Intern kod

I Kina är neima (內碼, 内码; pinyin : nèimă; jyutping : noi6 maa5, bokstavligen intern kod ) kodningen av ett tecken i någon teckenuppsättning , eller till den teckenkodning som används. Det är inte en kodning i sig, och den faktiska kodningen som det refereras till måste bestämmas av sammanhanget.

På alla datorsystem är den interna koden den ursprungliga kodningen som används. Till exempel, i ett Big5-baserat system (t.ex. Microsoft Windows 3.1 lokaliserat för traditionell kinesiska), är den interna koden Big5 ; på liknande sätt, i ett GB -baserat system (t.ex. DOS som kör CCDOS), skulle den interna koden vara GB 2312 . På tidiga datorer tar det kinesiska språkkortet de interna koderna och återger motsvarande kinesiska tecken på skärmen. På många moderna operativsystem (som alla moderna Microsoft Windows-system) är den interna koden en form av Unicode .

Inom en viss kodning betyder den interna koden för ett visst tecken helt enkelt värdet på kodpunkten som används för att representera det tecknet. Till exempel, i Big5-kodningen, har tecknet "一" (kinesiska, lit. ett ) den interna koden A440 ( hexadecimal ); i GB-kodningen har samma tecken den interna koden för D2BB.

"neimametoden"

Den interna koden kan användas som en inmatningsmetod för att mata in Han-tecken . Denna inmatningsmetod kallas vanligtvis 內碼 på kinesiska och tillhandahålls vanligtvis för Big5 och GB interna koder; på engelska kan det på olika sätt kallas "neima", "intern kod", "råkod" eller andra liknande namn.

Till exempel, i ett Big5-baserat system kan man mata in tecknet "一" genom att skriva "A440" med inmatningsmetoden "intern kod". Å andra sidan, i ett GB-baserat system, för att mata in tecknet skulle man skriva "D2BB".

NeiMa förväntar sig att användaren matar in det önskade tecknet genom att ange dess värde inom den användarvalda teckenuppsättningen .

Till exempel, för att mata in det kinesiska tecknet "不" ( Pinyin "bù" – engelska "not") kan man starta Neima-editorn, byta till Unicode- teckenkodningsläge och sedan skriva "bù"s hexadecimala värde i Unicodes tabell, vilket är 4E0D . NeiMa är ett mycket besvärligt sätt att skriva in tecken, eftersom en användare skulle behöva känna till kodpunkterna för alla nödvändiga tecken.

Mer generellt sett accepterar NeiMa i Unicode-läge vilken kodpunkt som helst i Unicode-tabellen, så användarna är inte begränsade till att mata in kinesiska tecken, utan även alla andra tecken som kan hittas i Unicode-tabellen. Till exempel latinska versaler A , A , matas in med NeiMa med A:s Unicode-kodpunkt, som är 0041 .

På ett Unicode-baserat system kan man kanske mata in ett tecken genom att skriva dess Unicode-nummer i hexadecimal form. En sådan inmatningsmetod kan också kallas "neima", eller den kan kallas "Unicode".

På ett JIS-baserat system (japanska) kan det finnas en kuten- inmatningsmetod som gör att tecken kan matas in med en form av den interna koden som kallas "kuten-formen"; denna typ av inmatningsmetod kallas quwei på GB-baserade system (kinesiska). Även om formen kuten (quwei) är relaterad till den interna koden, hänvisas sådana inmatningsmetoder vanligtvis inte till som inmatningsmetoder för "intern kod".

Användningen av en "intern kod"-inmatningsmetod för att mata in tecken skulle normalt inte vara särskilt praktisk. Det är dock användbart för att mata in speciella symboler som annars kan vara omöjliga att mata in med andra inmatningsmetoder. Däremot skulle användaren behöva ha en teckentabell med sina interna koder.

Se även

  1. ^   朱, 巧明 (2005). 中文信息处理技术教程 . sid. 162. ISBN 9787302117612 .