KPS 9566

KPS 9566
Alias ISO-IR-202 (1997 version)
Språk)

Koreanska , engelska , ryska Delvis support: grekiska , japanska
Standard KPS 9566
Nuvarande status Används endast i Nordkorea .
Klassificering ISO-2022 -kompatibel DBCS , CJK-kodning
Kodningsformat UHC -kodning, ISO 2022 .
Annan relaterad kodning KS X 1001 , GB 12052

KPS 9566 (" DPRK Standard Korean Graphic Character Set for Information Interchange ") är en nordkoreansk standard som specificerar en teckenkodning för Chosŏn'gŭl (Hangul) skriftsystem som används för det koreanska språket . Utgåvan av 1997 specificerade en ISO 2022 -kompatibel 94×94 två-byte kodad teckenuppsättning . Efterföljande utgåvor har lagt till ytterligare kodade tecken utanför 94×94-planet, på ett sätt som är jämförbart med UHC eller GBK .

KPS 9566 skiljer sig i tillvägagångssätt från KS X 1001 , dess sydkoreanska motsvarighet, genom att använda en annan ordning av chosŏn'gŭl, genom att koda explicita vertikala presentationsformer av skiljetecken, genom att inte koda dubbletter av hanja för flera läsningar, och genom att inkludera flera tecken som är specifika för det nordkoreanska politiska systemet, inklusive särskilda kodningar för namnen på landets tidigare och nuvarande ledare ( Kim Il-sung, Kim Jong-il och Kim Jong-un ).

Även om KPS 9566 var den ursprungliga källan till flera tecken som lagts till i Unicode , har inte alla KPS 9566-tecken Unicode-motsvarigheter. De som inte gör det mappas till liknande Unicode-tecken eller till området för privat användning .

Bakgrund och andra standarder

ASCII - teckenuppsättningen har sitt ursprung i USA 1963 och reviderades 1967 till den form den har idag. ASCII blev också accepterad som en internationell standard 1967 och blev ECMA-6, betecknad ISO/IEC 646 av International Organization for Standardization . Den är för närvarande betecknad ANSI X3.4-1986 och ISO 646:1991. ASCII var en 7-bitars enkelbytekodning inklusive 94 grafiska tecken, mellanslag och 33 kontrollkoder , vilket gav grundläggande stöd för att representera amerikansk engelsk text som en serie bytes.

Nästa upplaga av ISO 646, publicerad 1972, reviderade standarden för att introducera konceptet med nationella versioner av koden, vilket gjorde det möjligt för länder att ersätta några mindre vanliga koder med sina egna obligatoriska tecken. Samtidigt pågick arbetet med att definiera förlängningsmekanismer för ASCII, med avsikten att kunna tillämpas på både 7-bitars och 8-bitars miljöer. Detta slutfördes 1973 och publicerades som JIS X 0202 , ECMA-35 och ISO 2022 . ISO 2022 specificerar mekanismer för att använda en-byte och flera-byte teckenuppsättningar med en viss struktur i både 7-bitars och 8-bitars miljöer, och för att deklarera och växla mellan dem på ett standardsätt med skiftkoder och escape-sekvenser .

Länder i Östasien , på grund av att de använde stora repertoarer av kinesiska tecken , introducerade standardiserade dubbelbyte-kodningar (DBCS) för sina skrivsystem, eftersom antalet tecken som kan representeras i en enkelbytekod inte var tillräckligt. I en ISO 2022-kompatibel DBCS kan varje tecken representeras med två ASCII-utskriftsteckenbyte; platsen för ett tecken kan refereras av dessa bytevärden, eller med två siffror från 1 till 94 (en kuten , lika med resp följt av GB 2312 (fastlandet Kina) 1980 och av Wansung-koden (Sydkorea; först benämnd KS C 5601-1987) 1987. Big5 (Taiwan), definierad 1984, följde inte ISO 2022-strukturen. När de användes i en 8-bitars (snarare än 7-bitars) miljö, användes GB 2312 och Wansung-kod vanligtvis med den åttonde bitars uppsättningen, med ASCII eller en liknande SBCS används med den åttonde biten oinställd; dessa kodningsscheman är kända som EUC-CN respektive EUC-KR .

Även om det koreanska skriftsystemet inkluderar individuella symboler ( jamo ) för konsonanter och vokaler, som fungerar som ett alfabet , är koreansk text korrekt inställd med dessa symboler sammansatta i block för varje stavelse. Wansung-koden inkluderade individuella koreanska stavelseblock separat, behandlade dem som en stor uppsättning tecken på samma sätt som hanja , och definierades först av den tredje upplagan av den sydkoreanska standarden KS C 5601. Den första utgåvan hade definierat en kodning av individuella jamo som tillät stavelseblock som ska kodas som sekvenser, som fick namnet N-byte Hangul , och hade inte antagits så brett som avsett.

Wansung-koden kodade inte alla möjliga moderna koreanska stavelser, bara ett urval av de 2350 vanligaste, även om det gjorde det möjligt att specificera dem genom att kombinera sekvenser, som ofta inte stöddes. En alternativ kodning, även sydkoreansk, som heter Johab gjorde, och fungerade som en konkurrent till Wansung under en tid. Unified Hangul Code (UHC), introducerad av Microsoft med Windows 95 , utökade EUC-KR, vilket tillåter användning av ogiltiga EUC-dubbelbytekoder för att representera alla andra stavelser som finns tillgängliga i Johab. Ett liknande tillvägagångssätt togs av den kinesiska GBK- kodningen, som utökar GB 2312 med stöd för traditionell kinesiska och för mindre vanliga kinesiska tecken genom att koda dem till dubbelbytekoder ogiltiga i EUC-CN .

Sydkorea var inte det enda landet som utvecklade en ISO 2022 DBCS för koreanska: det kinesiska fastlandet GB 12052 publicerades 1989. Detta var inte nära relaterat till Wansung-koden, även om det även inkluderade sammansatta stavelser. Istället motsvarade det GB 2312 med koreanska stavelser (och 94 hanja ) som ersatte de kinesiska tecknen, förutom införandet av ett dollartecken i stället för ett yuan-tecken. Den kan ha utvecklats för användning av den koreanska minoriteten i nordöstra Kina.

På samma sätt utvecklade Nordkorea KPS 9566. Även om både Nordkorea och Sydkorea använder koreanska Chosŏn'gŭl (Hangul) som sitt primära skriftsystem, använder de olika lexikografiska ordningsföljder . Därför skiljer sig teckenordningen mellan Wansung-koden och KPS 9566.

KPS 9566 har genomgått flera revisioner, inklusive utgåvor av 1997 och 2003, främst för att förbättra kompatibiliteten med Unicode . Dessa anges vanligtvis genom att ange år (t.ex. KPS 9566-97, 9566-2003). Den nuvarande utgåvan från och med releasen av Red Star OS 3.0 verkar vara KPS 9566-2011, vilket lägger till Kim Jong-un till listan över ledare. Det allmänt tillgängliga koddiagrammet för 1997 års upplaga av KPS 9566 visar ett ISO 2022 94×94-plan. De nyare utgåvorna, från vilka informationskällor som finns tillgängliga utanför själva Nordkorea, verkar definiera ytterligare tilldelningar utanför EUC-planet (på samma sätt som GBK eller UHC).

På grund av interoperabilitetsproblem som uppstår vid användningen av flera nationella standard- och plattforms- eller teckensnittsspecifika egenutvecklade teckenkodningar, utvecklades Unicode -standarden med avsikten att tillåta att all representativ text kan bytas ut i ett enda, universellt format. Den första utgåvan av Unicode publicerades 1991 och 1992, och ISO/IEC 10646 etablerades i synk med Unicode 1993. Unicode-format föredras för internationell användning på World Wide Web , där äldre teckenkodningar behandlas som partiella kodningar av Unicode med hjälp av kartfiler.

Design

I princip liknar KPS 9566 Wansung-teckenuppsättningen som definieras av den sydkoreanska KS X 1001- standarden, även om de två inte är kompatibla. Båda kodar en sektion med skiljetecken, symboler, jamo , kana och alfabetiska tecken, följt av en delmängd av de möjliga moderna chosŏn'gŭl-stavelserna, följt av en sektion av hanja . KPS 9566 använder dock en annan ordning av jamo och stavelser för att överensstämma med nordkoreansk lexikografisk ordning standarder. KPS 9566 innehåller också 28 explicit roterade skiljetecken för vertikal typografi, vilket KS X 1001 inte gör, och kodar varje hanja endast en gång, medan KS X 1001 kodar flera hanja med flera avläsningar flera gånger.

KPS 9566-97 kodar totalt 2679 chosŏn'gŭl stavelser och 4653 hanja. Detta ger bättre täckning än de 2350 stavelserna som kodas av Wansung-koden: till exempel har 똠-tecknet som används i namnet 똠방각하 [ ko ] , ett noterat koreanskt litterärt verk, inte en tilldelad Wansung-kodpunkt, men har en (38- 02) i KPS 9566. Hanja-sektionen innehåller 4652 tecken från Unified Repertoire and Ordering och en från CJK Unified Ideographs Extension A . Hela rad 15, den senare halvan av rad 44 (efter stavelseblocket) och den senare halvan av rad 94 (efter hanjablocket) kan användas för användardefinierade ändamål.

KPS 9566 utmärker sig särskilt genom att den innehåller flera specialtecken från det nordkoreanska politiska livet. Närmare bestämt inkluderar den hammaren, skäran och borstemblemet från Koreas arbetarparti , både inringade och inringade (kodpunkterna 12-01 och 12-02), och två grupper med tre specialtecken som stavar namnen på de nordkoreanska ledarna Kim Il-sung (김일성) och Kim Jong-il (김정일) i ett speciellt dekorativt typsnitt (kodpunkterna 04-72 till 04-74 respektive 04-75 till 04-77). Stavelserna för Kim och Il, som är identiska i stavningen av båda namnen, är kodade två gånger. KPS 9566-2011 innehåller dessutom namnet på Kim Jong-un (김정은) som kodpunkter 04-78 till 04-80.

På grund av dessa specialtecken finns det för närvarande ingen fullständig kompatibilitet tur och retur mellan KPS 9566 och Unicode, såvida inte tecken som inte stöds mappas till området för privat användning .

KPS 10721

Nordkorea utvecklade också en andra teckenuppsättning, KPS 10721 " Code of the supplementary Korean Hanja Set for Information Interchange ", som publicerades 2000. KPS 10721 kodar en uppsättning på minst 19469 hanja utöver de som ingår i KPS 9566. Från och med 2009 hade dessa inte alla mappningar till Unicode, utan inkluderade 10358 från Unified Repertoire and Ordering , 3187 från CJK Unified Ideographs Extension A och 107 från CJK Compatibility Ideographs (alla i Basic Multilingual Plane ), samt 5767 från CJK Unified Ideographs Extension B och 50 från CJK Compatibility Ideographs Supplement ( i det kompletterande Ideographic Plane ) .

Förutom kartläggningen av dessa hanja till Unicode, är lite känt om KPS 10721-standarden utanför Nordkorea. Nordkoreanska referensglyfer tillhandahålls inte för dessa hanja i Unicode-koddiagrammen, på grund av brist på lämplig typsnittsdata tillgänglig för Unicode Consortium. Unicode hanja-tecken med KPS 9566- eller KPS 10721-källor korsrefereras ändå till deras KPS-koder i Unihan -databasen med nyckeln kIRG_KPSource .

Dokumentation och relation till Unicode

Unicodes initiala täckning av koreanska stavelser , tillagd i version 1.0, baserades på Wansung-kod. I Unicode version 2.0 lades ett nytt block av koreanska stavelser (det nuvarande Hangul- stavelseblocket) till, baserat på den stavelserepertoar som finns tillgänglig i Johab, och det tidigare blocket togs bort (det är nu upptaget av CJK Unified Ideographs Extension A ). Detta gjordes under antagandet att inga Unicode-kodade koreanska data existerade ännu, men blev känd som "koreanska röran", och de ansvariga kommittéerna lovade att inte göra en sådan oförenlig förändring i framtiden, ett löfte kodifierat av Unicodes stabilitetspolicy .

Koddiagrammet för KPS 9566-97, publicerat april 1997, skickades till ISO International Register of Coded Character Sets för registrering för användning med ISO/IEC 2022 . Den registrerades i juni 1998 med numret ISO-IR-202 . Detta koddiagram är allmänt tillgängligt från Information Processing Society of Japan .

I augusti 1999 lämnade det nordkoreanska nationella organet ett dokument till WG2 ( ISO/IEC JTC 1/SC 2 Working Group 2), ISO-organet som ansvarar för ISO/IEC 10646 , den internationella standarden som motsvarar Unicode . Detta dokument begärde tillägg av KPS 9566-koder till befintliga korsreferenser från CJK Unified Ideographs diagram, tillägg av 80 symboltecken från KPS 9566 som inte hade existerande Unicode-mappningar, en upplösning på skillnaden i sorteringsordning mellan KPS 9566 och Unicode (på grund av ordningen för tecknen i Unicode efter de sydkoreanska kodningarna) och tillägg av 8 kombinerar jamo. Den begärde också att WG2 skulle redigera det befintliga Unicode-tecken och blocknamn för att använda termen "koreanskt tecken" snarare än "Hangul". En utökad version av detta förslag, uppdelad i flera dokument, lämnades in som arbetspunkt i december 1999.

Ett utförligt svar lämnades av den svenska representanten i mars 2000, som motsatte sig flera av punkterna och utvecklade Sveriges röst mot förslaget. Detta svar angav att att ändra kodningen av de koreanska tecknen igen skulle orsaka stora störningar, till och med mer än första gången, vilket gjordes när det fanns jämförelsevis få implementeringar, men som i efterhand inte borde ha gjorts. Den förklarade att få eller inga språk kan sorteras korrekt efter kodpunktsvärde och att en skräddarsydd för Unicode Collation Algorithm eller ISO/IEC 14651 (som då utarbetas) bör användas för detta ändamål, och att normativa namn på redan tilldelade tecken inte kan ändras på grund av stabilitetspolicyn, även om icke-normativa översättningar till andra språk kan användas. Den föreslog att en maskinläsbar mappningsfil mellan Unicode och KPS 9566 skulle kunna tillhandahållas av den nordkoreanska instansen själv, och skulle vara mer användbar än en utskriven korsreferens i standarddokumentet. När det gäller de föreslagna ytterligare tecknen, angav svaret att tecken som skulle ha kompatibilitetsupplösningar i Unicode inte bör läggas till och att logotyper, inklusive de för politiska partier, och specialtecken för namn på vissa personer inte bör läggas till.

I juli 2000 skrev det nordkoreanska organet till WG2 och anklagade dem för att utveckla båda versionerna av Unicode-kodningen för koreanska endast på basis av sydkoreanska förslag, utan att rådfråga Nordkorea, och anklagade dem för att lägga företagens kommersiella intressen och rädsla för internationella förvirring över respekten för Nordkoreas suveränitet, och angivande av att Nordkorea skulle betrakta ytterligare vägran att ändra namnet och ordningen för de koreanska tecknen i Unicode som en förolämpning mot deras suveräna värdighet och som att kompromissa med ISO s anspråk på opartiskhet. De upprepade sitt krav på WG2 och Unicode för att "korrigera" ordningen på de koreanska tecknen och att "korrigera" namnen "Hangul Jamo" och "Hangul stavelse" till "koreanska alfabetet" och "koreanska stavelsen".

I augusti 2000 lämnade det nordkoreanska nationella organet en mer detaljerad version av sina förfrågningar i en serie av fem på varandra följande förslag. Dessa begärde tillägg av ytterligare 14 jamo-tecken, tillägg av 82 symboltecken och användningen av termen "koreanska alfabetet" istället för "Hangul", gav stöd för den nordkoreanska sammanställningsordningen och begärde tillägg av den nordkoreanska hanja repertoar. Dessa förslag diskuterades vid två möten mellan nordkorean, sydkorean , svenska och andra WG2-representanter i september 2000, där det nordkoreanska organet ombads att tillhandahålla manuskriptbevis för de ytterligare jamo-teckenna, att återinlämna sitt symbolförslag med symboler som redan hade tagits bort i Unicode och att överväga att använda ISO / IEC 14651 , sedan i det sista utkaststadiet, för sammanställningsändamål.

I september 2001 lämnade det nordkoreanska nationella organet in en reviderad serie förslag som begärde tillägg av flera KPS 9566- och KPS 10721-tecken, inklusive 70 symboltecken, till Unicode. I denna version av förslaget inkluderades ett avsnitt med dokumentutdrag som visar användningen av flera tecken och korta förklaringar av deras syfte. Koreas arbetarparti symbolen döptes till "Hammaren och skäran och borsten", döptes om från "Mark of the Workers' Party of Korea" i tidigare versioner av förslaget, och motiverades som att den användes som en identifierande symbol på kartor. Som motivering för de föreslagna karaktärerna för ledarnas namn förklarade de att ledarnas namn ofta förekommer med en annan storlek och teckensnittsvikt i nordkoreanska publikationer i syfte att betona. En uppföljning av sydkoreanska WG2-representanter begärde bevis, namn på koreanska och motiveringar för att lägga till vissa av dessa karaktärer, och noterade att det redan fanns versioner utan betoning av karaktärerna för ledarnas namn. Ett möte med nord- och sydkoreanska representanter från WG2 sammankallades i oktober 2001, som rekommenderade att 47 av symboltecken skulle läggas till i Unicode, och föreslog att ledarnas namn och WPK-symboler skulle tas upp för vidare diskussion av WG2.

Ett efterföljande återkopplingsdokument från februari 2002 angående de nordkoreanska föreslagna tilläggen begärde att "te"-symbolen för ett tehus accepteras som en mer allmän symbol för "het dryck", vilket likställer den med symboler som används i guideböcker för att beteckna varma eller alkoholfria drycker. Den rekommenderade också att referensglyfen för den befintliga kodpunkten för ett paraply utan regn modifieras för att harmonisera med den föreslagna referensglyfen för paraplyet med regn, vilket likställer dem med "håll torrt"-symbolerna som används på förpackningen, och väckte frågan om vilken varningssymboler för blixtar och högspänning i befintliga symbolsamlingar skulle kunna förenas med den föreslagna "högspännings"-karaktären. Alla dessa tre tecken accepterades i Unicode i version 4.0. Det rekommenderades också att de horisontella bomrade fraktionerna och den åt vänster uppåt pekande saxen kodas med en variation selector , eftersom saxen inte åtföljde en annorlunda orienterad sax, och eftersom de befintliga Unicode-fraktionskodpunkterna förenade de sneda och horisontella formerna.

I november 2002 publicerade det sydkoreanska organet en uppsättning trevägstabeller som kartlade tecken mellan standarderna KPS 9566, KS X 1001 (som EUC-KR) och ISO/IEC 10646 som de fanns 2000. Dessa tabeller hade upprättats utan input från Nordkorea.

skickades ett par mappningstabeller mellan KPS 9566-2003 och Unicode till OpenOffice.org -projektet av en person som använde namnet "ooprojlover", som uppgav att de representerade den uppdaterade versionen av KPS 9566-standarden och begärde att stöd läggas till. Dessa filer mappade de tecken som inte var tillgängliga i Unicode till det privata användningsområdet , och inkluderade ytterligare kodade former för andra stavelseblock utanför ISO-IR-202-huvudplanet. En kartläggningstabell publicerades senare av Unicode Consortium 2011, baserat på dessa kartdata men med fel korrigerade med hänvisning till ISO-IR-diagrammet.

Kopior av Red Star OS 3.0 inkluderar typsnitt för en nyare utgåva av KPS 9566, som verkar vara KPS 9566-2011. Mappningstabellen som används av Red Star OS internt har extraherats. Förutom att lägga till Kim Jong-un till listan över ledare, ändrar KPS 9566-2011 mappningarna av vissa vertikala former jämfört med 2003 års mappningar (med utnyttjande av Vertical Forms -blocket som lagts till i Unicode 4.1), och inkluderar även flera ytterligare hanja och symboler kodad utanför ISO-IR-202-planet. Flera av dessa ytterligare symboler är också mappade till det privata användningsområdet; deras identitet är dock inte känd, eftersom inga namn eller referensglyfer för dessa karaktärer är kända utanför Nordkorea.

Inverkan på Unicode idag

Flera nuvarande Unicode-tecken lades till i Unicode 4.0 som ett resultat av de nordkoreanska förslagen, men inte alltid vid de ursprungliga föreslagna kodpunkterna. Dessa inkluderar HOT BEVERAGE (☕, föreslagen som TE-SYMBOL), som föreslogs som en kartsymbol för att markera ett tehus , och flaggsymbolerna WHITE FLAG (⚐) och SVART FLAGGA (⚑), som föreslogs som kartsymboler för platser för strider och militära segrar. Dessa tecken föreslogs för de provisoriska kodpunkterna U+270A, U+268E respektive U+268F, men kodade vid de slutliga kodpunkterna U+2615, U+2690 respektive U+2691. De inkluderar också en serie fetstilta riktningspilar i intervallet U+2B05 till U+2B0D, exklusive en högerpil, som mappades till en befintlig karaktär i Dingbats-blocket, som lades till vid samma kodpunkter som de föreslogs för , förutom att nordost- och nordvästpilarna byts ut jämfört med förslaget.

Andra bildkaraktärer som ingick i det nordkoreanska förslaget inkluderar paraplyet med regndroppar (☔), blixten för högspänning (⚡) och varningstriangeln (⚠). Efter lite diskussion om vilka andra högspänningssymboler som glyfer som används representerade samma tecken som den från det nordkoreanska förslaget, och vilken glyf som skulle vara bäst att inkludera för det i Unicode-koddiagrammet, och efter modifiering av koddiagrammet för det befintliga paraplytecknet utan regn (U+2602 , ☂) för att harmonisera med det nya paraplyet med regndroppar från det nordkoreanska förslaget lades dessa tecken även till i Unicode 4.0, samtidigt som flaggorna och dryckessymbolen. Även om de föreslogs för de provisoriska kodpunkterna U+2618, U+267F och U+267E, fick de de sista kodpunkterna U+2614, U+26A1 respektive U+26A0.

Av dessa karaktärer valdes den varma drycken, paraplyet med regndroppar, blixten och varningstriangeln och pilarna uppåt, nedåt och åt vänster som kartläggningar från de japanska cellulära emoji-uppsättningarna, vilket ger totalt sju aktuella Unicode-emoji som ursprungligen lades till till Unicode på begäran av Nordkorea. Paraplyet med regndroppar och uppåt-, nedåt- och vänsterpilarna förenades också med karaktärer från ARIB-tilläggen används i japansk sändning, som inkluderar flera tecken som nu klassificeras som emoji, och mappades till Unicode i Unicode 5.2. Men paret vita och svarta flaggor som används som emoji eller i regionala emoji- och identitetsflaggorsekvenser är en annan "viftande" uppsättning som lagts till i Unicode 7.0 (U+1F3F3 🏳 och U+1F3F4 🏴), inte det nordkoreanska paret.

Från och med 2018 fanns flera KPS 9566-tecken kvar som inte är mappade till Unicode. Dessa inkluderar WPK-symbolen, fyra triangulära märken, en sax som pekar åt vänster (exkluderad av skälet att kontrastiv användning med saxen åt höger i Dingbats-blocket inte hade demonstrerats ), en uppåtriktad manikel i en cirkel, vertikal presentation former av skiljetecken, varianter av avslutande parenteser som innehåller punkter , horisontella streckvarianter av vulgära bråk som kodas separat från deras lutande versioner och ledarnas namn.

Ett japanskt postmärke med en nedåtriktad triangel inkluderades i KPS 9566-97 men togs bort i KPS 9566-2003 efter att det nordkoreanska organet hade dragit tillbaka det från sitt Unicode-förslag för granskning som svar på förfrågningar från det sydkoreanska organet om bevis för symbolens användning i Nordkorea. Detta märke föreslogs på nytt 2018 på grundval av KPS 9566-kompatibilitet och identifierades som ett elektriskt överensstämmelsemärke som användes i Japan innan det ersattes med PSE- diamanten . Den lades till i Unicode i version 13.0, publicerad 2020.

Kodade former

1997 års upplaga av KPS 9566 registrerades i International Register of Coded Character Sets for Use with Escape Sequences som ISO-IR-202, och kan därför kodas med ISO/IEC 2022 . Det är en 94 n multipelbyte G-uppsättning, dvs om den används i en 7-bitars ISO 2022-kod (analogt med ISO-2022-JP eller ISO-2022-KR ), kommer tecken att kodas med par av byte mellan 0x21 och 0x7E i lämpligt läge.

De dokumenterade mappningarna mellan KPS 9566 och Unicode för 2003 och 2011 års utgåvor av KPS 9566 använder en kodning som liknar en anpassning av Unified Hangul Code (UHC) för att koda KPS 9566 snarare än Wansung-kod, med deras uppdaterade versioner av ISO-IR-202 plan som kodas med hjälp av par av byte mellan 0xA1 och 0xFE, och med andra två-byte koder som används för stavelser som inte finns i ISO-IR-202. Ordningen på de utökade stavelserna följer vanlig KPS 9566-ordning. På samma sätt som UHC använder de leadbyte 0x81 och högre, och trailbyte från intervallen 0x41–0x5A, 0x61–0x7A och 0x81–0xFE, exklusive intervallet 0xA1–0xFE om leadbyten är 0xA1 eller högre.

2011 års utgåva innehåller också flera ytterligare hanja och symboler kodade utanför ISO-IR-202-planet, efter intervallet som används för de utökade stavelseblocken. Det här tillvägagångssättet liknar det som används av GBK , men med spårbyte kvar i UHC-stilsområdena: liksom de utökade stavelserna med blybyte 0xA1 och högre använder dessa alla spårbyteområdena 0x41–0x5A, 0x61–0x7A och 0x81 –0xA0. Utökade hanja kodas med leadbyte mellan 0xC8 och 0xDC, utökade symboler kodas med leadbyte mellan 0xE0 och 0xEA, och utökade koder med leadbyte mellan 0xEC och 0xFE mappas, utan luckor, till det privata användningsområdet (jämför de användardefinierade intervallen i GBK). Flera av tecknen i den utökade symbolsektionen och tre i hanjasektionen är också mappade till Unicode Private Use Area; till skillnad från de PUA-mappade symbolerna i huvud ISO-IR-202-planet, är identiteten för dessa tecken inte dokumenterad.

Blybyte

Det här diagrammet beskriver den övergripande layouten för huvudplanet för KPS 9566-teckenuppsättningen av leadbyte. För blybyte som används för andra tecken än sammansatta chosŏn'gŭl stavelser eller hanja, finns länkar till diagram på den här sidan som listar de tecken som kodats under den leadbyten. För blybytes som används för hanja, tillhandahålls länkar till lämplig sektion av Wiktionarys hanja-index.

Där två hexadecimala tal anges används värdet under 0x7F i en 7-bitars kodning, och det större värdet (mellan 0xA1 och 0xFE) används i en 8-bitars EUC- kodning . De utökade 8-bitarskodningarna i UHC-stil som definieras av 2003-utgåvan och framåt använder likaså de större bytevärdena, mellan 0xA1 och 0xFE inklusive, för det ISO-IR-202-baserade huvudplanet .

KPS 9566 (lead byte)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x/Yxa SP 1-_ 2-_ 3-_ 4-_ 5-_ 6-_ 7-_ 8-_ 9-_ 10-_ 11-_ 12-_ 13-_ 14-_ 15-_
3x/Bx 16-_ 17-_ 18-_ 19-_ 20-_ 21-_ 22-_ 23-_ 24-_ 25-_ 26-_ 27-_ 28-_ 29-_ 30-_ 31-_
4x/Cx 32-_ 33-_ 34-_ 35-_ 36-_ 37-_ 38-_ 39-_ 40-_ 41-_ 42-_ 43-_ 44-_ 45-_ 46-_ 47-_
5x/Dx 48-_ 49-_ 50-_ 51-_ 52-_ 53-_ 54-_ 55-_ 56-_ 57-_ 58-_ 59-_ 60-_ 61-_ 62-_ 63-_
6x/Ex 64-_ 65-_ 66-_ 67-_ 68-_ 69-_ 70-_ 71-_ 72-_ 73-_ 74-_ 75-_ 76-_ 77-_ 78-_ 79-_
7x/Fx 80-_ 81-_ 82-_ 83-_ 84-_ 85-_ 86-_ 87-_ 88-_ 89-_ 90-_ 91-_ 92-_ 93-_ 94-_ DEL

Icke-Hanja, icke-komponerade uppsättningar i huvudplanet

Teckenuppsättning 0x21/0xA1 (rad nummer 1, skiljetecken och vertikala former)

Den här uppsättningen innehåller vanliga meningsskiljepunkt som parenteser, citattecken, kommatecken och så vidare, samt presentationsformer för användning i vertikal skrift. ASCII-interpunktion (markerad) visas nedan mappad till grundläggande latinska kodpunkter (överensstämmer med artiklar om andra CJK-teckenuppsättningar, såsom KS X 1001 eller JIS X 0208 ), men mappas till blocken Halfwidth och Fullwidth Forms när de används i en kodning som kombinerar KPS 9566 med ASCII (enligt definitionen av till exempel 2003 års upplaga).

Jämfört med 2003 års mappning, ändrar 2011 års mappningar Unicode-mappningarna av tre vertikala presentationsformer för att dra fördel av Vertical Forms- blocket som introducerades med Unicode 4.1.

KPS 9566 (prefixet 0x21/0xA1)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x/Yxa IDSP
3001

3002 _

002C _

. 002E

· 00B7

: 003A

; 003B

? 003F

! 0021

2025

2026

~ 007E

3003

2015
3x/Bx
2010

_ 005F

FFE3

/ 002F

\ 005C

| 007C

2225

2215

2216

309B

309C

´00B4 _

` 0060

¨ 00A8

^ 005E

ˇ 02C7
4x/Cx
˙ 02D9
' / ˚ / ˊ /
22EE
ⸯ
' 2018

' 2019

" 201C

201D

( 0028

) 0029

3014

3015

[ 005B

] 005D
5x/Dx
{ 007B

} 007D

3008

3009

300A

300B

300C

300D

300E

300F

3010

3011
.) .⟫
201A

201B
6x/Ex
201E

" 201F

FE35

FE36

FE39

FE3A

FE47

FE48

FE37

FE38

︿ FE3F

FE40

FE3D

FE3E

FE41

FE42
7x/Fx
FE43

FE44

FE3B

FE3C
  ASCII-interpunktion, kan också mappas till blocket Halfwidth och Fullwidth Forms .
 Mappad till privat användningsområde, visas simulerad.

Teckenuppsättning 0x22/0xA2 (rad nummer 2, symboler och operatorer)

Denna uppsättning innehåller matematiska operatorer och några andra symboler som et -tecken , pilkråka , musiknot och så vidare. ASCII-interpunktion (markerad) visas nedan mappad till grundläggande latinska kodpunkter (överensstämmer med artiklar om andra CJK-teckenuppsättningar), men mappas till Halfwidth och Fullwidth Forms- blocket när det används i en kodning som kombinerar KPS 9566 med ASCII .

Flera triangulära "vägmärke"-symboler som anger kommande berg eller lutningar framåt eller åt ena sidan är inkluderade i den här raden, men ingår för närvarande inte i Unicode. De är mappade till det privata användningsområdet.

KPS 9566 (prefixet med 0x22/0xA2)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x/Yxa
+ 002B

- 002D

± 00B1

× 00D7

÷ 00F7

= 003D

2260

< 003C

> 003E

2266

2267

221E

2234

2642

2640
3x/Bx
2220

22A5

2312

2202

2207

2261

2252

2248

226A

226B

221A

223D

221D

2235

222B

222C
4x/Cx
222E

2208

220B

2286

2287

2282

2283

2209

220C

2288

2289

2284

2285

222A

2229

2227
5x/Dx
2228

FFE2

21D2

21D4

2200

2203

2211

# 0023

& 0026

* 002A

@ 0040

§ 00A7

203B

2606

2605

25CB
6x/Ex
25CF

25 e.Kr

25C7

25C6

25A1

25A0

25B3

25B2

25BD

25 f.Kr

25B7

25C1

25B6

25C0

2218

2219
7x/Fx
2756
   
2690

2691

266F

266D

266A

2020

2021

00B6

2295

2296
  ASCII-interpunktion, kan också mappas till blocket Halfwidth och Fullwidth Forms .
 Mappad till privat användningsområde, visas simulerad.

Teckenuppsättning 0x23/0xA3 (radnummer 3, siffror och romerska)

Denna uppsättning innehåller en delmängd av ASCII , minus skiljetecken och symboler, bestående av västerländska arabiska siffror och båda kasus av det grundläggande latinska alfabetet . Jämför rad 3 i JIS X 0208 , som den här raden exakt matchar. Jämför och kontrast rad 3 i KS X 1001 och GB 2312 , som inkluderar hela deras nationella varianter av ISO 646 i denna rad, snarare än bara den alfanumeriska delmängden.

Tecknen i den här raden visas nedan mappade till grundläggande latinska kodpunkter (överensstämmer med artiklar om andra teckenuppsättningar), men mappas till Halfwidth- och Fullwidth Forms- blocken när de används i en kodning som kombinerar KPS 9566 med ASCII .

KPS 9566 (med prefixet 0x23/0xA3)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x/Yxa
3x/Bx 0
0030

1 0031

2 0032

3 0033

4 0034

5 0035

6 0036

7 0037

8 0038

9 0039
4x/Cx
A 0041

B 0042

C 0043

D 0044

E 0045

F 0046

G 0047

H 0048

I 0049

J 004A

K 004B

L 004C

M 004D

N 004E

O 004F
5x/Dx
P 0050

Q 0051

R 0052

S 0053

T 0054

U 0055

V 0056

W 0057

X 0058

Y 0059

Z 005A
6x/Ex
en 0061

b 0062

c 0063

d 0064

e 0065

f 0066

g 0067

h 0068

jag 0069

j 006A

k 006B

l 006C

m 006D

n 006E

o 006F
7x/Fx
s 0070

q 0071

r 0072

s 0073

t 0074

u 0075

v 0076

w 0077

x 0078

y 0079

z 007A

Teckenuppsättning 0x24/0xA4 (rad nummer 4, Chosŏn'gŭl jamo och ledarnas namn)

Denna uppsättning innehåller Chosŏn'gŭl jamo , såväl som speciella kodningar för namnen på (från 2003) de nordkoreanska ledarna Kim Il-sung och Kim Jong-il . Namnet på Kim Jong-un ingår också från och med 2011 års upplaga. Jämför med rad 4 i KS X 1001 .

Den jamo i den här raden som finns i Unicode Hangul Compatibility Jamo- blocket (som innehåller de positionsoberoende tecknen mappade från KS X 1001) mappas till det blocket. De föråldrade jamo- utmärkande palataliserade sibilanterna mappar till de positionsspecifika karaktärerna i Hangul Jamo-blocket . Omvänt är inte all föråldrad jamo kodad av KS X 1001 kodad i huvudplanet för KPS 9566. I 2011 års utgåva av KPS 9566 ingår några av de andra historiska jamo från KS X 1001 utanför huvudplanet, med blybyten 0xEA .

De speciella kodningarna av ledarnas namn finns inte i Unicode och är mappade till det privata användningsområdet. De visas nedan simulerade med uppmärkning.

KPS 9566 (prefixet 0x24/0xA4)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x/Yxa
3131

3134

3137

3  139 kr

3141

3142

3145

3147

3148

314A

314B

314C

314D

314E

3132
3x/Bx
3138

3143

3146

3149

314F

3151

3153

3155

3157

315B

315C

3160

3161

3163

3150

3152
4x/Cx
3154

3156

315A

315F

3162

3158

315D

3159

315E

3133

3135

3136

313A

313B

313C

313D
5x/Dx
313E

313F

3140

3144

317F

3181

3186

318D

113C

113D

113E

113F

114E

114F

1150

1151
6x/Ex
1154

1155
7x/Fx
 Mappad till privat användningsområde, visas simulerad.

Teckenuppsättning 0x25/0xA5 (rad nummer 5, kyrillisk)

Denna uppsättning innehåller båda fallen med 33 bokstäver från den kyrilliska skriften , tillräckligt för att skriva det moderna ryska alfabetet och det bulgariska alfabetet , även om andra former av kyrilliska kräver ytterligare bokstäver.

Jämför rad 12 i KS X 1001 och rad 7 i JIS X 0208, som använder samma layout (men i en annan rad).

KPS 9566 (prefixet 0x25/0xA5)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x/Yxa
А 0410

Б 0411

В 0412

Г 0413

Д 0414

Е 0415

Ё 0401

Ж 0416

З 0417

И 0418

Й 0419

К 041A

Л 041B

М 041C

I 041D
3x/Bx
О 041E

П 041F

Р 0420

С 0421

Т 0422

У 0423

Ф 0424

Х 0425

Ц 0426

Ч 0427

Ш 0428

Щ 0429

Ъ 042A

Ы 042B

Ь 042C

Э 042D
4x/Cx
Ю 042E

Я 042F
5x/Dx
a 0430

б 0431

в 0432

г 0433

till 0434

е 0435

ё 0451

ж 0436

av 0437

och 0438

© 0439

к 043A

л 043B

m 043C

н 043D
6x/Ex
о 043E

п 043F

р 0440

с 0441

т 0442

у 0443

ф 0444

х 0445

ц 0446

ч 0447

ш 0448

щ 0449

ъ 044A

ы 044B

ü 044C

э 044D
7x/Fx
ю 044E

я 044F

Teckenuppsättning 0x26/0xA6 (rad nummer 6, grekiska bokstäver och romerska siffror)

Denna uppsättning innehåller romerska siffror och grundläggande stöd för det grekiska alfabetet , utan diakritiska tecken eller den slutliga sigma .

Jämför och kontrast rad 5 i KS X 1001 (som använder samma tecken men i en annan layout och en annan rad) och rad 6 i JIS X 0208 (som använder samma layout för de grekiska bokstäverna, men utan de romerska siffrorna).

KPS 9566 (med prefixet 0x26/0xA6)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x/Yxa
Α 0391

Β 0392

Γ 0393

Δ 0394

Ε 0395

Ζ 0396

Η 0397

Θ 0398

jag 0399

Κ 039A

Λ 039B

Μ 039C

N 039D

Ξ 039E

Ο 039F
3x/Bx
Π 03A0

Ρ 03A1

Σ 03A3

Τ 03A4

Υ 03A5

Φ 03A6

Χ 03A7

Ψ 03A8

Ω 03A9
4x/Cx
a 03B1

β 03B2

γ 03B3

5 03B4

ε 03B5

ζ 03B6

η 03B7

θ 03B8

ι 03B9

K 03BA

λ 03BB

μ 03 f.Kr

v 03BD

ξ 03BE

ο 03BF
5x/Dx
π 03C0

ρ 03C1

σ 03C3

τ 03C4

υ 03C5

φ 03C6

χ 03C7

ψ 03C8

ω 03C9
6x/Ex
2160

2161

2162

2163

2164

2165

2166

2167

2168

2169
7x/Fx
2170

2171

2172

2173

2174

2175

2176

2177

2178

2179

Teckenuppsättning 0x27/0xA7 (rad nummer 7, inringad, upphöjd, nedsänkt, bråk)

Flera inringade siffror i den här raden mappades felaktigt till Unicode i 2003 års upplaga, på grund av användning av icke-slutliga föreslagna kodpunkter. De korrigerades i 2011 års upplaga.

KPS 9566 (med prefixet 0x27/0xA7)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x/Yxa
2460

2461

2462

2463

2464

2465

2466

2467

2468

2469

246A

246B

246C

246D

246E
3x/Bx
246F

2470

2471

2472

2473

3251

3252

3253

3254

3255

3256

3257

3258

3259

325A
4x/Cx
3260

3261

3262

3263

3264

3265

3266

3267

3268

3269

326A

326B

326C

326D
5x/Dx
326E

326F

3270

3271

3272

3273

3274

3275

3276

3277

3278

3279

327A
· 327B
6x/Ex
2070

¹ 00B9

² 00B2

³ 00B3

2074

2075

2076

2077

2078

2079

½ 00BD

2153

2154

¼ 00 f.Kr

¾ 00BE
7x/Fx 2080 kr

2081

2082

2083

2084

2085

2086

2087

2088

2089
1/2 _ _ 1/3 _ _ 2/3 _ _ 1/4 _ _ 3/4 _ _
 Mappad till privat användningsområde, visas simulerad.

Teckenuppsättning 0x28/0xA8 (radnummer 8, enhet, kvantitet och valutasymboler)

Denna uppsättning innehåller symboler för måttenheter och valuta. De som finns i ASCII (markerade) visas nedan mappade till grundläggande latinska kodpunkter (överensstämmer med artiklar om andra CJK-teckenuppsättningar), men mappas till Halfwidth- och Fullwidth Forms- blocken när de används i en kodning som kombinerar KPS 9566 med ASCII .

Kelvin - tecknet ersattes med ett eurotecken i 2003 års upplaga. 2011 års utgåva innehåller en alternativ kodning av Kelvin-tecknet vid 0xE988 .

Jämför och kontrast med repertoaren av enhetssymboler som ingår i rad 7 i KS X 1001 .

KPS 9566 (prefixet med 0x28/0xA8)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x/Yxa
° 00B0

" 2032

2033

2103

2109
/ K
FFE6
0024 USD

FFE0

FFE1

FFE5

% 0025

2030

Å 212B

33C4
3x/Bx
33A1

33A5

339D

33A0

33A4

339C

339F

33A3

3377

3378

3379

339E

33A2

33A6

3399

339A
4x/Cx
339B

33A7

33A8

338D

338E

338F

33B4

33B5

33B6

33B7

33B8

33B9

3380

3381

3382

3383
5x/Dx
3384

33BA

33BB

33 f.Kr

33BD

33BE

33BF

Ω 2126

33C0

33C1

3390

3391

3392

3393

3394

33DE
6x/Ex
33DF

33B0

33B1

33B2

33B3

338A

338B

338C

33A9

33AA

33AB

33AC

2113

3395

3396

3397
7x/Fx
3398

33FF

3388

3389

33 e.Kr

33AE

33AF

32CC

33DD

33C8

32 CD

32 e.Kr

33D6

33CB

33CA
  ASCII-interpunktion, kan också mappas till blocket Halfwidth och Fullwidth Forms .

Teckenuppsättning 0x29/0xA9 (rad nummer 9, kartongritning)

KPS 9566 (med prefixet 0x29/0xA9)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x/Yxa
2500

2502

250C

2510

2518

2514

251C

252C

2524

2534

253C

2501

2503

250F

2513
3x/Bx
251B

2517

2523

2533

252B

253B

254B

2520

252F

2528

2537

253F

251D

2530

2525

2538
4x/Cx
2542

2512

2511

251A

2519

2516

2515

250E

250D

251E

251F

2521

2522

2526

2527

2529
5x/Dx
252A

252D

252E

2531

2532

2535

2536

2539

253A

253D

253E

2540

2541

2543

2544

2545
6x/Ex
2546

2547

2548

2549

254A
7x/Fx

Teckenuppsättning 0x2A/0xAA (radnummer 10, Hiragana)

Den här raden innehåller Hiragana för användning på japanska .

Jämför rad 10 i KS X 1001 , som använder samma layout. Jämför och kontrastera rad 4 i JIS X 0208 , som också använder samma layout, men i en annan rad.

KPS 9566 (prefixet med 0x2A/0xAA)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x/Yxa
3041

3042

3043

3044

3045

3046

3047

3048

3049

304A

304B

304C _

304D

304E

304F
3x/Bx
3050

3051

3052

3053

3054

3055

3056

3057

3058

3059

305A

305B

305C

305D

305E

305F
4x/Cx
3060

3061

3062

3063 _

3064

3065

3066

3067

3068

3069

306A

306B

306C

306D

306E

306F
5x/Dx
3070

3071

3072

3073

3074

3075

3076

3077

3078

3079

307A

307B

307C

307D

307E

307F
6x/Ex
3080

3081

3082

3083

3084

3085

3086

3087

3088

3089

308A

308B

308C

308D

308E

308F
7x/Fx
3090

3091

3092

3093

Teckenuppsättning 0x2B/0xAB (radnummer 11, Katakana)

Den här raden innehåller Katakana för användning på japanska . Det japanska långa vokalmärket , som används i katakanatext och ingår i rad 1 i JIS X 0208 , ingår dock inte (på samma sätt som med GB 2312 och KS X 1001), även om det ingår i KPS 9566-2011 utanför huvudplanet, vid 0xEA48 .

Jämför rad 11 i KS X 1001 , som använder samma layout. Jämför och kontrast rad 5 i JIS X 0208 , som också använder samma layout, men i en annan rad.

KPS 9566 (prefixet 0x2B/0xAB)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x/Yxa
30A1

30A2

30A3

30A4

30A5

30A6

30A7

30A8

30A9

30AA

30AB

30AC

30 e.Kr

30AE

30AF
3x/Bx
30B0

30B1

30B2

30B3

30B4

30B5

30B6

30B7

30B8

30B9

30BA

30BB

30 f.Kr

30BD

30BE

30BF
4x/Cx
30C0

30C1

30C2

30C3

30C4

30C5

30C6

30C7

30C8

30C9

30CA

30CB

30CC

30 CD

30 e.Kr

30CF
5x/Dx
30D0

30D1

30D2

30D3

30D4

30D5

30D6

30D7

30D8

30D9

30DA

30DB

30DC

30DD

30DE

30DF
6x/Ex
30E0

30E1

30E2

30E3

30E4

30E5

30E6

30E7

30E8

30E9

30EA

30EB

30EC

30ED

30EE

30EF
7x/Fx
30F0

30F1

30F2

30F3

30F4

30F5

30F6

Teckenuppsättning 0x2C/0xAC (radnummer 12, diverse symboler och pilar)

I syfte att mappa denna rad till Unicode, förenades den fetstilta högerpilen med den fetstilta högerpilen från Zapf Dingbats (U+27A1), även om tidigare tabeller (som saknade mappningar för de andra fetstilta pilarna) istället hade förenat den med U+ 279E, en något annorlunda Zapf Dingbats-karaktär. Eftersom motsvarande pilar i andra riktningar inte ingick i Dingbats block, kodades ytterligare pilar mellan U+2B05 och U+2B0D för kompatibilitet med KPS 9566. Dessa inkorporerades i Unicode-koddiagrammen med hjälp av de referensglyfer som föreslagits av det nordkoreanska nationella organet, medan U+27A1 behöll sin referensglyph baserat på Zapf Dingbats. Dessa pilar (U+2B05 till U+2B07, plus U+27A1) valdes i Unicode 6.0 som mappningar för några av piltecken i mobila emoji -uppsättningar. Därefter, under tillägget av Wingdings 3 repertoaren i Unicode 7.0, Unicode-täckningen av piltecken granskades, vilket resulterade i att ytterligare en högerpil lades till vid U+2B95 med avsikten att harmonisera med tecknen U+2B05 till U+2B0D (i textpresentation), sedan referensen ändrades glyph för Zapf Dingbats-karaktären ansågs inte lämplig.

I tidigare utgåvor av KPS 9566, som 1997 års upplaga, inkluderade denna rad både det enkla postmärket i japansk stil (〒) och en version i en nedåtriktad triangel, som föreslogs av det nordkoreanska nationella organet för tillägg till Unicode tillsammans med de andra saknade KPS 9566-tecken. Ett svar från en sydkorean representant, bland andra förfrågningar, begärde bevis för symbolens användning i Nordkorea, och noterade att postmärket i japansk stil inte används i Sydkorea, som använder en inringad 우 (dvs. ㉾) för liknande ändamål, och frågade om en japansk -stilt postmärke användes i Nordkorea. Ett efterföljande möte hölls för att diskutera detta förslag, med deltagande av nord- och sydkoreanska WG2-representanter; mötesrapporten noterar att det nordkoreanska organet hade beslutat att se över karaktären innan det diskuterades vidare och därför inte rekommenderade det för övervägande av WG2 som helhet. Poststämpelstriangeln togs sedan bort från KPS 9566 2003, vilket bara lämnade kvar det oinneslutna postmärket.

Postmärkestriangeln lades så småningom till Unicode i version 13.0, både för kompatibilitet med det äldre KPS 9566-97-tecknet och efter att märket identifierades som en symbol som hade använts för certifiering av elektriska apparater i Japan (som en föregångare ) till PSE-diamanten ).

Vissa KPS 9566-tecken i den här raden, nämligen två former av emblemet för Koreas arbetarparti , en sax som pekar i en annan riktning än de i Dingbats -blocket, och en inringad uppåtriktad manikel , förblir mappade till Privat användningsområde .

De nordöstra och nordvästra vita pilarna använde felaktigt utbytta Unicode-mappningar i 2003 års upplaga. Detta korrigerades i kartläggningarna av 2011 års upplaga.

KPS 9566 (prefixet med 0x2C/0xAC)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x/Yxa  
235F

2600

2602

☔︎ 2614

2601

2744

⚡︎ 26A1

26A0

2116

2192

2190

2191

2193
3x/Bx
2197

2196

2198

2199

2194

2195

21E8

21E6

21E7

21E9

2B00

2B01

2B02

2B03

2B04

21F3
4x/Cx
27A1

2B05

2B06

2B07

2B08

2B09

2B0A

2B0B

2B0C

2B0D

2663

2665

2660

2666

3012

2B97
5x/Dx
260F

260E

23 e.Kr

261E
 
☕︎ 2615

327C

327D

321D

321E

33C7

32CF

3250

2121

213B
6x/Ex
337A

® 00AE
7x/Fx
  mappad till privat användningsområde, visas simulerad.

Teckenuppsättning 0x2E/0xAE (radnummer 14, Latin-1 delmängd)

Karaktärerna i denna uppsättning fanns inte i 1997 års version av teckenuppsättningen, men lades till i 2003 års version. De utgör en delmängd av Latin-1 Supplement -blocket i Unicode (motsvarande den övre hälften av ISO 8859-1 (Latin-1) teckenuppsättningen). Detta inkluderar accenter av romerska bokstäver och symboler. Vissa av de symboler som redan inkluderades utelämnas, medan andra dupliceras som halvbreddsmotsvarigheter till de tidigare fullbreddsformerna : till exempel not-tecknet (¬, U+00AC) representeras som 0xAEAC, medan dess fullbreddsform (¬, U+FFE2) representeras som 0xA2D1 (i rad 2 ).

Den här raden har utelämnats från mappningen för 2011 års upplaga av standarden, vilket indikerar att den kan ha tagits bort någon gång efter 2003 års upplaga. Yen-tecknet med halv bredd är istället kodat till 0xE98E i 2011 års upplaga.

Det nödvändiga utrymmet skulle falla utanför intervallet på 94 tecken och kollidera med området som används för utökade chosŏn'gŭl stavelser när en UHC -stil kodning används (specifikt med stavelsen 쁲), och utelämnas. Även om y med trema också faller utanför 94-teckenintervallet, och spårbyten 0xFF i övrigt är oanvänd, mappas koden 0xAEFF till den i KPS 9566-2003.

KPS 9566-2003 (med prefixet 0x2E/0xAE)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x/Yxa
¡ 00A1

¢ 00A2

£ 00A3

¤ 00A4

¥ 00A5

¦ 00A6

© 00A9

ª 00AA

« 00AB

¬ 00 AC
BLYG
¯ 00AF
3x/Bx
µ 00B5

¸ 00B8

º 00BA

» 00BB

¿ 00BF
4x/Cx
À 00C0

Á 00C1

 00C2

à 00C3

Ä 00C4

Å 00C5

Æ 00C6

Ç 00C7

È 00C8

É 00C9

Ê 00CA

Ë 00CB

Ì 00CC

I 00CD

Î 00 CE

Ï 00CF
5x/Dx
Ð 00D0

Ñ ​​00D1

Ò 00D2

Ó 00D3

Ô 00D4

Õ 00D5

Ö 00D6

Ø 00D8

Ù 00D9

Ú 00DA

Û 00DB

Ü 00DC

Ý 00DD

Þ 00DE

ß 00DF
6x/Ex
à 00E0

á 00E1

â 00E2

ã 00E3

ä 00E4

å 00E5

æ 00E6

ç 00E7

è 00E8

é 00E9

ê 00EA

ë 00EB

ì 00 EC

i 00ED

î 00EE

ï 00EF
7x/Fx
ð 00F0

ñ 00F1

ò 00F2

ó 00F3

ô 00F4

õ 00F5

ö 00F6

ø 00F8

ù 00F9

ú 00FA

û 00FB

ü 00FC

ý 00FD

þ 00FE

ÿ 00FF

Förkomponerade Chosŏn'gŭl-uppsättningar (rad nummer 16 till 44)

Förkomponerade Chosŏn'gŭl stavelsekluster tilldelas kodpunkter i ett kontinuerligt sorterat block mellan kodpunkterna 16-01 och 44-47 inklusive. Inte alla möjliga kluster tilldelas kodpunkter. Jämför de olika beställningarna och tillgängligheten i KS X 1001 .

Den kodade formen som är dokumenterad för KPS 9566-2003 kodar KPS 9566-planet på GR (0xA1-0xFE) och kodar dessutom de återstående stavelseklustren med hjälp av leadbyte i intervallet 0x80-0xC2 och spårbyte i intervallen 0x41-0x61-0x5A, och 0x81-0xFE (där högst en byte är i intervallet 0xA1-0xFE), på samma sätt som Unified Hangul Code men med de utelämnade klustren från och sorteringsordningen för KPS 9566, inte KS X 1001 .

  • Rad 16: 가 각 간 갇 갈 갉 갊 감 갑 값 갓 강 갖 갗 같 갚 갛 갔 갸 갹 갼 걱 갹 갱 걱 걸 걹 걺 검 겁 것 겅 겆 겉 겊 겋 겄 겨 격 견 겯 결 겸 겹 겻 경 곁 겪 겼 고 곡 곤 곧 골 곪 곬 곯 곰 곱 곳 공 곶 곺 국 굵 굔 굵 군 군 굵 굶 굻 굼 굽 굿 궁 궂 규 균 귤 귬 귱 그 극 근 귿
  • Rad 17: 글 긁 긇 금 급 긋 긍 기 긱 긴 긷 길 긺 김 깁 깃 깅 깆 깇 깉 깊 갬 갬 깰 갰 걔 걘 걜 게 겍 겐 겔 겜 겝 겟 겡 겠 계 곈 곌 곕 곗 괴 괵 괸 괼 굄 굅 굇 굉 굈 귀 귁 귄 귈 귐 귑 귓 긔 곴 곽 관 괃 괃 괄 괄 괆 괉 권 궐 궘 궝 궜 괘 괙 괜 괠 괩 괭 괬 궤 궥 궷 나 낙
  • Rad 18: 낛 난 낟 날 낡 낢 남 납 낫 낭 낮 낯 낱 낳 낚 났 냐 냑 냔 냘 냠 냄 넘 냠 넓 넘 넙 넛 넝 넢 넣 넊 넜 녀 녁 년 녈 념 녑 녓 녕 녘 녔 노 녹 논 놀 놂 놈 놉 놋 농 높 놓 뇨 뇩 뇬 뇰 뇸 뇹 뇻 뇽 누 눅 눈 눕 눅 눈 눋 Nästa
  • Rad 19: 늦 늪 니 닉 닌 닐 닒 님 닙 닛 닝 닢 내 낵 낸 낼 냄 냅 냇 냉 냈 먄 넬 네 넹 넸 녜 녠 뇌 뇐 뇔 뇜 뇝 뇟 뉘 뉜 뉠 뉨 뉩 뉭 늬 늰 늴 늼 닁 놔 놘 놜 놧 놨 눠 눨 눳 눴 놰 눼 다 닥 단 닫 달 닭 닮 닯 닲 닷 닯 닲 닷 닾 닿 닦 닸 댜 더 덕 던 덛 덜 덞 덟 덤 덥 덧 덩 덫
  • Rad 20: 덮 덯 덖 덨 뎌 뎐 뎔 뎡 뎠 도 독 돈 돋 돌 돎 돐 돔 돕 돗 동 돛 두 두 두 두 두 둣 둥 듀 듄 듈 듐 듕 드 득 든 듣 들 듥 듦 듧 듬 듭 듯 등 디 딕 딘 딛 딜 딤 딥 딧 딩 딪 딮 딨 대 댁 댄 댈 댐 댑 댓 댕 댔 댸 데 뎃 뎅 뎄 뎨 뎬 되 된 될 됨 됩 됫 됭 됬 뒤 뒥 뒨 뒬
  • Rad 21: 뒴 뒵 뒷 뒹 듸 듼 딀 딉 딍 돠 돤 돨 둬 둰 둴 둼 둿 뒀 돼 됀 뽄 띒 랒 랒 랍 랏 랑 랒 랖 랗 랐 랴 략 랸 랼 럄 럅 럇 량 러 럭 런 🔸 룝 룟 룡 루 룩 룬 룰 룸 룹 룻 룽 류 륙 륜 률 륨 륩
  • Rad 22: 륫 륭 르 륵 른 를 름 릅 릇 릉 릊 릍 릎 리 릭 린 릴 림 립 릠 랩 맆 래 랭 랬 럐 레 렉 렌 렐 렘 렙 렛 렝 렜 례 롄 롈 롑 롓 뢰 뢴 뢸 룀 룁 룃 룅 룄 뤼 뤽 륀 륄 륌 륏 륑 릐 릔 릘 릠 롸 롼 뢉 뢍 먤 뤘 많 맏 말 맑 맒 맘 맙 맛 망 맞 맟 맡 맣 먀 먁 먄 먈
  • Rad 23: 먐 먕 머 먹 먼 멀 멁 멂 멈 멉 멋 멍 멎 멓 멌 며 멱 면 멸 몀 몁 몃 몀 명 몃 몀 몯 몰 몲 몸 몹 못 몽 뫃 묘 묜 묠 묩 묫 무 묵 문 묻 물 묽 묾 뭄 뭅 뭇 뭉 뭍 뭏 묶 뮤 뮥 뮨 뮬 뮴 뮷 뮹 므 믄 믈 믐 믑 믓 믕 미 밉 밋 밍 및 밑 밌 매 맥 맨 맬 맴 맵 맷 맹 맺 맸 먜
  • Rad 24: 메 멕 멘 멜 멤 멥 멧 멩 멨 몌 몐 뫼 묀 묄 묌 묍 묏 묑 뮈 뮌 뮐 믜 되 뭔 뭘 뭠 뭡 뭣 뭤 뫠 뭬 바 박 밗 반 받 발 밝 밞 밟 밤 밥 밧 방 밭 밖 뱌 뱍 뱐 뱜 뱝 버 벅 번 벋 벌 벍 벎 범 법 벗 벙 벚 뽲 볘 벚 뽲 볏 병 볓 볕 볐 보 복 본 볼 봄 봅 봇 봉 봏 볶 뵤 뵨
  • Rad 25: 뵬 부 북 분 붇 불 붉 붊 붐 붑 붓 붕 붙 붚 뷰 뷴 뷸 븀 븁 븃 븅 븐 븐 블 븅 븐 븐 비 빅 빈 빌 빎 빔 빕 빗 빙 빚 빛 배 백 밴 밷 밸 뱀 뱁 뱃 뱅 뱉 뱄 뱨 베 벡 벤 벧 벨 벰 벱 벳 벵 벴 볘 볜 뵈 뵉 뵌 뵐 뵘 땷 뵜 븷 땷 뵜 븬 븰 븽 봐 봔 봡 봣 봤 붜 붤 붯 붴 붰 봬 봰 뵀 붸
  • Rad 26: 사 삭 삯 산 삳 살 삵 삶 삼 삽 삿 상 샅 샀 샤 샥 샨 샬 샴 샠 샷 섧 섬 섭 섯 성 섶 섞 섰 셔 셕 션 셜 셤 셥 셧 셩 셨 소 속 손 솓 솔 솖 솜 솝 솟 송 솥 솎 쇼 쇽 숀 숄 숌 숍 숏 숑 수 숙 순 숈 쩈 술 숲 슈 슉 슌 슐 슘 슙 슛 슝 스 슥 슨 슬 슭 슲 슳 슴
  • Rad 27: 습 슷 승 시 식 신 싣 실 싫 심 십 싯 싱 싶 새 색 샌 샐 샘 샙 샛 샄 츄 섹 센 셀 셈 셉 셋 셍 셑 셒 셌 셰 셴 셸 솅 쇠 쇡 쇤 쇨 쇰 쇱 쇳 쇵 쇴 쉬 쉭 쉰 쉴 쉼 쉽 쉿 슁 싀 싄 솨 솩 솬 솰 솻 솽 숴 쉈 쉇 쐇 쉑 쉔 쉘 쉠 쉡 쉥 자 작 잔 잖 잗 잘 잚 잠 잡 잣 장
  • Rad 28: 잦 잤 쟈 쟉 쟌 쟎 쟐 쟘 쟙 쟝 저 적 전 절 젊 점 접 젓 정 젖 젼 쀡 쀡 젉 졌 조 족 존 졸 졺 좀 좁 좃 종 좆 좇 좋 죠 죡 죤 죨 죰 죵 주 죽 준 줄 줅 줆 줌 줍 줏 중 쥬 쥰 쥴 쥼 즁 즈 즉 즌 즐 즘 즙 즧 슧 슧 쁧 짐 집 짓 징 짖 짙 짚 재 잭 잰 잴 잼 잽 잿 쟁 쟀 쟤
  • Rad 29: 쟨 쟬 제 젝 젠 젤 젬 젭 젯 젱 젶 젰 졔 졘 졜 죄 죈 죌 죔 죕 죗 죥 엘 쥡 쥣 즤 좌 좍 좐 좔 좝 좟 좡 줘 줬 좨 좽 좼 줴 줸 줼 쥄 쥅 쥈 차 착 찬 찮 찰 참 찹 찻 창 찾 찼 챠 챤 챦 챨 챰 챱 챵 첲 첲 첩 첲 첲 첩 쳐 쳑 쳔 쳘 쳤 초 촉 촌 촐 촘 촙 촛 총 쵸 쵼 춀 춈
  • Rad 30: 추 축 춘 춛 출 춤 춥 춧 충 츄 츈 츌 츔 츙 츠 측 츤 츨 츰 츱 츳 츹 칡 칩 칫 칭 채 책 챈 챌 챔 챕 챗 챙 챘 챼 체 첵 첸 첼 쳄 쳅 쳇 쳉 쳈 쳬 쳰 촁 최 쵠 쵤 쵬 쵭 쵯 쵱 취 췬 췰 췸 췹 췻 췴 츼 샷 샷 샷 샷 쵀 쵄 췌 췐 카 칵 칸 칼 캄 캅 캇 캉 캎 캈 캬 캭 캰
  • Rad 31: 캼 캽 컁 커 컥 컨 컫 컬 컴 컵 컷 컹 컽 컾 컸 켜 켠 켤 켬 켭 콕 콜 콜 콧 콩 쿄 쿠 쿡 쿤 쿨 쿰 쿱 쿳 쿵 큐 큔 큘 큠 크 큭 큰 클 큼 큽 킁 키 킥 킨 킬 킴 킵 킷 킹 킾 캐 캑 캔 캘 캠 캡 캣 캥 캪 케 켄 캪 캼 켈 켓 켕 켸 쾨 쾰 퀴 퀵 퀸 퀼 큄 큅 큇 큉 킈 콰 콱 콴
  • Rad 32: 콸 쾀 쾅 쿼 퀀 퀄 퀑 쾌 쾐 쾔 쾡 퀘 퀙 퀠 퀭 타 탁 탄 탈 탉 탐 탑 탓 터 턱 턴 털 턺 텀 텁 텃 텅 텄 텨 텬 텼 토 톡 톤 톨 톰 톱 톳 통 톺 툐 투 툭 툰 툴 툼 툽 툿 퉁 튜 튠 튤 튬 튱 트 특 튼 튿 틈 티 티 티 틴 틸 팀 팁 팃 팅 태 택 탠 탤 탬 탭 탯 탱 탶 탰 턔
  • Rad 33: 테 텍 텐 텔 템 텝 텟 텡 텦 톄 톈 퇴 퇸 툇 툉 튀 튁 튄 튈 튐 튑 휋 틇 퉈 퉜 퇘 퉤 퉨 퉸 파 팍 판 팔 팖 팜 팝 팟 팡 팥 팎 팠 퍄 퍅 퍼 퍽 펀 펄 펌 펍 펏 펑 펐 펴 펵 편 펼 폄 폅 폇 평 폈 포 폭 표 푏 푤 푭 푯 푸 푹 푼 푿 풀 풂 품 풉 풋 풍 퓨 퓬 퓰 퓸
  • Rad 34: 퓻 퓽 프 픈 플 픔 픕 픗 픙 피 픽 핀 필 핌 핍 핏 핑 패 팩 팬 팼 펌 펌 팼 팸 펜 펠 펨 펩 펫 펭 펲 폐 폔 폘 폡 폣 푀 푄 퓌 퓐 퓔 퓜 portal 혁 현 혈 혐 협 혓 형 혔 호 혹 혼 혿 홀 홅 홈 홉 홋
  • Rad 35: 홍 홑 효 횬 횰 횹 횻 후 훅 훈 훌 훑 훔 훕 훗 훙 휴 휵 휸 휼 흄 흑 흉 흐 흙 흝 흠 흡 흣 흥 흩 히 힉 힌 힐 힘 힙 힛 힝 해 핵 핸 핼 햄 햅 햇 행 했 햬 헤 헥 헨 헬 헴 헵 헷 헹 헸 혜 혠 혤 혭 회 획 횐 휡 휡 횐 휠 휨 휩 휫 휭 희 흰 흴 흼 흽 힁 화 확 환 활 홤 홥
  • Rad 36: 홧 황 훠 훡 훤 훨 훰 훵 홰 홱 홴 횃 횅 횄 훼 훽 휀 휄 휑 까 깓 깓 까 깍 깐 깥 깎 깠 꺄 꺅 꺈 꺌 꺼 꺽 껀 껄 껌 껍 껏 껑 꺾 껐 껴 껸 껼 꼇 꼍 꼈 꼬 꼭 꼰 꼱 꼲 꼴 꼼 꼽 꼿 꽁 꽂 꽃 꾜 꾸 꾹 꾼 꾼 꾿 꾿 꿀꿉 끄 끅 끈 끊 끌 끎 끓 끔 끕 끗 끙 끝 끼 끽 낀 낄 낌
  • Rad 37: 낍 낏 낑 깨 깩 깬 깰 깸 깹 깻 깽 깼 꺠 께 껙 껜 껠 껨 껩 껫 껫 껼 꾐 꾐 꾐 꾐 꾐 꾐 꾕 뀌 뀐 뀔 뀜 뀝 뀡 꽈 꽉 꽌 꽐 꽛 꽝 꽜 꿔 꿘 꿜 꿥 꿧 꿩 꿨 꽤 꽥 꽨 꽬 꽹 꿰 꿱 꿴 꿸 뀀 뀁 뀅 뀄 따 딱 딴 딸 딿 땀 땁 땲 떠 떡 떤 떨 떪 떫 떰 떱 떳 떵 떻 떴 뗘 뗬 또 똑 똔
  • Rad 38: 💕 띱 띳 띵 때 땍 땐 땔 땜 땝 땟 땡 땠 떼 떽 뗀 뗄 뗌 뗍 뗏 뗑 뗐 뙤 뙨 뛰 뛴 뛸 뜀 뜁 뜅 띄 띅 띈 띌 띔 띕 띙 똬 똰 똴 뚸 뛹 먠 뚸 뛌 뙈 빪 빰 빱 빳 빵 빻 빴 뺘 뺙 뺜 뺨 뻐 뻑 뻔 뻗 뻘 뻠
  • Rad 39. 쁑 쁘 쁜 쁠 쁨 쁩 삐 삑 삔 삘 삠 삡 삣 삥 빼 빽 뺀 뺄 뺌 뺍 뺏 뺑 뺐 뺴 뻬 뻭 뻰 뻴 뻼 뼁 뾔 쀠 쁴 뽜 뿨 싸 싹 싻 싼 쌓 쌈 싌 쌸 썅 써 썩 썬 썰 썲 썸 썹 썻 썽 썪 썼 쎠 쏘 쏙 쏜
  • Rad 40: 쏟 쏠 쏢 쏨 쏩 쏫 쏭 쑈 쑌 쑐 쑘 쑝 쑤 쑥 쑨 쑬 쑴 쑵 쑹 쓓 쓘 쓓 츓 츓 츓 츓 씀 씁 씅 씨 씩 씬 씯 씰 씸 씹 씻 씽 씼 쌔 쌕 쌘 쌜 쌤 쌥 쌧 쌩 쌨 썌 쎄 쎅 쎈 쎌 쎔 쎕 쎙 쎼 쏀 쐬 쐭 쐰 쐴 쐼 쐽 쑀 쒸 쒼 쏔 쏔 쏔 쏔 쏼 쐇 쐉 쐈 쒀 쒔 쐐 쐑 쐤 쒜 쒠 쒭 짜 짝 짠 짢 짤
  • Rad 41: 짧 짬 짭 짯 짱 짰 쨔 쨘 쨤 쨩 쩌 쩍 쩐 쩔 쩗 쩜 쩝 쩟 쩡 쩠 쪄 콫 콪 쫑 쫒 쫓 쫗 쬬 쬰 쬼 쭁 쭈 쭉 쭌 쭐 쭘 쭙 쭛 쭝 쮸 쯀 쯔 쯕 쯘 쯜 쯤 쯧 쯩 쯪 찌 찍 찐 찔 찜 찝 찟 찡 찢 찦 찧 째 짹 짼 쨨 싨 싨 싨 쩨 쩩 쩬 쩰 쩸 쩹 쩽 쪠 쬐 쬔 쬘 쬠 쬡 쬤 쮜 쯰 쯴
  • Rad 42: 쫘 쫙 쫜 쫠 쫭 쫬 쭤 쭹 쭸 쫴 쬈 쮀 아 악 안 앉 않 알 앍 앎 앒 압 암 암 았 야 약 얀 얃 얄 얇 얌 얍 얏 양 얕 얗 얐 어 억 언 얹 얻 얼 얽 얾 엄 업 없 엇 엉 엊 엌 엎 엏 었 여 역 연 엳 열 엶 엷 염 엿 엾 염 엿 엾 였 오 옥 온 올 옭 옮 옰 옳 옴 옵 옷 옹 옻 옾 요 욕
  • Rad 43: 욘 욜 욤 욥 욧 용 우 욱 운 울 욹 욺 움 웁 웃 웅 유 육 윤 율 윰 윷 융 을 읅 읊 음 읍 읏 응 읒 읓 읔 읕 읖 읗 이 익 인 일 읽 읾 잃 임 입 잇 잉 잊 잎 있 애 액 앤 앨 앰 앱 앳 앵 앴 얘 얜 얠 얩 엣 엥 엥 엡 엥 엤 예 옌 옐 옘 옙 옛 옝 옜 외 왹 왼 욀 욈 욉 욋 욍
  • Rad 44: 위 윅 윈 윌 윔 윕 윗 윙 의 읜 읠 읨 읫 와 왁 완 왇 왈 왐 왑 왓 웜 읐 왔 웜 웟 웡 웠 왜 왝 왠 왬 왯 왱 웨 웩 웬 웰 웸 웹 웻 웽 윁

Hanja-set (rad nummer 45 till 94)

Hanja vid 69-09 (0xE5A9) är mappad till U+676E i alla dokumenterade tabeller; tecken är dock ordnade enligt deras avläsningar, av vilket det framgår att det är tänkt att vara U+67FF istället.

Utökade icke-stavelser, icke-hanja-uppsättningar i KPS 9566:2011

Följande är diagram för den icke-staviga, icke-hanja-delen av KPS 9566-2011 utanför huvudplanet.

Tilläggssats 0xE0 (symboler och piktogram)

KPS 9566-2011 (med prefixet 0xE0)
0 1 2 3 4 5 6 7 8 9 A B C D E F
4x
25D1

2298

2709

261B

261E

270C
5x
270D

270F

270E

2710

2713

2714

22A1

2394
6x
2299
7x
⚓︎ 2693

263C
8x
25C9
9x
272A

272F

272C

272B

272E

272D

2730

2729
 Inte i Unicode, mappad till område för privat användning

Tilläggsuppsättningar 0xE1, 0xE2, 0xE3 (okänt)

Dessa tillägg sätter kartan till området för privat användning. Deras syfte är inte dokumenterat.

KPS 9566-2011 (med prefixet 0xE1)
0 1 2 3 4 5 6 7 8 9 A B C D E F
4x
5x
6x
7x
8x
9x
Yxa (En del av huvudplanet.)
 Inte i Unicode, mappad till område för privat användning
KPS 9566-2011 (med prefixet 0xE2)
0 1 2 3 4 5 6 7 8 9 A B C D E F
4x
5x
6x
7x
8x
9x
  Ej i Unicode, mappad till område för privat användning
KPS 9566-2011 (med prefixet 0xE3)
0 1 2 3 4 5 6 7 8 9 A B C D E F
4x
5x
6x
7x
8x
9x
  Ej i Unicode, mappad till område för privat användning

Förlängningsset 0xE4 (pilar)

Den här uppsättningen innehåller flera, mestadels högerpilar som mappas till Unicode Dingbats -blocket och på andra ställen.

KPS 9566-2011 (med prefixet 0xE4)
0 1 2 3 4 5 6 7 8 9 A B C D E F
4x
2794

2798

2799

279A

279B

279C

279D

279F

27A0

27A2

27A3

27A4

27A5

27A6

27A7
5x
27A8

27A9

27AA

27AB

27AC

27 e.Kr

27AE

27AF

27B1

27B2

27B3
6x
27B4

27B5

27B6

27B7

27B8

27B9

27BA

27BB

27BE

27 f.Kr

27BD
7x
8x
27F7

21CC

296B

296C

21D0

27F9
9x
 Inte i Unicode, mappad till område för privat användning

Tilläggsuppsättning 0xE5 (romerska upphöjda och nedsänkta)

Den här raden innehåller flera romerska upphöjda bokstäver med små bokstäver med spårbyte som motsvarar deras ASCII-motsvarigheter med stora bokstäver, och romerska nedsänkta bokstäver med gemener med spårbytes som motsvarar deras ASCII-motsvarigheter med gemener.

KPS 9566-2011 (med prefixet 0xE5)
0 1 2 3 4 5 6 7 8 9 A B C D E F
4x
1D43

1D47

1D9C

1D48

1D49

1DA0

1D4D

1D4F

1D50

207F

1D52
5x
1D56

1D57

1D58

1D5B
6x
2090
2091 kr

1D62

2C7C
2092 kr
7x
1D63

1D64

1D65
2093
8x
9x
 Inte i Unicode, mappad till område för privat användning

Tilläggsuppsättning 0xE6 (grekiska och symbol upphöjda och nedsänkta)

KPS 9566-2011 (med prefixet 0xE6)
0 1 2 3 4 5 6 7 8 9 A B C D E F
4x
1D45

1D5D

1D5E

1D5F

1D4B

ᶿ 1DBF

1DB9
5x
1D60

1D61
6x
1D66

1D67
7x
1D68

1D69

1D6A
8x
207A

207B
9x
208A

208B
 Inte i Unicode, mappad till område för privat användning

Tilläggssats 0xE7 (ytterligare listmarkörer)

KPS 9566-2011 (med prefixet 0xE7)
0 1 2 3 4 5 6 7 8 9 A B C D E F
4x
325B

325C

325D

325E

325F

32B1

32B2

32B3

32B4

32B5

32B6

32B7

32B8

32B9

32BA
5x
32BB

32 f.Kr

32BD

32BE

32BF
6x
7x
8x
9x
  Ej i Unicode, mappad till område för privat användning

Förlängningsset 0xE8

KPS 9566-2011 (med prefixet 0xE8)
0 1 2 3 4 5 6 7 8 9 A B C D E F
4x
5x
6x
7x
8x
FE30
9x
  Ej i Unicode, mappad till område för privat användning

Tilläggsuppsättning 0xE9 (ytterligare symboler och skiljetecken)

Denna uppsättning innehåller spelkortssymboler, olika diverse symboler och halvbreddsmotsvarigheter för några av valutasymbolerna i rad 8 . Kelvin - tecknet ingår också, efter att ha ersatts på rad 8 av eurotecknet .

KPS 9566-2011 (med prefixet 0xE9)
0 1 2 3 4 5 6 7 8 9 A B C D E F
4x
2205

2297

3013

2667

2661

2664

2662

25EF

29BE
5x
6x
7x
8x
K 212A

20A9

20A4

¥ 00A5
9x
  Ej i Unicode, mappad till område för privat användning

Tilläggsuppsättning 0xEA (japanska skiljetecken och extra jamo)

Den här uppsättningen innehåller flera skiljetecken som används i Japan och några tecken från Hangul-kompatibilitet Jamo Unicode-blocket som inte redan finns på rad 4 . Detta omfattar några av jamo-tecken som finns i KS X 1001 , men tidigare frånvarande i KPS 9566.

KPS 9566-2011 (med prefixet 0xEA)
0 1 2 3 4 5 6 7 8 9 A B C D E F
4x
30FD

30FE

309D

309E

3005

3006

3007

30FC
5x
6x
3165

316D

3171

3172

3173

3174

3175

3176

3177

3178

3179

317A

317B

317D

317E
7x
3180

3184

3185

3187

3188

3189

318A

318B

318C

119E

318E
8x
9x
  Ej i Unicode, mappad till område för privat användning

Fotnoter

externa länkar