KPS 9566
Alias | ISO-IR-202 (1997 version) |
---|---|
Språk) |
Koreanska , engelska , ryska Delvis support: grekiska , japanska |
Standard | KPS 9566 |
Nuvarande status | Används endast i Nordkorea . |
Klassificering | ISO-2022 -kompatibel DBCS , CJK-kodning |
Kodningsformat | UHC -kodning, ISO 2022 . |
Annan relaterad kodning | KS X 1001 , GB 12052 |
KPS 9566 (" DPRK Standard Korean Graphic Character Set for Information Interchange ") är en nordkoreansk standard som specificerar en teckenkodning för Chosŏn'gŭl (Hangul) skriftsystem som används för det koreanska språket . Utgåvan av 1997 specificerade en ISO 2022 -kompatibel 94×94 två-byte kodad teckenuppsättning . Efterföljande utgåvor har lagt till ytterligare kodade tecken utanför 94×94-planet, på ett sätt som är jämförbart med UHC eller GBK .
KPS 9566 skiljer sig i tillvägagångssätt från KS X 1001 , dess sydkoreanska motsvarighet, genom att använda en annan ordning av chosŏn'gŭl, genom att koda explicita vertikala presentationsformer av skiljetecken, genom att inte koda dubbletter av hanja för flera läsningar, och genom att inkludera flera tecken som är specifika för det nordkoreanska politiska systemet, inklusive särskilda kodningar för namnen på landets tidigare och nuvarande ledare ( Kim Il-sung, Kim Jong-il och Kim Jong-un ).
Även om KPS 9566 var den ursprungliga källan till flera tecken som lagts till i Unicode , har inte alla KPS 9566-tecken Unicode-motsvarigheter. De som inte gör det mappas till liknande Unicode-tecken eller till området för privat användning .
Bakgrund och andra standarder
ASCII - teckenuppsättningen har sitt ursprung i USA 1963 och reviderades 1967 till den form den har idag. ASCII blev också accepterad som en internationell standard 1967 och blev ECMA-6, betecknad ISO/IEC 646 av International Organization for Standardization . Den är för närvarande betecknad ANSI X3.4-1986 och ISO 646:1991. ASCII var en 7-bitars enkelbytekodning inklusive 94 grafiska tecken, mellanslag och 33 kontrollkoder , vilket gav grundläggande stöd för att representera amerikansk engelsk text som en serie bytes.
Nästa upplaga av ISO 646, publicerad 1972, reviderade standarden för att introducera konceptet med nationella versioner av koden, vilket gjorde det möjligt för länder att ersätta några mindre vanliga koder med sina egna obligatoriska tecken. Samtidigt pågick arbetet med att definiera förlängningsmekanismer för ASCII, med avsikten att kunna tillämpas på både 7-bitars och 8-bitars miljöer. Detta slutfördes 1973 och publicerades som JIS X 0202 , ECMA-35 och ISO 2022 . ISO 2022 specificerar mekanismer för att använda en-byte och flera-byte teckenuppsättningar med en viss struktur i både 7-bitars och 8-bitars miljöer, och för att deklarera och växla mellan dem på ett standardsätt med skiftkoder och escape-sekvenser .
Länder i Östasien , på grund av att de använde stora repertoarer av kinesiska tecken , introducerade standardiserade dubbelbyte-kodningar (DBCS) för sina skrivsystem, eftersom antalet tecken som kan representeras i en enkelbytekod inte var tillräckligt. I en ISO 2022-kompatibel DBCS kan varje tecken representeras med två ASCII-utskriftsteckenbyte; platsen för ett tecken kan refereras av dessa bytevärden, eller med två siffror från 1 till 94 (en kuten , lika med resp följt av GB 2312 (fastlandet Kina) 1980 och av Wansung-koden (Sydkorea; först benämnd KS C 5601-1987) 1987. Big5 (Taiwan), definierad 1984, följde inte ISO 2022-strukturen. När de användes i en 8-bitars (snarare än 7-bitars) miljö, användes GB 2312 och Wansung-kod vanligtvis med den åttonde bitars uppsättningen, med ASCII eller en liknande SBCS används med den åttonde biten oinställd; dessa kodningsscheman är kända som EUC-CN respektive EUC-KR .
Även om det koreanska skriftsystemet inkluderar individuella symboler ( jamo ) för konsonanter och vokaler, som fungerar som ett alfabet , är koreansk text korrekt inställd med dessa symboler sammansatta i block för varje stavelse. Wansung-koden inkluderade individuella koreanska stavelseblock separat, behandlade dem som en stor uppsättning tecken på samma sätt som hanja , och definierades först av den tredje upplagan av den sydkoreanska standarden KS C 5601. Den första utgåvan hade definierat en kodning av individuella jamo som tillät stavelseblock som ska kodas som sekvenser, som fick namnet N-byte Hangul , och hade inte antagits så brett som avsett.
Wansung-koden kodade inte alla möjliga moderna koreanska stavelser, bara ett urval av de 2350 vanligaste, även om det gjorde det möjligt att specificera dem genom att kombinera sekvenser, som ofta inte stöddes. En alternativ kodning, även sydkoreansk, som heter Johab gjorde, och fungerade som en konkurrent till Wansung under en tid. Unified Hangul Code (UHC), introducerad av Microsoft med Windows 95 , utökade EUC-KR, vilket tillåter användning av ogiltiga EUC-dubbelbytekoder för att representera alla andra stavelser som finns tillgängliga i Johab. Ett liknande tillvägagångssätt togs av den kinesiska GBK- kodningen, som utökar GB 2312 med stöd för traditionell kinesiska och för mindre vanliga kinesiska tecken genom att koda dem till dubbelbytekoder ogiltiga i EUC-CN .
Sydkorea var inte det enda landet som utvecklade en ISO 2022 DBCS för koreanska: det kinesiska fastlandet GB 12052 publicerades 1989. Detta var inte nära relaterat till Wansung-koden, även om det även inkluderade sammansatta stavelser. Istället motsvarade det GB 2312 med koreanska stavelser (och 94 hanja ) som ersatte de kinesiska tecknen, förutom införandet av ett dollartecken i stället för ett yuan-tecken. Den kan ha utvecklats för användning av den koreanska minoriteten i nordöstra Kina.
På samma sätt utvecklade Nordkorea KPS 9566. Även om både Nordkorea och Sydkorea använder koreanska Chosŏn'gŭl (Hangul) som sitt primära skriftsystem, använder de olika lexikografiska ordningsföljder . Därför skiljer sig teckenordningen mellan Wansung-koden och KPS 9566.
KPS 9566 har genomgått flera revisioner, inklusive utgåvor av 1997 och 2003, främst för att förbättra kompatibiliteten med Unicode . Dessa anges vanligtvis genom att ange år (t.ex. KPS 9566-97, 9566-2003). Den nuvarande utgåvan från och med releasen av Red Star OS 3.0 verkar vara KPS 9566-2011, vilket lägger till Kim Jong-un till listan över ledare. Det allmänt tillgängliga koddiagrammet för 1997 års upplaga av KPS 9566 visar ett ISO 2022 94×94-plan. De nyare utgåvorna, från vilka informationskällor som finns tillgängliga utanför själva Nordkorea, verkar definiera ytterligare tilldelningar utanför EUC-planet (på samma sätt som GBK eller UHC).
På grund av interoperabilitetsproblem som uppstår vid användningen av flera nationella standard- och plattforms- eller teckensnittsspecifika egenutvecklade teckenkodningar, utvecklades Unicode -standarden med avsikten att tillåta att all representativ text kan bytas ut i ett enda, universellt format. Den första utgåvan av Unicode publicerades 1991 och 1992, och ISO/IEC 10646 etablerades i synk med Unicode 1993. Unicode-format föredras för internationell användning på World Wide Web , där äldre teckenkodningar behandlas som partiella kodningar av Unicode med hjälp av kartfiler.
Design
I princip liknar KPS 9566 Wansung-teckenuppsättningen som definieras av den sydkoreanska KS X 1001- standarden, även om de två inte är kompatibla. Båda kodar en sektion med skiljetecken, symboler, jamo , kana och alfabetiska tecken, följt av en delmängd av de möjliga moderna chosŏn'gŭl-stavelserna, följt av en sektion av hanja . KPS 9566 använder dock en annan ordning av jamo och stavelser för att överensstämma med nordkoreansk lexikografisk ordning standarder. KPS 9566 innehåller också 28 explicit roterade skiljetecken för vertikal typografi, vilket KS X 1001 inte gör, och kodar varje hanja endast en gång, medan KS X 1001 kodar flera hanja med flera avläsningar flera gånger.
KPS 9566-97 kodar totalt 2679 chosŏn'gŭl stavelser och 4653 hanja. Detta ger bättre täckning än de 2350 stavelserna som kodas av Wansung-koden: till exempel har 똠-tecknet som används i namnet 똠방각하 [ Unified Repertoire and Ordering och en från CJK Unified Ideographs Extension A . Hela rad 15, den senare halvan av rad 44 (efter stavelseblocket) och den senare halvan av rad 94 (efter hanjablocket) kan användas för användardefinierade ändamål.
ett noterat koreanskt litterärt verk, inte en tilldelad Wansung-kodpunkt, men har en (38- 02) i KPS 9566. Hanja-sektionen innehåller 4652 tecken frånKPS 9566 utmärker sig särskilt genom att den innehåller flera specialtecken från det nordkoreanska politiska livet. Närmare bestämt inkluderar den hammaren, skäran och borstemblemet från Koreas arbetarparti , både inringade och inringade (kodpunkterna 12-01 och 12-02), och två grupper med tre specialtecken som stavar namnen på de nordkoreanska ledarna Kim Il-sung (김일성) och Kim Jong-il (김정일) i ett speciellt dekorativt typsnitt (kodpunkterna 04-72 till 04-74 respektive 04-75 till 04-77). Stavelserna för Kim och Il, som är identiska i stavningen av båda namnen, är kodade två gånger. KPS 9566-2011 innehåller dessutom namnet på Kim Jong-un (김정은) som kodpunkter 04-78 till 04-80.
På grund av dessa specialtecken finns det för närvarande ingen fullständig kompatibilitet tur och retur mellan KPS 9566 och Unicode, såvida inte tecken som inte stöds mappas till området för privat användning .
KPS 10721
Nordkorea utvecklade också en andra teckenuppsättning, KPS 10721 " Code of the supplementary Korean Hanja Set for Information Interchange ", som publicerades 2000. KPS 10721 kodar en uppsättning på minst 19469 hanja utöver de som ingår i KPS 9566. Från och med 2009 hade dessa inte alla mappningar till Unicode, utan inkluderade 10358 från Unified Repertoire and Ordering , 3187 från CJK Unified Ideographs Extension A och 107 från CJK Compatibility Ideographs (alla i Basic Multilingual Plane ), samt 5767 från CJK Unified Ideographs Extension B och 50 från CJK Compatibility Ideographs Supplement ( i det kompletterande Ideographic Plane ) .
Förutom kartläggningen av dessa hanja till Unicode, är lite känt om KPS 10721-standarden utanför Nordkorea. Nordkoreanska referensglyfer tillhandahålls inte för dessa hanja i Unicode-koddiagrammen, på grund av brist på lämplig typsnittsdata tillgänglig för Unicode Consortium. Unicode hanja-tecken med KPS 9566- eller KPS 10721-källor korsrefereras ändå till deras KPS-koder i Unihan -databasen med nyckeln kIRG_KPSource
.
Dokumentation och relation till Unicode
Unicodes initiala täckning av koreanska stavelser , tillagd i version 1.0, baserades på Wansung-kod. I Unicode version 2.0 lades ett nytt block av koreanska stavelser (det nuvarande Hangul- stavelseblocket) till, baserat på den stavelserepertoar som finns tillgänglig i Johab, och det tidigare blocket togs bort (det är nu upptaget av CJK Unified Ideographs Extension A ). Detta gjordes under antagandet att inga Unicode-kodade koreanska data existerade ännu, men blev känd som "koreanska röran", och de ansvariga kommittéerna lovade att inte göra en sådan oförenlig förändring i framtiden, ett löfte kodifierat av Unicodes stabilitetspolicy .
Koddiagrammet för KPS 9566-97, publicerat april 1997, skickades till ISO International Register of Coded Character Sets för registrering för användning med ISO/IEC 2022 . Den registrerades i juni 1998 med numret ISO-IR-202 . Detta koddiagram är allmänt tillgängligt från Information Processing Society of Japan .
I augusti 1999 lämnade det nordkoreanska nationella organet ett dokument till WG2 ( ISO/IEC JTC 1/SC 2 Working Group 2), ISO-organet som ansvarar för ISO/IEC 10646 , den internationella standarden som motsvarar Unicode . Detta dokument begärde tillägg av KPS 9566-koder till befintliga korsreferenser från CJK Unified Ideographs diagram, tillägg av 80 symboltecken från KPS 9566 som inte hade existerande Unicode-mappningar, en upplösning på skillnaden i sorteringsordning mellan KPS 9566 och Unicode (på grund av ordningen för tecknen i Unicode efter de sydkoreanska kodningarna) och tillägg av 8 kombinerar jamo. Den begärde också att WG2 skulle redigera det befintliga Unicode-tecken och blocknamn för att använda termen "koreanskt tecken" snarare än "Hangul". En utökad version av detta förslag, uppdelad i flera dokument, lämnades in som arbetspunkt i december 1999.
Ett utförligt svar lämnades av den svenska representanten i mars 2000, som motsatte sig flera av punkterna och utvecklade Sveriges röst mot förslaget. Detta svar angav att att ändra kodningen av de koreanska tecknen igen skulle orsaka stora störningar, till och med mer än första gången, vilket gjordes när det fanns jämförelsevis få implementeringar, men som i efterhand inte borde ha gjorts. Den förklarade att få eller inga språk kan sorteras korrekt efter kodpunktsvärde och att en skräddarsydd för Unicode Collation Algorithm eller ISO/IEC 14651 (som då utarbetas) bör användas för detta ändamål, och att normativa namn på redan tilldelade tecken inte kan ändras på grund av stabilitetspolicyn, även om icke-normativa översättningar till andra språk kan användas. Den föreslog att en maskinläsbar mappningsfil mellan Unicode och KPS 9566 skulle kunna tillhandahållas av den nordkoreanska instansen själv, och skulle vara mer användbar än en utskriven korsreferens i standarddokumentet. När det gäller de föreslagna ytterligare tecknen, angav svaret att tecken som skulle ha kompatibilitetsupplösningar i Unicode inte bör läggas till och att logotyper, inklusive de för politiska partier, och specialtecken för namn på vissa personer inte bör läggas till.
I juli 2000 skrev det nordkoreanska organet till WG2 och anklagade dem för att utveckla båda versionerna av Unicode-kodningen för koreanska endast på basis av sydkoreanska förslag, utan att rådfråga Nordkorea, och anklagade dem för att lägga företagens kommersiella intressen och rädsla för internationella förvirring över respekten för Nordkoreas suveränitet, och angivande av att Nordkorea skulle betrakta ytterligare vägran att ändra namnet och ordningen för de koreanska tecknen i Unicode som en förolämpning mot deras suveräna värdighet och som att kompromissa med ISO s anspråk på opartiskhet. De upprepade sitt krav på WG2 och Unicode för att "korrigera" ordningen på de koreanska tecknen och att "korrigera" namnen "Hangul Jamo" och "Hangul stavelse" till "koreanska alfabetet" och "koreanska stavelsen".
I augusti 2000 lämnade det nordkoreanska nationella organet en mer detaljerad version av sina förfrågningar i en serie av fem på varandra följande förslag. Dessa begärde tillägg av ytterligare 14 jamo-tecken, tillägg av 82 symboltecken och användningen av termen "koreanska alfabetet" istället för "Hangul", gav stöd för den nordkoreanska sammanställningsordningen och begärde tillägg av den nordkoreanska hanja repertoar. Dessa förslag diskuterades vid två möten mellan nordkorean, sydkorean , svenska och andra WG2-representanter i september 2000, där det nordkoreanska organet ombads att tillhandahålla manuskriptbevis för de ytterligare jamo-teckenna, att återinlämna sitt symbolförslag med symboler som redan hade tagits bort i Unicode och att överväga att använda ISO / IEC 14651 , sedan i det sista utkaststadiet, för sammanställningsändamål.
I september 2001 lämnade det nordkoreanska nationella organet in en reviderad serie förslag som begärde tillägg av flera KPS 9566- och KPS 10721-tecken, inklusive 70 symboltecken, till Unicode. I denna version av förslaget inkluderades ett avsnitt med dokumentutdrag som visar användningen av flera tecken och korta förklaringar av deras syfte. Koreas arbetarparti symbolen döptes till "Hammaren och skäran och borsten", döptes om från "Mark of the Workers' Party of Korea" i tidigare versioner av förslaget, och motiverades som att den användes som en identifierande symbol på kartor. Som motivering för de föreslagna karaktärerna för ledarnas namn förklarade de att ledarnas namn ofta förekommer med en annan storlek och teckensnittsvikt i nordkoreanska publikationer i syfte att betona. En uppföljning av sydkoreanska WG2-representanter begärde bevis, namn på koreanska och motiveringar för att lägga till vissa av dessa karaktärer, och noterade att det redan fanns versioner utan betoning av karaktärerna för ledarnas namn. Ett möte med nord- och sydkoreanska representanter från WG2 sammankallades i oktober 2001, som rekommenderade att 47 av symboltecken skulle läggas till i Unicode, och föreslog att ledarnas namn och WPK-symboler skulle tas upp för vidare diskussion av WG2.
Ett efterföljande återkopplingsdokument från februari 2002 angående de nordkoreanska föreslagna tilläggen begärde att "te"-symbolen för ett tehus accepteras som en mer allmän symbol för "het dryck", vilket likställer den med symboler som används i guideböcker för att beteckna varma eller alkoholfria drycker. Den rekommenderade också att referensglyfen för den befintliga kodpunkten för ett paraply utan regn modifieras för att harmonisera med den föreslagna referensglyfen för paraplyet med regn, vilket likställer dem med "håll torrt"-symbolerna som används på förpackningen, och väckte frågan om vilken varningssymboler för blixtar och högspänning i befintliga symbolsamlingar skulle kunna förenas med den föreslagna "högspännings"-karaktären. Alla dessa tre tecken accepterades i Unicode i version 4.0. Det rekommenderades också att de horisontella bomrade fraktionerna och den åt vänster uppåt pekande saxen kodas med en variation selector , eftersom saxen inte åtföljde en annorlunda orienterad sax, och eftersom de befintliga Unicode-fraktionskodpunkterna förenade de sneda och horisontella formerna.
I november 2002 publicerade det sydkoreanska organet en uppsättning trevägstabeller som kartlade tecken mellan standarderna KPS 9566, KS X 1001 (som EUC-KR) och ISO/IEC 10646 som de fanns 2000. Dessa tabeller hade upprättats utan input från Nordkorea.
skickades ett par mappningstabeller mellan KPS 9566-2003 och Unicode till OpenOffice.org -projektet av en person som använde namnet "ooprojlover", som uppgav att de representerade den uppdaterade versionen av KPS 9566-standarden och begärde att stöd läggas till. Dessa filer mappade de tecken som inte var tillgängliga i Unicode till det privata användningsområdet , och inkluderade ytterligare kodade former för andra stavelseblock utanför ISO-IR-202-huvudplanet. En kartläggningstabell publicerades senare av Unicode Consortium 2011, baserat på dessa kartdata men med fel korrigerade med hänvisning till ISO-IR-diagrammet.
Kopior av Red Star OS 3.0 inkluderar typsnitt för en nyare utgåva av KPS 9566, som verkar vara KPS 9566-2011. Mappningstabellen som används av Red Star OS internt har extraherats. Förutom att lägga till Kim Jong-un till listan över ledare, ändrar KPS 9566-2011 mappningarna av vissa vertikala former jämfört med 2003 års mappningar (med utnyttjande av Vertical Forms -blocket som lagts till i Unicode 4.1), och inkluderar även flera ytterligare hanja och symboler kodad utanför ISO-IR-202-planet. Flera av dessa ytterligare symboler är också mappade till det privata användningsområdet; deras identitet är dock inte känd, eftersom inga namn eller referensglyfer för dessa karaktärer är kända utanför Nordkorea.
Inverkan på Unicode idag
Flera nuvarande Unicode-tecken lades till i Unicode 4.0 som ett resultat av de nordkoreanska förslagen, men inte alltid vid de ursprungliga föreslagna kodpunkterna. Dessa inkluderar HOT BEVERAGE (☕, föreslagen som TE-SYMBOL), som föreslogs som en kartsymbol för att markera ett tehus , och flaggsymbolerna WHITE FLAG (⚐) och SVART FLAGGA (⚑), som föreslogs som kartsymboler för platser för strider och militära segrar. Dessa tecken föreslogs för de provisoriska kodpunkterna U+270A, U+268E respektive U+268F, men kodade vid de slutliga kodpunkterna U+2615, U+2690 respektive U+2691. De inkluderar också en serie fetstilta riktningspilar i intervallet U+2B05 till U+2B0D, exklusive en högerpil, som mappades till en befintlig karaktär i Dingbats-blocket, som lades till vid samma kodpunkter som de föreslogs för , förutom att nordost- och nordvästpilarna byts ut jämfört med förslaget.
Andra bildkaraktärer som ingick i det nordkoreanska förslaget inkluderar paraplyet med regndroppar (☔), blixten för högspänning (⚡) och varningstriangeln (⚠). Efter lite diskussion om vilka andra högspänningssymboler som glyfer som används representerade samma tecken som den från det nordkoreanska förslaget, och vilken glyf som skulle vara bäst att inkludera för det i Unicode-koddiagrammet, och efter modifiering av koddiagrammet för det befintliga paraplytecknet utan regn (U+2602 , ☂) för att harmonisera med det nya paraplyet med regndroppar från det nordkoreanska förslaget lades dessa tecken även till i Unicode 4.0, samtidigt som flaggorna och dryckessymbolen. Även om de föreslogs för de provisoriska kodpunkterna U+2618, U+267F och U+267E, fick de de sista kodpunkterna U+2614, U+26A1 respektive U+26A0.
Av dessa karaktärer valdes den varma drycken, paraplyet med regndroppar, blixten och varningstriangeln och pilarna uppåt, nedåt och åt vänster som kartläggningar från de japanska cellulära emoji-uppsättningarna, vilket ger totalt sju aktuella Unicode-emoji som ursprungligen lades till till Unicode på begäran av Nordkorea. Paraplyet med regndroppar och uppåt-, nedåt- och vänsterpilarna förenades också med karaktärer från ARIB-tilläggen används i japansk sändning, som inkluderar flera tecken som nu klassificeras som emoji, och mappades till Unicode i Unicode 5.2. Men paret vita och svarta flaggor som används som emoji eller i regionala emoji- och identitetsflaggorsekvenser är en annan "viftande" uppsättning som lagts till i Unicode 7.0 (U+1F3F3 🏳 och U+1F3F4 🏴), inte det nordkoreanska paret.
Från och med 2018 fanns flera KPS 9566-tecken kvar som inte är mappade till Unicode. Dessa inkluderar WPK-symbolen, fyra triangulära märken, en sax som pekar åt vänster (exkluderad av skälet att kontrastiv användning med saxen åt höger i Dingbats-blocket inte hade demonstrerats ), en uppåtriktad manikel i en cirkel, vertikal presentation former av skiljetecken, varianter av avslutande parenteser som innehåller punkter , horisontella streckvarianter av vulgära bråk som kodas separat från deras lutande versioner och ledarnas namn.
Ett japanskt postmärke med en nedåtriktad triangel inkluderades i KPS 9566-97 men togs bort i KPS 9566-2003 efter att det nordkoreanska organet hade dragit tillbaka det från sitt Unicode-förslag för granskning som svar på förfrågningar från det sydkoreanska organet om bevis för symbolens användning i Nordkorea. Detta märke föreslogs på nytt 2018 på grundval av KPS 9566-kompatibilitet och identifierades som ett elektriskt överensstämmelsemärke som användes i Japan innan det ersattes med PSE- diamanten . Den lades till i Unicode i version 13.0, publicerad 2020.
Kodade former
1997 års upplaga av KPS 9566 registrerades i International Register of Coded Character Sets for Use with Escape Sequences som ISO-IR-202, och kan därför kodas med ISO/IEC 2022 . Det är en 94 n multipelbyte G-uppsättning, dvs om den används i en 7-bitars ISO 2022-kod (analogt med ISO-2022-JP eller ISO-2022-KR ), kommer tecken att kodas med par av byte mellan 0x21 och 0x7E i lämpligt läge.
De dokumenterade mappningarna mellan KPS 9566 och Unicode för 2003 och 2011 års utgåvor av KPS 9566 använder en kodning som liknar en anpassning av Unified Hangul Code (UHC) för att koda KPS 9566 snarare än Wansung-kod, med deras uppdaterade versioner av ISO-IR-202 plan som kodas med hjälp av par av byte mellan 0xA1 och 0xFE, och med andra två-byte koder som används för stavelser som inte finns i ISO-IR-202. Ordningen på de utökade stavelserna följer vanlig KPS 9566-ordning. På samma sätt som UHC använder de leadbyte 0x81 och högre, och trailbyte från intervallen 0x41–0x5A, 0x61–0x7A och 0x81–0xFE, exklusive intervallet 0xA1–0xFE om leadbyten är 0xA1 eller högre.
2011 års utgåva innehåller också flera ytterligare hanja och symboler kodade utanför ISO-IR-202-planet, efter intervallet som används för de utökade stavelseblocken. Det här tillvägagångssättet liknar det som används av GBK , men med spårbyte kvar i UHC-stilsområdena: liksom de utökade stavelserna med blybyte 0xA1 och högre använder dessa alla spårbyteområdena 0x41–0x5A, 0x61–0x7A och 0x81 –0xA0. Utökade hanja kodas med leadbyte mellan 0xC8 och 0xDC, utökade symboler kodas med leadbyte mellan 0xE0 och 0xEA, och utökade koder med leadbyte mellan 0xEC och 0xFE mappas, utan luckor, till det privata användningsområdet (jämför de användardefinierade intervallen i GBK). Flera av tecknen i den utökade symbolsektionen och tre i hanjasektionen är också mappade till Unicode Private Use Area; till skillnad från de PUA-mappade symbolerna i huvud ISO-IR-202-planet, är identiteten för dessa tecken inte dokumenterad.
Blybyte
Det här diagrammet beskriver den övergripande layouten för huvudplanet för KPS 9566-teckenuppsättningen av leadbyte. För blybyte som används för andra tecken än sammansatta chosŏn'gŭl stavelser eller hanja, finns länkar till diagram på den här sidan som listar de tecken som kodats under den leadbyten. För blybytes som används för hanja, tillhandahålls länkar till lämplig sektion av Wiktionarys hanja-index.
Där två hexadecimala tal anges används värdet under 0x7F i en 7-bitars kodning, och det större värdet (mellan 0xA1 och 0xFE) används i en 8-bitars EUC- kodning . De utökade 8-bitarskodningarna i UHC-stil som definieras av 2003-utgåvan och framåt använder likaså de större bytevärdena, mellan 0xA1 och 0xFE inklusive, för det ISO-IR-202-baserade huvudplanet .
KPS 9566 (lead byte) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
2x/Yxa | SP | 1-_ | 2-_ | 3-_ | 4-_ | 5-_ | 6-_ | 7-_ | 8-_ | 9-_ | 10-_ | 11-_ | 12-_ | 13-_ | 14-_ | 15-_ |
3x/Bx | 16-_ | 17-_ | 18-_ | 19-_ | 20-_ | 21-_ | 22-_ | 23-_ | 24-_ | 25-_ | 26-_ | 27-_ | 28-_ | 29-_ | 30-_ | 31-_ |
4x/Cx | 32-_ | 33-_ | 34-_ | 35-_ | 36-_ | 37-_ | 38-_ | 39-_ | 40-_ | 41-_ | 42-_ | 43-_ | 44-_ | 45-_ | 46-_ | 47-_ |
5x/Dx | 48-_ | 49-_ | 50-_ | 51-_ | 52-_ | 53-_ | 54-_ | 55-_ | 56-_ | 57-_ | 58-_ | 59-_ | 60-_ | 61-_ | 62-_ | 63-_ |
6x/Ex | 64-_ | 65-_ | 66-_ | 67-_ | 68-_ | 69-_ | 70-_ | 71-_ | 72-_ | 73-_ | 74-_ | 75-_ | 76-_ | 77-_ | 78-_ | 79-_ |
7x/Fx | 80-_ | 81-_ | 82-_ | 83-_ | 84-_ | 85-_ | 86-_ | 87-_ | 88-_ | 89-_ | 90-_ | 91-_ | 92-_ | 93-_ | 94-_ | DEL |
Icke-Hanja, icke-komponerade uppsättningar i huvudplanet
Teckenuppsättning 0x21/0xA1 (rad nummer 1, skiljetecken och vertikala former)
Den här uppsättningen innehåller vanliga meningsskiljepunkt som parenteser, citattecken, kommatecken och så vidare, samt presentationsformer för användning i vertikal skrift. ASCII-interpunktion (markerad) visas nedan mappad till grundläggande latinska kodpunkter (överensstämmer med artiklar om andra CJK-teckenuppsättningar, såsom KS X 1001 eller JIS X 0208 ), men mappas till blocken Halfwidth och Fullwidth Forms när de används i en kodning som kombinerar KPS 9566 med ASCII (enligt definitionen av till exempel 2003 års upplaga).
Jämfört med 2003 års mappning, ändrar 2011 års mappningar Unicode-mappningarna av tre vertikala presentationsformer för att dra fördel av Vertical Forms- blocket som introducerades med Unicode 4.1.
KPS 9566 (prefixet 0x21/0xA1) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
2x/Yxa | IDSP |
、 3001 |
3002 _ |
002C _ |
. 002E |
· 00B7 |
: 003A |
; 003B |
? 003F |
! 0021 |
‥ 2025 |
… 2026 |
~ 007E |
〃 3003 |
— 2015 |
|
3x/Bx |
– 2010 |
_ 005F |
 ̄ FFE3 |
/ 002F |
\ 005C |
| 007C |
∥ 2225 |
∕ 2215 |
∖ 2216 |
゛ 309B |
゜ 309C |
´00B4 _ |
` 0060 |
¨ 00A8 |
^ 005E |
ˇ 02C7 |
4x/Cx |
˙ 02D9 |
' / ︐ | ˚ / ︒ | ˊ / ︑ |
⋮ 22EE |
' 2018 |
' 2019 |
" 201C |
” 201D |
( 0028 |
) 0029 |
〔 3014 |
〕 3015 |
[ 005B |
] 005D |
|
5x/Dx |
{ 007B |
} 007D |
〈 3008 |
〉 3009 |
《 300A |
》 300B |
「 300C |
」 300D |
『 300E |
』 300F |
【 3010 |
】 3011 |
.) | .⟫ |
‚ 201A |
‛ 201B |
6x/Ex |
„ 201E |
" 201F |
︵ FE35 |
︶ FE36 |
︹ FE39 |
︺ FE3A |
﹇ FE47 |
﹈ FE48 |
︷ FE37 |
︸ FE38 |
︿ FE3F |
﹀ FE40 |
︽ FE3D |
︾ FE3E |
﹁ FE41 |
﹂ FE42 |
7x/Fx |
﹃ FE43 |
﹄ FE44 |
︻ FE3B |
︼ FE3C |
||||||||||||
ASCII-interpunktion, kan också mappas till blocket Halfwidth och Fullwidth Forms .
Mappad till privat användningsområde, visas simulerad.
|
Teckenuppsättning 0x22/0xA2 (rad nummer 2, symboler och operatorer)
Denna uppsättning innehåller matematiska operatorer och några andra symboler som et -tecken , pilkråka , musiknot och så vidare. ASCII-interpunktion (markerad) visas nedan mappad till grundläggande latinska kodpunkter (överensstämmer med artiklar om andra CJK-teckenuppsättningar), men mappas till Halfwidth och Fullwidth Forms- blocket när det används i en kodning som kombinerar KPS 9566 med ASCII .
Flera triangulära "vägmärke"-symboler som anger kommande berg eller lutningar framåt eller åt ena sidan är inkluderade i den här raden, men ingår för närvarande inte i Unicode. De är mappade till det privata användningsområdet.
KPS 9566 (prefixet med 0x22/0xA2) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
2x/Yxa |
+ 002B |
- 002D |
± 00B1 |
× 00D7 |
÷ 00F7 |
= 003D |
≠ 2260 |
< 003C |
> 003E |
≦ 2266 |
≧ 2267 |
∞ 221E |
∴ 2234 |
♂ 2642 |
♀ 2640 |
|
3x/Bx |
∠ 2220 |
⊥ 22A5 |
⌒ 2312 |
∂ 2202 |
∇ 2207 |
≡ 2261 |
≒ 2252 |
≈ 2248 |
≪ 226A |
≫ 226B |
√ 221A |
∽ 223D |
∝ 221D |
∵ 2235 |
∫ 222B |
∬ 222C |
4x/Cx |
∮ 222E |
∈ 2208 |
∋ 220B |
⊆ 2286 |
⊇ 2287 |
⊂ 2282 |
⊃ 2283 |
∉ 2209 |
∌ 220C |
⊈ 2288 |
⊉ 2289 |
⊄ 2284 |
⊅ 2285 |
∪ 222A |
∩ 2229 |
∧ 2227 |
5x/Dx |
∨ 2228 |
¬ FFE2 |
⇒ 21D2 |
⇔ 21D4 |
∀ 2200 |
∃ 2203 |
∑ 2211 |
# 0023 |
& 0026 |
* 002A |
@ 0040 |
§ 00A7 |
※ 203B |
☆ 2606 |
★ 2605 |
○ 25CB |
6x/Ex |
● 25CF |
◎ 25 e.Kr |
◇ 25C7 |
◆ 25C6 |
□ 25A1 |
■ 25A0 |
△ 25B3 |
▲ 25B2 |
▽ 25BD |
▼ 25 f.Kr |
▷ 25B7 |
◁ 25C1 |
▶ 25B6 |
◀ 25C0 |
∘ 2218 |
∙ 2219 |
7x/Fx |
❖ 2756 |
⚐ 2690 |
⚑ 2691 |
♯ 266F |
♭ 266D |
♪ 266A |
† 2020 |
‡ 2021 |
¶ 00B6 |
⊕ 2295 |
⊖ 2296 |
|||||
ASCII-interpunktion, kan också mappas till blocket Halfwidth och Fullwidth Forms .
Mappad till privat användningsområde, visas simulerad.
|
Teckenuppsättning 0x23/0xA3 (radnummer 3, siffror och romerska)
Denna uppsättning innehåller en delmängd av ASCII , minus skiljetecken och symboler, bestående av västerländska arabiska siffror och båda kasus av det grundläggande latinska alfabetet . Jämför rad 3 i JIS X 0208 , som den här raden exakt matchar. Jämför och kontrast rad 3 i KS X 1001 och GB 2312 , som inkluderar hela deras nationella varianter av ISO 646 i denna rad, snarare än bara den alfanumeriska delmängden.
Tecknen i den här raden visas nedan mappade till grundläggande latinska kodpunkter (överensstämmer med artiklar om andra teckenuppsättningar), men mappas till Halfwidth- och Fullwidth Forms- blocken när de används i en kodning som kombinerar KPS 9566 med ASCII .
KPS 9566 (med prefixet 0x23/0xA3) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
2x/Yxa | ||||||||||||||||
3x/Bx |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
||||||
4x/Cx |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
I 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
|
5x/Dx |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
|||||
6x/Ex |
en 0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
h 0068 |
jag 0069 |
j 006A |
k 006B |
l 006C |
m 006D |
n 006E |
o 006F |
|
7x/Fx |
s 0070 |
q 0071 |
r 0072 |
s 0073 |
t 0074 |
u 0075 |
v 0076 |
w 0077 |
x 0078 |
y 0079 |
z 007A |
Teckenuppsättning 0x24/0xA4 (rad nummer 4, Chosŏn'gŭl jamo och ledarnas namn)
Denna uppsättning innehåller Chosŏn'gŭl jamo , såväl som speciella kodningar för namnen på (från 2003) de nordkoreanska ledarna Kim Il-sung och Kim Jong-il . Namnet på Kim Jong-un ingår också från och med 2011 års upplaga. Jämför med rad 4 i KS X 1001 .
Den jamo i den här raden som finns i Unicode Hangul Compatibility Jamo- blocket (som innehåller de positionsoberoende tecknen mappade från KS X 1001) mappas till det blocket. De föråldrade jamo- utmärkande palataliserade sibilanterna mappar till de positionsspecifika karaktärerna i Hangul Jamo-blocket . Omvänt är inte all föråldrad jamo kodad av KS X 1001 kodad i huvudplanet för KPS 9566. I 2011 års utgåva av KPS 9566 ingår några av de andra historiska jamo från KS X 1001 utanför huvudplanet, med blybyten 0xEA .
De speciella kodningarna av ledarnas namn finns inte i Unicode och är mappade till det privata användningsområdet. De visas nedan simulerade med uppmärkning.
KPS 9566 (prefixet 0x24/0xA4) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
2x/Yxa |
ㄱ 3131 |
ㄴ 3134 |
ㄷ 3137 |
3 139 kr |
ㅁ 3141 |
ㅂ 3142 |
ㅅ 3145 |
ㅇ 3147 |
ㅈ 3148 |
ㅊ 314A |
ㅋ 314B |
ㅌ 314C |
ㅍ 314D |
ㅎ 314E |
ㄲ 3132 |
|
3x/Bx |
ㄸ 3138 |
ㅃ 3143 |
ㅆ 3146 |
ㅉ 3149 |
ㅏ 314F |
ㅑ 3151 |
ㅓ 3153 |
ㅕ 3155 |
ㅗ 3157 |
ㅛ 315B |
ㅜ 315C |
ㅠ 3160 |
ㅡ 3161 |
ㅣ 3163 |
ㅐ 3150 |
ㅒ 3152 |
4x/Cx |
ㅔ 3154 |
ㅖ 3156 |
ㅚ 315A |
ㅟ 315F |
ㅢ 3162 |
ㅘ 3158 |
ㅝ 315D |
ㅙ 3159 |
ㅞ 315E |
ㄳ 3133 |
ㄵ 3135 |
ㄶ 3136 |
ㄺ 313A |
ㄻ 313B |
ㄼ 313C |
ㄽ 313D |
5x/Dx |
ㄾ 313E |
ㄿ 313F |
ㅀ 3140 |
ㅄ 3144 |
ㅿ 317F |
ㆁ 3181 |
ㆆ 3186 |
ㆍ 318D |
ᄼ 113C |
ᄽ 113D |
ᄾ 113E |
ᄿ 113F |
ᅎ 114E |
ᅏ 114F |
ᅐ 1150 |
ᅑ 1151 |
6x/Ex |
ᅔ 1154 |
ᅕ 1155 |
김 | 일 | 성 | 김 | 정 | 일 | 김 | 정 | ||||||
7x/Fx | 은 | |||||||||||||||
Mappad till privat användningsområde, visas simulerad.
|
Teckenuppsättning 0x25/0xA5 (rad nummer 5, kyrillisk)
Denna uppsättning innehåller båda fallen med 33 bokstäver från den kyrilliska skriften , tillräckligt för att skriva det moderna ryska alfabetet och det bulgariska alfabetet , även om andra former av kyrilliska kräver ytterligare bokstäver.
Jämför rad 12 i KS X 1001 och rad 7 i JIS X 0208, som använder samma layout (men i en annan rad).
KPS 9566 (prefixet 0x25/0xA5) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
2x/Yxa |
А 0410 |
Б 0411 |
В 0412 |
Г 0413 |
Д 0414 |
Е 0415 |
Ё 0401 |
Ж 0416 |
З 0417 |
И 0418 |
Й 0419 |
К 041A |
Л 041B |
М 041C |
I 041D |
|
3x/Bx |
О 041E |
П 041F |
Р 0420 |
С 0421 |
Т 0422 |
У 0423 |
Ф 0424 |
Х 0425 |
Ц 0426 |
Ч 0427 |
Ш 0428 |
Щ 0429 |
Ъ 042A |
Ы 042B |
Ь 042C |
Э 042D |
4x/Cx |
Ю 042E |
Я 042F |
||||||||||||||
5x/Dx |
a 0430 |
б 0431 |
в 0432 |
г 0433 |
till 0434 |
е 0435 |
ё 0451 |
ж 0436 |
av 0437 |
och 0438 |
© 0439 |
к 043A |
л 043B |
m 043C |
н 043D |
|
6x/Ex |
о 043E |
п 043F |
р 0440 |
с 0441 |
т 0442 |
у 0443 |
ф 0444 |
х 0445 |
ц 0446 |
ч 0447 |
ш 0448 |
щ 0449 |
ъ 044A |
ы 044B |
ü 044C |
э 044D |
7x/Fx |
ю 044E |
я 044F |
Teckenuppsättning 0x26/0xA6 (rad nummer 6, grekiska bokstäver och romerska siffror)
Denna uppsättning innehåller romerska siffror och grundläggande stöd för det grekiska alfabetet , utan diakritiska tecken eller den slutliga sigma .
Jämför och kontrast rad 5 i KS X 1001 (som använder samma tecken men i en annan layout och en annan rad) och rad 6 i JIS X 0208 (som använder samma layout för de grekiska bokstäverna, men utan de romerska siffrorna).
KPS 9566 (med prefixet 0x26/0xA6) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
2x/Yxa |
Α 0391 |
Β 0392 |
Γ 0393 |
Δ 0394 |
Ε 0395 |
Ζ 0396 |
Η 0397 |
Θ 0398 |
jag 0399 |
Κ 039A |
Λ 039B |
Μ 039C |
N 039D |
Ξ 039E |
Ο 039F |
|
3x/Bx |
Π 03A0 |
Ρ 03A1 |
Σ 03A3 |
Τ 03A4 |
Υ 03A5 |
Φ 03A6 |
Χ 03A7 |
Ψ 03A8 |
Ω 03A9 |
|||||||
4x/Cx |
a 03B1 |
β 03B2 |
γ 03B3 |
5 03B4 |
ε 03B5 |
ζ 03B6 |
η 03B7 |
θ 03B8 |
ι 03B9 |
K 03BA |
λ 03BB |
μ 03 f.Kr |
v 03BD |
ξ 03BE |
ο 03BF |
|
5x/Dx |
π 03C0 |
ρ 03C1 |
σ 03C3 |
τ 03C4 |
υ 03C5 |
φ 03C6 |
χ 03C7 |
ψ 03C8 |
ω 03C9 |
|||||||
6x/Ex |
Ⅰ 2160 |
Ⅱ 2161 |
Ⅲ 2162 |
Ⅳ 2163 |
Ⅴ 2164 |
Ⅵ 2165 |
Ⅶ 2166 |
Ⅷ 2167 |
Ⅸ 2168 |
Ⅹ 2169 |
||||||
7x/Fx |
ⅰ 2170 |
ⅱ 2171 |
ⅲ 2172 |
ⅳ 2173 |
ⅴ 2174 |
ⅵ 2175 |
ⅶ 2176 |
ⅷ 2177 |
ⅸ 2178 |
ⅹ 2179 |
Teckenuppsättning 0x27/0xA7 (rad nummer 7, inringad, upphöjd, nedsänkt, bråk)
Flera inringade siffror i den här raden mappades felaktigt till Unicode i 2003 års upplaga, på grund av användning av icke-slutliga föreslagna kodpunkter. De korrigerades i 2011 års upplaga.
KPS 9566 (med prefixet 0x27/0xA7) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
2x/Yxa |
① 2460 |
② 2461 |
③ 2462 |
④ 2463 |
⑤ 2464 |
⑥ 2465 |
⑦ 2466 |
⑧ 2467 |
⑨ 2468 |
⑩ 2469 |
⑪ 246A |
⑫ 246B |
⑬ 246C |
⑭ 246D |
⑮ 246E |
|
3x/Bx |
⑯ 246F |
⑰ 2470 |
⑱ 2471 |
⑲ 2472 |
⑳ 2473 |
㉑ 3251 |
㉒ 3252 |
㉓ 3253 |
㉔ 3254 |
㉕ 3255 |
㉖ 3256 |
㉗ 3257 |
㉘ 3258 |
㉙ 3259 |
㉚ 325A |
|
4x/Cx |
㉠ 3260 |
㉡ 3261 |
㉢ 3262 |
㉣ 3263 |
㉤ 3264 |
㉥ 3265 |
㉦ 3266 |
㉧ 3267 |
㉨ 3268 |
㉩ 3269 |
㉪ 326A |
㉫ 326B |
㉬ 326C |
㉭ 326D |
||
5x/Dx |
㉮ 326E |
㉯ 326F |
㉰ 3270 |
㉱ 3271 |
㉲ 3272 |
㉳ 3273 |
㉴ 3274 |
㉵ 3275 |
㉶ 3276 |
㉷ 3277 |
㉸ 3278 |
㉹ 3279 |
㉺ 327A |
· 327B |
||
6x/Ex |
⁰ 2070 |
¹ 00B9 |
² 00B2 |
³ 00B3 |
⁴ 2074 |
⁵ 2075 |
⁶ 2076 |
⁷ 2077 |
⁸ 2078 |
⁹ 2079 |
½ 00BD |
⅓ 2153 |
⅔ 2154 |
¼ 00 f.Kr |
¾ 00BE |
|
7x/Fx |
2080 kr |
₁ 2081 |
₂ 2082 |
₃ 2083 |
₄ 2084 |
₅ 2085 |
₆ 2086 |
₇ 2087 |
₈ 2088 |
₉ 2089 |
1/2 _ _ | 1/3 _ _ | 2/3 _ _ | 1/4 _ _ | 3/4 _ _ | |
Mappad till privat användningsområde, visas simulerad.
|
Teckenuppsättning 0x28/0xA8 (radnummer 8, enhet, kvantitet och valutasymboler)
Denna uppsättning innehåller symboler för måttenheter och valuta. De som finns i ASCII (markerade) visas nedan mappade till grundläggande latinska kodpunkter (överensstämmer med artiklar om andra CJK-teckenuppsättningar), men mappas till Halfwidth- och Fullwidth Forms- blocken när de används i en kodning som kombinerar KPS 9566 med ASCII .
Kelvin - tecknet ersattes med ett eurotecken i 2003 års upplaga. 2011 års utgåva innehåller en alternativ kodning av Kelvin-tecknet vid 0xE988 .
Jämför och kontrast med repertoaren av enhetssymboler som ingår i rad 7 i KS X 1001 .
KPS 9566 (prefixet med 0x28/0xA8) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
2x/Yxa |
° 00B0 |
" 2032 |
″ 2033 |
℃ 2103 |
℉ 2109 |
€ / K |
₩ FFE6 |
0024 USD |
¢ FFE0 |
£ FFE1 |
¥ FFE5 |
% 0025 |
‰ 2030 |
Å 212B |
㏄ 33C4 |
|
3x/Bx |
㎡ 33A1 |
㎥ 33A5 |
㎝ 339D |
㎠ 33A0 |
㎤ 33A4 |
㎜ 339C |
㎟ 339F |
㎣ 33A3 |
㍷ 3377 |
㍸ 3378 |
㍹ 3379 |
㎞ 339E |
㎢ 33A2 |
㎦ 33A6 |
㎙ 3399 |
㎚ 339A |
4x/Cx |
㎛ 339B |
㎧ 33A7 |
㎨ 33A8 |
㎍ 338D |
㎎ 338E |
㎏ 338F |
㎴ 33B4 |
㎵ 33B5 |
㎶ 33B6 |
㎷ 33B7 |
㎸ 33B8 |
㎹ 33B9 |
㎀ 3380 |
㎁ 3381 |
㎂ 3382 |
㎃ 3383 |
5x/Dx |
㎄ 3384 |
㎺ 33BA |
㎻ 33BB |
㎼ 33 f.Kr |
㎽ 33BD |
㎾ 33BE |
㎿ 33BF |
Ω 2126 |
㏀ 33C0 |
㏁ 33C1 |
㎐ 3390 |
㎑ 3391 |
㎒ 3392 |
㎓ 3393 |
㎔ 3394 |
㏞ 33DE |
6x/Ex |
㏟ 33DF |
㎰ 33B0 |
㎱ 33B1 |
㎲ 33B2 |
㎳ 33B3 |
㎊ 338A |
㎋ 338B |
㎌ 338C |
㎩ 33A9 |
㎪ 33AA |
㎫ 33AB |
㎬ 33AC |
ℓ 2113 |
㎕ 3395 |
㎖ 3396 |
㎗ 3397 |
7x/Fx |
㎘ 3398 |
㏿ 33FF |
㎈ 3388 |
㎉ 3389 |
㎭ 33 e.Kr |
㎮ 33AE |
㎯ 33AF |
㋌ 32CC |
㏝ 33DD |
㏈ 33C8 |
㋍ 32 CD |
㋎ 32 e.Kr |
㏖ 33D6 |
㏋ 33CB |
㏊ 33CA |
|
ASCII-interpunktion, kan också mappas till blocket Halfwidth och Fullwidth Forms .
|
Teckenuppsättning 0x29/0xA9 (rad nummer 9, kartongritning)
KPS 9566 (med prefixet 0x29/0xA9) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
2x/Yxa |
─ 2500 |
│ 2502 |
┌ 250C |
┐ 2510 |
┘ 2518 |
└ 2514 |
├ 251C |
┬ 252C |
┤ 2524 |
┴ 2534 |
┼ 253C |
━ 2501 |
┃ 2503 |
┏ 250F |
┓ 2513 |
|
3x/Bx |
┛ 251B |
┗ 2517 |
┣ 2523 |
┳ 2533 |
┫ 252B |
┻ 253B |
╋ 254B |
┠ 2520 |
┯ 252F |
┨ 2528 |
┷ 2537 |
┿ 253F |
┝ 251D |
┰ 2530 |
┥ 2525 |
┸ 2538 |
4x/Cx |
╂ 2542 |
┒ 2512 |
┑ 2511 |
┚ 251A |
┙ 2519 |
┖ 2516 |
┕ 2515 |
┎ 250E |
┍ 250D |
┞ 251E |
┟ 251F |
┡ 2521 |
┢ 2522 |
┦ 2526 |
┧ 2527 |
┩ 2529 |
5x/Dx |
┪ 252A |
┭ 252D |
┮ 252E |
┱ 2531 |
┲ 2532 |
┵ 2535 |
┶ 2536 |
┹ 2539 |
┺ 253A |
┽ 253D |
┾ 253E |
╀ 2540 |
╁ 2541 |
╃ 2543 |
╄ 2544 |
╅ 2545 |
6x/Ex |
╆ 2546 |
╇ 2547 |
╈ 2548 |
╉ 2549 |
╊ 254A |
|||||||||||
7x/Fx |
Teckenuppsättning 0x2A/0xAA (radnummer 10, Hiragana)
Den här raden innehåller Hiragana för användning på japanska .
Jämför rad 10 i KS X 1001 , som använder samma layout. Jämför och kontrastera rad 4 i JIS X 0208 , som också använder samma layout, men i en annan rad.
KPS 9566 (prefixet med 0x2A/0xAA) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
2x/Yxa |
ぁ 3041 |
あ 3042 |
ぃ 3043 |
い 3044 |
ぅ 3045 |
う 3046 |
ぇ 3047 |
え 3048 |
ぉ 3049 |
お 304A |
か 304B |
304C _ |
き 304D |
ぎ 304E |
く 304F |
|
3x/Bx |
ぐ 3050 |
け 3051 |
げ 3052 |
こ 3053 |
ご 3054 |
さ 3055 |
ざ 3056 |
し 3057 |
じ 3058 |
す 3059 |
ず 305A |
せ 305B |
ぜ 305C |
そ 305D |
ぞ 305E |
た 305F |
4x/Cx |
だ 3060 |
ち 3061 |
ぢ 3062 |
3063 _ |
つ 3064 |
づ 3065 |
て 3066 |
で 3067 |
と 3068 |
ど 3069 |
な 306A |
に 306B |
ぬ 306C |
ね 306D |
の 306E |
は 306F |
5x/Dx |
ば 3070 |
ぱ 3071 |
ひ 3072 |
び 3073 |
ぴ 3074 |
ふ 3075 |
ぶ 3076 |
ぷ 3077 |
へ 3078 |
べ 3079 |
ぺ 307A |
ほ 307B |
ぼ 307C |
ぽ 307D |
ま 307E |
み 307F |
6x/Ex |
む 3080 |
め 3081 |
も 3082 |
ゃ 3083 |
や 3084 |
ゅ 3085 |
ゆ 3086 |
ょ 3087 |
よ 3088 |
ら 3089 |
り 308A |
る 308B |
れ 308C |
ろ 308D |
ゎ 308E |
わ 308F |
7x/Fx |
ゐ 3090 |
ゑ 3091 |
を 3092 |
ん 3093 |
Teckenuppsättning 0x2B/0xAB (radnummer 11, Katakana)
Den här raden innehåller Katakana för användning på japanska . Det japanska långa vokalmärket , som används i katakanatext och ingår i rad 1 i JIS X 0208 , ingår dock inte (på samma sätt som med GB 2312 och KS X 1001), även om det ingår i KPS 9566-2011 utanför huvudplanet, vid 0xEA48 .
Jämför rad 11 i KS X 1001 , som använder samma layout. Jämför och kontrast rad 5 i JIS X 0208 , som också använder samma layout, men i en annan rad.
KPS 9566 (prefixet 0x2B/0xAB) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
2x/Yxa |
ァ 30A1 |
ア 30A2 |
ィ 30A3 |
イ 30A4 |
ゥ 30A5 |
ウ 30A6 |
ェ 30A7 |
エ 30A8 |
ォ 30A9 |
オ 30AA |
カ 30AB |
ガ 30AC |
キ 30 e.Kr |
ギ 30AE |
ク 30AF |
|
3x/Bx |
グ 30B0 |
ケ 30B1 |
ゲ 30B2 |
コ 30B3 |
ゴ 30B4 |
サ 30B5 |
ザ 30B6 |
シ 30B7 |
ジ 30B8 |
ス 30B9 |
ズ 30BA |
セ 30BB |
ゼ 30 f.Kr |
ソ 30BD |
ゾ 30BE |
タ 30BF |
4x/Cx |
ダ 30C0 |
チ 30C1 |
ヂ 30C2 |
ッ 30C3 |
ツ 30C4 |
ヅ 30C5 |
テ 30C6 |
デ 30C7 |
ト 30C8 |
ド 30C9 |
ナ 30CA |
ニ 30CB |
ヌ 30CC |
ネ 30 CD |
ノ 30 e.Kr |
ハ 30CF |
5x/Dx |
バ 30D0 |
パ 30D1 |
ヒ 30D2 |
ビ 30D3 |
ピ 30D4 |
フ 30D5 |
ブ 30D6 |
プ 30D7 |
ヘ 30D8 |
ベ 30D9 |
ペ 30DA |
ホ 30DB |
ボ 30DC |
ポ 30DD |
マ 30DE |
ミ 30DF |
6x/Ex |
ム 30E0 |
メ 30E1 |
モ 30E2 |
ャ 30E3 |
ヤ 30E4 |
ュ 30E5 |
ユ 30E6 |
ョ 30E7 |
ヨ 30E8 |
ラ 30E9 |
リ 30EA |
ル 30EB |
レ 30EC |
ロ 30ED |
ヮ 30EE |
ワ 30EF |
7x/Fx |
ヰ 30F0 |
ヱ 30F1 |
ヲ 30F2 |
ン 30F3 |
ヴ 30F4 |
ヵ 30F5 |
ヶ 30F6 |
Teckenuppsättning 0x2C/0xAC (radnummer 12, diverse symboler och pilar)
I syfte att mappa denna rad till Unicode, förenades den fetstilta högerpilen med den fetstilta högerpilen från Zapf Dingbats (U+27A1), även om tidigare tabeller (som saknade mappningar för de andra fetstilta pilarna) istället hade förenat den med U+ 279E, en något annorlunda Zapf Dingbats-karaktär. Eftersom motsvarande pilar i andra riktningar inte ingick i Dingbats block, kodades ytterligare pilar mellan U+2B05 och U+2B0D för kompatibilitet med KPS 9566. Dessa inkorporerades i Unicode-koddiagrammen med hjälp av de referensglyfer som föreslagits av det nordkoreanska nationella organet, medan U+27A1 behöll sin referensglyph baserat på Zapf Dingbats. Dessa pilar (U+2B05 till U+2B07, plus U+27A1) valdes i Unicode 6.0 som mappningar för några av piltecken i mobila emoji -uppsättningar. Därefter, under tillägget av Wingdings 3 repertoaren i Unicode 7.0, Unicode-täckningen av piltecken granskades, vilket resulterade i att ytterligare en högerpil lades till vid U+2B95 med avsikten att harmonisera med tecknen U+2B05 till U+2B0D (i textpresentation), sedan referensen ändrades glyph för Zapf Dingbats-karaktären ansågs inte lämplig.
I tidigare utgåvor av KPS 9566, som 1997 års upplaga, inkluderade denna rad både det enkla postmärket i japansk stil (〒) och en version i en nedåtriktad triangel, som föreslogs av det nordkoreanska nationella organet för tillägg till Unicode tillsammans med de andra saknade KPS 9566-tecken. Ett svar från en sydkorean representant, bland andra förfrågningar, begärde bevis för symbolens användning i Nordkorea, och noterade att postmärket i japansk stil inte används i Sydkorea, som använder en inringad 우 (dvs. ㉾) för liknande ändamål, och frågade om en japansk -stilt postmärke användes i Nordkorea. Ett efterföljande möte hölls för att diskutera detta förslag, med deltagande av nord- och sydkoreanska WG2-representanter; mötesrapporten noterar att det nordkoreanska organet hade beslutat att se över karaktären innan det diskuterades vidare och därför inte rekommenderade det för övervägande av WG2 som helhet. Poststämpelstriangeln togs sedan bort från KPS 9566 2003, vilket bara lämnade kvar det oinneslutna postmärket.
Postmärkestriangeln lades så småningom till Unicode i version 13.0, både för kompatibilitet med det äldre KPS 9566-97-tecknet och efter att märket identifierades som en symbol som hade använts för certifiering av elektriska apparater i Japan (som en föregångare ) till PSE-diamanten ).
Vissa KPS 9566-tecken i den här raden, nämligen två former av emblemet för Koreas arbetarparti , en sax som pekar i en annan riktning än de i Dingbats -blocket, och en inringad uppåtriktad manikel , förblir mappade till Privat användningsområde .
De nordöstra och nordvästra vita pilarna använde felaktigt utbytta Unicode-mappningar i 2003 års upplaga. Detta korrigerades i kartläggningarna av 2011 års upplaga.
KPS 9566 (prefixet med 0x2C/0xAC) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
2x/Yxa |
⍟ 235F |
☀ 2600 |
☂ 2602 |
☔︎ 2614 |
☁ 2601 |
❄ 2744 |
⚡︎ 26A1 |
⚠ 26A0 |
№ 2116 |
→ 2192 |
← 2190 |
↑ 2191 |
↓ 2193 |
|||
3x/Bx |
↗ 2197 |
↖ 2196 |
↘ 2198 |
↙ 2199 |
↔ 2194 |
↕ 2195 |
⇨ 21E8 |
⇦ 21E6 |
⇧ 21E7 |
⇩ 21E9 |
⬀ 2B00 |
⬁ 2B01 |
⬂ 2B02 |
⬃ 2B03 |
⬄ 2B04 |
⇳ 21F3 |
4x/Cx |
➡ 27A1 |
⬅ 2B05 |
⬆ 2B06 |
⬇ 2B07 |
⬈ 2B08 |
⬉ 2B09 |
⬊ 2B0A |
⬋ 2B0B |
⬌ 2B0C |
⬍ 2B0D |
♣ 2663 |
♥ 2665 |
♠ 2660 |
♦ 2666 |
〒 3012 |
⮗ 2B97 |
5x/Dx |
☏ 260F |
☎ 260E |
⏎ 23 e.Kr |
☞ 261E |
☕︎ 2615 |
㉼ 327C |
㉽ 327D |
㈝ 321D |
㈞ 321E |
㏇ 33C7 |
㋏ 32CF |
㉐ 3250 |
℡ 2121 |
℻ 213B |
||
6x/Ex |
㍺ 337A |
® 00AE |
||||||||||||||
7x/Fx | ||||||||||||||||
mappad till privat användningsområde, visas simulerad.
|
Teckenuppsättning 0x2E/0xAE (radnummer 14, Latin-1 delmängd)
Karaktärerna i denna uppsättning fanns inte i 1997 års version av teckenuppsättningen, men lades till i 2003 års version. De utgör en delmängd av Latin-1 Supplement -blocket i Unicode (motsvarande den övre hälften av ISO 8859-1 (Latin-1) teckenuppsättningen). Detta inkluderar accenter av romerska bokstäver och symboler. Vissa av de symboler som redan inkluderades utelämnas, medan andra dupliceras som halvbreddsmotsvarigheter till de tidigare fullbreddsformerna : till exempel not-tecknet (¬, U+00AC) representeras som 0xAEAC, medan dess fullbreddsform (¬, U+FFE2) representeras som 0xA2D1 (i rad 2 ).
Den här raden har utelämnats från mappningen för 2011 års upplaga av standarden, vilket indikerar att den kan ha tagits bort någon gång efter 2003 års upplaga. Yen-tecknet med halv bredd är istället kodat till 0xE98E i 2011 års upplaga.
Det nödvändiga utrymmet skulle falla utanför intervallet på 94 tecken och kollidera med området som används för utökade chosŏn'gŭl stavelser när en UHC -stil kodning används (specifikt med stavelsen 쁲), och utelämnas. Även om y med trema också faller utanför 94-teckenintervallet, och spårbyten 0xFF i övrigt är oanvänd, mappas koden 0xAEFF till den i KPS 9566-2003.
KPS 9566-2003 (med prefixet 0x2E/0xAE) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
2x/Yxa |
¡ 00A1 |
¢ 00A2 |
£ 00A3 |
¤ 00A4 |
¥ 00A5 |
¦ 00A6 |
© 00A9 |
ª 00AA |
« 00AB |
¬ 00 AC |
BLYG |
¯ 00AF |
||||
3x/Bx |
µ 00B5 |
¸ 00B8 |
º 00BA |
» 00BB |
¿ 00BF |
|||||||||||
4x/Cx |
À 00C0 |
Á 00C1 |
 00C2 |
à 00C3 |
Ä 00C4 |
Å 00C5 |
Æ 00C6 |
Ç 00C7 |
È 00C8 |
É 00C9 |
Ê 00CA |
Ë 00CB |
Ì 00CC |
I 00CD |
Î 00 CE |
Ï 00CF |
5x/Dx |
Ð 00D0 |
Ñ 00D1 |
Ò 00D2 |
Ó 00D3 |
Ô 00D4 |
Õ 00D5 |
Ö 00D6 |
Ø 00D8 |
Ù 00D9 |
Ú 00DA |
Û 00DB |
Ü 00DC |
Ý 00DD |
Þ 00DE |
ß 00DF |
|
6x/Ex |
à 00E0 |
á 00E1 |
â 00E2 |
ã 00E3 |
ä 00E4 |
å 00E5 |
æ 00E6 |
ç 00E7 |
è 00E8 |
é 00E9 |
ê 00EA |
ë 00EB |
ì 00 EC |
i 00ED |
î 00EE |
ï 00EF |
7x/Fx |
ð 00F0 |
ñ 00F1 |
ò 00F2 |
ó 00F3 |
ô 00F4 |
õ 00F5 |
ö 00F6 |
ø 00F8 |
ù 00F9 |
ú 00FA |
û 00FB |
ü 00FC |
ý 00FD |
þ 00FE |
ÿ 00FF |
Förkomponerade Chosŏn'gŭl-uppsättningar (rad nummer 16 till 44)
Förkomponerade Chosŏn'gŭl stavelsekluster tilldelas kodpunkter i ett kontinuerligt sorterat block mellan kodpunkterna 16-01 och 44-47 inklusive. Inte alla möjliga kluster tilldelas kodpunkter. Jämför de olika beställningarna och tillgängligheten i KS X 1001 .
Den kodade formen som är dokumenterad för KPS 9566-2003 kodar KPS 9566-planet på GR (0xA1-0xFE) och kodar dessutom de återstående stavelseklustren med hjälp av leadbyte i intervallet 0x80-0xC2 och spårbyte i intervallen 0x41-0x61-0x5A, och 0x81-0xFE (där högst en byte är i intervallet 0xA1-0xFE), på samma sätt som Unified Hangul Code men med de utelämnade klustren från och sorteringsordningen för KPS 9566, inte KS X 1001 .
- Rad 16: 가 각 간 갇 갈 갉 갊 감 갑 값 갓 강 갖 갗 같 갚 갛 갔 갸 갹 갼 걱 갹 갱 걱 걸 걹 걺 검 겁 것 겅 겆 겉 겊 겋 겄 겨 격 견 겯 결 겸 겹 겻 경 곁 겪 겼 고 곡 곤 곧 골 곪 곬 곯 곰 곱 곳 공 곶 곺 국 굵 굔 굵 군 군 굵 굶 굻 굼 굽 굿 궁 궂 규 균 귤 귬 귱 그 극 근 귿
- Rad 17: 글 긁 긇 금 급 긋 긍 기 긱 긴 긷 길 긺 김 깁 깃 깅 깆 깇 깉 깊 갬 갬 깰 갰 걔 걘 걜 게 겍 겐 겔 겜 겝 겟 겡 겠 계 곈 곌 곕 곗 괴 괵 괸 괼 굄 굅 굇 굉 굈 귀 귁 귄 귈 귐 귑 귓 긔 곴 곽 관 괃 괃 괄 괄 괆 괉 권 궐 궘 궝 궜 괘 괙 괜 괠 괩 괭 괬 궤 궥 궷 나 낙
- Rad 18: 낛 난 낟 날 낡 낢 남 납 낫 낭 낮 낯 낱 낳 낚 났 냐 냑 냔 냘 냠 냄 넘 냠 넓 넘 넙 넛 넝 넢 넣 넊 넜 녀 녁 년 녈 념 녑 녓 녕 녘 녔 노 녹 논 놀 놂 놈 놉 놋 농 높 놓 뇨 뇩 뇬 뇰 뇸 뇹 뇻 뇽 누 눅 눈 눕 눅 눈 눋 Nästa
- Rad 19: 늦 늪 니 닉 닌 닐 닒 님 닙 닛 닝 닢 내 낵 낸 낼 냄 냅 냇 냉 냈 먄 넬 네 넹 넸 녜 녠 뇌 뇐 뇔 뇜 뇝 뇟 뉘 뉜 뉠 뉨 뉩 뉭 늬 늰 늴 늼 닁 놔 놘 놜 놧 놨 눠 눨 눳 눴 놰 눼 다 닥 단 닫 달 닭 닮 닯 닲 닷 닯 닲 닷 닾 닿 닦 닸 댜 더 덕 던 덛 덜 덞 덟 덤 덥 덧 덩 덫
- Rad 20: 덮 덯 덖 덨 뎌 뎐 뎔 뎡 뎠 도 독 돈 돋 돌 돎 돐 돔 돕 돗 동 돛 두 두 두 두 두 둣 둥 듀 듄 듈 듐 듕 드 득 든 듣 들 듥 듦 듧 듬 듭 듯 등 디 딕 딘 딛 딜 딤 딥 딧 딩 딪 딮 딨 대 댁 댄 댈 댐 댑 댓 댕 댔 댸 데 뎃 뎅 뎄 뎨 뎬 되 된 될 됨 됩 됫 됭 됬 뒤 뒥 뒨 뒬
- Rad 21: 뒴 뒵 뒷 뒹 듸 듼 딀 딉 딍 돠 돤 돨 둬 둰 둴 둼 둿 뒀 돼 됀 뽄 띒 랒 랒 랍 랏 랑 랒 랖 랗 랐 랴 략 랸 랼 럄 럅 럇 량 러 럭 런 🔸 룝 룟 룡 루 룩 룬 룰 룸 룹 룻 룽 류 륙 륜 률 륨 륩
- Rad 22: 륫 륭 르 륵 른 를 름 릅 릇 릉 릊 릍 릎 리 릭 린 릴 림 립 릠 랩 맆 래 랭 랬 럐 레 렉 렌 렐 렘 렙 렛 렝 렜 례 롄 롈 롑 롓 뢰 뢴 뢸 룀 룁 룃 룅 룄 뤼 뤽 륀 륄 륌 륏 륑 릐 릔 릘 릠 롸 롼 뢉 뢍 먤 뤘 많 맏 말 맑 맒 맘 맙 맛 망 맞 맟 맡 맣 먀 먁 먄 먈
- Rad 23: 먐 먕 머 먹 먼 멀 멁 멂 멈 멉 멋 멍 멎 멓 멌 며 멱 면 멸 몀 몁 몃 몀 명 몃 몀 몯 몰 몲 몸 몹 못 몽 뫃 묘 묜 묠 묩 묫 무 묵 문 묻 물 묽 묾 뭄 뭅 뭇 뭉 뭍 뭏 묶 뮤 뮥 뮨 뮬 뮴 뮷 뮹 므 믄 믈 믐 믑 믓 믕 미 밉 밋 밍 및 밑 밌 매 맥 맨 맬 맴 맵 맷 맹 맺 맸 먜
- Rad 24: 메 멕 멘 멜 멤 멥 멧 멩 멨 몌 몐 뫼 묀 묄 묌 묍 묏 묑 뮈 뮌 뮐 믜 되 뭔 뭘 뭠 뭡 뭣 뭤 뫠 뭬 바 박 밗 반 받 발 밝 밞 밟 밤 밥 밧 방 밭 밖 뱌 뱍 뱐 뱜 뱝 버 벅 번 벋 벌 벍 벎 범 법 벗 벙 벚 뽲 볘 벚 뽲 볏 병 볓 볕 볐 보 복 본 볼 봄 봅 봇 봉 봏 볶 뵤 뵨
- Rad 25: 뵬 부 북 분 붇 불 붉 붊 붐 붑 붓 붕 붙 붚 뷰 뷴 뷸 븀 븁 븃 븅 븐 븐 블 븅 븐 븐 비 빅 빈 빌 빎 빔 빕 빗 빙 빚 빛 배 백 밴 밷 밸 뱀 뱁 뱃 뱅 뱉 뱄 뱨 베 벡 벤 벧 벨 벰 벱 벳 벵 벴 볘 볜 뵈 뵉 뵌 뵐 뵘 땷 뵜 븷 땷 뵜 븬 븰 븽 봐 봔 봡 봣 봤 붜 붤 붯 붴 붰 봬 봰 뵀 붸
- Rad 26: 사 삭 삯 산 삳 살 삵 삶 삼 삽 삿 상 샅 샀 샤 샥 샨 샬 샴 샠 샷 섧 섬 섭 섯 성 섶 섞 섰 셔 셕 션 셜 셤 셥 셧 셩 셨 소 속 손 솓 솔 솖 솜 솝 솟 송 솥 솎 쇼 쇽 숀 숄 숌 숍 숏 숑 수 숙 순 숈 쩈 술 숲 슈 슉 슌 슐 슘 슙 슛 슝 스 슥 슨 슬 슭 슲 슳 슴
- Rad 27: 습 슷 승 시 식 신 싣 실 싫 심 십 싯 싱 싶 새 색 샌 샐 샘 샙 샛 샄 츄 섹 센 셀 셈 셉 셋 셍 셑 셒 셌 셰 셴 셸 솅 쇠 쇡 쇤 쇨 쇰 쇱 쇳 쇵 쇴 쉬 쉭 쉰 쉴 쉼 쉽 쉿 슁 싀 싄 솨 솩 솬 솰 솻 솽 숴 쉈 쉇 쐇 쉑 쉔 쉘 쉠 쉡 쉥 자 작 잔 잖 잗 잘 잚 잠 잡 잣 장
- Rad 28: 잦 잤 쟈 쟉 쟌 쟎 쟐 쟘 쟙 쟝 저 적 전 절 젊 점 접 젓 정 젖 젼 쀡 쀡 젉 졌 조 족 존 졸 졺 좀 좁 좃 종 좆 좇 좋 죠 죡 죤 죨 죰 죵 주 죽 준 줄 줅 줆 줌 줍 줏 중 쥬 쥰 쥴 쥼 즁 즈 즉 즌 즐 즘 즙 즧 슧 슧 쁧 짐 집 짓 징 짖 짙 짚 재 잭 잰 잴 잼 잽 잿 쟁 쟀 쟤
- Rad 29: 쟨 쟬 제 젝 젠 젤 젬 젭 젯 젱 젶 젰 졔 졘 졜 죄 죈 죌 죔 죕 죗 죥 엘 쥡 쥣 즤 좌 좍 좐 좔 좝 좟 좡 줘 줬 좨 좽 좼 줴 줸 줼 쥄 쥅 쥈 차 착 찬 찮 찰 참 찹 찻 창 찾 찼 챠 챤 챦 챨 챰 챱 챵 첲 첲 첩 첲 첲 첩 쳐 쳑 쳔 쳘 쳤 초 촉 촌 촐 촘 촙 촛 총 쵸 쵼 춀 춈
- Rad 30: 추 축 춘 춛 출 춤 춥 춧 충 츄 츈 츌 츔 츙 츠 측 츤 츨 츰 츱 츳 츹 칡 칩 칫 칭 채 책 챈 챌 챔 챕 챗 챙 챘 챼 체 첵 첸 첼 쳄 쳅 쳇 쳉 쳈 쳬 쳰 촁 최 쵠 쵤 쵬 쵭 쵯 쵱 취 췬 췰 췸 췹 췻 췴 츼 샷 샷 샷 샷 쵀 쵄 췌 췐 카 칵 칸 칼 캄 캅 캇 캉 캎 캈 캬 캭 캰
- Rad 31: 캼 캽 컁 커 컥 컨 컫 컬 컴 컵 컷 컹 컽 컾 컸 켜 켠 켤 켬 켭 콕 콜 콜 콧 콩 쿄 쿠 쿡 쿤 쿨 쿰 쿱 쿳 쿵 큐 큔 큘 큠 크 큭 큰 클 큼 큽 킁 키 킥 킨 킬 킴 킵 킷 킹 킾 캐 캑 캔 캘 캠 캡 캣 캥 캪 케 켄 캪 캼 켈 켓 켕 켸 쾨 쾰 퀴 퀵 퀸 퀼 큄 큅 큇 큉 킈 콰 콱 콴
- Rad 32: 콸 쾀 쾅 쿼 퀀 퀄 퀑 쾌 쾐 쾔 쾡 퀘 퀙 퀠 퀭 타 탁 탄 탈 탉 탐 탑 탓 터 턱 턴 털 턺 텀 텁 텃 텅 텄 텨 텬 텼 토 톡 톤 톨 톰 톱 톳 통 톺 툐 투 툭 툰 툴 툼 툽 툿 퉁 튜 튠 튤 튬 튱 트 특 튼 튿 틈 티 티 티 틴 틸 팀 팁 팃 팅 태 택 탠 탤 탬 탭 탯 탱 탶 탰 턔
- Rad 33: 테 텍 텐 텔 템 텝 텟 텡 텦 톄 톈 퇴 퇸 툇 툉 튀 튁 튄 튈 튐 튑 휋 틇 퉈 퉜 퇘 퉤 퉨 퉸 파 팍 판 팔 팖 팜 팝 팟 팡 팥 팎 팠 퍄 퍅 퍼 퍽 펀 펄 펌 펍 펏 펑 펐 펴 펵 편 펼 폄 폅 폇 평 폈 포 폭 표 푏 푤 푭 푯 푸 푹 푼 푿 풀 풂 품 풉 풋 풍 퓨 퓬 퓰 퓸
- Rad 34: 퓻 퓽 프 픈 플 픔 픕 픗 픙 피 픽 핀 필 핌 핍 핏 핑 패 팩 팬 팼 펌 펌 팼 팸 펜 펠 펨 펩 펫 펭 펲 폐 폔 폘 폡 폣 푀 푄 퓌 퓐 퓔 퓜 portal 혁 현 혈 혐 협 혓 형 혔 호 혹 혼 혿 홀 홅 홈 홉 홋
- Rad 35: 홍 홑 효 횬 횰 횹 횻 후 훅 훈 훌 훑 훔 훕 훗 훙 휴 휵 휸 휼 흄 흑 흉 흐 흙 흝 흠 흡 흣 흥 흩 히 힉 힌 힐 힘 힙 힛 힝 해 핵 핸 핼 햄 햅 햇 행 했 햬 헤 헥 헨 헬 헴 헵 헷 헹 헸 혜 혠 혤 혭 회 획 횐 휡 휡 횐 휠 휨 휩 휫 휭 희 흰 흴 흼 흽 힁 화 확 환 활 홤 홥
- Rad 36: 홧 황 훠 훡 훤 훨 훰 훵 홰 홱 홴 횃 횅 횄 훼 훽 휀 휄 휑 까 깓 깓 까 깍 깐 깥 깎 깠 꺄 꺅 꺈 꺌 꺼 꺽 껀 껄 껌 껍 껏 껑 꺾 껐 껴 껸 껼 꼇 꼍 꼈 꼬 꼭 꼰 꼱 꼲 꼴 꼼 꼽 꼿 꽁 꽂 꽃 꾜 꾸 꾹 꾼 꾼 꾿 꾿 꿀꿉 끄 끅 끈 끊 끌 끎 끓 끔 끕 끗 끙 끝 끼 끽 낀 낄 낌
- Rad 37: 낍 낏 낑 깨 깩 깬 깰 깸 깹 깻 깽 깼 꺠 께 껙 껜 껠 껨 껩 껫 껫 껼 꾐 꾐 꾐 꾐 꾐 꾐 꾕 뀌 뀐 뀔 뀜 뀝 뀡 꽈 꽉 꽌 꽐 꽛 꽝 꽜 꿔 꿘 꿜 꿥 꿧 꿩 꿨 꽤 꽥 꽨 꽬 꽹 꿰 꿱 꿴 꿸 뀀 뀁 뀅 뀄 따 딱 딴 딸 딿 땀 땁 땲 떠 떡 떤 떨 떪 떫 떰 떱 떳 떵 떻 떴 뗘 뗬 또 똑 똔
- Rad 38: 💕 띱 띳 띵 때 땍 땐 땔 땜 땝 땟 땡 땠 떼 떽 뗀 뗄 뗌 뗍 뗏 뗑 뗐 뙤 뙨 뛰 뛴 뛸 뜀 뜁 뜅 띄 띅 띈 띌 띔 띕 띙 똬 똰 똴 뚸 뛹 먠 뚸 뛌 뙈 빪 빰 빱 빳 빵 빻 빴 뺘 뺙 뺜 뺨 뻐 뻑 뻔 뻗 뻘 뻠
- Rad 39. 쁑 쁘 쁜 쁠 쁨 쁩 삐 삑 삔 삘 삠 삡 삣 삥 빼 빽 뺀 뺄 뺌 뺍 뺏 뺑 뺐 뺴 뻬 뻭 뻰 뻴 뻼 뼁 뾔 쀠 쁴 뽜 뿨 싸 싹 싻 싼 쌓 쌈 싌 쌸 썅 써 썩 썬 썰 썲 썸 썹 썻 썽 썪 썼 쎠 쏘 쏙 쏜
- Rad 40: 쏟 쏠 쏢 쏨 쏩 쏫 쏭 쑈 쑌 쑐 쑘 쑝 쑤 쑥 쑨 쑬 쑴 쑵 쑹 쓓 쓘 쓓 츓 츓 츓 츓 씀 씁 씅 씨 씩 씬 씯 씰 씸 씹 씻 씽 씼 쌔 쌕 쌘 쌜 쌤 쌥 쌧 쌩 쌨 썌 쎄 쎅 쎈 쎌 쎔 쎕 쎙 쎼 쏀 쐬 쐭 쐰 쐴 쐼 쐽 쑀 쒸 쒼 쏔 쏔 쏔 쏔 쏼 쐇 쐉 쐈 쒀 쒔 쐐 쐑 쐤 쒜 쒠 쒭 짜 짝 짠 짢 짤
- Rad 41: 짧 짬 짭 짯 짱 짰 쨔 쨘 쨤 쨩 쩌 쩍 쩐 쩔 쩗 쩜 쩝 쩟 쩡 쩠 쪄 콫 콪 쫑 쫒 쫓 쫗 쬬 쬰 쬼 쭁 쭈 쭉 쭌 쭐 쭘 쭙 쭛 쭝 쮸 쯀 쯔 쯕 쯘 쯜 쯤 쯧 쯩 쯪 찌 찍 찐 찔 찜 찝 찟 찡 찢 찦 찧 째 짹 짼 쨨 싨 싨 싨 쩨 쩩 쩬 쩰 쩸 쩹 쩽 쪠 쬐 쬔 쬘 쬠 쬡 쬤 쮜 쯰 쯴
- Rad 42: 쫘 쫙 쫜 쫠 쫭 쫬 쭤 쭹 쭸 쫴 쬈 쮀 아 악 안 앉 않 알 앍 앎 앒 압 암 암 았 야 약 얀 얃 얄 얇 얌 얍 얏 양 얕 얗 얐 어 억 언 얹 얻 얼 얽 얾 엄 업 없 엇 엉 엊 엌 엎 엏 었 여 역 연 엳 열 엶 엷 염 엿 엾 염 엿 엾 였 오 옥 온 올 옭 옮 옰 옳 옴 옵 옷 옹 옻 옾 요 욕
- Rad 43: 욘 욜 욤 욥 욧 용 우 욱 운 울 욹 욺 움 웁 웃 웅 유 육 윤 율 윰 윷 융 을 읅 읊 음 읍 읏 응 읒 읓 읔 읕 읖 읗 이 익 인 일 읽 읾 잃 임 입 잇 잉 잊 잎 있 애 액 앤 앨 앰 앱 앳 앵 앴 얘 얜 얠 얩 엣 엥 엥 엡 엥 엤 예 옌 옐 옘 옙 옛 옝 옜 외 왹 왼 욀 욈 욉 욋 욍
- Rad 44: 위 윅 윈 윌 윔 윕 윗 윙 의 읜 읠 읨 읫 와 왁 완 왇 왈 왐 왑 왓 웜 읐 왔 웜 웟 웡 웠 왜 왝 왠 왬 왯 왱 웨 웩 웬 웰 웸 웹 웻 웽 윁
Hanja-set (rad nummer 45 till 94)
Hanja vid 69-09 (0xE5A9) är mappad till U+676E 杮 i alla dokumenterade tabeller; tecken är dock ordnade enligt deras avläsningar, av vilket det framgår att det är tänkt att vara U+67FF 柿 istället.
Utökade icke-stavelser, icke-hanja-uppsättningar i KPS 9566:2011
Följande är diagram för den icke-staviga, icke-hanja-delen av KPS 9566-2011 utanför huvudplanet.
Tilläggssats 0xE0 (symboler och piktogram)
KPS 9566-2011 (med prefixet 0xE0) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
4x | | | | |
◑ 25D1 |
| | | |
⊘ 2298 |
✉ 2709 |
☛ 261B |
☞ 261E |
✌ 270C |
| |
5x |
✍ 270D |
✏ 270F |
✎ 270E |
✐ 2710 |
|
✓ 2713 |
✔ 2714 |
⊡ 22A1 |
⎔ 2394 |
| | |||||
6x |
⊙ 2299 |
|||||||||||||||
7x | | |
⚓︎ 2693 |
| | | | | |
☼ 263C |
| |||||
8x | | | |
◉ 25C9 |
| | ||||||||||
9x | | |
✪ 272A |
|
✯ 272F |
✬ 272C |
|
✫ 272B |
|
✮ 272E |
✭ 272D |
✰ 2730 |
|
✩ 2729 |
||
Inte i Unicode, mappad till område för privat användning
|
Tilläggsuppsättningar 0xE1, 0xE2, 0xE3 (okänt)
Dessa tillägg sätter kartan till området för privat användning. Deras syfte är inte dokumenterat.
KPS 9566-2011 (med prefixet 0xE1) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
4x | | | | | | | | | | | | | | | | |
5x | | | | | | | | | | | | |||||
6x | | | | | | | | | | | | | | | | |
7x | | | | | | | | | | | | |||||
8x | | | | | | | | | | | | | | | | |
9x | | | | | | | | | | | | | | | | |
Yxa | | (En del av huvudplanet.) | ||||||||||||||
Inte i Unicode, mappad till område för privat användning
|
KPS 9566-2011 (med prefixet 0xE2) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
4x | | | | | | | | | | | | | | | | |
5x | | | | | | | | | | | ||||||
6x | ||||||||||||||||
7x | ||||||||||||||||
8x | ||||||||||||||||
9x | ||||||||||||||||
Ej i Unicode, mappad till område för privat användning
|
KPS 9566-2011 (med prefixet 0xE3) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
4x | | | | | | | | | | | | | | | | |
5x | | | | | | | | | | | | |||||
6x | | | | | | | | | | | | | | |||
7x | ||||||||||||||||
8x | | | | | | | ||||||||||
9x | ||||||||||||||||
Ej i Unicode, mappad till område för privat användning
|
Förlängningsset 0xE4 (pilar)
Den här uppsättningen innehåller flera, mestadels högerpilar som mappas till Unicode Dingbats -blocket och på andra ställen.
KPS 9566-2011 (med prefixet 0xE4) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
4x |
➔ 2794 |
➘ 2798 |
➙ 2799 |
➚ 279A |
➛ 279B |
➜ 279C |
➝ 279D |
➟ 279F |
➠ 27A0 |
➢ 27A2 |
➣ 27A3 |
➤ 27A4 |
➥ 27A5 |
➦ 27A6 |
➧ 27A7 |
|
5x |
➨ 27A8 |
➩ 27A9 |
➪ 27AA |
➫ 27AB |
➬ 27AC |
➭ 27 e.Kr |
➮ 27AE |
➯ 27AF |
➱ 27B1 |
➲ 27B2 |
➳ 27B3 |
|||||
6x |
➴ 27B4 |
➵ 27B5 |
➶ 27B6 |
➷ 27B7 |
➸ 27B8 |
➹ 27B9 |
➺ 27BA |
➻ 27BB |
➾ 27BE |
➼ 27 f.Kr |
➽ 27BD |
| ||||
7x | ||||||||||||||||
8x |
⟷ 27F7 |
⇌ 21CC |
| | | |
⥫ 296B |
|
⥬ 296C |
⇐ 21D0 |
|
⟹ 27F9 |
||||
9x | | | | | ||||||||||||
Inte i Unicode, mappad till område för privat användning
|
Tilläggsuppsättning 0xE5 (romerska upphöjda och nedsänkta)
Den här raden innehåller flera romerska upphöjda bokstäver med små bokstäver med spårbyte som motsvarar deras ASCII-motsvarigheter med stora bokstäver, och romerska nedsänkta bokstäver med gemener med spårbytes som motsvarar deras ASCII-motsvarigheter med gemener.
KPS 9566-2011 (med prefixet 0xE5) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
4x |
ᵃ 1D43 |
ᵇ 1D47 |
ᶜ 1D9C |
ᵈ 1D48 |
ᵉ 1D49 |
ᶠ 1DA0 |
ᵍ 1D4D |
| | |
ᵏ 1D4F |
|
ᵐ 1D50 |
ⁿ 207F |
ᵒ 1D52 |
|
5x |
ᵖ 1D56 |
| | |
ᵗ 1D57 |
ᵘ 1D58 |
ᵛ 1D5B |
| | | | |||||
6x |
ₐ 2090 |
| | |
2091 kr |
| | |
ᵢ 1D62 |
ⱼ 2C7C |
| | | |
2092 kr |
|
7x | | |
ᵣ 1D63 |
| |
ᵤ 1D64 |
ᵥ 1D65 |
|
2093 ₓ |
| | |||||
8x | | | | | | | ||||||||||
9x | | | | | | | ||||||||||
Inte i Unicode, mappad till område för privat användning
|
Tilläggsuppsättning 0xE6 (grekiska och symbol upphöjda och nedsänkta)
KPS 9566-2011 (med prefixet 0xE6) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
4x |
ᵅ 1D45 |
ᵝ 1D5D |
ᵞ 1D5E |
ᵟ 1D5F |
ᵋ 1D4B |
| |
ᶿ 1DBF |
| | | |
ᶹ 1DB9 |
| | |
5x | | | | | |
ᵠ 1D60 |
ᵡ 1D61 |
| | |||||||
6x | |
ᵦ 1D66 |
ᵧ 1D67 |
| | | | | | | | | | | | |
7x | |
ᵨ 1D68 |
| | |
ᵩ 1D69 |
ᵪ 1D6A |
| | |||||||
8x |
⁺ 207A |
⁻ 207B |
| | | |||||||||||
9x |
₊ 208A |
₋ 208B |
| | | |||||||||||
Inte i Unicode, mappad till område för privat användning
|
Tilläggssats 0xE7 (ytterligare listmarkörer)
KPS 9566-2011 (med prefixet 0xE7) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
4x |
㉛ 325B |
㉜ 325C |
㉝ 325D |
㉞ 325E |
㉟ 325F |
㊱ 32B1 |
㊲ 32B2 |
㊳ 32B3 |
㊴ 32B4 |
㊵ 32B5 |
㊶ 32B6 |
㊷ 32B7 |
㊸ 32B8 |
㊹ 32B9 |
㊺ 32BA |
|
5x |
㊻ 32BB |
㊼ 32 f.Kr |
㊽ 32BD |
㊾ 32BE |
㊿ 32BF |
| | | | | | |||||
6x | | | | | | | | | | | | | | | | |
7x | | | | | | | | | | | | |||||
8x | | | | | | | | | ||||||||
9x | ||||||||||||||||
Ej i Unicode, mappad till område för privat användning
|
Förlängningsset 0xE8
KPS 9566-2011 (med prefixet 0xE8) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
4x | | | | | | | | | | | | | | | ||
5x | ||||||||||||||||
6x | | | | | | | | | | | | | | | ||
7x | ||||||||||||||||
8x | | | |
︰ FE30 |
||||||||||||
9x | ||||||||||||||||
Ej i Unicode, mappad till område för privat användning
|
Tilläggsuppsättning 0xE9 (ytterligare symboler och skiljetecken)
Denna uppsättning innehåller spelkortssymboler, olika diverse symboler och halvbreddsmotsvarigheter för några av valutasymbolerna i rad 8 . Kelvin - tecknet ingår också, efter att ha ersatts på rad 8 av eurotecknet .
KPS 9566-2011 (med prefixet 0xE9) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
4x |
∅ 2205 |
⊗ 2297 |
|
〓 3013 |
|
♧ 2667 |
♡ 2661 |
♤ 2664 |
♢ 2662 |
|
◯ 25EF |
⦾ 29BE |
| | ||
5x | ||||||||||||||||
6x | | | | |||||||||||||
7x | ||||||||||||||||
8x | | | | | | | |
K 212A |
₩ 20A9 |
| | |
₤ 20A4 |
¥ 00A5 |
||
9x | ||||||||||||||||
Ej i Unicode, mappad till område för privat användning
|
Tilläggsuppsättning 0xEA (japanska skiljetecken och extra jamo)
Den här uppsättningen innehåller flera skiljetecken som används i Japan och några tecken från Hangul-kompatibilitet Jamo Unicode-blocket som inte redan finns på rad 4 . Detta omfattar några av jamo-tecken som finns i KS X 1001 , men tidigare frånvarande i KPS 9566.
KPS 9566-2011 (med prefixet 0xEA) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
4x |
ヽ 30FD |
ヾ 30FE |
ゝ 309D |
ゞ 309E |
々 3005 |
〆 3006 |
〇 3007 |
ー 30FC |
||||||||
5x | | | ||||||||||||||
6x |
ㅥ 3165 |
ㅭ 316D |
ㅱ 3171 |
ㅲ 3172 |
ㅳ 3173 |
ㅴ 3174 |
ㅵ 3175 |
ㅶ 3176 |
ㅷ 3177 |
ㅸ 3178 |
ㅹ 3179 |
ㅺ 317A |
ㅻ 317B |
ㅽ 317D |
ㅾ 317E |
|
7x |
ㆀ 3180 |
ㆄ 3184 |
ㆅ 3185 |
ㆇ 3187 |
ㆈ 3188 |
ㆉ 3189 |
ㆊ 318A |
ㆋ 318B |
ㆌ 318C |
ᆞ 119E |
ㆎ 318E |
|||||
8x | ||||||||||||||||
9x | ||||||||||||||||
Ej i Unicode, mappad till område för privat användning
|
Fotnoter
externa länkar
- KPS 9566-97 kodtabell från ISO-IR- registret
- Trevägsmappningar mellan EUC-KP (KPS 9566), EUC-KR och Unicode från och med 2000 Arkiverade 2021-04-03 på Wayback Machine (fil i EUC-KR; notera typografiska felmappning 0xA1BA till U+3090 ゐ snarare än U+309C ゜ )
- KPS 9566-2003 till Unicode-mappning
- KPS 9566-2011 kodtabell och mappning omvänd konstruerad från Red Star OS