Tai Tham (Unicode-block)

Tai Tham
Tai Tham
Räckvidd	; U+1A20..U+1AAF (144 kodpunkter)
Plan	BMP
Manus	Tai Tham
Stora alfabet	Tai Tham
Tilldelad	127 kodpunkter
Oanvänd	17 reserverade kodpunkter
Unicode versionshistorik
5,2 (2009)	127 (+127)
Diagramkod
	diagram
	Obs :

Den här artikeln innehåller specialtecken . Utan korrekt renderingsstöd kan du se frågetecken, rutor eller andra symboler .

Tai Tham är ett Unicode-block som innehåller tecken från Lanna-skriptet som används för att skriva språken nordthailändsk (Kam Mu'ang), Tai Lü och Khün.

Tai Tham Official Unicode Consortium koddiagram (PDF)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
U+1A2x	ᨠ	ᨡ	ᨢ	ᨣ	ᨤ	ᨥ	ᨦ	ᨧ	ᨨ	ᨩ	ᨪ	ᨫ	ᨬ	ᨭ	ᨮ	ᨯ
U+1A3x	ᨰ	ᨱ	ᨲ	ᨳ	ᨴ	ᨵ	ᨶ	ᨷ	ᨸ	ᨹ	ᨺ	ᨻ	ᨼ	ᨽ	ᨾ	ᨿ
U+1A4x	ᩀ	ᩁ	ᩂ	ᩃ	ᩄ	ᩅ	ᩆ	ᩇ	ᩈ	ᩉ	ᩊ	ᩋ	ᩌ	ᩍ	ᩎ	ᩏ
U+1A5x	ᩐ	ᩑ	ᩒ	ᩓ	ᩔ	ᩕ	ᩖ	ᩗ	ᩘ	ᩙ	ᩚ	ᩛ	ᩜ	ᩝ	ᩞ
U+1A6x	᩠	ᩡ	ᩢ	ᩣ	ᩤ	ᩥ	ᩦ	ᩧ	ᩨ	ᩩ	ᩪ	ᩫ	ᩬ	ᩭ	ᩮ	ᩯ
U+1A7x	ᩰ	ᩱ	ᩲ	ᩳ	ᩴ	᩵	᩶	᩷	᩸	᩹	᩺	᩻	᩼			᩿
U+1A8x	᪀	᪁	᪂	᪃	᪄	᪅	᪆	᪇	᪈	᪉
U+1A9x	᪐	᪑	᪒	᪓	᪔	᪕	᪖	᪗	᪘	᪙
U+1AAx	᪠	᪡	᪢	᪣	᪤	᪥	᪦	ᪧ	᪨	᪩	᪪	᪫	᪬	᪭
Noteringar 1. ^ Från och med Unicode version 15.0 2. ^ Grå områden indikerar icke-tilldelade kodpunkter

Historia

123 av de 127 kodpunkterna som ursprungligen kodades föreslogs i L2/07-007R, ytterligare två (U+1A5C och U+1A7C) i L2/08-037R2 och ett sista par (U+1A5D och U+1A5E) i L2/ 08-073. Det sista av dessa tre dokument ändrade definitionerna av U+1A37 och U+1A38 i det första av de tre.

Följande Unicode-relaterade dokument registrerar syftet och processen för att definiera specifika tecken i Tai Tham-blocket:

Version	Slutliga kodpunkter	Räkna	L2 ID	WG2 ID	Dokumentera
5.2	U+1A20..1A5E, 1A60..1A7C, 1A7F..1A89, 1A90..1A99, 1AA0..1AAD	127	L2/99-245	N2042	Everson, Michael ; McGowan, Rick (1999-07-20), Unicode Technical Report #3: Early Aramaic, Balti, Kirat (Limbu), Manipuri (Meitei) och Tai Lü scripts
			X3L2/94-088	N1013	Motion on the Coding of the Old Xishuang Banna Dai Writing, Enting into BMP of ISO/IEC 10646 , 1994-04-18
				N1099 (pdf , doc )	Motionen om kodning av den gamla Xishuang Banna Dai Writing Ingå i BMP enligt ISO/IEC 10646, 1994-10-10
			L2/04-351		Hosken, Martin (2004-06-28), Lanna Unicode: A Draft Proposal
			L2/05-095R		Hosken, Martin (2005-04-25), Lanna Unicode: Ett förslag
			L2/05-166		Kourilsky, G.; Berment, V. (2005-07-15), Towards a Computerization of the Lao Tham System of Writing
			L2/05-188		Hosken, Martin (2005-08-02), Lao Tham i termer av Lanna: ett svar på L2/05-166 från L2/05-095
			L2/06-258R	N3121R	Everson, Michael; Hosken, Martin (2006-09-09), Förslag till kodning av Lanna-skriptet i BMP för UCS
			L2/06-311	N3159	Tun, Ngwe (2006-09-20), svar på N3121R: Förslag om kodning av Lanna-skriptet i BMP för UCS
			L2/06-319	N3161	Åsikter om N3121-Lanna manus , 2006-09-22
			L2/06-320	N3169R	Chen, Zhuang; Everson, Michael; Hosken, Martin; Wei, Lin-Mei (2006-09-26), Lanna ad hoc-rapport
				N3153 (pdf , doc )	Umamaheswaran, VS (2007-02-16), "M49.17", obekräftade protokoll från WG 2 möte 49 AIST, Akihabara, Tokyo, Japan; 2006-09-25/29
			L2/07-015		Moore, Lisa (2007-02-08), "Lanna (C.17)", UTC #110 minuter
			L2/07-007R	N3207	Everson, Michael; Hosken, Martin; Konstapel, Peter (2007-03-21), reviderat förslag för kodning av Lanna-skriptet i BMP för UCS
			L2/07-101	N3238	Förslag om kodning av gammal Tai Lue, 2007-04-03
			L2/07-098	N3239	Svar på kinesiskt bidrag N3238, "Proposing on Encoding Old Tai Lue", 2007-04-11
				N3353 (pdf , doc )	Umamaheswaran, VS (2007-10-10), "M51.2", obekräftade protokoll från WG 2 möte 51 Hanzhou, Kina; 2007-04-24/27
			L2/07-118R2		Moore, Lisa (2007-05-23), "111-C17", UTC #111 minuter
			L2/07-268	N3253 (pdf , doc )	Umamaheswaran, VS (2007-07-26), "M50.10", obekräftade protokoll från WG 2 möte 50, Frankfurt-am-Main, Tyskland; 2007-04-24/27
			L2/07-307	N3313	Kommentarer om Lanna-kodning i FPDAM4 , 2007-09-06
			L2/07-316	N3342	Hosken, Martin (2007-09-10), Svar på N3313
			L2/07-319	N3346	Ad hoc-rapport om Lanna , 2007-09-19
			L2/07-322	N3349R	Everson, Michael (2007-09-28), "Tai Tham", Sammanfattning av repertoaren för FPDAM 5 i ISO/IEC 10646:2003 och framtida tillägg
			L2/07-345		Moore, Lisa (2007-10-25), "Consensus 113-C10", UTC #113 minuter
			L2/07-353		Whistler, Ken (2007-10-10), "A. Lanna (FDAM 4 och FPDAM 5)", WG2 Consent Docket
			L2/08-037R2	N3379R2	Konstapel, Peter (2008-04-18), Tai Tham Ad-hoc mötesrapport
			L2/08-073	N3384	Hosken, Martin (2008-01-28), Tai Tham Subjoined Variants
			L2/08-003		Moore, Lisa (2008-02-14), "Tai Tham", UTC #114 minuter
			L2/08-318	N3453 (pdf , doc )	Umamaheswaran, VS (2008-08-13), "M52.2a", obekräftat protokoll från WG 2 möte 52
			L2/14-126 + bilagor		Pournader, Roozbeh (2014-05-02), Förbättringar begärda för Unicode Indic-egenskaper (två textfilbilagor HÄR) [berörd U+1A55, 1A60, 1A80-1A89, 1A90-1A99]
			L2/14-177		Moore, Lisa (2014-08-21), "B.14.5", UTC #140 minuter [påverkad U+1A56-1A5E, 1A75-1A7C, 1A7F]
			L2/17-120		Wordingham, Richard (2017-05-01), Rättelser till den indiska syllabiska kategorin för Tai Tham-skriptet [berörd U+1A57, 1A5A-1A5E, 1A74, 1A7A]
			L2/17-169		Pournader, Roozbeh (2017-05-12), Föreslagna ändringar av indiska syllabiska kategorier för Tai Tham för Unicode 10 [berörd U+1A57, 1A5A-1A5E, 1A74, 1A7A]
			L2/17-103		Moore, Lisa (2017-05-18), "B.14.9", UTC #151 minuter [berörd U+1A57, 1A5A-1A5E, 1A74, 1A7A]
			L2/18-053		Pournader, Roozbeh (2018-01-24), New Indic Syllabic Category Consonant_Initial_Postfixed [berörd U+1A5A]
			L2/18-007		Moore, Lisa (2018-03-19), "B.14.7", UTC #154 minuter [påverkad U+1A5A]
			L2/18-171		Wordingham, Richard (2018-04-29), Positionering av Tai Tham-vokaler nedan [dokumenterad U+1A69 & U+1A6A]
			L2/18-241		Anderson, Deborah; et al. (2018-07-25), "15. Tai Tham", rekommendationer till UTC # 156 juli 2018 om manusförslag [dokumenterad U+1A69 & U+1A6A]
			L2/18-183		Moore, Lisa (2018-11-20), "D.12 Positionering av Tai Tham-vokaler nedan", UTC #156 minuter [dokumenterad U+1A69 & U+1A6A]

Kodning av underordnade konsonanter

Bas- och underkonsonanter har olika kodningar eftersom ord som ᨲᩥ᩠ᨠ och ᨲᩥᨠ är olika i både utseende och ljud. Sänkta konsonanter kodas som en sekvens av 2 tecken. Det andra är bastecknet och det första är specialtecknet U+1A60 TAI THAM SIGN SAKOT.

Om en konsonant har två nedsänkta former och valet påverkar innebörden, kommer formen som vanligtvis används för stavelseslutkonsonanter att kodas med SAKOT, och den andra formen kommer att ha en egen kodpunkt. Det finns 7 konsonanter som har olika underskriftsformer på detta sätt, nämligen ᩁ RA, ᩃ LA, ᨷ BA, ᩈ HIGH SA, ᨾ MA, ᨳ HIGH RATA och ᨻ LOW PA.

ᨣᩕᩪ ( nordthailändskt uttal: [k ʰ uː] ) är kodad som <U+1A23 LÅG KA, [ka ] U +1A55 MEDIAL RA , U+1A6A TECKN UU> men ᨠᩣ᩠ᩁ ( IPA: + är kodad 1A20 HÖG KA, U+1A63 SIGN AA, U+1A60 SAKOT, U+1A41 RA >

ᩆᩦ᩠ᩃ ( IPA: [siː n ] ) är kodad som <U+1A46 HIGH SHA, U+1A66 SIGN II, U+1A60 SAKOT, U+1A43 LA > men ᨸᩖᩦ ( IPA: [piː är <U kodad som) 1A38 HÖG PA, U+1A56 MEDIAL LA , U+1A66 SIGN II>. (Jämför ᩁᨭᩛᨷᩣ᩠ᩃ ( nordthailändskt uttal: [lat tha baːn] för användning av LA som en stavelseslutbokstav) .

U+1A57 SIGN LA TANG LAI ser ut som <U+1A60 SAKOT, U+1A43 LA> men är ursprungligen en ligatur av den med <U+1A60 SAKOT, U+1A26 NGA>. Tai Lue använder det för att skriva ordet ᨴᩢ᩵ᩗᩣ ( IPA: [taŋ laːi] ) .

ᨣᩝᩴ ( IPA: [kɔː b ɔː] ) är kodad som <U+1A23 LÅG KA, U+1A5D SIGN BA , U+1A74 MAI KANG>, men ᨠᩢ᩠ᨷ ( IPA: [ka p ] 0 ) är kodad HIGH KA, U+1A62 MAI SAT, U+1A60 SAKOT, U+1A37 BA > och ᨠᩢᨷ᩠ᨷ᩺ ( IPA: [kap] ) är kodade som <U+1A20 HIGH KA, U+1A62 MAI SAT, BA U+ 1A +1A60 SAKOT, U+1A37 BA , U+1A7A RA HAAM>

I det slutliga förslaget, som Unicode Consortium accepterade att det som nu är SIGN BA (som i ᨣᩝᩴ ) skulle kodas som <SAKOT, BA> och det som nu är <SAKOT, BA> (som i ᨠᩢ᩠ᨷ ) skulle kodas som <SAKOT , HÖG PA>, men under ISO-processen ändrades betydelsen av <SAKOT, BA> och SIGN BA lades till. Den ursprungliga betydelsen av <SAKOT, HÖG PA> finns dock kvar för ord från thailändska som har ป som en stavelseslutkonsonant. (Detta förslag kallar felaktigt <SAKOT, HIGH PA> <SAKOT, HIGH PHA>.)

Pali använder HIGH PA istället för BA i Laos och nordöstra Thailand. Man bör därför vara beredd att hitta kodad som i Pali.

Tai Khuen har två sätt att skriva subscript HIGH SA. De är inte utbytbara. I Tai Khuen är det korrekt att skriva ᩃᩮᩞ och att skriva ᩃᩮ᩠ᩈ är fel, men att skriva ᩈᨶ᩠ᨶᩥᩅᩤ᩠ᩈ är korrekt medan att skriva ᩈᨶ᩠ᨶᩥᩅ᩠ᨶᩥᩅᩅᨶᩥᩅᩈ är fel! ᩃᩮᩞ är kodad som <U+1A43 LA, U+1A6E SIGN E, U+1A5E SIGN SA > medan den felaktiga ᩃᩮ᩠ᩈ är kodad som <U+1A43 LA, U+1A6E SIGN E, U+1A60 SAGH SA >.

Tai Khuen har ytterligare ett sätt att skriva prenumerations MA. Det finns en speciell kodpunkt för denna extra metod. Ordet som nordthailändsk skriver som ᨵᨾ᩠ᨾ᩺ är skrivet i Tai Khuen både som ᨵᨾ᩠ᨾ᩼ kodat som <U+1A35 LÅG THA, U+1A3E MA, U+1A60 SAKOT, MA U, 1A60 SAKOT, MA U ,1 +1A7C KARAN> och som ᨵᨾᩜ᩼ kodad som <U+1A35 LOW THA, U+1A3E MA, U+1A5C SIGN MA , U+1A7C KARAN>.

Det finns två sätt att skriva prenumerationen för både HÖG RATHA och LÅG PA. ᨶᩥᨣᨱᩛ är kodad som <U+1A36 NA, U+1A65 SIGN I, U+1A23 LÅG KA, U+1A31 RANA, U+1A5B TECKN HÖG RATHA ELLER LÅG PA >: ᩁᩣᩮ᩠᩠ᨩ᩠1 en+A 1A63 SKYLT AA, U+1A29 LÅG CA, U+1A3D LÅG PHA, U+1A62 MAI SAT, U+1A60 SAKOT, U+1A2E HÖG RATHA >. ᨶᩥᨻᩛᩣᨶ är kodad som <U+1A36 NA, U+1A65 TECKNA I, U+1A3B LÅG PA, U+ 1A5B TECKNA HÖG RATHA ELLER LÅG PA , U+1A63 TECKNA AA, U+1A36 NA enkod som: <U+1A36 NA en +1A34 LÅG TA, U+1A6E SKYLT E, U+1A60 SAKOT, U+1A3B LÅG PA >. Det senare ordet skrivs också som ᨴᩮ᩠ᨷ . Den laotiska konsonanten ᨲ᩠ᨳ (kodad som <U+1A32 HIGH TA, U+1A60 SAKOT, U+1A33 HIGH THA>) ser ut som om den är ᨲᩛ kodad som <U+1A32 HIGH 5BAT SIHAGNA HIGH TA, U+1A ELLER LÅG PA>. Formen på U+1A5B beror på vilken konsonant den är ansluten till.

Den beroende vokalen för ord som ᨯᩬᨠ 'blomma' är kodad av den speciella vokalen <U+1A6C SIGN OA BELOW>; man ska inte använda sekvensen <U+1A60 SAKOT, U+1A4B LETTER A> Det finns också en kodad beroende vokal för ord som Tai Khuen, Tai Lue och laotiska ord som ᨶ᩶ᩭ , nämligen U+1A6D SIGN OY . Denna vokal är inte kodad som <U+1A6C SIGN OA BELOW, U+1A60 SAKOT, U+1A3F LOW YA> (vilket är vad nordthailändska använder för motsvarande ord; det är inte heller sekvensen <U+1A60 SAKOT, U+ 1A40 HIGH YA>⁠

Upphöjda konsonanter

Upphöjda konsonanter kodas oberoende av baskonsonanterna. Vissa karaktärer fungerar både som konsonanter i upphöjd skrift och i andra roller, och diskuteras därför vidare i detta avsnitt.

Niggahita och är kodad som U+1A74 MAI KANG. Upphöjd WA kodas inte separat. Den är kodad som MAI KANG. Till exempel är Tai Khuen ᨯ᩠ᨿᩴ ( IPA: [deu] ) kodad som <U+1A2, DA, U+1A60 SAKOT, U+1A3F LOW YA, U+1A74 MAI KANG>. För teckensekvensering behandlas det vanligtvis som en vokal.

Upphöjd klusterinitial NGA är kodad som U+1A58 MAI KANG LAI. Observera att Lao i allmänhet använder samma glyf för MAI KANG LAI och U+1A59 SIGN FINAL NGA.

U+1A62 MAI SAT har tre roller - det är en vokal, en sista konsonant och en vokalförkortare.

Det var svårt att välja kodning av den upphöjda formen av RA och vokaldödare. På 1940-talet skrev Tai Khuen konsonanten och vokalmördaren på samma sätt. Föreslagarna av kodningen gjorde förfrågningar och fick höra att glyferna fortfarande var desamma och kodade därför båda som U+1A7A RA HAAM. Det fick reda på att Tai Khuen hade ändrat glyferna för vokalmördaren, och en ny karaktär U+1A7C KARAN lades till för Tai Khuen-stilen för vokalmördaren. Vissa nordthailändska författare föredrar att använda U+1A7C som vokaldödare, och användningen av dess glyf är faktiskt inte okänd i nordthailändsk handstil.

Särskilda konsonanter

De speciella formerna ᩓ och ᩕ kodas av kodpunkterna U+1A53 respektive U+1A55.

Om glyferna för U+1A36 NA och U+1A63 TECKN AA skulle vara sida vid sida skrivs de som ligaturen ᨶᩣ snarare än som två separata glyfer ᨶ‌ᩣ . De skrivs som en ligatur även om NA har en underordnad konsonant eller ett icke-följande märke bifogat. Exempel: ᨾᨶ᩠ᨲᩣ ( IPA: [man taː] , kodning <U+1A3E MA, U+1A36 NA, U+1A60 SAKOT, U+1A32 HIGH TA, U+1A63 SIGN AA>) och ᨩᩮ]ᩢ:ᩮ]ᩢ: ᩮ ] ᩢ : ᩮ kodning <U+1A36 NA, 1A6E SIGN E, U+1A62 MAI SAT, U+1A63 TECKN AA>). Subscript NA och SIGN AA inte på samma sätt, t.ex. ᩉ᩠ᨶᩣ (( IPA: [naː] ), kodad <U+1A49 HIGH HA, U+1A60 SAKOT, 1A36 NA, U+1A63 SIGN AA>)

Geminatkonsonanten ᩔ kodas separat eftersom ordet ᩅᩥᩈᩮ᩠ᩈ ( nordthailändskt uttal: [wiseːt] , kodar <U+1A45 WA, U+1A65 SIGN I, U+1A48 HIGH SA, U+1A,OT U+1A48 HIGH SA>) har ett utseende som skiljer sig mycket från ᩅᩥᩔᩮ , men man kan ha tillfälle att vika slutstavelsen till <HIGH SA, SAKOT, HIGH SA, SIGN E>. Under 2019 till 2020 pågick en kampanj för att fastställa den senare som standardstavning.

Däremot är geminatkonsonanten ᨬ᩠ᨬ kodad som konjunkten <U+1A2C NYA, U+1A60 SAKOT, U+1A2C NYA>, även om vissa av dess glyfer kan likna den hypotetiska konjunkten ᨱ᩠ᨬ1A RANA, U31A RANA, U31A RANA, U31A RANA , U31A SAKOT, U+1A2C NYA>.

Oberoende vokaler

Den oberoende vokalen ᩋ och konsonanten ᩋ är samma tecken, U+1A4B.

Den oberoende vokalen ᩋᩣ och sekvensen av konsonanten ᩋ och den beroende vokalen ᩣ har samma utseende ᩋᩣ och är därför båda kodade <U+1A20 BOKSTAV A, U+1A63 TECKN AA>.

Northern Thai använder 5 oberoende vokaler med sina egna kodpunkter, nämligen ᩍ , ᩎ , ᩏ , ᩐ och ᩑ .

I norra thailändska är den 8:e oberoende vokalen inte annorlunda än sekvensen av konsonanten ᩋ och beroende vokal ᩰ , dvs ᩋᩰ , och de är därför båda kodade <U+1A4B LETTER A, U+1A70 TECKN OO>. Andra språk använder ett distinkt tecken ᩒ U+1A52 LETTER OO för den oberoende vokalen.

Teckenordning inom text

Kodningsförslaget definierade ordningen för Unicode-tecken.

Liksom sättet att skriva burmesiska, khmeriska och indiska språk, ordnas Unicode-tecken enligt ordningen på ljuden förutom i speciella fall eller om 2 ljud kombineras till ett enda ljud och sedan använder man den gamla ordningen. Denna ordning är vanligtvis som på siamesiska. Om ljudet inte har en ordning så använder man den visuella ordningen eller en speciell alternativ ordning.

Det finns särskilda regler för:

(a) Ordningen av vokaler

(b) Skrivningen av mai kia i alla dess varianter

(c) Skrivningen av mai kua i alla dess varianter (

d) Skrivningen av mai kam

(e) Skrivningen av tonmärken

Ordningen av Unicode-tecken för konsonanter och vokaler är: inledande bokstäver, sanna vokaltecken, kodakonsonanter, begynnelsebokstäver, sanna vokaltecken, kodakonsonanter. För enkelhetens skull räknar man med att symboler som dödar vokaler är vokaler.

De "startbokstäver" är konsonanter, oberoende vokaler eller speciella symboler. Konsonanterna i en grupp är ordnade efter den ordning som de ljuder eller brukade ljuda.

Exempel: ᨻᩩᨴ᩠ᨵ ( nordthailändskt uttal: [put thaʔ] )

startbokstav: ᨻ

ren vokal: ᩩ

slutlig 'konsonant': ᨴ

startbokstav: ᨵ

ren vokal: ingen symbol

slutkonsonant: ingen

Kodningen är<U+1A3B LOW PA, U+1A69 SIGN U, U+1A34 LOW TA, U+1A60 SAKOT, U+1A35 LOW THA>

Exempel: ᨻᩕ har ett enstaka konsonantljud nordthailändskt uttal: [pʰ] , men hade tidigare 2 ljud, nämligen de av ᨻ och sedan ᩁ som i central thai. Detta ord är kodat som <LOW PA, MEDIAL RA>.

Förutom MEDIAL RA är ordningen på konsonantglyferna densamma som ordningen på ljuden. I de flesta fall är MEDIAL RA den sista konsonanten men WA för /ua/ och LOW YA för /ia/ följer MEDIAL RA.

Exempel:

ᩆᩣᩈ᩠ᨲᩕ᩺ är kodad <U+1A46 HIGH SHA, U+1A63 SIGN AA, U+1A48 HIGH SA, U+1A60 SAKOT, U+1A32 HIGH TA, U+1A55 1A55 HAA7A RA, U+.

ᨠᩕᩈᩢ᩠ᨲ är kodad <U+1A20 HIGH KA, U+1A55 MEDIAL RA, U+1A48 HIGH SA, U+1A62 MAI SAT, U+1A60 SAKOT, U+1A32 HIGH TA&gt.

ᩈᩕ᩠ᩅᨾ är kodad <U+1A48 HIGH SA, U+1A55 MEDIAL RA, U+1A60 SAKOT, U+1A45 WA, U+1A3E MA>.

Men ᨲᩕ᩠ᨶᩬᨾ ( nordthailändskt uttal: [tʰa nɔːm] ) är kodad <U+1A32 HIGH TA, U+1A55 MEDIAL RA, U+1A60 SAKOT, U+1A36 NABEL, U+1A+ 3

För ord som ᨧᩮᩢ᩶ᩣ finns regeln att symboler för vokaler och toner har ordningen:

(1) inledande vokaler

(2) vokaler under (upptill till botten)

(3) vokaler ovanför (botten till topp)

(4) tonmärken (vänster till höger)

(5) efterföljande vokaler (vänster till höger)

Vid tillämpningen av dessa regler räknas MAI KANG som en vokal även om den fungerar som niggahita eller som en konsonant. Unicode-tecknet MAI SAT räknas som en vokal även om det fungerar som en konsonant, dvs som mai kak, dvs som en slutkonsonant eller fungerar som en vokalförkortare som i ᨸᩮᩢ᩠ᨯ .

Den relativa ordningen för märkena ovan och nedan bör följa thailändska och laotiska som i เจ้า เกี่ว ชุํ och ບິ່ .

Exempel:

ᨧᩮᩢ᩶ᩣ är kodad som <U+1A27 HIGH CA, U+1A6E SIGN E, U+1A62 MAI SAT, U+1A76 TONE-2, U+1A63 SIGN AA> ᨾᩢᩣ ( IPA: [

maːkd ] som ) is 1A3E MA, U+1A62 MAI SAT, U+1A63 SIGN AA>

ᩃᩪᩢ ( IPA: [luːk] ) är kodad som <U+1A43 LA, U+1A6A SIGN UU, U+1A62 MAI SAT>

ᩢᩣ är encode +1a36 na, u+1a6e tecken e, u+1a62 mai sat, u+1a63 tecken aa>

ᩋᩫᨶ᩠ᨲᩕᩣ᩠ᨿ (norra thailändska uttal: [ på thaʔ laːi] ) är kodad som <u+1a4b bokstav a, u+1a6b skylt o, U+1A36 NA, U+1A60 SAKOT, U+1A32 HÖG TA, U+1A55 MEDIAL RA, U+1A63 SIGN AA, U+1A60 SAKOT, U+1A3F LOW YA>

För /ia/ och /ua/ i alla deras former, räknas nedsänkt LOW YA och WA som debutkonsonanter.

Exempel:

ᩈ᩠ᨿᩮ är faktiskt kodad <U+1A48 HÖG SA, U+1A60 SAKOT, U+1A3F LÅG YA, U+1A6E SIGN E> ᨸ᩠ᩃ᩠ᨿ᩵ᩁ är faktiskt kodad <U+6+1A38, U1A GH PA,1A38, U1A GH PA,1A38

, U38 +1A60 SAKOT, U+1A3F LOW YA, U+1A75 TONE-1, U+1A41 RA>

ᨲ᩠ᩅᩫ är faktiskt kodad <U+1A32 HÖG TA, U+1A60 SAKOT, U+1A45 WA, U+1A᩠᩠ᩅ᩠᩠᩠᩠᩠᩠᩠᩠᩠ᩁ>

᩠ᩁ är faktiskt kodad <U+1A48 HIGH SA, U+1A60 SAKOT, U+1A45 WA, U+1A75 TONE-1, U+1A41 RA> ᨠᩖ᩠ᩅ᩠᩶ᨿ är faktiskt kodad som <U+1A20 KA, U+1A, MEDIAL U

+ 1A +1A60 SAKOT, U+1A45 WA, U+1A60 SAKOT, U+1A76 TONE-2, U+1A3F LOW YA> (<

U+1A60, U+1A76> är kanoniskt ekvivalent med <U+1A76, U+1A60> )

Utanför norra Thailand är MAI KANG i symbolen för /am/ skrivet på SIGN AA-komponenten. I norra Thailand är den placerad på olika sätt – på konsonanten, på SIGN AA och mellan dem. Unicode-konsortiet vägrade ett specialtecken för kombinationen. Ordet ᨷᩴ᩠᩵ᨾᩣ ( nordthailändskt uttal: [bɔːmaː] ) bör inte verka ha samma vokal som ᨲ᩵ᩣᩴ ( IPA: [tam] ). Kombinationen för /am/ är därför kodad som <U+1A63 SIGN AA, U+1A74 MAI KANG>. Ordet ᨷᩴ᩠᩵ᨾᩣ är kodat som <U+1A37 BA, U+1A74 MAI KANG, U+1A75 TONE-1, U+1A60 SAKOT, U+1A3E MA, U+1A63 SIGN AA>. Ordet ᨲ᩵ᩣᩴ är kodat som <U+1A32 HÖG TA, U+1A75 TONE-1, U+1A63 SIGN AA, U+1A74 MAI KANG>. Kombinationen för /am/ med SIGN TALL AA är kodad som <U+1A64 SIGN TALL AA, U+1A74 MAI KANG>.

U+1A5A SIGN LOW PA är ett specialfall; Tai Lue-ordet ᨣᨽᩚ ( IPA: [kap phaʔ] ) är kodat som <U+1A23 LÅG KA, U+1A3D LÅG PHA, U+1A5A TECKN LÅG PA>.

Exempel som visar mai kang lai och la tang lai:

Pali-ordet ᩈᩘᨥᩮᩣ (saṅgho) är kodat <U+1A48 SA, U+1A58 MAI KANG LAI, U+1A25 LÅG KHA, U+1A6E TECKNA E, U+1A63 TECKNA AA>.

Nordthailändska ordet ᨴᩘ᩠ᩃᩣ᩠ᨿ ( nordthailändskt uttal: [taŋ laːi] ) är kodat <U+1A34 LÅG TA, U+1A58 MAI KANG LAI, U+1A60 SAKOT, U+1A43 LA6,+ SAKOT, U+1A43 LA 6,+ S , U+1A3F LÅG YA&gt.

Tai Lue-ordet ᨴᩢᩗᩣ ( Tai Lue-uttal: [taŋ laːi] ) är kodat <U+1A34 LÅG TA, U+1A62 MAI SAT, U+1A57 LA TANG LAI, U+1A63 SIGN AA>.

externa länkar

Chew, P., Saengboon, P., & Wordingham, R. (2015). "Tai Tham: Ett hybridskript som utmanar nuvarande kodningsmodeller" . Presenteras på Internationalization and Unicode Conference (IUC 39) .

Tai Tham
Räckvidd	U+1A20..U+1AAF (144 kodpunkter)
Plan	BMP
Manus	Tai Tham
Stora alfabet	Tai Tham
Tilldelad	127 kodpunkter
Oanvänd	17 reserverade kodpunkter
Unicode versionshistorik

5,2 (2009)	127 (+127)

Diagramkod
diagram
Obs :