Digraph (ortografi)
Ett digraf eller digram (från antikgrekiskan : δίς dís , "dubbel" och γράφω gráphō , "att skriva") är ett teckenpar som används i ortografin av ett språk för att skriva antingen ett enda fonem (distinkt ljud), eller en sekvens av fonem som inte motsvarar normalvärdena för de två tecknen tillsammans.
Vissa digrafer representerar fonem som inte kan representeras med ett enda tecken i ett språks skriftsystem, som engelska sh i ship and fish . Andra digrafer representerar fonem som också kan representeras av enstaka tecken. En digraf som delar sitt uttal med ett enda tecken kan vara en kvarleva från en tidigare period av språket när digrafen hade ett annat uttal, eller kan representera en distinktion som bara görs i vissa dialekter , som engelskan wh . Vissa sådana digrafer används av rent etymologiska skäl, som rh på engelska.
Digrafer används i vissa romaniseringsscheman , som zh som ofta används för att representera den ryska bokstaven ж . Som ett alternativ till digrafer, använder ortografier och romaniseringsscheman ibland bokstäver med diakritiska tecken , som den tjeckiska och slovakiska š , som har samma funktion som den engelska digraphen sh, som den rumänska Ț , som har samma funktion som den slaviska C , den bokstaven Ť som används i tjeckiska och slovakiska, som har samma funktion som den ungerska digrafen Ty , och bokstaven med cedilla på några turkiska språk som har samma funktion som bokstaven med cedilla nedan följt av bokstaven h i Engelska, till exempel, ç blir ch på engelska och ş blir sh på engelska.
I vissa språks ortografier betraktas digrafer (och ibland trigrafer ) som enskilda bokstäver , vilket betyder att de har sin egen plats i alfabetet och inte kan separeras i sina ingående grafem vid sortering , förkortning eller avstavning av ord. Exempel på detta finns på ungerska ( cs, dz, dzs, gy, ly, ny, sz, ty, zs ), tjeckiska ( ch ), slovakiska ( ch , dz , dž ), albanska ( dh , gj , ll , nj , rr , sh , th , xh , zh ), Gajs latinska alfabet ( lj, nj, dž ), och på uzbekiska (sh, ch, ng) . Kazakiska använde också en form av det latinska alfabetet där det finns några digrafer och en tetragraf, närmare bestämt 2018 års version av det kazakiska latinska alfabetet (sh, ch, shch, ıo), och det finns fortfarande en digraf i den nya versionen av latinska alfabetet (şç) . På nederländska, när digrafen ij är versal, skrivs båda tecknen med versaler ( IJ ). På maorispråket finns det två digrafer i språket som fortfarande ingår i alfabetet, vilket är ng och wh . På walesiska finns det åtta digrafer som finns i det officiella alfabetet (ch, dd, ff, ng, ll, ph, rh, th) .
På maltesiska finns det två digrafer i det officiella alfabetet ( għ och ie ). Romanisering av det kyrilliska alfabetet, särskilt de som används i vissa slaviska språk, inklusive ryska, resulterade i att vissa bokstäver ibland blev digrafer, vilket är bokstäverna (ё, ж, х, ц, ч, ш, щ, ю, я) och kan translittereras till ( jo/yo , zh, kh, ts, ch, sh, shch, yu/ju, ya/ja ), medan romanisering av bokstäverna ibland görs genom att lägga till diakritiska tecken, förutom kh och ts, som för kh, ibland blir ch eller x, och ts blir ibland c (ë, ž, č, š), fortfarande med några digrafer (šč, ju/yu, ja/ya). Det tjeckiska alfabetet brukade ha många digrafer för några hundra år sedan, men genom evolutionen blev dessa digrafer så småningom bokstäver med diakritiska tecken, även om det tjeckiska språket fortfarande behöll några eftersom de bokstäverna med diakritiska tecken inte kan göra uttalen av respektive digrafer (kap. , dz, dž), vilket också är samma fall med det slovakiska alfabetet, som har många digrafer i alfabetet och sedan utvecklas till att bli en diakritisk bokstav, och behåller några när de diakritiska bokstäverna inte kan göra uttalet av respektive digrafer.
Digrafer kan utvecklas till ligaturer , men detta är ett distinkt koncept: en ligatur innebär en grafisk kombination av två tecken, som när a och e smälts samman till æ , och som när o och e smälts samman till œ . Dessa två ligaturer används fortfarande på vissa språk. Æ används vanligtvis på skandinaviska språk, särskilt isländska, norska och danska. Svenskan hade förr bokstaven Æ, men denna bokstav har ändrats till Ä. Œ används vanligtvis på franska, men skrivs vanligtvis med två tangenttryckningar (OE/oe), istället för en speciell tangent på det franska tangentbordet eller med AltGr-tangenten. I Kanada är tangentbordslayouten (Canadian Multilingual Standard) modifierad så att den kan använda höger Ctrl-tangent för att få fler tecken, inklusive œ och andra främmande tecken, ibland en död tangent för att mata in några typer av diakritiska tecken på vissa bokstäver till skriv in det språk som använder diakritiken i fråga. Digrafen ij är ett specialfall, särskilt på nederländska, eftersom när den är handskriven blir den stora versionen (IJ) väldigt lik om inte omöjlig att särskilja den kursiva bokstaven Y, men om den skrivs i den vanliga, gemena versionen, kommer att se ut som ett Y med en diaeres/omljud (ÿ).
Dubbla bokstäver
Digrafer kan bestå av två olika tecken (heterogena digrafer) eller två instanser av samma karaktär (homogena digrafer). I det senare fallet kallas de i allmänhet dubbla (eller dubbla ) bokstäver .
Dubbla vokalbokstäver används vanligtvis för att indikera ett långt vokalljud . Detta är fallet i till exempel finska och estniska , där ⟨uu⟩ representerar en längre version av vokalen betecknad med ⟨u⟩, ⟨ää⟩ representerar en längre version av vokalen betecknad med ⟨ä⟩, och så vidare. I mellanengelska användes sekvenserna ⟨ee⟩ och ⟨oo⟩ på ett liknande sätt, för att representera förlängda "e" respektive "o"-ljud; båda stavningarna har behållits i modern engelsk ortografi , men det stora vokalskiftet och andra historiska ljudförändringar gör att de moderna uttalen skiljer sig ganska mycket från de ursprungliga.
Dubbla konsonantbokstäver kan också användas för att indikera ett långt eller geminerat konsonantljud. På italienska , till exempel, uttalas konsonanter skrivna dubbla längre än enstaka. Detta var den ursprungliga användningen av dubbla konsonantbokstäver i gammalengelska , men under den mellanengelska och tidigmodern engelska perioden förlorades fonemisk konsonantlängd och en stavningskonvention utvecklades där en dubblerad konsonant tjänar till att indikera att en föregående vokal ska uttalas kort. På modern engelska, till exempel, skiljer ⟨pp⟩ för tappning det första vokalljudet från det för tappning . I sällsynta fall representerar dubbla konsonantbokstäver en sann geminate konsonant på modern engelska; detta kan inträffa när två instanser av samma konsonant kommer från olika morfem , till exempel ⟨nn⟩ i onaturlig ( un + naturlig ).
I vissa fall särskiljs ljudet som representeras av en dubblerad konsonantbokstav på något annat sätt än längden från ljudet av motsvarande enstaka konsonantbokstav:
- På walesiska och grönländska står ⟨ll⟩ för en tonlös sidokonsonant , medan det på spanska och katalanska står för en palatal konsonant .
- På flera språk i västra Europa, inklusive engelska, franska , portugisiska och katalanska, används digrafen ⟨ss⟩ mellan vokaler för att representera den röstlösa sibilanten /s/ , eftersom en ⟨s⟩ ensam mellan vokalerna normalt representerar den tonande sibilanten /z/ .
- På spanska, katalanska och baskiska används ⟨rr⟩ mellan vokaler för den alveolära trillen /r/ , eftersom en ⟨r⟩ ensam mellan vokalerna representerar en alveolär flik /ɾ/ (de två är olika fonem på dessa språk).
- På spanska indikerade digrafen ⟨nn⟩ tidigare /ɲ/ (en palatal nasal ); det utvecklades till bokstaven ñ .
- På baskiska markerar dubbla konsonantbokstäver i allmänhet palataliserade versioner av den enda konsonantbokstaven, som i ⟨dd⟩ , ⟨ll⟩, ⟨tt⟩ . Men ⟨rr⟩ är en triller som står i kontrast till enbokstavsfliken, som på spanska, och den palatala versionen av ⟨n⟩ skrivs ⟨ñ⟩.
I flera europeiska skriftsystem, inklusive det engelska, representeras dubbleringen av bokstaven ⟨c⟩ eller ⟨k⟩ som den heterogena digrafen ⟨ck⟩ istället för ⟨cc⟩ respektive ⟨kk⟩. I inhemska tyska ord ersätts dubbleringen av ⟨z⟩, som motsvarar /ts/ , med digrafen ⟨tz⟩.
Pan-dialektiska digrafer
Vissa språk har en enhetlig ortografi med digrafer som representerar distinkta uttal i olika dialekter ( diafonem ). Till exempel på bretonska finns det en digraf ⟨zh⟩ som representerar [z] i de flesta dialekter, men [h] i vannetais. På liknande sätt har Saintongeais -dialekten av franska en digraf ⟨jh⟩ som representerar [h] i ord som motsvarar [ʒ] på standardfranska. På liknande sätt har katalanska en digraf ⟨ix⟩ som representerar [ʃ] på östkatalanska , men [jʃ] eller [js] på västkatalanska – valencianska .
Dela digrafer
Bokstäverna som utgör ett fonem ligger inte alltid intill varandra. Detta är fallet med engelska silent e . Till exempel har sekvensen a_e ljudet /eɪ/ på engelsk kaka. Detta är resultatet av tre historiska ljudförändringar: cake var ursprungligen /kakə/ , den öppna stavelsen /ka/ kom att uttalas med en lång vokal , och senare släppte den sista schwaen och lämnade /kaːk/ . Ännu senare blev vokalen /aː/ /eɪ/ . Det finns sex sådana digrafer på engelska, ⟨a_e, e_e, i_e, o_e, u_e, y_e⟩.
Men alfabet kan också utformas med diskontinuerliga digrafer. I det tatariska kyrilliska alfabetet , till exempel , används bokstaven ю för att skriva både /ju/ och /jy/ . Vanligtvis är skillnaden tydlig från resten av ordet, men när den inte är det , används sekvensen ю...ь för /jy/ , som i юнь /jyn/ 'billig'.
De indiska alfabeten är utmärkande för sina diskontinuerliga vokaler, som thailändska เ...อ /ɤː/ i เกอ /kɤː/ . Tekniskt sett kan de dock betraktas som diakritiska , inte hela bokstäver; om de är digrafer är alltså en definitionsfråga.
Tvetydiga bokstavssekvenser
Vissa bokstavspar ska inte tolkas som digrafer utan visas på grund av sammansättning : hogshead och samarbeta . De är ofta inte markerade på något sätt och måste därför memoreras som undantag. Vissa författare anger det dock antingen genom att bryta upp digrafen med ett bindestreck , som i hogs-head , co-operate , eller med ett trema-tecken , som i coöperate , men användningen av diaeresen har minskat på engelska inom den senaste århundrade. När det förekommer i namn som Clapham , Townshend och Hartshorne markeras det aldrig på något sätt. Positionella alternativa glyfer kan hjälpa till att disambiguera i vissa fall: när runda användes ⟨s⟩ som en sista variant av lång ⟨ſ⟩, och den engelska digrafen som liknar / ʃ/ skulle alltid vara ⟨ſh⟩.
Vid romanisering av japanska indikeras de ingående ljuden ( morae ) vanligtvis med digrafer, men vissa anges med en enda bokstav och några med en trigraf. Fallet med tvetydighet är stavelsen ん , som skrivs som n (eller ibland m ), förutom före vokaler eller y där den följs av en apostrof som n' . Till exempel är förnamnet じゅんいちろう romaniserat som Jun'ichirō, så att det tolkas som "Jun-i-chi-rou", snarare än som "Ju-ni-chi-rou". En liknande användning av apostrof ses i pinyin där 嫦娥 skrivs Chang'e eftersom g tillhör den sista (-ang) av den första stavelsen, inte till initialen i den andra stavelsen. Utan apostrof skulle Change förstås som stavelsen chan (slutlig -an) följt av stavelsen ge (initial g-).
I flera slaviska språk , t.ex. tjeckiska , kan dubbla bokstäver förekomma i sammansatta ord, men de betraktas inte som digrafer. Exempel: bezzubý 'tandlös', cenný 'värdefull', černooký 'svarta ögon'.
I alfabetisering
räknas vissa digraphs och trigraphs som distinkta bokstäver i sig och tilldelas en specifik plats i alfabetet , separat från den för sekvensen av tecken som komponerar dem, för ortografi och sammanställning . Till exempel:
- I Gajs latinska alfabet som används för att skriva serbokroatiska , behandlas digraferna ⟨dž⟩ , ⟨lj⟩ och ⟨nj⟩ , som motsvarar de enstaka kyrilliska bokstäverna ⟨џ⟩, ⟨љ⟩, ⟨љ⟩, ⟨њ⟩, ⟨њ⟩, distin. .
- I det tjeckiska och slovakiska alfabetet behandlas ⟨ch⟩ som en distinkt bokstav, som kommer efter ⟨h⟩ i alfabetet. I det slovakiska alfabetet behandlas också de relativt sällsynta digraferna ⟨dz⟩ och ⟨dž⟩ som distinkta bokstäver.
- I det danska och norska alfabetet är den tidigare digrafen ⟨aa⟩ , där den förekommer i äldre namn, sorterad som om det vore bokstaven ⟨å⟩ , som ersatte den.
- I det norska alfabetet finns det flera digrafer och bokstavskombinationer som representerar ett isolerat ljud.
- I det holländska alfabetet skrivs digrafen ⟨ij⟩ ibland som en ligatur och kan sorteras med ⟨y⟩ (i Nederländerna , dock inte vanligtvis i Belgien ); men oavsett var det används, när ett nederländskt ord som börjar med 'ij' skrivs med versal, skrivs hela digrafen med versaler ( IJmeer , IJmuiden ). Andra holländska digrafer behandlas aldrig som enstaka bokstäver.
- På ungerska har digraferna ⟨cs⟩ , ⟨dz⟩ , ⟨gy⟩ , ⟨ly⟩ , ⟨ny⟩ , ⟨sz⟩ , ⟨ty⟩ , ⟨zs⟩ ⟨zs⟩ , ⟨ly⟩ , ⟨ny⟩ , ⟨sz⟩ , ⟨ty⟩ ⟨zs⟩ ⟨zs⟩ ⟨zs ⟩ , och trigrafen, sin egen plats alfabetet (där ⟨cs⟩ följer ⟨c⟩, ⟨dz⟩ och ⟨dzs⟩ följer ⟨d⟩, etc.)
- På spanska behandlades digraferna ⟨ch⟩ och ⟨ll⟩ tidigare som distinkta bokstäver, men är nu uppdelade i sina konstituerande bokstäver.
- På walesiska innehåller alfabetet digraferna ⟨ch⟩ , ⟨dd⟩ , ⟨ff⟩ , ⟨ll⟩ , ⟨ng⟩ , ⟨ph⟩ , ⟨rh⟩ , ⟨th⟩ . ⟨mh⟩ , ⟨nh⟩ och ⟨ngh⟩ , som representerar muterade röstlösa konsonanter, behandlas dock inte som distinkta bokstäver .
- I romaniseringen av flera slaviska länder som använder den kyrilliska skriften kan bokstäver som ш, ж och ч skrivas som sh, zh och ch, men ibland kan resultatet av romaniseringen ändra en bokstav till att vara en diakritisk bokstav istället för en digrafera.
- På maltesiska används två digrafer, għ som kommer precis efter g, och alltså som kommer precis efter i.
De flesta andra språk, inklusive engelska, franska, tyska, polska, etc., behandlar digrafer som kombinationer av separata bokstäver för alfabetiseringsändamål.
Exempel
latinsk skrift
engelsk
Engelska har både homogena digrafer (dubbla bokstäver) och heterogena digrafer (digrafer som består av två olika bokstäver). De av den senare typen inkluderar följande:
- ⟨sc⟩ representerar normalt /s/ ( röstlös alveolär frikativ - scen ) eller /ʃ/ ( röstlös postalveolär frikativ - medveten ) före ⟨e⟩ eller ⟨i⟩.
- ⟨ng⟩ representerar /ŋ/ ( velar nasal ) som i sak .
- ⟨ ch ⟩ motsvarar vanligtvis /tʃ/ ( röstlös postalveolär affricate - kyrka ), till /k/ ( röstlös velar plosiv ) när den används som etymologisk digraf i ord av grekiskt ursprung ( christ ), mindre vanligt med /ʃ/ ( röstlös postalveolär ) frikativ ) i ord av franskt ursprung ( champagne ).
- ⟨ck⟩ motsvarar /k/ som i bock .
- ⟨ gh ⟩ representerar /ɡ/ ( uttryckt velar plosiv ) i början av ord ( spöke ), representerar / f/ ( röstlös labiodental frikativ i nog ) eller är tyst i slutet av ord ( suck ).
- ⟨ph⟩ representerar /f/ ( röstlös labiodental frikativ ), som i sifon .
- ⟨rh⟩ representerar engelska /r/ i ord av grekiskt ursprung, till exempel rytm .
- ⟨ sh ⟩ representerar /ʃ/ ( röstlös postalveolär frikativ ), som i får .
- ⟨ti⟩ representerar vanligtvis /ʃ/ ordmedialt före en vokal, som i utbildning .
- ⟨ th ⟩ motsvarar vanligtvis /θ/ ( stämmig interdental frikativ ) i tunn eller /ð/ ( tonad interdental frikativ ) i then . Se även uttal av engelska ⟨th⟩ .
- ⟨wh⟩ representerar /hw/ i vissa konservativa dialekter; /w/ i andra dialekter ( medan ); och /h/ med några få ord där det följs av ⟨o⟩, som vem och hela . Se även Fonologisk historia av ⟨wh⟩ .
- ⟨zh⟩ representerar /ʒ/ i ord translittererade från slaviska språk [ vilka? ] , och i amerikansk ordbok uttal stavning.
- ⟨ci⟩ visas vanligtvis som /ʃ/ före vokaler, som i ansiktsbehandling och artificiell . Annars är det /si/ som i finare och isigare eller /sɪ/ som i syra och härsken .
- ⟨wr⟩ representerar /r/ . Ursprungligen stod det för ett labialiserat ljud, medan ⟨r⟩ utan ⟨w⟩ var icke-labialiserat, men distinktionen har gått förlorad i de flesta dialekter, de två ljuden smälter samman till en enda alveolär approximant , allofoniskt labialiserad i början av stavelser, som i rött [ɹʷɛd] . Se även rotisk konsonant .
- ⟨qu⟩ representerar vanligtvis /kw/ ; ⟨q⟩ följs vanligtvis av ⟨u⟩ och en vokalbokstav som i snabb , med några undantag.
Digrafer kan också vara sammansatta av vokaler. Vissa bokstäver ⟨a, e, o⟩ är att föredra för den första positionen, andra för den andra ⟨i, u⟩. De senare har allografer ⟨y, w⟩ i engelsk ortografi .
andra bokstaven → första bokstaven ↓ |
⟨...e⟩ | ⟨...jag⟩ ¦ ⟨...y⟩ | ⟨...u⟩ ¦ ⟨...w⟩ | ⟨...a⟩ | ⟨...o⟩ |
---|---|---|---|---|---|
⟨o...⟩ | ⟨oe¦œ⟩ > ⟨e⟩ – /i/ | ⟨oi¦oy⟩ – /ɔɪ/ | ⟨ou¦ow⟩ – /aʊ¦uː¦oʊ/ | ⟨oa⟩ – /oʊ¦ɔː/ | ⟨oo⟩ – /uː¦ʊ(¦ʌ)/ |
⟨en...⟩ | ⟨ae¦æ⟩ > ⟨e⟩ – /i/ | ⟨ai¦ay⟩ – /eɪ¦ɛ/ |
⟨au¦aw⟩ – /ɔː/ (i lånord: /aʊ/ ) |
(i lånord och egennamn: ⟨aa⟩ – /ə¦ɔː¦ɔl/ ) | (i lånord från kinesiska: ⟨ao⟩ – /aʊ/ ) |
⟨e...⟩ | ⟨ee⟩ – /iː/ | ⟨ei¦ey⟩ – /aɪ¦eɪ¦(iː)/ | ⟨eu¦ew⟩ – /juː¦uː/ | ⟨ea⟩ – /iː¦ɛ¦(eɪ¦ɪə)/ | |
⟨u...⟩ | ⟨ue⟩ – /uː¦u/ | ⟨ui⟩ – /ɪ¦uː/ | |||
⟨jag...⟩ | ⟨ie⟩ – /iː(¦aɪ)/ |
Andra språk som använder det latinska alfabetet
På serbokroatiska :
- ⟨ lj ⟩ motsvarar /ʎ/ , ( palatal lateral approximant )
- ⟨ nj ⟩ motsvarar /ɲ/ ( palatal nasal )
- ⟨ dž ⟩ motsvarar /d͡ʒ/ ( tonad postalveolär affricat )
Observera att i den kyrilliska ortografin representeras dessa ljud av enstaka bokstäver (љ, њ, џ).
På tjeckiska och slovakiska :
- ⟨ ch ⟩ motsvarar /x/ ( röstlös velarfrikativ ), räknas som en distinkt bokstav
- ⟨ dz ⟩ motsvarar /d͡z/ ( tonande alveolär affricat ), räknas som en distinkt bokstav på slovakiska, relativt sällsynt digraf
- ⟨ dž ⟩ motsvarar /d͡ʒ/ ( tonad postalveolär affrikat ), räknas som en distinkt bokstav på slovakiska, relativt sällsynt digraf
På danska och norska :
- Digrafen ⟨ aa ⟩ representerade /ɔ/ fram till 1917 i Norge och 1948 i Danmark, men stavas idag ⟨ å ⟩. Digrafen används fortfarande i äldre namn, men sorterad som om det vore bokstaven med det diakritiska tecknet.
På norska kan flera ljud endast representeras av en digraf eller en kombination av bokstäver. De är de vanligaste kombinationerna, men extrema regionala skillnader finns, särskilt de av de östliga dialekterna . En anmärkningsvärd skillnad är strävan efter rs i östliga dialekter, där det motsvarar skj och sj . Bland många ungdomar, särskilt i de västra regionerna i Norge och i eller runt de större städerna, har skillnaden mellan ç och ʃ helt utplånats och uttalas nu densamma.
- ⟨kj⟩ representerar /ç/ som i ch på tyska i ch eller x i Mé x ico.
- ⟨tj⟩ representerar /ç/ som i ch på tyska i ch eller x i Mé x ico.
- ⟨skj⟩ representerar /ʃ/ som i sh på engelska sh e.
- ⟨sj⟩ representerar /ʃ/ som i sh på engelska sh e.
- ⟨sk⟩ representerar /ʃ/ (före i eller y) som i sh på engelska sh e.
- ⟨ ng ⟩ representerar /ŋ/ som i ng på engelska thi ng .
På katalanska :
- ⟨ll⟩ representerar /ʎ/ ( palatal lateral approximant )
- ⟨ny⟩ representerar /ɲ/ ( palatal nasal )
- ⟨rr⟩ representerar /r/ ( postalveolär trill )
- ⟨ss⟩ representerar /s/ ( röstlös alveolär indragen sibilant )
- ⟨qu⟩ representerar /k/ ( röstlös velar plosiv )
- ⟨gu⟩ representerar /g/ ( tonad velar plosiv )
- postvokalisk ⟨ix⟩ representerar /ʃ/ ( röstlös postalveolär frikativ ) i österländska dialekter, i västerländska dialekter representerar den /jʃ/.
På holländska :
- ⟨ ij ⟩ motsvarar /ɛi/ (se ovan för dess möjliga status som en separat bokstav).
- ⟨ ng ⟩ representerar /ŋ/ ( velar nasal )
- ⟨ ch ⟩ representerar /x/ ( röstlös velarfrikativ )
- ⟨sj⟩ representerar /ʃ/ ( röstlös postalveolär frikativ )
- ⟨ie⟩ representerar /i/ ( stäng främre orundad vokal )
- ⟨oe⟩ representerar /u/ ( stäng bakåt rundad vokal )
- ⟨eu⟩ representerar /ø/ ( avrundad vokal nära mitten fram )
På franska :
- ⟨ch⟩ representerar /ʃ/ ( röstlös postalveolär frikativ )
- ⟨gn⟩ representerar /ɲ/ ( palatal nasal )
- ⟨qu⟩ representerar /k/ ( röstlöst velarstopp ), vanligtvis före historiska främre vokaler
Franska sångdigrafer ⟨...jag⟩ ⟨...u⟩ ⟨en...⟩ ⟨ai⟩ – /ɛ¦e/ ⟨au⟩ – /o/ ⟨e...⟩ ⟨ei⟩ – /ɛ/ ⟨eu⟩ – /œ¦ø/ ⟨o...⟩ ⟨oi⟩ – /wa/ ⟨du⟩ – /u(¦w)/
Se även fransk fonologi .
På tyska :
- ⟨ ch ⟩ representerar /x/ ( röstlös velarfrikativ ) eller /ç/ ( röstlös palatalfrikativ )
- ⟨ck⟩ representerar /k/ ( röstlös velar plosiv )
- ⟨ei⟩ representerar /a͡ɪ/ ( öppen främre orundad vokal ) följt av ( nära nära främre orundad vokal )
- ⟨eu⟩ representerar /ɔ͡ʏ/ ( öppen-mitt bak avrundad vokal ) följt av ( nära nära framtill rundad vokal )
På ungerska :
- ⟨ cs ⟩ representerar /tʃ/ ( röstlös postalveolär affricat )
- ⟨ zs ⟩ representerar /ʒ/ ( tonad postalveolär frikativ )
- ⟨ gy ⟩ representerar /ɟ/ ( tonat palatal plosiv )
- ⟨ ly ⟩ ursprungligen representerad /ʎ/ ( palatal lateral approximant ), men i det moderna språket står för / j/ ( palatal approximant )
- ⟨ ny ⟩ representerar /ɲ/ ( palatal nasal )
- ⟨ ty ⟩ representerar /c/ ( röstlös palatal plosiv )
- ⟨ dz ⟩ representerar /dz/ ( tonat postalveolärt affrikat )
- ⟨ sz ⟩ representerar /s/ ( röstlös alveolär frikativ ) (⟨s⟩ uttalas /ʃ/ )
- Det ungerska alfabetet innehåller dessutom en trigraf , ⟨ dzs ⟩ / dʒ / .
På italienska :
- ⟨sc⟩ motsvarar /ʃ/ , ( röstlös postalveolär frikativ ) före -i och -e (men till /sk/ före andra bokstäver)
- ⟨ch⟩ motsvarar /k/ (endast före i, e)
- ⟨gh⟩ motsvarar /ɡ/ (endast före i, e)
- ⟨gl⟩ representerar /ʎ/ , palatal lateral approximant , före -i (med några undantag)
- ⟨gn⟩ representerar /ɲ/ ( palatal nasal )
På manxgaeliska representerar ⟨ch⟩ /χ/ , men ⟨çh⟩ representerar /tʃ/ .
På polska :
- ⟨ ch ⟩ motsvarar /x/ ( röstlös velarfrikativ )
- ⟨ cz ⟩ motsvarar /tʂ/ ( röstlös retroflex affricate )
- ⟨ dz ⟩ motsvarar /dz/ ( tonad alveolär affricat )
- ⟨ dź ⟩ motsvarar /dʑ/ ( tonat alveolo-palatal affricat )
- ⟨ dż ⟩ motsvarar /dʐ/ ( tonad retroflex affricate )
- ⟨ rz ⟩ motsvarar /ʐ/ ( tonad retroflexfrikativ )
- ⟨ sz ⟩ motsvarar /ʂ/ ( röstlös retroflexfrikativ )
På portugisiska :
- ⟨ ch ⟩ motsvarar /ʃ/ ( röstlös postalveolär frikativ )
- ⟨ lh ⟩ motsvarar /ʎ/ ( palatal lateral approximant )
- ⟨ nh ⟩ motsvarar /ɲ/ ( palatal nasal )
- ⟨qu⟩ representerar vanligtvis /k/ ( stämmigt velarstopp )
På spanska :
- ⟨ll⟩ uttalas traditionellt (men nu vanligtvis inte) /ʎ/
- ⟨ch⟩ representerar /tʃ/ ( röstlös postalveolär affricat ). Sedan 2010 anses ingen av dem vara en del av alfabetet. De brukade sorteras som separata bokstäver, men en reform 1994 av den spanska kungliga akademin har tillåtit att de delas upp i sina konstituerande bokstäver för sammanställning. Digrafen ⟨ rr ⟩, uttalas som en distinkt alveolär trill , ansågs aldrig officiellt vara en bokstav i det spanska alfabetet, och detsamma gäller ⟨gu⟩ och ⟨qu⟩ (för /ɡ/ och /k/ respektive före ⟨ e⟩ eller ⟨i⟩).
På walesiska :
- ⟨ng⟩ representerar /ŋ/ ( velar nasal ), samma ljud som på engelska (men i vissa ord uttalas /ng/ ).
- ⟨ch⟩ representerar /χ/ ( röstlös uvulär frikativ )
- ⟨rh⟩ representerar /r̥/ ( röstlös alveolär trill ), uttalas ungefär som kombinationen hr .
- ⟨th⟩ representerar /θ/ ( röstlös interdental frikativ )
- ⟨ dd ⟩ representerar /ð/ ( uttryckt dental frikativ ), som engelskan ⟨th⟩ i då (men uttalas som röstlös i många sammanhang).
- ⟨ ff ⟩ representerar /f/ ( röstlös labiodental frikativ ), som engelska ⟨f⟩, eftersom walesiska ⟨f⟩ uttalas /v/ som en engelska ⟨v⟩.
- ⟨ph⟩ representerar också /f/ (röstlös labiodental frikativ) men används i modern ortografi endast för aspirerande mutation av ord som börjar med ⟨p⟩.
- ⟨ ll ⟩ representerar /ɬ/ ( röstlös alveolär lateral frikativ )
Digraferna som anges ovan representerar distinkta fonem och behandlas som separata bokstäver för sammanställningsändamål. Å andra sidan behandlas inte digraferna ⟨ mh ⟩, ⟨ nh ⟩ och trigrafen ⟨ ngh ⟩, som står för röstlösa konsonanter men bara förekommer i början av ord som ett resultat av nasala mutation , som separata bokstäver, och ingår alltså inte i alfabetet.
Daighi tongiong pingim , ett transkriptionssystem som används för taiwanesiska Hokkien , inkluderar eller som representerar /ə/ ( mitt central vokal ) eller /o/ ( nära-mitt bak rundad vokal ), såväl som andra digrafer.
På Yoruba :
- ⟨gb⟩ är ett alfabet och en plosiv som uttalas mest exakt genom att försöka säga /g/ och /b/ samtidigt.
Kyrillisk
Moderna slaviska språk som är skrivna i det kyrilliska alfabetet använder föga digrafer förutom ⟨дж⟩ för /dʐ/ , ⟨дз⟩ för /dz/ (på ukrainska, vitryska och bulgariska) och ⟨жж⟩ och ⟨зж⟩ för ovanligt ryskt fonem /ʑː/ . På ryska förekommer sekvenserna ⟨дж⟩ och ⟨дз⟩ (främst i lånord) men de uttalas som kombinationer av en implosiv (ibland behandlad som en affrikat) och en frikativ; implosiva behandlas som allofoner av plosiven /d̪/ och därför anses dessa sekvenser inte vara digrafer. Kyrilliska har få digrafer om det inte används för att skriva icke-slaviska språk, särskilt kaukasiska språk .
Arabisk skrift
Eftersom vokaler i allmänhet inte skrivs, är digrafer sällsynta i abjader som arabiska. Till exempel, om sh användes för š, kan sekvensen sh betyda antingen ša eller saha. Digrafer används dock för de aspirerade och mumlade konsonanterna (de som stavas med h- digrafer i latinsk transkription) på språk i Sydasien som urdu som är skrivna med arabisk skrift med en speciell form av bokstaven h , som endast används för aspirationsdigrafer, som kan ses med följande anslutande (kh) och icke-förbindande (ḍh) konsonanter:
Urdu ansluter icke-anslutande digrafera: کھا /kʰɑː/ ڈھا /ɖʱɑː/ sekvens: کہا /kəɦɑː/ ڈہا /ɖəɦɑː/
armeniska
På det armeniska språket transkriberar digrafen ու ⟨ou⟩ / u / , en konvention som kommer från grekiskan.
georgiska
Det georgiska alfabetet använder några få digrafer för att skriva andra språk. Till exempel, i Svan skrivs / ø/ ჳე ⟨we⟩ och /y/ som ჳი ⟨wi⟩.
grekisk
Modern grekiska har följande digrafier:
- αι ( ai ) representerar /e̞/
- ει ( ei ) representerar /i/
- οι ( oi ) representerar /i/
- ου ( oy ) representerar /u/
- υι ( yi ) representerar /i/
De kallas "diftonger" på grekiska ; i klassisk tid representerade de flesta av dem diftonger , och namnet har fastnat.
- γγ ( gg ) representerar /ŋɡ/ eller /ɡ/
- τσ ( ts ) representerar affrikatet /ts/
- τζ ( tz ) representerar affrikatet /dz/
- Initial γκ ( gk ) representerar /ɡ/
- Initial μπ ( mp ) representerar /b/
- Initial ντ ( nt ) representerar /d/
Forntida grekiska hade också "diftongerna" som anges ovan även om deras uttal i antiken är omtvistat. Dessutom använde antikgrekiska också bokstaven γ i kombination med ett velarstopp för att producera följande digrafer:
- γγ ( gg ) representerar /ŋɡ/
- γκ ( gk ) representerar /ŋɡ/
- γχ ( gkh ) representerar /ŋkʰ/
Tsakonian har några ytterligare digrafier:
- ρζ ( rz ) /ʒ/ (historiskt sett kanske en frikativ drill )
- κχ ( kkh ) representerar /kʰ/
- τθ ( tth ) representerar /tʰ/
- πφ ( pph ) representerar /pʰ/
- σχ ( skh ) representerar /ʃ/
Dessutom indikeras palatala konsonanter med vokalbokstaven ι , vilket dock till stor del är förutsägbart. När /n/ och /l/ inte är palataliserade före ι skrivs de νν och λλ .
I Bactrian användes digraferna ββ , δδ och γγ för /b/ , /d/ , respektive /ŋg/ .
hebreiska
י I det hebreiska alfabetet kan תs och תש ibland hittas för צ <a i=9> / / ts / . Modern hebreiska använder också digrafer gjorda med symbolen ' för icke-inhemska ljud: ג׳ <a i=17> / / dʒ / , ז׳ <a i=23> / / ʒ / , צ׳ <a i=29> / / tʃ / ; och andra digrafier av bokstäver när det skrivs utan vokaler: v för en konsonantbokstav ו i mitten av ett ord, och יי för /aj/ eller /aji/ , etc., det vill säga en konsonantbokstav <a i=43>י på platser där det kanske inte var väntat. Jiddisch har sin egen transkriptionstradition och använder därför olika digrafer för några av samma ljud: דז <a i=49> / / dz / , זש <a i=55> / / ʒ / , טש <a i=61> / / tʃ / , och jd (bokstavligen dzš ) för / dʒ / , w <a i=76> / / v / , även tillgängligt som ett enda Unicode- tecken v , וי eller som ett enstaka tecken i Unicode ױ <a i=87> / oj/ , יי eller ײ <a i=93> / ej/ , och ij <a i=97> / aj/ . Enteckendigraferna kallas " ligaturer " i Unicode. י kan också användas efter en konsonant för att indikera palatalisering i slaviska lånord.
Indic
De flesta indiska skrifter har sammansatta vokaldiakritiska tecken som inte kan förutsägas utifrån deras individuella element. Det kan illustreras med thailändska där diakritiken เ, uttalad ensam /eː/ , modifierar uttalet av andra vokaler:
enkelvokaltecken: กา /kaː/ , เก /keː/ , กอ /kɔː/ vokaltecken plus เ: เกา /kaw/ , แก /kɛː/ , เกอ /kɤː/
Dessutom uttalas kombinationen รร /a/ eller /an/ , det finns några ord där kombinationerna ทร och ศร står för /s/ och bokstaven ห, som prefix till en konsonant, ändrar dess toniska klass till hög, modifierar tonen i stavelsen.
Inuit
Inuktitut syllabics lägger till två digrafer till Cree:
- rk för q
- ᙯ qai , ᕿ qi , ᖁ qu , ᖃ qa , ᖅ q
och
- ng för ŋ
- ᖕ ng
Den senare bildar trigrafer och tetragrafer.
CJK-karaktärer
kinesiska
Flera kombinationer av kinesiska tecken (Hanzi) bildade av två eller flera olika tecken som kallas digrafer.
japanska
Två kana kan kombineras till en CV- stavelse genom att teckna den andra; konventionen upphäver vokalen för den första. Det görs vanligtvis för CyV- stavelser som kallas yōon , som i ひょ (ひ よ ) hyo ⟨hi yo ⟩. De är inte digrafer eftersom de behåller den normala sekventiella läsningen av de två glyferna. Vissa föråldrade sekvenser behåller dock inte längre den läsningen, som i くゎ kwa, ぐゎ gwa och むゎ mwa, nu uttalas ka, ga, ma . Dessutom används icke-sekvenserbara digrafer för utländska lån som inte följer normala japanska assibileringsmönster , såsom ティ ti , トゥ tu , チェ tye / che , スェ swe , ウィ wi , ツ ォ tso . (Se katakana och transkription till japanska för fullständiga tabeller.)
Långa vokaler skrivs genom att lägga till kana för den vokalen, i praktiken dubbla den. Långt ō kan dock skrivas antingen oo eller ou , som i とうきょう toukyou [toːkʲoː] 'Tōkyō'. För dialekter som inte skiljer ē och ei , används den senare stavningen för ett långt e , som i へいせい heisei [heːseː] ' Heisei '. I lånord, chōonpu , en rad som följer textens riktning, som i ビール bīru [bi:ru] bīru 'öl'. Med undantag för stavelser som börjar med n skrivs dubbla konsonantljud genom att prefixet en mindre version av tsu (skrivet っ och ッ i hiragana respektive katakana), som i きって kitte 'stamp'. Konsonanter som börjar med n använder tecknet kana n (skrivet ん eller ン) som prefix istället.
Det finns flera konventioner för Okinawan kana som involverar nedsänkta digrafer eller ligaturer. Till exempel, i University of the Ryukyus system är ウ /ʔu/ , ヲ är /o/ , men ヲゥ (ヲ ウ ) är /u/ .
koreanska
Som fallet var på grekiska har koreanska vokaler som härstammar från diftonger som fortfarande skrivs med två bokstäver. Dessa digrafer, ㅐ /ɛ/ och ㅔ /e/ (även ㅒ /jɛ/ , ㅖ /je/ ), och i vissa dialekter ㅚ /ø/ och ㅟ /y/ , slutar alla på historiska ㅣ /i/ .
Hangul designades med en digrafserie för att representera de " leriga " konsonanterna: ㅃ *[b] , ㄸ *[d] , ㅉ *[dz] , ㄲ *[ɡ] , ㅆ *[z] , ㆅ *[ɣ] ; även ᅇ, med ett osäkert värde. Dessa värden är nu föråldrade, men de flesta av de dubblerade bokstäverna återuppstod under 1800-talet för att skriva konsonanter som inte fanns när hangul uppfanns: ㅃ /p͈/ , ㄸ /t͈/ , ㅉ /t͈ɕ/ , ㄲ /k͈/ , ㅆ /s͈/ .
Ligaturer och nya bokstäver
Digrafer kommer ibland att skrivas som en enda ligatur. Med tiden kan ligaturerna utvecklas till nya bokstäver eller bokstäver med diakritiska tecken. Till exempel blev sz ß på tyska och "nn" blev ñ på spanska.
I Unicode
I allmänhet representeras en digraf helt enkelt med två tecken i Unicode . Men av olika anledningar tillhandahåller Unicode ibland en separat kodpunkt för en digraf, kodad som ett enda tecken.
DZ- och IJ -digraferna och de serbiska/kroatiska digraferna DŽ , LJ och NJ har separata kodpunkter i Unicode.
Två tecken Digraph Unicode kodpunkt HTML DZ, Dz, dz DZ, Dz, dz U+01F1 U+01F2 U+01F3 DZ Dz dz DŽ, Dž, dž DŽ, Dž, dž U+01C4 U+01C5 U+01C6 DŽ Dž dž IJ, ij IJ, ij U+0132 U+0133 IJ ij LJ, Lj, lj LJ, Lj, lj U+01C7 U+01C8 U+01C9 LJ Lj lj NJ, Nj, nj NJ, Nj, nj U+01CA U+01CB U+01CC NJ Nj nj th ᵺ U+1D7A
Se även Ligaturer i Unicode .
Se även
- Multigraf (ortografi)
- Trigraf
- Tetragraf
- Pentagraf
- Hexagraf
- Bigram
- Diftong
- Lista över latinska bokstäver
- Digraph (programmering)