rumänska alfabetet

rumänska alfabetet
Romanian alphabet.svg
Skripttyp
Tidsperiod
1860-talet – nutid
språk rumänska
Relaterade skript
Föräldrasystem
Unicode
delmängd av latin (U+0000...U+024F)
  Den här artikeln innehåller fonetiska transkriptioner i International Phonetic Alphabet (IPA) . För en introduktionsguide om IPA-symboler, se Hjälp:IPA . För skillnaden mellan [ ] , / / ​​och ⟨ ⟩, se IPA § parenteser och transkriptionsavgränsare .

Det rumänska alfabetet är en variant av det latinska alfabetet som används för att skriva det rumänska språket . Det är en modifiering av det klassiska latinska alfabetet och består av 31 bokstäver, varav fem (Ă, Â, Î, Ș och Ț) har modifierats från sina latinska original för språkets fonetiska krav:

Brev namn
A, a a
Ă, ă ă
Â, â î din a
B, b vara / bî
C, c ce / cî
D, d de / dî
E, e e
F, f ef / fe / fî
G, g ge / ghe / gî
H, h haș / ha / hî
Brev namn
jag, jag i
Î, î î din i
J, j je / jî
K, k ca / capa
L, l el / le / lî
M, m em / jag / mî
N, n sv / ne / nî
O, o o
P, sid pe / pî
Q, q chiu ( /ky/ )
Brev namn
R, r er / re / rî
S, s es / se / sî
Ș, ș șe / șî
T, t te / tî
Ț, ț țe / țî
U u u
V, v ve / vî
W, w dublu ve / dublu vî
X, x ics
Y, y jag grek
Z, z ze / zet / zed / zî

Bokstäverna Q ( chiu ), W ( dublu v ) och Y ( igrec eller i grec, som betyder "grekiska i") introducerades formellt i det rumänska alfabetet 1982, även om de hade använts tidigare. De förekommer endast i främmande ord och deras rumänska derivator, såsom kvasar , watt och yacht . Bokstaven K , även om den är relativt äldre, används också sällan och förekommer endast i egennamn och internationella neologismer som kilogram , broker , karate . Dessa fyra bokstäver uppfattas fortfarande som främmande, vilket förklarar deras användning i stilistiska syften med ord som nomenklatură (normalt nomenklatură , som betyder "nomenklatur", men ibland stavat med k istället för c om det hänvisas till medlemmar av den kommunistiska ledningen i Sovjetunionen och östblocksländerna, eftersom nomenklatura används på engelska).

I fall där ordet är ett direkt lån med diakritiska tecken som inte finns i alfabetet ovan, tenderar officiell stavning att gynna deras användning ( München , Angoulême etc., i motsats till användningen av Istanbul framför Istanbul ).

Bokstäver och deras uttal

Rumänsk stavning är mestadels fonemisk utan tysta bokstäver (men se i ). Tabellen nedan visar överensstämmelsen mellan bokstäver och ljud. Vissa av bokstäverna har flera möjliga läsningar, även om allofoner inte beaktas. När vokaler /i/ , /u/ , /e/ och /o/ ändras till sina motsvarande halvvokaler markeras detta inte skriftligt. Bokstäverna K, Q, W och Y förekommer endast i utländska lån; uttalet av W och Y och av kombinationen QU beror på ursprunget till ordet de förekommer i.

Brev Fonem Ungefärligt uttal
A a / a / a i "far"
Ă ă (a med breve ) / ə / a i "ovan"
 â (a med cirkumflex ) / ɨ / den nära centrala orundade vokalen som hörs, till exempel, i sista stavelsen i ordet roses för vissa engelsktalande
B b / b / b i "boll"
C c / k / c i "scan"
/ / ch i "schimpans" — om c förekommer före bokstäverna e eller i (men inte î ); i detta fall e och i vanligtvis inte i kombinationerna: cea ( cia i vissa lånord), cio , ciu och i ordslut ci om inte accentuerat
D d / d / d i "dans"
E e / e / e i "glad"
/e̯/ , /ɛ̯/ före a eller o — halvvokalisk /e/ ; om den inte föregås av en konsonant blir /j/ [ tveksam ]
/je/ , /jɛ/ ye i "ja" — i några gamla ord med initial e : este , el etc.
F f / f / f i "flagga"
G g / ɡ / g i "get"
/ d͡ʒ / g i "allmänt" — om g förekommer före bokstäverna e eller i (men inte î ); i det här fallet e och i vanligtvis inte i kombinationerna: gea ( gia i vissa lånord), gio ( geo i vissa lånord), giu och i ordslut gi om inte accentuerat
H h / h / ( [ h ] , [ ç ] , [ x ] ) ch på skotska "loch" eller h på engelska "ha!" eller mer vanligtvis en subtil blandning av de två (det vill säga, inte så guttural som den skotska sjön. )
(stum) inget uttal om h förekommer mellan bokstäverna c eller g och e eller i ( che, chi, ghe, ghi ) ; c och g är palataliserade
jag i / jag / jag i "maskin"
/ j / y i "ja"
/ʲ/ Indikerar palatalisering av föregående konsonant (när ordslut och obetonat, i vissa sammansättningar som oricum och i kombinationerna chia, chio, chiu, ghia, ghio, ghiu )
Î î (jag med cirkumflex ) / ɨ / Identiskt med Â, se ovan, används i början och slutet av ordet av etymologiska skäl, ex. "att lära" = "en învăța"; "att döda" = "en omorî"
J j / ʒ / är i "skatt"
K k / k / c i "scan" (palataliserad före e och i )
L l / l / jag i "halt"
M m / m / m i "munnen"
N n / n / n i "norr"
O o / o / o i "golvet"
/o̯/ , /ɔ̯/ före a — halvvokalisk /o/ ; om den inte föregås av en konsonant blir /w/
P sid / p / p i "spot"
Q q / k / k i "vattenkokare" ( qu uttalas /kw/ , /kv/ eller /kʲ/ )
R r / r / alveolär trill eller kran
S s / s / s i "låt"
Ș ș (s med komma ) * / ʃ / sh i "shopping"
T t / t / t i "sten"
Ț ț (t med komma ) * / t͡s / ts i "katter"
U u / u / du i "gruppen"
/ w / w i "ko"
/ y / Franska u eller tyska ü ( nära främre rundad vokal ) — i några lånord från franska: ecru, tul
V v / v / v i "vision"
W w / v / v i "vision"
/ w / w i "väst"
/ u / oj i "sked"
X x /ks/ x i "sex"
/ɡz/ x i "exempel"
Å å / j / y i "ja"
/ jag / jag i "maskin"
Z z / z / z i "dragkedja"

* Se Komma-nedan (ș och ț) kontra cedilla (ş och ţ) .

Särskilda bokstäver

Gatuskyltar före ( överst ) och efter 1993 ( längst ner ) i Bukarest , som visar de två olika stavningarna med samma namn

Rumänsk ortografi använder inte accenter eller diakritiska tecken – dessa är sekundära symboler som läggs till bokstäver (dvs. grundläggande glyfer ) för att ändra deras uttal eller för att skilja mellan ord. Det finns dock fem specialbokstäver i det rumänska alfabetet (associerade med fyra olika ljud) som bildas genom att modifiera andra latinska bokstäver; strängt taget fungerar dessa bokstäver som grundläggande glyfer i sig själva snarare än bokstäver med diakritiska tecken, men de kallas ofta för det senare.

Bokstaven â används uteslutande i mitten av ord; dess majuscule version förekommer endast i inskriptioner med stora bokstäver.

Att skriva bokstäverna ș och ț med en cedilla istället för ett kommatecken anses vara felaktigt av den rumänska akademin. Rumänska skrifter, inklusive böcker skapade för att lära barn att skriva, behandlar kommatecken och cedilla som en variant av typsnitt. Se Unicode och HTML nedan.

Î kontra Â

Bokstäverna î och â är fonetiskt och funktionellt identiska. Anledningen till att de båda används är historiska, vilket anger språkets latinska ursprung.

Under några decennier fram till en stavningsreform 1904 hade så många som fyra eller fem bokstäver använts för samma fonem ( â , ê , î , û och ibland ô ), enligt en etymologisk regel. Alla användes för att representera vokalen /ɨ/ , mot vilken de ursprungliga latinska vokalerna skrivna med cirkumflexer hade konvergerat. 1904 års reform såg bara två bokstäver kvar, â och î , vars val följde regler som ändrades flera gånger under 1900-talet.

Under första hälften av århundradet var regeln att använda î i ord-initial- och ordslutpositioner, och â överallt annars. Det fanns undantag som påtvingade användningen av î i interna positioner när ord kombinerades eller härleddes med prefix eller suffix. Till exempel skrevs adjektivet urît "ful" med î eftersom det härstammar från verbet a urî "att hata".

1953, under kommunisttiden , eliminerade den rumänska akademin bokstaven â och ersatte den med î överallt, inklusive namnet på landet, som skulle stavas Romînia . Den första bestämmelsen sammanföll med den officiella beteckningen av landet som en folkrepublik , vilket innebar att dess fulla titel var Republica Populară Romînă . En mindre stavningsreform 1964 förde tillbaka bokstaven â , men bara i stavningen av român "rumänska" och alla dess derivator, inklusive landets namn. Som sådan förknippas den socialistiska republiken som proklamerades 1965 med stavningen Republica Socialistă România .

Ceaușescus regerings fall beslutade den rumänska akademin att återinföra â från 1993 och framåt, genom att avbryta effekterna av 1953 års stavningsreform och i huvudsak återgå till 1904 års regler (med vissa skillnader). Flytten motiverades offentligt som rättelse antingen av ett kommunistiskt angrepp på traditionen, eller av ett sovjetiskt inflytande på den rumänska kulturen, och som en återgång till en traditionell stavning som bär märket av språkets latinska ursprung. Det politiska sammanhanget vid den tiden var dock att den rumänska akademin till stor del betraktades som en kommunistisk och korrupt institution - Nicolae Ceaușescu och hans fru Elena hade varit dess hedersmedlemmar, och medlemskapet hade kontrollerats av kommunistpartiet. Som sådan sågs stavningsreformen 1993 som ett försök från Akademien att bryta med sitt kommunistiska förflutna. Akademien bjöd in det nationella samfundet av lingvister såväl som utländska lingvister specialiserade på rumänska för att diskutera problemet; när dessa överväldigande motsatte sig stavningsreformen i häftiga ordalag, avfärdades deras ståndpunkt uttryckligen som alltför vetenskaplig.

Enligt 1993 års reform bygger valet mellan î och â alltså återigen på en regel som varken är strikt etymologisk eller fonologisk utan positionell och morfologisk. Ljudet stavas alltid som â , förutom i början och slutet av ord, där î ska användas istället. Undantag inkluderar egennamn där användningen av bokstäverna är fryst, vilken det än kan vara, och sammansatta ord, vars komponenter var för sig är föremål för regeln (t.ex. ne- + î ndemanatic ne î ndemanatic "klumpigt", inte * ne â ndemanatisk ). Undantaget gäller dock inte längre för ord avledda med suffix, i motsats till 1904 års norm; till exempel det som stavas urît efter 1904 blev urât efter 1993.

Även om reformen främjades som ett sätt att visa det latinska ursprunget till rumänska, är det statistiskt sett endast ett fåtal av orden som skrivs med â enligt 1993 års reform som faktiskt härrör från latinska ord som har ett a i motsvarande position. Faktum är att detta inkluderar ett stort antal ord som innehöll ett i i det latinska originalet och på liknande sätt skrivs med i i sina italienska eller spanska motsvarigheter. Exempel inkluderar rîu "flod", från latinets rivus (jämför spanska río ), nu skriven râu ; tillsammans med rîde < ridere , sîn < sinus , strînge < stringere , lumînare < luminaria , etc.

Medan stavningsnormen från 1993 är obligatorisk i rumänsk utbildning och officiella publikationer, och gradvis de flesta andra publikationer kom att använda den, finns det fortfarande individer, publikationer och förlag som föredrar den tidigare stavningsnormen eller ett eget blandat hybridsystem. Bland dem finns den veckovisa kulturtidningen Dilema Veche och dagstidningen Gazeta Sporturilor , medan vissa publikationer tillåter författare att välja endera stavningsnorm; dessa inkluderar România literară , tidskrift av Writers' Union of Rumänien , och förlag som Polirom . Ordböcker, grammatiker och andra språkliga verk har också publicerats med î och sînt långt efter 1993 års reform.

I slutändan är konflikten ett resultat av två olika språkligt baserade resonemang om hur man stavar /ɨ/ . Valet av â härrör från att a är den mest genomsnittliga eller centrala av de fem vokalerna (den officiella bulgariska romaniseringen använder samma logik och väljer a för ъ, vilket resulterar i att landets namn stavas Balgariya ; och även den europeiska portugisiska vokalen /ɐ/ för a som nämnts ovan), medan î är ett försök att välja den latinska bokstaven som mest intuitivt skriver ljudet /ɨ/ (likt hur polska använder bokstaven y ).

Komma nedan ( ș och ț ) kontra cedilla ( ş och ţ )

Även om den rumänska akademins standard föreskriver kommatecken nedan för ljuden /ʃ/ och /t͡s/ , används cedillavarianterna fortfarande i stor utsträckning. Många tryckta och onlinetexter använder fortfarande felaktigt " s med cedilla " och " t med cedilla ". Detta tillstånd beror på en initial brist på glyph-standardisering, förvärrad av bristen på datorfontstöd för varianterna med kommatecken nedan (se Unicode- avsnittet för detaljer).

Bristen på stöd för kommatecken har korrigerats i nuvarande versioner av större operativsystem: Windows Vista eller nyare, Linux-distributioner efter 2005 och för närvarande stödda macOS-versioner. I enlighet med EU:s uppdrag släppte Microsoft en teckensnittsuppdatering för att rätta till denna brist i Windows XP i början av 2007, strax efter att Rumänien gick med i Europeiska unionen.

Föråldrade bokstäver

Gamla Bukarest brunnslock inskrivet enligt den etymologiskt benägna stavningen på den tiden, som lyder BUCURESCI CANALISARE (som betyder Bukarest, avlopp ). Jämför med dagens BUCUREȘTI CANALIZARE .

Före stavningsreformen 1904 fanns flera tilläggsbokstäver med diakritiska tecken.

  • Vokaler:
    • ĭ i med breve indikerad halvvokal i som en del av rumänska diftonger och triftonger ia , ei , iei etc., eller ett sista, "viskade" ljud av den föregående palataliserade konsonanten, i ord som București ( /bu.kuˈreʃtʲ/ ), lupi ( /lupʲ/ – "vargar"), och greci ( /ɡret͡ʃʲ/ – "greker") - Bucurescĭ (den korrekta stavningen vid den tiden användes c istället för t , se -ești ), lupĭ , grecĭ , som den slaviska mjuka tecken . Det moldaviska kyrilliska alfabetet behöll de kyrilliska motsvarigheterna till denna bokstav, nämligen й och ь, men det avskaffades i det rumänska latinska alfabetet av okänd anledning. Genom att ersätta denna bokstav med ett enkelt i utan att göra några ytterligare ändringar blev det fonetiska värdet av bokstaven i tvetydigt; även infödda talare kan ibland uttala ord fel som toponymen Pecica (som har två stavelser, men ofta felaktigt uttalas med tre) eller namnet Mavrogheni (som har fyra stavelser, inte tre). Dessutom, i ett antal ord som subiect "ämne" och ziar "tidning", är uttalet av i som en vokal eller som en halvvokal olika bland talare.
    • ŭ u med breve användes endast i slutet av ett ord. Det var i huvudsak en latinsk motsvarighet till den slaviska backen som finns på språk som ryska. Outtalad i de flesta fall tjänade det till att indikera att den föregående konsonanten inte var palataliserad, eller att föregående i var vokalen [i] och inte bara en markör för palatalisering. När ŭ uttalades följde den efter en betonad vokal och stod för semivokal u , som i orden , , och meŭ , alla stavade idag utan breve. En gång frekvent finns den kvar idag i författaren Mateiu Caragiales namn – ursprungligen stavad Mateiŭ (det är inte specificerat om uttalet ska anta en version som han själv förmodligen aldrig använde, medan han i många upplagor fortfarande krediteras som Matei ). I andra namn togs bara brevet bort, samtidigt som uttalet av en semivokal u , som är fallet med BP Hasdeŭ , bevaras .
    • ĕ e med breve . Denna bokstav är nu ersatt med ă . Förekomsten av två bokstäver för ett ljud, schwa, hade ett etymologiskt syfte, som visar från vilken vokal ("a" eller "e") den ursprungligen härrörde. Till exempel împĕrat – "kejsare" (< Imperator ), vĕd – "jag ser" (<vedo), umĕr – "axel" (< humerus ), păsĕri – "fåglar" (< jfr passer ).
    • é / É — Latinsk liten/versal bokstav e med akut accent indikerade ett ljud som motsvarar antingen dagens rumänska diftong ea , eller med vissa ord, dagens rumänska bokstav e . Det skulle ursprungligen indikera ljudet av den rumänska bokstaven e när det uttalades som diftong ea i vissa rumänska regioner, t.ex. acéste (idag stavas aceste ) och céle (idag stavas cele ). Detta brev skulle ibland indikera ett härlett ord från ett rumänskt grundord som innehåller latinsk bokstav e , vilket är fallet med mirésă (i dag stavat mireasă ) härlett från myr . För andra ord skulle det ligga till grund för ett förhållande mellan ett rumänskt ord och ett latinskt ord som innehåller bokstaven e , där det rumänska ordet skulle använda é , som gréle (i dag stavas grele ) som kommer från latinska ordet grevis . Slutligen användes denna bokstav för att tillgodose ljudet som motsvarar dagens rumänska diftong ia , som i ordet ér ( iar idag). [ citat behövs ]
    • ó / Ó — latinsk liten/versal o med akut accent angav ett ljud som motsvarar dagens rumänska diftong oa . Detta brev skulle ibland indikera ett härlett ord från ett rumänskt grundord som innehåller latinsk bokstav o , som är fallet med popóre (i dag stavas popoare ) härlett från popor . Med andra ord skulle det ligga till grund för ett förhållande mellan ett rumänskt ord och ett latinskt ord som innehåller bokstaven o , där det rumänska ordet skulle använda ó , som fórte (i dag stavas foarte ) som kommer från latinska ordet forte . Slutligen användes denna bokstav för att tillgodose ljudet som motsvarar dagens rumänska diftong oa , som i ordet fóme ( skum idag). [ citat behövs ]
    • ê , û och ô — se Î kontra  avsnitt ovan.
  • Konsonanter
    • d̦ / D̦ — latinsk liten/versal bokstav d med kommatecken nedan användes för att ange det ljud som idag motsvarar den rumänska bokstaven z . Det skulle beteckna att ordet det tillhörde härrörde från latin och att dess motsvarande latinska bokstav var d . Exempel på ord som innehåller denna bokstav är: d̦ece ("tio"), d̦i ("dag") – som återspeglar dess härledning från det latinska ordet dies , Dumned̦eu ("Gud") – som återspeglar den latinska frasen Domine Deus , d̦ână ("fe" ) – kommer från det latinska ordet Diana . I dagens rumänska språk är denna bokstav inte längre närvarande och latinska bokstaven z används i stället. En parallell utveckling har skett i polska , som förvandlade d före en främre vokal ( i eller e ) till dz ; Rumänska tog sedan bort d:et för att lämna z . [ citat behövs ]

Dessutom användes den akuta accenten ( á , í ) i verbinfinitiver och imperfekta former i tredje person som betonades på sista stavelsen: lăudá ("berömma"), aud̦í ("höra"), 3:e persons imperfektum lăudá , aud̦iá . Den grava accenten ( à , ì , ù ) användes i 3:e persons perfekta former betonade på sista stavelsen: lăudà , aud̦ì .

Användningen av dessa bokstäver antogs inte helt ens före 1904, eftersom vissa publikationer (t.ex. Timpul och Universul ) valde att använda ett förenklat tillvägagångssätt som liknade dagens rumänska språkskrivning. [ citat behövs ]

Andra diakritiska tecken

Som med andra språk används den akuta accenten ibland i rumänska texter för att indikera den betonade vokalen i vissa ord. Denna användning är regelbunden i ordboksuppslag, men finns också ibland i noggrant redigerade texter för att disambiguera mellan homografer som inte också är homofoner , till exempel för att skilja mellan cópii ("kopior") och copíi ("barn"), éra ("eran") ") och erá ("var"), ácele ("nålarna") och acéle ("de"), etc. Accenten skiljer också mellan homografiska verbformer, såsom încúie och încuié ("han låser" och "han har låst").

Diakritiska tecken i vissa lån behålls: bourrée , pietà . Utländska namn stavas också vanligtvis med sina ursprungliga diakritiska tecken: Bâle , Molière , även när en akut accent kan felaktigt tolkas som en stress, som i István eller Gérard . Men ofta använda utländska namn, såsom namn på städer eller länder, stavas ofta utan diakritiska tecken: Bogota , Panama , Peru .

Digital typografi

ISO 8859

Utbredd felaktig användning av rumänska diakritiska tecken med exempel

Teckenkodningsstandarden ISO 8859 definierade initialt en enda teckentabell för hela Central- och Östeuropa — ISO 8859-2 . Denna teckentabell innehåller endast "s" och "t" med cedillas. Den sydösteuropeiska ISO 8859-16 inkluderar "s" och "t" med kommatecken under på samma ställen "s" och "t" med cedilla var i ISO 8859-2. ISO 8859-16-kodtabellen blev en standard efter att Unicode blev utbredd, men den ignorerades till stor del av programvaruleverantörer.

Unicode och HTML

De rumänska bokstäverna med cirkumflex och breve-accent var en del av Unicode- standarden sedan starten, liksom cedilla-varianterna av s och t. Ș och ț (varianter med kommatecken) lades till i Unicode version 3.0. Från Unicode version 3.0 till version 5.1 specificerades de cedilla-användande tecknen av Unicode Standard för att "användas i både turkiska och rumänska data" och att "en glyfvariant med kommatecken nedan är att föredra för rumänska"; På de nyligen kodade tecknen med kommatecken stod det att de skulle användas "när distinkt kommatecken under formuläret krävs". Unicode 5.2 säger uttryckligen att "formen med cedilla är att föredra på turkiska, och formen med kommatecken nedan är att föredra på rumänska", samtidigt som det nämns (möjligen av historiska skäl) att "på turkiska och rumänska, en cedilla och ett komma nedanför ibland ersätta varandra".

Utbredd användning hämmades under några år av bristen på typsnitt som gav de nya glyferna. I maj 2007, fem månader efter att Rumänien (och Bulgarien) gick med i EU , släppte Microsoft uppdaterade typsnitt som inkluderar alla officiella tecken i det rumänska (och bulgariska ) alfabetet. Den här teckensnittsuppdateringen riktade sig till Windows XP SP2, Windows Server 2003 och Windows Vista. Den delmängd av Unicode som stöds mest på Microsoft Windows-system, Windows Glyph List 4 , inkluderar fortfarande inte kommatecken nedanför varianterna av S och T.

Fonem Med kommatecken (officiellt) Med cedilla
Karaktär

Unicode- position (hexadecimal)
HTML-enhet Karaktär

Unicode- position (hexadecimal)
HTML-enhet
/ʃ/ Ș 0218 Ș eller Ș Ş 015E Ş eller Ş eller Ş
ș 0219 ș eller ș ş 015F ş eller ş eller ş
/t͡s/ Ț 021A Ț eller Ț Ţ 0162 Ţ eller Ţ eller Ţ
ț 021B ț eller ț ţ 0163 ţ eller ţ eller ţ

Vokaler med diakritiska tecken kodas enligt följande:

Fonem Karaktär

Unicode- position (hexadecimal)
HTML-enhet
/ə/ Ă 0102 Ă eller Ă eller Ă
ă 0103 ă eller ă eller ă
/ɨ/  00C2  eller  eller Â
â 00E2 â eller â eller â
Î 00 CE Î eller Î eller Î
î 00EE î eller î ​​eller î

Adobe/Linotype/Vista de facto standard

Inkonsekventa cedilla-glyfer i Adobe Caslon (vänster). Den korrekta rumänska renderingen (höger) kan erhållas genom att aktivera OpenType GSUB/latn/ROM/locl -funktionen, som mappar om s med cedilla-glyph till komma-nedan. Återgivningen till höger är visuellt omöjlig att skilja från renderingen som produceras av kommatecken nedanför kodpunkter för detta teckensnitt.

Adobe Systems beslutade att Unicode-glyferna "t with cedilla" U+0162/3 inte används på något språk. (Det används faktiskt, men på väldigt få språk. T med Cedilla finns som en del av Kamerunspråkens allmänna alfabet , i vissa gagauziska ortografier, på berberspråkets kabylska dialekt och möjligen på andra ställen.) Adobe har därför ersatt glyferna med "t med komma under" (U+021A/B) i alla teckensnitt som de skickar. Den olyckliga konsekvensen av detta beslut är att rumänska dokument som använder de (inofficiella) Unicode-punkterna U+015E/F och U+0162/3 (för ș och ț) renderas i Adobe-teckensnitt på ett visuellt inkonsekvent sätt med "s med cedilla" , men "t med kommatecken" (se figur). Linotype -teckensnitt som stöder rumänska glyfer följer oftast denna konvention.

Teckensnitten som introducerades av Microsoft i Windows Vista implementerar också denna de facto Adobe-standard. Få Microsoft-teckensnitt ger ett konsekvent utseende när cedilla-varianter används; Anmärkningsvärda är Tahoma , Verdana , Trebuchet MS , Microsoft Sans Serif och Segoe UI .

De gratis typsnitten DejaVu och Linux Libertine ger korrekta och konsekventa tecken i båda varianterna. Red Hats Liberation- teckensnitt stöder endast kommatecken nedan varianter som börjar med version 1.04, planerad att inkluderas i Fedora 10.


OpenType ROM/locl -funktion

Vissa OpenType- teckensnitt från Adobe och alla Vista-typsnitt i C-serien implementerar den valfria OpenType-funktionen GSUB/latn/ROM/locl . Denna funktion tvingar "s med cedilla" att renderas med samma glyf som "s med kommatecken under". När denna andra (men valfria) ommappning äger rum, renderas rumänsk Unicode-text med kommatecken nedan oavsett kodpunktsvarianter.

Tyvärr implementerar de flesta OpenType-teckensnitt från Microsoft pre-Vista ( Arial etc.) inte ROM/locl -funktionen, inte ens efter uppdateringen av Europeiska unionens expansionstypsnittsuppdatering, så gamla dokument kommer att se inkonsekventa ut som i den vänstra sidan av ovanstående figur. Välj ett fåtal typsnitt, t.ex. Verdana och Trebuchet MS , har inte bara ett konsekvent utseende för cedilla-varianter (efter EU-uppdateringen), utan gör också en samtidig ommappning av cedilla s och t till varianter under kommatecken när ROM/locl är aktiverat. De gratis typsnitten DejaVu och Linux Libertine erbjuder ännu inte den här funktionen i sina nuvarande utgåvor, men utvecklingsversioner gör det.

Pango stöder locl- taggen sedan version 1.17. XeTeX stöder locl sedan version 0.995. Från och med juli 2008 stöder väldigt få Windows-program funktionen locl . Från Adobe CS3 -sviten är det bara InDesign som har stöd för det.

Statusen för rumänskt stöd i de gratis typsnitt som levereras med Fedora bibehålls på Fedoraproject.org .

Kombinera karaktärer

Unicode tillåter också att diakritiska tecken representeras som separata kombinerade diakritiska tecken . De relevanta kombinationsaccenterna är U+0326 KOMBINERA KOMMA NEDEN och U+0327 KOMBINERA CEDILLA. Stöd för att applicera ett kombinerat komma nedan på bokstäverna S och T kan ha haft dåligt stöd i kommersiella teckensnitt tidigare, men nästan alla moderna teckensnitt kan framgångsrikt hantera både Cedilla- och Comma Below-märkena för S och T. Som med alla typsnitt, typografiska Kvaliteten kan variera, så det är att föredra att använda de enskilda kodpunkterna istället. Närhelst ett kombinerat diakritiskt tecken används i ett dokument, bör teckensnittet som används testas för att bekräfta att det återges acceptabelt.

(Latex

LaTeX tillåter typsättning på rumänska med cedilla Ş och Ţ med hjälp av Cork-kodningen . Varianterna nedanför kommatecken stöds inte helt i standard 8-bitars TeX-teckensnittskodningar. Avsaknaden av en standard LICR (LaTeX Internal Character Representations) för kommatecken nedanför Ș och Ț är en del av problemet. Inmatningsmetoden latin10 försöker lösa problemet genom att definiera \textcommabelow LICR-accenten. Detta stöds tyvärr inte av utf8- inmatningsmetoden.

Problemet kan delvis lösas i ett LaTeX-dokument med dessa inställningar, vilket skulle tillåta användning av ș, ț eller deras cedilla-varianter direkt i LaTeX-källan:

{ }{\textcommabelow t} % ţ \DeclareUnicodeCharacter{0162}{\textcommabelow T} % Ţ % translittererar utf8 kommatecken nedan till kommatecken nedan till representationen av kommatecken \DeclareUnicodeCharacter{0219}{\textcommabelow s} % code1}% code1code1 {\textcommabelow S} % Ș \DeclareUnicodeCharacter{021B}{\textcommabelow t} % ț \DeclareUnicodeCharacter{021A}{\textcommabelow T} % Ț

Paketet latin10 sammanställer teckenen under kommatecken genom att lägga ett kommatecken och bokstäverna S och T ovanpå. Denna metod är endast lämplig för utskrift. I PDF- dokument som skapats på detta sätt fungerar inte sökning eller kopiering av text korrekt. Den polska QX-kodningen har visst stöd för glyfer nedanför kommatecken, som är felaktigt mappade till cedilla LICRs, men saknar också A breve (Ă), som alltid måste vara sammansatt, och därmed osökbar.

I Latin Modern Type 1-teckensnitten finns T med kommatecken nedan under AGL-namnet /Tcommaaccent. Detta strider mot Adobes beslut som diskuterats ovan, som sätter ett T med kommatecken nedan vid /Tcedilla. Följaktligen kan ingen fast mappning fungera över alla typ 1-teckensnitt; varje typsnitt måste ha sin egen mappning. Tyvärr har TeX-utdatadrivrutiner, som dvips , dvipdfm eller pdfTeX: s interna PDF-drivrutin, åtkomst till glyferna efter AGL -namn. Eftersom alla utdatadrivrutiner som nämns inte är medvetna om denna egenhet, är problemet i huvudsak svårlöst för alla typsnitt. Följaktligen måste man använda typsnitt som inkluderar en mappning som inte förbigås av TeX. Detta är fallet med den nyare TeX-motorn XeTeX , som kan använda Unicode OpenType-teckensnitt, och som inte kringgår typsnittets Unicode-karta.

Tangentbordslayout

Moderna datoroperativsystem kan konfigureras för att implementera en vanlig rumänsk tangentbordslayout, för att tillåta att skriva på vilket tangentbord som helst som om det vore ett rumänskt tangentbord.

I system som Linux som använder XCompose-systemet kan rumänska bokstäver skrivas från en icke-rumänsk tangentbordslayout med hjälp av en skrivknapp . Systemets tangentbordslayout måste ställas in för att använda en skrivknapp. (Exakt hur detta åstadkoms beror på fördelningen.) Till exempel används den 'vänstra Alt'-tangenten ofta som en skrivknapp.

För att skriva en bokstav med ett diakritiskt tecken, hålls skrivtangenten nedtryckt medan en annan tangent skrivs, vilket indikerar det märke som ska användas, sedan skrivs grundbokstaven. Till exempel, när du använder en engelsk (amerikansk) tangentbordslayout för att producera ț, håll nere compose-tangenten medan du skriver semikolon ';', släpp sedan compose-tangenten och skriv 't'. Andra märken kan appliceras på liknande sätt enligt följande:

brev markeringsnyckel grundbokstav notera
ț ; t
ă U a shift-u för U
î ^ i skift-6 för ^

Stavningsalfabetet

Det finns en rumänsk motsvarighet till de engelskspråkiga stavningsalfabeten . De flesta av kodorden är personers förnamn, med undantag för K, J, Q, W och Y. Bokstäver med diakritiska tecken (Ă, Â, Î, Ș, Ț) sänds i allmänhet utan diakritiska tecken (A, A, I, S, T).

  Ord IPA (inofficiell)
A Ana /ˈa.na/
B Barbu /ˈbar.bu/
C Constantin /kon.stanˈtin/
D Dumitru /duˈmi.tru/
E Elena /eˈle.na/
F Florea /ˈflo.re̯a/
G Gheorghe /ˈɡe̯or.ɡe/
H Haralambie /ha.raˈlam.bi.e/
jag Jon /Jon/
J Jiu /ʒiw/
K kilogram /ki.loˈɡram/
L Lazăr /ˈla.zər/
M Maria /maˈri.a/
  Ord IPA (inofficiell)
N Nicolae /ni.koˈla.e/
O Olga /ˈol.ɡa/
P Petre /ˈpe.tre/
F F /ˈkju/
R Radu /ˈra.du/
S Sandu /ˈsan.du/
T Tudor /ˈtu.dor/
U Udrea /ˈu.dre̯a/
V Vasile /vaˈsi.le/
W dublu V /du.bluˈve/
X Xenia /ˈkse.ni.a/
Y jag grec /ˈi.ɡrek/
Z Zamfir /ˈzam.fir/

Se även

Anteckningar

Bibliografi

  • (på rumänska) Mioara Avram, Ortografie pentru toți , Editura Litera Internațional, 2002
  •   Unicode-konsortiet (2000). Unicode-standarden, version 3.0 . Boston: Addison-Wesley. ISBN 0-201-61633-5 .

externa länkar