ISO 639 makrospråk

Ett makrospråk är en bokföringsmekanism för den internationella standarden ISO 639 för språkkoder. Makrospråk upprättas för att underlätta kartläggning mellan olika uppsättningar av ISO-språkkoder. Specifikt kan det finnas en många-till-en-överensstämmelse mellan ISO 639-3 , avsedd att identifiera alla tusentals språk i världen, och endera av två andra uppsättningar, ISO 639-1 , etablerade för att identifiera språk i datorsystem, och ISO 639-2 , som kodar några hundra språk för bibliotekskatalogisering och bibliografiska ändamål. När sådana många-till-en ISO 639-2-koder ingår i en ISO 639-3-kontext kallas de "makrospråk" för att skilja dem från motsvarande enskilda språk i ISO 639-3. Enligt ISO,

Vissa befintliga kodelement i ISO 639-2, och motsvarande kodelement i ISO 639-1, betecknas i dessa delar av ISO 639 som individuella språkkodelement, men är ändå i ett en-till-många-förhållande med enskilda språkkodelement i [ISO 639-3]. För ändamålen med [ISO 639-3] anses de vara makrospråkskodelement.

ISO 639-3: Förhållandet mellan ISO 639-3 och de andra delarna av ISO 639

ISO 639-3 är kurerad av SIL International, ISO 639-2 är kurerad av Library of Congress (USA).

Kartläggningen har ofta innebörden att den täcker gränsfall där två språkvarieteter kan anses vara starkt divergerande dialekter av samma språk eller mycket närbesläktade språk ( dialektkontinuum) ; det kan också omfatta situationer när det finns språkvarianter som anses vara varieteter av samma språk på grund av etniska, kulturella och politiska överväganden snarare än språkliga skäl. Detta är dock inte dess primära funktion och klassificeringen tillämpas inte jämnt.

Till exempel är kinesiska ett makrospråk som omfattar många språk som inte är ömsesidigt begripliga, men språken " standardtyska ", " bayersk tyska " och andra närbesläktade språk bildar inte ett makrospråk, trots att de är mer ömsesidigt begripliga. Andra exempel inkluderar Tadzjiki som inte är en del av det persiska makrospråket trots att de delar mycket lexikon, och urdu och hindi bildar inte ett makrospråk trots att de bildar ett ömsesidigt begripligt dialektkontinuum . Även alla dialekter av hindi anses vara separata språk . I grund och botten använder ISO 639-2 och ISO 639-3 olika kriterier för att dela upp språkvarianter i språk, 639-2 använder delade skriftsystem och litteratur mer medan 639-3 fokuserar på ömsesidig förståelse och delat lexikon. Makrospråken finns inom ISO 639-3-koduppsättningen för att göra mappningen mellan de två uppsättningarna enklare.

Användningen av makrospråk tillämpades i Ethnologue , från och med den 16:e upplagan. Från och med 2020 finns det femtioåtta språkkoder i ISO 639-2 som räknas som makrospråk i ISO 639-3, men nya makrospråk skapas inte längre, eftersom nuvarande databaser är tillräckliga för att indikera sambanden mellan koder.

Vissa av makrospråken hade inget individuellt språk (enligt definitionen av 639-3) i ISO 639-2, t.ex. "ara" ( arabiska ), men ISO 639-3 känner igen olika varianter av arabiska som separata språk under vissa omständigheter. Andra, som "nor" ( norska ) hade sina två enskilda delar (nno nynorsk , nob bokmål ) redan 639-2. Det betyder att vissa språk (t.ex. "arb" standardarabiska ) som enligt ISO 639-2 ansågs vara dialekter av ett språk ("ara") nu är i ISO 639-3 i vissa sammanhang som själva anses vara enskilda språk. Detta är ett försök att ta itu med varieteter som kan vara språkligt skilda från varandra, men som av sina talare behandlas som former av samma språk, t.ex. i fall av diglossi . Till exempel,

  • Generisk arabiska, 639-2
  • Standard arabiska, 639-3

ISO 639-2 innehåller även koder för samlingar av språk; dessa är inte samma sak som makrospråk. Dessa samlingar av språk är undantagna från ISO 639-3, eftersom de aldrig refererar till enskilda språk. De flesta sådana koder ingår i ISO 639-5 .

Typer av makrospråk

  • element som inte har någon ISO 639-2-kod: 4 ( bnc , hbs , kln , luy )
  • element som inte har någon ISO 639-1-kod: 29
  • element som har ISO 639-1-koder: 33
  • element vars enskilda språk har ISO 639-1-koder: 4
    • aka tw
    • hbs bs , hr , sr
    • msa id
    • inte heller nb , nn

Lista över makrospråk

Denna lista innehåller endast officiella data från https://iso639-3.sil.org/code_tables/macrolanguage_mappings/data .

ISO 639-1 ISO 639-2 ISO 639-3 Antal enskilda språk Makrospråkets namn
ak aka aka 2 Akan språk
ar ara ara 29 + pensionerad 1 arabiskt språk
ja aym aym 2 Aymara språk
az aze aze 2 azerbajdzjanska språket
(-) bal bal 3 Baluchi språk
(-) bik bik 8 + pensionerad 1 Bikol språk
(-) (-) bnc 5 Bontok språk
(-) bua bua 3 Buriatiska språk
(-) chm chm 2 Marispråk (Ryssland)
cr cre cre 6 Cree språk
(-) del del 2 Delaware språk
(-) håla håla 2 slaviskt språk (Athapascan)
(-) dån dån 5 Dinka språk
(-) doi doi 2 Dogrispråk
et est est 2 estniska språket
fa fas/per fas 2 persiska språket
ff full full 9 Fula språk
(-) gba gba 6 + pensionerad 1 Gbaya-språket (Centralafrikanska republiken)
(-) gon gon 3 + pensionerad 1 Gondi språk
(-) grb grb 5 Grebo språk
gn grn grn 5 Guaraní språk
(-) hej hej 2 Haida språk
(-) (-) hbs 4 serbokroatiska
(-) hmn hmn 25 + pensionerad 1 Hmong språk
iu iku iku 2 Inuktitut språk
ik ipk ipk 2 Inupiaq språk
(-) jrb jrb 4 + pensionerad 1 Judeo-arabiska språk
kr kau kau 3 Kanuri språk
(-) (-) kln 9 Kalenjin språk
(-) kok kok 2 Konkani språk
kv kom kom 2 Komi språk
kg kon kon 3 Kongo språk
(-) kpe kpe 2 Kpelle språk
ku kur kur 3 kurdiska språket
(-) lah lah 7 + pensionerad 1 Lahnda språk
lv lav lav 2 lettiska språket
(-) (-) luy 14 Luyia språk
(-) man man 6 + pensionerad 1 Manding språk
mg mlg mlg 11 + pensionerad 1 Malagasiska språk
mn mån mån 2 mongoliska språket
Fröken msa/maj msa 36 + pensionerad 1 malaysiska språk
(-) mwr mwr 6 Marwari språk
ne nep nep 2 Nepalesiska språk
Nej inte heller inte heller 2 norska språket
oj oji oji 7 Ojibwa språk
eller ori ori 2 Oriya språk
om orm orm 4 Oromo språk
ps pus pus 3 Pashto språk
qu que que 43 + pensionerad 1 Quechua språk
(-) raj raj 6 Rajasthani språk
(-) rom rom 7 romskt språk
kvm sqi/alb sqi 4 albanska språket
sc srd srd 4 sardiska språket
sw swa swa 2 Swahili språk
(-) syr syr 2 syriska språket
(-) tmh tmh 4 Tuareg språk
uz uzb uzb 2 uzbekiska språk
yi yid yid 2 Jiddisch språk
(-) zap zap 58 + pensionerad 1 Zapotec språk
za zha zha 16 + pensionerad 2 Zhuang språk
Z H zho/chi zho 16 kinesiskt språk
(-) zza zza 2 Zaza språk
33 58 62 440 + pensionerad 14 totala koder
ISO 639-1 ISO 639-2 ISO 639-3 Antal enskilda språk Makrospråkets namn

Lista över makrospråk och de enskilda språken

Detta är en komplett lista över de individuella språkkoderna som utgör makrospråken i ISO 639-3-kodtabellerna från och med den 22 november 2022.

aaa–ezz

aka

aka är ISO 639-3 språkkoden för Akan . Dess ISO 639-1- kod är ak . Det finns två individuella språkkoder tilldelade:

ara

ara är ISO 639-3 språkkoden för arabiska . Dess ISO 639-1- kod är ar . Det finns tjugonio individuella språkkoder tilldelade:

Följande koder var tidigare en del av ara:

aym

aym är ISO 639-3 språkkoden för Aymara . Dess ISO 639-1- kod är ay . Det finns två individuella språkkoder tilldelade:

aze

aze är ISO 639-3 språkkoden för azerbajdzjanska . Dess ISO 639-1- kod är az . Det finns två individuella språkkoder tilldelade:

bal

bal är ISO 639-3 språkkoden för Baluchi . Det finns tre individuella språkkoder tilldelade:

bik

bik är ISO 639-3 språkkoden för Bikol . Det finns åtta individuella språkkoder tilldelade:

Följande kod var tidigare en del av bik:

  • bhk Albay Bicolano (Delad i Buhi'non Bikol [ubl], Libon Bikol [lbl], Miraya Bikol [rbl] och West Albay Bikol [fbl] den 18 januari 2010)

bnc

bnc är ISO 639-3 språkkoden för Bontok . Det finns fem individuella språkkoder tilldelade:

bua

bua är ISO 639-3 språkkoden för Buriat . Det finns tre individuella språkkoder tilldelade:

chm

chm är ISO 639-3 språkkoden för Mari , ett språk som finns i Ryssland . Det finns två individuella språkkoder tilldelade:

cre

cre är ISO 639-3 språkkoden för Cree . Dess ISO 639-1- kod är cr . Det finns sex individuella språkkoder tilldelade:

Dessutom finns det sex nära associerade individuella koder:

  • nsk Naskapi (del av Cree-språkgruppen men ingår inte under cre- makrospråksbeteckningen)
  • moe Montagnais (del av Cree-språkgruppen men ingår inte under cre- makrospråksbeteckningen)
  • atj Atikamekw (del av Cree-språkgruppen men ingår inte under cre- makrospråksbeteckningen)
  • crg Michif-språk ( Cree - franskt blandspråk med starka influenser från Ojibwe-språkgruppen och inte inkluderat under cre -makrospråksbeteckningen)
  • ojs Ojibwa, Severn (Ojibwa, Northern) (del av Ojibwa-språkgruppen med starka influenser från Cree-språkgruppen och inte inkluderad under cre -makrospråksbeteckningen)
  • ojw Ojibwa, västerländsk (del av Ojibwa-språkgruppen med starka influenser från Cree-språkgruppen och ingår inte under cre -makrospråksbeteckningen)

Dessutom finns det ett annat språk utan individuella koder som är nära associerade, men inte en del av, denna makrospråkskod:

del

del är ISO 639-3 språkkoden för Delaware . Det finns två individuella språkkoder tilldelade:

håla

den är ISO 639-3- språkkoden för Slave . Det finns två individuella språkkoder tilldelade:

dån

din är ISO 639-3 språkkoden för Dinka . Det finns fem individuella språkkoder tilldelade:

doi

doi är ISO 639-3 språkkoden för Dogri . Det finns två individuella språkkoder tilldelade:

est

est är ISO 639-3- språkkoden för estniska . Dess ISO 639-1- kod är et . Det finns två individuella språkkoder tilldelade:

faa–jzz

fas

fas är ISO 639-3 språkkoden för persiska . Dess ISO 639-1- kod är fa . Det finns två individuella språkkoder tilldelade:

full

ful är ISO 639-2 och ISO 639-3 språkkoden för Fulah (även stavat Fula). Dess ISO 639-1- kod är ff . Det finns nio individuella språkkoder tilldelade för sorter av Fulah:

gba

gba är ISO 639-3- språkkoden för Gbaya i Centralafrikanska republiken . Det finns sex individuella språkkoder tilldelade:

Följande kod var tidigare en del av gba:

  • mdo – sydvästra Gbaya (delad i sydvästra Gbaya [gso] (ny identifierare) och Gbaya-Mbodomo [gmm] den 14 januari 2008)

gon

gon är ISO 639-3- språkkoden för Gondi . Det finns tre individuella språkkoder tilldelade:

Följande kod var tidigare en del av gon:

  • ggo – Southern Gondi (Delad i [esg] Aheri Gondi och [wsg] Adilabad Gondi den 15 januari 2016)

grb

grb är ISO 639-3 språkkoden för Grebo . Det finns fem individuella språkkoder tilldelade:

grn

grn är ISO 639-3 språkkoden för Guarani . Dess ISO 639-1- kod är gn . Det finns fem individuella språkkoder tilldelade:

hej

hai är ISO 639-3 språkkoden för Haida . Det finns två individuella språkkoder tilldelade:

hbs

hbs är ISO 639-3- språkkoden för serbokroatiska . Det finns fyra individuella språkkoder tilldelade:

hmn

hmn är ISO 639-3 språkkoden för Hmong . Det finns tjugofem individuella språkkoder tilldelade:

Följande kod var tidigare en del av hmn:

  • blu – Hmong Njua (Delad i Hmong Njua [hnj] (ny identifierare), Chuanqiandian Cluster Miao [cqd], Horned Miao [hrm] och Small Flowery Miao [sfm] den 14 januari 2008)

iku

iku är ISO 639-3 språkkoden för Inuktitut . Dess ISO 639-1- kod är iu . Det finns två individuella språkkoder tilldelade:

ipk

ipk är ISO 639-3 språkkoden för Inupiaq . Dess ISO 639-1- kod är ik . Det finns två individuella språkkoder tilldelade:

jrb

jrb är ISO 639-3 språkkoden för judeo-arabiska . Det finns fyra individuella språkkoder tilldelade:

Följande kod var tidigare en del av jrb:

kaa–ozz

kau

kau är ISO 639-2 och ISO 639-3 språkkoden för Kanuri . Dess ISO 639-1- kod är kr . Det finns tre individuella språkkoder tilldelade i ISO 639-3 för varianter av Kanuri:

Det finns två andra relaterade språk som inte anses vara en del av makrospråket enligt ISO 639:

kln

kln är ISO 639-3 språkkoden för Kalenjin . Det finns nio individuella språkkoder tilldelade:

kok

kok är ISO 639-3 språkkoden för Konkani (makrospråk) . Det finns två individuella språkkoder tilldelade:

Båda språken kallas Konkani av sina respektive talare.

kom

kom är ISO 639-3 språkkoden för Komi . Dess ISO 639-1- kod är kv . Det finns två individuella språkkoder tilldelade:

kon

kon är ISO 639-3 språkkoden för Kongo . Dess ISO 639-1- kod är kg . Det finns tre individuella språkkoder tilldelade:

kpe

kpe är ISO 639-3 språkkoden för Kpelle . Det finns två individuella språkkoder tilldelade:

kur

kur är ISO 639-3 språkkoden för kurdiska . Dess ISO 639-1- kod är ku . Det finns tre individuella språkkoder tilldelade:

lah

lah är ISO 639-3 språkkoden för Lahnda . Det finns sju individuella språkkoder tilldelade.

Observera att lah inte inkluderar panjabi/punjabi ( pan ) .

Följande kod var tidigare en del av lah:

lav

lav är ISO 639-3 språkkoden för lettiska . Dess ISO 639-1-kod är lv . Det finns två individuella språkkoder tilldelade:

luy

luy är ISO 639-3 språkkoden för Luyia . Det finns fjorton individuella språkkoder tilldelade:

man

man är ISO 639-3 språkkoden för Mandingo . Det finns sex individuella språkkoder tilldelade:

Följande koder var tidigare en del av människan:

mlg

mlg är ISO 639-3 språkkoden för malagasiska . Dess ISO 639-1- kod är mg . Det finns elva individuella språkkoder tilldelade:

Följande koder var tidigare en del av mlg:

mån

mon är ISO 639-3- språkkoden för mongoliska . Dess ISO 639-1- kod är mn . Det finns två individuella språkkoder tilldelade:

msa

msa är ISO 639-3- språkkoden för malajiska (makrospråk) . Dess ISO 639-1- kod är ms . Det finns trettiosex individuella språkkoder tilldelade:

Följande kod var tidigare en del av msa:

  • mly – malajiska (individuellt språk) (delad i standardmalajiska [zsm], haji [hji], papuanska malajiska [pmy] och malajiska [zlm] den 18 februari 2008)

Dessutom finns det en individuell kod som inte ingår i detta makrospråk eftersom det är kategoriserat som ett historiskt språk :

mwr

mwr är ISO 639-3 språkkoden för Marwari . Det finns sex individuella språkkoder tilldelade:

nep

nep är ISO 639-3-språkkoden för nepali (makrospråk). Dess ISO 639-1- kod är ne . Det finns två individuella språkkoder tilldelade:

inte heller

inte heller ISO 639-3- språkkoden för norska . Dess ISO 639-1- kod är nr . Det finns två individuella språkkoder tilldelade:

oji

oji är ISO 639-3 språkkoden för Ojibwa . Dess ISO 639-1- kod är oj . Det finns sju individuella språkkoder tilldelade:

Dessutom finns det tre nära associerade individuella koder:

Dessutom finns det två andra språk utan individuella koder som är nära associerade, men inte en del av, denna makrospråkskod:

ori

ori är ISO 639-3-språkkoden för Oriya (makrospråk). Dess ISO 639-1-kod är eller . Det finns två individuella språkkoder tilldelade:

orm

orm är ISO 639-3 språkkoden för Oromo . Dess ISO 639-1- kod är om . Det finns fyra individuella språkkoder tilldelade:

paa–zzz

pus

pus är ISO 639-3 språkkoden för pashto . Dess ISO 639-1- kod är ps . Det finns tre individuella språkkoder tilldelade:

que

que är ISO 639-3 språkkoden för Quechua . Dess ISO 639-1- kod är qu . Det finns fyrtiotre individuella språkkoder tilldelade:

Följande kod var tidigare en del av que:

raj

raj är ISO 639-3 språkkoden för Rajasthani . Det finns sex individuella språkkoder tilldelade:

rom

rom är ISO 639-3 språkkoden för romska . Det finns sju individuella språkkoder tilldelade:

Dessutom finns det nio individuella koder som inte ingår i detta makrospråk men de är kategoriserade som blandade språk :

sqi

sqi är ISO 639-3 språkkoden för albanska . Dess ISO 639-1- kod är sq . Det finns fyra individuella språkkoder tilldelade:

srd

srd är ISO 639-3 språkkoden för sardiska . Dess ISO 639-1- kod är sc . Det finns fyra individuella språkkoder tilldelade:

swa

swa är ISO 639-3 språkkoden för swahili . Dess ISO 639-1- kod är sw . Det finns två individuella språkkoder tilldelade:

syr

syr är ISO 639-3- språkkoden för syriska . Det finns två individuella språkkoder tilldelade:

tmh

tmh är ISO 639-3 språkkoden för Tamashek . Det finns fyra individuella språkkoder tilldelade:

uzb

uzb är ISO 639-3 språkkoden för uzbekiska . Dess ISO 639-1- kod är uz . Det finns två individuella språkkoder tilldelade:

yid

yid är ISO 639-3- språkkoden för jiddisch . Dess ISO 639-1- kod är yi . Det finns två individuella språkkoder tilldelade:

zap

zap är ISO 639-3 språkkoden för Zapotec . Det finns femtioåtta individuella språkkoder tilldelade.

Följande koder var tidigare en del av zap:

  • ztc – Lachirioag Zapotec (Flyttad till Yatee Zapotec [zty] den 18 juli 2007)

Dessutom finns det en individuell kod som inte ingår i detta makrospråk eftersom det är kategoriserat som ett historiskt språk :

zha

zha är ISO 639-3- språkkoden för Zhuang . Dess ISO 639-1- kod är za . Det finns sexton individuella språkkoder tilldelade:

Följande koder var tidigare en del av zha:

  • ccx – Northern Zhuang (Delad i Guibian Zh [zgn], Liujiang Zh [zlj], Qiubei Zh [zqe], Guibei Zh [zgb], Youjiang Zh [zyj], Central Hongshuihe Zh [zch], Eastern Hongshuihe Zh [zeh] , Liuqian Zh [zlq], Yongbei Zh [zyb] och Lianshan Zh [zln]. den 14 januari 2008)
  • ccy – Södra Zhuang (Delad i Nong Zhuang [zhn], Yang Zhuang [zyg], Yongnan Zhuang [zyn], Zuojiang Zhuang [zzj] och Dai Zhuang [zhd] den 18 juli 2007)

zho

zho är ISO 639-3 språkkoden för kinesiska . Dess ISO 639-1- kod är zh . Det finns sexton individuella språkkoder tilldelade, varav de flesta egentligen inte är språk utan snarare grupper av sinitiska språk som kännetecknas av isoglosser :

Även om Dungan-språket ( dng ) är en dialekt av mandarin, är det inte listat under kinesiska i ISO 639-3 på grund av separat historisk och kulturell utveckling.

ISO 639 listar även koder för gammal kinesiska ( och ) och sen mellankinesiska ( ltc )). De är inte listade under kinesiska i ISO 639-3 eftersom de är kategoriserade som antika respektive historiska språk.

zza

zza är ISO 639-3 språkkoden för Zaza . Det finns två individuella språkkoder tilldelade:

Se även

externa länkar