Lexikalisk likhet
Inom lingvistik är lexikal likhet ett mått på i vilken grad orduppsättningarna för två givna språk är lika . En lexikal likhet på 1 (eller 100%) skulle innebära en total överlappning mellan ordförråd, medan 0 betyder att det inte finns några vanliga ord.
Det finns olika sätt att definiera den lexikala likheten och resultaten varierar därefter. Till exempel Ethnologue s beräkningsmetod i att jämföra en regionalt standardiserad ordlista (jämförbar med Swadesh-listan ) och räkna de former som uppvisar likhet i både form och betydelse. Genom att använda en sådan metod utvärderades engelska till att ha en lexikalisk likhet på 60 % med tyska och 27 % med franska .
Lexikalisk likhet kan användas för att utvärdera graden av genetisk relation mellan två språk. Procentandelar högre än 85 % indikerar vanligtvis att de två språken som jämförs sannolikt är relaterade dialekter .
Den lexikala likheten är bara en indikation på de två språkens ömsesidiga förståelighet , eftersom den senare också beror på graden av fonetisk, morfologisk och syntaktisk likhet. Variationerna på grund av olika ordlistor tynger detta. Till exempel är lexikallikheten mellan franska och engelska betydande inom lexikaliska områden som rör kultur, medan deras likhet är mindre när det gäller grundläggande (funktions)ord. Till skillnad från ömsesidig förståelse kan lexikal likhet endast vara symmetrisk.
Indoeuropeiska språk
Tabellen nedan visar några lexikaliska likhetsvärden för par av utvalda romanska, germanska och slaviska språk, som samlats in och publicerats av Ethnologue .
Lang. koda |
Språk 1 ↓ |
Lexikaliska likhetskoefficienter | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
katalanska | engelsk | franska | tysk | italienska | portugisiska | rumänska | romanska | ryska | sardiska | spanska | ||
katt | katalanska | 1 | - | 0,85 | - | 0,87 | 0,85 | 0,73 | 0,76 | - | 0,75 | 0,85 |
eng | engelsk | - | 1 | 0,27 | 0,60 | - | - | - | - | 0,24 | - | - |
fra | franska | 0,85 | 0,27 | 1 | 0,29 | 0,89 | 0,75 | 0,75 | 0,78 | - | 0,80 | 0,75 |
deu | tysk | - | 0,60 | 0,29 | 1 | - | - | - | - | - | - | - |
ita | italienska | 0,87 | - | 0,89 | - | 1 | - | 0,77 | 0,78 | - | 0,85 | 0,82 |
por | portugisiska | 0,85 | - | 0,75 | - | - | 1 | 0,72 | 0,74 | - | - | 0,89 |
ron | rumänska | 0,73 | - | 0,75 | - | 0,77 | 0,72 | 1 | 0,72 | - | 0,74 | 0,71 |
roh | romanska | 0,76 | - | 0,78 | - | 0,78 | 0,74 | 0,72 | 1 | - | 0,74 | 0,74 |
rus | ryska | - | 0,24 | - | - | - | - | - | - | 1 | - | - |
srd | sardiska | 0,75 | - | 0,80 | - | 0,85 | - | 0,74 | 0,74 | - | 1 | 0,76 |
spa | spanska | 0,85 | - | 0,75 | - | 0,82 | 0,89 | 0,71 | 0,74 | - | 0,76 | 1 |
katalanska | engelsk | franska | tysk | italienska | portugisiska | rumänska | romanska | ryska | sardiska | spanska | ||
Språk 2 → | katt | eng | fra | deu | ita | por | ron | roh | rus | srd | spa |
Anmärkningar:
- Språkkoder kommer från standarden ISO 639-3 .
- Roberto Bolognesi och Wilbert Heeringa fann att den genomsnittliga divergensen mellan sardiska och italienska var cirka 48,7 %, från en minsta dialektal divergensgrad på 46,6 % till den högsta på 51,1 %. Det skulle göra de olika dialekterna på sardiska något mer divergerande från italienska än spanska (med en genomsnittlig grad av avvikelse från italienska på cirka 46,0 %).
- "-" anger att jämförelsedata inte är tillgänglig.
- När det gäller engelsk-fransk lexikal likhet uppskattar åtminstone två andra studier antalet engelska ord som är direkt från franska till 28,3 % respektive 41 %, med respektive 28,24 % och 15 % av andra engelska ord härrörande från latin, vilket uttrycker engelska -Fransk lexikal likhet på cirka 0,56, med ömsesidigt lägre engelsk-tyska lexikala likheter. En annan studie uppskattar antalet engelska ord med kursivt ursprung till 51 %, i överensstämmelse med de två tidigare analyserna.
Se även
- Ethnologue.com (lexikaliska likhetsvärden tillgängliga på några av de enskilda språkposterna)
- Definition av lexikal likhet på Ethnologue.com
- Rensch, Calvin R. 1992. "Att beräkna lexikal likhet." I Eugene H. Casad (red.), Windows on bilingualism , 13-15. (Summer Institute of Linguistics och University of Texas i Arlington Publications in Linguistics, 110). Dallas: Summer Institute of Linguistics och University of Texas i Arlington.
Anteckningar
- ^ "Om etnologen" . Etnolog . 2012-09-25 . Hämtad 2019-02-24 .
- ^ Se till exempel lexikaliska likhetsdata för franska , tyska , engelska
- ^ a b "Bolognesi, Roberto; Heeringa, Wilbert. Sardegna fra tante lingue , pp.123, 2005, Condaghes" (PDF) . Arkiverad från originalet (PDF) 2014-02-11 . Hämtad 2017-04-14 .
- ^ Finkenstaedt, Thomas; Dieter Wolff (1973). Beställde överflöd; studier i ordböcker och engelska lexikonet . C. Vinter. ISBN 3-533-02253-6 .
- ^ "Joseph M. Willams, ursprunget till det engelska språket på" . Amazon.com . Hämtad 2010-04-21 .
- ^ Nation, ISP (2001). Lära sig ordförråd på ett annat språk . Cambridge University Press. sid. 477. ISBN 0-521-80498-1 .
externa länkar
- Mest liknande språk
- A Similarity Database of Modern Lexicons : Lexikal likhet mellan 331 språk