Tvärserieberoenden

A diagram showing cross-serial dependency using lines and colors to represent the dependent pairs.
Ett schema som visar tvärseriella beroenden. Lägg märke till att w och v, som representerar ord, bildar respektive serie. Lägg också märke till att linjerna som representerar beroenderelationerna överlappar varandra.

Inom lingvistik uppstår tvärserieberoenden (även kallade korsningsberoenden av vissa författare) när linjerna som representerar beroenderelationerna mellan två serier av ord korsar varandra . De är av särskilt intresse för lingvister som vill bestämma det naturliga språkets syntaktiska struktur; språk som innehåller ett godtyckligt antal av dem är inte kontextfria . Genom detta faktum holländska och schweizisk-tyska visat sig vara icke-kontextfria.

Exempel

En schweizisk-tysk mening som innehåller tvärseriella beroenden (visas som linjer mellan verben och deras objekt). Den engelska översättningen med dess beroenden, som inte korsar varandra, visas för jämförelse.
Ett mer komplicerat exempel.

Eftersom schweizisk-tyska tillåter att verb och deras argument sorteras seriellt, har vi följande exempel, hämtat från Shieber:

... mer em Hans es huus hälfed aastriiche.
... vi Hans ( dat ) de hus ( enl ) hjälp måla.

Det vill säga "vi hjälper Hans att måla huset."

Lägg märke till att de sekventiella substantivfraserna em Hans ( Hans ) och es huus ( huset ), och de sekventiella verben hälfed ( hjälp ) och aastriiche ( måla ) båda bildar två separata serier av beståndsdelar. Lägg också märke till att dativverbet hälfed och ackusativverbet aastriiche tar dativen em Hans respektive ackusativ es huus som sina argument.

Icke-sammanhangsfrihet

Låt vara mängden av alla schweizisk-tyska meningar. Vi kommer att bevisa matematiskt att inte är kontextfri.

I schweizisk-tyska meningar måste antalet verb i ett grammatiskt kasus (dativ eller ackusativ) matcha antalet objekt i det kasus. Dessutom är en mening som innehåller ett godtyckligt antal sådana objekt tillåten (i princip). Därför kan vi definiera följande formella språk , en delmängd av :

Således har vi , där är det vanliga språket som definieras av
där den upphöjda plussymbolen betyder "en eller flera kopior". Eftersom uppsättningen av kontextfria språk är stängd under korsning med vanliga språk, behöver vi bara bevisa att inte är kontextfri (, s 130--135).

Efter en ordsubstitution har formen . Eftersom kan mappas till med följande karta: de sammanhangsfria språken är stängda under mappningar från terminalsymboler till terminalsträngar ( det vill säga en homomorfism ) (, s 130--135), behöver vi bara bevisa att inte är kontextfri.

icke -kontextfritt språk (, s. 128). Detta kan visas av Ogdens lemma .

Anta att språket genereras av en kontextfri grammatik, låt sedan vara den längd som krävs i Ogdens lemma, betrakta sedan ordet i språket och markera bokstäverna . Då kan inte alla de tre villkoren i Ogdens lemma vara uppfyllda.

Alla kända talade språk som innehåller tvärseriella beroenden kan på liknande sätt bevisas inte vara kontextfria.

Behandling

Forskning inom milt kontextkänsligt språk har försökt identifiera en smalare och mer beräkningsmässigt hanteringsbar underklass av sammanhangskänsliga språk som kan fånga kontextkänslighet som finns i naturliga språk. Till exempel kan tvärseriella beroenden uttryckas i linjära kontextfria omskrivningssystem (LCFRS); man kan skriva en LCFRS-grammatik för { a n b n c n d n | n ≥ 1} till exempel.