Ogdens lemma
I teorin om formella språk är Ogdens lemma (uppkallat efter William F. Ogden) en generalisering av det pumpande lemmat för sammanhangsfria språk .
Påstående
Ogdens lemma — Om ett språk genereras av en kontextfri grammatik, så finns det några så att med längd , och alla sätt att markera positioner för som "markerade", det finns en icketerminal och ett sätt att dela upp i 5 segment , så att
innehåller minst en markerad position.
innehåller högst markerade positioner.
innehåller båda markerade positioner, eller innehåller båda markerade positioner.
Vi kommer att använda understrykningar för att indikera "markerade" positioner.
Speciella fall
Ogdens lemma anges ofta i följande form, vilket kan erhållas genom att "glömma bort" grammatiken, och koncentrera sig på själva språket: Om ett språk L är sammanhangsfritt, så finns det något tal (där p kan vara en pumplängd eller inte) så att för alla strängar med längd minst p i L och alla sätt att "markera" p eller fler av positionerna i s , kan s skrivas som
med strängar u, v, w, x och y , så att
- vx har minst en markerad position,
- vwx har högst p markerade positioner, och
- för alla .
I det speciella fallet där varje position är markerad är Ogdens lemma likvärdigt med det pumpande lemmat för sammanhangsfria språk. Ogdens lemma kan användas för att visa att vissa språk inte är kontextfria i de fall det pumpande lemmat inte är tillräckligt. Ett exempel är språket .
Exempelapplikationer
Icke-sammanhangsfrihet
Det speciella fallet med Ogdens lemma är ofta tillräckligt för att bevisa att vissa språk inte är kontextfria. Till exempel, kontext- fritt språk (, s. 128).
Anta att språket genereras av en kontextfri grammatik, låt sedan vara den längd som krävs i Ogdens lemma, betrakta sedan ordet på språket. Då kan inte alla de tre villkoren i Ogdens lemma vara uppfyllda.
På liknande sätt kan man bevisa språket "kopiera två gånger" lemma på .
Och det givna exemplet sista avsnittet är inte kontextfri genom att använda Ogdens lemma på .
Inneboende tvetydighet
Ogdens lemma kan användas för att bevisa den inneboende tvetydigheten hos vissa språk, vilket antyds av titeln på Ogdens artikel.
Exempel : Låt . Språket är i sig tvetydigt. (Exempel från sida 3 i Ogdens tidning.)
Låt vara den pumplängd som behövs för Ogdens lemma, och tillämpa den på meningen .
Genom rutinkontroll av villkoren för Ogdens lemma finner vi att härledningen är
Således får vi en härledning av genom att interpolera härledningen med kopior av . Enligt denna härledning är en hel undermening är avkomling av en nod i härledningsträdet.
Symmetriskt kan vi få en annan härledning av enligt vilken det finns en hel undermening nod i härledningsträdet.
Eftersom eftersom ingen av dem innehåller den andra, de två härledningsträden är olika.
På liknande sätt är i sig tvetydig, och för alla CFG i språket, om vi låter vara konstanten för Ogdens lemma, finner vi att minst olika analyser. Således en obegränsad grad av inneboende tvetydighet.
Oavgörbarhet
Beviset kan utvidgas till att visa att det är oavgörbart att avgöra om en CFG i sig är tvetydig, genom att reducera till postkorrespondensproblemet . Det kan också visa att det inte går att avgöra om en CFG har en obegränsad grad av inneboende tvetydighet. (sida 4 i Ogdens tidning)
Med tanke på alla Post-korrespondensproblem över binära strängar, reducerar vi det till ett beslutsproblem över en CFG.
Givet två valfria listor av binära strängar och , skriv om det binära alfabetet till .
Låt vara språket över alfabetet , genererad av CFG med regler för varje . Definiera .
Nu, med samma argument som ovan, språket är i sig tvetydig om postkorrespondensproblemet har en lösning.
Och språket har en obegränsad grad av inneboende tvetydighet om postkorrespondensproblemet har en lösning.
Generaliserat tillstånd
Bader och Moura har generaliserat lemmat för att tillåta markering av vissa positioner som inte ska inkluderas i vx . Deras beroende av parametrarna förbättrades senare av Dömösi och Kudlek. Om vi betecknar antalet sådana exkluderade positioner med måste antalet d markerade positioner som vi vill inkludera några i vx uppfylla ) , där p är någon konstant som bara beror på språket. Påståendet blir att varje s kan skrivas som
med strängar u, v, w, x och y , så att
- vx har minst en markerad position och ingen exkluderad position,
- vwx har högst markerade positioner, och
- för alla .
Dessutom har antingen var och en av u,v,w en markerad position, eller var och en av har en markerad position.