Evolutionär spelteori
Evolutionär spelteori ( EGT ) är tillämpningen av spelteori på utvecklande populationer inom biologi . Den definierar ett ramverk av tävlingar, strategier och analyser som darwinistisk konkurrens kan modelleras in i. Det uppstod 1973 med John Maynard Smith och George R. Prices formalisering av tävlingar, analyserade som strategier, och de matematiska kriterier som kan användas för att förutsäga resultaten av konkurrerande strategier.
Evolutionär spelteori skiljer sig från klassisk spelteori genom att fokusera mer på dynamiken i strategiförändring. Detta påverkas av frekvensen av de konkurrerande strategierna i befolkningen.
Evolutionär spelteori har hjälpt till att förklara grunden för altruistiska beteenden i darwinistisk evolution . Det har i sin tur blivit intressant för ekonomer , sociologer , antropologer och filosofer .
Historia
Klassisk spelteori
Klassisk icke-kooperativ spelteori skapades av John von Neumann för att bestämma optimala strategier i tävlingar mellan motståndare. En tävling involverar spelare, som alla har ett val av drag. Spel kan vara en enda omgång eller repetitiva. Det tillvägagångssätt som en spelare använder när de gör sina drag utgör deras strategi. Regler styr resultatet för de drag som spelarna tar, och utfall ger utdelning för spelarna; regler och resulterande utdelningar kan uttryckas som beslutsträd eller i en utdelningsmatris . Klassisk teori kräver att spelarna gör rationella val. Varje spelare måste överväga den strategiska analys som deras motståndare gör för att göra sina egna val av drag.
Problemet med ritualiserat beteende
Evolutionär spelteori började med problemet hur man förklarar ritualiserat djurbeteende i en konfliktsituation; "Varför är djur så 'gentlemanly eller ladylike' i tävlingar om resurser?" De ledande etologerna Niko Tinbergen och Konrad Lorenz föreslog att ett sådant beteende existerar till förmån för arten . John Maynard Smith ansåg att det var oförenligt med darwinistiskt tänkande, där urval sker på individnivå, så egenintresse belönas samtidigt som man inte söker det gemensamma bästa. Maynard Smith, en matematisk biolog, vände sig till spelteorin som föreslagits av George Price, även om Richard Lewontins försök att använda teorin hade misslyckats.
Anpassa spelteori till evolutionära spel
Maynard Smith insåg att en evolutionär version av spelteorin inte kräver att spelarna agerar rationellt – bara att de har en strategi. Resultaten av ett spel visar hur bra den strategin var, precis som evolutionen testar alternativa strategier för förmågan att överleva och fortplanta sig. Inom biologi är strategier genetiskt nedärvda egenskaper som styr en individs handlingar, analogt med datorprogram. Framgången för en strategi bestäms av hur bra strategin är i närvaro av konkurrerande strategier (inklusive sig själv), och av hur ofta dessa strategier används. Maynard Smith beskrev sitt arbete i sin bok Evolution and the Theory of Games .
Deltagarna strävar efter att producera så många kopior av sig själva som de kan, och utdelningen är i konditionsenheter (relativt värde för att kunna reproducera). Det är alltid ett flerspelarspel med många konkurrenter. Reglerna inkluderar replikatordynamik, med andra ord hur de bättre spelarna kommer att skapa fler repliker av sig själva i befolkningen och hur de mindre passformade kommer att tas bort , i en replikatorekvation . Replikatordynamiken modellerar ärftlighet men inte mutation, och antar asexuell reproduktion för enkelhetens skull. Spelen körs upprepade gånger utan villkor. Resultaten inkluderar dynamiken i förändringar i befolkningen, framgången med strategier och alla uppnådda jämviktstillstånd. Till skillnad från klassisk spelteori väljer spelare inte sin strategi och kan inte ändra den: de föds med en strategi och deras avkommor ärver samma strategi.
Evolutionära spel
Modeller
Evolutionär spelteori omfattar darwinistisk evolution, inklusive konkurrens (spelet), naturligt urval (replikatordynamik) och ärftlighet. Evolutionär spelteori har bidragit till förståelsen av gruppurval , sexuellt urval , altruism , föräldravård , samevolution och ekologisk dynamik. Många kontraintuitiva situationer inom dessa områden har satts på en fast matematisk grund genom användningen av dessa modeller.
Det vanliga sättet att studera den evolutionära dynamiken i spel är genom replikatorekvationer . Dessa visar tillväxthastigheten för andelen organismer som använder en viss strategi och den hastigheten är lika med skillnaden mellan den genomsnittliga utdelningen för den strategin och den genomsnittliga utdelningen för befolkningen som helhet. Kontinuerliga replikatorekvationer förutsätter oändliga populationer, kontinuerlig tid , fullständig blandning och att strategier föder sanna. Vissa atttraktorer (alla globala asymptotiskt stabila fixpunkter) av ekvationerna är evolutionärt stabila tillstånd . En strategi som kan överleva alla "mutanta" strategier anses evolutionärt stabil. I samband med djurbeteende betyder detta vanligtvis att sådana strategier är programmerade och starkt påverkade av genetik , vilket gör att alla spelare eller organismers strategi bestäms av dessa biologiska faktorer.
Evolutionära spel är matematiska objekt med olika regler, utdelningar och matematiska beteenden. Varje "spel" representerar olika problem som organismer måste hantera, och de strategier de kan anta för att överleva och föröka sig. Evolutionära spel får ofta färgglada namn och omslagsberättelser som beskriver den allmänna situationen för ett visst spel. Representativa lekar inkluderar hökduva , utmattningskrig , svensexa , producent-scrounger , tragedi av allmänningen och fångens dilemma . Strategier för dessa spel inkluderar hök, duva, bourgeois, prober, avhoppare, bedömare och repressalier. De olika strategierna tävlar under det speciella spelets regler, och matematiken används för att bestämma resultat och beteenden.
Hökduva
Det första spelet som Maynard Smith analyserade är det klassiska hökduvaspelet . Det var tänkt att analysera Lorenz och Tinbergens problem, en tävling om en delbar resurs. De tävlande kan vara antingen en hök eller en duva. Dessa är två undertyper eller morfer av en art med olika strategier. Höken visar först aggression och eskalerar sedan till en kamp tills den antingen vinner eller skadas (förlorar). Duvan visar först aggression, men om den ställs inför stora eskalering springer den för säkerhets skull. Om duvan inte möter en sådan eskalering försöker duvan dela resursen.
möter hök | möter duva | |
om hök | V/2 − C/2 | V |
om duva | 0 | V/2 |
Med tanke på att resursen ges värdet V, ges skadan från att förlora en kamp kostnad C:
- Om en hök möter en duva, får höken hela resursen V
- Om en hök möter en hök, halva tiden vinner de, halva tiden förlorar de, så det genomsnittliga resultatet är då V/2 minus C/2
- Om en duva möter en hök, kommer duvan att backa och få ingenting – 0
- Om en duva möter en duva, delar både resursen och får V/2
Den faktiska utdelningen beror dock på sannolikheten att träffa en hök eller duva, vilket i sin tur är en representation av andelen hökar och duvor i befolkningen när en viss tävling äger rum. Det i sin tur bestäms av resultaten från alla tidigare tävlingar. Om kostnaden för att förlora C är större än värdet av att vinna V (den normala situationen i den naturliga världen) slutar matematiken i en evolutionärt stabil strategi (ESS), en blandning av de två strategierna där populationen av hökar är V/C . Populationen går tillbaka till denna jämviktspunkt om några nya hökar eller duvor gör en tillfällig störning i populationen. Lösningen med hökduvaspelet förklarar varför de flesta djurtävlingar endast involverar rituella stridsbeteenden i tävlingar snarare än direkta strider. Resultatet beror inte alls på " artens bra " beteenden som föreslagits av Lorenz, utan enbart på implikationen av handlingar av så kallade själviska gener .
Utmattningskrig
I hökduvaspelet är resursen delbar, vilket ger utdelning till båda duvorna som möts i en parvis tävling. Där resursen inte är delbar, men en alternativ resurs kan vara tillgänglig genom att backa och försöka någon annanstans, är rena hök- eller duvastrategier mindre effektiva. Om en resurs som inte går att dela kombineras med en hög kostnad för att förlora en tävling (skada eller möjlig dödsfall) minskar både hök- och duvavinsten ytterligare. En säkrare strategi med lägre kostnad att visa, bluffa och vänta på att vinna är då genomförbar – en bluffarstrategi. Spelet blir då ett av ackumulerande kostnader, antingen kostnaderna för att visa eller kostnaderna för långvarigt olöst engagemang. Det är faktiskt en auktion; vinnaren är den tävlande som kommer att svälja den högre kostnaden medan förloraren får samma kostnad som vinnaren men ingen resurs. Den resulterande evolutionära spelteorin matematik leder till en optimal strategi för tidsinställd bluffning.
Detta beror på att i utmattningskriget är varje strategi som är orubblig och förutsägbar instabil, eftersom den i slutändan kommer att ersättas av en mutantstrategi som bygger på det faktum att den bäst kan den befintliga förutsägbara strategin genom att investera ett extra litet delta av väntande resurs för att säkerställa att den vinner. Därför kan bara en slumpmässig oförutsägbar strategi behålla sig själv i en population av bluffare. De tävlande väljer i själva verket en acceptabel kostnad som ska uppstå relaterad till värdet av den resurs som söks, och lägger faktiskt ett slumpmässigt bud som en del av en blandad strategi (en strategi där en tävlande har flera, eller till och med många, möjliga åtgärder i sin strategi ). Detta implementerar en fördelning av bud för en resurs med specifikt värde V, där budet för en specifik tävling väljs slumpmässigt från den fördelningen. Fördelningen (ett ESS) kan beräknas med hjälp av Bishop-Cannings-teoremet , som gäller för alla ESS med blandad strategi. Distributionsfunktionen i dessa tävlingar bestämdes av Parker och Thompson till:
Resultatet är att den kumulativa populationen av slutande för en viss kostnad m i denna "blandade strategi"-lösning är:
som visas i grafen intill. Den intuitiva känslan av att större värden av eftersökta resurser leder till längre väntetider bekräftas. Detta observeras i naturen, som hos manliga dyngflugor som tävlar om parningsställen, där tidpunkten för urkoppling i tävlingar är som förutspått av evolutionsteorin matematik.
Asymmetrier som tillåter nya strategier
I utmattningskriget får det inte finnas något som signalerar storleken på ett bud till en motståndare, annars kan motståndaren använda köet i en effektiv motstrategi. Det finns dock en mutantstrategi som kan bli bättre på att bluffa i utmattningskrigsspelet om en lämplig asymmetri existerar, den borgerliga strategin. Bourgeois använder en asymmetri av något slag för att bryta dödläget. I naturen är en sådan asymmetri innehav av en resurs. Strategin är att spela en hök om den är i besittning av resursen, men att visa och sedan dra sig tillbaka om den inte är i besittning. Detta kräver större kognitiv förmåga än hök, men borgerlighet är vanligt i många djurtävlingar, som i tävlingar bland bönsyrsräkor och bland fläckiga träfjärilar .
Socialt beteende
Spel som hökduva och utmattningskrig representerar ren konkurrens mellan individer och har inga åtföljande sociala element. Där sociala influenser gäller har konkurrenter fyra möjliga alternativ för strategisk interaktion. Detta visas i figuren intill, där ett plustecken representerar en förmån och ett minustecken representerar en kostnad.
- I en kooperativ eller ömsesidig relation är både "givare" och "mottagare" nästan omöjliga att särskilja eftersom båda får en fördel i spelet genom att samarbeta, dvs paret befinner sig i en spelmässig situation där båda kan vinna genom att utföra en viss strategi, eller alternativt måste båda agera tillsammans på grund av några omfattande begränsningar som effektivt sätter dem "i samma båt".
- I ett altruistiskt förhållande ger givaren, till en kostnad för sig själv, en fördel för mottagaren. I det allmänna fallet kommer mottagaren att ha en anhörigrelation till givaren och donationen är enkelriktad. Beteenden där förmåner doneras alternativt (i båda riktningarna) till en kostnad kallas ofta för "altruistiska", men vid analys kan sådan "altruism" ses uppstå från optimerade "egoistiska" strategier.
- Trots är i grunden en "omvänd" form av altruism där en allierad får hjälp genom att skada den allierades konkurrenter. Det allmänna fallet är att den allierade är anhörig relaterad och fördelen är en lättare konkurrensmiljö för den allierade. Notera: George Price, en av de tidiga matematiska modellerarna av både altruism och trots, fann denna likvärdighet särskilt störande på en känslomässig nivå.
- Själviskhet är grundkriteriet för alla strategiska val ur ett spelteoretiskt perspektiv – strategier som inte syftar till självöverlevnad och självreplikering är inte långa för något spel. Kritiskt sett påverkas dock denna situation av det faktum att konkurrensen äger rum på flera nivåer – det vill säga på genetisk, individuell och gruppnivå.
Tävlingar av själviska gener
Vid första anblicken kan det tyckas att deltagarna i evolutionära spel är de individer som finns i varje generation som direkt deltar i spelet. Men individer lever bara genom en spelcykel, och istället är det strategierna som verkligen tävlar med varandra under varaktigheten av dessa många generationers spel. Så det är i slutändan gener som spelar ut en hel tävling – själviska strategigener. De tävlande generna finns hos en individ och i viss mån hos alla individens släktingar. Detta kan ibland djupt påverka vilka strategier som överlever, särskilt med frågor om samarbete och avhopp. William Hamilton , känd för sin teori om anhörigval , utforskade många av dessa fall med hjälp av spelteoretiska modeller. Släktrelaterad behandling av speltävlingar hjälper till att förklara många aspekter av beteendet hos sociala insekter , det altruistiska beteendet i förälder-avkomma-interaktioner, ömsesidigt skyddsbeteenden och kooperativ vård av avkommor . För sådana spel definierade Hamilton en utökad form av fitness – inkluderande fitness , som inkluderar en individs avkomma såväl som eventuella avkommor som hittats i släkt.
Matematik för urval av anhöriga |
---|
Konceptet med anhörigval är att:
Konditionen mäts i förhållande till den genomsnittliga befolkningen; till exempel, fitness=1 betyder tillväxt i genomsnittstakten för befolkningen, kondition < 1 betyder att ha en minskande andel i befolkningen (dö ut), kondition > 1 betyder en ökande andel i befolkningen (ta över). Den inkluderande lämpligheten för en individ w i är summan av dess specifika lämplighet för sig själv a i plus den specifika lämpligheten för varje relativ viktad av graden av släktskap som motsvarar summan av alla r j *b j .... ... där r j är släktskap med en specifik släkting och b j är den specifika släktingens kondition – vilket ger: Om individ a i offrar sin "egen genomsnittliga ekvivalenta kondition på 1" genom att acceptera en fitnesskostnad C, och sedan för att "få tillbaka den förlusten", måste w i fortfarande vara 1 (eller större än 1)...och använda R* B för att representera summeringsresultaten i:
|
Hamilton gick utöver släktskap för att arbeta med Robert Axelrod , och analyserade samarbetsspel under förhållanden som inte involverade anhöriga där ömsesidig altruism kom in i bilden.
Eusocialitet och anhörigval
Eusociala insektsarbetare förlorar reproduktiva rättigheter till sin drottning. Det har föreslagits att släktval, baserat på dessa arbetares genetiska sammansättning, kan predisponera dem för altruistiska beteenden. De flesta eusociala insektssamhällen har haplodiploid sexuell bestämning, vilket innebär att arbetare är ovanligt nära släkt.
Denna förklaring av insekts eussocialitet har dock ifrågasatts av ett fåtal högt uppmärksammade evolutionära spelteoretiker (Nowak och Wilson) som har publicerat en kontroversiell alternativ spelteoretisk förklaring baserad på en sekventiell utveckling och gruppselektionseffekter som föreslagits för dessa insektsarter.
Fångens dilemma
En svårighet i evolutionsteorin, som Darwin själv erkände, var problemet med altruism . Om grunden för urval är på individnivå, är altruism ingen mening alls. Men det universella urvalet på gruppnivå (för artens bästa, inte individens) klarar inte testet av spelteorin i matematik och är verkligen inte det allmänna fallet i naturen. Ändå finns det ett altruistiskt beteende hos många sociala djur. Lösningen på detta problem kan hittas i tillämpningen av evolutionär spelteori på fångens dilemmaspel – ett spel som testar fördelarna med att samarbeta eller avbryta samarbetet. Det är det mest studerade spelet i hela spelteorin.
Analysen av fångens dilemma är som ett repetitivt spel. Detta ger konkurrenter möjligheten att hämnas för avhopp i tidigare omgångar av spelet. Många strategier har testats; de bästa konkurrensstrategierna är allmänt samarbete, med en reserverad vedergällning vid behov. Den mest kända och en av de mest framgångsrika av dessa är tit-for-tat med en enkel algoritm.
def tit_for_tat ( last_move_by_opponent ): """Defekt om motståndaren defektar, annars samarbeta.""" if last_move_by_opponent == defekt : defekt ( ) else : cooperate ()
Utdelningen för varje enskild omgång av spelet definieras av utdelningsmatrisen för en spelomgång (visas i stapeldiagram 1 nedan). I spel med flera omgångar kan de olika valen – samarbeta eller defekta – göras i vilken omgång som helst, vilket resulterar i en viss utdelning. Det är dock de möjliga ackumulerade vinsterna under de multipla omgångarna som räknas i utformningen av de övergripande vinsterna för olika strategier i flera omgångar som tit-for-tat.
Exempel 1: Det enkla spelet med fångars dilemma i en omgång. Det klassiska fångdilemmaspelets utdelning ger en spelare maximal utdelning om de hoppar av och deras partner samarbetar (detta val kallas frestelse ). Om spelaren däremot samarbetar och deras partner defekt, får de det sämsta möjliga resultatet (suckers payoff). Under dessa utdelningsförhållanden är det bästa valet (en Nash-jämvikt ) att defektera.
Exempel 2: Prisoner's dilemma spelade upprepade gånger. Strategin som används är tit-for-tat som förändrar beteenden baserat på de åtgärder som en partner vidtog i föregående omgång – dvs. belöna samarbete och straffa avhopp. Effekten av denna strategi i ackumulerad utdelning under många omgångar är att ge en högre utdelning för båda spelarnas samarbete och en lägre utdelning för avhopp. Detta tar bort frestelsen att hoppa av. Suckers payoff blir också mindre, även om "invasion" av en ren avhoppningsstrategi inte helt elimineras.
Vägar till altruism
Altruism äger rum när en individ, till en kostnad (C) för sig själv, utövar en strategi som ger en fördel (B) till en annan individ. Kostnaden kan bestå av en förlust av förmåga eller resurs som hjälper till i kampen för överlevnad och reproduktion, eller en extra risk för sin egen överlevnad. Altruismstrategier kan uppstå genom:
Typ | Gäller för: | Situation | Matematisk effekt |
---|---|---|---|
Anhörigval – (inklusive fitness för relaterade tävlande) | Kin – genetiskt relaterade individer | Evolutionära speldeltagare är gener av strategi. Den bästa utdelningen för en individ är inte nödvändigtvis den bästa utdelningen för genen. I alla generationer finns spelargenen inte bara i en individ, den är i en släktgrupp. Den högsta konditionsutdelningen för anhöriggruppen väljs ut av naturligt urval. Därför är strategier som inkluderar självuppoffring från individers sida ofta spelvinnare – den evolutionärt stabila strategin. Djur måste leva i släktgrupper under en del av spelet för att möjligheten för denna altruistiska uppoffring någonsin ska kunna ske. | Spel måste ta hänsyn till inkluderande fitness. Fitnessfunktion är den kombinerade konditionen för en grupp relaterade tävlande – var och en viktad med graden av släktskap – i förhållande till den totala genetiska populationen. Den matematiska analysen av denna gencentrerade syn på spelet leder till Hamiltons regel, att den altruistiska donatorns släktskap måste överstiga kostnads-nyttoförhållandet för själva altruistiska handlingen: R>c/b R är släktskap, c
|
Direkt ömsesidighet | Tävlande som byter favoriter i parförhållanden | En spelteoretisk förkroppsligande av "I'll scratch your back if you scratch min". Ett par individer byter favoriter i ett spel med flera omgångar. Individerna känns igen för varandra som partner. Termen "direkt" gäller eftersom returförmånen specifikt ges tillbaka till enbart parpartnern. | Egenskaperna hos spelet med flera omgångar skapar en risk för avhopp och de potentiellt mindre utdelningarna av samarbete i varje omgång, men varje sådant avhopp kan leda till straff i en efterföljande omgång – vilket etablerar spelet som ett upprepat fångsdilemma. Därför kommer familjen av tit-for-tat-strategier i förgrunden. |
Indirekt ömsesidighet | Besläktade eller icke-relaterade tävlande byter tjänster men utan partnerskap. En returtjänst är "underförstådd" men utan någon specifik identifierad källa vem som ska ge den. | Avkastningsförmånen kommer inte från någon särskild etablerad partner. Potentialen för indirekt ömsesidighet finns för en specifik organism om den lever i ett kluster av individer som kan interagera under en längre tidsperiod. Det har hävdats att mänskliga beteenden vid upprättandet av moraliska system såväl som förbrukandet av betydande energier i det mänskliga samhället för att spåra individuella rykten är en direkt effekt av samhällens beroende av strategier för indirekt ömsesidighet. |
Spelet är mycket känsligt för avhopp, eftersom direkta repressalier är omöjliga. Därför kommer indirekt ömsesidighet inte att fungera utan att hålla en social poäng, ett mått på tidigare kooperativt beteende. Matematiken leder till en modifierad version av Hamiltons regel där:
Organismer som använder social poäng benämns Diskriminatorer och kräver en högre nivå av kognition än strategier för enkel direkt ömsesidighet. Som evolutionsbiologen David Haig uttryckte det – "För direkt ömsesidighet behöver du ett ansikte; för indirekt ömsesidighet behöver du ett namn". |
Den evolutionärt stabila strategin
Den evolutionärt stabila strategin (ESS) är besläktad med Nash-jämvikten i klassisk spelteori, men med matematiskt utökade kriterier. Nash-jämvikt är en speljämvikt där det inte är rationellt för någon spelare att avvika från sin nuvarande strategi, förutsatt att de andra håller sig till sina strategier. En ESS är ett tillstånd av speldynamik där, i en mycket stor population av konkurrenter, en annan mutantstrategi inte framgångsrikt kan komma in i populationen för att störa den befintliga dynamiken (som i sig beror på populationsmixen). Därför måste en framgångsrik strategi (med en ESS) vara både effektiv mot konkurrenter när det är sällsynt – att gå in i den tidigare konkurrerande populationen, och framgångsrik när det senare är i hög andel i populationen – för att försvara sig. Detta innebär i sin tur att strategin måste vara framgångsrik när den tävlar med andra precis som den själv.
En ESS är inte:
- En optimal strategi: det skulle maximera konditionen, och många ESS-tillstånd ligger långt under den maximala konditionen som kan uppnås i ett fitnesslandskap. (Se diagrammet för hökduva ovan som ett exempel på detta.)
- En unik lösning: ofta kan flera ESS-villkor existera i en konkurrenssituation. En viss tävling kan stabilisera sig i någon av dessa möjligheter, men senare kan en stor störning i förhållandena flytta lösningen till en av de alternativa ESS-tillstånden.
- Alltid närvarande: det är möjligt att det inte finns någon ESS. Ett evolutionärt spel utan ESS är "klipp-sax-papper", som finns hos arter som sidfläckig ödla ( Uta stansburiana ).
- En oslagbar strategi: ESS är bara en oinvaderlig strategi.
ESS-tillståndet kan lösas genom att antingen utforska dynamiken i populationsförändringar för att bestämma en ESS, eller genom att lösa ekvationer för de stabila stationära punktförhållandena som definierar en ESS. Till exempel, i hökduvspelet kan vi leta efter om det finns ett statiskt populationsblandningstillstånd där duvors kondition kommer att vara exakt densamma som konditionen för hökar (därför har båda likvärdiga tillväxthastigheter – en statisk punkt).
Låt chansen att träffa en hök=p så därför är chansen att träffa en duva (1-p)
Låt Whawk vara lika med utdelningen för hawk.....
Whawk=payoff i chansen att träffa en duva + payoff i chansen att träffa en hök
Ta utdelningsmatrisresultaten och koppla in dem i ovanstående ekvation:
Whawk = V·(1-p)+(V/2-C/2)·p
På samma sätt för en duva:
Wdove = V/2·(1-p)+0·(p)
så....
Wdove = V/2·(1-p)
Jämställa de två fitnesses, hök och duva
V·(1-p)+(V/2-C/2)·p = V/2·(1-p)
... och lösa för sid
p = V/C
så för denna "statiska punkt" där populationsprocenten är en ESS löser sig att vara ESS (procent Hawk) = V/C
På liknande sätt, med hjälp av ojämlikheter, kan det visas att ytterligare en hök- eller duvmutant som går in i detta ESS-tillstånd så småningom resulterar i mindre lämplighet för sitt slag – både en sann Nash- och en ESS-jämvikt. Detta exempel visar att när riskerna för tävlingsskada eller dödsfall (kostnaden C) är betydligt större än den potentiella belöningen (nyttovärdet V), kommer den stabila populationen att blandas mellan angripare och duvor, och andelen duvor kommer att överstiga det av angriparna. Detta förklarar beteenden som observeras i naturen.
Instabila spel, cykliska mönster
Sten sax påse
Stenpappersaxar som ingår i ett evolutionärt spel har använts för att modellera naturliga processer i studiet av ekologi . Med hjälp av experimentella ekonomiska metoder har forskare använt RPS-spel för att testa mänskliga sociala evolutionära dynamiska beteenden i laboratorier. De sociala cykliska beteenden, förutspådda av evolutionär spelteori, har observerats i olika laboratorieexperiment.
Side-blotched ödla spelar RPS och andra cykliska spel
Det första exemplet på RPS i naturen sågs i beteendet och halsfärgerna hos en liten ödla i västra Nordamerika. Den sidofläckiga ödlan ( Uta stansburiana ) är polymorf med tre svalgfärgade morfer som var och en följer en annan parningsstrategi:
- Den orange halsen är mycket aggressiv och verkar över ett stort territorium - försöker para sig med många honor
- Den oaggressiva gula strupen efterliknar markeringarna och beteendet hos ödlor, och glider "smygande" in på den orange strupens territorium för att para sig med honorna där (och tar därmed över populationen)
- Den blå halsen parar sig med och bevakar noggrant en hona – vilket gör det omöjligt för sneakers att lyckas och tar därför om sin plats i en population
De blå struparna kan dock inte övervinna de mer aggressiva orange struparna. Senare arbete visade att de blå hanarna är altruistiska mot andra blå hanar, med tre nyckelegenskaper: de signalerar med blå färg, de känner igen och slår sig ner bredvid andra (oberoende) blå hanar, och de kommer till och med att försvara sin partner mot orange, till död. Detta är kännetecknet för ett annat samarbetsspel som involverar en grönskäggseffekt .
Honorna i samma population har samma halsfärger, och det påverkar hur många avkommor de producerar och storleken på avkomman, vilket genererar cykler i täthet, ännu ett spel - rK- spelet . Här r den malthusianska parametern som styr exponentiell tillväxt, och K är miljöns bärförmåga . Orange honor har större kopplingar och mindre avkommor som klarar sig bra vid låg densitet. Gula & blå honor har mindre kopplingar och större avkommor som klarar sig bra vid hög densitet. Detta genererar eviga cykler som är tätt knutna till befolkningstätheten. Idén med cykler på grund av densitetsreglering av två strategier har sitt ursprung hos gnagarforskaren Dennis Chitty , alltså leder den här typen av spel till "Chitty-cykler". Det finns spel inom spel inom spel inbäddade i naturliga populationer. Dessa driver RPS-cykler hos hanarna med en periodicitet på fyra år och rK- cykler hos kvinnor med en tvåårsperiod.
Den övergripande situationen motsvarar stenen, saxen, pappersspelet, vilket skapar en fyraårig befolkningscykel. RPS-spelet i manliga sidfläckiga ödlor har ingen ESS, men det har en Nash-jämvikt (NE) med oändliga banor runt NE-atttraktorn . Efter denna forskning om sidoblotched ödlor har många andra polymorfismer med tre strategier upptäckts i ödlor och några av dessa har RPS-dynamik som sammanfogar det manliga spelet och densitetsreglerande spelet i ett enda kön (hanar). På senare tid har däggdjur visat sig hysa samma RPS-spel hos hanar och rK -vilt hos honor, med pälsfärgade polymorfismer och beteenden som driver cykler. Detta spel är också kopplat till utvecklingen av manlig vård hos gnagare och monogami, och driver artbildningsfrekvensen . Det finns rK strategispel kopplade till gnagarpopulationscykler (och ödlor).
När han läste att dessa ödlor i huvudsak var engagerade i ett spel med en sten-papper-saxstruktur, sägs John Maynard Smith ha utbrast "De har läst min bok!".
Signalering, sexuell selektion och handikappprincipen
Bortsett från svårigheten att förklara hur altruism existerar i många utvecklade organismer, besvärades Darwin också av en andra gåta – varför ett betydande antal arter har fenotypiska egenskaper som är uppenbart ofördelaktiga för dem med avseende på deras överlevnad – och borde genom processen att naturlig sektion väljas mot – t.ex. den massiva obekväma fjäderstrukturen som finns i en påfågels svans. Angående denna fråga skrev Darwin till en kollega "Synen av en fjäder i en påfågels svans, när jag tittar på den, gör mig sjuk." Det är den evolutionära spelteorins matematik, som inte bara har förklarat existensen av altruism, utan också förklarar den totalt kontraintuitiva existensen av påfågelns svans och andra sådana biologiska belastningar.
När det gäller analys är problemen med biologiskt liv inte alls olik de problem som definierar ekonomi – ätande (liknande resursanskaffning och förvaltning), överlevnad (konkurrensstrategi) och reproduktion (investering, risk och avkastning). Spelteori var ursprungligen tänkt som en matematisk analys av ekonomiska processer och det är faktiskt därför den har visat sig vara så användbar för att förklara så många biologiska beteenden. En viktig ytterligare förfining av den evolutionära spelteorimodellen som har ekonomiska övertoner vilar på analysen av kostnader. En enkel kostnadsmodell förutsätter att alla tävlande drabbas av samma straff som spelkostnaderna, men så är inte fallet. Mer framgångsrika spelare kommer att vara utrustade med eller kommer att ha samlat på sig en högre "förmögenhetsreserv" eller "överkomlighet" än mindre framgångsrika spelare. Denna rikedomseffekt inom evolutionär spelteori representeras matematiskt av " resurshållningspotential (RHP)" och visar att den effektiva kostnaden för en konkurrent med högre RHP inte är lika stor som för en konkurrent med lägre RHP. Eftersom en individ med högre RHP är en mer önskvärd partner för att producera potentiellt framgångsrika avkommor, är det bara logiskt att RHP med sexuell selektion skulle ha utvecklats för att signaleras på något sätt av de konkurrerande rivalerna, och för att detta ska fungera måste denna signalering göras ärligt . . Amotz Zahavi har utvecklat detta tänkande i vad som kallas " handikappprincipen ", där överlägsna konkurrenter signalerar sin överlägsenhet genom en kostsam uppvisning. Eftersom individer med högre RHP har råd med en så kostsam skärm är denna signalering i sig ärlig och kan tas som sådan av signalmottagaren. I naturen illustreras detta än i påfågelns kostsamma fjäderdräkt . Det matematiska beviset för handikappprincipen utvecklades av Alan Grafen med hjälp av evolutionär spelteoretisk modellering.
Samevolution
Två typer av dynamik:
- Evolutionära spel som leder till en stabil situation eller stas för stridande strategier som resulterar i en evolutionärt stabil strategi
- Evolutionära spel som uppvisar ett cykliskt beteende (som med RPS-spel) där proportionerna av stridande strategier kontinuerligt växlar över tiden inom den totala befolkningen
En tredje, samevolutionär , dynamisk, kombinerar intraspecifik och interspecifik konkurrens. Exempel inkluderar rovdjur-byteskonkurrens och värd-parasitsam-evolution, såväl som mutualism. Evolutionära spelmodeller har skapats för parvisa och multi-arts samevolutionära system. Den allmänna dynamiken skiljer sig mellan konkurrenssystem och mutualistiska system.
I ett konkurrerande (icke-mutualistiskt) samevolutionssystem mellan arterna är arterna involverade i en kapprustning – där anpassningar som är bättre på att konkurrera mot de andra arterna tenderar att bevaras. Både spelutdelning och replikatordynamik återspeglar detta. Detta leder till en Red Queen- dynamik där huvudpersonerna måste "springa så fort de kan för att bara stanna på ett ställe".
Ett antal evolutionära spelteorimodeller har tagits fram för att omfatta samevolutionära situationer. En nyckelfaktor som är tillämplig i dessa samevolutionära system är den kontinuerliga anpassningen av strategin i sådana kapprustning. Samevolutionär modellering inkluderar därför ofta genetiska algoritmer för att återspegla mutationseffekter, medan datorer simulerar dynamiken i det övergripande samevolutionära spelet. Den resulterande dynamiken studeras när olika parametrar modifieras. Eftersom flera variabler är i spel samtidigt, blir lösningar provinsen för multivariabeloptimering. De matematiska kriterierna för att bestämma stabila punkter är Pareto-effektivitet och Pareto-dominans, ett mått på lösningens optimalitetstoppar i multivariabla system.
Carl Bergström och Michael Lachmann tillämpar evolutionär spelteori på fördelningen av fördelar i mutualistiska interaktioner mellan organismer. Darwinistiska antaganden om fitness modelleras med hjälp av replikatordynamik för att visa att organismen som utvecklas i en långsammare takt i ett mutualistiskt förhållande får en oproportionerligt hög andel av fördelarna eller utdelningarna.
Förlänger modellen
En matematisk modell som analyserar ett systems beteende måste initialt vara så enkel som möjligt för att hjälpa till att utveckla en basförståelse för grunderna, eller "första ordningens effekter", som hänför sig till det som studeras. Med denna förståelse på plats är det sedan lämpligt att se om andra, mer subtila, parametrar (andra ordningens effekter) ytterligare påverkar de primära beteendena eller formar ytterligare beteenden i systemet. Efter Maynard Smiths framstående arbete inom evolutionär spelteori har ämnet haft ett antal mycket betydande förlängningar som har kastat mer ljus över förståelsen av evolutionär dynamik, särskilt inom området altruistiska beteenden. Några av dessa viktiga tillägg till evolutionär spelteori är:
Rumsliga spel
Geografiska faktorer i evolutionen inkluderar genflöde och horisontell genöverföring . Rumsliga spelmodeller representerar geometri genom att placera tävlande i ett gitter av celler: tävlingar äger endast rum med omedelbara grannar. Vinnande strategier tar över dessa omedelbara grannskap och interagerar sedan med närliggande grannskap. Den här modellen är användbar för att visa hur fickor av samarbetspartners kan invadera och introducera altruism i spelet Prisoners Dilemma, där Tit for Tat (TFT) är en Nash Equilibrium men INTE också en ESS. Rumslig struktur abstraheras ibland till ett allmänt nätverk av interaktioner. Detta är grunden för evolutionär grafteori .
Effekter av att ha information
I evolutionär spelteori som i konventionell spelteori är effekten av signalering (inhämtning av information) av avgörande betydelse, som i Indirect Reciprocity in Prisoners Dilemma (där tävlingar mellan SAMMA parade individer INTE är repetitiva). Detta modellerar verkligheten för de flesta normala sociala interaktioner som inte är släktrelaterade. Om inte ett sannolikhetsmått på rykte finns tillgängligt i Prisoners Dilemma kan endast direkt ömsesidighet uppnås. Med denna information stöds också indirekt ömsesidighet.
Alternativt kan agenter ha tillgång till en godtycklig signal från början okorrelerad till strategi men blir korrelerad på grund av evolutionär dynamik. Detta är den gröna skäggeffekten (se sidofläckiga ödlor ovan) eller evolutionen av etnocentrism hos människor. Beroende på spelet kan det tillåta utvecklingen av antingen samarbete eller irrationell fientlighet.
Från molekylär till flercellig nivå kan en signalspelsmodell med informationsasymmetri mellan sändare och mottagare vara lämplig, till exempel vid attraktion av kompisar eller utveckling av översättningsmaskineri från RNA-strängar.
Finita populationer
Många evolutionära spel har modellerats i ändliga populationer för att se vilken effekt detta kan ha, till exempel i framgången med blandade strategier.
Se även
Anteckningar
Vidare läsning
- Davis, Morton,; "Game Theory – A Nontechnical Introduction", Dover Books, ISBN 0-486-29672-5
- Dawkins, Richard ; "The Selfish Gene", Oxford University Press, ISBN 0-19-929114-4
- Dugatkin och Reeve; "Game Theory and Animal Behavior", Oxford University Press, ISBN 0-19-513790-6
- Hofbauer och Sigmund; "Evolutionary Games and Population Dynamics", Cambridge University Press, ISBN 0-521-62570-X
- Kohn, Marek; "A Reason for Everything", Faber och Faber, ISBN 0-571-22393-1
- Sandholm, William H.; "Population Games and Evolutionary Dynamics", The MIT Press, ISBN 0262195879
- Segerstrale, Ullica; "Nature's Oracle - The life and work of WD Hamilton", Oxford University Press, 2013, ISBN 978-0-19-860727-4
- Sigmund, Karl ; "Games of Life", Penguin Books, även Oxford University Press, 1993, ISBN 0198547838
- Vincent och Brown; "Evolutionär spelteori, naturligt urval och darwinistisk dynamik", Cambridge University Press, ISBN 0-521-84170-4
externa länkar
- Evolutionär spelteori vid Stanford Encyclopedia of Philosophy
- Utvecklande artificiella moraliska ekologier vid Center for Applied Ethics, University of British Columbia
- Evolutionär spelteori på Curlie
- "Web av berättelser, intervju - liv och arbete John Maynard Smith" . Richard Dawkins .
- 4 Strategier för evolutionär spelteori. Momoi Tominori.