Jämviktsval

Jämviktsval är ett koncept från spelteorin som syftar till att adressera skäl för spelare i ett spel att välja en viss jämvikt framför en annan. Konceptet är särskilt relevant inom evolutionär spelteori , där de olika metoderna för jämviktsval svarar på olika idéer om vilka jämvikter som kommer att vara stabila och beständiga för en spelare att spela även inför avvikelser (och mutationer) hos de andra spelarna. Detta är viktigt eftersom det finns olika jämviktskoncept , och för många speciella begrepp, såsom Nash-jämvikten , har många spel flera jämvikter.

Jämviktsurval med upprepade spel

Ett scenspel är ett n-player-spel där spelarna väljer från en begränsad uppsättning åtgärder, och det finns en utdelningsprofil för deras val. Ett upprepat spel är att spela ett antal upprepningar av ett scenspel under diskreta tidsperioder (Watson, 2013). En spelares rykte påverkar de andra spelarnas handlingar och beteende. Med andra ord, hur en spelare beter sig i föregående omgångar avgör deras motståndares agerande i efterföljande omgångar. Ett exempel är interaktionen mellan en anställd och en arbetsgivare där den anställde drar sig undan sitt ansvar för en kortsiktig vinst och sedan förlorar på den bonus som arbetsgivaren avbryter efter att ha observerat den anställdes beteende (Watson, 2013). Dynamiken i jämviktsvalet för upprepade spel kan illustreras med ett tvåperiodsspel. Med varje åtgärd från spelarna under en period startas ett nytt delspel baserat på den åtgärdsprofilen. För Nash-jämvikten i hela spelet krävs en perfekt jämvikt i underspelet för varje spel. Därför, i den sista perioden av ett upprepat spel, kommer spelarna att välja ett scenspel Nash Equilibrium. Jämviktsbestämmelser som inte är Nash Equilibrium-strategier i scenspelet stöds fortfarande. Detta kan uppnås genom att etablera ett rykte om "samarbete" under de föregående perioderna som leder till att motståndaren väljer en mer gynnsam Nash Equilibrium-strategi i den sista perioden. Om en spelare bygger upp ett rykte om att avvika istället för att samarbeta, så kan motståndaren "bestraffa" spelaren genom att välja en mindre gynnsam Jämvikt i den sista perioden av det upprepade spelet.

Brännpunkt

Ett annat koncept som kan hjälpa till att välja en korrekt jämvikt är fokuspunkten . Detta koncept introducerades först av Thomas Schelling, en nobelvinnande spelteoretiker, i sin bok The Strategy of Conflict 1960 (Schelling, 1960). När deltagarna är i ett koordinatspel där spelarna inte har en chans att diskutera sina strategier i förväg är fokus en lösning som på något sätt sticker ut som det naturliga svaret.

Till exempel, i ett experiment utfört 1990 av Mehta et al. (1994) lät forskarna deltagarna besvara ett frågeformulär, som innehöll frågan "namn ett år" eller "namn en stad i England". Deltagarna ombads ge det första svaret som de tänkte på, och många angav sitt födelseår eller hemstad.

Men när de hade incitament att samordna – deltagarna fick veta att de skulle få betalt om de lyckades svara på frågan på samma sätt som en anonym partner – valde de flesta av dem 1990 (året då) och London (den största stad i Storbritannien). Det här är inte de första svaren som de tänkte på, men de är de bästa valen efter övervägande när de försöker hitta en partner utan föregående diskussion. I det här fallet är år 1990, eller staden London, fokuspunkten i detta spel, för att hjälpa spelarna att välja den bästa jämvikten i detta koordinatspel.

Dessutom, även i den situation där spelarna tillåts kommunicera med varandra, såsom förhandlingar, kan kontaktpunkten fortfarande vara användbar för dem att välja en lämplig jämvikt: När förhandlingen är på väg mot sitt slut, måste varje spelare göra det sista -minut beslut om hur aggressiva de ska vara och i vilken utsträckning de ska lita på sina motståndare (Hyde, 2017).

Exempel på jämviktsselektionskoncept

Risk & Payoff dominans

Definition : Tänk på en situation där ett spel har flera Nash-jämvikter (NE), jämvikten kan klassificeras i två kategorier:

  • En Nash-jämvikt anses vara riskdominerande om den har den största attraktionsbassängen (dvs. är mindre riskabel).
  • En Nash-jämvikt anses vara utdelningsdominerande om den är Pareto överlägsen alla andra Nash-jämvikter i spelet.

Förklaring: En riskdominant NE väljs när spelaren vill undvika stora förluster medan en payoff dominant NE övervägs för en optimal payoff-lösning. Observera att antingen riskdominant eller payoff dominant är en typisk typ av NE.

Exempel: Ta den normala utbetalningsmatrisen för ett spel som ett exempel:

Tabell 1: Normal form av exempelspelet
L R
U 10, 10 0, 15
D 15, 0 5, 5

Det finns två NE i detta spel, dvs (U, L) och (D,R). Här (U, L) är en utdelningsdominerande NE eftersom en sådan strategi kan ge en optimal total utdelning. Men med tanke på osäkerheten i en motståndares agerande, kan en av spelarna överväga en mer konservativ strategi (D för spelare 1 och R för spelare två), som kan undvika situationen med "en stor förlust", dvs. få 0 utdelning när motståndaren avviker. Därför är (D, R) en riskdominerande NE.

1/2 dominans

  • Harsanyi, John C. och Selten, Reinhard, A General Theory of Equilibrium Selection in Games , MIT Press (1988)
  • Watson, J. (2013). Upprepade spel och rykte. I Strategy: An introduction to game theory (3:e uppl., s. 291–305). uppsats, Norton & Company.
  • Hyde, T., 2017. Kan Schellings fokuspunkter hjälpa oss att förstå höginsatsförhandlingar?. [online] Aeaweb.org. Tillgänglig på: [Nådd 9 december 2021].
  • Mehta, J., Starmer, C., & Sugden, R. (1994). The Nature of Salience: En experimentell undersökning av rena koordinationsspel. The American Economic Review, 84(3), 658–673. http://www.jstor.org/stable/2118074
  • Schelling, TC (1960). Konfliktstrategin. Cambridge, Mass.