Mekanism design

Stanley Reiter-diagrammet ovan illustrerar ett spel med mekanismdesign. Det övre vänstra utrymmet visar typutrymmet och det övre högra utrymmet X utrymmet för resultat. Den sociala valfunktionen f mappar en typprofil till ett utfall. I spel med mekanismdesign skickar agenter meddelanden i en spelmiljö . Jämvikten i spelet kan utformas för att implementera någon social valfunktion .

Mekanismdesign är ett fält inom ekonomi och spelteori som tar ett mål-först tillvägagångssätt för att utforma ekonomiska mekanismer eller incitament, mot önskade mål, i strategiska miljöer, där spelarna agerar rationellt. Eftersom det börjar i slutet av spelet och sedan går baklänges, kallas det också omvänd spelteori . Det har breda tillämpningar, från ekonomi och politik inom områden som marknadsdesign , auktionsteori och sociala valteori till nätverkssystem (internet-interdomänrouting, sponsrade sökauktioner).

Mekanismdesign studerar lösningskoncept för en klass av privatinformationsspel. Leonid Hurwicz förklarar att "i ett designproblem är målfunktionen den huvudsakliga "givna", medan mekanismen är det okända. Därför är designproblemet det "inversa" av traditionell ekonomisk teori, som vanligtvis ägnas åt analys av prestandan hos en given mekanism.' Så två utmärkande egenskaper hos dessa spel är:

  • att en spel "designer" väljer spelstrukturen snarare än att ärva en
  • att designern är intresserad av spelets resultat

2007 års Nobels minnespris i ekonomisk vetenskap tilldelades Leonid Hurwicz , Eric Maskin och Roger Myerson "för att ha lagt grunden till teorin om mekanismdesign".

Intuition

I en intressant klass av bayesianska spel , skulle en spelare, kallad "rektor", vilja villkora sitt beteende på information som andra spelare känner till privat. Till exempel skulle rektorn vilja veta den verkliga kvaliteten på en begagnad bil som en säljare säljer. Han kan inte lära sig någonting bara genom att fråga försäljaren, eftersom det ligger i säljarens intresse att förvränga sanningen. Men i mekanismdesign har rektorn en fördel: Han kan designa ett spel vars regler kan påverka andra att agera som han vill.

Utan mekanismdesignteori skulle rektors problem vara svårt att lösa. Han skulle behöva överväga alla möjliga spel och välja det som bäst påverkar andra spelares taktik. Dessutom skulle huvudmannen behöva dra slutsatser från agenter som kan ljuga för honom. Tack vare mekanismdesign, och särskilt avslöjningsprincipen , behöver rektorn bara överväga spel där agenter sanningsenligt rapporterar sin privata information.

Grunder

Mekanism

Ett spel med mekanismdesign är ett spel med privat information där en av agenterna, kallad huvudmannen, väljer utbetalningsstrukturen. Efter Harsanyi ( 1967 ) får agenterna hemliga "meddelanden" från naturen som innehåller information som är relevant för utbetalningar. Ett meddelande kan till exempel innehålla information om deras preferenser eller kvaliteten på en vara till salu. Vi kallar denna information för agentens "typ" (noteras vanligtvis och följaktligen utrymmet för typerna ). Agenter rapporterar sedan en typ till rektor (vanligtvis noterad med en hatt ) som kan vara en strategisk lögn. Efter rapporten betalas huvudmannen och ombuden enligt den utdelningsstruktur som huvudmannen valt.

Tidpunkten för spelet är:

  1. Huvudmannen förbinder sig till en mekanism som ger ett utfall som en funktion av rapporterad typ
  2. Agenterna rapporterar, möjligen oärligt, en typprofil
  3. Mekanismen exekveras (agenter får utfallet )

För att förstå vem som får vad är det vanligt att dela upp utfallet i en varufördelning och en pengaöverföring, } en allokering av varor som utförts eller tagits emot som funktion av typ, och står för en monetär överföring som funktion av typ.

Som riktmärke definierar designern ofta vad som skulle hända under fullständig information. Definiera en social valfunktion som mappar den (sanna) typprofilen direkt till allokeringen av mottagna eller renderade varor,

Däremot mappar en mekanism den rapporterade typprofilen till ett resultat (igen, både en varuallokering och en pengaöverföring )

Uppenbarelseprincipen

En föreslagen mekanism utgör ett Bayesianskt spel (ett spel med privat information), och om det sköter sig väl har spelet en Bayesiansk Nash-jämvikt . Vid jämvikt väljer agenter sina rapporter strategiskt som en funktion av typ

Det är svårt att lösa för Bayesiansk jämvikt i en sådan miljö eftersom det innebär att lösa för agenters strategier för bästa svar och för bästa slutledning från en möjlig strategisk lögn. Tack vare ett svepande resultat som kallas uppenbarelseprincipen, oavsett vilken mekanism en designer kan begränsa uppmärksamheten till jämvikter där agenter sanningsenligt rapporterar typ. Uppenbarelseprincipen säger: "Till varje Bayesiansk Nash-jämvikt motsvarar ett Bayesianskt spel med samma jämviktsresultat men där spelare sanningsenligt rapporterar typ. "

Detta är extremt användbart. Principen gör det möjligt för en att lösa en Bayesiansk jämvikt genom att anta att alla spelare är sanningsenligt rapporterade (med förbehåll för en incitamentkompatibilitetsbegränsning) . I ett slag eliminerar det behovet av att överväga antingen strategiskt beteende eller lögn.

Dess bevis är ganska direkt. Antag ett Bayesianskt spel där agentens strategi och utdelning är funktioner av dess typ och vad andra gör, . Per definition är agent i: s jämviktsstrategi Nash i förväntad nytta:

Definiera helt enkelt en mekanism som skulle få agenter att välja samma jämvikt. Det enklaste att definiera är att mekanismen förbinder sig att spela agenternas jämviktsstrategier för dem.

Under en sådan mekanism finner agenterna det givetvis optimalt att avslöja typ eftersom mekanismen spelar de strategier som de fann optimala ändå. Formellt, välj så att

Implementerbarhet

Konstruktören av en mekanism hoppas i allmänhet heller

  • att designa en mekanism som "implementerar" en social valfunktion
  • för att hitta mekanismen som maximerar något värdekriterium (t.ex. vinst)

Att implementera en social valfunktion är att hitta någon överföringsfunktion som motiverar agenter att välja . Formellt, om jämviktsstrategiprofilen under mekanismen kartläggs till samma varuallokering som en social valfunktion,

vi säger att mekanismen implementerar den sociala valfunktionen.

Tack vare uppenbarelseprincipen kan designern vanligtvis hitta en överföringsfunktion för att implementera ett socialt val genom att lösa ett tillhörande sanningsberättarspel. Om agenter tycker att det är optimalt att sanningsenligt rapportera typ,

vi säger att en sådan mekanism är sanningsenligt implementerbar (eller bara "implementerbar"). Uppgiften är sedan att lösa ett sanningsenligt implementerbart och tillskriva denna överföringsfunktion till det ursprungliga spelet. En allokering är sanningsenligt implementerbar om det finns en överföringsfunktion så att

som också kallas begränsningen för incitamentkompatibilitet (IC).

I applikationer är IC-villkoret nyckeln till att beskriva formen av på något användbart sätt. Under vissa förhållanden kan den till och med isolera överföringsfunktionen analytiskt. läggs ibland ett deltagande ( individuell rationalitet ) till om agenter har möjlighet att inte spela.

Nödvändighet

Tänk på en inställning där alla agenter har en typkontingent hjälpfunktion . Betrakta också en godsallokering som är vektorvärderad och storleken (som tillåter antal varor) och anta att den är styckvis kontinuerlig med hänsyn till dess argument.

Funktionen är implementerbar endast om

närhelst och och x är kontinuerlig vid . Detta är ett nödvändigt villkor och härleds från första och andra ordningens villkor för agentens optimeringsproblem under antagande om sanningssägande.

Dess betydelse kan förstås i två delar. Den första delen säger att agentens marginella substitutionsgrad (MRS) ökar som en funktion av typen,

Kort sagt, agenter kommer inte att berätta sanningen om mekanismen inte erbjuder högre agenttyper en bättre affär. Annars kommer högre typer som möter någon mekanism som straffar höga typer för rapportering att ljuga och förklara att de är lägre typer, vilket bryter mot den sanningsberättande IC-begränsningen. Det andra stycket är ett monotoniskt tillstånd som väntar på att hända,

vilket, för att vara positivt, innebär att högre typer måste ges mer av det goda.

Det finns potential för de två delarna att interagera. Om kontraktet för något typområde erbjöd mindre kvantitet till högre typer är det möjligt att mekanismen skulle kunna kompensera genom att ge högre typer en rabatt. Men ett sådant kontrakt finns redan för medel av låg typ, så denna lösning är patologisk. En sådan lösning uppstår ibland i processen att lösa en mekanism. I dessa fall måste den " strykas ". I en miljö med flera bra är det också möjligt för designern att belöna agenten med mer av en vara för att ersätta mindre av en annan (t.ex. smör mot margarin ). Flera-goda mekanismer är ett pågående problem inom mekanismdesignteorin.

Tillräcklighet

Mekanismdesignpapper gör vanligtvis två antaganden för att säkerställa implementerbarhet:

Detta är känt under flera namn: enkelkorsningsvillkoret , sorteringsvillkoret och Spence–Mirrlees-villkoret. Det betyder att hjälpfunktionen har en sådan form att agentens MRS ökar i typ.

Detta är ett tekniskt tillstånd som begränsar tillväxttakten för MRS.

Dessa antaganden är tillräckliga för att tillhandahålla att varje monoton är implementerbar (en finns som kan implementera den). Dessutom, i singel-bra-inställningen är enkelkorsningsvillkoret tillräckligt för att tillhandahålla att endast ett monotont är implementerbart, så att designern kan begränsa sin sökning till ett monotont .

Markerade resultat

Intäktsekvivalenssats

Vickrey ( 1961 ) ger ett hyllat resultat att varje medlem i en stor klass av auktioner försäkrar säljaren om samma förväntade intäkt och att den förväntade intäkten är det bästa säljaren kan göra. Detta är fallet om

  1. Köparna har identiska värderingsfunktioner (vilket kan vara en funktion av typ)
  2. Köparnas typer är oberoende fördelade
  3. Köpartyperna hämtas från en kontinuerlig distribution
  4. Typfördelningen bär den monotona riskhastighetsegenskapen
  5. Mekanismen säljer varan till köparen med den högsta värderingen

Det sista villkoret är avgörande för satsen. En implikation är att för att säljaren ska uppnå högre intäkter måste han chansa på att ge varan till en agent med lägre värdering. Vanligtvis innebär detta att han måste riskera att inte sälja föremålet alls.

Vickrey–Clarke–Groves mekanismer

Auktionsmodellen Vickrey (1961) utökades senare av Clarke ( 1971 ) och Groves för att behandla ett offentligt val där kostnaden för ett offentligt projekt bärs av alla agenter, t.ex. om man ska bygga en kommunal bro. Den resulterande "Vickrey–Clarke–Groves"-mekanismen kan motivera agenter att välja en socialt effektiv allokering av allmännyttan även om agenter har privata kända värderingar. Med andra ord kan det lösa " allmänningens tragedi " - under vissa förhållanden, i synnerhet kvasilinjär nytta eller om budgetbalans inte krävs.

Tänk på en inställning där antal agenter har kvasilinjär nytta med privata värderingar där valutan värderas linjärt. VCG-designern designar en incitamentskompatibel (därav sanningsenligt implementerbar) mekanism för att erhålla den sanna typens profil, från vilken designern implementerar den socialt optimala allokeringen

Det smarta med VCG-mekanismen är hur den motiverar sanningsenlig uppenbarelse. Det eliminerar incitament att felrapportera genom att bestraffa en agent med kostnaden för den snedvridning han orsakar. Bland rapporterna som agenten kan göra tillåter VCG-mekanismen en "noll"-rapport som säger att han är likgiltig för allmännyttan och bara bryr sig om pengaöverföringen. Detta tar effektivt bort agenten från spelet. Om en agent väljer att rapportera en typ, debiterar VCG-mekanismen agenten en avgift om hans rapport är avgörande , det vill säga om hans rapport ändrar den optimala allokeringen x för att skada andra agenter. Betalningen är beräknad

som summerar förvrängningen i de andra agenternas (och inte hans egna) verktyg som orsakas av att en agent rapporterar.

Gibbard–Satterthwaites sats

Gibbard ( 1973 ) och Satterthwaite ( 1975 ) ger ett omöjlighetsresultat som till sin anda liknar Arrows omöjlighetsteorem . För en mycket allmän klass av spel kan endast "diktatoriska" sociala valfunktioner implementeras.

En social valfunktion f () är diktatorisk om en agent alltid får sin mest gynnade varutilldelning,

Teoremet säger att under allmänna förhållanden måste alla sanningsenligt implementerbara sociala valfunktioner vara diktatoriska om,

  1. X är ändlig och innehåller minst tre element
  2. Preferenser är rationella

Myerson–Satterthwaites sats

Myerson och Satterthwaite ( 1983 ) visar att det inte finns något effektivt sätt för två parter att handla med en vara när de var och en har hemliga och sannolikt varierande värderingar för den, utan risken att tvinga en part att handla med förlust. Det är bland de mest anmärkningsvärda negativa resultaten inom ekonomi – en sorts negativ spegel av välfärdsekonomins grundläggande satser .

Shapley värde

Phillips och Marden (2018) bevisade att för kostnadsdelningsspel med konkava kostnadsfunktioner, den optimala kostnadsdelningsregeln som för det första optimerar de värsta ineffektiviteterna i ett spel (priset för anarki), och sedan för det andra optimerar det bästa fallet utfall ( priset för stabilitet ), är just Shapley-regeln om kostnadsdelning. Ett symmetriskt uttalande är på samma sätt giltigt för spel som delar verktyg med konvexa verktygsfunktioner.

Exempel

Pris diskriminering

Mirrlees ( 1971 ) introducerar en inställning där överföringsfunktionen t () är lätt att lösa. På grund av dess relevans och lätthanterlighet är det en vanlig miljö i litteraturen. Tänk på en enkel-bra, singelagent-inställning där agenten har kvasilinjär nytta med en okänd typparameter

och där huvudmannen har en tidigare CDF över agentens typ . Huvudmannen kan producera varor till en konvex marginalkostnad c ( x ) och vill maximera den förväntade vinsten från transaktionen

beroende av IC- och IR-villkor

Huvudmannen här är en monopolist som försöker fastställa ett vinstmaximerande prisschema där den inte kan identifiera typen av kund. Ett vanligt exempel är ett flygbolag som sätter priser för affärs-, fritids- och studentresenärer. På grund av IR-tillståndet måste det ge varje typ en tillräckligt bra affär för att framkalla deltagande. På grund av IC-tillståndet måste den ge varje typ en tillräckligt bra affär för att typen föredrar sin affär framför alla andra.

Ett knep som ges av Mirrlees (1971) är att använda kuvertsatsen för att eliminera överföringsfunktionen från förväntan att maximeras,

Integrering,

där är någon indextyp. Ersätter det incitamentskompatibla i maximanden,

efter en integrering av delar. Denna funktion kan maximeras punktvis.

Eftersom är incitamentskompatibel redan kan designern släppa IC-begränsningen. Om verktygsfunktionen uppfyller Spence–Mirrlees-villkoret finns en monoton funktion. IR-begränsningen kan kontrolleras vid jämvikt och avgiftsschemat kan höjas eller sänkas i enlighet med detta. Notera dessutom förekomsten av en riskfrekvens i uttrycket. Om typfördelningen bär den monotona riskkvotsegenskapen är FOC tillräcklig för att lösa för t (). Om inte, då är det nödvändigt att kontrollera om monotonisitetsbegränsningen (se tillräcklighet ovan) är uppfylld överallt längs allokerings- och avgiftsplanerna. Om inte, måste designern använda Myerson-strykning.

Myerson stryker

Det är möjligt att lösa ett varu- eller prisschema som uppfyller villkoren för första beställning men som inte är monotont. Om så är fallet är det nödvändigt att "stryka" schemat genom att välja något värde för att platta till funktionen.

I vissa applikationer kan konstruktören lösa första ordningens villkor för pris- och allokeringsscheman men ändå upptäcka att de inte är monotona. Till exempel, i den kvasilinjära miljön händer detta ofta när riskkvoten i sig inte är monoton. Enligt Spence–Mirrlees villkor måste de optimala pris- och allokeringsscheman vara monotona, så designern måste eliminera alla intervall över vilket schemat ändrar riktning genom att platta till det.

Intuitivt, vad som händer är att designern tycker att det är optimalt att slå ihop vissa typer och ge dem samma kontrakt. Normalt motiverar designern högre typer att utmärka sig genom att ge dem en bättre affär. Om det inte finns tillräckligt få högre typer i marginalen anser konstruktören att det inte lönar sig att ge lägre typer en koncession (kallad deras informationshyra) för att debitera högre typer ett typspecifikt kontrakt.

Överväg att en monopolistisk huvudman säljer till agenter med kvasilinjär nytta, exemplet ovan. Antag att allokeringsschemat som uppfyller första ordningens villkor har en enda inre topp vid och ett enda inre dal vid illustrerad till höger.

  • Efter Myerson (1981) platta till det genom att välja som uppfyller
    där är den inversa funktionen av x avbildning till och är den inversa funktionen av x avbildning till . Det vill säga, returnerar ett före den inre toppen och returnerar ett efter det inre tråget.
  • Om det icke-monotona området för gränsar till kanten av typrymden, ställ helt enkelt in lämplig funktion (eller båda) till gränstyp. Om det finns flera regioner, se en lärobok för en iterativ procedur; det kan vara så att mer än ett tråg ska strykas tillsammans.

Bevis

Beviset använder teorin om optimal kontroll. Den tar hänsyn till mängden intervall i det icke-monotona området av över vilket det kan platta till schemat. Den skriver sedan en Hamiltonian för att erhålla nödvändiga villkor för en inom intervallen

  1. som tillfredsställer monotoni
  2. för vilka monotonisitetsbegränsningen inte är bindande för intervallets gränser

Villkor två säkerställer att som uppfyller det optimala kontrollproblemet återansluter till schemat i det ursprungliga problemet vid intervallgränserna (inga hopp). Alla som uppfyller de nödvändiga villkoren måste vara platt eftersom de måste vara monotona och ändå återansluta vid gränserna.

Som tidigare maximera huvudmannens förväntade utdelning, men den här gången med förbehåll för monotonisitetsbegränsningen

och använd en Hamiltonian för att göra det, med skuggpris

där är en tillståndsvariabel och kontrollen. Som vanligt vid optimal kontroll måste ekvationen för costate-evolutionen uppfyllas

Genom att dra nytta av villkor 2, notera att monotonisitetsbegränsningen inte är bindande vid gränserna för -intervallet,

vilket innebär att costate-variabelvillkoret kan integreras och också är lika med 0

Den genomsnittliga förvrängningen av huvudmannens överskott måste vara 0. För att platta till schemat, hitta ett så att dess inversa bild mappas till ett -intervall som uppfyller villkoret ovan.

Se även

Anteckningar

Vidare läsning

externa länkar