Proebstings paradox

I sannolikhetsteorin är Proebstings paradox ett argument som verkar visa att Kelly-kriteriet kan leda till ruin . Även om det kan lösas matematiskt, väcker det några intressanta frågor om den praktiska tillämpningen av Kelly, särskilt när det gäller investeringar. Det namngavs och diskuterades först av Edward O. Thorp 2008. Paradoxen fick sitt namn efter Todd Proebsting, dess skapare.

Uttalande av paradoxen

Om en satsning är lika sannolikt att vinna eller förlora, och betalar b gånger insatsen för en vinst, är Kelly-satsningen:

gånger rikedom. Till exempel, om en 50/50 satsning ger 2 till 1, säger Kelly att satsa 25% av förmögenheten. Om en 50/50 satsning ger 5 till 1, säger Kelly att satsa 40% av förmögenheten.

Anta nu att en spelare erbjuds 2 till 1 utbetalning och satsar 25%. Vad ska han göra om utbetalningen på nya satsningar ändras till 5 till 1? Han bör välja f * för att maximera:

för om han vinner kommer han att ha 1,5 (0,5 från att vinna 25%-satsningen till 2 till 1 odds) plus 5 f *; och om han förlorar måste han betala 0,25 från den första insatsen och f * från den andra. Att ta derivatan med avseende på f * och sätta den till noll ger:

som kan skrivas om:

f * = 0,225.

Det paradoxala är att den totala insatsen, 0,25 + 0,225 = 0,475, är större än 0,4 Kelly-insatsen om oddsen 5 till 1 erbjuds från början. Det är kontraintuitivt att du satsar mer när en del av insatsen är till ogynnsamma odds. Todd Proebsting mailade Ed Thorp och frågade om detta.

Ed Thorp insåg att idén kunde utvidgas för att ge Kelly-spelaren en sannolikhet som inte är noll att bli ruinerad. Han visade att om en spelare erbjuds 2 till 1 odds, sedan 4 till 1, sedan 8 till 1 och så vidare (2 n till 1 för n = 1 till oändlighet) säger Kelly att satsa:

varje gång. Summan av alla dessa satsningar är 1. Så en Kelly-spelare har 50 % chans att förlora hela sin rikedom.

I allmänhet, om en spelaren satsar Kelly på ett 50/50-förslag med en utbetalning på b 1 , och sedan erbjuds b 2 , kommer han att satsa totalt:

Den första termen är vad spelaren skulle satsa om han erbjuds b 2 från början. Den andra termen är positiv om f 2 > f 1 , vilket betyder att om utbetalningen förbättras, kommer Kelly-spelaren att satsa mer än han skulle göra om han precis erbjöds den andra vinsten, medan om utbetalningen blir sämre kommer han att satsa mindre än han skulle göra om han erbjöds bara den andra utbetalningen.

Praktisk applikation

Många spel har funktionen att utdelningar och sannolikheter kan ändras innan resultatet bestäms. I sportspel till exempel kan raden ändras flera gånger innan evenemanget hålls, och nyheter kan komma ut (som en skada eller väderprognos) som ändrar sannolikheten för ett utfall. När du investerar kan en aktie som ursprungligen köptes för $20 per aktie vara tillgänglig nu för $10 eller $30 eller något annat pris. Vissa sportspelare försöker tjäna pengar på att förutse linjeändringar snarare än att förutsäga händelseutfall. Vissa handlare koncentrerar sig på möjliga kortsiktiga prisrörelser för ett värdepapper snarare än dess långsiktiga fundamentala utsikter.

Ett klassiskt investeringsexempel är en handlare som har exponeringsgränser, säg att han inte får ha mer än 1 miljon dollar i riskzonen i en aktie. Det betyder inte att han inte kan förlora mer än 1 miljon dollar. Om han köper $1 miljon av aktien för $20 och den går till $10, kan han köpa ytterligare $500 000. Om det sedan går till $5, kan han köpa ytterligare $500 000. Om det går till noll kan han förlora oändligt mycket pengar, trots att han aldrig har mer än 1 miljon dollar i riskzonen.

Upplösning

Det finns ingen paradox. Kellys kriterium är att maximera den förväntade tillväxttakten; endast under begränsade förhållanden motsvarar det att maximera stocken. Ett enkelt sätt att avfärda paradoxen är att notera att Kelly antar att sannolikheter inte förändras.

En Kelly-spelare som vet att oddsen kan förändras kan faktorisera detta till en mer komplex Kelly-satsning. Anta till exempel att en Kelly-spelare får en engångsmöjlighet att satsa ett 50/50-förslag till oddset 2 till 1. Han vet att det finns en 50 % chans att en andra engångsmöjlighet kommer att erbjudas med 5 till 1. Nu borde han maximera:

med avseende på både f 1 och f 2 . Svaret visar sig vara satsning noll vid 2 till 1, och vänta på chansen att satsa på 5 till 1, i vilket fall du satsar 40% av förmögenheten. Om sannolikheten för att erbjudas 5 till 1 odds är mindre än 50 %, kommer ett belopp mellan noll och 25 % att satsas på 2 till 1. Om sannolikheten att erbjudas 5 till 1 odds är mer än 50 %, spelar Kelly-spelaren kommer faktiskt att göra en negativ satsning till 2 till 1 odds (det vill säga satsa på 50/50-resultatet med en utbetalning på 1/2 om han vinner och betala 1 om han förlorar). I båda fallen är hans insats på 5 till 1 odds, om möjligheten erbjuds, 40 % minus 0,7 gånger hans 2 till 1 insats.

Vad paradoxen i grund och botten säger är att om en Kelly-spelare har felaktiga övertygelser om vilka framtida spel som kan erbjudas, kan han göra suboptimala val och till och med gå pank. Kelly-kriteriet är tänkt att göra bättre än någon väsentligt annorlunda strategi på lång sikt och ha noll chans att förstöra, så länge spelaren känner till sannolikheterna och utbetalningarna.

Mer ljus över frågorna spreds genom en oberoende övervägande av problemet av Aaron Brown , även meddelat Ed Thorp via e-post. I denna formulering utgår antagandet att spelaren först säljer tillbaka den ursprungliga insatsen och sedan gör en ny insats vid den andra utbetalningen. I det här fallet är hans totala insats:

som ser väldigt likt formeln ovan för Proebsting-formuleringen, förutom att tecknet är omvänt på den andra termen och det multipliceras med ytterligare en term.

Till exempel, givet det ursprungliga exemplet med en 2 till 1 utbetalning följt av en 5 till 1 utbetalning, i denna formulering satsar spelaren först 25 % av förmögenheten vid 2 till 1. När 5 till 1 utbetalning erbjuds kan spelaren sälja tillbaka den ursprungliga insatsen för en förlust på 0,125. Hans 2 till 1 satsning ger 0,5 om han vinner och kostar 0,25 om han förlorar. Vid den nya 5 till 1-utbetalningen kan han få en insats som ger 0,625 om han vinner och kostar 0,125 om han förlorar, detta är 0,125 bättre än hans ursprungliga insats i båda staterna. Därför har hans ursprungliga insats nu ett värde på -0,125. Med tanke på hans nya förmögenhetsnivå på 0,875 är hans 40% insats (Kelly-beloppet för 5 till 1-utbetalningen) 0,35.

De två formuleringarna är likvärdiga. I den ursprungliga formuleringen har spelaren 0,25 insats vid 2 till 1 och 0,225 insats vid 5 till 1. Om han vinner får han 2,625 och om han förlorar har han 0,525. I den andra formuleringen har spelaren 0,875 och 0,35 insats på 5 till 1. Om han vinner får han 2,625 och om han förlorar har han 0,525.

Den andra formuleringen klargör att beteendeförändringen beror på den mark-to-market-förlust som investeraren upplever när den nya utbetalningen erbjuds. Detta är ett naturligt sätt att tänka inom finans, mindre naturligt för en spelare. I denna tolkning förstör inte den oändliga serien av dubbla utbetalningar Kelly-spelaren genom att locka honom att överbeta, den extraherar all hans rikedom genom förändringar utanför hans kontroll.