Pojke eller flicka paradox
Pojke- eller flickparadoxen omger en uppsättning frågor inom sannolikhetsteorin , som också är kända som The Two Child Problem , Mr. Smith's Children och Mrs. Smith-problemet . Den första formuleringen av frågan går tillbaka till åtminstone 1959, när Martin Gardner presenterade den i sin oktober 1959 " Matematical Games-kolumn " i Scientific American . Han kallade det The Two Children Problem och formulerade paradoxen så här:
- Mr Jones har två barn. Det äldre barnet är en flicka. Vad är sannolikheten att båda barnen är flickor?
- Mr Smith har två barn. Minst en av dem är en pojke. Vad är sannolikheten att båda barnen är pojkar?
1/3 Gardner gav till en början svaren 1/2 tvetydig . respektive , men erkände senare att den andra frågan var Dess svar kan vara 1 / 2 , beroende på förfarandet genom vilket informationen "minst en av dem är en pojke" erhölls. Tvetydigheten, beroende på den exakta formuleringen och möjliga antaganden, bekräftades av Maya Bar-Hillel och Ruma Falk och Raymond S. Nickerson .
Andra varianter av denna fråga, med varierande grad av tvetydighet, har populariserats av Ask Marilyn i Parade Magazine , John Tierney från The New York Times och Leonard Mlodinow i The Drunkard's Walk . En vetenskaplig studie visade att när identisk information förmedlades 39 , men med olika delvis tvetydiga formuleringar som betonade olika punkter, ändrades andelen MBA-studenter som svarade 1/2 från 85 % till %.
Paradoxen har stimulerat en hel del kontroverser. Paradoxen härrör från om problemuppställningen är likartad för de två frågorna. intuitiva 1/2 . svaret är Detta svar är intuitivt om frågan får läsaren att tro att det finns två lika sannolika möjligheter för det andra barnets kön (dvs. pojke och flicka), och att sannolikheten för dessa utfall är absolut, inte villkorlig .
Vanliga antaganden
De två möjliga svaren delar ett antal antaganden. För det första antas det att utrymmet för alla möjliga händelser lätt kan räknas upp, vilket ger en utökad definition av utfall: {BB, BG, GB, GG}. Denna notation indikerar att det finns fyra möjliga kombinationer av barn, märka pojkar B och flickor G, och använda den första bokstaven för att representera det äldre barnet. För det andra antas det att dessa utfall är lika sannolika. Detta innebär följande modell , 1/2 : en Bernoulli - process med p =
- Varje barn är antingen man eller kvinna.
- Varje barn har samma chans att vara man som att vara kvinna.
- Varje barns kön är oberoende av det andras kön.
Det matematiska resultatet skulle vara detsamma om det formulerades i form av en myntkastning .
Första frågan
- Mr Jones har två barn. Det äldre barnet är en flicka. Vad är sannolikheten att båda barnen är flickor?
Under de tidigare nämnda antagandena väljs i detta problem en slumpmässig familj. I detta provutrymme finns det fyra lika sannolika händelser:
Äldre barn | Yngre barn |
---|---|
Flicka | Flicka |
Flicka | Pojke |
|
|
|
|
Endast två av dessa möjliga händelser uppfyller kriterierna som anges i frågan (dvs. GG, GB). Eftersom båda de två möjligheterna i det nya urvalsutrymmet {GG, GB} är lika sannolika, och endast en 1/2 av en flicka de två, GG, inkluderar två flickor, är sannolikheten att det yngre barnet också är .
Andra frågan
- Mr Smith har två barn. Minst en av dem är en pojke. Vad är sannolikheten att båda barnen är pojkar?
Denna fråga är identisk med fråga ett, förutom att istället för att specificera att det äldre barnet är en pojke, anges att minst en av dem är en pojke. Som svar på läsarens kritik av frågan som ställdes 1959, sa Gardner att inget svar är möjligt utan information som inte lämnats. Specifikt att två olika procedurer för att fastställa att "minst en är en pojke" skulle kunna leda till exakt samma formulering av problemet. Men de leder till olika korrekta svar:
- Från alla familjer med två barn, varav minst en är en pojke, väljs en familj slumpmässigt. Detta skulle ge svaret på 1/3 .
- Från alla familjer med två barn väljs ett barn ut slumpmässigt och könet på det barnet anges vara en pojke. Detta skulle ge ett svar på 1/2 .
Grinstead och Snell hävdar att frågan är tvetydig på ungefär samma sätt som Gardner gjorde. De överlåter åt läsaren att avgöra om proceduren, som ger 1/3 som svar, är rimlig för problemet enligt ovan. Formuleringen av frågan de övervägde specifikt är följande:
- Tänk på en familj med två barn. Med tanke på att ett av barnen är en pojke, vad är sannolikheten att båda barnen är pojkar?
I denna formulering är tvetydigheten mest uppenbart närvarande, eftersom det inte är klart om vi får anta att ett specifikt barn är en pojke, vilket gör det andra barnet osäkert, eller om det ska tolkas på samma sätt som "minst en pojke". Denna oklarhet lämnar flera möjligheter som inte är likvärdiga och lämnar behovet av att göra antaganden om hur informationen erhölls, som Bar-Hillel och Falk hävdar, där olika antaganden kan leda till olika utfall (eftersom problemformuleringen inte var tillräckligt väl definierad för att tillåta en enda enkel tolkning och ett enkelt svar).
Säg till exempel att en observatör ser Mr Smith på en promenad med bara ett av sina barn. Om han har två pojkar måste det barnet vara en pojke. Men om han har en pojke och en flicka, kunde det barnet ha varit en flicka. Så att se honom med en pojke eliminerar inte bara kombinationerna där han har två flickor, utan också kombinationerna där han har en son och en dotter och väljer dottern att gå med.
Så även om det verkligen är sant att alla möjliga Mr Smith har minst en pojke (dvs tillståndet är nödvändigt), kan det inte antas att varje Mr Smith med minst en pojke är avsedd. Det vill säga att problemformuleringen inte säger att att ha en pojke är ett tillräckligt villkor för att Mr Smith ska kunna identifieras som att han har en pojke på det här sättet.
När de kommenterar Gardners version av problemet noterar Bar-Hillel och Falk att "Mr Smith, till skillnad från läsaren, är förmodligen medveten om könet på båda sina barn när han gör detta uttalande", dvs att "Jag har två barn och kl. åtminstone en av dem är en pojke." Det måste vidare antas att Mr. Smith alltid avsåg skulle rapportera detta faktum om det var sant, och antingen tiga eller säga att han har minst en dotter, för att det korrekta svaret ska vara 1/3 som Gardner uppenbarligen ursprungligen . Men under det antagandet, om han förblir tyst eller säger att han har en dotter, är det 100 % sannolikhet att han har två döttrar.
Analys av oklarheten
Om man antar att denna information har erhållits genom att titta på båda barnen för att se om det finns minst en pojke är villkoret både nödvändigt och tillräckligt. Tre av de fyra lika sannolika händelserna för en tvåbarnsfamilj i provrummet ovan uppfyller villkoret, som i denna tabell:
Äldre barn | Yngre barn |
---|---|
|
|
Flicka | Pojke |
Pojke | Flicka |
Pojke | Pojke |
2 1/3 , om det antas att båda barnen övervägdes när de letade efter en pojke, är svaret på fråga . Men om familjen först valdes ut och sedan ett slumpmässigt, sant uttalande gjordes om könet på ett barn i den familjen, oavsett om båda beaktades eller inte, är det korrekta sättet att beräkna den villkorade sannolikheten att inte räkna alla fall som inkluderar ett barn med det könet. Istället måste man bara beakta sannolikheterna där påståendet kommer att göras i varje enskilt fall. Så om ALOB representerar händelsen där påståendet är "minst en pojke" och ALOG representerar händelsen där påståendet är "minst en tjej", så beskriver den här tabellen provutrymmet:
Äldre barn | Yngre barn | P(den här familjen) | P(ALOB givet denna familj) | P(ALOG givet denna familj) | P(ALOB och denna familj) | P(ALOG och denna familj) |
---|---|---|---|---|---|---|
Flicka | Flicka | 1/4 _ _ | 0 | 1 | 0 | 1/4 _ _ |
Flicka | Pojke | 1/4 _ _ | 1/2 _ _ | 1/2 _ _ | 1/8 _ _ | 1/8 _ _ |
Pojke | Flicka | 1/4 _ _ | 1/2 _ _ | 1/2 _ _ | 1/8 _ _ | 1/8 _ _ |
Pojke | Pojke | 1/4 _ _ | 1 | 0 | 1/4 _ _ | 0 |
Så, om åtminstone en är en pojke när faktumet är slumpmässigt valt, är sannolikheten att båda är pojkar
Paradoxen uppstår när det inte är känt hur påståendet "minst en är en pojke" genererades. Båda svaren kan vara korrekt, baserat på vad som antas.
Men svaret " 1/3 , dvs. " erhålls endast genom att anta P(ALOB|BG) = P(ALOB|GB) =1, vilket innebär att P(ALOG|BG) = P(ALOG|GB) = 0 , det andra barnets kön nämns aldrig även om det är närvarande. Som Marks och Smith säger, "Detta extrema antagande ingår dock aldrig i presentationen av tvåbarnsproblemet, och är definitivt inte vad folk har i åtanke när de presenterar det."
Modellering av den generativa processen
Ett annat sätt att analysera tvetydigheten (för fråga 2) är att explicitera den generativa processen (alla dragningar är oberoende).
- Följande process leder till svaret :
- Rita sannolikt från
- Rita sannolikt från
- Kassera fall där det inte finns något B
- Observera
- Följande process leder till svaret :
- Rita sannolikt från
- Rita sannolikt från
- Rita index sannolikt från
- Observera
Bayesiansk analys
Efter klassiska sannolikhetsargument betraktar vi en stor urna som innehåller två barn. Vi antar lika stor sannolikhet att antingen är en pojke eller en flicka. De tre urskiljbara fallen är således:
- båda är tjejer (GG) – med sannolikhet P(GG) = 1 / 4 ,
- båda är pojkar (BB) – med sannolikheten P(BB) = 1 / 4 , och
- en av varje (G·B) – med sannolikheten P(G·B) = 1 / 2 .
Dessa är de tidigare sannolikheterna.
Nu lägger vi till det ytterligare antagandet att "minst en är en pojke" = B. Med Bayes' sats finner vi
där P(A|B) betyder "sannolikhet för A givet B". P(B|BB) = sannolikheten för minst en pojke givet att båda är pojkar = 1. P(BB) = sannolikheten för båda pojkarna = 1/4 från . den tidigare fördelningen P(B) = sannolikheten för att minst en är en pojke, vilket inkluderar fallen BB och G·B = 1 / 4 + 1 / 2 = 3 / 4 .
1/3 BB även om det naturliga antagandet verkar vara en sannolikhet på , 1/2 det , så ( ) härledda värdet på verkar lågt, är det faktiska "normala" värdet för 1/3 1/4 P så är faktiskt lite högre .
Paradoxen uppstår eftersom det andra antagandet är något artificiellt, och när man beskriver problemet i en faktisk miljö blir det lite klibbigt. Hur vet vi att "minst" en är en pojke? En beskrivning av problemet säger att vi tittar in i ett fönster, ser bara ett barn och det är en pojke. Detta låter som samma antagande. Den här motsvarar dock att "sampla" fördelningen (dvs. ta bort ett barn från urnan, försäkra sig om att det är en pojke och sedan ersätta). Låt oss kalla påståendet "provet är en pojke" proposition "b". Nu har vi:
Skillnaden här är P(b), som bara är sannolikheten att dra en pojke från alla möjliga fall (dvs utan "minst"), vilket är klart 1/2 .
Den Bayesianska analysen generaliserar lätt till fallet där vi slappnar av 50:50 befolkningsantagandet. Om vi inte har någon information om populationerna så antar vi en "flat prior", dvs P(GG) = P(BB) = P(G·B) = 1 / 3 . I det här fallet ger antagandet "minst" resultatet P(BB|B) = 1 / 2 , och samplingsantagandet ger P(BB|b) = 2 / 3 , ett resultat som också kan härledas från Successionsregeln .
Martingale analys
Anta att man hade satsat på att Mr Smith hade två pojkar och fått rättvisa odds. En betalar $1 och de kommer att få $4 om han har två pojkar. Deras insats kommer att öka i värde när goda nyheter kommer. Vilka bevis skulle göra dem gladare över sin investering? Att lära sig att minst ett barn av två är en pojke, eller att lära sig att minst ett barn av ett är en pojke?
Det senare är a priori mindre troligt, och därför bättre nyheter. Det är därför de två svaren inte kan vara desamma.
Nu till siffrorna. Om vi satsar på ett barn och vinner har värdet på deras investering fördubblats. Det måste fördubblas igen för att komma till $4, så oddsen är 1 på 2.
Å andra sidan om man får veta att minst ett av två barn är en pojke, ökar investeringen som om de hade satsat på denna fråga. Vår $1 1 + 1/3 . är nu värd $ För att komma till $4 måste vi fortfarande tredubbla vår förmögenhet. Så svaret är 1 av 3.
Varianter av frågan
Efter att Gardners popularisering av paradoxen har presenterats och diskuterats i olika former. Den första varianten som presenteras av Bar-Hillel & Falk har följande lydelse:
- Mr. Smith är tvåbarnspappa. Vi möter honom gå längs gatan med en ung pojke som han stolt presenterar som sin son. Vad är sannolikheten att Mr Smiths andra barn också är en pojke?
Bar-Hillel & Falk använder denna variant för att belysa vikten av att beakta de underliggande antagandena. Det intuitiva svaret är 1/2 och när man . gör de mest naturliga antagandena är detta korrekt Men någon kan hävda att "...innan Mr. Smith identifierar pojken som sin son, vet vi bara att han antingen är far till två pojkar, BB, eller till två flickor, GG, eller till en av varje i någon av dem födelseordning, dvs BG eller GB. Om vi återigen antar oberoende och ekvisannolikhet börjar vi med en sannolikhet på 1/4 att Smith är far till två pojkar. Upptäcker att han har minst en pojke utesluter händelsen GG. Eftersom de återstående tre händelser var lika sannolika, vi får en sannolikhet på 1/3 för " BB.
Det naturliga antagandet är att Mr. Smith valde barnets sällskap på måfå. Om så är fallet, eftersom kombinationen BB har dubbelt så stor sannolikhet att antingen BG eller GB har resulterat i att pojken går följeslagare (och kombinationen GG har noll sannolikhet, vilket utesluter), blir föreningen av händelser BG och GB lika sannolik med händelse BB, och så chansen att det andra barnet också är en pojke är 1/2 . Bar-Hillel & Falk föreslår dock ett alternativt scenario. De föreställer sig en kultur där pojkar alltid väljs framför flickor som promenadkompisar. 1/3 här lika fallet antas kombinationerna av BB, BG och GB sannolikt ha resulterat i att pojken går sällskap, och därmed är sannolikheten att det andra barnet också är en pojke .
1991 svarade Marilyn vos Savant på en läsare som bad henne att svara på en variant av Boy or Girl-paradoxen som inkluderade beaglar. 1996 publicerade hon frågan igen i en annan form. Frågorna 1991 och 1996 var respektive formulerade:
- En butiksinnehavare säger att hon har två nya beaglar att visa dig, men hon vet inte om de är manliga, kvinnliga eller ett par. Du säger till henne att du bara vill ha en hane och hon ringer till killen som badar dem. "Är åtminstone en en hane?" frågar hon honom. "Ja!" informerar hon dig med ett leende. Vad är sannolikheten att den andra är en man?
- Säg att en kvinna och en man (som inte är släkt) har två barn vardera. Vi vet att åtminstone ett av kvinnans barn är en pojke och att mannens äldsta barn är en pojke. Kan du förklara varför chansen att kvinnan får två pojkar inte är lika med chansen att mannen får två pojkar?
1/2 det gäller den andra chansen 1/3 . formuleringen gav Vos Savant det klassiska svaret att att kvinnan har två pojkar är cirka medan chansen att mannen har två pojkar är cirka Som svar på läsarens svar som ifrågasatte hennes analys genomförde vos Savant en undersökning av läsare med exakt två barn, varav minst ett är en pojke. Av 17 946 svar rapporterade 35,9 % två pojkar.
Vos Savants artiklar diskuterades av Carlton och Stansfield i en artikel 2005 i The American Statistician . Författarna diskuterar inte den möjliga tvetydigheten i frågan och drar slutsatsen att hennes svar är korrekt ur ett matematiskt perspektiv, givet antagandena att sannolikheten för att ett barn är en pojke eller flicka är lika, och att det andra barnets kön är oberoende. av den första. När det gäller hennes undersökning säger de att det "åtminstone bekräftar vos Savants korrekta påstående att "chanserna" som ställdes i den ursprungliga frågan, även om de låter liknande, är olika, och att den första sannolikheten säkerligen är närmare 1 på 3 än 1 i 2."
Carlton och Stansfield fortsätter med att diskutera de vanliga antagandena i Boy or Girl-paradoxen. De visar att manliga barn faktiskt är mer sannolika än kvinnliga barn, och att det andra barnets kön inte är oberoende av det förstas kön. Författarna drar slutsatsen att, även om antagandena i frågan strider mot observationer, har paradoxen fortfarande pedagogiskt värde, eftersom den "illustrerar en av de mer spännande tillämpningarna av betingad sannolikhet." De faktiska sannolikhetsvärdena spelar naturligtvis ingen roll; Syftet med paradoxen är att visa en till synes motsägelsefull logik, inte faktiska födelsetal.
Information om barnet
Anta att vi inte bara fick veta att Mr Smith har två barn, och ett av dem är en pojke, utan också att pojken föddes på en tisdag: ändrar detta de tidigare analyserna? Återigen beror svaret på hur denna information presenterades – vilken typ av urvalsprocess som gav denna kunskap.
I enlighet med problemets tradition, anta att i populationen av tvåbarnsfamiljer är könet på de två barnen oberoende av varandra, lika sannolikt pojke eller flicka, och att födelsedatumet för varje barn är oberoende av det andra barnet . Chansen att födas en viss veckodag är 1/7 .
Från Bayes sats att sannolikheten för två pojkar, givet att en pojke föddes på en tisdag, ges av:
Antag att sannolikheten att födas på en tisdag är ε = 1/7 lösningen . som kommer att ställas in efter att man kommit fram till den allmänna Den andra faktorn i täljaren är helt enkelt . 1/4 , sannolikheten att få två pojkar Den första termen i täljaren är sannolikheten för att minst en pojke föds på tisdag, givet att familjen har två pojkar, eller 1 − (1 − ε ) 2 (en minus sannolikheten att ingen av pojkarna föds på tisdag). För nämnaren, låt oss dekomponera: . Varje term viktas med sannolikhet 1/4 . Den första termen är redan känd av föregående anmärkning, den sista termen är 0 (det finns inga pojkar). och är ε , det finns en och bara en pojke, så han har ε chans att födas på tisdag. Därför är den fullständiga ekvationen:
- För , detta reducerar till
Om ε nu är satt till 13/27 1/7 0,48 blir , . sannolikheten eller cirka I själva verket, när ε närmar sig 0, går den totala sannolikheten till 1 / 2 , vilket är det svar som förväntas när ett barn provtas (t.ex. det äldsta barnet är en pojke) och därför tas bort från poolen av möjliga barn. Med andra ord, när fler och fler detaljer om pojkebarnet ges (till exempel: född den 1 januari), närmar sig chansen att det andra barnet är en flicka hälften.
när irrelevant information infördes, men sannolikheten för det andra barnets kön har förändrats dramatiskt från vad det var tidigare (chansen att det andra barnet var en flicka var 2/3, det inte var känt att pojken var född på tisdag).
För att förstå varför det är så kan du tänka dig att Marilyn vos Savants läsarundersökning hade frågat vilken veckodag pojkar i familjen föddes. Om Marilyn sedan delade upp hela datamängden i sju grupper – en för varje veckodag en son föddes – skulle sex av sju familjer med två pojkar räknas i två grupper (gruppen för veckodagen för pojkens födelsedag 1, och gruppen för födelsedagen för pojke 2), vilket i varje grupp fördubblar sannolikheten för en pojke-pojke-kombination.
Men är det verkligen rimligt att familjen med minst en pojke född på en tisdag skapades genom att bara välja en av sådana familjer på måfå? Det är mycket lättare att föreställa sig följande scenario.
- Vi vet att Mr Smith har två barn. Vi knackar på hans dörr och en pojke kommer och öppnar dörren. Vi frågar pojken vilken veckodag han föddes.
Antag att vem av de två barnen som öppnar dörren bestäms av en slump. Sedan var proceduren (1) välja en tvåbarnsfamilj slumpmässigt från alla tvåbarnsfamiljer (2) välja ett av de två barnen slumpmässigt, (3) se om det är en pojke och fråga vilken dag han föddes . Chansen att det andra barnet är en flicka är 1/2 . Detta är en helt annan procedur än (1) att välja en tvåbarnsfamilj slumpmässigt från alla familjer med två barn, minst ett en pojke, född på en tisdag. Chansen att familjen består av en pojke och en flicka är 14/27 , cirka 0,52.
Denna variant av pojk- och flickproblemet diskuteras på många internetbloggar och är föremål för en artikel av Ruma Falk. Moralen i berättelsen är att dessa sannolikheter inte bara beror på den kända informationen, utan på hur den informationen erhölls.
Psykologisk utredning
Från den statistiska analysens ståndpunkt är den relevanta frågan ofta tvetydig och som sådan finns det inget "rätt" svar. Detta uttömmer dock inte pojk- eller flickparadoxen för det är inte nödvändigtvis tvetydigheten som förklarar hur den intuitiva sannolikheten härleds. 1/3 1/2 av människor antar en förståelse sannolikhetssvaret av Gardners problem att om de var konsekventa skulle de leda dem till sannolikhetssvaret, men överväldigande kommer människor intuitivt fram till . Oavsett tvetydighet gör detta problemet till intresse för psykologiska forskare som försöker förstå hur människor uppskattar sannolikhet.
Fox & Levav (2004) använde problemet (kallat Mr. Smith-problemet , krediterat Gardner, men inte formulerat exakt på samma sätt som Gardners version) för att testa teorier om hur människor uppskattar betingade sannolikheter. I denna studie presenterades paradoxen för deltagarna på två sätt:
- "Mr Smith säger: "Jag har två barn och åtminstone ett av dem är en pojke." Med tanke på denna information, vad är sannolikheten att det andra barnet är en pojke?"
- "Mr Smith säger: "Jag har två barn och det är inte så att de båda är flickor." Med tanke på denna information, vad är sannolikheten att båda barnen är pojkar?"
Författarna hävdar att den första formuleringen ger läsaren det felaktiga intrycket att det finns två möjliga utfall för det "andra barnet", medan den andra formuleringen ger läsaren intrycket att det finns fyra möjliga utfall, varav ett har förkastats (som resulterar i där 1/3 ) . är sannolikheten för att båda barnen är pojkar, eftersom det finns 3 återstående möjliga utfall, varav endast ett är att båda barnen är pojkar Studien fann att 85 % av deltagarna svarade 1/2 formuleringen . för den första formuleringen, medan endast 39 % svarade på det sättet på den andra Författarna hävdade att anledningen till att människor svarar olika på varje fråga (tillsammans med andra liknande problem, såsom Monty Hall-problemet och Bertrands box-paradox ) är på grund av användningen av naiva heuristik som misslyckas med att korrekt definiera antalet möjliga utfall.
Se även
- Bertrand paradox (sannolikhet)
- Slips paradox
- Törnrosa problem
- St Petersburg paradox
- Problem med två kuvert
- Lista över paradoxer
externa länkar
- Minst en tjej på MathPages
- Ett problem med två björnungar
- Lewis Carrolls kuddproblem
- När intuition och matematik förmodligen ser fel ut