Basräntefel

Ett sjukhus med fler vaccinerade än ovaccinerade personer kan tyckas oroande till en början, men det är att vänta i en mycket vaccinerad befolkning

Basräntefelen , även kallad basränteförsummelse eller basräntebias , är en typ av misstag där människor tenderar att ignorera basräntan (dvs. allmän prevalens ) till förmån för den individuella informationen (dvs. information som endast hänför sig till en specifik fall). Basränteförsummelse är en specifik form av den mer allmänna förlängningsförsummelsen .

Falsk positiv paradox

Ett exempel på grundräntefelet är den falska positiva paradoxen . Denna paradox beskriver situationer där det finns fler falskt positiva testresultat än sant positiva. Till exempel, om en ansiktsigenkänningskamera kan identifiera eftersökta brottslingar till 99 % exakt, men analyserar 10 000 personer om dagen, uppvägs den höga noggrannheten av antalet tester, och programmets lista över brottslingar kommer sannolikt att ha mycket fler falska positiva än sant. Sannolikheten för ett positivt testresultat bestäms inte bara av testets noggrannhet utan också av egenskaperna hos den provtagna populationen. När prevalensen, andelen av dem som har ett givet tillstånd, är lägre än testets falskt positiva frekvens, kommer även test som har mycket låg risk att ge ett falskt positivt i ett enskilt fall ge fler falskt än sant positiva totalt sett . Paradoxen överraskar de flesta.

Det är särskilt kontraintuitivt när man tolkar ett positivt resultat i ett test på en lågprevalenspopulation efter att ha hanterat positiva resultat från en högprevalenspopulation. Om den falska positiva frekvensen av testet är högre än andelen av den nya populationen med tillståndet, kan en testadministratör vars erfarenhet har hämtats från testning i en population med hög prevalens dra slutsatsen av erfarenhet att ett positivt testresultat vanligtvis indikerar en positivt ämne, när det i själva verket är mycket mer sannolikt att ett falskt positivt har inträffat.

Exempel

Exempel 1: Sjukdom

Befolkning med hög förekomst


Antal personer
Infekterad Oinfekterad Total

Testa positivt

400 (riktigt positivt)

30 (falskt positivt)
430

Test negativt
0
(falskt negativ)

570 (true negativ)
570
Total 400 600 1000

Föreställ dig att köra ett infektionssjukdomstest på en population A på 1 000 personer, varav 40 % är infekterade. Testet har en falsk positiv frekvens på 5 % (0,05) och ingen falsk negativ frekvens. Det förväntade resultatet av de 1000 testerna på population A skulle vara:

Infekterad och test indikerar sjukdom ( sann positiv )
1000 × 40 / 100 = 400 personer skulle få ett sant positivt
Oinfekterat och test indikerar sjukdom ( falskt positivt )
1000 × 100 – 40 / 100 × 0,05 = 30 personer skulle få ett falskt positivt
Resten 570 tester är korrekt negativa.

Så i population A kan en person som får ett positivt test vara över 93 % säker ( 400 / 30 + 400 ) på att det korrekt indikerar infektion.

Befolkning med låg förekomst


Antal personer
Infekterad Oinfekterad Total

Testa positivt

20 (riktigt positivt)

49 (falskt positivt)
69

Test negativt
0
(falskt negativ)

931 (true negativ)
931
Total 20 980 1000

Betrakta nu samma test som tillämpas på population B , av vilken endast 2% är infekterade. Det förväntade resultatet av 1000 tester på population B skulle vara:

Infekterad och test indikerar sjukdom ( sann positiv )
1000 × 2 / 100 = 20 personer skulle få ett sant positivt
Oinfekterat och test indikerar sjukdom ( falskt positivt )
1000 × 100 – 2 / 100 × 0,05 = 49 personer skulle få ett falskt positivt
Resten 931 tester är korrekt negativa.

I population B är bara 20 av de totalt 69 personerna med ett positivt testresultat faktiskt infekterade. Så sannolikheten att faktiskt bli smittad efter att man fått veta att man är smittad är bara 29 % ( 20 / 20 + 49 ) för ett test som annars verkar vara "95% korrekt".

En testare med erfarenhet av grupp A kan tycka att det är en paradox att i grupp B , ett resultat som vanligtvis korrekt indikerade infektion nu vanligtvis är ett falskt positivt . Förväxlingen av den bakre sannolikheten för infektion med den tidigare sannolikheten att få ett falskt positivt är ett naturligt fel efter att ha fått ett hälsohotande testresultat.

Exempel 2: Berusade förare

En grupp poliser har alkomätare som visar falskt fylleri i 5 % av fallen där föraren är nykter. Men alkomätarna misslyckas aldrig med att upptäcka en verkligt berusad person. En av tusen förare kör rattfull. Anta att poliserna sedan stoppar en förare slumpmässigt för att utföra ett alkomtest. Det tyder på att föraren är berusad. Vi antar att du inte vet något annat om dem. Hur stor är sannolikheten att de verkligen är berusade?

Många skulle svara så högt som 95 %, men den korrekta sannolikheten är cirka 2 %.

En förklaring till detta är följande: i genomsnitt, för varje 1 000 testade förare,

  • 1 förare är berusad, och det är 100% säkert att för den föraren finns ett sant positivt testresultat, så det finns 1 sant positivt testresultat
  • 999 förare är inte berusade, och bland dessa förare finns det 5 % falskt positiva testresultat, så det finns 49,95 falskt positiva testresultat

Därför är sannolikheten att en av förarna bland de 1 + 49,95 = 50,95 positiva testresultaten verkligen är berusad .

Giltigheten av detta resultat beror dock på giltigheten av det ursprungliga antagandet att polismannen stoppade föraren verkligen på måfå, och inte på grund av dålig körning. Om det eller ett annat icke godtyckligt skäl för att stoppa föraren förelåg, så inbegriper beräkningen även sannolikheten för att en rattfyllerist kör behörigt och en icke rattfylld förare kör (o-)kompetent.

Mer formellt kan samma sannolikhet på ungefär 0,02 fastställas med Bayes teorem . Målet är att hitta sannolikheten att föraren är berusad med tanke på att alkomätaren visade att de är berusade, vilket kan representeras som

där D betyder att alkomätaren indikerar att föraren är berusad. Bayes teorem säger oss det

Vi fick höra följande i första stycket:

och

Som du kan se från formeln behöver man p ( D ) för Bayes sats, som man kan beräkna från de föregående värdena med hjälp av lagen om total sannolikhet :

vilket ger

Pluggar man in dessa siffror i Bayes sats, finner man det

Exempel 3: Terroristidentifiering

I en stad med 1 miljon invånare, låt det finnas 100 terrorister och 999 900 icke-terrorister. För att förenkla exemplet antas att alla människor som finns i staden är invånare. Sålunda är sannolikheten för att en slumpmässigt utvald invånare i staden är terrorist 0,0001, och sannolikheten för att samma invånare är en icke-terrorist är 0,9999. I ett försök att fånga terroristerna installerar staden ett larmsystem med en övervakningskamera och mjukvara för automatisk ansiktsigenkänning .

Programvaran har två felfrekvenser på 1 %:

  • Den falska negativa frekvensen: Om kameran skannar en terrorist kommer en klocka att ringa 99 % av gångerna och den kommer inte att ringa 1 % av gångerna.
  • Den falska positiva frekvensen: Om kameran skannar en icke-terrorist ringer inte en klocka 99 % av gångerna, men den ringer 1 % av gångerna.

Antag nu att en invånare utlöser larmet. Vad är sannolikheten att personen är terrorist? Med andra ord, vad är P(T | B), sannolikheten att en terrorist har upptäckts med tanke på klockans ringning? Någon som gör "basfrekvensfelet" skulle dra slutsatsen att det finns en 99% sannolikhet att den upptäckta personen är en terrorist. Även om slutsatsen verkar vara vettig, är det faktiskt dåligt resonemang, och en beräkning nedan kommer att visa att sannolikheten för en terrorist faktiskt är nära 1 %, inte nära 99 %.

Missförståndet uppstår genom att blanda ihop karaktärerna hos två olika felfrekvenser. "Antalet icke-klockor per 100 terrorister" och "antal icke-terrorister per 100 klockor" är orelaterade storheter. Det ena är inte nödvändigtvis lika med det andra, och de behöver inte ens vara nästan lika. För att visa detta, fundera på vad som händer om ett identiskt larmsystem sattes upp i en andra stad utan några terrorister alls. Liksom i den första staden ljuder larmet för 1 av 100 upptäckta icke-terroristinvånare, men till skillnad från i den första staden ljuder larmet aldrig för en terrorist. Därför är 100 % av alla larmtillfällen för icke-terrorister, men en falsk negativ frekvens kan inte ens beräknas. "Antalet icke-terrorister per 100 klockor" i den staden är 100, men ändå P(T | B) = 0%. Det är noll chans att en terrorist har upptäckts med tanke på klockans ringning.

Föreställ dig att den första stadens hela befolkning på en miljon människor passerar framför kameran. Cirka 99 av de 100 terroristerna kommer att utlösa larmet – och så kommer cirka 9 999 av de 999 900 icke-terroristerna att göra. Därför kommer cirka 10 098 personer att utlösa larmet, varav cirka 99 kommer att vara terrorister. Sannolikheten att en person som utlöser larmet faktiskt är en terrorist är bara cirka 99 av 10 098, vilket är mindre än 1%, och mycket, mycket långt under vår ursprungliga gissning på 99%.

Basräntefelet är så missvisande i det här exemplet eftersom det finns många fler icke-terrorister än terrorister, och antalet falska positiva (icke-terrorister skannade som terrorister) är så mycket större än de sanna positiva (terrorister skannade som terrorister).

Flera utövare har hävdat att eftersom basfrekvensen för terrorism är extremt låg, kan användning av datautvinning och prediktiva algoritmer för att identifiera terrorister inte fungera på grund av den falska positiva paradoxen. Uppskattningar av antalet falska positiva för varje korrekt resultat varierar från över tio tusen till en miljard; Följaktligen skulle det vara kostsamt och tidsödande att undersöka varje potentiell kund. Den noggrannhetsnivå som krävs för att göra dessa modeller livskraftiga är sannolikt omöjlig att uppnå. Framför allt betyder den låga basfrekvensen för terrorism också att det saknas data för att göra en korrekt algoritm. Vidare, i samband med att upptäcka terrorism är falska negativa negativa effekter högst oönskade och måste därför minimeras så mycket som möjligt, men detta kräver ökad känslighet på bekostnad av specificitet , ökande falska positiva. Det är också tveksamt om användningen av sådana modeller av brottsbekämpande myndigheter skulle uppfylla den erforderliga bevisbördan med tanke på att över 99 % av resultaten skulle vara falska positiva.

Fynd inom psykologi

I experiment har människor visat sig föredra individualiserad information framför allmän information när den förra är tillgänglig.

I vissa experiment ombads eleverna att uppskatta betygsgenomsnittet (GPA) för hypotetiska elever. När de fick relevant statistik om GPA-fördelning, tenderade eleverna att ignorera dem om de fick beskrivande information om den specifika eleven även om den nya beskrivande informationen uppenbarligen var av liten eller ingen relevans för skolprestationer. Detta fynd har använts för att argumentera för att intervjuer är en onödig del av högskolan eftersom intervjuare inte kan välja framgångsrika kandidater bättre än grundläggande statistik.

Psykologerna Daniel Kahneman och Amos Tversky försökte förklara detta fynd i termer av en enkel regel eller "heuristik" som kallas representativitet . De hävdade att många bedömningar som rör sannolikhet, eller orsak och verkan, är baserade på hur representativ en sak är för en annan eller för en kategori. Kahneman anser att försummelse av basräntan är en specifik form av försummelse för förlängning . Richard Nisbett har hävdat att vissa tillskrivningsfördomar som det grundläggande tillskrivningsfelet är exempel på basräntefelet: människor använder inte "konsensusinformationen" ("basfrekvensen") om hur andra betedde sig i liknande situationer och föredrar istället enklare dispositionstillskrivningar . .

Det finns en betydande debatt inom psykologi om de förhållanden under vilka människor uppskattar eller inte uppskattar information om baspris. Forskare i programmet heuristik och fördomar har betonat empiriska fynd som visar att människor tenderar att ignorera basräntor och dra slutsatser som bryter mot vissa normer för sannolikhetsresonemang, som Bayes sats . Slutsatsen från denna forskningslinje var att mänskligt probabilistiskt tänkande är fundamentalt felaktigt och felbenäget. Andra forskare har betonat kopplingen mellan kognitiva processer och informationsformat och hävdat att sådana slutsatser generellt sett inte är motiverade.

Betrakta exempel 2 från ovan igen. Den slutsats som krävs är att uppskatta den (bakre) sannolikheten att en (slumpmässigt utvald) förare är berusad, givet att alkomätet är positivt. Formellt kan denna sannolikhet beräknas med Bayes sats , som visas ovan. Det finns dock olika sätt att presentera relevant information. Tänk på följande, formellt likvärdiga variant av problemet:

1 av 1000 förare kör rattfull. Alkomätarna misslyckas aldrig med att upptäcka en verkligt berusad person. För 50 av de 999 förarna som inte är berusade visar alkomätaren falskt fylleri. Anta att poliserna sedan stoppar en förare på måfå och tvingar dem att göra ett alkomtest. Det tyder på att de är berusade. Vi antar att du inte vet något annat om dem. Hur stor är sannolikheten att de verkligen är berusade?

I detta fall presenteras den relevanta numeriska informationen — p (berusad), p ( D | berusad), p ( D | nykter) — i termer av naturliga frekvenser med avseende på en viss referensklass (se referensklassproblem ). Empiriska studier visar att människors slutsatser stämmer mer överens med Bayes regel när information presenteras på detta sätt, vilket hjälper till att övervinna försummelse av basnivån hos lekmän och experter. Som en konsekvens rekommenderar organisationer som Cochrane Collaboration att använda denna typ av format för att kommunicera hälsostatistik. Att lära människor att översätta dessa typer av Bayesianska resonemangsproblem till naturliga frekvensformat är mer effektivt än att bara lära dem att koppla in sannolikheter (eller procentsatser) i Bayes sats. Det har också visat sig att grafiska representationer av naturliga frekvenser (t.ex. ikonmatriser, hypotetiska utfallsdiagram) hjälper människor att dra bättre slutsatser.

Varför är naturliga frekvensformat användbara? En viktig anledning är att detta informationsformat underlättar den erforderliga slutsatsen eftersom det förenklar de nödvändiga beräkningarna. Detta kan ses när du använder ett alternativt sätt att beräkna den nödvändiga sannolikheten p (berusad| D ):

där N (berusad ∩ D ) anger antalet förare som är berusade och får ett positivt alkomätningsresultat, och N ( D ) anger det totala antalet fall med positivt alkomätningsresultat. Ekvivalensen av denna ekvation med ovanstående följer av sannolikhetsteorins axiom, enligt vilka N (berusad ∩ D ) = N × p ( D | full) × p (berusad). Viktigt, även om denna ekvation formellt motsvarar Bayes regel, är den inte psykologiskt ekvivalent. Att använda naturliga frekvenser förenklar slutledningen eftersom den nödvändiga matematiska operationen kan utföras på naturliga tal, istället för normaliserade bråk (dvs. sannolikheter), eftersom det gör det höga antalet falska positiva mer transparenta, och eftersom naturliga frekvenser uppvisar en "kapslad uppsättning strukturera".

Inte alla frekvensformat underlättar Bayesianska resonemang. Naturliga frekvenser hänvisar till frekvensinformation som är resultatet av naturlig sampling , som bevarar bashastighetsinformation (t.ex. antalet berusade förare när ett slumpmässigt urval av förare tas). Detta skiljer sig från systematisk provtagning , där basräntor är fastställda a priori (t.ex. i vetenskapliga experiment). I det senare fallet är det inte möjligt att sluta sig till den bakre sannolikheten p (berusad | positivt test) från att jämföra antalet förare som är berusade och testar positivt jämfört med det totala antalet personer som får ett positivt alkomätningsresultat, eftersom basfrekvensinformation är inte bevarad och måste uttryckligen återinföras med Bayes sats.

Se även

externa länkar