Boken om varför

Boken om varför: Den nya vetenskapen om orsak och verkan
The Book of Why.jpg
Första upplagan (USA)
Författare Judea Pearl och Dana Mackenzie
Språk engelsk
Ämnen Causality , Causal Inferens , Statistik
Utgivare
Basic Books (USA) Penguin (Storbritannien)
Publiceringsdatum
2018
ISBN 9780141982410
Föregås av Causal inference in Statistics: A Primer

The Book of Why: The New Science of Cause and Effect är en facklitteratur från 2018 av datavetaren Judea Pearl och författaren Dana Mackenzie. Boken utforskar ämnet kausalitet och kausal slutledning ur statistiska och filosofiska synvinklar för en allmän publik.

Sammanfattning

Boken består av tio kapitel och en introduktion.

Introduktion: Mind over Data

Inledningen beskriver otillräckligheten hos det tidiga 1900-talets statistiska metoder för att göra uttalanden om orsakssamband mellan variabler. Författarna beskriver sedan vad de kallar "The Causal Revolution", som startade i mitten av 1900-talet, och gav nya konceptuella och matematiska verktyg för att beskriva orsakssamband.

Kapitel 1: Orsaksstegen

Kapitel 1 introducerar 'kausalitetstrappan' - ett diagram som används för att illustrera de tre nivåerna av orsaksresonemang. Den första nivån heter 'Association', som diskuterar samband mellan variabler. Frågor som "är variabel X associerad med variabel Y?" kan besvaras på denna nivå. Det är dock avgörande att kausalitet inte åberopas. Ett exempel på resonemang på denna första nivå är observationen att en galande tupp är förknippad med soluppgången. Den här typen av resonemang kan dock inte beskriva orsakssamband. Vi kan till exempel inte säga om soluppgången får tuppen att gala, eller om tuppen får solen att gå upp. Många av det tidiga 1900-talets statistiska verktyg, såsom korrelation och regression , fungerar på denna nivå.

Den andra nivån (eller 'steg') på orsaksstegen är märkt 'Intervention'. Resonemang på denna nivå svarar på frågor av formen 'om jag gör interventionen X, hur kommer detta att påverka sannolikheten för utfallet Y?'. Till exempel, frågan "ökar rökning min chans att drabbas av lungcancer?" finns på den andra nivån av orsaksstegen. Denna typ av resonemang åberopar kausalitet och kan användas för att undersöka fler frågor än resonemanget från första steget.

Det tredje steget på orsaksstegen är märkt "Kontrafakta" och innebär att besvara frågor som frågar vad som kan ha varit om omständigheterna varit annorlunda. Sådana resonemang åberopar kausalitet i högre grad än den tidigare nivån. Ett exempel på kontrafaktisk fråga som ges i boken är "Skulle Kennedy vara vid liv om Oswald inte hade dödat honom?"

Kapitel 2: Från sjöfarare till marsvin : The Genesis of Causal Inference

Kapitel 2 börjar med en kort sammanfattning av Francis Galtons och Karl Pearsons bidrag till utvecklingen av statistik under det sena 1800-talet och början av 1900-talet. Författarna klandrar Galton för att hålla studien av statistik på första steget av orsaksstegen och avskräcka all diskussion om kausalitet i statistik. Orsaksanalys med hjälp av vägdiagram introduceras sedan genom förklaringarna av Sewall Wrights arbete .

Kapitel 3: Från bevis till orsaker: Pastor Bayes träffar Mr Holmes

Kapitel 3 ger en introduktion till Bayes sats . Sedan introduceras Bayesian Networks . Slutligen diskuteras kopplingarna mellan Bayesianska nätverk och kausala diagram.

Kapitel 4: Förväxling och dekonfounding, eller, döda den lurande variabeln

Det här kapitlet introducerar idén om förväxling och beskriver hur kausala diagram kan användas för att identifiera störande variabler och bestämma deras effekt. Pearl förklarar att randomiserade kontrollerade studier (RCT) kan användas för att omintetgöra effekten av confounders, men visar att, förutsatt att man har en orsaksmodell för confounding, behöver en RCT inte nödvändigtvis utföras för att få resultat.

Kapitel 5: Den rökfyllda debatten: Rensa luften

Det här kapitlet tar ett historiskt förhållningssätt till frågan "orsakar rökning lungcancer?", med fokus på argumenten från Abraham Lilienfeld , Jacob Yerushalmy, Ronald Fisher och Jerome Cornfield . Författarna förklarar att även om cigarettrökning var tydligt korrelerad med lungcancer, trodde vissa, såsom Fisher och Yerushalmy, att de två variablerna förväxlades och argumenterade mot hypotesen att cigaretter orsakade cancern . Författarna förklarar sedan hur orsaksresonemang (som utvecklats i resten av boken) kan användas för att hävda att cigaretter verkligen orsakar cancer.

Kapitel 6: Paradoxer i överflöd!

Detta kapitel undersöker flera paradoxer, inklusive Monty Hall-problemet , Simpsons paradox , Berksons paradox och Lords paradox . Författarna visar hur dessa paradoxer kan lösas med hjälp av kausala resonemang.

Kapitel 7: Beyond Adjustment: The Conquest of Mount Intervention

Det här kapitlet tittar på den "andra stegen" på orsaksstegen som introducerades i kapitel 1. Författarna beskriver hur man använder kausala diagram för att fastställa orsakseffekten av att utföra interventioner (t.ex. rökning) på utfall (som lungcancer). "front-door-kriteriet" och "göra-kalkylen" introduceras som verktyg för att göra detta. Kapitlet avslutas med två exempel, som används för att introducera användningen av instrumentella variabler för att uppskatta orsakssamband. Den första är John Snows upptäckt att kolera orsakas av ohygieniska vattenförråd. Det andra är förhållandet mellan kolesterolnivåer och sannolikheten för en hjärtattack.

Kapitel 8: Kontrafakta: Gruvvärldar som kunde ha varit

Detta kapitel undersöker det tredje steget av orsaksstegen: kontrafakta. Kapitlet introducerar "strukturella kausala modeller", som tillåter resonemang om kontrafakta på ett sätt som traditionell (icke-kausal) statistik inte gör det. Därefter utforskas tillämpningarna av kontrafaktiska resonemang inom områdena klimatvetenskap och juridik.

Kapitel 9: Medling: Sökandet efter mekanismen

Detta kapitel diskuterar medling: den mekanism genom vilken en orsak leder till en effekt. Författarna diskuterar Barbara Stoddard Burks arbete om orsakerna till barns intelligens, policyn "algebra för alla" av Chicagos offentliga skolor och användningen av turneringar för att behandla stridssår.

Kapitel 10: Big Data, Artificiell Intelligens och de stora frågorna

Det sista kapitlet diskuterar användningen av kausala resonemang i big data och artificiell intelligens (AI) och det filosofiska problemet att AI skulle behöva reflektera över sina egna handlingar, vilket kräver kontrafaktiska (och därför kausala) resonemang.

Recensioner

Vetenskaplig bakgrund, utdrag, errata och en lista med 37 recensioner av The Book of Why finns på Judea Pearls webbsida.

The Book of Why recenserades av Jonathan Knee i The New York Times . Recensionen var positiv, där Knee kallade boken "upplysande". Han beskriver dock vissa delar av boken som "utmanande" och konstaterar att boken "inte alltid är fullt tillgänglig för läsare som inte delar författarens förkärlek för ekvationer".

Tim Maudlin gav boken en blandad recension i The Boston Review och kallade den för en "fantastisk översikt över det senaste inom kausal analys". Maudlin kritiserar dock införandet av "kontrafakta" som separata steg på "kausalitetstrappan", och säger att "[kontrafakta] är så nära sammanflätade med kausala påståenden att det inte är möjligt att tänka kausalt men inte kontrafaktiskt". Maudlin kritiserar också avsnittet om fri vilja för dess "oprecision och bristande förtrogenhet med den filosofiska litteraturen". Slutligen pekar han på arbetet av flera vetenskapsmän (inklusive Clark Glymour ) som utvecklade liknande idéer som Pearl, och hävdar att Pearl "kunde ha sparat sig själv bokstavligen år av ansträngning om han blivit informerad om detta arbete". I ett genmäle noterar Pearl att han vid den tiden var väl bekant med detta arbete.

Zoe Hackett, som skrev i Chemistry World , gav The Book of Why en positiv recension, med förbehållet att "[det kräver koncentration och en flitig ansträngning för att arbeta igenom de sinnesböjande statistiska problemen som finns i texten". Recensionen avslutas med att säga att "[denna] bok är ett måste för alla seriösa studerande i vetenskapsfilosofi och bör vara obligatorisk läsning för alla första års grundutbildningsstatistikkurser".

Lisa R. Goldberg skrev en detaljerad teknisk recension i Notices of the American Mathematical Society .