Förvirrande

Medan en mediator är en faktor i kausalkedjan (ovan), är en konfounder en falsk faktor som felaktigt antyder orsakssamband (nederst)

Inom statistik är en confounder (även confounding variabel , confounding factor , extern determinant eller lurande variabel ) en variabel som påverkar både den beroende variabeln och den oberoende variabeln , vilket orsakar en falsk association . Confounding är ett kausalt begrepp och kan som sådant inte beskrivas i termer av korrelationer eller associationer. Förekomsten av confounders är en viktig kvantitativ förklaring till varför korrelation inte innebär orsakssamband .

Förväxlingar är hot mot intern giltighet .

Definition

Confounding definieras i termer av den datagenererande modellen. Låt X vara någon oberoende variabel och Y någon beroende variabel . För att uppskatta effekten av X Y måste statistikern undertrycka effekterna av främmande variabler som påverkar både X och Y. Vi säger att X och Y förväxlas med någon annan variabel Z närhelst Z påverkar både X och Y kausalt .

Låt vara sannolikheten för händelse Y = y under den hypotetiska interventionen X = x . X och Y förväxlas inte om och endast om följande gäller:

 

 

 

 

()

för alla värden X = x och Y = y , där är den villkorade sannolikheten vid att se X = x . Intuitivt anger denna likhet att X och Y inte förväxlas närhelst den observationsmässigt bevittnade associationen mellan dem är densamma som den association som skulle mätas i ett kontrollerat experiment , med x randomiserat .

I princip är den definierande likheten kan verifieras från den datagenererande modellen, förutsatt att vi har alla ekvationer och sannolikheter förknippade med modellen. Detta görs genom att simulera en intervention (se Bayesianskt nätverk ) och kontrollera om den resulterande sannolikheten för Y är lika med den betingade sannolikheten . Det visar sig dock att enbart grafstrukturen är tillräcklig för att verifiera likheten .

Kontrollera

Betrakta en forskare som försöker bedöma effektiviteten av läkemedel X , från befolkningsdata där läkemedelsanvändning var patientens val. Data visar att kön ( Z ) påverkar en patients val av läkemedel samt deras chanser att återhämta sig ( Y ). I det här scenariot förväxlar kön Z förhållandet mellan X och Y eftersom Z är en orsak till både X och Y :

Causal diagram of Gender as common cause of Drug use and Recovery

Det har vi

 

 

 

 

()

eftersom observationskvantiteten innehåller information om korrelationen mellan X och Z , och interventionskvantiteten inte gör det (eftersom X inte är korrelerad med Z i ett randomiserat experiment). Det kan visas att, i fall där endast observationsdata är tillgängliga, en opartisk uppskattning av den önskade kvantiteten , kan erhållas genom att "justera" för alla störande faktorer, nämligen betingning av deras olika värden och medelvärdesberäkning av resultatet. I fallet med en enda konfounder Z leder detta till "justeringsformeln":

 

 

 

 

()

vilket ger en opartisk uppskattning för den kausala effekten av X Y . Samma justeringsformel fungerar när det finns flera konfounders förutom att i det här fallet måste valet av en uppsättning Z av variabler som skulle garantera opartiska uppskattningar göras med försiktighet. Kriteriet för ett korrekt val av variabler kallas Back-Door och kräver att den valda uppsättningen Z "blockerar" (eller skär upp) varje väg mellan X och Y som innehåller en pil till X. Sådana uppsättningar kallas "Back-Door amissible " och kan inkludera variabler som inte är vanliga orsaker till X och Y , utan bara proxy därav.

För att återgå till exemplet med droganvändning, eftersom Z överensstämmer med kravet på bakdörr (dvs. den avlyssnar den ena bakdörrsvägen , justeringen av bakdörren formeln är giltig:

 

 

 

 

()

På detta sätt kan läkaren förutsäga den sannolika effekten av att administrera läkemedlet från observationsstudier där de villkorade sannolikheterna som förekommer på höger sida av ekvationen kan uppskattas genom regression.

I motsats till vad man tror kan lägga till kovariater till justeringsuppsättningen Z introducera bias. Ett typiskt motexempel uppstår när Z är en vanlig effekt av X och Y , ett fall där Z inte är en confounder (dvs. nolluppsättningen är tillåten bakdörr) och justering för Z skulle skapa bias som kallas " kolliderarbias " eller " Berksons paradox ." Kontroller som inte är bra konfounders kallas ibland för dåliga kontroller .

I allmänhet kan confounding kontrolleras genom justering om och endast om det finns en uppsättning observerade kovariater som uppfyller bakdörrsvillkoret. Dessutom, om Z är en sådan uppsättning, då är justeringsformeln för ekv. (3) är giltig. Pearls do-calculus ger alla möjliga förhållanden under vilka kan uppskattas, inte nödvändigtvis genom justering.

Historia

Enligt Morabia (2011) kommer ordet från det medeltida latinska verbet "confudere", som betydde "blandning", och valdes förmodligen för att representera förvirringen (från latin: con=med + fusus=mixa eller smälta ihop) mellan orsak man vill bedöma och andra orsaker som kan påverka utfallet och därmed förvirra, eller stå i vägen för den önskade bedömningen. Fisher använde ordet "förvirrande" i sin bok "The Design of Experiments" från 1935 för att beteckna någon felkälla i hans ideal om randomiserade experiment. Enligt Vandenbroucke (2004) var det Kish som använde ordet "förvirrande" i ordets moderna betydelse, för att betyda "ojämförbarhet" av två eller flera grupper (t.ex. exponerade och oexponerade) i en observationsstudie.

Formella villkor som definierar vad som gör vissa grupper "jämförbara" och andra "ojämförbara" utvecklades senare inom epidemiologin av Grönland och Robins (1986) med användning av det kontrafaktiska språket av Neyman (1935) och Rubin (1974). Dessa kompletterades senare med grafiska kriterier som bakdörrens tillstånd ( Pearl 1993; Grönland, Pearl och Robins, 1999).

Grafiska kriterier visade sig vara formellt likvärdiga med den kontrafaktiska definitionen men mer transparenta för forskare som förlitar sig på processmodeller.

Typer

När det gäller riskbedömningar som utvärderar omfattningen och arten av risker för människors hälsa , är det viktigt att kontrollera för förvirring för att isolera effekten av en viss fara, såsom en livsmedelstillsats, bekämpningsmedel eller nytt läkemedel. För prospektiva studier är det svårt att rekrytera och screena efter volontärer med samma bakgrund (ålder, kost, utbildning, geografi etc.), och i historiska studier kan det finnas liknande variationer. På grund av oförmågan att kontrollera för variationer hos frivilliga och mänskliga studier, är förvirring en särskild utmaning. Av dessa skäl experiment ett sätt att undvika de flesta former av förvirring.

Inom vissa discipliner kategoriseras confounding i olika typer. Inom epidemiologi är en typ "confounding by indication", vilket hänför sig till confounding från observationsstudier . Eftersom prognostiska faktorer kan påverka behandlingsbeslut (och bias uppskattningar av behandlingseffekter), kan kontroll för kända prognostiska faktorer minska detta problem, men det är alltid möjligt att en glömd eller okänd faktor inte inkluderades eller att faktorer interagerar komplext. Förvirring genom indikation har beskrivits som den viktigaste begränsningen för observationsstudier. Randomiserade studier påverkas inte av förväxling med indikation på grund av slumpmässig tilldelning .

Förväxlande variabler kan också kategoriseras efter deras källa. Valet av mätinstrument (operationell förvirring), situationella egenskaper (processmässig förvirring) eller interindividuella skillnader (personförvirring).

  • En operationell förvirring kan uppstå i både experimentella och icke-experimentella forskningsdesigner. Denna typ av förvirring uppstår när ett mått som är utformat för att bedöma en viss konstruktion av misstag också mäter något annat.
  • En procedurförväxling kan uppstå i ett laboratorieexperiment eller ett kvasi-experiment . Denna typ av förvirring uppstår när forskaren av misstag låter en annan variabel ändras tillsammans med den manipulerade oberoende variabeln.
  • En personförvirring uppstår när två eller flera grupper av enheter analyseras tillsammans (t.ex. arbetare från olika yrken), trots att de varierar enligt en eller flera andra (observerade eller oobserverade) egenskaper (t.ex. kön).

Exempel

Säg att man studerar sambandet mellan födelseordning (1:a barnet, 2:a barnet, etc.) och förekomsten av Downs syndrom hos barnet. I det här scenariot skulle moderns ålder vara en förvirrande variabel:

  1. Högre moderns ålder är direkt associerad med Downs syndrom hos barnet
  2. Högre moderns ålder är direkt associerad med Downs syndrom, oavsett födelseordning (en mamma som får sitt första mot 3:e barn vid 50 års ålder ger samma risk)
  3. Moderns ålder är direkt associerad med födelseordningen (det andra barnet, utom i fallet med tvillingar, föds när modern är äldre än hon var vid födelsen av det första barnet)
  4. Moderns ålder är inte en konsekvens av födelseordningen (att få ett andra barn förändrar inte moderns ålder)

I riskbedömningar påverkar faktorer som ålder, kön och utbildningsnivå ofta hälsotillståndet och bör därför kontrolleras. Utöver dessa faktorer kanske forskare inte överväger eller har tillgång till data om andra orsaksfaktorer. Ett exempel är studien av röktobak på människors hälsa. Rökning, alkoholkonsumtion och kost är livsstilsaktiviteter som är relaterade. En riskbedömning som tittar på effekterna av rökning men inte kontrollerar alkoholkonsumtion eller kost kan överskatta risken för rökning. Rökning och confounding granskas i yrkesriskbedömningar såsom säkerheten vid kolbrytning. När det inte finns en stor urvalspopulation av icke-rökare eller icke-drickare i ett visst yrke, kan riskbedömningen vara partisk för att finna en negativ effekt på hälsan.

Minskar risken för förvirring

En minskning av potentialen för förekomst och effekt av störande faktorer kan erhållas genom att öka typen och antalet jämförelser som utförs i en analys. Om mätningar eller manipulationer av kärnkonstruktioner är förvirrade (dvs. operationella eller procedurmässiga förvirringar finns), kanske inte undergruppsanalys avslöjar problem i analysen. Att öka antalet jämförelser kan dessutom skapa andra problem (se flera jämförelser ) .

Peer review är en process som kan hjälpa till att minska fall av förvirring, antingen före studiens genomförande eller efter att analys har skett. Peer review förlitar sig på samlad expertis inom en disciplin för att identifiera potentiella svagheter i studiedesign och analys, inklusive sätt på vilka resultat kan bero på förvirring. På liknande sätt replikering testa om resultaten från en studie är robusta under alternativa studieförhållanden eller alternativa analyser (t.ex. kontroll av potentiella förvirringar som inte identifierats i den initiala studien).

Förvirrande effekter kan vara mindre sannolikt att uppstå och agera på liknande sätt vid flera tidpunkter och platser. [ citat behövs ] När man väljer studieplatser kan miljön karakteriseras i detalj på studieplatserna för att säkerställa att platserna är ekologiskt lika och därför mindre benägna att ha förvirrande variabler. Slutligen kan sambandet mellan de miljövariabler som eventuellt förvirrar analysen och de uppmätta parametrarna studeras. Informationen om miljövariabler kan sedan användas i platsspecifika modeller för att identifiera kvarvarande varians som kan bero på verkliga effekter.

Beroende på vilken typ av studiedesign som finns finns det olika sätt att ändra designen för att aktivt utesluta eller kontrollera störande variabler:

  • Fall-kontrollstudier tilldelar konfounders till både grupper, fall och kontroller, lika mycket. Till exempel, om någon ville studera orsaken till hjärtinfarkt och tror att åldern är en trolig störande variabel, kommer varje 67-årig infarktpatient att matchas med en frisk 67-årig "kontrollperson". I fall-kontrollstudier är matchade variabler oftast ålder och kön. Nackdel: Fallkontrollstudier är möjliga endast när det är lätt att hitta kontroller, dvs personer vars status gentemot alla kända potentiella störande faktorer är densamma som hos patienten: Antag att en fallkontrollstudie försöker hitta orsaken till en viss sjukdom hos en person som är 1) 45 år gammal, 2) afroamerikan, 3) från Alaska , 4) en ivrig fotbollsspelare, 5) vegetarian och 6) arbetar inom utbildning. En teoretiskt perfekt kontroll skulle vara en person som, förutom att inte ha sjukdomen som utreds, matchar alla dessa egenskaper och inte har några sjukdomar som patienten inte också har — men att hitta en sådan kontroll skulle vara en enorm uppgift.
  • Kohortstudier : En grad av matchning är också möjlig och det görs ofta genom att endast släppa in vissa åldersgrupper eller ett visst kön i studiepopulationen, skapa en kohort av personer som delar liknande egenskaper och därmed är alla kohorter jämförbara med avseende på ev. konfunderande variabel. Till exempel, om ålder och kön anses vara förväxlande, skulle endast 40 till 50 år gamla män vara involverade i en kohortstudie som skulle bedöma risken för hjärtinfarkt i kohorter som antingen är fysiskt aktiva eller inaktiva. Nackdel: I kohortstudier kan överexkluderingen av indata få forskare att för snävt definiera uppsättningen av liknande personer som de hävdar att studien är användbar för, så att andra personer som orsakssambandet faktiskt gäller kan förlora möjlighet att dra nytta av studiens rekommendationer. På liknande sätt kan "överstratifiering" av indata inom en studie minska urvalsstorleken i ett givet stratum till den punkt där generaliseringar som dras genom att observera medlemmarna i det stratum enbart inte är statistiskt signifikanta .
  • Dubbelblindning : döljer deltagarnas medlemskap i experimentgruppen för försökspopulationen och observatörerna. Genom att hindra deltagarna från att veta om de får behandling eller inte placeboeffekten vara densamma för kontroll- och behandlingsgruppen. Genom att hindra observatörerna från att känna till deras medlemskap bör det inte finnas någon partiskhet från forskare som behandlar grupperna olika eller från att tolka resultaten annorlunda.
  • Randomiserad kontrollerad studie : En metod där studiepopulationen delas upp slumpmässigt för att minska chanserna för självval av deltagare eller partiskhet från studiedesignerna. Innan experimentet börjar kommer testarna att tilldela medlemmarna i deltagarpoolen till sina grupper (kontroll, intervention, parallell), med hjälp av en randomiseringsprocess såsom användning av en slumptalsgenerator. Till exempel, i en studie om effekterna av träning skulle slutsatserna vara mindre giltiga om deltagarna fick ett val om de ville tillhöra kontrollgruppen som inte skulle träna eller interventionsgruppen som skulle vara villiga att delta i en träningsprogram. Studien skulle sedan fånga andra variabler förutom träning, såsom hälsonivåer före experimentet och motivation att anta hälsosamma aktiviteter. Från observatörens sida kan försöksledaren välja kandidater som är mer benägna att visa de resultat som studien vill se eller kan tolka subjektiva resultat (mer energisk, positiv attityd) på ett sätt som gynnar deras önskemål.
  • Stratifiering : Som i exemplet ovan anses fysisk aktivitet vara ett beteende som skyddar mot hjärtinfarkt; och ålder antas vara en möjlig konfunderare. De data som provtas stratifieras sedan efter åldersgrupp – detta innebär att sambandet mellan aktivitet och infarkt skulle analyseras per åldersgrupp. Om de olika åldersgrupperna (eller åldersskikten) ger mycket olika riskkvoter måste ålder ses som en störande variabel. Det finns statistiska verktyg, bland dem Mantel-Haenszel-metoder, som står för stratifiering av datamängder.
  • Att kontrollera för confounding genom att mäta de kända confounders och inkludera dem som kovariater är multivariabel analys såsom regressionsanalys . Multivariata analyser avslöjar mycket mindre information om styrkan eller polariteten hos den störande variabeln än vad stratifieringsmetoder gör. Till exempel, om multivariat analys kontrollerar för antidepressiva medel , och den inte stratifierar antidepressiva medel för TCA och SSRI , kommer den att ignorera att dessa två klasser av antidepressiva medel har motsatta effekter på hjärtinfarkt, och den ena är mycket starkare än den andra.

Alla dessa metoder har sina nackdelar:

  1. Det bästa tillgängliga försvaret mot möjligheten till falska resultat på grund av förväxling är ofta att avstå från ansträngningar med stratifiering och istället genomföra en randomiserad studie av ett tillräckligt stort urval taget som helhet, så att alla potentiella förvirrande variabler (kända och okända) blir fördelas av en slump över alla studiegrupper och kommer därför att vara okorrelerade med den binära variabeln för inkludering/exkludering i vilken grupp som helst.
  2. Etiska överväganden: I dubbelblinda och randomiserade kontrollerade studier är deltagarna inte medvetna om att de är mottagare av skenbehandlingar och kan nekas effektiva behandlingar. Det finns en möjlighet att patienter endast går med på invasiv kirurgi (som medför verkliga medicinska risker) under förutsättning att de får behandling. Även om detta är ett etiskt problem, är det inte en fullständig redogörelse för situationen. För operationer som för närvarande utförs regelbundet, men för vilka det inte finns några konkreta bevis för en äkta effekt, kan det finnas etiska problem att fortsätta med sådana operationer. Under sådana omständigheter utsätts många människor för de verkliga riskerna med operation men dessa behandlingar kan möjligen inte ge någon märkbar fördel. Sham-kirurgi kontroll är en metod som kan göra det möjligt för medicinsk vetenskap att avgöra om ett kirurgiskt ingrepp är effektivt eller inte. Med tanke på att det finns kända risker förknippade med medicinska operationer är det tveksamt etiskt att tillåta overifierade operationer att utföras i all oändlighet in i framtiden.

Artefakter

Artefakter är variabler som borde ha varierats systematiskt, antingen inom eller över studier, men som av misstag hölls konstant. Artefakter är alltså hot mot extern validitet . Artefakter är faktorer som samvarierar med behandlingen och resultatet. Campbell och Stanley identifierar flera artefakter. De största hoten mot intern validitet är historia, mognad, testning, instrumentering, statistisk regression , urval, experimentell mortalitet och interaktioner mellan urval och historia.

Ett sätt att minimera påverkan av artefakter är att använda en kontrollgruppsdesign före test efter test . Inom denna design, "grupper av människor som initialt är likvärdiga (vid förtestfasen) tilldelas slumpmässigt för att få den experimentella behandlingen eller ett kontrolltillstånd och bedöms sedan igen efter denna differentiella erfarenhet (eftertestfasen)". Således är eventuella effekter av artefakter (helst) lika fördelade på deltagarna i både behandlings- och kontrollförhållanden.

Se även

Vidare läsning

externa länkar