Spillover (experiment)
I experiment är en spillover en indirekt effekt på en person som inte behandlas direkt av experimentet. Dessa effekter är användbara för policyanalys men komplicerar den statistiska analysen av experiment.
Analys av spridningseffekter innebär att man lättar på antagandet om icke-interferens, eller SUTVA (Stable Unit Treatment Value Assumption). Detta antagande kräver att subjekt i :s avslöjande av dess potentiella utfall endast beror på patientens egen behandlingsstatus och är opåverkad av en annan patient j :s behandlingsstatus. I vanliga miljöer där forskaren försöker uppskatta den genomsnittliga behandlingseffekten ( ), innebär brott mot antagandet om icke-interferens att traditionella estimatorer för ATE, såsom skillnad- in-medel, kan vara partisk . Det finns dock många verkliga fall där en enhets avslöjande av potentiella resultat beror på en annan enhets behandlingsuppdrag, och att analysera dessa effekter kan vara lika viktigt som att analysera den direkta effekten av behandlingen.
En lösning på detta problem är att omdefiniera den kausala bedömningen av intresse genom att omdefiniera en patients potentiella resultat i termer av ens egen behandlingsstatus och relaterade subjekts behandlingsstatus. Forskaren kan sedan analysera olika uppskattningar av intresse separat. Ett viktigt antagande här är att denna process fångar alla mönster av spillovers , och att det inte finns några omodellerade spillovers kvar (ex. spillovers inträffar inom ett tvåmanshushåll men inte utanför).
När de potentiella resultaten har omdefinierats, involverar resten av den statistiska analysen att modellera sannolikheterna för att utsättas för behandling givet ett schema för behandlingsuppdrag, och att använda invers sannolikhetsviktning (IPW) för att producera opartiska (eller asymptotiskt opartiska) uppskattningar av uppskattningen av intressera.
Exempel på spridningseffekter
Spillover-effekter kan uppstå på en mängd olika sätt. Vanliga applikationer inkluderar analys av sociala nätverksspillovers och geografiska spillovers. Exempel inkluderar följande:
- Kommunikation : En intervention som förmedlar information om en teknologi eller produkt kan påverka andras beslut om att ta i bruk i deras nätverk om det sprider sig utanför den ursprungliga användaren.
- Konkurrens : Arbetsförmedlingsstöd för unga arbetssökande kan påverka arbetsmarknadsutsikterna för personer som inte fått utbildningen men som konkurrerar om samma jobb.
- Smitta: Att få avmaskningsläkemedel kan minska andras sannolikhet att drabbas av sjukdomen.
- Avskräckande : Information om statliga revisioner i specifika kommuner kan spridas till närliggande kommuner.
- Förflyttning : Ett hotspot polisingripande som ökar polisens närvaro på en given gata kan leda till att brott flyttas till närliggande obehandlade gator.
- Omfördelning av resurser : Ett hotspot polisingripande som ökar polisens närvaro på en given gata kan minska polisens närvaro på närliggande gator.
- Social jämförelse : Ett program som randomiserar individer till att få en kupong för att flytta till en ny stadsdel kan dessutom påverka kontrollgruppens övertygelse om deras boendeförhållanden.
I sådana exempel kan behandling i en randomiserad kontrollstudie ha en direkt effekt på dem som får interventionen och även en spridningseffekt på dem som inte direkt behandlats.
Statistiska frågor
Att uppskatta spridningseffekter i experiment introducerar tre statistiska frågor som forskarna måste ta hänsyn till.
Släpp på antagandet om icke-interferens
Ett nyckelantagande för opartisk slutledning är antagandet om icke-interferens, som hävdar att en individs potentiella resultat endast avslöjas av deras eget behandlingsuppdrag och inte andras behandlingsuppdrag. Detta antagande har också kallats för det individualistiska behandlingssvaret eller det stabila enhetsbehandlingsvärdeantagandet . Icke-interferens kränks när försökspersoner kan kommunicera med varandra om sina behandlingar, beslut eller upplevelser, och därigenom påverka varandras potentiella resultat. Om antagandet om icke-interferens inte håller, har enheter inte längre bara två potentiella utfall (behandlade och kontroll), utan en mängd andra potentiella utfall som beror på andra enheters behandlingsuppdrag, vilket komplicerar uppskattningen av den genomsnittliga behandlingseffekten .
Att uppskatta spridningseffekter kräver att antagandet om icke-interferens lättar på. Detta beror på att en enhets resultat inte bara beror på dess behandlingsuppdrag utan också på grannarnas behandlingsuppdrag. Forskaren måste ange en uppsättning potentiella resultat som begränsar typen av störning. Som ett exempel, överväg ett experiment som skickar ut politisk information till studenter för att öka deras politiska deltagande. Om studiepopulationen består av alla studenter som bor med en rumskamrat i en studenthem, kan man föreställa sig fyra uppsättningar av potentiella resultat, beroende på om studenten eller dennes partner fick informationen (anta att det inte finns något spridning utanför varje rum för två personer):
- Y 0,0 hänvisar till en individs potentiella resultat när de inte behandlas (0) och inte heller deras rumskamrat (0).
- Y 0,1 hänvisar till en individs potentiella utfall när de inte behandlas (0) men deras rumskamrat behandlades (1).
- Y 1,0 hänvisar till en individs potentiella resultat när de behandlas (1) men deras rumskamrat inte behandlades (0).
- Y 1,1 hänvisar till en individs potentiella resultat när de behandlas (1) och deras rumskamrat behandlades (1).
Nu påverkas en individs resultat av både om de fick behandlingen och om deras rumskamrat fick behandlingen. Vi kan uppskatta en typ av spridningseffekt genom att titta på hur ens utfall förändras beroende på om deras rumskamrat fick behandlingen eller inte, givet att individen inte fick behandling direkt. Detta skulle fångas av skillnaden Y 0,1 - Y 0,0 . På samma sätt kan vi mäta hur ens resultat förändras beroende på rumskamratens behandlingsstatus, när individen själv behandlas. Detta motsvarar att ta skillnaden Y 1,1 - Y 1,0 .
Medan forskare vanligtvis omfamnar experiment eftersom de kräver mindre krävande antaganden, kan spillovers vara "obegränsade i omfattning och omöjliga att specificera i form." Forskaren måste göra specifika antaganden om vilka typer av spillovers som är verksamma. Man kan lätta på antagandet om icke-interferens på olika sätt beroende på hur spillovers tros uppstå i en given miljö. Ett sätt att modellera spillover-effekter är en binär indikator för om en omedelbar granne också behandlades, som i exemplet ovan. Man kan också ange spridningseffekter som beror på antalet omedelbara grannar som också behandlades, även kallade k-nivåeffekter.
Exponeringskartläggningar
Nästa steg efter att omdefiniera den kausala uppskattningen av intresse är att karakterisera sannolikheten för spridningsexponering för varje individ i analysen, givet någon vektor för behandlingsuppgift. Aronow och Samii (2017) presenterar en metod för att få fram en matris av exponeringssannolikheter för varje enhet i analysen.
Definiera först en diagonal matris med en vektor för behandlingstilldelningssannolikheter
För det andra, definiera en indikatormatris om huruvida enheten är utsatt för spillover eller inte. Detta görs genom att använda en närliggande matris som visas till höger, där information om ett nätverk kan omvandlas till en indikatormatris. Denna resulterande indikatormatris kommer att innehålla värden på , de realiserade värdena för en slumpmässig binär variabel som indikerar om den enheten har utsatts för spillover eller inte.
För det tredje, skaffa sandwichprodukten N × N - matris som innehåller två element: den individuella sannolikheten för exponering på diagonalen, och de gemensamma exponeringssannolikheterna på de avstängda diagonalerna:
De erhållna exponeringssannolikheterna kan sedan användas för invers sannolikhetsviktning (IPW, beskrivs nedan), i en estimator som Horvitz–Thompson-estimatorn .
En viktig varning är att denna procedur utesluter alla enheter vars sannolikhet för exponering är noll (exempelvis en enhet som inte är kopplad till några andra enheter), eftersom dessa siffror hamnar i nämnaren för IPW-regressionen.
Behov av inversa sannolikhetsvikter
Att uppskatta spillover-effekter kräver ytterligare försiktighet: även om behandling är direkt tilldelad, tilldelas spillover-status indirekt och kan leda till olika sannolikheter för spillover-tilldelning för enheter. Till exempel är det mer sannolikt att en person med 10 vänanknytningar utsätts för indirekt behandling i motsats till en patient med bara en vänanknytning. Att inte ta hänsyn till varierande sannolikheter för spridningsexponering kan påverka uppskattningar av den genomsnittliga spridningseffekten.
Figur 1 visar ett exempel där enheter har olika sannolikheter att tilldelas spillover-tillståndet. Underfigur A visar ett nätverk med 25 noder där enheterna i grönt är berättigade att ta emot behandling. Spillovers definieras som att dela minst en kant med en behandlad enhet. Till exempel, om nod 16 behandlas, skulle noderna 11, 17 och 21 klassificeras som spillover-enheter. Antag att tre av dessa sex gröna enheter väljs slumpmässigt för att behandlas, så att olika uppsättningar av behandlingstilldelningar är möjliga. I detta fall visar underfigur B varje nods sannolikhet att tilldelas spillover-tillståndet. Nod 3 är tilldelad spillover i 95 % av randomiseringarna eftersom den delar kanter med tre enheter som behandlas. Denna nod kommer bara att vara en kontrollnod i 5 % av randomiseringarna: det vill säga när de tre behandlade noderna är 14, 16 och 18. Samtidigt tilldelas nod 15 till spillover endast 50 % av tiden – om nod 14 inte är det direkt behandlas kommer nod 15 inte att tilldelas spillover.
Använder omvända sannolikhetsvikter
Vid analys av experiment med varierande sannolikhet för tilldelning bör särskilda försiktighetsåtgärder vidtas. Dessa skillnader i tilldelningssannolikheter kan neutraliseras genom invers-sannolikhetsvägd (IPW) regression , där varje observation viktas med inversen av dess sannolikhet att tillskrivas behandlingstillståndet som observerats med hjälp av Horvitz-Thompson-estimatorn . Detta tillvägagångssätt tar itu med den bias som kan uppstå om potentiella utfall systematiskt var relaterade till tilldelningssannolikheter. Nackdelen med denna estimator är att den kan vara fylld av provtagningsvariabilitet om vissa observationer tillmäts en hög vikt (dvs. en enhet med låg sannolikhet för spillover tilldelas spillover-tillståndet av en slump).
Använda randomiseringsslutledning för hypotestestning
I vissa inställningar skapar det ytterligare svårigheter att uppskatta variabiliteten av en spillover-effekt. När forskningsstudien har en fast enhet för klustring , till exempel en skola eller ett hushåll, kan forskare använda traditionella standardverktyg för feljustering som kluster-robusta standardfel, som tillåter korrelationer i feltermer inom kluster men inte över dem. I andra inställningar finns det dock ingen fast enhet för klustring. För att utföra hypotestestning i dessa inställningar rekommenderas användning av randomiseringsslutledning . Denna teknik gör att man kan generera p-värden och konfidensintervall även när spillovers inte följer en fast enhet av kluster men närliggande enheter tenderar att tilldelas liknande spillover-förhållanden, som i fallet med fuzzy clustering .