Studera heterogenitet

Inom statistik är (mellan-) studieheterogenitet ett fenomen som ofta uppstår när man försöker göra en metaanalys . I ett förenklat scenario skulle studier vars resultat ska kombineras i metaanalysen alla genomföras på samma sätt och enligt samma experimentella protokoll. Skillnader mellan utfall skulle bara bero på mätfel (och studier skulle därför vara homogena ). Studiens heterogenitet betecknar variabiliteten i utfall som går utöver vad som skulle förväntas (eller skulle kunna förklaras) på grund av enbart mätfel.

Introduktion

Metaanalys är en metod som används för att kombinera resultaten från olika försök för att få en kvantitativ syntes. Storleken på enskilda kliniska prövningar är ofta för liten för att kunna upptäcka behandlingseffekter på ett tillförlitligt sätt. Metaanalys ökar kraften i statistiska analyser genom att slå samman resultaten av alla tillgängliga försök.

När man försöker använda metaanalys för att uppskatta en kombinerad effekt från en grupp liknande studier, måste effekterna som finns i de enskilda studierna vara tillräckligt lika för att man kan vara säker på att en kombinerad uppskattning kommer att vara en meningsfull beskrivning av uppsättningen av studier. De individuella uppskattningarna av behandlingseffekten kommer dock att variera av en slump; viss variation förväntas på grund av observationsfel . All överskottsvariation (oavsett om den är uppenbar eller detekterbar eller inte) kallas (statistisk) heterogenitet . Förekomsten av viss heterogenitet är inte ovanlig, t.ex. är analoga effekter också vanligt förekommande även inom studier, i multicenterförsök (between- center heterogenity).

Orsakerna till den ytterligare variabiliteten är vanligtvis skillnader i själva studierna, de undersökta populationerna, behandlingsscheman, endpointdefinitioner eller andra omständigheter (klinisk mångfald). Olika typer av effektmått (t.ex. oddskvot vs. relativ risk ) kan också vara mer eller mindre mottagliga för heterogenitet.

Modellering

Om ursprunget till heterogenitet kan identifieras och kan tillskrivas vissa studiefunktioner, kan analysen stratifieras (genom att beakta undergrupper av studier, som då förhoppningsvis skulle vara mer homogena), eller genom att utvidga analysen till en metaregression , redogörelse för (kontinuerliga eller kategoriska ) moderatorvariabler . Tyvärr tillåter litteraturbaserad metaanalys ofta inte att samla in data om alla (potentiellt) relevanta moderatorer.

Dessutom tillgodoses heterogenitet vanligtvis genom att använda en modell för slumpmässiga effekter , där heterogeniteten sedan utgör en varianskomponent . Modellen representerar bristen på kunskap om varför behandlingseffekter kan skilja sig genom att de (potentiella) skillnaderna behandlas som okända. Mitten av denna symmetriska fördelning beskriver medelvärdet av effekterna, medan dess bredd beskriver graden av heterogenitet. Det uppenbara och konventionella valet av fördelning är en normalfördelning . Det är svårt att fastställa giltigheten av något fördelningsantagande, och detta är en vanlig kritik mot metaanalyser av slumpmässiga effekter. Variationer av den exakta fördelningsformen kanske inte gör så stor skillnad, och simuleringar har visat att metoderna är relativt robusta även under extrema fördelningsantaganden, både när det gäller att uppskatta heterogenitet och att beräkna en total effektstorlek.

Att inkludera en slumpmässig effekt i modellen har effekten att göra slutsatserna (på sätt och vis) mer konservativa eller försiktiga, eftersom en (icke-noll) heterogenitet kommer att leda till större osäkerhet (och undvika övertro) i uppskattningen av övergripande effekter. I det speciella fallet med en heterogenitetsvarians på noll, reduceras modellen med slumpmässiga effekter åter till specialfallet med modellen med gemensam effekt .

Vanliga metaanalysmodeller bör dock naturligtvis inte appliceras blint eller naivt på insamlade uppsättningar av uppskattningar. Om resultaten som ska slås samman avsevärt skiljer sig åt (i deras sammanhang eller i deras uppskattade effekter), kanske ett härlett metaanalytiskt medelvärde så småningom inte motsvarar en rimlig uppskattning . När enskilda studier uppvisar motstridiga resultat, finns det sannolikt några anledningar till att resultaten skiljer sig åt; till exempel kan två subpopulationer uppleva olika farmakokinetiska vägar . I ett sådant scenario skulle det vara viktigt att både känna till och beakta relevanta kovariabler i en analys.

Testning

Statistisk testning för en heterogenitetsvarians som inte är noll görs ofta baserat på Cochrans Q eller relaterade testprocedurer. Denna vanliga procedur är dock tveksam av flera skäl, nämligen den låga effekten av sådana tester, särskilt i det mycket vanliga fallet att endast ett fåtal uppskattningar kombineras i analysen, såväl som specifikationen av homogenitet som nollhypotesen som sedan bara förkastas i närvaro av tillräckliga bevis mot det.

Uppskattning

Medan huvudsyftet med en metaanalys vanligtvis är uppskattning av huvudeffekten, är undersökning av heterogeniteten också avgörande för dess tolkning. Ett stort antal ( frequentistiska och bayesianska ) estimatorer är tillgängliga. Bayesiansk uppskattning av heterogeniteten kräver vanligtvis specifikation av en lämplig tidigare fördelning .

Även om många av dessa skattare beter sig på samma sätt vid ett stort antal studier, uppstår i synnerhet skillnader i deras beteende i det vanliga fallet med endast få uppskattningar. En felaktig variansuppskattning av noll mellan studier erhålls ofta, vilket leder till ett falskt homogenitetsantagande. Sammantaget verkar det som om heterogenitet konsekvent underskattas i metaanalyser.

Kvantifiering

Heterogenitetsvariansen betecknas vanligtvis med τ², eller standardavvikelsen ( dess kvadratrot) med τ . Heterogenitet är förmodligen lättast att tolka i termer av τ, eftersom detta är heterogenitetsfördelningens skalparameter , som mäts i samma enheter som själva den totala effekten.

Ett annat vanligt mått på heterogenitet är I², en statistik som indikerar den procentuella variansen i en metaanalys som kan tillskrivas studier av heterogenitet (något liknande en bestämningskoefficient ). I² relaterar heterogenitetsvariansens storlek till storleken på de individuella uppskattningarnas varianser (kvadratiserade standardfel ) ; med denna normalisering är det dock inte helt uppenbart vad som exakt skulle utgöra "små" eller "stora" mängder heterogenitet. För en konstant heterogenitet (τ), skulle tillgängligheten av mindre eller större studier (med motsvarande olika standardfel associerade) påverka I²-måttet; så den faktiska tolkningen av ett I²-värde är inte okomplicerad.

Det gemensamma övervägandet av ett prediktionsintervall tillsammans med ett konfidensintervall för huvudeffekten kan hjälpa till att få en bättre känsla av heterogenitetens bidrag till osäkerheten kring effektskattningen.

Se även

Vidare läsning