Metaregression
Metaregression definieras som en metaanalys som använder regressionsanalys för att kombinera, jämföra och syntetisera forskningsresultat från flera studier samtidigt som man justerar för effekterna av tillgängliga kovariater på en svarsvariabel. En metaregressionsanalys syftar till att förena motstridiga studier eller bekräfta konsekventa; en metaregressionsanalys kännetecknas därför av de sammanställda studierna och deras motsvarande datamängder – oavsett om svarsvariabeln är data på studienivå (eller motsvarande aggregerade ) data eller individuella deltagare (eller individuella patientdata inom medicin). En datamängd är aggregerad när den består av sammanfattande statistik såsom urvalsmedelvärde , effektstorlek eller oddskvot . Å andra sidan är data från enskilda deltagare på sätt och vis råa genom att alla observationer rapporteras utan förkortning och därför ingen informationsförlust. Aggregerade data sammanställs enkelt via internetsökmotorer och är därför inte dyrt. Individuella deltagares uppgifter är dock vanligtvis konfidentiella och är endast tillgängliga inom den grupp eller organisation som utförde studierna.
Även om metaanalys för observationsdata också är under omfattande forskning, kretsar litteraturen fortfarande till stor del kring att kombinera randomiserade kontrollerade studier (RCT) . I RCT inkluderar en studie vanligtvis en studie som består av armar . En arm hänvisar till en grupp deltagare som fått samma terapi, intervention eller behandling . En metaanalys med några eller alla studier som har mer än två armar kallas nätverksmetaanalys , indirekt metaanalys eller en jämförelse av flera behandlingar . Trots att det också är ett paraplybegrepp, metaanalys ibland att alla inkluderade studier har strikt två armar vardera - samma två behandlingar i alla försök - för att skilja sig från nätverksmetaanalys. En metaregression kan klassificeras på samma sätt – metaregression och nätverksmetaregression – beroende på antalet distinkta behandlingar i regressionsanalysen.
Metaanalys (och meta-regression) placeras ofta högst upp i evidenshierarkin förutsatt att analysen består av individuella deltagares data från randomiserade kontrollerade kliniska prövningar. Metaregression spelar en avgörande roll för att redogöra för kovariateffekter, särskilt i närvaro av kategoriska variabler som kan användas för subgruppsanalys.
Metaregressionsmodeller
Metaregression täcker en stor klass av modeller som kan skilja sig åt beroende på karaktäriseringen av de data man har till sitt förfogande. Det finns i allmänhet ingen enstaka beskrivning för metaregressionsmodeller. Individuella deltagares data, i synnerhet, tillåter flexibel modellering som återspeglar olika typer av svarsvariabler: kontinuerlig, antal, proportion och korrelation. Emellertid modelleras aggregerade data generellt som en normal linjär regression y tk = x tk ′ β + ε tk med hjälp av den centrala gränssatsen och variabel transformation, där subskriptet k indikerar den k: te studien eller försöket, t betecknar den t: te behandlingen, y tk indikerar svarsändpunkten för den k: te studiens t :e arm, x tk är samvariatvektorn på armnivå, ε tk är feltermen som är oberoende och identiskt fördelad som en normalfördelning. Till exempel kan en provproportion p̂tk logit-transformeras eller arcsine-transformeras före metaregressionsmodellering, dvs y tk = logit( p̂ tk ) eller y tk = arcsin( p̂ tk ) . På samma sätt Fishers z -transformation användas för sampelkorrelationer, dvs y tk = arctanh( r tk ). Den vanligaste sammanfattande statistiken som rapporteras i en studie är urvalets medelvärde och urvalets standardavvikelse, i vilket fall ingen transformation behövs. Det är också möjligt att härleda en aggregerad datamodell från en underliggande individ-deltagare-datamodell. Om t.ex. y itk är det binära svaret antingen noll eller ett där den extra nedsänkta i indikerar den i :te deltagaren, samplingsandelen p̂ tk som sampelmedelvärdet av y itk för i = 1, 2, ..., n tk kanske inte kräver någon transformation om de Moivre–Laplace-satsen antas vara på gång. Observera att om en metaregression är på studienivå, i motsats till armnivå, finns det inget abonnemang som anger vilken behandling som tilldelats motsvarande arm.
En av de viktigaste distinktionerna i metaanalysmodeller är om man ska anta heterogenitet mellan studierna. Om en forskare antar att studier inte är heterogena , innebär det att studierna bara är olika på grund av urvalsfel utan någon väsentlig skillnad mellan studierna, i vilket fall ingen annan variationskälla skulle komma in i modellen. Å andra sidan, om studierna är heterogena måste den eller de ytterligare variationskällorna – förutom urvalsfelet som representeras av ε tk – tas upp. Detta översätts i slutändan till ett val mellan metaregression med fast effekt och metaregression med slumpmässig effekt (rigoröst sett, blandad effekt).
Metaregression med fast effekt
Metaregression med fast effekt återspeglar tron att de inblandade studierna saknar väsentlig skillnad. En metaregression med fast effekt på armnivå skrivs som y tk = x tk ′ β + ɛ tk . Om endast sammanfattande statistik på studienivå finns tillgänglig, kan prenumerationen t för behandlingsuppgift tas bort, vilket ger y k = x k ′ β + ɛ k . Feltermen innefattar en variansterm σ tk 2 (eller σ k 2 ) som inte är estimerbar om inte provvariansen s tk 2 (eller s k 2 ) rapporteras såväl som y tk (eller y k ). Vanligast antas modellvariansen vara lika mellan armar och studier, i vilket fall alla abonnemang tas bort, dvs σ 2 . Om variationen mellan studierna inte är försumbar kommer parameteruppskattningarna att vara partiska och motsvarande statistiska slutledning kan inte generaliseras.
Metaregression med blandad effekt
Begreppen metaregression med slumpmässig effekt och metaregression med blandad effekt är likvärdiga. Även om man kallar en modell för en slumpeffektsmodell signalerar frånvaron av fasta effekter, vilket tekniskt sett skulle diskvalificera den från att vara en regressionsmodell, men man skulle kunna hävda att modifieraren slumpeffekt bara lägger till, inte tar bort från, vad en regressionsmodell bör inkludera. : fasta effekter. Google Trends indikerar att båda termerna har liknande acceptansnivåer i publikationer från och med den 24 juli 2021.
Metaregression med blandad effekt inkluderar en slumpmässig effektterm utöver de fasta effekterna, vilket tyder på att studierna är heterogena. De slumpmässiga effekterna, betecknade med w tk ′ γ k , fångar variabilitet mellan försök. Hela modellen blir då y tk = x tk ′ β + w tk ′ γ k + ε tk . Slumpmässiga effekter i metaregression är avsedda att återspegla de bullriga behandlingseffekterna – om inte annat antas och modelleras – vilket innebär att längden på motsvarande koefficientvektor γ k bör vara densamma som antalet behandlingar som ingår i studien. Detta innebär att behandlingarna i sig antas vara en källa till variation i utfallsvariabeln – t.ex. kommer gruppen som får placebo inte att ha samma nivå av variation i kolesterolnivå som en annan som får ett kolesterolsänkande läkemedel. Om vi begränsar vår uppmärksamhet till den snäva definitionen av metaanalys inklusive två behandlingar, γ k tvådimensionell, dvs γ k = ( γ 1k , γ 2k )′, för vilken modellen omarbetas som y tk = x tk ′ β + γ tk + ε tk . Fördelen med att skriva modellen i en matris-vektornotation är att korrelationen mellan behandlingarna, Corr( γ 1k , γ 2k ), kan undersökas. Slumpkoefficientvektorn yk är då en brusig realisering av den verkliga behandlingseffekten betecknad med y . Fördelningen av γ k antas vanligen vara en i lokaliseringsskala-familjen , framför allt en multivariat normalfördelning , dvs γ k ~ N ( γ , Ω).
Vilken modell att välja
Metaregression har använts som en teknik för att härleda förbättrade parameteruppskattningar som är direkt användbara för beslutsfattare. Metaregression tillhandahåller ett ramverk för replikering och erbjuder en känslighetsanalys för modellspecifikation. Det finns ett antal strategier för att identifiera och koda empiriska observationsdata. Metaregressionsmodeller kan utökas för modellering inom studieberoende, överdriven heterogenitet och publikationsurval. Regressionsmodellen med fast effekt tillåter inte variation inom studien. Mixed Effects-modellen tillåter variation inom studien och mellan studier och anses därför vara den mest flexibla modellen att välja i många tillämpningar. Även om heterogenitetsantagandet kan testas statistiskt och det är en utbredd praxis inom många områden, om detta test följs av en annan uppsättning regressionsanalys, är motsvarande statistiska slutledning föremål för vad som kallas selektiv inferens . Dessa heterogenitetstester drar inte heller slutsatsen att det inte finns någon heterogenitet även när de visar sig vara obetydliga, och vissa forskare rekommenderar att i alla fall välja metaregression med blandad effekt.
Ansökningar
Metaregression är en statistiskt rigorös metod för systematiska översikter . De senaste tillämpningarna inkluderar kvantitativa granskningar av den empiriska litteraturen inom ekonomi, näringsliv, energi och vattenpolitik. Metaregressionsanalyser har setts i studier av pris- och inkomstelasticiteter för olika råvaror och skatter, produktivitetsspillovers på multinationella företag och beräkningar av värdet av ett statistiskt liv (VSL). Andra nyare metaregressionsanalyser har fokuserat på kvalificerande elasticiteter härledda från efterfrågefunktioner. Som exempel kan nämnas egna priselasticiteter för alkohol, tobak, vatten och energi.
Inom energihushållning har metaregressionsanalys använts för att utvärdera beteendeinformationsstrategier inom elsektorn för bostäder. I vattenpolitisk analys har metaregression använts för att utvärdera kostnadsbesparingsuppskattningar på grund av privatisering av lokala myndigheters tjänster för vattendistribution och insamling av fast avfall. Metaregression är ett allt populärare verktyg för att utvärdera tillgängliga bevis i kostnads-nyttoanalysstudier av en policy eller ett program spridda över flera studier.
Vidare läsning
- Thompson, SG; Higgins, JPT (2002). "Hur ska metaregressionsanalyser genomföras och tolkas?". Statistik i medicin . 21 (11): 1559–1573. doi : 10.1002/sim.1187 . PMID 12111920 .
- Roberts, Colin; Stanley, TD (2005). Meta-Regressionsanalys: Issues of Publication Bias in Economics . Wiley-Blackwell. ISBN 978-1-4051-3799-7 .
- Bonett DG (2009). "Metaanalytisk intervalluppskattning för standardiserade och ostandardiserade medelskillnader". Psykologiska metoder . 14 (3): 225–38. doi : 10.1037/a0016619 . PMID 19719359 .