Generaliserad skattningsekvation
I statistik används en generaliserad skattningsekvation (GEE) för att uppskatta parametrarna för en generaliserad linjär modell med en möjlig omätt korrelation mellan observationer från olika tidpunkter. Även om vissa tror att generaliserade skattningsekvationer är robusta i allt även med fel val av arbetskorrelationsmatris, är generaliserade skattningsekvationer endast robusta mot förlust av överensstämmelse med fel val.
Regressionsbeta-koefficientuppskattningar från Liang Zeger GEE är konsekventa , opartiska, asymptotiskt normala även när arbetskorrelationen är felspecificerad, under milda regularitetsförhållanden. GEE har högre effektivitet än generaliserad linjär iterativ modell GLIM (mjukvara) i närvaro av hög autokorrelation. När den verkliga arbetskorrelationen är känd kräver inte konsistens MCAR. Huber-White standardfel förbättrar effektiviteten hos Liang Zeger GEE i frånvaro av seriell autokorrelation men kan ta bort den marginella tolkningen. GEE uppskattar det genomsnittliga svaret över populationen ("effekter i genomsnitt av befolkningen) med Liang Zeger Standard Errors, och hos individer som använder Huber White Standard Errors även känd som "robust standard error" eller "sandwich varians" skattningar. Huber-White GEE har använts sedan 1997, och Liang Zeger GEE dateras till 1980-talet baserat på en begränsad litteraturöversikt. Flera oberoende formuleringar av dessa standardfelestimatorer bidrar till GEE-teorin. Att placera de oberoende standardfelskalkylatorerna under paraplytermen "GEE" kan exemplifiera Missbruk av språk .
GEEs tillhör en klass av regressionstekniker som kallas semiparametriska eftersom de förlitar sig på specifikation av endast de två första momenten . De är ett populärt alternativ till den sannolikhetsbaserade generaliserade linjära blandade modellen som löper större risk för konsistensförlust vid specifikation av variansstruktur. Avvägningen mellan felspecifikation av variansstruktur och konsekventa uppskattningar av regressionskoefficient är förlust av effektivitet, så uppblåsta Wald-test p-värden som ett resultat av högre varians av standardfel än den för de mest optimala. De används ofta i stora epidemiologiska studier, särskilt kohortstudier på flera ställen , eftersom de kan hantera många typer av omättat beroende mellan utfall.
Formulering
Givet en medelmodell för ämne och tid som beror på regressionsparametrar , och variansstruktur, , uppskattningsekvationen bildas via:
Parametrarna uppskattas genom att lösa och erhålls vanligtvis via Newton–Raphson-algoritmen . Variansstrukturen är vald för att förbättra effektiviteten av parameteruppskattningarna. Hessian för lösningen av GEE i parameterutrymmet kan användas för att beräkna robusta standardfeluppskattningar . Termen "variansstruktur" hänvisar till den algebraiska formen av kovariansmatrisen mellan utfall, Y, i urvalet. Exempel på variansstrukturspecifikationer inkluderar oberoende, utbytbar, autoregressiv, stationär m-beroende och ostrukturerad. Den mest populära formen av slutledning om GEE-regressionsparametrar är Wald-testet som använder naiva eller robusta standardfel, även om Score-testet också är giltigt och att föredra när det är svårt att få uppskattningar av information under den alternativa hypotesen. Sannolikhetskvotstestet är inte giltigt i den här inställningen eftersom de uppskattade ekvationerna inte nödvändigtvis är sannolikhetsekvationer . Modellval kan utföras med GEE-motsvarigheten till Akaike Information Criterion (AIC), kvasi-sannolikheten under oberoende modellkriteriet (QIC).
Förhållande med Generalized Method of Moments
Den generaliserade skattningsekvationen är ett specialfall av den generaliserade momentmetoden (GMM). Detta samband är omedelbart uppenbart från kravet att poängfunktionen uppfyller ekvationen:
Beräkning
Programvara för att lösa generaliserade skattningsekvationer finns i MATLAB , SAS (proc genmod ), SPSS ( gee -proceduren), Stata ( kommandot xtgee ), R (paket gee , geepack och multgee ), Julia (paket GEE.jl ) och Python (paketstatistikmodeller ) .
Jämförelser mellan mjukvarupaket för analys av binärt korrelerad data och ordinär korrelerad data via GEE är tillgängliga.
Se även
Vidare läsning
- Hardin, James; Hilbe, Joseph (2003). Generaliserade skattningsekvationer . London: Chapman och Hall/CRC. ISBN 978-1-58488-307-4 .
- Ziegler, A. (2011). Generaliserade skattningsekvationer . Springer. ISBN 978-1-4614-0498-9 .