Integrerade kapslade Laplace-approximationer

Integrated Nested Laplace approximations ( INLA ) är en metod för approximation av Bayesiansk slutledning baserad på Laplaces metod . Den är designad för en klass av modeller som kallas latenta Gaussiska modeller (LGM), för vilka den kan vara ett snabbt och korrekt alternativ för Markovkedjans Monte Carlo- metoder för att beräkna posteriora marginalfördelningar. På grund av dess relativa hastighet även med stora datamängder för vissa problem och modeller, har INLA varit en populär inferensmetod inom tillämpad statistik, i synnerhet rumslig statistik , ekologi och epidemiologi . Det är också möjligt att kombinera INLA med en finita elementmetodlösning av en stokastisk partiell differentialekvation för att studera t.ex. rumsliga punktprocesser och artfördelningsmodeller . INLA-metoden är implementerad i R-INLA R -paketet.

Latenta Gaussiska modeller

Låt beteckna svarsvariabeln (det vill säga observationerna) som tillhör en exponentiell familj där medelvärdet (av ) är kopplat till en linjär prediktor via en lämplig länkfunktion . Den linjära prediktorn kan ha formen av en (bayesiansk) additiv modell. Alla latenta effekter (den linjära prediktorn, skärningen, koefficienter för möjliga kovariater och så vidare) betecknas tillsammans med vektorn . Modellens hyperparametrar betecknas med θ } . Enligt Bayesiansk statistik och slumpvariabler med tidigare distributioner.

Observationerna antas vara villkorligt oberoende givet och :

där är uppsättningen av index för observerade element i (vissa element kan vara oobserverade, och för dessa beräknar INLA en posterior prediktiv fördelning ). Observera att den linjära prediktorn är en del av .

För att modellen ska vara en latent Gaussisk modell antas det att är ett Gaussiskt Markov Random Field (GMRF) (det vill säga en multivariat Gaussian med ytterligare villkorliga oberoendeegenskaper) med sannolikhetstäthet

där är en -beroende gles precisionsmatris och är dess determinant. Precisionsmatrisen är sparsam på grund av GMRF-antagandet. Den tidigare fördelningen för hyperparametrarna behöver inte vara Gaussisk. Antalet hyperparametrar, , antas dock vara litet (säg mindre än 15).

Ungefärlig Bayesiansk slutledning med INLA

I Bayesiansk inferens vill man lösa den bakre fördelningen av de latenta variablerna och . Tillämpa Bayes sats

den gemensamma bakre fördelningen av och ges av
Att erhålla den exakta posterioren är i allmänhet ett mycket svårt problem. I INLA är huvudsyftet att approximera de bakre marginalerna
där .

En nyckelidé med INLA är att konstruera kapslade approximationer som ges av

där är en ungefärlig bakre densitet. Approximationen till marginaldensiteten erhålls på ett kapslat sätt genom att först approximera och , och sedan numeriskt integrera ut som
där summeringen är över värdena för , med integrationsvikter givna av . Approximationen av beräknas genom att numeriskt integrera ut från .

För att få den ungefärliga fördelningen relationen

som utgångspunkt. Då erhålls med Laplaces approximation
där är den gaussiska approximationen till vars läge vid en given är . Läget kan hittas numeriskt till exempel med Newton-Raphson-metoden .

Tricket i Laplace-approximationen ovan är det faktum att Gauss-approximationen appliceras på hela villkoret av i nämnaren eftersom den vanligtvis är nära en Gauss på grund av GMRF-egenskapen för . Att tillämpa approximationen här förbättrar metodens noggrannhet, eftersom den bakre behöver vara nära en Gauss, så den Gaussiska approximationen appliceras inte direkt på . Den andra viktiga egenskapen hos en GMRF, glesheten hos precisionsmatrisen för effektiv beräkning av för varje värde .

Erhålla den ungefärliga fördelningen är mer involverad, och INLA-metoden ger tre alternativ för detta: Gauss approximation, Laplace approximation eller den förenklade Laplace approximationen. För den numeriska integrationen för att erhålla även tre alternativ tillgängliga: rutnätssökning, central kompositdesign, eller empirisk Bayes.

Vidare läsning