Vecchia uppskattning

Vecchia approximation är en Gaussisk processapproximationsteknik som ursprungligen utvecklades av Aldo Vecchia, en statistiker vid United States Geological Survey . Det är ett av de tidigaste försöken att använda Gaussiska processer i högdimensionella miljöer. Det har sedan dess generaliserats i stor omfattning, vilket ger upphov till många samtida approximationer.

Intuition

En gemensam sannolikhetsfördelning för händelser , och , betecknade , kan uttryckas som

Vecchias approximation tar formen, t.ex.

och är korrekt när händelser och är nära villkorligt oberoende given kunskap om . Naturligtvis kunde man alternativt ha valt approximationen

och därför kräver användningen av approximationen viss kunskap om vilka händelser som är nära villkorligt oberoende givet andra. Dessutom kunde vi ha valt en annan ordning, till exempel

Lyckligtvis finns det i många fall bra heuristik för att fatta beslut om hur approximationen ska konstrueras.

Mer tekniskt leder allmänna versioner av approximationen till en sparsam Cholesky-faktor i precisionsmatrisen. Genom att använda standarden Cholesky-faktorisering produceras poster som kan tolkas som villkorliga korrelationer med nollor som indikerar inget oberoende (eftersom modellen är Gaussisk). Dessa oberoende relationer kan alternativt uttryckas med hjälp av grafiska modeller och det finns satser som kopplar samman grafstruktur och vertexordning med nollor i Cholesky-faktorn. I synnerhet är det känt att oberoende som är kodade i en moralisk graf leder till Cholesky-faktorer i precisionsmatrisen som inte har någon fyllning .

Formell beskrivning

Problemet

Låt vara en gaussisk process indexerad av med medelfunktion och kovariansfunktion . Antag att är en finit delmängd av och är en vektor av värden på utvärderade vid , dvs för . Antag vidare att man observerar där med . I detta sammanhang inkluderar de två vanligaste slutledningsuppgifterna att utvärdera sannolikheten

eller göra förutsägelser av värden på för och , dvs beräknar

Ursprunglig formulering

Den ursprungliga Vecchia-metoden börjar med observationen att fogtätheten för observationer kan skrivas som en produkt av villkorliga distributioner

Vecchia approximation antar istället att för vissa

Vecchia föreslog också att ovanstående approximation skulle tillämpas på observationer som omordnas lexikografiskt med hjälp av deras rumsliga koordinater. Även om hans enkla metod har många svagheter, reducerade den beräkningskomplexiteten till . Många av dess brister åtgärdades av de efterföljande generaliseringarna.

Allmän formulering

Även om det är begreppsmässigt enkelt, visar antagandet om Vecchia-approximationen sig ofta vara ganska restriktivt och felaktigt. Detta inspirerade till viktiga generaliseringar och förbättringar som introducerats i den grundläggande versionen under åren: införandet av latenta variabler, mer sofistikerad konditionering och bättre ordning. Olika specialfall av den allmänna Vecchia approximationen kan beskrivas i termer av hur dessa tre element väljs.

Latenta variabler

För att beskriva förlängningar av Vecchia-metoden i dess mest allmänna form, definiera och notera att för det gäller som i föregående avsnitt

eftersom givet är alla andra variabler oberoende av .

Beställning

Det har noterats allmänt att den ursprungliga lexikografiska ordningen baserad på koordinater när är tvådimensionell ger dåliga resultat. På senare tid har en annan beställning föreslagits, av vilka några säkerställer att poängen ordnas på ett kvasi-slumpmässigt sätt. Mycket skalbara, de har visat sig också drastiskt förbättra noggrannheten.

Konditionering

I likhet med den grundläggande versionen som beskrivs ovan, för en given beställning kan en generell Vecchia-approximation definieras som

där . Eftersom följer att att termerna ska ersättas med . Det visar sig emellertid att ibland villkorar vissa av observationerna ökar sparsiteten av Cholesky-faktorn för precisionsmatrisen för . Därför kan man istället överväga mängder och så att och uttryck som

Flera metoder för att välja och har föreslagits, framför allt den Gaussiska processen som är närmast granne ( NNGP), meshed gaussisk process och multi-resolution approximation (MRA) tillvägagångssätt med användning av , standard Vecchia med och Sparse General Vecchia där både och är inte tomma.

programvara

Flera paket har utvecklats som implementerar vissa varianter av Vecchia-approximationen.

  • GPvecchia är ett R-paket tillgängligt via CRAN (R-programmeringsspråk) som implementerar de flesta versioner av Vecchia-approximationen
  • GpGp är ett R-paket tillgängligt via CRAN (R programmeringsspråk) som implementerar en skalbar beställningsmetod för rumsliga problem som avsevärt förbättrar noggrannheten.
  • spNNGP är ett R-paket tillgängligt via CRAN (R-programmeringsspråk) som implementerar den latenta Vecchia-approximationen
  • pyMRA är ett Python-paket tillgängligt genom pyPI som implementerar flerupplösningsapproximation, ett specialfall av den allmänna Vecchia-metoden som används i dynamiska tillståndsrymdsmodeller
  • meshed är ett R-paket tillgängligt via CRAN (R programmeringsspråk) som implementerar Bayesianska rumsliga eller spatiotemporala multivariata regressionsmodeller baserade på en latent Meshed Gaussian Process (MGP) med Vecchia-approximationer på partitionerade domäner

Anteckningar