Bayesiansk kvadratur
Bayesiansk kvadratur är en metod för att approximera svårlösta integrationsproblem. Det faller inom klassen probabilistiska numeriska metoder . Bayesiansk kvadratur ser numerisk integration som en Bayesiansk slutledningsuppgift , där funktionsutvärderingar används för att uppskatta integralen av den funktionen. Av denna anledning kallas det ibland också för "bayesiansk probabilistisk numerisk integration" eller "bayesiansk numerisk integration". Namnet "Bayesian cubature" används också ibland när integranden är flerdimensionell. En potentiell fördel med detta tillvägagångssätt är att det ger probabilistisk osäkerhetskvantifiering för värdet av integralen.
Bayesiansk kvadratur
Numerisk integration
Låt vara en funktion definierad på en domän (där typiskt . I numerisk integration , funktionsutvärderingar på distinkta platser i används för att uppskatta integralen av mot ett mått : dvs vikter en kvadraturregel är en estimator av av formen
Bayesiansk kvadratur består av att specificera en tidigare fördelning över , konditionera denna prior på för att erhålla en bakre fördelning , beräkna sedan den implicita bakre fördelningen på . Namnet "kvadratur" kommer från det faktum att det bakre medelvärdet på ibland tar formen av en kvadraturregel vars vikter bestäms av valet av prior.
Bayesisk kvadratur med gaussiska processer
Det vanligaste valet av tidigare fördelning för är en gaussisk process eftersom detta tillåter konjugerad slutledning för att erhålla en sluten form bakre fördelning på . Antag att vi har en Gauss-process med tidigare medelfunktion och kovariansfunktion (eller kärnfunktion) . Sedan är den bakre fördelningen på en gaussisk process med medelvärde och kärna ges av:
Dessutom är den bakre fördelningen på en univariat gaussisk fördelning med medelvärde och varians ges av
I mer utmanande integrationsproblem, där den tidigare fördelningen inte kan förlitas på som en meningsfull representation av epistemisk osäkerhet, är det nödvändigt att använda data för att ställa in kärnans hyperparametrar med till exempel maximal sannolikhetsuppskattning . Uppskattningen av kärnhyperparametrar introducerar adaptivitet i Bayesiansk kvadratur.
Exempel
Överväg uppskattning av integralen
Fördelar och nackdelar
Eftersom Bayesiansk kvadratur är ett exempel på probabilistisk numerik , ärver den vissa fördelar jämfört med traditionella numeriska integrationsmetoder :
- Det gör att osäkerhet kan kvantifieras och spridas genom alla efterföljande beräkningar för att explicit modellera effekten av numeriska fel.
- Den tillhandahåller ett principiellt sätt att införliva förkunskaper genom att använda ett omdömesgillt val av tidigare distributioner för som kan vara mer sofistikerad jämfört med den Gaussiska standardprocessen som just beskrivits.
- Det tillåter mer effektiv användning av information, t.ex. att gemensamt sluta sig till flera relaterade mängder av intresse eller använda aktivt lärande för att minska det erforderliga antalet poäng.
Trots dessa fördelar har Bayesianska kvadraturmetoder följande begränsningar:
- Även om det Bayesianska paradigmet tillåter en principiell behandling av kvantifieringen av osäkerhet, är den bakre inferensen över inte alltid löslig, vilket kräver en uppskattning på andra nivån. För t.ex. Bayesiansk kvadratur med Gaussiska processer, har kärnans medelinbäddning inget uttryck i slutet form för en allmän kärna och mät .
- Beräkningskostnaden för Bayesianska kvadraturmetoder baserade på Gaussiska processer är i allmänhet på grund av kostnaden för att invertera matriser, som kan trotsa sina applikationer till storskaliga problem.
Algoritmisk design
Tidigare utdelningar
Den vanligaste priorn för är en Gaussisk process prior. Detta beror främst på fördelen med Gaussisk konjugation och det faktum att Gaussiska processer kan koda ett brett spektrum av förkunskaper inklusive jämnhet, periodicitet och sparsitet genom ett noggrant val av tidigare kovarians. Emellertid har även ett antal andra tidigare utdelningar föreslagits. Detta inkluderar Gaussiska processer med flera utdata , som är särskilt användbara när man tar itu med flera relaterade numeriska integrationsuppgifter samtidigt eller sekventiellt, och trädbaserade prioriteringar som Bayesianska additiv regressionsträd, som är väl lämpade för diskontinuerliga f {\displaystyle . Dessutom Dirichlet-processer föreslagits för integrationsmåttet .
Punktval
Punkterna anses antingen vara givna eller kan väljas för att säkerställa baksidan på koncentreras i en snabbare takt. En metod består i att använda punktuppsättningar från andra kvadraturregler. Till exempel, att ta oberoende och identiskt fördelade realisationer från återställer en Bayesiansk ansats till Monte Carlo , medan användning av vissa deterministiska punktuppsättningar som sekvenser med låg diskrepans eller gitter återställer ett Bayesianskt alternativ till quasi-Monte Carlo . Det är naturligtvis också möjligt att använda punktuppsättningar speciellt utformade för Bayesiansk kvadratur; se till exempel arbetet med vem som utnyttjade symmetrier i punktuppsättningar för att erhålla skalbara Bayesianska kvadraturestimatorer. Alternativt kan punkter också väljas adaptivt enligt principer från aktivt lärande och Bayesiansk experimentell design för att direkt minimera bakre osäkerhet, inklusive för Gaussiska processer med flera utgångar.
Kärnmedelvärde och initialfel
En av utmaningarna när man implementerar Bayesiansk kvadratur är behovet av att utvärdera funktionen och konstanten . Den förra kallas vanligen för kärnmedelvärde och är en kvantitet som är nyckeln till beräkningen av kärnbaserade avstånd såsom den maximala medelavvikelsen. Det senare kallas vanligen för det initiala felet eftersom det ger en övre gräns för integrationsfelet innan några funktionsvärden observeras. Tyvärr kan kärnans medelvärde och initialfel endast beräknas för ett litet antal par; se till exempel Tabell 1 in.
Teori
Det har funnits ett antal teoretiska garantier för Bayesiansk kvadratur. Dessa kräver vanligtvis Sobolev-jämnhetsegenskaper hos integranden, även om nyare arbeten även sträcker sig till integrander i den reproducerande kärnan Hilbert-utrymme i den Gaussiska kärnan. De flesta av resultaten gäller fallet med Monte Carlo eller deterministiska rutnätspunkter, men vissa resultat sträcker sig även till adaptiva konstruktioner.