Variansbaserad känslighetsanalys
Variansbaserad känslighetsanalys (ofta kallad Sobol'-metoden eller Sobol'-index , efter Ilya M. Sobol') är en form av global känslighetsanalys . Genom att arbeta inom ett probabilistiskt ramverk bryter den ned variansen av modellens eller systemets utdata i bråkdelar som kan tillskrivas indata eller uppsättningar av indata. Till exempel, givet en modell med två ingångar och en utgång, kan man upptäcka att 70 % av utgångsvariansen orsakas av variansen i den första ingången, 20 % av variansen i den andra och 10 % på grund av interaktioner mellan två. Dessa procentsatser tolkas direkt som mått på känslighet. Variansbaserade mått på känslighet är attraktiva eftersom de mäter känslighet över hela inmatningsutrymmet (dvs. det är en global metod), de kan hantera icke-linjära svar och de kan mäta effekten av interaktioner i icke- additiva system.
Nedbrytning av varians
Ur ett black box- perspektiv kan vilken modell som helst ses som en funktion Y = f ( X ), där X är en vektor av d osäkra modellingångar { X 1 , X 2 , ... Xd } och Y är en vald univariat modellutdata (observera att detta tillvägagångssätt undersöker skalära modellutdata, men flera utdata kan analyseras genom flera oberoende känslighetsanalyser). Vidare kommer det att antas att ingångarna är oberoende och likformigt fördelade inom enhetens hyperkub, dvs för . Detta medför ingen förlust av generalitet eftersom vilket inmatningsutrymme som helst kan omvandlas till denna enhetshyperkub. f ( X ) kan sönderdelas på följande sätt,
0 där f är en konstant och f i är en funktion av X i , f ij en funktion av X i och X j , etc. Ett villkor för denna nedbrytning är att,
dvs alla termer i den funktionella nedbrytningen är ortogonala . Detta leder till definitioner av termerna för den funktionella nedbrytningen i termer av villkorade förväntade värden,
Av vilken det kan ses att f i är effekten av att variera X i enbart (känd som huvudeffekten av X i ), och f ij är effekten av att variera X i och X j samtidigt, utöver effekten av deras individuella variationer . Detta är känt som en andra ordningens interaktion . Termer av högre ordning har analoga definitioner.
Om vi nu antar att f ( X ) är kvadratintegrerbar , kan den funktionella nedbrytningen kvadreras och integreras för att ge,
Lägg märke till att den vänstra sidan är lika med variansen av Y , och termerna på den högra sidan är varianstermer, nu uppdelade med avseende på mängder av X i . Detta leder slutligen till nedbrytningen av variansuttryck,
var
- ,
och så vidare. X ~ i- notationen indikerar mängden av alla variabler utom X i . Ovanstående variansuppdelning visar hur variansen av modellutdata kan dekomponeras i termer som kan hänföras till varje ingång, såväl som interaktionseffekterna dem emellan. Tillsammans summerar alla termer till den totala variansen av modellens utdata.
Första ordningens index
Ett direkt variansbaserat mått på känsligheten Si , kallat "första ordningens känslighetsindex" eller " huvudeffektindex" anges enligt följande,
Detta är bidraget till utmatningsvariansen av huvudeffekten av Xi , därför mäter det effekten av att variera X i enbart , men medelvärde över variationer i andra ingångsparametrar. Den är standardiserad av den totala variansen för att ge ett delbidrag. Interaktionsindex av högre ordning S ij , S ijk och så vidare kan bildas genom att dividera andra termer i variansuppdelningen med Var( Y ). Observera att detta har innebörden att,
Totaleffektindex
Med hjälp av S i , S ij och högre ordningens index som ges ovan kan man bygga en bild av betydelsen av varje variabel för att bestämma utdatavariansen. Men när antalet variabler är stort kräver detta en utvärdering av 2 d -1 index, vilket kan vara för beräkningskrävande. Av denna anledning används ett mått känt som "Total-effektindex" eller "Total-order index", S Ti . Detta mäter bidraget till utgångsvariansen för Xi , inklusive all varians orsakad av dess interaktioner, av valfri ordning, med andra indatavariabler. Det ges som,
Observera att till skillnad från S i ,
att interaktionseffekten mellan t.ex. X i och Xj räknas i både S Ti och S Tj . Faktum är att summan av S Ti bara är lika med 1 när modellen är rent additiv .
Beräkning av index
För analytiskt handhavbara funktioner kan indexen ovan beräknas analytiskt genom att utvärdera integralerna i nedbrytningen. Men i de allra flesta fall uppskattas de – detta görs vanligtvis med Monte Carlo-metoden .
Samplingssekvenser
Monte Carlo-metoden innebär att generera en sekvens av slumpmässigt fördelade punkter inuti enhetens hyperkub (strängt taget kommer dessa att vara pseudoslumpmässiga ). I praktiken är det vanligt att ersätta slumpmässiga sekvenser med sekvenser med låg diskrepans för att förbättra estimatorernas effektivitet. Detta är då känt som quasi-Monte Carlo-metoden . Några sekvenser med låg avvikelse som vanligtvis används i känslighetsanalys inkluderar Sobol'-sekvensen och den latinska hyperkubdesignen .
Procedur
För att beräkna indexen med (kvasi) Monte Carlo-metoden används följande steg:
- Generera en N × 2 d provmatris, dvs varje rad är en provpunkt i hyperrymden med 2 d dimensioner. Detta bör göras med hänsyn till indatavariablernas sannolikhetsfördelningar.
- Använd de första d kolumnerna i matrisen som matris A och de återstående d kolumnerna som matris B. Detta ger effektivt två oberoende sampel av N punkter i den d -dimensionella enhetens hyperkub.
- Bygg d ytterligare N × d matriser A B i , för i = 1,2,...,d, så att den i: e kolumnen i A B i är lika med den i: te kolumnen i B , och de återstående kolumnerna är från A .
- A- , B- och dABi - matriserna totalt specificerar N ( d +2) punkter i inmatningsutrymmet (en för varje rad ) . Kör modellen vid varje designpunkt i matriserna A , B och A B i , vilket ger totalt N ( d +2) modellutvärderingar – motsvarande f( A ), f( B ) och f( A B i ) värden.
- Beräkna känslighetsindexen med hjälp av estimatorerna nedan.
Noggrannheten hos estimatorerna är naturligtvis beroende av N . Värdet på N kan väljas genom att sekventiellt addera poäng och beräkna indexen tills de uppskattade värdena når någon acceptabel konvergens. Av denna anledning, när du använder sekvenser med låg avvikelse, kan det vara fördelaktigt att använda de som tillåter sekventiell addition av punkter (som Sobol'-sekvensen), jämfört med de som inte gör det (som latinska hyperkubsekvenser).
Uppskattare
Det finns ett antal möjliga Monte Carlo-estimatorer tillgängliga för båda indexen. Två som för närvarande används allmänt är,
och
för uppskattning av Si respektive S Ti .
Beräkningskostnad
För uppskattningen av Si och S Ti för alla indatavariabler krävs N ( d +2 ) modellkörningar. Eftersom N ofta är i storleksordningen hundratals eller tusentals körningar, kan beräkningskostnader snabbt bli ett problem när modellen tar en betydande tid för en enda körning. I sådana fall finns det ett antal tekniker tillgängliga för att minska beräkningskostnaden för att uppskatta känslighetsindex, såsom emulatorer , HDMR och FAST .