Vi undersöker en kontinuerlig stokastisk variabel. Låt vara den karakteristiska funktionen för dess fördelning vars densitetsfunktion är f , och dess kumulanter . Vi expanderar i termer av en känd fördelning med sannolikhetstäthetsfunktion ψ , karakteristisk funktion och kumulanter . Tätheten ψ väljs i allmänhet för att vara normalfördelningen, men andra val är också möjliga. Enligt definitionen av kumulanterna har vi (se Wallace, 1958)
och
som ger följande formella identitet:
Med Fouriertransformens egenskaper, är Fouriertransformen av där D är differentialoperatorn med avseende på x . Sålunda, efter att ha ändrat med på båda sidor av ekvationen, finner vi för f den formella expansionen
Om ψ väljs som normal densitet
med medelvärde och varians enligt f , det vill säga medelvärde och varians blir expansionen
eftersom för alla r > 2, eftersom högre kumulanter av normalfördelningen är 0. Genom att expandera exponentialen och samla termer enligt ordningen på derivatorna kommer vi fram till Gram–Charlier A-serien. En sådan expansion kan skrivas kompakt i termer av Bell polynom som
Eftersom den n:te derivatan av Gaussfunktionen ges i termer av hermitpolynom som
detta ger oss det slutliga uttrycket för Gram–Charlier A-serien som
Om vi bara inkluderar de två första korrigeringstermerna till normalfördelningen får vi
med och .
Observera att detta uttryck inte garanteras vara positivt och därför inte är en giltig sannolikhetsfördelning. Gram–Charlier A-serien divergerar i många fall av intresse – den konvergerar endast om faller av snabbare än i oändligheten (Cramér 1957). När den inte konvergerar är serien inte heller en sann asymptotisk expansion , eftersom det inte är möjligt att uppskatta expansionsfelet. Av denna anledning är Edgeworth-serien (se nästa avsnitt) generellt att föredra framför Gram–Charlier A-serien.
Edgeworth-serien
Edgeworth utvecklade en liknande expansion som en förbättring av den centrala gränssatsen . Fördelen med Edgeworth-serien är att felet kontrolleras, så att det är en sann asymptotisk expansion .
Låt vara en sekvens av oberoende och identiskt fördelade slumpvariabler med ändligt medelvärde och varians , och låt vara deras standardiserade summor:
för varje , så länge medelvärdet och variansen är ändliga.
Standardiseringen av säkerställer att de två första kumulanterna av är och Antag nu att, förutom att ha medelvärdet och varians , de iid slumpvariablerna har högre kumulanter . Från additivitets- och homogenitetsegenskaperna för kumulanter är kumulanterna för i termer av kumulanterna för för ,
Om vi utökar det formella uttrycket för den karakteristiska funktionen av i termer av standarden normalfördelning, det vill säga om vi sätter
då är de kumulanta skillnaderna i expansionen
Gram–Charlier A-serien för densitetsfunktionen för är nu
Edgeworth-serien är utvecklad på samma sätt som Gram–Charlier A-serien, bara att nu termer samlas in enligt potenserna . Koefficienterna för n -m/2 term kan erhållas genom att samla monomialerna för Bell-polynomen som motsvarar heltalspartitionerna för m . Således har vi den karakteristiska funktionen som
där är ett polynom med grad . Återigen, efter invers Fouriertransform, följer densitetsfunktionen
På samma sätt, genom att integrera serien, får vi distributionsfunktionen
Vi kan uttryckligen skriva polynomet som
där summeringen är över alla heltalspartitioner av m så att och och
Till exempel, om m = 3, så finns det tre sätt att partitionera detta nummer: 1 + 1 + 1 = 2 + 1 = 3. Som sådan måste vi undersöka tre fall:
1 + 1 + 1 = 1 · k 1 , så vi har k 1 = 3, l 1 = 3 och s = 9.
1 + 2 = 1 · k 1 + 2 · k 2 , så vi har k 1 = 1, k 2 = 1, l 1 = 3, l 2 = 4 och s = 7.
3 = 3 · k 3 , så vi har k 3 = 1, l 3 = 5 och s = 5.
Det erforderliga polynomet är alltså
De första fem terminerna av expansionen är
Här är φ ( j ) ( x ) den j -te derivatan av φ(·) vid punkt x . Kom ihåg att derivatorna av densiteten för normalfördelningen är relaterade till normaldensiteten med H är hermitpolynomet av ordningen n ), detta förklarar de alternativa representationerna i termer av densitetsfunktionen. Binnikov och Moessner (1998) har gett en enkel algoritm för att beräkna termer av högre ordning för expansionen.
Observera att i fallet med en gitterfördelning (som har diskreta värden), måste Edgeworth-expansionen justeras för att ta hänsyn till de diskontinuerliga hoppen mellan gitterpunkterna.
Illustration: densiteten för provmedelvärdet av tre χ²-fördelningar
Densiteten för provmedelvärdet för tre chi2-variabler. Diagrammet jämför den sanna densiteten, den normala approximationen och två Edgeworth-expansioner.
expansion inte garanterad att vara en korrekt sannolikhetsfördelning eftersom CDF-värdena vid vissa punkter kan gå längre än .
De garanterar (asymptotiskt) absoluta fel , men relativa fel kan enkelt bedömas genom att jämföra den ledande Edgeworth-termen i resten med den övergripande ledande termen.
Martin, Douglas; Arora, Rohit (2017). "Ineffektivitet och partiskhet av modifierat värde-at-risk och förväntat underskott". Journal of Risk . 19 (6): 59–84. doi : 10.21314/JOR.2017.365 .
JE Kolassa (2006). Series Approximation Methods in Statistics (3:e upplagan). (Föreläsningsanteckningar i statistik #88). Springer, New York.