Edgeworth-serien

Gram –Charlier A-serien (uppkallad för att hedra Jørgen Pedersen Gram och Carl Charlier ), och Edgeworth-serien (uppkallad för att hedra Francis Ysidro Edgeworth ) är serier som approximerar en sannolikhetsfördelning i termer av dess kumulanter . Serierna är desamma; men arrangemanget av termer (och därmed noggrannheten vid trunkering av serien) skiljer sig åt. Nyckelidén med dessa expansioner är att skriva den karakteristiska funktionen för fördelningen vars sannolikhetstäthetsfunktion f ska approximeras i termer av den karakteristiska funktionen för en fördelning med kända och lämpliga egenskaper, och att återvinna f genom den inversa Fouriertransformen .

Gram–Charlier A-serien

Vi undersöker en kontinuerlig stokastisk variabel. Låt vara den karakteristiska funktionen för dess fördelning vars densitetsfunktion är f , och dess kumulanter . Vi expanderar i termer av en känd fördelning med sannolikhetstäthetsfunktion ψ , karakteristisk funktion och kumulanter . Tätheten ψ väljs i allmänhet för att vara normalfördelningen, men andra val är också möjliga. Enligt definitionen av kumulanterna har vi (se Wallace, 1958)

och

som ger följande formella identitet:

Med Fouriertransformens egenskaper, är Fouriertransformen av där D är differentialoperatorn med avseende på x . Sålunda, efter att ha ändrat med på båda sidor av ekvationen, finner vi för f den formella expansionen

Om ψ väljs som normal densitet

med medelvärde och varians enligt f , det vill säga medelvärde och varians blir expansionen

eftersom för alla r > 2, eftersom högre kumulanter av normalfördelningen är 0. Genom att expandera exponentialen och samla termer enligt ordningen på derivatorna kommer vi fram till Gram–Charlier A-serien. En sådan expansion kan skrivas kompakt i termer av Bell polynom som

Eftersom den n:te derivatan av Gaussfunktionen ges i termer av hermitpolynom som

detta ger oss det slutliga uttrycket för Gram–Charlier A-serien som

Att integrera serien ger oss den kumulativa distributionsfunktionen

där är CDF för normalfördelningen.

Om vi ​​bara inkluderar de två första korrigeringstermerna till normalfördelningen får vi

med och .

Observera att detta uttryck inte garanteras vara positivt och därför inte är en giltig sannolikhetsfördelning. Gram–Charlier A-serien divergerar i många fall av intresse – den konvergerar endast om faller av snabbare än i oändligheten (Cramér 1957). När den inte konvergerar är serien inte heller en sann asymptotisk expansion , eftersom det inte är möjligt att uppskatta expansionsfelet. Av denna anledning är Edgeworth-serien (se nästa avsnitt) generellt att föredra framför Gram–Charlier A-serien.

Edgeworth-serien

Edgeworth utvecklade en liknande expansion som en förbättring av den centrala gränssatsen . Fördelen med Edgeworth-serien är att felet kontrolleras, så att det är en sann asymptotisk expansion .

Låt vara en sekvens av oberoende och identiskt fördelade slumpvariabler med ändligt medelvärde och varians , och låt vara deras standardiserade summor:

Låt beteckna de kumulativa fördelningsfunktionerna för variablerna . Sedan genom den centrala gränssatsen,

för varje , så länge medelvärdet och variansen är ändliga.

Standardiseringen av säkerställer att de två första kumulanterna av är och Antag nu att, förutom att ha medelvärdet och varians , de iid slumpvariablerna har högre kumulanter . Från additivitets- och homogenitetsegenskaperna för kumulanter är kumulanterna för i termer av kumulanterna för för ,

Om vi ​​utökar det formella uttrycket för den karakteristiska funktionen av i termer av standarden normalfördelning, det vill säga om vi sätter

då är de kumulanta skillnaderna i expansionen

Gram–Charlier A-serien för densitetsfunktionen för är nu

Edgeworth-serien är utvecklad på samma sätt som Gram–Charlier A-serien, bara att nu termer samlas in enligt potenserna . Koefficienterna för n -m/2 term kan erhållas genom att samla monomialerna för Bell-polynomen som motsvarar heltalspartitionerna för m . Således har vi den karakteristiska funktionen som

där är ett polynom med grad . Återigen, efter invers Fouriertransform, följer densitetsfunktionen

På samma sätt, genom att integrera serien, får vi distributionsfunktionen

Vi kan uttryckligen skriva polynomet som

där summeringen är över alla heltalspartitioner av m så att och och

Till exempel, om m = 3, så finns det tre sätt att partitionera detta nummer: 1 + 1 + 1 = 2 + 1 = 3. Som sådan måste vi undersöka tre fall:

  • 1 + 1 + 1 = 1 · k 1 , så vi har k 1 = 3, l 1 = 3 och s = 9.
  • 1 + 2 = 1 · k 1 + 2 · k 2 , så vi har k 1 = 1, k 2 = 1, l 1 = 3, l 2 = 4 och s = 7.
  • 3 = 3 · k 3 , så vi har k 3 = 1, l 3 = 5 och s = 5.

Det erforderliga polynomet är alltså

De första fem terminerna av expansionen är

Här är φ ( j ) ( x ) den j -te derivatan av φ(·) vid punkt x . Kom ihåg att derivatorna av densiteten för normalfördelningen är relaterade till normaldensiteten med H är hermitpolynomet av ordningen n ), detta förklarar de alternativa representationerna i termer av densitetsfunktionen. Binnikov och Moessner (1998) har gett en enkel algoritm för att beräkna termer av högre ordning för expansionen.

Observera att i fallet med en gitterfördelning (som har diskreta värden), måste Edgeworth-expansionen justeras för att ta hänsyn till de diskontinuerliga hoppen mellan gitterpunkterna.

Illustration: densiteten för provmedelvärdet av tre χ²-fördelningar

Densiteten för provmedelvärdet för tre chi2-variabler. Diagrammet jämför den sanna densiteten, den normala approximationen och två Edgeworth-expansioner.

Ta och urvalets medelvärde .

Vi kan använda flera distributioner för :

  • Den exakta fördelningen, som följer en gammafördelning : .
  • Den asymptotiska normalfördelningen: .
  • Två Edgeworth-expansioner, grader 2 och 3.

Diskussion om resultat

  • expansion inte garanterad att vara en korrekt sannolikhetsfördelning eftersom CDF-värdena vid vissa punkter kan gå längre än .
  • De garanterar (asymptotiskt) absoluta fel , men relativa fel kan enkelt bedömas genom att jämföra den ledande Edgeworth-termen i resten med den övergripande ledande termen.

Se även

Vidare läsning