D'Agostinos K -ruta test

Inom statistik är D'Agostinos K ^2- , test, uppkallat efter Ralph D'Agostino, ett passande mått på avvikelse från normalitet det vill säga testet syftar till att mäta kompatibiliteten hos given data med nollhypotesen att data är en realisering av oberoende, identiskt fördelade gaussiska slumpvariabler. Testet är baserat på omvandlingar av provet kurtosis och skewness , och har makt endast mot alternativen att fördelningen är skev och/eller kurtisk.

Skevhet och kurtos

I det följande betecknar { x _i } ett urval av n observationer, g ₁ och g ₂ är provets skevhet och kurtos , m _j är det j -te provets centrala moment och ${\bar { x}}$ är sampelmedelvärdet . Ofta i litteraturen relaterad till normalitetstestning betecknas skevhet och kurtos som √ β ₁ respektive β ₂ . Sådan notation kan vara obekväm eftersom till exempel √ β ₁ kan vara en negativ storhet.

Provets skevhet och kurtos definieras som

{\begin{aligned}&g_{1}={\frac {m_{3}}{m_{2}^{3/2}}}={\frac {{\frac {1}{n} }\summa _{i=1}^{n}\left(x_{i}-{\bar {x}}\right)^{3}}{\left({\frac {1}{n}} \sum _{i=1}^{n}\left(x_{i}-{\bar {x}}\right)^{2}\right)^{3/2}}}\ ,\\&g_ {2}={\frac {m_{4}}{m_{2}^{2}}}-3={\frac {{\frac {1}{n}}\summa _{i=1}^ {n}\left(x_{i}-{\bar {x}}\right)^{4}}{\left({\frac {1}{n}}\summa _{i=1}^{ n}\left(x_{i}-{\bar {x}}\right)^{2}\right)^{2}}}-3\ .\end{aligned}}

Dessa kvantiteter uppskattar konsekvent den teoretiska skevheten respektive kurtosen hos fördelningen. Dessutom, om provet verkligen kommer från en normal population, kan de exakta ändliga provfördelningarna av skevhet och kurtos i sig analyseras i termer av deras medelvärden μ ₁ , varianser μ ₂ , skevheter γ ₁ och kurtoser γ ₂ . Detta har gjorts av Pearson (1931) , som härledde följande uttryck: ^{[ bättre källa behövs ]}

{\begin{aligned}&\mu _{1}(g_{1})=0,\\&\mu _{2}(g_{1})={\frac {6(n-2 )}{(n+1)(n+3)}},\\&\gamma _{1}(g_{1})\equiv {\frac {\mu _{3}(g_{1})} {\mu _{2}(g_{1})^{3/2}}}=0,\\&\gamma _{2}(g_{1})\equiv {\frac {\mu _{4 }(g_{1})}{\mu _{2}(g_{1})^{2}}}-3={\frac {36(n-7)(n^{2}+2n-5 )}{(n-2)(n+5)(n+7)(n+9)}}.\end{aligned}}

och

{\begin{aligned}&\mu _{1}(g_{2})=-{\frac {6}{n+1}},\\&\mu _{2}(g_{2} })={\frac {24n(n-2)(n-3)}{(n+1)^{2}(n+3)(n+5)}},\\&\gamma _{1 }(g_{2})\equiv {\frac {\mu _{3}(g_{2})}{\mu _{2}(g_{2})^{3/2}}}={\ frac {6(n^{2}-5n+2)}{(n+7)(n+9)}}{\sqrt {\frac {6(n+3)(n+5)}{n( n-2)(n-3)}}},\\&\gamma _{2}(g_{2})\equiv {\frac {\mu _{4}(g_{2})}{\mu _{2}(g_{2})^{2}}}-3={\frac {36(15n^{6}-36n^{5}-628n^{4}+982n^{3}+5777n ^{2}-6402n+900)}{n(n-3)(n-2)(n+7)(n+9)(n+11)(n+13)}}.\end{aligned} }

Exempelvis kan ett urval med storlek n = 1000 från en normalfördelad population förväntas ha en skevhet på 0, SD 0,08 och en kurtos på 0, SD 0,15 , där SD anger standardavvikelsen. ^{[ citat behövs ]}

Transformerad provskevhet och kurtos

Provskevheten g ₁ och kurtosis g ₂ är båda asymptotiskt normala. Men hastigheten för deras konvergens till distributionsgränsen är frustrerande långsam, särskilt för g ₂ . Till exempel även med n = 5000 observationer har provet kurtosis g ₂ både skevheten och kurtosen på ungefär 0,3, vilket inte är försumbart. För att råda bot på denna situation har det föreslagits att omvandla kvantiteterna g ₁ och g ₂ på ett sätt som gör deras fördelning så nära standard som möjligt.

D'Agostino & Pearson (1973) föreslog särskilt följande transformation för skevhet i provet:

Z_{1}(g_{1})=\delta \operatörsnamn {asinh} \left({\frac {g_{1} }{\alpha {\sqrt {\mu _{2}}}}}\right),

där konstanterna α och δ beräknas som

{\begin{aligned}&W^{2}={\sqrt { 2\gamma _{2}+4}}-1,\\&\delta =1/{\sqrt {\ln W}},\\&\alpha ^{2}=2/(W^{2} -1),\end{aligned}}

och där μ ₂ = μ ₂ ( g ₁ ) är variansen av g ₁ , och γ ₂ = γ ₂ ( g ₁ ) är kurtosen - uttrycken som ges i föregående avsnitt.

På liknande sätt föreslog Anscombe & Glynn (1983) en transformation för g ₂ , som fungerar ganska bra för provstorlekar på 20 eller större:

Z_{ 2}(g_{2})={\sqrt {\frac {9A}{2}}}\left\{1-{\frac {2}{9A}}-\left({\frac {1-2 /A}{1+{\frac {g_{2}-\mu _{1}}{\sqrt {\mu _{2}}}}{\sqrt {2/(A-4)}}}} \right)^{\!1/3}\right\},

var

A=6+{\frac {8}{\gamma _{1}}}\left({\frac { 2}{\gamma _{1}}}+{\sqrt {1+4/\gamma _{1}^{2}}}\right),

och μ ₁ = μ ₁ ( g ₂ ), μ ₂ = μ ₂ ( g ₂ ), γ ₁ = γ ₁ ( g ₂ ) är de kvantiteter som beräknats av Pearson.

Omnibus K ² statistik

Statistik Z ₁ och Z ₂ kan kombineras för att producera ett omnibustest, som kan upptäcka avvikelser från normalitet på grund av antingen skevhet eller kurtos ( D'Agostino, Belanger & D'Agostino 1990) :

K^{2}=Z_{1}(g_{1})^{2}+Z_{2}(g_{2} })^{2}\,

Om nollhypotesen om normalitet är sann, så är K ² ungefär χ ² -fördelad med 2 frihetsgrader.

Observera att statistiken g ₁ , g ₂ inte är oberoende, bara okorrelerad. Därför kommer deras transformationer Z ₁ , Z ₂ också att vara beroende ( Shenton & Bowman 1977) , vilket gör giltigheten av χ ² approximation tveksam. Simuleringar visar att under nollhypotesen kännetecknas K ^{2 -teststatistiken av}

	förväntat värde	standardavvikelse	95% kvantil
n = 20	1,971	2,339	6,373
n = 50	2,017	2,308	6,339
n = 100	2,026	2,267	6,271
n = 250	2,012	2,174	6,129
n = 500	2,009	2,113	6,063
n = 1000	2 000	2,062	6,038
χ ² (2) fördelning	2 000	2 000	5,991

Se även

Anscombe, FJ; Glynn, William J. (1983). "Fördelning av kurtosisstatistiken b ₂ för normal statistik". Biometrika . 70 (1): 227–234. doi : 10.1093/biomet/70.1.227 . JSTOR 2335960 .
D'Agostino, Ralph B. (1970). "Transformation till normalitet av nollfördelningen av g ₁ ". Biometrika . 57 (3): 679–681. doi : 10.1093/biomet/57.3.679 . JSTOR 2334794 .
D'Agostino, Ralph B.; Pearson, ES (1973). "Tester för avvikelse från normalitet. Empiriska resultat för fördelningarna av b ₂ och √b ₁ ". Biometrika . 60 (3): 613–622. JSTOR 2335012 .
D'Agostino, Ralph B.; Belanger, Albert; D'Agostino, Ralph B., Jr. (1990). "Ett förslag för att använda kraftfulla och informativa normalitetstester" ( PDF) . Den amerikanska statistikern . 44 (4): 316–321. doi : 10.2307/2684359 . JSTOR 2684359 . Arkiverad från originalet (PDF) 2012-03-25.
Pearson, Egon S. (1931). "Anmärkning om normalitetstester". Biometrika . 22 (3/4): 423–424. doi : 10.1093/biomet/22.3-4.423 . JSTOR 2332104 .
Shenton, LR; Bowman, Kimiko O. (1977). "En bivariat modell för fördelningen av √b ₁ och b ₂ ". Journal of the American Statistical Association . 72 (357): 206–211. doi : 10.1080/01621459.1977.10479940 . JSTOR 2286939 .

D'Agostinos K -ruta test

Skevhet och kurtos

Transformerad provskevhet och kurtos

Omnibus K 2 statistik

Se även

Omnibus K ² statistik