Goodman och Kruskals gamma
I statistik är Goodman och Kruskals gamma ett mått på rangkorrelation , dvs likheten mellan ordningsföljderna av data när de rankas efter var och en av kvantiteterna . Den mäter associationsstyrkan för de korstabulerade data när båda variablerna mäts på ordningsnivå . Den gör ingen justering för vare sig bordsstorlek eller slipsar. Värden sträcker sig från −1 (100 % negativ association eller perfekt inversion) till +1 (100 % positiv association eller perfekt överensstämmelse). Ett värde på noll indikerar frånvaron av association.
Denna statistik (som är skild från Goodman och Kruskals lambda ) är uppkallad efter Leo Goodman och William Kruskal , som föreslog den i en serie artiklar från 1954 till 1972.
Definition
Uppskattningen av gamma, G , beror på två kvantiteter:
- N s , antalet fallpar rangordnade i samma ordning på båda variablerna (antal konkordanta par ) ,
- N d , antalet par av fall rangordnade i omvänd ordning på båda variablerna (antal omvända par),
där "band" (fall där någon av de två variablerna i paret är lika) tas bort. Sedan
Denna statistik kan betraktas som den maximala sannolikhetsskattaren för den teoretiska kvantiteten , där
och där P s och P d är sannolikheterna för att ett slumpmässigt utvalt par observationer kommer att placeras i samma respektive motsatt ordning, när de rangordnas av båda variablerna.
Kritiska värden för gammastatistiken hittas ibland genom att använda en approximation, varvid ett transformerat värde, t av statistiken hänvisas till Student t-fördelning , där [ citat behövs ]
och där n är antalet observationer (inte antalet par):
Yules Q
Ett specialfall av Goodman och Kruskals gamma är Yules Q , även känd som Yule-associationskoefficienten , som är specifik för 2×2-matriser. Tänk på följande händelsetabell över händelser, där varje värde är en räkning av en händelses frekvens:
Ja | Nej | Summor | |
---|---|---|---|
Positiv | a | b | a + b |
Negativ | c | d | c + d |
Summor | a + c | b + d | n |
Yules Q ges av:
Även om den beräknas på samma sätt som Goodman och Kruskals gamma, har den en något bredare tolkning eftersom distinktionen mellan nominella och ordinala skalor blir en fråga om godtycklig märkning för dikotoma distinktioner. Om Q är positivt eller negativt beror alltså bara på vilka parningar analytikern anser vara överensstämmande, men är annars symmetriska.
Q varierar från −1 till +1. −1 reflekterar total negativ association, +1 reflekterar perfekt positiv association och 0 reflekterar ingen association alls. Tecknet beror på vilka parningar analytikern från början ansåg vara konkordanta, men detta val påverkar inte storleken.
När det gäller oddskvoten ELLER, ges Yules Q av
och så är Yules Q och Yules Y relaterade till
Se även
- Kendall tau rank korrelationskoefficient
- Goodman och Kruskals lambda
- Yules Y , även känd som koefficienten för kolligering
Vidare läsning
- Sheskin, DJ (2007) Handboken för parametriska och icke-parametriska statistiska förfaranden . Chapman & Hall/CRC, ISBN 9781584888147