Goodman och Kruskals lambda

Inom sannolikhetsteori och statistik är Goodman & Kruskals lambda ( \ ) ett mått på proportionell minskning av fel i korstabuleringsanalys . För varje urval med en nominell oberoende variabel och beroende variabel (eller sådana som kan behandlas nominellt) anger det i vilken utsträckning de modala kategorierna och frekvenserna för varje värde av den oberoende variabeln skiljer sig från den övergripande modala kategorin och frekvensen, dvs. för alla värden på den oberoende variabeln tillsammans. definieras av ekvationen

var

är den totala icke-modala frekvensen, och
är summan av de icke-modala frekvenserna för varje värde av den oberoende variabeln.

Värden för lambda sträcker sig från noll (ingen association mellan oberoende och beroende variabler) till ett (perfekt association).

Svagheter

Även om Goodman och Kruskals lambda är ett enkelt sätt att bedöma sambandet mellan variabler, ger det ett värde på 0 (ingen association) när två variabler är i överensstämmelse – det vill säga när den modala kategorin är densamma för alla värden av den oberoende variabeln , även om modala frekvenser eller procentsatser varierar. Som ett exempel, betrakta tabellen nedan, som beskriver ett fiktivt urval av 350 individer, kategoriserade efter relationsstatus och blodtryck. Antag att relationsstatusen är den oberoende variabeln, blodtrycket är den beroende variabeln, dvs frågan som ställs är "kan blodtrycket förutsägas bättre om relationsstatusen är känd?"

Relationsstatus och blodtryck (fiktivt)
Relationsstatus Total
Ogift Gift
Blodtryck Vanligt
80 % (120)

51 % (102)

63,4 % (222)
Hög
20 % (30)

49 % (98)

36,6 % (128)
Total
42,9 % (150)

57,1 % (200)

100 % (350)

För detta prov,

Anledningen är att det förutsagda nominella blodtrycket faktiskt är "Normalt" i båda kolumnerna (båda övre siffrorna är högre än motsvarande lägre siffra). Att ta hänsyn till förhållandets status kommer alltså inte att ändra förutsägelsen att människor har ett normalt blodtryck, även om data indikerar att att vara gift ökar sannolikheten för högt blodtryck.

Om frågan ändras, t.ex. genom att fråga "Vad är den förväntade relationsstatusen baserat på blodtryck?", kommer att ha ett värde som inte är noll.

Det är:

Se även

  •   Goodman, LA, Kruskal, WH (1954) "Measures of association for cross classifications" . Del I. Journal of the American Statistical Association , 49, 732–764. JSTOR 281536
  •   Goodman, LA, Kruskal, WH (1959) "Measures of Association for Cross Classifications. II: Ytterligare diskussioner och referenser" [ permanent död länk ] . Journal of the American Statistical Association , 52, 123–163. JSTOR 2282143
  •   Goodman, LA, Kruskal, WH (1963) "Measures of Association for Cross Classifications III: Approximate Sampling Theory", Journal of the American Statistical Association , 58, 310–364. JSTOR 2283271 doi : 10.1080/01621459.1963.10500850