Kendalls W

Kendalls W (även känd som Kendalls konkordanskoefficient ) är en icke-parametrisk statistik för rangkorrelation . Det är en normalisering av statistiken för Friedman-testet och kan användas för att bedöma överensstämmelse mellan bedömare och i synnerhet tillförlitlighet mellan bedömare . Kendalls W sträcker sig från 0 (ingen överenskommelse) till 1 (fullständig överenskommelse).

Anta till exempel att ett antal personer har blivit ombedda att rangordna en lista över politiska frågor, från de viktigaste till de minst viktiga. Kendalls W kan beräknas från dessa data. Om teststatistiken W är 1, har alla undersökningsrespondenterna varit enhälliga, och varje respondent har tilldelat samma ordning till listan med problem. Om W är 0, så finns det ingen övergripande trend av överensstämmelse bland respondenterna, och deras svar kan betraktas som i huvudsak slumpmässiga. Mellanvärden för W indikerar en större eller mindre grad av enighet mellan de olika svaren.

Medan tester som använder Pearsons standardkorrelationskoefficient antar normalfördelade värden och jämför två sekvenser av utfall samtidigt, gör Kendalls W inga antaganden om sannolikhetsfördelningens natur och kan hantera hur många distinkta utfall som helst.

Steps of Kendall's W

Antag att objekt i ges rangen r i,j av domarnummer j , där det finns totalt n objekt och m domare. Då är den totala rang som ges till objekt i

och medelvärdet för dessa totala led är

Summan av kvadrerade avvikelser, S , definieras som

definieras Kendalls W som

Om teststatistiken W är 1, har alla domare eller undersökningsrespondenterna varit enhälliga, och varje domare eller respondent har tilldelat samma ordning till listan över objekt eller problem. Om W är 0, så finns det ingen övergripande trend av överensstämmelse bland respondenterna, och deras svar kan betraktas som i huvudsak slumpmässiga. Mellanvärden på W indikerar en större eller mindre grad av enighet bland de olika domarna eller respondenterna.

Kendall och Gibbons (1990) visar också att W är linjärt relaterat till medelvärdet av Spearmans rangkorrelationskoefficienter mellan alla möjliga rankingpar mellan domare

Ofullständiga block

När domarna endast utvärderar en delmängd av de n objekten, och när motsvarande blockdesign är en (n, m, r, p, λ)-design (notera den olika notationen) . Med andra ord, när

  1. varje domare rankar samma antal p objekt för vissa ,
  2. varje objekt rankas exakt samma totala antal r gånger,
  3. och varje par av objekt presenteras tillsammans för någon bedömare totalt exakt λ gånger, en konstant för alla par.

definieras Kendalls W som

Om och så att varje domare rangordnar alla n objekt, är formeln ovan ekvivalent med den ursprungliga.

Korrigering för slipsar

När likvärdiga värden inträffar ges var och en medelvärdet av de rangordningar som skulle ha givits om inga kopplingar inträffat. Till exempel har datamängden {80,76,34,80,73,80} värden 80 oavgjort för 4:e, 5:e och 6:e plats; eftersom medelvärdet av {4,5,6} = 5, skulle rankningar tilldelas rådatavärdena enligt följande: {5,3,1,5,2,5}.

Effekten av band är att minska värdet på W ; denna effekt är dock liten om det inte finns ett stort antal band. För att korrigera för kopplingar, tilldela rankningar till bundna värden enligt ovan och beräkna korrigeringsfaktorerna

där t i är antalet bundna led i den i :te gruppen av bundna led, (där en grupp är en uppsättning värden med konstant (obunden) rang) och g j är antalet grupper av kopplingar i uppsättningen av rangordningar (från 1 till n ) för domare j . Tj är . således den korrektionsfaktor som krävs för uppsättningen av rang för domare j , dvs. den j :e uppsättningen av rang Observera att om det inte finns några jämna led för domare j , är T j lika med 0.

Med korrigeringen för slips blir formeln för W

där R i är summan av rangorden för objekt i , och är summan av värden på T j över alla m uppsättningar av rangordningar.

Steg av viktade Kendalls W

I vissa fall kanske vikten av bedömarna (experterna) inte är densamma som varandra. I det här fallet ska Weighted Kendall's W användas. Antag att objekt ges rangen av domarnummer , där det finns totalt objekt och domare. Vikten av domare visas också av (i verkliga situationer kan betydelsen av varje bedömare vara olika). Domarnas vikt är faktiskt . Då är den totala rankningen som ges till objekt

och medelvärdet för dessa totala rankningar är,

Summan av kvadrerade avvikelser, , definieras som,

och sedan definieras viktade Kendalls W som,

Ovanstående formel är lämplig när vi inte har någon oavgjort rang.

Korrigering för slipsar

I händelse av oavgjort rang måste vi överväga det i formeln ovan. För att korrigera för band bör vi beräkna korrigeringsfaktorerna,

där representerar antalet oavgjorda rankningar i domare för objekt . visar det totala antalet oavgjorda resultat i domare . Med korrigeringen för slips blir formeln för Weighted Kendalls W ,

Om bedömarnas vikter är lika (fördelningen av vikterna är enhetlig), är värdet av Weighted Kendalls W och Kendalls W lika.

Signifikanstest

När det gäller fullständiga rangordningar ges ett vanligt använt signifikanstest för W mot en nollhypotes om ingen överensstämmelse (dvs. slumpmässiga rangordningar) av Kendall och Gibbons (1990).

Där teststatistiken tar en chi-kvadratfördelning med frihetsgrader.

Vid ofullständiga rankningar (se ovan) blir detta

Där återigen finns frihetsgrader.

Legendre jämförde via simulering kraften hos chi-kvadrat- och permutationstestningsmetoderna för att bestämma betydelsen för Kendalls W . Resultaten visade att chi-kvadratmetoden var alltför konservativ jämfört med ett permutationstest när . Marozzi utökade detta genom att också överväga F -testet, som föreslagits i den ursprungliga publikationen som introducerar W- statistiken av Kendall & Babington Smith (1939):

Där teststatistiken följer en F-fördelning med och frihetsgrader. Marozzi fann att F -testet fungerar ungefär lika bra som permutationstestmetoden och kan vara att föredra framför när är liten, eftersom det är beräkningsmässigt enklare.

programvara

Kendalls W och Weighted Kendalls W är implementerade i MATLAB , SPSS , R och andra statistiska programvarupaket.

Se även

Anteckningar

  •   Kendall, MG; Babington Smith, B. (sep 1939). "Problemet med m Rankings" . The Annals of Mathematical Statistics . 10 (3): 275–287. doi : 10.1214/aoms/1177732186 . JSTOR 2235668 .
  • Kendall, MG, & Gibbons, JD (1990). Rankkorrelationsmetoder. New York, NY: Oxford University Press.
  •   Corder, GW, Foreman, DI (2009). Icke-parametrisk statistik för icke-statistiker: A Step-by-Step Approach Wiley, ISBN 978-0-470-45461-9
  •   Dodge, Y. (2003). Oxford Dictionary of Statistical Terms , OUP. ISBN 0-19-920613-9
  • Legendre, P (2005) Species Associations: The Kendall Coefficient of Concordance Revisited. Journal of Agricultural, Biological and Environmental Statistics , 10(2), 226–245. [1]
  •   Siegel, Sidney; Castellan, N. John, Jr. (1988). Ickeparametrisk statistik för beteendevetenskaperna (2:a upplagan). New York: McGraw-Hill. sid. 266. ISBN 978-0-07-057357-4 .
  •   Gibbons, Jean Dickinson; Chakraborti, Subhabrata (2003). Icke-parametrisk statistisk slutledning (4:e upplagan). New York: Marcel Dekker. s. 476–482. ISBN 978-0-8247-4052-8 .