Scotts Pi

Scotts pi (uppkallad efter William A Scott ) är en statistik för att mäta interbedömartillförlitlighet för nominella data i kommunikationsstudier . Textliga enheter kommenteras med kategorier av olika kommentatorer, och olika mått används för att bedöma graden av överensstämmelse mellan kommentatorerna, varav en är Scotts pi. Eftersom automatisk anteckning av text är ett populärt problem inom naturlig språkbehandling och målet är att få datorprogrammet som utvecklas att stämma överens med människorna i de anteckningar det skapar, är det viktigt att bedöma i vilken utsträckning människor håller med varandra. fastställa en rimlig övre gräns för datorns prestanda.

Introduktion

Scotts pi liknar Cohens kappa genom att de förbättras på enkel observerad överensstämmelse genom att ta hänsyn till graden av överensstämmelse som kan förväntas av en slump. Men i varje statistik beräknas den förväntade överenskommelsen något annorlunda. Scotts pi gör antagandet att annotatorer har samma fördelning av svar, vilket gör Cohens kappa något mer informativt. Scotts pi utökas till mer än två annotatorer av Fleiss kappa .

Ekvationen för Scotts pi, som i Cohens kappa , är:

Emellertid beräknas Pr(e) med hjälp av kvadratiska "fogproportioner" som är kvadratiska aritmetiska medelvärden av marginalproportionerna (medan Cohens använder kvadratiska geometriska medelvärden av dem).

Arbetat exempel

Förvirringsmatris för två kommentatorer, tre kategorier {Yes, No, Maybe} och 45 objekt betygsatta (90 betyg för två kommentatorer):

Ja Nej Kanske Marginalsumma
Ja 1 2 3 6
Nej 4 5 6 15
Kanske 7 8 9 24
Marginalsumma 12 15 18 45

För att beräkna den förväntade överensstämmelsen, summera marginaler för annotatorer och dividera med det totala antalet betyg för att få gemensamma proportioner. Kvadrat och totalt dessa:

Ann1 Ann2 Joint Proportion JP Squared
Ja 12 6 (12 + 6)/90 = 0,2 0,04
Nej 15 15 (15 + 15)/90 = 0,333 0,111
Kanske 18 24 (18 + 24)/90 = 0,467 0,218
Total 0,369

För att beräkna observerad överensstämmelse, dividera antalet objekt som kommentatorerna kom överens om med det totala antalet objekt. I detta fall,

Givet att Pr(e) = 0,369 är Scotts pi då

Se även

  • Scott, W. (1955). "Tillförlitlighet hos innehållsanalys: fallet med kodning i nominell skala." Public Opinion Quarterly, 19(3), 321-325.
  • Krippendorff, K. (2004b) "Tillförlitlighet i innehållsanalys: Några vanliga missuppfattningar och rekommendationer." i Human Communication Research. Vol. 30, sid. 411-433.