Guttman skala

I analysen av multivariata observationer utformade för att bedöma ämnen med avseende på ett attribut , är en Guttman-skala (uppkallad efter Louis Guttman ) en enkel (unidimensionell) ordningsskala för bedömning av attributet, från vilken de ursprungliga observationerna kan återges. Upptäckten av en Guttman-skala i data beror på att deras multivariatfördelning överensstämmer med en viss struktur (se nedan). Därför är en Guttman-skala en hypotes om strukturen av data, formulerad med avseende på ett specificerat attribut och en specificerad population och kan inte konstrueras för någon given uppsättning observationer. I motsats till en utbredd uppfattning är en Guttman-skala inte begränsad till dikotoma variabler och bestämmer inte nödvändigtvis en ordning bland variablerna. Men om alla variabler är dikotoma, ordnas variablerna verkligen efter deras känslighet vid registrering av det bedömda attributet, som illustreras av exempel 1.

Deterministisk modell

Exempel 1: Dikotoma variabler

En Guttman-skala kan antas för följande fem frågor som rör attributet "acceptans av social kontakt med invandrare" (baserat på Bogardus sociala avståndsskala ), presenterade för en lämplig population:

  1. Skulle du acceptera invandrare som bosatta i ditt land? (Nej=0; Ja=1)
  2. Skulle du acceptera invandrare som invånare i din stad? (Nej=0; Ja=1)
  3. Skulle du acceptera invandrare som boende i ditt grannskap? (Nej=0; Ja=1)
  4. Skulle du acceptera invandrare som grannar? (Nej=0; Ja=1)
  5. Skulle du acceptera en invandrare som ditt barns make? (Nej=0; Ja=1)


Ett positivt svar från en viss respondent på någon fråga i den här listan, föreslår positiva svar från den respondenten på alla föregående frågor i denna lista. Därför kan man förvänta sig att bara få svaren som anges i den skuggade delen (kolumnerna 1-5) i Tabell 1.

Tabell 1. Hypoteserade svar på de fem sociala avståndsvariablerna bildar en Guttman-skala (en kumulativ skala)
Table 1.

Varje rad i den skuggade delen av Tabell 1 (kolumn 1-5) är svarsprofilen för ett valfritt antal (≥ 0) svarande. Varje profil i denna tabell indikerar acceptans av invandrare i alla betydelser som anges av den föregående profilen, plus en ytterligare betydelse i vilken invandrare accepteras. Om i ett stort antal observationer endast de profiler som anges i Tabell 1 observeras, stöds Guttman-skalans hypotes, och skalans värden (sista kolumnen i Tabell 1) har följande egenskaper:

  1. De bedömer styrkan i attributet "acceptans av social kontakt med invandrare";
  2. De återger de ursprungliga observationerna. (Till exempel innebär en respondents skala på 2 att den respondenten svarade positivt på frågorna 1 och 2 och negativt på frågorna 3, 4 och 5.)

Guttman-skalan, om den stöds av data, är användbar för att effektivt bedöma försökspersoner (respondenter, testpersoner eller någon samling av undersökta objekt) på en endimensionell skala med avseende på det specificerade attributet. Vanligtvis hittas Guttman-skalor med avseende på attribut som är snävt definierade.

Medan andra skalningstekniker (t.ex. Likert-skalan ) producerar en enda skala genom att summera respondenternas poäng – en procedur som antar, ofta utan motivering, att alla observerade variabler har lika vikt – undviker Guttman-skalan att vikta de observerade variablerna; alltså "respekterar" data för vad de är. Om en Guttman-skala bekräftas är mätningen av attributet i sig endimensionell; endimensionaliteten framtvingas inte av summering eller medelvärde. Detta särdrag gör det lämpligt för konstruktionen av replikerbara vetenskapliga teorier och meningsfulla mätningar, som förklaras i facettteorin .

Ordinalvariabler

Givet en datamängd av N försökspersoner som observerats med avseende på n ordinalvariabler, var och en med ett ändligt antal (≥2) numeriska kategorier ordnade efter ökande styrka av ett förspecificerat attribut, låt a ij vara poängen som erhålls av försöksperson i på variabel j , och definiera listan över poäng som ämne i fick på de n variablerna, a i =a i1 …a in , för att vara profilen för ämne i . (Antalet kategorier kan vara olika i olika variabler, och ordningen på variablerna i profilerna är inte viktig men bör vara fast).

Definiera:

Två profiler, a s och a t är lika , betecknade a s =a t , iff a sj =a tj för alla j =1… n

Profil a s är större än Profil a t , betecknad a s >a t , om a sj ≥ a tj för alla j =1… n och a sj' > a tj' för minst en variabel, j' .

Profilerna a s och a t är jämförbara , betecknade som s Sa t , om a s =a t ; eller a s >a t ; eller a t >a s

Profilerna a s och a t är ojämförbara , betecknade a s $a t , om de inte är jämförbara (det vill säga för minst en variabel, j' , a sj' > a tj' och för minst en annan variabel , j '' , a tj'' > a sj '' .

För datamängder där kategorierna för alla variabler är likadant ordnade numeriskt (från högt till lågt eller från lågt till högt) med avseende på ett givet attribut, definieras Guttman-skalan helt enkelt så här:

Definition: Guttman-skalan är en datamängd där alla profilpar är jämförbara.

Exempel: Icke-dikotoma variabler

Betrakta följande fyra variabler som bedömer aritmetiska färdigheter bland en population P av elever:

V1: Kan elev (p) utföra addition av tal? Nej=1; Ja, men endast av tvåsiffriga nummer=2; Ja=3.

V2: Kan elev (p) multiplikationstabellen (1-10)? Nej=1; Ja=2.

V3: Kan elev (p) utföra multiplikation av tal? Nej=1; Ja, men endast av tvåsiffriga nummer=2; Ja=3.

V4: Kan elev (p) utföra långdivision? Nej=1; Ja=2.

Data som samlats in för ovanstående fyra variabler bland en population av skolbarn kan antas uppvisa Guttman-skalan som visas nedan i tabell 2:


Tabell 2. Data för de fyra ordinala aritmetiska färdighetsvariablerna antas bilda en Guttman-skala

V 1 V 2 V 3 V 4 Möjlig

Skala poäng

1 1 1 1 4
2 1 1 1 5
2 2 1 1 6
3 2 1 1 7
3 2 2 1 8
3 2 3 1 9
3 2 3 2 10


De uppsättningsprofiler som antas förekomma (skuggad del i tabell 2) illustrerar den definierande egenskapen hos Guttmanskalan, nämligen att vilket par av profiler som helst är jämförbara. Även här, om hypotesen bekräftas, återger en enda skalpoäng en försökspersons svar i alla observerade variabler.

Varje ordnad uppsättning siffror kan fungera som skala. I den här illustrationen valde vi summan av profilpoäng. Enligt fasettteorin kan en sådan summering vara motiverad endast i data som överensstämmer med en Guttman-skala.

Reproducerbarhet

I praktiken är perfekta ("deterministiska") Guttman-skalor sällsynta, men ungefärliga sådana har hittats i specifika populationer med avseende på attribut som religiösa sedvänjor, snävt definierade kunskapsområden, specifika färdigheter och ägande av hushållsapparater. När data inte överensstämmer med en Guttman-skala kan de antingen representera en Guttman-skala med brus (och behandlas stokastiskt), eller så kan de ha en mer komplex struktur som kräver multipel skalning för att identifiera skalorna som är inneboende i dem.

I vilken utsträckning en datamängd överensstämmer med en Guttman-skala kan uppskattas från reproducerbarhetskoefficienten som det finns ett fåtal versioner av, beroende på statistiska antaganden och begränsningar. Guttmans ursprungliga definition av reproducerbarhetskoefficienten, C R är helt enkelt 1 minus förhållandet mellan antalet fel och antalet poster i datamängden. Och för att säkerställa att det finns ett antal svar (inte fallet om alla respondenter bara godkände ett objekt) används skalbarhetskoefficienten.

I Guttman-skalning återfinns början av objektsvarsteori som, i motsats till klassisk testteori , erkänner att objekt i frågeformulär inte alla har samma svårighetsgrad. Icke-deterministiska (dvs stokastiska) modeller har utvecklats såsom Mokken-skalan och Rasch-modellen . Guttman-skalan har generaliserats till teorin och procedurerna för "multipelskalning" som identifierar det minsta antalet skalor som behövs för tillfredsställande reproducerbarhet.

Som en procedur som binder samman innehållet med logiska aspekter av data, förebådade Guttmans skala tillkomsten av facettteori som utvecklats av Louis Guttman och hans medarbetare.

Guttmanskalan i kvalitativa variabler

Guttmans ursprungliga definition av en skala tillåter också den explorativa skalningsanalysen av kvalitativa variabler (nominella variabler, eller ordinalvariabler som inte nödvändigtvis tillhör ett förutbestämt gemensamt attribut). Denna definition av Guttman-skalan bygger på den tidigare definitionen av en enkel funktion .

För en helt ordnad mängd X , säg 1,2,..., m , och en annan finit mängd, Y , med k element k m , är en funktion från X till Y en enkel funktion om X kan delas upp i k intervall som är i en-till-en-överensstämmelse med värdena för Y .

En Guttman-skala kan sedan definieras för en datamängd med n variabler, där den j: e variabeln har k j (kvalitativa, inte nödvändigtvis ordnade) kategorier, alltså:

Definition: Guttman-skalan är en datamängd för vilken det finns en ordningsvariabel, X , med ett ändligt antal m kategorier, säg 1,..., m med m ≥ max j ( k j ) och en permutation av försökspersoners profiler som t.ex. att varje variabel i datamängden är en enkel funktion av X .

Trots dess till synes elegans och dragningskraft för utforskande forskning har denna definition inte studerats eller tillämpats tillräckligt.

  1. ^ a b   Coombs, Clyde; Coombs, Lolagene; Lingoes, James (1978). "Kapitel 11: Stokastiska kumulativa skalor". I Shye, Samuel (red.). Teorikonstruktion och dataanalys i beteendevetenskapen . San Francisco: Jossey-Bass. s. 280–298. ISBN 0-87589-379-1 .
  2. ^ Stouffer, SA, Guttman, L., Suchman, EA, Lazarsfeld, PF, Star, SA, Clausen, JA (1950) Mätning och förutsägelse Princeton University Press
  3. ^ a b   Guttman, Louis (1944). "En grund för skalning av kvalitativ data". American Sociological Review . 9 (2): 139–150. doi : 10.2307/2086306 . JSTOR 2086306 .
  4. ^ Menzel, H. (1953) En ny koefficient för scalogramanalys i Educational and Public Opinion Quarterly Volume: 15 nummer: 2, sida(r): 268-280

Vidare läsning

  1. Coombs, CH, Coombs, LC, & Lingoes, JC (1978). "Stokastiska kumulativa skalor". I S. Shye (Red.), Teorikonstruktion och dataanalys i beteendevetenskap. San Francisco : Jossey-Bass.
  2. Goodman, LA (1975). "En ny modell för att skala svarsmönster: En tillämpning av konceptet kvasi-oberoende". Journal of the American Statistical Association , 70, 755–768.
  3. Guttman, L. (1944). "En grund för skalning av kvalitativ data". American Sociological Review , 9, 139–150.
  4. Green, BF (1956). "En metod för skalogramanalys med hjälp av sammanfattande statistik". Psychometrika , 21, 79-88.