Galtons problem

Galtons problem , uppkallat efter Sir Francis Galton , är problemet med att dra slutsatser från tvärkulturella data, på grund av det statistiska fenomen som nu kallas autokorrelation . Problemet är nu erkänt som ett allmänt problem som gäller alla icke-experimentella studier och även experimentell design . Det beskrivs enklast som problemet med externa beroenden vid statistiska uppskattningar när de insamlade elementen inte är statistiskt oberoende . Att fråga två personer i samma hushåll om de till exempel tittar på tv ger dig inga statistiskt oberoende svar. Urvalsstorleken, n , för oberoende observationer i detta fall är en, inte två. När väl korrekta justeringar har gjorts som handlar om externa beroenden, kommer sannolikhetsteorins axiom angående statistiskt oberoende att gälla. Dessa axiom är viktiga för att härleda till exempel variansmått eller test av statistisk signifikans .

Ursprung

1888 var Galton närvarande när Sir Edward Tylor presenterade ett papper vid Royal Anthropological Institute . Tylor hade sammanställt information om institutioner för äktenskap och härkomst för 350 kulturer och undersökt sambanden mellan dessa institutioner och mått på samhällelig komplexitet. Tylor tolkade hans resultat som indikationer på en allmän evolutionär sekvens, där institutioner ändrar fokus från moderlinjen till faderns linje i takt med att samhällen blir allt mer komplexa. Galton höll inte med och påpekade att likheter mellan kulturer kan bero på lån, kan bero på gemensam härkomst eller kan bero på evolutionär utveckling; han hävdade att utan att kontrollera för lån och gemensam härkomst kan man inte dra giltiga slutsatser om evolutionär utveckling. Galtons kritik har blivit det eponyma Galtons problem , som namnges av Raoul Naroll , som föreslog de första statistiska lösningarna.

I början av 1900-talet övergavs unilineal evolutionism och tillsammans med den dras direkta slutsatser från korrelationer till evolutionära sekvenser. Galtons kritik visade sig dock vara lika giltig för att sluta sig till funktionella relationer från korrelationer. Problemet med autokorrelation kvarstod.

Lösningar

Statistikern William S. Gosset utvecklade 1914 metoder för att eliminera falsk korrelation på grund av hur position i tid eller rum påverkar likheter. Dagens valundersökningar har ett liknande problem: ju närmare undersökningen valet, desto färre individer bestämmer sig självständigt, och desto större är opålitligheten i undersökningsresultaten, särskilt felmarginalen eller konfidensgränserna . Det effektiva antalet oberoende fall från deras urval sjunker när valet närmar sig. Statistisk signifikans faller med lägre effektiv urvalsstorlek.

Problemet dyker upp i urvalsundersökningar när sociologer vill minska restiden för att göra sina intervjuer, och därför delar de in sin befolkning i lokala kluster och sticker ut klustren slumpmässigt, för att sedan ta prov igen inom klustren. Om de intervjuar n personer i kluster av storlek m skulle den effektiva urvalsstorleken (efs) ha en nedre gräns på 1 + ( n − 1) / m om alla i varje kluster var identiska. När det bara finns partiella likheter inom kluster, måste m i denna formel sänkas i enlighet med detta. En formel av detta slag är 1 + d ( n − 1) där d är intraklasskorrelationen för statistiken i fråga. I allmänhet beror uppskattningen av lämpliga efs på den statistiken , som till exempel medelvärde , chi-kvadrat , korrelation , regressionskoefficient och deras varianser .

För tvärkulturella studier uppskattade Murdock och White storleken på fläckar av likheter i deras urval av 186 samhällen . De fyra variablerna de testade – språk, ekonomi, politisk integration och härkomst – hade fläckar av likheter som varierade från storlek tre till storlek tio. En mycket grov tumregel kan vara att dela upp kvadratroten av likhetsplåstrets storlekar i n , så att de effektiva provstorlekarna är 58 respektive 107 för dessa fläckar. Återigen faller statistisk signifikans med lägre effektiv urvalsstorlek.

I modern analys har rumsliga eftersläpningar modellerats för att uppskatta graden av globalisering i moderna samhällen.

Rumsligt beroende eller autokorrelation är ett grundläggande begrepp inom geografi. Metoder utvecklade av geografer som mäter och kontrollerar för rumslig autokorrelation gör mycket mer än att minska det effektiva n för tester av signifikans av en korrelation. Ett exempel är den komplicerade hypotesen att "närvaron av hasardspel i ett samhälle är direkt proportionell mot förekomsten av kommersiella pengar och till förekomsten av betydande socioekonomiska skillnader och är omvänt relaterad till huruvida samhället är ett nomadiskt herdesamhälle eller inte." Tester av denna hypotes i ett urval av 60 samhällen misslyckades med att förkasta nollhypotesen. Autokorrelationsanalys visade dock en signifikant effekt av socioekonomiska skillnader.

Hur utbredd är autokorrelation bland de variabler som studeras i tvärkulturell forskning? Ett test av Anthon Eff på 1700 variabler i den kumulativa databasen för Standard Cross-Cultural Sample, publicerad i World Cultures , mätte Morans I för rumslig autokorrelation (avstånd), lingvistisk autokorrelation (gemensam härkomst) och autokorrelation i kulturell komplexitet (huvudlinjeevolution). ). "Resultaten tyder på att ... det skulle vara klokt att testa för rumslig och fylogenetisk autokorrelation när man utför regressionsanalyser med standard tvärkulturellt prov." Användningen av autokorrelationstester i explorativ dataanalys illustreras, och visar hur alla variabler i en given studie kan utvärderas för icke-oberoende av fall vad gäller avstånd, språk och kulturell komplexitet. Metoderna för att uppskatta dessa autokorrelationseffekter förklaras sedan och illustreras för vanlig minsta kvadratregression med användning av Moran I signifikansmåttet för autokorrelation.

När autokorrelation finns kan den ofta tas bort för att få opartiska uppskattningar av regressionskoefficienter och deras varianser genom att konstruera en specificerad beroende variabel som är "laggad" av viktningar på den beroende variabeln på andra platser, där vikterna är graden av samband. Denna fördröjda beroende variabel är endogen och uppskattning kräver antingen minsta kvadrater i två steg eller metoder med maximal sannolikhet .

Resurser

En offentlig server, om den används externt på http://SocSciCompute.ss.uci.edu Archived 2016-02-20 at the Wayback Machine , erbjuder etnografiska data, variabler och verktyg för slutledning med R-skript av Dow (2007) och Eff och Dow (2009) i en NSF-stödd Galaxy ( http://getgalaxy.org ) ramverk ( https://www.xsede.org ) för instruktörer, studenter och forskare att göra "CoSSci Galaxy" tvärkulturell forskningsmodellering Arkiverad 2016- 02-20 på Wayback Machine med kontroller för Galtons problem med standardvariabler för tvärkulturella prov på https://web.archive.org/web/20160402201432/https://dl.dropboxusercontent.com/u/9256203/SCCScodebook. txt .

Möjligheter

Inom antropologin, där Tylors problem först upptäcktes av statistikern Galton 1889, är det fortfarande inte allmänt erkänt att det finns statistiska standardjusteringar för problemet med fläckar av likhet i observerade fall och möjligheter till nya upptäckter med hjälp av autokorrelationsmetoder. Vissa tvärkulturella forskare (se t.ex. Korotayev och de Munck 2003) har börjat inse att bevis på spridning, historiskt ursprung och andra källor till likhet mellan relaterade samhällen eller individer borde döpas om till Galtons möjlighet och Galtons tillgång snarare än Galtons problem . Forskare använder nu longitudinella, tvärkulturella och regionala variationsanalyser rutinmässigt för att analysera alla konkurrerande hypoteser: funktionella relationer, diffusion , gemensamt historiskt ursprung, multilinjär evolution , samanpassning med miljön och komplex social interaktionsdynamik .

Kontroverser

Inom antropologin ges Galtons problem ofta som en anledning att helt förkasta jämförande studier. Eftersom problemet är ett allmänt problem, gemensamt för vetenskaperna och för statistiska slutsatser i allmänhet, är denna speciella kritik av tvärkulturella eller jämförande studier – och det finns många – en som, logiskt sett, innebär ett helt förkastande av vetenskap och statistik. All data som till exempel samlas in och analyseras av etnografer är lika föremål för Galtons problem, uppfattat i dess mest allmänna mening. En kritik av den antijämförande kritiken är inte begränsad till statistisk jämförelse eftersom den skulle gälla även för analys av text. Det vill säga analysen och användningen av text i argumentation är föremål för kritik när det gäller den bevisgrundande slutsatsen. Att enbart förlita sig på retorik är inget skydd mot kritik om argumentets giltighet och dess bevisgrund.

Det råder dock föga tvivel om att gemenskapen av tvärkulturella forskare har varit försumliga med att ignorera Galtons problem. Expertundersökning av denna fråga visar resultat som "starkt tyder på att den omfattande rapporteringen av naiva chi-kvadratoberoendetester med hjälp av tvärkulturella datamängder under de senaste decennierna har lett till felaktigt förkastande av nollhypoteser på nivåer som är mycket högre än de förväntade 5% Betygsätta." Utredaren drar slutsatsen att "Inkorrekta teorier som har "räddats" av naiva chi-kvadrat-tester med jämförande data kanske kan testas mer noggrant en annan dag." Återigen ges den justerade variansen för ett klusterprov som en multiplicerad med 1 + d ( k + 1) där k är medelstorleken på ett kluster, och en mer komplicerad korrigering ges för variansen av kontingenstabellkorrelationer med r rader och c- kolumner. Sedan denna kritik publicerades 1993, och andra liknande den, har fler författare börjat anta korrigeringar för Galtons problem, men majoriteten inom det tvärkulturella området har inte gjort det. Följaktligen är det troligt att en stor del av publicerade resultat som bygger på naiva signifikanstester och som använder P < 0,05 snarare än en P < 0,005-standard är felaktiga eftersom de är mer mottagliga för typ I-fel , vilket är att förkasta nollvärdet. hypotes när den är sann.

Vissa tvärkulturella forskare avvisar allvaret i Galtons problem eftersom de hävdar att uppskattningar av korrelationer och medel kan vara opartiska även om autokorrelation, svag eller stark, är närvarande. Utan att undersöka autokorrelation kan de dock fortfarande felskatta statistik som handlar om samband mellan variabler. I regressionsanalys , till exempel, kan att undersöka mönstren för autokorrelerade residualer ge viktiga ledtrådar till tredje faktorer som kan påverka relationerna mellan variabler men som inte har inkluderats i regressionsmodellen. För det andra, om det finns kluster av liknande och relaterade samhällen i urvalet, kommer variansmått att underskattas, vilket leder till falska statistiska slutsatser. till exempel att överdriva den statistiska signifikansen av korrelationer. För det tredje gör underskattningen av varians det svårt att testa för replikering av resultat från två olika prov, eftersom resultaten oftare kommer att avvisas som liknande.

Se även

Vidare läsning