Cochran–Armitage test för trend

Cochran –Armitage-testet för trend , uppkallat efter William Cochran och Peter Armitage , används i kategorisk dataanalys när syftet är att bedöma om det finns ett samband mellan en variabel med två kategorier och en ordinalvariabel med k kategorier. Den modifierar Pearsons chi-kvadrattest för att införliva en misstänkt ordning i effekterna av k -kategorierna för den andra variabeln. Till exempel kan doser av en behandling beställas som 'låg', 'medium' och 'hög' och vi kan misstänka att behandlingsnyttan inte kan bli mindre när dosen ökar. Trendtestet används ofta som ett genotypbaserat test för fallkontrollstudier av genetisk association .

Introduktion

Trendtestet tillämpas när data har formen av en 2 × k beredskapstabell . Till exempel, om k = 3 har vi

B = 1 B = 2 B = 3
A = 1 N 11 N 12 N 13
A = 2 N 21 N 22 N 23

Denna tabell kan kompletteras med marginalsummorna för de två variablerna

B = 1 B = 2 B = 3 Belopp
A = 1 N 11 N 12 N 13 R 1
A = 2 N 21 N 22 N 23 R 2
Belopp C 1 C 2 C 3 N

där R1 = N11 + N12 + N13 , och C1 = N11 + N21 , etc. _ _ _ _ _

Trendteststatistiken är _

där t i är vikter, och skillnaden N 1 i R 2 N 2 i R 1 kan ses som skillnaden mellan N 1 i och N 2 i efter omvägning av raderna för att få samma totalsumma.

Hypotesen om ingen association (nollhypotesen ) kan uttryckas som:

Om man antar att detta gäller, använder man upprepade förväntningar ,

Variansen kan beräknas genom sönderdelning , ger

och som ett stort urvalsuppskattning,

Vikterna t i kan väljas så att trendtestet blir lokalt mest kraftfullt för att upptäcka särskilda typer av associationer. Till exempel, om k = 3 och vi misstänker att B = 1 och B = 2 har liknande frekvenser (inom varje rad), men att B = 3 har en annan frekvens, bör vikterna t = (1,1,0) användas. Om vi ​​misstänker en linjär trend i frekvenserna ska vikterna t = (0,1,2) användas. Dessa vikter används också ofta när frekvenserna misstänks ändras monotont med B , även om trenden inte nödvändigtvis är linjär.

Tolkning och roll

Trendtestet kommer att ha högre effekt än chi-kvadrattestet när den misstänkta trenden är korrekt, men förmågan att upptäcka oanade trender offras. Detta är ett exempel på en allmän teknik för att styra hypotesprov mot smala alternativ . Trendtestet utnyttjar den misstänkta effektriktningen för att öka kraften, men detta påverkar inte samplingsfördelningen av teststatistiken under nollhypotesen . Den misstänkta trenden i effekter är alltså inte ett antagande som måste hållas för att testresultaten ska vara meningsfulla.

Tillämpning på genetik

Antag att det finns tre möjliga genotyper på något lokus , och vi hänvisar till dessa som aa, Aa och AA. Fördelningen av genotypantal kan sättas i en 2 × 3 beredskapstabell. Tänk till exempel på följande data, där genotypfrekvenserna varierar linjärt i fallen och är konstanta i kontrollerna:

Genotyp aa Genotyp Aa Genotyp AA Belopp
Kontroller 20 20 20 60
Fall 10 20 30 60
Belopp 30 40 50 120

I genetiska tillämpningar väljs vikterna enligt det misstänkta nedärvningssättet . Till exempel, för att testa om allel a är dominant över allel A, är valet t = (1, 1, 0) lokalt optimalt. För att testa om allel a är recessiv mot allel A är det optimala valet t = (0, 1, 1). För att testa om alleler a och A är samdominanta är valet t = (0, 1, 2) lokalt optimalt. För komplexa sjukdomar är den underliggande genetiska modellen ofta okänd. I genomomfattande associationsstudier används ofta den additiva (eller codominanta) versionen av testet.

I det numeriska exemplet är den standardiserade teststatistiken för olika viktvektorer

Vikter Standardiserad teststatistik
1,1,0 1,85
0,1,1 −2.1
0,1,2 −4,67

och Pearson chi-kvadrattest ger en standardiserad teststatistik på 2. Således får vi en starkare signifikansnivå om vikterna som motsvarar additiv (samdominant) arv används. Observera att för att signifikansnivån ska ge ett p-värde med den vanliga probabilistiska tolkningen måste vikterna specificeras innan data granskas och endast en uppsättning vikter får användas.

Se även

  •   Agresti, Alan (2002). Kategorisk dataanalys (andra upplagan). Wiley. ISBN 0-471-36093-7 .
  •    Sasieni, P (1997). "Från genotyper till gener: fördubbling av provstorleken". Biometri . International Biometric Society. 53 (4): 1253–61. doi : 10.2307/2533494 . JSTOR 2533494 . PMID 9423247 .
  • statgen.org (2007). "En härledning för Armitages trendtest för genotyptabellen 2 × 3" ( PDF) . Hämtad 6 februari 2009 .
  1. ^   Cochran, WG (1954). "Några metoder för att stärka de vanliga chi-kvadrattesterna". Biometri . International Biometric Society. 10 (4): 417–451. doi : 10.2307/3001616 . JSTOR 3001616 .
  2. ^   Armitage, P (1955). "Tester för linjära trender i proportioner och frekvenser". Biometri . International Biometric Society. 11 (3): 375–386. doi : 10.2307/3001775 . JSTOR 3001775 .
  3. ^    Purcell S, Neale B, Todd-Brown K, et al. (september 2007). "PLINK: ett verktygsuppsättning för hel-genomassociation och populationsbaserade länkanalyser" . Am. J. Hum. Genet . 81 (3): 559–75. doi : 10.1086/519795 . PMC 1950838 . PMID 17701901 .