Bonferroni-korrigering

I statistiken är Bonferroni -korrigeringen en metod för att motverka problemet med flera jämförelser .

Bakgrund

Metoden är uppkallad efter dess användning av Bonferroni-ojämlikheterna . En utvidgning av metoden till konfidensintervall föreslogs av Olive Jean Dunn .

Statistisk hypotestestning bygger på att förkasta nollhypotesen om sannolikheten för de observerade data under nollhypotesen är låg. Om flera hypoteser testas ökar sannolikheten för att observera en sällsynt händelse, och därför ökar sannolikheten för att felaktigt förkasta en nollhypotes (dvs. göra ett typ I-fel) .

Bonferroni-korrigeringen kompenserar för denna ökning genom att testa varje enskild hypotes vid en signifikansnivå av där är den önskade totala alfanivån och är antalet hypoteser. Till exempel, om ett försök testar -hypoteser med ett önskat , så skulle Bonferroni-korrigeringen testa varje individuell hypotes vid . På samma sätt, när man konstruerar flera konfidensintervall, uppstår samma fenomen.

Definition

Låt vara en familj av hypoteser och deras motsvarande p-värden . Låt vara det totala antalet nollhypoteser, och låt vara antalet sanna nollhypoteser (vilket förmodligen är okänt för forskaren). Den familjemässiga felfrekvensen (FWER) är sannolikheten för att avvisa minst ett sant det vill säga att göra minst ett typ I-fel . Bonferroni-korrigeringen förkastar nollhypotesen för varje styr därigenom FWER vid . Bevis på denna kontroll följer av Booles ojämlikhet , enligt följande:

Denna kontroll kräver inga antaganden om beroende mellan p-värdena eller om hur många av nollhypoteserna som är sanna.

Tillägg

Generalisering

Istället för att testa varje hypotes på -nivån, kan hypoteserna testas på vilken annan kombination av nivåer som helst som summerar till , förutsatt att nivån för varje test bestäms innan man tittar på uppgifterna. Till exempel, för två hypoteser, skulle en total på 0,05 kunna upprätthållas genom att utföra ett test vid 0,04 och det andra vid 0,01.

Konfidensintervall

Proceduren som Dunn föreslagit kan användas för att justera konfidensintervall . Om man upprättar konfidensintervall och vill ha en total konfidensnivå på , kan varje enskilt konfidensintervall justeras till nivån .

Kontinuerliga problem

När man söker efter en signal i ett kontinuerligt parameterutrymme kan det också vara problem med flera jämförelser, eller se någon annanstans effekt. Till exempel kan en fysiker leta efter att upptäcka en partikel med okänd massa genom att överväga ett stort antal massor; detta var fallet under den nobelprisvinnande upptäckten av Higgs-bosonen . I sådana fall kan man tillämpa en kontinuerlig generalisering av Bonferroni-korrigeringen genom att använda Bayesiansk logik för att relatera det effektiva antalet försök, till före-till-posterior volymförhållandet.

Alternativ

Det finns alternativa sätt att kontrollera den familjemässiga felfrekvensen . Till exempel Holm–Bonferroni-metoden och Šidák-korrigeringen universellt mer kraftfulla procedurer än Bonferroni-korrigeringen, vilket betyder att de alltid är minst lika kraftfulla. Till skillnad från Bonferroni-proceduren kontrollerar dessa metoder inte det förväntade antalet typ I-fel per familj (typ I-felfrekvensen per familj).

Kritik

Med avseende på FWER- kontroll kan Bonferroni-korrigeringen vara konservativ om det finns ett stort antal tester och/eller teststatistiken är positivt korrelerad.

Korrigeringen kommer till priset av att öka sannolikheten för att producera falska negativ , dvs. minska statistisk styrka . Det finns ingen definitiv konsensus om hur man definierar en familj i alla fall, och justerade testresultat kan variera beroende på antalet tester som ingår i hypotesfamiljen . [ citat behövs ] Sådan kritik gäller FWER- kontroll i allmänhet och är inte specifik för Bonferroni-korrigeringen.

externa länkar