Boschloos test

Boschloos test är ett statistiskt hypotestest för att analysera 2x2 beredskapstabeller . Den undersöker sambandet mellan två Bernoulli-distribuerade slumpvariabler och är ett enhetligt mer kraftfullt alternativ till Fishers exakta test . Det föreslogs 1970 av RD Boschloo.

Miljö

En 2x2 beredskapstabell visualiserar oberoende observationer av två binära variabler och :

Sannolikhetsfördelningen för sådana tabeller kan klassificeras i tre olika fall.



  1. Radsummorna och kolumnsummorna är fixerade i förväg och inte slumpmässiga. Då bestäms alla . Om och är oberoende, följer hypergeometrisk fördelning med parametrarna : .



  2. Radsummorna är fixerade i förväg men kolumnsummorna är det inte. Sedan bestäms alla slumpmässiga parametrar av och och följer en binomial fördelning med sannolikheter :

  3. Endast det totala antalet är fast men raden summerar och kolumnen summerar är det inte. Sedan följer den slumpmässiga vektorn en multinomialfördelning med sannolikhetsvektor .

Fishers exakta test är utformat för det första fallet och därför ett exakt villkorligt test (eftersom det villkorar på kolumnsummorna). Det typiska exemplet på ett sådant fall är Lady som provar te : En dam smakar 8 koppar te med mjölk. I 4 av dessa koppar hälls mjölken i före teet. I de övriga 4 kopparna hälls teet i först. Damen försöker tilldela kopparna till de två kategorierna. representerar slumpvariabeln representerar damens gissningar (1 = mjölk först gissade, 0 = mjölk sist) gissade). Då är radsummorna det fasta antalet koppar som tillagas med varje metod: . Damen vet att det finns 4 koppar i varje kategori, så kommer att tilldela 4 koppar till varje metod. Således är kolumnsummorna också fixerade i förväg: . Om hon inte kan se skillnaden och oberoende och antalet av korrekt klassificerade koppar med mjölk följer först den hypergeometriska fördelningen .

Boschloos test är designat för det andra fallet och därför ett exakt ovillkorligt test. Exempel på ett sådant fall finns ofta inom medicinsk forskning, där en binär endpoint jämförs mellan två patientgrupper. Efter vår notation representerar representerar den andra gruppen som får placebo . indikerar att en patient botar (1 = botemedel, 0 = inget botemedel). Då är radsummorna lika med gruppstorlekarna och är vanligtvis fasta i förväg. Kolumnsummorna är det totala antalet botar respektive sjukdomsfortsättningar och inte fastställda i förväg.

Ett exempel för det tredje fallet kan konstrueras enligt följande: Vänd samtidigt två urskiljbara mynt och och gör detta gånger. Om vi ​​räknar antalet resultat i vår 2x2-tabell (1 = huvud, 0 = svans), vet vi varken i förväg hur ofta mynt visar huvud eller svans (rad summerar slumpmässigt), och vi vet inte heller hur ofta visar mynt huvud eller svans (kolumnsummor slumpmässigt).

Testa hypotesen

Nollhypotesen för Boschloos ensidiga test (höga värden på gynnar den alternativa hypotesen) är :

Nollhypotesen för det ensidiga testet kan också formuleras i den andra riktningen (små värden på gynnar den alternativa hypotesen):

Nollhypotesen för det tvåsidiga testet är:

Det finns ingen universell definition av den tvåsidiga versionen av Fishers exakta test. Eftersom Boschloos test är baserat på Fishers exakta test, existerar inte heller en universell tvåsidig version av Boschloos test. I det följande behandlar vi det ensidiga testet och .

Boschloos idé

Vi betecknar den önskade signifikansnivån med . Fishers exakta test är ett villkorligt test och lämpligt för det första av de ovan nämnda fallen. Men om vi behandlar den observerade kolumnsumman som fastställd i förväg, kan Fishers exakta test också tillämpas på det andra fallet. Testets verkliga storlek beror sedan på störningsparametrarna och . Det kan visas att storleken max max tas för lika proportioner och är fortfarande styrs av . Boschloo uppgav dock att för små provstorlekar är den maximala storleken ofta betydligt mindre än . Detta leder till en oönskad effektförlust .

Boschloo föreslog att Fishers exakta test skulle användas med en högre nominell nivå . Här väljas så stor som möjligt så att den maximala storleken fortfarande styrs av : . Denna metod var särskilt fördelaktig vid tidpunkten för Boschloos publicering eftersom kunde slås upp för vanliga värden för och . Detta gjorde det beräkningsmässigt enkelt att utföra Boschloos test.

Teststatistik

Beslutsregeln för Boschloos tillvägagångssätt är baserad på Fishers exakta test . Ett likvärdigt sätt att formulera testet är att använda p-värdet för Fishers exakta test som teststatistik . Fishers p-värde beräknas från den hypergeometriska fördelningen (för att underlätta notationen skriver vi istället för ):

Fördelningen av bestäms av binomialfördelningarna av och och beror på den okända störningsparametern . För en specificerad signifikansnivå det kritiska värdet för det maximala värdet som uppfyller . Det kritiska värdet är lika med den nominella nivån för Boschloos ursprungliga tillvägagångssätt.

Modifiering

Boschloos test behandlar den okända störningsparametern genom att ta maximalt över hela parameterutrymmet [ , . Berger & Boos-proceduren tar ett annat tillvägagångssätt genom att maximera a konfidensintervall för och lägg till . är vanligtvis ett litet värde som 0,001 eller 0,0001. Detta resulterar i ett modifierat Boschloos test som också är exakt.

Jämförelse med andra exakta tester

Alla exakta test håller den angivna signifikansnivån men kan ha varierande kraft i olika situationer. Mehrotra et al. jämförde kraften hos några exakta tester i olika situationer. Resultaten avseende Boschloos test sammanfattas i det följande.

Modifierat Boschloos test

Boschloos test och det modifierade Boschloos test har liknande kraft i alla övervägda scenarier. Boschloos test har något mer kraft i vissa fall, och vice versa i vissa andra fall.

Fishers exakta test

Boschloos test är till sin konstruktion likformigt kraftfullare än Fishers exakta test. För små urvalsstorlekar (t.ex. 10 per grupp) är effektskillnaden stor, från 16 till 20 procentenheter i de aktuella fallen. Effektskillnaden är mindre för större provstorlekar.

Exakt -Pooled test

Detta test är baserat på teststatistiken

där och är den sammanslagna händelsen Betygsätta.

Kraften i detta test liknar den i Boschloos test i de flesta scenarier. I vissa fall -Pooled-testet större kraft, med skillnader som oftast sträcker sig från 1 till 5 procentenheter. I mycket få fall går skillnaden upp till 9 procentenheter.

Detta test kan också modifieras med Berger & Boos-proceduren. Det resulterande testet har dock mycket liknande kraft som det omodifierade testet i alla scenarier.

Exakt -Unpooled test

Detta test är baserat på teststatistiken

där .

Kraften i detta test liknar Boschloos test i många scenarier. I vissa fall -Unpooled-testet större kraft, med skillnader som sträcker sig från 1 till 5 procentenheter. Men i vissa andra fall har Boschloos test märkbart större kraft, med skillnader upp till 68 procentenheter.

Detta test kan också modifieras med Berger & Boos-proceduren. Det resulterande testet har liknande kraft som det omodifierade testet i de flesta scenarier. I vissa fall förbättras effekten avsevärt av modifieringen, men den totala effektjämförelsen med Boschloos test förblir oförändrad.

programvara

Beräkningen av Boschloos test kan utföras i följande programvara:

  • Funktionen scipy.stats.boschloo_exact från SciPy
  • Paket Exakt och exakt 2x2 av programmeringsspråket R
  • StatXact

Se även