Additiv ojämvikt och z-statistik

Additiv ojämvikt ( D ) är en statistik som uppskattar skillnaden mellan observerade genotypiska frekvenser och de genotypiska frekvenser som kan förväntas under Hardy–Weinberg-jämvikt . På ett bialleliskt lokus med allel 1 och 2 existerar den additiva ojämvikten enligt ekvationerna

där f ij är frekvensen av genotyp ij i populationen, p är allelfrekvensen i populationen och D är den additiva ojämviktskoefficienten.

Att ha ett värde på D > 0 indikerar ett överskott av homozygoter /brist på heterozygoter i befolkningen, medan D < 0 indikerar ett överskott av heterozygoter/brist på homozygoter. När D = 0 anses genotyperna vara i Hardy Weinberg-jämvikt. I praktiken kommer den uppskattade additiva ojämvikten från ett prov, sällan att vara exakt 0, men den kan vara tillräckligt liten för att dra slutsatsen att den inte skiljer sig signifikant från 0. Hitta värdet av den additiva ojämviktskoefficienten ger en alternativ bedömning för att acceptera eller förkasta Hardy Weinberg Jämvikt i en uppsättning genotypiska frekvenser.

Eftersom genotypen och allelfrekvenserna måste vara positiva tal i intervallet (0,1), finns det en begränsning för intervallet av möjliga värden för D , som är följande:

För att uppskatta D från ett urval, använd formeln:

där n 11 ( n 12 ) är antalet individer i provet med den speciella genotypen och n är det totala antalet individer i provet. Observera att och är provuppskattningar av populationens genotyp och allelfrekvenser.

Den ungefärliga samplingsvariansen för D (given av är:

   

Från detta kan ett uppskattat 95% konfidensintervall beräknas, vilket är

Obs: är också lika med den uppskattade standardavvikelsen .

Om konfidensintervallet för inte inkluderar noll, kan vi förkasta nollhypotesen för Hardy Weinbergs jämvikt.

  • På liknande sätt kan vi också testa för Hardy Weinberg Equilibrium med hjälp av z - statistiken, som använder information från skattningen av additiv ojämvikt för att bestämma signifikans. När du använder z- statistiken är målet att transformera statistiken på ett sätt så att den asymptotiskt har en standardnormalfördelning . För att göra detta, dividera med dess standardavvikelse, vilket ger den förenklade ekvationen:

När z är stor är och därmed avvikelsen från Hardy Weinberg Equilibrium också stor. Om värdet på z är tillräckligt stort är det osannolikt att avvikelserna skulle inträffa av en slump och därmed kan hypotesen om Hardy Weinberg Equilibrium förkastas.

För att avgöra om z är betydligt större eller mindre än förväntat under Hardy Weinberg Equilibrium, hitta "sannolikheten att observera" ett värde lika eller mer extremt som det observerade z "under nollhypotesen". Svanssannolikheten används normalt, ( y > z ), där y är standard normal slumpvariabel. När z är positiv är svanssannolikheten 1 − ( y z ). Eftersom normalfördelningar är symmetriska kommer de övre och nedre svanssannolikheterna att vara lika, och därmed kan du hitta den övre sannolikheten och multiplicera med 2 för att hitta de kombinerade svanssannolikheterna.

Om z är negativ, hitta den negativa svanssannolikheten, ( y z ), och multiplicera med 2 för att hitta den kombinerade sannolikheten i både övre och nedre svansar.

Sannolikhetsvärdena som beräknats från dessa ekvationer kan analyseras genom jämförelse med ett förbestämt värde på α . När den observerade sannolikheten p α , kan vi "förkasta nollhypotesen för Hardy Weinberg Equilibrium". Om p > α misslyckas vi med att förkasta nollhypotesen. Vanligt använda värden för α är 0,05, 0,01 och 0,001.

Vid en signifikans av α = 0,05 kan vi förkasta hypotesen om Hardy Weinberg Equilibrium om absolutvärdet av z är "större än eller lika med det kritiska värdet 1,96" för det tvåsidiga testet.