Harmoniskt medelvärde p -värde

Det harmoniska medelvärdet p -värde (HMP) är en statistisk teknik för att lösa problemet med flera jämförelser som styr den starka familjemässiga felfrekvensen (detta påstående har ifrågasatts). Den förbättrar kraften hos Bonferroni -korrigering genom att utföra kombinerade tester, dvs genom att testa om grupper av p -värden är statistiskt signifikanta, som Fishers metod . Det undviker dock det restriktiva antagandet att p -värdena är oberoende , till skillnad från Fishers metod. Följaktligen kontrollerar den den falska positiva frekvensen när tester är beroende, på bekostnad av mindre effekt (dvs. en högre falsk negativ frekvens ) när tester är oberoende. Förutom att tillhandahålla ett alternativ till metoder som Bonferroni-korrigering som kontrollerar den stringenta familjemässiga felfrekvensen, tillhandahåller den också ett alternativ till den allmänt använda Benjamini-Hochberg-proceduren (BH) för att kontrollera den mindre stringenta falska upptäcktsfrekvensen . Detta beror på att HMP:s förmåga att upptäcka signifikanta grupper av hypoteser är större än förmågan hos BH att upptäcka signifikanta individuella hypoteser.

Det finns två versioner av tekniken: (i) direkt tolkning av HMP som ett ungefärligt p -värde och (ii) en procedur för att transformera HMP till ett asymptotiskt exakt p -värde . Tillvägagångssättet tillhandahåller en testprocedur på flera nivåer där de minsta grupperna av p -värden som är statistiskt signifikanta kan sökas.

Direkt tolkning av det harmoniska medelvärdet p -värde

Det viktade harmoniska medelvärdet av p -värdena definieras som

där är vikter som måste summera till ett, dvs . Lika vikter kan väljas, i vilket fall .

är det antikonservativt att tolka HMP direkt som ett p -värde, vilket betyder att frekvensen av falskt positiva är högre än förväntat. Men när HMP blir mindre, under vissa antaganden, minskar diskrepansen, så att direkt tolkning av signifikans uppnår en falsk positiv frekvens nära den som antyds för tillräckligt små värden (t.ex. p ∘ < 0,05 {\displaystyle {\ ).

HMP är aldrig antikonservativ med mer än en faktor för liten eller för stor . Dessa gränser representerar dock värsta scenarier under godtyckligt beroende som sannolikt kommer att vara konservativa i praktiken. I stället för att tillämpa dessa gränser kan asymptotiskt exakta p -värden framställas genom att transformera HMP.

Asymptotiskt exakt harmoniskt medelvärde för p -värde

Generaliserad central gränssats visar att ett asymptotiskt exakt p -värde, kan beräknas från HMP, med formeln

Med förbehåll för antagandena om generaliserad central gränssats , blir detta transformerade p -värde exakt när antalet tester, , blir stort. Beräkningen använder Landau-fördelningen , vars densitetsfunktion kan skrivas
Testet implementeras av kommandot p.hmp i paketet harmonicmeanp R ; en handledning finns tillgänglig online.

På motsvarande sätt kan man jämföra HMP med en tabell med kritiska värden (tabell 1). Tabellen illustrerar att ju mindre frekvensen av falskt positiva är, och ju mindre antalet tester, desto närmare är det kritiska värdet frekvensen för falskt positiva.

Tabell 1. Kritiska värden för HMP för varierande antal tester och falska positiva frekvenser .
10 0,040 0,0094 0,00099
100 0,036 0,0092 0,00099
1 000 0,034 0,0090 0,00099
10 000 0,031 0,0088 0,00098
100 000 0,029 0,0086 0,00098
1 000 000 0,027 0,0084 0,00098
10 000 000 0,026 0,0083 0,00098
100 000 000 0,024 0,0081 0,00098
1 000 000 000 0,023 0,0080 0,00097

Flera tester via flernivåtestproceduren

Om HMP är signifikant på någon nivå för en grupp av p -värden, kan man söka i alla delmängder av p -värdena för den minsta signifikanta gruppen , samtidigt som den starka familjemässiga felfrekvensen bibehålls. Formellt utgör detta ett slutet testförfarande .

När är liten (t.ex. ), kontrollerar följande flernivåtest baserat på direkt tolkning av HMP den starka familjemässiga felfrekvensen på nivån ungefär

  1. Definiera HMP för varje delmängd av p -värdena som ska vara
  2. Förkasta nollhypotesen att inget av p -värdena i delmängd är signifikant om R . (Kom ihåg att per definition )


En asymptotiskt exakt version av ovanstående ersätter i steg 2 med

där anger antalet p -värden, inte bara de i delmängden .

Eftersom direkt tolkning av HMP är snabbare kan en tvåstegsprocedur användas för att identifiera delmängder av p -värden som sannolikt är signifikanta med hjälp av direkt tolkning, med förbehåll för bekräftelse med den asymptotiskt exakta formeln.

HMP:s egenskaper

HMP har en rad egenskaper som härrör från generaliserad central gränssats. Det är:

  • Robust till positivt beroende mellan p -värdena.
  • Okänslig för det exakta antalet tester, L .
  • Robust för viktfördelning, w .
  • Mest påverkad av de minsta p -värdena.

När HMP inte är signifikant, är det inte heller någon delmängd av ingående tester. Omvänt, när flernivåtestet bedömer att en delmängd av p -värden är signifikant, är HMP för alla p -värden kombinerade sannolikt signifikant; detta är säkert när HMP tolkas direkt. När målet är att bedöma signifikansen av individuella p -värden, så att kombinerade tester avseende grupper av p -värden inte är av intresse, är HMP likvärdig med Bonferroni -proceduren men föremål för den strängare signifikanströskeln (Tabell 1).

HMP antar att de individuella p -värdena har (inte nödvändigtvis oberoende) enhetliga standardfördelningar när deras nollhypoteser är sanna. Ett stort antal underpowered tester kan därför skada kraften hos HMP.

Även om valet av vikter är oviktigt för giltigheten av HMP under nollhypotesen, påverkar vikterna kraften i proceduren. Kompletterande metoder §5C av och en online handledning överväga frågan mer i detalj.

Bayesianska tolkningar av HMP

HMP skapades i analogi med Bayesiansk modellmedelvärde och kan tolkas som omvänt proportionell mot en modellberoende Bayes-faktor när man kombinerar p -värden från sannolikhetsförhållandetester .

Den harmoniska genomsnittliga tumregeln

IJ Good rapporterade ett empiriskt samband mellan Bayes-faktorn och p -värdet från ett sannolikhetsförhållandetest. För en nollhypotes kapslad i en mer allmän alternativ hypotes observerade han att ofta,

där anger Bayes-faktorn till förmån för kontra Extrapolerande föreslog han en tumregel där HMP antas vara omvänt proportionell mot den modellberoende Bayes-faktorn för en samling -test med vanlig nollhypotes:
For Good, hans tumregel stödde en utbytbarhet mellan Bayesianska och klassiska metoder för hypotestestning.

Bayesisk kalibrering av p -värden

Om fördelningarna av p -värdena under de alternativa hypoteserna följer Beta-fördelningar med parametrar en form som anses av Sellke, Bayarri och Berger, så kan den omvända proportionaliteten mellan den modellberoende Bayes-faktorn och HMP formaliseras som

var
  • är den tidigare sannolikheten för alternativ hypotes så att
  • är det förväntade värdet av under alternativ hypotes
  • är vikten som tillskrivs p -värde
  • införlivar den tidigare modellens sannolikheter och potenser i vikterna, och
  • vikterna.

Approximationen fungerar bäst för väldrivna tester ( .

Det harmoniska medelvärdet av p -värdet som en gräns för Bayes-faktorn

För sannolikhetsförhållandetester med exakt två frihetsgrader, innebär Wilks sats att där är det maximerade sannolikhetsförhållandet till förmån för alternativ hypotes och därför , där är det viktade genomsnittliga maximerade sannolikhetsförhållandet, med hjälp av vikter Eftersom är en övre gräns för Bayes-faktorn, , sedan är en övre gräns för den modellberoende Bayes-faktorn:

Medan ekvivalensen endast gäller för två frihetsgrader, är förhållandet mellan och och därför beter sig på liknande sätt för andra frihetsgrader.

Under antagandet att fördelningarna av p -värdena under de alternativa hypoteserna följer Beta-fördelningar med parametrar och att vikterna ger HMP en snävare övre gräns för den modellgenomsnittliga Bayes-faktorn:

ett resultat som återigen reproducerar den omvända proportionaliteten av Goods empiriska förhållande.
  1. ^ a b c   Good, IJ (1958). "Betydlighetstester parallellt och i serie". Journal of the American Statistical Association . 53 (284): 799–813. doi : 10.1080/01621459.1958.10501480 . JSTOR 2281953 .
  2. ^ a b c d e f g h i j k l m n    Wilson, DJ (2019). "Det harmoniska medelvärdet p -värde för att kombinera beroende tester" . Proceedings of the National Academy of Sciences USA . 116 (4): 1195–1200. doi : 10.1073/pnas.1814092116 . PMC 6347718 . PMID 30610179 .
  3. ^ a b c Vovk, Vladimir ; Wang, Ruodu (25 april 2019). "Kombinera p-värden via medelvärdesberäkning" (PDF) . Algoritmiskt lärande i en slumpmässig värld .
  4. ^     Goeman, Jelle J.; Rosenblatt, Jonathan D.; Nichols, Thomas E. (2019-11-19). "Det harmoniska medelvärdet av p-värdet: Stark kontra svag kontroll och antagandet om oberoende" . Proceedings of the National Academy of Sciences . 116 (47): 23382–23383. doi : 10.1073/pnas.1909339116 . ISSN 0027-8424 . PMC 6876242 . PMID 31662466 .
  5. ^ Fisher, RA (1934). Statistiska metoder för forskare (5:e upplagan). Edinburgh, Storbritannien: Oliver och Boyd.
  6. ^   Benjamini Y, Hochberg Y (1995). "Kontrollera den falska upptäcktsfrekvensen: En praktisk och kraftfull metod för flera tester". Journal of the Royal Statistical Society. Serie B (metodologisk) . 57 (1): 289–300. doi : 10.1111/j.2517-6161.1995.tb02031.x . JSTOR 2346101 .
  7. ^   Marcus R, Eric P, Gabriel KR (1976). "Om slutna testprocedurer med särskild hänvisning till beställd variansanalys". Biometrika . 63 (3): 655–660. doi : 10.1093/biomet/63.3.655 . JSTOR 2335748 .
  8. ^ Wilson, Daniel J (17 augusti 2019). "Uppdaterad korrigering till "Det harmoniska medelvärdet för p-värde för att kombinera oberoende tester" " ( PDF ) .
  9. ^ Bra, IJ (1984). "C192. En svans mot två svansar, och den harmoniska tumregeln". Journal of Statistical Computation and Simulation . 19 (2): 174–176. doi : 10.1080/00949658408810727 .
  10. ^ Bra, IJ (1984). "C193. Parade kontra oparade jämförelser och tumregeln för harmoniskt medelvärde". Journal of Statistical Computation and Simulation . 19 (2): 176–177. doi : 10.1080/00949658408810728 .
  11. ^ Bra, IJ (1984). "C213. En skärpning av tumregeln för harmonisk medelvärde för att kombinera tester "parallellt" " . Journal of Statistical Computation and Simulation . 20 (2): 173–176. doi : 10.1080/00949658408810770 .
  12. ^ Bra, IJ (1984). "C214. Tumregeln för harmoniskt medelvärde: Vissa applikationsklasser". Journal of Statistical Computation and Simulation . 20 (2): 176–179. doi : 10.1080/00949658408810771 .
  13. ^    Bra, Irving John. (2009). Bra tänkande: grunderna för sannolikhet och dess tillämpningar . Dover Publikationer. ISBN 9780486474380 . OCLC 319491702 .
  14. ^    Sellke, Thomas; Bayarri, M.J; Berger, James O (2001). "Kalibrering av p-värden för att testa exakta nollhypoteser". Den amerikanska statistikern . 55 (1): 62–71. doi : 10.1198/000313001300339950 . ISSN 0003-1305 . S2CID 396772 .
  15. ^    Wilson, DJ (2019). "Svar till Held: När är ett harmoniskt medelvärde p -värde en Bayes-faktor?" (PDF) . Proceedings of the National Academy of Sciences USA . 116 (13): 5857–5858. doi : 10.1073/pnas.1902157116 . PMC 6442550 . PMID 30890643 .
  16. ^    Held, L (2019). "Om den Bayesianska tolkningen av det harmoniska medelvärdet p -värde" . Proceedings of the National Academy of Sciences USA . 116 (13): 5855–5856. doi : 10.1073/pnas.1900671116 . PMC 6442579 . PMID 30890644 .