Negativ hypergeometrisk fördelning

Negativ hypergeometrisk
Sannolikhetsmassfunktion
Several examples of the PMF of the negative hypergeometric probability distribution.
Kumulativ fördelningsfunktion
Several examples of the CDF of the negative hypergeometric probability distribution.
Parametrar


- totalt antal element - totalt antal "framgångselement"

- antal misslyckanden när experimentet stoppas
Stöd - antal framgångar när experimentet stoppas.
PMF
Betyda
Variation

Inom sannolikhetsteori och statistik beskriver den negativa hypergeometriska fördelningen sannolikheter för när urval från en ändlig population utan ersättning där varje urval kan klassificeras i två ömsesidigt uteslutande kategorier som Godkänd/Underkänd eller Anställd/Arbetslös. När slumpmässiga urval görs från populationen, minskar varje efterföljande dragning populationen vilket gör att sannolikheten för framgång ändras med varje dragning. Till skillnad från den vanliga hypergeometriska fördelningen , som beskriver antalet framgångar i en fast urvalsstorlek, i den negativa hypergeometriska fördelningen, dras sampel tills misslyckanden har hittats, och fördelningen beskriver sannolikheten att hitta framgångar i ett sådant exempel. Med andra ord beskriver den negativa hypergeometriska fördelningen sannolikheten för framgångar i ett urval med exakt misslyckanden.

Definition

Det finns element, av vilka definieras som "framgångar" och resten är "misslyckanden".

Element ritas efter varandra, utan ersättning, tills -fel uppstår. Därefter stannar ritningen och antalet framgångar räknas. Den negativa hypergeometriska fördelningen, är den diskreta fördelningen av denna .

Den negativa hypergeometriska fördelningen är ett specialfall av beta-binomialfördelningen med parametrarna och båda är heltal (och ).

Resultatet kräver att vi observerar framgångar i dragningar och bit måste vara ett misslyckande. Sannolikheten för den förra kan hittas genom direkt tillämpning av den hypergeometriska fördelningen och sannolikheten för det senare är helt enkelt antalet återstående misslyckanden dividerat med storleken på den återstående populationen . Sannolikheten att ha exakt framgångar upp till den fel (dvs ritningen stannar så snart provet inkluderar det fördefinierade antalet -fel) är då produkten av dessa två sannolikheter:

Därför följer en slumpvariabel den negativa hypergeometriska fördelningen om dess sannolikhetsmassfunktion (pmf) ges av

var

  • är populationsstorleken,
  • är antalet framgångstillstånd i befolkningen,
  • är antalet misslyckanden,
  • är antalet observerade framgångar,
  • är en binomial koefficient

Genom design summerar sannolikheterna till 1. Men om vi vill visa det explicit har vi:

där vi har använt det,

som kan härledas med hjälp av binomialidentiteten , , och Chu–Vandermonde-identiteten , m n och alla icke-negativa heltal .

Relationen ^ i expansionen av , med hjälp av Newtons binomialserie .

Förväntan

När man räknar antalet framgångar före misslyckanden, är det förväntade antalet framgångar och kan härledas enligt följande.

där vi har använt sambandet .

Variation

Variansen kan härledas genom följande beräkning.

Då är variansen

Relaterade distributioner

Om ritningen stannar efter ett konstant antal dragningar (oavsett antalet misslyckanden), så har antalet framgångar den hypergeometriska fördelningen , . De två funktionerna är relaterade på följande sätt:

Negativ-hypergeometrisk fördelning (som den hypergeometriska fördelningen) handlar om dragningar utan ersättning , så att sannolikheten för framgång är olika i varje dragning. Däremot handlar negativ-binomialfördelning (som binomialfördelningen) med drag med utbyte , så att sannolikheten för framgång är densamma och försöken är oberoende. Följande tabell sammanfattar de fyra fördelningarna relaterade till ritobjekt:

Med ersättare Inga ersättare
Antal framgångar i konstant antal dragningar binomial fördelning hypergeometrisk fördelning
Antal framgångar i konstant antal misslyckanden negativ binomialfördelning negativ hypergeometrisk fördelning

Vissa författare definierar den negativa hypergeometriska fördelningen som antalet dragningar som krävs för att få det te felet. Om vi ​​låter beteckna detta tal så är det tydligt att där är enligt definitionen ovan. Därav PMF . Om vi ​​låter antalet misslyckanden betecknas med betyder . Stödet för är mängden . Det är tydligt att och att .