Beta negativ binomial
Parametrar
α >
0
{\displaystyle \alpha >0}
form ( verklig )
β >
0
{\displaystyle \beta >0}
form ( verklig )
r >
0
{\displaystyle r>0}
— antal framgångar tills experimentet stoppas ( heltal men kan utökas till verklig )
Stöd
0
k ∈ { , 1 , 2 , … }
{\displaystyle k\in \{0,1,2,\ldots \}}
PMF
B
( r + k , α + β )
B
( r , α )
Γ ( k + β )
k ! Γ ( β )
{\displaystyle {\frac {\mathrm {B} (r+k,\alpha +\beta )}{\mathrm {B} (r,\alpha )}}{\frac {\Gamma (k+ \beta )}{k!\;\Gamma (\beta )}}}
Betyda
{
r β
α − 1
om
α > 1
∞
annars
{\displaystyle {\begin{cases}{\frac {r\beta }{\alpha -1}}&{\text{if}}\ \alpha >1\ \\infty &{\text{annars}}\ \end{cases}}}
Variation
{
r ( α + r − 1 ) β ( α + β − 1 )
( α − 2 )
( α − 1 )
2
om
α > 2
∞
annars
{\displaystyle {\begin{cases}{\frac {r(\ alpha +r-1)\beta (\alpha +\beta -1)}{(\alpha -2){(\alpha -1)}^{2}}}&{\text{if}}\ \alpha >2\\\infty &{\text{annars}}\ \end{cases}}}
Skevhet
{
( α + 2 r − 1 ) ( α + 2 β − 1 )
( α − 3 )
r ( α + r − 1 ) β ( α + β − 1 )
α − 2
om
α > 3
∞
annars
{\displaystyle {\begin{cases}{\frac {(\alpha +2r-1)(\alpha +2\beta -1)}{(\alpha -3){\sqrt {\frac {r(\alpha +r- 1)\beta (\alpha +\beta -1)}{\alpha -2}}}}}&{\text{if}}\ \alpha >3\\\infty &{\text{annars}}\ \end{cases}}}
MGF
existerar inte
CF
Γ ( α + r ) Γ ( α + β )
Γ ( α + β + r ) Γ ( α )
2
F
1
( r , β ; α + β + r ;
e
i t
)
{\displaystyle {\frac {\ Gamma (\alpha +r)\Gamma (\alpha +\beta )}{\Gamma (\alpha +\beta +r)\Gamma (\alpha )}}{}_{2}F_{1}(r, \beta ;\alpha +\beta +r;e^{it})\!}
där
Γ
{\displaystyle \Gamma }
är gammafunktionen och 2
F
1
{
\displaystyle {}_{2}F_{1}}
är den hypergeometriska funktionen .
I sannolikhetsteorin är en beta-negativ binomialfördelning sannolikhetsfördelningen för en diskret slumpvariabel
X
{\displaystyle X}
lika med antalet misslyckanden som krävs för att få
r
{\displaystyle r}
framgångar i en sekvens av oberoende Bernoulli-försök . Sannolikheten
p
{\displaystyle p}
för framgång för varje försök förblir konstant inom ett givet experiment men varierar mellan olika experiment efter en betafördelning . Fördelningen är alltså en sammansatt sannolikhetsfördelning .
Denna fördelning har också kallats både den omvända Markov-Pólya-fördelningen och den generaliserade Waring-fördelningen eller helt enkelt förkortat som BNB -fördelningen. En förskjuten form av distributionen har kallats beta-Pascal-fördelningen .
Om parametrarna för betafördelningen är
α
{\displaystyle \alpha }
och
β
{\displaystyle \beta }
, och om
X ∣ p ∼
N B
( r , p ) ,
{\displaystyle X\mid p\sim \mathrm {NB} (r,p),}
var
p ∼
B
( α , β ) ,
{\displaystyle p\sim {\textrm {B}}(\alpha ,\beta ),}
då är marginalfördelningen av
X
{\displaystyle X}
en beta-negativ binomialfördelning:
X ~
B N B
( r , α , β ) .
{\displaystyle X\sim \mathrm {BNB} (r,\alpha ,\beta ).}
I ovanstående är
N B
( r , p )
{\displaystyle \mathrm {NB} (r,p)}
den negativa binomialfördelningen och
B
( α , β )
{\displaystyle {\textrm {B}}(\alpha ,\beta )}
är betafördelningen .
Definition och härledning
Betecknar
f
X
|
p
( k
|
q ) ,
f
p
( q
|
α , β )
{\displaystyle f_{X|p}(k|q),f_{p}(q|\alpha ,\beta )} densiteterna
för negativt binomial respektive betafördelning, vi får PMF
f ( k
|
α , β , r )
{\displaystyle f(k|\alpha ,\beta ,r)}
för BNB-fördelningen genom marginalisering:
f ( k
|
α , β , r ) =
0
∫
1
f
X
|
p
( k
|
r , q ) ⋅
f
p
( q
|
α , β )
d
q =
0
∫
1
(
k + r − 1
k
)
( 1 − q
)
k
q
r
⋅
q
α − 1
( 1 − q
)
β − 1
B
( α , β )
d
q =
1
B
( α , β )
(
k + r − 1
k
)
0
∫
1
q
α + r − 1
( 1 − q
)
β + k − 1
d
q
{\displaystyle f (k|\alpha ,\beta ,r)=\int _{0}^{1}f_{X|p}(k|r,q)\cdot f_{p}(q|\alpha ,\beta ) \mathrm {d} q=\int _{0}^{1}{\binom {k+r-1}{k}}(1-q)^{k}q^{r}\cdot {\frac {q^{\alpha -1}(1-q)^{\beta -1}}{\mathrm {B} (\alpha ,\beta )}}\mathrm {d} q={\frac {1} {\mathrm {B} (\alpha ,\beta )}}{\binom {k+r-1}{k}}\int _{0}^{1}q^{\alpha +r-1}( 1-q)^{\beta +k-1}\mathrm {d} q}
Notera att integralen utvärderas till:
0
∫
1
q
α + r − 1
( 1 − q
)
β + k − 1
d
q =
Γ ( α + r ) Γ ( β + k )
Γ ( α + β + k + r )
{\displaystyle \int _{ 0}^{1}q^{\alpha +r-1}(1-q)^{\beta +k-1}\mathrm {d} q={\frac {\Gamma (\alpha +r)\ Gamma (\beta +k)}{\Gamma (\alpha +\beta +k+r)}}}
vi kan komma fram till följande formler genom relativt enkla manipulationer.
Om
r
{\displaystyle r}
är ett heltal, kan PMF skrivas i termer av betafunktionen , :
f ( k
|
α , β , r ) =
(
r + k − 1
k
)
B
( α + r , β + k )
B
( α , β )
{\displaystyle f(k|\alpha ,\beta ,r) ={\binom {r+k-1}{k}}{\frac {\mathrm {B} (\alpha +r,\beta +k)}{\mathrm {B} (\alpha ,\beta )} }}
.
Mer generellt kan PMF skrivas
f ( k
|
α , β , r ) =
Γ ( r + k )
k ! Γ ( r )
B
( α + r , β + k )
B
( α , β )
{\displaystyle f(k|\alpha ,\beta ,r)={\frac {\Gamma (r+k)}{k !\;\Gamma (r)}}{\frac {\mathrm {B} (\alpha +r,\beta +k)}{\mathrm {B} (\alpha ,\beta )}}}
eller
f ( k
|
α , β , r ) =
B
( r + k , α + β )
B
( r , α )
Γ ( k + β )
k ! Γ ( β )
{\displaystyle f(k|\alpha ,\beta ,r)={\frac {\mathrm {B} (r+k,\alpha +\beta )}{\mathrm {B} (r, \alpha )}}{\frac {\Gamma (k+\beta )}{k!\;\Gamma (\beta )}}}
.
PMF uttryckt med Gamma
Med hjälp av egenskaperna för betafunktionen kan PMF med heltal
r
{\displaystyle r}
skrivas om som:
f ( k
|
α , β , r ) =
(
r + k − 1
k
)
Γ ( α + r ) Γ ( β + k ) Γ ( α + β )
Γ ( α + r + β + k ) Γ ( α + k ) ) Γ ( β )
{\displaystyle f(k|\alpha ,\beta ,r)={\binom {r+k-1}{k}}{\frac {\Gamma (\alpha +r)\Gamma ( \beta +k)\Gamma (\alpha +\beta )}{\Gamma (\alpha +r+\beta +k)\Gamma (\alpha )\Gamma (\beta )}}}
.
Mer generellt kan PMF skrivas som
f ( k
|
α , β , r ) =
Γ ( r + k )
k ! Γ ( r )
Γ ( α + r ) Γ ( β + k ) Γ ( α + β )
Γ ( α + r + β + k ) Γ ( α ) Γ ( β )
{\displaystyle f(k|\alpha , \beta ,r)={\frac {\Gamma (r+k)}{k!\;\Gamma (r)}}{\frac {\Gamma (\alpha +r)\Gamma (\beta +k) \Gamma (\alpha +\beta )}{\Gamma (\alpha +r+\beta +k)\Gamma (\alpha )\Gamma (\beta )}}}
.
PMF uttryckt med den stigande Pochammer-symbolen
PMF presenteras ofta också i termer av Pochammer-symbolen för heltal
r
{\displaystyle r}
f ( k
|
α , β , r ) =
r
( k )
α
( r )
β
( k )
k ! ( α + β
)
( r + k )
{\displaystyle f(k|\alpha ,\beta ,r)={\frac {r^{(k)}\alpha ^{(r)}\beta ^{( k)}}{k!(\alpha +\beta )^{(r+k)}}}}
Egenskaper
Ej identifierbar
Det beta-negativa binomet är icke-identifierbart vilket enkelt kan ses genom att helt enkelt byta
r
{\displaystyle r}
och
β
{\displaystyle \beta }
i ovanstående densitet eller karakteristiska funktion och notera att den är oförändrad. Således uppskattning att en begränsning läggs på
r
{\displaystyle r}
,
β
{\displaystyle \beta }
eller båda.
Relation till andra distributioner
Den beta-negativa binomialfördelningen innehåller den beta-geometriska fördelningen som ett specialfall när antingen
r = 1
{\displaystyle r=1}
eller
β = 1
{\displaystyle \beta =1}
. Den kan därför approximera den geometriska fördelningen godtyckligt. Den approximerar också den negativa binomialfördelningen godtyckligt väl för stora
α
{\displaystyle \alpha }
. Den kan därför approximera Poisson-fördelningen godtyckligt för stora
α
{\displaystyle \alpha } ,
β
{
\displaystyle \beta }
och
r
{\displaystyle r}
.
Tung svans
Genom Stirlings approximation till betafunktionen kan det enkelt visas att för stora
k
{\displaystyle k}
f ( k
|
α , β , r ) ∼
Γ ( α + r )
Γ ( r )
B
( α , β )
k
r − 1
( β + k
)
r + α
{\displaystyle f(k|\alpha ,\ beta ,r)\sim {\frac {\Gamma (\alpha +r)}{\Gamma (r)\mathrm {B} (\alpha ,\beta )}}{\frac {k^{r-1} }{(\beta +k)^{r+\alpha }}}}
vilket innebär att den beta-negativa binomialfördelningen är tungsvansad och att moment mindre än eller lika med
α
{\displaystyle \alpha }
inte existerar.
Beta geometrisk fördelning
Den beta-geometriska fördelningen är ett viktigt specialfall av den beta-negativa binomialfördelningen som inträffar för
r = 1
{\displaystyle r=1}
. I det här fallet förenklas pmf till
f ( k
|
α , β ) =
B
( α + 1 , β + k )
B
( α , β )
{\displaystyle f(k|\alpha ,\beta )={\frac {\mathrm {B} (\ alfa +1,\beta +k)}{\mathrm {B} (\alpha ,\beta )}}}
.
Denna distribution används i vissa Buy Till you Die (BTYD)-modeller.
Vidare, när
β = 1
{\displaystyle \beta =1}
reduceras beta-geometrin till Yule–Simon-fördelningen . Det är dock vanligare att definiera Yule-Simon-fördelningen i termer av en förskjuten version av beta-geometrin. I synnerhet, om
X ∼ B G ( α , 1 )
{\displaystyle X\sim BG(\alpha ,1)}
så
X + 1 ∼ Y S ( α )
{\displaystyle X+1\sim YS(\alpha ) }
.
Beta negativ binomial som en Pólya urnmodell
I fallet när de 3 parametrarna
r , α
{\displaystyle r,\alpha }
och
β
{\displaystyle \beta }
är positiva heltal, kan det negativa beta binomialet också motiveras av en urnmodell - eller mer specifikt en grundläggande Pólya urn modell . Betrakta en urna som initialt innehåller
α
{\displaystyle \alpha }
röda kulor (stoppfärgen) och
β
{\displaystyle \beta }
blå kulor. Vid varje steg i modellen dras en kula slumpmässigt från urnan och ersätts, tillsammans med ytterligare en kula i samma färg. Processen upprepas om och om igen, tills
r
{\displaystyle r}
röda kulor har ritats. Den slumpmässiga variabeln
X
{\displaystyle X}
av observerade dragningar av blå bollar är fördelade enligt en
B N B
( r , α , β )
{\displaystyle \mathrm {BNB} (r,\alpha ,\beta )}
. Observera att i slutet av experimentet innehåller urnan alltid det fasta talet
r + α
{\displaystyle r+\alpha }
för röda kulor samtidigt som den innehåller det slumpmässiga talet
X + β
{\displaystyle X+\beta }
blå kulor.
Genom egenskapen icke-identifierbarhet kan
X
{\displaystyle X}
på samma sätt genereras med urnan som initialt innehåller
α
{\displaystyle \alpha }
röda bollar (stoppfärgen) och
r
{\displaystyle r}
blå bollar och stoppar när
β
{ \displaystyle \beta }
röda bollar observeras.
Se även
Anteckningar
Johnson, NL; Kotz, S.; Kemp, AW (1993) Univariate Discrete Distributions , 2nd edition, Wiley ISBN 0-471-54897-9 (Avsnitt 6.2.3)
Kemp, CD; Kemp, AW (1956) "Generaliserade hypergeometriska distributioner , Journal of the Royal Statistical Society , Series B, 18, 202–211
Wang, Zhaoliang (2011) "One mixed negative binomial distribution with application", Journal of Statistical Planning and Inference , 141 (3), 1153-1160 doi : 10.1016/j.jspi.2010.09.020
externa länkar
Diskret univariat
med ändligt stöd
med oändligt stöd
Kontinuerlig univariat
stöds på ett begränsat intervall
stöds på ett semi-oändligt intervall
stöds på hela reallinjen
med stöd vars typ varierar
Blandad univariat
Multivariat (led)
Riktad
Degenererad och singular
Familjer