Hermitfördelning

Hermite
	Sannolikhetsmassfunktion ; Den horisontella axeln är indexet k , antalet förekomster. Funktionen definieras endast vid heltalsvärden k . Anslutningslinjerna är endast guider för ögat.
	Kumulativ fördelningsfunktion ; Den horisontella axeln är indexet k , antalet förekomster. CDF är diskontinuerlig vid heltal av k och platt överallt annars eftersom en variabel som är Hermite distribuerad bara tar heltalsvärden.
Notation
Parametrar	a 1 ≥ 0, a 2 ≥ 0
Stöd	x ∈ { 0, 1, 2, ... }
PMF
CDF
Betyda
Variation
Skevhet
Ex. kurtosis
MGF
CF
PGF

Inom sannolikhetsteori och statistik är Hermite -fördelningen , uppkallad efter Charles Hermite , en diskret sannolikhetsfördelning som används för att modellera räknedata med mer än en parameter. Denna fördelning är flexibel när det gäller dess förmåga att tillåta en måttlig överspridning av data.

Författarna Kemp och Kemp har kallat det "Hermite distribution" från det faktum att dess sannolikhetsfunktion och den momentgenererande funktionen kan uttryckas i termer av koefficienterna för (modifierade) hermitpolynom .

Historia

Fördelningen dök först upp i tidningen Applications of Mathematics to Medical Problems, av Anderson Gray McKendrick 1926. I detta arbete förklarar författaren flera matematiska metoder som kan tillämpas på medicinsk forskning. I en av dessa metoder betraktade han den bivariata Poisson-fördelningen och visade att fördelningen av summan av två korrelerade Poisson-variabler följer en fördelning som senare skulle bli känd som Hermite-fördelning.

Som en praktisk tillämpning övervägde McKendrick fördelningen av antalet bakterier i leukocyter . Med hjälp av momentmetoden anpassade han data med Hermite-fördelningen och fann modellen mer tillfredsställande än att passa den med en Poisson-fördelning .

Distributionen introducerades formellt och publicerades av CD Kemp och Adrienne W. Kemp 1965 i deras arbete Some Properties of 'Hermite' Distribution . Arbetet är fokuserat på egenskaperna hos denna fördelning, till exempel ett nödvändigt villkor för parametrarna och deras maximala sannolikhetsestimatorer (MLE), analysen av den sannolikhetsgenererande funktionen (PGF) och hur den kan uttryckas i termer av koefficienterna för ( modifierad) Hermitpolynom . Ett exempel som de har använt i denna publikation är fördelningen av antalet bakterier i leukocyter som använde McKendrick men Kemp och Kemp uppskattar modellen med maximal sannolikhetsmetoden .

Hermitfördelning är ett specialfall av diskret sammansatt Poisson-fördelning med endast två parametrar.

Samma författare publicerade 1966 tidningen An alternative Derivation of the Hermite Distribution . I detta arbete fastställdes att Hermite-fördelningen kan erhållas formellt genom att kombinera en Poisson-fördelning med en normalfördelning .

1971 gjorde YC Patel en jämförande studie av olika uppskattningsförfaranden för Hermite-fördelningen i sin doktorsavhandling. Den inkluderade maximal sannolikhet, momentuppskattare, medelvärde och nollfrekvensuppskattare och metoden för jämna poäng.

1974 gjorde Gupta och Jain en forskning om en generaliserad form av Hermite-distribution.

Definition

Sannolikhetsmassfunktion

Låt X ₁ och X ₂ vara två oberoende Poisson-variabler med parametrarna a ₁ och a ₂ . Sannolikhetsfördelningen för den slumpmässiga variabeln Y = X ₁ + 2 X 2 _är Hermite-fördelningen med parametrarna a ₁ och a ₂ och sannolikhetsmassfunktionen ges av

p_{n}=P(Y=n)=e^{-(a_{1}+a_{2})}\summa _{j=0}^{\lfloor n/2\rfloor }{ \frac {a_{1}^{n-2j}a_{2}^{j}}{(n-2j)!j!}}

var

n = 0, 1, 2, ...
a ₁ , a ₂ ≥ 0.
( n − 2 j )! och j ! är faktorerna för ( n − 2 j ) respektive j .
${\textstil \lfloor n/2\rfloor }$ är heltalsdelen av n /2.

Den sannolikhetsgenererande funktionen för sannolikhetsmassan är,

G_{Y}(s)=\summa _{ n=0}^{\infty }p_{n}s^{n}=\exp(a_{1}(s-1)+a_{2}(s^{2}-1))

Notation

När en slumpvariabel Y = X ₁ + 2 X ₂ fördelas med en hermitfördelning, där X ₁ och X ₂ är två oberoende Poisson-variabler med parametrarna a ₁ och a ₂ , skriver vi

Y\ \sim \operatörsnamn {Herm} (a_{1},a_{2})\,

Egenskaper

Moment- och kumulantgenererande funktioner

Den momentgenererande funktionen för en slumpvariabel X definieras som det förväntade värdet av e ^t , som en funktion av den reella parametern t . För en Hermite-fördelning med parametrarna X ₁ och X ₂ finns den momentgenererande funktionen och är lika med

M(t)=G(e^{t})= \exp(a_{1}(e^{t}-1)+a_{2}(e^{2t}-1))

Den kumulantgenererande funktionen är logaritmen för den momentgenererande funktionen och är lika med

K(t)=\log(M(t))=a_ {1}(e^{t}-1)+a_{2}(e^{2t}-1)

Om vi betraktar koefficienten för ( it ) ^r r ! i expansionen av K ( t ) får vi r -kumulanten

k_{n}=a_{1}+2^{n}a_{2}

Därför är medelvärdet och de tre följande ögonblicken om det

Beställa	Ögonblick	Kumulant
1	$\mu _{1}=k_{1}=a_{1}+2a_{2}$	$\mu$
2	$\mu _{2}=k_{2}=a_{1}+4a_{2}$	$\sigma ^{2}$
3	$\mu _{3}=k_{3}=a_{1}+8a_{2}$	$k_{3}$
4	$\mu _{4}=k_{4}+3k_{2}^{2 }=a_{1}+16a_{2}+3(a_{1}+4a_{2})^{2}$	$k_{4}$

Skevhet

Skevheten är det tredje momentet centrerat kring medelvärdet dividerat med 3/2-potensen för standardavvikelsen, och för hermitfördelningen är ,

\gamma _{1}={\frac {\mu _{3}}{ \mu _{2}^{3/2}}}={\frac {a_{1}+8a_{2}}{(a_{1}+4a_{2})^{3/2}}}

Alltid $\gamma _{1}>0$ , så fördelningens massa är koncentrerad till vänster.

Kurtosis

Kurtosen är det fjärde momentet centrerat kring medelvärdet, dividerat med kvadraten på variansen, och för Hermite är fördelningen,

\beta _{2}={\frac {\mu _{4}}{\mu _{2}^{2}}}={\frac {a_{1}+16a_{2 }+3(a_{1}+4a_{2})^{2}}{(a_{1}+4a_{2})^{2}}}={\frac {a_{1}+16a_{2 }}{(a_{1}+4a_{2})^{2}}}+3

Överskottet kurtos är bara en korrigering för att göra kurtosen av normalfördelningen lika med noll, och det är följande,

\gamma _{2}={\frac {\mu _{4}}{\mu _{2}^{2}}}-3={\frac {a_{1}+16a_{2}}{(a_{1}+4a_{2})^{2}}}

Alltid $\beta _{2}>3$ , eller $\gamma _{2}>0$ fördelningen har en hög akut topp runt medel- och fetare svansar.

Karakteristisk funktion

I en diskret fördelning definieras den karakteristiska funktionen för varje slumpvariabel med reellt värde som det förväntade värdet av ${\displaystyle e^{itX}} ,$ där i är den imaginära enheten och t ∈ R

\phi (t)=E[e^{itX}]=\summa _{j =0}^{\infty }e^{ijt}P[X=j]

Denna funktion är relaterad till den momentgenererande funktionen via $\phi _{x}(t)=M_{X}(it)$ . Därför är den karakteristiska funktionen för denna fördelning,

\phi _{x}(t)=\exp(a_{1} (e^{it}-1)+a_{2}(e^{2it}-1))

Kumulativ fördelningsfunktion

Den kumulativa fördelningsfunktionen är,

{\begin{aligned}F(x;a_{1},a_{2})&=P(X\leq x)\\&=\exp(-(a_{1}+a_{2} ))\summa _{i=0}^{\lgolv x\rgolv}\summa _{j=0}^{[i/2]}{\frac {a_{1}^{i-2j}a_{ 2}^{j}}{(i-2j)!j!}}\end{aligned}}

Övriga fastigheter

Denna distribution kan ha valfritt antal lägen . Som ett exempel har den anpassade fördelningen för McKendricks data uppskattade parametrar på ${\displaystyle {\hat {a}}_{1}=0,0135} ,$ a $displaystyle {\hat { a}}_{2}=0,0932}$ . Därför är de första fem uppskattade sannolikheterna 0,899, 0,012, 0,084, 0,001, 0,004.

Exempel på multimodal data, Hermite distribution(0.1,1.5).

Denna fördelning är stängd under addition eller stängd under faltningar. Liksom Poisson-fördelningen har Hermite-fördelningen denna egenskap. Givet två Hermite-fördelade slumpvariabler $X_{1}\sim \operatorname {Herm} (a_{1},a_{2})$ och $X_{2}\sim \operatorname {Herm} (b_{1},b_{2})$ , sedan följer Y = X ₁ + X ₂ en hermitfördelning, $Y\sim \operatörsnamn {Herm} (a_{1}+b_{1},a_{2}+b_{2})$ .
Denna fördelning tillåter en måttlig överspridning , så den kan användas när data har den här egenskapen. En slumpvariabel har överdispersion, eller så är den överdispergerad med avseende på Poisson-fördelningen, när dess varians är större än dess förväntade värde. Hermitfördelningen tillåter en måttlig överdispersion eftersom spridningskoefficienten alltid är mellan 1 och 2,

d={\frac {\operatörsnamn {Var } (Y)}{\operatörsnamn {E} (Y)}}={\frac {a_{1}+4a_{2}}{a_{1}+2a_{2}}}=1+{\frac { 2a_{2}}{a_{1}+2a_{2}}}

Parameteruppskattning

Moments metod

Medelvärdet och variansen för Hermite-fördelningen är $\mu =a_{1}+2a_{2}$ och σ $\displaystyle \sigma ^ {2}=a_{1}+4a_{2}}$ respektive. Så vi har dessa två ekvationer,

{\begin{cases}{\bar {x}}=a_{1}+2a_{2}\\\sigma ^ {2}=a_{1}+4a_{2}\end{cases}}

När vi löser dessa två ekvationer får vi ögonblicksberäkningarna ${\hat {a_{1}}}$ och ${\hat {a_{2}}}$ av en ₁ och en ₂ .

{\hat {a_{1}}}=2{\bar {x}}-\sigma ^{2}

{\hat {a_{2}}}={\frac {\sigma ^{2}-{\hat {x}}}{2}}

Eftersom en ₁ och en ₂ båda är positiva är estimatorn ${\hat {a_{1}}}$ och ${\hat {a_{2}}}$ tillåtna ( ≥ 0) endast om, ${\bar {x}}<\sigma ^{2}<2{\bar {x}}$ .

Maximal sannolikhet

Givet ett urval X ₁ , ..., X _m är oberoende slumpvariabler som var och en har en Hermite-fördelning vill vi uppskatta värdet av parametrarna ${\hat {a_{1}}}$ och ${\hat {en_{2}}}$ . Vi vet att fördelningens medelvärde och varians är $\mu =a_{1}+2a_{2}$ och $\ sigma ^{2}=a_{1}+4a_{2}$ respektive. Med hjälp av dessa två ekvationer,

{\begin{cases}a_{1}=\mu (2-d)\\[4pt]a_{2} ={\dfrac {\mu (d-1)}{2}}\end{cases}}

Vi kan parametrisera sannolikhetsfunktionen med μ och d

P(X=x)=\exp \left(-\left(\mu (2-d)+{\frac {\mu (d-1)}{2}}\right)\right)\ summa _{j=0}^{[x/2]}{\frac {(\mu (2-d))^{x-2j}\left({\frac {\mu (d-1)}{ 2}}\höger)^{j}}{(x-2j)!j!}}

Därför är log-likelihood-funktionen ,

{\begin{aligned}{\mathcal {L}}(x_{1}, \ldots ,x_{m};\mu ,d)&=\log({\mathcal {L}}(x_{1},\ldots ,x_{m};\mu ,d))\\&=m \mu \left(-1+{\frac {d-1}{2}}\right)+\log(\mu (2-d))\summa _{i=1}^{m}x_{i }+\summa _{i=1}^{m}\log(q_{i}(\theta ))\end{aligned}}

var

$q_{i}(\theta )=\sum _{j=0}^{[x_{i}/2]}{\frac {\theta ^{j}}{(x_{i}-2j )!j!}}$
$\theta ={\frac {d-1}{2\mu (2-d)^{2}}}$

Från log-likelihood-funktionen är sannolikhetsekvationerna ,

{\frac {\partial l}{\partial \mu }}=m\left(-1+{\frac {d-1}{2}}\right)+{\frac { 1}{\mu }}\summa _{i=1}^{m}x_{i}-{\frac {d-1}{2\mu ^{2}(2-d)^{2}} }\summa _{i=1}^{m}{\frac {q_{i}^{'}(\theta )}{q_{i}(\theta )}}

{\frac {\ partiell l}{\partial d}}=m{\frac {\mu}{2}}-{\frac {\sum _{i=1}^{m}x_{i}}{2-d}} -{\frac {d}{2\mu (2-d)^{3}}}\sum _{i=1}^{m}\summa _{i=1}^{m}{\frac { q_{i}^{'}(\theta )}{q_{i}(\theta )}}

Enkla beräkningar visar att

$\mu ={\bar {x}}$
Och d kan hittas genom att lösa,

\sum _{i=1}^{m}{\frac {q_ {i}^{'}({\tilde {\theta }})}{q_{i}({\tilde {\theta }})}}=m({\bar {x}}(2-d) )^{2}

där ${\tilde {\theta }}={\frac {d-1}{2{\bar {x}}(2-d) ^{2}}}$

Det kan visas att log-likelihood-funktionen är strikt konkav i parametrarnas domän. Följaktligen är MLE unik.

Sannolikhetsekvationen har inte alltid en lösning som den visar följande proposition,

Proposition: Låt X ₁ , ..., X _m komma från en generaliserad Hermite-fördelning med fast n . Då är parametrarnas MLE ${\hat {\mu }}$ och ${\tilde {d}}$ om bara ${\ displaystyle m^{(2)}/{\bar {x}}^{2}>1}$ , där $m^ {(2)}=\summa _{i=1}^{n}x_{i}(x_{i}-1)/n$ indikerar det empiriska faktoriella momentet av ordning 2.

Anmärkning 1: Villkoret $m^{(2)}/{\bar {x}}^{2}>1$ motsvarar ${\tilde {d}}>1$ där ${\tilde {d}}=\sigma ^{2}/{\bar {x}}$ är det empiriska spridningsindexet
Anmärkning 2: Om villkoret inte är uppfyllt är parametrarnas MLEs ${\hat {\mu }}={\bar {x}}$ och ${\displaystyle {\tilde {d}}=1} ,$ det vill säga att data anpassas med hjälp av Poisson-fördelningen.

Nollfrekvens och medelvärdesskattare

Ett vanligt val för diskreta distributioner är den relativa nollfrekvensen för datamängden som är likställt med sannolikheten för noll under den antagna fördelningen. Observera att $f_{0}=\exp(-(a_{1}+a_{2}))$ och $\mu =a_{1}+2a_{2}$ . Efter exemplet med YC Patel (1976) resulterade det resulterande ekvationssystemet,

{\begin{cases}{\bar {x}}=a_{1}+2a_{2} \\f_{0}=\exp(-(a_{1}+a_{2}))\end{cases}}

Vi får nollfrekvensen och medelvärdesskattaren en ₁ av ${\hat {a_{1}}}$ och en ₂ av ${\hat {a_{2}}}$ ,

{\hat {a_{1}}}=-({\bar {x}}+2\log(f_{0}))

{\hat {a_{2}}}={\bar {x}}+\log(f_{0})

där $f_{0}={\frac {n_{0}}{n}}$ , är den relativa nollfrekvensen, n > 0

Det kan ses att för distributioner med hög sannolikhet vid 0 är effektiviteten hög.

För tillåtna värden på ${1}}}}$ och ${\hat {a_{2}}}$ vi ha

-\log \left({\frac {n_{0}}{n}}\right)<{\bar {x}}<-2\log \left({\frac {n_{0}}{n}}\right)

Testar Poisson-antagandet

När Hermite-fördelning används för att modellera ett dataprov är det viktigt att kontrollera om Poisson-fördelningen räcker för att passa data. Att följa den parametriserade sannolikhetsmassfunktionen som används för att beräkna den maximala sannolikhetsskattaren är viktigt för att bekräfta följande hypotes,

{\begin{cases}H_{0}:d=1\\H_{1}:d>1\end{cases}}

Sannolikhetsförhållande test

Sannolikhetsförhållandets teststatistik för eremitfördelning är,

W=2({\mathcal {L}}(X;{\hat {\mu }} ,{\hat {d}})-{\mathcal {L}}(X;{\hat {\mu }},1))

Där ${\mathcal {L}}()$ är log-likelihood-funktionen. Eftersom d = 1 tillhör gränsen för parametrarnas domän, under nollhypotesen, har W inte en asymptotisk $\chi _{1}^{2}$ -fördelning som förväntat. Det kan fastställas att den asymptotiska fördelningen av W är en 50:50 blandning av konstanten 0 och $\chi _{1}^{2}$ . α upper-tail procentenheterna för denna blandning är desamma som 2α upper-tail procentenheterna för en $\chi _{1}^{2}$ ; till exempel, för α = 0,01, 0,05 och 0,10 är de 5,41189, 2,70554 och 1,64237.

"Score" eller Lagrange multiplikatortest

Poängstatistiken är,

S_{2}=2m\left[{\frac {m^{(2 )}-{\bar {x}}^{2}}{2{\bar {x}}}}\right]^{2}={\frac {m({\tilde {d}}-1) ^{2}}{2}}

där m är antalet observationer.

Den asymptotiska fördelningen av poängteststatistiken under nollhypotesen är en $\chi _{1}^{2}$ -fördelning. Det kan vara bekvämt att använda en signerad version av poängtestet, det vill säga $\operatorname {sgn} (m^{(2)}-{\bar {x}}^{2}){\sqrt {S}}$ , som asymptotiskt följer en standardnormal.

Se även

Sannolikhetsmassfunktion Den horisontella axeln är indexet k , antalet förekomster. Funktionen definieras endast vid heltalsvärden k . Anslutningslinjerna är endast guider för ögat.
Kumulativ fördelningsfunktion Den horisontella axeln är indexet k , antalet förekomster. CDF är diskontinuerlig vid heltal av k och platt överallt annars eftersom en variabel som är Hermite distribuerad bara tar heltalsvärden.
Notation	$\operatorname {Herm} (a_{1},a_{2})\,$
Parametrar	a ₁ ≥ 0, a ₂ ≥ 0
Stöd	x ∈ { 0, 1, 2, ... }
PMF	$x\mapsto e^{-(a_{1}+a_{2})}\sum _{j=0}^{\lfloor x/2\rfloor }{\frac {a_{1}^{ x-2j}a_{2}^{j}}{(x-2j)!j!}}$
CDF	$x\mapsto e^{-a_{1}+a_{2}}\sum _{i=0}^{\lfloor x\rfloor}\sum _{j=0}^{\lfloor i/ 2\rvåning }{\frac {a_{1}^{i-2j}a_{2}^{j}}{(i-2j)!j!}}$
Betyda	$a_{1}+2a_{2}$
Variation	$a_{1}+4a_{2}$
Skevhet	${\frac {a_{1}+8a_{2}}{(a_{1}+4a_{2})^{3/ 2}}}$
Ex. kurtosis	${\frac {a_{1}+16a_{2}}{(a_{1}+4a_{2})^{2}}}$
MGF	$\exp(a_{1}(e^{t}-1)+a_{2}(e^{ 2t}-1))\,$
CF	$\exp(a_{1}(e^{ti}-1)+a_{2}(e ^{2ti}-1))\,$
PGF	$\exp(a_{1}(s-1)+a_{2}(s^{2}-1)) \,$