Logit-normalfördelning
Sannolikhetstäthetsfunktion
| |||
Kumulativ fördelningsfunktion
| |||
Notation | |||
---|---|---|---|
Parametrar |
σ 2 > 0 — kvadratisk skala (real), μ ∈ R — plats |
||
Stöd | x ∈ (0, 1) | ||
CDF | |||
Betyda | ingen analytisk lösning | ||
Median | |||
Läge | ingen analytisk lösning | ||
Variation | ingen analytisk lösning | ||
MGF | ingen analytisk lösning |
I sannolikhetsteorin är en logit-normalfördelning en sannolikhetsfördelning av en slumpvariabel vars logit har en normalfördelning . Om Y är en slumpvariabel med en normalfördelning och t är den logistiska standardfunktionen , så har X = t ( Y ) en logit-normalfördelning; på samma sätt, om X är logit-normalfördelad, då är Y = logit ( X )= log ( X /(1- X )) normalfördelad. Det är också känt som den logistiska normalfördelningen , som ofta hänvisar till en multinomial logitversion (t.ex.).
En variabel kan modelleras som logit-normal om det är en proportion, som begränsas av noll och ett, och där värden på noll och ett aldrig förekommer.
Karakterisering
Sannolikhetstäthetsfunktion
Sannolikhetstäthetsfunktionen (PDF) för en logit-normalfördelning, för 0 < x < 1, är:
där μ och σ är medelvärdet och standardavvikelsen för variabelns logit (definitivt är variabelns logit normalfördelad).
Densiteten som erhålls genom att ändra tecknet för μ är symmetrisk, eftersom den är lika med f(1-x;- μ , σ ), vilket skiftar läget till andra sidan av 0,5 (mittpunkten av (0,1) intervallet ).
Ögonblick
Momenten för logit-normalfördelningen har ingen analytisk lösning. Momenten kan uppskattas genom numerisk integration , men numerisk integration kan vara oöverkomlig när värdena för är sådana att densitetsfunktionen divergerar till oändligt vid ändpunkterna noll och en. Ett alternativ är att använda observationen att logit-normalen är en transformation av en normal slumpvariabel. Detta gör att vi kan approximera det -th momentet via följande kvasi Monte Carlo-uppskattning
där är standardlogistikfunktionen, och är den inversa kumulativa fördelningsfunktionen av en normalfördelning med medelvärde och varians . [ förtydligande behövs ]
Läge eller lägen
När derivatan av densiteten är lika med 0 så uppfyller läget för moden x följande ekvation:
För vissa värden på parametrarna finns två lösningar, dvs fördelningen är bimodal .
Multivariat generalisering
Den logistiska normalfördelningen är en generalisering av logit-normalfördelningen till D-dimensionella sannolikhetsvektorer genom att ta en logistisk transformation av en multivariat normalfördelning.
Sannolikhetstäthetsfunktion
Sannolikhetstäthetsfunktionen är :
där anger en vektor av de första (D-1) komponenterna av och betecknar simplexet för D-dimensionella sannolikhetsvektorer. Detta följer av att tillämpa den additiva logistiska transformationen för att kartlägga en multivariat normal stokastisk variabel :
Den unika inversa mappningen ges av:
- .
Detta är fallet med en vektor x som sammanfattar komponenter till ett. I fallet med x med sigmoidala element, det vill säga när
vi har
där loggen och divisionen i argumentet tas elementmässigt. Detta beror på att transformationens jakobiska matris är diagonal med elementen .
Använd i statistisk analys
Den logistiska normalfördelningen är ett mer flexibelt alternativ till Dirichlet-fördelningen genom att den kan fånga korrelationer mellan komponenter i sannolikhetsvektorer. Det har också potential att förenkla statistiska analyser av sammansättningsdata genom att tillåta en att svara på frågor om log-förhållanden mellan komponenterna i datavektorerna. Man är ofta intresserad av kvoter snarare än absoluta komponentvärden.
Sannolikhetssimplexet är ett avgränsat utrymme, vilket gör standardtekniker som vanligtvis tillämpas på vektorer i mindre meningsfulla. Aitchison beskrev problemet med falska negativa korrelationer när man tillämpar sådana metoder direkt på enkla vektorer. Mappning av sammansättningsdata i genom inversen av den additiva logistiska transformationen ger emellertid realvärderade data i . Standardtekniker kan tillämpas på denna representation av data. Detta tillvägagångssätt motiverar användningen av den logistiska normalfördelningen, som alltså kan betraktas som "simplexens Gauss".
Förhållande till Dirichlet-distributionen
Dirichlet och logistisk normalfördelning är aldrig exakt lika för val av parametrar . Aitchison beskrev emellertid en metod för att approximera en Dirichlet med en logistisk normal så att deras Kullback–Leibler divergens (KL) minimeras:
Detta minimeras genom:
Med hjälp av momentegenskaper för Dirichlet-fördelningen kan lösningen skrivas i termer av funktionerna digamma och trigamma
Denna uppskattning är särskilt korrekt för stora . I själva verket kan man visa att för har vi att .
Se även
- Betadistribution och Kumaraswamy-distribution , andra tvåparameterdistributioner på ett begränsat intervall med liknande former
Vidare läsning
- Frederic, P. & Lad, F. (2008) Two Moments of the Logitnormal Distribution. Kommunikation i statistik-simulering och beräkning . 37: 1263-1269
- Mead, R. (1965). "En generaliserad logit-normal distribution". Biometri . 21 (3): 721–732. doi : 10.2307/2528553 . JSTOR 2528553 . PMID 5858101 .
externa länkar
- logitnorm-paket för R