Logit-normalfördelning

Logit-normal
Sannolikhetstäthetsfunktion
Plot of the Logitnormal PDF
Kumulativ fördelningsfunktion
Plot of the Logitnormal PDF
Notation
Parametrar
σ 2 > 0 — kvadratisk skala (real), μ R — plats
Stöd x ∈ (0, 1)
PDF
CDF
Betyda ingen analytisk lösning
Median
Läge ingen analytisk lösning
Variation ingen analytisk lösning
MGF ingen analytisk lösning

I sannolikhetsteorin är en logit-normalfördelning en sannolikhetsfördelning av en slumpvariabel vars logit har en normalfördelning . Om Y är en slumpvariabel med en normalfördelning och t är den logistiska standardfunktionen , så har X = t ( Y ) en logit-normalfördelning; på samma sätt, om X är logit-normalfördelad, då är Y = logit ( X )= log ( X /(1- X )) normalfördelad. Det är också känt som den logistiska normalfördelningen , som ofta hänvisar till en multinomial logitversion (t.ex.).

En variabel kan modelleras som logit-normal om det är en proportion, som begränsas av noll och ett, och där värden på noll och ett aldrig förekommer.

Karakterisering

Sannolikhetstäthetsfunktion

Sannolikhetstäthetsfunktionen (PDF) för en logit-normalfördelning, för 0 < x < 1, är:

där μ och σ är medelvärdet och standardavvikelsen för variabelns logit (definitivt är variabelns logit normalfördelad).

Densiteten som erhålls genom att ändra tecknet för μ är symmetrisk, eftersom den är lika med f(1-x;- μ , σ ), vilket skiftar läget till andra sidan av 0,5 (mittpunkten av (0,1) intervallet ).

Plott av Logitnormal PDF för olika kombinationer av μ (facetter) och σ (färger)

Ögonblick

Momenten för logit-normalfördelningen har ingen analytisk lösning. Momenten kan uppskattas genom numerisk integration , men numerisk integration kan vara oöverkomlig när värdena för är sådana att densitetsfunktionen divergerar till oändligt vid ändpunkterna noll och en. Ett alternativ är att använda observationen att logit-normalen är en transformation av en normal slumpvariabel. Detta gör att vi kan approximera det -th momentet via följande kvasi Monte Carlo-uppskattning

där är standardlogistikfunktionen, och är den inversa kumulativa fördelningsfunktionen av en normalfördelning med medelvärde och varians . [ förtydligande behövs ]

Läge eller lägen

När derivatan av densiteten är lika med 0 så uppfyller läget för moden x följande ekvation:

För vissa värden på parametrarna finns två lösningar, dvs fördelningen är bimodal .

Multivariat generalisering

Den logistiska normalfördelningen är en generalisering av logit-normalfördelningen till D-dimensionella sannolikhetsvektorer genom att ta en logistisk transformation av en multivariat normalfördelning.

Sannolikhetstäthetsfunktion

Sannolikhetstäthetsfunktionen är :

där anger en vektor av de första (D-1) komponenterna av och betecknar simplexet för D-dimensionella sannolikhetsvektorer. Detta följer av att tillämpa den additiva logistiska transformationen för att kartlägga en multivariat normal stokastisk variabel :

Gaussiska densitetsfunktioner och motsvarande logistiska normaldensitetsfunktioner efter logistisk transformation.

Den unika inversa mappningen ges av:

.

Detta är fallet med en vektor x som sammanfattar komponenter till ett. I fallet med x med sigmoidala element, det vill säga när

vi har

där loggen och divisionen i argumentet tas elementmässigt. Detta beror på att transformationens jakobiska matris är diagonal med elementen .

Använd i statistisk analys

Den logistiska normalfördelningen är ett mer flexibelt alternativ till Dirichlet-fördelningen genom att den kan fånga korrelationer mellan komponenter i sannolikhetsvektorer. Det har också potential att förenkla statistiska analyser av sammansättningsdata genom att tillåta en att svara på frågor om log-förhållanden mellan komponenterna i datavektorerna. Man är ofta intresserad av kvoter snarare än absoluta komponentvärden.

Sannolikhetssimplexet är ett avgränsat utrymme, vilket gör standardtekniker som vanligtvis tillämpas på vektorer i mindre meningsfulla. Aitchison beskrev problemet med falska negativa korrelationer när man tillämpar sådana metoder direkt på enkla vektorer. Mappning av sammansättningsdata i genom inversen av den additiva logistiska transformationen ger emellertid realvärderade data i . Standardtekniker kan tillämpas på denna representation av data. Detta tillvägagångssätt motiverar användningen av den logistiska normalfördelningen, som alltså kan betraktas som "simplexens Gauss".

Förhållande till Dirichlet-distributionen

Logistisk normal approximation till Dirichlet distribution

Dirichlet och logistisk normalfördelning är aldrig exakt lika för val av parametrar . Aitchison beskrev emellertid en metod för att approximera en Dirichlet med en logistisk normal så att deras Kullback–Leibler divergens (KL) minimeras:

Detta minimeras genom:

Med hjälp av momentegenskaper för Dirichlet-fördelningen kan lösningen skrivas i termer av funktionerna digamma och trigamma

Denna uppskattning är särskilt korrekt för stora . I själva verket kan man visa att för har vi att .

Se även

Vidare läsning

externa länkar