Gumbel distribution
Sannolikhetstäthetsfunktion
| |||
Kumulativ fördelningsfunktion
| |||
Notation | |||
---|---|---|---|
Parametrar |
plats ( verklig ) skala (riktig) |
||
Stöd | |||
där |
|||
CDF | |||
Betyda |
där är Euler–Mascheroni-konstanten |
||
Median | |||
Läge | |||
Variation | |||
Skevhet | |||
Ex. kurtosis | |||
Entropi | |||
MGF | |||
CF |
I sannolikhetsteori och statistik används Gumbel-fördelningen (även känd som typ-I-generaliserad extremvärdesfördelning) för att modellera fördelningen av maximum (eller minimum) av ett antal urval av olika distributioner .
Denna fördelning kan användas för att representera fördelningen av maxnivån i en flod under ett visst år om det fanns en lista med maximivärden för de senaste tio åren. Det är användbart för att förutsäga risken att en extrem jordbävning, översvämning eller annan naturkatastrof kommer att inträffa. Den potentiella tillämpbarheten av Gumbel-fördelningen för att representera fördelningen av maxima relaterar till extremvärdesteori , vilket indikerar att det sannolikt kommer att vara användbart om fördelningen av de underliggande provdata är av normal eller exponentiell typ. Den här artikeln använder Gumbel-fördelningen för att modellera fördelningen av det maximala värdet . För att modellera minimivärdet, använd det negativa av de ursprungliga värdena.
Gumbel-fördelningen är ett särskilt fall av den generaliserade extremvärdesfördelningen (även känd som Fisher-Tippett-fördelningen). Det är också känt som log- Weibull-fördelningen och den dubbla exponentialfördelningen (en term som ibland används för att referera till Laplace-fördelningen ). Det är relaterat till Gompertz-fördelningen : när dess densitet först reflekteras kring origo och sedan begränsas till den positiva halvlinjen, erhålls en Gompertz-funktion.
I den latenta variabelformuleringen av multinomial logit -modellen - vanlig i teorin om diskret val - följer felen hos de latenta variablerna en Gumbel-fördelning. Detta är användbart eftersom skillnaden mellan två Gumbel-fördelade slumpvariabler har en logistisk fördelning .
Gumbeldistributionen är uppkallad efter Emil Julius Gumbel (1891–1966), baserat på hans originalhandlingar som beskriver distributionen.
Definitioner
Den kumulativa fördelningsfunktionen för Gumbel-distributionen är
Standard Gumbel distribution
Standard Gumbel-fördelningen är fallet där och med kumulativ fördelningsfunktion
och sannolikhetstäthetsfunktion
I det här fallet är läget 0, medianen är , medelvärdet är ( Euler–Mascheroni-konstanten ), och standardavvikelsen är
Kumulanterna, för n>1, ges av
Egenskaper
Läget är μ, medan medianen är och medelvärdet ges av
- ,
där är Euler-Mascheroni-konstanten .
Standardavvikelsen är alltså
I läget, där blir värdet på oavsett värdet på
Relaterade distributioner
- Om har en Gumbel-fördelning, så har den villkorliga fördelningen av Y=−X givet att Y är positiv, eller motsvarande givet att X är negativ, en Gompertz-fördelning . CDF G för Y är relaterad till F , CDF för X , med formeln för y >0. Följaktligen är densiteterna relaterade till : Gompertz-densiteten är proportionell mot en reflekterad Gumbel densitet, begränsad till den positiva halvlinjen.
- Om X är en exponentiellt fördelad variabel med medelvärde 1, så har −log( X ) en standard Gumbelfördelning.
- Om och är oberoende, då se Logistisk distribution ).
- Om är oberoende, då är . Observera att . Mer allmänt kan fördelningen av linjära kombinationer av oberoende Gumbel-slumpvariabler approximeras med GNIG- och GIG-fördelningar.
Teori relaterad till den generaliserade multivariata log-gamma-fördelningen ger en multivariat version av Gumbel-fördelningen.
Förekomst och tillämpningar
Gumbel har visat att det maximala värdet (eller sista ordningens statistik ) i ett urval av slumpvariabler efter en exponentiell fördelning minus den naturliga logaritmen för urvalsstorleken närmar sig Gumbel-fördelningen när urvalsstorleken ökar.
Konkret, låt vara sannolikhetsfördelningen av och dess kumulativa fördelning. Då är det maximala värdet av realisationer av mindre än om och endast om alla realisationer är mindre än . Så den kumulativa fördelningen av det maximala värdet uppfyller
- ,
och för stora konvergerar den högra sidan till
Inom hydrologi används därför Gumbel-fördelningen för att analysera sådana variabler som månatliga och årliga maximivärden för daglig nederbörd och flodutsläppsvolymer, och även för att beskriva torka.
Gumbel har också visat att estimatorn r ⁄ ( n +1) för sannolikheten för en händelse — där r är rangnumret för det observerade värdet i dataserien och n är det totala antalet observationer — är en opartisk estimator av kumulativ sannolikhet kring fördelningsläget . Därför används denna estimator ofta som en plottningsposition .
I talteorin approximerar Gumbel-fördelningen antalet termer i en slumpmässig partition av ett heltal såväl som de trendjusterade storlekarna för maximala primtalsluckor och maximala gap mellan primtalskonstellationer .
Gumbel omparametriseringstrick
I maskininlärning används ibland Gumbel-distributionen för att generera prover från den kategoriska distributionen . Denna teknik kallas "Gumbel-max-trick" och är ett speciellt exempel på "reparametriseringstrick".
I detalj, låt vara icke-negativ, och inte alla noll, och låt vara oberoende prover av Gumbel(0, 1), sedan genom rutinintegrering,
På motsvarande sätt, givet valfri vi kan sampla från dess Boltzmann-fördelning genom att
- Om , då .
- .
- . Det vill säga att Gumbel-distributionen är en max-stabil distributionsfamilj.
- .
Slumpmässig variationsgenerering
Eftersom kvantilfunktionen (invers kumulativ fördelningsfunktion ), , av en Gumbelfördelning ges av
varianten har en Gumbel-fördelning med parametrarna och när slumpvarianten dras från uniformen fördelning på intervallet .
Sannolikhetspapper
I tider före programvaran användes sannolikhetspapper för att avbilda Gumbel-fördelningen (se illustration). Papperet är baserat på linjärisering av den kumulativa fördelningsfunktionen :
I papperet är den horisontella axeln konstruerad i en dubbel stockskala. Den vertikala axeln är linjär. Genom att plotta på papperets horisontella axel och -variabeln på den vertikala axeln, representeras fördelningen av en rät linje med en lutning 1 . När distributionsanpassningsprogramvara som CumFreq blev tillgänglig gjordes uppgiften att plotta distributionen enklare, vilket visas i avsnittet nedan.
Se även
- Typ-2 Gumbel distribution
- Extremvärdesteori
- Generaliserad extremvärdesfördelning
- Fisher–Tippett–Gnedenkos sats
- Emil Julius Gumbel