L-moment
I statistik är L-moment en sekvens av statistik som används för att sammanfatta formen på en sannolikhetsfördelning . De är linjära kombinationer av ordningsstatistik ( L-statistik ) analoga med konventionella moment , och kan användas för att beräkna kvantiteter analoga med standardavvikelse , skevhet och kurtos , benämnda L-skalan, L-skevheten respektive L-kurtosen (L-kurtos). -medelvärde är identiskt med det konventionella medelvärdet ). Standardiserade L-moment kallas L-moment-förhållanden och är analoga med standardiserade moment . Precis som för konventionella moment har en teoretisk fördelning en uppsättning av populations-L-moment. Sample L-moment kan definieras för ett urval från populationen och kan användas som uppskattning av populationens L-moment.
Population L-moment
För en slumpvariabel X är det r: te populationens L-moment
där X k:n anger k: te ordningens statistik ( k: te minsta värdet) i ett oberoende urval av storlek n från fördelningen av X och anger förväntat värde . I synnerhet är de fyra första populationens L-moment
Observera att koefficienterna för det k -:te L-momentet är desamma som i den k -:te termen av den binomala transformationen , som används i den ändliga skillnaden av k -ordningen (ändlig analog med derivatan).
De två första av dessa L-moment har konventionella namn:
L-skalan är lika med halva den genomsnittliga absoluta skillnaden .
Exempel på L-moment
Sampel-L-momenten kan beräknas som populationens L-moment för urvalet, summering över r -elementdelmängder av urvalet gör alltså ett medelvärde genom att dividera med binomialkoefficienten :
Gruppering av dessa efter ordningsstatistik räknar antalet sätt som ett element i ett n -elementprov kan vara det j: te elementet i en r -elementdelmängd, och ger formler i formen nedan. Direkta estimatorer för de första fyra L-momenten i ett ändligt urval av n observationer är:
där x ( i ) är i:te ordningens statistik och är en binomial koefficient . Exempel på L-moment kan också definieras indirekt i termer av sannolikhetsvägda moment, vilket leder till en mer effektiv algoritm för deras beräkning.
L-moment förhållanden
En uppsättning L-moment-förhållanden , eller skalade L-moment, definieras av
De mest användbara av dessa är , kallad L-skewness , och , L-kurtosis .
L-momentförhållanden ligger inom intervallet (–1, 1). Snävare gränser kan hittas för vissa specifika L-momentförhållanden; i synnerhet ligger L-kurtosis i [-¼,1), och
En kvantitet som är analog med variationskoefficienten , men baserad på L-moment, kan också definieras: som kallas "L-variationskoefficienten" eller "L-CV". För en icke-negativ slumpvariabel ligger denna i intervallet (0,1) och är identisk med Gini-koefficienten .
Relaterade kvantiteter
L-moment är statistiska storheter som härleds från sannolikhetsviktade moment (PWM) som definierades tidigare (1979). PWM används för att effektivt uppskatta parametrarna för distributioner som kan uttryckas i invers form, såsom Gumbel- , Tukey- och Wakeby-distributionerna.
Användande
Det finns två vanliga sätt att använda L-moment, i båda fallen analogt med de konventionella momenten:
- Som sammanfattande statistik för data.
- Att härleda estimatorer för parametrarna för sannolikhetsfördelningar genom att tillämpa metoden för moment på L-momenten snarare än konventionella moment.
Förutom att göra dessa med standardmoment, görs det senare (uppskattning) mer vanligt med metoder för maximal sannolikhet ; att använda L-moment ger dock ett antal fördelar. Specifikt är L-moment mer robusta än konventionella moment, och förekomsten av högre L-moment kräver bara att den slumpmässiga variabeln har ett ändligt medelvärde. En nackdel med L-momentförhållanden för uppskattning är deras typiskt mindre känslighet. Till exempel har Laplace-fördelningen en kurtos på 6 och svaga exponentiella svansar, men ett större 4:e L-moment-förhållande än t.ex. student-t-fördelningen med df=3, som har en oändlig kurtos och mycket tyngre svansar.
Som ett exempel kan du betrakta en datauppsättning med några få datapunkter och ett externt datavärde. Om den ordinarie standardavvikelsen för denna datamängd tas kommer den att i hög grad påverkas av denna punkt: om L-skalan tas kommer den dock att vara mycket mindre känslig för detta datavärde. Följaktligen är L-moment mycket mer meningsfulla när man hanterar extremvärden i data än konventionella ögonblick. Det finns dock även andra bättre lämpade metoder för att uppnå en ännu högre robusthet än att bara ersätta moment med L-moment. Ett exempel på detta är att använda L-moment som sammanfattande statistik i extremvärdesteori ( EVT). Denna applikation visar den begränsade robustheten hos L-moment, dvs. L-statistik är inte resistent statistik , eftersom ett enda extremvärde kan kasta bort dem, men eftersom de bara är linjära (inte högre ordningsstatistik) påverkas de mindre av extrema värden än konventionella ögonblick.
En annan fördel som L-moment har jämfört med konventionella moment är att deras existens endast kräver att den slumpmässiga variabeln har ändligt medelvärde, så L-momenten existerar även om de högre konventionella momenten inte existerar (till exempel för Students t-fördelning med låga grader av frihet ). En finit varians krävs dessutom för att standardfelen för uppskattningar av L-momenten ska vara finita.
Några förekomster av L-moment i den statistiska litteraturen inkluderar boken av David & Nagaraja (2003, avsnitt 9.9) och ett antal artiklar. Ett antal gynnsamma jämförelser av L-moment med vanliga moment har rapporterats.
Värden för några vanliga distributioner
Tabellen nedan ger uttryck för de två första L-momenten och numeriska värden för de två första L-momentförhållandena för några vanliga kontinuerliga sannolikhetsfördelningar med konstanta L-momentförhållanden. Mer komplexa uttryck har härletts för några ytterligare distributioner för vilka L-momentförhållandena varierar med en eller flera av fördelningsparametrarna, inklusive log- normal , Gamma , generaliserad Pareto , generaliserat extremvärde och generaliserade logistiska fördelningar.
Distribution | Parametrar | medel, λ 1 | L-skala, λ 2 | L-skevhet, τ 3 | L-kurtosis, τ 4 |
---|---|---|---|---|---|
Enhetlig | a , b | ( a + b ) / 2 | ( b – a ) / 6 | 0 | 0 |
Logistisk | μ , s | μ | s | 0 | 1⁄6 0,1667 _ = |
Vanligt | μ , σ 2 | μ | σ / √ π | 0 | 0,1226 |
Laplace | μ , b | μ | 3 b /4 | 0 | 1/(3 √ 2 ) = 0,2357 |
Students t , 2 df | ν = 2 | 0 | π /2 3/2 = 1,111 | 0 | 3 ⁄ 8 = 0,375 |
Students t , 4 df | ν = 4 | 0 | 15 n /64 = 0,7363 | 0 | 111/512 = 0,2168 |
Exponentiell | λ | 1/ A | 1 / (2 λ ) | 1⁄3 0,3333 _ = | 1⁄6 0,1667 _ = |
Gumbel | μ , β | μ + γ β | β log 2 | 0,1699 | 0,1504 |
Notationen för parametrarna för varje distribution är densamma som den som används i den länkade artikeln. I uttrycket för medelvärdet av Gumbelfördelningen är γ Euler–Mascheroni-konstanten 0,57721... .
Tillägg
Trimmade L-moment är generaliseringar av L-moment som ger noll vikt åt extrema observationer. De är därför mer robusta mot förekomsten av extremvärden, och till skillnad från L-moment kan de vara väldefinierade för distributioner för vilka medelvärdet inte existerar, såsom Cauchy- fördelningen .
Se även
externa länkar
- L-moments-sidan Jonathan RM Hosking, IBM Research
- L Ögonblick. Dataplot referensmanual, vol. 1, hjälpkapitel. National Institute of Standards and Technology , 2006. Åtkomst 2010-05-25.