Den vikta normalfördelningen är en sannolikhetsfördelning relaterad till normalfördelningen . Givet en normalfördelad stokastisk variabel X med medelvärde μ och varians σ 2 , är stokastisk variabel Y = | X | har en vikt normalfördelning. Ett sådant fall kan uppstå om endast storleken på någon variabel registreras, men inte dess tecken. Fördelningen kallas "vikt" eftersom sannolikhetsmassan till vänster om x = 0 viks över genom att ta det absoluta värdet . Inom värmeledningsfysiken är den vikta normalfördelningen en grundläggande lösning av värmeekvationen på halvrummet ; det motsvarar att ha en perfekt isolator på ett hyperplan genom ursprunget.
Variansen uttrycks då lätt i termer av medelvärdet:
Både medelvärdet ( μ ) och variansen ( σ 2 ) för X i den ursprungliga normalfördelningen kan tolkas som lokaliserings- och skalparametrarna för Y i den vikta fördelningen.
Egenskaper
Läge
Fördelningsläget är värdet på för vilket densiteten är maximerad. För att hitta detta värde tar vi den första derivatan av densiteten med avseende på och sätter den lika med noll. Tyvärr finns det ingen stängd form. Vi kan dock skriva derivatan på ett bättre sätt och sluta med en icke-linjär ekvation
.
Tsagris et al. (2014) såg från numerisk undersökning att när uppnås maximivärdet när och när blir större än , maxvärdet närmar sig . Detta är naturligtvis något som kan förväntas, eftersom i detta fall den vikta normalen konvergerar till normalfördelningen. För att undvika problem med negativa varianser föreslås exponentieringen av parametern. Alternativt kan du lägga till en begränsning, som om optimeraren går för en negativ varians är värdet på log-sannolikheten NA eller något mycket litet.
Karakteristisk funktion och andra relaterade funktioner
Det finns några sätt att uppskatta parametrarna för den vikta normalen. Alla är i huvudsak den maximala sannolikhetsuppskattningsproceduren, men i vissa fall utförs en numerisk maximering, medan i andra fall roten till en ekvation genomsöks. Loggsannolikheten för den vikta normalen när ett prov av storleken är tillgängligt kan skrivas på följande sätt
I R (programmeringsspråk) , med hjälp av paketet Rfast kan man få MLE riktigt snabbt (kommando foldnorm.mle ). Alternativt kommer kommandot optim eller nlm att passa denna distribution. Maximeringen är enkel, eftersom två parametrar ( och är inblandade. Observera att både positiva och negativa värden för är acceptabla, eftersom tillhör den reella talraden, därför är tecknet inte viktigt eftersom fördelningen är symmetrisk med avseende på Det. Nästa kod är skriven i R
vikt <- funktion ( y ) { ## y är en vektor med positiva data n <- längd ( y ) ## provstorlek sy2 <- summa ( y ^ 2 ) sam <- funktion ( para , n , sy2 ) { me <- para [ 1 ] ; se <- exp ( para [ 2 ] ) f <- - n / 2 * log ( 2 / pi / se ) + n * me ^ 2 / 2 / se + sy2 / 2 / se - summa ( log ( cosh ( me ) * y / se ) ) ) f } mod <- optim ( c ( medelvärde ( y ), sd ( y ) ) , n = n , sy2 = sy2 , sam , kontroll = lista ( maxit = 2000 ) ) mod <- optim ( mod $ par , sam , n = n , sy2 = sy2 , kontroll = lista ( maxit = 20000 ) ) resultat <- c ( - mod $ värde , mod $ par [ 1 ], exp ( mod $ par [ 2 ] ) ) namn ( resultat ) <- c ( "log-sannolikhet" , "mu" , "sigma squared" ) resultat }
De partiella derivatorna av log-sannolikheten skrivs som
.
Genom att likställa den första partiella derivatan av log-sannolikheten till noll får vi ett bra förhållande
.
Observera att ekvationen ovan har tre lösningar, en på noll och två till med motsatt tecken. Genom att substituera ovanstående ekvation med partialderivatan av log-sannolikheten wrt och likställa den med noll, får vi följande uttryck för variansen
,
vilket är samma formel som i normalfördelningen . En huvudskillnad här är att och inte är statistiskt oberoende. Ovanstående samband kan användas för att erhålla maximala sannolikhetsuppskattningar på ett effektivt rekursivt sätt. Vi börjar med ett initialt värde för och hittar den positiva roten ( av den sista ekvationen. Då får vi ett uppdaterat värde på . Proceduren upprepas tills förändringen i log-sannolikhetsvärdet är försumbar. Ett annat enklare och mer effektivt sätt är att utföra en sökalgoritm. Låt oss skriva den sista ekvationen på ett mer elegant sätt
.
Det blir tydligt att optimeringen av log-sannolikheten med avseende på de två parametrarna har förvandlats till en rotsökning av en funktion. Detta är naturligtvis identiskt med den tidigare rotsökningen. Tsagris et al. (2014) upptäckte att det finns tre rötter till denna ekvation för dvs det finns tre möjliga värden på som uppfyller denna ekvation. − och är maximal sannolikhetsuppskattningar och 0, som motsvarar minsta log-sannolikhet.
Elandt RC (1961). "Den vikta normalfördelningen: två metoder för att uppskatta parametrar från ögonblick". Teknometri . 3 (4): 551–562. doi : 10.2307/1266561 . JSTOR 1266561 .
Lin PC (2005). "Tillämpning av den generaliserade vikta normalfördelningen på processkapacitetsmåtten". Int J Adv Manuf Technol . 26 (7–8): 825–830. doi : 10.1007/s00170-003-2043-x . S2CID 123589207 .
Psarakis, S.; Panaretos, J. (2001). "På vissa bivariata förlängningar av den vikta normalen och de vikta-t-fördelningarna". Journal of Applied Statistical Science . 10 (2): 119–136.
Chakraborty, AK; Chatterjee, M. (2013). "På multivariat vikt normalfördelning". Sankhyā: The Indian Journal of Statistics, serie B . 75 (1): 1–15. JSTOR 42003783 .