Vikt normalfördelning

Sannolikhetstäthetsfunktion
Probability density function for the folded-normal distribution
μ =1, σ =1
Kumulativ fördelningsfunktion
Cumulative distribution function for the normal distribution
μ =1, σ =1
Parametrar
μ R ( plats ) σ 2 > 0 ( skala )
Stöd x ∈ [0,∞)
PDF
CDF
Betyda
Variation

Den vikta normalfördelningen är en sannolikhetsfördelning relaterad till normalfördelningen . Givet en normalfördelad stokastisk variabel X med medelvärde μ och varians σ 2 , är stokastisk variabel Y = | X | har en vikt normalfördelning. Ett sådant fall kan uppstå om endast storleken på någon variabel registreras, men inte dess tecken. Fördelningen kallas "vikt" eftersom sannolikhetsmassan till vänster om x = 0 viks över genom att ta det absoluta värdet . Inom värmeledningsfysiken är den vikta normalfördelningen en grundläggande lösning av värmeekvationen halvrummet ; det motsvarar att ha en perfekt isolator på ett hyperplan genom ursprunget.

Definitioner

Densitet

Sannolikhetstäthetsfunktionen (PDF ) ges av

för x ≥ 0 och 0 överallt. En alternativ formulering ges av

,

där cosh är cosinus hyperbolisk funktion . Det följer att den kumulativa fördelningsfunktionen (CDF) ges av:

för x ≥ 0, där erf() är felfunktionen . Detta uttryck reduceras till CDF för halvnormalfördelningen när μ = 0.

Medelvärdet av den vikta fördelningen är då

eller

där är den normala kumulativa fördelningsfunktionen :

Variansen uttrycks då lätt i termer av medelvärdet:

Både medelvärdet ( μ ) och variansen ( σ 2 ) för X i den ursprungliga normalfördelningen kan tolkas som lokaliserings- och skalparametrarna för Y i den vikta fördelningen.

Egenskaper

Läge

Fördelningsläget är värdet på för vilket densiteten är maximerad. För att hitta detta värde tar vi den första derivatan av densiteten med avseende på och sätter den lika med noll. Tyvärr finns det ingen stängd form. Vi kan dock skriva derivatan på ett bättre sätt och sluta med en icke-linjär ekvation

.

Tsagris et al. (2014) såg från numerisk undersökning att när uppnås maximivärdet när och när blir större än , maxvärdet närmar sig . Detta är naturligtvis något som kan förväntas, eftersom i detta fall den vikta normalen konvergerar till normalfördelningen. För att undvika problem med negativa varianser föreslås exponentieringen av parametern. Alternativt kan du lägga till en begränsning, som om optimeraren går för en negativ varians är värdet på log-sannolikheten NA eller något mycket litet.

Karakteristisk funktion och andra relaterade funktioner

  • Den karakteristiska funktionen ges av

.

  • Den momentgenererande funktionen ges av

.

  • Den kumulantgenererande funktionen ges av

.

  • Laplace-förvandlingen ges av

.

  • Fouriertransformen ges av

.

Relaterade distributioner

  • När μ = 0 är fördelningen av Y en halvnormalfördelning .
  • Slumpvariabeln ( Y / σ ) 2 har en icke-central chi-kvadratfördelning med 1 frihetsgrad och icke-centralitet lika med ( μ / σ ) 2 .
  • Den vikta normalfördelningen kan också ses som gränsen för den vikta icke-standardiserade t-fördelningen då frihetsgraderna går i oändlighet.
  • Det finns en bivariat version utvecklad av Psarakis och Panaretos (2001) samt en multivariat version utvecklad av Chakraborty och Chatterjee (2013).
  • Risfördelningen är en multivariat generalisering av den vikta normalfördelningen .
  • Modifierad halvnormalfördelning med pdf:en på ges som , där anger Fox -Wright Psi-funktionen .

Statistisk slutsats

Uppskattning av parametrar

Det finns några sätt att uppskatta parametrarna för den vikta normalen. Alla är i huvudsak den maximala sannolikhetsuppskattningsproceduren, men i vissa fall utförs en numerisk maximering, medan i andra fall roten till en ekvation genomsöks. Loggsannolikheten för den vikta normalen när ett prov av storleken är tillgängligt kan skrivas på följande sätt

I R (programmeringsspråk) , med hjälp av paketet Rfast kan man få MLE riktigt snabbt (kommando foldnorm.mle ). Alternativt kommer kommandot optim eller nlm att passa denna distribution. Maximeringen är enkel, eftersom två parametrar ( och är inblandade. Observera att både positiva och negativa värden för är acceptabla, eftersom tillhör den reella talraden, därför är tecknet inte viktigt eftersom fördelningen är symmetrisk med avseende på Det. Nästa kod är skriven i R

   

  
      
    

         
                  
                     
                          
      
    

                     
                  
        
      
  

 vikt  <-  funktion  (  y  )  {  ## y är en vektor med positiva data  n  <-  längd  (  y  )  ## provstorlek  sy2  <-  summa  (  y  ^  2  )  sam  <-  funktion  (  para  ,  n  ,  sy2  )  {  me  <-  para  [  1  ]  ;  se  <-  exp  (  para  [  2  ]  )  f  <-  -  n  /  2  *  log  (  2  /  pi  /  se  )  +  n  *  me  ^  2  /  2  /  se  +  sy2  /  2  /  se  -  summa  (  log  (  cosh  (  me )  *  y  /  se  )  )  )  f  }  mod  <-  optim  (  c  (  medelvärde  (  y  ),  sd  (  y  )  ) ,  n  =  n  ,  sy2  =  sy2  ,  sam  ,  kontroll  =  lista  (  maxit  =  2000  )  )  mod  <-  optim  (  mod  $  par  ,  sam  ,  n  =  n  ,  sy2  =  sy2  ,  kontroll  =  lista  (  maxit  =  20000  )  )  resultat  <-  c  (  -  mod  $  värde  ,  mod  $  par  [  1  ],  exp  (  mod  $  par  [  2  ] )  )  namn  (  resultat  )  <-  c  (  "log-sannolikhet"  ,  "mu"  ,  "sigma squared"  )  resultat  } 

De partiella derivatorna av log-sannolikheten skrivs som

.

Genom att likställa den första partiella derivatan av log-sannolikheten till noll får vi ett bra förhållande

.

Observera att ekvationen ovan har tre lösningar, en på noll och två till med motsatt tecken. Genom att substituera ovanstående ekvation med partialderivatan av log-sannolikheten wrt och likställa den med noll, får vi följande uttryck för variansen

,

vilket är samma formel som i normalfördelningen . En huvudskillnad här är att och inte är statistiskt oberoende. Ovanstående samband kan användas för att erhålla maximala sannolikhetsuppskattningar på ett effektivt rekursivt sätt. Vi börjar med ett initialt värde för och hittar den positiva roten ( av den sista ekvationen. Då får vi ett uppdaterat värde på . Proceduren upprepas tills förändringen i log-sannolikhetsvärdet är försumbar. Ett annat enklare och mer effektivt sätt är att utföra en sökalgoritm. Låt oss skriva den sista ekvationen på ett mer elegant sätt

.

Det blir tydligt att optimeringen av log-sannolikheten med avseende på de två parametrarna har förvandlats till en rotsökning av en funktion. Detta är naturligtvis identiskt med den tidigare rotsökningen. Tsagris et al. (2014) upptäckte att det finns tre rötter till denna ekvation för dvs det finns tre möjliga värden på som uppfyller denna ekvation. − och är maximal sannolikhetsuppskattningar och 0, som motsvarar minsta log-sannolikhet.

Se även

  • Vikt kumulativ fördelning
  • Halvnormalfördelning
  • Modifierad halvnormalfördelning med pdf:en på ges som , där anger Fox -Wright Psi-funktionen .
  • Trunkerad normalfördelning

externa länkar