Linjär sannolikhetsmodell
Inom statistik är en linjär sannolikhetsmodell (LPM) ett specialfall av en binär regressionsmodell . Här tar den beroende variabeln för varje observation värden som är antingen 0 eller 1. Sannolikheten att observera en 0 eller 1 i något fall behandlas som beroende på en eller flera förklarande variabler . För den "linjära sannolikhetsmodellen" är detta förhållande särskilt enkelt och gör att modellen kan anpassas genom linjär regression .
Modellen antar att och dess associerade vektor av förklarande variabler, X Bernoulli-försöket ) ,
För denna modell,
och följaktligen kan vektorn för parametrarna β uppskattas med hjälp av minsta kvadrater . Denna anpassningsmetod skulle vara ineffektiv och kan förbättras genom att anta ett iterativt schema baserat på viktade minsta kvadrater , där modellen från föregående iteration används för att tillhandahålla uppskattningar av de villkorliga varianserna, , vilket skulle variera mellan observationer. Detta tillvägagångssätt kan relateras till att anpassa modellen efter maximal sannolikhet .
En nackdel med denna modell är att, om inte restriktioner sätts på kan de uppskattade koefficienterna antyda sannolikheter utanför enhetsintervallet [ , 1 . Av denna anledning är modeller som logitmodellen eller probitmodellen vanligare.
Latent-variabel formulering
Mer formellt kan LPM härröra från en latent-variabel formulering (som vanligtvis finns i ekonometrisk litteratur, ), enligt följande: anta följande regressionsmodell med en latent (oobserverbar) beroende variabel:
Det kritiska antagandet här är att feltermen för denna regression är en symmetrisk runt noll Uniform slumpvariabel, och därmed medelvärdet noll. Den kumulativa fördelningsfunktionen för här är
Definiera indikatorvariabeln om och noll annars, och beakta den villkorade sannolikheten
Men det här är den linjära sannolikhetsmodellen,
med kartläggningen
Denna metod är en allmän anordning för att erhålla en betingad sannolikhetsmodell av en binär variabel: om vi antar att fördelningen av feltermen är logistisk får vi logitmodellen , medan om vi antar att det är normalen får vi sannolikheten modell och, om vi antar att det är logaritmen för en Weibull-fördelning, den komplementära log-log-modellen .
Se även
Vidare läsning
- Aldrich, John H .; Nelson, Forrest D. (1984). "Den linjära sannolikhetsmodellen" . Linjära sannolikhets-, loggit- och probitmodeller . Salvia. s. 9–29. ISBN 0-8039-2133-0 .
- Amemiya, Takeshi (1985). "Kvalitativa svarsmodeller" . Avancerad ekonometri . Oxford: Basil Blackwell. s. 267–359. ISBN 0-631-13345-3 .
- Wooldridge, Jeffrey M. (2013). "En binär beroende variabel: den linjära sannolikhetsmodellen". Introductory Econometrics: A Modern Approach (5:e internationella upplagan). Mason, OH: Sydvästra. s. 238–243. ISBN 978-1-111-53439-4 .
- Horrace, William C. och Ronald L. Oaxaca. "Resultat på bias och inkonsekvens hos vanliga minsta kvadrater för den linjära sannolikhetsmodellen." Economics Letters, 2006: Vol. 90, s. 321-327