Beställde logit

Inom statistik är den ordnade logitmodellen (även beställd logistisk regression eller proportionell oddsmodell ) en ordinal regressionsmodell - det vill säga en regressionsmodell för ordinalberoende variabler - som först betraktades av Peter McCullagh . Till exempel, om en fråga i en undersökning ska besvaras med ett val mellan "dålig", "rättvis", "bra", "mycket bra" och "utmärkt", och syftet med analysen är att se hur väl det svar kan förutsägas av svaren på andra frågor, av vilka några kan vara kvantitativa, sedan kan ordnad logistisk regression användas. Det kan ses som en förlängning av den logistiska regressionsmodellen som gäller dikotoma beroende variabler, som tillåter mer än två (ordnade) svarskategorier.

Modellen och det proportionella oddsantagandet

Modellen gäller endast för data som uppfyller antagandet om proportionella odds , vars innebörd kan exemplifieras enligt följande. Anta att det finns fem resultat: "dåligt", "rättvist", "bra", "mycket bra" och "utmärkt". Vi antar att sannolikheterna för dessa utfall ges av p ₁ ( x ), p ₂ ( x ), p ₃ ( x ), p ₄ ( x ), p ₅ ( x ), som alla är funktioner av någon oberoende variabel (s) x . Sedan, för ett fast värde på x, är logaritmerna för oddsen (inte logaritmerna för sannolikheterna) för att svara på vissa sätt:

{ \begin{array}{rll}{\text{dålig}}:&\log {\frac {p_{1}(x)}{p_{2}(x)+p_{3}(x)+p_{ 4}(x)+p_{5}(x)}},\\[8pt]{\text{dålig eller rättvis}}:&\log {\frac {p_{1}(x)+p_{2} (x)}{p_{3}(x)+p_{4}(x)+p_{5}(x)}},\\[8pt]{\text{dålig, lagom eller bra}}:& \log {\frac {p_{1}(x)+p_{2}(x)+p_{3}(x)}{p_{4}(x)+p_{5}(x)}},\ \[8pt]{\text{dålig, rättvis, bra eller mycket bra}}:&\log {\frac {p_{1}(x)+p_{2}(x)+p_{3}(x) +p_{4}(x)}{p_{5}(x)}}\end{array}}

om proportionella odds säger att talen som läggs till var och en av dessa logaritmer för att få nästa är desamma oavsett x . Med andra ord, skillnaden mellan logaritmen för oddsen att ha dålig eller rättvis hälsa minus logaritmen för att ha dålig hälsa är densamma oavsett x ; på liknande sätt är logaritmen för oddsen att ha dålig, rättvis eller god hälsa minus logaritmen för att ha dålig eller rättvis hälsa densamma oavsett x ; etc.

Exempel på svarskategorier med flera ordningar inkluderar obligationsbetyg, opinionsundersökningar med svar som sträcker sig från "instämmer starkt" till "håller inte med", nivåer på statliga utgifter för statliga program (hög, medel eller låg), den valda försäkringsskyddsnivån ( ingen, delvis eller helt), och anställningsstatus (inte anställd, deltidsanställd eller helt anställd).

Ordnad logit kan härledas från en latent-variabel modell, liknande den från vilken binär logistisk regression kan härledas. Antag att den underliggande processen som ska karakteriseras är

y^{*}=\mathbf {x} ^{\mathsf {T}}\beta +\varepsilon ,\,

där $y^{*}$ är en oobserverad beroende variabel (kanske den exakta nivån av överensstämmelse med påståendet som föreslagits av enkätaren); $\mathbf {x}$ är vektorn för oberoende variabler; $\varepsilon$ är feltermen , som antas följa en standardlogistisk fördelning; och $\beta$ är vektorn av regressionskoefficienter som vi vill uppskatta. Anta vidare att även om vi inte kan observera $y^{*}$ , kan vi istället bara observera svarskategorierna

= {\begin style y }0&{\text{if }}y^{*}\leq \mu _{1},\\1&{\text{if }}\mu _{1}<y^{*}\leq \mu _ {2},\\2&{\text{if }}\mu _{2}<y^{*}\leq \mu _{3},\\\vdots \\N&{\text{if }}\ mu _{N}<y^{*}\end{cases}}}

där parametrarna $\mu _{i}$ är de externt pålagda slutpunkterna för de observerbara kategorierna. Sedan kommer den ordnade logittekniken att använda observationerna på y , som är en form av censurerad data på y* , för att passa parametervektorn $\beta$ .

Uppskattning

För detaljer om hur ekvationen uppskattas, se artikeln Ordinal regression .

Se även

Vidare läsning

Gelman, Andrew; Hill, Jennifer (2007). Dataanalys med hjälp av regression och flernivå-/hierarkiska modeller . New York: Cambridge University Press. s. 119–124. ISBN 978-0-521-68689-1 .
Hardin, James; Hilbe, Joseph (2007). Generaliserade linjära modeller och tillägg (2:a upplagan). College Station: Stata Press. ISBN 978-1-59718-014-6 .
Woodward, Mark (2005). Epidemiologi: Studiedesign och dataanalys (2:a uppl.). Chapman & Hall/CRC. ISBN 978-1-58488-415-6 .
Wooldridge, Jeffrey (2010). Ekonometrisk analys av tvärsnitts- och paneldata (andra upplagan). Cambridge: MIT Press. s. 643–666. ISBN 978-0-262-23258-6 .

externa länkar

Simon, Steve (2004-09-22). "Samplestorlek för ett ordinärt resultat" . STATISTIK − Steves försök att lära ut statistik . Hämtad 2014-08-22 .
Rodríguez, German. "Beställda Logit-modeller" . Princeton University .