Multinomial vinst

Inom statistik och ekonometri är den multinomiala probitmodellen en generalisering av probitmodellen som används när det finns flera möjliga kategorier som den beroende variabeln kan falla in i. Som sådan är det ett alternativ till multinomial logit- modellen som en metod för multiklassklassificering . Den ska inte förväxlas med den multivariata probitmodellen , som används för att modellera korrelerade binära utfall för mer än en oberoende variabel.

Allmän specifikation

Det antas att vi har en serie observationer Y i , för i = 1... n , av resultaten av flervägsval från en kategorisk fördelning av storlek m (det finns m möjliga val). Tillsammans med varje observation Y i är en uppsättning av k observerade värden x 1,i , ..., x k,i av förklarande variabler (även kända som oberoende variabler , prediktorvariabler, egenskaper, etc.). Några exempel:

  • De observerade resultaten kan vara "har sjukdom A, har sjukdom B, har sjukdom C, har ingen av sjukdomarna" för en uppsättning sällsynta sjukdomar med liknande symtom, och de förklarande variablerna kan vara egenskaper hos patienterna som anses vara relevanta (kön) , ras, ålder, blodtryck , kroppsmassaindex , närvaro eller frånvaro av olika symtom, etc.).
  • De observerade resultaten är rösterna från personer för ett visst parti eller en kandidat i ett flervägsval, och de förklarande variablerna är de demografiska egenskaperna hos varje person (t.ex. kön, ras, ålder, inkomst, etc.).

Multinomial probit-modellen är en statistisk modell som kan användas för att förutsäga det sannolika resultatet av en oobserverad flervägsförsök givet de tillhörande förklaringsvariablerna. I processen försöker modellen förklara den relativa effekten av olika förklaringsvariabler på de olika utfallen.

Formellt beskrivs utfallen Y i som kategoriskt fördelade data, där varje utfallsvärde h för observation i inträffar med en oobserverad sannolikhet p i,h som är specifik för den aktuella observationen i eftersom det bestäms av värdena för förklarande variabler förknippade med den observationen. Det är:

eller motsvarande

för vart och ett av m möjliga värden på h .

Latent variabel modell

Multinomial probit skrivs ofta i termer av en latent variabel modell :

var

Sedan

Det är,

Observera att denna modell tillåter godtycklig korrelation mellan felvariablerna , så att den inte nödvändigtvis respekterar oberoende av irrelevanta alternativ .

När är identitetsmatrisen (så att det inte finns någon korrelation eller heteroskedasticitet ), kallas modellen independent probit .

Uppskattning

För detaljer om hur ekvationerna uppskattas, se artikeln Probit-modellen .

  •   Greene, William H. (2012). Econometric Analysis (sjunde upplagan). Boston: Pearson Education. s. 810–811. ISBN 978-0-273-75356-8 .