Uppskattare av högsta poäng

Inom statistik och ekonometri är maximipoängestimatorn en icke-parametrisk skattare för diskreta valmodeller utvecklade av Charles Manski 1975. Till skillnad från multinomial probit och multinomial logit- estimatorer gör den inga antaganden om fördelningen av den oobserverbara delen av nyttan . Dess statistiska egenskaper (särskilt dess asymptotiska distribution ) är dock mer komplicerade än de multinomiala probit- och logitmodellerna, vilket gör statistisk slutledning svår. För att ta itu med dessa problem föreslog Joel Horowitz en variant, kallad den utjämnade maximala poängskattaren.

Miljö

Vid modellering av diskreta valproblem antas det att valet bestäms av jämförelsen av den underliggande latenta nyttan. Beteckna populationen av agenterna som T och den gemensamma valuppsättningen för varje agent som C . För agent , beteckna hennes val som , vilket är lika med 1 om val i är valt och 0 annars. Antag att latent nytta är linjär i de förklarande variablerna och att det finns ett additivt svarsfel . Sedan för en agent ,

displaystyle

där och är de q -dimensionella observerbara kovariaten om agenten och valet, och och är de faktorer som kommer in i agentens beslut som inte observeras av ekonometrikern. Konstruktionen av de observerbara kovariaten är mycket generell. Till exempel, om C är en uppsättning av olika kaffemärken, så inkluderar egenskaperna både hos agenten t , såsom ålder, kön, inkomst och etnicitet, och kaffet i , såsom pris, smak och om det är lokalt eller importerat. Alla feltermer antas iid och vi behöver uppskatta som kännetecknar effekten av olika faktorer på agentens val.

Parametriska estimatorer

Vanligtvis läggs något specifikt fördelningsantagande på feltermen, så att parametern uppskattas parametriskt . Till exempel, om fördelningen av feltermen antas vara normal, så är modellen bara en multinomial probitmodell ; om det antas vara en Gumbel-distribution , så blir modellen en multinomial logit-modell . Den parametriska modellen är bekväm för beräkning men kanske inte är konsekvent när fördelningen av feltermen är felspecificerad.

Binärt svar

Anta till exempel att C bara innehåller två objekt. Detta är den latenta nyttorepresentationen av en binär valmodell . I denna modell är valet: , där är två vektorer av de förklarande kovariaterna, och är iid-svarsfel,

är latent nytta av att välja val 1 och 2. Då kan log likelihood-funktionen ges som:

Om något fördelningsantagande om svarsfelet påtvingas, kommer loggsannolikhetsfunktionen att ha en representation i slutet format. Till exempel, om svarsfelet antas vara fördelat som: , då kan sannolikhetsfunktionen skrivas om som:

där är den kumulativa fördelningsfunktionen (CDF) för standardnormalfördelningen . Här, även om inte har en representation i sluten form, har dess derivata det. Detta är probitmodellen .

Denna modell är baserad på ett fördelningsantagande om svarsfeltermen. Att lägga till ett specifikt distributionsantagande i modellen kan göra modellen beräkningsmässigt trakterbar på grund av förekomsten av den slutna representationen. Men om fördelningen av feltermen är felspecificerad kommer uppskattningarna baserade på fördelningsantagandet att vara inkonsekventa.

Grundtanken med den fördelningsfria modellen är att ersätta de två sannolikhetstermerna i log-likelihood-funktionen med andra vikter. Den allmänna formen av log-likelihood-funktionen kan skrivas som:

Uppskattare av högsta poäng

För att göra estimatorn mer robust mot fördelningsantagandet föreslog Manski (1975) en icke-parametrisk modell för att uppskatta parametrarna. I denna modell, beteckna antalet element i valuppsättningen som J , det totala antalet agenter som N och är en sekvens av reella tal. Maximum Score Estimator definieras som:

Här, är rangordningen av säkerhetsdelen av den underliggande nyttan att välja i . Intuitionen i denna modell är att när rankningen är högre kommer valet att läggas mer vikt på.

Under vissa förhållanden kan den maximala poängskattaren vara svag konsekvent , men dess asymptotiska egenskaper är mycket komplicerade. Denna fråga kommer huvudsakligen från att den objektiva funktionen inte är jämn .

Binärt exempel

I det binära sammanhanget kan skattaren av maximal poäng representeras som:

var

och och är två konstanter i (0,1). Intuitionen med detta viktningsschema är att sannolikheten för valet beror på den relativa ordningen för säkerhetsdelen av verktyget.

Utjämnad uppskattar av maximal poäng

Horowitz (1992) föreslog en utjämnad maximipoäng (SMS) estimator som har mycket bättre asymptotiska egenskaper. Grundidén är att ersätta den icke-utjämnade viktfunktionen med en utjämnad. Definiera en smidig kärnfunktion K som uppfyller följande villkor:

  1. är avgränsad över de reella talen
  2. och

Här är kärnfunktionen analog med en CDF vars PDF är symmetrisk runt 0. Då definieras SMS-uppskattaren som:

där är en sekvens av strikt positiva tal och . Här är intuitionen densamma som i konstruktionen av den traditionella maximipoängskattaren: agenten är mer benägen att välja det val som har den högre observerade delen av latent nytta. Under vissa förhållanden är den utjämnade maximipoängskattaren konsekvent, och ännu viktigare, den har en asymptotisk normalfördelning. Därför kan alla vanliga statistiska tester och slutsatser baserade på asymptotisk normalitet implementeras.

Vidare läsning