Tvåstegs M-skattare
Tvåstegs M-estimatorer hanterar M-uppskattningsproblem som kräver preliminär uppskattning för att erhålla parametern av intresse. Tvåstegs M-uppskattning skiljer sig från vanliga M-uppskattningsproblem eftersom asymptotisk fördelning av andrastegsuppskattaren i allmänhet beror på förstastegsuppskattaren. Att redogöra för denna förändring i asymptotisk distribution är viktigt för giltig slutledning.
Beskrivning
Klassen av tvåstegs M-estimatorer inkluderar Heckmans urvalsuppskattning , viktade icke-linjära minsta kvadrater och vanliga minsta kvadrater med genererade regressorer .
För att fixa idéer, låt vara ett iid -exempel. och är delmängder av euklidiska utrymmen respektive . Givet en funktion tvåstegs M -estimator definieras som:
där är en M-uppskattning av en störningsparameter som måste beräknas i det första steget.
Konsistens hos tvåstegs M-uppskattare kan verifieras genom att kontrollera konsistensförhållandena för vanliga M-uppskattare, även om viss modifiering kan vara nödvändig. I praktiken är det viktiga villkoret att kontrollera identifieringsvillkoret . Om där är en icke-slumpmässig vektor, då identifieringsvillkor är att har en unik maximerare över .
Asymptotisk fördelning
Under regularitetsförhållanden har tvåstegs M-estimatorer asymptotisk normalitet . En viktig punkt att notera är att den asymptotiska variansen för en tvåstegs M-estimator i allmänhet inte är densamma som den för den vanliga M-estimatorn där den första stegsuppskattningen inte är nödvändig. Detta faktum är intuitivt eftersom är ett slumpmässigt objekt och dess variation bör påverka uppskattningen av . Det finns emellertid ett speciellt fall där den asymptotiska variansen av tvåstegs M-skattare tar formen som om det inte fanns något förstastegsuppskattningsprocedur. Sådant specialfall inträffar om:
där är det sanna värdet av och är sannolikhetsgränsen för . För att tolka detta villkor, observera först att under regularitetsförhållanden, eftersom är maximeraren för . Så villkoret ovan antyder att liten störning i γ inte har någon inverkan på första ordningens tillstånd . Således, i ett stort urval, påverkar variabiliteten av inte argmax för den objektiva funktionen, vilket förklarar den invarianta egenskapen för asymptotisk varians. Naturligtvis är detta resultat endast giltigt eftersom urvalsstorleken tenderar till oändlighet, så egenskapen för finita sampel kan vara helt annorlunda.
Involverar MLE
När det första steget är en maximal sannolikhetsestimator , under vissa antaganden, är tvåstegs M-estimator mer asymptotiskt effektiv (dvs. har mindre asymptotisk varians) än M-estimator med känd förstastegsparameter. Konsistens och asymptotisk normalitet hos estimatorn följer av det allmänna resultatet på tvåstegs M-estimatorer.
Låt {V i ,W i ,Z i }
n i=1 vara ett slumpmässigt urval och andrastegs M-estimatorn är följande:
där är parametern som uppskattas av maximal sannolikhet i det första steget. För MLE,
där f är den villkorliga densiteten för V givet Z . Antag nu att givet Z , V är villkorligt oberoende av W. Detta kallas det villkorade oberoende antagandet eller urvalet på observerbara. Intuitivt betyder detta tillstånd att Z är en bra prediktor för V så att V när den väl har betingats på Z inte har något systematiskt beroende av W . Under antagandet om villkorligt oberoende är den asymptotiska variansen för tvåstegsuppskattaren:
var
och ∇ representerar partiell derivata med avseende på en radvektor. I det fall där γ 0 är känd är den asymptotiska variansen
och därför, om inte , tvåstegs M-skattaren är mer effektiv än den vanliga M-skattaren. Detta faktum tyder på att även när γ 0 är känt a priori, finns det en effektivitetsvinst genom att uppskatta γ med MLE. En tillämpning av detta resultat kan hittas till exempel vid uppskattning av behandlingseffekt.
Exempel
- Genererad regressor
- Heckman korrigering
- Möjliga generaliserade minsta kvadrater
- Tvåstegs genomförbar generaliserad metod för ögonblick