Empirisk sannolikhet
Empirisk sannolikhet (EL) är en icke-parametrisk metod som kräver färre antaganden om felfördelningen samtidigt som man behåller några av fördelarna med sannolikhetsbaserad slutledning. Uppskattningsmetoden kräver att data är oberoende och identiskt fördelade (iid). Det fungerar bra även när distributionen är asymmetrisk eller censurerad. EL-metoder kan också hantera begränsningar och tidigare information om parametrar. Art Owen var pionjär inom detta område med sitt papper från 1988.
Uppskattningsförfarande
EL-uppskattningar beräknas genom att maximera den empiriska sannolikhetsfunktionen med förbehåll för begränsningar baserat på skattningsfunktionen och det triviala antagandet att sannolikhetsvikterna för sannolikhetsfunktionen summerar till 1. Denna procedur representeras som:
omfattas av begränsningarna
- förtydligande behövs ]
Värdet på theta-parametern kan hittas genom att lösa Lagrangian-funktionen
Det finns en tydlig analogi mellan detta maximeringsproblem och det som lösts för maximal entropi .
Den empiriska sannolikhetsmetoden kan också användas för diskreta distributioner :
var
Då är sannolikheten kallas en empirisk sannolikhet.
Empiriskt sannolikhetsförhållande (ELR)
En empirisk sannolikhetskvotsfunktion definieras och används för att erhålla konfidensintervallparameter av intresse θ som liknar parametriska sannolikhetskvotskonfidensintervall. Låt L(F) vara den empiriska sannolikheten för funktionen , då skulle ELR vara:
.
Överväg uppsättningar av formuläret
.
Under sådana förhållanden förkastar ett test av när t inte tillhör , det vill säga när ingen fördelning F med har sannolikhet .
Det centrala resultatet är för medelvärdet av X. Det är uppenbart att vissa begränsningar för behövs, annars behövs närhelst . För att se detta, låt:
Om är tillräckligt liten och , då är .
Men då, eftersom sträcker sig genom , så gör också medelvärdet av och spårar ut . Problemet kan lösas genom att begränsa till distributioner F som stöds i en begränsad uppsättning. Det visar sig vara möjligt att begränsa uppmärksamheten t distributioner med stöd i urvalet, med andra ord till fördelningen . En sådan metod är bekväm eftersom statistikern kanske inte är villig att specificera ett begränsat stöd för och eftersom omvandlar konstruktionen av till ett ändligt dimensionellt problem.
Andra applikationer
Användningen av empirisk sannolikhet är inte begränsad till konfidensintervall. Vid kvantiluppskattning hjälper en EL-baserad kategoriseringsprocedur att bestämma formen på den sanna diskreta fördelningen på nivå p, och ger också ett sätt att formulera en konsekvent skattare. Dessutom kan EL användas i stället för parametrisk sannolikhet för att bilda modellvalskriterier .