Semiparametrisk modell
Inom statistik är en semiparametrisk modell en statistisk modell som har parametriska och icke-parametriska komponenter.
En statistisk modell är en parametriserad familj av distributioner: indexerad av en parameter .
- En parametrisk modell är en modell där indexeringsparametern är en vektor i -dimensionellt euklidiskt rymd , för något icke-negativt heltal . Således ändlig dimensionell, och .
- Med en icke-parametrisk modell är uppsättningen av möjliga värden för parametern en delmängd av något utrymme som inte nödvändigtvis är ändligt dimensionellt. Till exempel kan vi betrakta uppsättningen av alla fördelningar med medelvärdet 0. Sådana utrymmen är vektorrum med topologisk struktur, men kanske inte är ändliga dimensionella som vektorrum. Således, för något möjligen oändligt dimensionellt utrymme .
- Med en semiparametrisk modell har parametern både en ändlig dimensionell komponent och en oändlig dimensionell komponent (ofta en verkligt värderad funktion definierad på den reella linjen). Således, där är ett oändligt dimensionellt utrymme.
Det kan till en början verka som att semiparametriska modeller inkluderar icke-parametriska modeller, eftersom de har en oändlig-dimensionell såväl som en ändlig-dimensionell komponent. En semiparametrisk modell anses dock vara "mindre" än en helt icke-parametrisk modell eftersom vi ofta bara är intresserade av den finita dimensionella komponenten av . Det vill säga, den oändliga dimensionella komponenten betraktas som en störande parameter . I icke-parametriska modeller, däremot, är det primära intresset att uppskatta den oändliga dimensionella parametern. Således är uppskattningsuppgiften statistiskt svårare i icke-parametriska modeller.
Dessa modeller använder ofta utjämning eller kärnor .
Exempel
Ett välkänt exempel på en semiparametrisk modell är Cox proportional hazards-modell . Om vi är intresserade av att studera tiden till en händelse som död på grund av cancer eller fel på en glödlampa, specificerar Cox-modellen följande distributionsfunktion för :
där är kovariatvektorn, och och är okända parametrar. . Här finitdimensionell och är av intresse; är en okänd icke-negativ funktion av tid (känd som baslinjens riskfunktion) och är ofta en störande parameter . Uppsättningen av möjliga kandidater för är oändlig dimensionell.
Se även
Anteckningar
- Bickel, PJ; Klaassen, CAJ; Ritov, Y.; Wellner, JA (1998), Effektiv och adaptiv skattning för semiparametriska modeller , Springer
- Härdle, Wolfgang; Müller, Marlene; Sperlich, Stefan; Werwatz, Axel (2004), Nonparametric and Semiparametric Models , Springer
- Kosorok, Michael R. (2008), Introduktion till empiriska processer och semiparametrisk slutledning , Springer
- Tsiatis, Anastasios A. (2006), Semiparametrisk teori och saknade data , Springer
- Begun, Janet M.; Hall, WJ; Huang, Wei-Min; Wellner, Jon A. (1983), "Information och asymptotisk effektivitet i parametriska--icke-parametriska modeller", Annals of Statistics, 11 (1983), nr. 2, 432-452