Kärna (statistik)
Termen kärna används i statistisk analys för att referera till en fönsterfunktion . Termen "kärna" har flera distinkta betydelser i olika grenar av statistik.
Bayesiansk statistik
I statistik, särskilt i Bayesiansk statistik , är kärnan i en sannolikhetstäthetsfunktion (pdf) eller sannolikhetsmassfunktion (pmf) formen av pdf eller pmf där alla faktorer som inte är funktioner för någon av variablerna i domänen är utelämnad. [ citat behövs ] Observera att sådana faktorer mycket väl kan vara funktioner av parametrarna för pdf eller pmf. Dessa faktorer utgör en del av normaliseringsfaktorn för sannolikhetsfördelningen och är onödiga i många situationer. Till exempel, vid pseudo-slumptalssampling ignorerar de flesta samplingsalgoritmer normaliseringsfaktorn. Dessutom, i Bayesiansk analys av konjugerade tidigare fördelningar, ignoreras normaliseringsfaktorerna i allmänhet under beräkningarna, och endast kärnan beaktas. I slutet undersöks kärnans form, och om den matchar en känd fördelning kan normaliseringsfaktorn återställas. Annars kan det vara onödigt (till exempel om distributionen bara behöver tas ur).
För många distributioner kan kärnan skrivas i sluten form, men inte normaliseringskonstanten.
Ett exempel är normalfördelningen . Dess sannolikhetstäthetsfunktion är
och den associerade kärnan är
Observera att faktorn framför exponentialen har utelämnats, även om den innehåller parametern eftersom den inte är en funktion av domänvariabeln .
Mönsteranalys
Kärnan i en reproducerande kärna Hilbert-utrymme används i den svit av tekniker som kallas kärnmetoder för att utföra uppgifter som statistisk klassificering , regressionsanalys och klusteranalys av data i ett implicit utrymme. Denna användning är särskilt vanlig inom maskininlärning .
Icke-parametrisk statistik
I icke-parametrisk statistik är en kärna en viktningsfunktion som används i icke-parametriska uppskattningstekniker. Kärnor används vid uppskattning av kärndensitet för att uppskatta slumpvariablernas densitetsfunktioner , eller i kärnregression för att uppskatta den villkorade förväntan av en slumpvariabel . Kärnor används också i tidsserier , i användningen av periodogrammet för att uppskatta den spektrala tätheten där de är kända som fönsterfunktioner . En ytterligare användning är uppskattningen av en tidsvarierande intensitet för en punktprocess där fönsterfunktioner (kärnor) konvolveras med tidsseriedata.
Vanligtvis måste kärnbredder också anges när en icke-parametrisk uppskattning körs.
Definition
En kärna är en icke-negativ realvärd integrerbar funktion K. För de flesta applikationer är det önskvärt att definiera funktionen för att uppfylla två ytterligare krav:
- Symmetri:
Det första kravet säkerställer att metoden för kärndensitetsuppskattning resulterar i en sannolikhetstäthetsfunktion . Det andra kravet säkerställer att medelvärdet av motsvarande fördelning är lika med det för det använda urvalet.
Om K är en kärna, så är funktionen K * definierad av K *( u ) = λ K (λ u ), där λ > 0. Detta kan användas för att välja en skala som är lämplig för data.
Kärnfunktioner i vanligt bruk
Flera typer av kärnfunktioner används vanligtvis: enhetlig, triangel, Epanechnikov, quartic (biweight), tricube, triweight, Gaussian, kvadratisk och cosinus.
I tabellen nedan, om ges med ett begränsat stöd , då för värden på u som ligger utanför stödet.
Kärnfunktioner, K ( u ) | Effektivitet i förhållande till Epanechnikov-kärnan | ||||
---|---|---|---|---|---|
Uniform ("rektangulärt fönster") |
Support: |
" Lådbilsfunktion " |
92,9 % | ||
Triangulär |
Support: |
98,6 % | |||
Epanechnikov (parabolisk) |
Support: |
100 % | |||
Quartic (bivikt) |
Support: |
99,4 % | |||
Trevikt |
Support: |
98,7 % | |||
Tricube |
Support: |
99,8 % | |||
Gaussisk | 95,1 % | ||||
Cosinus |
Support: |
99,9 % | |||
Logistisk | 88,7 % | ||||
Sigmoid funktion | 84,3 % | ||||
Silverman kärna | inte tillämpbar |
Se även
- Uppskattning av kärndensitet
- Kärnan mjukare
- Stokastisk kärna
- Positivt-definierad kärna
- Densitetsuppskattning
- Multivariat kärndensitetsuppskattning
- Li, Qi; Racine, Jeffrey S. (2007). Ickeparametrisk ekonometri: teori och praktik . Princeton University Press. ISBN 978-0-691-12161-1 .
- Zucchini, Walter. "TILLÄMPAD UTLÄTTNINGSTEKNIK Del 1: Uppskattning av kärndensitet" (PDF) . Hämtad 6 september 2018 .
- Comaniciu, D; Meer, P (2002). "Mean shift: A robust approach to feature space analysis". IEEE-transaktioner på mönsteranalys och maskinintelligens . 24 (5): 603–619. CiteSeerX 10.1.1.76.8968 . doi : 10.1109/34.1000236 .