Kärna (statistik)

Termen kärna används i statistisk analys för att referera till en fönsterfunktion . Termen "kärna" har flera distinkta betydelser i olika grenar av statistik.

Bayesiansk statistik

I statistik, särskilt i Bayesiansk statistik , är kärnan i en sannolikhetstäthetsfunktion (pdf) eller sannolikhetsmassfunktion (pmf) formen av pdf eller pmf där alla faktorer som inte är funktioner för någon av variablerna i domänen är utelämnad. [ citat behövs ] Observera att sådana faktorer mycket väl kan vara funktioner av parametrarna för pdf eller pmf. Dessa faktorer utgör en del av normaliseringsfaktorn för sannolikhetsfördelningen och är onödiga i många situationer. Till exempel, vid pseudo-slumptalssampling ignorerar de flesta samplingsalgoritmer normaliseringsfaktorn. Dessutom, i Bayesiansk analys av konjugerade tidigare fördelningar, ignoreras normaliseringsfaktorerna i allmänhet under beräkningarna, och endast kärnan beaktas. I slutet undersöks kärnans form, och om den matchar en känd fördelning kan normaliseringsfaktorn återställas. Annars kan det vara onödigt (till exempel om distributionen bara behöver tas ur).

För många distributioner kan kärnan skrivas i sluten form, men inte normaliseringskonstanten.

Ett exempel är normalfördelningen . Dess sannolikhetstäthetsfunktion är

och den associerade kärnan är

Observera att faktorn framför exponentialen har utelämnats, även om den innehåller parametern eftersom den inte är en funktion av domänvariabeln .

Mönsteranalys

Kärnan i en reproducerande kärna Hilbert-utrymme används i den svit av tekniker som kallas kärnmetoder för att utföra uppgifter som statistisk klassificering , regressionsanalys och klusteranalys av data i ett implicit utrymme. Denna användning är särskilt vanlig inom maskininlärning .

Icke-parametrisk statistik

I icke-parametrisk statistik är en kärna en viktningsfunktion som används i icke-parametriska uppskattningstekniker. Kärnor används vid uppskattning av kärndensitet för att uppskatta slumpvariablernas densitetsfunktioner , eller i kärnregression för att uppskatta den villkorade förväntan av en slumpvariabel . Kärnor används också i tidsserier , i användningen av periodogrammet för att uppskatta den spektrala tätheten där de är kända som fönsterfunktioner . En ytterligare användning är uppskattningen av en tidsvarierande intensitet för en punktprocess där fönsterfunktioner (kärnor) konvolveras med tidsseriedata.

Vanligtvis måste kärnbredder också anges när en icke-parametrisk uppskattning körs.

Definition

En kärna är en icke-negativ realvärd integrerbar funktion K. För de flesta applikationer är det önskvärt att definiera funktionen för att uppfylla två ytterligare krav:

  • Symmetri:

Det första kravet säkerställer att metoden för kärndensitetsuppskattning resulterar i en sannolikhetstäthetsfunktion . Det andra kravet säkerställer att medelvärdet av motsvarande fördelning är lika med det för det använda urvalet.

Om K är en kärna, så är funktionen K * definierad av K *( u ) = λ K u ), där λ > 0. Detta kan användas för att välja en skala som är lämplig för data.

Kärnfunktioner i vanligt bruk

Alla kärnor nedan i ett gemensamt koordinatsystem.

Flera typer av kärnfunktioner används vanligtvis: enhetlig, triangel, Epanechnikov, quartic (biweight), tricube, triweight, Gaussian, kvadratisk och cosinus.

I tabellen nedan, om ges med ett begränsat stöd , då för värden på u som ligger utanför stödet.

Kärnfunktioner, K ( u ) Effektivitet i förhållande till Epanechnikov-kärnan
Uniform ("rektangulärt fönster")

Support:

Kernel uniform.svg

" Lådbilsfunktion "

    92,9 %
Triangulär

Support:

Kernel triangle.svg     98,6 %
Epanechnikov

(parabolisk)

Support:

Kernel epanechnikov.svg     100 %

Quartic (bivikt)

Support:

Kernel quartic.svg     99,4 %
Trevikt

Support:

Kernel triweight.svg     98,7 %
Tricube

Support:

Kernel tricube.svg     99,8 %
Gaussisk Kernel exponential.svg     95,1 %
Cosinus

Support:

Kernel cosine.svg     99,9 %
Logistisk Kernel logistic.svg     88,7 %
Sigmoid funktion Kernel logistic.svg     84,3 %
Silverman kärna Kernel Silverman.svg     inte tillämpbar

Se även

  •   Li, Qi; Racine, Jeffrey S. (2007). Ickeparametrisk ekonometri: teori och praktik . Princeton University Press. ISBN 978-0-691-12161-1 .