Kvadratisk form (statistik)

I multivariatstatistik , om är en vektor av slumpvariabler och är en -dimensionell symmetrisk matris , då är den skalära kvantiteten är känd som en kvadratisk form i .

Förväntan

Det kan man visa

där och är det förväntade värdet och varians-kovariansmatrisen för respektive, och tr anger spåret av en matris. Detta resultat beror bara på förekomsten av och ; i synnerhet krävs inte normalitet för .

En bokbehandling av ämnet kvadratiska former i slumpvariabler är Mathai och Provost.

Bevis

Eftersom den kvadratiska formen är en skalär storhet, .

Därefter, genom den cykliska egenskapen för spårningsoperatören ,

Eftersom spåroperatorn är en linjär kombination av komponenterna i matrisen, följer det därför av linjäriteten hos förväntansoperatorn att

En standardegenskap för varians säger oss att så är

Om vi ​​tillämpar spårningsoperatörens cykliska egenskap igen, får vi

Varians i det Gaussiska fallet

I allmänhet beror variansen för en kvadratisk form mycket på fördelningen av . Men om följer en multivariat normalfördelning, blir variansen av den kvadratiska formen särskilt lättöverskådlig. Antag för ögonblicket att är en symmetrisk matris. Sedan,

.

I själva verket kan detta generaliseras för att hitta kovariansen mellan två kvadratiska former på samma (återigen, och måste båda vara symmetriska):

.

Dessutom följer en kvadratisk form som denna en generaliserad chi-kvadratfördelning .

Beräknar variansen i det icke-symmetriska fallet

Vissa texter anger felaktigt [ citat behövs ] att ovanstående varians- eller kovariansresultat håller utan att kräva att är symmetrisk. Fallet för allmän kan härledas genom att notera det

är en kvadratisk form i den symmetriska matrisen , så medelvärdet och variansuttrycken är desamma, förutsatt att ersätts med däri.

Exempel på kvadratiska former

I inställningen där man har en uppsättning observationer och en operatormatris , då kan restsumman av kvadrater skrivas som en kvadratisk form i :

För procedurer där matrisen är symmetrisk och idempotent , och felen är Gaussiska med kovariansmatris RSS har en chi-kvadratfördelning med frihetsgrader och icke-centralitetsparameter , där

kan hittas genom att matcha de två första centrala momenten i en icke-central chi-kvadratvariabel med uttrycken som ges i de två första avsnitten. Om uppskattar utan bias , då är icke-centraliteten noll och följer en central chi-kvadratfördelning.

Se även