Kvadratisk form (statistik)

I multivariatstatistik , om $\varepsilon$ är en vektor av $n$ slumpvariabler och $\Lambda$ är en $n$ -dimensionell symmetrisk matris , då är den skalära kvantiteten $\varepsilon ^{T}\Lambda \varepsilon$ är känd som en kvadratisk form i $\varepsilon$ .

Förväntan

Det kan man visa

\operatörsnamn {E} \left[\varepsilon ^{T}\Lambda \varepsilon \right]=\operatörsnamn {tr} \left[\Lambda \Sigma \right]+\mu ^{T}\Lambda \mu

där $\mu$ och $\Sigma$ är det förväntade värdet och varians-kovariansmatrisen för $\varepsilon$ respektive, och tr anger spåret av en matris. Detta resultat beror bara på förekomsten av $\mu$ och $\Sigma$ ; i synnerhet krävs inte normalitet för $\varepsilon$ .

En bokbehandling av ämnet kvadratiska former i slumpvariabler är Mathai och Provost.

Bevis

Eftersom den kvadratiska formen är en skalär storhet, $\varepsilon ^{T}\Lambda \varepsilon =\operatörsnamn {tr} (\varepsilon ^{T}\Lambda \varepsilon )$ .

Därefter, genom den cykliska egenskapen för spårningsoperatören ,

\operatörsnamn {E} [\operatörsnamn {tr} (\varepsilon ^{T}\Lambda \varepsilon )]=\operatörsnamn {E} [\operatörsnamn {tr} (\Lambda \varepsilon \varepsilon ^{T} )].

Eftersom spåroperatorn är en linjär kombination av komponenterna i matrisen, följer det därför av linjäriteten hos förväntansoperatorn att

\operatörsnamn {E} [\operatörsnamn {tr} (\Lambda \varepsilon \varepsilon ^{T})]=\operatörsnamn {tr} (\Lambda \operatörsnamn {E} (\varepsilon \varepsilon ^{T} ))

En standardegenskap för varians säger oss att så är

\operatörsnamn {tr} (\Lambda (\Sigma +\mu \mu ^{T})).

Om vi tillämpar spårningsoperatörens cykliska egenskap igen, får vi

\operatörsnamn {tr} (\Lambda \Sigma )+\operatörsnamn {tr} (\Lambda \mu \mu ^{T})=\operatörsnamn {tr} (\Lambda \Sigma )+\operatörsnamn {tr} (\mu ^{T}\Lambda \mu )=\operatörsnamn {tr} (\Lambda \Sigma )+\mu ^{T}\Lambda \mu .

Varians i det Gaussiska fallet

I allmänhet beror variansen för en kvadratisk form mycket på fördelningen av $\varepsilon$ . Men om $\varepsilon$ följer en multivariat normalfördelning, blir variansen av den kvadratiska formen särskilt lättöverskådlig. Antag för ögonblicket att $\Lambda$ är en symmetrisk matris. Sedan,

\operatorname {var} \left[\varepsilon ^{T}\Lambda \varepsilon \right] =2\operatörsnamn {tr} \left[\Lambda \Sigma \Lambda \Sigma \right]+4\mu ^{T}\Lambda \Sigma \Lambda \mu

.

I själva verket kan detta generaliseras för att hitta kovariansen mellan två kvadratiska former på samma $\varepsilon$ (återigen, $\Lambda _{1}$ och $\Lambda _ {2}$ måste båda vara symmetriska):

\psivare \psivareft[cov} ^{T}\Lambda _{1}\varepsilon ,\varepsilon ^{T}\Lambda _{2}\varepsilon \right]=2\operatörsnamn {tr} \left[\Lambda _{1}\Sigma \Lambda _{2}\Sigma \right]+4\mu ^{T}\Lambda _{1}\Sigma \Lambda _{2}\mu

.

Dessutom följer en kvadratisk form som denna en generaliserad chi-kvadratfördelning .

Beräknar variansen i det icke-symmetriska fallet

Vissa texter anger felaktigt ^{[ citat behövs ]} att ovanstående varians- eller kovariansresultat håller utan att kräva att $\Lambda$ är symmetrisk. Fallet för allmän $\Lambda$ kan härledas genom att notera det

\varepsilon ^{T}\Lambda ^{T}\varepsilon =\varepsilon ^{T}\Lambda \varepsilon

så

\varepsilon ^{T}{\tilde {\Lambda }}\varepsilon =\varepsilon ^{T}\left(\Lambda +\ Lambda ^{T}\right)\varepsilon /2

är en kvadratisk form i den symmetriska matrisen ${\tilde {\Lambda }}=\left(\Lambda +\Lambda ^{T}\right)/2$ , så medelvärdet och variansuttrycken är desamma, förutsatt att $\Lambda$ ersätts med ${\tilde {\Lambda }}$ däri.

Exempel på kvadratiska former

I inställningen där man har en uppsättning observationer $y$ och en operatormatris $H$ , då kan restsumman av kvadrater skrivas som en kvadratisk form i $y$ :

{\textrm {RSS}}=y^{T}(IH)^{T}(IH)y.

För procedurer där matrisen $H$ är symmetrisk och idempotent , och felen är Gaussiska med kovariansmatris ${\displaystyle \sigma ^{2}I} ,$ RSS $\displaystyle {\textrm { RSS}}/\sigma ^{2}}$ har en chi-kvadratfördelning med $k$ frihetsgrader och icke-centralitetsparameter $\lambda$ , där

k=\operatörsnamn {tr} \left[(IH)^{T}(IH)\right]

\lambda =\mu ^{T}(IH)^{T}(IH)\mu /2

kan hittas genom att matcha de två första centrala momenten i en icke-central chi-kvadratvariabel med uttrycken som ges i de två första avsnitten. Om $Hy$ uppskattar $\mu$ utan bias , då är icke-centraliteten $\lambda$ noll och ${\textrm {RSS}}/\sigma ^{2}$ följer en central chi-kvadratfördelning.

Se även