Bråkdel av variansen oförklarad

Inom statistik är variansfraktionen oförklarad ( FVU ) i sammanhanget av en regressionsuppgift den variansandel av regressen och (beroende variabeln) Y som inte kan förklaras, dvs. som inte är korrekt förutspådd, av de förklarande variablerna X .

Formell definition

Antag att vi får en regressionsfunktion som ger för varje en uppskattning där är vektorn för de i : te observationerna på alla förklarande variabler. Vi definierar fraktionen av variansen oförklarad (FVU) som:

där R 2 är bestämningskoefficienten och VAR err och VAR tot är variansen av residualerna och urvalsvariansen för den beroende variabeln. SS err (summan av kvadrerade prediktionsfel, ekvivalent restsumman av kvadrater ), SS tot ( totalsumman av kvadrater ) och SS reg (summan av kvadraterna av regressionen, ekvivalent den förklarade summan av kvadrater ) ges av

Alternativt kan den oförklarade variansfraktionen definieras enligt följande:

där MSE( f ) är medelkvadratfelet för regressionsfunktionen ƒ .

Förklaring

Det är användbart att överväga den andra definitionen för att förstå FVU. När vi försöker förutsäga Y , är den mest naiva regressionsfunktionen vi kan tänka oss den konstanta funktionen som förutsäger medelvärdet av Y , dvs. . Det följer att MSE för denna funktion är lika med variansen av Y ; det vill säga SS err = SS tot och SS reg = 0. I det här fallet kan ingen variation i Y redovisas, och FVU har då sitt maximala värde på 1.

Mer generellt kommer FVU att vara 1 om de förklarande variablerna X inte säger oss något om Y i den meningen att de förutsagda värdena för Y inte samvarierar med Y . Men eftersom förutsägelsen blir bättre och MSE kan minskas, går FVU ner. I fallet med perfekt förutsägelse där för alla i , är MSE 0, SS fel = 0, SS reg = SS tot och FVU är 0.

Se även