Medelkvadrat förutsägelsefel

I statistiken är medelkvadratförutsägelsefelet eller medelkvadratfel för förutsägelserna av en utjämnings- eller kurvanpassningsprocedur det förväntade värdet på kvadratskillnaden mellan de anpassade värdena som impliceras av den förutsägande funktionen $\displaystyle {\widehat {g}} }$ { och värdena för den (ej observerbara) funktionen g . Det är ett omvänt mått på förklaringskraften för ${\widehat {g}},$ och kan användas i processen för korsvalidering av en uppskattad modell.

Om utjämnings- eller anpassningsproceduren har projektionsmatris (dvs hattmatris) L , som mappar de observerade värdena vektor $y$ till förutsagda värden vektor ${\hat {y}}= Ly,$ då

\operatörsnamn {MSPE} (L)=\operatörsnamn {E} \left[\left(g(x_{i})-{\widehat {g}}(x_{i})\right)^{2 }\höger].

MSPE kan delas upp i två termer: medelvärdet av kvadratiska biaser för de anpassade värdena och medelvärdet av varianserna för de anpassade värdena:

n\cdot \operatörsnamn {MSPE} (L)=\summa _{i=1}^{n}\left(\operatörsnamn {E} \left[{\widehat {g}}(x_{i} )\right]-g(x_{i})\right)^{2}+\summa _{i=1}^{n}\operatörsnamn {var} \left[{\widehat {g}}(x_{ i})\right].

Kunskaper om g krävs för att exakt beräkna MSPE; annars kan det uppskattas.

Beräkning av MSPE över out-of-sample data

Medelkvadratförutsägelsefelet kan beräknas exakt i två sammanhang. För det första, med ett dataprov med längden n , kan dataanalytikern köra regressionen över endast q av datapunkterna (med q < n ), och hålla tillbaka de andra n – q datapunkterna med det specifika syftet att använda dem för att beräkna skattade modellens MSPE utanför urvalet (dvs. inte använda data som användes i modelluppskattningsprocessen). Eftersom regressionsprocessen är skräddarsydd för de q in-samplet-punkterna, kommer normalt MSPE i-samplet att vara mindre än den out-of-samplet som beräknas över de n – q kvarhållna punkterna. Om ökningen av MSPE utanför provet jämfört med i provet är relativt liten, resulterar det i att modellen ses positivt. Och om två modeller ska jämföras, ses den med den lägre MSPE över datapunkterna n – q utanför urvalet mer fördelaktigt, oavsett modellernas relativa prestanda i urvalet. MSPE utanför urvalet i detta sammanhang är exakt för de datapunkter utanför urvalet som det beräknades över, men är bara en uppskattning av modellens MSPE för den mestadels oobserverade populationen från vilken data hämtades.

För det andra, med tiden kan mer data bli tillgänglig för dataanalytikern, och sedan kan MSPE beräknas över dessa nya data.

Uppskattning av MSPE över befolkningen

När modellen har uppskattats över alla tillgängliga data utan att någon har hållits tillbaka, kan modellens MSPE över hela populationen av mestadels oobserverade data uppskattas enligt följande.

För modellen $y_{i}=g(x_{i})+\sigma \varepsilon _{i}$ där ${ \displaystyle \varepsilon _{i}\sim {\mathcal {N}}(0,1)} ,$ man kan skriva

n\cdot \operatörsnamn {MSPE} (L)=g^{\text{T}}(IL)^{\text{T}}(IL)g+\sigma ^{2}\operatörsnamn {tr} \left[L^{\text{T}}L\right].

Med hjälp av datavärden i urvalet motsvarar den första termen på höger sida

\sum _{i=1}^{n}\left(\operatörsnamn {E} \left[g(x_{i})-{\widehat {g}}(x_{i})\right] \right)^{2}=\operatörsnamn {E} \left[\sum _{i=1}^{n}\left(y_{i}-{\widehat {g}}(x_{i})\ höger)^{2}\right]-\sigma ^{2}\operatörsnamn {tr} \left[\left(IL\right)^{T}\left(IL\right)\right].

Således,

n\cdot \operatörsnamn {MSPE} (L)=\operatörsnamn {E} \left[\sum _{i=1}^{n}\left(y_{i}-{\widehat {g}} (x_{i})\right)^{2}\right]-\sigma ^{2}\left(n-\operatörsnamn {tr} \left[L\right]\right).

Om $\sigma ^{2}$ är känd eller välskattad av ${\widehat {\sigma }}^{2}$ , blir det möjligt att uppskatta MSPE med

n\cdot \operatörsnamn {\widehat {MSPE}} (L)=\sum _{i=1}^{n}\left(y_{i}-{\widehat {g}}(x_{i })\right)^{2}-{\widehat {\sigma }}^{2}\left(n-\operatörsnamn {tr} \left[L\right]\right).

Colin Mallows förespråkade denna metod i konstruktionen av sin modellvalsstatistik C _p , som är en normaliserad version av den uppskattade MSPE:

C_{p}={\frac {\sum _{i=1}^{n}\left(y_{i}-{\widehat {g}}(x_{i})\right)^{ 2}}{{\widehat {\sigma }}^{2}}}-n+2p.

där p antalet uppskattade parametrar p och ${\widehat {\sigma }}^{2}$ beräknas från den version av modellen som inkluderar alla möjliga regressorer. Det avslutar detta bevis.

Se även

Vidare läsning

Pindyck, Robert S. ; Rubinfeld, Daniel L. (1991). "Prognoser med tidsseriemodeller" . Econometric Models & Economic Forecasts (3:e upplagan). New York: McGraw-Hill. s. 516–535 . ISBN 0-07-050098-3 .

Utvärderingsstatistik för maskininlärning
Regression	MSE · MAE · sMAPE · MAPE · MASE · MSPE · RMS · RMSE/RMSD · R2 · MDA · MAD
Klassificering	F-poäng · P4 · Noggrannhet · Precision · Återkallelse · Kappa · MCC · AUC · ROC · Sensitivitet och specificitet · Logaritmisk förlust
Klustring	Silhouette · Calinski-Harabasz · Davies-Bouldin · Dunn-index · Hopkins-statistik · Jaccard-index · Randindex · Likhetsmått · SMC · SimHash
Ranking	MRR · DCG · NDCG · AP
Datorsyn	PSNR · SSIM · IoU
NLP	Förvirring · BLEU
Deep Learning-relaterade mätvärden	Startpoäng · FID
Rekommendationssystem	Täckning · Intra-list likhet
Likhet	Cosinuslikhet · Euklidiskt avstånd · Pearson korrelationskoefficient
Förvirringsmatris