Betyder absolut fel
I statistik är genomsnittligt absolut fel ( MAE ) ett mått på fel mellan parade observationer som uttrycker samma fenomen. Exempel på Y mot X inkluderar jämförelser av förutspådd kontra observerad, efterföljande tid mot initial tid, och en mätteknik kontra en alternativ mätteknik. MAE beräknas som summan av absoluta fel dividerat med urvalsstorleken :
Oenighet om kvantitet och oenighet om tilldelning
Det är möjligt att uttrycka MAE som summan av två komponenter: Oenighet om kvantitet och Oenighet om allokering. Kvantitetsskillnad är det absoluta värdet av medelfelet som ges av:
Oenighet om allokering är MAE minus Oenighet om kvantitet.
Det är också möjligt att identifiera olika typer av skillnader genom att titta på en plot. Kvantitetsskillnad föreligger när medelvärdet av X-värdena inte är lika med medelvärdet av Y-värdena. Tilldelningsskillnad finns om och endast om punkter finns på båda sidor om identitetslinjen.
Relaterade åtgärder
Det genomsnittliga absoluta felet är ett av flera sätt att jämföra prognoser med deras slutliga utfall. Väletablerade alternativ är det genomsnittliga absoluta skalade felet (MASE) och det genomsnittliga kvadratiska felet . Dessa sammanfattar alla prestanda på sätt som bortser från riktningen för över- eller underförutsägelser; ett mått som lägger tonvikt på detta är medelvärdet för teckenskillnaden .
När en prediktionsmodell ska anpassas med ett valt prestandamått, i den meningen att minsta kvadratmetoden är relaterad till medelkvadratfelet , är ekvivalenten för genomsnittligt absolut fel minsta absoluta avvikelser .
MAE är inte identisk med root-mean square error (RMSE), även om vissa forskare rapporterar och tolkar det så. MAE är begreppsmässigt enklare och också lättare att tolka än RMSE: det är helt enkelt det genomsnittliga absoluta vertikala eller horisontella avståndet mellan varje punkt i ett spridningsdiagram och Y=X-linjen. Med andra ord är MAE den genomsnittliga absoluta skillnaden mellan X och Y. Dessutom bidrar varje fel till MAE i proportion till felets absoluta värde. Detta till skillnad från RMSE som innebär att kvadrera skillnaderna, så att några få stora skillnader ökar RMSE i högre grad än MAE. Se exemplet ovan för en illustration av dessa skillnader.
Optimalitetsegenskap
Det genomsnittliga absoluta felet för en reell variabel c med avseende på den slumpmässiga variabeln X är
Mer generellt definieras en median som ett minimum av
Denna optimeringsbaserade definition av medianen är användbar vid statistisk dataanalys, till exempel vid k -medianklustring .
Bevis på optimalitet
Påstående: Klassificeraren som minimerar är .
Bevis:
Förlustfunktionerna för klassificering är
Differentiera med avseende på en ger
Detta betyder
Därav