Konsistens (statistik)

Inom statistik är konsekvensen av procedurer, som att beräkna konfidensintervall eller utföra hypotestest , en önskad egenskap hos deras beteende eftersom antalet objekt i datamängden som de tillämpas på ökar i det oändliga . I synnerhet kräver konsekvens att resultatet av proceduren med obegränsad data ska identifiera den underliggande sanningen. Användningen av termen i statistik kommer från Sir Ronald Fisher 1922.

Användningen av termerna konsekvent och konsekvent i statistik är begränsad till fall där i huvudsak samma procedur kan tillämpas på valfritt antal dataposter. I komplicerade tillämpningar av statistik kan det finnas flera sätt på vilka antalet dataposter kan växa. Till exempel kan rekord för nederbörd inom ett område öka på tre sätt: rekord för ytterligare tidsperioder; register för ytterligare platser med ett fast område; register för extra platser som erhållits genom att utöka områdets storlek. I sådana fall kan egenskapen konsistens begränsas till ett eller flera av de möjliga sätten att en urvalsstorlek kan växa.

Uppskattare

En konsekvent estimator är en för vilken, när uppskattningen betraktas som en slumpmässig variabel indexerad med antalet n poster i datamängden, när n ökar skattningarna konvergerar i sannolikhet till det värde som skattaren är designad att uppskatta.

En estimator som har Fisher-konsistens är en för vilken, om estimatorn tillämpades på hela populationen snarare än ett urval, det sanna värdet av den uppskattade parametern skulle erhållas.

Tester

Ett konsekvent test är ett där testets styrka för en fast osann hypotes ökar till ett när antalet dataobjekt ökar.

Klassificering

I statistisk klassificering är en konsekvent klassificerare en för vilken sannolikheten för korrekt klassificering, givet en träningsuppsättning, närmar sig, när storleken på träningsuppsättningen ökar, den bästa sannolikheten som är teoretiskt möjlig om populationsfördelningarna var fullt kända.

Sparsamhet

Låt vara en vektor och definiera stödet där är det :e elementet i . Låt vara en estimerare för . Då är sparsistens egenskapen att stödet från estimatorn konvergerar till det sanna stödet när antalet sampel växer till oändlighet. Mer formellt, som . [ bättre källa behövs ]

Se även