Villkorlig avvikelse

I sannolikhetsteori och statistik är en betingad varians variansen av en slumpvariabel givet värdet/värdena av en eller flera andra variabler. Särskilt inom ekonometri är den villkorliga variansen också känd som den skedastiska funktionen eller skedastiska funktionen . Villkorliga varianser är viktiga delar av autoregressiv villkorlig heteroskedasticitet ( ARCH) modeller.

Definition

Den villkorliga variansen för en slumpvariabel Y givet en annan slumpvariabel X är

Den villkorliga variansen talar om för oss hur mycket varians som finns kvar om vi använder för att "förutsäga" Y . Här, som vanligt, för den villkorliga förväntan av Y givet X , som vi kanske minns, är en slumpvariabel i sig (en funktion) av X , bestämt upp till sannolikhet ett). Som ett resultat är i sig en slumpvariabel (och är en funktion av X ).

Förklaring, relation till minsta kvadrater

Kom ihåg att varians är den förväntade kvadratiska avvikelsen mellan en slumpvariabel (säg Y ) och dess förväntade värde. Det förväntade värdet kan ses som en rimlig förutsägelse av resultaten av det slumpmässiga experimentet (särskilt det förväntade värdet är den bästa konstanta förutsägelsen när förutsägelser bedöms med förväntat kvadrerat prediktionsfel). En tolkning av variansen är alltså att den ger minsta möjliga förväntade kvadratiska prediktionsfel. Om vi ​​har kunskap om en annan slumpvariabel ( X ) som vi kan använda för att förutsäga Y , kan vi potentiellt använda denna kunskap för att minska det förväntade kvadratiska felet. Som det visar sig är den bästa förutsägelsen av Y givet X den villkorade förväntan. Speciellt för alla mätbara,

Genom att välja blir den andra, icke-negativa termen noll, vilket visar påståendet. Här använde den andra jämlikheten lagen om total förväntan . Vi ser också att den förväntade villkorliga variansen för Y givet X visar sig som det irreducibla felet att förutsäga Y endast givet kunskapen om X .

Specialfall, variationer

Konditionering på diskreta slumpvariabler

När X antar räknebara många värden med positiv sannolikhet, dvs det är en diskret slumpvariabel , kan vi introducera , den villkorliga variansen för Y givet att X=x för alla x från S enligt följande:

där minns att är den villkorade förväntan av Z givet att X=x , vilket är väldefinierat för . En alternativ notation för är

Observera att här definierar en konstant för möjliga värden på x , och i synnerhet , är inte en slumpvariabel.

Kopplingen av denna definition till är som följer: Låt S vara som ovan och definiera funktionen som . Då nästan säkert .

Definition med villkorliga distributioner

Den "villkorliga förväntan på Y givet X=x " kan också definieras mer generellt med hjälp av den villkorliga fördelningen av Y givet X (detta finns i det här fallet, eftersom både här X och Y är realvärderade).

I synnerhet låter vara den (reguljära) villkorliga fördelningen av Y givet X , dvs att nästan säkert över stödet av X ), kan vi definiera

Detta kan naturligtvis specialiseras till när Y är diskret själv (ersätter integralerna med summor), och även när den villkorliga tätheten för Y givet X=x med avseende på någon underliggande fördelning existerar.

Komponenter av varians

Lagen om total varians säger

Med ord: variansen av Y är summan av den förväntade villkorliga variansen av Y givet X och variansen av den villkorliga förväntan av Y givet X . Den första termen fångar variationen som lämnas efter "användning av X för att förutsäga Y ", medan den andra termen fångar variationen på grund av medelvärdet av förutsägelsen av Y på grund av slumpmässigheten hos X .

Se även

Vidare läsning