Felkorrigeringsmodell

En felkorrigeringsmodell ( ECM ) tillhör en kategori av multipla tidsseriemodeller som oftast används för data där de underliggande variablerna har en långvarig gemensam stokastisk trend, även känd som kointegration . ECM är ett teoretiskt styrt tillvägagångssätt som är användbart för att uppskatta både kortsiktiga och långsiktiga effekter av en tidsserie på en annan. Termen felkorrigering avser det faktum att den senaste periodens avvikelse från en långsiktig jämvikt, felet , påverkar dess kortsiktiga dynamik. Således uppskattar ECM direkt den hastighet med vilken en beroende variabel återgår till jämvikt efter en förändring i andra variabler.

Historia

Yule (1926) och Granger och Newbold (1974) var de första som uppmärksammade problemet med falsk korrelation och hittade lösningar på hur man skulle ta itu med det i tidsserieanalys. Med tanke på två helt orelaterade men integrerade (icke-stationära) tidsserier, regressionsanalysen av den ena på den andra att tendera att producera ett till synes statistiskt signifikant samband och således kan en forskare felaktigt tro att ha hittat bevis på ett sant samband mellan dessa variabler. Vanliga minsta kvadrater kommer inte längre att vara konsekventa och vanlig teststatistik kommer att vara ogiltig. I synnerhet Monte Carlo-simuleringar visar att man kommer att få en mycket hög R-kvadrat , mycket hög individuell t-statistik och en låg Durbin-Watson-statistik . Tekniskt sett bevisade Phillips (1986) att parameteruppskattningar inte kommer att konvergera i sannolikhet , skärningen kommer att divergera och lutningen kommer att ha en icke-degenererad fördelning när urvalsstorleken ökar . Det kan dock finnas en gemensam stokastisk trend för båda serierna som en forskare är genuint intresserad av eftersom det återspeglar ett långsiktigt samband mellan dessa variabler.

På grund av trendens stokastiska karaktär är det inte möjligt att dela upp integrerade serier i en deterministisk (förutsägbar) trend och en stationär serie som innehåller trendavvikelser. Även i deterministiskt detrenderade slumpmässiga promenader kommer falska korrelationer så småningom att uppstå. Avskräckning löser alltså inte uppskattningsproblemet.

För att fortfarande använda Box–Jenkins-metoden skulle man kunna skilja serierna och sedan uppskatta modeller som ARIMA , med tanke på att många vanliga tidsserier (t.ex. inom ekonomi) verkar vara stationära i första skillnader. Prognoser från en sådan modell kommer fortfarande att spegla cykler och säsongsvariationer som finns i data. All information om långsiktiga justeringar som data i nivåer kan innehålla utelämnas dock och långsiktiga prognoser kommer att vara opålitliga.

Detta ledde till att Sargan (1964) utvecklade ECM-metoden, som behåller nivåinformationen.

Uppskattning

Flera metoder är kända i litteraturen för att uppskatta en förfinad dynamisk modell som beskrivits ovan. Bland dessa är Engle och Granger 2-stegs tillvägagångssätt, som uppskattar deras ECM i ett steg och den vektorbaserade VECM med Johansens metod .

Engle och Granger 2-stegs strategi

Det första steget i denna metod är att förtesta de individuella tidsserier man använder för att bekräfta att de är icke-stationära i första hand. Detta kan göras genom standardenhetsrot - DF-testning och ADF-test (för att lösa problemet med seriellt korrelerade fel). Ta fallet med två olika serier och . Om båda är I(0) kommer standardregressionsanalys att vara giltig. Om de är integrerade av en annan ordning, t.ex. en är I(1) och den andra är I(0), måste man transformera modellen.

Om de båda är integrerade i samma ordning (vanligen I(1)), kan vi uppskatta en ECM-modell av formuläret

Om båda variablerna är integrerade och denna ECM existerar, samintegreras de av Engle–Granger-representationssatsen.

Det andra steget är sedan att uppskatta modellen med hjälp av vanliga minsta kvadrater : Om regressionen inte är falsk enligt testkriterier som beskrivs ovan, kommer vanliga minsta kvadrater inte bara att vara giltiga, utan faktiskt superkonsekventa ( Stock, 1987). Då de förutsagda residualerna från denna regression sparas och används i en regression av differentierade variabler plus en fördröjd felterm

Man kan sedan testa för kointegration med hjälp av en standard t-statistik . Även om detta tillvägagångssätt är lätt att tillämpa, finns det dock många problem:

  • De univariata enhetsrottesterna som används i det första steget har låg statistisk kraft
  • Valet av beroende variabel i det första steget påverkar testresultaten, dvs vi behöver svag exogenitet för som bestäms av Granger-kausalitet
  • Man kan potentiellt ha en liten provbias
  • Samintegreringstestet på följer inte en standardfördelning
  • Giltigheten av långtidsparametrarna i det första regressionssteget där man erhåller residualerna kan inte verifieras eftersom fördelningen av OLS-estimatorn för den samintegrerande vektorn är mycket komplicerad och icke-normal
  • Som mest kan ett samintegrerande förhållande undersökas. [ citat behövs ]

VECM

Engle–Granger-metoden som beskrivs ovan lider av ett antal svagheter. Den är nämligen begränsad till endast en enstaka ekvation med en variabel betecknad som den beroende variabeln, förklarad av en annan variabel som antas vara svagt exogen för parametrarna av intresse. Den förlitar sig också på att förtesta tidsserien för att ta reda på om variabler är I(0) eller I(1). Dessa svagheter kan åtgärdas genom att använda Johansens förfarande. Dess fördelar inkluderar att förtestning inte är nödvändig, det kan finnas många samintegrerande samband, alla variabler behandlas som endogena och tester relaterade till långtidsparametrarna är möjliga. Den resulterande modellen är känd som en vektorfelskorrigeringsmodell (VECM), eftersom den lägger till felkorrigeringsfunktioner till en multifaktormodell som kallas vektorautoregression (VAR). Proceduren görs enligt följande:

  • Steg 1: uppskatta en obegränsad VAR som involverar potentiellt icke-stationära variabler
  • Steg 2: Testa för kointegration med Johansen test
  • Steg 3: Forma och analysera VECM.

Ett exempel på ECM

Idén om samintegration kan demonstreras i en enkel makroekonomisk miljö. Antag att konsumtion och disponibel inkomst är makroekonomiska tidsserier som är relaterade på lång sikt (se Permanent inkomsthypotes ) . Specifikt, låt den genomsnittliga konsumtionsbenägenheten vara 90 %, det vill säga i det långa loppet . Ur ekonometrikerns synvinkel existerar detta långsiktiga samband (aka kointegration) om fel från regressionen är en stationär serie, även om och är icke-stationära. Antag också att om plötsligt ändras med så ändras det vill säga den marginella konsumtionsbenägenheten är lika med 50 %. Vårt slutliga antagande är att gapet mellan nuvarande och jämviktskonsumtion minskar varje period med 20 %.

I denna inställning kan en förändring i förbrukningsnivå modelleras som . Den första termen i RHS beskriver kortsiktig påverkan av förändring i , den andra termen förklarar långsiktig gravitation mot jämviktsförhållandet mellan variabler, och den tredje termen speglar slumpmässiga störningar som systemet får (t.ex. störningar av konsumenternas förtroende som påverkar konsumtionen). För att se hur modellen fungerar, överväg två typer av chocker: permanenta och tillfälliga (tillfälliga). För enkelhets skull, låt vara noll för alla t. Antag att i period t − 1 är systemet i jämvikt, dvs . Antag att den disponibla inkomsten under perioden t ökar med 10 och sedan återgår till sin tidigare nivå. Sedan först (i period t) med 5 (halva av 10), men efter den andra perioden börjar att minska och konvergerar till sin initiala nivå . Om chocken till däremot är permanent, konvergerar långsamt till ett värde som överstiger det initiala med 9.

Denna struktur är gemensam för alla ECM-modeller. I praktiken uppskattar ekonometriker ofta först kointegrationsförhållandet (ekvation i nivåer), och sedan infogar det i huvudmodellen (ekvation i skillnader).

Vidare läsning