Autoregressiv Moving-Average Simulation (First Order) Demonstrasjonen er satt slik at samme tilfeldige serie poeng blir brukt uansett hvordan konstantene er varierte. Men når kvoten kvitteringsknappen trykkes, vil en ny tilfeldig serie bli generert og brukt. Å holde den tilfeldige serien identisk tillater brukeren å se nøyaktig effektene på ARMA-serien av endringer i de to konstantene. Konstanten er begrenset til (-1,1) fordi divergens av ARMA-serien resulterer når. Demonstrasjonen er kun for en første bestillingsprosess. Ytterligere AR-betingelser ville muliggjøre mer komplekse serier som skal genereres, mens flere MA-termer vil øke utjevningen. For en detaljert beskrivelse av ARMA-prosesser, se for eksempel G. Box, G. M. Jenkins og G. Reinsel, Time Series Analysis: Forecasting and Control. 3. utg. Englewood Cliffs, NJ: Prentice-Hall, 1994. RELATERTE LINKSAutoregressive Integrert Moving Gjennomsnitt ARIMA (p, d, q) Modeller for Time Series Analysis I det forrige settet av artikler (Deler 1. 2 og 3) gikk vi inn i betydelig detalj om AR (p), MA (q) og ARMA (p, q) lineære tidsseriemodeller. Vi brukte disse modellene til å generere simulerte datasett, tilpassede modeller for å gjenopprette parametere og deretter anvende disse modellene på finansielle aksjer data. I denne artikkelen skal vi diskutere en utvidelse av ARMA-modellen, nemlig den autoregressive Integrated Moving Average-modellen, eller ARIMA (p, d, q) - modellen. Vi vil se at det er nødvendig å vurdere ARIMA-modellen når vi har ikke-stationære serier. Slike serier forekommer i nærvær av stokastiske trender. Rask oppskrift og neste trinn Til dags dato har vi vurdert følgende modeller (linkene tar deg til de aktuelle artiklene): Vi har stadig bygget opp vår forståelse av tidsserier med begreper som seriell korrelasjon, stasjonaritet, linearitet, residualer, korrelogrammer, simulering, montering, sesongmessighet, betinget heteroscedasticitet og hypotesetesting. Fra og med har vi ikke utført noen prognoser eller prognoser fra våre modeller og har derfor ikke hatt noen mekanisme for å produsere et handelssystem eller egenkapitalkurve. Når vi har studert ARIMA (i denne artikkelen), ARCH og GARCH (i de neste artiklene), vil vi være i stand til å bygge en grunnleggende langsiktig handelsstrategi basert på prognose for børsindeksavkastning. Til tross for det faktum at jeg har gått i detalj på modeller som vi vet, vil det i siste instans ikke ha stor ytelse (AR, MA, ARMA), er vi nå godt bevandret i prosessen med tidsseriemodellering. Dette betyr at når vi kommer til å studere nyere modeller (og selv de som nå er i forskningslitteraturen), vil vi ha en betydelig kunnskapsbase om å tegne, for å kunne evaluere disse modellene effektivt, i stedet for å behandle dem som en nøkkel resept eller svart boks. Enda viktigere vil det gi oss tillit til å utvide og endre dem på egen hånd og forstå hva vi gjør når vi gjør det. Id takk for at du har vært tålmodig så langt som det kan virke som at disse artiklene er langt borte fra den virkelige handlingen av faktisk handel. Imidlertid er sann kvantitativ handelsforskning forsiktig, målt og tar betydelig tid å komme seg til rette. Det er ingen hurtig løsning eller få rik ordning i kvant handel. Var veldig nær klar til å vurdere vår første handelsmodell, som vil være en blanding av ARIMA og GARCH, så det er viktig at vi bruker litt tid på å forstå ARIMA-modellen godt. Når vi har bygget vår første handelsmodell, skal vi vurdere mer avanserte modeller som langminneprosesser, state-space-modeller (dvs. Kalman Filter) og Vector Autoregressive (VAR) - modeller, som vil lede oss til andre, mer sofistikerte, handelsstrategier. Autoregressive Integrated Moving Average (ARIMA) Modeller av rekkefølge p, d, q ARIMA-modeller brukes fordi de kan redusere en ikke-stationær serie til en stasjonær serie ved hjelp av en sekvens av differenseringstrinn. Vi kan huske fra artikkelen om hvit støy og tilfeldige turer. Hvis vi bruker forskjelloperatøren til en tilfeldig walk-serie (en ikke-stationær serie), står vi igjen med hvit støy (en stasjonær serie): begynn nabla xt xt - x wt slutten ARIMA utfører i hovedsak denne funksjonen, men gjør det gjentatte ganger, d ganger, for å redusere en ikke-stationær serie til en stasjonær en. For å håndtere andre former for ikke-stasjonærhet utover stokastiske trender, kan flere modeller benyttes. Sesongmessige effekter (som de som oppstår i råvarepriser) kan løses med sesongbaserte ARIMA-modellen (SARIMA), men vi vil ikke diskutere SARIMA mye i denne serien. Betingede heteroscedastiske effekter (som med volatilitetsklynging i aksjeindekser) kan håndteres med ARCHGARCH. I denne artikkelen vurderer vi ikke-stationære serier med stokastiske trender og passer ARIMA-modeller til disse serien. Vi vil også endelig produsere prognoser for vår finansielle serie. Definisjoner Før vi definerer ARIMA-prosesser, må vi diskutere konseptet med en integrert serie: Integrerte rekkefølgen d En tidsserie er integrert i ordre d. I (d), hvis: begynn nablad xt wt end Det er, hvis vi skiller seriens d ganger, mottar vi en diskret hvit støyserie. Alternativt, ved å bruke Backward Shift Operator er en liknende betingelse: Nå som vi har definert en integrert serie, kan vi definere ARIMA-prosessen selv: Autoregressiv Integrert Moving Average Modell av rekkefølge p, d, q En tidsserie er en autoregressiv integrert glidende gjennomsnittlig modell av rekkefølgen p, d, q. ARIMA (p, d, q). hvis nablad xt er et autoregressivt glidende gjennomsnitt av orden p, q, ARMA (p, q). Det vil si at hvis serien er differenced d ganger, og det følger en ARMA (p, q) prosess, så er det en ARIMA (p, d, q) serie. Hvis vi bruker den polynomiske notasjonen fra del 1 og del 2 i ARMA-serien, kan en ARIMA (p, d, q) prosess skrives i forhold til bakoverskiftoperatøren. : Hvor wt er en diskret hvit støyserie. Det er noen poeng å merke seg om disse definisjonene. Siden tilfeldig gange er gitt med xt x wt kan det ses at jeg (1) er en annen representasjon, siden nabla1 xt wt. Hvis vi mistenker en ikke-lineær trend, kan vi muligens bruke gjentatte differensier (dvs. gt 1) for å redusere en serie til stasjonær hvit støy. I R kan vi bruke diff-kommandoen med flere parametre, f. eks. diff (x, d3) for å utføre gjentatte forskjeller. Simulering, korrelogram og modellmontering Siden vi allerede har benyttet arima. sim-kommandoen for å simulere en ARMA (p, q) prosess, vil følgende prosedyre være lik den som ble utført i del 3 av ARMA-serien. Den største forskjellen er at vi nå skal sette d1, det vil si, vi vil produsere en ikke-stationær tidsserie med en stokastisk trending komponent. Som før vil vi passe en ARIMA-modell til våre simulerte data, forsøke å gjenopprette parametrene, opprette konfidensintervaller for disse parametrene, produsere et korrelogram av rester av den monterte modellen og til slutt utføre en Ljung-Box-test for å fastslå om vi har en god passform. Vi skal simulere en ARIMA (1,1,1) modell, med den autoregressive koeffisienten alpha0.6 og den bevegelige gjennomsnittlige koeffisienten beta-0.5. Her er R-koden for å simulere og plotte en slik serie: Nå som vi har vår simulerte serie, skal vi prøve å passe en ARIMA (1,1,1) modell til den. Siden vi kjenner ordren, vil vi bare angi den i passformen: Forventningsintervallene beregnes som: Begge parameterestimatene faller innenfor konfidensintervallene og ligger nær de sanne parameterverdiene for den simulerte ARIMA-serien. Derfor bør vi ikke bli overrasket over at residuene ser ut som en realisering av diskret hvit støy. Til slutt kan vi kjøre en Ljung-Box-test for å gi statistisk bevis på en god form: Vi kan se at p-verdien er betydelig større enn 0,05 og som sådan kan vi si at det er sterke bevis for at diskret hvit støy er en god passform til resterne. Derfor er modellen ARIMA (1,1,1) en god passform, som forventet. Finansdata og prognoser I denne delen skal vi passe ARIMA-modeller til Amazon, Inc. (AMZN) og SampP500 US Equity Index (GPSC, i Yahoo Finance). Vi vil ta i bruk prognosebiblioteket, skrevet av Rob J Hyndman. Lar oss gå videre og installere biblioteket i R: Nå kan vi bruke quantmod til å laste ned Amazonas daglige prisserie fra begynnelsen av 2013. Siden vi allerede har tatt de første rekkefølgeforskjellene i serien, har ARIMA passet utført snart vilje ikke krever d gt 0 for den integrerte komponenten: Som i del 3 av ARMA-serien, går vi nå gjennom en kombinasjon av p, d og q for å finne den optimale modellen ARIMA (p, d, q). Med optimal mener vi ordrekombinasjonen som minimerer Akaike Information Criterion (AIC): Vi ser at en rekkefølge av p4, d0, q4 ble valgt. Spesielt d0, da vi allerede har tatt førstegangsforskjeller over: Hvis vi plotter korrelogrammet av residualene, kan vi se om vi har bevis for en diskret hvit støyserie: Det er to betydelige topper, nemlig på k15 og k21, selv om vi burde Forvente å se statistisk signifikante topper bare på grunn av prøvetrykkvariasjon 5 av tiden. Kan utføre en Ljung-Box-test (se forrige artikkel) og se om vi har bevis for god passform: Som vi ser, er p-verdien større enn 0,05 og så har vi bevis for en god passform på 95-nivået. Vi kan nå bruke prognose-kommandoen fra prognosebiblioteket for å forutsi 25 dager fremover for returserien til Amazon: Vi kan se poengprognosene for de neste 25 dagene med 95 (mørkeblå) og 99 (lyseblå) feilbånd . Vi vil bruke disse prognosene i vår første gangs handelsstrategi når vi kommer til å kombinere ARIMA og GARCH. Lar utføre samme prosedyre for SampP500. For det første henter vi dataene fra quantmod og konverterer den til en daglig logg returneringsstrøm: Vi passer på en ARIMA-modell ved å løse over verdiene p, d og q: AIC forteller oss at den beste modellen er ARIMA (2,0, 1) modell. Merk igjen at d0, da vi allerede har tatt første rekkefølgeforskjeller i serien: Vi kan plotte resterne av den monterte modellen for å se om vi har bevis på diskret hvit støy: Korrelogrammet ser lovende ut, så neste skritt er å løpe Ljung-Box-testen og bekreft at vi har en god modellpasning: Siden p-verdien er større enn 0,05, har vi bevis på en god modellpassform. Hvorfor er det at i den forrige artikkelen viste vår Ljung-Box-test for SampP500 at ARMA (3,3) var dårlig egnet for den daglige loggen returnerer Legg merke til at jeg bevisst trunker SampP500 dataene for å starte fra 2013 og fremover i denne artikkelen , som praktisk utelukker de volatile perioder rundt 2007-2008. Derfor har vi utelukket en stor del av SampP500 hvor vi hadde for stor volatilitetsklynging. Dette påvirker seriell korrelasjon av serien og har følgelig effekten av at serien ser ut til å være mer stasjonær enn den har vært i det siste. Dette er et veldig viktig punkt. Når vi analyserer tidsserier, må vi være svært forsiktige med betinget heteroscedastiske serier, som aksjemarkedsindekser. I kvantitativ finans er det ofte kjent som regimeringsdetektering å prøve å bestemme perioder med ulik volatilitet. Det er en av de vanskeligere oppgavene å oppnå. Nå drøft dette punktet i lengden i neste artikkel når vi kommer til å vurdere ARCH og GARCH-modellene. La oss nå plotte en prognose for de neste 25 dagene av SampP500 daglige logg returnerer: Nå som vi har muligheten til å passe og prognose modeller som ARIMA, var svært nær å kunne opprette strategiske indikatorer for handel. Neste trinn I neste artikkel skal vi se på Generalized Autoregressive Conditional Heteroscedasticity (GARCH) - modellen og bruke den til å forklare mer av seriell korrelasjon i enkelte aksjer og aksjeindeksserier. Når vi har diskutert GARCH, vil vi være i stand til å kombinere det med ARIMA-modellen og skape signalindikatorer og dermed en grunnleggende kvantitativ handelsstrategi. Bare Komme i gang med kvantitativ TradingDocumentation a er en konstant vektor av forskyvninger, med n elementer. A jeg er n-en-matriser for hver jeg. A i er autoregressive matriser. Det er p autoregressive matriser. 949 t er en vektor av serielt ukorrelerte innovasjoner. vektorer med lengde n. 949 t er multivariate normale tilfeldige vektorer med en kovariansmatrise Q. hvor Q er en identitetsmatrise, med mindre annet er angitt. B j er n-by-n matriser for hver j. Bj flytter gjennomsnittlige matriser. Det er q bevegelige gjennomsnittsmatriser. X t er en n-by-matrise som representerer eksogene vilkår ved hver tid t. r er antall eksogene serier. Eksogene vilkår er data (eller andre umodellerte innganger) i tillegg til responstidsserien y t. b er en konstant vektor av regresjonskoeffisienter av størrelse r. Så produktet X t middotb er en vektor med størrelse n. Generelt er tidsseriene y t og X t observerbare. Med andre ord, hvis du har data, representerer den en eller begge seriene. Du vet ikke alltid offseten a. koeffisient b. autoregressive matriser A i. og bevegelige gjennomsnittsmatriser B j. Du vil vanligvis tilpasse disse parametrene til dine data. Se vgxvarx-funksjonsreferansesiden for måter å estimere ukjente parametere på. Innovasjonene 949 t er ikke observerbare, i hvert fall i data, selv om de kan observeres i simuleringer. Lagoperatørrepresentasjon Det er en ekvivalent representasjon av de lineære autoregressive ligningene i forhold til lagoperatører. Lagsoperatøren L flytter tidsindeksen tilbake med en: L y t y t 82111. Operatøren L m flytter tidsindeksen tilbake med m. L m y t y t 8211 m. I lagoperatørform blir ligningen for en SVARMAX-modell (p. Q. R) (A 0 x2212 x2211 i 1 p A i L i) a t X t b (B 0 x 2211 j 1 q B j L j) x03B5 t. Denne ligningen kan skrives som A (L) y t a X t b B (L) x03B5 t. En VAR-modell er stabil hvis det (I n x2212 A 1 z x 2212 A 2 z 2 x 2212 x2212 A pzp) x2260 0 x00A0x00A0forx00A0x00A0 z x2264 1. Denne betingelsen innebærer at alle prosessene tilsvarer null, forvandler VAR-prosessen til en som tiden går videre. Se Luumltkepohl 74 Kapittel 2 for en diskusjon. En VMA-modell er inverterbar hvis det (I n B 1 z B 2 z 2. B q z q) x2260 0 x00A0x00A0forx00A0x00A0 z x2264 1. Denne betingelsen innebærer at den rene VAR-representasjonen av prosessen er stabil. For en forklaring på hvordan du konverterer mellom VAR og VMA-modeller, se Endre modellrepresentasjoner. Se Luumltkepohl 74 Kapittel 11 for en diskusjon av inverterbare VMA-modeller. En VARMA-modell er stabil hvis VAR-delen er stabil. På samme måte er en VARMA-modell inverterbar hvis dens VMA-del er inverterbar. Det er ingen veldefinert forestilling om stabilitet eller invertibilitet for modeller med eksogene innganger (for eksempel VARMAX-modeller). En eksogen inngang kan destabilisere en modell. Å bygge VAR-modeller For å forstå en flere tidsseriemodell eller flere tidsseriedata, utfører du vanligvis følgende trinn: Importer og forhåndsbehandle data. Angi en modell. Spesifikasjonsstrukturer uten parameterværdi for å spesifisere en modell når du vil at MATLAB x00AE skal estimere parametrene Spesifikasjonsstrukturer med valgte parameterverdier for å angi en modell hvor du kjenner noen parametere og vil at MATLAB skal estimere de andre. Bestemme et passende antall lag for å bestemme et passende antall lags for din modell. Tilpass modellen til data. Passer Modeller til Data for å bruke vgxvarx til å estimere de ukjente parameterne i modellene dine. Dette kan innebære: Endre modellrepresentasjoner for å endre modellen til en type som vgxvarx håndterer Analyser og prognoser ved hjelp av den monterte modellen. Dette kan innebære: Undersøk stabiliteten til en montert modell for å avgjøre om modellen din er stabil og inverterbar. VAR modellprognoser å prognose direkte fra modeller eller å prognostisere ved hjelp av en Monte Carlo simulering. Beregning av impulsresponser for å beregne impulsresponser, som gir prognoser basert på en antatt endring i en inngang til en tidsserie. Sammenlign resultatene fra modellene dine prognoser til data holdt ut for prognoser. For eksempel, se VAR Model Case Study. Programmet ditt trenger ikke involvere alle trinnene i denne arbeidsflyten. For eksempel har du kanskje ingen data, men vil simulere en parameterisert modell. I så fall vil du bare utføre trinn 2 og 4 i generisk arbeidsflyt. Du kan iterere gjennom noen av disse trinnene. Beslektede eksempler Velg landAutoregressive bevegelige gjennomsnittlige feilprosesser (ARMA-feil) og andre modeller som involverer feilfeil, kan estimeres ved hjelp av FIT-setninger og simulert eller prognose ved å bruke SOLVE-setninger. ARMA modeller for feilprosessen brukes ofte til modeller med autokorrelerte rester. AR-makroen kan brukes til å spesifisere modeller med autoregressive feilprosesser. MA-makroen kan brukes til å spesifisere modeller med bevegelige gjennomsnittsfeilprosesser. Autoregressive feil En modell med førstegangs autoregressive feil, AR (1), har skjemaet mens en AR (2) feilprosess har skjemaet og så videre for høyere rekkefølge prosesser. Merk at s er uavhengige og identisk fordelte og har en forventet verdi på 0. Et eksempel på en modell med en AR (2) komponent er og så videre for høyere rekkefølge prosesser. For eksempel kan du skrive en enkel lineær regresjonsmodell med MA (2) glidende gjennomsnittlige feil som hvor MA1 og MA2 er de bevegelige gjennomsnittsparametrene. Legg merke til at RESID. Y automatisk er definert av PROC MODEL, da ZLAG-funksjonen må brukes til MA-modeller for å avkorte rekursjonen av lagene. Dette sikrer at de forsinkede feilene starter ved null i forsinkelsesfasen og ikke propagerer manglende verdier når forsinkelsesperiodevariabler mangler, og det sikrer at fremtidige feil er null i stedet for å bli savnet under simulering eller prognoser. For detaljer om lagfunksjonene, se avsnittet Laglogikk. Denne modellen som er skrevet ved hjelp av MA-makroen, er som følger: Generell form for ARMA-modeller Den generelle ARMA (p, q) prosessen har følgende form En ARMA (p, q) modell kan spesifiseres som følger: hvor AR i og MA j representerer de autoregressive og bevegelige gjennomsnittsparametrene for de ulike lagene. Du kan bruke noen navn du vil ha for disse variablene, og det finnes mange tilsvarende måter som spesifikasjonen kan skrives på. Vector ARMA prosesser kan også estimeres med PROC MODEL. For eksempel kan en tovariabel AR (1) prosess for feilene i de to endogene variablene Y1 og Y2 spesifiseres som følger: Konvergensproblemer med ARMA-modeller ARMA-modeller kan være vanskelig å estimere. Hvis parametrisestimatene ikke er innenfor det aktuelle området, øker de gjenværende betingelsene for flyttende gjennomsnitt eksponentielt. De beregnede residualene for senere observasjoner kan være svært store eller kan overflyte. Dette kan skje enten fordi feil startverdier ble brukt eller fordi iterasjonene flyttet vekk fra rimelige verdier. Pasienten bør brukes til å velge startverdier for ARMA-parametere. Startverdier på 0,001 for ARMA-parametere virker vanligvis hvis modellen passer godt til data og problemet er godt betinget. Legg merke til at en MA-modell ofte kan tilnærmet seg med en høy-ordnet AR-modell, og omvendt. Dette kan resultere i høy kollinearitet i blandede ARMA-modeller, som igjen kan forårsake alvorlig dårlig konditionering i beregningene og ustabiliteten til parameterestimatene. Hvis du har konvergensproblemer mens du vurderer en modell med ARMA-feilprosesser, kan du prøve å estimere i trinn. Bruk først en FIT-setning for å estimere bare strukturparametrene med ARMA-parametrene holdt til null (eller til fornuftige tidligere estimater hvis tilgjengelig). Deretter bruker du en annen FIT-setning for å bare estimere ARMA-parametrene, ved hjelp av strukturelle parameterverdier fra første runde. Siden verdiene til strukturparametrene sannsynligvis vil være nær de endelige estimatene, kan ARMA parameter estimatene nå konvergere. Til slutt, bruk en annen FIT-setning for å produsere samtidige estimater av alle parametrene. Siden de første verdiene til parametrene nå er sannsynligvis ganske nær deres endelige felles estimater, bør estimatene konvergere raskt hvis modellen passer for dataene. AR Initial Conditions De første lagene av feilvilkårene for AR (p) - modellene kan modelleres på forskjellige måter. De autoregressive feiloppstartsmetodene som støttes av SASETS-prosedyrer, er følgende: Kondisjonerende minste kvadrater (ARIMA og MODEL-prosedyrer) ubetingede minstefirkanter (AUTOREG, ARIMA og MODEL-prosedyrer) maksimal sannsynlighet (AUTOREG, ARIMA og MODEL-prosedyrer) Yule-Walker (AUTOREG Hildreth-Lu, som sletter de første p-observasjonene (kun MODEL-prosedyre) Se kapittel 8, AUTOREG-prosedyren, for en forklaring og diskusjon av fordelene ved ulike AR (p) oppstartsmetoder. CLS, ULS, ML og HL initialiseringer kan utføres av PROC MODEL. For AR (1) - feil, kan disse initialiseringene produseres som vist i tabell 18.2. Disse metodene er ekvivalente i store prøver. Tabell 18.2 Initialiseringer utført av PROC MODEL: AR (1) FEIL De første lagene til feilvilkårene for MA (q) - modellene kan også modelleres på forskjellige måter. Følgende gjennomsnittlige feiloppstartsparadigmaer for bevegelige gjennomsnitt er støttet av ARIMA - og MODEL-prosedyrene: ubetingede minstefeltene betingede minstefirkanter Den betingede minstefirkantmetoden for estimering av gjennomsnittlig feilvilkår er ikke optimal fordi den ignorerer oppstartsproblemet. Dette reduserer estimatets effektivitet, selv om de forblir objektive. De innledende forsinkede residuene, som strekker seg før data begynner, antas å være 0, deres ubetingede forventede verdi. Dette introduserer en forskjell mellom disse residuene og de generaliserte minstkvadratresiduene for den bevegelige gjennomsnittlige kovariansen, som, i motsetning til den autoregressive modellen, fortsetter gjennom datasettet. Vanligvis er denne forskjellen konvergerende raskt til 0, men for nesten uforanderlige bevegelige gjennomsnittsprosesser er konvergensen ganske treg. For å minimere dette problemet, bør du ha rikelig med data, og de gjennomsnittlige estimatene for bevegelige gjennomsnitt skal ligge godt innenfor det inverterbare området. Dette problemet kan korrigeres på bekostning av å skrive et mer komplekst program. Ubetingede minimale kvadrater estimater for MA (1) prosessen kan produseres ved å spesifisere modellen som følger: Flytte-gjennomsnittlige feil kan være vanskelig å estimere. Du bør vurdere å bruke en AR (p) tilnærming til den bevegelige gjennomsnittsprosessen. En bevegelig gjennomsnittsprosess kan vanligvis være godt tilnærmet av en autoregressiv prosess hvis dataene ikke har blitt jevnet eller differensiert. AR Macro SAS makro AR genererer programmeringsuttalelser for PROC MODEL for autoregressive modeller. AR-makroen er en del av SASETS-programvaren, og ingen spesielle alternativer må settes for å bruke makroen. Den autoregressive prosessen kan brukes på strukturelle ligningsfeilene eller til den endogene serien selv. AR-makroen kan brukes til følgende typer autoregresjon: ubegrenset vektor autoregresjonsbegrenset vektor autoregresjon Univariate Autoregression For å modellere feilbegrepet for en ligning som en autoregressiv prosess, bruk følgende setning etter ligningen: For eksempel, anta at Y er en lineær funksjon av X1, X2 og en AR (2) feil. Du vil skrive denne modellen som følger: Samtalen til AR må komme etter alle likningene som prosessen gjelder for. Den foregående makrooppkallingen, AR (y, 2), produserer setningene som vises i LIST-utgangen i figur 18.58. Figur 18.58 LIST Alternativutgang for en AR-modell (2) PRED-prefikserte variabler er midlertidige programvariabler som brukes, slik at lagene på residualene er de riktige residualene og ikke de som er omdefinert av denne ligningen. Merk at dette tilsvarer uttalelsene som er uttrykkelig skrevet i avsnittet Generell skjema for ARMA-modeller. Du kan også begrense de autoregressive parametrene til null ved valgte lag. For eksempel, hvis du vil ha autoregressive parametere på lag 1, 12 og 13, kan du bruke følgende setninger: Disse setningene genererer utgangen vist i Figur 18.59. Figur 18.59 LIST Option Output for en AR-modell med Lags på 1, 12 og 13 MODEL Prosedyreoppføring av kompilert programkodestatus som analysert PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. y PRED. y - y OLDPRED. y PRED. y yl1 ZLAG1 (y - perdy) yl12 ZLAG12 (y - perdy) yl13 ZLAG13 (y - perdy) RESID. y PRED. y - AKTUELT. ERROR. y PRED. y - y Det er variasjoner på den betingede minste kvadratmetoden, avhengig av om observasjoner ved starten av serien brukes til å varme opp AR-prosessen. Som standard bruker AR-betinget minste kvadratmetoden alle observasjonene og antar nuller for de første lagene av autoregressive termer. Ved å bruke M-alternativet, kan du be om at AR bruker stedet for ubetinget minste kvadrat (ULS) eller maksimal sannsynlighet (ML) i stedet. For eksempel er diskusjoner av disse metodene gitt i avsnittet AR Initial Conditions. Ved å bruke MCLS n-alternativet, kan du be om at de første n observasjonene brukes til å beregne estimater av de første autoregressive lagene. I dette tilfellet starter analysen med observasjon n 1. For eksempel: Du kan bruke AR-makroen til å bruke en autoregressiv modell til den endogene variabelen, i stedet for til feilperioden, ved å bruke TYPEV-alternativet. Hvis du for eksempel vil legge til de fem siste lagene til Y til ligningen i forrige eksempel, kan du bruke AR til å generere parametrene og lagre ved å bruke følgende setninger: De foregående setningene genererer utgangen vist i Figur 18.60. Figur 18.60 LIST Alternativutgang for en AR-modell av Y Denne modellen forutsier Y som en lineær kombinasjon av X1, X2, en avskjæring og verdiene for Y i de siste fem periodene. Ubegrenset Vector Autoregression Hvis du vil modellere feilvilkårene for et sett med ligninger som en vektorautoregressiv prosess, bruker du følgende form for AR-makroen etter likningene: Prosessnavnverdien er et hvilket som helst navn du oppgir for AR å bruke til å lage navn for autoregressive parametre. Du kan bruke AR-makroen til å modellere flere forskjellige AR-prosesser for forskjellige sett med ligninger ved å bruke forskjellige prosessnavn for hvert sett. Prosessnavnet sikrer at variabelenavnene som brukes, er unike. Bruk en kort prosessnavn verdi for prosessen hvis parameter estimater skal skrives til et utdatasett. AR-makroen forsøker å konstruere parameternavn mindre enn eller lik åtte tegn, men dette er begrenset av lengden på prosessnavn. som brukes som prefiks for AR-parameternavnene. Variablelistverdien er listen over endogene variabler for ligningene. For eksempel, anta at feil for ligningene Y1, Y2 og Y3 er generert av en andreordsvektor autoregressiv prosess. Du kan bruke følgende setninger: som genererer følgende for Y1 og lignende kode for Y2 og Y3: Bare metodene med betinget minste kvadrat (MCLS eller MCLS n) kan brukes til vektorprosesser. Du kan også bruke samme skjema med begrensninger at koeffisjonsmatrisen er 0 på utvalgte lag. Følgende setninger bruker for eksempel en tredje ordensvektprosess til ligningsfeilene med alle koeffisientene ved lag 2 begrenset til 0 og med koeffisientene ved lag 1 og 3 ubegrenset: Du kan modellere de tre seriene Y1Y3 som en vektor-autoregressiv prosess i variablene i stedet for i feilene ved å bruke TYPEV-alternativet. Hvis du vil modellere Y1Y3 som en funksjon av tidligere verdier av Y1Y3 og noen eksogene variabler eller konstanter, kan du bruke AR til å generere setningene for lagbetingelsene. Skriv en ligning for hver variabel for den ikke-autoregressive delen av modellen, og ring deretter AR med TYPEV-alternativet. For eksempel kan den ikke-autoregressive delen av modellen være en funksjon av eksogene variabler, eller det kan skilles parametere. Hvis det ikke finnes eksogene komponenter til vektorgruppens autoregresjonsmodell, inkludert ingen avlyttinger, tilordner du null til hver av variablene. Det må være en oppgave til hver av variablene før AR kalles. Dette eksemplet modellerer vektoren Y (Y1 Y2 Y3) som en lineær funksjon bare av verdien i de to foregående periodene og en hvit støyfeilvektor. Modellen har 18 (3 3 3 3) parametere. Syntax av AR Macro Det er to tilfeller av syntaksen til AR-makroen. Når det ikke er behov for restriksjoner på en AR-vektorprosess, har syntaksen til AR-makroen den generelle formen spesifiserer et prefiks for AR som skal brukes til å konstruere navn på variabler som trengs for å definere AR-prosessen. Hvis endolisten ikke er spesifisert, angir den endogene listen som navnet. som må være navnet på ligningen som AR feilprosessen skal brukes på. Navneverdien kan ikke overstige 32 tegn. er ordren til AR-prosessen. spesifiserer listen over likninger som AR-prosessen skal brukes på. Hvis mer enn ett navn er gitt, opprettes en ubegrenset vektorprosess med de strukturelle rester av alle ligningene som er inkludert som regressorer i hver av ligningene. Hvis ikke spesifisert, angir endolisten navnet. angir listen over lag som AR-vilkårene skal legges til. Koeffisientene til betingelsene ved lags ikke listet er satt til 0. Alle de listede lagene må være mindre enn eller lik nlag. og det må ikke være duplikater. Hvis ikke spesifisert lagrer laglisten til alle lag 1 til nlag. angir estimeringsmetoden som skal implementeres. Gyldige verdier av M er CLS (estimater med betingede minste kvadrater), ULS (ubetingede minstkvadratestimater) og ML (maksimal sannsynlighet estimater). MCLS er standard. Bare MCLS er tillatt når mer enn en ligning er angitt. ULS - og ML-metodene støttes ikke for vektor AR-modeller av AR. angir at AR-prosessen skal påføres de endogene variablene selv i stedet for til de strukturelle residualene i ligningene. Begrenset Vector Autoregression Du kan kontrollere hvilke parametere som er inkludert i prosessen, begrense til 0 de parametrene du ikke inkluderer. Bruk først AR med alternativet DEFER til å erklære variabellisten og definere dimensjonen av prosessen. Deretter bruker du flere AR-anrop for å generere vilkår for utvalgte ligninger med utvalgte variabler på utvalgte lag. F. eks. Feilligningene som er produsert, er som følger: Denne modellen sier at feilene for Y1 avhenger av feilene til både Y1 og Y2 (men ikke Y3) i begge lag 1 og 2, og at feilene for Y2 og Y3 avhenger av De forrige feilene for alle tre variablene, men bare ved lag 1. AR Makro syntaks for begrenset vektor AR En alternativ bruk av AR har lov til å pålegge restriksjoner på en vektor AR-prosess ved å ringe AR flere ganger for å angi forskjellige AR-termer og lags for forskjellige ligninger. Den første anropet har den generelle formen angir et prefiks for AR å bruke til å bygge navn på variabler som trengs for å definere vektor AR-prosessen. angir rekkefølgen av AR-prosessen. spesifiserer listen over likninger som AR-prosessen skal brukes på. angir at AR ikke skal generere AR-prosessen, men skal vente på ytterligere informasjon angitt i senere AR-anrop for samme navneverdi. De påfølgende anropene har den generelle formelen den samme som i den første anropet. spesifiserer listen over likninger som spesifikasjonene i denne AR-anropet skal brukes til. Bare navn som er spesifisert i endolistverdien til den første anropen for navnverdien, kan vises i listen over likninger i eqlist. spesifiserer listen over ligninger hvis lagrede strukturelle residualer skal inkluderes som regressorer i ligningene i eqlist. Bare navn i endolisten til det første anropet for navnverdien kan vises i varlisten. Hvis ikke spesifisert, varsler standard til endolist. angir listen over lag som AR-vilkårene skal legges til. Koeffisientene til betingelsene ved lags ikke listet er satt til 0. Alle de listede lagene må være mindre enn eller lik verdien av nlag. og det må ikke være duplikater. Hvis ikke spesifisert, lagliste standard til alle lag 1 til nlag. MA Macro SAS makro MA genererer programmeringserklæringer for PROC MODEL for flyttende gjennomsnittlige modeller. MA-makroen er en del av SASETS-programvaren, og det kreves ingen spesielle alternativer for å bruke makroen. Feilprosessen med bevegelige gjennomsnitt kan påføres strukturelle ligningsfeil. Syntaxen til MA-makroen er den samme som AR-makroen, bortsett fra at det ikke er noen TYPE-argument. Når du bruker MA og AR-makroene kombinert, må MA-makroen følge AR-makroen. Følgende SASIML-setninger produserer en ARMA (1, (1 3)) feilprosess og lagrer den i datasettet MADAT2. Følgende PROC MODEL-setninger brukes til å estimere parametrene til denne modellen ved å bruke maksimal sannsynlighet feil struktur: Estimatene av parametrene produsert av denne løp er vist i Figur 18.61. Figur 18.61 Estimater fra en ARMA (1, (3)) prosess Det er to tilfeller av syntaksen for MA makroen. Når det ikke er behov for restriksjoner på en vektor MA-prosess, har syntaksen til MA-makroen den generelle formen spesifiserer et prefiks for MA som skal brukes til å konstruere navn på variabler som trengs for å definere MA prosessen og er standard endolisten. er bestillingen av MA prosessen. spesifiserer likningene som MA-prosessen skal brukes på. Hvis mer enn ett navn er gitt, brukes CLS estimering for vektorprosessen. spesifiserer lagene der MA-vilkårene skal legges til. Alle de listede lagene må være mindre enn eller lik nlag. og det må ikke være duplikater. Hvis ikke spesifisert lagrer laglisten til alle lag 1 til nlag. angir estimeringsmetoden som skal implementeres. Gyldige verdier av M er CLS (estimater med betingede minste kvadrater), ULS (ubetingede minstkvadratestimater) og ML (maksimal sannsynlighet estimater). MCLS er standard. Kun MCLS er tillatt når mer enn en ligning er spesifisert i endolisten. MA Makro syntaks for begrenset vektor Flyttende Gjennomsnitt En alternativ bruk av MA er tillatt å pålegge begrensninger på en vektor MA prosess ved å ringe MA flere ganger for å angi forskjellige MA-termer og lags for forskjellige ligninger. Den første anropet har den generelle formen spesifiserer et prefiks for MA å bruke til å konstruere navn på variabler som trengs for å definere vektor MA prosessen. angir rekkefølgen av MA prosessen. spesifiserer listen over likninger som MA-prosessen skal brukes på. angir at MA ikke skal generere MA prosessen, men skal vente på ytterligere informasjon angitt i senere MA-samtaler for samme navneverdi. De påfølgende anropene har den generelle formelen den samme som i den første anropet. spesifiserer listen over likninger som spesifikasjonene i dette MA-samtalen skal brukes til. spesifiserer listen over ligninger hvis lagrede strukturelle residualer skal inkluderes som regressorer i ligningene i eqlist. angir listen over lag som MA-vilkårene skal legges til.
No comments:
Post a Comment