Thursday 16 February 2017

Un Processus De Moyenne Mobile

2.1 Modèles de moyenne mobile (modèles MA) Les modèles de séries chronologiques connus sous le nom de modèles ARIMA peuvent inclure des termes autorégressifs ou des termes de moyenne mobile. Dans la semaine 1, nous avons appris un terme autorégressif dans un modèle de série chronologique pour la variable x t est une valeur décalée de x t. Par exemple, un terme autorégressif de retard 1 est x t-1 (multiplié par un coefficient). Cette leçon définit les termes moyens mobiles. Un terme moyen mobile dans un modèle de séries chronologiques est une erreur passée (multipliée par un coefficient). Soit (wt overet N (0, sigma2w)), ce qui signifie que les w t sont identiquement, indépendamment distribués, chacun avec une distribution normale ayant une moyenne 0 et la même variance. Le modèle de moyenne mobile du 1er ordre, noté MA (1) est (xt mu wt theta1w) Le modèle de moyenne mobile du 2 e ordre, noté MA (2) est (xt mu wt theta1w theta2w) , Désignée par MA (q) est (xt mu wt theta1w theta2w points thetaqw) Note. De nombreux manuels et programmes logiciels définissent le modèle avec des signes négatifs avant les termes. Cela ne modifie pas les propriétés théoriques générales du modèle, bien qu'il renverse les signes algébriques des valeurs des coefficients estimés et des termes (non carrés) dans les formules pour les ACF et les variances. Vous devez vérifier votre logiciel pour vérifier si des signes négatifs ou positifs ont été utilisés pour écrire correctement le modèle estimé. R utilise des signes positifs dans son modèle sous-jacent, comme nous le faisons ici. Propriétés théoriques d'une série temporelle avec un modèle MA (1) Notez que la seule valeur non nulle dans l'ACF théorique est pour le lag 1. Toutes les autres autocorrélations sont 0. Ainsi, un échantillon ACF avec une autocorrélation significative seulement au décalage 1 est un indicateur d'un modèle MA (1) possible. Pour les étudiants intéressés, les preuves de ces propriétés sont une annexe à ce document. Exemple 1 Supposons qu'un modèle MA (1) soit x t 10 w t .7 w t-1. Où (wt dépasse N (0,1)). Ainsi, le coefficient 1 0,7. L'ACF théorique est donné par Un tracé de cette ACF suit. Le graphique qui vient d'être montré est l'ACF théorique pour un MA (1) avec 1 0,7. En pratique, un échantillon ne fournira habituellement qu'un tel motif clair. En utilisant R, nous avons simulé n 100 échantillons en utilisant le modèle x t 10 w t .7 w t-1 où w t iid N (0,1). Pour cette simulation, un schéma chronologique des données de l'échantillon suit. Nous ne pouvons pas dire beaucoup de cette intrigue. L'échantillon ACF pour les données simulées suit. Nous observons un pic au décalage 1 suivi par des valeurs généralement non significatives pour les décalages au-delà de 1. Notez que l'échantillon ACF ne correspond pas au modèle théorique du MA (1) sous-jacent, c'est-à-dire que toutes les autocorrélations Un échantillon différent aurait un ACF d'échantillon légèrement différent indiqué ci-dessous, mais aurait probablement les mêmes caractéristiques générales. Propriétés théoriques d'une série temporelle avec un modèle MA (2) Pour le modèle MA (2), les propriétés théoriques sont les suivantes: Noter que les seules valeurs non nulles dans l'ACF théorique sont pour les lags 1 et 2. Les autocorrélations pour les décalages supérieurs sont 0 . Ainsi, un échantillon ACF avec des autocorrélations significatives aux décalages 1 et 2, mais des autocorrélations non significatives pour des décalages plus élevés indique un modèle MA (2) possible. Iid N (0,1). Les coefficients sont 1 0,5 et 2 0,3. Parce qu'il s'agit d'une MA (2), l'ACF théorique aura des valeurs non nulles uniquement aux lags 1 et 2. Les valeurs des deux autocorrélations non nulles sont: Un tracé de la théorie ACF suit. Comme presque toujours le cas, les données d'échantillon ne se comporteront pas aussi parfaitement que la théorie. Nous avons simulé n 150 échantillons pour le modèle x t 10 w t .5 w t-1 .3 w t-2. Où w t iid N (0,1). Le tracé de la série chronologique des données suit. Comme avec le graphique de la série temporelle pour les données d'échantillon MA (1), vous ne pouvez pas en dire beaucoup. L'échantillon ACF pour les données simulées suit. Le modèle est typique pour les situations où un modèle MA (2) peut être utile. Il y a deux pointes statistiquement significatives aux écarts 1 et 2, suivies des valeurs non significatives pour les autres retards. Notez qu'en raison de l'erreur d'échantillonnage, l'ACF de l'échantillon ne correspondait pas exactement au modèle théorique. ACF pour les modèles MA (q) Une propriété des modèles MA (q) en général est qu'il existe des autocorrélations non nulles pour les q premiers lags et autocorrélations 0 pour tous les retards gt q. Non-unicité de la connexion entre les valeurs de 1 et (rho1) dans MA (1) Modèle. Dans le modèle MA (1), pour toute valeur de 1. La valeur réciproque 1 1 donne la même valeur pour. Par exemple, utilisez 0,5 pour 1. Puis utilisez 1 (0,5) 2 pour 1. Vous obtiendrez (rho1) 0,4 dans les deux cas. Pour satisfaire une restriction théorique appelée invertibilité. Nous limitons les modèles MA (1) à des valeurs dont la valeur absolue est inférieure à 1. Dans l'exemple donné, 1 0,5 sera une valeur de paramètre admissible, alors que 1 10,5 2 ne le sera pas. Invertibilité des modèles MA Un modèle MA est dit inversible s'il est algébriquement équivalent à un modèle d'ordre infini convergent. En convergeant, nous voulons dire que les coefficients AR décroissent à 0 lorsque nous retournons dans le temps. Invertibilité est une restriction programmée dans le logiciel de séries temporelles utilisé pour estimer les coefficients de modèles avec des termes MA. Ce n'est pas quelque chose que nous vérifions dans l'analyse des données. Des informations supplémentaires sur la restriction d'inversibilité pour les modèles MA (1) sont données en annexe. Théorie avancée. Pour un modèle MA (q) avec un ACF spécifié, il n'existe qu'un seul modèle inversible. La condition nécessaire à l'inversibilité est que les coefficients ont des valeurs telles que l'équation 1- 1 y-. - q y q 0 a des solutions pour y qui tombent en dehors du cercle unitaire. Code R pour les exemples Dans l'exemple 1, nous avons représenté l'ACF théorique du modèle x t 10 w t. 7w t-1. Puis a simulé n 150 valeurs à partir de ce modèle et a représenté graphiquement la série chronologique de l'échantillon et l'échantillon ACF pour les données simulées. Les r commandes utilisées pour tracer l'ACF théorique sont: acfma1ARMAacf (mac (0.7), lag. max10) 10 lags de ACF pour MA (1) avec theta1 0.7 lags0: 10 crée une variable nommée lags qui va de 0 à 10. plot Abline (h0) ajoute un axe horizontal à la trame La première commande détermine l'ACF et la stocke dans un objet (a0) Nommé acfma1 (notre choix de nom). La commande plot (la 3ème commande) trace des retards par rapport aux valeurs ACF pour les lags 1 à 10. Le paramètre ylab étiquette l'axe y et le paramètre principal place un titre sur la trame. Pour voir les valeurs numériques de l'ACF, utilisez simplement la commande acfma1. La simulation et les parcelles ont été effectuées avec les commandes suivantes. (X, typeb, mainSimulated MA (1) data) xcarima. sim (n150, list (mac (0.7))) Simule n 150 valeurs de MA (1) xxc10 ajoute 10 pour faire la moyenne 10. La simulation (X, xlimc (1,10), mainACF pour des données d'échantillon simulées) Dans l'exemple 2, nous avons représenté graphiquement l'ACF théorique du modèle xt 10 wt.5 w t-1 .3 w t-2. Puis a simulé n 150 valeurs à partir de ce modèle et a représenté graphiquement la série chronologique de l'échantillon et l'échantillon ACF pour les données simulées. Les ordres R utilisés étaient: ACFma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 tracé (lags, acfma2, xlimc (1,10), ylabr, typeh, ACF principal pour MA (2) avec theta1 0,5, (X, typeb, principale série MA (2) simulée) acf (x, xlimc (1,10), x2) (1) Pour les étudiants intéressés, voici des preuves des propriétés théoriques du modèle MA (1). Lorsque x 1, l'expression précédente 1 w 2. Pour tout h 2, l'expression précédente 0 (x), x, x, x, x, x, La raison en est que, par définition de l'indépendance du wt. E (w k w j) 0 pour tout k j. En outre, parce que w t ont une moyenne 0, E (w j w j) E (w j 2) w 2. Pour une série chronologique, appliquer ce résultat pour obtenir l'ACF ci-dessus. Un modèle inversible MA est celui qui peut être écrit comme un modèle AR d'ordre infini qui converge de sorte que les coefficients AR convergent vers 0 alors que nous avançons infiniment dans le temps. Bien démontrer l'inversibilité pour le modèle MA (1). On substitue alors la relation (2) pour w t-1 dans l'équation (1) (3) (zt wt theta1 (z - theta1w) wt theta1z - theta2w) Au temps t-2. L'équation (2) devient Nous substituons alors la relation (4) pour w t-2 dans l'équation (3) (zt wt theta1 z - theta21w wt theta1z - theta21 (z - theta1w) wt theta1z - theta12z theta31w) Si nous devions continuer On notera cependant que si 1 1, les coefficients multipliant les décalages de z augmentent (infiniment) en taille à mesure que l'on se déplace vers l'arrière temps. Pour éviter cela, nous avons besoin de 1 lt1. C'est la condition pour un modèle inversible MA (1). Infinite Order MA model Dans la semaine 3, voyez bien qu'un modèle AR (1) peut être converti en un modèle d'ordre infini MA: (xt - mu wt phi1w phi21w points phik1 w dots sum phij1w) Cette sommation des termes de bruit blanc passé est connue Comme la représentation causale d'un AR (1). En d'autres termes, x t est un type spécial de MA avec un nombre infini de termes revenant dans le temps. C'est ce qu'on appelle un ordre infini MA ou MA (). Un ordre fini MA est un ordre infini AR et tout ordre fini AR est un ordre infini MA. Rappelons à la semaine 1, nous avons noté qu'une exigence pour un AR stationnaire (1) est que 1 lt1. Calculons le Var (x t) en utilisant la représentation causale. Cette dernière étape utilise un fait de base sur les séries géométriques qui nécessite (phi1lt1) sinon la série diverge. Navigation8.4 Modèles de moyenne mobile Au lieu d'utiliser les valeurs passées de la variable de prévision dans une régression, un modèle de moyenne mobile utilise les erreurs de prévision passées dans un modèle de type régression. Y c et theta e theta e dots theta e, où et est le bruit blanc. Nous appelons cela un modèle MA (q). Bien sûr, nous n'observons pas les valeurs de et, donc ce n'est pas vraiment une régression au sens usuel. Notez que chaque valeur de yt peut être considérée comme une moyenne mobile pondérée des dernières erreurs de prévision. Toutefois, les modèles de moyenne mobile ne doivent pas être confondus avec le lissage moyen mobile décrit au chapitre 6. Un modèle de moyenne mobile est utilisé pour prévoir les valeurs futures, tandis que le lissage moyen mobile est utilisé pour estimer le cycle tendanciel des valeurs passées. Figure 8.6: Deux exemples de données provenant de modèles de moyenne mobile avec des paramètres différents. A gauche: MA (1) avec y t 20e t 0.8e t-1. A droite: MA (2) avec y t e t - e t-1 0.8e t-2. Dans les deux cas, e t est le bruit blanc normalement distribué avec zéro moyen et variance un. La figure 8.6 présente certaines données d'un modèle MA (1) et d'un modèle MA (2). Modification des paramètres theta1, points, thetaq résultats dans différents modèles de séries chronologiques. Comme pour les modèles autorégressifs, la variance du terme d'erreur et ne changera que l'échelle de la série, et non pas les motifs. Il est possible d'écrire un modèle AR (p) stationnaire comme modèle MA (infty). Par exemple, en utilisant une substitution répétée, nous pouvons le démontrer pour un modèle AR (1): begin php phi1y ph php phi1y phi1y phi1y phi1y 1, la valeur de phi1k diminue à mesure que k devient plus grand. Donc, nous obtenons finalement un processus MA (infty) et yt et phi1 e phi12 e phi13 e cdots. Le résultat inverse se vérifie si l'on impose certaines contraintes aux paramètres MA. Ensuite, le modèle MA est appelé inversible. C'est-à-dire que nous pouvons écrire tout processus inverse MA (q) comme un processus AR (infty). Les modèles Invertible ne sont pas simplement pour nous permettre de convertir des modèles MA en modèles AR. Ils ont également des propriétés mathématiques qui les rendent plus faciles à utiliser dans la pratique. Les contraintes d'inversibilité sont similaires aux contraintes de stationnarité. Pour un modèle MA (1): -1lttheta1lt1. Pour un modèle MA (2): -1lttheta2lt1, theta2theta1 gt-1, theta1-theta2 lt 1. Des conditions plus compliquées tiennent pour qge3. De plus, R prendra soin de ces contraintes lors de l'estimation des modèles. Comment déterminer les valeurs pour AR (p) et MA (q) Utilisez les graphiques pour les corrélogrammes (presque tous les programmes ecomométriques les ont): vous devez d'abord différencier Les données d'origine jusqu'à ce qu'elles soient stationnaires. Ensuite, chaque type de modèle AR (1), AR (2), MA (1), MA (2), ARMA (1,1). A son propre modèle caractéristique dans l'autocorrélation simple et les graphiques d'autocorrélation partielle (vous pouvez les trouver facilement dans n'importe quel livre sur les séries temporelles). Essayez le modèle qui est plus semblable à vos correlogrammes, puis analysez les corrélogrammes des résidus (ils devraient être un bruit blanc, c'est-à-dire complètement aléatoire). Si le corrélogramme du résiduel montre un modèle, mettez à jour votre modèle pour inclure ce modèle (par exemple, si vous aviez spécifié un modèle AR (1) et le corrélogramme des résidus ressemble à un AR (1), puis spécifiez de nouveau votre modèle Modèle comme AR (2)). C'est un peu un art, mais il devient plus simple avec un peu de pratique. Cher Hamna, il existe des méthodes pour trouver l'ordre du modèle ARMA. Le simple et facile est d'observer les pointes proéminentes dans le tracé du corrélogramme, c'est-à-dire ACFPACF parcelle. Presque tous les logiciels statistiques ont la possibilité de tracer ce graphique. Vous pouvez utiliser Eviews pour déterminer l'AR et MA. Dans Eviews 8, il existe un outil automatique pour le calcul. Vous pouvez également le contrôler avec le calcul manuel en considérant les facteurs R sqrd et AIC-SB. J'espère que l'explication vous aide Il ya un certain nombre de questions qui sont importantes avant toute analyse univariée des séries chronologiques. Premier l'ordre d'intégration de la série doit être déterminée, cela est souvent entrepris par un Dickey Fuller (DF) test ou augmenté DF (ADF) pour faciliter ce processus. Sous réserve de la détection de l'ordre d'intégration et étant une valeur entière, il est alors possible de spécifier un modèle AR ou MA. Pour de nombreuses séries temporelles, la première différence est souvent suffisante pour rendre stationnaire une série. Un mécanisme simple pour déterminer si une série est non stationnaire se rapporte à la réversion moyenne de telle sorte que la tendance ne signifie pas revenir et sont normalement non stationnaires. Alors que les séries qui entrecroisent la valeur moyenne sont généralement stationnaires. Sous réserve de l'observation d'une tendance, les séries sont susceptibles d'être positivement corrélées et lorsque ce coefficient est proche d'un, alors les séries sont proches de la frontière entre le monde stationnaire et le monde non stationnaire. Souvent, les données dans leurs logs naturels se comportent de façon similaire aux données d'origine, mais la première différence du journal est un changement de pourcentage qui, pour de nombreuses séries, a plus de sens qu'une simple différence première. Cependant, sur des périodes relativement longues de données, cette dernière est susceptible d'être hétéroscédastique. En supposant que l'observation ci-dessus suggère la première différence dans les logs, il serait logique d'étudier le comportement des séries chronologiques de ces données via l'ACF (fonction d'autocorrélation) et le partiel (PACF) pourrait être utilisé pour fournir une certaine notion de la dynamique à utiliser Dans le test ADF. Dans ce cas, les données financières sont proches de l'aléatoire et, par conséquent, la corrélation dans le temps est faible. Dans ce cas, le test DF serait approprié pour tester la stationnarité et le modèle final serait le bruit blanc lors de la première différence et qui pourrait conduire à aucun modèle expliquant les données sous forme stationnaire. Une fois que les données sont dans leur forme stationnaire ou cela semble une approximation raisonnable, les modèles AR, MA et ARMA se rapprochent tous les uns des autres. Dans le cas des finances, il est souvent vrai que les coefficients MA et AR sont pratiquement les mêmes, si inusément un modèle AR (1) et MA (1) s'adapte à la fois aux données. Toute approximation qui se produit par inversion de la MA ou de la composante AR est négligeable dans un échantillon fini. Cela a conduit à suggérer que l'identification et l'estimation peuvent être combinées. Ainsi, un modèle AR peut être étudié en premier avec une longueur de retard sélectionnée à partir du PACF ou par l'intermédiaire d'une enquête empirique où éviter la possibilité de spécifier incorrectement l'ordre MA (dans le cas où le MA est d'abord essayé alors l'ordre MA est mis à 0) , Il peut souvent être logique d'étendre le délai observé depuis le dernier terme significatif dans le PACF. Ceci conduit à la suggestion d'estimer un modèle AR légèrement sur-spécifié, ce qui est attribué à Hannen et Rissannen. Il est suggéré dans le chapitre sur les séries chronologiques dans les Méthodes économétriques de Johnston et Dinardo, McGraw-Hill (1987) que cela peut être vu comme une procédure d'identification. Il est certain que par la recherche de la spécification AR, il est possible de déterminer le paramétrage de la spécification AR. Ce qui est intéressant, c'est que lorsque le modèle AR est correctement spécifié, les résidus de ce modèle peuvent être utilisés pour observer directement l'erreur non corrélée. Ce résidu peut être utilisé pour étudier plus en détail les spécifications du modèle MA et ARMA de façon directe par régression. Spliid (1983) explique dans le contexte multivarié qu'il s'agit d'une méthode d'estimateur de moment et cela peut être robuste par rapport aux procédures de maximum de vraisemblance Prendre normalité pour calculer les paramètres MA. En supposant que l'on a calculé un modèle de RA, je suggère que l'étape suivante de l'identification consiste à estimer un modèle de MA avec des écarts s-1 dans les erreurs non corrélées dérivées de la régression. La spécification MA parcimonieuse pourrait être envisagée et ceci pourrait être comparé à une spécification AR plus parcimonieuse. Les modèles ARMA pourraient également être analysés. Cependant, certains soins doivent être pris en relation avec les modèles ARMA. Cette question est soulevée dans Harvey (1981), Time Series Models et se rapporte à ce qu'on appelle une restriction de facteur commune. Il existe un problème bien connu que les modèles ARMA non parcimonieux sont souvent observés car les termes AR et MA peuvent être propagés. Dans les séries de cas les plus extrêmes qui sont en fait non corrélés, donnent lieu à des modèles AR et MA avec des termes de retard insignifiants comme cela devrait conduire à des spécifications ARMA (p, q) jusqu'à n'importe quel ordre que les données vont supporter. Si l'on considère le cas d'ARMA (1,1), l'étudiant est convaincu que c'est un bon modèle car les coefficients se révèlent très significatifs. Cependant, la clé est que les coefficients AR et MA ont un signe égal et opposé (-.75 et .81 ou dans certains cas -1 et 1). Ces modèles seraient rejetés dans la terminologie Box et Jenkins (1970) car ils ne sont pas parcimonieux, la forme parcimonieuse est ARMA (0,0) ou les données originales suivent une marche aléatoire et la différence est vraiment non corrélée. Les critères d'information sont souvent relativement stables lorsqu'on considère d'autres modèles et en supposant qu'ils se rapportent au même échantillon d'estimation, alors il peut souvent être qu'ils sont très légèrement plus grands que pour ces modèles par rapport aux spécifications AR ou MA plus simples. Parfois, ces modèles conduisent à des résidus qui sont mal comportés, mais souvent de nombreux critères conventionnels suggèrent des spécifications qui ne sont pas parcimonieux et font peu de sens. Les références décrites ci-dessus peuvent être trouvées dans Burke et Hunter (2005) Série chronologique non stationnaire - Palgrave. Le premier chapitre examine les modèles de séries temporelles et le modèle de test ADF. Si cet estimateur est cohérent et que l'échantillon est raisonnablement important, la procédure de régression à une étape devrait donner lieu à des estimations similaires à la vraisemblance maximale. Les résidus ne doivent pas être corrélés si les modèles sont bien formulés et Zinde Walsh et Galbraith (1998) constatent qu'une itération supplémentaire n'améliore pas les résultats, de sorte qu'une étape élimine toute corrélation dans l'erreur qui résulte du fait que la composante MA est ajoutée à une plus parcimonieuse AR modèle. Dans mon expérience avec le cas ARMA vectoriel, le critère change peu suite à une nouvelle itération tandis que Zinde Walsh et Galbraith suggèrent que les paramètres peuvent osiler autour d'une solution (voir la note précédente pour la direction en ce qui concerne la recherche des références). Juehui Shi middot Université de Buffalo, Université de l'État de New York Vous pouvez vous référer au document de travail avec des étapes empiriques claires. En général, on cherche moins d'AR ou d'ordre MA plutôt que plus, plus la stationnarité est un must pour tout travail paramétrique. Ensuite, vous devez effectuer un diagnostic complet sur la normalité, l'autocorrélation et l'hétéroscédasticité sur une seule série chronologique et la cointegration sur deux séries temporelles. Je vous suggère également de suivre l'approche univariée de Box-Jenkins et la procédure Tiao-Box multivariée. Disponible à partir de: Juehui Shi


No comments:

Post a Comment