Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
KEHO Yaya
yayakeho@yahoo.fr
Octobre 2007
1
Objectifs du Cours
L'objet du cours est de fournir aux participants les connaissances minimales requises pour
effectuer des travaux appliqués dans les différents domaines où ils pourront être amenés à
utiliser les méthodes économétriques. Si l'orientation "appliquée" est importante, elle suppose
d'abord quelques connaissances théoriques. C’est pourquoi avant d’aborder comment, de
manière pratique, les différentes méthodes économétriques sont mises en œuvre, un cours
magistral rappellera les fondements théoriques nécessaires à la compréhension et surtout à
l’interprétation des résultats. Les développements théoriques portent tout d'abord sur les
problèmes d'estimation et d'inférence statistique sur le modèle de régression multiple et sur les
modèles à équations simultanées. Ce sera l'occasion d'évoquer les différentes méthodes
d'estimation (méthodes des moindres carrés, maximum de vraisemblance, variables
instrumentales, méthodes à information limitée et complète) et d'étudier leurs propriétés
statistiques.
Une part importante du cours est ensuite consacrée à l'économétrie des séries temporelles. On
privilégie ici trois aspects. Le premier aspect est celui de l'estimation des processus ARMA et
VAR stationnaires. Le second aspect vise à introduire l'ensemble des concepts liés à
l'économétrie des séries temporelles non stationnaires à travers la cointégration et les modèles
dynamiques à correction d’erreur. Enfin, on s'intéressera à l'estimation des modèles non-
linéaires, actuellement très utilisées dans différents domaines de l'économie : macroéconomie,
finance, microéconomie, etc.
Le rappel théorique est complété par des séances de travaux pratiques qui devront permettre
aux participants d'appliquer les concepts théoriques étudiés sur des cas concrets. Ces travaux
pratiques ont également la vocation d'aider à l'interprétation économique des résultats et de
permettre d'entrevoir les difficultés concrètes qui se posent. Les cours pratiques ainsi que les
illustrations se feront sur le logiciel Eviews.
1.1. Généralités
Eviews est un logiciel qui permet de réaliser une analyse des données, notamment des
régressions et des prévisions. C’est donc un outil performant d’analyse des séries
macroéconomiques. Il représente la version nouvelle d’un ensemble d’outils de traitement
des séries temporelles initialement fait par TSP (Time Series Processor) développé
initialement par les économistes. Aujourd’hui, Eviews connaît une large application dans
beaucoup de domaines. Il offre la possibilité d’entrer les données à partir du clavier ou de
fichiers d’une disquette, de créer de nouvelles séries à partir de celles existantes, de faire des
analyses statistiques des relations entre des séries. Eviews utilise les caractéristiques visuelles
des logiciels sous Windows. L’utilisateur peut utiliser sa souris pour faire des opérations à
l’aide les menus et boites de dialogue standards de Windows. Les résultats apparaissent en
Windows et peuvent être manipulés par les techniques standard. Ils peuvent être copiés puis
collés dans Word pour faciliter le processus de rédaction du rapport. Alternativement, EViews
dispose d’un langage de programmation et de commandes assez variées que pourrait utiliser
l’utilisateur. Enfin, EViews contient un menu d’aide en ligne très documenté sur la mise en
œuvre des procédures d’analyse, des commandes et des opérations qu’il permet de faire.
La prévision macroéconomique
Prévision de l’inflation ;
Prévision du taux de croissance ;
Prévision du taux d’investissement ;
Prévision des recettes budgétaires etc. ;
La prévision en entreprise
L’analyse financière
La simulation
EViews est basé sur la notion d’objet. Les objets sont en fait des blocs d’éléments liés par
une notion commune et qui sont mis ensemble pour être utilisés plus aisément. De façon
virtuelle, tout le travail dans Eviews impliquera l’utilisation et la manipulation d’objets divers.
L’objet le plus important dans EViews est le workfile (espace de travail) et la première chose
à faire sera de créer un nouveau workfile ou d’ouvrir un workfile existant. Chaque objet est un
ensemble d’information se rapportant à un domaine particulier de l’analyse. Les objets
peuvent recevoir également un nom. Les objets les plus importants sont les workfiles, les
séries et les équations. Il existe cependant un certain nombre d’autres objets qui jouent des
fonctions différentes. Il s’agit par exemple des vecteurs de coefficients, des bases de données,
les graphes, les groupes, les modèles, le VAR/VECM. Tous ces objets, à l’exception des
workfiles et des bases de données, possèdent leurs propres icônes qui apparaissent dans le
workfile. Lorsqu’un nouvel espace de travail (workfile) est crée, deux objets apparaissent
automatiquement : le vecteur des coefficients (initialement fixé à 0) et la série des résidus.
Voici l’aperçu des icônes associés à certains objets :
Pour créer un nouvel objet, il suffit de sélectionner Object/New Object à partir du menu
principal ou du menu du workfile, de choisir ensuite le type d’objet que l’on veut créer et de
le nommer avant de valider par OK.
EViews dispose d’un éventail d’opérateurs et de fonctions qui permet de faire des calculs
mathématiques. Il dispose surtout de certaines fonctions spécialisées utilisées couramment
dans l’analyse des séries temporelles (log, différences premières/secondes, retards…). Le
tableau suivant décrit les fonctions des opérateurs mathématiques utilisés par EViews.
2. MANIPULATION DE DONNEES
La création d’un workfile est la première étape à accomplir. Il s’agit de l’espace de travail qui
va enregistrer tous ce que vous allez faire. La création de l’espace de travail définit le nombre
d’observations, leur fréquence (données annuelles, trimestrielles, mensuelles, journalière… ou
irrégulières) et le nombre ou les noms des variables. Il est donc nécessaire de relever ces
caractéristiques dans le cas d’une importation de données. Nous allons faire l’exercice pour
les données du fichier croissance.xls.
Les données
sont annuelles
Cliquer ici
pour valider
Date de
début Date de fin
Préciser ici la fréquence des observations des données. Ici les données sont annuelles, elles
commencent en 1965 et finissent en 2001. A noter que si les données étaient trimestrielles,
alors on aurait indiqué le trimestre après l’année en tapant par exemple 1965 :1 à 2001 :4.
EViews donne la possibilité d’entrer directement des données dans un workfile. Pour cela,
sélectionner dans le menu principal de Eviews : Objects/New Object/Series. Entrez ensuite
le nom de la série (par exemple Y).
Validez ici
Type d’Objet
Après avoir validé, la variable Y apparaît dans le workfile. Répétez ces opérations autant de
fois que vous voulez créer de séries de données. Pour le visualiser la série, faites un double-
clic sur l’icône de la série. Toutes les valeurs sont NA. Cliquez sur Edit +/- pour activer
l’entrée des données. Vous pouvez maintenant entrer les observations de la série Y. Appuyer
la touche Entrée (sur votre clavier) après chaque entrée. Avant de fermer la fenêtre de saisie,
cliquez à nouveau sur Edit +/-.
Précisez ensuite le nom du fichier à lire (ici croissance) et cliquez sur ouvrir.
Taper ici le
nombre de
variables
L’étendue des
données à
conserver
Note * : La colonne A du fichier contient les années. Le fait d’avoir déjà précisé que les
données vont de 1965 à 2001 génère automatiquement cette variable année. Les séries
commencent en réalité à partir de la colonne B, ligne 2. La cellule B1 contient le nom de la
série.
Vous venez de créer le fichier de travail. Les cinq (5) séries CRED, INVG, INVP, PIB et TIR
apparaissent bien dans le workfile. Range indique la période couverte par les séries. Sample
indique la période qui va être considérée dans les calculs.
Pour visualiser les observations d’une série, double-cliquez sur la série. Pour visualiser
l’ensemble des 5 séries, sélectionnez-les et faites Show puis validez. On peut aussi faire un
clic droit et sélectionner Open/As Group.
Attention : Le fichier Excel ne doit comporter qu’une feuille unique et non un fichier de type
« classeur » rassemblant plusieurs feuilles. De plus, les noms des séries doivent être entrés
dans Eviews dans le même ordre que l’ordre d’enregistrement dans Excel.
On peut créer des variables à partir des variables existantes par des opérations de calculs et/ou
des transformations. Pour générer de nouvelles variables, sélectionnez dans le menu principal
Quick/Generate Series ou cliquez sur Genr dans le menu du workfile, et tapez la formule de
calcul. Nous allons calculer l’investissement total, les taux d’investissement public et privé et
les logarithmes des variables. Pour l’investissement total entrez la formule comme indiquée
dans l’écran suivant :
2.5. Graphiques
Pour obtenir la représentation graphique d’une série, il faut d’abord la visualiser (en faisant
simplement double-clic sur la série). Ensuite, sélectionnez View/Graph/Line. On peut
obtenir simultanément les graphes de plusieurs séries.
350
400
400
300
250 300
300
200
200
150 200
100 100
50 100
1965 1970 1975 1980 1985 1990 1995 2000 1965 1970 1975 1980 1985 1990 1995 2000 0
1965 1970 1975 1980 1985 1990 1995 2000
INVG INVP
INVG INVP
On peut représenter un nuage de points entre deux variables. Ouvrez les deux variables et
sélectionnez, à partir du menu, View/Graph/Scatter/Simple Scatter.
400
INVP
300
200
100
50 100 150 200 250 300 350 400
INVG
Lorsque vous fermez la fenêtre graphique, vous pouvez sauvegarder votre graphique en
choisissant Name dans la boite de dialogue. Votre graphique figurera alors dans le Workfile
comme un objet graphique aux côtés des objets séries de données déjà présents.
Nous allons calculer quelques statistiques élémentaires pour les variables. Pour le faire,
sélectionnez les variables ou l’objet groupe qui contient les variables, puis visualisez (menu
Show). Une fois le groupe ouvert, sélectionnez dans la barre de menu View/Descriptives
Stats/Individual Samples.
Observations 37 37 37 37 37
Pour obtenir la matrice des corrélations empiriques entre les variables sélectionnées, activez
sur View/Correlations/Individual Samples.
Les cœfficients de corrélations empiriques permettent de voir relations linéaires entre chacune
des variables explicatives et la variable endogène et aussi entre les variables explicatives
elles-mêmes. On peut utiliser un t-test pour tester la significativité d’un cœfficient de
corrélation. C’est une étapes importante pour la régression. Rappelez-vous les conséquences
d’une multicolinéarité approchée des variables explicatives d’un modèle de régression
linéaire.
3. ESTIMATION D’EQUATIONS
Dans cette spécification, l’investissement privé (LINVP) est la variable dépendante et les
autres variables sont des variables explicatives.
La variable
endogène est suivie
de la constante et
des explicatives
La méthode utilisée
ici (et à défaut) est
les MCO
Ce tableau vous donne les principales valeurs caractéristiques d’une régression. Le menu de la
fenêtre équation, dans laquelle figure la régression, vous permet d’accéder à différents aspects
de la régression effectuée. Par exemple, si vous cliquez sur l’onglet Resids de ce menu, vous
obtenez un graphique des résidus. On peut nommer cette équation en tant qu’un objet. Cliquez
sur Name et tapez le nom (ici croissance). Pour documenter les résultats (dans un document
Word par exemple), cliquez sur View/Representations.
Estimation Command:
=====================
LS LOG(INVP) C LOG(PIB) LOG(INVG) LOG(CRED) TIR @TREND(1965)
Estimation Equation:
=====================
LOG(INVP) = C(1) + C(2)*LOG(PIB) + C(3)*LOG(INVG) + C(4)*LOG(CRED) + C(5)*TIR + C(6)*(@TREND(1965))
Substituted Coefficients:
=====================
LOG(INVP) = -18.10705271 + 4.215895662*LOG(PIB) + 0.0793417408*LOG(INVG) - 0.8686315888*LOG(CRED) -
0.005436349675*TIR - 0.08000108038*(@TREND(1965))
On peut ainsi aisément copier et coller la dernière ligne dans un document word. Pour revenir
aux résultats de la régression, cliquez sur l’onglet Stats.
Pour générer la série des résidus, sélectionnez à partir du menu de l’équation, Procs/Make
Residual Series…
Graphiques
On peut représenter sur un même graphique les valeurs théoriques de la variable dépendante,
les valeurs réelles et les résidus. Pour cela, il suffit de cliquer sur l’onglet Resids du menu de
l’équation (le dernier onglet à droite).
6.4
6.0
5.6
5.2
.3
4.8
.2
4.4
.1
.0
-.1
-.2
1965 1970 1975 1980 1985 1990 1995 2000
Test de normalité
4 Mean -2.80E-15
Median -0.013621
Maximum 0.215766
3
Minimum -0.169803
Std. Dev. 0.106578
2 Skewness 0.356915
Kurtosis 2.203583
1
Jarque-Bera 1.763411
Probability 0.414076
0
-0.1 0.0 0.1 0.2
Test d’autocorrélation
Test de Breusch-Godfrey
Les résultats ne permettent pas de rejeter l’hypothèse d’autocorrélation d’orde 1 pour un seuil
de 5%. Mais à 8% on est amené à rejeter l’hypothèse nulle.
Les coefficients estimés, les écart types et les statistiques s’interprètent de la façon habituelle.
Le coefficient estimé du terme AR(1) est le coefficient de l’autocorrélation sérielle des résidus
inconditionnels.
Nous reviendrons sur les autres méthodes itératives d’estimation par MCG (Cochrane-Orcutt,
Hildreth-Lu…) dans la séance consacrée à la programmation.
L’hétéroscédasticité qualifie des données qui n’ont pas une variance constante, i.e.
var(e) 2 . L’hétéroscédasticité ne biaise pas l’estimation des coefficients, mais l’inférence
habituelle n’est plus valide puisque les écarts-types trouvés ne sont pas les bons.
L’hétéroscédasticité est une situation rencontrée fréquemment dans les données individuelles,
il est donc important de savoir la détecter et la corriger.
Plusieurs tests se ressemblant existent pour détecter l’hétéroscédasticité. Deux de ces tests
sont le test de Breusch-Pagan et le test de White. L’idée générale de ces tests est de vérifier si
le carré des résidus peut être expliqué par les variables du modèle. Si c’est le cas, il y a
hétéroscédasticité. Dans le contexte d’un test d’hétéroscédasticité, l’hypothèse nulle est que
tous les coefficients de la régression des résidus au carré sont nuls, i.e. les variables du modèle
n’expliquent pas la variance observée donc il y a homoscédasticité. L’hypothèse alternative
est l’hypothèse d’hétéroscédasticité.
Pour chaque statistique, on a la p-value. Ici, les probabilités sont supérieurs à 5% (seuil usuel
des tests d’hypothèses) : par conséquent, l’hypothèse d’homoscédasticité ne peut être rejetée.
Les tests sur les cœfficients sont de plusieurs types. Le test de significativité globale, le test de
significativité des coefficients et le test de restrictions linéaires. Le test de significativité
globale et le test de significativité individuelle des coefficients sont faits à partir
respectivement de la statistique de Fisher et de la statistique de Student (t stat) sous
l’hypothèse de normalité des erreurs. On peut donc utiliser les p-values.
Nous allons appliquer un test de Wald pour tester l’hypothèse suivante (à titre d’exercice) :
a1 a 2 4
Tapez la contrainte. Les coefficients associés aux variables explicatives sont notés par C(1)
pour la constante, C(2) pour PIB, C(3) pour INVG etc. La lettre « c » qui apparaît ainsi dans
le workfile représente le vecteur des cœfficients C(1), C(2), C(3) etc.
Wald Test:
Equation: EQ01
Test Statistic Value df Probability
F-statistic 0.715968 (1, 31) 0.4040
Chi-square 0.715968 1 0.3975
Tests de stabilité
Il existe plusieurs tests de stabilité d’un modèle. Le test de stabilité de Chow effectue un test
de Fisher en comparant les estimations des coefficients sur deux ou plusieurs périodes. Nous
allons réaliser un test de Chow en considérant les deux périodes 1965-1993 et 1994-2001.
La statistique de Fisher reporte une probabilité inférieure à 5% : on ne peut donc accepter au
seuil de 5% l’hypothèse de stabilité des coefficients. La dévaluation de 1994 a donc introduit
un changement structurel significatif dans le comportement des grandeurs macroéconomiques
de l’économie étudiée.
Un autre moyen de tester la stabilité du modèle est d’analyser les résidus récursifs du modèle.
Si le modèle est stable, les résidus récursifs sont indépendamment et normalement distribués,
de moyenne nulle et d’écart type constant. On peut également mettre en œuvre les tests
CUSUM (cumulative sum ) et CUSUMSQ (cumulative sum of squares). Le CUSUM utilise la
somme cumulée des résidus récursifs tandis que le CUSUMSQ utilise le carré des résidus
récursifs. Ces tests offrent l’avantage par rapport au test de Chow de ne pas connaître a priori
la date de rupture.
Pour mettre en œuvre ces tests récursifs, sélectionnez, à partir du menu de l’équation,
View/Stability Tests/Recursive Estimates…
.4
20
1.6
.3
15
.2 10 1.2
.1 5
0.8
0
.0
-5 0.4
-.1
-10
-.2 0.0
-15
-.3 -20 -0.4
1975 1980 1985 1990 1995 2000 1975 1980 1985 1990 1995 2000 1975 1980 1985 1990 1995 2000
Les statistiques obtenues sortent de la bande critique à 5% pour les résidus récursifs et le test
CUSUMSQ. Mais il s’agit plus d’un choc conjoncturel que d’un changement structurel.
NB. On remarquera que les tests récursifs ne sont faisables que lorsque le modèle est estimé
par moindres carrés ordinaires et sans termes AR et MA.
3.4 Prévision
Nous avons estimé une équation d’investissement sur la période 1965-2001. Nous allons faire
des prévisions au delà de l’année 2001, c’est-à-dire pour la période 2002-2005. Pour cela, la
taille du workfile (Range) et celle de l’échantillon (Sample) doivent être étendues. Pour faire
ces prévisions suivez les étapes indiquées ci-après :
Bien que le modèle estimé soit spécifié sous la forme logarithmique, il est possible de prévoir
directement les valeurs de la série en niveau pour l’horizon temporelle définie. La série des
prévisions est nommée en ajoutant la lettre F (pour Forecast) au nom de la série à prévoir. Ici
cette série prend le nom INVPF. Il est possible de la renommer autrement.
Par ailleurs, la méthode de prévision peut être statique ou dynamique. La méthode dynamique
utilise les valeurs passées de la variable indépendante, soit INVP(-1) pour former la prévision
de la période suivante. Pour la première observation, ces deux méthodes donnent la même
prévision. Le graphique donne l’évolution de la variable INVPF sur toute la période 1965-
2005. Les statistiques figurant à droite du graphique permettent de procéder à une évaluation
de la qualité de la prévision.
L’estimation des modèles à équations simultanées passe d’abord par une phase
d’identification. Pour qu’une équation structurelle soit identifiée il faut que le nombre
d’exogènes exclues de l’équation soit supérieur ou égal au nombre d’endogènes présentes
moins 1. Cette condition est remplie pour les deux équations ci-dessus. Le modèle est sur-
identifié. Nous allons appliquer la méthode des doubles moindres carrés en utilisant
l’ensemble des variables exogènes comme instruments.
Après avoir écrit le modèle, vous pouvez l’estimer en cliquant sur l’onglet Estimate de la
fenêtre system. Une boite de dialogue vous demande alors de choisir la méthode
d’estimation. Et c’est là que vous devez commencer à réfléchir afin de choisir la méthode
adéquate. Etant données les conditions d’identification, nous choisissons ici la méthode des
doubles moindres carrés.
Dérouler ici
pour choisir
la méthode
Choisisser
TSLS
Les séries chronologiques se distinguent des données en coupe transversale par le fait qu’elles
possèdent un ordre chronologique. Une série chronologique est en fait le résultat d’un
processus stochastique indexé en fonction du temps. Plusieurs problèmes sont propres aux
séries chronologiques, notamment en raison de la corrélation entre les observations
(autocorrélation) et de la possibilité de changement du processus générateur de données d’une
époque à l’autre. Les sections qui suivent adressent la question de comment s’assurer que l’on
peut travailler avec nos données chronologiques.
Les modèles à retards échelonnés autorisent les variables retardées à figurer en explicatives.
La spécification du modèle sous EView se fait en ajoutant les retards des variables
concernées. Considérons le modèle d’investissement de la forme suivante :
Pour travailler avec des données temporelles, elles doivent conserver une distribution
constante dans le temps. C’est le concept de stationnarité. Si les données ne sont pas
stationnaires, on se retrouve avec:
mauvaise inférence
biais de prévision
prévision inefficace
Tendance déterministe : Les données suivent une tendance qui a une fonction définie
(linéaire, quadratique, etc.). Afin de résoudre le problème, il suffit d’inclure une variable de
tendance dans le modèle de régression. Toutefois, en pratique il convient de ne pas traiter une
tendance stochastique comme une tendance déterministe.
Tendance stochastique : Les données suivent une marche aléatoire avec ou sans dérive avec
un coefficient de 1 pour le terme autorégressé : y t y t 1 u t . Il y a non-stationnarité car la
variance n’est pas constante: V var( y t ) t u2 .
Le test de Dickey-Fuller (DF) teste s’il y a une racine unitaire dans le processus générateur de
données. La loi de DF sur laquelle le test se base diffère en fait selon l’hypothèse alternative
qu’elle teste. Le choix de l’hypothèse alternative est donc primordial pour la validité du test.
Ce choix doit se baser sur l’analyse de l’économètre.
Le test de de Phillip-Perron (PP) offre une correction non paramétrique des statistiques de DF
pour prendre en compte des erreurs hétéroscédastiques.
Précisez
Séminaire lessur Eviews–GPE Octobre 2010
de formation Yaya KEHO 27
termes
déterministes
Note* : Le choix du nombre de retard est important pour le test. EViews procède à la
sélection automatique du nombre de retard optimal en utilisant les critères d’information
usuels. Toutefois, EViews donne la possibilité à l’utilisateur de spécifier un nombre de retard.
Le deuxième tableau indique le modèle à partir duquel le test est conduit. On peut ainsi juger
de la pertinence des termes déterministes à inclure dans la régression auxiliaire (Attention :
les valeurs critiques ne sont pas standard).
Un modèle VAR est un modèle autorégressif dans lequel la valeur contemporaine d’une
variable dépend de ses valeurs passées et des valeurs passées des autres variables. Ici il n’y a
pas de variables exogènes et de variables endogènes. Toutes les variables du VAR sont
supposées endogènes. Cependant, l’on peut ajouter au modèle des variables qui soient
exogènes.
Nous allons estimer un VAR (1) pour les variables en différences. Sélectionnez le groupe de
variables, faites un clic droit et sélectionnez as VAR…
Liste des
variables du
VAR
Entrez ici le
nombre de
retards du VAR
Pour nommer cet objet, cliquez sur Name dans le menu. L’estimation du VAR est équivalente
à la régression par les MCO de 5 équations. Ainsi les résultats présentés dans ce tableau
peuvent être considérés comme une compilation de ces 5 régressions.
Tous les tests d’hypothèses portant sur les résidus peuvent s’effectuer dans le cadre des
modèles VAR. Ces tests prennent la forme de tests multivariés (test de normalité, test
d’autocorrélation, test d’hétéroscasticité…).
Pour déterminer l’ordre optimal du VAR, il est possible de calculer les critères d’information
pour des ordres différents puis de retenir l’ordre qui minimise ces critères. Sélectionnez
View/Lag Structure/Lag Lenght Criteria…, puis indiquer l’ordre maximal.
D’une façon générale, les coefficients d’un modèle VAR ne peuvent être directement
interprétés. On s’intéresse alors à la significativité globale des coefficients associés à une ou
un groupe de variables. C’est l’idée du test de causalité de Granger. La mise en œuvre de ce
test n’est pas la même dans le cas bivarié et dans le cas multivarié.
Cas bivarié
On s’intéresse à la causalité entre les variables prises deux à deux. L’analyse porte sur
l’estimation d’un VAR à deux variables où l’influence des autres variables n’est pas prise en
compte. Pour réaliser ce test, ouvrez d’abord le groupe de variables (sélection puis clic droit)
puis sélectionnez à partir du menu View/Granger Causality… puis spécifiez le nombre de
retards à considérer.
En pratique, cette façon de procéder n’est pas toujours la bonne. En effet, on a supposé que le
nombre de retards optimal pour le VAR multivarié (5 retards) est le même pour tous les
modèles bi-variés. Ce qui n’est pas toujours le cas : l’ordre optimal d’un VAR à 5 variables
n’est pas forcement optimal pour un VAR à deux variables. Il est plus juste de déterminer les
retards pour chaque couple de variables et d’effecteur le test de causalité à partir de ces
retards. On effectue le test par couple de variables et séparément.
Cas multivarié
Le test de causalité porte sur les résultats de l’estimation du VAR à 5 variables. Selectionnez
View/Lag Structure/Pairwise Granger Causality Tests.
Pour la variable dépendante LPIB, le tableau donne pour chaque variable la statistique de
Wald du test de nullité simultanée des coefficients associés aux retards. Par exemple, pour la
variable LINVP la statistique de test donne une valeur de 10,47368 et une probabilité
inférieure à 5%. L’hypothèse de non causalité de LPIB par LINVP ne peut donc être retenue
au seuil de 5%. De même, on note que le crédit au secteur privé et le taux d’intérêt réel
causent chacune le PIB. L’investissement public ne cause pas le PIB.
La dernière ligne du tableau (ALL) donne la statistique du test de la non causalité du bloc
constitué par les quatre variables (LINVP, LINVG, LCRED et TIR). La valeur de la p-value
associée à ce test indique que les quatre variables prises ensemble causent le PIB (rejet de
l’hypothèse nulle de non causalité).
L’analyse impulsionnelle permet de simuler les réponses des variables du VAR suite aux
chocs d’innovations sur certaines variables. Sélectionnez View/Impusle Response…
On peut aussi directement cliquer sur l’onglet impulse dans le tableau des estimations.
Dans l’onglet Impulse Definition, vous pouvez choisir la méthode de factorisation. Par défaut
la méthode de factorisation est celle de Cholesky. Cliquez ensuite sur OK pour valider.
.06 .3
.04 .2
.02 .1
.00 .0
-.02 -.1
-.04 -.2
-.06 -.3
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
L’analyse des variances fournit des informations quant à l’importance relative des innovations
dans les variations de chacune des variables du VAR. Elle nous permet de déterminer dans
quelle direction le choc a le plus d’impact. Pour obtenir la décomposition de la variance,
sélectionnez à partir du menu, View/Variance Decomposition….
Sélectionnez puis ouvrez le groupe de variables. Puis entrez le nombre de retard. Sélectionnez
dans le menu du group View/Cointegration Test…
Le test de Johansen offre la possibilité de choisir entre plusieurs spécifications. L’option 6 fait
un résumé des 5 spécifications proposées par le test. En choisissant celle-ci, on obtient les
résultats suivants :
On peut ainsi lire le nombre de relations de cointégration suivant l’hypothèse faite pour la
spécification du modèle. Par exemple, si on suppose qu’il n’y a aucune tendance dans les
séries, la présence d’un terme constant dans les relations de cointégration conduit à retenir,
selon la statistique de la trace, l’hypothèse de deux relations de cointégration entre les cinq
variables au seuil de 5%. La statistique de la valeur propre maximale (Max-Eig) conduit à une
seule relation de cointégration.
6. UN PEU DE PROGRAMMATION
Un programme n’est pas un objet-Eview. C’est simplement un fichier texte contenant des commandes
d’Eviews. En conséquence, il n’apparaît pas dans le workfile.
Pour exécuter cette commande, cliquez sur Run. Enregistrez le programme et validez. La
variable est automatiquement créée dans le workfile. Générez les logarithmes des séries et le
temps.
Une ligne commençant par le symbole ‘ est une ligne de commentaire. Elle est ignorée lors de
l’exécution du programme.
6.3. Utiliser les statistiques d’une régression pour faire des calculs
Pour renvoyer par exemple le t-stat du coefficient de LINVG dans l’équation eq12, tapez :
Scalar t_invg=eq12.@tstats(3)
t_invg=eq12.c(3)/eq12.@stderrs(3)’(eq12.c(3)/eq12.@ covariance(3,3)
Scalar te=@abs(t_invg)
Scalar ddl=eq12.@regobs-eq12.@ncoef (ncoef= nombre de coefficients estimés)
( regobs=nombre d’observations)
p_val_invg=@tdist(te,ddl)
Next
Programme du test
genr pond=1/sqr(z) ‘ne pas oublier que la pondération affecte aussi la constante
genr yp=y*pond
genr zp=x*pond
equation pond1.ls yp zp pond
‘on peut utiliser la commande de la régression pondérée
equation pond.ls(w=pond) y c z
Nous allons tester l’exogénéité du PIB dans l’équation d’investissement à l’aide du test
d’Hausman. La programmation suit la procédure de Holly-Sargan.
Smpl 1965 2001 '(ou smpl @all)
On peut programmer ainsi le test d’exogénéité pour chacune des variables du modèle.
Equation eq1.tsls linvp c lpib linvg lcred tir temps @ linvp(-1) linvg
lcred tir
On veut par exemple calculer les coefficients de régression linéaire à partir de l’expression
analytique :
aˆ ( X ' X ) 1 X ' Y
Sélectionnez le groupe des variables explicatives LPIB, LINVG, LCRED, TIR et nommez-le
par GX.
Matrix xpx=@transpose(convert(GX))*@convert(GX)
Matrix xpy=@transpose(@convert(GX))*convert(Y)
Matrix a=@inverse(xpx)*xpy
Variables de « Contrôle »
Les variables de contrôle sont des variables qui peuvent être utilisées à la place des valeurs
numériques dans un programme d’Eviews. Une fois qu’une valeur est assignée à une variable
de contrôle, on peut l’utiliser partout dans le programme en lieu et place de la valeur
numérique. Le nom d’une variable de contrôle commence toujours par la marque " ! ". Après
cette marque, on peut donner n’importe quel nom acceptable.
Une variable de contrôle ne peut être utilisée sans être préalablement déclarée.
Les variables de contrôle ne sont pas enregistrées dans le workfile ; elles n’existent
uniquement que dans le programme. Cependant, il est possible de sauver les valeurs
numériques des variables de contrôle en créant de nouveaux objets qui contiendraient ces
valeurs.
Un string est un texte bouclé par deux quotes " ". Exemple : ″ on rejette l’hypothèse nulle″.
Une variable de type string est une variable dont les valeurs sont des textes. La déclaration de
ces variables se fait en précédant le nom par le symbole %.
Une fois assignée une valeur, une variable string peut être utilisée dans les expressions. On a:
LINVP.Label %invp, Smpl %Mysample, Equation eq1.ls %dep c %dep(-1), Equation eq2.ls
%dep c %dep(-1) %ARMAS.
Une variable string assignée à un nombre peut être convertie en un nombre à l’aide de la
fonction @val. Par exemple: %pi=″3.14159″.
!valeur = @val(%pi)
Variables de « remplacement »
Dans ce contexte, la variable string %X est utilisée comme une variable de remplacement
parce qu’elle est remplacée dans le programme par son contenu.
Les variables de remplacement peuvent être utilisées pour former des mots. Dans ce cas, elles
doivent être mises en parenthèses. Exemple : %Type="Bas", %NVAR="Revenu", Series
REV1, REV1.Label {%NVAR} {%Type} %Type="Elevé", Series REV2, REV2.Label
{%NVAR}{%Type}. Ici, le commentaire "Revenu Bas" est utilisé pour labelliser la série
REV1 et "Revenu Elevé " pour labelliser la série REV2. Dans ces exemples, le terme
{%NVAR}{%Type} est une variable de remplacement puisque la commande est construite
en remplaçant les variables string par leurs contenus.
Les variables de contrôle peuvent aussi être utilisées comme variables de remplacement.
Considérons l’exemple, GENR Y{!X}=NRND où !X est une variable de contrôle. Si !X=1,
cette ligne de commande est interprétée comme GENR Y1=NRND. Si %X=99 alors la
commande signifie GENR Y99=NRND.
Un usage important des variables de remplacement concerne la construction de noms d’objets.
Exemple : !A=1, %B=2, %C="VAR", series X{!A}, matrix X{%B}, vector X_{%C}IABLE.
Ici nous avons déclaré une série nommée X1, une matrice nommée X2 et un vecteur nommé
X_VARIABLE. Pour appeler une variable de remplacement, on a besoin d’utiliser des
parenthèses. Par exemple, si on cherche le nombre d’observations valides dans une série
labellisée REVENU, on peut utiliser la fonction @obs : @obs(REVENU). Si nous voulons
utiliser la variable string %VAR pour indiquer la série REVENU, la syntaxe exacte est
%VAR="REVENU", @obs({%VAR}). La fonction @obs(%VAR) renverrait une erreur de
syntaxe car la fonction @obs s’applique à une série et non à une variable string comme
argument.
Pour contrôler l’exécution d’un programme on est souvent amené à recourir aux commendes
de contrôle. Ces commandes permettent en effet d’exécuter de façon sélective des
commandes. La commande IF exécute un ensemble de commandes si une certaine condition
est satisfaite. La boucle FOR répète un ensemble de commandes pour un nombre fixé de
temps. La boucle WHILE répète un ensemble de commandes aussi longtemps qu’une certaine
condition est vérifiée.
La Commande IF
Un programme peut contenir ELSE pour indiquer les commandes à exécuter si la condition
est fausse. Si la condition est VRAIE, toutes les commandes avant ELSE seront exécutées. Si
la condition est fausse, toutes les commandes entre ELSE et ENDIF seront exécutées.
Exemple : IF !x>0 THEN
GENR NAGE=AGE/!x
ELSE
GENR NAGE=AGE
ENDIF
IF peut aussi s’appliquer aux variables string :
IF %x=″CA″ OR %x=″IN″ THEN
GENR STATID=1
ELSE
IF %x=″MA″ THEN
GENR STATID=2
ELSE
IF %x=″ID″ THEN
GENR STATID=3
ENDIF
ENDIF
ENDIF
La boucle FOR permet de répéter un ensemble de commandes pour différentes valeurs d’une
variable de type contrôle ou string. La boucle FOR commence avec la déclaration FOR et
finie avec la déclaration NEXT. Entre ces deux mots peuvent se trouver n’importe quel
nombre de commandes qu’on désire exécuter.
La syntaxe de la boucle FOR diffère selon qu’elle utilise des variables de contrôle ou des
variables string.
Lorsqu’on veut répéter des déclarations pour différentes valeurs d’une variable de contrôle,
FOR implique de poser l’égalité d’une variable de contrôle à une valeur initiale, suivie du mot
TO, et alors d’une valeur finale. Après la valeur finale, l’on peut inclure le mot STEP suivi
d’un nombre indiquant comment changer la variable de contrôle à chaque fois que la boucle
est exécutée. Si on n’indique pas STEP, il est pris égal à 1. Exemples :
FOR !j=1 TO 100
SERIES DECILE{!j}=(REVENU<LEVEL{!j})
NEXT
Dans cet exemple, STEP=1 et la variable !j est utilisée deux fois comme une variable de
remplacement, d’abord pour les 100 séries DECILE1 à DECILE100 et pour les 100 variables
LEVEL1 à LEVEL100.
FOR !j=100 TO 1 STEP -1
GENR RESCALE{!j}=REVENU/ !j
NEXT
Dans ce exemple, STEP =-1 et !j est utilisée comme une variable de remplacement pour
nommer les 100 variables RESCALE100 à RESCALE1, et comme un scalaire dans la
division de la série REVENU.
La boucle FOR est exécutée d’abord pour la valeur initiale, à moins que cette valeur excède la
limite supérieure. Après avoir exécuté pour la valeur initiale, la variable de contrôle est
incrémentée par STEP et Eviews contrôle si elle dépasse la limite ; si c’est le cas, l’exécution
est stoppée.
!SUM=0
!NUM=100
VECTOR(!NUM) X
FOR !I=1 TO !NUM
!SUM=!SUM+X(!I)
NEXT
SCALAR MEANVAL=!SUM/!NUM
MATRIX(20,10) XX
FOR !I=1 TO 20
FOR !J=1 TO 10
XX(!I,!J)=(!I-1)*10+!J
NEXT
NEXT
Dans cette suite de commande, la variable de contrôle change de valeur. Cela est difficile à
suivre et peut avoir des résultats non souhaités. Si on veut changer la variable de contrôle dans
la boucle, on peut utiliser la boucle WHILE.
Vous pouvez exécuter une boucle FOR avec des scalaires au lieu de variables de contrôle.
Cependant vous devez déclarer le scalaire et ne pas l’utiliser comme une variable de
remplacement. Exemple :
SCALAR I
SCALAR SUM=0
VECTOR(10) X
FOR I=1 TO 10
X(I)=I
SUM=SUM+I
NEXT
Dans cet exemple, les scalaires I et SUM restent dans le Workfile à moins de les supprimer.
Lorsqu’on veut répéter des déclarations pour différentes valeurs d’une variable string, on peut
utiliser la boucle FOR pour permettre à une variable string de courir une liste de valeurs
string. Donnez le nom de la variable string suivi de la liste des valeurs. Exemple :
Dans certains cas, on souhaite répéter une série de commandes plusieurs fois, mais
seulement tant qu’une ou plusieurs conditions sont satisfaites. Comme la boucle FOR, la
boucle WHILE vous permet de répéter des commandes, mais WHILE offre une plus
grande flexibilité dans la spécification des conditions. La boucle WHILE débute avec une
déclaration WHILE et se termine avec le mot WEND. La déclaration consiste en la
commande WHILE suivie d’une expression impliquant une variable de contrôle.
L’expression doit avoir une valeur logique (TRUE/FALSE) ou une valeur numérique.
Dans ce dernier cas, zéro indique FALSE et toute autre valeur non nulle est considérée
comme TRUE. Exemples :
!VAL=1
!A=1
WHILE !VAL<10000 AND !A<10 THEN
SERIES REV{!VAL}=REVENU/!VAL
!VAL=!VAL*10
!A=!A+1
WEND
Cette boucle comporte quatre parties. La première partie est l’initialisation des variables
de contrôle utilisées dans les conditions. La seconde partie est la déclaration WHILE qui
comprend les conditions et se termine par THEN. La troisième partie est la mise à jour des
variables de contrôle. Finalement la fin de la boucle est marquée par le mot WEND.