Vous êtes sur la page 1sur 7

Econométrie des séries temporelles multi-variées

Université Paris Nanterre

M1 EA et MBFA-GDA

2023-2024

Fiche de travail pour la séance de TD 1 : Travail préparatoire pour l’estimation d’un VAR bi-varié

1) Préparation du dossier de travail et du script R.

a- Créez un nouveau dossier sur le bureau nommé « ScriptTD ».

Ouvrez R. Déclarez ce nouveau dossier comme étant votre « working directory » (dossier de travail).
Vous pouvez cliquer sur « Session » dans le menu en haut à gauche -> « Set working directory » ->
« Choose directory » et sélectionner le dossier en question.

Ou vous pouvez utiliser la commande setwd (c’est-à-dire « set working directory »).

Par exemple :

setwd(“C:/Users/pauli/OneDrive/Bureau/ScriptTD”)

Pour récupérer le chemin d’accès vers votre dossier de travail : touche Shift + clic-droit (copier en
tant que chemin d’accès).

[\ transformés en /].

b-
c- Créez un script R (là où vous allez enregistrer toutes les commandes).

En haut à droite : File-> New File -> R Script. Enregistrez ce script dans votre dossier de travail
sous le nom « TD1 ».

Attention : Toutes les commandes doivent désormais être tapées et enregistrées dans le script
pour pouvoir les réutiliser directement les fois suivantes.

2) Récupération des données

a- Connectez-vous sur le site de statistiques de l’OCDE à l’adresse suivante :


https://stats.oecd.org/ (vous pouvez changer la langue du site en haut à droite pour
l’avoir en français) et téléchargez les données trimestrielles du taux de croissance annuel
du PIB réel (approche par les dépenses) et d’Indice des prix à la consommation en France
sur la période 1999 (Q1)-2019(Q4) au format Excel.

Aide : les données pour le PIB doivent être cherchées dans la catégorie «Comptes Nationaux
Trimestriels» et les données pour l’indice des prix à la consommation dans la catégorie « Prix et
parités de pouvoir d’achat (PPA) ».
Le sujet à sélectionner pour le PIB est « Taux de croissance trimestriel du PIB réel » et il faut
sélectionner la série calculée sur les données en volume et corrigées des variations saisonnières
(série GYSA). Le sujet à sélectionner pour l’indice des prix à la consommation est « Indice des prix à la
consommation – Inflation annuelle » (IPC total, en glissement annuel, série IPC 01-12-Total).

Il faut cliquer sur « Personnaliser » pour sélectionner uniquement les données qui vous intéressent.

Pour vérifier que vous ne vous êtes pas trompé dans la sélection : la première valeur doit être égale à
2,8 et la dernière valeur doit être égale à 1,0 pour le PIB (respectivement 0,3 et 1,1 pour l’indice des
prix à la consommation).

b- Copiez-collez les deux séries de données dans un nouveau fichier Excel à côté d’une
colonne de dates (en utilisant la transposition). Arrondir au premier chiffre après la
virgule. Sur la première ligne du fichier, introduisez les noms de chaque colonne : Date,
IPC et PIB. Enregistrez le fichier au format csv (séparateur : point-virgule) sous le nom
IPCPIB dans votre dossier de travail.

c- Pourquoi sélectionne-t-on la série du PIB corrigée des variations saisonnières ?

Le PIB est une variable qui présente des variations saisonnières (on a des patterns de
hausse ou de baisse régulières sur des périodes régulières comme le nouvel an, Noël et
cela vient biaiser nos variables). (…)

d- Quelle est la spécificité de la période étudiée, qui pourrait poser des problèmes
éventuels ? ……………………………………………………………………………………………………………………….
Nous avons la crise des subprimes qui génèrent un break/rupture structurelle (qui a
provoqué des changements durables …) (…)
Instabilité (…)

e- Pourquoi a-t-on volontairement exclu la période 2020-2023 ?


Car c’est une période qui prend en compte la guerre du COVID et la guerre en UKRAINE
qui sont des périodes très spécifiques (…)

f- A quoi correspond le début de la période d’étude ?

1999 : création de l’euro qui a générer de l’inflation -> changements de monnaies donc
estimations plus complexes.

g- Combien d’observations avons-nous ? Cela vous semble-t-il suffisant ? Nous avons 84


observations qui est très peu (84 observations : voir dans le tableau VAR1 par exemple,
sur la dernière ligne). (…) à peu près d’une trentaine d’observations.
3) Importation des données sous R
a- Importez votre fichier csv dans R et enregistrez les données sous le nom « VAR1 » en tapant
la commande suivante dans le script : (pour exécuter la commande, il faut la sélectionner et
faire « run »).

VAR1<-read.csv("IPCPIB.csv",header=T,dec=",",sep=";")

Que signifie chacun des termes dans la commande ci-dessus ?

- VAR1 : pour VAR1 (pour VAR uni-varié)


- ("IPCPIB.csv") : nom du fichier (avec des guillemets car « strings »
- Read.csv : importer au format csv et lire la base de données « csv » sur R
- Header=T : la première ligne est le titre des colonnes (T=TRUE : elle nous indique « est-ce
que la première ligne de notre base données contient des en-têtes -> si oui alors on mettre T
pour TRUE sinon on aura mis F pour FALSE)
- Dec = « , » : les décimales sont séparées par des virgules (car en anglais, les décimales sont
avec des points, on lui indique que nous voulons un séparateur avec une virgule).
- Sep = « ; » : le séparateur des colonnes est le point-virgule

Déclarez la nature temporelle des variables.

IPC_t<-ts(VAR1$IPC,start=c(1999,1), end=c(2019,4), frequency=4)

PIB_t<-ts(VAR1$PIB,start=c(1999,1), end=c(2019,4), frequency=4)

Que signifie chacun des termes dans la commande ci-dessus ?

- On va chercher la valeur IPC dans la VAR1, avec comme date de départ le premier trimestre
de 1999 et comme date de fin le dernier trimestre de 2019. On utilise la fonction « ts » qui
est fonction pour manipuler les séries temporelles (« ts » pour séries temporelles) et on
assigne tout ça dans une nouvelle variable « IPC ».
- On va chercher la valeur PIB dans la VAR1, avec comme date de départ le premier trimestre
de 1999 et comme date de fin le dernier trimestre de 2019. On utilise la fonction « ts » qui
est fonction pour manipuler les séries temporelles (« ts » pour séries temporelles) et on
assigne tout ça dans une nouvelle variable « PIB ».

La commande « ts » pour déclarer la nature temporelle des variables.


Dans la base de données VAR1, on va chercher la variable IPC (par l’intermédiaire du signe $)
Start = pour définir la première période
End = pour définir la dernière période
Frequency = pour définir la fréquence, ici données trimestrielles donc 4, si c’était mensuelle
alors on aurait mis 12 !
4) Analyse des données

Travail de visualisation : IPC_t et PIB_t sont les variables que nous avons choisies après les avoir
déclarer comme étant des variables temporelles.

a-

View(VAR1)
plot(IPC_t)
plot(PIB_t)

Les séries étudiées ont-elles l’air stationnaires ? Pourquoi ? Formulez des hypothèses sur leur ordre
d’intégration.

- Les séries ne semblent pas être stationnaire en moyenne ni en variance : il faut donc prendre
le « log » et la différence première de ces deux séries pour les rendre stationnaire.
- On remarque les séries semblent être fortement volatils
- Les séries sont donc intégrées d’ordre 1 car il faut les différencier une fois (prendre la
différence première une fois pour les rendre stationnaire). IPC -> I(1) et PIB -> I(1)

IPC_t (interprétations)

Notre série : taux de croissance annuel (qui sont en générale stationnaires (…))

Stationnarité en moyenne : on remarque que la série semble revenir en moyennes (retour à la


moyenne)

Stationnarité en variance : changement de la variance après la crise financière (possibilité que cette
série soit stationnaire (pq ? …) -> break structurelle après la crise de 2008

Le graphique semble ambigu (…) extrêmement divergente.

PIB_t (interprétations)

(…)

La série semble être stationnaire en variance et en moyenne sauf pendant la rupture structurelle
causée par la crise des subprimes

Pour l’examen : les interpréations sont subjectives du coup il faut juste avoir un raisonnement
cohérent et commenter nos interprétations après avoir fait les tests

b- L’autocorrélogramme total semble-t-il confirmer votre diagnostic initial ?

acf(data.frame(IPC_t),lag.max=25, main="ACF pour IPC")

acf(data.frame(PIB_t),lag.max=25, main="ACF pour PIB")

……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
c- Mettez en œuvre la procédure séquentielle du test de Dickey-Fuller augmenté pour tester la
stationnarité des séries en niveau, en utilisant la table fournie sur Cours en ligne. Quelle est
votre conclusion pour chacune des deux séries ? Que préconisez-vous alors de faire ?

Si vous n’avez encore jamais installé le package urca : install.packages("urca"). Vous pouvez aussi
faire Tools-> install packages dans R studio.

library(urca)

IPC_t_ru<-ur.df(IPC_t,type='trend',selectlags="AIC")

summary(IPC_t_ru)

ur.df : test de racine unitaire (unit root dickey fuller) ; type = trend (modèle avec tendance), summary
pour afficher les résultats.

- La tendance correspond à « tt »

IPC_t_ru_2<-ur.df(IPC_t,type='drift',selectlags="AIC")

summary(IPC_t_ru_2)

IPC_t_ru_3<-ur.df(IPC_t,type='none',selectlags="AIC")

summary(IPC_t_ru_3)

PIB_t_ru<-ur.df(PIB_t,type='trend',selectlags="AIC")

summary(PIB_t_ru)

PIB_t_ru_2<-ur.df(PIB_t,type='drift',selectlags="AIC")

summary(PIB_t_ru_2)

PIB_t_ru_3<-ur.df(PIB_t,type='none',selectlags="AIC")

summary(PIB_t_ru_3)

Interprétations : (à réécouter)
On a va tester la significativité de la tendance dans le modèle avec constante et tendance

……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………

d- Qu’aurait-il fallu faire si le résultat avait été différent ?

Avant tout il aurait fallu faire un test de cointégration. Si les séries sont cointégrées on peut les
laisser en niveau. Sinon on aurait du stationnariser les séries en différence première ou en taux de
croissance qui a plus de signification économique (que la différence première). Si la différence
première n’est pas stationnaire on différencie une deuxième fois.

5) Transition vers l’estimation d’un VAR bi-varié

a- On veut estimer un VAR sur la période 1999-2019 pour étudier les relations entre le taux
d’inflation et le taux de croissance du PIB. Pourquoi la modélisation VAR peut-elle être
pertinente ici, notamment par rapport à l’estimation d’un modèle de régression linéaire
contemporain ?

Intérdépendance dynamiques entre les varibales inflation et PIB. Les retards de l’inflation et du PIB.

Forme d’endogénité, les retards du PIB affectent l’inflation.

L’inflation peut affecter la croissance éco car elle augmente les cout de production pour les
entreprises et entraine une perte du pouvoir d’achat et réduit la demande des ménage et
l’investissement des entreprises qui peuvent être retardées dans le temps. Pas de relation
contemporelle entre les variables c’est seulement les effets retardés de l’une sur l’autre. On s’attend
à ce que l’inflation affcete négativement le PIB. Egaleùent le PIB peut influé sur l’inflatipon (courbe
de Phillips). Si on a une ahusse de la croissance (hausse de l’investissement des entreprise, hausse de
consommation des ménage et hausse des prix) ce qui entraine une inflation. Les prix sont rigides à
courts termes donc l’infaltion peut mettre du temps à arriver d’ou l’interet des effets retardés.

On s’interesse à la dynamique des variables (retards = effets dynamiques : ce qui se passe


aujorud’hui sur le futur). C’est interessant de faire un processus VAR si on peut faire de la prévision,
si on veut prévoir ces deux varibales.

On peut également condurie une analyse de choc, s’interesser à la propagation dans le temps des
effets du choc.

Avant d’utiliser un VAR, on commence toujours pas le modèle le plus simple (modèle OLS : regression
linéaire simple : une seule variable) et on réaffine.
b- On lie les deux séries en vue de l’estimation du VAR bi-varié que l’on réalisera lors de la
séance suivante.

VAR1_group<-cbind(IPC_t, PIB_t)

View(VAR1_group)

c- Que peut-on dire sur la relation contemporaine entre ces deux variables ?

MCO<-lm(IPC_t~PIB_t)

summary(MCO)

lm qui permet de faire une regression linéaire multiple.

Ici la variable expliquée est le taux d’inflation et la variable explicative est la croissance.

On voit que le coefficient est bien significatif et positif. Cela concorde avec ce que nous avons prédis.
Il y a bien une relation entre la hausse de l’inflation et celle du PIB. La hausse du PIB entraine une
hausse de l’inflation.

Pour la séance de TD suivante, vous devez être capable de refaire tourner directement toutes les
commandes présentées dans cette séance, afin de pouvoir repartir directement de l’estimation du
VAR bi-varié, d’où l’intérêt de sauvegarder toutes les commandes dans un script.

Vous aimerez peut-être aussi