Vous êtes sur la page 1sur 130

INSTITUT DES HAUTES ETUDES À TUNIS ANNÉE UNIVERSITAIRE 2020-2021

Logiciel
d’Économétrie des Séries
temporelles
Master Professionnel en Administration des affaires
Master Professionnel en Ingénierie financière

1
Plan du cours

• Chapitre 1: Introduction au logiciel Stata

• Chapitre 2: Introduction aux séries temporelles

• Chapitre 3: Les modèles linéaires de séries temporelles

2
Chapitre 1
Introduction au logiciel Stata

3
La meilleure façon d’apprendre
à utiliser un nouveau logiciel
c’est la pratique!

4
Les fenêtres de Stata

5
Les fenêtres de Stata
Stata se présente sous la forme de 4 fenêtres :

 Review : affiche l'historique des commandes tapées par l'utilisateur et permet


d'en rappeler facilement.

 Results : utilisée pour afficher tous les résultats des commandes tapées par
l'utilisateur.

 Variables : détaille toutes les variables présentes dans la base de données


actuellement ouverte dans Stata .

 Command : permet à l'utilisateur d'entrer les commandes.

6
On trouve au dessus de ces fenêtres une barre de menu, permettant d’exécuter les

commandes les plus courantes sous Stata sans avoir à se servir de la fenêtre Command. On

trouve par exemple deux icônes permettant d’afficher la base de données (Data Editor ou

Data Browser), commandes également accessibles par le biais du menu (Data/Data Editor

ou Data/Data Browser) et directement à partir de la fenêtre de commandes (edit ou browse).

De même, l’ouverture du Do-File Editor peut se faire en appuyant sur l’icône

correspondante dans la barre de menu, en sélectionnant dans le menu Data/Do-file

Editor/New file, ou en entrant doedit dans la fenêtre Command. L’utilisation de ces barres

de menu est donc facultative, et finalement assez rare lorsqu’on utilise Stata. 7
8
Création d'un répertoire de travail

L'utilisation de Stata nécessite une base de données et un fichier do. Nous verrons par la
suite qu'il est possible de créer des fichiers de résultats (log, résultats de régressions,
graphiques). Afin de ne pas disperser ces fichiers et de ne pas devoir indiquer le chemin
des fichiers à chaque fois, il est utile de créer un répertoire de travail en début de son
fichier do.
cd "C:\Formation Stata\Espace de travail "
Ainsi, par la suite, si on souhaite sauvegarder la base de données, on tapera seulement
save table.dta au lieu de
save "C:\Formation Stata\Espace de travail\table.dta"
9
Création d'un fichier log: journal des commandes effectuées et des résultats

 Afin de garder une trace de toutes les commandes effectuées et des résultats, il est conseillé
d'ouvrir un fichier log en début de travail:
log using trace.log
ou, si on n'a pas crée de répertoire de travail :
log using "C:\Formation Stata\Espace de travail\trace.log"
Il se ferme en tapant la commande log close
 Pour importer une base de données sous Stata:
use table.dta [, clear]
Il faut parfois rajouter l'option clear afin d'effacer le fichier de données déjà utilisé par le
logiciel. Par précaution, on peut l‘écrire tout le temps. 10
Sauvegarder sa base de données

save table.dta [,replace]


Il est également possible de créer "manuellement" une base de données à l'aide de la
commande edit qui ouvre une base de données vide dans laquelle on remplit les cases. C'est
rare d'avoir à le faire. Pour observer la base de données, il suffit de taper la commande
browse ou de cliquer sur l'onglet correspondant dans la barre des taches du logiciel.
Pour écrire un commentaire sans que Stata pense qu'il s'agit d'une commande, on utilise
l'astérisque ou /*commentaire*/.

11
Types de variables
Les variables sous Stata peuvent être numériques ou alphanumériques:
Les variables numériques: variables quantitatives contenant des entiers ou des réels. Elles peuvent
être de différents types, selon la précision nécessaire.
Format général %g %9.0g 1.414114
Format fixé %f %9.2f 1.41
Format scientifique %e %9.2e 1.41e+00
Les variables alphanumériques: variables qualitatives (en rouge dans browser) sont des chaînes de
caractères quelconques. Elles sont enregistrées sous forme str# (string).
# renvoyant à la place allouée à l’écriture de la variable, la longueur maximale est de 80 caractères .

12
Décrire et lire les données
 count: cette commande permet de connaître le nombre d’observations.

describe: la commande describe permet de décrire les données de façon très

générale : pour chaque variable, elle retourne le format dans lequel la variable est

stockée (double, float, int), le format dans lequel la variable s'affiche (%9.0g,

%9s, …), le label de la variable ainsi que celui de ses modalités. Si on n'indique

pas les variables à décrire, Stata décrit toute la base de données, en fournissant

également le nombre d'observations, de variables et la taille de la base de

données. L'option short permet d'obtenir uniquement une description de la base.


13
edit: cette commande permet d’ouvrir la base de données et la possibilité de la modifier
à la main.

14
browse: la commande browse ouvre la base de données, mais ne permet pas de la modifier à

la main.

15
list
La commande list permet d'afficher la base de données ou un extrait de cette base
dans la fenêtre des résultats. Attention, si on ne précise pas quelles variables et quelles
observations à afficher (en tapant seulement list), toute la base de données s'affiche
dans la fenêtre Results.
list age etudes m3 in 1/5
+----------------------+
| age etudes m3 |
|----------------------|
1. | 39 16 homme |
2. | 4 0 homme |
3. | 11 3 homme |
4. | 6 0 femme |
5. | 25 10 femme |
+----------------------+
16
codebook

La commande codebook permet de créer un dictionnaire des variables indiquant le nom de


la variable, son label, son format de stockage, l'intervalle de ses valeurs, ses valeurs
uniques, sa moyenne et son écart-type (variable continue), la fréquence des modalités
(variable discrète), le nombre de valeurs manquantes, des quantiles, le label de ses
modalités. L'option mv fournit des informations sur les valeurs manquantes.

codebook var1
var1 age
-----------------------------------------------------------------------------------
type: numeric (float)
range: [0,98] units: 1
unique values: 95 missing .: 0/12749
mean: 21.699
std. dev: 17.2764
percentiles: 10% 25% 50% 75% 90%
3 8 17 32 46 17
En Résumé
On débute le programme avec la commande clear afin de vider la mémoire de Stata.
On crée un répertoire de travail:
cd "C:\StataSE12\formation stata\Espace de travail "
On indique la base à utiliser:
use data.dta
ou bien use "C:\StataSE12\formation stata\Espace de travail\etudiant.dta "
Il est conseillé d'ouvrir un fichier log :
log using résultat.log
On commence le programme (describe, rename, replace…)
Sauvegarder les modifications et fermer le fichier log:
save data.dta
log close
18
Création des variables
La commande principale pour créer une variable est la commande generate. Sa syntaxe possède
une partie supplémentaire :
generate [varlist] [=exp] [if exp] [,options]
C'est dans [=exp] qu'on indique comment construire la variable, par exemple :

generate var3=var1+var2 /*addition*/


generate var4=5*var1 /*multiplication*/
generate logvar=log(var) /*logarithme*/
generate y = x[n] /*créer une constante y dont la valeur est égale à celle de la nième observation de la variable x*/
gen x = log(a*b)-sqrt(abs(b)): La nouvelle variable x = log(a × b) − p | .
generate CDM=1 if m5==1 /*== : test d'égalité*/
generate nonCDM=0 if CDM~=1 /*~= : test de différence*/
generate CDMfemme=1 if femme==1 & CDM==1 /* & : et*/
generate CDM_conjoint=1 if CDM==1 | m5==2 /* | : ou*/

19
egenerate (extended generate) : s'impose lorsque les calculs se complexifient un peu ou
lorsque l'utilisation de fonctions statistiques spécifiques est nécessaire.

egen y = count (x) /* y est une constante égale au nombre d’observations de la variable x*/
egen y = sd(x) /* y est une constante égale à l’écart-type de la variable x*/
egen y = mad(x) /* y est une constante égale à la médiane de la variable x*/
egen y = max(x) /* y est une constante égale à la valeur max de la variable x*/
egen y = min(x) /* y est une constante égale à la valeur min de la variable x*/
egen y = sum(x) /* y est une constante égale à la somme de la variable x*/
egen y = mean(x) /* y est une constante égale à la moyenne de la variable x*/
egen y= rsum(x,z) /* y est une constante égale à la somme des variable x et z*/
egen y= rmax(x,z) /* y est une constante égale au maximum des valeurs des variable x et z*/
egen y= rmean(x,z) /* y est une constante égale à la moyenne des variable x et z*/

recode: cette commande permet de recoder les valeurs d’une variable.

20
Addition + Soustraction -
Multiplication * Division /
Égalité = Inégalité !=
Exposant ^ Partie entière int()
Racine sqrt() Exponentielle exp()
Logarithme log() Valeur absolue abs()
Sup. (resp. Inf.) >(resp. <) Sup. (resp. Inf) ou égal >= (resp. <=)
Ou | Et &
Minimum min() Maximum max()

21
22
Statistiques descriptives
• Les statistiques descriptives regroupent toutes les techniques
utilisées pour décrire et résumer des données quantitatives et
qualitatives.

• Ces méthodes comportent :

• Les tableaux : distributions de fréquences.

• Les représentations graphiques.

• Les paramètres statistiques :


• Réduction des données à quelques valeurs numériques caractéristiques.
Exemple : la commande « graph »

graph pie m3, over(m3)


pie(1, color(red*2)) pie(2,
color(red))

homme femme

24
Exemple: la commande « graph »

25
20
graph bar m4, over(m3) over(strate)

mean of m4

15
10
5
0
homme
femme homme
femme homme
femme homme
femme homme
femme homme
femme
01 02 03 04 05 06

homme
01
femme

homme
02
femme

homme
03
femme

graph hbar m4, over(m3) over(strate) 04


homme
femme

homme
05
femme

homme
06
femme

0 5 10 15 20 25
mean of m4

25
Exemple: la commande « graph »
graph dot m4, over(m3) over(strate)

homme
01
femme

homme
02
femme

homme
03
femme

homme
04
femme

homme
05
femme

homme
06
femme

0 5 10 15 20 25
mean of m4

26
Exemple : la commande « graph »

Un nuage de points représentant la

6
relation inverse entre la variable

5
situation de famille
dépendante m6 et la variable

4
indépendante m4.

3
graph twoway scatter m4 m6

2
1
0 20 40 60 80 100
age

27
Exemple: la commande «histogram »

Options des histogrammes:

4000
• bin (#): spécifie le nombre

3000
d’intervalles à utiliser pour les

Frequency
barres.

2000
• freq: fréquence relative de

1000
l’axe des ordonnées.
• normal: dessine la distribution

0
0 20 40 60 80 100
age

normale.
histogram m4, bin(10) frequency

28
La boite à moustache
graph box m4

100
80
60
age
40
20
0

29
describe : cette commande fournit une description non-statistique de ou
des variables (type, nombre, label, taille de la base de données).

 summarize (sum) : cette commande fournit un résumé numérique


simple de toutes les variables de la base de données ou des variables
sélectionnées. Elle calcule la moyenne, l’écart type, les valeurs minimales
et les valeurs maximales. Pour plus d'informations sur les variables (les
quartiles, test de normalité, médiane), il faut ajouter l'option detail (det).

Exemple:
summarize m3,detail
Su m3,det

30
Exemple: tabulate oneway, tabulate twoway
Tabulate (tab) : cette commande fournit le tableau des fréquences
d'une variable (les variables catégoriques à k modalités).
Pour une seule variable, la commande tabulate fournit pour chaque
modalité le nombre d'observations, le pourcentage et le pourcentage
cumulé.
tab m3

Si la commande est passée pour deux variables, l'output est un


tableau croisé.
tab m6 m3
• Les options column row donnent les pourcentages pour les cellules
(en ligne et en colonne) .
tab m6 m3, column row

31
Exercice
• Pour des raisons de sécurité publique, on s’intéresse à la concentration d’ozone dans
l’air (en microgrammes par millilitre). En particulier, on cherche à savoir s’il est possible
d’expliquer le taux maximal d’ozone par la température à midi. Les données sont:

Température à 12h 23.8 16.3 27.2 7.1 25.1 27.5 19.4 19.8 32.2 20.7

O3 max 115.4 76.8 113.8 81.6 115.4 125 83.6 75.2 136.8 102.8

32
• Créer, sur le bureau, un dossier appelé exercice.
• Créer un répertoire de travail dans le dossier
“C:\Users\Dell\Desktop\exercice”.
• Créer un fichier log nommé exe.log.
• Sauvegarder les données ci-dessus sous le nom données.dta.
• Présenter le tableau des statistiques descriptives de la variable O3 max.
• Existe-t-il une corrélation entre la concentration maximale d’ozone et la
température à midi?
• Représenter graphiquement la concentration maximale d’ozone en
fonction de la température à midi.
• Fermer le fichier log.

33
Chapitre 2
Introduction aux séries
temporelles

34
Dans le cours d’économétrie 1, l’estimation se fait à partir de relations
structurelles censées traduire des mécanismes économiques. La
modélisation consiste à traduire en équations la théorie économique.
Dans ce cours d’économétrie des séries temporelles, ces éléments
structurels disparaissent.

De ce fait, on ne cherche plus à expliquer mais simplement à décrire


ou à prévoir. Pour cela on utilise des séries c'est-à-dire des
observations d'une variable au cours du temps. L'utilisation de ces
séries se généralise pour tout un ensemble de problèmes pour lesquels
la modélisation traditionnelle apparaît peu satisfaisante.

35
C'est le cas pour des phénomènes complexes dans lesquels il y a de
nombreuses actions et réactions simultanées pour lesquelles il est
difficile de faire apparaître clairement un enchaînement de causes et
d'effets. (Exemple : cours d'une valeur mobilière au jour le jour). Cela
peut aussi être le cas de variables extrêmement volatiles.

Les modèles explicatifs sont en général incapables de prévoir


correctement les points de retournement. Ces modèles sont performants
à moyen terme mais peu performants à court terme. Le taux de change,
qui subit des fluctuations assez courtes et assez amples, fournit des
illustrations de ce type de difficultés.

36
Une des causes de mauvaise performance des modèles explicatifs vient
du fait qu'ils sont beaucoup plus performants pour analyser des
tendances que des fluctuations. Une grande partie de leur pouvoir
explicatif est tiré du parallélisme des évolutions. Cet argument laisse
entendre que certaines corrélations ne correspondent pas véritablement
à des relations entre variables, mais peuvent tout simplement résulter
d'une évolution semblable des variables sous des influences n'ayant rien
à voir avec le problème étudié.

37
Dans tous ces cas, quand on a besoin de faire une prévision à court
terme et quand les enjeux de cette prévision sont économiquement
importants on préfère utiliser des modèles non explicatifs mais assez
performants en prévision qui sont donc des modèles de série temporelle.
Ce sont des structures légères qu'on peut facilement réestimer. Le
modèle peut donc être mis à jour tous les jours. Le coût de la prévision
est relativement faible. Un économètre bien formé avec un bon logiciel
peut assurer au quotidien la prévision au jour le jour.

38
Un des domaines d'application est le domaine des variables financières (taux
d'intérêt, taux de change, taux de rendement). La méthode consiste à rechercher
dans l'histoire de la variable des régularités susceptibles d'aider à prévoir ses
valeurs futures.

• Exemples de séries temporelles


• Le nombre de voyageurs faisant Tunis-Bizerte chaque jour
• Le taux de change journalier EUR\TND
• Le PIB d’une nation au cours du temps
• Le nombre journalier de contaminations par le SARS-Covid 19 en Tunisie
• Le nombre journalier de décès par le SARS-Covid 19 en Tunisie
• Le cours journalier du titre SFBT
https://www.ilboursa.com/marches/cotation.aspx?s=BIAT/
https://www.worldometers.info/coronavirus/country/tunisia/
39
Évolution journalière du nombre de personnes infectées par le coronavirus en Tunisie

40
Évolution journalière du nombre de décès par le coronavirus en Tunisie

41
42
Processus stochastique

Un processus stochastique (aléatoire) est une suite de


variables aléatoires indexées par le temps et définies sur
le même espace probabiliste.

43
Les propriétés des processus stationnaires

• L'utilisation des séries temporelles conduit à rechercher des


régularités dans les valeurs passées de la série. Pour que cette
démarche ait un sens pour la prévision, il faut que le processus
présente une certaine stabilité ou un certain degré d'invariance
au cours du temps.

• Si le processus était complètement erratique, on pourrait peut-


être tirer quelques enseignements du passé mais ces éléments
n'auraient aucun intérêt prédictif.

• C'est cette idée de stabilité ou d'invariance au cours du temps


qui est traduite par la notion statistique de stationnarité.
44
• On peut définir la stationnarité d’un processus de série temporelle par
les trois conditions suivantes :
• 1ère condition
• Un processus stochastique de série temporelle est invariant s’il a une
moyenne constante au cours du temps :
• E(𝑦𝑡 )=𝜇, ∀ t.
• 2ème condition
• La variance de ce processus est invariante au cours du temps.
• V(𝑦𝑡 )=𝜎𝑦2𝑡 = 𝛾(0), ∀ t.
• 3ème condition
• Les covariances entre deux observations de y pour deux périodes
différentes ne dépendent que du nombre de décalages.
• Cov(𝑦𝑡 ,𝑦𝑡+𝑘 )=Cov 𝑦𝑡+𝑙 , 𝑦𝑡+𝑙+𝑘 = 𝛾(𝑘), ∀ t.
45
Exemple de processus stationnaire

• 𝜀𝑡 , t∈Z, est un bruit blanc (white noise), alors :

• E(𝜀𝑡 )=0, ∀ t,
• V(𝜀𝑡 )=𝜎 2 , ∀ t,
• Cov(𝜀𝑡 ,𝜀𝑡+𝑘 )=0, ∀ 𝑘0.

46
Fonction d’auto-covariance
• La fonction d’auto-covariance 𝛾 est définie par :

𝛾: ℤ →ℝ
k→ 𝛾(𝑘)= Cov(𝑦𝑡 , 𝑦𝑡+𝑘 ).

2
Pour K=0, on a 𝛾(0)= V(𝑦𝑡 )=𝜎𝑦𝑡 .

47
Fonction d’autocorrélation
• La fonction d’autocorrélation 𝜌 est décrite par :

𝜌: ℤ →[-1, 1]
Cov (𝑦𝑡 ,𝑦 𝑡+𝑘 )
k→ 𝜌(𝑘)= .
𝜎𝑦 𝑡 𝜎𝑦 𝑡+𝑘

𝜌(𝑘) est le coefficient de corrélation linéaire entre 𝑦𝑡 et 𝑦𝑡+𝑘 .


Si le processus est stationnaire, 𝜌(𝑘)= 𝜌(−𝑘).

48
• Si le processus est stationnaire, alors sa variance est invariante au cours du
temps, ainsi,

𝜎𝑦𝑡 = 𝜎𝑦𝑡+𝑘 =𝜎𝑦2𝑡 = 𝛾(0)


Alors
Cov(𝑦𝑡 ,𝑦𝑡+𝑘 ) 𝛾(𝑘)
𝜌(𝑘)= =
𝛾(0) 𝛾(0)

• Tous les coefficients d’autocorrélation 𝜌(𝑘) s’obtiennent facilement à partir


des coefficients d’auto-covariance. Il suffit de les rapporter à 𝛾(0).

49
• Si le processus est stationnaire, ces coefficients d'autocorrélation diminueront
assez rapidement. Un processus non stationnaire peut avoir une résonance de
la période t à une période plus éloignée, de telle sorte que des coefficients
d'autocorrélation élevés puissent exister pour des valeurs élevées de k.

• Seuls les processus stationnaires sont intéressants car ils sont stables. Il est
possible de tester la stationnarité d'un processus c'est-à-dire en fait la
décroissance rapide de ses coefficients d'autocorrélation. C'est la première
opération à faire lorsqu'on étudie une série.

• On appelle corrélogramme le graphe de la fonction d’autocorrélation 𝜌(𝑘).

50
Fonction d’autocorrélation partielle

Soit 𝑦𝑡 un processus stationnaire. On appelle coefficient d’auto-corrélation partielle d’ordre k


noté 𝜙𝑘𝑘 , le coefficient de corrélation linéaire entre 𝑦𝑡 et 𝑦𝑡+𝑘 , une fois retirée l’influence des
variables intermédiaires entre 𝑦𝑡 et 𝑦𝑡+𝑘 .
• Les coefficients d’auto-corrélation partielle d’ordre 1,2 et 3 se calculent comme suit :
• 𝜙11 = 𝜌(1),
1 𝜌(1)
𝜌(1) 𝜌(2)
• 𝜙22 = 1 𝜌(1) ,
𝜌(1) 1 1 𝜌(1) 𝜌(1)
𝜌(1) 1 𝜌(2)
𝜌(2) 𝜌(1) 𝜌(3)
• 𝜙33 = 1 𝜌(1) 𝜌(2)
.
𝜌(1) 1 𝜌(1)
𝜌(2) 𝜌(1) 1
• Les calculs deviennent fastidieux à partir de l’ordre 3, alors on se réfère à des logiciels de calcul.
• On appelle corrélogramme partiel le graphe de la fonction d’autocorrélation partielle 𝜙𝑘𝑘 .
51
L’opérateur retard

En économétrie des séries temporelles, l'opérateur retard, noté L (comme


Lag) ou B (comme Backward) est l'opérateur qui, à tout élément d'une série
temporelle, associe l'observation précédente.
Exemple
• L(𝑦𝑡 )= 𝑦𝑡−1 ; L(𝑦𝑡−1 )= 𝑦𝑡−2 , 𝐿0 (𝑦𝑡 ) = 𝑦𝑡
• 𝐿𝑖 (𝑦𝑡 ) = 𝑦𝑡−𝑖

Commande Stata
gen air1=L.air
Gen air2=L2.air 52
Airline passengers data (Stata)

53
Pour représenter graphiquement l’évolution du nombre de passagers aériens
en fonction du temps:

• Commandes Stata:
tsset t, monthly
tsline air

54
ou bien en utilisant la barre de menu:

55
56
57
58
59
Coefficients d’autocorrélation et coefficients d’autocorrélation partielle
La commande Stata est :
corrgram air, lags(20)

60
Corrélogramme avec Stata

La commande Stata est:

ac var

61
62
63
64
65
Corrélogramme partiel avec Stata

La commande Stata est:

pac var

66
67
68
69
70
71
72
73
74
75
76
77
78
79
Exercice
• Créer un répertoire de travail dans le dossier “C :\Dell\Desktop\bases ”.
• Créer un fichier log nommé exe.log.
• Importer la base data.dta se trouvant dans votre répertoire de travail.
• Présenter le tableau des statistiques descriptives du taux de change EUR\TND.
Interpréter.
• Présenter graphiquement l’évolution du taux de change EUR\TND au cours du temps.
Enregistrer le graphique sous le nom graph.png.
• Créer la variable « taux1 » retardée une fois du taux de change EUR\TND.
• Calculer la valeur de 𝜌 𝑘 pour k=0,1,…,5. Interpréter.
• Présenter le corrélogramme du taux de change EUR\TND . Interpréter.
Enregistrer le graphique sous le nom cor.png.
• Donner les valeurs de 𝜙11 , 𝜙22 , 𝜙55 𝑒𝑡 𝜙77 . Interpréter.
• Tracer le corrélogramme partiel du taux de change EUR\TND . Interpréter.
Enregistrer le graphique sous le nom corp.png.
• Fermer le fichier log.
80
Chapitre 3
Les modèles linéaires
de séries temporelles

81
Les modèles linéaires de séries temporelles

• Les modèles autorégressifs : AR(P) (Autoregressive models)

• Les modèles moyennes-mobiles : MA(q) (Moving-Average models)

• Les modèles ARMA(p,q) (Autoregressive Moving Average models, pour des


processus stationnaires)

• Les modèles ARIMA(p,d,q) (Autotoregressive Integrated Moving Average models,


pour des processus non stationnaires))
82
Les modèles autorégressifs (Yule, 1927)

• Un processus de série temporelle fait dépendre une variable de ses


propres valeurs passées. Un processus autorégressif d’ordre p (p∈ ℕ)
est présenté comme suit :

𝑦𝑡 =𝜑1 𝑦𝑡−1 + 𝜑2 𝑦𝑡−2 + ⋯ + 𝜑𝑝 𝑦𝑡−𝑝 + 𝜀𝑡 , avec 𝜀𝑡 ~𝐵𝐵(0, 𝜎 2 )

83
Les modèles autorégressifs d’ordre 1 : AR(1)

• Un processus autorégressif d’ordre 1 peut être exprimé comme suit :


𝑦𝑡 =𝜑1 𝑦𝑡−1 + 𝜀𝑡 , avec 𝜀𝑡 ~𝐵𝐵(0, 𝜎 2 )
• Le processus 𝑦𝑡 est stationnaire si est seulement si |𝜑1 |<1.
• si |𝜑1 |<1 alors le processus est inversible, on a :

𝑦𝑡 = +∞ 𝜑
𝑖=0 1
𝑖
= 𝜀𝑡 +𝜑 𝜀
1 𝑡−1 +𝜑 2
𝜀
1 𝑡−2 +𝜑 3
1 𝜀𝑡−3 +…..
C’est la représentation moyenne-mobile infinie de 𝑦𝑡 .
• E(𝑦𝑡 ) = 0.
𝜎2
• 𝛾(0) =V(𝑦𝑡 )= 2 .
1−𝜑1
• 𝜙11 = 𝜌(1)= 𝜑1 et 𝜙𝑘𝑘 =0 ∀ k>1.
84
• Pour un processus AR (1), les coefficients d'autocorrélation 𝜌(𝑘) décroissent de
façon exponentielle.
• Comme indiqué dans le graphique suivant, la fonction d’autocorrélation est
marquée par une décroissance exponentielle de termes soit tous positifs si 𝜑1 > 0,
soit alternant en signe si 𝜑1 < 0.

85
Les modèles autorégressifs d’ordre 2 : AR(2)
• Un processus autorégressif d’ordre 2 peut être exprimé comme suit :
𝑦𝑡 =𝜑1 𝑦𝑡−1 + 𝜑2 𝑦𝑡−2 + 𝜀𝑡 , avec 𝜀𝑡 ~𝐵𝐵(0, 𝜎 2 )
(1-𝜑1 𝐿 − 𝜑2 𝑙 2 ) 𝑦𝑡 = 𝜀𝑡
Φ 𝐿 =1-𝜑1 𝐿 − 𝜑2 𝑙 2
• Le processus 𝑦𝑡 est stationnaire si est seulement si les racines du polynôme Φ 𝐿 = 0
sont de module>1.
• Un processus AR(2) est inversible, on a :
• 𝑦𝑡 = Φ−1 (𝐿) 𝜀𝑡 = +∞ 𝑖=0 𝜔𝑖 𝜀𝑡−𝑖 (représentation moyenne mobile infinie de 𝑦𝑡 )
• E(𝑦𝑡 ) = 0
1−𝜑2
• 𝛾(0) =V(𝑦𝑡 )=𝜑1 𝛾 1 + 𝜑2 𝛾 2 + 𝜎2= 𝜎 2.
[1+𝜑2 ][(1−𝜑2) 2 −𝜑1 2 ]
• 𝜌(𝑘) =φ1 𝜌(𝑘 − 1)+ φ2 𝜌(𝑘 − 2),∀ k>0.( les équations de Yule-Walker)
φ1
• 𝜙11 = 𝜌(1)= ; 𝜙22 = 𝜑2 et 𝜙𝑘𝑘 =0 ∀ k>2
1−φ2
86
Les modèles autorégressifs d’ordre p : AR(P)

Pour un processus AR (p), les coefficients d'autocorrélation


partielle sont nuls pour tout décalage k > p,

𝝓𝒌𝒌 =0 ∀ k> 𝒑

87
Les modèles moyennes-mobiles (Yule, 1921-1926)

• Un processus moyenne-mobile fait dépendre une variable des valeurs


passées du terme d'erreur. Un processus moyenne-mobile d’ordre q
(q∈ ℕ) est présenté comme suit :

𝑦𝑡 = 𝜀𝑡 - θ1 𝜀𝑡−1 − θ2 𝜀𝑡−2 −…−θq 𝜀𝑡−𝑞 , avec 𝜀𝑡 ~𝐵𝐵(0, 𝜎 2 )

• Un processus moyenne-mobile est stationnaire (c’est une


combinaison linéaire de bruit blanc).

88
Les modèles moyennes-mobiles d’ordre 1 : MA(1)
• 𝑦𝑡 = 𝜀𝑡 − θ1 𝜀𝑡−1 , avec 𝜀𝑡 ~𝐵𝐵(0, 𝜎 2 )
𝑦𝑡 = (1 − θ1 𝐿) 𝜀𝑡
𝑦𝑡 = 𝜃(L)𝜀𝑡
• Un processus MA(1) est stationnaire.
• Si |θ1 |<1 alors le processus est inversible, on a :
+∞
𝜀𝑡 = 𝜃1 𝑖 𝑦𝑡−𝑖
𝑖=0
2
𝜀𝑡 = 𝑦𝑡 +θ1 𝑦𝑡−1 +θ1 𝑦𝑡−2 +… ; c’est la représentation autorégressive infinie du
processus.
• E(𝑦𝑡 )=0
• 𝛾 0 = 𝜎 2 1 + θ12
• 𝜌 𝑘 = 0 si k>1 89
Les modèles moyennes-mobiles d’ordre 2 : MA(2)

• 𝑦𝑡 = 𝜀𝑡 - θ1 𝜀𝑡−1 − θ2 𝜀𝑡−2 , avec 𝜀𝑡 ~𝐵𝐵(0, 𝜎 2 )


𝑦𝑡 = (1 − θ1 𝐿 − θ2 𝐿2 )𝜀𝑡
𝑦𝑡 = 𝜃(L)𝜀𝑡 , avec 𝜃(L)=1 − θ1 𝐿 − θ2 𝐿2
• Le processus est stationnaire (combinaison linéaire finie de bruits blancs).
• E(𝑦𝑡 )=0
• 𝛾 0 =V(𝑦𝑡 )=(1+θ1 2 +θ2 2 ) 𝜎 2
• 𝜌(𝑘)= 0 si k>2

90
Les modèles moyennes-mobiles d’ordre q : MA(q)
Pour un processus MA (q), les coefficients d'autocorrélation sont nuls
pour tout décalage k > q,

𝜌(𝑘)= 0 si k>q

91
Les modèles ARMA (p,q) (Box-Jenkins, 1971)

• Les modèles ARMA sont représentatifs d’un processus généré par une
combinaison des valeurs passées et des erreurs passées. Un
processus ARMA(p,q) est une combinaison d’un processus AR(p) et
d’un processus MA(q).
• Un processus ARMA (p,q) est défini par l’équation suivante :
• Φ 𝐿 𝑦𝑡 = 𝜃(L)𝜀𝑡 , avec 𝜀𝑡 ~𝐵𝐵(0, 𝜎 2 )
• Φ 𝐿 = 1 − 𝜑1 𝐿 − 𝜑2 𝐿2 − ⋯ − 𝜑𝑝 𝐿𝑝 ,
• 𝜃(L)=1 − θ1 𝐿 − θ2 𝐿2 −…−θq 𝐿𝑞

92
La méthodologie de Box-Jenkins

93
Les étapes de la méthodologie de Box-Jenkins

94
Étape 1:Stationnarisation de la série

95
Étape 2: Identification

96
Étape 3: Estimation

97
Étape 4: Validation

98
Les critères d’information

• Le critère d'information d'Akaike, (en anglais Akaike information


criterion ou AIC) est une mesure de la qualité d'un modèle statistique
proposée par Hirotugu Akaike en 1973. On choisit alors le modèle avec le
critère d'information d'Akaike le plus faible.

• Le critère d'information bayésien (en anglais bayesian information


criterion ; ou BIC) est un critère d’information dérivé du critère
d'information d'Akaike proposé par Gideon Schwarz en 1978.

99
Étape 5: Prévision

• Le modèle retenu sera utilisé dans la prévision.

100
Application de la méthodologie de Box-Jenkins
sur Stata pour la modélisation et la prévision du
taux de change EUR/TND

101
Présentation des données

102
Étape 1: Stationnarisation de la série

103
104
Test de Dickey-Fuller
 Les hypothèses du test
H0 : Présence de racine unitaire (série non stationnaire)
H1 : Absence de racine unitaire (série stationnaire)
 La règle de décision
Si p-value≤ 5% , on rejette H0 ,
Si p-value> 5% , on accepte H0 .
• 5% est le seuil de signification

105
106
107
108
Test de Dickey-Fuller sur la série D.cloture

109
• P-value=0.000<5% donc on rejette H0 ainsi la série différenciée est
stationnaire.

110
Étape 2: Identification

La deuxième étape consiste à représenter le corrélogramme et le


corrélogramme partiel afin de déterminer les paramètres p et q du
modèle ARIMA.

111
112
113
114
Ainsi, les modèles ARIMA sélectionnés sont ARIMA(1,1,1), ARIMA(2,1,1) et
ARIMA(3,1,1).

115
Étape 3: Estimation des modèles ARIMA retenus

116
117
118
119
120
121
122
Étape 4: Validation
Cette étape consiste à retenir le meilleur modèle ARIMA. Le
modèle ARIMA le plus approprié pour modéliser le taux de change
EUR\TND est celui qui présente les caractéristiques suivantes :

• Le nombre des coefficients significatifs le plus élevé.


• La volatilité la plus faible.
• La log-vraisemblance la plus élevée.
• Les critères d’information AIC et BIC les plus faibles.
123
• Les critères d’information AIC et BIC sont obtenus (après l’estimation du
modèle correspondant) grâce à la commande Stata suivante:
estat ic

. estat ic

Model Obs ll(null) ll(model) df AIC BIC

. 227 . 701.0407 4 -1394.081 -1380.382

124
Test de Significativité des coefficients
 Les hypothèses du test
H0 : Le coefficient =0 (le coefficient est statistiquement non significatif au seuil de
5%)
H1 : Le coefficient≠ 0 (le coefficient est statistiquement significatif au seuil de
5%)

 La règle de décision
Si p-value≤ 5% , on rejette H0 ,
Si p-value> 5% , on accepte H0 .
• 5% est le seuil de signification
125
Test de significativité des paramètres du modèle ARIMA(3,1,1)

126
127
128
129
Bibliographie
• Becketti Sean et al., Introduction to time series using Stata, College Station, TX : Stata
Press, 2013.
• Bernard H., Économétrie appliquée, ESTEM-Editions scientifiques techniques et
médicales, 1996.
• Bourbonnais Régis, Économétrie-10e éd.: Cours et exercices corrigés, Dunod, 2018.
• Casin P., Econométrie, Éditions Technip, 2009.
• Hurlin C., Économétrie Appliquée Séries Temporelles, Cours tronc commun, UFR
Economie appliquée, 2001.
• Leblond S., Guide d’économétrie appliquée, Université de Montréal, 2003.
• Ouellet E., BELLEY-FERRIS I., et LEBLOND S., Guide d’économétrie appliquée pour
Stata Pour ECN 3950 et FAS 3900, 2005.
• Wooldridge J., Introductory Econometrics: A Modern Approach, (5th edition),
SouthWestern College Publishing, 2012.
• Traduit en français : Introduction à l’économétrie : Une approche moderne, De Boeck-
Ouvertures Économique, 2015. 130

Vous aimerez peut-être aussi