Vous êtes sur la page 1sur 151

République Algérienne Démocratique Et Populaire

Ministère de l’Enseignement Supérieur et


de la Recherche Scientifique

Université des Sciences et de la Technologie


Houari Boumediene
Faculté des mathématiques
Département de probabilités et statistique

Mémoire de fin d’études


En vue de l’obtention du diplôme d’Ingénieur d’Etat en Statistique

THEME

Encadré par : Proposé par :


Mr Hacène BELBACHIR Mr Ahmed MENKOURA (NAFTAL)

Présenté par :
Mr. Mohamed OSMAN Mr. Cherif YAKOUBENE

Devant le jury :
Mme H. GUERBYENNE Présidente
Mr. A.AKNOUCHE Examinateur
Mme K.DJABALLAH Examinatrice
Promotion 2005-2006
DÉDICACES
Je dédie ce modeste travail
A ma très chère mère, à mon père
A mes sœurs, à mon frère Khaled
A mes grands-parents qui m’ont tous aidé et soutenus et qui
m’ont réservé les moyens tout au long de mes études.
mes tentes Malika, Baya, Aldjia,
A mes cousines, cousins Mohamed Reda, Ali, Tarek, et
A toute la famille petits avant les grands
A Abdelkader, Oualid, mes amis de toujours
Cherif, mon ami partenaire « binôme » qui a tant donné
pour que nous achevions ce travail,
A toute la promotion 2005 – 2006 probabilités et statistique
pour leurs soutien et encouragement,
A Anissa, Fella, Sihem et Smail,
Kamel, Hichem, Ameur
Aux prochaines promotions que je ne manquerai pas
d’encourager,
A Samir, Rafik, Bilel, Mourad
A tous les étudiants de R.O.
A tous ceux qui m’ont aidé,
A tous ceux que j’aime,
A tous les musulmans frères,
A tout le peuple Algérien, Palestinien, Irakien
Avec toute ma gratitude
Mohamed.O
DÉDICACES
Je dédie ce mémoire :

A ma très chère mère, à mon père

A mes sœurs, à mes fréres

A toute ma famille.

A mon ami Mohamed « binôme »

A Mhend, Toufik , Oualid mes amis de toujours

A toute la promotion 2005 – 2006 probabilités et statistique

Pour leur soutien et encouragement,

A Anissa, Fella, Sihem et Smail,

Kamel, Hichem, Ameur

Aux prochaines promotions que je ne manquerai pas

d’encourager,

A Samir, Rafik, Mourad

A tous les étudiants de R.O.

A tous ceux qui m’ont aidé,

A tous les musulmans frères,

Cherif.Y
REMERCIEMENTS
Louange à Dieu, le miséricordieux, sans Lui rien de tout cela n'aurait
pu être.
Nous remerciement le bon Dieu qui nous a orienté au chemin du
savoir et les portes de la science. Nous tenons à remercier vivement tous
ceux qui nous ont aidés de prés ou de loin à l’élaboration de ce mémoire ;
nous pensons particulièrement à :
-Monsieur Hècene.BELBACHIR, qui nous a guidées avec ses conseils,
ses orientations techniques et surtout à l’attention particulière qu’il a
donné à notre projet, et qui nous a accompagné au long de notre travail.
-Madame Hafida.GUERBYENNE. Pour avoir accepter de présider
notre soutenance et pour son aide et sa contribution et ses précieux conseils
et sa gentillesse.
-Madame Khadija.DJABALLAH. Examinatrice, pour son aide et sa
contribution et ses précieux conseils et sa gentillesse.
-Monsieur Malek. AKNOUCHE. Examinateur, pour son aide et sa
contribution et ses précieux conseils.
-Madame Djenet.SEDDIKI membre de jury qui nous a fait l'honneur
d'en faire partie.
De même nos remerciements vont au personnel de NAFTAL, en
particulier :
Mr H.MENKOURA, Mr K. HEMMI, Mr M.KECHROUDE.
Nous remercions également nos familles respectivement qui nous ont
aidés, encouragées et soutenues dans les moments difficiles tout au long de
la préparation de cette thèse.
Nous remercions toute personne parmi nos camarades ou autre qui
nous ont aidées de prés ou de loin à la réalisation de ce mémoire.
Enfin, nous remercions tous ceux qui nous ont encouragé tout au long
de notre Parcours universitaire et ceux qui ont contribué à notre
formation mais que nous N’avons pas cités.
A toute ces personnes, nous leurs disons merci infiniment.
SOMMAIRE

Introduction et Problématique : 1
PRESENTATION GENERALE DE NAFTAL 3

Partie théorique
Chapitre 1 : Généralités sur les séries chronologiques :
1.1 Introduction………………………………………….......……………………… 10
1.2 Stationnarité. …………………………………………………………………… 10
1.2.1 Définition d’un processus stationnaire au sens strict………………………. 10
1.2.2Definition d’un processus stationnaire de second ordre……………………. 10
1.3 Premiers indices descriptifs d’une série temporelle……………………………. 11
1.3.1 Indice de la moyenne et la variance……………………………………….. 11
1.3.2 Indice de dépendance……………………………………………………… 11
1.4 La classe des processus aléatoire ARMA……………………………………… 13
1.4.1Géneralités et notations…………………………………………………….. 13
1.4.2 Définition des processus ARMA…………………………………………… 13
2 Les démarches préliminaire pour analyser une série chronologique :
2.1 Représentation graphique de la série………………………………………….. 17
2.2 Les composantes temporelles de la série……………………………………… 17
2.2.1 La tendance………………………………………………………………. 17
2.2.2 Saisonnalité………………………………………………………………. 17
2.2.3 Facteur irrégulier…………………………………………………………. 17
2.2.4 Composante cyclique……………………………………………………. 17
2.3 Type de décomposition………………………………………………………. 17
2.3.1 Le modèle additif ……………………………………………………… 18
2.3.2 Le modéle multiplicatif………………………………………………….. 18
2.4 Le test de schéma……………………………………………………………… 18
2.4.1 Le test graphique…………………………………………………………. 18
2.5 La technique de détection de la saisonnalité et de la tendance………………… 19
2.5.1 La technique graphique…………………………………………………… 19
2.5.2 La technique analytique…………………………………………………. 19
Chapitre 2 : Méthode de lissage exponentiel :
2.1 Introduction…………………………………………………………………… 22
2.2 Principe de base……………………………………………………………….. 22
2.3 Description de la méthode…………………………………………………….. 22
2.4 Lissage exponentiel simple……………………………………………………. 22
2.5 Choix de coefficient de lissage………………………………………………… 25
2.6 Lissage exponentiel double…………………………………………………… 25
2.7 Méthode de Holt-Winters …………………………………………………….
25
Chapitre 3 : Processus non stationnaire, tests de racine unitaire
3.1 Généralités sur la non stationnarité……………………………………………… 28
3.1.1 Processus de type DS et TS……………………………………………….. 28
3.1.1.1 Les processus de type TS……………………………………………. 28
3.1.1.2 Les processus de type DS……………………………………………. 28
3.1.1.3 Conséquences d’une mauvaise stationnarisation du processus TS…. 29
3.1.2 Processus autorégressif moyenne mobile………………………………… . 29
3.1.3 Processus autorégressif moyenne mobile intégré saisonnier………………. 30
3.2 Tests de racine unitaire………………………………………………………….. 30
3.2.1 Le test de Dickey-Fuller simple ……………………………………………... 30
3.2.2 Le test de Dickey-Fuller augmenté……………………………………….. 32
3.2.3 L’algorithme de Dickey-Fuller augmenté………………………………... 33
Chapitre 4 : Méthodologie de Box et Jenkins
4.1 Méthodologie de Box et Jenkins………………………………………… 35
4.1.1 Les démarches de la méthodologie de Box et Jenkins………………….. 35
4.2 L’estimation du modéle…………………………………………………………. 37
4.2.1 Méthode d’estimation……………………………………………………… 37
4.3 Les tests de validation…………………………………………………………. 37
4.3.1 Tests sur les paramètres…………………………………………………… 37
4.3.2 Tests sur les résidus………………………………………………………… 38
4.4 Choix du modèle……………………………………………………………… 41
4.5 Prévision……...........................................………………………………… 41
4.5.1 Transformation de la série ………………………….. 42
4.5.2 Prédicteur pour un modèle ARMA ………………………. 42
Chapitre 5 : Les processus à mémoire longue
5.1 Généralité et définition de la mémoire longue………………………………… 45
5.2 Bruit blanc fractionnaire ARFIMA (0.d.0)……………………………………. 45
5.3 Processus ARFIMA (p.d.q)…………………………………………………… 46
5.4 Test de mémoire longue………………………………………………………… 46
5.4.1 Test de LO (1991)………………………………………………………….. 46
5.4.2 Test de Labato et Robinson (1998)……………………………………….. 47
5.5 Les méthodes d’estimation des processus ARFIMA………………………… 47
5.5.1 Méthode en deux étapes………………………………………………. 47
5.6 Prévision d’un processus ARFIMA(p.d.q). …………………………………... 48
Chapitre6 : Modéle VAR
6.1 Présentation du modèle VAR standard……………………………………….. 50
6.1.1 Ecriture du modèle VAR standard……………………………………….. 50
6.1.2 Condition de stationnarité……………………………………………….. 50
6.1.3 Concept d’innovation………………………………………………………. 51
6.2 Estimation d’un modèle VAR standard………………………………………. 52
6.3 Estimation du nombre de décalages p………………………………………… 54
6.3.1 Estimation du nombre de décalages à partir d’un critère d’information… 55
6.3.2 Estimation du nombre de décalages à partir de tests du rapport de 56
vraisemblance………………………………………………………………………
6.4Calcul des fonctions de réponse du modèle VAR standard…………………… 57
6.4.1Utilités du concept d’innovation en simulation…………………………… 57
6.4.2 Fonctions de réponse du modèle VAR standard……………………………. 58
6.4.3 Décomposition de la variance des erreurs de prévision du modèle VAR standard 60

Partie application :
Lissage exponentiel…………………………………………………………………… 63
Box & Jenkins……………………………………………….………………………… 68
ARFIMA……………………………………………………..…….……………….... 114
VAR……………………………………………………………………………………. 119
Conclusion ……………………………………………………..…………….……….. 137
Conclusion générale…………………………………………..….…………………… 140
-Annexes ………………………………………………..…………………………….. 142
-Bibliographie ……………………………………..…………………………………. 144
Introduction et Problématique :

Les mutations économiques que connaît notre pays, à savoir son passage d’une
économie dirigée à une économie de marché, ont interpellé toutes les entreprises nationales à
s’adapter à ce nouvel environnement économique.
NAFTAL compte parmi ces entreprises qui se préparent sérieusement à évoluer dans un
nouveau contexte à travers notamment la mise en place d’une nouvelle organisation adapté
aux nouveaux enjeux économiques et ce, en prévision de l’installation de la concurrence
étrangère.

Forte des expériences du passé, NAFTAL, qui a recouvert sa santé financière grâce
notamment à la recapitalisation, a décidé de se projeter résolument dans l’avenir avec l’appui
de l’élaboration d’une stratégie de développement rationnelle et cohérente qui tient compte
des enjeux et des exigences du nouveau contexte économique national et international.

Entre 2000-2006, la demande des produits pétroliers a enregistré une croissance


significative. Les ventes de carburants culminés est de prés de 7 millions de tonnes (d’après
NAFTAL magazine).

La demande ainsi estimée fait ressortir la nécessité de définir, d’un point de vue
organisationnel, de nouvelles approches pour renforcer la position de NAFTAL dans un
marché libre des produits pétroliers, ouvert à la concurrence et qui imposera davantage les
enjeux de la commercialisation de la rentabilité de la réalité des prix. L’environnement
économique national nouveau caractérisé par la disparition du monopole et la libre initiative
va se traduire pour NAFTAL par l’émergence de la concurrence aussi bien dans l’importation
que dans la distribution et la commercialisation des produits pétroliers sur le marché national
(d’après NAFTAL magazine).

Pour cela NAFTAL : branche carburant (Aviation-Marine) souhaiterait procéder à une


prévision des ventes de carburants (Aviation et Marine) à court et à long terme en se basant
sur des méthodes statistiques. Nous allons tenter dans ce travail de répondre partiellement à
leurs attentes.

1
C’est ainsi que le sujet qui nous a été proposé s’intitule :
Modélisation VAR et ARFIMA en Vu de la Prévision des Quantités de Ventes de
Carburants Aviation et Marine
Notre travail est scindé en deux parties :

Partie Théorique :
Nous commençons dans une première étape tout d’abord par une étude univariée en
nous basant sur la méthode de lissage exponentiel de Holt-Winters, ensuite la méthodologie
de Box et Jenkins, et la modélisation ARFIMA.
Dans la deuxième étape, nous complétons l’étude univariée par une étude multivariée
(modèle VAR).
Enfin, nous nous proposons de comparer les quatre méthodes en nous basant sur l’erreur
moyenne quadratique pour en tirer la méthode la plus appropriée

Le plan de notre travail est le suivant:


• Chapitre 1 : Notions et généralités sur les séries chronologiques.
• Chapitre 2 : Les démarches préliminaires pour analyser une série chronologique.
• Chapitre 3 : L’étude de la Méthode de Lissage exponentiel (Holt et Winters ) .
• Chapitre 4 : Non stationnarité, test de racine unitaire.
• Chapitre 5 : Modélisation via la méthodologie de Box-Jenkins .
• Chapitre 6 : Les modèles à mémoire longue appelés modèles ARFIMA
• Chapitre 7 : Modélisation multivariée .

Partie Application :
• Application de la méthode de Holt et Winters.
• Application de la méthodologie de Box et Jenkins.
• Application de la modélisation ARFIMA.
• Application de la méthode VAR

Nous avons développé un didacticiel sous DELPHI, pour le logiciel « EVIEWS » afin
de permettre aux utilisateurs de bien manipuler et maîtriser le logiciel.

2
PRESENTATION GENERALE DE NAFTAL

I-1 HISTORIQUE :

Issue de SONATRACH, l’entreprise nationale de raffinage de distribution


des produits a été créée par le Décret N 80/101 du 06 Avril 1980.

Entrée en activité le 01er Janvier 1982, elle est chargée de l’industrie, du


raffinage et de la distribution des produits pétroliers sous le sigle NAFTAL.
En 1987, l’activité raffinage est séparée de l’activité distribution

La raison sociale de la société change suite à cette séparation des activités


et NAFTAL est désormais chargé de la commercialisation et de la distribution
des produits pétroliers et dérivés.
A partir de 1998, elle change de statut et devient filiale à 100% de
SONATRACH.

L’appellation NAFTAL provient de :

NAFT : Pétrole
AL : Aldjazair.

ORGANISATIONS DE NAFTAL :
Les directions principales sont :

LBP : Lubrifiant, Bitumes, Pneumatique, a pour mission principale :


ª Elaboration, et suivi des politiques et programmes nationaux par
marché et activé des Lubrifiants, Pneumatiques, Bitumes

D.C : Direction Centrale, a pour principale :

GPL : Gaz Pétrole Liquéfie, a pour mission principale :


Gestion des produits propane (vente, Approvisionnement,
Distribution.)

B.CR : Branche, Carburant, a pour missions principales :


Elaborer le programme d’approvisionnement en Carburant, en
Collaboration avec la Branche Commercialisation.
Assure l’approvisionnement en Carburant et produits spéciaux des
centres relevant de la Branche de commercialisation.

3
B.I : Branche International, a pour mission principale :
Elle s’occupe des projets d’association avec le compare international.

D.E : Direction Exécutif, a pour mission principale :

B.COM : Branche Commercialisation, a pour mission principale :


Assure l’approvisionnent et la commercialisation des produits
Aviation et Marine pour la satisfaction des besoins de la clientèles
dans les meilleures condition d’efficacité et de coût.

Description des l’abréviation utilisée :

Branche Lubrifient bitume pneumatique


Direction Central

Branche Gaz Pétrole Liquéfié

Branche carburant

Branche international

Direction Exécutif

Branche Commercialisation

4
Direction. Général
NAFTAL

Branche Dir. Branche Branche Branche Dir. Branche


Centrale GPL Exécu Comm
LBP Carburant Inter
Historique de la branche carburant (BCR)

Suite à la décentralisation de la Sonatrach,la division AVM créé le 19 avril


1978,était chargée de commercialiser des produits aviation et marine aux nivaux
des port et aéroport.
Par décision du 26jeuin 2002,l’AVM a été dissoute et,par conséquent, elle
fut remplacer par la branche carburant qui est chargée de la commercialisation
des produit carburant « terre mer,aviation ».
Pour réaliser ses missions, elle dispose d’un certain nombre
d’infrastructures et moyens (dépôt, centres aviation, centres marine, camions,
bridges, camion aviateurs, barges d’avitaillement…etc.).

MISSIONS Branche Carburant

A / LES MISSIONS :

W Elaborer le programme d’approvisionnement en Carburants,


en collaboration avec la Branche Commercialisation ;

W Conclure et gérer les contrats d’approvisionnement de Carburants et


produits spéciaux ;

W Assurer l’approvisionnement en Carburants et produits spéciaux


des centres relevant de la Branche Commercialisation ;

W Assurer la distribution des Carburants au réseau de points de vente et


autres clientèles ;

W Définir les niveaux de stocks optimaux et en assurer le maintien ;

W Tenir des réunions de coordination régulière avec la Branche


Commercialisation pour définir et ajuster les programmes
d’approvisionnement mensuels des districts Commercialisation en
Carburants et produits spéciaux ;

W Exploiter, réhabiliter, moderniser et développer les infrastructures


de stockage et les moyens de distribution de la Branche Carburants ;

W Mettre en place un suivi régulier des relations avec les fournisseurs ;

6
W Veiller à l’utilisation optimale des ressources humaines et prendre toutes
les mesures permettant d’en augmenter productivité et d’en relever
le niveau de formation ;

W Mettre en œuvre toute action ou initiative d’étude de coût, d’optimisation


du flux de distribution et de réduction des coûts visant à renforcer
la position commerciale et l’image de la société sur le marché ;

W Mettre en place un système de veille ou surveillance la concurrence ;

W Mettre en place un système de procédure de gestion centralisé en vue


de suivre et de s’assurer de l’exécution.

Les produits de NAFTAL Branche Carburant, division AVM sont:

o JET A1 (Produits Aviation)


o AVGAS Aviation
o Gas Oil Marine
o Fuel Bunker C Marine
o Fuel BTS Marine
o HUILES.

Tâches & responsabilité :


o Assiste et conseille le Directeur dans la définition, l’analyse et la mise en œuvre
de politiques, stratégies et objectifs à atteindre sur la base d’études élaborées par
les Directions de la Branche
o Participe à l’élaboration des objectifs et politiques de développement de la
Société pour les domaines d’activité relevant de la Branche

o Assure le traitement des dossiers particuliers qui lui sont confiés par la hiérarchie
o Coordonne, à la demande du Directeur de Branche, les travaux effectués par les
Directions et en prépare les synthèses
o Peut être appelé, en cas de nécessité, à assurer l’intérim d’une Direction
o Est chargé de la rédaction des procès verbaux des différentes réunions
o Participe, à la demande du Directeur de Branche, aux différentes Commissions
de la Société
o Peut représenter la Branche ou la Société auprès des autorités politiques,
administratives ou organismes nationaux

7
Partie Théorique
Chapitre 1

Généralités sur
Les séries chronologiques
Chapitre 1 Généralités sur les séries chronologiques

1.1 Introduction :
Dans de nombreux domaines comme la biologie, la climatologie l’économétrie, on
enregistre des observations au cours du temps pour constituer ce que l’on appelle une série
chronologique.
Une série chronologique est une suite d’observations indicée par le temps (t),
représentant l’évolution d’un phénomène dans le temps.
Certaines séries peuvent s’observer de manière continue, certaines autres correspondent
à des observations réalisées en des intervalles de temps fixes a priori : heure, jour, mois,
année…
De telles suites de données sont notée {xt ; t=1,…,T}.
Les méthodes que nous exposons font référence à ce type de donnée.

1.2 Stationnarité :
La stationnarité est la clef de l’analyse des séries temporelles avant d’effectuer des testes
spécifiques sur cette série et de chercher à la modéliser.
Nous commencerons par donner la définition d’un processus stationnaire au sens strict
(ou stationnarité forte), et ensuite celle de la stationnarité du second ordre (ou stationnarité
faible).

1.2.1. Définition d’un processus stationnaire au sens strict :


Le processus x est dit strictement ou fortement stationnaire si quel que soit le n-uplet
t

du temps (t1,t2,…,tn ) t1<t2<…. <tn , tel que ti ∈ Z et pour tout temps h∈ Z avec ti+h∈ Z : ∀i,
i=1...n , la suite ( xt1+ h ,..., xtn + h ) a la même loi de probabilité que le vecteur ( xt1 ,..., xtn ).

Autrement dit, la stationnarité stricte signifie que la distribution conjointe de


( xt1 ,..., xtn ) est invariante par translation dans le temps.

Cette condition est difficile à vérifier en pratique, c’est pourquoi on utilise en général
une version plus faible de la stationnarité, à savoir la stationnarité au second ordre.
1.2.2. Définition d’un processus stationnaire au second ordre :
Un processus x t
est dit stationnaire au second ordre, ou stationnaire au sens faible, si
les trois conditions suivantes sont satisfaites :
¾ ∀t ∈ Ζ, Ε( xt ) = m,..independante.de.t..
2
¾ ∀t ∈ Ζ, Ε( xt )〈∞.

¾ ∀(t , h) ∈ Ζ 2 , cov( xt , xt + h) = γ (h).independant.de.t.

10
Chapitre 1 Généralités sur les séries chronologiques

1.3 Premiers indices descriptifs d’une série temporelle :


Il est bien utile de disposer de quelques indices numériques qui résument une
série ( x ,..., xT ) .
1

1.3.1 Indice de la moyenne et la variance:


Les expressions de la moyenne et de la variance d’une série temporelle est :
-Moyenne : µ (t)= Ε( xt )

-Variance : σ 2 (t ) = V ( xt ).

1.3.2 Indice de dépendance :


¾ Fonction d’autocovariance :

x un processus aléatoire de variance finie, on appelle fonction d’autocovariance


Soit t

γ (t) de x la fonction :
h t

γ h
(t ) = cov( xt . xt + h) = Ε[( xt − Ε( xt ))( xt + h − Ε( xt + h))].

9 Cette fonction fournit des informations sur la variabilité de la série et


sur les liaisons temporelles qui existent entre les différentes
composantes de la série
Dans le cas d’un processus stationnaire du second ordre γ h
(t) = γ est indépendante de t
h

9 La fonction d’autocovariance d’un processus stationnaire xt vérifie les


propriétés suivantes :
• γ = cov( xt . xt ) = Ε[( xt − Ε( xt )) 2 ]. = V ( xt ) = σ 2x ≥ 0.
0

• γ h
≤ γ 0
.

• γ =γ h −h
. : fonction. paire.

¾ Fonction d’autocorrélation notée FAC:


On appelle fonction d’autocorrélation d’un processus stationnaire x la fonction :
t

γ cov( xt , xt + h)
ρ = h
= , h ∈ Ζ.
h
γ 0
V ( xt )V ( xt + h )

Cette fonction vérifie les trois propriétés suivantes :

11
Chapitre 1 Généralités sur les séries chronologiques

™
ρ 0
= 1.

™
ρ h
≤ ρ 0
.

™
ρ =ρh −h
: fonction. paire.

¾ Fonction d’autocorrélation partielle notée FAP :


Elle mesure la corrélation entre X t et X t − h , l’influence des variables X t − h +i , 1 < i < h − 1
ayant été retirée. Soit la matrice des corrélations formées des (h-1) premières autocorrélations.

⎡1 ρ1...ρ h −1 ⎤
⎢ ρ 1...ρ ⎥
⎢ 1 h−2 ⎥

⎢. 1 ⎥ h ∈N
P h= ⎢ ⎥
⎢. ⎥
⎢ ⎥
⎢ ⎥
⎢⎣ ρ h −1 ρ h − 2 ...1⎥⎦

P h*
La fonction d’autocorrélation partielle est donnée par : ρ h = .
ph

Où Ph * est le déterminant de la matrice Ph∗ obtenue à partir de Ph , en remplaçant la

dernière colonne de celle-ci par le vecteur ( ρ1 ,..., ρ h ) .

⎡1 ρ1...ρ1 ⎤
⎢ ρ 1...ρ ⎥
⎢ 1 2 ⎥

Ainsi P * = ⎢. ⎥
h ⎢ ⎥
⎢. ⎥
⎢ ⎥
⎢ ⎥
⎢⎣ ρ h −1 ...ρ h ⎥⎦

On peut se passer de ce calcul matriciel qui n’est souvent pas facile à faire. Pour cela, on
a recours à une écriture récurrente de ρ ii
tel que :

⎧ ρ 1 si i = 1
⎪ i −1
⎪⎪ ρ i − ∑ ρ i −1, j ρ i − j
ρ ii = ⎨ j =1
⎪ i −1
i = 2,....., h
⎪ 1 − ∑ ρ i −1, j ρ j
⎪⎩ j =1

avec ρ ij = ρ i −1, j − ρ ii ρ i −1,i − j , j = 1,..., i − 1 et i = 2,..., h .

12
Chapitre 1 Généralités sur les séries chronologiques

Cet algorithme résolvant les équations de Yule-Walker de manière récursive est appelé
algorithme de Durbin (1960).

1.4 La classe des processus aléatoire ARMA :

1.4.1 Généralités et notations :

¾ Processus bruit blanc :


⎧ Ε(ε t ) = 0.∀t ∈ T .

ε t
est un processus bruit blanc si : ⎨ VAR (ε t ) = σ 2 .∀t ∈ T .

⎩COV (ε t.ε s ) = 0. pour.t ≠ s.

¾ Opérateur linéaire :

™ Opérateur de retard :
On note B l’opérateur retard, il est défini par : Bxt = x t −1
.

Bm x = x .
Si on applique m fois cet opérateur, on a la relation suivante :
t t −m

On constate ainsi que l’opérateur retard transforme une variable x en sa valeur passée. t

Le polynôme retard Φ (B) est défini comme suit :


Φ ( B ) = 1 − Φ 1 B − Φ 2 B 2 − ... − Φ p B p .

™ Opérateur d’avance :
Soit F l’opérateur inverse de B : B*F=I., I étant l’opérateur identité.
L’opérateur F est appelé opérateur avance: F x =x
t t +1
.

Si on applique m fois cet opérateur, on a la relation suivante :

Fm x = x t t +m
.

™ Opérateur de différence :
On note ∇ l’opérateur (1-B) et ∇ m l’opérateur (1- B m ) ainsi :

∇ x =x −x
m
t t t −m
.

où ∇ m S’appelle opérateur de différentiation de retard m.

1.4.2. Définition des processus ARMA :

13
Chapitre 1 Généralités sur les séries chronologiques

Il s’agit d’une très grande famille de processus stationnaires qui présente l’avantage
d’être un bon outil de prévision ;

¾ Processus autorégressifs AR (p):


Un processus { xt ; t∈Z } est appelé autorégressif d’ordre p si c’est une solution de l’équation :
⎪⎧Φ ( B) x t = ε t

⎪⎩∀t ∈ Ζ.
telle que :

• {ε t , t ∈ Ζ} est un processus bruit blanc.

• Φ( B )est appelé opérateur autoregressif d ' ordre p.

Si une série { xt ; t∈Z } est la réalisation d’un tel processus. Alors on peut écrire
Φ ( B ) x t = ε t sous la forme :

x t
= φ1 xt −1 + ... + φ p xt − p + ε t .

avec:

• φ1 ...φ p des paramétres réels independants de t.

™ Condition nécessaire et suffisante de la causalité et d’inversibilité :


Une condition nécessaire et suffisante pour que le modèle autorégressif
X t = φ1 X t −1 + φ2 X t − 2 + +φp X t− p + εt soit causal (annexe 1) est que les racines de la
fonction caractéristique : Φ(B) = 0 ⇔ 1−φ1 B −φ2 B2 − −φ p B p = 0 soient en valeur absolue
supérieures à 1 c'est-à-dire B > 1 .
D’après la définition d’inversibilité (annexe 1), un modèle autorégressif d’ordre fini est toujours inversible.

™ Fonction d’ autocorrélation :
Pour obtenir les autocorrélations d’un processus AR (p), il suffit de multiplier chaque
membre de l’équation x t
= φ1 xt −1 + ... + φ p xt − p + ε t . par x t −k
tel que (k>0) ; en prenant ensuite
l’espérance de la variable et en divisant l’ensemble par γ 0 , on obtient ainsi :
i= p
ρ k = ∑ φi ρ k −i ∀k > 0.
i =1

En écrivant cette relation pour différentes valeurs de k (k=1,…,p),on obtient les


équations de Yule-Walker .

™ Fonction autocorrélation partielle :

14
Chapitre 1 Généralités sur les séries chronologiques

Les autocorrélations partielles, notées k , d’un processus AR (p)

Xt = c + φ1 X t −1 +φ2 Xt −2 + +φ p X t − p + ε t sont nulles pour tout ordre supérieur à p


( Pk = 0, ∀ k > p) et non nulles pour tout ordre inférieur à p. De plus on a Pp = φ p .
9 Seuls les p premiers termes de la FAP sont significativement différents de 0.

¾ Processus moyenne mobile MA (q) :


Un processus { xt ; t ∈ Ζ } est appelé processus moyenne mobile d’ordre q s’il est défini
par la relation suivante :

⎧⎪ x t = Θ( B) *ε t

⎪⎩∀t ∈ Ζ.

telle que :
• {ε t , t ∈ Ζ} est un processus bruit blanc.

•Θ( B) est appelé moyenne mobile d ' ordre q.


Si une série { xt ; t∈Z } est la réalisation d’un tel processus. Alors on peut écrire

x t
= Θ( B ) * ε t sous la forme :

x t
= ε t − θ1ε t −1 − ... − θ qε t − q .

Avec :
•θ1 ,...,θ q des paramétres réels independants de t.

™ Condition nécessaire et suffisante de causalité et d’inversibilité:


Une condition nécessaire et suffisante pour que le modèle moyenne mobile
X t = ε t − θ1ε t −1 − − θ qε t − q soit inversible est que les racines de la fonction

caractéristique Θ(B ) = 0 ⇔ (1 − θ1B − θ 2 B 2 − − θq Bq ) = 0 soient en valeurs absolues

supérieures à 1 B > 1 .

D’après la définition de causalité (annexe 1), un modèle moyenne mobile d’ordre fini est
toujours causal, car c’est une combinaison linéaire finie d’un processus
stationnaire {ε t , t ∈ Z }.

™ Fonction d’autocorrélation :
La fonction d’autocorrélation d’un processus MA (q) est donnée sous la forme :

15
Chapitre 1 Généralités sur les séries chronologiques

⎧ γ k −θ k + θ1θ k +1 + ... + θ q − kθ q
⎪ ρk = = si 1 ≤ k ≤ q.
⎨ γ0 1 + θ12 + ... + θ q2
⎪0 si k > q.

™ Fonction autocorrélation partielle :


La fonction d’autocorrélation partielle Pk d’un processus MA (q) {X t , t ∈ Z }

défini par X t = Θ( B)ε t se comporte comme une exponentielle ou une sinusoïdale amortie.

¾ Processus ARMA (p, q) :


On appelle un processus { xt , t ∈ Z } autorégressif moyenne mobile d’ordre (p, q) noté

ARMA (p, q) s’il s’écrit sous la forme suivante :


Φ( B) xt = Θ( B)ε t , avec : {ε t , t ∈ Z } : est un bruit blanc de variance σ 2 .

Φ (B ) =1 − φ1 B − φ2 B 2 − −φ p B p φi ∈ IR, ∀ i =1,…, p .

Θ( B) = 1 − θ1B1 − θ 2 B 2 − − θq Bq ,θ i ∈ IR , ∀i = 1, ,q .

telle que :
• {ε t , t ∈ Ζ} est un processus bruit blanc.

Si une série { xt ; t∈Z } est la réalisation d’un tel processus, alors on peut écrire :

•θ1...θ q et φ1...φ p sont des paramètres réels independants de t.

¾ Relation entre les processus AR(p) et MA(q) :


Soit le processus de type MA (1) : x t
= ε t − θ1ε t −1.

Qui s’écrit aussi

x t
= ε t − θ1 Bε t . = ε t (1 − θ1 B ).

D’où :
i =∞ i =∞
1
εt = * x t = ∑ θ1i B i * x t = ∑ψ i B i * x tqui est un processus AR(∞) telle que ψ i = θ1i .
(1 − θ1 B ) i =0 i =0

sous la condition θ1 ≤ 1

16
Chapitre 1 Généralités sur les séries chronologiques

2. Les démarches préliminaires pour analyser une série chronologique

2.1 Représentation graphique de la série:


La première étape pour analyser une série chronologique est de la représenter
graphiquement pour mieux visualiser l’évolution de cette chronique (croissance, saisonnalité,
période, oscillation, rupture…), cet examen nous permettra après de choisir un modéle
approprié ainsi que de détecter d’éventuelles anomalies.

2.2 Les composantes temporelles de la série :


L’examen de cette série met en évidence quatre composantes ; cette approche suppose
que la structure de la chronique peut être décomposée en éléments simples (modélisables)
pour ensuite être reconstituées pour donner une prévision de la chronique ; ce sont :

2.2.1 La tendance (trend) notée Tt :


Cette tendance représente l’évolution à long terme de la série, elle se représente comme
une fonction du temps (linéaire ou non) ; et décrit une structure d’évolution déterministe.
Celle-ci est souvent la composante la plus importante dans une série chronologique.
Cette tendance peut avoir :

1. Un caractère linéaire : la série croit d’une même quantité à chaque période ;


2. Un caractère exponentiel : la série croit à un taux constant ; des formulations plus
complexes (par exemple polynomiales ou logistiques) peuvent être proposées.
2.2.2 Le facteur saisonnier notée St:
C’est une composante marquée par des fluctuations plus ou moins régulières, d’une
intensité qui peut être variable et d’une période beaucoup plus faible que celle de la
composante cyclique.

2.2.3 Les irrégularités ou résiduelle notée Rt:


C’est un mouvement qui regroupe tout ce qui n’a pas été pris par la tendance et le facteur
saisonnier ; il contient donc de nombreuses fluctuations ponctuelles, de faibles amplitudes
n’ayant pas d’incidence à moyen ou à long terme sur l’allure générale de la série : on parle
parfois de mouvement erratique pour le caractériser.
Ce sont des fluctuations difficiles à analyser mais les plus intéressantes à modéliser pour
la prévision à court terme.

2.2.4 La composante cyclique notée Ct :


C’est un mouvement d’allure quasi-périodique de mouvement ascendant (période de
prospérité) et descendant (période de dépression) dont l’ensemble forme une dynamique
oscillatoire retraçant le cycle économique.

2.3 Type de décomposition :

17
Chapitre 1 Généralités sur les séries chronologiques

Après avoir détecté par des méthodes graphiques ou analytiques quelles sont les
composantes présentes, il faut proposer un modèle :

2.3.1 Le modèle additif :


La relation fonctionnelle la plus simple entre ces différentes composantes est la forme
linéaire additive :
⎧ X t = T t + S t + Rt .
⎨ .
⎩t = 1...T

Dans ce modèle, on suppose que les amptitudes des variations saisonnières et des
fluctuations résiduelles ne dépendent pas de la tendance.

2.3.2 Le modèle multiplicatif :

Si on observe des amptitudes variables (des saisonnalités et des irrégularités) avec la


tendance, on préféra une forme multiplicative complète de la forme :

⎧ X t = T t * S t * Rt .
⎨ .
⎩t = 1 ...T
Notons qu’une simple transformation logarithmique redonne la forme linéaire. Elle est
très utilisée en économie.
Parfois les effets à court terme ne sont pas amplifiés par les effets à moyen et à long
terme ; c’est à dire que la tendance et le facteur saisonnier sont multiplicatifs et les
irrégularités additives, le modèle retenue est le modèle multiplicatif de la forme :

⎧ X t = T t * S t + Rt .

⎩t = 1...T .

2.4 Le test de schéma :


2.4.1 Le test graphique :
Pour identifier graphiquement le modèle, il suffit de relier les deux grands pics par une
droite (D1) et le deux derniers creux par une autre droite (D2).
- Si les deux droites (D1, D2) sont parallèles alors le modèle est additif.
- Si les deux droites (D1, D2) ne sont pas parallèles, alors le modèle est multiplicatif.
Exemple : soit les deux graphes (G1) et (G2) :

18
Chapitre 1 Généralités sur les séries chronologiques

26000

24000
D1
22000

20000

18000

16000

14000 D2
12000
2000 2001 2002 2003 2004

AD D ITIF

250

200

150
D1
100

50

0
D2
2000 2001 2002 2003 2004

MULTIPLICATIF

2.5 Les techniques de détection de la saisonnalité et de la tendance :


2.5.1 La technique graphique :
D’après les définitions précédentes les facteurs de la tendance et de la saisonnalité,
peuvent être détectes graphiquement.

2.5.2 Les techniques analytiques :

L’examen du graphique ne suffit pas très souvent pour mettre en évidence une
saisonnalité, donc il est nécessaire d’utiliser le test de Fisher à partir de l’analyse de la
variance (test d’ANOVA).

19
Chapitre 1 Généralités sur les séries chronologiques

¾ Test de Fisher :
On considère n: Le nombre d’années. P: Le nombre d’observations dans l’année
X i j : La valeur de la série pour la ième année et la jème période.

La moyenne générale X . . , la moyenne de l’année i X i . , la moyenne de la période j X . j


La variance année et la variance période sont définies respectivement par :
n p
p ∑ ( X i . − X . . )2 n ∑ ( X . j − X . . )2
VARA = i =1 , VARP =
j =1

n −1 p −1
n p

∑ ∑ (X i j − X i . − X . j − X .. ) 2
La variance résiduelle : VAR R = i =1 j =1

(n − 1)( p − 1)
n p

∑∑ ( X ij − X .. ) 2
L’équation de la variance totale : VART = VAR A + VARP + VARR = i =1 j =1

n −1

L’hypothèse est : H 0 « pas de saisonnalité » contre H 1 : « il existe une saisonnalité

VARP
La valeur calculée F0 = que l’on compare à la valeur tabulée Fvα1 v2
VARR

avec v1 = (P − 1) , v 2 = (n − 1)(P − 1) degré de liberté

Si F0 Fvα1 v2 on rejette H 0 , la série est saisonnière.

Soient les hypothèses : H 0 : « La série n’est pas affectée d’une tendance »

Contre H 1 : « La série est affectée d’une tendance »


VAR A
On calcule F1 = que l’on compare avec Fvα3 v2
VARR

Avec v3 = (n − 1) , v 2 = (n − 1)(P − 1) degré de liberté

Si F1 Fvα3 v2 on rejette l’hypothèse nulle, la série est affectée d’une tendance.

Concernant l’existence de la tendance, le test de Fisher s’avère faible, il convient d’effectuer


un autre test.

20
Chapitre 2
Méthode
du lissage exponentiel
Chapitre 2 Méthode de lissage exponentiel

2.1 Introduction :
La prévision à court terme a connu des développements importants durant les dernières
années, elle constitue la base de l'action. La prise de décision repose en effet toujours sur des
prévisions, c'est ainsi qu'une entreprise commerciale s'intéresse aux prévisions des ventes
futures pour faire face à la demande, gérer sa production ainsi que ses stocks, mais aussi
orienter sa politique commerciale ( prix, produits et marketing). De même, on essaie de
prévoir les rendements d'un investissement, la pénétration d'un marché ou l'effet de la
modération salariale sur l'emploi.
Les développements de la pratique statistique ont permis de disposer d'un certain nombre
d'outils de calcul, les méthodes de lissage exponentiel font l'objet de ce chapitre, ces méthodes
datent du début des années soixante (HOLT en 1957 et BROWN en 1962). Ils justifient
amplement leurs utilisations.
Après avoir fait un lissage exponentiel simple qui ne peut être utilisé en présence d'une
tendance ou d'une saisonnalité, nous passons au lissage double et à la méthode de HOLT, ces
dernièrs peuvent convenir pour des séries présentant une tendance. Le lissage de WINTERS
intervient dans les cas ou la tendance et la composante saisonnière sont juxtaposées soit de
manière additive soit de manière multiplicative.

2.2 Principe de base :


La méthode de lissage exponentiel repose sur l'idée suivante : les informations contenues
dans une série chronologique ont d'autant plus d'importance qu’elles sont plus récentes. Pour
effectuer une prévision, il faut affecter aux informations un poids d'autant plus faible qu'elles
proviennent d'époques plus éloignées.

2.3 Description de la méthode :


Si x1 , x2 ,,,,,, xn sont les termes d'une chronique, la méthode du lissage exponentiel
consiste à prendre comme prévision :
xˆn ,h = (1−α ) xn +αxˆn−1,h telle que 0 ≤ α ≤ 1 , h et l’horizon.

où α : appelée constante de lissage est généralement comprise entre 0 et 1.


Pour débuter le processus de lissage, il convient de choisir une valeur pour la constante.
Ce choix est très important car il conditionne la prévision future à travers le degré de
pondération que l'on affecte au passé récent et au passé lointain et ceci pour assurer une bonne
qualité de prévision.

2.4 Lissage exponentiel simple:


Cette méthode ne doit être employée que sur une série qui ne présente ni tendance ni
composante saisonnière.
En prenant en compte toute l'histoire de la chronique de sorte que plus nous nous
éloignons de la prévision moins l'influence des observations correspondantes est importante .
Cette décroissance de l'influence est de type exponentiel ce qui justifie l’appellation.

22
Chapitre 2 Méthode de lissage exponentiel

Nous disposons d'une série chronologique x = ( x1 ,…, x n ) de longueur enregistrée aux dates 1, . . .,
n. Nous nous situons à la date n et nous souhaitons prévoir la valeur x n + h non encore observée à
l'horizon h. Nous notons cette prévision : xˆ n ,h . L'entier n est parfois appelé base de la prévision
Les formules de lissage sont :
xˆn ,h = (1−α ) xn +αxˆn−1,h telle que 0 ≤ α ≤ 1 …………. ( ∗ ).

avec xˆ1,h = x1,h (initialisation).

Il existe d'autres initialisations x1 ₁ comme la moyenne de la série.


Dans le choix de α , nous distinguons les deux cas particuliers suivants :
¾ Si α =0, alors toutes les prévisions sont identiques, les prévisions restent inchangées,
on dit dans ce cas que le lissage est inerte.
¾ Si α =1, la prévision est égale à la dernière valeur observée, la nouvelle valeur lissée
est toujours égale à la dernière réalisation, dans ce cas on dit que le lissage est hyper réactif.
La relation (∗ ) peut être développée en remontant dans le temps (n-1, n-2, n-3,...,1 ,0) et
laisse apparaître que la nouvelle valeur lissée est une combinaison linéaire de toutes les
observations du passé affectée d'un poids décroissant avec l'âge, les poids sont de plus en plus
faibles au fur et à mesure que l'on s'éloigne de l'observation actuelle.
n−1
On retrouve : xˆn ,h = (1−α )∑ α j xn− j .
j =0

Remarques:
La formule xˆn ,h = (1 − α ) xn + α xˆn −1,h . permet

¾ d'interpréter xˆn ,h comme le barycentre de xn ,h et de xˆn −1,h affecté respectivement des


masses (1- α ) et α .
¾ d'interpréter le lissage comme une moyenne pondrée de la dernière réalisation et de la
dernière valeur lissée.
¾ de réécrire cette formule sous la forme suivante :
xˆn ,h = xˆn −1,h + (1 − α )( xn − xˆn −1,h ).

Le lissage apparaît comme le résultat de la dernière valeur lissée corrigée par une
pondération de l'écart entre la réalisation et la prévision.
¾ Lorsque α est proche de 0 ( α ≃0), la pondération s'étale sur un grand nombre de
termes dépendant du passé, la mémoire du phénomène étudié est forte et la prévision est peut
réactive aux dernières observations.
¾ Lorsque α est proche de 1 ( α ≃1), les observations les plus récentes ont un poids
prépondérant sur les anciens termes, la mémoire du phénomène étudié est faible et la
prévision est très réactive aux dernières observations.

On peut retrouver l'équation du lissage exponentiel en employant une approche très simple
basée sur le concept de la fonction de prévision, telle que:
xˆn ,h = an ...(Ω)

23
Chapitre 2 Méthode de lissage exponentiel

où an est une constante qui dépend de l'origine de prévision.


On choisit an en utilisant un critère de moindres carrés pondérés, avec des coefficients de
pondération décroissant exponentiellement quand on recule dans le passé, de la forme de β j ,
on l’appelle facteur d’escompte .
En appliquant la prévision au passé de la série, l'erreur de prévision est la
différence xn − j − an . La somme des carrés des erreurs à minimiser est alors de la forme :

Q (an ) = ∑ β j ( xn − j − an ) 2 . ²
j ≥0

Egalons à zéro la dérivées par rapport à an de cette expression:

Q(an ) = −2∑ β j ( xn − j − an ) = 0.
j ≥0

Ce qui entraîne l'équation :

∑β
j ≥0
j
xn − j = an ∑ β j .
j ≥0
or ∑β
j ≥0
j
= (1 − β ) −1

d’où

aˆn = (1 − β )∑ β j xn − j ............(**)
j ≥0

L'expression (∗∗) est exactement ce que nous avons trouvé pour la prévision xˆn ,h (relation
(∗) ) du lissage exponentiel simple tel que le facteur d'escompte β est remplacé par la
constante de lissage α c'est-à-dire β = α

On remarque que (voir relation (*).


xˆn ,h = (1 − α ) xn + α xˆn −1,h .
an = (1 − α ) xn + α an −1 d 'après la relation (Ω).
xn − xˆn = en ⇒ xn = en + xˆn .
xn = en + an .d ' ou :
an = (1 − α )(en + an ) + α an −1.

= en − α en + an − α an + α an −1.
α an = (1 − α )en + α an −1.si.α ≠ 0.alors :
(1 − α )
an = ( )en + an −1 = γ en + an −1.
α
an = γ en + an −1. .avec.0 ≤ γ ≤ 1.

En conséquence , nous pouvons dire que le lissage exponentiel simple est justifié dans le
cas d'une fonction de prévision constante, dans le contexte de moindres carrés pondérés , et
elle ne sera vraiment constante que si l'on choisit un facteur d'escompte β égale à 1, ce qui
correspond à α = 1 .

24
Chapitre 2 Méthode de lissage exponentiel

2.5 Choix du coefficient de lissage:


Pour débuter le processus de lissage, il convient de choisir une valeur pour la constante α ,
ce choix est très important car il conditionne la prévision future à travers le degré de
pondération que l'on affecte au passé récent et au passé lointain.
Divers procédures d'estimation ont été établit, on s'intéresse à la méthode la plus classique
qui consiste à retenir une valeur de α qui minimise l'écart entre la prévision et la réalisation
sur la partie connue de la chronique. Pour optimiser le choix de la constante α , il suffit de :
¾ Choisir un des critères d'optimisation : le critère MSE (Mean square error ou moyenne
des carrées des résidus) satisfait ce besoin.
¾ Choisir un ensemble de valeurs de α pour effectuer un balayage, par exemple les
valeurs de 0 à 1 par pas de 0,1.
¾ Choisir la prévision initiale.
¾ Pour chaque valeur de α choisie, on effectue l'ensemble du lissage exponentiel par
application des formules suivantes:
Pour n=1 à N….faire
..........xn − xˆn −1 → en .
..........xn − α en → xˆn .
........... fin.
¾ Choisir la valeur de α qui améliore aux mieux le critère MSE (celle qui fournit la
plus petite moyenne des carrées des résidus).

2.6 Lissage exponentiel double:


Les formules précédentes permettent de calculer une prévision pour des séries
chronologiques stationnaires sans tendance, nous pouvons définir un lissage exponentiel
double qui est utilisé en cas de série présentant une tendance.
On part d'une fonction de prévision linéaire de la forme:
xˆn ,h = aˆ1,n + aˆ2,n h

Notons que :
aˆ1,n .et.aˆ2,n sont des coefficients dépendant de n

On cherche à déterminer les valeurs des deux paramètres par le critère des moindres
carrées escomptes β , tel que le facteur d'escompte est remplacer par α c'est-à-dire β = α .

2.7 Méthode de Holt-Winters


Cette approche a pour but d'améliorer et de généraliser le Lissage Exponentiel Simple.
Nous étudions plusieurs cas particuliers de cette méthode :
- ajustement d'une droite affine (sans saisonnalité)
- ajustement d'une droite affine plus une composante saisonnière
- ajustement d'une constante plus une composante saisonnière
25
Chapitre 2 Méthode de lissage exponentiel

Cette méthode est plus souple que le lissage exponentiel amélioré, dans la mesure où elle fait
intervenir deux constantes β et γ au lieu d’une α
Telle que 0 < β < 1 et 0 < γ < 1 deux constantes fixées et les formules de mise à jour :

aˆ1 = β xn + (1 − β ) ⎡⎣ aˆ1 ( n − 1) + aˆ2 ( n − 1) ⎤⎦


aˆ2 = γ ⎡⎣ aˆ1 ( n ) − aˆ1 ( n − 1) ⎤⎦ + (1 − γ ) aˆ2 ( n − 1)
La prévision prend la forme :
xˆn,h = aˆ1 + h aˆ2 (n)

1−α
si β = 1 − α 2 et γ = alors :
1+ α
aˆ1 (n) = α 2 ⎡⎣ aˆ1 ( n − 1) + aˆ2 ( n − 1) ⎤⎦ +

(1 − α ) ⎡⎣ x
2
n − xˆn −1,1 + aˆ1 ( n − 1) + aˆ2 ( n − 1) ⎤⎦
= α 2 ⎡⎣ aˆ1 ( n − 1) + aˆ2 ( n − 1) ⎤⎦ + (1 − α 2 ) xn

(1 − α )
2

aˆ2 (n) = aˆ2 ( n − 1) + ⎡⎣ aˆ1 ( n ) − α 2 ⎡⎣ aˆ1 ( n − 1) + aˆ2 ( n − 1) ⎤⎦


1−α 2

− (1 − α ) ⎡⎣ aˆ1 ( n − 1) + aˆ2 ( n − 1) ⎤⎦
2

(1 − α )
2

= aˆ2 ( n − 1) + ⎡ aˆ1 ( n ) − aˆ1 ( n − 1) − aˆ2 ( n − 1) ⎤⎦


1−α 2 ⎣
Remarque :
Si β et γ sont petits, le lissage est fort puisque alors α est grand et que nous tenons compte
du passé lointain.

26
Chapitre 3

Non stationnarité,
tests
de racine unitaire
Chapitre 3 Non stationnarité, tests de racine unitaire

3.1 Généralités sur la non stationnarité :


La plupart des réalisations économiques et financières sont des réalisations de processus
non stationnaires.
D’après la définition de la stationnarité au second ordre : un processus non stationnaire est un
processus qui ne satisfait pas l’une ou l’autre de ces deux conditions, Ainsi l’origine de la non
stationnarité peut provenir d’une dépendance du moment d’ordre un (l’espérance) par rapport au
temps, ou d’une dépendance de la variance ou des autocovariances par rapport au temps .
La difficulté réside dans le fait qu’il existe différentes sources de non stationnarité et qu’à
chaque origine de la non stationnarité est associée une méthode propre de stationnarisation.
Les cas de non stationnarité les plus fréquents sont analysés à partir de deux types de processus :
les processus de type TS (time stationary) et les processus de type DS (differency stationary).

3.1.1 Processus de type DS et TS :


Le fait que la stationnarité puisse être de type déterministe ou stochastique, nous amène
à définir la classe des processus de type TS (trend stationary) et la classe des processus de
type DS (differency stationary).

3.1.1.1 Les processus de type TS :


( xt , t ∈ Ζ) est un processus de type TS s’il peut s’écrire sous la forme :

xt = f (t ) + ε t .
Où f (t ) est une fonction déterministe du temps et ε t est un bruit blanc.
Il est évident que le processus ne satisfait pas la définition de la stationnarité de second
ordre puisque il viole la premeir condition de la définition d’un processus stationnaire :
E ( xt ) = f (t ) dépend du temps, car E (ε t ) = 0.

¾ Étude des chocs sur les processus de type TS :


L’une des propriétés importantes de ce type de processus est la propriété de non
persistance de chocs, cela signifie que lorsqu’un processus de type TS subit un choc positif
ou négatif à une date donnée, l’influence de ce choc a tendance à s’estomper au cours du
temps . La variable considérée rejoint sa dynamique de long terme déterminée par f (t ) .

¾ Stationnarisation d’un processus de type TS :


Pour stationnariser un processus de type TS, il convient de retirer la composante
déterministe f (t ) en régressant la série xt

3.1.1.2 Les processus DS :


( xt , t ∈ Ζ) est un processus non stationnaire de type DS (differency stationnary) d’ordre
(d), qui désigne l’ordre d’intégration, si le processus filtré par (1 − B) d xt est stationnaire. On
dit alors que ( xt , t ∈ Ζ) est un processus intégré d’ordre (d) noté I (d).

28
Chapitre 3 Non stationnarité, tests de racine unitaire
¾ Ordre d’intégration (d):
( xt , t ∈ Ζ) est un processus DS intégré d’ordre (d) si et seulement si : le polynôme
φ ( B) associé à sa composante autorégressive admet (d) racine unitaire :

φ ( B) xt = zt avec φ ( B) = (1 − B) d Φ ( B) .

z t est un processus stationnaire, les racines du polynôme Φ ( B ) sont toutes supérieures en
module à l’unité.

¾ Étude des chocs sur les processus de type DS :


L’influence d’un choc ε t à une date donnée sur un processus non stationnaire de type DS
est permanente.

¾ Stationnarisation d’un processus de type DS :


Pour stationnariser un processus de type DS d’ordre (d), il convient d’appliquer le filtre
(1 − B )d .

3.1.1.3 Conséquences d’une mauvaise stationnarisation du processus :

¾ Conséquence sur un processus TS :


Soit le processus ( xt , t ∈ Ζ) de type TS défini par : xt = a0 + a1t + ε t .
L’application d’un filtre aux différences premières Δxt = (1 − B) xt = xt − xt −1 = a1 + ε t − ε t −1.
nous permet de définir un processus Δxt stationnaire.
∗E (Δxt ) = a1.
∗E[(Δxt ) 2 ] = a12 + 2σ ε2 < ∞.
⎧ 2σ ε2 pour h = 0

∗γ (h) = ⎨−σ ε2 pour h = {−1;1} .
⎪ 0 sin on

Le processus obtenu Δxt n’a pas les caractéristiques d’un bruit blanc puisque sa fonction
d’autocovariance n’est pas la fonction d’autocovariance d’un bruit blanc. Ce qui conduit à une
autocovariance fallacieuse du résidu du filtre
¾ Conséquence sur un processus DS :
L’extraction d’une tendance linéaire d’un processus DS conduit à créer artificiellement
une forte autocorrélation des résidus aux premiers retards et donc apparaît un mouvement
pseudo-périodique des résidus.

3.1.2 Processus autorégressif moyenne mobile intégré d’ordre (p, d, q) :


Ce sont des modèles ARMA intégrés notés ARIMA. Ils sont issus des séries
stationnarisées par l’application du filtre aux différences et ceci, bien entendu dans le cas des
processus DS détectés par le test de Dickey- Fuller. Le processus X t suit un ARIMA (p, d,
q), s’il est solution d’une équation aux différences stochastiques du type
Φ ( B) (1 − B) d X t = Θ( B) ε t .

29
Chapitre 3 Non stationnarité, tests de racine unitaire
3.1.3. Processus autorégressif moyenne mobile intégré saisonnier :
Il est possible que certaines séries chronologiques soient caractérisées par une allure
graphique périodique. Pour cela, il est important de les analyser en tenant compte de l’effet
saisonnier. Box et Jenkins (1970) ont proposé une classe de modèles particuliers appelée :
classe de modèles ARIMA saisonniers.

¾ Modèles saisonniers mixtes : SARIMA


Ce sont des extensions des modèles ARMA et ARIMA. Ils représentent généralement des
séries marquées par une saisonnalité, comme c’est le plus souvent le cas pour des séries
économiques voire financières. Ces séries peuvent mieux s’ajuster par des modèles
saisonniers. Ce sont les modèles SARIMA (p, d, q) (P, D, Q) qui répondent au modèle:
Φ( B) Φ s ( B s ) (1 − B) d (1 − B s ) D X t = Θ( B) Θ s ( B s ) ε t Où :
Φ (B) =1−φ1 B −φ2 B − 2
−φ p B p
: Polynôme autorégressif non saisonnier d’ordre p.
( )
Φs Bs =1−φ1s B −φ2s B2s − −φPs BPs : Polynôme autorégressif saisonnier d’ordre Ps.
Θ(B) = 1 − θ1 B1 − θ 2 B 2 − − θq Bq : Polynôme moyenne mobile non saisonnier d’ordre q.
Θs (Bs ) = 1−θ1s B1 −θ2s B2 − −θQsBQs : Polynôme moyenne mobile saisonnier d’ordre Qs.
(1 − B) d : Opérateur de différence d’ordre d.
(1 − B s ) D : Opérateur de différence saisonnière d’ordre D.
ε t → BB ( 0, σ ε2 ) , s correspond à la saisonnalité.

¾ Modèles saisonniers purs : (SARMA)


Un processus stochastique {X t , t ∈ Z } est dit processus autorégressif moyenne mobile
saisonnier pur d’ordre ( p, 0, q )( P, D, Q ) s , si son évolution satisfait la forme
suivante : Φ( B) Φ s ( B ) (1 − B ) X t = Θ( B) Θ s ( B ) ε t
s s D s

ε t → BB ( 0, σ ε2 ) , s correspond à la saisonnalité.

3.2 Test de racine unitaire :


Les tests de racine unitaire sont des tests paramétriques qui servent à détecter la non
stationnarité des processus, parmi les tests les plus utilisés en raison de leurs simplicités on
trouve les tests de Dickey - Fuller.

3.2.1 Le Test de Dickey- Fuller simple (1979):


Le test de Dickey –Fuller considère les trois modèles suivants
Modèle [1] : modèle sans constante ni tendance déterministe :
(1 − ρ B) X t = ε t ou ε t ∼ BB (0, σ ε2 )
Modèle [2] : modèle avec constante sans tendance déterministe :
(1 − ρ B)( X t − μ ) = ε t ou ε t ∼ BB(0, σ ε2 )
Modèle [3] : modèle avec constante et tendance déterministe :
(1 − ρ B)( X t − μ − α t ) = ε t ou ε t ∼ BB(0, σ ε2 )

30
Chapitre 3 Non stationnarité, tests de racine unitaire
Le principe général du test consiste à tester l’hypothèse nulle de présence d’une racine
unitaire (on dit alors que X t est intègré d’ordre 1), contre l’hypothèse alternative d’absence
de racine unitaire (on dit alors que X t est intègré d’ordre 0).
Ecrivons plus précisément les hypothèses nulle et alternative pour chacun des trois
modèles considérés :
¾ Modèle [1] :
⎧ H 0 : ρ = 1 ⇔ X t = X t −1 + ε t . ⇒ ( X t suit un processus de marche aleatoire sans dérive).

⎩ H1 : ρ ≺ 1 ⇔ X t = ρ X t −1 + ε t . ⇒ ( X t suit un processus autoregressif d .ordre 1 ( AR(1))).
¾ Modèle [2] :
⎧ H 0 : ρ = 1 ⇔ X t = X t −1 + ε t ⇒ ( X t suit un processus de marche aleatoire sans dérive).

⎩ H1 : ρ ≺ 1 ⇔ X t = ρ X t −1 + γ + ε t .avec.γ = μ (1 − ρ ) ⇒ ( X t suit un processus AR (1) avec dérive).

¾ Modèle [3] :
⎧ H 0 : ρ = 1 ⇔ X t = X t −1 + β + ε t . ⇒ ( X t suit un processus de marche aleatoire avec dérive.).

⎨ H1 : ρ ≺ 1 ⇔ X t = ρ X t −1 + λ + δ * t + ε t .avec.λ = α (1 − ρ ) + ρβ .et.δ = β (1 − ρ ).
⎪ ⇒ ( X t est un processus TS avec erreurs ARMA).

En pratique, on estime les modèles sous la forme suivante :


¾ Modèle [1] : ΔX t = φ X t −1 + ε t .
¾ Modèle [2] : ΔX t = φ X t −1 + γ + ε t .
¾ Modèle [3] : ΔX t = φ X t −1 + λ + δ * t + ε t .

Avec, pour chaque modèle, φ = ρ − 1 et ε t ∼ BB(0, σ ε2 )


On teste alors l’hypothèse nulle φ = 0 (non stationnarité) contre l’hypothèse
alternative φ < 0 (stationnarité).

Règle de décision :
¾ Si la valeur calculée de la t-statistique associée à φ est inférieure à la valeur critique (en
se referant aux table de Dickey et Fuller (annexe 2)), on rejette l’hypothèse nulle de non
stationnarité.
¾ Si la valeur calculée de la t-statistique associée à φ est supérieure à la valeur critique, on
accepte l’hypothèse nulle de non stationnarité.

Stratégie séquentielle de test en trois grandes étapes :


• Etape 1 : on estime le modèle [3]. On commence par tester la significativité de la
tendance en se référant aux tables de Dickey-Fuller (annexe 2) deux cas peuvent se
présenter :
™ Si la tendance n’est pas significative, on passe à l’étape 2.
™ Si la tendance est significative, on teste l’hypothèse nulle de racine
unitaire en comparant la t –statistique de φ aux valeurs tabulées par Dickey et
Fuller (annexe 2). On a alors deux possibilités :

31
Chapitre 3 Non stationnarité, tests de racine unitaire
o Si on accepte l’hypothèse nulle, X t est non stationnaire. Dans ce cas, il
faut la différencier et recommencer la procédure de test sur la série en
différence première.
o Si l’on rejette l’hypothèse nulle, X t est stationnaire. Dans ce cas, la
procédure de test s’arrête et l’on peut directement travailler sur X t

• Etape 2 : cette étape ne doit être appliquée que si la tendance dans le modèle
précèdent n’est pas significative. On estime le modèle [2] et l’on commence par tester la
significative de la constante en se referant aux tables de Dickey-Fuller (annexe 2) :
™ Si la constante n’est pas significative, on passe à l’étape 3.
™ Si la constante est significative, on teste l’hypothèse nulle de racine unitaire en
comparant la t-statistique de φ aux valeurs tabulées par Dickey Fuller (annexe
2), on se trouve alors deux possibilités :
o Si l’on accepte l’hypothèse nulle, X t est non stationnaire .dans ce cas, il faut la
différencier et recommencer la procédure de test sur la série en différence première.
o Si l’on rejette l’hypothèse nulle, X t est stationnaire. Dans ce cas la
procédure de test s’arrête et l’on peut directement travailler sur X t .

• Etape 3 : cette étape ne doit être appliquée que si la constante dans le modèle
précèdent n’est pas significative. On estime alors le modèle [1] et on teste l’hypothèse
nulle de racine unitaire en utilisant les valeurs critiques du tableau :
™ Si l’on accepte l’hypothèse nulle, X t est non stationnaire. Dans ce cas, il faut la
différencier et recommencer la procédure de test sur la série en différence première.

™ Si l’on rejette l’hypothèse nulle, X t est stationnaire, la procédure de test


s’arrête et l’on peut directement travailler sur X t
3-2-2 Test de Dickey Fuller augmenté:
Tout comme dans le cas du test de Dickey Fuller (DF) simple, trois modèles se distinguent
dans le test de Dickey Fuller augmenté (ADF) :
• Modèle [1’] : modèle sans constante ni tendance déterministe :
p
ΔX t = φ X t −1 + ∑ γ j ΔX t − j + ηt .
j =1

• Modèle [2’] : modèle avec constante sans tendance déterministe :


p
ΔX t = φ X t −1 + μ + ∑ γ j ΔX t − j + ηt .
j =1

• Modèle [3’] : modèle avec constante et avec tendance déterministe :


p
ΔX t = φ X t −1 + λ + δ t + ∑ γ j ΔX t − j + ηt .
j =1

La mise en œuvre du test ADF est similaire à celle du test de DF simple :


On adopte la même stratégie séquentielle descendante partant de l’estimation du
modèle [3’]. Les statistiques de test sont les mêmes que dans le cas du test DF simple. Il
convient cependant de remarquer que l’application du test ADF nécessite au préalable de
choisir le nombre de retards p à introduire de sorte à blanchir les résidus.
32
Chapitre 3 Non stationnarité, tests de racine unitaire
3-2-3 Algorithme de Dickey –Fuller augmenté :

p
ΔX t =φX t −1 + ∑ φ jΔX t− j + β t + C + εt.
j =1

β=0

A H0 R H0

p
Δ X t = φ X t −1 + ∑ φ j Δ X t − j + C + ε t . Φ=0
j =1

A H0 R H0

C=0 Un processus de type Un processus de type TS


DS et TS (Régression sur le temps)

A H0 R H0

p Φ=0
ΔX t = φ X t −1 + ∑ φ jΔ X t− j + ε t.
j =1
A H0 R H0

Un processus de type Le processus est


Φ=0 DS Stationnaire (Fin)
(Filtre aux

A H0 R H0

Un processus de type Le processus est


DS Stationnaire (Fin)
(Filtre aux différences)
Telle que :
A H0 : accepter l’hypothèse nulle H0.
R H0 : rejeter l’hypothèse nulle H0

33
Chapitre 4

Méthodologie
de Box & Jenkins
et Tests sur les résidus

19
Chapitre 4 Méthodologie de Box & Jenkins

5.1 Méthodologie de Box et Jenkins :

La méthode de Box et Jenkins qui a fait l’objet d’importantes d’applications dans le


domaine de la prévision, est présenté ici par cet organigramme:

IDENTIFICATION

ESTIMATION

VALIDATION

NON OUI

Box et Jenkins ont développé une véritable méthodologie de recherche systématique d’un
modèle adéquat, ils se réfèrent à deux types de modèles ; les modèles moyennes mobiles, les
modèles autorégressifs, ou une combinaison des deux.

4.1.1 Les démarches de la méthodologie de Box et Jenkins :


¾ Analyse exploratoire des données.
™ Analyse graphique de la série (saisonnalité, tendance).
™ Analyse analytique de la série :
ƒ Test de Fisher (saisonnalité).
ƒ Test de Dickey Fuller (tendance).
¾ Stationnarisation de la serie.
™ Filtre à la différence d’ordre d.
™ Filtre aux différences saisonnier d’ordre D.
™ Filtre par régression.
¾ Identification du modèle.
¾ Estimation des paramètres.
¾ Test de validation.
¾ Prévision.

35
Chapitre 4 Méthodologie de Box & Jenkins

Analyse du graphique et du
corrélogramme

Analyse de la saisonnalité

Test de DICKEY-FULLER

Régression sur le temps Si Passage aux Différences Si


TS DS

Série stationnaire

Analyse des corrélogrammes simple et


partiel

Détermination des ordres p et q du


processus ARMA

Estimation des paramètres

Test de STUDENT les coefficients non


significatifs sont supprimés

Test sur les résidus sont-ils des bruits


blancs

Oui Non ajout d’un ordre p

Prévision par ARMA

Recoloration de la série
(saisonnalité,……..)

Différentes étapes de la méthodologie de BOX & JENKINS


Note : ce diagramme est repris de l’ouvrage de Régis Bourbonnais et Jean-Claude
Usinier.

36
Chapitre 4 Méthodologie de Box & Jenkins

4.2. L’estimation du modèle :


Après avoir identifié l’ordre du processus ARMA, il convient d’estimer les paramètres du
modèle, puis de vérifier à partir d’un certain nombre de tests statistiques que l’estimation du
modèle est valide.

4.2.1. Méthode d’estimation :


Parmi les méthodes les plus utilisées pour l’estimation des paramètres du modèle ARMA,
θ et φ , figurent la méthode du maximum de vraisemblance et la méthode des moindres
carrées.

4.3. Les tests de validation :

Après l’étape de l’identification et l’estimation des paramètres du modèle, plusieurs


modèles sont estimés et c’est l’ensemble de ces modèles qui subissent alors l’épreuve des
tests.

4.3.1. Test sur les paramètres :

ƒ Test de Student :
On effectue un test classique de Student sur chacun des paramètres du processus ARMA,
Il peut arriver qu’un ou plusieurs paramètres ne soient pas significativement différents de
0, alors le modèle estimé est rejeté et on retourne à l’étape d’estimation en éliminant la
variable dont le coefficient n’est pas significatif.

¾ H0 « φp = 0 » contre H1 « φp ≠ 0 ».

φˆp
™ La statistique du test : tφˆ = .
p
σˆ φˆ
p

La règle de décision est alors

⎧ *si. tφˆ ≺ t1−α / 2.on accepte l'hypothése nulle de processus ARMA( p − 1, q ).


⎪ p


⎪*si. tφˆ ≥ t1−α / 2 l'hypothese nulle est rejetée et on retient un processus ARMA( p, q ).
⎩ p

Les mêmes démarches sont valables pour les paramètres θ q .

ƒ Le coefficient de détermination :
Pour chaque modèle estimé, le coefficient de détermination correspondant R2 est:

37
Chapitre 4 Méthodologie de Box & Jenkins

R2 = 1 −
∑ε t
. (Coefficient de détermination normal).
∑ ( xt − x )
2

R2 = 1−
n −1
*
∑ ε t . (Coefficient de détermination corrigé)
2

n − p − q ∑ ( xt − x )2
t

(Coefficient de détermination corrigé.).


⎧ si R 2 0.7 ⇒ (le modéle estimé ajuste bien la chronique).

si ⎨ si R 2 ≺ 0.5 ⇒ (le modéle estimé ajuste mal la chronique).
⎪ si non ⇒ (on ne peut rien dire).

4.3.2 Tests sur les résidus :
L’objectif de ces tests est de vérifier que les résidus estimés suivent bien un processus
bruit blanc.

Rappelons qu’un processus bruit blanc est un processus de moyenne nulle, de variance
constante et non autocorrélé, et pas nécessairement gaussien.

ƒ Test de nullité de la moyenne :

⎧ E (ε t ) = m
Soit ⎨ et ε : la moyenne calculée des résidus .
⎩var(ε t ) = σ
2

ε
On accepte l’hypothèse Η 0 au seuil α = 5% si : ≤ t n5−%1
σˆ
n −1
¾ L'hypothèse de test : Η 0 : " m = 0" contre Η 1 :" m ≠ 0"

ε
¾ La statistique de test : Z= .
σˆ
n −1
La règle de décision : si Z ≤ tn5%
−1 on accepte l'hypothèse H0

ƒ Test d’existence d’une tendance (point de retournement) :


Il teste la nature aléatoire des résidus, on dira que la suite des données
ε 1 , ε 2 , …, ε n présente un point de retournement à la date i si :

ε i −1 ≺ ε i ε i +1 Où ε i −1 ε i ≺ ε i +1

38
Chapitre 4 Méthodologie de Box & Jenkins

Soit la variable aléatoire Χ t tel que :

⎧1
Χt = ⎨ S’il présente un point de retournement à la date t
⎩0 Sinon

La variable aléatoire Χ t suit la loi Bernoulli de paramètre 2/3.


Si T désigne le nombre total des points de retournement alors on a :
n −1
2(n − 2) 16n − 29
T= ∑ Χ i ; Ε(T ) = ; νar (T ) = .
i=2 3 90
Sous l’hypothèse que ( ε i ) forment une suite de variables aléatoires Indépendantes et
identiquement distribuées :
T − E (T )
La statistique U= ⎯
⎯→ N (0,1) , pour n>50
var(T )

Donc on accepte l’hypothèse Η 0 : « les ε i sont non corrélés» si U ≺ 1.96 et cela au seuil
α = 0,05

ƒ Test de recherche d’autocorrélation (Durbin–Watson)


Le test de Durbin Watson est un test qui détecte l’autocorrélation d’ordre 1, sous la
forme : ε t = ρε t−1 + η t . ou ε t ≈ N(0.σ2 ) .
¾ Le test d’hypothèse:
⎪⎧⎪ H 0 : ρ = 0(absence.de.corrélation)

⎪⎪⎩H1 : ρ ≠ 0(présence.de.corrèlation)

¾ La statistique de Durbin Watson utilisée est :


n

∑(ε − ε
2
t t −1 )
DW = t=2
n
Cette statistique comprise entre 0 et 4.
∑ε
t =1
t
2

Ou εt : l’estimateur des résidus du model.


Cette statistique est comprise entre 0 et 4 et vaut 2 lorsque ρ =0
Durbin et Watson ont tabulé les valeurs critiques de DW au seuil 5 % en fonction de la
taille de la série et du nombre de variables explicatives.

ƒ Test de Box Pierce :


k
Ce test est basé sur la statistique de Quenouille Q= n * ∑ rk2 (ε t ) qui est fonction de la
k =1
somme des carrés des autocorrélations de la FAC. Il permet de vérifier l’hypothèse :

39
Chapitre 4 Méthodologie de Box & Jenkins

H 0 = ρ1 = ρ 2 = ... = ρ K = 0.

H1 : il existe au moins un ρ i significativement différent de 0.


Pour effectuer ce test, il est conseillé de choisir K entre 20 et 30.
L’hypothèse H0 rejette au seuil de 5 % si Q est supérieur au quantile χ 2 0.95 de la loi χ 2 .

ƒ Test de Ljung et Box:


Nous pouvons utiliser aussi une statistique, dont les propriétés asymptotiques sont
meilleures, dérivée de la première qui est le Q′ de Ljung et Box :
k
ri 2 (ε t )
Q′ = n(n + 2)∑ .
i =1 n−i

ƒ Les tests du Skewness et de Kurtosis :


La statistique de test :
β11/ 2 − 0
v1 = telle que β1/2
1 : cooefficient de skewness
6/n

β2 − 3
ν2 = telle que β 2 : coefficient de kurtosis.
24 / n
¾ Les hypothèses :
H0 : ν 1 = 0(absence d'symétrie) etν 2 = 0(aplatissement normal) .
¾ La règle de décision :
⎧ si ν 1 ≺ 1.96 et ν 2 ≺ 1.96 ⇒ (on accepte l'hypothese de normalite).

⎩ si non on rejette l'hypothese de normalite.

ƒ Le test de Jarque et Bera

Il s’agit d’un test qui regroupe les résultats précédents.


¾ La statistique du test :
s = n / 6* β1 + n / 24( β 2 − 3) 2
¾ Les hypothèses : H0 : normalité des résidus au seuil α.
¾ La règle de décision : si s ≥ χ12−α (2)on rejette l'hypothese de normalité .

ƒ Test d’homoscédasticité (l’effet ARCH)


40
Chapitre 4 Méthodologie de Box & Jenkins

Les modèles classiques de prévision fondés sur les modèles ARMA supposent des
séries temporelles à variance constante (hypothèse d’homoscedasticité).
Cette modélisation néglige l’information éventuelle contenue dans le facteur résiduel
de la chronique.
Les modèles de type ARCH (autorégressive conditionnellement heteroscedastiques)
permettent de modéliser des chroniques qui ont une volatilité (ou variance ou variabilité)
instantanée qui dépend du passé.
Il est ainsi possible d’élaborer une prévision dynamique de la chronique en termes de
moyenne et de variance.
L’effet ARCH est repéré grâce au corrélogramme des carrés des résidus.
Si un ou plusieurs termes sont significativement différents de zéro (l’existence d’une
corrélation entre les carrés des résidus) on dit qu’il y a effet ARCH.

Ceci est confirmé par le test d’effet ARCH :


¾ Le modèle ARCH est spécifie par :
p
ε t = u t . ht Avec ut indépendants identiquement distribués et ht2 = α 0 + ∑α i ε t2−i
i =1

¾ Statistique du Multiplicateur de Lagrange LM= nR 2 avec n = le


nombre d’observations servant au calcul de la régression.
R2= le coefficient de détermination.

™ Soit l’hypothèse H0 : « α1 = α 2 = ... = α p = 0 » contre H1 : « α i non


tous nul »
™ Règle de décision : Si LM < χ 2 ( p) on accepte H 0 .

™ Dans le cas contraire LM > χ 2 ( p ) à p degré de liberté compris entre 1


et 3, on rejette H0 et le processus est justifiable d’un modèle ARCH (p).
Si p >3 le modèle sera justifiable d’un modèle de type GARCH.

5.4. Choix du modèle :


On fait appel à des critères d’information afin de choisir le modèle optimal parmi tous les
modèles repérés :
¾ Le critère AIC introduit par Akaike :

AIC (p, q) = log [σ2] + 2 * ( p + q )


N
¾ Le critère BIC de Schwartz :
BIC (p, q) = log [σ2] + (p+q) * log( N ) N
Le modèle optimal est celui qui minimise ces deux critères.

4.5 Prévision :
41
Chapitre 4 Méthodologie de Box & Jenkins

4.5.1 Transformation de la série :


Lorsque on a appliqué différentes transformations (exemple différenciation dans le cas
d’une série I (1)) afin d’identifier le modèle ARMA, il est nécessaire lors de la phase de
prévision de prendre en compte la transformation retenue et de recolorer la prévision.
Plusieurs cas sont possibles :
¾ Si le processus contient une tendance déterministe, on extrait cette dernière par
régression afin d’obtenir une série stationnaire lors de la phase de prévision, on
adjoint aux prévisions réalisées sur la composante ARMA stationnaire, la
projection de la tendance.
¾ Si la transformation résulte de l’application d’un filtre linéaire (de type par
exemple différence premières), on réalise les prévisions sur la série filtrée
stationnaire e l’on reconstruit ensuite par inversion du filtre les prévisions sur la
série initiale.
4.5.2 Prédicteur pour un modèle ARMA :
On considère un modèle ARMA ( p, q ) tel que :
X t = φ1 X t −1 + + φ p X t − p + ε t + θ1 ε t −1 + + θq ε t −q

Avec : (φ p ,θ q )∈ IR 2∗ et ε t i ⋅ i ⋅ d (0,σ ε2 ) .

Appliquons le théorème de Wold au processus {X t , t ∈ Ζ} et considérons la forme



MA (∞) correspondante : X t = ∑α ε
j =0
j t− j α0 = 1 α j
≺ ∞.

Il s’ensuit que la meilleure prévision que l’on peut faire de X t +1 compte tenu de toute

l’information disponible jusqu’à la date t, notée Xˆ t (1) , est donnée par :

Xˆ t (1) = E ( X t +1 X t , X t −1 , X t − 2 ,..., X 0 )

= E ( X t +1 ε t , ε t −1 , ε t − 2 ,..., ε 0 ) = ∑ α jε t +1− j
j =1

Dés lors, l’erreur de prévision est donnée par la réalisation en t + 1 de l’innovation qui en t
n’est pas connue : X t +1 − Xˆ t (1) = ε t +1

Plus généralement pour une prévision à un horizon k on a :


∞ k −1
Xˆ t (k ) = ∑ α jε t + k − j et X t + k − Xˆ t (k ) = ∑ α jε t + k − j
j =k j =0

Déterminons un intervalle de confiance sur la prévision Xˆ t (k ), sous l’hypothèse de normalité

des résidus ε t . On montre alors que :

42
Chapitre 4 Méthodologie de Box & Jenkins

X t + k − Xˆ t (k ) l
→ N (0,1)
[
var X t + k − Xˆ t (k ) ]1
2 T →∞

Or on sait que :

{[ ]} ⎡⎛ k −1 ⎞ ⎤ k −1 2 2
2
2
E X t + k − Xˆ t ( k ) = E ⎢⎜ ∑ α j ε t + k − j ⎟ ⎥ = ∑ α j σ ε
⎣⎝ j = 0 ⎠ ⎦ j =0
X t + k − Xˆ t (k ) l
D’où → N (0,1)
σε [∑ k −1
α2
j =0 j
] 1
2 T →∞

On peut donc construire un intervalle de confiance sous la forme :


⎡ α ⎛ k −1 ⎞
1
2 ⎤
IC = X t (k ) ± t ⎜ ∑ α j ⎟ σˆ ε ⎥
⎢ ˆ 2⎜ 2

⎢ ⎝ j =0 ⎠ ⎥
⎣ ⎦

43
Chapitre 5

Les processus
à mémoire longue
Chapitre 5 Les processus a mémoire longue

5.1. Généralité et définition de la mémoire longue :


Un processus stationnaire Xt est un processus à mémoire longue s’il existe un nombre
réel α , telle que 0 ≺ α ≺ 1 , et une constante c, c 0,vérifiant :
ρk
lim = 1.
k →∞ ck −α
où ρ est la fonction d’autocorrelation et k le retard.
Par conséquent, les autocorrelations d’un processus à mémoire longue vérifient la
relation asymptotique suivante : ρ k ≈ ck −α quand k → ∞ .

5.2. Bruit blanc fractionnaire ARFIMA(0.d.0) :


Le processus ARFIMA le plus simple est le processus ARFIMA (0.d.0) ou bruit
fractionnaire de paramètre d en temps discret. Il se définit comme suit :
(1 − B) d X t = ε t .

où B est l’opérateur retard et ξt est un bruit blanc.


Le développement binomial est donné par :
Γ( j − d ) k −1− d

πj = = ∏( ).
Γ( j + 1)Γ(− d ) 0≺ k ≤ j
∇ d = (1 − B) d = ∑ π j B j
k
où pour j=0.1…
j =0

où Γ étant la fonction euclidienne de seconde espèce.


Le processus ainsi défini est le processus ARFIMA (0.d.0). Les propriétés de ce modèle
sont largement développées dans Hos King (1981). Nous reprenons ici que les bases
principales.
¾ Si d <1/2, Xt est stationnaire et a une représentation moyenne mobile infinie :

X t = (1 − B) − d ε t = Θ( B)ε t = ∑ θ k ε t −k .
k =0

Γ(d + k ) k d −1
où θ k = ≈ .. pour.k → ∞ .
Γ(d )Γ(k + 1) Γ(d )
¾ Si d >-1/2, Xt est inversible et a la représentation autorégressive infinie
suivante :

(1 − B) d X t = Φ ( B) X t = ∑ φk X t − k = ε t .
k =0

Γ(k − d ) k − d −1
où φk = ≈ .. pour.k → ∞ .
Γ(− d )Γ(k + 1) Γ(−d )

45
Chapitre 5 Les processus a mémoire longue

5.3. Processus ARFIMA (p.d.q) :


Un processus ARFIMA (p.d.q) ou d ∈ ]−1/ 2.1/ 2[ est définie par :

φ ( B) X t = θ ( B)ε t Ou : ε t = (1 − B)− d υt , ou, υ BB(0.σ 2 ).


Où φ ( B) et θ ( B) sont des polynômes de degrés respectivement p et q.
Les conditions de stationnarité et d’inversibilité des processus ARFIMA (p.d.q) sont :
¾ Si d <1/2 et φ ( B) = 0 possède toutes ses racines à l’extérieur du cercle unité du
plans complexe. Xt est stationnaire.
¾ Si d >-1/2 et Θ( B) = 0. possède toutes ses racines à l’extérieur du cercle unité
du plans complexes. Xt est inversible.
Finalement Xt est stationnaire et inversible lorsque -1/2<d<1/2.

5.4. Test de mémoire longue :


Il existe plusieurs types de tests de mémoire longue. Nous allons présenter ici deux tests :
¾ Le test de LO (1991) qui repose sur l’analyse de la statistique
R/S.
¾ Test de Labato et Robinson (1998).

5.4.1.Test de Lo (1991) :
Log QT
L’exposant de Hurst est donné par : H ≈
Log T
La relation entre l’exposant de Hurst et le degré d’intégration fractionnaire
1
est : H = d + .
2
( )
¾ Si 1 < H < 1 0 < d < 1 : le processus est à mémoire longue ou persistant.
2 2
¾ Si H = 1 (d = 0) : le processus se réduit au processus standard ARMA.
2
( )
¾ Si 0 < H < 1 − 1 < d < 0 : le processus est anti-persistant.
2 2

Lo a défini une statistique R/S qui, tout en restant sensible à la mémoire longue, est
invariante sous une classe générale de processus à mémoire courte.
La statistique R/S notée QT , s’écrit :

⎡ ⎤
k k
1 ⎢ ⎥
QT = R / sT (q ) = ⎢ max ∑ ( X j − X T ) − min ∑ ( X j − X T )⎥ .
sT (q ) ⎢ j =1 1≤ k ≤T j =1 ⎥
⎣ 1≤ k ≤T ⎦

46
Chapitre 5 Les processus a mémoire longue

T q
⎡ T ⎤
où sT2 (q ) = 1/ T ∑ ( X j − X T ) 2 + 2 / T ∑ w j (q ) ⎢ ∑ ( X j − X T )( X t − j − X T ) ⎥ .
j =1 j =1 ⎣ i = j +1 ⎦
j
telle que : w j (q) = 1 − , q < T.
q +1

5.4.2. Test de Labato et Robinson (1998) :


Labato et Robinson (1998) ont proposé un test du type multiplicateur de Lagrange de
l’hypothèse nulle I(0) contre l’alternative I(d) avec d ≠ 0.
La statistique de test est donnée par :
m

∑ν j I (λ j )
1/ 2 j =1
LR = − m m

∑ I (λ )
j =1
j

m
où ν j = log j − m−1 ∑ log i .
i =1

où I(λj) est le périodogramme de Xt et m le nombre d’ordonnées du périodogramme.


Asymptotiquement, la statistique de test suit une loi normale centrée réduite.

5.5. Les méthodes d’estimation des processus ARFIMA :


Les méthodes d’estimation des processus ARFIMA peuvent être regroupées en deux
catégories. La première (la méthode en deux étapes) consiste à estimer d’abord le
ˆ
paramètre d . Une fois cette estimation réalisée, la série corrigée ((1 − B) d X t ) permet de
déterminer les paramètres de la partie ARMA (p, q) du processus ARFIMA (p, d, q). La
seconde méthode (méthode en une étape) consiste à estimer tous les paramètres
simultanément par la méthode du maximum de vraisemblance, chacune de ces deux méthodes
comprend des techniques d’estimation.

5.5.1 Méthode en deux étapes : (méthode basée sur l’exposant de Hurst)


Lors de son analyse sur les crues du Nil, Hurst (1951) a introduit une statistique
permettant de détecter la présence des phénomènes de mémoire longue, cette statistique, notée
R S , est particulièrement intéressante dans la mesure où elle donne lieu à un coefficient,
appelé exposant de Hurst, permettant de classifier les séries temporelles en fonction de la
nature de leur mémoire.

47
Chapitre 5 Les processus a mémoire longue

5.6 Prévision d’un processus ARFIMA (p, d, q) :


Soit un processus ARFIMA (p, d , q) causal et inversible tel que :
Φ( B) (1 − B) d X t = Θ( B) ε t ………. (1) -

ε t → BB(0, σ ε2 ) , d ∈ ⎥ − ,
⎤ 1 1⎡

⎦ 2 2⎣
Φ( μ ) ≠ 0

où μ < 1 (causalité) et Θ(γ ) ≠ 0 , γ <1 (inversibilité).


μ et γ sont les racines des polynômes Φ et Θ respectivement

(1) peut s’écrire : X t = ∑ψ j ε t − j …………… (2)
j =0


ou bien : ε t = ∑ π j X t − j …………… (3)
j =0


(1) et (2) donnent : ∑ψ
j =0
j Z j = Θ q ( Z ) Φ p ( Z ) −1 (1 − Z ) − d


(1) et (3) donnent: ∑π
j =0
j Z j = Φ p ( Z ) Θ q ( Z ) −1 (1 − Z ) d et Z < 1

Par définition : Xˆ n + h = E ( X n + h / X 1 , X 2 ,........ X n , ε 1 , ε 2 ,........ε n )

où n est le nombre d’observations, h l’horizon et Xˆ n + h la prévision.



X n + h = ∑ψ j ε n + h − j
j =0

∞ ∞
Xˆ n + h = E (∑ψ jε n + h − j / X 1 ,..., X n , ε1 ,..., ε n ) =
j =0
∑ψ
j =0
j E (ε n + h − j / X 1 ,...X n , ε 1 ,...ε n )

⎧ε n + h − j si h − j ≤ 0
E (ε n + h − j / X 1 , X 2 ,........ X n , ε 1 , ε 2 ,........ε n ) = ⎨
⎩0 si non

Xˆ n + h = ∑ψ j ε n + h − j
j =h

Il existe un écart entre les observations et les prévisions appelé erreur de prévision noté
h −1 h −1
eˆn+ h tel que : var(eˆn + h ) = E ( X n + h − Xˆ n + h ) 2 = E (∑ψ j ε n + h − j ) 2 = σ ε2 ∑ψ 2
j
j =0 j =0

h −1
D’où l’intervalle de prévision : Xˆ n + h = ± 1.96σ ε (∑ψ 2j )1 / 2 si les erreurs sont gaussiennes .
j =0

48
Chapitre 6
Le modèle VAR
Chapitre 6 Le modèle VAR

Un modèle VAR est un outil économique particulièrement adapté pour mesurer et


utiliser en simulation, l’ensemble des liaisons dynamiques à l’intérieur d’un groupe de
variables donné. Toutes les variables sont initialement considérées comme étant
potentiellement endogènes. En règle générale, la modélisation VAR « standard» consiste à
modéliser un vecteur de variables stationnaires à partir de sa propre histoire et chaque variable
est donc expliquée par le passé de l’ensemble des variables.

La forme standard de ce type de modèle est caractérisée par les points suivants :
¾ Les variables à modéliser sont toutes stationnaires.
¾ Les variables à modéliser sont toutes potentiellement endogènes.
¾ Le nombre de décalages associé à chaque variable dans chaque équation est
identique.

6.1 Présentation du modèle VAR standard


6.1.1 Ecriture du modèle VAR standard
Soit X t = ( xt1 , xt2 ,…, xtn )′ un vecteur stationnaire de dimension ( n ×1) .

La modélisation de ce vecteur sous la forme d’un processus VAR ( p ) s’écrit


X t = C + Φ1 X t −1 + Φ 2 X t − 2 + … + Φ p X t − p + ε t t = 1, …, T
avec ε t = ( ε t1 , , ε tn ) , ε t ≈ iidN ( 0, ∑ ) où ∑ est une matrice diagonale, C : ( n ×1) , et
Φ i : ( n × n ) pour i = 1, , p.

L’hypothèse que ∑ est une matrice diagonale est cruciale dans la modélisation VAR et
dans l’utilisation du modèle VAR en simulation (calcul des fonctions de réponse et
décomposition de la variance de l’erreur de prévision).

Une autre écriture fréquemment rencontrée de ce modèle VAR est la suivante :


Φ ( B ) X t = C + ε t t = 1, , T
où Φ ( B ) = (1 − Φ1 B − … Φ p B p ) est un polynôme en l’opérateur retard L caractérisé par
B k X t = X t −k .
Enfin, dans le cas où toutes les variables sont centrées, l’écriture du modèle VAR se
ramène à Φ ( B ) X t = ε t t = 1, , T (1)
C’est cette écriture qui sera retenue par la suite

6.1.2 Condition de stationnarité


Le terme de droite du modèle VAR ( p ) défini par l’équation (1) représente le mécanisme
supposé avoir engendré le vecteur X t . Ce mécanisme est purement dynamique. Or les
éléments du vecteur X t étant stationnaires, il est nécessaire que les mécanismes dynamiques
définis par ce terme de droite génèrent effectivement une dynamique stationnaire. Pour que
cela soit assuré, les racines en B du polynôme caractéristique (1 − Φ1 B − … Φ p B p ) doivent
être de module supérieur à l’unité (ou hors du cercle unité dans le jargon consacré).

50
Chapitre 6 Le modèle VAR

Exemple : Soit la modélisation VAR (1) du processus stationnaire non centré

X t = ( xt1 xt2 )′ de dimension 2 :


⎛ xt1 ⎞ ⎛ c1 ⎞ ⎛ φ1,1
1 1
φ1,2 ⎞ ⎛ xt1−1 ⎞ ⎛ ε t1 ⎞
=
⎜ 2 ⎟ ⎜ ⎟ ⎜⎜ 1+ 1 ⎟ ⎟⎜ 2 ⎟ + ⎜ 2 ⎟
⎝ xt ⎠ ⎝ c2 ⎠ ⎝ φ2,1 φ2,2 ⎠ ⎝ xt −1 ⎠ ⎝ ε t ⎠
La condition de stationnarité de ce processus VAR (1) est obtenue par le calcul des
racines en B du polynôme :
⎛ 1 0 ⎞ ⎛ φ1,1 φ1,2 ⎞ ⎛ 1− φ1,1 B ⎞
1 1 1 1
B −φ1,2
( I − Φ1B ) = ⎜ − ⎜
⎟ ⎜ 1 1 ⎟ ⎟ B = ⎜
⎜ −φ B 1− φ B ⎟⎟
1 1
⎝ 0 1 ⎠ ⎝ φ2,1 φ2,2 ⎠ ⎝ 2,1 2,2 ⎠
Les racines en B de ce modèle VAR(1) sont obtenues en calculant les racines en B de :
det ( I − Φ1 B ) = 0 ⇔ (1 − φ1,1
1
B )(1 − φ2,2
1
B ) − φ1,2
1 1
φ2,1 B2 = 0

La stationnarité du modèle VAR est assurée si les deux racines en B de cette équation
sont de module supérieur à l’unité.

6.1.3 Concept d’innovation


Dans le cadre d’un modèle VAR, le vecteur ε t de taille ( n ×1) est appelé vecteur des
innovations de X t . Le concept d’innovation joue un rôle clef dans la modélisation VAR et
dans l’utilisation des modèles VAR en simulation.
Pour saisir facilement ce concept, il suffit de réécrire tout d’abord le modèle VAR
précédent sous la forme suivante :
X t − ( Φ1 X t −1 + Φ 2 X t − 2 + … + Φ p X t − p ) = ε t

Or, d’après l’équation (1), la meilleure prévision linéaire du vecteur X t qu’il est
possible de réaliser en ( t − 1) est donné par :

,t −1 = E ( Φ1 X t −1 + Φ 2 X t − 2 + … + Φ p X t − p / Inf t −1 )
X tprévu
= Φ1 X t −1 + Φ 2 X t − 2 + … + Φ p X t − p

où E (./ Inf t −1 ) représente l’opérateur "espérance conditionnelle à l’information


disponible à la date ( t − 1) ".

Le vecteur ε t peut donc être finalement réécrit sous la forme :

ε t = X t − X tprévu
,t −1 ( 2)
Soit encore au niveau de chacun des éléments de ε t

ε t j = xtj − E ( xtj / Inf t −1 ) pour j = 1,… , n


On s’aperçoit ainsi que si le modèle (1) est le "vrai modèle" ayant engendré le vecteur
X t (cette hypothèse est faite lors de toute modélisation et n’est donc pas spécifique aux

51
Chapitre 6 Le modèle VAR

modèles VAR), le vecteur ε t représente la part de X t qui n’était pas prévisible à la date
précédente ( t − 1) . En considérant que l’économie (autrement dit ici le vecteur X t ) subit à
chaque date des chocs aléatoires ou des "innovations" imprévisibles qui font dévier la valeur
que prend effectivement le vecteur X à une date t quelconque, de la valeur de X qui était
prévisible en ( t − 1) pour la date t, on s’aperçoit immédiatement sur l’écriture (2) que les chocs
aléatoires survenant à la date t sont donnée par ε t . On appellera donc ε t le vecteur des
innovations du vecteur X à la date t ou bien encore le vecteur des chocs d’innovations
affectant X à la date t (ou affectant X t plus simplement).
Ces innovations représentent donc les chocs affectant l’économie à chaque date. Nous
verrons par la suite qu’elles seront "considérées" comme des variables exogènes du modèle
VAR et seront utilisées comme telles en simulation.

Exemple: Soit X t = ( xt1 , xt2 , xt3 )′ un processus vectoriel stationnaire centré de dimension
3. Une modélisation VAR(1) de ce vecteur s’écrit :
⎛ xt1 ⎞ ⎛ φ1,1
1 1
φ1,2 1
φ2,3 ⎞ ⎛ xt1−1 ⎞ ⎛ ε t1 ⎞
⎜ 2⎟ ⎜ 1 1 ⎟⎜ 2 ⎟ ⎜ 2 ⎟
⎟ ⎜ xt −1 ⎟ + ⎜ ε t ⎟
1
⎜ xt ⎟ = ⎜ φ2,1 φ2,2 φ2,3
⎜ xt3 ⎟ ⎜ φ3,1
1 1
φ3,2 1 ⎟⎜ 3 ⎟ ⎜ 3 ⎟
φ3,3 ⎠ ⎝ xt −1 ⎠ ⎝ ε t ⎠
⎝ ⎠ ⎝
Considérons par exemple la variable x 2 . La prévision en ( t − 1) de la valeur de xt2 est
donnée par

(x ) = E ( φ2,1 xt3−1 / Inft −1 )


prévu 1 1 1 1
2
t xt −1 + φ2,2 xt2−1 + φ2,3
1 1 1 1
= φ2,1 xt −1 + φ2,2 xt2−1 + φ2,3 xt3−1

La valeur de l’innovation affectant x 2 à la date t est donc égale à :

xt2 − ( xt2 )
prévu
= ε t2

6.2. Estimation d’un modèle VAR standard


Dans le cas d’un vecteur X t stationnaire et d’un modèle VAR(p) usuel où chaque
variable intervient dans chaque équation avec le même nombre de décalages, l’inférence
classique s’applique et le modèle peut être convenablement estimé à l’aide de la méthode des
Moindres Carrés Ordinaires sur chaque équation séparément.
L’objectif n’est pas ici de fournir une démonstration rigoureuse de tous ces résultats
mais de mettre ce résultat en évidence de façon heuristique pour faire apparaître le modèle
VAR comme la forme réduite usuelle d’un modèle économétrique et pour justifier
l’applicabilité des résultats économétrique auxquels le modélisateur non spécialiste des séries
temporelles est habitué
Le modèle VAR(p) présenté dans l’équation (1) est tout d’abord réécrit sous une forme
plus proche de celle généralement retenue en économétrie classique :

52
Chapitre 6 Le modèle VAR

Soit Yt le vecteur de dimension ( np ×1) et soit Π ′ la matrice de dimension ( n × np )


⎛ X t −1 ⎞
⎜ ⎟
définis par Yt = ⎜ ⎟ et Π ′= ( Φ1 … Φ p )
⎜ X t− p ⎟
⎝ ⎠

Le modèle (1) peut alors être réécrit selon


X t = Π′Yt + ε t
où la matrice Π ′ contient l’ensemble des matrices Φ i i = 1, , p.

Sous l’hypothèse ε t ≈ iidN ( 0, ∑ ) , la distribution du vecteur X t conditionnelle à


l’histoire de ce vecteur ( X t − k pour k = 1, 2,…) est donnée par :

( X t / X t −1 , X t −2 ,…) ≈ N ( Π′Yt , ∑ )
La densité conditionnelle de l’observation de la période t (pour t quelconque) est alors :
1
n
⎧ 1 ⎫
f ( X t / X t −1 , ) = ( 2π ) ∑ −1 2 exp ⎨− .( X t − Π′Yt )′ .∑ −1.( X t − Π′Yt ) ⎬

2
⎩ 2 ⎭
On peut donc en déduire la vraisemblance de l’échantillon :

f ( X1, X 2 , , X − p +1 ) = ∏ f ( X t / X t −1 ,
T
, XT / X 0 , )
t =1

Il vient ensuite pour la log-vraisemblance de l’échantillon :

L (θ ) = −
nT
2
T
2
1 T
(
2 t =1 ⎢⎣
)
Log ( 2π ) + Log ∑ −1 − ∑ ⎡( X t − Π′Yt )′ .∑ −1.( X t − Π′Yt ) ⎤
⎥⎦

Où θ = ( Π ′ , ∑ ) représente l’ensemble des paramètres du modèle.

L’estimateur du maximum de vraisemblance de Π′ obtenu par application de la


méthode des moindres carrés ordinaires aboutit alors à
−1
ˆ ′ = ⎡ ∑ X Y ′ ⎤⎡ ∑ Y Y ′ ⎤
T T
Π ⎢ t t ⎥⎢ t t ⎥
⎣ t =1 ⎦⎣ t =1 ⎦
Notons que les estimateurs des éléments de la jème ligne de la matrice Π′ sont obtenus en
régressant xtj sur Yt :
−1
⎡T ⎤⎡ T ⎤
πˆ j = ⎢ ∑ xt Yt′ ⎥⎢ ∑ Yt Yt′ ⎥
⎣ t =1 ⎦⎣ t =1 ⎦

53
Chapitre 6 Le modèle VAR

ˆ ′ de la matrice Π′ permet ensuite d’obtenir l’estimateur


L’utilisation de l’estimateur Π
de la matrice de variance-covariance ∑ . En effet la valeur estimée du vecteur des
innovations est donnée par :
ˆ ′Y
εˆt = X t − Π t

par définition de la matrice de variance-covariance des innovations, il vient ensuite :

ˆ = 1 . εˆ εˆ′
T
∑ ∑tt
T t =1

L’élément ( i, i ) de la matrice ∑
ˆ correspond à la variance estimée de l’innovation de la
1 T
∑ (εˆt′ ) alors que l’élément ( i, j ) de ˆ correspond à la
2
variable x : σˆ i =
i
t la matrice ∑
T t =1
1 T i j′
covariance estimée des innovations des variables xti et xtj : σˆ i j = ∑ εˆt εˆt
T t =1

D’un point de vue théorique, la présentation de la modélisation VAR standard ne


présente donc aucune difficulté particulière pour l’économètre classique une fois connu le
nombre de décalages p à utiliser.

6.3. Estimation du nombre de décalages p


La théorie économique ne donne que très peu d’informations sur le nombre de décalages
p à retenir dans la modélisation d’un vecteur de variables X sous une forme VAR(p). De plus,
il n’existe aucune procédure établie pour déterminer le nombre de décalages adéquat. Tout au
plus pourrait-on dire que le nombre de décalages à retenir est celui qui permet de modéliser
"convenablement" le vecteur X et d’aboutir à un vecteur d’innovations (qui est en fait la partie
non modélisée de X) qui soit de type bruit blanc.
Si cette remarque de bon sens semble déjà suggérer une méthode de détermination du
nombre de décalages, il faut également remarquer que le nombre de paramètres à estimer pour
un modèle VAR est égal à pn2 (ou (pn2 +n) en prenant en compte les termes constants
contenus dans le vecteur C) et augmente de n2 avec chaque nouveau décalage. Un nombre
trop élevé de décalages risque donc d’épuiser rapidement les degrés de libertés.

A partir de ces deux remarques, trois méthodes sont plus particulièrement retenues pour
estimer le nombre de décalages p dans la pratique des modèles VAR :
™ Une méthode basée sur l’examen des propriétés statistiques des innovations du
modèle VAR
™ Une méthode basée sur l’utilisation de critères d’information
™ Une méthode basée sur des tests de nullité emboîtée sur les paramètres associés au
dernier décalage du modèle.

54
Chapitre 6 Le modèle VAR

Une première méthode de détermination du nombre p de décalages consiste à vérifier la


blancheur des résidus de modèles VAR(p) successivement estimée pour p=1,2,3….
En partant du modèle VAR d’ordre minimal (p = 1), il suffit alors d’arrêter la procédure
pour le nombre de décalages p pour lequel les résidus sont de type bruit blanc. La blancheur
des résidus peut être examinée à partir de différents tests de non autocorrélation (test de
Ljung-Box ou Box-Pierce, test type multiplicateur de Lagrange, etc.), de normalité
(Skewness, Kurtosis, Barque-Jéra) et d’absence d’hétéroscédasticité conditionnelle (test
d’absence d’effets ARCH).

6.3.1 Estimation du nombre de décalages à partir d’un critère d’information


Une seconde méthode consiste à déterminer le nombre de décalages en utilisant un
critère d’information. Les critères d’information sont basés sur l’idée selon laquelle l’ajout
d’une variable explicative (ou d’un ensemble de variables explicatives) à un modèle existant
aboutit d’un coté à une amélioration plus ou moins importante de la part expliquée des
variables modélisées (apport informatif) et d’un autre côté à une réduction des degrés de
libertés pour l’estimateur. Cette réduction des degrés de liberté est considérée comme une
pénalité liée à l’incorporation d’une variable explicative additionnelle.

La valeur du critère d’information peut être calculée pour chaque modèle estimé. Dans
le cas des modèles VAR, la procédure de détermination du nombre de décalages à partir des
critères d’informations consiste donc à estimer un modèle VAR d’ordre minimal (p = 1) et de
calculer la valeur prise par le critère d’information) pour ce modèle, En estimant le modèle
VAR d’ordre immédiatement supérieur (p = 2) et en recalculant la valeur correspondante du
critère d’information, on décide de conserver le décalage p=2 si l’apport informatif du second
décalage est supérieur au coût qu’il occasionne en termes de réduction de degrés de liberté.

Dans le cas où le décalage p=2 est conservé, la procédure est prolongée en estimant le
modèle VAR(3) et en comparant le critère d’information obtenu pour ce modèle avec celui
obtenu pour le modèle précédent VAR(2). Le nombre de décalages est ainsi systématiquement
augmenté tant que l’apport informatif du dernier décalage est supérieur au coût qu’il
occasionne. Lorsqu’un décalage occasionne un coût supérieur au gain informatif, la procédure
s’arrête et le décalage précédent apparaît être le décalage "optimal".

En pratique, il suffit donc de déterminer "à priori" un nombre de décalages maximal pmax
et d’estimer successivement les modèles VAR(p) pour p =1,… , pmax. Pour chaque modèle
estimé, la valeur du critère d’information correspondante est calculée et est notée CRIT(p)
pour p =1,… , pmax .

Le nombre de décalages optimal p̂ est choisi comme celui pour lequel la valeur de
critère d’information est maximale (ou minimale selon la forme du critère retenu) :
pˆ = max ou min CRIT ( P )
p =1,…, pmax p =1,…, pmax

Dans le cadre de la modélisation VAR, parmi les critères qui sont fréquemment
utilisés : le critère du Final Predictor Error (FPE), le critère d’information de Schwartz (SC) et
le critère d’information de Hannan-Quinn (HQ), le critère d’information d’ Akaike(AIC).

55
Chapitre 6 Le modèle VAR

Tous les critères sont basés sur le choix d’un nombre de décalages qui minimise une
expression dans laquelle intervient à la fois le nombre de décalages (p), la taille de
l’échantillon (T), le nombre de variables (n) et le déterminant de la matrice de variance-
covariance des innovations obtenues à partir d’un VAR(p) (noté det ∑ ( p ) dans les formules
relatives à chaque critère). Ce dernier élément est en fait un indicateur de la qualité statistique
du modèle qui décroît lorsque la qualité statistique du modèle s’améliore.
En notant ∑ ( p ) la matrice de variance-covariance du modèle VAR(p), les expressions
correspondant à ces différents critères sont les suivants :
p
⎡ T + np + 1 ⎤
- Critère FPE (Final Predictor Error) : ⎢ ⎥ det ∑ ( p )
⎣ T − np − 1 ⎦
2 pn 2
- Critère AIC (Akaike Information Criterion): log ⎡⎣det ∑ ( p ) ⎤⎦ +
T
log (T )
- Critère SC (Shwartz Criterion) : log ⎡⎣ det ∑ ( p ) ⎤⎦ + pn 2
T
2log ⎡⎣log (T ) ⎤⎦
- Critère HQ (Hannan Quinn) : log ⎡⎣ det ∑ ( p ) ⎤⎦ + pn 2
T

Plusieurs auteurs ont déjà réalisé des évaluations comparatives de ces différents critères
afin d’analyser leur capacités respectives à sélectionner le bon modèle

6.3.2. Estimation du nombre de décalages à partir de tests du rapport


de vraisemblance
Une troisième procédure consiste à déterminer le nombre de décalages du modèle VAR.
Les tests utilisés sont des tests du rapport de vraisemblance qui prennent une forme simple
dans le cas des modèles VAR. En effet, la valeur de la log-vraisemblance du modèle VAR
éstimé est égale à

() ( )
ˆ −1 − 1 εˆ′ ∑
T
nT T
L θˆ = −
2
Log ( 2π ) + Log ∑
2

2 t =1
t
ˆ −1 εˆ
t

ˆ = 1 εˆ εˆ′, le dernier élément du terme de droite se réduit ici à


T
Etant donné que ∑ ∑
T t =1
t t

1 T nT

2 t =1
εˆt′ ∑ˆ −1εˆt =
2

Les tests du rapport de vraisemblance associé à une hypothèse nulle H 0 donnée sont
bâtis sur le double du rapport des vraisemblance (ou de la différence des Log-vraisemblance)
estimées pour le modèle contraint ( L0 ( θ ) ) et pour le modèle non contraint ( L1 ( θ ) ) . La
statistique de test correspondante dans le cas d’un modèle VAR se réduit donc à :

( ()
RV = 2 L1 θˆ − L 0 θˆ( )) = T {Log ∑ˆ 0
ˆ
− Log ∑ 1 }
56
Chapitre 6 Le modèle VAR

Un résultat standard sur la distribution de cette statistique permet de montrer que


RV = 2 ( L1 ( θ ) − L0 ( θ ) ) ≈ χ 2 ( rest )

Avec rest = nombre de restrictions sous H 0 , sous l’hypothèse nulle H 0 .

La procédure de détermination du nombre de décalages d’un modèle VAR consiste donc


ici à déterminer "à priori" un nombre de décalages maximal pmax et d’estimer simultanément
le modèle VAR(pmax) et le modèle VAR(pmax-1). L’estimation des deux modèles permet alors
de réaliser un test du rapport de vraisemblance associé à l’hypothèse nulle H 0 : Φ pmax = 0.
En effet, cette procédure s’arrête dés que l’hypothèse nulle des paramètres associés au
dernier décalage est rejetée par les données. Le modèle VAR correspondant à ce décalage est
finalement retenu.

Remarque: dans la pratique, il est fréquent de combiner ces trois méthodes pour
s’assurer que le nombre de décalages retenu est statistiquement adéquat.

6.4. Calcul des fonctions de réponse du modèle VAR standard


La forme autorégressive d’un modèle VAR est presque toujours non interprétable en
termes économiques car elle ne représente que la forme réduite d’un modèle structurel sous-
jacent. Sauf cas particulier, la simulation de modèle VAR estimé ne fournit donc pas
d’informations économiquement interprétables quant à la forme structurelle sous jacente au
modèle VAR. La simulation de la forme structurelle sous jacente peut être effectué. Elle
nécessite cependant que le modèle VAR estimé soit préalablement transformé pour être mis
sous la forme d’un modèle VAR structurel.

6.4.1. Utilité du concept d’innovation en simulation


La simulation d’un modèle VAR fait immédiatement surgir une première difficulté pour
l’économètre classique. En effet, La simulation d’un modèle structurel repose généralement
sur l’analyse des effets statiques et dynamiques d’une variation d’une ou plusieurs variables
exogènes sur les variables endogènes du modèle. Or un modèle VAR standard ne contient pas
de variables exogènes!. Pour simuler un modèle VAR, il est en fait nécessaire de considérer
les innovations comme des variables exogènes et d’analyser les effets des variations d’une
ou plusieurs innovations (on parlera d’un "choc d’innovation") sur les variables du modèle
VAR.

Soit ε ti l’innovation associée à la variable xti du vecteur X t .

Par définition, cette innovation est égale à ε ti = xti − ( xti / t −1 )


prévu
et représente la part de la
valeur prise par la variable x i en t qui n’a pas été anticipée rationnellement en ( t − 1) à partir
du modèle VAR retenu.
Cette part est supposée représenter les chocs nouveaux ayant affecté la valeur de x i à la
date t et ayant fait dévier xti de la valeur qu’elle aurait du avoir d’après l’information
disponible et utilisée en ( t − 1) . Autrement dit, ε ti représente un choc en t "non anticipé en

57
Chapitre 6 Le modèle VAR

( t − 1) " sur x i . Le fait que ce choc faisant augmenter xti de 1 unité par rapport à la valeur
qu’elle aurait du prendre d’après l’information disponible en ( t − 1) .

Simuler le modèle VAR revient en fait à tracer les effets dynamiques des chocs
d’innovations de chacune des variables (ou de certaines d’entre elles uniquement) sur les
variables du vecteur X (ou sur certaines d’entre elles).
7.4.2. Fonctions de réponse du modèle VAR standard
Le calcul des fonctions de réponse est immédiat dans le cas d’un modèle VAR standard
dont les innovations ne sont pas corrélées instantanément :

( )
Cov ε ti , ε t j = σ i j = 0 ∀ ( i, j ) avec i ≠ j.

Dans ce cas, les innovations ne sont pas instantanément reliées. Il est donc possible de
simuler tour à tour les effets d’un choc sur l’une des innovations sans prendre en
considération les éventuels effets de ce choc sur la variation d’une autre innovation. Dans ce
cas, le calcul des fonctions de réponse est extrêmement simple.
Le calcul des fonctions de réponse d’un modèle VAR passe par le calcul de la forme
Moyenne Mobile Vectorielle (ou forme VMA) du modèle VAR. Cette forme VMA est
obtenue par inversion du polynôme Φ ( B ) .
Soit l’écriture suivante du modèle VAR(p) défini par l’équation (1)
Φ ( B) X t = εt

Sous l’hypothèse que les racines en L du polynôme Φ ( B ) sont hors du cercle unité,
Φ −1 ( B ) existe et est un polynôme en B d’ordre fini : Φ −1 ( B ) = I + Ψ1 B + Ψ 2 B 2 +

avec Ψ k : ( n × n ) pour k = 1, 2, et lim Ψ k = 0


k →∞

La forme VMA du modèle VAR(p) s’écrit donc :


X t = Φ −1 ( B ) ε t
= Ψ ( B)εt ( 2)
= I ε t + Ψ1ε t −1 + Ψ 2ε t − 2 +

Les fonctions de réponse du modèle VAR sont directement obtenues à partir des
matrices Ψ k , k = 1, 2, associées aux innovations décalées. Plus précisément, le calcul des
fonctions de réponses de modèle VAR revient à analyser comment la variation à une date t
quelconque d’une innovation ε i de la variable x i quelconque de X va affecter l’ensemble des
variables ( xt1 , xt2 , , xtn ) pour les dates t , t + 1, t + 2, .

Les fonctions de réponse cumulées entre l’innovation ε i et la variable x j à k périodes


en avant ( FRI j ,i , k ) sont égales à :

58
Chapitre 6 Le modèle VAR

∂xtj+ k
FRI j ,i , k = pour k = 1, 2,
∂ε ti

Les fonctions de réponse instantanées entre l’innovation ε i et la variable x j à une


périodes en avant ( FRC j ,i , k ) sont égales à :
k
∂xtj+ s
FRC j ,i , k = ∑ pour k = 1, 2,
s = 0 ∂ε t
i

Or d’après (3) et l’hypothèse de stationnarité de X t , il vient :


X t = I ε t + Ψ1ε t −1 + Ψ 2ε t − 2 + ⇔ X t + l = I ε l +t + Ψ1ε t +l −1 + Ψ 2ε t +l − 2 +
On a donc :
∂xtj+ k ∂xtj
= = Ψ kj ,i pour l = 1, 2,
∂ε ti
∂ε t − k
i

Où Ψ kj ,i représente l’élément ( j , i ) de la matrice Ψ k .


Les fonctions de réponse instantanées et cumulées correspondantes à l’effet à k périodes
en avant d’un choc de l’innovation ε i sur la variable x j peuvent donc être réécrites selon :
k
FRI j ,i , k = Ψ j ,i
k et FRC j ,i , k = ∑ Ψ sj ,i
s =0

Enfin, les effets multiplicateurs totaux des innovations sur les variables du vecteur X
sont donnés par :
k
∂X t + s

s = 0 ∂ε t
= I + Ψ1 +Ψ 2 + = Ψ (1) pour k = 1, 2,

où Ψ (1) est une matrice de taille ( n × n ) .

Les fonctions de réponses sont généralement présentées sous la forme d’un tracé
permettant de visualiser simplement les effets instantanées et dynamiques associés aux chocs
d’innovation sur les variables du vecteur X t .

Remarque 1: L’écriture (2) de la forme VMA fait apparaître que les effets instantanés
induits par les chocs d’innovations sur le vecteur X t sont égaux à la matrice identité de taille
(n × n) :
∂X ∂x j ⎧1 pour i = j
= I ⇔ ti = ⎨
∂ε t ∂ε t ⎩0 pour i ≠ j
Tout choc d’innovation unitaire sur une variable i fait donc varier instantanément la
variable x i d’une unité (ce résultat est évident puisque par définition xti = ( xti )
prévu
+ ε ti ) et la
variable x j de 0 unité (pour i ≠ j ).

59
Chapitre 6 Le modèle VAR

Remarque2 : D’après l’hypothèse de stationnarité de X t (et donc du modèle VAR étant


supposé avoir engendré X t ), les fonctions de réponse instantanées et cumulées du modèle
VAR doivent vérifier pour tout couple ( i, j ) :

lim FRI j ,i , k = 0 et lim FRC j ,i , k = FRC j ,i , ∞ = constante


k →∞ k →∞

La vérification de cet effet de convergence des fonctions de réponse permet de vérifier à


posteriori la stationnarité du processus VAR.

6.4.3. Décomposition de la variance des erreurs de prévision du modèle


VAR standard
( )
Soit xti la valeur de l’élément i de X t et soit Et xti+ k l’espérance conditionnelle de la
valeur de xti+ k réalisé à la date t. En d’autres termes, Et ( xti+ k ) représente la prévision linéaire
de xti+ k réalisé à la date t.

( )
Soit Var xti+ k − Et ( xti+ k ) la variance de l’erreur de prévision à k périodes en avant. Il

( )
est possible de calculer la part de Var xti+ k − Et ( xti+ k ) qui est due au jème choc du modèle
VAR (soit ε t j ). Ce calcul correspond à la décomposition de la variance de l’erreur de
prévision du modèle VAR.

Pour faire ce calcul simplement, nous rappelons rapidement un résultat de calcul


matriciel usuel

Soit ∑ = (σ i j ) avec i, j = 1,…, n, une matrice diagonale de dimension ( n, n ) (on a


donc σ i j ≠ 0 pour i = j et σ i j = 0 pour i ≠ j ).

Soit R = ( ri j ) avec i, j = 1, , n une matrice diagonale de dimension ( n, n ) et soit Ri la


ème
i colonne de la matrice R. Un résultat usuel de calcul matriciel permet de montrer que la
matrice ∑ étant diagonale, on a
n
R ∑ R′ = ∑σ ii Ri Ri′
i =1

60
PARTIE

APPLICATION
Application
Lissage exponentiel
Analyse de la série vente de carburant
JET A1 secteur Aviation National :
La série JAN est tendancielle et présente aussi une composante saisonnière qui
intervient de façon multiplicative, c’est pour cela qu’on a appliqué la technique multiplicative
de Holt & Winters.

Parameters: Alpha 0.5200


Beta 0.0000
Gamma 0.0000
Sum of Squared Residuals 5.55E+08
Root Mean Squared Error 2049.664
Le tableau ci-dessus comporte :

¾ Les coefficients de lissage qui minimisent la somme des carrés résiduels et qui sont :

™ Coefficient de lissage de la moyenne noté α= 0.5200.


™ Coefficient de lissage de la tendance noté β =0.0000
™ Coefficient de lissage de la saisonnalité noté γ = 0,000

¾ La racine moyenne des carrés résiduels : RMSE = 2049.664


Prévision :
Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006

Diagramme séquentiel de la série brute JAN et des prévisions :

prévision JAN
Janvier 2006 27542.4072
Février 2006 24899.7827
Mars 2006 28238.1796
Avril 2006 27509.2703
Mai 2006 26792.7844
Juin 2006 25909.4509
Juillet 2006 29244.5123
Août 2006 30058.7333
Septembre 2006 28518.1544
Octobre 2006 25881.8044
Novembre2006 27022.0719
décembre2006 28044.4801

Remarque : Les quantités de carburants sont en milliers de tonnes.

63
Analyse de la série vente de carburant
JET A1 secteur Aviation Etrangère :
La série JAE est tendancielle et présente aussi une composante saisonnière qui intervient
de façon multiplicative, c’est pour cela qu’on a appliqué la technique multiplicative de Holt &
Winters.

Parameters: Alpha 0.6600


Beta 0.0000
Gamma 0.0000
Sum of Squared Residuals 16930748
Root Mean Squared Error 358.1386

Le tableau ci-dessus comporte :

¾ Les coefficients de lissage qui minimisent la somme des carrés résiduels et qui sont :
™ Coefficient de lissage de la moyenne noté α= 0.6600.
™ Coefficient de lissage de la tendance noté β =0.0000
™ Coefficient de lissage de la saisonnalité noté γ = 0,000

¾ La racine moyenne des carrés résiduels : RMSE = 358.1386

Prévision :
Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006

Diagramme séquentiel de la série brute JAE et des prévisions :

prévision JAE
Janvier 2006 4249.33902
Février 2006 3637.6644
Mars 2006 4068.42458
Avril 2006 4125.16432
Mai 2006 4226.8494
Juin 2006 3967.68175
Juillet 2006 4696.11771
Août 2006 4294.42568
Septembre 2006 4005.86643
Octobre 2006 4150.11976
Novembre2006 4109.20486
décembre2006 4741.52595

Remarque : Les quantités de carburants sont en milliers de tonnes.

64
Analyse de la série vente de carburant
Fuel-oil secteur Marine Nationale :
La série FN est tendancielle et présente aussi une composante saisonnière qui intervient
de façon multiplicative, c’est pour cela qu’on a appliqué la technique multiplicative de Holt &
Winters .
Parameters: Alpha 0.3500
Beta 0.0000
Gamma 0.0000
Sum of Squared Residuals 1.11E+09
Root Mean Squared Error 2904.533

Le tableau ci-dessus comporte :

¾ Les coefficients de lissage qui minimisent la somme des carrés résiduels et qui sont :
™ Coefficient de lissage de la moyenne noté α= 0.3500
™ Coefficient de lissage de la tendance noté β =0.0000
™ Coefficient de lissage de la saisonnalité noté γ = 0,000

¾ La racine moyenne des carrés résiduels : RMSE = 2904.533

Prévision :
Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006

Diagramme séquentiel de la série brute FN et des prévisions :


prévision FN
Janvier 2006 26146,0924
Février 2006 22161,4455
Mars 2006 26728,015
Avril 2006 26496,0203
Mai 2006 25551,5049
Juin 2006 24767,9815
Juillet 2006 29793,8169
Août 2006 28296,0462
Septembre 2006 27201,0912
Octobre 2006 28965,654
Novembre2006 22008,8657
décembre2006 25130,4277

Remarque : Les quantités de carburants sont en milliers de tonnes.

65
Analyse de la série vente de carburant
Fuel-oil secteur Marine Etrangère :
La série FE est tendancielle non saisonnière, c’est pour cela qu’on a appliqué la
technique multiplicative de Holt & Winters .

Parameters: Alpha 0.4100


Beta 0.0100
Sum of Squared Residuals 4.72E+08
Root Mean Squared Error 1891.048

Le tableau ci-dessus comporte :

¾ Les coefficients de lissage qui minimisent la somme des carrés résiduels et qui sont :
™ Coefficient de lissage de la moyenne noté α= 0.4100
™ Coefficient de lissage de la tendance noté β =0.0100

¾ La racine moyenne des carrés résiduels : RMSE = 1891.048

Prévision :
Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006

Diagramme séquentiel de la série brute FE et des prévisions :

prévision FN
Janvier 2006 552,955261
Février 2006 474,691447
Mars 2006 396,427633
Avril 2006 318,163819
Mai 2006 239,900005
Juin 2006 161,636191
Juillet 2006 183,372377
Août 2006 195,108563
Septembre 2006 173,155251
Octobre 2006 151,419065
Novembre2006 229,682879
décembre2006 307,946694

Remarque : Les quantités de carburants sont en milliers de tonnes.

Remarque importante:nous remarquons que les coefficients γ et β sont nuls pour les
séries JAN,JEA,FE bien que ses dernières aient une composante saisonnière est quelques
une ont dune composante tendancielle de type TS (d'après l'étude de Box et Jenkins
présentée dans le chapitre suivant)

66
Application
Box & Jenkins
Application Box & Jenkins

Analyse de la série vente de carburant


JET A1 secteur Aviation National :
Plusieurs étapes préliminaires sont nécessaires avant d’effectuer des tests spécifiques sur
une série chronologique et de chercher à la modéliser, il convient d’étudier quelques
caractéristiques stochastiques en particulier sa moyenne et sa variance.
Notation : Nous notons la série vente de carburant jet A1 secteur national JAN.
Identification
Les données de la série des ventes de carburant jet A1 (notée : JAN) sur une période de
dix ans, les observations sont mensuelles ; de janvier 1995 à décembre 2005. L'unité de
mesure est en milliers de tonnes.
Diagramme séquentiel de la série brute JAN :

Graphe de la moyenne et la variance de la série brute JAN :

Graphe de la moyenne Graphe de la variance

40000 16000000
35000 14000000
30000 12000000
25000 10000000
20000 JAN 8000000 JAN
15000 6000000
10000 4000000
5000 2000000
0 0
1 3 5 7 9 11 1 3 5 7 9 11

68
Application Box & Jenkins

D’après les deux graphes précédents, on remarque que la moyenne et la variance varient
au cours du temps. On peut donc dire que cette série semble non stationnaire..
Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des
corrélogrammes simple et partiel de la série brute.
Corrélogramme de la série brute JAN :

Nous remarquons dans le corrélogramme simple que presque tous les pics sont
pratiquement à l’extérieure de l’intervalle de confiance, le corrélogramme partiel est marqué
aussi par la présence des pics sortant au retard 1,3,4,9,12 et 13
.
D’où la série brute est donc générée par un processus non stationnaire .

69
Application Box & Jenkins

Test de FISHER:
Pour détecter la saisonnalité de la série on a fait appel à l’analyse de la variance
(ANOVA) à deux facteurs sans répétition.

Table de l’ANOVA (à 2 facteurs) données par logiciel SPSS :


Source des Somme des Degré de Moyenne F Probabilité Valeur
variations carrés liberté des carrés critique pour
F
Lignes 271775141 11 24706831 5.57733365 4.766E-07 1.87673166
Colonnes 1633056117 10 163305612 36.8646989 1.2291E-30 1.9178259
Erreur 487285068 110 4429864.25
Total 2392116326 131

Test d’influence de facteur ligne (mois) :


Fstat= 5.5773 > Fthéo= 1.8767 donc (on rejette l’hypothèse nulle) la série est affectée
d’une saisonnalité.
Test d’influence de facteur colonne (années) :
Fstat= 36.86 > Fthéo= 1.9178 donc (on rejette l’hypothèse nulle) la série est peut être
affectée d’une tendance.

Afin de traiter l’effet de saisonnalité sur notre série ou encore la stationnariser, nous lui
avons appliqué la différence saisonnière d’ordre 12.
Notation : Nous notons la série JAN désaisonnalisé par DJAN.

Graphe de la série DJAN :

70
Application Box & Jenkins

Corrélogramme de la série DJAN :

En observant le graphe ainsi que le corrélogramme de la série DJAN, nous remarquons


que la saisonnalité a été absorbée. Un recours au test de racine unitaire permet d’affirmer ou
d’infirmer la stationnarité de la série en question.

Test de Dickey- Fuller Augmenté:

On procède à l’estimation par la méthode des moindres carrées avec d=1 des trois
modèles [4],[5] et [6] de Dickey-Fuller sur la série DJAN(car les résidus forment un bruit
blanc).

Remarque
On choisit le retard d=1 qui minimise le critères d’informations d’Akaike et Schwarz

Etape (1) :
Model 4 : Test sur la tendance :

d
ΔX t = φ X t −1 + c + β t + ∑ φ j ΔX t − j + ε t .
j =1

Avec ε t est un processus stationnaire

71
Application Box & Jenkins

Nous testons alors la présence d’une tendance dans le processus en testant la nullité du
coefficient de la tendance β . Le résultat est donné dans le tableau suivant:

On remarque que la t- statistique de la tendance = -0.772 est inférieure aux valeurs


critiques 3.53 et 2.79 et 2.73 (données par la table de Dickey- Fuller) pour les seuils 1%,
5%,10% On le confirme par prob = 0.4414 supérieure à 0.05. Donc la tendance n’est pas
significativement différente de zéro, on passe alors à l’étape (2)

Etape (2) :
Model 5 : Test sur la constante

d
ΔX t = φ X t −1 + c + ∑ φ j ΔX t − j + ε t .
j =1

Avec ε t est un processus stationnaire


Nous testons la présence d’une constante dans le processus en testant la nullité du
coefficient de la constante. Le résultat de l’affichage pour la série DJAN est donné dans le
tableau suivant:

72
Application Box & Jenkins

On remarque que la t-statistique de la constante (c) = 0.209 est inférieure aux valeurs
critiques 3.78 et 3.11 et 2.73 (données par la table de Dickey- Fuller) pour les seuils 1% et
5% et 10% On le confirme par prob = 0.8342 supérieure à 0.05. Donc la constante n’est pas
significativement différente de zéro, on passe alors à l’étape (3)

Etape (3) :
Model 6: Test de la racine unitaire :

Avec ε t est un processus stationnaire


d
ΔX t = φ X t −1 + ∑ φ j ΔX t − j + ε t .
j =1

Nous testons alors la présence d’une racine unitaire dans le processus en testant la
nullité du paramètre Φ à l’aide d’une statistique de Student t Φ̂ , où Φ̂ désigne l’estimateur des
moindres carrés ordinaires (MCO). Le résultat de l’affichage pour la série DJAN est donné
dans le tableau suivant.

La statistique de Student t Φ̂ = - 2.77 est inférieure aux valeurs critiques -2.584, -1.943 et -1.614
(données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10% d’où la série ne possède pas de
racine unitaire (on rejette l’hypothèse nulle “φ = 0 “). La série DJAN est donc stationnaire. Il convient à
présent d’estimer le modèle susceptible de la représenter, en observant les corrélogrammes simple et
partiel de la série stationnaire DJAN, nous remarquons que la fonction d’autocorrélation simple (AC)
possède des valeurs importantes aux retards q=1,2,3,..,11, et que la fonction d’autocorrélation partielle
(PAC) possède des valeurs importantes aux retards p=1, 2 ,12, par conséquent nous avons plusieurs
modèles candidats parmi lesquels nous avons sélectionné le modèle :
SARIMA (1.0.1)(0.1.1).
Estimation des paramètres de model :

73
Application Box & Jenkins

Nous remarquons que tous les paramètres du modèle sont significativement différents de zéro.
En effet les rapports des coefficients du modèle sont en valeurs absolues supérieures à 1.96, ce qui est
confirmé par la probabilité de nullité des coefficients qui sont tous inférieures à 0.05.

Tests sur les résidus :


Test de validation des paramètres :

De la représentation graphique des inverses des racines des polynômes de retards


moyenne mobile et autorégressif nous constatons qu’ils sont tous supérieures à 1 en module
(leurs inverses sont en module, inférieures à 1).
Représentation graphique des séries : résiduelle ( ε t ) ; actuelle et estimée:

A partir de la représentation graphique des séries résiduelles, actuelles et estimée nous


constatons que le model estimé ajuste mieux la série DJAN.

74
Application Box & Jenkins

Corrélogramme simple et partiel des résidus :

L’analyse du corrélogramme des résidus, montre que tous les termes sont à l’intérieur
de l’intervalle de confiance (illustré par des pointillés sur le graphique). Ce qui nous entraîne
à dire que les résidus forment un bruit blanc.

Test de point de retournement :


H 0 : « Les ε i forment un bruit blanc » contre
H 1 : « Il existe une corrélation entre les ε i tel que : i = 1, n »
Après les calculs à l’aide du logiciel MATLAB nous avons obtenu les résultats suivants
Nombre de points de retournements p = 60
Espérance de la stat du test E (p) = 80
Variance de la statistique du test VAR(p) =16
La statistique du teste est T= 0.92
T = 0.92 est inférieure à 1.96 (tabulée) d’où on accepte l’hypothèse H 0 : « Les ε i
forment un bruit blanc » au seuil de 0,05.

Test de Box – Ljung :


Nous avons à tester l’hypothèse nulle :
H 0 : « Les autocorrélations jusqu’au pas k, (k=N/4) ne sont pas significatives » C'est-à-dire
H 0 : « ρ1 = ρ 2 = ... = ρ K = 0 » Contre H 1 : « ∃ρ j : j = 1,…,45 tel que ρ j ≠ 0 ».
K
γ k2
Ce test est basé sur la statistique de Box-Ljung au pas k : Q = n(n + 1)∑ .
k =1 n−k

75
Application Box & Jenkins

Si Q < χ 02,95 ( K − p − q ) , nous acceptons l’hypothèse H 0 .


La probabilité de la statistique de Box-Ljung est supérieure à 0,05 à n’importe quel retard et
la valeur de la statistique de Box-Ljung quand k = 30, p = 1, q = 12 est égale à 27.359, inférieure à
χ 02.,95
(17) = 27.59. Nous concluons alors que les erreurs ne sont pas corrélées.

Test de Durbin-Watson : (Test de détection d’autocorrélation d’ordre1 des erreurs) :


Nous testons H 0 : « ρ = 0 » contre H 1 : « ρ ≠ 0 ».
La statistique de Durbin-Watson (DW=1.993855 ≈ 2 ) nous constatons que les résidus
d’ordre 1 ne sont pas corrélés.

Test de Normalité :
Les tests sont effectués à partir des valeurs empiriques des coefficients de Skewness,
Kurtosis et la statistique de Jarque-Bera, nous avons l’histogramme suivant:

Test de Skewness (asymétrie) et de Kurtosis (aplatissement) :


⎧ H 0 : γ 1 = 0 et γ 2 = 0

Nous testons les hypothèses suivantes : ⎨
⎪ H :γ ≠ 0 ou γ ≠ 0
⎩ 1 1 2

β11 2 − 0 β2 − 3
Test de Skewness : γ 1 = Test de Kurtosis : γ 2 =
6 24
N N
μ3
où : β 11 2 = : est le coefficient de Skewness (l’indicateur d’asymétrie des résidus)
μ 23 2
μ4
β2 = : est le coefficient de Kurtosis (le degré d’aplatissement de la loi des
μ 22
résidus).
Sous l’hypothèse H 0 et si le nombre d’observations est assez grand (N >30), nous
avons :
μ ℘ ⎛ 6 ⎞
β 11 2 = 332 → N ⎜⎜ 0, ⎟ (1)
μ2 N →∞ ⎝ N ⎟⎠

76
Application Box & Jenkins

μ4 ℘ ⎛ 24 ⎞
β2 = → N ⎜
⎜ 0, ⎟
⎟ (2)
μ 22N →∞ ⎝ N ⎠
Après calculs nous avons obtenu :
β1/1 2 + 0 0.306326 + 0
Test de skewness : γ1 = = = 1.364 ≺ 1.96
6 6
N 119
β2 − 3 4.751797 − 3
Test de Kurtosis : γ2 = = = 3,900 1.96
24 24
N 119
Test de Jarque et Bera :
β 1 + (β 2 − 3)2
N N
Nous définissons la statistique S par : S =
6 24
Sous (1) et (2) : S → χ 12−α (2)
Nous testons H 0 : « accepter la normalité des résidus au seuil α =0,05 » contre
H 1 : « il n’ y a pas de normalité des résidus ».
Si S > χ 12−α (2) nous rejetons l’hypothèse H 0 sinon nous l’acceptons
La statistique de Jarque – Bera=14.11086 elle est supérieure à χ 2 (2) = 5,99.
D’après les tests précédents, nous concluons que les résidus forment un bruit blanc non gaussien.

Test d'effet ARCH :

L’analyse du corrélogramme des résidus carrés, montre que tous les termes sont à
l’intérieur de l’intervalle de confiance, ce qui nous entraîne à dire que pas d’effet ARCH.
Conclusion :
Nous pouvons conclure d’après ces tests que le modèle qui ajuste le mieux la série est :
SARIMA (1.0.1)(0.1.1) qui s’écrit sous la forme suivante :
(1 − 0.945162B )(1 − B 12 )JAN t = (1 + 0.433123B ) *(1 + 0.451035B 12 )ε t

77
Application Box & Jenkins

Prévision :
Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006
Diagramme séquentiel de la série brute JAN et des prévisions

prévision JAN
Janvier 2006 27611,1864
Février 2006 26032,2365
Mars 2006 25764,223
Avril 2006 26484,7609
Mai 2006 25626,018
Juin 2006 25343,9037
Juillet 2006 28430,7901
Août 2006 29926,5701
Septembre
2006 28368,3942
Octobre 2006 26835,2154
Novembre200
6 29177,2587
décembre2006 28070,493

Remarque : Les quantités de carburants sont en milliers de tonnes.

78
Application Box & Jenkins

Analyse de la série vente de carburant


JET A1 secteur Aviation Etrangère :
Plusieurs étapes préliminaires sont nécessaires avant d’effectuer des tests spécifiques sur
une série chronologique et de chercher à la modéliser, il convient d’étudier ces
caractéristiques stochastiques c'est-à-dire sa moyenne et sa variance.
Notation : Nous notons la série vente de carburant jet A1 secteur aviation étrangère JAE.
Identification

Les données de la série des ventes de carburant jet A1 (notée : JAE ) sur une période de
dix ans, les observations sont mensuelles ; de janvier 1995 à décembre 2005.L'unité de
mesure est en milliers de tonnes.

Diagramme séquentiel de la série brute JAE :

Graphe de la moyenne et la variance de la série brute JAE :

moyenne var iance

4500 600000

4000
500000
3500

3000 400000

2500
moyenne 300000 var iance
2000

1500 200000

1000
100000
500

0 0
1 3 5 7 9 11 1 2 3 4 5 6 7 8 9 1 11

79
Application Box & Jenkins

D’après les deux graphes précédents, on remarque que la moyenne et la variance varient
au cours du temps. On peut donc dire que cette série semble non stationnaire..
Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des
corrélogrammes simple et partiel de la série brute

Corrélogramme de la série JAE:

Nous remarquons dans le corrélogramme simple que presque tous les pics sont
pratiquement à l’extérieure de l’intervalle de confiance, le corrélogramme partiel est marqué
aussi par la présence d’un seul pic sortant au1er retard d’où la série brute est donc générée par
un processus non stationnaire .

Test de FISHER: Pour détecter la saisonnalité de la série on a fait appel à l’analyse de


variance (ANOVA) à deux facteurs sans répétition

Table de l’ANOVA (à 2 facteurs) données par logiciel SPSS:

Valeur
Source des Somme des
Degré de liberté Moyenne des carrés F Probabilité critique pour
variations carrés
F
Lignes 5520713.11 11 501883.01 3.36400777 0.00049586 1.87673166
Colonnes 109984312.00 10 10998431.20 73.7199847 4.5556E-44 1.91782590
Erreur 16411118.80 110 149191.98
Total 131916143.00 131

Teste d’influence de facteur ligne (mois) :


Fstat= 3.364 > Fthéo= 1.8767 donc (on rejette l’hypothèse nulle) la série est affectée d’une
saisonnalité

80
Application Box & Jenkins

Teste d’influence de facteur colonne (années) :


Fstat= 73.7199 > Fthéo= 1.9178 donc (on rejette l’hypothèse nulle) la série est peut être
affectée d’une tendance.

Afin de traiter l’effet de saisonnalité sur notre série ou encore la stationnariser nous lui
Avons appliqué la différence saisonnière d’ordre 12.
Notation : Nous notons la série JAE désaisonnalisé par DJAE
Graphe de la série DJAE :

Corrélogramme de la série DJAE :

En observant le graphe ainsi que le corrélogramme de la série DJAE, nous remarquons


que la saisonnalité a été absorbée .Un recours au test de racine unitaire permet d’affirmer ou
d’infirmer la stationnarité de la série en question.

81
Application Box & Jenkins

Test de Dickey- Fuller Augmenté:


on procède à l’estimation par la méthode des moindres carrées avec d=1 des trois modèles
[4],[5] et [6] de Dickey-Fuller sur la série DJAE (car les résidus forment un bruit blanc
Remarque
On choisit le retard d=1 qui minimise le critères d’informations d’Akaike et de Schwarz
Etape (1) :
Modèle 4 : Test sur la tendance :
d
ΔX t = φ X t −1 + c + β t + ∑ φ j ΔX t − j + ε t .
j =1

Avec ε t est un processus stationnaire


Nous testons alors la présence d’une tendance dans le processus en testant la nullité du
coefficient de la tendance β , Le résultat de l’affichage pour la série DJAE est donné dans le
tableau suivant:

On remarque que la t- statistique de la tendance =3.149 est inférieure à 3.53 pour le seuil
1% mais supérieur aux valeurs 2.79 et 2.73 au seuils 5% et 10% (données par la table de
Dickey- Fuller) .On le confirme ça par prob = 0.0018 est inférieure 0.05. La tendance n’est
pas significativement différente de zéro.

Alors d’après le même tableau on remarque que :


La statistique de Student t Φ̂ = -5.1657 est inférieure aux valeurs critiques -4.037, -3.448 et
-3.149 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10%
D’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ φ = 0 “)
donc non stationnarité de type TS on confirme cela par la probabilité( prob = 0.0058 )est
inférieure à 0.05).
La série DJAE est non stationnaire de type TS
Donc pour stationnariser cette série il faut faire un ajustement.
Le meilleur ajustement du processus est l’ajustement cubique car R 2 associé égale 0,362
est le plus grand d’après les résultats obtenus par le logiciel SPSS :

82
Application Box & Jenkins

Tableau (1)

La série JAE après désaisonnalisation peut être ajustée par une fonction cubique

Estimation de la tendance cubique :


Estimons l’équation d’ajustement y t qui est donnée par la formule suivante :
y t = b0 + b1 ⋅ t + b2 ⋅ t 2 + b3 ⋅ t 3 , les cœfficients b 0 , b 1 , b 2 et b 3 sont données par le Tableau (1)
Notation : Nous notons la série ajustée par AJU t elle est donnée par la formule :

AJU t = DJAEt - yt .

Diagramme séquentiel de la série DJAE avec Ajustement

DAJE
2000

1000

Observé

-1000 Cubique
0 20 40 60 80 100 120 140

Séquence

D’où la série qu’on va étudier maintenant c’est la série AJU t

Graphe de la série AJU t :

83
Application Box & Jenkins

Corrélogramme de la série AJU t :

Pour vérifier si la série ajustée AJU t ne nécessite pas une différenciation (ne possède pas
de racine unitaire), nous appliquons une deuxième fois le teste de Dickey-Fuller (mais cette
fois sur la série ajustée AJU t) les résultats sont tels que:

Etape (1) :
Model 4 : Test sur la tendance :
d
ΔX t = φX t −1 + c + β t + ∑ φ j ΔX t−j + εt .
j =1

84
Application Box & Jenkins

Avec ε t est un processus stationnaire

Nous testons alors la présence d’une tendance dans le processus en testant la nullité du
coefficient de la tendance β . Le résultat de l’affichage pour la série AJU t est donné dans le
tableau suivant:

On remarque que la t- statistique de la tendance = -0.0388 est inférieure aux valeurs


critiques 3.53 et 2.79 et 2.73 (données par la table de Dickey- Fuller) pour les seuils 1%,
5%,10% On le confirme par la prob = 0.9691 supérieure à 0.05. Donc la tendance n’est pas
significativement différente de zéro, on passe alors à l’étape (2)
Etape (2) :
Model 5 : Test sur la constante
d
ΔX = φX + c + ∑ φ j ΔX + εt .
t t −1
j =1
t− j
Avec ε t est un processus stationnaire
Nous testons la présence d’une constante dans le processus en testant la nullité du
coefficient de la constante. Le résultat de l’affichage pour la série AJU t est donné dans le
tableau suivant:

On remarque que la t-statistique de la constante (c) = 0.000922 est inférieure aux valeurs
critiques 3.22 et 2.54 et 2.17 (données par la table de Dickey- Fuller) pour les seuils 1% ,
5% et 10% On le confirme par prob = 0.9993 supérieure à 0.05. Donc la constante n’est pas
significativement différente de zéro, on passe alors à l’étape (3)
Etape (3) :
Model 6: Test de la racine unitaire :
d
ΔX t = φX t −1 + ∑ φ j ΔX t− j + εt .
j =1

85
Application Box & Jenkins

Avec ε t est un processus stationnaire.

Nous testons alors la présence d’une racine unitaire dans le processus en testant la nullité du
paramètre Φ à l’aide d’une statistique de Student t Φ̂ , où Φ̂ désigne l’estimateur des moindres carrés
ordinaires (MCO). Le résultat de l’affichage pour la série AJU t est donné dans le tableau suivant.

La statistique de Student t Φ̂ = - 7.858 est inférieure aux valeurs critiques -2.584, -1.943 et
-1.614 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10% d’où la série
ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ φ = 0 “). La série AJU t est
donc stationnaire. Il convient à présent d’estimer le modèle susceptible de la représenter, en
observant les corrélogrammes simple et partiel de la série stationnaire AJU t, nous
remarquons que la fonction d’autocorrélation simple (AC) possède des valeurs importantes
aux retards q=1,12,… , et que la fonction d’autocorrélation partielle (PAC) possède des
valeurs importantes aux retards p=1, 2 ,12,… par conséquent nous avons plusieurs modèles
candidats parmi lesquels nous avons sélectionné le modèle :

Sarima (1.1.0)(1.1.1)
Estimation des paramètres de model :

Nous remarquons que tous les paramètres du modèle sont significativement différents de zéro.
En effet les rapports des coefficients du modèle sont en valeurs absolues supérieures à 1.96, ce qui est
confirmé par la probabilité de nullité des coefficients qui sont tous inférieures à 0.05.
86
Application Box & Jenkins

Tests sur les résidus :


Test de validation des paramètres:

De la représentation graphique des inverses des racines des polynômes de retards


moyenne mobile et autorégressif nous constatons qu’ils sont tous supérieures à 1 en module
(leurs inverses sont en module, inférieures à 1).

Représentation graphique des séries : résiduelle ( ε t ) ; actuelle et estimée:

A partir de la représentation graphique des séries résiduelles, actuelles et estimée nous


constatons que le model estimé ajuste mieux la série DAJN.

Corrélogrammes simple et partiel des résidus :

87
Application Box & Jenkins

L’analyse du corrélogramme des résidus, montre que tous les termes sont à l’intérieur de
l’intervalle de confiance (illustré par des pointillés sur le graphique). Ce qui nous entraîne à
dire que les résidus forment un bruit blanc.
Test de point de retournement :
H 0 : « Les ε i forment un bruit blanc » contre
H 1 : « Les ε i ne forment pas un bruit blanc tel que : i = 1, n »
Après les calculs à l’aide du logiciel MATLAB nous avons obtenu les résultats suivants
Nombre de points de retournements p = 75
Espérance de la stat du test E (p) = 70
Variance de la statistique du test VAR(p) = 19
La statistique du teste est T= 1.2
T = 1.2 est inférieure à 1.96 (tabulée) d’où on accepte l’hypothèse H 0 : « Les ε i
forment un bruit blanc » au seuil de 0,05

Test de Box – Ljung :


Nous avons à tester l’hypothèse nulle :
H 0 : « Les autocorrélations jusqu’au pas k, (k=N/4) ne sont pas significatives » C'est-à-dire
H 0 : « ρ1 = ρ 2 = ... = ρ K = 0 » Contre H 1 : « ∃ρ j : j = 1,…,45 tel que ρ j ≠ 0 ».
K
γ k2
Ce test est basé sur la statistique de Box-Ljung au pas k : Q = n(n + 1)∑ .
k =1 n−k

88
Application Box & Jenkins

Si Q < χ 02,95 ( K − p − q ) , nous acceptons l’hypothèse H 0 .


La probabilité de la statistique de Box-Ljung est supérieure à 0,05 à n’importe quel retard
et la valeur de la statistique de Box-Ljung quand k = 30, p = 2 , q = 1 est égale à 16.422,
inférieure à χ 02.,95 (27) = 40.11. Nous concluons alors que les erreurs ne sont pas corrélées.

Test de Durbin-Watson : (Test de détection d’autocorrélation d’ordre1 des erreurs) :


Nous testons H 0 : « ρ = 0 » contre H 1 : « ρ ≠ 0 ».
La statistique de Durbin-Watson (DW=2.058 ≈ 2 ) nous constatons que les résidus
d’ordre 1 ne sont pas corrélés.
Test de Normalité :
Les tests sont effectués à partir des valeurs empiriques des coefficients de Skewness,
Kurtosis et la statistique de Jarque-Bera, nous avons l’histogramme suivant:

-t Test de Skewness (asymétrie) et de Kurtosis (aplatissement) :


⎧ H 0 : γ 1 = 0 et γ 2 = 0

Nous testons les hypothèses suivantes : ⎨
⎪ H :γ ≠ 0 ou γ ≠ 0
⎩ 1 1 2

β11 2 − 0 β2 − 3
Test de Skewness : γ 1 = Test de Kurtosis : γ 2 =
6 24
N N
μ3
où : β 11 2 = : est le coefficient de Skewness (l’indicateur d’asymétrie des résidus)
μ 23 2
μ4
β2 = : est le coefficient de Kurtosis (le degré d’aplatissement de la loi des résidus).
μ 22
Sous l’hypothèse H 0 et si le nombre d’observations est assez grand (N >30), nous avons :
μ3 ⎛℘
6 ⎞
β 11 2 = →
N ⎜⎜ 0, ⎟
⎟ (1)
μ 23 2
N →∞ ⎝ N ⎠
μ ℘ ⎛ 24 ⎞
β 2 = 42 → N ⎜⎜ 0, ⎟
⎟ (2)
μ 2 N →∞ ⎝ N ⎠
Après calculs nous avons obtenu :

89
Application Box & Jenkins

β1/1 2 + 0 0.019704 + 0
Test de skewness : γ1 = = = 0.0835<1.96. Donc :
6 6
N 108
On accepte l’hypothèse nulle H 0 (aplatissement Normal)
β2 − 3 2.448338 − 3
Test de Kurtosis : γ 2 = = = 1,170 ≺ 1.96. Donc :
24 24
N 108
On accepte l’hypothèse nulle H 0 (asymétrie)
Nous acceptons l’hypothèse de normalité en ce qui concerne la symétrie et l’aplatissement
de la distribution ( γ 1 et γ 2 sont inférieurs à 1,96), Ce qui est confirmé par la statistique de
Jarque et Bera.
Test de Jarque et Bera :
La statistique de Jarque et Bera noté (S) est égale à 1.376 ; elle est inférieure à la valeur
χ 02,95 (2) = 5,99 d’où les résidus sont gaussiens.

Test effet ARCH :

90
Application Box & Jenkins

L’analyse du corrélogramme des résidus carrés, montre que tous les termes sont à
l’intérieur de l’intervalle de confiance, ce qui nous entraîne à dire que pas d’effet ARCH.

Conclusion :
Nous pouvons conclure d’après ces tests que le modèle qui ajuste le mieux la série est :
Sarima (1.1.0)(1.1.1)qui s’écrit sous la forme suivante :
(1 − 0.395849 B)(1 − 0.329961B12 ) (1 − B)(1 − B12 ) JAEt = (1 + 0.891910 B12 )ξt .

Prévision :
Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006

91
Application Box & Jenkins

Diagramme séquentiel de la série brute JAE et des prévisions

prévision JAE
Janvier 2006 4124.58408
Février 2006 4132.7257
Mars 2006 4570.19352
Avril 2006 4394.5555
Mai 2006 4566.20834
Juin 2006 4829.54963
Juillet 2006 5752.69921
Août 2006 5815.18974
Septembre 2006 5780.73036
Octobre 2006 5440.57075
Novembre2006 5456.10994
décembre2006 5383.597

Remarque : Les quantités de carburants sont en milliers de tonnes

Analyse de la série vente de carburant


92
Application Box & Jenkins

Fuel-oil secteur Marine Nationale :

Plusieurs étapes préliminaires sont nécessaires avant d’effectuer des tests spécifiques sur
une série chronologique et de chercher à la modéliser, il convient d’étudier quelques
caractéristiques stochastiques en particulier sa moyenne et sa variance.

Notation : Nous notons la série vente de carburant Fuel-oil secteur National FN.

Identification
Les données de la série des ventes de carburant Fuel-oil (notée : FN) sur une période de
dix ans, les observations sont mensuelles ; de janvier 1995 à décembre 2005. L'unité de
mesure est le millier de tonnes.
Diagramme séquentiel de la série brute FN :

Cette série exhibe une faible tendance avec des fluctuations plus aux moins régulières
Graphe de la moyenne et la variance de la série brute FN :

moyenne variance

30000
120000000
25000
100000000

20000 80000000

15000 moyenne 60000000 variance

10000 40000000

5000
20000000

0
0
1 2 3 4 5 6 7 8 9 1 11 1 3 5 7 9 11

D’après les deux graphes précédents, on remarque que la moyenne et la variance varient
au cours du temps. On peut donc dire que cette série semble non stationnaire.

93
Application Box & Jenkins

Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des
corrélogrammes simple et partiel de la série brute.

Corrélogramme de la série brute FN :

D'après le corrélogramme simple de la série on remarque que les pics aux retards 1,…,9sont à
l'extérieur de la bande de confiance et les autocorrélations prennent une allure décroissante.
Le corrélogramme partiel est marqué par des pics significatif au retard 1et 2 .
Alors d’après l’analyse graphique on peut dire que la série FN semble non stationnaire

Test de FISHER:
Pour détecter la saisonnalité de la série on a fait appel à l’analyse de la variance
(ANOVA) à deux facteurs sans répétition.
Table de l’ANOVA (à 2 facteurs) données par logiciel SPSS :

Valeur
Source des Somme des Degré de Moyenne des
F Probabilité critique pour
variations carrés liberté carrés
F
Lignes 280910554 11 25537323.1 2.75775868 0.00340777 1.87673166
Colonnes 1958479112 10 195847911 21.1494868 2.1327E-21 1.9178259
Erreur 1018619056 110 9260173.23
Total 3258008722 131
Test d’influence de facteur ligne (mois) :
Fstat= 2.7577 > Fthéo= 1.8767 donc (on rejette l’hypothèse nulle) la série est affectée d’une
saisonnalité
Test d’influence de facteur colonne (années) :
Fstat= 21.1494 > Fthéo= 1.9178 donc (on rejette l’hypothèse nulle) la série est peut être
affectée d’une tendance.

94
Application Box & Jenkins

Afin de traiter l’effet de saisonnalité sur notre série ou encore la stationnariser, nous lui
avons appliqué la différence saisonnière d’ordre 12.

Notation : Nous notons la série FN désaisonnalisé par DFN.


Graphe de la série DFN :

Corrélogramme de la série DFN:

En observant le graphe de la série DFN sa moyenne est presque satable au cours du temps il semble
que la série soit stationnaire en moyenne, ainsi Nous remarquons que la fonction d’autocorrélation
simple de la série DFN diminue rapidement, nous pouvons donc dire que cette série semble stationnaire.
Pour confirmer ou infirmer cette hypothèse nous appliquons le test de Dickey-Fuller Augmenter qui
nécessite tout d’abord de sélectionner le nombre de retard p qui minimise le critère d’Akaike.

Test de Dickey- Fuller Augmenté:

95
Application Box & Jenkins

On procède à l’estimation par la méthode des moindres carrées avec d=1 des trois modèles
[4],[5] et [6] de Dickey-Fuller sur la série DFN.
Remarque
On choisit le retard d=1 qui minimise le critères d’informations d’Akaike et de Schwarz
Etape (1) :
Modèle 4 : Test sur la tendance :
d
ΔX t = φ X t −1 + c + β t + ∑ φ j ΔX t − j + ε t . Avec ε t est un processus stationnaire
j =1

Nous testons alors la présence d’une tendance dans le processus en testant la nullité du
coefficient de la tendance β . Le résultat est donné dans le tableau suivant:

On remarque que la t- statistique de la tendance =2.79814 est inférieure à 3.53 pour le


seuil 1% mais supérieur aux valeurs 2.79 et 2.73 au seuils 5% et 10% (données par la table
de Dickey- Fuller) .On le confirme ça par prob = 0.006 est inférieure 0.05. la tendance n’est
pas significativement différente de zéro ,de plus :
La statistique de Student t Φ̂ = -4.991788 est inférieure aux valeurs critiques -4.037, -
3.448 et -3.149 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10%
D’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ φ = 0 “) donc non
stationnarité de type TS on confirme ça par la prob = 0.0058 est inférieure à 0.05).
La série DFE est non stationnaire de type TS
Donc pour stationnariser cette série il faut faire un ajustement.
Le meilleur ajustement du processus est l’ajustement cubique car R 2 associé égale 0,362
est le plus grand D’après les résultats obtenus par le logiciel SPSS :
Dependent Mth Rsq d.f. F Sigf b0 b1 b2 b3
DFN LIN .156 118 21.80 .000 -2278.10 53.2261
DFN LOG .066 118 8.34 .005 -3968.20 1287.08
DFN INV .000 118 7.7E-03 .930 957.75 -349.24
DFN QUA .190 117 13.68 .000 -315.26 -43.305 .7978
DFN CUB .192 116 9.18 .000 307.93 -103.86 2.0437 -.0069
Tableau (1)

La série FN après désaisonnalisation peut être ajustée par une forme cubique

Estimation de la tendance cubique :

96
Application Box & Jenkins

Estimons l’équation d’ajustement y t qui est donnée par la formule suivante :


y t = b0 + b1 ⋅ t + b2 ⋅ t 2 + b3 ⋅ t 3 , les cœfficients b 0 , b 1 , b 2 et b 3 sont données par le
Tableau (1)
Notation : Nous notons la série ajustée par AD t elle est donnée par la formule :
AD t = DFN t − yt .

Diagramme séquentiel de la série DFN avec Ajustement

DFN
20000

10000

Observé

-10000 Cubique
0 20 40 60 80 100 120 140

Séquence

Nous devons rétablir le Test de Dickey-Fuller sur la série DFN ajustée c'est-à-dire AD t :
Etape (3) :
Modèle 6: Test de la racine unitaire :
d
ΔX t = φ X t −1 + ∑ φ j ΔX t − j + ε t . Avec ε t est un processus stationnaire.
j =1

Nous testons alors la présence d’une racine unitaire dans le processus en testant la nullité
du paramètre Φ à l’aide d’une statistique de Student t Φ̂ , où Φ̂ désigne l’estimateur des
moindres carrés ordinaires (MCO). Le résultat de l’affichage pour la série AD t est donné dans
le tableau suivant:

97
Application Box & Jenkins

La statistique de Student t Φ̂ = - 5.0515 est inférieure aux valeurs critiques -2.584, -1.943 et -1.614
(données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10% d’où la série ne possède pas
de racine unitaire (on rejette l’hypothèse nulle “ φ = 0 “). La série AD t est donc stationnaire.
Il convient à présent d’estimer le modèle susceptible de la représenter.
Corrélogramme de la série AD t :

En observant les corrélogrammes simple et partiel de la série stationnaire AD t, nous


remarquons que la fonction d’autocorrélation simple (AC) possède des valeurs importantes
aux retards q=1,12,3,7,… , et que la fonction d’autocorrélation partielle (PAC) possède des
valeurs importantes aux retards p=1, 2,7,12,… par conséquent nous avons plusieurs modèles
candidats parmi lesquels nous avons sélectionné le modèle :
SARIMA (2.1.0)(0.1.1).
Estimation des paramètres de model :

Nous remarquons que tous les paramètres du modèle sont significativement différents de zéro.
En effet les rapports des coefficients du modèle sont en valeurs absolues supérieures à 1.96, ce
qui est confirmé par la probabilité de nullité des coefficients qui sont tous inférieures à 0.05.

Tests sur les résidus :


98
Application Box & Jenkins

Test de validation des paramètres:


De la représentation graphique des inverses des racines des polynômes de retards
moyenne mobile et autorégressif nous constatons qu’ils sont tous supérieures à 1 en module
(leurs inverses sont en module, inférieures à 1).

Représentation graphique des séries : résiduelle ( ε t ) ; actuelle et estimée:

A partir de la représentation graphique des séries résiduelles, actuelles et estimée nous


constatons que le modèle estimé ajuste mieux la série AD.

Corrélogrammes simple et partiel des résidus :

99
Application Box & Jenkins

L’analyse du corrélogramme des résidus, montre que tous les termes sont à l’intérieur de
l’intervalle de confiance (illustré par des pointillés sur le graphique). Ce qui nous entraîne à
dire que les résidus forment un bruit blanc.

Test de point de retournement :


H 0 : « Les ε i forment un bruit blanc » contre
H 1 : « Les ε i ne forment pas un bruit blanc »
Après les calculs à l’aide du logiciel MATLAB nous avons obtenu les résultats suivants
Nombre de points de retournements p = 76
Espérance de la statistique du test E (p) = 73
Variance de la statistique du test VAR(p) = 20
La statistique du test est T= 0.6
T = 0.6 est inférieure à 1.96 (tabulée) d’où on accepte l’hypothèse H 0 : « Les ε i
forment un bruit blanc » au seuil de 0,05
Test de Box – Ljung :
Nous avons à tester l’hypothèse nulle :
H 0 : « Les autocorrélations jusqu’au pas k, (k=N/4) ne sont pas significatives » C'est-à-dire
H 0 : « ρ1 = ρ 2 = ... = ρ K = 0 » Contre H 1 : « ∃ρ j : j = 1,…,45 tel que ρ j ≠ 0 ».
K
γ k2
Ce test est basé sur la statistique de Box-Ljung au pas k : Q = n(n + 1)∑ .
k =1 n−k
Si Q < χ 02,95 ( K − p − q ) , nous acceptons l’hypothèse H 0 .

100
Application Box & Jenkins

La probabilité de la statistique de Box-Ljung est supérieure à 0,05 à n’importe quel retard


et la valeur de la statistique de Box-Ljung quand k = 30, p = 2 , q = 1 est égale à 20.473,
inférieure à χ 02.,95 (27) = 40.11 Nous concluons alors que les erreurs ne sont pas corrélées.

Test de Durbin-Watson : (Test de détection d’autocorrélation d’ordre1 des erreurs) :


Nous testons H 0 : « ρ = 0 » contre H 1 : « ρ ≠ 0 ».
La statistique de Durbin-Watson (DW=2.10 ≈ 2 ) nous constatons que les résidus
d’ordre 1 ne sont pas corrélés.

Test de Normalité :
Les tests sont effectués à partir des valeurs empiriques des coefficients de Skewness,
Kurtosis et la statistique de Jarque-Bera, nous avons l’histogramme suivant:

Test de Skewness (asymétrie) et de Kurtosis (aplatissement) :


⎧ H 0 : γ 1 = 0 et γ 2 = 0

Nous testons les hypothèses suivantes : ⎨
⎪ H :γ ≠ 0 ou γ ≠ 0
⎩ 1 1 2

β11 2 − 0 β2 − 3
Test de Skewness : γ 1 = Test de Kurtosis : γ 2 =
6 24
N N
μ3
où : β 11 2 = : est le coefficient de Skewness (l’indicateur d’asymétrie des résidus)
μ 23 2
μ
β 2 = 42 : est le coefficient de Kurtosis (le degré d’aplatissement de la loi des
μ2
résidus).
Sous l’hypothèse H 0 et si le nombre d’observations est assez grand (N >30), nous avons :
μ3 ℘ ⎛ 6 ⎞
β 11 2 = → N ⎜⎜ 0, ⎟
⎟ (1)
μ 23 2 N →∞ ⎝ N ⎠
μ4 ℘ ⎛ 24 ⎞
β2 = → N ⎜⎜ 0, ⎟
⎟ (2)
μ 22 N →∞ ⎝ N ⎠

101
Application Box & Jenkins

Après calculs nous avons obtenu :


b11/ 2 + 0 0.805861 + 0
Test de skewness : g1 = = = 3,497>1.96 donc :
6 6 113
N
On rejette l’hypothèse nulle H 0 (aplatissement Normal)
b2 − 3 5.793996 − 3
Test de Kurtosis : g 2 = = = 6,062>1.96 donc :
24 24 113
N
On rejette l’hypothèse nulle H 0 (asymétrie)
Alors : les résidus ne sont pas gaussiens. Ce qui est confirmé par le test de Jaque-Bera
Test de Jarque et Bera :
la statistique de Jaque Bera=48.98>5.911.Donc : on rejette l’hypothèse nulle
H 0 (normalité)
noté (S) est égale à 48.98 ; elle est supérieure à la valeur χ 02,95 (2) = 5,99 d’où les résidus ne

sont pas gaussiens.


.
Conclusion :
Nous pouvons conclure d’après ces tests que le modèle qui ajuste le mieux la série est :
SARIMA (2.1.0)(0.1.1)qui s’écrit sous la forme suivante :
(1 − 0.203857 B + 0.195202 B 7 )(1 − B)(1 − B12 ) FN t = 1 + 0.888587 B12 )ξ t

Prévision :
Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006

Diagramme séquentiel de la série brute FN et des prévisions

prévision FN
Janvier 2006 26422,3403
Février 2006 25159,6582
Mars 2006 28103,5815
Avril 2006 28918,9406
Mai 2006 29677,0913
Juin 2006 30241,7849
Juillet 2006 33999,8893
Août 2006 33501,7876
Septembre 2006 32960,7763
Octobre 2006 33918,9098
Novembre2006 29451,4462
décembre2006 32445,0728

Remarque : Les quantités de carburants sont en milliers de tonnes

102
Application Box & Jenkins

Analyse de la série vente de carburant


Fuel-oil secteur Marine Etrangère :
Plusieurs étapes préliminaires sont nécessaires avant d’effectuer des tests spécifiques sur
une série chronologique et de chercher à la modéliser, il convient d’étudier ces
caractéristiques stochastiques c'est-à-dire sa moyenne et sa variance.

Notation : Nous notons la série vente de carburant jet A1 secteur aviation étrangère FE.
Identification
Les données de la série des ventes de carburant fuol-oil etranger (notée : FE ) sur une
période de dix ans, les observations sont mensuelles ; de janvier 1995 à décembre
2005.L'unité de mesure est en milliers de tonnes.

Diagramme séquentiel de la série brute FE :

Graphe de la moyenne et la variance de la série brute FE :

moyenne variance

6000 12000000

5000 10000000

4000 8000000

3000 moyenne 6000000 variance

2000 4000000

1000 2000000

0 0
1 2 3 4 5 6 7 8 9 10 11 1 3 5 7 9 11

103
Application Box & Jenkins

D’après les deux graphes précédents, on remarque que la moyenne et la variance varient
au cours du temps. On peut donc dire que cette série semble non stationnaire..
Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des
corrélogrammes simple et partiel de la série brute

Corrélogramme de la série FE:

D'après le corrélogramme simple de la série on remarque que les pics aux retards
1,…,7,10,..,13 sont à l'extérieur de la bande de confiance et les autocorrélations prennent une
allure décroissante. Le corrélogramme partiel est marqué par des pics significatif au retard
1,2,5,9,11et 19.
En effet, la fonction d’autocorrélation simple estimée (colonne AC) ne décroît pas de
manière rapide vers zéro .

Test de FISHER: Pour détecter la saisonnalité de la série on a fait appel à l’analyse de


variance (ANOVA) à deux facteurs sans répétition

104
Application Box & Jenkins

Table de l’ANOVA (à 2 facteurs) données par logiciel SPSS:

Valeur
Source des Somme des Degré de Moyenne des Probabil critique pour
variations carrés liberté carrés F ité F
0,21320
Lignes 38868993.4 4 3533544.85 1.33826868 372 1,87673166
1,1668E
Colonnes 261316593 10 261316593 9.89691168 -11 1,9178259
Erreur 290442374 110 2640385.22
Total 590627961 131

Test d’influence de facteur ligne (mois) :


Fstat= 1.33826< Fthéo= 1.8767 donc (on accepte l’hypothèse nulle) la série n’est pas
affectée d’une saisonnalité
Test d’influence de facteur colonne (années) :
Fstat= 9.89691 > Fthéo= 1.9178 donc (on rejette l’hypothèse nulle) la série est peut être
affectée d’une tendance.

En observant le graphe ainsi que le corrélogramme de la série FE, nous remarquons que la
série semble non stationnaire .Un recours au test de racine unitaire permet d’affirmer ou
d’infirmer la stationnarité de la série en question.

Test de Dickey- Fuller Augmenté:

on procède à l’estimation par la méthode des moindres carrées avec d=1 des trois modèles
[4],[5] et [6] de Dickey-Fuller sur la série FE (car les résidus forment un bruit blanc

Remarque
On choisit le retard d=1 qui minimise le critères d’informations d’Akaike et Schwarz

105
Application Box & Jenkins

Etape (1) :
Modèle 4 : Test sur la tendance :

d
ΔX t = φ X t −1 + c + β t + ∑ φ j ΔX t − j + ε t .
j =1

Avec ε t est un processus stationnaire


Nous testons alors la présence d’une tendance dans le processus en testant la nullité du
coefficient de la tendance β , Le résultat de l’affichage pour la série FE est donné dans le
tableau suivant:

On remarque que la t- statistique de la tendance =2.931002 est supérieure à 2.79 et 2.73


au seuils 5% et 10% (données par la table de Dickey- Fuller) .On le confirme par
probabilité (prob = 0.004 est inférieure 0.05. La tendance est significativement différente de
zéro.Alors d’après le même tableau on remarque que :
La statistique de Student t Φ̂ = -8.931532 est inférieure aux valeurs critiques -4.0303, -
3.4445 et -3.31468 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10%
D’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ φ = 0 “)
donc non stationnarité de type TS .
la série FE est non stationnaire de type TS
Donc pour stationnariser cette série il faut faire un ajustement.
Le meilleur ajustement du processus est l’ajustement cubique car R 2 associé égale 0,362
est le plus grand d’après les résultats obtenus par le logiciel SPSS :

La série FE peut être ajustée par une forme linéaire.

Estimation de la tendance linéaire :


Estimons l’équation d’ajustement y t qui est donnée par la formule suivante :
y t = b0 + b1 ⋅ t .

106
Application Box & Jenkins

Notation : Nous notons la série ajustée par AJU t elle est donnée par la formule :
AJU t = FEt - yt .

D’où la série qu’on va étudier maintenant c’est la série AJU t

Graphe de la série AJU t :

Corrélogramme de la série AJU t :

107
Application Box & Jenkins

Un recours au test de racine unitaire permet d’affirmer ou d’infirmer la stationnarité de la


série en question.

Etape (1) :
Modèle 4 : Test sur la tendance :

d
ΔX t = φ X t −1 + c + β t + ∑ φ j ΔX t − j + ε t .
j =1

Avec ε t est un processus stationnaire


Nous testons alors la présence d’une tendance dans le processus en testant la nullité du
coefficient de la tendance β . Le résultat de l’affichage pour la série AJU t est donné dans le
tableau suivant:

On remarque que la t- statistique de la tendance = 0.284562 est inférieure aux valeurs


critiques 3.53 et 2.79 et 2.73 (données par la table de Dickey- Fuller) pour les seuils 1%,
5%,10% On le confirme par la prob = 0.7764 supérieure à 0.05. Donc la tendance n’est pas
significativement différente de zéro, on passe alors à l’étape (2)

Etape (2) :
Modèle 5 : Test sur la constante

d Avec ε t est un processus stationnaire


ΔX t = φ X t −1 + c + ∑ φ j ΔX t − j + ε t .
j =1

Nous testons la présence d’une constante dans le processus en testant la nullité du


coefficient de la constante. Le résultat de l’affichage pour la série AJU t est donné dans le
tableau suivant:

108
Application Box & Jenkins

On remarque que la t-statistique de la constante (c) = 0.125585 est inférieure aux valeurs
critiques 3.22 et 2.54 et 2.17 (données par la table de Dickey- Fuller) pour les seuils 1% ,
5% et 10% On le confirme par prob = 0.9003 supérieure à 0.05. Donc la constante n’est pas
significativement différente de zéro, on passe alors à l’étape (3)

Etape (3) :
Modèle 6: Test de la racine unitaire :

d
ΔX t = φ X t −1 + ∑ φ j ΔX t − j + ε t . Avec ε t est un processus stationnaire.
j =1

Nous testons alors la présence d’une racine unitaire dans le processus en testant la nullité du
paramètre Φ à l’aide d’une statistique de Student t Φ̂ , où Φ̂ désigne l’estimateur des moindres carrés
ordinaires (MCO). Le résultat de l’affichage pour la série AJU t est donné dans le tableau suivant.

La statistique de Student t Φ̂ = - 19.24054 est inférieure aux valeurs critiques -2.584, -


1.943 et -1.614 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10%
d’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ φ = 0 “). La
série AJU t est donc stationnaire. Il convient à présent d’estimer le modèle susceptible de la
représenter, en observant les corrélogrammes simple et partiel de la série stationnaire AJU t,
nous remarquons que la fonction d’autocorrélation simple (AC) possède des valeurs
importantes aux retards q=1,12,… , et que la fonction d’autocorrélation partielle (PAC)
possède des valeurs importantes aux retards p=1, 2 ,12,… par conséquent nous avons
plusieurs modèles candidats parmi lesquels nous avons sélectionné le modèle :
ARIMA (3.1.3)
Estimation des paramètres de modèle :

109
Application Box & Jenkins

Nous remarquons que tous les paramètres du modèle sont significativement différents de zéro.
En effet les rapports des coefficients du modèle sont en valeurs absolues supérieures à 1.96, ce qui
est confirmé par la probabilité de nullité des coefficients qui sont tous inférieures à 0.05.
Tests sur les résidus :

Test de validation des paramètres:

De la représentation graphique des inverses des racines des polynômes de retards


moyenne mobile et autorégressif nous constatons qu’ils sont tous supérieures à 1 en module
(leurs inverses sont en module, inférieures à 1).
Représentation graphique des séries : résiduelle ( ε t ) ; actuelle et estimée:

A partir de la représentation graphique des séries résiduelle, actuelles et estimée nous


constatons que le model estimé ajuste mieux la série FE.

110
Application Box & Jenkins

Corrélogrammes simple et partiel des résidus :

L’analyse du corrélogramme des résidus, montre que tous les termes sont à l’intérieur de
l’intervalle de confiance (illustré par des pointillés sur le graphique). Ce qui nous entraîne à
dire que les résidus forment un bruit blanc.

Test de point de retournement :


H 0 : « Les ε i forment un bruit blanc » contre
H 1 : « Les ε i ne forment pas un bruit blanc tel que : i = 1, n »
Après les calculs à l’aide du logiciel MATLAB nous avons obtenu les résultats suivants
Nombre de points de retournements p = 85
Espérance de la statistique du test E (p) = 74
Variance de la statistique du test VAR(p) = 30
La statistique du test est T= 1.2
T = 1.8 est inférieure à 1.96 (tabulée) d’où on accepte l’hypothèse H 0 : « Les ε i
forment un bruit blanc » au seuil de 0,05

Test de Box – Ljung :


Nous avons à tester l’hypothèse nulle :
H 0 : « Les autocorrélations jusqu’au pas k, (k=N/4) ne sont pas significatives » C'est-à-dire
H 0 : « ρ1 = ρ 2 = ... = ρ K = 0 » Contre H 1 : « ∃ρ j : j = 1,…,45 tel que ρ j ≠ 0 ».
K
γ k2
Ce test est basé sur la statistique de Box-Ljung au pas k : Q = n(n + 1)∑ .
k =1 n−k
Si Q < χ 02,95 ( K − p − q ) , nous acceptons l’hypothèse H 0 .

111
Application Box & Jenkins

La probabilité de la statistique de Box-Ljung est supérieure à 0,05 à n’importe quel retard


et la valeur de la statistique de Box-Ljung quand k = 33, p = 3 , q = 3 est égale à 18.846
inférieure à χ 02.,95 (27) = 40.11 Nous concluons alors que les erreurs ne sont pas orrélées.

Test de Durbin-Watson : (Test de détection d’autocorrélation d’ordre1 des erreurs) :


Nous testons H 0 : « ρ = 0 » contre H 1 : « ρ ≠ 0 ».
La statistique de Durbin-Watson (DW=2.003 ≈ 2 ) nous constatons que les résidus
d’ordre 1 ne sont pas corrélés.

Test de Normalité :
Les tests sont effectués à partir des valeurs empiriques des coefficients de Skewness,
Kurtosis et la statistique de Jarque-Bera, nous avons l’histogramme suivant:

-t Test de Skewness (asymétrie) et de Kurtosis (aplatissement) :


⎧ H 0 : γ 1 = 0 et γ 2 = 0
Nous testons les hypothèses suivantes : ⎪⎨
⎪ H :γ ≠ 0 ou γ ≠ 0
⎩ 1 1 2

Test de Skewness : γ 1 = β1 − 0 Test de Kurtosis : γ 2 = β 2 − 3


12

6 24
N N
μ3
où : β 11 2 = : est le coefficient de Skewness (l’indicateur d’asymétrie des résidus)
μ 23 2
μ
β 2 = 42 : est le coefficient de Kurtosis (le degré d’aplatissement de la loi des résidus).
μ2
Sous l’hypothèse H 0 et si le nombre d’observations est assez grand (N >30), nous avons :
μ3 ℘ ⎛ 6 ⎞
β 11 2 = → N ⎜⎜ 0, ⎟ (1)
μ 23 2 N →∞ ⎝ N ⎟⎠
μ4 ℘ ⎛ 24 ⎞
β2 = → N ⎜⎜ 0, ⎟ (2)
μ 22 N →∞ ⎝ N ⎟⎠

112
Application Box & Jenkins

Après calculs nous avons obtenu :


β1/1 2 + 0 0.252499 + 0
Test de skewness : γ1 = = = 1.1385<1.96. Donc :
6 6
N 1221.1385
On accepte l’hypothèse nulle H 0 (aplatissement Normal)
β2 − 3 3.5277 − 3
Test de Kurtosis : γ 2 = = = 0.7388 ≺ 1.96. Donc :
24 24
N 122
On accepte l’hypothèse nulle H 0 (asymétrie)
Nous acceptons l’hypothèse de normalité en ce qui concerne la symétrie et l’aplatissement de la
distribution ( γ 1 et γ 2 sont inférieurs à 1,96), Ce qui est confirmé par la statistique de Jarque et Bera.
Test de Jarque et Bera :
La statistique de Jarque et Bera noté (S) est égale à 2.401 ; elle est inférieure à la valeur
χ 02,95 (2) = 5,99 d’où les résidus sont gaussiens.

Conclusion :
Nous pouvons conclure d’après ces tests que le modèle qui ajuste le mieux la série est :
ARIMA (3.1.3) qui s’écrit sous la forme suivante :
(1 − 0.236236B 2 − 0.326708B 10 − 0.177887 B 3 )(1 − B )FE t =
(1 − 0.23255B + 0.430185B 10 + 0.36597 B 15 )ε t

Prévision :
Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006
Diagramme séquentiel de la série brute JAE et des prévisions

prévision JAE
Janvier 2006 4124.58408
Février 2006 4132.7257
Mars 2006 4570.19352
Avril 2006 4394.5555
Mai 2006 4566.20834
Juin 2006 4829.54963
Juillet 2006 5752.69921
Août 2006 5815.18974
Septembre 2006 5780.73036
Octobre 2006 5440.57075
Novembre2006 5456.10994
décembre2006 5383.597

Remarque : Les quantités de carburants sont en milliers de tonnes

113
Application
ARFIMA
Application ARFIMA

Les corrélogrammes des quatre séries


JAI JAE

FE FN

Test de mémoire longue :


On cherche à tester l’hypothèse :

⎤ −1 1 ⎡ Existence d’une mémoire longue"


H 0 :"d ∈ ⎥ ,
⎦ 2 2 ⎢⎣
⎤−1 1⎡
H1 :" d ∉ ⎥ , Absence de mémoire longue"
⎦ 2 2 ⎢⎣
Mais auparavant, il est impératif d’estimer le paramètre d’intégration fractionnaire d.

114
Application ARFIMA

Estimation de d :
Pour la détermination de l’ordre d’intégration fractionnaire d, on a utilisé la méthode
d’estimation en deux étapes (analyse R/S) basée sur l’exposant de HURST. Pour cela, on a
élaboré un programme informatique.
Résultats du test :
Pour la série JAN : d= 0.0398.
Pour la série JAE: d= 0.0541.
Pour la série FE : d= 0.2396.
Pour la série FN : d=0.0452.

Les résultats du test confirment l’existence d’une mémoire longue pour la série FE et
son absence pour les autres séries.

Etude de la série FE :
Estimation et modélisation de la série FE :
Modèle AIC -2LOG(likelihood)
ARFIMA (2, 0.2396,2) 0.235790 E +04 0.234790 E +04
ARFIMA (2, 0.2396, 4) 0.236115 E +04 0.234715 E +04

ARMA Model:
(1-B)^.2396 X(t)
= .0000 X(t-1) + .1000 X(t-2)
+ Z(t) + .0000 Z(t-1) + .0000 Z(t-2)

Corrélogrammes des résidus:

115
Application ARFIMA

Tests sur les résidus :

Test des points de retournement


On a à tester l’hypothèse nulle :
H0 : « les εi ne sont pas corrélés entre eux »

Contre H1 : « Il existe une corrélation entre les εi i =1,n ».


Turning points = 84.000~AN (86.667, sd = 4.8109), p-value = .57937>0.05.
On accepte alors H0.

Test de Box-Lung
Le Corrélogramme des résidus du modèle montre que les résidus semblent former un
bruit blanc puisque tous les termes ne sont pas significativement différents de zéro. Nous
remarquons aussi que la statistique de Box-Ljung est inférieure à la valeur théorique au seuil
5%

Test de normalité :

116
Application ARFIMA

- Test de skewness : g1 = b1 + 0 = 0.805861 + 0 = 1.29<1.96 donc :


1/ 2

6 6 113
n
On accepte l’hypothèse nulle H 0 (aplatissement Normal)

b2 − 3 5.793996 − 3
- Test de kurtoisis : g 2 = = = 5.26>1.96 donc :
24 24 111
n
On rejette l’hypothèse nulle H 0 (asymétrie)
Alors : les résidus ne sont pas gaussiens. Ce qui est confirmé par le test de Jarque-Bera
- La statistique de Jraque Bera=29.64>5.911.Donc : on rejette l’hypothèse nulle H 0 (normalité)
Conclusion : D’après les tests précédent on conclut que les résidus forme un bruit blanc non
gaussien.

Test d’homoscédasticité (ARCH) :


D’après le corrélogramme des résidus au carré il n’existe pas de pic significativement
différent de zéro et donc pas d’effet ARCH

Prévision :
Année et mois Prévision
janv-05 873,6863
févr-05 751,9604
mars-05 666,4125
avr-05 562,8928
mai-05 459,5315
juin-05 350,8888
juil-05 238,5849
août-05 122,21
sept-05 1,5543
oct-05 288,098
nov-05 107,0413
déc-05 -387,0356
Remarques :
9 Les quantités de carburants sont en milliers de tonnes.
9 La dernière prévision c'est à dire celle de mois de décembre 2005 est négative ce qui
nous pousse a dire plus que l'horizon de prévision s'élargit plus la modélisation
ARFIMA(dans notre cas) ne donne pas des bonne prévisions.

117
Application
VAR
Application VAR

La modélisation VAR sous le logiciel Eviews:


On dispose de 04 séries stationnaires (jae, jan, fe, fn) on travaille sur la période allant de
janvier 1996 à décembre 2005.

Les processus ( Yit i = 1,4) étant stationnaires, il est possible de modéliser la série

chronologique multivariée Y t par un processus VAR. Nous avons, K = 4 et T = 120

(T nombre d’observations de la série Yit i = 1,4)

Notation:
Jae: Carburant JET A1 secteur aviation région étrangère
Jan: Carburant JET A1 secteur aviation région nationale
Fe : Carburant fuel-oil secteur marine région étrangère
Fn: Carburant fuel-oil secteur marine région nationale
Les séries stationnaires sont représentées par les graphes suivants:

119
Application VAR

Estimation du VAR:
La première étape consiste à déterminer l’ordre p du processus VAR à retenir, à cette fin
nous avons estimé pour commencer divers processus VAR pour des ordres de retards p allant
de 1 à 12, nous devons donc retenir celui dont les critères de Akaike (AIC) et de Schwarz
(SC) sont les plus petits.

Nous estimons divers modèles VAR pour p=1 à 12 après plusieurs essais nous avons
retenu un retard p=12. Les critères d'information d'AKAIKE (AIC) de SCHWARZ (SC) et de
Hannan-Quinn sont donnés par:

avec

=déterminant de la matrice variance- covariance tel que:

AIC= 70.189
SC=74.957

RESIDFE RESIDFN RESIDJAE RESIDJAN


RESIDFE 909829.8 -132962.5 9300.141 -59992.79
RESIDFN -132962.5 6941278. -124212.4 161394.3
RESIDJAE 9300.141 -124212.4 76397.21 58720.83
RESIDJAN -59992.79 161394.3 58720.83 3976582.

Log –vraisemblance, les critères d'information d'Akaike (AIC) et Schwarz (SC)

120
Application VAR

Mais lorsque nous avons estimé les paramètres du modèle VAR(12) avec constante nous
avons remarqué que la t-statistique de la constante est inférieure à 1,96 ; donc la constante
n'est pas significative.
12
Yt = A0 + ∑ ApYt − p + ε t
p =1

⎡ y1t ⎤ ⎡a1 ⎤
0 ⎡a11p a12p a13p a14p ⎤ ⎡ y1t − p ⎤ ⎡ε1t ⎤
⎢ y ⎥ ⎢a 0 ⎥ 12 ⎢ 1 2 3 4
⎥ ⎢ ⎥ ⎢ ⎥
⎢ 2⎥ ⎢ a2 p a2 p a2 p a2 p ⎥ ⎢ y2t − p ⎥ ⎢ε 2t ⎥
Yt = ⎢ ⎥ = ⎢ 0 ⎥ + ∑
2t

⎢ y3t ⎥ a3 ⎢ 1 2 3 4 ⎥ ⎢ y ⎥ + ⎢ε ⎥
⎢ ⎥ ⎢ 0⎥
p =1 ⎢a3 p a3 p a3 p a3 p ⎥ ⎢ 3t − p ⎥ ⎢ 3t ⎥
⎣ y4t ⎦ ⎢⎣a4 ⎥⎦ ⎢ 1 2 3 4 ⎥ ⎢⎣ y4t − p ⎥⎦ ⎣ε 4t ⎦
⎣⎢a4 p a4 p a4 p a4 p ⎦⎥

⎡a10 ⎤
⎢ 0⎥
⎢a ⎥
Où A 0 = ⎢ 20 ⎥ représente l’estimation de la constante et les A p (p =1,...,12) sont des
⎢a3 ⎥
⎢⎣a40 ⎥⎦
matrices carrés d’ordre 4 tel que A p les aijp (i,j =1,4) représentent les coefficients
estimés; ε 1t et ε 2 t et ε 3t et ε 4t sont des bruits blancs.

Tableau :

121
Application VAR

122
Application VAR

Présentation des résultats:


1érepartie du tableau: résultat de l'estimation
Chaque colonne correspond à une équation du modèle VAR, Eviews reporte sur chaque
coefficient estimé son écart-type estimé entre parenthèses et la t-statistique entre crochets
2émepartie du tableau: statistiques associés à une régression MCO standard calculée
équation par équation (i.e. calculées à partir des résidus estimés de chaque équation)
3émepartie du tableau: statistique associée à une régression MCO standard calculée pour
le modèle VAR dans son ensemble

123
Application VAR

La première colonne donne les résultats d'estimation de la première équation (variable fe)
La deuxième colonne donne les résultats d'estimation de la deuxième équation (variable fn)
La troisième colonne donne les résultats d'estimation de la troisième équation (variable
jae)
La quatrième colonne donne les résultats d'estimation de la quatrième équation (variable
jan) donc le VAR estimé s'écrit sous la forme:
FE = 0.5138865666*FE(-1) + 0.08851646244*FE(-3) - 0.1858916363*FE(-4) + 0.2129399812*FE(-5) -
0.06753771936*FE(-6) + 0.1100312394*FE(-7) - 0.1354494342*FE(-10) + 0.1950868599*FE(-
11) - 0.05601552414*FE(-12) - 0.05207190108*FN(-1) + 0.1542121815*FN(-3) -
0.1297690979*FN(-4) + 0.01309840894*FN(-5) - 0.01016582916*FN(-6) + 0.02924002657*FN(-
7) + 0.00940125585*FN(-10) - 0.05809671716*FN(-11) + 0.06204082923*FN(-12) -
0.2885535862*JAE(-1) + 0.7425845812*JAE(-3) - 0.9350288096*JAE(-4) + 0.72221153*JAE(-5)
- 0.04131481402*JAE(-6) + 0.4142686105*JAE(-7) + 0.01165554772*JAE(-10) +
0.05390104945*JAE(-11) + 0.205440153*JAE(-12) - 0.02943791762*JAN(-1) -
0.09559081329*JAN(-3) + 0.1748064848*JAN(-4) - 0.03260088414*JAN(-5) -
0.1222785296*JAN(-6) + 0.124394713*JAN(-7) - 0.158152241*JAN(-10) +
0.07565053515*JAN(-11) + 0.01620620952*JAN(-12)

FN = 0.2668463094*FE(-1) + 0.1274586202*FE(-3) - 0.4819189698*FE(-4) - 0.6684105782*FE(-5) +


0.2832104158*FE(-6) + 0.04235964971*FE(-7) + 0.02009687886*FE(-10) + 0.1084720276*FE(-
11) - 0.3711201441*FE(-12) - 0.05097990158*FN(-1) + 0.2135230552*FN(-3) +
0.07249170752*FN(-4) - 0.06210024519*FN(-5) - 0.1163635678*FN(-6) - 0.2195410591*FN(-7)
- 0.02543579987*FN(-10) - 0.1135588004*FN(-11) - 0.4537274846*FN(-12) +
1.334156666*JAE(-1) + 0.091656488*JAE(-3) - 1.639224531*JAE(-4) + 1.976905728*JAE(-5) +
0.01487653128*JAE(-6) - 0.01103787487*JAE(-7) - 1.66310656*JAE(-10) - 2.291743749*JAE(-
11) + 0.6929252057*JAE(-12) - 0.001800288424*JAN(-1) + 0.0577185335*JAN(-3) -
0.1837043566*JAN(-4) - 0.2096021983*JAN(-5) + 0.01093173704*JAN(-6) -
0.1094409864*JAN(-7) + 0.3506146091*JAN(-10) - 0.1775124355*JAN(-11) -
0.2198517455*JAN(-12)

JAE = - 0.01882273148*FE(-1) + 0.01567360967*FE(-3) + 0.01650562139*FE(-4) +


0.06332678143*FE(-5) - 0.02649027611*FE(-6) - 0.00585109903*FE(-7) + 0.01045516186*FE(-
10) - 0.01257219655*FE(-11) - 0.01896288183*FE(-12) + 0.01931064853*FN(-1) +
0.006718999501*FN(-3) - 0.005604280877*FN(-4) - 0.002959298683*FN(-5) -
0.001118438836*FN(-6) - 0.00592425837*FN(-7) - 0.004680914032*FN(-10) +
0.001101445776*FN(-11) + 0.0209835476*FN(-12) + 0.3164288494*JAE(-1) +
0.02522073334*JAE(-3) - 0.08550745803*JAE(-4) - 0.02773427551*JAE(-5) +
0.07195401881*JAE(-6) - 0.009741058023*JAE(-7) - 0.2067551668*JAE(-10) +
0.1278039929*JAE(-11) - 0.2127460731*JAE(-12) - 0.03440147237*JAN(-1) +
0.01834208186*JAN(-3) - 0.01254105344*JAN(-4) - 0.002707723161*JAN(-5) +
0.003854667483*JAN(-6) + 0.04109508282*JAN(-7) - 0.01365410628*JAN(-10) -
0.02116113552*JAN(-11) + 0.03479601759*JAN(-12)

JAN = - 0.1399375945*FE(-1) - 0.005335446463*FE(-3) - 0.06008855141*FE(-4) +


0.1013908291*FE(-5) - 0.2529872799*FE(-6) - 0.07732883534*FE(-7) - 0.01190880795*FE(-10)
- 0.2903432703*FE(-11) + 0.1495829226*FE(-12) - 0.002996991519*FN(-1) -
0.05049803301*FN(-3) + 0.01076013018*FN(-4) - 0.05969214808*FN(-5) -
0.05408929182*FN(-6) + 0.05509316593*FN(-7) + 0.08264553226*FN(-10) -
0.009874632583*FN(-11) - 0.01736103924*FN(-12) - 0.201687376*JAE(-1) +
0.451964449*JAE(-3) - 0.08484463669*JAE(-4) - 0.9604511724*JAE(-5) + 0.419853133*JAE(-
6) - 0.5754540741*JAE(-7) - 0.8438202862*JAE(-10) - 0.6380606547*JAE(-11) -
0.3079768732*JAE(-12) + 0.4617223899*JAN(-1) + 0.2091587066*JAN(-3) -
0.09069666901*JAN(-4) + 0.08404651002*JAN(-5) + 0.07709415443*JAN(-6) +
0.1183870882*JAN(-7) + 0.01818272123*JAN(-10) + 0.03834980612*JAN(-11) -
0.2804770253*JAN(-12)

124
Application VAR

Vérification de la stationnarité du VAR:


Test sur les racines :

Les inverses des racines des polynômes autorégressifs (donnés par l’Eviews) des quatre
séries sont inférieure en module à 1

L’inverse des racines associées à la partie AR appartient au disque unité. Le VAR est
stationnaire.
Tests sur les paramètres :
La significativité des coefficients du modèle VAR(12) est confirmée par le test de Student En
tenant compte du tableau des estimations (Tableau) et le fait qu’un coefficient est significativement
différent de zéro au seuil 5%, si la t-statistique associée est supérieure à 1.96

125
Application VAR

Résidus simples de la série (FE):

Résidus simples de la série (FN):

126
Application VAR

Résidus simples de la série (JAE):

Résidus simples de la série (JAN):

127
Application VAR

Résidus croisés des séries (FN ; FE):

Résidus croisés des séries (JAE ; JAN):

128
Application VAR

Résidus croisés des séries (FE ; JAE):

Résidus croisés des séries (FE ; JAN):

129
Application VAR

Résidus croisés des séries (FN ;JAE):

Résidus croisés des séries (FN ; JAN):

130
Application VAR

Les graphes des résidus simples des quatre séries :

Pour les séries Jan; Jae; Fe; FN on retient les coefficients qui sont significatifs, c'est-à-dire
ceux dont les statistiques de Student (t-stat) sont supérieures en valeur absolue aux valeurs
théoriques (1.96) au seuil de 5%. D’où:
Le modèle VAR(12) s’écrit donc de la façon suivante :
FE = 0.5138865666*FE(-1) + 0.2129399812*FE(-5) + 0.1950868599*FE(-11) + 0.1542121815*FN(-3)
- 0.1297690979*FN(-4) - 0.9350288096*JAE(-4) + 0.1748064848*JAN(-4) + 0.124394713*JAN(-
7) - 0.158152241*JAN(-10)

FN = - 0.6684105782*FE(-5) + 0.2135230552*FN(-3) - 0.2195410591*FN(-7) - 0.4537274846*FN(-12)


- 2.291743749*JAE(-11) + 0.3506146091*JAN(-10)

JAE = 0.06332678143*FE(-5) - 0.02649027611*FE(-6) - 0.00585109903*FE(-7) +


0.0209835476*FN(-12) + 0.3164288494*JAE(-1) - 0.03440147237*JAN(-1) +
0.04109508282*JAN(-7) + 0.03479601759*JAN(-12)

JAN = 0.4617223899*JAN(-1) - 0.2804770253*JAN(-12)

Remarque:
Nous constatons que la série JAN s’écrit uniquement en fonction de ses valeurs passées,
ceci nous pousse à penser que l’approche multivariée pour cette série n’apportera rien en
terme de prévisions par rapport à l’approche univarié

131
Application VAR

Tests sur les résidus


De la même façon que la méthodologie de Box & Jenkins, il convient de vérifier si les
résidus forment un bruit blanc, une observation des corrélogrammes des résidus des deux
séries s’impose.
Globalement, l’analyse des corrélogrammes simples et croisées nous montre que tous les
termes sont à l’intérieur de l’intervalle de confiance de là on déduit une absence de
corrélation, de plus toutes les probabilités associées sont supérieures à 0.05, ce qui est
confirmé par Q-stat pour tous les retards en particulier Q-stat = 15.474 ; 15.546 ; 22.488 ;
23.903 resp des séries (FE, FN,JAE, JAN); (pour h = 30) < χ 0.05
2
(30) = 43.77 . Donc les résidus
se comportent comme un bruit blanc.
Donc les résidus des séries une à une forment un processus bruit blanc.
Test de Normalité :
Résidus de la série (FE):

b11 / 2 + 0 0.252499 + 0
-test de skewness : g1 = = = 1,071<1.96 donc :
6 6 108
n
On accepte l’hypothèse nulle H 0 (aplatissement Normal)
b2 − 3 3.52793 − 3
-test de kurtosis : g 2 = = = 1,119<1.96 donc :
24 24 108
n
On accepte l’hypothèse nulle H 0 (asymétrie)
Alors : les résidus sont gaussiens. Ce qui est confirmé par le test de Jarque-Berra

132
Application VAR

- La statistique de Jarque-Berra=2,40>5.911.Donc : on accepte l’hypothèse nulle


H 0 (normalité)
RESIDFE RESIDFN
Skewness 0.252499300708926 -0.178678479865026
Kurtosis 3.52779348449417 2.65701587043281
Jarque-Bera 2.40115297368819 1.10403949411112
Probability 0.301020627450904 0.575785693706116
Sum -9634.80974233782 -8939.07126213692
Sum Sq. Dev. 98261617.464214 749657986.861302
Observations 108 108

RESIDJAE RESIDJAN
Skewness -0.0712588488320082 0.281728280741602
Kurtosis 2.78755176016054 4.06493347414021
Jarque-Bera 0.294504969412509 6.5320497046027
Probability 0.863076036404564 0.0381578089195492
Sum -69.9319286509287 -12552.0427659422
Sum Sq. Dev. 8250899.10417633 429470841.548753
Observations 108 108

RESIDFE RESIDFN RESIDJAE RESIDJAN


Skewness 1,071 0,757 0,302 1,195
Kurtosis 1,119 1,393 0,848 8,623
Jarque-Bera 2.401 1.1040 0.294 6.5320
Observations 108 108 108 108

Conclusion : D’après les tests précédents on conclut que les résidus forment un bruit
blanc Gaussien sauf pour les résidus de la série JAN

Prévision:
Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006

FE FN JAE JAN
Janvier 2006 219.9691 22861.44 3889.915 25445.95
Février 2006 760.1325 26087.89 4342.417 23763.63
Mars 2006 247.8898 35924.73 4318.431 23890.61
Avril 2006 1120.071 32969.42 4247.052 24472.81
Mai 2006 434.6242 30365.83 4465.693 24754.62
Juin 2006 1030.656 27410.18 4769.805 23744.89
Juillet 2006 732.0931 35723.78 5989.449 25355.39
Août 2006 508.3732 31954.93 6159.516 26790.62
Septembre 2006 1186.878 32574.07 5882.792 23908.79
Octobre 2006 1143.687 31269.60 5166.946 24080.56
Novembre2006 86.02180 24402.61 5220.334 28424.65
Décembre2006 745.5457 30627.60 5071.127 27387.77

133
Application VAR

Diagrammes séquentiels des quatre séries brutes (FE ,FN,JAE,JAN) et des


prévisions :

Remarque : Les quantités de carburants sont en milliers de tonnes.

Test de causalité au sens de Granger :


Il s’agit ici simplement de tester la nullité jointe de certains cœfficients, en utilisant par
exemple les tests traditionnels de type FISHER. Nous avons donc à tester deux types
d’hypothèses :

H 0 : « la série A ne cause pas la série B » et H 0' : « la série B ne cause pas la série A»


tq: A et B sont des séries différentes ( FE, FN, JAE , JAN ) ou : A ≠ B

134
Application VAR

Les résultats de ces tests sont reportés dans le tableau ci – dessous

Lags: 12
Null Hypothesis: Obs F-Statistic Probability
FN does not Granger Cause FE 108 2.377 0.010
FE does not Granger Cause FN 1.210 0.290
JAE does not Granger Cause FE 108 0.878 0.571
FE does not Granger Cause JAE 0.842 0.607
JAN does not Granger Cause FE 108 1.583 0.112
FE does not Granger Cause JAN 0.742 0.706
JAE does not Granger Cause FN 108 1.391 0.186
FN does not Granger Cause JAE 0.499 0.909
JAN does not Granger Cause FN 108 1.436 0.165
FN does not Granger Cause JAN 0.801 0.647
JAN does not Granger Cause JAE 108 1.640 0.096
JAE does not Granger Cause JAN 0.542 0.880

D’après le tableau ci-dessus, nous acceptons l’hypothèse H 0 dans la première équation car
la valeur de la statistique de Fisher calculée est inférieure à la statistique de Fisher tabulée,
2,120
FStat < F 0.05 = 3.07, de plus la probabilité associée est supérieure au seuil statistique
usuel de 5 % , il n’y a donc pas de causalité au sens de Granger de A vers B , nous acceptons
l’hypothèse H 0'
Remarque:
(Sauf pour les séries FE et FN )
La probabilité associée est de 0.01 : elle est inférieure au seuil statistique usuel de 5 % donc
FE explique significativement FN . Il y a donc causalité au sens de Granger de FE vers FN

135
Conclusion
Conclusion

Choix de la méthode de prévision

A cette étape bien précise nous sommes en possession de deux groupes de résultats
associés à deux approches différentes (univariée et multvariée) pour un objectif commun à
savoir effectuer des prévisions. Pour choisir les meilleurs résultats une comparaison sera
entreprise.
Comparaison :
La comparaison des résultats prévisionnels obtenus par les différentes méthodes à savoir
la méthodologie de Holt et Winters et celle de Box et Jenkins et la modélisation VAR est
basée sur la racine carrées de la somme des carrées résidus (RMSE) entre les observations
prévues et les réalisations des séries de ventes.
Les prévisions d'une méthode sont jugées plus fiables si son RMSE est la plus faible par
rapport à celle de l'autre méthode.
Le calcul du RMSE (la racine carrée des moyennes des résidus) mesurant les écarts
prévisionnels moyens pour chaque méthode) est donné par la formule suivante :

1 N 2
RMSE = ∑ ε t où N est le nombre d’observations
N 1
Ainsi, la comparaison entre les différentes méthodes utilisées s’effectuera à partir du
tableau suivant:

RMSE 1 RMSE2 RMSE3 RMSE4

FE 1891,04 1679.16 4350,09 958,012

FN 2904,53 2915,33 - 2635,93

JAE 358,13 307,77 - 276,4

JAN 2049,66 2463,67 - -

Telle que :
RMSE 1 : la racine carrée des moyennes des résidus associée à la méthode Holt et Winters .
RMSE 2 : la racine carrée des moyennes des résidus associée à la méthodologie de Box et
Jenkins.
RMSE 3 : la racine carrée des moyennes des résidus associée à la modélisation ARFIMA.
RMSE 4 : la racine carrée des moyennes des résidus associée à la modélisation VAR.

137
Conclusion

Nous constatons que :


• pour la série vente de carburant fuel-oil secteur Marine Nationale FE le
RMSE 4 < RMSE 2< RMSE 1< RMSE 3.
Nous concluons que les prévisions obtenues par la méthodologie de Box & Jenkins pour
sont plus fiables que celles obtenues par la méthode de Holt et Winters et modélisation
ARFIMA et les prévisions obtenues par la modélisation VAR sont plus fiables que celle
obtenus par la méthodologie de Box & Jenkins
• pour la série vente de carburant fuel-oil secteur Marine Nationale FN.
RMSE 4 < RMSE 1< RMSE 2
Nous concluons que les prévisions obtenues par la méthode de Holt et Winters pour sont
plus fiables que celles obtenues par la méthodologie de Box & Jenkins et les prévisions
obtenues par la modélisation VAR sont plus fiables que celle obtenus par la La méthode
de Holt et Winters

• pour la série vente de carburant Jet A1 secteur aviation étrangère JAE.


RMSE 4 < RMSE 2< RMSE 1
Nous concluons que les prévisions obtenues par la méthodologie de Box & Jenkins pour
sont plus fiables que celles obtenues par la méthode de Holt et Winters et les prévisions
obtenues par la modélisation VAR sont plus fiables que celle obtenus par la méthodologie
de Box & Jenkins.

• pour la série vente de carburant Jet A1 secteur aviation nationale JAN.


RMSE 1< RMSE 2
Nous concluons que les prévisions obtenues par la méthode de Holt et Winters sont plus
fiables que celles obtenues par la méthodologie de Box & Jenkins

Nous concluons enfin que les prévisions obtenues par la modélisation VAR sont plus fiables
que celles obtenues par les autres méthodes

138
Conclusion Générale
Conclusion générale

Conclusion Générale

Au cours de la préparation de notre mémoire de fin d’études, nous avons été amenés à
faire des prévisions à l’aide de diverses méthodes sur différentes séries. et essayer d’attendre
l’objectif fixé par notre étude, à savoir trouver le type de modèle qui convienne au problème
posé .Pour cela nous avons proposé dans un premier temps d'étudier individuellement les
séries en utilisant l’approche univariée qui comporte deux parties :

La première comporte deux méthodes Holt et Winters et Box et Jenkins


Le premier point de notre conclusion est destiné aux résultats obtenus dans l’étude des
quatre séries de ventes de carburants (FE. FN, JAN, JAE)

En effet, l’application des deux méthodes sur ces séries, nous a permis de conclure que :
La méthode Holt & Winters est la plus appropriée pour faire de meilleures prévisions
pour les séries FN et JAN au sens du RMSE
La méthode Box et Jenkins est la plus appropriée pour faire de meilleures prévisions
pour les séries FE et JAE au sens du RMSE

Pour la modélisation ARFIMA, nous pensons qu’elle est d’une grande importance et
d’une utilité à ne pas négliger car elle traite l’existence de phénomène à mémoire longue ;
elle permet en ce sens de préciser le type de mémoire (longue, ou courte) que nous avons à
traiter, pour cela il est indispensable de disposer d’un logiciel approprié et performant qui gère
la composante tendancielle et surtout saisonnière quel que soit son ordre. (Les résultats de
cette modélisation sont obtenus par le logiciel ITSM)

Cependant la méthodologie de Box et Jenkins ne prend pas en compte l’interdépendance


des séries, pour cette raison nous avons proposé par la suite une approche multivariée pour
parer aux insuffisances de l’approche univarié.

Etant donné qu’à l’issue de la méthodologie de Box & Jennkins les séries sont rendues
stationnaires, l’application de la modélisation V AR(p) à la base de ces séries est possible, en
Utilisant les critères d’informations d’Akaike et le maximum de vraisemblance nous obtenons
un ordre de décalage p = 12; à l’instar de la méthode précédente, le modèle V AR(12) subira
l’épreuve des tests pour qu’il soit par la suite validé afin d’être exploité pour les prévisions.
Néanmoins l’ordre du décalage p = 12 retenu est important, ce qui n’est pas pour diminuer Le
nombre de paramètres à estimer qui avoisine 132 paramètres, nous aurions pu diminuer
l’ordre du décalage en introduisant une composante moyenne mobile mais le logiciel
EVIEWS ne traite pas les modèles VARMA.

Nous achevons notre étude par une comparaison entre les deux méthodes sur la base du
critère RMSE qui permet de conclure que l’approche multivarié nous a permis d’améliorer les
Prévisions pour les quatre séries (FE. FN, JAN, JAE) .
Lors de cette étude , il nous a été permis d’approfondir nos connaissances dans le
domaine de la prévision à court et à long terme et un savoir faire pour les logiciels
statistiques EVIEWS , MATLAB , SPSS , ITSM , XL STAT .

Nous espérons avoir répondu au problème posé et que les résultats trouvés seront d’une
utilité pertinente

140
Annexe
Annexe 01

1.1 Notion de causalité :


Un modèle de série chronologique (linéaire ou non) de la forme :
X t = F (X t −1 , X t − 2 ,…, X t − p , ε1 , ε t −1 ,…, ε t − q ) est causal, si et seulement si, on peut exprimer le

processus stochastique sous forme d’une combinaison linéaire (finie ou infinie) convergente
en moyenne quadratique, du présent et du passé d’un bruit blanc {ε t }.

¾ Remarque :
La causalité n’est pas une propriété du processus {X t , t ∈ Z } à lui seul, mais plutôt de la

relation avec {ε t , t ∈ Z } . Par suite, si le modèle est causal, alors le processus {X t , t ∈ Z } est
stationnaire, puisque ce dernier s’écrit en fonction de bruit blanc stationnaire.

1.2 Notion d’inversibilité :


Un modèle de série chronologique (linéaire ou non) de la forme :
X t = F (X t −1 , X t − 2 ,…, X t − p , ε1 , ε t −1 ,…, ε t − q ) est inversible, si et seulement si, on peut exprimer

le processus {ε t } sous forme d’une combinaison linéaire (finie ou infinie) convergente en

moyenne quadratique, du présent et du passé du processus stochastique {X t }.

142
Annexe 02

TAB. : Valeurs critiques du test de Dickey-Fuller pour p = 1

T 1% 5% 10%

Modèle [1]
100 -2.60 -1.95 -1.61
250 -2.58 -1.95 -1.62
500 -2.58 -1.95 -1.62
∞ -2.58 -1.95 -1.62
Modèle [2]
100 -3.51 -2.89 -2.58
250 -3.46 -2.88 -2.57
500 -3.44 -2.87 -2.57
∞ -3.43 -2.86 -2.57
Modèle [3]
100 -4.04 -3.45 -3.15
250 -3.99 -3.43 -3.13
500 -3.98 -3.42 -3.13
∞ -3.96 -3.41 -3.12

Modèle [1] : modèle sans constante, ni tendance déterministe. Modèle [2] : modèle
avec constante, sans tendance. Modèle [3] : modèle avec constante et tendance

TAB. Valeurs critiques de la constante et de la tendance, tests de Dickey-Fuiler


Modèle [2] Modèle [3]

Constante Constante Trend


T 1% 5% 10 % 1% 5% 10% 1 % 5% 10%

100 3.22 2.54 2.17 3.78 3.11 2.73 3.53 2.79 2.38
250 3.19 2.53 2.16 3.74 3.09 2.73 3.49 2.79 2.38
500 3.18 2.52 2.16 3.72 3.08 2.72 3.48 2.78 2.38
∞ 3.18 2.52 2.16 3.71 3.08 2.72 3.46 2.78 2.38

Modèle [2] : modèle avec constante sans tendance déterministe


Modèle [3] : modèle avec constante et tendance.

143
Bibliographie :

¾ Analyse des séries temporelles en économie (Régis


Bourbonnais et Michel Terraza).

¾ Econométrie des séries temporelles macroéconomiques et


financières (Sandrine Lardic et Valérie Mignon).

¾ Prévision des ventes théorie et pratique (Régis Bourbonnais


et Jean-Claude Usunier).

¾ Arthur Charpentier cours de séries temporelles.

¾ Michel Lubrano (Septembre 2004).

¾ Econométrie Appliquée Série Temporelles (Christophe


Hurlin).

¾ Maîtrise D économétrie Cours de Série Temporelles Années


1999 a 2004.

Texte :M-C Viano.

Graphique : A.Philippe.

¾ Box, G.E.P. et Jenkins, G.M. (1976). Time Series Analysis,


Forecasting and Control, Holden-Day, (revised
edition). San Francisco, CA.

¾ Bresson & A. Pirotte (1995), Econométrie des Séries


Temporelles Théorie et Application. PUF.

¾ Brockwell & R. A. Davis (1987), Time Series: Theory and


Methods. New York: Springer-Verlag.

¾ Gourieroux & A. Monfort (2e édition 1995), Séries


Temporelles et Modèles Dynamiques. Economica.

144

Vous aimerez peut-être aussi