Académique Documents
Professionnel Documents
Culture Documents
THEME
Présenté par :
Mr. Mohamed OSMAN Mr. Cherif YAKOUBENE
Devant le jury :
Mme H. GUERBYENNE Présidente
Mr. A.AKNOUCHE Examinateur
Mme K.DJABALLAH Examinatrice
Promotion 2005-2006
DÉDICACES
Je dédie ce modeste travail
A ma très chère mère, à mon père
A mes sœurs, à mon frère Khaled
A mes grands-parents qui m’ont tous aidé et soutenus et qui
m’ont réservé les moyens tout au long de mes études.
mes tentes Malika, Baya, Aldjia,
A mes cousines, cousins Mohamed Reda, Ali, Tarek, et
A toute la famille petits avant les grands
A Abdelkader, Oualid, mes amis de toujours
Cherif, mon ami partenaire « binôme » qui a tant donné
pour que nous achevions ce travail,
A toute la promotion 2005 – 2006 probabilités et statistique
pour leurs soutien et encouragement,
A Anissa, Fella, Sihem et Smail,
Kamel, Hichem, Ameur
Aux prochaines promotions que je ne manquerai pas
d’encourager,
A Samir, Rafik, Bilel, Mourad
A tous les étudiants de R.O.
A tous ceux qui m’ont aidé,
A tous ceux que j’aime,
A tous les musulmans frères,
A tout le peuple Algérien, Palestinien, Irakien
Avec toute ma gratitude
Mohamed.O
DÉDICACES
Je dédie ce mémoire :
A toute ma famille.
d’encourager,
Cherif.Y
REMERCIEMENTS
Louange à Dieu, le miséricordieux, sans Lui rien de tout cela n'aurait
pu être.
Nous remerciement le bon Dieu qui nous a orienté au chemin du
savoir et les portes de la science. Nous tenons à remercier vivement tous
ceux qui nous ont aidés de prés ou de loin à l’élaboration de ce mémoire ;
nous pensons particulièrement à :
-Monsieur Hècene.BELBACHIR, qui nous a guidées avec ses conseils,
ses orientations techniques et surtout à l’attention particulière qu’il a
donné à notre projet, et qui nous a accompagné au long de notre travail.
-Madame Hafida.GUERBYENNE. Pour avoir accepter de présider
notre soutenance et pour son aide et sa contribution et ses précieux conseils
et sa gentillesse.
-Madame Khadija.DJABALLAH. Examinatrice, pour son aide et sa
contribution et ses précieux conseils et sa gentillesse.
-Monsieur Malek. AKNOUCHE. Examinateur, pour son aide et sa
contribution et ses précieux conseils.
-Madame Djenet.SEDDIKI membre de jury qui nous a fait l'honneur
d'en faire partie.
De même nos remerciements vont au personnel de NAFTAL, en
particulier :
Mr H.MENKOURA, Mr K. HEMMI, Mr M.KECHROUDE.
Nous remercions également nos familles respectivement qui nous ont
aidés, encouragées et soutenues dans les moments difficiles tout au long de
la préparation de cette thèse.
Nous remercions toute personne parmi nos camarades ou autre qui
nous ont aidées de prés ou de loin à la réalisation de ce mémoire.
Enfin, nous remercions tous ceux qui nous ont encouragé tout au long
de notre Parcours universitaire et ceux qui ont contribué à notre
formation mais que nous N’avons pas cités.
A toute ces personnes, nous leurs disons merci infiniment.
SOMMAIRE
Introduction et Problématique : 1
PRESENTATION GENERALE DE NAFTAL 3
Partie théorique
Chapitre 1 : Généralités sur les séries chronologiques :
1.1 Introduction………………………………………….......……………………… 10
1.2 Stationnarité. …………………………………………………………………… 10
1.2.1 Définition d’un processus stationnaire au sens strict………………………. 10
1.2.2Definition d’un processus stationnaire de second ordre……………………. 10
1.3 Premiers indices descriptifs d’une série temporelle……………………………. 11
1.3.1 Indice de la moyenne et la variance……………………………………….. 11
1.3.2 Indice de dépendance……………………………………………………… 11
1.4 La classe des processus aléatoire ARMA……………………………………… 13
1.4.1Géneralités et notations…………………………………………………….. 13
1.4.2 Définition des processus ARMA…………………………………………… 13
2 Les démarches préliminaire pour analyser une série chronologique :
2.1 Représentation graphique de la série………………………………………….. 17
2.2 Les composantes temporelles de la série……………………………………… 17
2.2.1 La tendance………………………………………………………………. 17
2.2.2 Saisonnalité………………………………………………………………. 17
2.2.3 Facteur irrégulier…………………………………………………………. 17
2.2.4 Composante cyclique……………………………………………………. 17
2.3 Type de décomposition………………………………………………………. 17
2.3.1 Le modèle additif ……………………………………………………… 18
2.3.2 Le modéle multiplicatif………………………………………………….. 18
2.4 Le test de schéma……………………………………………………………… 18
2.4.1 Le test graphique…………………………………………………………. 18
2.5 La technique de détection de la saisonnalité et de la tendance………………… 19
2.5.1 La technique graphique…………………………………………………… 19
2.5.2 La technique analytique…………………………………………………. 19
Chapitre 2 : Méthode de lissage exponentiel :
2.1 Introduction…………………………………………………………………… 22
2.2 Principe de base……………………………………………………………….. 22
2.3 Description de la méthode…………………………………………………….. 22
2.4 Lissage exponentiel simple……………………………………………………. 22
2.5 Choix de coefficient de lissage………………………………………………… 25
2.6 Lissage exponentiel double…………………………………………………… 25
2.7 Méthode de Holt-Winters …………………………………………………….
25
Chapitre 3 : Processus non stationnaire, tests de racine unitaire
3.1 Généralités sur la non stationnarité……………………………………………… 28
3.1.1 Processus de type DS et TS……………………………………………….. 28
3.1.1.1 Les processus de type TS……………………………………………. 28
3.1.1.2 Les processus de type DS……………………………………………. 28
3.1.1.3 Conséquences d’une mauvaise stationnarisation du processus TS…. 29
3.1.2 Processus autorégressif moyenne mobile………………………………… . 29
3.1.3 Processus autorégressif moyenne mobile intégré saisonnier………………. 30
3.2 Tests de racine unitaire………………………………………………………….. 30
3.2.1 Le test de Dickey-Fuller simple ……………………………………………... 30
3.2.2 Le test de Dickey-Fuller augmenté……………………………………….. 32
3.2.3 L’algorithme de Dickey-Fuller augmenté………………………………... 33
Chapitre 4 : Méthodologie de Box et Jenkins
4.1 Méthodologie de Box et Jenkins………………………………………… 35
4.1.1 Les démarches de la méthodologie de Box et Jenkins………………….. 35
4.2 L’estimation du modéle…………………………………………………………. 37
4.2.1 Méthode d’estimation……………………………………………………… 37
4.3 Les tests de validation…………………………………………………………. 37
4.3.1 Tests sur les paramètres…………………………………………………… 37
4.3.2 Tests sur les résidus………………………………………………………… 38
4.4 Choix du modèle……………………………………………………………… 41
4.5 Prévision……...........................................………………………………… 41
4.5.1 Transformation de la série ………………………….. 42
4.5.2 Prédicteur pour un modèle ARMA ………………………. 42
Chapitre 5 : Les processus à mémoire longue
5.1 Généralité et définition de la mémoire longue………………………………… 45
5.2 Bruit blanc fractionnaire ARFIMA (0.d.0)……………………………………. 45
5.3 Processus ARFIMA (p.d.q)…………………………………………………… 46
5.4 Test de mémoire longue………………………………………………………… 46
5.4.1 Test de LO (1991)………………………………………………………….. 46
5.4.2 Test de Labato et Robinson (1998)……………………………………….. 47
5.5 Les méthodes d’estimation des processus ARFIMA………………………… 47
5.5.1 Méthode en deux étapes………………………………………………. 47
5.6 Prévision d’un processus ARFIMA(p.d.q). …………………………………... 48
Chapitre6 : Modéle VAR
6.1 Présentation du modèle VAR standard……………………………………….. 50
6.1.1 Ecriture du modèle VAR standard……………………………………….. 50
6.1.2 Condition de stationnarité……………………………………………….. 50
6.1.3 Concept d’innovation………………………………………………………. 51
6.2 Estimation d’un modèle VAR standard………………………………………. 52
6.3 Estimation du nombre de décalages p………………………………………… 54
6.3.1 Estimation du nombre de décalages à partir d’un critère d’information… 55
6.3.2 Estimation du nombre de décalages à partir de tests du rapport de 56
vraisemblance………………………………………………………………………
6.4Calcul des fonctions de réponse du modèle VAR standard…………………… 57
6.4.1Utilités du concept d’innovation en simulation…………………………… 57
6.4.2 Fonctions de réponse du modèle VAR standard……………………………. 58
6.4.3 Décomposition de la variance des erreurs de prévision du modèle VAR standard 60
Partie application :
Lissage exponentiel…………………………………………………………………… 63
Box & Jenkins……………………………………………….………………………… 68
ARFIMA……………………………………………………..…….……………….... 114
VAR……………………………………………………………………………………. 119
Conclusion ……………………………………………………..…………….……….. 137
Conclusion générale…………………………………………..….…………………… 140
-Annexes ………………………………………………..…………………………….. 142
-Bibliographie ……………………………………..…………………………………. 144
Introduction et Problématique :
Les mutations économiques que connaît notre pays, à savoir son passage d’une
économie dirigée à une économie de marché, ont interpellé toutes les entreprises nationales à
s’adapter à ce nouvel environnement économique.
NAFTAL compte parmi ces entreprises qui se préparent sérieusement à évoluer dans un
nouveau contexte à travers notamment la mise en place d’une nouvelle organisation adapté
aux nouveaux enjeux économiques et ce, en prévision de l’installation de la concurrence
étrangère.
Forte des expériences du passé, NAFTAL, qui a recouvert sa santé financière grâce
notamment à la recapitalisation, a décidé de se projeter résolument dans l’avenir avec l’appui
de l’élaboration d’une stratégie de développement rationnelle et cohérente qui tient compte
des enjeux et des exigences du nouveau contexte économique national et international.
La demande ainsi estimée fait ressortir la nécessité de définir, d’un point de vue
organisationnel, de nouvelles approches pour renforcer la position de NAFTAL dans un
marché libre des produits pétroliers, ouvert à la concurrence et qui imposera davantage les
enjeux de la commercialisation de la rentabilité de la réalité des prix. L’environnement
économique national nouveau caractérisé par la disparition du monopole et la libre initiative
va se traduire pour NAFTAL par l’émergence de la concurrence aussi bien dans l’importation
que dans la distribution et la commercialisation des produits pétroliers sur le marché national
(d’après NAFTAL magazine).
1
C’est ainsi que le sujet qui nous a été proposé s’intitule :
Modélisation VAR et ARFIMA en Vu de la Prévision des Quantités de Ventes de
Carburants Aviation et Marine
Notre travail est scindé en deux parties :
Partie Théorique :
Nous commençons dans une première étape tout d’abord par une étude univariée en
nous basant sur la méthode de lissage exponentiel de Holt-Winters, ensuite la méthodologie
de Box et Jenkins, et la modélisation ARFIMA.
Dans la deuxième étape, nous complétons l’étude univariée par une étude multivariée
(modèle VAR).
Enfin, nous nous proposons de comparer les quatre méthodes en nous basant sur l’erreur
moyenne quadratique pour en tirer la méthode la plus appropriée
Partie Application :
• Application de la méthode de Holt et Winters.
• Application de la méthodologie de Box et Jenkins.
• Application de la modélisation ARFIMA.
• Application de la méthode VAR
Nous avons développé un didacticiel sous DELPHI, pour le logiciel « EVIEWS » afin
de permettre aux utilisateurs de bien manipuler et maîtriser le logiciel.
2
PRESENTATION GENERALE DE NAFTAL
I-1 HISTORIQUE :
NAFT : Pétrole
AL : Aldjazair.
ORGANISATIONS DE NAFTAL :
Les directions principales sont :
3
B.I : Branche International, a pour mission principale :
Elle s’occupe des projets d’association avec le compare international.
Branche carburant
Branche international
Direction Exécutif
Branche Commercialisation
4
Direction. Général
NAFTAL
A / LES MISSIONS :
6
W Veiller à l’utilisation optimale des ressources humaines et prendre toutes
les mesures permettant d’en augmenter productivité et d’en relever
le niveau de formation ;
o Assure le traitement des dossiers particuliers qui lui sont confiés par la hiérarchie
o Coordonne, à la demande du Directeur de Branche, les travaux effectués par les
Directions et en prépare les synthèses
o Peut être appelé, en cas de nécessité, à assurer l’intérim d’une Direction
o Est chargé de la rédaction des procès verbaux des différentes réunions
o Participe, à la demande du Directeur de Branche, aux différentes Commissions
de la Société
o Peut représenter la Branche ou la Société auprès des autorités politiques,
administratives ou organismes nationaux
7
Partie Théorique
Chapitre 1
Généralités sur
Les séries chronologiques
Chapitre 1 Généralités sur les séries chronologiques
1.1 Introduction :
Dans de nombreux domaines comme la biologie, la climatologie l’économétrie, on
enregistre des observations au cours du temps pour constituer ce que l’on appelle une série
chronologique.
Une série chronologique est une suite d’observations indicée par le temps (t),
représentant l’évolution d’un phénomène dans le temps.
Certaines séries peuvent s’observer de manière continue, certaines autres correspondent
à des observations réalisées en des intervalles de temps fixes a priori : heure, jour, mois,
année…
De telles suites de données sont notée {xt ; t=1,…,T}.
Les méthodes que nous exposons font référence à ce type de donnée.
1.2 Stationnarité :
La stationnarité est la clef de l’analyse des séries temporelles avant d’effectuer des testes
spécifiques sur cette série et de chercher à la modéliser.
Nous commencerons par donner la définition d’un processus stationnaire au sens strict
(ou stationnarité forte), et ensuite celle de la stationnarité du second ordre (ou stationnarité
faible).
du temps (t1,t2,…,tn ) t1<t2<…. <tn , tel que ti ∈ Z et pour tout temps h∈ Z avec ti+h∈ Z : ∀i,
i=1...n , la suite ( xt1+ h ,..., xtn + h ) a la même loi de probabilité que le vecteur ( xt1 ,..., xtn ).
Cette condition est difficile à vérifier en pratique, c’est pourquoi on utilise en général
une version plus faible de la stationnarité, à savoir la stationnarité au second ordre.
1.2.2. Définition d’un processus stationnaire au second ordre :
Un processus x t
est dit stationnaire au second ordre, ou stationnaire au sens faible, si
les trois conditions suivantes sont satisfaites :
¾ ∀t ∈ Ζ, Ε( xt ) = m,..independante.de.t..
2
¾ ∀t ∈ Ζ, Ε( xt )〈∞.
10
Chapitre 1 Généralités sur les séries chronologiques
-Variance : σ 2 (t ) = V ( xt ).
γ (t) de x la fonction :
h t
γ h
(t ) = cov( xt . xt + h) = Ε[( xt − Ε( xt ))( xt + h − Ε( xt + h))].
• γ h
≤ γ 0
.
• γ =γ h −h
. : fonction. paire.
γ cov( xt , xt + h)
ρ = h
= , h ∈ Ζ.
h
γ 0
V ( xt )V ( xt + h )
11
Chapitre 1 Généralités sur les séries chronologiques
ρ 0
= 1.
ρ h
≤ ρ 0
.
ρ =ρh −h
: fonction. paire.
⎡1 ρ1...ρ h −1 ⎤
⎢ ρ 1...ρ ⎥
⎢ 1 h−2 ⎥
⎢. 1 ⎥ h ∈N
P h= ⎢ ⎥
⎢. ⎥
⎢ ⎥
⎢ ⎥
⎢⎣ ρ h −1 ρ h − 2 ...1⎥⎦
P h*
La fonction d’autocorrélation partielle est donnée par : ρ h = .
ph
⎡1 ρ1...ρ1 ⎤
⎢ ρ 1...ρ ⎥
⎢ 1 2 ⎥
Ainsi P * = ⎢. ⎥
h ⎢ ⎥
⎢. ⎥
⎢ ⎥
⎢ ⎥
⎢⎣ ρ h −1 ...ρ h ⎥⎦
On peut se passer de ce calcul matriciel qui n’est souvent pas facile à faire. Pour cela, on
a recours à une écriture récurrente de ρ ii
tel que :
⎧ ρ 1 si i = 1
⎪ i −1
⎪⎪ ρ i − ∑ ρ i −1, j ρ i − j
ρ ii = ⎨ j =1
⎪ i −1
i = 2,....., h
⎪ 1 − ∑ ρ i −1, j ρ j
⎪⎩ j =1
12
Chapitre 1 Généralités sur les séries chronologiques
Cet algorithme résolvant les équations de Yule-Walker de manière récursive est appelé
algorithme de Durbin (1960).
¾ Opérateur linéaire :
Opérateur de retard :
On note B l’opérateur retard, il est défini par : Bxt = x t −1
.
Bm x = x .
Si on applique m fois cet opérateur, on a la relation suivante :
t t −m
On constate ainsi que l’opérateur retard transforme une variable x en sa valeur passée. t
Opérateur d’avance :
Soit F l’opérateur inverse de B : B*F=I., I étant l’opérateur identité.
L’opérateur F est appelé opérateur avance: F x =x
t t +1
.
Fm x = x t t +m
.
Opérateur de différence :
On note ∇ l’opérateur (1-B) et ∇ m l’opérateur (1- B m ) ainsi :
∇ x =x −x
m
t t t −m
.
13
Chapitre 1 Généralités sur les séries chronologiques
Il s’agit d’une très grande famille de processus stationnaires qui présente l’avantage
d’être un bon outil de prévision ;
Si une série { xt ; t∈Z } est la réalisation d’un tel processus. Alors on peut écrire
Φ ( B ) x t = ε t sous la forme :
x t
= φ1 xt −1 + ... + φ p xt − p + ε t .
avec:
Fonction d’ autocorrélation :
Pour obtenir les autocorrélations d’un processus AR (p), il suffit de multiplier chaque
membre de l’équation x t
= φ1 xt −1 + ... + φ p xt − p + ε t . par x t −k
tel que (k>0) ; en prenant ensuite
l’espérance de la variable et en divisant l’ensemble par γ 0 , on obtient ainsi :
i= p
ρ k = ∑ φi ρ k −i ∀k > 0.
i =1
14
Chapitre 1 Généralités sur les séries chronologiques
⎧⎪ x t = Θ( B) *ε t
⎨
⎪⎩∀t ∈ Ζ.
telle que :
• {ε t , t ∈ Ζ} est un processus bruit blanc.
x t
= Θ( B ) * ε t sous la forme :
x t
= ε t − θ1ε t −1 − ... − θ qε t − q .
Avec :
•θ1 ,...,θ q des paramétres réels independants de t.
supérieures à 1 B > 1 .
D’après la définition de causalité (annexe 1), un modèle moyenne mobile d’ordre fini est
toujours causal, car c’est une combinaison linéaire finie d’un processus
stationnaire {ε t , t ∈ Z }.
Fonction d’autocorrélation :
La fonction d’autocorrélation d’un processus MA (q) est donnée sous la forme :
15
Chapitre 1 Généralités sur les séries chronologiques
⎧ γ k −θ k + θ1θ k +1 + ... + θ q − kθ q
⎪ ρk = = si 1 ≤ k ≤ q.
⎨ γ0 1 + θ12 + ... + θ q2
⎪0 si k > q.
⎩
défini par X t = Θ( B)ε t se comporte comme une exponentielle ou une sinusoïdale amortie.
Φ (B ) =1 − φ1 B − φ2 B 2 − −φ p B p φi ∈ IR, ∀ i =1,…, p .
Θ( B) = 1 − θ1B1 − θ 2 B 2 − − θq Bq ,θ i ∈ IR , ∀i = 1, ,q .
telle que :
• {ε t , t ∈ Ζ} est un processus bruit blanc.
Si une série { xt ; t∈Z } est la réalisation d’un tel processus, alors on peut écrire :
x t
= ε t − θ1 Bε t . = ε t (1 − θ1 B ).
D’où :
i =∞ i =∞
1
εt = * x t = ∑ θ1i B i * x t = ∑ψ i B i * x tqui est un processus AR(∞) telle que ψ i = θ1i .
(1 − θ1 B ) i =0 i =0
sous la condition θ1 ≤ 1
16
Chapitre 1 Généralités sur les séries chronologiques
17
Chapitre 1 Généralités sur les séries chronologiques
Après avoir détecté par des méthodes graphiques ou analytiques quelles sont les
composantes présentes, il faut proposer un modèle :
Dans ce modèle, on suppose que les amptitudes des variations saisonnières et des
fluctuations résiduelles ne dépendent pas de la tendance.
⎧ X t = T t * S t * Rt .
⎨ .
⎩t = 1 ...T
Notons qu’une simple transformation logarithmique redonne la forme linéaire. Elle est
très utilisée en économie.
Parfois les effets à court terme ne sont pas amplifiés par les effets à moyen et à long
terme ; c’est à dire que la tendance et le facteur saisonnier sont multiplicatifs et les
irrégularités additives, le modèle retenue est le modèle multiplicatif de la forme :
⎧ X t = T t * S t + Rt .
⎨
⎩t = 1...T .
18
Chapitre 1 Généralités sur les séries chronologiques
26000
24000
D1
22000
20000
18000
16000
14000 D2
12000
2000 2001 2002 2003 2004
AD D ITIF
250
200
150
D1
100
50
0
D2
2000 2001 2002 2003 2004
MULTIPLICATIF
L’examen du graphique ne suffit pas très souvent pour mettre en évidence une
saisonnalité, donc il est nécessaire d’utiliser le test de Fisher à partir de l’analyse de la
variance (test d’ANOVA).
19
Chapitre 1 Généralités sur les séries chronologiques
¾ Test de Fisher :
On considère n: Le nombre d’années. P: Le nombre d’observations dans l’année
X i j : La valeur de la série pour la ième année et la jème période.
n −1 p −1
n p
∑ ∑ (X i j − X i . − X . j − X .. ) 2
La variance résiduelle : VAR R = i =1 j =1
(n − 1)( p − 1)
n p
∑∑ ( X ij − X .. ) 2
L’équation de la variance totale : VART = VAR A + VARP + VARR = i =1 j =1
n −1
VARP
La valeur calculée F0 = que l’on compare à la valeur tabulée Fvα1 v2
VARR
20
Chapitre 2
Méthode
du lissage exponentiel
Chapitre 2 Méthode de lissage exponentiel
2.1 Introduction :
La prévision à court terme a connu des développements importants durant les dernières
années, elle constitue la base de l'action. La prise de décision repose en effet toujours sur des
prévisions, c'est ainsi qu'une entreprise commerciale s'intéresse aux prévisions des ventes
futures pour faire face à la demande, gérer sa production ainsi que ses stocks, mais aussi
orienter sa politique commerciale ( prix, produits et marketing). De même, on essaie de
prévoir les rendements d'un investissement, la pénétration d'un marché ou l'effet de la
modération salariale sur l'emploi.
Les développements de la pratique statistique ont permis de disposer d'un certain nombre
d'outils de calcul, les méthodes de lissage exponentiel font l'objet de ce chapitre, ces méthodes
datent du début des années soixante (HOLT en 1957 et BROWN en 1962). Ils justifient
amplement leurs utilisations.
Après avoir fait un lissage exponentiel simple qui ne peut être utilisé en présence d'une
tendance ou d'une saisonnalité, nous passons au lissage double et à la méthode de HOLT, ces
dernièrs peuvent convenir pour des séries présentant une tendance. Le lissage de WINTERS
intervient dans les cas ou la tendance et la composante saisonnière sont juxtaposées soit de
manière additive soit de manière multiplicative.
22
Chapitre 2 Méthode de lissage exponentiel
Nous disposons d'une série chronologique x = ( x1 ,…, x n ) de longueur enregistrée aux dates 1, . . .,
n. Nous nous situons à la date n et nous souhaitons prévoir la valeur x n + h non encore observée à
l'horizon h. Nous notons cette prévision : xˆ n ,h . L'entier n est parfois appelé base de la prévision
Les formules de lissage sont :
xˆn ,h = (1−α ) xn +αxˆn−1,h telle que 0 ≤ α ≤ 1 …………. ( ∗ ).
Remarques:
La formule xˆn ,h = (1 − α ) xn + α xˆn −1,h . permet
Le lissage apparaît comme le résultat de la dernière valeur lissée corrigée par une
pondération de l'écart entre la réalisation et la prévision.
¾ Lorsque α est proche de 0 ( α ≃0), la pondération s'étale sur un grand nombre de
termes dépendant du passé, la mémoire du phénomène étudié est forte et la prévision est peut
réactive aux dernières observations.
¾ Lorsque α est proche de 1 ( α ≃1), les observations les plus récentes ont un poids
prépondérant sur les anciens termes, la mémoire du phénomène étudié est faible et la
prévision est très réactive aux dernières observations.
On peut retrouver l'équation du lissage exponentiel en employant une approche très simple
basée sur le concept de la fonction de prévision, telle que:
xˆn ,h = an ...(Ω)
23
Chapitre 2 Méthode de lissage exponentiel
Q (an ) = ∑ β j ( xn − j − an ) 2 . ²
j ≥0
Q(an ) = −2∑ β j ( xn − j − an ) = 0.
j ≥0
∑β
j ≥0
j
xn − j = an ∑ β j .
j ≥0
or ∑β
j ≥0
j
= (1 − β ) −1
d’où
aˆn = (1 − β )∑ β j xn − j ............(**)
j ≥0
L'expression (∗∗) est exactement ce que nous avons trouvé pour la prévision xˆn ,h (relation
(∗) ) du lissage exponentiel simple tel que le facteur d'escompte β est remplacé par la
constante de lissage α c'est-à-dire β = α
= en − α en + an − α an + α an −1.
α an = (1 − α )en + α an −1.si.α ≠ 0.alors :
(1 − α )
an = ( )en + an −1 = γ en + an −1.
α
an = γ en + an −1. .avec.0 ≤ γ ≤ 1.
En conséquence , nous pouvons dire que le lissage exponentiel simple est justifié dans le
cas d'une fonction de prévision constante, dans le contexte de moindres carrés pondérés , et
elle ne sera vraiment constante que si l'on choisit un facteur d'escompte β égale à 1, ce qui
correspond à α = 1 .
24
Chapitre 2 Méthode de lissage exponentiel
Notons que :
aˆ1,n .et.aˆ2,n sont des coefficients dépendant de n
On cherche à déterminer les valeurs des deux paramètres par le critère des moindres
carrées escomptes β , tel que le facteur d'escompte est remplacer par α c'est-à-dire β = α .
Cette méthode est plus souple que le lissage exponentiel amélioré, dans la mesure où elle fait
intervenir deux constantes β et γ au lieu d’une α
Telle que 0 < β < 1 et 0 < γ < 1 deux constantes fixées et les formules de mise à jour :
1−α
si β = 1 − α 2 et γ = alors :
1+ α
aˆ1 (n) = α 2 ⎡⎣ aˆ1 ( n − 1) + aˆ2 ( n − 1) ⎤⎦ +
(1 − α ) ⎡⎣ x
2
n − xˆn −1,1 + aˆ1 ( n − 1) + aˆ2 ( n − 1) ⎤⎦
= α 2 ⎡⎣ aˆ1 ( n − 1) + aˆ2 ( n − 1) ⎤⎦ + (1 − α 2 ) xn
(1 − α )
2
− (1 − α ) ⎡⎣ aˆ1 ( n − 1) + aˆ2 ( n − 1) ⎤⎦
2
(1 − α )
2
26
Chapitre 3
Non stationnarité,
tests
de racine unitaire
Chapitre 3 Non stationnarité, tests de racine unitaire
xt = f (t ) + ε t .
Où f (t ) est une fonction déterministe du temps et ε t est un bruit blanc.
Il est évident que le processus ne satisfait pas la définition de la stationnarité de second
ordre puisque il viole la premeir condition de la définition d’un processus stationnaire :
E ( xt ) = f (t ) dépend du temps, car E (ε t ) = 0.
28
Chapitre 3 Non stationnarité, tests de racine unitaire
¾ Ordre d’intégration (d):
( xt , t ∈ Ζ) est un processus DS intégré d’ordre (d) si et seulement si : le polynôme
φ ( B) associé à sa composante autorégressive admet (d) racine unitaire :
∼
φ ( B) xt = zt avec φ ( B) = (1 − B) d Φ ( B) .
∼
z t est un processus stationnaire, les racines du polynôme Φ ( B ) sont toutes supérieures en
module à l’unité.
29
Chapitre 3 Non stationnarité, tests de racine unitaire
3.1.3. Processus autorégressif moyenne mobile intégré saisonnier :
Il est possible que certaines séries chronologiques soient caractérisées par une allure
graphique périodique. Pour cela, il est important de les analyser en tenant compte de l’effet
saisonnier. Box et Jenkins (1970) ont proposé une classe de modèles particuliers appelée :
classe de modèles ARIMA saisonniers.
ε t → BB ( 0, σ ε2 ) , s correspond à la saisonnalité.
30
Chapitre 3 Non stationnarité, tests de racine unitaire
Le principe général du test consiste à tester l’hypothèse nulle de présence d’une racine
unitaire (on dit alors que X t est intègré d’ordre 1), contre l’hypothèse alternative d’absence
de racine unitaire (on dit alors que X t est intègré d’ordre 0).
Ecrivons plus précisément les hypothèses nulle et alternative pour chacun des trois
modèles considérés :
¾ Modèle [1] :
⎧ H 0 : ρ = 1 ⇔ X t = X t −1 + ε t . ⇒ ( X t suit un processus de marche aleatoire sans dérive).
⎨
⎩ H1 : ρ ≺ 1 ⇔ X t = ρ X t −1 + ε t . ⇒ ( X t suit un processus autoregressif d .ordre 1 ( AR(1))).
¾ Modèle [2] :
⎧ H 0 : ρ = 1 ⇔ X t = X t −1 + ε t ⇒ ( X t suit un processus de marche aleatoire sans dérive).
⎨
⎩ H1 : ρ ≺ 1 ⇔ X t = ρ X t −1 + γ + ε t .avec.γ = μ (1 − ρ ) ⇒ ( X t suit un processus AR (1) avec dérive).
¾ Modèle [3] :
⎧ H 0 : ρ = 1 ⇔ X t = X t −1 + β + ε t . ⇒ ( X t suit un processus de marche aleatoire avec dérive.).
⎪
⎨ H1 : ρ ≺ 1 ⇔ X t = ρ X t −1 + λ + δ * t + ε t .avec.λ = α (1 − ρ ) + ρβ .et.δ = β (1 − ρ ).
⎪ ⇒ ( X t est un processus TS avec erreurs ARMA).
⎩
Règle de décision :
¾ Si la valeur calculée de la t-statistique associée à φ est inférieure à la valeur critique (en
se referant aux table de Dickey et Fuller (annexe 2)), on rejette l’hypothèse nulle de non
stationnarité.
¾ Si la valeur calculée de la t-statistique associée à φ est supérieure à la valeur critique, on
accepte l’hypothèse nulle de non stationnarité.
31
Chapitre 3 Non stationnarité, tests de racine unitaire
o Si on accepte l’hypothèse nulle, X t est non stationnaire. Dans ce cas, il
faut la différencier et recommencer la procédure de test sur la série en
différence première.
o Si l’on rejette l’hypothèse nulle, X t est stationnaire. Dans ce cas, la
procédure de test s’arrête et l’on peut directement travailler sur X t
• Etape 2 : cette étape ne doit être appliquée que si la tendance dans le modèle
précèdent n’est pas significative. On estime le modèle [2] et l’on commence par tester la
significative de la constante en se referant aux tables de Dickey-Fuller (annexe 2) :
Si la constante n’est pas significative, on passe à l’étape 3.
Si la constante est significative, on teste l’hypothèse nulle de racine unitaire en
comparant la t-statistique de φ aux valeurs tabulées par Dickey Fuller (annexe
2), on se trouve alors deux possibilités :
o Si l’on accepte l’hypothèse nulle, X t est non stationnaire .dans ce cas, il faut la
différencier et recommencer la procédure de test sur la série en différence première.
o Si l’on rejette l’hypothèse nulle, X t est stationnaire. Dans ce cas la
procédure de test s’arrête et l’on peut directement travailler sur X t .
• Etape 3 : cette étape ne doit être appliquée que si la constante dans le modèle
précèdent n’est pas significative. On estime alors le modèle [1] et on teste l’hypothèse
nulle de racine unitaire en utilisant les valeurs critiques du tableau :
Si l’on accepte l’hypothèse nulle, X t est non stationnaire. Dans ce cas, il faut la
différencier et recommencer la procédure de test sur la série en différence première.
p
ΔX t =φX t −1 + ∑ φ jΔX t− j + β t + C + εt.
j =1
β=0
A H0 R H0
p
Δ X t = φ X t −1 + ∑ φ j Δ X t − j + C + ε t . Φ=0
j =1
A H0 R H0
A H0 R H0
p Φ=0
ΔX t = φ X t −1 + ∑ φ jΔ X t− j + ε t.
j =1
A H0 R H0
A H0 R H0
33
Chapitre 4
Méthodologie
de Box & Jenkins
et Tests sur les résidus
19
Chapitre 4 Méthodologie de Box & Jenkins
IDENTIFICATION
ESTIMATION
VALIDATION
NON OUI
Box et Jenkins ont développé une véritable méthodologie de recherche systématique d’un
modèle adéquat, ils se réfèrent à deux types de modèles ; les modèles moyennes mobiles, les
modèles autorégressifs, ou une combinaison des deux.
35
Chapitre 4 Méthodologie de Box & Jenkins
Analyse du graphique et du
corrélogramme
Analyse de la saisonnalité
Test de DICKEY-FULLER
Série stationnaire
Recoloration de la série
(saisonnalité,……..)
36
Chapitre 4 Méthodologie de Box & Jenkins
Test de Student :
On effectue un test classique de Student sur chacun des paramètres du processus ARMA,
Il peut arriver qu’un ou plusieurs paramètres ne soient pas significativement différents de
0, alors le modèle estimé est rejeté et on retourne à l’étape d’estimation en éliminant la
variable dont le coefficient n’est pas significatif.
¾ H0 « φp = 0 » contre H1 « φp ≠ 0 ».
φˆp
La statistique du test : tφˆ = .
p
σˆ φˆ
p
⎨
⎪*si. tφˆ ≥ t1−α / 2 l'hypothese nulle est rejetée et on retient un processus ARMA( p, q ).
⎩ p
Le coefficient de détermination :
Pour chaque modèle estimé, le coefficient de détermination correspondant R2 est:
37
Chapitre 4 Méthodologie de Box & Jenkins
R2 = 1 −
∑ε t
. (Coefficient de détermination normal).
∑ ( xt − x )
2
R2 = 1−
n −1
*
∑ ε t . (Coefficient de détermination corrigé)
2
n − p − q ∑ ( xt − x )2
t
Rappelons qu’un processus bruit blanc est un processus de moyenne nulle, de variance
constante et non autocorrélé, et pas nécessairement gaussien.
⎧ E (ε t ) = m
Soit ⎨ et ε : la moyenne calculée des résidus .
⎩var(ε t ) = σ
2
ε
On accepte l’hypothèse Η 0 au seuil α = 5% si : ≤ t n5−%1
σˆ
n −1
¾ L'hypothèse de test : Η 0 : " m = 0" contre Η 1 :" m ≠ 0"
ε
¾ La statistique de test : Z= .
σˆ
n −1
La règle de décision : si Z ≤ tn5%
−1 on accepte l'hypothèse H0
ε i −1 ≺ ε i ε i +1 Où ε i −1 ε i ≺ ε i +1
38
Chapitre 4 Méthodologie de Box & Jenkins
⎧1
Χt = ⎨ S’il présente un point de retournement à la date t
⎩0 Sinon
Donc on accepte l’hypothèse Η 0 : « les ε i sont non corrélés» si U ≺ 1.96 et cela au seuil
α = 0,05
∑(ε − ε
2
t t −1 )
DW = t=2
n
Cette statistique comprise entre 0 et 4.
∑ε
t =1
t
2
39
Chapitre 4 Méthodologie de Box & Jenkins
H 0 = ρ1 = ρ 2 = ... = ρ K = 0.
β2 − 3
ν2 = telle que β 2 : coefficient de kurtosis.
24 / n
¾ Les hypothèses :
H0 : ν 1 = 0(absence d'symétrie) etν 2 = 0(aplatissement normal) .
¾ La règle de décision :
⎧ si ν 1 ≺ 1.96 et ν 2 ≺ 1.96 ⇒ (on accepte l'hypothese de normalite).
⎨
⎩ si non on rejette l'hypothese de normalite.
Les modèles classiques de prévision fondés sur les modèles ARMA supposent des
séries temporelles à variance constante (hypothèse d’homoscedasticité).
Cette modélisation néglige l’information éventuelle contenue dans le facteur résiduel
de la chronique.
Les modèles de type ARCH (autorégressive conditionnellement heteroscedastiques)
permettent de modéliser des chroniques qui ont une volatilité (ou variance ou variabilité)
instantanée qui dépend du passé.
Il est ainsi possible d’élaborer une prévision dynamique de la chronique en termes de
moyenne et de variance.
L’effet ARCH est repéré grâce au corrélogramme des carrés des résidus.
Si un ou plusieurs termes sont significativement différents de zéro (l’existence d’une
corrélation entre les carrés des résidus) on dit qu’il y a effet ARCH.
4.5 Prévision :
41
Chapitre 4 Méthodologie de Box & Jenkins
Avec : (φ p ,θ q )∈ IR 2∗ et ε t i ⋅ i ⋅ d (0,σ ε2 ) .
Il s’ensuit que la meilleure prévision que l’on peut faire de X t +1 compte tenu de toute
Xˆ t (1) = E ( X t +1 X t , X t −1 , X t − 2 ,..., X 0 )
∞
= E ( X t +1 ε t , ε t −1 , ε t − 2 ,..., ε 0 ) = ∑ α jε t +1− j
j =1
Dés lors, l’erreur de prévision est donnée par la réalisation en t + 1 de l’innovation qui en t
n’est pas connue : X t +1 − Xˆ t (1) = ε t +1
42
Chapitre 4 Méthodologie de Box & Jenkins
X t + k − Xˆ t (k ) l
→ N (0,1)
[
var X t + k − Xˆ t (k ) ]1
2 T →∞
Or on sait que :
{[ ]} ⎡⎛ k −1 ⎞ ⎤ k −1 2 2
2
2
E X t + k − Xˆ t ( k ) = E ⎢⎜ ∑ α j ε t + k − j ⎟ ⎥ = ∑ α j σ ε
⎣⎝ j = 0 ⎠ ⎦ j =0
X t + k − Xˆ t (k ) l
D’où → N (0,1)
σε [∑ k −1
α2
j =0 j
] 1
2 T →∞
43
Chapitre 5
Les processus
à mémoire longue
Chapitre 5 Les processus a mémoire longue
Γ(d + k ) k d −1
où θ k = ≈ .. pour.k → ∞ .
Γ(d )Γ(k + 1) Γ(d )
¾ Si d >-1/2, Xt est inversible et a la représentation autorégressive infinie
suivante :
∞
(1 − B) d X t = Φ ( B) X t = ∑ φk X t − k = ε t .
k =0
Γ(k − d ) k − d −1
où φk = ≈ .. pour.k → ∞ .
Γ(− d )Γ(k + 1) Γ(−d )
45
Chapitre 5 Les processus a mémoire longue
5.4.1.Test de Lo (1991) :
Log QT
L’exposant de Hurst est donné par : H ≈
Log T
La relation entre l’exposant de Hurst et le degré d’intégration fractionnaire
1
est : H = d + .
2
( )
¾ Si 1 < H < 1 0 < d < 1 : le processus est à mémoire longue ou persistant.
2 2
¾ Si H = 1 (d = 0) : le processus se réduit au processus standard ARMA.
2
( )
¾ Si 0 < H < 1 − 1 < d < 0 : le processus est anti-persistant.
2 2
Lo a défini une statistique R/S qui, tout en restant sensible à la mémoire longue, est
invariante sous une classe générale de processus à mémoire courte.
La statistique R/S notée QT , s’écrit :
⎡ ⎤
k k
1 ⎢ ⎥
QT = R / sT (q ) = ⎢ max ∑ ( X j − X T ) − min ∑ ( X j − X T )⎥ .
sT (q ) ⎢ j =1 1≤ k ≤T j =1 ⎥
⎣ 1≤ k ≤T ⎦
46
Chapitre 5 Les processus a mémoire longue
T q
⎡ T ⎤
où sT2 (q ) = 1/ T ∑ ( X j − X T ) 2 + 2 / T ∑ w j (q ) ⎢ ∑ ( X j − X T )( X t − j − X T ) ⎥ .
j =1 j =1 ⎣ i = j +1 ⎦
j
telle que : w j (q) = 1 − , q < T.
q +1
∑ν j I (λ j )
1/ 2 j =1
LR = − m m
∑ I (λ )
j =1
j
m
où ν j = log j − m−1 ∑ log i .
i =1
47
Chapitre 5 Les processus a mémoire longue
ε t → BB(0, σ ε2 ) , d ∈ ⎥ − ,
⎤ 1 1⎡
⎢
⎦ 2 2⎣
Φ( μ ) ≠ 0
∞
ou bien : ε t = ∑ π j X t − j …………… (3)
j =0
∞
(1) et (2) donnent : ∑ψ
j =0
j Z j = Θ q ( Z ) Φ p ( Z ) −1 (1 − Z ) − d
∞
(1) et (3) donnent: ∑π
j =0
j Z j = Φ p ( Z ) Θ q ( Z ) −1 (1 − Z ) d et Z < 1
∞ ∞
Xˆ n + h = E (∑ψ jε n + h − j / X 1 ,..., X n , ε1 ,..., ε n ) =
j =0
∑ψ
j =0
j E (ε n + h − j / X 1 ,...X n , ε 1 ,...ε n )
⎧ε n + h − j si h − j ≤ 0
E (ε n + h − j / X 1 , X 2 ,........ X n , ε 1 , ε 2 ,........ε n ) = ⎨
⎩0 si non
∞
Xˆ n + h = ∑ψ j ε n + h − j
j =h
Il existe un écart entre les observations et les prévisions appelé erreur de prévision noté
h −1 h −1
eˆn+ h tel que : var(eˆn + h ) = E ( X n + h − Xˆ n + h ) 2 = E (∑ψ j ε n + h − j ) 2 = σ ε2 ∑ψ 2
j
j =0 j =0
h −1
D’où l’intervalle de prévision : Xˆ n + h = ± 1.96σ ε (∑ψ 2j )1 / 2 si les erreurs sont gaussiennes .
j =0
48
Chapitre 6
Le modèle VAR
Chapitre 6 Le modèle VAR
La forme standard de ce type de modèle est caractérisée par les points suivants :
¾ Les variables à modéliser sont toutes stationnaires.
¾ Les variables à modéliser sont toutes potentiellement endogènes.
¾ Le nombre de décalages associé à chaque variable dans chaque équation est
identique.
L’hypothèse que ∑ est une matrice diagonale est cruciale dans la modélisation VAR et
dans l’utilisation du modèle VAR en simulation (calcul des fonctions de réponse et
décomposition de la variance de l’erreur de prévision).
50
Chapitre 6 Le modèle VAR
La stationnarité du modèle VAR est assurée si les deux racines en B de cette équation
sont de module supérieur à l’unité.
Or, d’après l’équation (1), la meilleure prévision linéaire du vecteur X t qu’il est
possible de réaliser en ( t − 1) est donné par :
,t −1 = E ( Φ1 X t −1 + Φ 2 X t − 2 + … + Φ p X t − p / Inf t −1 )
X tprévu
= Φ1 X t −1 + Φ 2 X t − 2 + … + Φ p X t − p
ε t = X t − X tprévu
,t −1 ( 2)
Soit encore au niveau de chacun des éléments de ε t
51
Chapitre 6 Le modèle VAR
modèles VAR), le vecteur ε t représente la part de X t qui n’était pas prévisible à la date
précédente ( t − 1) . En considérant que l’économie (autrement dit ici le vecteur X t ) subit à
chaque date des chocs aléatoires ou des "innovations" imprévisibles qui font dévier la valeur
que prend effectivement le vecteur X à une date t quelconque, de la valeur de X qui était
prévisible en ( t − 1) pour la date t, on s’aperçoit immédiatement sur l’écriture (2) que les chocs
aléatoires survenant à la date t sont donnée par ε t . On appellera donc ε t le vecteur des
innovations du vecteur X à la date t ou bien encore le vecteur des chocs d’innovations
affectant X à la date t (ou affectant X t plus simplement).
Ces innovations représentent donc les chocs affectant l’économie à chaque date. Nous
verrons par la suite qu’elles seront "considérées" comme des variables exogènes du modèle
VAR et seront utilisées comme telles en simulation.
Exemple: Soit X t = ( xt1 , xt2 , xt3 )′ un processus vectoriel stationnaire centré de dimension
3. Une modélisation VAR(1) de ce vecteur s’écrit :
⎛ xt1 ⎞ ⎛ φ1,1
1 1
φ1,2 1
φ2,3 ⎞ ⎛ xt1−1 ⎞ ⎛ ε t1 ⎞
⎜ 2⎟ ⎜ 1 1 ⎟⎜ 2 ⎟ ⎜ 2 ⎟
⎟ ⎜ xt −1 ⎟ + ⎜ ε t ⎟
1
⎜ xt ⎟ = ⎜ φ2,1 φ2,2 φ2,3
⎜ xt3 ⎟ ⎜ φ3,1
1 1
φ3,2 1 ⎟⎜ 3 ⎟ ⎜ 3 ⎟
φ3,3 ⎠ ⎝ xt −1 ⎠ ⎝ ε t ⎠
⎝ ⎠ ⎝
Considérons par exemple la variable x 2 . La prévision en ( t − 1) de la valeur de xt2 est
donnée par
xt2 − ( xt2 )
prévu
= ε t2
52
Chapitre 6 Le modèle VAR
( X t / X t −1 , X t −2 ,…) ≈ N ( Π′Yt , ∑ )
La densité conditionnelle de l’observation de la période t (pour t quelconque) est alors :
1
n
⎧ 1 ⎫
f ( X t / X t −1 , ) = ( 2π ) ∑ −1 2 exp ⎨− .( X t − Π′Yt )′ .∑ −1.( X t − Π′Yt ) ⎬
−
2
⎩ 2 ⎭
On peut donc en déduire la vraisemblance de l’échantillon :
f ( X1, X 2 , , X − p +1 ) = ∏ f ( X t / X t −1 ,
T
, XT / X 0 , )
t =1
L (θ ) = −
nT
2
T
2
1 T
(
2 t =1 ⎢⎣
)
Log ( 2π ) + Log ∑ −1 − ∑ ⎡( X t − Π′Yt )′ .∑ −1.( X t − Π′Yt ) ⎤
⎥⎦
53
Chapitre 6 Le modèle VAR
ˆ = 1 . εˆ εˆ′
T
∑ ∑tt
T t =1
L’élément ( i, i ) de la matrice ∑
ˆ correspond à la variance estimée de l’innovation de la
1 T
∑ (εˆt′ ) alors que l’élément ( i, j ) de ˆ correspond à la
2
variable x : σˆ i =
i
t la matrice ∑
T t =1
1 T i j′
covariance estimée des innovations des variables xti et xtj : σˆ i j = ∑ εˆt εˆt
T t =1
A partir de ces deux remarques, trois méthodes sont plus particulièrement retenues pour
estimer le nombre de décalages p dans la pratique des modèles VAR :
Une méthode basée sur l’examen des propriétés statistiques des innovations du
modèle VAR
Une méthode basée sur l’utilisation de critères d’information
Une méthode basée sur des tests de nullité emboîtée sur les paramètres associés au
dernier décalage du modèle.
54
Chapitre 6 Le modèle VAR
La valeur du critère d’information peut être calculée pour chaque modèle estimé. Dans
le cas des modèles VAR, la procédure de détermination du nombre de décalages à partir des
critères d’informations consiste donc à estimer un modèle VAR d’ordre minimal (p = 1) et de
calculer la valeur prise par le critère d’information) pour ce modèle, En estimant le modèle
VAR d’ordre immédiatement supérieur (p = 2) et en recalculant la valeur correspondante du
critère d’information, on décide de conserver le décalage p=2 si l’apport informatif du second
décalage est supérieur au coût qu’il occasionne en termes de réduction de degrés de liberté.
Dans le cas où le décalage p=2 est conservé, la procédure est prolongée en estimant le
modèle VAR(3) et en comparant le critère d’information obtenu pour ce modèle avec celui
obtenu pour le modèle précédent VAR(2). Le nombre de décalages est ainsi systématiquement
augmenté tant que l’apport informatif du dernier décalage est supérieur au coût qu’il
occasionne. Lorsqu’un décalage occasionne un coût supérieur au gain informatif, la procédure
s’arrête et le décalage précédent apparaît être le décalage "optimal".
En pratique, il suffit donc de déterminer "à priori" un nombre de décalages maximal pmax
et d’estimer successivement les modèles VAR(p) pour p =1,… , pmax. Pour chaque modèle
estimé, la valeur du critère d’information correspondante est calculée et est notée CRIT(p)
pour p =1,… , pmax .
Le nombre de décalages optimal p̂ est choisi comme celui pour lequel la valeur de
critère d’information est maximale (ou minimale selon la forme du critère retenu) :
pˆ = max ou min CRIT ( P )
p =1,…, pmax p =1,…, pmax
Dans le cadre de la modélisation VAR, parmi les critères qui sont fréquemment
utilisés : le critère du Final Predictor Error (FPE), le critère d’information de Schwartz (SC) et
le critère d’information de Hannan-Quinn (HQ), le critère d’information d’ Akaike(AIC).
55
Chapitre 6 Le modèle VAR
Tous les critères sont basés sur le choix d’un nombre de décalages qui minimise une
expression dans laquelle intervient à la fois le nombre de décalages (p), la taille de
l’échantillon (T), le nombre de variables (n) et le déterminant de la matrice de variance-
covariance des innovations obtenues à partir d’un VAR(p) (noté det ∑ ( p ) dans les formules
relatives à chaque critère). Ce dernier élément est en fait un indicateur de la qualité statistique
du modèle qui décroît lorsque la qualité statistique du modèle s’améliore.
En notant ∑ ( p ) la matrice de variance-covariance du modèle VAR(p), les expressions
correspondant à ces différents critères sont les suivants :
p
⎡ T + np + 1 ⎤
- Critère FPE (Final Predictor Error) : ⎢ ⎥ det ∑ ( p )
⎣ T − np − 1 ⎦
2 pn 2
- Critère AIC (Akaike Information Criterion): log ⎡⎣det ∑ ( p ) ⎤⎦ +
T
log (T )
- Critère SC (Shwartz Criterion) : log ⎡⎣ det ∑ ( p ) ⎤⎦ + pn 2
T
2log ⎡⎣log (T ) ⎤⎦
- Critère HQ (Hannan Quinn) : log ⎡⎣ det ∑ ( p ) ⎤⎦ + pn 2
T
Plusieurs auteurs ont déjà réalisé des évaluations comparatives de ces différents critères
afin d’analyser leur capacités respectives à sélectionner le bon modèle
() ( )
ˆ −1 − 1 εˆ′ ∑
T
nT T
L θˆ = −
2
Log ( 2π ) + Log ∑
2
∑
2 t =1
t
ˆ −1 εˆ
t
1 T nT
∑
2 t =1
εˆt′ ∑ˆ −1εˆt =
2
Les tests du rapport de vraisemblance associé à une hypothèse nulle H 0 donnée sont
bâtis sur le double du rapport des vraisemblance (ou de la différence des Log-vraisemblance)
estimées pour le modèle contraint ( L0 ( θ ) ) et pour le modèle non contraint ( L1 ( θ ) ) . La
statistique de test correspondante dans le cas d’un modèle VAR se réduit donc à :
( ()
RV = 2 L1 θˆ − L 0 θˆ( )) = T {Log ∑ˆ 0
ˆ
− Log ∑ 1 }
56
Chapitre 6 Le modèle VAR
Remarque: dans la pratique, il est fréquent de combiner ces trois méthodes pour
s’assurer que le nombre de décalages retenu est statistiquement adéquat.
57
Chapitre 6 Le modèle VAR
( t − 1) " sur x i . Le fait que ce choc faisant augmenter xti de 1 unité par rapport à la valeur
qu’elle aurait du prendre d’après l’information disponible en ( t − 1) .
Simuler le modèle VAR revient en fait à tracer les effets dynamiques des chocs
d’innovations de chacune des variables (ou de certaines d’entre elles uniquement) sur les
variables du vecteur X (ou sur certaines d’entre elles).
7.4.2. Fonctions de réponse du modèle VAR standard
Le calcul des fonctions de réponse est immédiat dans le cas d’un modèle VAR standard
dont les innovations ne sont pas corrélées instantanément :
( )
Cov ε ti , ε t j = σ i j = 0 ∀ ( i, j ) avec i ≠ j.
Dans ce cas, les innovations ne sont pas instantanément reliées. Il est donc possible de
simuler tour à tour les effets d’un choc sur l’une des innovations sans prendre en
considération les éventuels effets de ce choc sur la variation d’une autre innovation. Dans ce
cas, le calcul des fonctions de réponse est extrêmement simple.
Le calcul des fonctions de réponse d’un modèle VAR passe par le calcul de la forme
Moyenne Mobile Vectorielle (ou forme VMA) du modèle VAR. Cette forme VMA est
obtenue par inversion du polynôme Φ ( B ) .
Soit l’écriture suivante du modèle VAR(p) défini par l’équation (1)
Φ ( B) X t = εt
Sous l’hypothèse que les racines en L du polynôme Φ ( B ) sont hors du cercle unité,
Φ −1 ( B ) existe et est un polynôme en B d’ordre fini : Φ −1 ( B ) = I + Ψ1 B + Ψ 2 B 2 +
Les fonctions de réponse du modèle VAR sont directement obtenues à partir des
matrices Ψ k , k = 1, 2, associées aux innovations décalées. Plus précisément, le calcul des
fonctions de réponses de modèle VAR revient à analyser comment la variation à une date t
quelconque d’une innovation ε i de la variable x i quelconque de X va affecter l’ensemble des
variables ( xt1 , xt2 , , xtn ) pour les dates t , t + 1, t + 2, .
58
Chapitre 6 Le modèle VAR
∂xtj+ k
FRI j ,i , k = pour k = 1, 2,
∂ε ti
Enfin, les effets multiplicateurs totaux des innovations sur les variables du vecteur X
sont donnés par :
k
∂X t + s
∑
s = 0 ∂ε t
= I + Ψ1 +Ψ 2 + = Ψ (1) pour k = 1, 2,
Les fonctions de réponses sont généralement présentées sous la forme d’un tracé
permettant de visualiser simplement les effets instantanées et dynamiques associés aux chocs
d’innovation sur les variables du vecteur X t .
Remarque 1: L’écriture (2) de la forme VMA fait apparaître que les effets instantanés
induits par les chocs d’innovations sur le vecteur X t sont égaux à la matrice identité de taille
(n × n) :
∂X ∂x j ⎧1 pour i = j
= I ⇔ ti = ⎨
∂ε t ∂ε t ⎩0 pour i ≠ j
Tout choc d’innovation unitaire sur une variable i fait donc varier instantanément la
variable x i d’une unité (ce résultat est évident puisque par définition xti = ( xti )
prévu
+ ε ti ) et la
variable x j de 0 unité (pour i ≠ j ).
59
Chapitre 6 Le modèle VAR
( )
Soit Var xti+ k − Et ( xti+ k ) la variance de l’erreur de prévision à k périodes en avant. Il
( )
est possible de calculer la part de Var xti+ k − Et ( xti+ k ) qui est due au jème choc du modèle
VAR (soit ε t j ). Ce calcul correspond à la décomposition de la variance de l’erreur de
prévision du modèle VAR.
60
PARTIE
APPLICATION
Application
Lissage exponentiel
Analyse de la série vente de carburant
JET A1 secteur Aviation National :
La série JAN est tendancielle et présente aussi une composante saisonnière qui
intervient de façon multiplicative, c’est pour cela qu’on a appliqué la technique multiplicative
de Holt & Winters.
¾ Les coefficients de lissage qui minimisent la somme des carrés résiduels et qui sont :
prévision JAN
Janvier 2006 27542.4072
Février 2006 24899.7827
Mars 2006 28238.1796
Avril 2006 27509.2703
Mai 2006 26792.7844
Juin 2006 25909.4509
Juillet 2006 29244.5123
Août 2006 30058.7333
Septembre 2006 28518.1544
Octobre 2006 25881.8044
Novembre2006 27022.0719
décembre2006 28044.4801
63
Analyse de la série vente de carburant
JET A1 secteur Aviation Etrangère :
La série JAE est tendancielle et présente aussi une composante saisonnière qui intervient
de façon multiplicative, c’est pour cela qu’on a appliqué la technique multiplicative de Holt &
Winters.
¾ Les coefficients de lissage qui minimisent la somme des carrés résiduels et qui sont :
Coefficient de lissage de la moyenne noté α= 0.6600.
Coefficient de lissage de la tendance noté β =0.0000
Coefficient de lissage de la saisonnalité noté γ = 0,000
Prévision :
Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006
prévision JAE
Janvier 2006 4249.33902
Février 2006 3637.6644
Mars 2006 4068.42458
Avril 2006 4125.16432
Mai 2006 4226.8494
Juin 2006 3967.68175
Juillet 2006 4696.11771
Août 2006 4294.42568
Septembre 2006 4005.86643
Octobre 2006 4150.11976
Novembre2006 4109.20486
décembre2006 4741.52595
64
Analyse de la série vente de carburant
Fuel-oil secteur Marine Nationale :
La série FN est tendancielle et présente aussi une composante saisonnière qui intervient
de façon multiplicative, c’est pour cela qu’on a appliqué la technique multiplicative de Holt &
Winters .
Parameters: Alpha 0.3500
Beta 0.0000
Gamma 0.0000
Sum of Squared Residuals 1.11E+09
Root Mean Squared Error 2904.533
¾ Les coefficients de lissage qui minimisent la somme des carrés résiduels et qui sont :
Coefficient de lissage de la moyenne noté α= 0.3500
Coefficient de lissage de la tendance noté β =0.0000
Coefficient de lissage de la saisonnalité noté γ = 0,000
Prévision :
Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006
65
Analyse de la série vente de carburant
Fuel-oil secteur Marine Etrangère :
La série FE est tendancielle non saisonnière, c’est pour cela qu’on a appliqué la
technique multiplicative de Holt & Winters .
¾ Les coefficients de lissage qui minimisent la somme des carrés résiduels et qui sont :
Coefficient de lissage de la moyenne noté α= 0.4100
Coefficient de lissage de la tendance noté β =0.0100
Prévision :
Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006
prévision FN
Janvier 2006 552,955261
Février 2006 474,691447
Mars 2006 396,427633
Avril 2006 318,163819
Mai 2006 239,900005
Juin 2006 161,636191
Juillet 2006 183,372377
Août 2006 195,108563
Septembre 2006 173,155251
Octobre 2006 151,419065
Novembre2006 229,682879
décembre2006 307,946694
Remarque importante:nous remarquons que les coefficients γ et β sont nuls pour les
séries JAN,JEA,FE bien que ses dernières aient une composante saisonnière est quelques
une ont dune composante tendancielle de type TS (d'après l'étude de Box et Jenkins
présentée dans le chapitre suivant)
66
Application
Box & Jenkins
Application Box & Jenkins
40000 16000000
35000 14000000
30000 12000000
25000 10000000
20000 JAN 8000000 JAN
15000 6000000
10000 4000000
5000 2000000
0 0
1 3 5 7 9 11 1 3 5 7 9 11
68
Application Box & Jenkins
D’après les deux graphes précédents, on remarque que la moyenne et la variance varient
au cours du temps. On peut donc dire que cette série semble non stationnaire..
Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des
corrélogrammes simple et partiel de la série brute.
Corrélogramme de la série brute JAN :
Nous remarquons dans le corrélogramme simple que presque tous les pics sont
pratiquement à l’extérieure de l’intervalle de confiance, le corrélogramme partiel est marqué
aussi par la présence des pics sortant au retard 1,3,4,9,12 et 13
.
D’où la série brute est donc générée par un processus non stationnaire .
69
Application Box & Jenkins
Test de FISHER:
Pour détecter la saisonnalité de la série on a fait appel à l’analyse de la variance
(ANOVA) à deux facteurs sans répétition.
Afin de traiter l’effet de saisonnalité sur notre série ou encore la stationnariser, nous lui
avons appliqué la différence saisonnière d’ordre 12.
Notation : Nous notons la série JAN désaisonnalisé par DJAN.
70
Application Box & Jenkins
On procède à l’estimation par la méthode des moindres carrées avec d=1 des trois
modèles [4],[5] et [6] de Dickey-Fuller sur la série DJAN(car les résidus forment un bruit
blanc).
Remarque
On choisit le retard d=1 qui minimise le critères d’informations d’Akaike et Schwarz
Etape (1) :
Model 4 : Test sur la tendance :
d
ΔX t = φ X t −1 + c + β t + ∑ φ j ΔX t − j + ε t .
j =1
71
Application Box & Jenkins
Nous testons alors la présence d’une tendance dans le processus en testant la nullité du
coefficient de la tendance β . Le résultat est donné dans le tableau suivant:
Etape (2) :
Model 5 : Test sur la constante
d
ΔX t = φ X t −1 + c + ∑ φ j ΔX t − j + ε t .
j =1
72
Application Box & Jenkins
On remarque que la t-statistique de la constante (c) = 0.209 est inférieure aux valeurs
critiques 3.78 et 3.11 et 2.73 (données par la table de Dickey- Fuller) pour les seuils 1% et
5% et 10% On le confirme par prob = 0.8342 supérieure à 0.05. Donc la constante n’est pas
significativement différente de zéro, on passe alors à l’étape (3)
Etape (3) :
Model 6: Test de la racine unitaire :
Nous testons alors la présence d’une racine unitaire dans le processus en testant la
nullité du paramètre Φ à l’aide d’une statistique de Student t Φ̂ , où Φ̂ désigne l’estimateur des
moindres carrés ordinaires (MCO). Le résultat de l’affichage pour la série DJAN est donné
dans le tableau suivant.
La statistique de Student t Φ̂ = - 2.77 est inférieure aux valeurs critiques -2.584, -1.943 et -1.614
(données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10% d’où la série ne possède pas de
racine unitaire (on rejette l’hypothèse nulle “φ = 0 “). La série DJAN est donc stationnaire. Il convient à
présent d’estimer le modèle susceptible de la représenter, en observant les corrélogrammes simple et
partiel de la série stationnaire DJAN, nous remarquons que la fonction d’autocorrélation simple (AC)
possède des valeurs importantes aux retards q=1,2,3,..,11, et que la fonction d’autocorrélation partielle
(PAC) possède des valeurs importantes aux retards p=1, 2 ,12, par conséquent nous avons plusieurs
modèles candidats parmi lesquels nous avons sélectionné le modèle :
SARIMA (1.0.1)(0.1.1).
Estimation des paramètres de model :
73
Application Box & Jenkins
Nous remarquons que tous les paramètres du modèle sont significativement différents de zéro.
En effet les rapports des coefficients du modèle sont en valeurs absolues supérieures à 1.96, ce qui est
confirmé par la probabilité de nullité des coefficients qui sont tous inférieures à 0.05.
74
Application Box & Jenkins
L’analyse du corrélogramme des résidus, montre que tous les termes sont à l’intérieur
de l’intervalle de confiance (illustré par des pointillés sur le graphique). Ce qui nous entraîne
à dire que les résidus forment un bruit blanc.
75
Application Box & Jenkins
Test de Normalité :
Les tests sont effectués à partir des valeurs empiriques des coefficients de Skewness,
Kurtosis et la statistique de Jarque-Bera, nous avons l’histogramme suivant:
β11 2 − 0 β2 − 3
Test de Skewness : γ 1 = Test de Kurtosis : γ 2 =
6 24
N N
μ3
où : β 11 2 = : est le coefficient de Skewness (l’indicateur d’asymétrie des résidus)
μ 23 2
μ4
β2 = : est le coefficient de Kurtosis (le degré d’aplatissement de la loi des
μ 22
résidus).
Sous l’hypothèse H 0 et si le nombre d’observations est assez grand (N >30), nous
avons :
μ ℘ ⎛ 6 ⎞
β 11 2 = 332 → N ⎜⎜ 0, ⎟ (1)
μ2 N →∞ ⎝ N ⎟⎠
76
Application Box & Jenkins
μ4 ℘ ⎛ 24 ⎞
β2 = → N ⎜
⎜ 0, ⎟
⎟ (2)
μ 22N →∞ ⎝ N ⎠
Après calculs nous avons obtenu :
β1/1 2 + 0 0.306326 + 0
Test de skewness : γ1 = = = 1.364 ≺ 1.96
6 6
N 119
β2 − 3 4.751797 − 3
Test de Kurtosis : γ2 = = = 3,900 1.96
24 24
N 119
Test de Jarque et Bera :
β 1 + (β 2 − 3)2
N N
Nous définissons la statistique S par : S =
6 24
Sous (1) et (2) : S → χ 12−α (2)
Nous testons H 0 : « accepter la normalité des résidus au seuil α =0,05 » contre
H 1 : « il n’ y a pas de normalité des résidus ».
Si S > χ 12−α (2) nous rejetons l’hypothèse H 0 sinon nous l’acceptons
La statistique de Jarque – Bera=14.11086 elle est supérieure à χ 2 (2) = 5,99.
D’après les tests précédents, nous concluons que les résidus forment un bruit blanc non gaussien.
L’analyse du corrélogramme des résidus carrés, montre que tous les termes sont à
l’intérieur de l’intervalle de confiance, ce qui nous entraîne à dire que pas d’effet ARCH.
Conclusion :
Nous pouvons conclure d’après ces tests que le modèle qui ajuste le mieux la série est :
SARIMA (1.0.1)(0.1.1) qui s’écrit sous la forme suivante :
(1 − 0.945162B )(1 − B 12 )JAN t = (1 + 0.433123B ) *(1 + 0.451035B 12 )ε t
77
Application Box & Jenkins
Prévision :
Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006
Diagramme séquentiel de la série brute JAN et des prévisions
prévision JAN
Janvier 2006 27611,1864
Février 2006 26032,2365
Mars 2006 25764,223
Avril 2006 26484,7609
Mai 2006 25626,018
Juin 2006 25343,9037
Juillet 2006 28430,7901
Août 2006 29926,5701
Septembre
2006 28368,3942
Octobre 2006 26835,2154
Novembre200
6 29177,2587
décembre2006 28070,493
78
Application Box & Jenkins
Les données de la série des ventes de carburant jet A1 (notée : JAE ) sur une période de
dix ans, les observations sont mensuelles ; de janvier 1995 à décembre 2005.L'unité de
mesure est en milliers de tonnes.
4500 600000
4000
500000
3500
3000 400000
2500
moyenne 300000 var iance
2000
1500 200000
1000
100000
500
0 0
1 3 5 7 9 11 1 2 3 4 5 6 7 8 9 1 11
79
Application Box & Jenkins
D’après les deux graphes précédents, on remarque que la moyenne et la variance varient
au cours du temps. On peut donc dire que cette série semble non stationnaire..
Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des
corrélogrammes simple et partiel de la série brute
Nous remarquons dans le corrélogramme simple que presque tous les pics sont
pratiquement à l’extérieure de l’intervalle de confiance, le corrélogramme partiel est marqué
aussi par la présence d’un seul pic sortant au1er retard d’où la série brute est donc générée par
un processus non stationnaire .
Valeur
Source des Somme des
Degré de liberté Moyenne des carrés F Probabilité critique pour
variations carrés
F
Lignes 5520713.11 11 501883.01 3.36400777 0.00049586 1.87673166
Colonnes 109984312.00 10 10998431.20 73.7199847 4.5556E-44 1.91782590
Erreur 16411118.80 110 149191.98
Total 131916143.00 131
80
Application Box & Jenkins
Afin de traiter l’effet de saisonnalité sur notre série ou encore la stationnariser nous lui
Avons appliqué la différence saisonnière d’ordre 12.
Notation : Nous notons la série JAE désaisonnalisé par DJAE
Graphe de la série DJAE :
81
Application Box & Jenkins
On remarque que la t- statistique de la tendance =3.149 est inférieure à 3.53 pour le seuil
1% mais supérieur aux valeurs 2.79 et 2.73 au seuils 5% et 10% (données par la table de
Dickey- Fuller) .On le confirme ça par prob = 0.0018 est inférieure 0.05. La tendance n’est
pas significativement différente de zéro.
82
Application Box & Jenkins
Tableau (1)
La série JAE après désaisonnalisation peut être ajustée par une fonction cubique
AJU t = DJAEt - yt .
DAJE
2000
1000
Observé
-1000 Cubique
0 20 40 60 80 100 120 140
Séquence
83
Application Box & Jenkins
Pour vérifier si la série ajustée AJU t ne nécessite pas une différenciation (ne possède pas
de racine unitaire), nous appliquons une deuxième fois le teste de Dickey-Fuller (mais cette
fois sur la série ajustée AJU t) les résultats sont tels que:
Etape (1) :
Model 4 : Test sur la tendance :
d
ΔX t = φX t −1 + c + β t + ∑ φ j ΔX t−j + εt .
j =1
84
Application Box & Jenkins
Nous testons alors la présence d’une tendance dans le processus en testant la nullité du
coefficient de la tendance β . Le résultat de l’affichage pour la série AJU t est donné dans le
tableau suivant:
On remarque que la t-statistique de la constante (c) = 0.000922 est inférieure aux valeurs
critiques 3.22 et 2.54 et 2.17 (données par la table de Dickey- Fuller) pour les seuils 1% ,
5% et 10% On le confirme par prob = 0.9993 supérieure à 0.05. Donc la constante n’est pas
significativement différente de zéro, on passe alors à l’étape (3)
Etape (3) :
Model 6: Test de la racine unitaire :
d
ΔX t = φX t −1 + ∑ φ j ΔX t− j + εt .
j =1
85
Application Box & Jenkins
Nous testons alors la présence d’une racine unitaire dans le processus en testant la nullité du
paramètre Φ à l’aide d’une statistique de Student t Φ̂ , où Φ̂ désigne l’estimateur des moindres carrés
ordinaires (MCO). Le résultat de l’affichage pour la série AJU t est donné dans le tableau suivant.
La statistique de Student t Φ̂ = - 7.858 est inférieure aux valeurs critiques -2.584, -1.943 et
-1.614 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10% d’où la série
ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ φ = 0 “). La série AJU t est
donc stationnaire. Il convient à présent d’estimer le modèle susceptible de la représenter, en
observant les corrélogrammes simple et partiel de la série stationnaire AJU t, nous
remarquons que la fonction d’autocorrélation simple (AC) possède des valeurs importantes
aux retards q=1,12,… , et que la fonction d’autocorrélation partielle (PAC) possède des
valeurs importantes aux retards p=1, 2 ,12,… par conséquent nous avons plusieurs modèles
candidats parmi lesquels nous avons sélectionné le modèle :
Sarima (1.1.0)(1.1.1)
Estimation des paramètres de model :
Nous remarquons que tous les paramètres du modèle sont significativement différents de zéro.
En effet les rapports des coefficients du modèle sont en valeurs absolues supérieures à 1.96, ce qui est
confirmé par la probabilité de nullité des coefficients qui sont tous inférieures à 0.05.
86
Application Box & Jenkins
87
Application Box & Jenkins
L’analyse du corrélogramme des résidus, montre que tous les termes sont à l’intérieur de
l’intervalle de confiance (illustré par des pointillés sur le graphique). Ce qui nous entraîne à
dire que les résidus forment un bruit blanc.
Test de point de retournement :
H 0 : « Les ε i forment un bruit blanc » contre
H 1 : « Les ε i ne forment pas un bruit blanc tel que : i = 1, n »
Après les calculs à l’aide du logiciel MATLAB nous avons obtenu les résultats suivants
Nombre de points de retournements p = 75
Espérance de la stat du test E (p) = 70
Variance de la statistique du test VAR(p) = 19
La statistique du teste est T= 1.2
T = 1.2 est inférieure à 1.96 (tabulée) d’où on accepte l’hypothèse H 0 : « Les ε i
forment un bruit blanc » au seuil de 0,05
88
Application Box & Jenkins
β11 2 − 0 β2 − 3
Test de Skewness : γ 1 = Test de Kurtosis : γ 2 =
6 24
N N
μ3
où : β 11 2 = : est le coefficient de Skewness (l’indicateur d’asymétrie des résidus)
μ 23 2
μ4
β2 = : est le coefficient de Kurtosis (le degré d’aplatissement de la loi des résidus).
μ 22
Sous l’hypothèse H 0 et si le nombre d’observations est assez grand (N >30), nous avons :
μ3 ⎛℘
6 ⎞
β 11 2 = →
N ⎜⎜ 0, ⎟
⎟ (1)
μ 23 2
N →∞ ⎝ N ⎠
μ ℘ ⎛ 24 ⎞
β 2 = 42 → N ⎜⎜ 0, ⎟
⎟ (2)
μ 2 N →∞ ⎝ N ⎠
Après calculs nous avons obtenu :
89
Application Box & Jenkins
β1/1 2 + 0 0.019704 + 0
Test de skewness : γ1 = = = 0.0835<1.96. Donc :
6 6
N 108
On accepte l’hypothèse nulle H 0 (aplatissement Normal)
β2 − 3 2.448338 − 3
Test de Kurtosis : γ 2 = = = 1,170 ≺ 1.96. Donc :
24 24
N 108
On accepte l’hypothèse nulle H 0 (asymétrie)
Nous acceptons l’hypothèse de normalité en ce qui concerne la symétrie et l’aplatissement
de la distribution ( γ 1 et γ 2 sont inférieurs à 1,96), Ce qui est confirmé par la statistique de
Jarque et Bera.
Test de Jarque et Bera :
La statistique de Jarque et Bera noté (S) est égale à 1.376 ; elle est inférieure à la valeur
χ 02,95 (2) = 5,99 d’où les résidus sont gaussiens.
90
Application Box & Jenkins
L’analyse du corrélogramme des résidus carrés, montre que tous les termes sont à
l’intérieur de l’intervalle de confiance, ce qui nous entraîne à dire que pas d’effet ARCH.
Conclusion :
Nous pouvons conclure d’après ces tests que le modèle qui ajuste le mieux la série est :
Sarima (1.1.0)(1.1.1)qui s’écrit sous la forme suivante :
(1 − 0.395849 B)(1 − 0.329961B12 ) (1 − B)(1 − B12 ) JAEt = (1 + 0.891910 B12 )ξt .
Prévision :
Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006
91
Application Box & Jenkins
prévision JAE
Janvier 2006 4124.58408
Février 2006 4132.7257
Mars 2006 4570.19352
Avril 2006 4394.5555
Mai 2006 4566.20834
Juin 2006 4829.54963
Juillet 2006 5752.69921
Août 2006 5815.18974
Septembre 2006 5780.73036
Octobre 2006 5440.57075
Novembre2006 5456.10994
décembre2006 5383.597
Plusieurs étapes préliminaires sont nécessaires avant d’effectuer des tests spécifiques sur
une série chronologique et de chercher à la modéliser, il convient d’étudier quelques
caractéristiques stochastiques en particulier sa moyenne et sa variance.
Notation : Nous notons la série vente de carburant Fuel-oil secteur National FN.
Identification
Les données de la série des ventes de carburant Fuel-oil (notée : FN) sur une période de
dix ans, les observations sont mensuelles ; de janvier 1995 à décembre 2005. L'unité de
mesure est le millier de tonnes.
Diagramme séquentiel de la série brute FN :
Cette série exhibe une faible tendance avec des fluctuations plus aux moins régulières
Graphe de la moyenne et la variance de la série brute FN :
moyenne variance
30000
120000000
25000
100000000
20000 80000000
10000 40000000
5000
20000000
0
0
1 2 3 4 5 6 7 8 9 1 11 1 3 5 7 9 11
D’après les deux graphes précédents, on remarque que la moyenne et la variance varient
au cours du temps. On peut donc dire que cette série semble non stationnaire.
93
Application Box & Jenkins
Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des
corrélogrammes simple et partiel de la série brute.
D'après le corrélogramme simple de la série on remarque que les pics aux retards 1,…,9sont à
l'extérieur de la bande de confiance et les autocorrélations prennent une allure décroissante.
Le corrélogramme partiel est marqué par des pics significatif au retard 1et 2 .
Alors d’après l’analyse graphique on peut dire que la série FN semble non stationnaire
Test de FISHER:
Pour détecter la saisonnalité de la série on a fait appel à l’analyse de la variance
(ANOVA) à deux facteurs sans répétition.
Table de l’ANOVA (à 2 facteurs) données par logiciel SPSS :
Valeur
Source des Somme des Degré de Moyenne des
F Probabilité critique pour
variations carrés liberté carrés
F
Lignes 280910554 11 25537323.1 2.75775868 0.00340777 1.87673166
Colonnes 1958479112 10 195847911 21.1494868 2.1327E-21 1.9178259
Erreur 1018619056 110 9260173.23
Total 3258008722 131
Test d’influence de facteur ligne (mois) :
Fstat= 2.7577 > Fthéo= 1.8767 donc (on rejette l’hypothèse nulle) la série est affectée d’une
saisonnalité
Test d’influence de facteur colonne (années) :
Fstat= 21.1494 > Fthéo= 1.9178 donc (on rejette l’hypothèse nulle) la série est peut être
affectée d’une tendance.
94
Application Box & Jenkins
Afin de traiter l’effet de saisonnalité sur notre série ou encore la stationnariser, nous lui
avons appliqué la différence saisonnière d’ordre 12.
En observant le graphe de la série DFN sa moyenne est presque satable au cours du temps il semble
que la série soit stationnaire en moyenne, ainsi Nous remarquons que la fonction d’autocorrélation
simple de la série DFN diminue rapidement, nous pouvons donc dire que cette série semble stationnaire.
Pour confirmer ou infirmer cette hypothèse nous appliquons le test de Dickey-Fuller Augmenter qui
nécessite tout d’abord de sélectionner le nombre de retard p qui minimise le critère d’Akaike.
95
Application Box & Jenkins
On procède à l’estimation par la méthode des moindres carrées avec d=1 des trois modèles
[4],[5] et [6] de Dickey-Fuller sur la série DFN.
Remarque
On choisit le retard d=1 qui minimise le critères d’informations d’Akaike et de Schwarz
Etape (1) :
Modèle 4 : Test sur la tendance :
d
ΔX t = φ X t −1 + c + β t + ∑ φ j ΔX t − j + ε t . Avec ε t est un processus stationnaire
j =1
Nous testons alors la présence d’une tendance dans le processus en testant la nullité du
coefficient de la tendance β . Le résultat est donné dans le tableau suivant:
La série FN après désaisonnalisation peut être ajustée par une forme cubique
96
Application Box & Jenkins
DFN
20000
10000
Observé
-10000 Cubique
0 20 40 60 80 100 120 140
Séquence
Nous devons rétablir le Test de Dickey-Fuller sur la série DFN ajustée c'est-à-dire AD t :
Etape (3) :
Modèle 6: Test de la racine unitaire :
d
ΔX t = φ X t −1 + ∑ φ j ΔX t − j + ε t . Avec ε t est un processus stationnaire.
j =1
Nous testons alors la présence d’une racine unitaire dans le processus en testant la nullité
du paramètre Φ à l’aide d’une statistique de Student t Φ̂ , où Φ̂ désigne l’estimateur des
moindres carrés ordinaires (MCO). Le résultat de l’affichage pour la série AD t est donné dans
le tableau suivant:
97
Application Box & Jenkins
La statistique de Student t Φ̂ = - 5.0515 est inférieure aux valeurs critiques -2.584, -1.943 et -1.614
(données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10% d’où la série ne possède pas
de racine unitaire (on rejette l’hypothèse nulle “ φ = 0 “). La série AD t est donc stationnaire.
Il convient à présent d’estimer le modèle susceptible de la représenter.
Corrélogramme de la série AD t :
Nous remarquons que tous les paramètres du modèle sont significativement différents de zéro.
En effet les rapports des coefficients du modèle sont en valeurs absolues supérieures à 1.96, ce
qui est confirmé par la probabilité de nullité des coefficients qui sont tous inférieures à 0.05.
99
Application Box & Jenkins
L’analyse du corrélogramme des résidus, montre que tous les termes sont à l’intérieur de
l’intervalle de confiance (illustré par des pointillés sur le graphique). Ce qui nous entraîne à
dire que les résidus forment un bruit blanc.
100
Application Box & Jenkins
Test de Normalité :
Les tests sont effectués à partir des valeurs empiriques des coefficients de Skewness,
Kurtosis et la statistique de Jarque-Bera, nous avons l’histogramme suivant:
β11 2 − 0 β2 − 3
Test de Skewness : γ 1 = Test de Kurtosis : γ 2 =
6 24
N N
μ3
où : β 11 2 = : est le coefficient de Skewness (l’indicateur d’asymétrie des résidus)
μ 23 2
μ
β 2 = 42 : est le coefficient de Kurtosis (le degré d’aplatissement de la loi des
μ2
résidus).
Sous l’hypothèse H 0 et si le nombre d’observations est assez grand (N >30), nous avons :
μ3 ℘ ⎛ 6 ⎞
β 11 2 = → N ⎜⎜ 0, ⎟
⎟ (1)
μ 23 2 N →∞ ⎝ N ⎠
μ4 ℘ ⎛ 24 ⎞
β2 = → N ⎜⎜ 0, ⎟
⎟ (2)
μ 22 N →∞ ⎝ N ⎠
101
Application Box & Jenkins
Prévision :
Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006
prévision FN
Janvier 2006 26422,3403
Février 2006 25159,6582
Mars 2006 28103,5815
Avril 2006 28918,9406
Mai 2006 29677,0913
Juin 2006 30241,7849
Juillet 2006 33999,8893
Août 2006 33501,7876
Septembre 2006 32960,7763
Octobre 2006 33918,9098
Novembre2006 29451,4462
décembre2006 32445,0728
102
Application Box & Jenkins
Notation : Nous notons la série vente de carburant jet A1 secteur aviation étrangère FE.
Identification
Les données de la série des ventes de carburant fuol-oil etranger (notée : FE ) sur une
période de dix ans, les observations sont mensuelles ; de janvier 1995 à décembre
2005.L'unité de mesure est en milliers de tonnes.
moyenne variance
6000 12000000
5000 10000000
4000 8000000
2000 4000000
1000 2000000
0 0
1 2 3 4 5 6 7 8 9 10 11 1 3 5 7 9 11
103
Application Box & Jenkins
D’après les deux graphes précédents, on remarque que la moyenne et la variance varient
au cours du temps. On peut donc dire que cette série semble non stationnaire..
Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des
corrélogrammes simple et partiel de la série brute
D'après le corrélogramme simple de la série on remarque que les pics aux retards
1,…,7,10,..,13 sont à l'extérieur de la bande de confiance et les autocorrélations prennent une
allure décroissante. Le corrélogramme partiel est marqué par des pics significatif au retard
1,2,5,9,11et 19.
En effet, la fonction d’autocorrélation simple estimée (colonne AC) ne décroît pas de
manière rapide vers zéro .
104
Application Box & Jenkins
Valeur
Source des Somme des Degré de Moyenne des Probabil critique pour
variations carrés liberté carrés F ité F
0,21320
Lignes 38868993.4 4 3533544.85 1.33826868 372 1,87673166
1,1668E
Colonnes 261316593 10 261316593 9.89691168 -11 1,9178259
Erreur 290442374 110 2640385.22
Total 590627961 131
En observant le graphe ainsi que le corrélogramme de la série FE, nous remarquons que la
série semble non stationnaire .Un recours au test de racine unitaire permet d’affirmer ou
d’infirmer la stationnarité de la série en question.
on procède à l’estimation par la méthode des moindres carrées avec d=1 des trois modèles
[4],[5] et [6] de Dickey-Fuller sur la série FE (car les résidus forment un bruit blanc
Remarque
On choisit le retard d=1 qui minimise le critères d’informations d’Akaike et Schwarz
105
Application Box & Jenkins
Etape (1) :
Modèle 4 : Test sur la tendance :
d
ΔX t = φ X t −1 + c + β t + ∑ φ j ΔX t − j + ε t .
j =1
106
Application Box & Jenkins
Notation : Nous notons la série ajustée par AJU t elle est donnée par la formule :
AJU t = FEt - yt .
107
Application Box & Jenkins
Etape (1) :
Modèle 4 : Test sur la tendance :
d
ΔX t = φ X t −1 + c + β t + ∑ φ j ΔX t − j + ε t .
j =1
Etape (2) :
Modèle 5 : Test sur la constante
108
Application Box & Jenkins
On remarque que la t-statistique de la constante (c) = 0.125585 est inférieure aux valeurs
critiques 3.22 et 2.54 et 2.17 (données par la table de Dickey- Fuller) pour les seuils 1% ,
5% et 10% On le confirme par prob = 0.9003 supérieure à 0.05. Donc la constante n’est pas
significativement différente de zéro, on passe alors à l’étape (3)
Etape (3) :
Modèle 6: Test de la racine unitaire :
d
ΔX t = φ X t −1 + ∑ φ j ΔX t − j + ε t . Avec ε t est un processus stationnaire.
j =1
Nous testons alors la présence d’une racine unitaire dans le processus en testant la nullité du
paramètre Φ à l’aide d’une statistique de Student t Φ̂ , où Φ̂ désigne l’estimateur des moindres carrés
ordinaires (MCO). Le résultat de l’affichage pour la série AJU t est donné dans le tableau suivant.
109
Application Box & Jenkins
Nous remarquons que tous les paramètres du modèle sont significativement différents de zéro.
En effet les rapports des coefficients du modèle sont en valeurs absolues supérieures à 1.96, ce qui
est confirmé par la probabilité de nullité des coefficients qui sont tous inférieures à 0.05.
Tests sur les résidus :
110
Application Box & Jenkins
L’analyse du corrélogramme des résidus, montre que tous les termes sont à l’intérieur de
l’intervalle de confiance (illustré par des pointillés sur le graphique). Ce qui nous entraîne à
dire que les résidus forment un bruit blanc.
111
Application Box & Jenkins
Test de Normalité :
Les tests sont effectués à partir des valeurs empiriques des coefficients de Skewness,
Kurtosis et la statistique de Jarque-Bera, nous avons l’histogramme suivant:
6 24
N N
μ3
où : β 11 2 = : est le coefficient de Skewness (l’indicateur d’asymétrie des résidus)
μ 23 2
μ
β 2 = 42 : est le coefficient de Kurtosis (le degré d’aplatissement de la loi des résidus).
μ2
Sous l’hypothèse H 0 et si le nombre d’observations est assez grand (N >30), nous avons :
μ3 ℘ ⎛ 6 ⎞
β 11 2 = → N ⎜⎜ 0, ⎟ (1)
μ 23 2 N →∞ ⎝ N ⎟⎠
μ4 ℘ ⎛ 24 ⎞
β2 = → N ⎜⎜ 0, ⎟ (2)
μ 22 N →∞ ⎝ N ⎟⎠
112
Application Box & Jenkins
Conclusion :
Nous pouvons conclure d’après ces tests que le modèle qui ajuste le mieux la série est :
ARIMA (3.1.3) qui s’écrit sous la forme suivante :
(1 − 0.236236B 2 − 0.326708B 10 − 0.177887 B 3 )(1 − B )FE t =
(1 − 0.23255B + 0.430185B 10 + 0.36597 B 15 )ε t
Prévision :
Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006
Diagramme séquentiel de la série brute JAE et des prévisions
prévision JAE
Janvier 2006 4124.58408
Février 2006 4132.7257
Mars 2006 4570.19352
Avril 2006 4394.5555
Mai 2006 4566.20834
Juin 2006 4829.54963
Juillet 2006 5752.69921
Août 2006 5815.18974
Septembre 2006 5780.73036
Octobre 2006 5440.57075
Novembre2006 5456.10994
décembre2006 5383.597
113
Application
ARFIMA
Application ARFIMA
FE FN
114
Application ARFIMA
Estimation de d :
Pour la détermination de l’ordre d’intégration fractionnaire d, on a utilisé la méthode
d’estimation en deux étapes (analyse R/S) basée sur l’exposant de HURST. Pour cela, on a
élaboré un programme informatique.
Résultats du test :
Pour la série JAN : d= 0.0398.
Pour la série JAE: d= 0.0541.
Pour la série FE : d= 0.2396.
Pour la série FN : d=0.0452.
Les résultats du test confirment l’existence d’une mémoire longue pour la série FE et
son absence pour les autres séries.
Etude de la série FE :
Estimation et modélisation de la série FE :
Modèle AIC -2LOG(likelihood)
ARFIMA (2, 0.2396,2) 0.235790 E +04 0.234790 E +04
ARFIMA (2, 0.2396, 4) 0.236115 E +04 0.234715 E +04
ARMA Model:
(1-B)^.2396 X(t)
= .0000 X(t-1) + .1000 X(t-2)
+ Z(t) + .0000 Z(t-1) + .0000 Z(t-2)
115
Application ARFIMA
Test de Box-Lung
Le Corrélogramme des résidus du modèle montre que les résidus semblent former un
bruit blanc puisque tous les termes ne sont pas significativement différents de zéro. Nous
remarquons aussi que la statistique de Box-Ljung est inférieure à la valeur théorique au seuil
5%
Test de normalité :
116
Application ARFIMA
6 6 113
n
On accepte l’hypothèse nulle H 0 (aplatissement Normal)
b2 − 3 5.793996 − 3
- Test de kurtoisis : g 2 = = = 5.26>1.96 donc :
24 24 111
n
On rejette l’hypothèse nulle H 0 (asymétrie)
Alors : les résidus ne sont pas gaussiens. Ce qui est confirmé par le test de Jarque-Bera
- La statistique de Jraque Bera=29.64>5.911.Donc : on rejette l’hypothèse nulle H 0 (normalité)
Conclusion : D’après les tests précédent on conclut que les résidus forme un bruit blanc non
gaussien.
Prévision :
Année et mois Prévision
janv-05 873,6863
févr-05 751,9604
mars-05 666,4125
avr-05 562,8928
mai-05 459,5315
juin-05 350,8888
juil-05 238,5849
août-05 122,21
sept-05 1,5543
oct-05 288,098
nov-05 107,0413
déc-05 -387,0356
Remarques :
9 Les quantités de carburants sont en milliers de tonnes.
9 La dernière prévision c'est à dire celle de mois de décembre 2005 est négative ce qui
nous pousse a dire plus que l'horizon de prévision s'élargit plus la modélisation
ARFIMA(dans notre cas) ne donne pas des bonne prévisions.
117
Application
VAR
Application VAR
Les processus ( Yit i = 1,4) étant stationnaires, il est possible de modéliser la série
Notation:
Jae: Carburant JET A1 secteur aviation région étrangère
Jan: Carburant JET A1 secteur aviation région nationale
Fe : Carburant fuel-oil secteur marine région étrangère
Fn: Carburant fuel-oil secteur marine région nationale
Les séries stationnaires sont représentées par les graphes suivants:
119
Application VAR
Estimation du VAR:
La première étape consiste à déterminer l’ordre p du processus VAR à retenir, à cette fin
nous avons estimé pour commencer divers processus VAR pour des ordres de retards p allant
de 1 à 12, nous devons donc retenir celui dont les critères de Akaike (AIC) et de Schwarz
(SC) sont les plus petits.
Nous estimons divers modèles VAR pour p=1 à 12 après plusieurs essais nous avons
retenu un retard p=12. Les critères d'information d'AKAIKE (AIC) de SCHWARZ (SC) et de
Hannan-Quinn sont donnés par:
avec
AIC= 70.189
SC=74.957
120
Application VAR
Mais lorsque nous avons estimé les paramètres du modèle VAR(12) avec constante nous
avons remarqué que la t-statistique de la constante est inférieure à 1,96 ; donc la constante
n'est pas significative.
12
Yt = A0 + ∑ ApYt − p + ε t
p =1
⎡ y1t ⎤ ⎡a1 ⎤
0 ⎡a11p a12p a13p a14p ⎤ ⎡ y1t − p ⎤ ⎡ε1t ⎤
⎢ y ⎥ ⎢a 0 ⎥ 12 ⎢ 1 2 3 4
⎥ ⎢ ⎥ ⎢ ⎥
⎢ 2⎥ ⎢ a2 p a2 p a2 p a2 p ⎥ ⎢ y2t − p ⎥ ⎢ε 2t ⎥
Yt = ⎢ ⎥ = ⎢ 0 ⎥ + ∑
2t
⎢ y3t ⎥ a3 ⎢ 1 2 3 4 ⎥ ⎢ y ⎥ + ⎢ε ⎥
⎢ ⎥ ⎢ 0⎥
p =1 ⎢a3 p a3 p a3 p a3 p ⎥ ⎢ 3t − p ⎥ ⎢ 3t ⎥
⎣ y4t ⎦ ⎢⎣a4 ⎥⎦ ⎢ 1 2 3 4 ⎥ ⎢⎣ y4t − p ⎥⎦ ⎣ε 4t ⎦
⎣⎢a4 p a4 p a4 p a4 p ⎦⎥
⎡a10 ⎤
⎢ 0⎥
⎢a ⎥
Où A 0 = ⎢ 20 ⎥ représente l’estimation de la constante et les A p (p =1,...,12) sont des
⎢a3 ⎥
⎢⎣a40 ⎥⎦
matrices carrés d’ordre 4 tel que A p les aijp (i,j =1,4) représentent les coefficients
estimés; ε 1t et ε 2 t et ε 3t et ε 4t sont des bruits blancs.
Tableau :
121
Application VAR
122
Application VAR
123
Application VAR
La première colonne donne les résultats d'estimation de la première équation (variable fe)
La deuxième colonne donne les résultats d'estimation de la deuxième équation (variable fn)
La troisième colonne donne les résultats d'estimation de la troisième équation (variable
jae)
La quatrième colonne donne les résultats d'estimation de la quatrième équation (variable
jan) donc le VAR estimé s'écrit sous la forme:
FE = 0.5138865666*FE(-1) + 0.08851646244*FE(-3) - 0.1858916363*FE(-4) + 0.2129399812*FE(-5) -
0.06753771936*FE(-6) + 0.1100312394*FE(-7) - 0.1354494342*FE(-10) + 0.1950868599*FE(-
11) - 0.05601552414*FE(-12) - 0.05207190108*FN(-1) + 0.1542121815*FN(-3) -
0.1297690979*FN(-4) + 0.01309840894*FN(-5) - 0.01016582916*FN(-6) + 0.02924002657*FN(-
7) + 0.00940125585*FN(-10) - 0.05809671716*FN(-11) + 0.06204082923*FN(-12) -
0.2885535862*JAE(-1) + 0.7425845812*JAE(-3) - 0.9350288096*JAE(-4) + 0.72221153*JAE(-5)
- 0.04131481402*JAE(-6) + 0.4142686105*JAE(-7) + 0.01165554772*JAE(-10) +
0.05390104945*JAE(-11) + 0.205440153*JAE(-12) - 0.02943791762*JAN(-1) -
0.09559081329*JAN(-3) + 0.1748064848*JAN(-4) - 0.03260088414*JAN(-5) -
0.1222785296*JAN(-6) + 0.124394713*JAN(-7) - 0.158152241*JAN(-10) +
0.07565053515*JAN(-11) + 0.01620620952*JAN(-12)
124
Application VAR
Les inverses des racines des polynômes autorégressifs (donnés par l’Eviews) des quatre
séries sont inférieure en module à 1
L’inverse des racines associées à la partie AR appartient au disque unité. Le VAR est
stationnaire.
Tests sur les paramètres :
La significativité des coefficients du modèle VAR(12) est confirmée par le test de Student En
tenant compte du tableau des estimations (Tableau) et le fait qu’un coefficient est significativement
différent de zéro au seuil 5%, si la t-statistique associée est supérieure à 1.96
125
Application VAR
126
Application VAR
127
Application VAR
128
Application VAR
129
Application VAR
130
Application VAR
Pour les séries Jan; Jae; Fe; FN on retient les coefficients qui sont significatifs, c'est-à-dire
ceux dont les statistiques de Student (t-stat) sont supérieures en valeur absolue aux valeurs
théoriques (1.96) au seuil de 5%. D’où:
Le modèle VAR(12) s’écrit donc de la façon suivante :
FE = 0.5138865666*FE(-1) + 0.2129399812*FE(-5) + 0.1950868599*FE(-11) + 0.1542121815*FN(-3)
- 0.1297690979*FN(-4) - 0.9350288096*JAE(-4) + 0.1748064848*JAN(-4) + 0.124394713*JAN(-
7) - 0.158152241*JAN(-10)
Remarque:
Nous constatons que la série JAN s’écrit uniquement en fonction de ses valeurs passées,
ceci nous pousse à penser que l’approche multivariée pour cette série n’apportera rien en
terme de prévisions par rapport à l’approche univarié
131
Application VAR
b11 / 2 + 0 0.252499 + 0
-test de skewness : g1 = = = 1,071<1.96 donc :
6 6 108
n
On accepte l’hypothèse nulle H 0 (aplatissement Normal)
b2 − 3 3.52793 − 3
-test de kurtosis : g 2 = = = 1,119<1.96 donc :
24 24 108
n
On accepte l’hypothèse nulle H 0 (asymétrie)
Alors : les résidus sont gaussiens. Ce qui est confirmé par le test de Jarque-Berra
132
Application VAR
RESIDJAE RESIDJAN
Skewness -0.0712588488320082 0.281728280741602
Kurtosis 2.78755176016054 4.06493347414021
Jarque-Bera 0.294504969412509 6.5320497046027
Probability 0.863076036404564 0.0381578089195492
Sum -69.9319286509287 -12552.0427659422
Sum Sq. Dev. 8250899.10417633 429470841.548753
Observations 108 108
Conclusion : D’après les tests précédents on conclut que les résidus forment un bruit
blanc Gaussien sauf pour les résidus de la série JAN
Prévision:
Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006
FE FN JAE JAN
Janvier 2006 219.9691 22861.44 3889.915 25445.95
Février 2006 760.1325 26087.89 4342.417 23763.63
Mars 2006 247.8898 35924.73 4318.431 23890.61
Avril 2006 1120.071 32969.42 4247.052 24472.81
Mai 2006 434.6242 30365.83 4465.693 24754.62
Juin 2006 1030.656 27410.18 4769.805 23744.89
Juillet 2006 732.0931 35723.78 5989.449 25355.39
Août 2006 508.3732 31954.93 6159.516 26790.62
Septembre 2006 1186.878 32574.07 5882.792 23908.79
Octobre 2006 1143.687 31269.60 5166.946 24080.56
Novembre2006 86.02180 24402.61 5220.334 28424.65
Décembre2006 745.5457 30627.60 5071.127 27387.77
133
Application VAR
134
Application VAR
Lags: 12
Null Hypothesis: Obs F-Statistic Probability
FN does not Granger Cause FE 108 2.377 0.010
FE does not Granger Cause FN 1.210 0.290
JAE does not Granger Cause FE 108 0.878 0.571
FE does not Granger Cause JAE 0.842 0.607
JAN does not Granger Cause FE 108 1.583 0.112
FE does not Granger Cause JAN 0.742 0.706
JAE does not Granger Cause FN 108 1.391 0.186
FN does not Granger Cause JAE 0.499 0.909
JAN does not Granger Cause FN 108 1.436 0.165
FN does not Granger Cause JAN 0.801 0.647
JAN does not Granger Cause JAE 108 1.640 0.096
JAE does not Granger Cause JAN 0.542 0.880
D’après le tableau ci-dessus, nous acceptons l’hypothèse H 0 dans la première équation car
la valeur de la statistique de Fisher calculée est inférieure à la statistique de Fisher tabulée,
2,120
FStat < F 0.05 = 3.07, de plus la probabilité associée est supérieure au seuil statistique
usuel de 5 % , il n’y a donc pas de causalité au sens de Granger de A vers B , nous acceptons
l’hypothèse H 0'
Remarque:
(Sauf pour les séries FE et FN )
La probabilité associée est de 0.01 : elle est inférieure au seuil statistique usuel de 5 % donc
FE explique significativement FN . Il y a donc causalité au sens de Granger de FE vers FN
135
Conclusion
Conclusion
A cette étape bien précise nous sommes en possession de deux groupes de résultats
associés à deux approches différentes (univariée et multvariée) pour un objectif commun à
savoir effectuer des prévisions. Pour choisir les meilleurs résultats une comparaison sera
entreprise.
Comparaison :
La comparaison des résultats prévisionnels obtenus par les différentes méthodes à savoir
la méthodologie de Holt et Winters et celle de Box et Jenkins et la modélisation VAR est
basée sur la racine carrées de la somme des carrées résidus (RMSE) entre les observations
prévues et les réalisations des séries de ventes.
Les prévisions d'une méthode sont jugées plus fiables si son RMSE est la plus faible par
rapport à celle de l'autre méthode.
Le calcul du RMSE (la racine carrée des moyennes des résidus) mesurant les écarts
prévisionnels moyens pour chaque méthode) est donné par la formule suivante :
1 N 2
RMSE = ∑ ε t où N est le nombre d’observations
N 1
Ainsi, la comparaison entre les différentes méthodes utilisées s’effectuera à partir du
tableau suivant:
Telle que :
RMSE 1 : la racine carrée des moyennes des résidus associée à la méthode Holt et Winters .
RMSE 2 : la racine carrée des moyennes des résidus associée à la méthodologie de Box et
Jenkins.
RMSE 3 : la racine carrée des moyennes des résidus associée à la modélisation ARFIMA.
RMSE 4 : la racine carrée des moyennes des résidus associée à la modélisation VAR.
137
Conclusion
Nous concluons enfin que les prévisions obtenues par la modélisation VAR sont plus fiables
que celles obtenues par les autres méthodes
138
Conclusion Générale
Conclusion générale
Conclusion Générale
Au cours de la préparation de notre mémoire de fin d’études, nous avons été amenés à
faire des prévisions à l’aide de diverses méthodes sur différentes séries. et essayer d’attendre
l’objectif fixé par notre étude, à savoir trouver le type de modèle qui convienne au problème
posé .Pour cela nous avons proposé dans un premier temps d'étudier individuellement les
séries en utilisant l’approche univariée qui comporte deux parties :
En effet, l’application des deux méthodes sur ces séries, nous a permis de conclure que :
La méthode Holt & Winters est la plus appropriée pour faire de meilleures prévisions
pour les séries FN et JAN au sens du RMSE
La méthode Box et Jenkins est la plus appropriée pour faire de meilleures prévisions
pour les séries FE et JAE au sens du RMSE
Pour la modélisation ARFIMA, nous pensons qu’elle est d’une grande importance et
d’une utilité à ne pas négliger car elle traite l’existence de phénomène à mémoire longue ;
elle permet en ce sens de préciser le type de mémoire (longue, ou courte) que nous avons à
traiter, pour cela il est indispensable de disposer d’un logiciel approprié et performant qui gère
la composante tendancielle et surtout saisonnière quel que soit son ordre. (Les résultats de
cette modélisation sont obtenus par le logiciel ITSM)
Etant donné qu’à l’issue de la méthodologie de Box & Jennkins les séries sont rendues
stationnaires, l’application de la modélisation V AR(p) à la base de ces séries est possible, en
Utilisant les critères d’informations d’Akaike et le maximum de vraisemblance nous obtenons
un ordre de décalage p = 12; à l’instar de la méthode précédente, le modèle V AR(12) subira
l’épreuve des tests pour qu’il soit par la suite validé afin d’être exploité pour les prévisions.
Néanmoins l’ordre du décalage p = 12 retenu est important, ce qui n’est pas pour diminuer Le
nombre de paramètres à estimer qui avoisine 132 paramètres, nous aurions pu diminuer
l’ordre du décalage en introduisant une composante moyenne mobile mais le logiciel
EVIEWS ne traite pas les modèles VARMA.
Nous achevons notre étude par une comparaison entre les deux méthodes sur la base du
critère RMSE qui permet de conclure que l’approche multivarié nous a permis d’améliorer les
Prévisions pour les quatre séries (FE. FN, JAN, JAE) .
Lors de cette étude , il nous a été permis d’approfondir nos connaissances dans le
domaine de la prévision à court et à long terme et un savoir faire pour les logiciels
statistiques EVIEWS , MATLAB , SPSS , ITSM , XL STAT .
Nous espérons avoir répondu au problème posé et que les résultats trouvés seront d’une
utilité pertinente
140
Annexe
Annexe 01
processus stochastique sous forme d’une combinaison linéaire (finie ou infinie) convergente
en moyenne quadratique, du présent et du passé d’un bruit blanc {ε t }.
¾ Remarque :
La causalité n’est pas une propriété du processus {X t , t ∈ Z } à lui seul, mais plutôt de la
relation avec {ε t , t ∈ Z } . Par suite, si le modèle est causal, alors le processus {X t , t ∈ Z } est
stationnaire, puisque ce dernier s’écrit en fonction de bruit blanc stationnaire.
142
Annexe 02
T 1% 5% 10%
Modèle [1]
100 -2.60 -1.95 -1.61
250 -2.58 -1.95 -1.62
500 -2.58 -1.95 -1.62
∞ -2.58 -1.95 -1.62
Modèle [2]
100 -3.51 -2.89 -2.58
250 -3.46 -2.88 -2.57
500 -3.44 -2.87 -2.57
∞ -3.43 -2.86 -2.57
Modèle [3]
100 -4.04 -3.45 -3.15
250 -3.99 -3.43 -3.13
500 -3.98 -3.42 -3.13
∞ -3.96 -3.41 -3.12
Modèle [1] : modèle sans constante, ni tendance déterministe. Modèle [2] : modèle
avec constante, sans tendance. Modèle [3] : modèle avec constante et tendance
100 3.22 2.54 2.17 3.78 3.11 2.73 3.53 2.79 2.38
250 3.19 2.53 2.16 3.74 3.09 2.73 3.49 2.79 2.38
500 3.18 2.52 2.16 3.72 3.08 2.72 3.48 2.78 2.38
∞ 3.18 2.52 2.16 3.71 3.08 2.72 3.46 2.78 2.38
143
Bibliographie :
Graphique : A.Philippe.
144