Académique Documents
Professionnel Documents
Culture Documents
MALI Abderrahmane
Les données ne sont pas indépendantes entre elles (c.à.d. que ce qui ce passe
aujourd'hui fonctionne essentiellement de ce qui s'est passé hier car si le présent ou le
futur sont déconnectés totalement du passé il n'y aura pas de méthodes de prévisions
possibles) L'ordre est important parce que le passé détermine le futur et parce qu'il
peut y avoir auto-corrélation c'est à dire que l'observation Yt est corrélée avec Yt-1 ou
Yt-2, ...
Cette méthode a pour objectif d'ajuster les données statistiques par une droite de la
forme y = Bx + C. Il s'agit de déterminer les paramètres B et C de la droite d'ajustement.
- les moyennes mobiles: Cette méthode est utilisée pour établir des prévisions
qui présentent des fluctuations régulières. Elle consiste à dégager une
tendance générale et une tendance saisonnière. Elle repose sur le calcul des
moyennes mobiles à partir des valeurs observées.
Cette méthode touche les phénomènes accidentels en permettant un lissage des
informations observées, mais elle élimine des informations en début et en fin de série.
Par ailleurs, elle ne donne pas une droite d'équation connue qui peut facilement se
prêter à des prévisions. C'est pourquoi l'ajustement par la méthode des moindres carrés
est préféré.
On recherche d'abord l'équation du trend par la méthode des moindres carrés (équation
de la forme Y = Bx + C), puis on calcule à partir de cette équation des valeurs ajustées
correspondantes à chaque période pour trouver par la suite les coefficients saisonniers
(coef sai = valeur observée/ valeur ajustée) et enfin calculer un coefficient moyen
permettant de faire des prévisions fiables.
La méthode des totaux mobiles permet de " lisser " les données c'est à dire d'éliminer
l'impact de la saisonnalité sur les variables. Cette méthode est la plus utilisée pour
procéder à la correction des variations saisonnières que ce soit par les entreprises ou par
les instituts économiques surtout.
Le but de la méthode est de dégager une tendance générale dans le cas d'une série
chronologique à variations saisonnières. Pour cela on effectue l'ajustement, non pas sur
les valeurs de la série elles-mêmes mais sur les totaux mobiles obtenus, successivement,
à partir des dites valeurs.
3. Comment construire un modèle de prévision :
Ft = Prévision de Yt
Et = Yt - Ft = erreur de prévision.
- Etape 3 : Utiliser le modèle qui a donné l'erreur la plus faible pour faire des
prévisions.
Section 2 : Technique descriptive
décomposition des chroniques
1. Définition :
Technique statistique utilisée afin de calculer des prévisions à l’aide d’une courbe
exponentielle. Dès lors que les coefficients de pondération des observations diminuent
géométriquement avec l’éloignement de ces observations, les valeurs récentes ont une
plus grande importance.
Notez bien que la présentation de cette formule est un peu déstabilisante puisque t est
le moment où la prévision a été faite et non celui où elle doit se réaliser. Ceci n'est pas
gênant dans la mesure où l'on reporte en t + 1 une valeur obtenue pour t.
- Si vous avez l’impression qu’on marche sur la tête en se basant sur des erreurs
pour prévoir l’avenir, la formule suivante vous paraîtra plus normale, bien
qu’elle revienne au même :
- La prévision initiale :
En raison de la formule récurrente du LES, on est obligé de CHOISIR une valeur à partir
de laquelle les prévisions seront effectuées. Cette valeur n’a que peu d’importance si la
série est longue. On prend souvent la moyenne des deux ou trois premières
observations mais ce choix est arbitraire. Les logiciels non spécialisés en prévision
utilisent la première valeur.
2. Historique :
Les méthodes de prévision se sont développées au cours de la seconde moitié du XXe
siècle. La méthode de lissage exponentiel simple a été introduite par Brown en 1962.Elle
a ensuite été généralisée par Holt et Winters. Ces méthodes sont largement diffusées et
utilisées. Leur succès est dû à la fois à leur simplicité et à la qualité des prévisions
obtenues.
Elles supposent que le phénomène étudié ne dépend que de ses valeurs passées.
- Pour une série sans saisonnalité, un historique d'au moins observations est
nécessaire
- Pour une série avec saisonnalité, un historique d'au moins années est nécessaire
(au moins 16 observations pour une série trimestrielle, au moins 48 observations
pour une série mensuelle).
Interprétation :
Pour cette série «Cours d'une action série sans tendance, ni saisonnalité, mais avec un
changement de niveau, on a réalisé deux lissages exponentiels simples (le LES nécessite
le choix d'un seul paramètre) :
Pour un paramètre de lissage égal à 0.9 les pondérations des premières observations
sont donc beaucoup plus faibles que pour un paramètre de lissage égal à 0.4
Dans le cas le plus général, un modèle ARIMA combine 3 types de processus aléatoire. La
contribution de chacun d’eux est précisée par la notation ARIMA (p,d,q) où p est l’ordre
de processus autorégressif Ar (p) , d est le degrés d’intégration du processus I (d), et q
est l’ordre de la moyenne mobile MA (q).
Yt = Yt-1 x φ1 + εt
Yt = Yt-1 x φ1 + Yt-2 x φ2 + εt
Le coefficient de régression φ exprime la force de liaison linéaire entre deux valeurs
successives. Si la valeur du coefficient de régression φ est entre -1 et 1, l’effet de chaque
perturbation εt aléatoire sur le système tend à décroitre au cours du temps.
On peut dire qu’un processus autorégressif possède une mémoire au sens ou chaque
valeur est corrélée à l’ensemble des valeurs qui la précède, c.à.d. la valeur à l’instant t de
Yt est en fonction de la valeur précédente Yt-1 qui est elle-même fonction de Yt-2.
Par exemple : le stock est modifié à chaque instant par les entrées «
approvisionnements » et les sorties «consommations », cependant le niveau moyen de
ces stocks dépends essentiellement de l’effet cumulé des changements instantanés sur
la période entre les deux inventaires. Sur le court terme la valeur des stocks fluctue avec
des aléas importants, alors que sur le long terme, le niveau de la série reste inchangé.
Même si le comportement d’une série est erratique c.à.d. instable, les différences d’une
observation à l’autre peuvent être relativement faibles.
Cette stationnarité de la série des différences, pour un processus intégré, est une
caractéristique importante du point de vue de l’analyse statistique des séries
chronologiques (on va détailler ça dans la partie méthodologie).
I (1) : Yt = Yt-1 + εt
εt est le bruit blanc c.à.d. un processus stationnaires dont les accroissements sont
indépendants et stationnaire (c.à.d. la même chose se reproduit dans le temps)
Un processus intégrés est dit d’ordre 1 si la série des différences premières est
stationnaire I (1).
Le processus intégrés est dit marche aléatoire, car c’est un processus autorégressif
d’ordre 1 dont le coefficient de régression est égal à 1, c.à.d. elle ne possède de
mémoire que pour la série précédente.
3- Les processus de moyennes mobiles : ( MA )
Un processus de moyennes mobiles est la combinaison linéaire entre la perturbation
courante εt avec une ou plusieurs perturbations précédentes.
Ainsi, une moyenne mobile d’ordre 1, MA(1), est définie par l’équation suivante :
MA (1) : Yt = εt – φ x εt-1
- Le processus des moyennes mobiles prend les moyennes pondérées des plus
récentes perturbations, et la perturbation aléatoire affecte la série pour un
nombre fini d’observation (qui est l’ordre de la moyenne) puis au delà de cette
valeur, elle cesse brutalement d’exercer une quelconque influence.
- Le processus autorégressif prend des moyennes pondérées des valeurs
précédentes, et l’effet de la perturbation décroit tout au long de la série au fur et
à mesure que le temps s’écoule.
- Identification
- Estimation
- Diagnostic
Il convient de réitérer (c.à.d. refaire) ses étapes jusqu’à ce que le résultat soit
satisfaisant.
1- Identification :
On suppose qu’on a éliminé les composantes saisonnières de la série chronologique, car
ils nécessitent un autre ensemble de paramètres.
Si la série n’est pas stationnaire c.à.d. si la moyenne de la série varie sur le court terme
ou que la variabilité de la série est plus élevée sur certaines périodes que sur d’autres, Il
faut les rendre stationnaire.
Pour les rendre stationnaire, la transformation la plus courante est la différenciation de
la série c.à.d. chaque valeur de la série est remplacée par la différence de cette valeur et
celle qui la précède.
2- Estimation :
3- Le diagnostic :
La série chronologique suivante représente les prix des tomates dans le marché de gros
d’OUJDA 1/2010-11/2013.
Moi 01 02 03 04 05 06 07 08 09 10 11 12
s
2010 3,00 6,00 7,50 12 8,50 4,00 2,20 1,80 2,50 5,00 6,60 6,00
2011 5,00 4,50 4,00 2,00 2,00 2,50 2,50 4,00 2,50 2,00 1,50 3,60
2012 5,00 2,50 4,00 2,80 2,50 3,80 3,00 2,50 2,80 6,00 2,80 7,00
2013 3,50 3,60 2,30 2,70 3,40 3,80 2,70 2,50 3,40 3,80 3,00 -
L’objectif est de prévoir les prix de tomates dans le marché de gros d’Oujda de
décembre 2013 jusqu’à décembre 2014 à partir du processus ARIMA.
Détermination de q :
Détermination de p :
N.B : - On choisit toujours l’ordre le plus grand, que ce soit pour FAC ou le FAP ;
On peut conclure de cette étape que c’est un processus ARIMA (3, 0, 1).
3ème étape : estimation des paramètres du modèle
Analyse Prévision créer un modèle
Il est nécessaire de vérifier l’hypothèse d’un bruit blanc pour les résiduels. Cette
vérification se fait par le test de Ljung-Box. L’hypothèse du bruit blanc est jugée
acceptable ssi sig. est supérieure à 0,05.
Dans notre cas 0,801 est supérieur à 0,05 donc l’hypothèse du bruit blanc est
acceptable.
Cette étape consiste essentiellement à juger si le modèle choisit est acceptable. Pour se
faire deux méthodes sont possible :
Méthode basée sur le corrélogramme des FAC résiduel et des FAP résiduel :
Ce modèle est acceptable puisque toutes les FAC et FAP résiduels sont inferieur au seuil
critique.
On accepte ce modèle ARIMA (3, 0,0) sans p = 2 pour cette série des prix de tomates.
Avec :
Tableau de prévisions :
Moi 01 02 03 04 05 06 07 08 09 10 11 12
s
2013 - - - - - - - - - - - 3,4
2014 3,5 3,9 3,9 4,0 3,9 3,8 3,7 3,7 3,7 3,8 3,8 3,8