Académique Documents
Professionnel Documents
Culture Documents
O U
d’une s.c est un problème d’ajustement en-
tre une variable mesurable et le temps.
UD
• L’ajustement consiste à rechercher la meilleure
S O
relation possible entre les deux variables.
A S
• Graphiquement cela revient à trouver la
courbe la plus proche possible de l’ensemble
des points de coordonnées (t , xt) de nuage
de points.
23
• A cet effet, on utilise
O U
– soit des méthodes analytiques qui sup-
posent qu’on a une idée sur la fonction
UD
mathématique qui représente la tendance
générale de la série,
S O
– soit des méthodes empiriques qui con-
A S
sistent à réduire les irrégularités de la
série, il s’agit principalement de la méthode
de lissage par moyennes mobiles.
24
I) Ajustement de la tendance par
des méthodes analytiques
O U
Il existe plusieurs modèles d’ajustements par
exemple
UD
O
• modèle linéaire : xt = a t + b,
S
A S
• modèle quadratique : xt = a t2 + b t + c,
25
• modèle exponentiel modifié : xt = α β t + γ,
• modèle logistique : xt =
1
b at + c
,
O U
UD
• modèle Gompertz : xt = exp(b at + c)),
S O
Ces méthodes analytiques sont simples, mais
A S
reposent sur l’hypothèse d’une tendance évoluant
selon une fonction analytique déterminée, hy-
pothèse qu’on ne peut pas fréquement faire,
même à la suite d’une transformation de vari-
able.
26
1) Ajustement par la droite de Mayer
O U
• Ranger les points At(t, xt) du nuage dans
l’ordre croissant de leurs abscisses.
UD
• Partager le nuage en deux sous-nuages ayant
O
le ”même” nombre de points.
S
A S
• Calculer les coordonnées du point moyen
de chaque nuage : G1 et G2.
27
Exemple : Reprenons l’exemple de la livraison
d’essence au Maroc (page 8).
t1 =
1 + 2 + ··· + 8
O U
• Premier sous-nuage : {A1, A2, · · · , A8}.
= 4.5
D
8
G1
x1 =
O U
109 + 108 + · + 122
8
= 120.
S S
• Deuxième sous-nuage : {A9, A10, · · · , A16}.
A G2
t2
=
9 + 10 + · · · + 16
8
= 12.5.
115 + 122 + · · · + 137
x2 = = 130.5.
8
28
La droite de Mayer passe par G1 et G2 :
4.5 a + b
= 120 a ≈ 1.31
12.5 a + b = 130.5
⇒
O U
b ≈ 114.09
donc
UD
La tendance estimée par la droite de Mayer est
S O
fbt = 1.31 t + 114.09.
A S
Remarque
29
2) Ajustement par la méthode des moindres
carrés
a) Tendance linéaire
ft = a t + b.
O U
d’une s.c dont la tendance semble être linéaire,
UD
• La méthode des moindres carrés consiste à
S O
trouver a et b qui minimisent la quantité
n
A S X
t=1
(xt − a t − b)2.
30
Cov(t, xt)
a
b= et b=x−a
b b t,
V(t)
avec
• t=
1 Xn
t et x=
1 Xn
xt ,
O U
n t=1
UD n t=1
S
• Cov(t, xt) =
O
1 Xn
n t=1
(t − t)(xt − x)
A S =
1 Xn
n t=1
txt − t x,
n n
1 X 1
(t − t)2 = t2 − t2 .
X
• V(t) =
n t=1 n t=1
31
Remarque
O U
par
UD
• Le cœfficient de corrélation linéaire est défini
S O
r(t, xt) = q
Cov(t, xt)
.
S
q
V(t) V(x)
32
Exemple : Reprenons l’exemple de la livraison
d’essence au Maroc (page 8).
t xt t2 txt
1
2
3
109
108
137
1
4
9
109
216
411
O U
4
5
UD
114
111
16
25
456
555
S
6
7 O119
140
36
49
714
980
A S 8
9
10
122
115
122
64
81
100
976
1035
1220
11 140 121 1540
12 130 144 1560
13 125 169 1625
14 125 196 1750
15 150 225 2250
16 137 256 2192
136 2004 1496 17589
33
Nous avons ainsi
136 2004
• t= = 8.5 et x= = 125.25
16 16
17589
• Cov(t, xt) = −8.5×125.25 = 34.6875
1496
16
O U
• V(t) =
16
UD
− (8.5)2 = 21.25.
D’où
S O
A• a=
b S
34.6875
21.25
≈ 1.63
xt = b a t ,
O U
on peut se ramener à un ajustement linéaire
par transformation logarithmique de xt (ln ou
log au choix).
UD
xt = b at ⇒ log(xt) = log b + t log a.
On pose
S O
A S
yt = log(xt), A = log a et B = log b.
Ce qui donne
yt = A t + B.
les cœfficients Ab et B
b sont déterminés alors par
la méthode des moindres carrés;
Cov(t, y) b =y−A
Ab = et B b t.
V(t)
35
Ensuite on calcule a
b et b
b :
b = eA et b
a b = eB si on utilise ln
b b
ou
b = 10A et b
b = 10B si on utilise log .
U
a
b b
D O
U
t 1 2 3 4 5 6
xt 255 330 435 570 740 960
S O
A S
• Un graphique usuel permet de proposer une
tendance exponentielle pour cette série.
36
Les calculs se présentent ainsi
t xt yt = log(xt) t yt t2
1 255 2.41 2.41 1
2 330 2.52 5.04 4
3 435 2.64 7.92 9
4
5
570
740
2.76
2.87
11.04
14.35
O U
16
25
6
21
960
—–
UD
2.98
16.18
17.88
58.64
36
91
O
Finalement, on trouve
S
A S Ab = 0.11 et B
b = 2.32.
b = 0.11 ⇒ a
Ab = log a b = 1.29.
B b = 2.32 ⇒ bb = 208.93.
b = log b
37
c) Tendance quadratique
xt = a t2 + b t + c.
O U
S=
n
X D
Il s’agit donc minimiser la somme
U
(xt − (a t2 + b t + c))2.
S
t=1
O
On doit resoudre le système
A
∂S
∂ a
S= −2
X
t
t2 (x − (a t2 + b t + c)) = 0
t
∂S
t(xt − (a t2 + b t + c)) = 0
X
= −2
∂b t
∂S X
2 + b t + c))
−2 −
∂c
= (x t (a t =0
t
38
Ce qui revient à résoudre le système suivant
d’inconnues a, b et c.
4 3 2 2x
X X X X
a t + b t + c t = t t
U
3 2
X X X X
a t +b t +c t = txt
a
X
2
t +b
X
D
t + nc =
X
xt O
O U
Exemple :Soit la s.c suivante :
S S
A t
xt
1
101
2
156
3
216
4
212
5
177
6
122
ft = a t2 + b t + c.
39
Les calculs permettant de résoudre le système
précédent sont donnés par le tableau suivant.
O U
1
t xt
101
t2
1
UDt3
1
t4
1
t xt
101
t2 xt
101
O
2 156 4 8 16 312 624
S
3 216 9 27 81 648 1 944
S
4 212 16 64 256 848 3 392
5 177 25 125 625 885 4 425
A6
7
28
122
47
1 031
36
49
140
216
343
784
1296
2 401
4 676
732
329
3 855
4 392
2 303
17 181
40
Finalement, on a le système suivant à résoudre.
U
4676 a + 784 b + 140 c = 17181
O
784 a + 140 b + 28 c = 3855
D
U
140 a + 28 b + 7 c
= 1031
On trouve
S O
A S
b = −15.32, b
a b = 112.96 et cb = 1.85.
La tendace ajustée est alors donnée par la re-
lation
41
3) Ajustement par la méthode des trois
points
U
S O
b) Courbe de Gompertz
t
xt = eα β +γ ,
A S 0 < β < 1.
Remarque : ln(xt) = α β t + γ.
c) Courbe logistique
1
xt = t
, 0 < β < 1, α > 0, γ > 0.
αβ + γ
1
Remarque : = α β t + γ.
xt
42
b) Principe de la méthode
étapes suivantes :
O U
La méthode des trois points consiste en les
UD
a) Répartir les données dans l’ordre du temps
en trois sous ensembles I, II et III, approxima-
S O
tivement de même taille, de telle sorte que
les moyennes des temps tI , tII et tIII soient
A S
équidistantes.
43
iii) si n est multiple de 3 plus 2 (n = 3k + 2),
mettre l’ensemble de taille k en II et les
deux ensembles de taille k + 1 en I et en
III.
O U
UD
c) Résoudre le système de trois équations non
linéaires à trois inconnues suivant :
S
xI =
Oα β tI + γ
= α β tII + γ
(1)
A S xII
xIII = α β tIII + γ
(2)
(3)
O
= β ∆,
D
d’où
U
!
1 xIII − xII
ln(β) = ln .
S O ∆ xII − xI
A S
d)iii) Déterminer β puis, revenant à l’équation
(4),
xIII − xII
α= t
β III − β tII
et grâce à l’équation (1) :
γ = xI − α β t I .
45
Remarque
O U
Exemple : Le produit intérieur brut d’un pays
entre 1999 et 2006 est donné par le tableau
D
suivant.
O
1999U
Année t
1
xt
31.3
S S 2000
2001
2
3
36.7
44.4
A 2002
2003
2004
2005
4
5
6
7
49.8
59.6
68.0
74.4
2006 8 79.0
S O
A S
Sous groupes
I
II
III
t
2
4.5
7
xt
36.7
54.7
74.4
1/xt
0.02725
0.01843
0.01344
ln(xt)
3.6028
3.9978
4.3095
47
• La courbe exponentielle modifiée ajustée a
pour équation
O U
b t = 177.31 × (1.0367)t − 153.8.
UD
• La courbe logistique ajustée a pour équation
x
bt =
S O 1
t
0.032028 × (0.796217) + 0.006943
.
A S
• La courbe de Gompertz ajustée a pour équation
t
b t = exp −2.26145 × (0.909464) + 5.473285 .
x
48
II) Ajustement de la tendance par des
méthodes empiriques
O U
Le but d’un lissage est de faire apparaı̂tre l’allure
UD
de la tendance. il s’agit donc de faire dis-
paraı̂tre la saisonnalité et de réduire au maxi-
O
mum l’effet résiduel.
S S
Les opérations de lissage sont essentiellement
A
utilisées
49
1) Méthode des moyennes échelonnées
O U
ou de longueur p consiste à remplacer ”p” valeurs
consécutives de la s.c par leur moyenne arithmétique.
UD
Elle permet de lisser la s.c, en réduisant les
O
variations saisonnières pour obtenir la tendance.
S
S p
On notera par MEt (x) cette moyenne calculée
A
sur la s.c (xt)t=1,··· ,n au temps t.
50
a) Si p est impair : p = 2k + 1
p x + x2 + · · · + xp
• MEk+1(x) = 1
p
,
O U
p
• ME3k+2(x) =
UD
xp+1 + xp+2 + · · · + x2p
,
S O p
A
p
S
• ME5k+3(x) =
x2p+1 + x2p+2 + · · · + x3p
p
,
• et ainsi de suite.
51
b) Si p est pair : p = 2k
x1 xp+1
+ x2 + · · · + xp +
p
• MEk+1(x) = 2
p
2 ,
O U
p
UD
xp+1
2
+ xp+2 + · · · + x2p +
x2p+1
2
O
• ME3k+1(x) = ,
p
S S x2p+1 x3p+1
A p
• ME5k+1(x) = 2
+ x2p+2 + · · · + x3p +
p
2 ,
• et ainsi de suite.
52
Remarque
U
plaçant p points par un seul, plusieurs points
sont ”perdus”.
D O
O U
• Le nombre de points ”perdus” dépend du
choix de l’ordre p.
S S
• Lorsque le choix de l’ordre p n’est pas im-
53
2) Méthode des moyennes mobiles
O U
Elle permet aussi de lisser la chronique en rem-
D
plaçant un nombre p de valeurs consécutives de
U
la s.c par leur moyenne arithmétique.
S O
Contrairement à la méthode précédente, seules
A S
les observations au début et à la fin de la séries
disparaissent.
p
On notera par MMt (x) cette moyenne calculée
sur la s.c (xt)t=1,··· ,n au temps t.
54
a) Si p est impair : p = 2k + 1
O U
p
• MMk+1(x) =
UD
x1 + x2 + · · · + xp
p
,
S O
x2 + x3 + · · · + xp+1
A
p
S
• MMk+2(x) =
p
,
p x3 + x4 + · · · + xp+2
• MMk+3(x) = ,
p
• et ainsi de suite.
55
b) Si p est pair : p = 2k
x1
O U
xp+1
p
• MMk+1(x) = 2
UD
+ x2 + · · · + xp +
p
2 ,
S x2 O xp+2
A
p
S
• MMk+2(x) = 2
+ x3 + · · · + xp+1 +
p
2 ,
x3 xp+3
+ x4 + · · · + xp+2 +
p
• MMk+3(x) = 2 2 ,
p
• et ainsi de suite.
56
Remarque : Pour les deux cas, on perd 2k
valeurs : k au début et k et à la fin de la série.
S O
• Si la période du mouvement saisonnier est
A S
p alors la moyenne mobile de longueur p
supprime la composante saisonnière.
57
Exemple : Calculons les moyennes échelonées
et mobiles pour estimer le trend de la s.c con-
cernant la livraison d’essence au Maroc.
S O
123.5 127 123.5
S
8 122 —– 125.667 124.375
9 115 —– 119.667 124.75
A 10
11
12
122
140
130
—–
128
—–
125.667
130.667
131.667
125.75
128
129.625
13 125 —– 126.667 131.25
14 125 —– 133.333 133.75
15 150 118.625 137.333 —–
16 137 —– —–
58
Remarque :
servées.
O U
les k premières et k dernières valeurs ob-
UD
Pour pallier cet inconvénient, on peut si le
p
nuage des points (t,MMt (x)) est allongé
O
par exemple, faire un ajustement linéaire.
S
S
On aura alors des estimées de la tendance
aux dates t = 1, · · · , k et t = n−k+1, · · · , n.
59
IV) Critères usuels pour réaliser le meilleur
ajustement
b1, · · · , x
x bn
x1 , · · · , x n .
O U
On note
UD
e1, · · · , en
S O
les n erreurs de prévision; (ei = xi − x
b i).
A S
les critères suivants sont utilisés pour juger la
validité de la méthode d’ajustement.
60
2. L’erreur quadratique moyenne (”Root Mean
Square Error”)
v
n
U
u1 X
u
RM SE(e) = t e2
i.
n i=1
D O
O U
3. L’erreur absolue moyenne en pourcentage
(”Mean Absolute Percentage Error”)
S S M AP E(e) =
1 Xn
| ei |
n i=1 xi
.
A
La courbe qui donne la plus petite valeur du
critère utilisé réalise alors le meilleur ajuste-
ment.
61
Exemple : Dans l’exemple de la page 46,
déterminer la courbe qui réalise le meilleur ajuste-
ment au sens du critère MAPE.
t xt Exp.Mod Logistique
O U
Gompertz
1
2
31.3
36.7
30.0
36.7
UD 30.8
36.7
30.5
36.7
O
3 44.4 43.7 43.3 43.5
4
5
6
S S
49.8
59.6
68.0
51.0
58.5
66.3
50.5
58.2
66.2
50.7
58.3
66.3
A7
8
74.4
79.0
MAPE
74.4
82.8
2.2 %
74.4
82.5
1.9 %
74.4
82.7
2 %
62
V) Test de Fisher pour détecter la présence
d’une tendance
1) La loi de Fisher-Snedecor
O U
• C’est une loi de probabilité continue qui
UD
dépend de deux paramètres appelés degrés
de liberté (ddl).
S O
• Si X et Y sont deux v.a indépendantes dis-
A S
tribuées selon des lois de khi-deux respec-
tivement à ν1 et ν2 ddl, la variable
X/ν1
F =
Y /ν2
est dite suivre une loi de Fisher à ν1 et ν2
degrés de liberté. On la note F (ν1, ν2).
63
Remarque :
O U
UD
• Dans la pratique de cette distribution, il
faut faire très attention à l’ordre des deux
S O
paramètres ν1 et ν1. La loi de Fisher à ν1
A S
et ν2 ddl n’est pas la même que la loi de
Fisher à ν2 et ν1 ddl.
64
2) Table de la loi de Fisher-Snedecor (α = 5%)
O U
UD
S O
A S
65
3) Test de Fisher
tendance.
O U
• L’hypothèse nulle testée est l’absence de
D
H0 : la chronique n’est pas affectée d’une tendance
U
S O ou encore
A S
H0 : pas d’influence du facteur année
N
i
...
xi1
xN 1
xij
xN j
xip
xN p
O Uxi
xN
Moyennes
périodes
p
x1
• xi =
S
1 X
p j=1
O
xij : moyenne de l’année i,
A S
• xj =
1 XN
xij : moyenne de la période j,
N i=1
N X p
1 X
• x = xij : moyenne générale
N × p i=1 j=1
de la chronique sur toutes les observations.
67
Soit ST la somme totale des carrés
p
N X
(xij − x)2.
X
ST =
i=1 j=1
L’écart xij − x peut s’écrire
O U
Après avoir élevé au carré et fait la somme de
D
tous les indices, on obtient
avec
O U
ST = SA + Sp + SR ,
S S
SA = p
N
X
(xi − x)2,
A Sp = N
i=1
Xp
(xj − x)2, .
j=1
N Xp
(xij − xi − xj + x)2
X
SR =
i=1 j=1
68
b) Règle de décision
O U
UD
• On détermine Ftab valeur tabulée de Fisher
à ν1 = N − 1 et ν2 = (N − 1)(p − 1) ddl.
S O
A S
• On compare Ftab au Fisher lu dans la table
Ftab
69
Exemple : On reprend l’exemple de la livraison
d’essence au Maroc (page 8).
T1 T2 T3 T4 xi
1974 109 108 137 114 117,00
1975
1976
1977
111
115
125
119
122
125
140
140
150
122
130
137
O U 123,00
126,75
134,25
xj 115,00
UD
118,50 141,75 125,75 x = 125.25
S O
A
Source deS
variation
Lignes
Sommes
des carrés
ddl
Carrés
moyens
SA = 625, 5 N −1=3 208,5
(années)
Colonnes
Sp = 1692, 5 p−1=3 564,17
(trimestres)
Total ST = 2403 N p − 1 = 15 160,2
Résidu SR = 85 (N − 1)(p − 1) = 9 9,44
Remarque : SR = ST − SN − Sp.
70
On teste l’hypothèse
UD
(N − 1)(p − 1)
=
9, 44
≈ 22, 08.
S O
• Détermination du Fisher lu dans la table à
A S
ν1 = 3 et ν2 = 9 degrés de liberté (page
65). On trouve Ftab = 3, 86.
71