Vous êtes sur la page 1sur 32

` TABLE DES MATIERES

1. Ajustements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2. ajustement afne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.3. corr lation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 e 1.4. Compl ment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 e 1.5. Ajustement exponentiel et puissance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.6. Exercices corrig s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 e 2. S ries chronologiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e 2.1. D nition et objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e 2.2. Calcul de la tendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3. Coefcients de variations saisonni` res . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e 2.4. Pr visions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e 2.5. Exercices corrig s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . e 17 17 18 20 22 26

CHAPITRE 1 AJUSTEMENTS

1.1. Introduction 1.1.1. exemple A. Le tableau suivant donne lindice mensuel des d penses dassurance e maladie dao t 1994 a juin 1995 (tendances observ es a la n juillet 1995 - base 100 janvier u ` e ` 1990). Mois Ao t 94 Oct 94 D c 94 F v 95 Avril 95 Juin 95 u e e Rang du mois X(i) 1 3 5 7 9 11 Indice Y (i) 123, 4 125, 9 127, 5 127, 9 129 131, 4
(Source : D partement statistique de la Caisse Nationale de lAssurance Maladie des Travailleurs Salari s). e e

On r alise le nuage de points repr sentatifs de cette distribution. e e


132 131 130 129 Y indice 128 127 126 125 124 123 0 2 4 6 X rang du mois 8 10 12

Figure 1. Nuage de points associ a la s rie A. e` e Question : y a-t-il une corr lation entre lindice mensuel des d penses dassurance male e adie et le mois du versement ? ` ` 1.1.2. exemple B. A loral dun examen, chaque candidat est interrog en 1ere langue e e et en 2i` me langue. les r sultats obtenus sont regroup s dans le tableau ci-dessous (ESCAE e e 79).

CHAPITRE 1. AJUSTEMENTS

X \Y 2 6 10 14 18

2 6 10 14 18 2 1 0 0 0 5 12 3 1 0 2 10 28 5 0 0 3 12 10 1 0 0 1 2 2

` La repr sentation en nuage de points de cette s rie est plus d licate. A titre dexemple e e e nous donnons une repr sentation. e
20 18 16 14 Y seconde langue 12 10 8 6 4 2 0 0 2
(2) (5) (2) (1) (12) (10) (3) (3) (28) (12) (1) (1) (5) (10) (2) (1) (2)

8 10 12 14 X premiere langue

16

18

20

Figure 2. Nuage de points assoc a la s rie B. e` e Il faut noter que non seulement le nombre de points est relativement grand, mais que de plus chaque point poss` de un poids (represent ici deux de facons diff rentes : diam` tre des e e e e cercles et effectifs marqu s a cot de chaque cercle). e ` e Question : y a-t-il une corr lation entre ces deux examens ? e 1.1.3. Probl` me. On veut savoir dune part si deux caract` res sont corr l s et dautre e e ee part si il existe un relation (` peu pr` s v ri ) reliant ces deux caract` res. La reponse a la a e e e e ` deuxi` me question na evidemment de sens que si on r pond positivement a la premi` re. e e ` e Le but de ce chapitre est de parvenir a ecrire une relation reliant les deux caract` res et de ` e mesurer la conance que lon peut donner a cette relation. Plus pr cisemment, on sint resse ` e e a deux variables statistiques X et Y et leurs valeurs observ es dans la population etudi e : ` e e (X(i), Y (i))1iN , dans le cas o` X et Y sont toutes deux quantitatives. On cherche a u `

1.2. AJUSTEMENT AFFINE

savoir sil existe une relation g n rale (` peu pr` s v ri e au sens statistique) du type Y = e e a e e e f (X), et si cest le cas d terminer la fonction f appropri e. Dans une telle formulation, la e e s rie X est appel e la s rie explicative et Y la s rie expliqu e. On peut dans certain cas e e e e e inverser la fonction f et ecrire X = f 1 (Y ). Dans ce cas X devient la s rie expliqu e et Y e e la s rie explicative. e

1.2. ajustement afne On commence par chercher des fonctions f de la forme x ax+b, i.e faire un ajustement lin aire. e 1.2.1. Droite de Mayer. D nition Soit (M (i) = (X(i), Y (i))i un groupe de n points associ a une s rie statise e` e tique. On appelle le point moyen du groupe, le point G = (x(G), y(G)) o` u x(G) = 1 n
n

X(i)
i=1

et

y(G) =

1 n

Y (i) .
i=1

M thode de Mayer : on partage la s rie en deux groupes, selon les valeurs de X(i) en e e respectant leur ordre croissant, on obtient alors deux groupes de points. On d termine les e points moyens, not s G1 et G2 , de ces groupes. e D nition On appelle droite de Mayer lunique droite passant par G1 et G2 . e Exemple On calcule la droite de Mayer pour lexemple A. On commence par s parer les e el ments du tableau en deux groupes. e Mois Ao t 94 Oct 94 D c 94 F v 95 Avril 95 Juin 95 u e e Rang du mois X(i) 1 3 5 7 9 11 Indice Y (i) 123, 4 125, 9 127, 5 127, 9 129 131, 4 premier groupe Puis on calcule les points moyens de chaques groupes : Soit G1 = (x(G1 ), y(G1 )) le point moyen des trois premiers points du nuage : x(G1 ) = 1+3+5 =3 3 et y(G1 ) = 123, 4 + 125, 9 + 127, 5 = 125, 6 . 3 second groupe

Soit G2 = (x(G2 ), y(G2 )) le point moyen des trois derniers points du nuage : x(G2 ) = 7 + 9 + 11 =9 3 et y(G2 ) = 127, 9 + 129 + 131, 4 = 129, 43 . 3

On place les points G1 = (3; 125, 6) et G2 = (9; 129.43) sur la courbe et on trace la droite passant par ces points.

6
132 131 130 129 Y indice 128 127 126 125 124 123 0 2

CHAPITRE 1. AJUSTEMENTS

G2

G1

6 X rang du mois

10

12

Figure 3. Droite de Mayer (en vert) passant par le nuage de points assoc a la s rie A. e` e 1.2.2. M thodes des moindres carr es. On cherche une droite d quation y = ax + b, e e e o` a et b sont des inconnues a d terminer, de sorte que les quantit s aX(i) + b Y (i) u ` e e (i = 1, . . . , N ) soient les plus petites possible. Plus pr cisemment on cherche a et b qui e rendent minimale la fonction
N

F (a, b) =
i=1

(aX(i) + b Y (i))2 .

Pour cela, on a besoin de la d nition e D nition On appelle covariance du couple de s ries statistiques (X(i), Y (i))1iN la e e quantit e N 1 Cov(X, Y ) = (X(i) X)(Y (i) Y ), . N i=1 1 Proposition On a la formule suivante Cov(X, Y ) = N N 1 2 Remarque Cov(X, X) = X(i)2 X = X 2 . N i=1
N

i=1

X(i)Y (i) X Y .

Avec ces notations, le couple (a, b) qui rend F minimale est donn par e a= Cov(X, Y ) X 2 et b = Y aX .

D nition Soit (X(i), Y (i))i=1,...,N un couple de s rie statistique. Avec les d nitions e e e ci-dessus, si on pose Cov(X, Y ) a= et b = Y aX , X 2 alors la droite d quation y = ax + b r alise un ajustement afne de la s rie e e e (X, Y ), o` X est la s rie explicative et Y la s rie expliqu e. On dit que lon u e e e a r alis un ajustement afne par la m thode des moindres carr s. e e e e

1.3. CORRELATION

Exemple On consid` re de nouveau lexemple A. On calcule les diff rentes quantit s n c ssaires e e e e e en utilisant un tableau. i X(i) Y (i) X(i)2 1 1 123, 4 1 2 3 125, 9 9 3 5 127, 5 25 4 7 127, 9 49 5 9 129 81 6 11 131, 4 121 total 36 765, 1 286 Y (i)2 X(i)Y (i) 15227, 56 123, 4 15850, 81 377, 7 16256, 25 637, 5 16358, 41 895, 3 16641 1161 17265, 96 1445, 4 97599, 99 4640, 3

On peut lire dans le tableau les valeurs suivantes : X(i) = 36, Y (i) = 765.1, 2 2 X(i) = 286, Y (i) = 97599.99 et X(i)Y (i) = 4640.3, do` X = 6, Y = 127.52, u X 2 = 11.67, Y 2 = 6.16 et Cov(X, Y ) = 8.28. Ainsi on obtient 8.28 = 0.71 et b = 127.5 (0.71)6 = 123.26 11.67 et la droite obtenue par la m thode des moindres carr s a pour equation e e a= y = 0.71x + 123.26 On peut repr senter sur le graphique la droite obtenue e
132 131 130 129 Y indice 128 127 126 125 124 123 0 2 4 6 X rang du mois 8 10 12
G1 G2

Figure 4. Repr sentation de la droite obtenue par la m thode des e e moindres carr s (en rouge) pour la s rie A. e e

1.3. corr lation e Nous avons vu comment r aliser un ajustement afne par deux m thodes diff rentes. e e e Maintenant nous allons donn un crit` re permettant de mesurer la conance a accorder a e e ` ` de tels ajustements. Pour cela on donne la d nition suivante : e D nition On d nit le coefcient de corr lation de la s rie (X,Y) par la quantit e e e e e Cov(X, Y ) r= X Y

CHAPITRE 1. AJUSTEMENTS

Th or` me On a 1 r 1. De plus, r = 1 si et seulement si il existe a, b, c des r els e e e tels que on ait, pour tout i = 1, . . . , N , aX(i) + bY (i) + c = 0. Remarque Si |r| 0, 95 on consid` re que la corr lation est de tr` s bonne qualit . On se e e e e permet deffectuer un ajustement afne d` s que |r| 0, 70. e

1.4. Compl ment e Dans cette section, on va donner la d nition de la covariance dans le cas o` on poss` de e u e une s rie double, puis montrer sur lexemple B lajustement par la m thode des moindres e e carr s. Soit (xk , yl , nk,l )1kq,1lr une s rie double. e e D nition La covariance de la s rie double est donn e par e e e 1 Cov(x, y) = N = 1 N
q r

k=1 l=1 q r

nk,l (xk x)(yl y ) nk,l xk yl xy

k=1 l=1

Si maintenant, on veut r aliser un ajustement afne de la s rie par la m thode des moine e e dres carr s, on proc` de comme ci-dessus, en gardant les m mes d nitions pour a et b et en e e e e calculant les moyennes de X et de Y , comme moyennes marginales de la s rie double, les e variances comme variances marginales et la covariance comme on vient de lindiquer. Exemple Reprenons lexemple B. Le calcul nous donne X = 10.36, Y = 9.2, X 2 = 12.51, Y 2 = 14.08 et Cov(X, Y ) = 8.60 (en utilisant la formule pr c dente) et ainsi pour e e lajustement lin aire par la m thode des moindres carr s on obtient la droite d quation e e e e

y = 0.6881x + 2.0716 ,

puisque 8.6 = 0.6881 et b = 9.2 (0.6881)10.36 = 2.0716 . 12.51

a=

On repr sente cette droite sur le graphique : e

1.5. AJUSTEMENT EXPONENTIEL ET PUISSANCE


20 18 16 14 Y seconde langue 12 10 8 6 4 2 0 0 2
(2) (5) (2) (1) (12) (10) (3) (3) (28) (12) (1) (1) (5) (10) (2) (1) (2)

8 10 12 14 X premiere langue

16

18

20

Figure 5. Ajustement afne de la s rie B obtenu par e la m thode des moindres carr s. e e Pour mesurer la conance a accorder a cette ajustement on calcule le coefcient de corr lation ` ` e de la s rie double. Le calcul nous donne e 8.6 r= = 0.6486 . 12.51 14.08 Lajustement afne nest pas de tr` s bonne qualit . e e 1.5. Ajustement exponentiel et puissance Soit (X(i), Y (i))1iN un couple de s ries statistiques. Dans cette section, on cherche un e ajustement y = f (x) de Y par rapport a X de lune des formes suivantes : ` y = bax : ajustement exponentiel. y = bxa : ajustement puissance. En r alit , gr ce a un changement de variable adapt , on va se ramener a effectuer un ajustee e a ` e ` ment afne par la m thode des moindres carr s. e e 1.5.1. Ajustement exponentiel. Consid rons un ajustement du type y = b a x . On e cherche a d terminer a et b de sorte que cette fonction r alise un bon ajustement de notre ` e e couple de s ries. cest-` -dire que lon ait, pour tout 1 i N , Y (i) b a X(i) . e a Proposition Posons Y = ln(Y (i)) pour tout 1 i N , = ln(b) et a = ln(a). Alors (i) b les propositions suivantes sont equivalentes Pour tout 1 i N , Y (i) baX(i) . Pour tout 1 i N , Y (i) aX(i) + b. Autrement dit, si on r alise un ajustement afne de la s rie Y en fonction de la s rie e e (i) e l quation de la droite r alisant lajustement afne, alors la X(i) et que lon note y = ax + b e e

10

CHAPITRE 1. AJUSTEMENTS

courbe d quation y = bax , o` a = exp() et b = exp( r alise un ajustement exponentiel e u a b), e de la s rie Y (i) en fonction de la s rie X(i). e e Remarque Pour mesurer la validit de lajustement exponentiel du couple (X(i), Y (i)), on e calcule le coefcient de correlation (lin aire) du couple (X(i), Y (i)) = (X(i), log(Y (i)). e Remarque Plut t que dutiliser le logarithme n perien, on peut utiliser le logarithme en o e base d quelconque. On rappelle que pour tout d > 1, on d nit la fonction log d par e logd (x) = ln(x) . ln(d)

Si d = 10, on note cette fonction simplement log. Dans ce cas, on ecrit Y = logd (Y (i)), (i) = log (b) et a = log (a). On trouve a et qui r alisent un ajustement pour tout 1 i N , b b e d d b (i))i et on r cup re a et b gr ce aux relations a = da et b = d. afne de (X(i), Y e e a Que faire en pratique pour r aliser un ajustement exponentiel ? e Soit (X(i), Y (i))i=1,...,N une s rie. e On calcule la s rie (X(i), log(Y (i))). e On r alise un ajustement afne de (X(i), log(Y (i))). cest-` -dire quon d termine a et e a e par b Cov(X, log(Y )) a= et b = log(Y ) aX . V(X)
On pose a = 10a et b = 10b . la courbe d quation y = bax r alise un ajustement exponentiel de (X(i), Y (i))i=1,...,N , e e o` X est la variable explicative et Y la variable expliqu e. u e

1.5.2. Ajustement puissance. Consid rons un ajustement du type y = bx a . On cherche e a d terminer a et b de sorte que cette fonction r alise un bon ajustement de notre couple de ` e e s rie. cest-` -dire que lon ait, pour tout 1 i N , Y (i) b(X(i))a . e a Proposition Posons Y = ln(Y (i)) et X(i) = ln(X(i)) pour tout 1 i N , = ln(b). (i) b Alors les propositions suivantes sont equivalentes Pour tout 1 i N , Y (i) bX a (i). Pour tout 1 i N , Y (i) aX(i) + b. Autrement dit, si on r alise un ajustement afne de la s rie Y en fonction de la s rie e e (i) e la droite r alisant lajustement lin aire, alors la courbe X(i) et que lon note y = a + b x e e a r alise un ajustement puissance de la s rie Y (i) en d quation y = bx , o` b = exp(b), e e u e fonction de la s rie X(i). e Remarque Pour mesurer la validit de lajustement puissance du couple (X(i), Y (i)), on e calcule le coefcient de correlation (lin aire) du couple (X(i), Y (i)) = (log(X(i)), log(Y (i)). e

1.6. EXERCICES CORRIGES

11

Remarque Comme pour lajustement exponentiel, on peut aussi utiliser le logarithme en base d quelconque. Ainsi, si on ecrit Y = logd (Y (i)) et X(i) = logd (X(i)), pour (i) tout 1 i N , = logd (b), alors on trouve a et qui r alisent un ajustement afne b b e b de (X(i), Y (i))i et on r cup re b gr ce a la relationt b = d . e e a ` Que faire en pratique pour r aliser un ajustement puissance ? e Soit (X(i), Y (i))i=1,...,N une s rie. e On calcule la s rie (log(X(i)), log(Y (i))). e On r alise un ajustement lin aire de (log(X(i)), log(Y (i))). cest-` -dire quon d termine e e a e par a et b

a=

Cov(log(X), log(Y )) et b = log(Y ) alog(X) . V(log(X))

On pose b = 10b . la courbe d quation y = bxa r alise un ajustement puissance de (X(i), Y (i))i=1,...,N , e e o` X est la variable explicative et Y la variable expliqu e. u e

1.6. Exercices corrig s e Exercice 1.1. On a relev les temps r alis s par les m dailles dor du 100 m` tres chez les e e e e e hommes et les femmes aux jeux olympiques depuis leur cr ation en 1896 jusquen 1988. e

Ann e e 0 4 8 12 16 24 28 32 36 40 52 Temps (hommes) 12.0 11.0 11.0 10.8 10.8 10.8 10.6 10.8 10.3 10.3 10.3 Temps (femmes) 12.2 11.9 11.5 11.9 Ann e e 56 60 64 68 72 76 80 84 88 92 Temps (hommes) 10.4 10.5 10.2 10.0 9.95 10.14 10.6 10.25 9.99 9.92 Temps (femmes) 11.5 11.5 11.0 11.4 11.0 11.07 11.08 11.06 10.97 10.54

Dans le tableau on compte les ann es ecoul es depuis 1896. e e a) Repr sentation des s ries dans un m me rep` re. e e e e

12
12.5

CHAPITRE 1. AJUSTEMENTS

12

11.5 temps realises

11

10.5

10

9.5 1890

1900

1910

1920

1930

1940 1950 annee

1960

1970

1980

1990

Figure 6. Repr sentation des s ries temporelles. Les ronds bleus e e donnent la s rie concernant les hommes et les ronds noirs celle e concernant les femmes. b) Droite de r gression. Dans cette question, on note X le caract` re donnant le nombre e e dann es ecoul es depuis 1896, Yh le caract` re donnant le temps r alis par les hommes et e e e e e Yf celui r alis par les femmes. e e S rie des hommes : La droite de r gression de cette s rie a pour equation y = ah x + bh , o` e e e u ah = Cov(X, Yh ) et b = Yh ah X . V (X) yh,n =

On commence par remarquer que la taille de la s rie est Nh = 21, e xn = 992, 2 2 220.65, xn = 64544, yh,n = 2323.1 et xn yh,n = 10187. Donc on a X= Yh = V(X) = 992 xn = 47.2381 , = Nh 21 yh,n 220.65 = = 10.5071 , Nh 21

64544 x2 n (X)2 = (47.2381)2 = 842.0862 , Nh 21

2 yh,n 2323.1 V(Yh ) = (Y h )2 = (10.5071)2 = 0.2233 et Nh 21 10187 xn yh,n XYh = 47.2381 10.5071 = 11.2231 . Cov(X, Yh ) = Nh 21 Ainsi, on peut calculer ah et bh a laide des formules pr cit es et de ces r sultats, pour obtenir ` e e e 11.2231 ah = = 0.0133 et bh = 10.5071 (0.0133)47.2381 = 11.1367 . 842.0862

1.6. EXERCICES CORRIGES

13

Do` la droite de r gr ssion Dh d quation y = 0.0133x + 11.1367. u e e e S rie des femmes : La droite de regression de cette s rie a pour equation y = af x + bf , o` e e u af = Cov(X, Yf ) et b = Yf af X . V (X) yf,n =

On commence par remarquer que la taille de la s rie est Nf = 14, e xn = 900, 2 2 158.6200, xn = 62704, yf,n = 1799.8 et xn yh,n = 10095. Donc on a X= Yf = V(X) = V(Yf ) = Cov(X, Yf ) = 900 xn = = 64.2857 , Nf 14 yf,n 158.62 = = 11.33 , Nf 14

62704 x2 n (X)2 = (64.2857)2 = 346.2041 , Nf 14


2 yf,n 1799.8 (Y f )2 = (11.33)2 = 0.1909 Nf 14

et

10095 xn yf,n XYf = 64.2857 11.33 = 7.3143 . Nf 14

Ainsi, on peut calculer af et bf a laide des formules pr cit es et de ces r sultats, pour obtenir ` e e e 7.3143 = 0.0211 et bf = 11.33 (0.0211)64.2857 = 12.6882 . 346.2041 Do` la droite de r gr ssion Df d quation y = 0.0211x + 12.6882. u e e e af = c) Repr sentation des droites de regression. e
13 12.5 12 temps realises 11.5 11 10.5 10 9.5 1890

1900

1910

1920

1930

1940 1950 annee

1960

1970

1980

1990

Figure 7. Repr sentation des droites de r gr ssion. e e e

14

CHAPITRE 1. AJUSTEMENTS

d) Les femmes pourront-elles faire mieux que les hommes? Pour savoir si les femmes pourront faire mieux que les hommes, il faut faire des pr visions. e Pour cela il suft de prolonger les droites de r gression obtenues, cest-` -dire quon pr dit e a e que, pour n > 96 (n = 96 correspond a lann e 1992 puisque n est le nombre dann e ` e e ecoule depuis 1896), on aura e Graphiquement, on constate que si on prolonge les courbes de r gression, celles-ci se coupent e en un point (x0 , y0 ). Ainsi a linstant x0 les hommes et les femmes feront le m me temps y0 , ` e plus pr cisemment x0 satisfait a l quation e ` e dont la solution est donn e par x0 = 12.688211.1367 = 198.9103. On se rap` le que x0 est le e e 0.02110.0133 nombre dann e ecoul es depuis 1896, donc les femmes feront mieux que les hommes, pass e e e ` cette date, le temps commun r alis par les hommes et lann e 1896 + 198.9 = 2094.9. A e e e les femmes est de y0 = 0.0211 198.9103 + 12.6882 = 0.0133 198.9103 + 11.1367 = 8.4912 . Exercice 1.2. Les donn es ci-dessous repr sentent l volution de la population des Etatse e e Unis de 1800 a 1990 (en millions) ` ann e e 1800 1810 1820 1830 1840 1850 1860 1870 population 5.3 7.2 9.6 12.9 17.1 23.2 31.4 38.6 ann e e 1900 1910 1920 1930 1940 1950 1960 1970 population 76.2 92.2 106 123.2 132.2 151.3 179.3 203.3 a) Repr sentation de la s rie On note X le caract` re donnant le nombre de d cennies e e e e ecoul es depuis 1800 et Y donnant la taille de la population (en millions). e
250

Yf,n = 0.0211n + 12.6882 et Yh,n = 0.0133n + 11.1367 .

0.0211x0 + 12.6882 = 0.0133x0 + 11.1367

200 population (en millions)

150

100

50

0 0

annee

10

12

14

16

18

Figure 8. Population des E.U. depuis 1800.

1.6. EXERCICES CORRIGES

15

b) Calcul des coefcients de corr lation lin aire des s ries (X, Y ) et (X, log(Y )). e e e Pour calculer le coefcient de corr lation de la s rie (X, Y ), on d termine les sommes e e e 2 2 suivantes : xn = 136, yn = 1209, xn = 1640, yn = 158214 et xn yn = 15803. La taille de la s rie etant 16, on d duit que X = 8.5, Y = 75.56, V(X) = 30.25, V(Y ) = e e 4178.7 et Cov(X, Y ) = 345.41. Enn cela donne pour le coefcient de corr lation, sachant e que X = V(X) = 5.5 et Y = V(Y ) = 64.64 : 345.41 Cov(X, Y ) = = 0.971 . X Y 5.5 64.64 Pour calculer le coefcient de corr lation de la s rie (X, log(Y )), on commence par e e d terminer la s rie log(Y ). La s rie log(Y ) poss` de par d nition les modalit s log(y n ). e e e e e e On doit ensuite d terminer les sommes suivantes : e xn = 136, log(yn ) = 26.18, x2 = 1640, log(yn )2 = 47.13 et xn log(yn ) = 267.6. La taille de la s rie etant e n 16, on d duit que X = 8.5, log(Y ) = 1.63, V(X) = 30.25, V(log(Y )) = 0.268 et e Cov(X, log(Y )) = 2.81. Enn cela donne pour le coefcient de corr lation, sachant que e X = V(X) = 5.5 et log(Y ) = V(log(Y )) = 0.517 : r(X, Y ) = r(X, log(Y )) = Cov(X, log(Y )) 2.81 = = 0.988 . X log(Y ) 5.5 0.517 y2 (log y)2 28.09 2.7812 51.84 3.897 92.16 5.1156 166.41 6.5394 292.41 8.0604 538.24 9.8857 985.96 11.88 1490 13.346 5806.4 18.778 8500.8 20.466 11236 21.748 15178 23.173 17477 23.857 22892 25.193 32148 26.926 41331 28.246 15821 47.13 xy 0 7.2 19.2 38.7 68.4 116 188.4 270.2 762.0 1014.2 1272.0 1601.6 1850.8 2269.5 2868.8 3456.1 15803 x log(y) 0 0.85733 1.9645 3.3318 4.932 6.8274 8.9816 11.106 18.8195 21.6120 24.3037 27.1779 29.6972 32.6976 36.0573 39.2383 267.6

Nous avons ecrit les calculs pr c dents dans le tableau suivant : e e x 0 1 2 3 4 5 6 7 10 11 12 13 14 15 16 17 136 y log(y) x2 5.3 0.72428 0 7.2 0.85733 1 9.6 0.98227 4 12.9 1.1106 9 17.1 1.233 16 23.2 1.3655 25 31.4 1.4969 36 38.6 1.5866 49 76.2 1.882 100 92.2 1.9647 121 106 2.0253 144 123.2 2.0906 169 132.2 2.1212 196 151.3 2.1798 225 179.3 2.2536 256 203.3 2.3081 289 1209 26.18 1640

c) Calcul du meuilleur ajustement de la s rie. Comme r(X, Y ) < r(X, log(Y )), on choisit e de faire un ajustement exponentiel de la s rie. Pour faire un ajustement exponentiel de la e s rie (X, Y ), on commence par faire un ajustement afne de (X, log(Y )). Cest-` -dire quon e a o` d termine la droite D, d quation y = ax + b, u e e Cov(X, log(Y )) et b = log(Y ) aX . a= V(X)

16

CHAPITRE 1. AJUSTEMENTS

Num riquement, on obtient e 2.81 a= = 0.0931 et = 1.63 (0.0931)8.5 = 0.8450 . b 30.25 Donc la droite de r gression de la s rie (X, log(Y )) a pour equation y = 0.0931x + 0.8450. e e x a Maintenant, la courbe d quation y = ba , o` a = 10 et b = 10b , r alise un ajustement e u e exponentiel de la s rie (X, Y ). Num riquement on obtient a = 10 0.0931 = 1.2391, b = e e 100.8450 = 6.9992 et ainsi la courbe y = 6.9992(1.2391)x r alise lajustement voulu. e d) Repr sentation du nuage de point et de la courbe dajustement sur un papier semi-log. e
10
3

population (en millions)

10

10

10

annee

10

12

14

16

18

Figure 9. Repr sentation de lajustement exponentiel sur un papier semi-log. e e) Pr vision de la population des E.U. en 2010. Pour faire la pr vision de la population des e e E.U. en 2010 on consid` re que la s rie est approch e par son ajustement. Comme en 2010 il e e e sest ecoul 21 d c nnies depuis 1800, on suppose que la population a cette date est donn e e e e ` e 21 par y21 6.9992(1.2391) = 631.36. Remarque En 2002 la population est de 288.3 millions dhabitants. Les pr visions faites e gr ce a la mod lisation par le mod` le exponentiel donne y20.2 a ` e e 6.9992(1.2391)20.2 = 531.85 (en millions). et celui par le mod` le lin aire donne y20.2 e e 11.4186 (20.2) 21.4956 = 209.16!

CHAPITRE 2 SERIES CHRONOLOGIQUES

2.1. D nition et objectifs e 2.1.1. D nition. e D nition On appelle s rie chronologique une s rie (Xn )n ind x e par le temps. e e e e e Exemple Consid rons la s rie donnant le chiffre daffaires r alis par une entreprise entre e e e e le mois de janvier 2000 et le mois de d cembre 2001 e ann e/mois Jan. Fev. Mars Avr. Mai Juin Juil. Aout Sep. Oct. Nov. D c. e e 2000 9 16 19 30 45 50 20 15 11 7 8 16 2001 11 18 23 36 53 61 24 17 14 10 12 21 Ici, pour n = 1, . . . , 24, (Xn ) est le chiffre daffaires r alis au n-` me mois (n = 1 pour e e e janvier 2000, n = 2 pour fevrier 2000, . . . , n = 24 pour d cembre 2001). e Probl` me : Analyser la s rie de sorte de pouvoir faire des pr visions. e e e Remarque On peut voir cette s rie comme le couple de s rie (Tn , Xn ), o` Tn = n. Cela e e u nous permet de faire des ajustements par la m thodes des moindres carr s pour le couple de e e s ries statistiques comme on la vu dans le chapitre pr c dent. e e e Remarque On peut encore voir cette s rie comme la s rie double e e (ai , mj , Xi,j )i{1,2},j{1,...,12} , o` a1 = 2000, a2 = 2001, m1 = Janv., . . . , m12 = D c et Xi,j est le chiffre daffaires r alis u e e e au moins mj de lann e ai . On verra que cette ecriture simplie, dune part le calcul des e coefcients de variations saisonni` res, mais dautre part le calcul de la s rie corrig e des e e e variations saisonni` res (d saisonnialisation) et le calcul de pr vision. e e e 2.1.2. Analyse avec un mod` le additif. On ecrit e Xn = t n + s n + n , o` u tn est la tendance. Cest la composante essentielle de la s rie. On peut penser a la e ` tendance comme un comportement moyen de la s rie. e

18

CHAPITRE 2. SERIES CHRONOLOGIQUES

sn est la s rie des coefcients de variations saisonni` res. Cette s rie est p riodique. e e e e Elle mesure les variations saisonni` res de la s rie dues a divers comportements sociaux e e ` et aux variations climatiques. n est ce qui reste. Cest le hasard de la s rie qui a priori nest pas analysable. e 2.1.3. Analyse avec un mod` le multiplicatif. Cette fois-ci on ecrit e Xn = t n s n n , o` tn , sn et n ont les m mes d nitions que dans le cas additifs. u e e 2.1.4. Choix du mod` le. On a repr sent sur le graphique suivant, deux s ries X n = e e e e tn + sn et Xn = tn sn , o` tn = a n + b et (sn ) est une s rie p riodique. u e e
2.5 1.5

1.5

0.5

0.5

0.5

0.5

10

1.5

10

Ainsi pour un mod` le additif, lamplitude des oscillations reste constante, alors que pour e le mod` le multiplicatif lamplitude des oscillations varie (sur le dessin lamplitude est strictee ment croissante dans le temps). Ce sont ces remarques qui vont guider le choix du mod` le. e En effet, la repr sentation dune s rie chronologique (Xn ) faisant apparatre des oscillae e tions, nous permettra de constater si ces derni` res restent constantes ou varient. On choisira e un mod` le additif dans le premier cas et un mod` le multiplicatif dans le second. e e 2.2. Calcul de la tendance Le calcul g n ral de la tendance consiste a faire un ajustement de notre s rie par une e e ` e courbe plus r guli` re. En g n ral, on choisira une courbe dont on connait une expression e e e e analytique, an de pouvoir r aliser des pr visions. Il peut se faire que lajustement nest pas e e dexpression analytique (cas des moyennes mobiles), mais que celui-ci nous permette quand m me de discerner une tendance. e 2.2.1. Moyennes mobiles. Soit (Xn )n=1,...,N une s rie chronologique. e

Figure 10. Le graphique de gauche repr sente tn + sn et celui de e droite tn sn

2.2. CALCUL DE LA TENDANCE

19

2.2.1.1. Moyennes mobiles d centr es. e e D nition Soit k un entier positif inferieur a N 1. On pose, pour n = k + 1, . . . , N , e ` mn = 1 k+1
n

Xi
i=nk

que lon appelle moyenne mobile d centr e dordre k. e e Cette moyenne mobile est la plus utilis e pour d gager une tendance. Leffet de ce genre e e de moyenne est de r gulariser la s rie. La s rie des moyennes (m n )n sera dautant plus e e e r guli re que k sera grand. Les cas extr` mes sont e e e k = 0 : mn = Xn pour tout n = 1 . . . N , on na rien fait du tout. e k = N 1 : mN = X. Moyenne mobile d nie uniquement pour n = N .

Exemple Dans le dessin ci-dessous, on a repr sent une s rie chronologique, ainsi que les e e e s ries des moyennes mobiles d centr es dordre 20 et 50. La s rie des moyennes mobiles e e e e dordre 20 est plus proche de la s rie initiale que la s rie des moyennes mobiles dordre 50. e e
0.15

0.1

0.05

0.05

0.1

0.15

50

100

150

200

250

300

350

400

Figure 11. S rie chronologique et moyennes mobiles dordre 20 e et dordre 50. 2.2.1.2. Moyennes mobiles centr es. e D nition Soit k un entier positif. On pose, pour n = k + 1, . . . , N k, e mn = 1 Xi 2k + 1 i=nk
n+k

que lon appelle moyenne mobile centr e dordre k. e 2.2.1.3. G n ralisation. Pour le cas d centr on a la g n ralisation suivante : e e e e e e
n

mn =
i=nk

pin Xi ,

20

CHAPITRE 2. SERIES CHRONOLOGIQUES

o` (pj )j=k,...,0 sont des poids tels que pj = 1. Dans le cas des moyennes d centr es vues u e e auparavant on avait pris pj = 1/(k + 1). Et pour le cas centr s e
n+k

mn =
i=nk

pin Xi ,

o` (pj )j=k,...,k sont des poids tels que u pj = 1. Dans le cas des moyennes centr es vues e auparavant on avait pris pj = 1/(2k + 1).

2.2.2. ajustement afne. Pour lajustement afne, on regarde la s rie comme le couple e de s ries (Tn , Xn ), o` Tn = n, puis on r alise un ajustement afne pour lequel X est la s rie e u e e expliqu e et T la s rie explicative. On a alors que la droite d quation y = ax + b, o` e e e u a= et r alise un ajustement afne du couple (T, X). e b = X aT Cov(T, X) V(T )

2.3. Coefcients de variations saisonni` res e 2.3.1. Cas particulier. Reprenons lexemple de lintroduction qui consid` re une s rie e e temporelle ind x e par les mois. On constate que le chiffre daffaires aux mois de mai et juin e e des deux ann es 2000 et 2001 sont nettement plus importants que ceux des autres mois. De e la m me facon on constate que les chiffres daffaires aux mois doctobre sont moins impore tants que pour les autres mois. Cela r v` le que le chiffre daffaires evolue dans le temps de e e facon p riodique. Lorsquon r alise un ajustement afne de la s rie on fait disparatre cette e e e information . Pour la r cuperer, on d nit les coefcients de variations saisonni` res. e e e La s rie temporelle ind x e par les mois, (Xn )n=1,...,N peut etre vue comme une s rie e e e e double. En effet, lindice n = 1 correspond au mois de janvier de lann e a 1 = 2000, n = 2 e correspond au mois de fevrier de lann e a1 , , n = 12 au mois de d cembre de lann e e e e a1 , n = 13 au mois de janvier de lann e suivante a2 = 2001 et ainsi de suite. Ainsi on est e en pr sence de la s rie double (ai , mj , ni,j )i{1,...,2},j{1,...,12} , o` ni,j est la valeur de la s rie e e u e correspondant au mois mj de lann e ai , i.e. ni,j = X12(i1)+j . e D nition on appelle coefcients saisonniers, not s j , les quantit s e e e j = 1 2
2

ni,j =
i=1

1 2

X12(i1)+j .
i=1

les coefcients saisonniers sont alors donn s par e 1 = 9 + 11 = 10 , 2 2 = 16 + 18 = 17 , , 2 12 = 16 + 21 = 18.5 2

` 2.3. COEFFICIENTS DE VARIATIONS SAISONNIERES

21

En pratique, seule la variation relative des coefcients saisonniers est signicative. Pour cette raison on doit renormaliser ces coefcients et d nir les coefcients de variations e saisonni` res. e D nition On appelle coefcients de variations saisonni` res les coefcients j d nis e e e par : Cas multiplicatif : j = j /. 1 o` = u j est la moyenne des coefcients saisonniers. 12 j=1 Ici = ( j j )/12 = 273/12 = 22.75(= X). Ainsi, si on choisit un mod` le multiplie catif, les coefcients de variations saisonni` res sont donn s par e e 1 = 10 = 0.4396 , 22.75 2 = 17 = 0.7473 , , 22.75 12 = 18.5 = 0.8132 . 22.75 Cas additif : j = j .
12

Ces r sultats sont r sum s dans le tableau ci-dessous. e e e mois janvier fevrier mars avril mai juin juillet aout septembre octobre novembre d cembre e 2000 9.00 16.00 19.00 30.00 45.00 50.00 20.00 15.00 11.00 7.00 8.00 16.00 2001 11.00 18.00 23.00 36.00 53.00 61.00 24.00 17.00 14.00 10.00 12.00 21.00 j 10.00 17.00 21.00 33.00 49.00 55.50 22.00 16.00 12.50 8.50 10.00 18.50 j 0.4396 0.7473 0.9231 1.4505 2.1538 2.4396 0.9670 0.7033 0.5495 0.3736 0.4396 0.8132

2.3.2. cas g n ral. On se donne une s rie chronologique (Xn )n=1,...,N . e e e Supposons que N = l p o` p est la longueur dune p riode et l le nombre de p riodes u e e (dans lexemple pr c dent, la p riode etait de 12 mois = 1 an et le nombre dann es etait e e e e 2, soit p = 12 et l = 2). On regarde la s rie chronologique, comme une s rie double e e (pi , qj , ni,j )i=1,...,l et j=1,...,p , o` ni,j = X(i1)p+j et le caract` re P = (pi ) est le caract` re u e e donnant une p riode et Q = (qj ) est le caract re donnant une subdivision en sous p riode de e e e P (dans lexemple pr c dent P est le caract` re donnant lann e et Q les mois. Une ann e e e e e e etant constitu e de 12 mois, on obtient bien une subdivision de P par Q et de plus on obtient e p = 12. On pourrait aussi consid rer les couples (ann e, trim` stre) (dans ce cas p = 4), e e e (semaine, jours) (p = 7), etc.). Pour comprendre cette op ration il faut se r f rer au tableau e ee ci-dessous.

22

CHAPITRE 2. SERIES CHRONOLOGIQUES

Pour prendre en compte les variations saisonni` res de notre s rie sur une p riode p, on e e e d nit p coefcients saisonniers par e l l 1 1 D nition j = e X(i1)p+j = ni,j l i=1 l i=1 Cest-` -dire que pour le calcul des coefcients saisonniers on ecrit (voir tableau) : a 1 = 1 l
l

X(i1)p+1 =
i=1 l

X1 + Xp+1 + X2p+1 + + X(l1)p+1 , l X2 + Xp+2 + X2p+2 + + X(l1)p+2 , l . . .

1 2 = l

X(i1)p+2 =
i=1

1 p = l

X(i1)p+p =
i=1

Xp + Xp+p + X2p+p + + X(l1)p+p . l

Les coefcients de variations saisonni` res (CVS) sont alors donn s par e e D nition Cas multiplicatif : j = j /. e Cas additif : j = j . o` = u 1 p
p

j =
j=1

1 N

X(n).
n=1

P/Q p1 p2 p3 . . . pi . . .

q1 X1 Xp+1 X2p+1

q2 X2 Xp+2 X2p+2

qj Xj Xp+j X2p+j

qp Xp X2p X3p . . . Xip . . .

X(i1)p+1 X(i1)p+2 X(i1)p+j

pl X(l1)p+1 X(l1)p+2 X(l1)p+j Xlp = XN j 1 2 j p j 1 2 j p Dans ce tableau, on a mis en evidence une correspondance (bijection) entre les couples (i, j), o` i = 1, . . . , l et j = 1, . . . , p, et les entiers n compris entre 1 et N donn e par : u e b : (i, j) n = (i 1)p + j . 2.4. Pr visions e On va d composer la s rie sous la forme Xn = tn sn n pour le cas multiplicatif, ou bien e e Xn = tn + sn + n pour le cas additif, o` tn est la tendance, sn la s rie des variations u e saisonni` res et n lal a. Pour ce faire, on effectue les etapes suivantes : e e

2.4. PREVISIONS

23

Calcul de la tendance tn = an + b, o` a et b sont tels que y = ax + b soit un ajustement u lin raire de (Tn , Xn ), o` Tn = n. e u Calcul des coefcients de variations saisonni` res j . e Calcul de la s rie corrig e des variations saisonni` res. e e e Pr visions e Les deux premi` res etapes ont fait lobjet des sections pr c dentes. Voyons maintenant e e e les deux derni` res. e 2.4.1. Calcul de la s rie corrig e des variations saisonni` res. e e e D nition On d nit la s rie corrig e des variations saisonni` res, not e (Y n )n par : e e e e e e cas multiplicatif : Y(i1)p+j = X(i1)p+j /j . cas additif : Y(i1)p+j = X(i1)p+j j . Exemple On reprend lexemple de lintroduction. On est dans le cadre du mod` le multie plicatif, donc Y1 = X1 /1 = 9/0.4396 = 20.47, Y2 = X2 /2 = 16/0.7473 = 21.4118, , Y12 = X12 /12 = 16/0.8132 = 19.6757, Y13 = X13 /1 = 11/0.4396 = 25.0250, Y14 = X14 /2 = 18/0.7473 = 24.0882, etc.. Ces r sultats sont indiqu s dans le tableau e e ci-dessous. mois janvier fevrier mars avril mai juin juillet aout septembre octobre novembre d cembre e 2.4.2. Pr visions. e On commence par pr dire les valeurs de la s rie corrig e des variations saisonni` res, e e e e Yn , pour n > N . Plus pr cisemment on effectue les pr visions suivantes : e e Yn = an + b pour des entiers n > N . On corrige cette s rie, en prenant en consid ration les variations saisonni` res (op ration e e e e inverse du calcul de la s rie corrig e des variations saisonni` res). Cest-` -dire que lon e e e a pose Xp(i1)+j = Yp(i1)+j j , 2000 9.00 16.00 19.00 30.00 45.00 50.00 20.00 15.00 11.00 7.00 8.00 16.00 2001 11.00 18.00 23.00 36.00 53.00 61.00 24.00 17.00 14.00 10.00 12.00 21.00 j 10.00 17.00 21.00 33.00 49.00 55.50 22.00 16.00 12.50 8.50 10.00 18.50 j 0.4396 0.7473 0.9231 1.4505 2.1538 2.4396 0.9670 0.7033 0.5495 0.3736 0.4396 0.8132 2000(c) 20.4750 21.4118 20.5833 20.6818 20.8929 20.4955 20.6818 21.3281 20.0200 18.7353 18.2000 19.6757 2001(c) 25.0250 24.0882 24.9167 24.8182 24.6071 25.0045 24.8182 24.1719 25.4800 26.7647 27.3000 25.8243

24

CHAPITRE 2. SERIES CHRONOLOGIQUES

pour (i, j) tel que n = p(i 1) + j > N (voir les exemples et les exercices). Exemple On reprend la s rie de lintroduction. On voudrait prevoir le chiffre daffaires de e lentreprise pour lann e 2002. On commence par faire des pr visions pour la s rie corrig e e e e e des variations saisonni` res (s rie liss e), puis on corrigera cette s rie a laide des coefcients e e e e ` de variations saisonni` res. e An de faire des pr visions sur la s rie Yn , nous devons calculer la droite de r gression e e e par la m thode des moindres carr s du couple (Tn , Xn )n=1,...,24 , o` Tn repr sente lindice du e e u e mois (i.e. Tn = n pour tout n = 1, . . . , 24) et Xn le chiffre daffaires de lentreprise pour le mois dindice n. Dans le cas o` la variable explicative est T et la variable expliqu e est X u e la droite de r gression r alisant un ajustement afne est donn e par l quation x = at + b, e e e e o` a = Cov(T, X)/V(T ) et b = X aT . On a N = 24 et successivement u Tn = 300, 2 2 Xn = 546, Tn = 4900, Xn = 17784 et Tn Xn = 6857. On peut a partir de ces ` sommes calculer toutes les quantit s utiles. Notamment e

T X V(T ) V(X) Cov(T, X)

= = = = =

300/24 546/24 4900/24 (12.5)2 17784/24 (22.75)2 6857/24 12.5 22.75

= = = = =

12.5 22.75 47.9167 . 223.4375 1.33

Ce qui conduit a a = 1.33/47.9167 = 0.0278, b = 22.75 0.0278 12.5 = 22.4022 et donc ` la droite de r gression est x = 0.0278t + 22.4022 et la tendance est t n = 0.0278n + 22.4022. e Donc les valeurs pr vues pour Yn pour lann e 2002 qui correspondent aux indices n = e e 25, . . . , 36, sont donn es par e

Yn = 0.0278n + 22.4022 .

Par exemple Y25 = 0.0278 25 + 22.4022 = 23.0978 correspond a la valeur pr dite pour le ` e mois de janvier 2002 de la s rie liss e (voir tableau). e e Maintenant, on ecrit X12(i1)+j = Y12(i1)+j j , pour des indices i et j correspondant ` e aux mois de lann e 2003. On a i = 3 (3eme ann e) et j = 1, , 12 (12 mois). Donc X25 = e Y25 1 = 23.0978 0.4396 = 10.1529, X26 = Y26 2 = 23.1257 0.7473 = 17.2807, , X36 = Y36 12 = 23.4039 0.8132 = 19.0318 sont les valeurs pr dites pour le chiffre e daffaires de lann e 2002. e On a r sum ces r sultats dans le tableau suivant : e e e

2.4. PREVISIONS

25

mois janvier fevrier mars avril mai juin juillet aout septembre octobre novembre d cembre e

2000 9.00 16.00 19.00 30.00 45.00 50.00 20.00 15.00 11.00 7.00 8.00 16.00

2001 11.00 18.00 23.00 36.00 53.00 61.00 24.00 17.00 14.00 10.00 12.00 21.00

j 10.00 17.00 21.00 33.00 49.00 55.50 22.00 16.00 12.50 8.50 10.00 18.50

j 2002 (liss ) 2002 (brut) e 0.4396 23.0978 10.1529 0.7473 23.1257 17.2807 0.9231 23.1535 21.3724 1.4505 23.1813 33.6256 2.1538 23.2091 49.9889 2.4396 23.2370 56.6880 0.9670 23.2648 22.4978 0.7033 23.2926 16.3816 0.5495 23.3204 12.8134 0.3736 23.3483 8.7235 0.4396 23.3761 10.2752 0.8132 23.4039 19.0318

70 60 50 40 30 20 10 0 0

10

15

20

25

30

35

40

Figure 12. Repr sentation de la s rie chronologique. Les e e courbes en pointill repr sentent les valeurs pr dites. e e e

26

CHAPITRE 2. SERIES CHRONOLOGIQUES

2.5. Exercices corrig s e Exercice 2.3. Lentreprise X communique le montant de son chiffre daffaires (en milliers deuro) pour les ann es 1989 a 1992. e ` mois/ann e e janvier f vrier e mars avril mai juin juillet aout septembre octobre novembre d cembre e 1989 1230 1280 1400 1600 1450 1390 1280 930 1080 1400 1500 1550 1990 1590 1640 1800 1990 1870 1910 1670 1260 1430 1780 1750 1670 1991 1750 1650 1800 1900 1950 1910 1980 1410 1520 1920 1900 1780 1992 1840 1790 2370 2360 2280 2510 2320 1870 1820 2210 2440 2270

a) Repr sentation Soit M le caract` re donnant le nombre de mois ecoul s depuis d cembre e e e e 1988 et X donnant le chiffre daffaires pour le mois correspondant. Ayant des donn es sur 4 e ans, on a a disposition une s rie (mi , xi )i=1,...,N , o` N = 48, m1 = 1, m2 = 2, , m48 = 48 ` e u et x1 = 1230, x2 = 1280, . . . , x12 = 1550, x13 = 1590, x14 = 1640, . . . , x48 = 2270. On repr sente cette s rie sur le graphique suivant : e e
2600 2400 2200 2000 chiffre daffaires 1800 1600 1400 1200 1000 800 0 5 10 15 20 25 mois 30 35 40 45 50

Figure 13. Evolution du chiffre daffaires de Janvier 1989 a ` d cembre 1992. e b) Ajustement par la m thode des moindres carr s Le tableau de calcul nest pas repr sent e e e e ici. On se contente de donner les r sultats, notamment, on indique les diff rentes sommes e e suivantes a partir desquelles on calculer toutes les quantit s voulues pour lajustement : ` e N N (N +1) 4849 2 = 2 = 1176, xi = 84000, mi = 38024, x2 = 153218400, i i=1 mi = 2

2.5. EXERCICES CORRIGES

27

mi xi = 2246180. Commencons par pr ciser M = 24.5, X = 1750, V(M ) = 191.92, e V(X) = 129550 et Cov(M, X) = 3920.4. Lajustement afne de cette s rie par la m thode e e des moindres carr s est donn par la droite D d quation x = am + b, o` e e e u a= Cov(M, X) et b = X aM , V(M )

ce qui donne num riquement, l quation x = 2.4251m + 1690.6 puisque e e a= 3920.4 = 20.4277 et b = 1750 (20.4277)24.5 = 1249.5 . 191.92

c) Mod` le pour linuence saisonni` re On choisit un mod le additif, car lamplitude des e e e creux (mois dao t) ne varie pas avec les ann es. u e d) Calcul des coefcients saisonniers On va ici calculer les coefcients saisonniers sur une p riode de 1 an. Autrement dit on doit d terminer 12 coefcient j . Plus pr cisemment on e e e ecrit, pour j = 1, . . . , 12, 1 j = (Xj + X12+j + X24+j + X36+j ) 4 On obtient les r sultats suivants : 1 = (1230 + 1590 + 1750 + 1840)/4 = 1602.5, 2 = e (1280+1640+1650+1790)/4 = 1590, . . . , 12 = (1550+1670+1780+2270)/4 = 1817.5 (voir tableau). e) Moyenne des coefcients saisonniers on a simplement 1 = 12
12

j =
j=1

21000 1 (1602.5 + 1590 + + 1817.5) = = 1750 . 12 12

On en d duit les CVS, gr ce a la formule j = j (mod` le additif). Par exemple e a ` e 1 = 1 = 1602.5 1750 = 147.5 , 2 = 2 = 1590 1750 = 160.0 , . . . , 12 = 12 = 1817.5 1750 = 67.5 .

f) S rie corrig es des variations saisonni` res La s rie corrig e des variations saisonni` res e e e e e e est obtenue simplement en ecrivant que o` , on a not (Yn ) la s rie corrig e des variations saisonni` res (voir le tableau). On a par u e e e e exemple Y1 = X1 1 , Y2 = X2 2 , . . . , Y12 = X12 12 , Y13 = X13 1 , Y14 = e X14 2 , . . . , Y25 = X25 1 , etc., soit num riquement Y1 = 1230 (147.5) = 1377.5, Y2 = 1280 (160) = 1440, . . . , Y13 = 1590 (147.5) = 1737.5, etc.. g) Chiffre daffaires en 1993 On commence par r sum les r sultats pr c dents dans le e e e e e tableau suivant Y12(i1)+j = X12(i1)+j j

28

CHAPITRE 2. SERIES CHRONOLOGIQUES

m/a jan. f v. e mars avr. mai juin jui. aout sep. oct. nov. d c. e

1989 1230 1280 1400 1600 1450 1390 1280 930 1080 1400 1500 1550

1990 1590 1640 1800 1990 1870 1910 1670 1260 1430 1780 1750 1670

1991 1750 1650 1800 1900 1950 1910 1980 1410 1520 1920 1900 1780

1992 1840 1790 2370 2360 2280 2510 2320 1870 1820 2210 2440 2270

j CVS 1602.5 147.5 1590 160 1842.5 92.5 1962.5 212.5 1887.5 137.5 1930 180 1812.5 62.5 1367.5 382.5 1462.5 287.5 1827.5 77.5 1897.5 147.5 1817.5 67.5

1989(c) 1990(c) 1991(c) 1992(c) 1993(l) 1993 1377.5 1737.5 1897.5 1987.5 2250.5 2103 1440 1800 1810 1950 2270.9 2110.9 1307.5 1707.5 1707.5 2277.5 2291.3 2383.8 1387.5 1777.5 1687.5 2147.5 2311.8 2524.3 1312.5 1732.5 1812.5 2142.5 2332.2 2469.7 1210 1730 1730 2330 2352.6 2532.6 1217.5 1607.5 1917.5 2257.5 2373 2435.5 1312.5 1642.5 1792.5 2252.5 2393.5 2011 1367.5 1717.5 1807.5 2107.5 2413.9 2126.4 1322.5 1702.5 1842.5 2132.5 2434.3 2511.8 1352.5 1602.5 1752.5 2292.5 2454.8 2602.3 1482.5 1602.5 1712.5 2202.5 2475.2 2542.7

Les deux derni` res colonnes repr sentent les valeurs pr dites. Plus pr cisemment lavant e e e e derni` re colonne repr sente les pr visions de la s rie corrig e des variations saisonni` res Y n e e e e e e donn es par e Yn = a n + b , n = 49, . . . , 60. Ces valeurs de n correspondent aux 12 mois de lann e 1993. La derni` re colonne est la e e pr vision de la s rie Xn donn e par e e e Xn = Yn + n48 . En r alit , on devrait ecrire X12(i1)+j = Y12(i1)+j) + j pour i = 5 (correspond a lann e e e ` e 1993) et pour tout j = 1, 2, . . . , 12. On repr sente la s rie corrig e des variations saisonni` res ainsi que les pr visions efe e e e e fectu es sur le graphique suivant e
2800 2600 2400 2200 chiffre daffaires 2000 1800 1600 1400 1200 1000 800 0 10 20 30 mois 40 50 60

Figure 14. Pr visions pour lann e 1993. La courbe grise e e repr sente la s rie corrig e des variations saisonni` res. Les e e e e courbes en pointill repr sentent les valeurs pr dites. e e e

2.5. EXERCICES CORRIGES

29

Exercice 2.4. Le tableau ci-dessous donne les valeurs des indices trimestriels (base 1985) de la production des boissons pour les ann es 1991 a 1994 (source INSEE). e ` 1991 1992 1993 1994
` ` ` 1er trimestre 2eme trimestre 3eme trimestre 4eme trimestre 103.3 114.4 112.9 129.3 98.7 120.5 107.7 131.5 100.1 120.6 115.8 132.9 100.3 116.8 124.5 143.0

a) Repr sentation de la s rie chronologique. On note T la s rie donnant le rang du trim` stre e e e e et X la s rie donnant la valeur des indices trimestriels. La taille de ces s ries vaut N = 16. e e
145 140 135 indices de la production 130 125 120 115 110 105 100 95 0 2 4 6 8 trimestre 10 12 14 16

Figure 15. Evolution de lindice trimestriel de 1991 a 1994. ` b) Calcul des moyennes mobiles d centr es dordre 4 et repr sentation de la s rie obtenue e e e e Par d nition, on a pour tout i = 4, 5, . . . , 16, e 1 1 xi = mi = 4 j=i3 4 Do` u m4 m5 m6 = 1 (x1 + x2 + x3 + x4 ) 4 1 = (x2 + x3 + x4 + x5 ) 4 1 (x3 + x4 + x5 + x6 ) = 4 . . . 1 (103.3 + 114.4 + 112.9 + 129.3) = 114.975 , 4 1 = (114.4 + 112.9 + 129.3 + 98.7) = 113.825 , 4 1 = (112.9 + 129.3 + 98.7 + 120.5) = 115.35 , 4 . . . . . . = 121.15 .
i 3

xij .
j=0

m16 =

1 1 (x13 + x14 + x15 + x16 ) = (100.3 + 116.8 + 124.5 + 143.0) = 4 4

30
145 140 135 indices de la production 130 125 120 115 110 105 100 95 0

CHAPITRE 2. SERIES CHRONOLOGIQUES

8 trimestre

10

12

14

16

Figure 16. dordre 4.

Repr sentation des moyennes mobiles d centr es e e e

c) Calcul des coefcients de variations saisonni` res On calcule les variations saisonni` res e e sur une ann e (= 4 trimestres). Cest-` -dire quon calcule j pour j = 1, 2, 3, 4, o` j = e a u 4 1 i=1 X4(i1)+j . On a alors 4 1 1 1 = (X1 + X5 + X9 + X13 ) = (103.3 + 98.7 + 100.1 + 100.3) = 100.6 4 4 1 1 2 = (X2 + X6 + X10 + X14 ) = (114.4 + 120.5 + 120.6 + 116.8) = 118.075 4 4 1 1 3 = (X3 + X7 + X11 + X15 ) = (112.9 + 107.7 + 115.8 + 124.5) = 115.225 4 4 1 1 4 = (X4 + X8 + X12 + X16 ) = (129.3 + 131.5 + 132.9 + 143.0) = 134.175 4 4

et

1 1 = (1 + 2 + 3 + 4 ) = (100.6 + 118.075 + 115.225 + 134.175) = 117.0188 . 4 4 Pour calculer les coefcients de variations saisonni` res, on ecrit (mod` le multiplicatif) j = e e j /, soit 1 = 100.6/117.0188 = 0.8597, 2 = 118.075/117.0188 = 1.0090, 3 = 115.225/117.0188 = 0.9847, 4 = 134.175/117.0188 = 1.1466. On a indiqu ces r sultats e e dans le tableau ci-dessous. d) S rie corrig e des variations saisonni` res La s rie corrig e des variations saisonni` res est e e e e e e obtenue simplement en ecrivant que X4(i1)+j Y4(i1)+j = j o` , on a not (Yn ) la s rie corrig e des variations saisonni` res (voir le tableau). On a par u e e e e exemple Y1 = X1 /1 , Y2 = X2 /2 , . . . , Y4 = X4 /4 , Y5 = X5 /1 , Y6 = X6 /2 , . . . , Y9 =

2.5. EXERCICES CORRIGES

31

X9 /1 , etc., soit num riquement Y1 = 103.3/0.8597 = 120.1594, Y2 = 114.4/1.009 = e 114.8087, . . . , Y5 = 98.7/0.8597 = 113.3766, etc.. e) Previsions pour lann e 1995 On r sume les calculs pr c dents (hormis les moyennes e e e e mobiles) dans le tableau ci-dessous
` ` ` 1er trimestre 2eme trimestre 3eme trimestre 4eme trimestre 1991 103.3 114.4 112.9 129.3 1992 98.7 120.5 107.7 131.5 1993 100.1 120.6 115.8 132.9 1994 100.3 116.8 124.5 143.0 j 100.6 118.075 115.225 134.175 CVS 0.8597 1.009 0.9847 1.1466 1991(c) 120.1594 114.8087 116.4371 116.6698 1992(c) 113.3766 119.4221 119.5212 115.7552 1993(c) 114.6576 109.3766 117.6027 126.4381 1994(c) 112.7671 114.6858 115.9068 124.7153 1995 (liss ) 126.1675 e 127.2438 128.3201 129.3965 1995 108.4651 128.3924 126.3532 148.3674

Les deux derni` res lignes repr sentent les valeurs pr dites. e e e Plus pr cisemment, on pose, pour n = 17, 18, 19, 20 (correspond au 4 trimestres de e lann e 1995), e Yn = an + b , o` a et b sont tels que la droite d quation y = ax + b r alise un ajustement afne de la s rie u e e e (T, X), o` T est la variable explicative (on rappelle qualors a = Cov(T, X)/V(T ) et b = u X aT ). On ne fait pas le calcul ici. Num riquement, on trouve a = 1.0763 et b = 107.87, e et ainsi Y17 = 1.0763 17 + 107.87 = 126.1675, Y18 = 1.0763 18 + 107.87 = 127.2438, , Y20 = 1.0763 20 + 107.87 = 129.3965 sont les valeurs pr dites pour la s rie corrig e e e e des variations saisonni` res. e Pour prendre en consid ration les variations saisonni` res on doit multiplier (mod` le mule e e tiplicatif) cette s rie par les CVS, cest-` -dire que lon pr dit, pour n = 17, 18, 19, 20, e a e (en r alit , il faudrait ecrire X4(i1)+j = Y4(i1)+j j pour i = 5 (correspond a lann e 1995) e e ` e et pour tout j = 1, 2, 3, 4). Ainsi X17 = Y17 1 = 126.1675 0.8597 = 108.4651 , X18 = Y18 2 = 127.2438 1.009 = 128.3924 , . . . X20 = Y20 2 = 129.3965 1.1466 = 148.3674 sont les pr visions des indices trimestriels pour lann e 1995. e e On a repr sent ces pr visions sur le graphique suivant e e e Xn = Yn (n16) ,

32
150

CHAPITRE 2. SERIES CHRONOLOGIQUES

140

indices de la production

130

120

110

100

90 0

10 12 trimestre

14

16

18

20

Figure 17. Pr visions pour lann e 1995. Les courbes en pointill e e e repr sentent les valeurs pr dites. e e

Vous aimerez peut-être aussi