Vous êtes sur la page 1sur 247

Mohamed DIOURI Adil ELMARHOUM

Docteur Ingnieur Docteur en statistique et informatique applique


Prsident Fondateur de lIGA Professeur Habilit Universit Mohamed V Agdal

STATISTIQUE DESCRIPTIVE
Cours et exercices
Collection Sciences Techniques et Managements des ditions TOUBKAL
Publications du Centre de Recherche en Mathmatiques (CRM) de lIGA

STATISTIQUE DESCRIPTIVE
Cours et exercices

Tous les droits sont rservs


Dpt lgal N2006/2774
I.S.S.N. 9954 496 03 3

Les livres de la collection Sciences Techniques et Management


sont co-dits par les ditions TOUBKAL et lInstitut suprieur du Gnie Appliqu, IGA.
3
A la mmoire de Myriam
M D

A mes chers enfants Zineb et Adam


A.E
LIMINAIRE

On dit souvent que lon peut faire dire ce quon veut aux statistiques ! Cest bien connu,
entre le verre moiti plein et le verre moiti vide la diffrence dinterprtation nous
interpelle, mais avant de pouvoir interprter un ensemble de donnes, il est indispensable de
savoir comment reprsenter, dans un tableau ou par un graphique, une srie statistique,
comment en faire les premiers traitements et surtout comment prsenter les rsultats de ces
calculs.

Ce sont l, les objectifs de ce livre !

Le prsent livre est un livre de cours.

La mthode adopte peut se rsumer dans les deux points suivants :

- Chaque chapitre est trait dune faon exhaustive pour englober tous les concepts et
toutes les dmonstrations des formules statistiques.
Il renferme, en plus, un ensemble dexemples dapplication avec solutions et surtout les
mthodes de rsolution.
- A la fin de chaque chapitre, le lecteur trouvera, ensuite un ensemble dexercices
dapplication qui lui permettra de sentraner rsoudre des problmes classiques de
statistique.

Signalons, cet effet, que pour toutes les solutions proposes pour les exemples, nous avons
utilis lordinateur avec des logiciels de graphisme et de gestionnaires de tableaux et nous
encourageons vivement autant les tudiants que les professeurs den faire de mme pour tout
problme de statistique.

Cette utilisation de lordinateur nous amne avertir nos lecteurs que les rsultats des
calculs donns dans les tableaux et ailleurs diffreront de ceux quon pourrait obtenir grce
une calculette pour la simple raison que la puissance de prcision dun ordinateur ne peut
jamais tre gale par une calculette.
Ce livre est ainsi destin aux tudiants qui dsirent acqurir une certaine adresse la
rsolution de problmes de statistique descriptive et aux professeurs qui recherchent un
ensemble dexercices didactiques de statistique descriptive proposer la rflexion de leurs
tudiants.

Les auteurs

Casablanca, octobre 2006.


SOMMAIRE

INTRODUCTION 9
PARTIE 1- STATISTIQUE DESCRIPTIVE A UNE SEULE VARIABLE 13
CH. 1. TABLEAUX ET GRAPHIQUES 15
1.1. Tableaux statistiques 15
1.2. Reprsentations graphiques 28
1.3. Exercices dapplication 37
CH. 2. CARACTERISTIQUES DE TENDANCE CENTRALE 43
2.1. Les moyennes 43
2.2. Le mode 61
2.3. La mdiane 63
2.4. La mdiale 66
2.5. Les fractiles 69
2.6. Exercices dapplication 73
CH. 3. CARACTERISTIQUES DE DISPERSION 78
3.1. Ecart absolu moyen 78
3.2. Variance 82
3.3. Ecart type 86
3.4. Coefficient de variation 87
3.5. Indice de concentration 93
3.6. Exercices dapplication 104
PARTIE 2 - STATISTIQUE DESCRIPTIVE A DEUX VARIABLES 111
CH. 4. REGRESSION ET CORRELATION 113
4.1. Introduction 113
4.2. Rgression simple 113
4.3. Qualit de lajustement 130
4.4. Calcul des prvisions 137
4.5. Rgression non linaire simple 138
4.6. Rgression multiple 142
4.7. Exercices dapplication 153
CH. 5. LES SERIES CHRONOLOGIQUES 163
5.1. Dfinition 163
5.2. Reprsentation graphique 164
5.3. Les principaux mouvements des sries chronologiques 166
5.4. Les schmas de composition 167
5.5. Les mthodes de lissage 169
5.6. Etude du trend 178
5.7. Etude de la composante saisonnire 183
5.8. Exercices dapplication 195
CH. 6. INDICES STATISTIQUES 205
6.1. Les indices lmentaires 205
6.2. Les indices synthtiques 211
6.3. Les indices synthtiques pondrs 216
6.4. Les principaux indices synthtiques 217
6.5. Lindice des prix la consommation 220
6.6. Indices boursiers 233
6.7. Exercices dapplication 234
BIBLIOGRAPHIE 246
Statistique descriptive Introduction

INTRODUCTION

HISTORIQUE.

Lactivit qui consiste recueillir des donnes permettant de connatre la situation des tats
remonte la plus haute antiquit. On cite, dune part, lempereur chinois Yao, organisant le
recensement des productions agricoles en 2238 avant J.-C., et, dautre part, linstitution des
recensements de la population chez les gyptiens, en 1700 avant J.-C.

Au dbut du XVIe sicle, on commena tenir en Angleterre un registre des dcs et des
naissances. En France, les intendants Sully, Colbert et Vauban commandrent de nombreux
inventaires et enqutes. En 1662, l'Anglais John Graunt constata une certaine constance dans le
rapport du nombre de naissances fminines celui des naissances masculines.

On attribue la cration du terme statistique un professeur allemand Gttingen,


G. Achenwall (1719-1772), qui aurait en 1746 cr le mot Statistik, driv de la notion
Staatskunde.

Mais c'est seulement au XIXe sicle qu'on dcouvrit que la thorie des probabilits pouvait
constituer une aide prcieuse la mthode statistique. Ce rapprochement, dj peru par le
mathmaticien Laplace, fut l'uvre d'Adolphe Qutelet (1796-1874), statisticien belge qui fut
l'initiative du premier congrs international de statistiques en 1853. Ds lors, la statistique se
dveloppa dans la plupart des sciences.

Lapparition dune relle mthodologie statistique a t initie par des statisticiens anglais
autour de 1900. Cest--dire une thorie bien formalise du raisonnement qui permet, partir
des donnes observes, de tirer des conclusions sur les lois de probabilit des phnomnes.
Cest la statistique mathmatique, qui sest dveloppe entre 1900 et 1950 et dont les succs
ont impos, au cours de cette priode, une interprtation particulire du concept de probabilit.

9
Statistique descriptive Introduction

partir des annes cinquante, lapparition de calculateurs puissants a donn naissance aux
mthodes danalyse des donnes multidimensionnelles, qui ont connu une grande vogue,
parfaitement justifie par leur efficacit. Ces mthodes permettent de dcrire, de classer et de
simplifier des donnes, les rsultats auxquels elles conduisent peuvent suggrer des lois, des
modles ou des explications des phnomnes.

Aujourd'hui, les statistiques sont considres comme des outils fiables qui peuvent fournir
une reprsentation exacte des valeurs de donnes conomiques, politiques, sociales,
psychologiques, biologiques ou physiques. Elles permettent de mettre en corrlation de telles
donnes et de les analyser. Le travail du statisticien ne se limite plus recueillir des donnes et
les prsenter sous forme de tableaux, mais il consiste principalement interprter
l'information.

DEFINITION.

Statistique, une discipline qui a pour objet la collecte, le traitement et l'analyse de donnes
numriques relatives un ensemble d'individus ou d'lments. Elle constitue un outil prcieux
pour l'exprimentation, la gestion des entreprises ou encore l'aide la dcision.

Une tude statistique se dcompose en quatre tapes : la dfinition et la collecte des


donnes, leur prsentation en tableaux, leur analyse et enfin la comparaison des rsultats avec
des lois statistiques connues.

1 - Dfinition et collecte des donnes

La matire premire des mthodes statistiques est constitue d'ensembles de nombres,


obtenus en comptant ou en mesurant des lments. Il est donc indispensable, lors de la collecte
de donnes statistiques, de s'assurer de l'exhaustivit et de la fiabilit des informations
recueillies.

Avant la collecte des donnes, on commence par dfinir la nature et la quantit des donnes
recueillir. Cette collecte s'effectue par recensement ou par sondage. Les donnes recueillies
peuvent faire l'objet d'une vrification partielle par mesure de scurit.

2 - Reprsentation des donnes

Les donnes recueillies sont classes et ranges dans des tableaux de faon permettre une
analyse et une interprtation directes. Ensuite, On peut reprsenter graphiquement les donnes
du tableau.

10
Statistique descriptive Introduction

3 - Analyse des donnes

Une fois les donnes recueillies et prsentes sous forme de tableaux, le travail d'analyse
commence par le calcul d'un paramtre statistique qui puisse rsumer lui seul l'ensemble des
donnes. On distingue trois types de paramtres statistiques :

- Tendance centrale : elle sert caractriser l'ordre de grandeur des observations ;


- Dispersion : elle sert savoir si les mesures sont troitement regroupes autour de la
moyenne ou si elles sont disperses ;
- Corrlation : elle sert tudier la relation qui peut exister entre deux phnomnes.

4 - Comparaison des rsultats avec des lois statistiques

Les statisticiens se sont aperus que de nombreux ensembles de mesures avaient le mme
type de distribution. Ils ont donc t amens concevoir des modles mathmatiques qui soient
le reflet des lois statistiques souvent rencontres. La comparaison des rsultats avec ces lois
statistiques permet de donner une explication du phnomne observ et en vrifier le bien
fond.

Dans le prsent ouvrage, nous nous proposons de montrer comment reprsenter les donnes
recueillies et comment en faire le traitement en exposant successivement les mthodes de calcul
des 3 paramtres statistiques que sont les paramtres de tendance centrale, ceux de dispersion et
ceux de corrlation.

Les mthodes de collecte de donne et celles de la comparaison des rsultats de leurs


traitements avec des lois statistiques feront lobjet dun autre ouvrage.

11
Statistique descriptive Introduction

12
Statistique descriptive Partie 1 : statistique descriptive une variable

PARTIE 1
STATISTIQUE DESCRIPTIVE A UNE VARIABLE

La statistique descriptive une variable est lensemble des mthodes qui permet dobtenir et
de faire un 1er traitement des informations relatives un caractre particulier dindividus dune
population donne.

La statistique descriptive a plusieurs objectifs :

- recueillir lensemble des donnes relatives un caractre particulier dindividus dune


population donne ;

- classer lensemble de ces donnes selon des sries statistiques afin de permettre den
faire :
* des reprsentations graphiques pour en visualiser lallure ;
* des traitements mathmatiques pour en dterminer certaines caractristiques.

Dans cette partie, nous axerons notre propos, dabord sur la dfinition des diffrents
concepts que nous venons dintroduire, ensuite sur les premiers traitements mathmatiques en
vue de la dtermination de certaines caractristiques.

13
Statistique descriptive Partie 1 : statistique descriptive une variable

14
Statistique descriptive 1. Tableaux et graphiques

CHAPITRE 1
TABLEAUX ET GRAPHIQUES

1.1. TABLEAUX STATISTIQUES.

Nous donnons dans ce qui suit la dfinition des principaux concepts de la statistique.

Population : ensemble dlments ou dindividus ayant un caractre commun tudier.

Exemples 1 :
Ensemble des tudiants dune cole ;
Ensemble des habitants dune ville ;
Ensemble des livres dune bibliothque ;
Ensemble de la production dune entreprise pendant un an ;
Etc.

Echantillon : partie de la population. Du fait de la taille importante de la population et de


limpossibilit den faire ltude exhaustive, on se contente, le plus souvent, dtudier le
caractre daprs un chantillon.

Lchantillon doit tre choisi de faon quil soit reprsentatif, pour ce faire il existe des
mthodes de tri en vue de la constitution dchantillon. Elles font lobjet dtudes spcifiques.

Exemples 2 :
Lensemble des tudiants dune salle de classe dune cole ;
Lensemble dun millier dhabitants choisi parmi tous les habitants dune ville ;
Lensemble dune centaine de livre tri parmi tous les livres dune bibliothque ;
La production dune entreprise pendant quelques jours ;
Etc.

Individu : lment de base constituant la population ou lchantillon, on dit aussi, unit


statistique.
Exemples 3 :
15
Statistique descriptive 1. Tableaux et graphiques

Ltudiant dune cole ;


Lhabitant dune ville ;
Le livre dune bibliothque ;
lunit produite par une entreprise ;
Etc.

Effectif : nombre dindividus observs constituant lchantillon, il est not n.

Exemples 4 :
n = 30 sil y a 30 tudiants dans lchantillon ;
n = 2000 sil y a 2000 habitants dans lchantillon ;
n = 125 sil y a 125 livres dans lchantillon ;
n = 15 000 sil y a 15 000 units produites constituant lchantillon ;
etc.

Caractre : Aspect particulier commun tous les individus de la population et donc de


lchantillon. Le caractre peut tre qualitatif ou quantitatif et dans ce cas il peut tre discret ou
continu.

Exemples 5 :
Notes des tudiants dune cole ;
Situations familiales des habitants dune ville ;
Thmes des livres dune bibliothque ;
Poids des units produites par une entreprise ;
Etc.

Modalits : Ce sont les diffrentes possibilits que peut prendre le caractre, par exemple
fminin ou masculin si le caractre est le sexe et 1,50 m ou 1,70 m si le caractre est la taille,
etc.

Caractre qualitatif : Un caractre est dit qualitatif quand il ne peut pas tre mesur.

Exemples 6 : Le tableau ci-dessous liste quelques exemples de caractres qualitatifs et de


modalits :

Caractres Modalits Genres


Couleur Rose, rouge, blanc, bleu, Qualitatif
Nationalit Marocain, Franais, Suisse, Qualitatif
Situation matrimoniale Mari, clibataire, veuf, divorc, Qualitatif
Disponibilit Oui, non. Qualitatif

16
Statistique descriptive 1. Tableaux et graphiques

Pour chaque modalit i du caractre tudier, on dtermine, pour lchantillon considr,


de taille n :

ni : effectif dindividus chez qui a t observe la modalit i.

fi = ni / n : frquence relative de la modalit i.

k k
Avec ni n et fi 1
i1 i1
Exemples 7 : Dans un chantillon de 2000 habitants dune ville, en relve que 900
personnes sont maries, on a ainsi, pour la modalit habitants maris :

ni = 900 et fi = 900/2000 = 45 % ;

- Dans une bibliothque constitue de 5000 livres on relve que 120 livres ont pour thme
les mathmatiques, on a ainsi pour la modalit livres de mathmatiques :

ni = 120 et fi = 120/5000 = 2,4 %

- On considre lensemble des touristes qui visitent le Maroc pendant une priode donne et
on considre comme caractre la nationalit. Si lon relve quil y a 300 Franais parmi un
ensemble de 900 touristes on a pour la modalit nationalit franaise :

ni = 300 et fi = 300/900 = 33,33 %

Caractre quantitatif : Un caractre est dit quantitatif quand il peut tre mesur. Il peut
alors tre continu ou discret :
- il est discret dans le cas doprations de dnombrement ou de comptage ;
- il est continu dans le cas doprations de mesures.

Exemples 8 : Le tableau ci-dessous donne quelques exemples de caractres quantitatifs et


de modalits.
Caractres Modalits Genres
Poids 60,5 Kg; 59,2 Kg; 65,3 Kg; Continu
Anciennet en entreprise 10 ans et 2 mois ; 9ans ; Continu
Volume 1 m3 ; 2,3 m3 ; 3 m3 ; Continu
Longueur 1 m ; 2,75 km ; 350 dm ; Continu
Notation 10/20 ; 9,5/10 ; Continu
Annes dtudes 2 ans ; 3 ans ; 6 ans ; Discret
Nombre de frres et surs 1;2;3; Discret
Nombre denfants 0;1;2; Discret
17
Statistique descriptive 1. Tableaux et graphiques

On dtermine pour chaque caractre quantitatif :

Si le caractre est discret : xi la valeur de la modalit ;

ni : effectif dindividus chez qui, la modalit i, a t observe.

fi = ni / n : frquence relative de la modalit i.

j i
Fi : f
j 1
j frquence relative cumule croissante.

F(x) : Fonction de rpartition, proportion dindividus ayant des modalits du caractre


tudi infrieures ou gales x.

Exemple 9 : On considre le poids des habitants dune ville comme caractre, on a, pour un
chantillon, la distribution suivante :

Poids Effectifs concerns Frquences relatives Frquences relatives


xi ni fi cumules Fi
65Kg 54 21.86% 21.86%
70Kg 132 53.44% 75.30%
75Kg 27 10.93% 86.23%
80Kg 34 13.77% 100.00%
Total 247 100% -

Unit statistique : habitant de la ville ;


Population : lensemble des habitants de la ville ;
Caractre tudi : le poids ;
Type de caractre : variable statistique discrte. (dans le cas de lexemple).

La fonction de rpartition F(x) se dfinit comme suit :


Pour x 65 Kg, on a : F(x) = 21,86% ou 21,86 % de lchantillon ont un poids infrieur ou
gal 65 Kg.
Pour x 70 Kg, on a : F(x) = 75.30% ou 75,30 % de lchantillon ont un poids infrieur ou
gal 70 Kg.
Pour x 75 Kg, on a : F(x) = 86.23% ou 86,23 % de lchantillon psent au plus 75 Kg.
Pour x 80 Kg, on a : F(x) = 100.00 % ou la totalit de lchantillon a un poids infrieur ou
gal 80 Kg.

Exemple 10 : une enqute auprs de 1000 commerants portant sur le nombre de leurs
employs, a donn les rsultats suivants :
18
Statistique descriptive 1. Tableaux et graphiques

Frquence Frquence Frquence Frquence


absolue absolue relative relative
xi ni fi
cumule cumule cumule cumule
croissante dcroissante croissante dcroissante
0 50 5% 50 1000 5% 100 %
1 100 10 % 150 950 15 % 95 %
2 200 20 % 350 850 35 % 85 %
3 150 15 % 500 650 50 % 65 %
4 120 12 % 620 500 62 % 50 %
5 160 16 % 780 380 78 % 38 %
6 130 13 % 910 220 91 % 22 %
7 90 9% 1000 90 100 % 9%
Total 1000 100 % - - - -

Unit statistique : Un commerant ;


Population : lensemble des 1000 commerants ;
Caractre tudi : Nombre demploys ;
Type de caractre : Variable statistique discrte.

Le nombre de commerants n'employant aucun employ est 50, ce qui reprsente 5 % des
commerants.

Les frquences absolues ou relatives cumules croissantes sont calcules en cumulant les
frquences absolues ou relatives du haut du tableau vers le bas. Elles permettent de rpondre
aux questions du genre : quel est le nombre ou la proportion au plus ?

Par contre, les frquences absolues ou relatives cumules dcroissantes sont calcules en
cumulant les frquences absolues ou relatives du bas du tableau vers le haut. Elles permettent
de rpondre aux questions du genre : quel est le nombre ou la proportion au moins (au
minimum ou plus de) ?

Le nombre de commerants employant au plus 5 employs (au maximum 5 employs ou


moins de 6 employs) est 780, ils reprsentent 78 % des commerants.

Le nombre de commerants employant au moins 3 employs (au minimum 3 employs ou


plus de 2 employs) est 650, ils reprsentent 65% des commerants.

19
Statistique descriptive 1. Tableaux et graphiques

Si le caractre est continu : [Ci ; Ci+1[ est lintervalle ou classe des modalits avec :
Ci et Ci+1 les bornes de la classe ;
ci : centre de la classe ;
ai : amplitude de la classe ;
di : densit de la classe.
ni : effectif de la classe i, nombre dindividus dont la modalit du caractre est
comprise entre Ci et Ci+1.
C i 1 C i
ci = , ai = Ci+1 Ci et di = ni/ai
2
De la mme manire que dans le cas discret, on dfinit :
fi = ni / n : frquence relative de la modalit i.
j i
Fi : f
j 1
j frquence relative cumule croissante.

Exemple 11 : On considre la taille comme caractre, on a pour un chantillon de 169


personnes, la distribution suivante :

Effectifs Frquences Frquences


Tailles (en m) ci
concerns relatives relatives cumules
Ci ; Ci+1 (en m)
ni fi Fi
[1,50 ; 1,60[ 1.55 35 20,71 % 20,71 %
[1,60 ; 1,70[ 1.65 42 24,85 % 45,56 %
[1,70 ; 1,80[ 1.75 53 31,36 % 76,92 %
[1,80 ; 1,90[ 1.85 39 23,08 % 100 %
Total - 169 100 % -

Parmi les 169 personnes, 35 mesurent entre 1,50 m et moins de 1,60 m, ce qui reprsente
20,71 % de lensemble de lchantillon.
76,92 % de lchantillon mesurent moins de 1,80 m.
Le fait de remplacer la classe Ci ; Ci+1 par ci permet de faire des calculs car on ne sait pas
faire des calculs sur des intervalles.
Srie statistique : Une srie statistique est lensemble constitu des xi et ni. On parle aussi
de distribution statistique une seule variable, comme par exemple :
Tailles et effectifs ;
Situations matrimoniales et effectifs ;
Ages et effectifs.
Etc.

20
Statistique descriptive 1. Tableaux et graphiques

Question 1 : Comment passer dune srie statistique relative un caractre discret ou


continu donne sous forme dune suite de classes [Ci ; Ci+1[et deffectifs ni de ces classes une
srie statistique sous forme dune suite de valeurs xi et deffectifs ni relatifs ces valeurs ?

On doit considrer 2 cas possibles :


1 cas : Classes amplitudes gales.

Il suffit, dans ce cas, de remplacer chaque classe [Ci ; Ci+1[ par son lment central ci = ( Ci
+ Ci+1 ) / 2 auquel il faut affecter leffectif ni.

Exemple 12 : On considre la srie statistique relative aux poids dun chantillon de 120
habitants dune ville, elle se prsente comme lindique le tableau suivant :

Poids (kg) Effectifs


Ci ; Ci+1 ni
[55 ; 60[ 5
[60 ; 65[ 14
[65 ; 70[ 20
[70 ; 75[ 40
[75 ; 80[ 18
[80 ; 85[ 15
[85 ; 90[ 8
Total 120

Unit statistique : Habitant dune ville ;


Population : Lensemble des habitants dune ville ;
Caractre tudi : Le poids de lhabitant ;
Type de caractre : Variable statistique continue.

On remplace chaque classe par le centre de cette classe, on obtient alors la srie quivalente
suivante :
Poids (kg) Effectifs Frquence relative
ci ni fi
57,5 5 4.17%
62,5 14 11.67%
67,5 20 16.67%
72,5 40 33.33%
77,5 18 15.00%
82,5 15 12.50%
87,5 8 6.67%
Total 120 100%

21
Statistique descriptive 1. Tableaux et graphiques

Exemple 13 : On considre la srie statistique relative aux notes obtenues dans une matire,
par les tudiants dune classe dcole :

Notes Effectifs
Ci ; Ci+1 ni
6 ; 8 2
8 ; 10 6
10 ; 12 12
12 ; 14 7
14 ; 16 3
Total 30

Unit statistique : Un tudiant ;


Population : Lensemble des tudiants dune classe dcole
Caractre : Note dtudiant
Type de caractre : Variable statistique continue

On remplace chaque classe par le centre de cette classe, on obtient alors la srie quivalente
suivante :

Notes Effectifs Frquences relatives


ci xi fi
7 2 6.67%
9 6 20%
11 12 40%
13 7 23.33%
15 3 10%
Total 30 100%

2 cas : Classes amplitudes diffrentes.

Il suffit, dans ce cas :


- de considrer les amplitudes des diffrentes classes ;
- de calculer leur Plus Grand Commun Diviseur (PGCD) ;
- de diviser chaque classe par le PGCD pour obtenir plusieurs sous classes qui
deviennent de nouvelles classes ;
- Daffecter chaque nouvelle classe, le quotient de leffectif de la classe mre par le
nombre de sous classes.

Remarquons que cette mthode repose sur lhypothse simple suivante qui consiste
admettre que les effectifs se rpartissent de faon rgulire dans une classe.

22
Statistique descriptive 1. Tableaux et graphiques

Exemple 14 : Reprenons lexemple 13 et considrons la srie statistique relative aux notes


obtenues dans une autre matire, par les tudiants dune classe dcole :

Notes Effectifs
Ci ; Ci+1 ni
[0 ; 6[ 6
6 ; 8 4
8 ; 14 12
14 ; 18 4

Unit statistique : Un tudiant ;


Population : Lensemble des tudiants dune classe dcole
Caractre : Note dtudiant
Type de caractre : Variable statistique continue

Dans cette srie, les amplitudes des diffrentes classes sont : 6 ; 2 ; 6 ; 4. Leur PGCD est 2.
On remplace chaque classe par plusieurs autres classes et on obtient alors la srie quivalente
suivante :

Notes Effectifs
Ci ; Ci+1 ni
[0 ; 2[ 2
[2 ; 4[ 2
[4 ; 6[ 2
6 ; 8 4
8 ; 10 4
10 ; 12 4
12 ; 14 4
[14 ; 16 2
16 ; 18[ 2

23
Statistique descriptive 1. Tableaux et graphiques

On remplace, aprs cette opration, chaque classe par le centre de cette classe, on obtient
alors la srie quivalente suivante :

Notes Effectifs
ci
Ci ; Ci+1 ni
[0 ; 2[ 1 2
[2 ; 4[ 3 2
[4 ; 6[ 5 2
6 ; 8 7 4
8 ; 10 9 4
10 ; 12 11 4
12 ; 14 13 4
[14 ; 16 15 2
16 ; 18[ 17 2

Remarque : Ainsi on peut considrer que toute srie statistique est donne, selon les
besoins du traitement numrique :

- Soit sous forme dune suite de classes [Ci ; Ci+1[et deffectifs ni.
- Soit sous forme dune suite de valeurs xi et deffectifs ni

Question 2 : Comment passer dune srie statistique relative un caractre discret ou


continu donne sous forme dune suite de valeurs xi une srie donne sous forme dune suite
de classes [Ci , Ci+1[ et deffectifs ni par classe ?

Pour ce faire, on utilise la rgle de STURGES donnant le nombre k de classes en fonction


du nombre n des donnes :

k = 1 + 3,322 log10 n

Ce calcul donne un nombre rel, on prend alors pour k le nombre entier trs proche du
rsultat de calcul de la formule prcdente.

Et tant ltendue E de toute la srie statistique, on dtermine e, tendue de chaque classe :

e = E / k avec E = xmax - xmin

xmax et xmin tant la valeur maximale et la valeur minimale prises par le caractre, les
diffrentes classes seront alors :

La borne infrieure de la premire classe C1 est gale xmin ou une valeur lgrement
infrieure xmin.
24
Statistique descriptive 1. Tableaux et graphiques

C1 ; C1+e
C1+e ; C1+2e
C1+2e ; C1+3e

C1+(k-1)e ; C1+ke

Exemple 15 : En prenant la taille comme caractre des habitants dune ville on a les
rsultats relatifs un chantillon de 169 habitants :

Tailles (en m) Effectifs concerns


xi ni
1.45 5
1.55 30
1.65 42
1.75 53
1.85 39
Total 169

Unit statistique : Habitants dune ville;


Population : Lensemble des habitants de la ville
Caractre : La taille de lhabitant
Type de caractre : Variable statistique continue

On applique la mthode de STURGES avec les conditions :

N = 169
E = 1,85 1,45 = 0.40

Ce qui donne, aprs calcul, k=1+3.322 log10 169 = 8.40

On prendra k = 8 et e = E/8 = 0.40/8 = 0.05

25
Statistique descriptive 1. Tableaux et graphiques

La srie prcdente peut tre transforme en la srie quivalente suivante


Tailles (en m) Effectifs concerns
[Ci ; Ci+1[ ni
1.45 ; 1.50 5
1.50 ; 1.55 0
1.55 ; 1.60 30
1.60 ; 1.65 0
1.65 ; 1.70 42
1.70 ; 1.75 0
1.75 ; 1.80 53
1.80 ; 1.85 0
1.85 ; 1.90 39
Total 137

Remarque : on aboutit 9 classes au lieu de 8 du fait de la configuration des intervalles


dfinissant les classes.

Exemple 16 : On a mesur le poids en kilogramme comme caractre pour un chantillon de


80 lves dune cole. Les donnes brutes sont reportes dans le tableau suivant :

68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71
79 62 67 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74
86 67 73 81 72 63 76 75 85 77

Unit statistique : Elve dune cole ;


Population : Lensemble des lves dune cole ;
Caractre : Le poids ;
Type de caractre : Variable statistique discrte.
La plus grande valeur est : 97
La plus petite valeur est : 53
L'tendue est : E = 97 - 53 = 44
On applique la mthode de STURGES avec les conditions :
n = 80
E = 44

26
Statistique descriptive 1. Tableaux et graphiques

Ce qui donne, aprs calcul, k = 1 + 3,322 log10 80 = 7,322


On prendra k = 7 et e = E / 7 = 44 /7 = 6

La srie prcdente peut tre transforme en la srie quivalente suivante :

ci ni Ni cr Ni d fi Fi cr Fi d
Poids
(1) (2) (3) (4) (5) (6) (7)
[52 ; 58[ 55 2 2 80 2,5% 2,5% 100%
[58 ; 64[ 61 12 14 78 15% 17,5% 97,5%
[64 ; 70[ 67 10 24 66 12,5% 30% 82,5%
[70 ; 76[ 73 19 43 56 23,75% 53,75 70%
[76 ; 82[ 79 16 59 37 20% 73,75 46,25%
[82 ; 88[ 85 9 68 21 11,25% 85% 26,25%
[88 ; 94[ 91 7 75 12 8,75% 93,75% 15%
[94 ; 100[ 97 5 80 5 6,25% 100% 6,25%
Total --- 80 --- --- 100% --- ---

Lgende du tableau :
- (1) : point central de la classe ;
- (2) : effectif de la classe, frquence absolue ;
- (3) : frquence absolue cumule croissante ;
- (4) : frquence absolue cumule dcroissante ;
- (5) : pourcentage de la classe, frquence relative ;
- (6) : frquence relative cumule croissante ;
- (7) : frquence relative cumule dcroissante.

Le nombre de personnes pesant entre 64 et moins de 70 kilogrammes est 10, ils reprsentent
12,5 % des personnes peses.

Le nombre de personnes pesant au moins 70 kilogrammes est 56, ils reprsentent 70 % des
personnes peses.

Le nombre de personnes pesant moins de 82 kilogrammes est 59, ils reprsentent 73,75 %
des personnes peses.

27
Statistique descriptive 1. Tableaux et graphiques

Pour rcapituler toute cette premire partie, donnons, dans un tableau synthtique, grce
des exemples, lensemble des concepts que nous avons introduits jusque l :

Population Echantillon Caractres Modalits Effectifs


-taille - 1m65
Habitants dune ville 200 habitants choisis -poids - 65kg 200
-etc. - etc.
Elves dune cole 30 lves tris -notes - 13,5 30
Livres dune
125 livres tris -thmes des livres - math 125
bibliothque
-poids de lunit - 8g
Production dune 1500 units produites
-dimension de 1500
usine tries
lunit - 37cm

Le tri ou le choix pour constituer un chantillon se fait selon des processus bien prcis.

1.2. REPRESENTATIONS GRAPHIQUES.

Il est trs courant, dans un premier traitement, pour bien visualiser lallure dune srie
statistique, de la reprsenter par un graphe. Cette reprsentation peut tre faite selon plusieurs
manires, en effet on peut citer les diffrentes reprsentations suivantes :
- le diagramme bandes ;
- le diagramme secteurs ;
- le diagramme btons ;
- lhistogramme des frquences simples ;
- le polygramme des frquences simples ;
- la courbe des frquences cumules.

Chaque type de reprsentation convient un type de caractre (qualitatif ou quantitatif,


quantitatif discret ou quantitatif continu) et un type de srie.

Nous donnons dans ce qui suit un ensemble de possibilits de reprsentations dune srie
statistique en indiquant, chaque fois, le choix du graphe adquat selon le type de caractre ou
de la srie ainsi que les raisons de ce choix.

1.2.1. Caractre qualitatif : Rappelons quun caractre qualitatif est un caractre quon ne
peut pas mesurer. Dans ce cas, deux types de reprsentations sont conseills :

Diagramme bandes :

Exemple 17 : On considre la srie statistique relative la situation familiale dun


chantillon de 130 personnes :

28
Statistique descriptive 1. Tableaux et graphiques

Situations familiales xi Effectifs concerns : ni


Clibataires 1 30
Maris 2 35
Divorcs 3 40
Veufs 4 25
Total --- 130

La reprsentation graphique dune telle srie peut tre trs bien faite par un diagramme
bandes.

45

40
35

30
Effectifs

25
20

15

10
5

clibataires maris divorcs veufs


Modalits de la variable

Remarques : La largeur des bandes est quelconque mais identique pour toutes les bandes.

Seules les hauteurs des bandes indiquent les effectifs ou les frquences relatives.

La numrotation des classes de modalits de 1 4 est faite uniquement dans le but de


faciliter les reprsentations graphiques.

Diagramme secteurs :

Exemple 18 : On reprend lexemple 7 et lon considre la mme srie statistique relative


la situation familiale dun chantillon de 130 personnes pour laquelle nous avons converti les
effectifs en pourcentage :

29
Statistique descriptive 1. Tableaux et graphiques

Effectifs concerns : ni
Situations familiales xi
Frquences relatives : fi
Clibataires 1 30 = 23%
Maris 2 35 = 27%
Divorcs 3 40 = 31%
Veufs 4 25 = 19%
Total --- 130 = 100%

La reprsentation graphique dune telle srie peut tre trs bien faite par un diagramme
secteurs.

veufs clibataires
19% 23%

divorcs
maris
31%
27%

Remarque 1 : le mme caractre, situation familiale a pu tre reprsent par deux types de
diagrammes.

Remarque 2 : La surface de chaque secteur reprsente, en pourcentage, la frquence


relative de la modalit indique.

Le rayon du cercle est quelconque.

1.2.2. Caractre quantitatif discret : Rappelons quun caractre quantitatif est discret
dans le cas doprations de comptage, dans ce cas, plusieurs types de reprsentation sont
possibles.

Diagramme btons :

Exemple 19 : On considre la srie statistique des notes obtenues dans une matire, par un
chantillon de 200 tudiants dun amphithtre de 500.

30
Statistique descriptive 1. Tableaux et graphiques

Notes : xi Effectifs : ni
10 55
12 40
14 60
16 45
Total 200

Pour reprsenter une telle srie, on a habituellement recours aux diagrammes btons.

70

60

50
Effectifs

40

30

20

10

0
10 12 14 16

Modalits de la variable

Remarque : La hauteur de chaque bton est proportionnelle ni ou fi pour la valeur xi du


caractre.

Sur laxe des x, on reporte les valeurs de xi attribues aux caractres afin de pouvoir traiter
la srie statistique.

La largeur du bton na aucune importance.

Polygone de frquences :

Les polygones de frquences sont construits en joignant par une ligne les sommets des
btons du diagramme en btons.

31
Statistique descriptive 1. Tableaux et graphiques

70

60

50
Effectifs
40

30

20

10

0
10 12 14 16

Modalits de la variable

Polygone de frquences cumules ou diagramme en escalier :

Exemple 20 : On reprend lexemple 18 et lon considre les notes obtenues dans une
matire, par un chantillon de 200 lves, calculons les effectifs cumuls.

Notes : xi Effectifs : ni Effectifs cumuls Fi


10 55 55
12 40 95
14 60 155
16 45 200
Total 200 ---

250

200
Effectifs cumuls

150

100

50

0
10 12 14 16

Modalits de la variable

32
Statistique descriptive 1. Tableaux et graphiques

1.2.3. Caractre quantitatif continu : Rappelons quun caractre quantitatif est continu
dans le cas doprations de mesures, dans ce cas, plusieurs types de reprsentation sont
possibles.

Histogramme :

Un histogramme est un graphique constitu de bandes verticales jointives. On dlimite en


abscisses les classes successives de la variable continue, en principe de mme amplitude, et sur
chaque base ainsi dlimite, on lve un rectangle de hauteur proportionnelle la frquence
correspondante de telle sorte que la surface du rectangle soit proportionnelle l'effectif
correspondant.

Quand les classes sont de mme amplitude, la hauteur des rectangles est proportionnelle aux
frquences des classes, elle est gale numriquement la frquence correspondante. Si les
classes n'ont pas la mme amplitude, il est ncessaire d'ajuster la hauteur des rectangles de telle
sorte que la surface du rectangle soit proportionnelle l'effectif correspondant, la hauteur des
rectangles est gale dans ce cas la densit de la classe.

Histogramme des frquences classes damplitudes gales :

Exemple 21 : On considre un chantillon de 530 personnes et lon prend pour caractre la


somme en DH quelles ont dans leur poche.

Montant dargent DH Effectifs ni


20 ; 30 110
30 ; 40 120
40 ; 50 100
50 ; 60 200
Total 530
Pour reprsenter une telle srie statistique on a habituellement recours lhistogramme des
frquences classes damplitudes gales.

33
Statistique descriptive 1. Tableaux et graphiques

250

200

150

ni ou fi
100

50

25 35 45 55
Xi

Remarque : On peut regrouper les valeurs discrtes par classes de mme amplitude, il suffit
alors que la hauteur de chaque rectangle soit proportionnelle ni ou fi .

Sur laxe des x, on reporte les valeurs Ci, bornes des classes
du caractre x.

Histogramme des frquences classes damplitudes ingales :

On peut regrouper les valeurs discrtes par classes damplitudes diffrentes, il suffit alors
que la hauteur de chaque rectangle soit proportionnelle di, densit de la classe considre.

Sur laxe des x, on reporte les valeurs Ci, bornes des classes du caractre x.

Exemple 22 : La rpartition de la surface, en m, de 100 logements est reprsente dans le


tableau suivant :

Surface en m Nombre de logements Densits


0 20 10 0,5
20 40 20 1
40 60 40 2
60 100 18 0,45
100 160 8 0,13
160 260 4 0,04
Total 100
Les amplitudes des classes tant ingales, il convient de calculer les densits afin de
reprsenter l'histogramme.

34
Statistique descriptive 1. Tableaux et graphiques

2,5

1,5
densit di

0,5

0
10 30 50 70 90 110 130 150 170 190 210 230 250

surface (centres de classes)

Polygone des frquences : di ou fi

Exemple 23 : La rpartition des soldes dun chantillon de 150 comptes bancaires est
donne par le tableau suivant :

[Ci ; Ci+1[ ci Effectif


en 1000 DH en 1000 DH ni
[5 ; 15[ 10 25
[15 ; 25[ 20 35
[25 ; 35[ 30 45
[35 ; 45[ 40 30
[45 ; 55[ 50 15
Total --- 150

35
Statistique descriptive 1. Tableaux et graphiques

50
45
40
35
30
ni ou fi 25
20
15
10
5
0
10 20 30 40 50

Xi

On construit, partir de lhistogramme des frquences.

- Le polygone des frquences, en joignant les milieux des segments.


- La surface du polygone des frquences est la mme que celle de lhistogramme.

Exemple 24 : On reprend lexemple 23 et on se propose de reprsenter la courbe des


frquences cumules croissantes.

Courbe des frquences cumules croissantes

[Ci ; Ci+1[ en 1000 DH Ci en 1000 DH Effectif ni Fi


[5 ; 15[ 10 25 25
[15 ; 25[ 20 35 60
[25 ; 35[ 30 45 105
[35 ; 45[ 40 30 135
[45 ; 55[ 50 15 150
Total --- 150 ---

36
Statistique descriptive 1. Tableaux et graphiques

160

140

120

100

Fi 80

60

40

20

0
10 20 30 40 50

Xi

Les individus sont classs en classes, la frquence cumule associe la classe numro i
correspond la proportion dindividus dont la valeur du caractre est strictement infrieure la
limite suprieure de la classe numro i.

1.3. EXERCICES DAPPLICATIONS.

1.3.1. Exercice.

A partir des tableaux suivants prciser :


a) l'unit statistique et la population ;
b) le caractre tudi ;
c) la nature du caractre tudi ;
d) reprsenter graphiquement la distribution ;

Structure de l'emploi au Maroc :

Secteurs d'activits Part en %


Agricole, fort, pche et mine 4,9
Industrie, btiment 34,5
Commerce 19
Htels et restaurants 2,7
Transport et communications 7,9
Finances et banques 6,6
Emploi domestique 20,3
Secteur public 4,1
Total 100

37
Statistique descriptive 1. Tableaux et graphiques

Effectif des stagiaires en formation :

Niveau 1re anne 2me anne Total


Technicien spcialis 1031 - 1031
Technicien 9727 8487 18214
Qualification 12542 9293 21835
Spcialisation 6573 1335 7908
Total 29873 19115 48988

Rpartition du nombre de pices dun ensemble de logements :

Nombre de pices Part en %


1 pice 24,68
2 pices 21,45
3 pices 20,50
4 pices 16,54
5 pices et plus 16,83
Total 100

Dure de vie des tubes lectroniques :

Dure (heures) Nombre de tubes


400-499 90
500-599 88
600-699 120
700-799 105
800-899 102
900-999 75
1000-1099 20
Total 600

1.3.2. Exercice.
Une tude de march a mesur le degr de satisfaction dun chantillon de 500 clients dune
banque. Les rsultas sont prsents dans le tableau suivant :
Degr de satisfaction Effectifs
Pas du tout satisfait 223
Insatisfait 187
Indiffrent 32
Satisfait 55
Trs satisfait 3
Total 500
a) Quelle est la population tudie ?
38
Statistique descriptive 1. Tableaux et graphiques

b) Quel est le caractre tudi ? quelle est sa nature ?


c) Calculer les frquences relatives ?
d) Reprsenter graphiquement cette distribution.

1.3.3. Exercice.

Soit la distribution suivante du nombre de pices dans 300 logements :

Nombre de pices Effectifs


1 35
2 51
3 68
4 55
5 49
6 42
Total 300

a) Prsenter dans un tableau les diffrentes frquences cumules.


b) Quel est le nombre de logements possdant au moins 3 pices ?
c) Quelle est la proportion des logements possdant moins de 5 pices?
d) Quel est le nombre de logements possdant au plus 4 pices ?
e) Quelle est la proportion des logements possdant plus de 3 pices ?
f) Reprsenter graphiquement :
- la distribution des frquences ;
- la distribution des frquences cumules croissantes ;

1.3.4. Exercice.

On a relev la recette hebdomadaire en milliers de dirhams de 40 commerces. Les donnes


brutes sont :

57 60 52 49 56 46 51 63 49 57
86 93 77 67 81 70 71 91 67 82
47 87 92 55 48 90 49 50 58 62
67 89 69 72 75 48 85 90 83 66

a) Prsenter les donnes dans un tableau statistique sous forme de classes.


b) Reprsenter graphiquement la distribution de frquences tablie.

1.3.5. Exercice.

39
Statistique descriptive 1. Tableaux et graphiques

Le tableau suivant prsente le nombre de femmes en activit selon l'ge de 500 femmes actives

Tranche d'ges Effectif


[15 20[ 14
[20 25[ 70
[25 30[ 100
[30 35[ 65
[35 40[ 69
[40 45[ 56
[45 50[ 63
[50 55[ 61
55 et plus 2

a) Reprsenter graphiquement cette distribution de frquences.


b) Reprsenter le diagramme des frquences cumules croissantes.
c) Quel est le nombre de femmes actives ges au moins de 25 ans?
d) Quelle est la proportion des femmes actives ges de plus de 30 ans ?

1.3.6. Exercice.

Le tableau suivant donne le niveau de scolarit en nombre dannes passes lcole dun
chantillon de 200 personnes.

Niveau de scolarit Effectif


[0 ; 6[ 40
[6 ; 12[ 80
[12 ; 14[ 50
[14 ; 16[ 30
Total 200

a) Reprsenter graphiquement cette distribution de frquences.


b) Reprsenter le diagramme des frquences cumules croissantes.
c) Quel est le nombre de personnes ayant un niveau de moins de 12 annes passes
lcole?
d) Quel est la proportion des personnes ayant un niveau dau moins 12 annes passes
lcole?

1.3.7. Exercice.

Soit la rpartition des travailleurs d'une entreprise selon l'ge :

40
Statistique descriptive 1. Tableaux et graphiques

11 % d'entre eux ont moins de 20 ans ;


31 % d'entre eux ont de 20 25 ans ;
26 % d'entre eux ont de 25 30 ans ;
16 % d'entre eux ont de 30 35 ans ;
7 % d'entre eux ont de 35 40 ans ;
9 % d'entre eux ont 40 ans et plus.

a) Reprsenter graphiquement cette distribution.


b) Reprsenter le diagramme des frquences cumules croissantes.

1.3.8. Exercice.

Un organisme charg de raliser des enqutes statistiques gre un rseau de 125 enquteurs. La
direction de cet organisme dcide d'tudier la rpartition de ses enquteurs selon le nombre
d'enqutes qu'ils ont ralises. Les donnes collectes ce sujet sont rsumes dans le tableau
ci-aprs :

Nombre d'enqutes ralises Effectifs


5 8
10 12
15 35
20 40
25 20
30 10

Reprsenter graphiquement cette srie statistique.


a- Par un polygone des frquences relatives
b- Par une courbe des frquences relatives cumules croissantes.

1.3.9. Exercice.

Le tableau suivant donne la distribution de frquences du nombre d'enfants dans 300 familles.
Nombre d'enfants Nombre de familles
0 13
1 22
2 46
3 49
4 58
5 42
6 39
plus de 6 31

41
Statistique descriptive 1. Tableaux et graphiques

Total 300

a) Calculer les diffrents types de frquences cumules.


b) Etablir le diagramme de frquences et le diagramme de frquences cumules.
c) Quel est le nombre de familles ayant au plus 4 enfants ?
d) Quel est le nombre de familles ayant au moins 2 enfants ?
e) Quel est le pourcentage des familles qui n'ont pas d'enfants ?
f) Quel est le pourcentage des familles qui ont des enfants ?
g) Quel est le pourcentage des familles qui ont moins de 4 enfants?

1.3.10. Exercice.

Une cooprative laitire fabrique un fromage qui doit contenir, selon les tiquettes, 45 % de
matires grasses. Un institut de consommation dont le rle est de vrifier que la qualit des
produits est bien celle qui est affirme par l'tiquette, fait prlever et analyser un chantillon de
100 fromages. Les rsultats de l'analyse sont consigns dans le tableau suivant :

Taux de matires grasses Nombre de fromages


[41,5 - 42,5[ 1
[42,5 - 43,5[ 11
[43,5 - 44,5[ 24
[44,5 - 45,5[ 38
[45,5 - 46,5[ 22
[46,5 - 47,5[ 3
[47,5 - 48,5[ 1

a) Reprsenter graphiquement cette distribution.


b) Reprsenter le diagramme des frquences cumules croissantes.

42
Statistique descriptive 2. Caractristiques de tendance centrale

CHAPITRE 2
CARACTERISTIQUES DE TENDANCE CENTRALE

Les caractristiques de tendance centrale, appeles aussi paramtres de position,


servent caractriser l'ordre de grandeur des observations. Les principaux
paramtres de position sont : les moyennes, le mode, la mdiane, et la mdiale.

Pour les caractristiques centrales, nous ne nous intressons quaux sries statistiques
relatives des caractres quantitatifs discrets ou continus, cest--dire des sries statistiques
donnes sous les formes : (xi) , (xi ; ni) ; (xi ; fi) ; (ci ; ni) ou (ci ; fi).

2.1. LES MOYENNES.

On peut rduire un ensemble d'observations en une seule observation constante


appele moyenne. La moyenne est donc une valeur qui se prsente comme si toutes les
observations lui taient gales.

On distingue plusieurs types de moyennes :

- la moyenne arithmtique ;
- la moyenne gomtrique ;
- la moyenne harmonique ;
- la moyenne quadratique.

2.1.1. Moyenne arithmtique.

2.1.1.1. Moyenne arithmtique simple.

La moyenne arithmtique simple, qu'on appelle couramment moyenne, d'une srie de


plusieurs observations est gale la somme de toutes les observations divise par le
nombre de ces observations.

43
Statistique descriptive 2. Caractristiques de tendance centrale

Dans le cas d'une suite de n observations : x1, x2, , xi, , xn la moyenne est gale, par
dfinition :
n

x x x ... x n x i
x 1 2 3 i 1

n n
n
Lintroduction du terme x
i 1
i doit tre explicite, en effet on convient habituellement

dcrire, en mathmatique :

x
i 1
i = x1 + x2 + x3 + . . . + xi + . . . + xn

Dans le cas dune srie statistique donne par un ensemble (xi , ni), c'est--dire lorsque
chaque valeur xi est rpte ni fois et quil y a k valeurs xi diffrentes, la moyenne arithmtique
simple dune telle srie se dduit de la formule prcdente :

n x i i k
x i 1
k
avec n= n i

nii 1
i 1

De mme dans le cas dune srie statistique donne par un ensemble (x i , fi) la moyenne
arithmtique simple se dduit de la formule prcdente :

k
x fi xi
i 1
k k
ni
avec n = n i 1
i ; fi
n
et f
i 1
i =1

Dans le cas d'une variable statistique continue groupe en classes, la moyenne arithmtique
simple est donne par les formules suivantes :

44
Statistique descriptive 2. Caractristiques de tendance centrale

n c i i
k
x i 1
k
f c i i

n
i 1
i
i 1

C i C i 1
ci est le point central de la classe i, il est tel que : ci
2
Exemple 1 : On considre lensemble des notes obtenues par les tudiants dune classe
dune cole, dans une matire ; on a la srie statistique suivante donne sous la forme simple
(xi) et pour laquelle on demande de calculer la moyenne arithmtique simple.

12 11 13 12 13
15 13 12 13 11
13 15 11 11 12
12 12 10 12 15

La moyenne arithmtique simple de cette srie est facile calculer, elle est gale :

20

x
i 1
i
248
x 12,4
n 20
Exemple 2 : On considre la mme srie statistique quon reprsente maintenant sous la
forme (xi ; ni) pour laquelle on demande de calculer la moyenne arithmtique simple.

xi ni
10 1
11 4
12 7
13 5
15 3

45
Statistique descriptive 2. Caractristiques de tendance centrale

Le calcul de la moyenne arithmtique simple peut tre facilement fait selon le tableau
suivant :

xi ni ni xi
10 1 10
11 4 44
12 7 84
13 5 65
15 3 45
Total 20 248
Moyenne --- 12,4

Exemple 3 : On considre la mme srie statistique quon reprsente sous la forme (xi ; fi)
pour laquelle on demande de calculer la moyenne arithmtique simple.

xi ni fi
10 1 5%
11 4 20%
12 7 35%
13 5 25%
15 3 15%
Total 20 100%

Le calcul de la moyenne arithmtique simple peut tre facilement fait selon le tableau
suivant :

xi ni fi fi xi
10 1 0,05 0,5
11 4 0,20 2,2
12 7 0,35 4,2
13 5 0,25 3,25
15 3 0,15 2,25
Total 20 100% 12,4
Moyenne --- --- 12,4

On voit, sur ces 3 exemples, que pour calculer la moyenne arithmtique simple, on utilise
lune des 3 formules selon la forme dans laquelle est donne la srie statistique.

Exemple 4 : On a procd au recensement des 50 salaris de la socit STM en relevant les


salaires horaires quils peroivent. Les donnes brutes sont :

46
Statistique descriptive 2. Caractristiques de tendance centrale

34 36 45 62 37 43 42 102 31 42
51 30 61 63 47 105 52 43 81 95
92 77 60 36 48 49 65 71 78 81
43 52 63 71 43 42 51 55 61 41
93 82 83 47 54 61 102 33 48 55

La moyenne arithmtique simple dune telle srie est gale :


50

x i
2939
x i 1
58,78 DH / h
50 50
Chaque salari de la socit touche, en moyenne, 58,78 DH par heure.

Exemple 5 : Une enqute, chez 1000 commerants, porte sur le nombre dagents quils
emploient. Les rsultats obtenus sont reprsents dans le tableau suivant :

Nombre d'employs Nombre de commerants proportion des commerants


xi ni fi
0 50 5%
1 100 10 %
2 200 20 %
3 150 15 %
4 120 12 %
5 160 16 %
6 130 13 %
7 90 9%
Total 1000 100 %

La moyenne arithmtique simple dune telle srie est gale :


8

n x i i 8
3640
x i 1
8
f x i i 3,64 employs par commerant
n i 1 1000
i
i 1
Chaque commerant emploie, en moyenne, trois quatre employs.

Exemple 6 : La rpartition de la surface, en m, de 100 logements est reprsente dans le


tableau suivant :

47
Statistique descriptive 2. Caractristiques de tendance centrale

Surface en m Nombre de logements Point central


0 20 10 10
20 40 20 30
40 60 40 50
60 100 18 80
100 160 8 130
160 260 4 210

La moyenne arithmtique simple dune telle srie est gale :


6

n c i i
6
x i 1
6
f c 6020
i i
100
60,20 m par logement
n
i 1
i
i 1

La superficie moyenne dun logement est de 60,20 m.

2.1.1.2. Moyenne arithmtique pondre.

La moyenne arithmtique simple suppose que toutes les observations ont la mme
importance, ce qui n'est pas toujours le cas. La moyenne arithmtique pondre
intervient dans le cas o les observations n'ont pas la mme importance. Il s'agit
d'associer chaque observation un coefficient de pondration indiquant son poids
parmi les autres observations.
k

x i i
x i 1
k


i 1
i

i est le poids affect l'observation i.

Exemple 7 : Un tudiant a eu 14 sur 20 au contrle continu, 12 sur 20 l'examen partiel et


13 sur 20 l'examen final. Les trois notes n'ont pas la mme importance. On associe un
coefficient de 1 la note du contrle, un coefficient de 2 la note de l'examen partiel, et un
coefficient de 4 la note de l'examen final. La note moyenne de l'anne obtenue par cet
tudiant est :

48
Statistique descriptive 2. Caractristiques de tendance centrale

x i i
1 14 2 12 4 13
x i 1
12,86
3
1 2 4

i 1
i

2.1.1.3 Proprits de la moyenne arithmtique.

* Proprit 1 : Transformation linaire

La transformation linaire d'une variable statistique x en une autre variable y telle


que :

y = ax + b avec a et b deux constantes quelconques

La moyenne de y peut tre obtenue directement partir de la moyenne de x :


n n n

y i (ax i b) a x i n b
y i 1
i 1
i 1

n n n
n

x i
y a i 1
b a x b
n
La moyenne d'une transformation linaire est donc une transformation linaire de la
moyenne.
Exemple 8 : Le tableau suivant prsente les prix en DH de 100 ordinateurs portables
achets dans diffrents points de vente :

Prix Nombre dordinateurs


10000 11000 9
11000 12000 10
12000 13000 10
13000 14000 14
14000 15000 16
15000 16000 14
16000 17000 12
17000 18000 15
Total 100

49
Statistique descriptive 2. Caractristiques de tendance centrale

Pour calculer la moyenne des prix des ordinateurs, on peut utiliser la proprit de la
transformation linaire dans le but de simplifier les calculs.

On effectue un changement de variable, c'est--dire, on remplace la variable prix par une


autre variable y de telle sorte que le prix soit une transformation linaire de y.
pb
p = ay + b Donc : y=
a
Il faut choisir les constantes a et b qui donnent des valeurs trs simples de y. On choisit la
constante b parmi les valeurs de p, de prfrence une valeur du milieu, pour avoir une valeur
nulle de y au milieu. On choisit la constante a comme tant le plus grand diviseur commun des
valeurs de (p - b) (le plus souvent a est l'amplitude constante des classes) pour avoir des valeurs
entires de y.

Pour notre exemple, on choisit :

b = 13500 et a = 1000

p 13500
Y=
1000
Les valeurs de y sont trs simples, on peut calculer facilement la moyenne de y.

Nombre
Point central
Prix dordinateurs yi ni yi
(ci)
(ni)
10000 11000 9 10500 -3 -27
11000 12000 10 11500 -2 -20
12000 13000 10 12500 -1 -10
13000 14000 14 13500 0 0
14000 15000 16 14500 1 16
15000 16000 14 15500 2 28
16000 17000 12 16500 3 36
17000 18000 15 17500 4 60
Total 100 83
8

n y i i

y i 1
8
83 0,83
100
n
i 1
i

On calcule facilement la moyenne grce aux formules de la transformation linaire :

50
Statistique descriptive 2. Caractristiques de tendance centrale


p 1000 y 13500 1000 0,83 13500 14330 DH

* Proprit 2 : La moyenne des carts par rapport la moyenne est nulle.

La somme des diffrences par rapport la moyenne est toujours nulle.

n n
(x i x) x i n x n x n x 0
i 1 i 1

* Proprit 3 : La somme des carres des carts par rapport la moyenne est
minimale.
n n
(x i a) 2 [(x i x) (x a)]2
i 1 i 1
n
[(x i x) 2 2(x i x)(x a) (x a) 2 ]
i 1
n n n
( x i x ) 2 2( x i x )( x a ) ( x a ) 2
i 1 i 1 i 1
n n n n
(x
i 1
i a ) 2 ( x i x ) 2 2( x a ) ( x i x ) ( x a ) 2
i 1 i 1 i 1
n n
( x a) ( x x)
i 1
i
2

i 1
i
2
n ( x a) 2

Cette expression est positive, elle est donc minimale lorsque :


( x a ) 2 0 c' est dire lorsque a x

2.1.2. Moyenne gomtrique.

2.1.2.1. Moyenne gomtrique simple.

La moyenne gomtrique simple est calcule pour des observations positives. Elle est gale
la racine nme du produit de lensemble des n observations. Elle est utilise principalement
lorsqu'on raisonne en taux de croissance.

51
Statistique descriptive 2. Caractristiques de tendance centrale

La moyenne gomtrique est gale, par dfinition, dans le cas dune suite de n observations
x1, x2, , xi, , xn :
1 1
n
x g n x1 x x ( x1 x x ) n [ x ] n
2 n 2 n i
i 1

Exemple 9 : On considre une action qui a accus, en bourse, durant le 1er semestre de
lanne 2005, les taux daugmentation mensuels suivants : +2,1% ; 1,3% ; 0,5% ; 0,9% ; 1,4% ;
3,8%. Calculer le taux daugmentation mensuel moyen de laction durant le 1 er semestre 2005.

Cest lexemple type de lapplication de la moyenne gomtrique simple :

Remarque : Rappelons que pour une variable qui a accus un taux daugmentation de 2%
par exemple, on multiplie cette variable par 1,02 pour trouver la nouvelle valeur de la
variable.

Ainsi si laction a comme valeur 25,35 DH en Janvier et quelle subisse un taux

daugmentation de 2,1% entre janvier et fvrier, sa valeur, en fvrier est gale :

25,35 x 1,021 = 25,88 DH.

Donc nous allons, tout le temps, utiliser cette remarque lorsquil sagit de taux.

Revenons lexemple 9 et calculons le taux daugmentation mensuel moyen de laction :



t 6 1,0211,013 1,005 1,009 1,014 1,038 1 1,66 %

Exemple 10 : La population marocaine est passe, entre 1994 et 2004 de 26 019 000
29 800 000.

Quel est le taux global daugmentation de la population pendant les 10 annes ?

Quel est le taux annuel moyen daugmentation de la population ?

Entre 1994 et 2004, le taux global d'accroissement de la population marocaine est :


29800 26019
t 100 14,53%
26019

52
Statistique descriptive 2. Caractristiques de tendance centrale


Le taux d'accroissement annuel moyen est t tel que :

26019 (1 t )10 29800
29800
(1 t )10 1,1453
26019

t 10
1,1453 1 0 , 0137 1, 37 %

Entre 1994 et 2004, la population marocaine a augment en moyenne, de 1,37 % par an.

2.1.2.2. Moyenne gomtrique pondre.

De mme que pour la moyenne arithmtique simple qui suppose que toutes les
observations aient la mme importance, ce qui n'est pas toujours le cas, la moyenne
gomtrique pondre intervient dans le cas o les observations n'ont pas la mme
importance. Il s'agit d'associer chaque observation un coefficient de pondration
indiquant son poids parmi les autres observations.


x g x1 1x 22 x n n

1
x g (x11x 2 2 x n n ) n

1 k
x g [ xii ] xifi
k
i1 i1

i est le poids affect l'observation i.


k
Avec i
i 1

Cest le cas de sries statistiques discrtes donnes sous la forme (xi ; ni) ou (xi ; fi), lorsque,
dans les sries, la variable xi est rpte ni fois (ou fi en %) et quil y a k observations distinctes.

Dans le cas d'une srie statistique continue, on dfinit la moyenne gomtrique


pondre comme suit :

53
Statistique descriptive 2. Caractristiques de tendance centrale

1

x g n c1n1 c n2 2 ... c nk k (c1n1 c n2 2 ... c nk k ) n
1
k n k
[ c i ] n c fi
i i
i 1 i 1

C i C i 1
ci est le point central de la classe i, il est tel que : ci
2
Exemple 11 : Etude du taux de variation dune action en bourse.

Le tableau suivant donne l'volution du taux daugmentation de la valeur dune action, en


bourse, entre janvier et dcembre 2005.

Priodes Taux daugmentation mensuel moyen


Entre janvier et avril 2,03% par mois en moyenne
Entre mai et juillet 0,69% par mois en moyenne
Entre aot et dcembre 2,13% par mois en moyenne

Quel est le taux global de variation de la valeur de laction entre janvier et dcembre 2005 ?

Quel est le taux mensuel moyen de variation de la valeur de laction entre janvier et
dcembre 2005 ?

Sagissant de taux daugmentation mensuels relatifs des priodes diffrentes, de nombres


de mois diffrents, il y a lieu daffecter chaque taux dun poids gal aux nombres de mois
contenu dans la priode ;

Le taux daugmentation global de la valeur de laction est :

t 1,02034 1,00693 1,02135 1 22,92%

Le taux daugmentation mensuel moyen de la valeur de laction entre janvier et dcembre


2005 est alors gal :

t 12 1,2294 11,73%
2.1.2.3. Proprits de la moyenne gomtrique.

54
Statistique descriptive 2. Caractristiques de tendance centrale

La moyenne gomtrique est aussi gale l'exponentielle de la moyenne arithmtique


des logarithmes des variables statistiques.
n
1 Log x
n n i
Log x g Log[ x ] n Log[ x ] i 1
1
i n i n
i 1 i 1
n
Log x
i
i 1
x exp ( )
g n
2.1.3. Moyenne harmonique.

2.1.3.1. Moyenne harmonique simple.

La moyenne harmonique simple est gale l'inverse de la moyenne arithmtique des


inverses des observations. Son usage s'impose lorsque la variable statistique est un
quotient (cot moyen, vitesse moyenne, etc.).

Dans le cas d'une suite de n observations x1, x2, , xi, , xn, toutes distinctes et de poids
identiques, la moyenne harmonique simple est gale :
n
xh n 1

i 1 x i

Exemple 12 : Calcul de la vitesse moyenne.

On considre un automobiliste qui fait 80 km et qui parcourt chaque 20 km avec des


vitesses moyennes diffrentes, soient successivement 90 km/h, puis 75 km/h, ensuite 85 km/h et
enfin 115 km/h.

Quelle est la vitesse moyenne de lautomobiliste ?

Comme il sagit de vitesses moyennes, toutes relatives la mme distance de 20 km, elles
doivent avoir le mme poids. Montrons donc que la vitesse moyenne sur les 80 km est la
moyenne harmonique des vitesses.

En effet, le temps t mis pour parcourir une distance d la vitesse v est donn par la formule
simple : t = d / v.

Ainsi le temps global t est la somme des quatre temps ti :


55
Statistique descriptive 2. Caractristiques de tendance centrale

t t1 t 2 t 3 t 4

4
d d1 d 2 d 3 d 4 d
i
v V1 V2 V3 V4 i 1 Vi

En divisant les 2 membres de cette galit par d et en constatant que di / d = 1 / 4 on trouve


facilement le rsultat recherch :
4
1
1
V
i 1
i

v 4
n
1
1
V
i 1
C'est--dire dune faon plus gnrale : i

v n
1 1 1 1 1 1
= ( ) 0,01123
v 4 90 75 85 115

Soit aprs calcul : v = 89,077 km/h

2.1.3.2. Moyenne harmonique pondre.

La moyenne harmonique pondre intervient dans le cas o les observations n'ont pas
la mme importance. Il s'agit d'associer chaque observation un coefficient de
pondration indiquant son poids parmi les autres observations.

* Cas d'une srie statistique discrte : dans laquelle la variable statistique xi est rpte ni
fois (ou fi en %), lorsque la srie est de la forme (xi ; ni) ou (xi ; fi).
k

n
i 1
i
1
xh = k
= k
ni
i 1 x i
fi
x
i 1 i
* Cas d'une srie statistique continue :

56
Statistique descriptive 2. Caractristiques de tendance centrale

k
ni 1
xh i 1
k n
k f
i i
i 1 c i i 1 c i

C i C i 1
ci est le point central de la classe i, il est tel que : c i
2
Exemple 13 : Calcul de la vitesse moyenne.

Reprenons lexemple de lautomobiliste et supposons que maintenant il ait roul sur


un trajet de 100 Km une vitesse de 90 Km/h, sur les 10 premiers kilomtres; de 100
Km/h sur un trajet de 30 Km, et de 120 Km/h sur les 60 derniers kilomtres.
L'automobiliste a parcouru le trajet de 100 Km avec trois vitesses moyennes diffrentes sur
des trajets de diffrentes longueurs :

Vitesses moyennes Trajets


V1 = 90 km/h d1 = 10 km
V2 = 100 km/h d2 = 30 km
V3 = 120 km/h d3 = 60 km
Total 100 km

Comme il sagit de vitesses moyennes relatives des distances diffrentes, elles doivent tre
affectes de poids diffrents. Montrons donc que la vitesse moyenne sur les 100 km est la
moyenne harmonique pondre des vitesses.

En effet, le temps t mis pour parcourir une distance d la vitesse v est donn par la formule
simple : t = d / v.

Ainsi le temps global t est la somme des quatre temps ti :

t t1 t 2 t 3 t 4

4
d d1 d 2 d 3 d 4 d
i
v V1 V2 V3 V4 i 1 Vi

En divisant les 2 membres de cette galit par d et en posant i di / d, on trouve


facilement le rsultat recherch :

57
Statistique descriptive 2. Caractristiques de tendance centrale

4
1 1 10
v

i 1
i
Vi
avec par exemple 1
100
0,10
n
1 1
C'est--dire dune faon plus gnrale :
v

i 1
i
Vi
Aprs calcul, on trouve v = 109,8 km/h.

Exemple 14 : Calcul du cot moyen dun stock.

Calculer le cot moyen dune pice de rechange stocke dans le magasin de


lentreprise si lon suppose que le stock ait t approvisionn, diffrents prix, en
plusieurs tapes.

Etapes Nombre de pices achetes Prix unitaires des pices


N 1 10 12,35 DH
N 2 25 13,12 DH
N 3 20 13,46 DH
N 4 45 14,07 DH

Comme le cot est un rapport, montrons que le cot moyen est la moyenne
harmonique pondre des diffrents cots. En effet, les cots moyens auxquels les
pices de rechange ont t achetes sont relatifs des lots de diffrentes tailles, ce qui
fait que ces cots doivent tre affects de diffrents poids.
Convenons dappeler, dans ce qui suit, pour le lot i, cui le cot unitaire, cti le cot total
et ni le nombre de pices de rechange achetes.
Nous avons lgalit suivante vidente relative aux nombres de pices de rechange :
4
n n1 n 2 n 3 n 4 n i
i 1

4
ct i ct ct
Or comme ni on a : n i
cu i cu i 1 cu i

58
Statistique descriptive 2. Caractristiques de tendance centrale

En divisant les 2 membres de la dernire galit par ct et en posant i cti / ct on


trouve la formule recherche, savoir :

4 4
1 ct 1 1
i i
cu i 1 ct cu i i 1 cu i

Avec par exemple :

ct 2 25 13,12
2
4
10 12,35 25 13,12 20 13,46 45 14,07
ct
i 1
i

0,2422
Le cot moyen dapprovisionnement de la pice de rechange est, aprs calculs, gal :
13,51 DH/unit.
2.1.4. Moyenne quadratique.

La moyenne quadratique est la racine carre de la moyenne arithmtique des carres.


Elle est trs rarement utilise.
* Cas d'une suite de n observations : x1, x2, , xi, , xn
n
x
2
i

xq i 1
n
* Cas d'une srie statistique discrte : lorsque chaque variable xi est rpte ni (ou fi en
%) fois dans la srie et quil y a k valeurs diffrentes.
k

n x
2
i i k
xq i 1
f x
2
k i i

n i 1
i
i 1

k k
avec n= ni et
i 1
f
i 1
i 1

59
Statistique descriptive 2. Caractristiques de tendance centrale

* Cas d'une srie statistique continue :


k
n c
2
i i
k
xq f c
i 1 2
i i
k
n
i 1
i
i 1

k k
avec n= n
i 1
i et f
i 1
i 1

Ci Ci 1
ci est le point central de la classe i, il est tel que : ci
2
Exemple 15 : Dans une entreprise produisant des pices pour lassemblage dune machine
on veut contrler si la longueur moyenne des pices est conforme la norme de 12 cm. La
production est juge comme conforme si lcart moyen par rapport la norme ne dpasse pas 1
cm. cette fin on a mesur la longueur dun chantillon de 16 pices dont les rsultats sont :
11 10 12,5 10,8 13,5 11,5 13 12,5
13 13,5 11,5 13,2 10,5 12,5 11 11,5

Peut-on admettre que le produit de lentreprise est conforme la norme ?

Calculons les carts par rapport la norme :

-1 -2 0,5 -1,2 1,5 -0,5 1 0,5


+1 1,5 -0,5 1,2 -1,5 0,5 -1 -0,5

On voit bien que certains carts sont positifs et dautres sont ngatifs ; le calcul de la
moyenne arithmtique nest pas appropri car les carts ngatifs vont compenser les carts
positifs. La moyenne quil faut calculer est la moyenne quadratique.

(1) (2) 0,5 (1,2) 1,5 (0,5) 1 0,5



n 16
x
2
1 1,5 (0,5) 1,2 (1,5) 0,5 (1) (0,5)
i

xq i 1
=
n 16

x q = 1,09 cm

Lcart moyen par rapport la norme est de 1,09 cm, il dpasse lcart moyen tolr qui est
de 1 cm, on ne peut donc admettre que le produit de lentreprise est conforme la norme.

60
Statistique descriptive 2. Caractristiques de tendance centrale

Remarque : On peut montrer que la moyenne harmonique est infrieure ou gale la


moyenne gomtrique qui est infrieure ou gale la moyenne arithmtique qui est
infrieure ou gale la moyenne quadratique.

xh x g x xq
Exemple 16 : On peut aisment vrifier de telles ingalits dans lexemple simple
suivant.
On considre la srie statistique simple constitue des cinq observations suivantes : 2 ;
5 ; 6 ; 8 et 10.
On trouve, aprs un calcul facile que :

1 1 (1 1 1 1 1 ) 0,2729 x h 3,664
x h 4 2 5 6 8 10
x g 5 256810 5,448

256810
x 6,2
5
256810
xq 6,767
5
Et lon a bien :

(x h 3,664) (x g 5,448) (x 6,2) (x q 6,767)


2.2. LE MODE.
Le mode est lobservation la plus frquente dans une srie statistique.

* Cas d'une suite de n observations : Le mode d'une srie statistique est l'observation que
l'on rencontre le plus frquemment. Le mode peut ne pas exister, et s'il existe, il peut ne pas tre
unique.

Exemple 17 : On considre les sries dobservations suivantes :

a) 3; 5 ; 8 ; 8 ; 8 ; 10 ; 10 ; 10 ; 10 ; 10 ; 14 ; 18 ; 20 ; 24 ; 24
b) 4 ; 8 ; 10 ; 10 ; 10 ; 10 ; 14 ; 18 ; 22 ; 22 ; 22 ; 22 ; 26
c) 5, 11, 14, 17, 18, 21, 23, 26, 29, 30, 32, 35, 38
d) 12 ; 23 ; 34 ; 23 ; 35 ; 23 ; 52 ; 23 ; 33 ; 56 ; 23 ; 23 ; 40

Dans ces exemples, on a successivement :


61
Statistique descriptive 2. Caractristiques de tendance centrale

- pour le cas a : Le mode est 10.


- pour le cas b : Il y a deux modes, 10 et 22.
- pour le cas c : Le mode nexiste pas.
- pour le cas d : Le mode est 23

* Cas d'une srie statistique discrte : Le mode correspond la valeur qui possde la plus
grande frquence.

Exemple 18 : Soit la distribution du nombre d'employs observs chez 1000 commerants.

Nombre d'employs Nombre de commerants proportion des


xi (ni) commerants (fi)
0 50 5%
1 100 10 %
2 200 20 %
3 150 15 %
4 120 12 %
5 160 16 %
6 130 13 %
7 90 9%
Total 1000 100 %

La variable xi nombre d'employs a pour mode 2, c'est--dire la plupart des


commerants ont deux employs.
* Cas d'une srie statistique continue : Dans le cas d'une variable statistique continue
groupe en classes, on parle de classe modale, elle correspond la classe dont la frquence est
la plus leve. Le mode correspond la valeur de la variable qui correspond au maximum de
l'histogramme. C'est le point central de la classe modale si les classes ont la mme amplitude,
dans le cas contraire, il faut travailler avec les densits.

Exemple 19 : La rpartition de la surface, en m, de 100 logements est reprsente dans le


tableau suivant :

Surface en m Nombre de logements


0 20 10
20 40 20
40 60 40
60 100 18
100 160 8
160 260 4

Les amplitudes des classes tant ingales, il convient de calculer les densits.

62
Statistique descriptive 2. Caractristiques de tendance centrale

Surface en m Nombre de logements Densits


0 20 10 0,5
20 40 20 1
40 60 40 2
60 100 18 0,45
100 160 8 0,13
160 260 4 0,04
Total 100

En cherchant la plus grande densit, la classe modale est la classe 40 60 m, le mode


est gal au centre de la classe modale, savoir : 50 m.

2.3. LA MEDIANE.

La mdiane d'une variable statistique est une valeur pour laquelle, la moiti des
observations lui sont infrieure ou gales et la moiti suprieures ou gales. La
mdiane partage donc le nombre total d'observations en deux parties gales. La
mdiane est un paramtre statistique qui ne dpend que du nombre d'observations.
Pour dterminer la mdiane, il faut raisonner en terme de frquences cumules, la
mdiane est alors la valeur de la variable qui correspond la moiti de l'effectif total.
* Cas d'une srie statistique discrte.
n 1
Si le nombre d'observations est impair, la mdiane est l'observation de rang .
2
Me x n 1
2

Si le nombre d'observations est pair, la mdiane est comprise entre l'observation de rang n
2
n
et l'observation de rang 1 . On prend comme valeur de la mdiane la moyenne arithmtique
2
simple des deux observations.
x n Me x n
1
2 2

xn xn
1
Me 2 2

2
Exemple 20 : Soit la distribution du nombre d'employs observs chez 1000 commerants.

63
Statistique descriptive 2. Caractristiques de tendance centrale

Nombre d'employs Nombre de commerants Frquences cumules croissantes


xi (ni) Fic
0 50 50
1 100 150
2 200 350
3 150 500
4 120 620
5 160 780
6 130 910
7 90 1000
Total 1000

Le nombre d'observations, 1000, est pair, la mdiane est comprise entre l'observation de
rang 500 et l'observation de rang 501. On prend comme valeur de la mdiane la moyenne
arithmtique simple des deux observations.
x 500 Me x 501
x 500 x 501
Me
2
En consultant les frquences absolues cumules croissantes, x500 correspond 3 et x501
correspond 4. La mdiane est donc :
3 4
Me 3,5
2
La moiti des commerants emploient 3 employs ou moins, et la moiti emploient 4
employs ou plus.
* Cas d'une srie statistique continue.

Pour des donnes groupes en classes, la classe mdiane est la classe qui contient la
mdiane. On dtermine la mdiane par interpolation linaire.
Dsignons par :

[Ci ; Ci+1[ : la classe mdiane ;


n : le nombre total des observations ;
Fi : la frquence absolue cumule croissante ;
ni : la frquence absolue de la classe mdiane.

La mdiane est comprise entre Ci et Ci+1

Ci < Me < Ci+1

De mme : Fi-1 < n < Fi


2
64
Statistique descriptive 2. Caractristiques de tendance centrale

Frquence cumule

Fi

50 % = n/2

Fi-1

Caractre
Ci Me Ci+1

On suppose que la distribution au sein de la classe mdiane soit rgulire.

Ainsi : Ci 1 Ci = Me Ci
Fi Fi 1 n Fi 1
2
Ce qui donne : Me Ci Ci 1 Ci ( n Fi 1)
Fi Fi 1 2
Exemple 21 : La rpartition de la surface, en m, de 100 logements est reprsente dans le
tableau suivant :

Surface en m Nombre de logements F. cumules croissantes


0 20 10 10
20 40 10 20
40 60 50 70
60 100 18 88
100 160 8 96
160 260 4 100
Total 100

En consultant les frquences absolues cumules croissantes, la classe mdiane est la


classe 40 60 m. La mdiane est donc :

65
Statistique descriptive 2. Caractristiques de tendance centrale

40 < Me < 60
20 < 50 < 70

60 40 = Me 40
70 20 50 20

Me = 40 + 20 x 30 = 52 m
50
La moiti des logements ont une superficie infrieure ou gale 52 m et la moiti des
logements ont une superficie suprieure ou gale 52 m.

2.4. LA MEDIALE.

La mdiale est une valeur telle que la somme des observations qui lui sont infrieures
est gale la somme des observations qui lui sont suprieures. La mdiale partage
donc la somme des observations en deux parties gales. La mdiale est un paramtre
statistique qui dpend de la somme de toutes les observations.

Pour dterminer la mdiale, il faut raisonner en terme de sommes cumules, la


mdiale est alors la valeur de la variable qui correspond la moiti de la somme des
observations.
La mdiale calcule pour une variable statistique groupe en classes, la classe mdiale est la
classe qui contient la mdiale. On dtermine la mdiale par interpolation linaire.

Dsignons par :

[Ci ; Ci+1[ : la classe mdiale ;


k
S= n c
i 1
i i : la somme des observations ;

j i
Si = n c
j1
j j : la somme des observations cumule croissante;

ni ci : la somme des observations de la classe mdiale.

La mdiale est comprise entre Ci et Ci+1


Ci < Ml < Ci+1
Si-1 < S < Si
2
Sommes cumules

66
Statistique descriptive 2. Caractristiques de tendance centrale

Si

50 % = S/2

Si-1

Caractre
Ci Ml Ci+1

On suppose que la distribution au sein de la classe mdiale soit rgulire.

Ainsi : Ci 1 Ci = Ml Ci
Si Si 1 S Si 1
2
Ml Ci Ci 1 Ci (S Si 1)
Si Si 1 2
Exemple 22 : La rpartition de la surface, en m, de 100 logements est reprsente dans le
tableau suivant :

Nombre de Sommes Sommes cumules


Surface en m Point central ci
logements ni nixi croissantes
0 20 10 10 100 100
20 40 20 30 600 700
40 60 40 50 2000 2700
60 100 18 80 1440 4140
100 160 8 130 1040 5180
160 260 4 210 840 6020
Total 100 6020

La moiti de la somme des observations est :


6

n c i i
6020
i 1
3010
2 2

67
Statistique descriptive 2. Caractristiques de tendance centrale

En consultant les sommes cumules croissantes, la classe mdiale est la classe 60 100
m. La mdiale est donc :

60 < Ml < 100


2700 < 3010 < 4140

10060 = Ml60
41402700 30102700

Ml = 60 + 40 x 310 = 68,61 m
1440
La moiti de la superficie totale des 100 logements est rpartie sous forme de
logements dont la superficie est infrieure ou gale 68,61 m et l'autre moiti sous
forme de logements dont la superficie est suprieure ou gale 68,61 m.

2.5. LES FRACTILES.

De mme que la mdiane nous a permis de partager la population en deux parties


gales, le fractile d'ordre p permet de partager la population en p parties gales,
100
chaque partie contient % du nombre total des observations. Ainsi les quartiles,
p
dciles, centiles vont respectivement nous permettre de partager la population
respectivement en quatre, dix et cent parties gales.
2.5.1. Les quartiles.
Les quartiles partagent le nombre total des observations en quatre parties gales,
chaque partie contient 25% des observations. On dfinit trois quartiles.
Le premier quartile Q1 : C'est une valeur pour laquelle un quart des observations
(25%) lui sont infrieures ou gales et trois quarts des observations (75%) lui sont
suprieures ou gales.

Le deuxime quartile Q2 : C'est une valeur pour laquelle deux quarts des observations
(50%) lui sont infrieures ou gales et deux quarts des observations (50%) lui sont
suprieures ou gales. Il est aussi gal la mdiane.
Le troisime quartile Q3 : C'est une valeur pour laquelle trois quarts des observations
(75%) lui sont infrieures ou gales et un quart des observations (25%) lui sont
suprieures ou gales.

68
Statistique descriptive 2. Caractristiques de tendance centrale

Pour le calcul des quartiles, on utilise la mme mthode de calcul que pour la mdiane.
Pour des donnes groupes en classes, on dtermine un quartile par interpolation
linaire.
Dsignons par :

[Ci ; Ci+1[ : la classe qui contient le quartile ;


n : le nombre total des observations ;
Fi : la frquence absolue cumule croissante ;
ni : la frquence absolue de la classe qui contient le quartile ;

Le quartile numro j, Qj est compris entre Ci et Ci+1


Ci < Qj < Ci+1
j n
Fi-1 < < Fi
4
Frquence cumule

Fi

j n /4

Fi-1

Caractre
Ci Qj Ci+1

On suppose que la distribution au sein de la classe est rgulire.

Ainsi : Ci 1 Ci = Qj Ci
Fi Fi 1 j n
Fi 1
4
j n
Qj Ci Ci 1 Ci ( Fi 1)
Fi Fi 1 4
Les trois quartiles sont :

69
Statistique descriptive 2. Caractristiques de tendance centrale

Q1 Ci Ci 1 Ci ( n Fi 1)
Fi Fi 1 4
Q2 Ci Ci 1 Ci ( n Fi 1) = Me
Fi Fi 1 2
i 1 Ci
Q3 Ci C ( n Fi 1)
3
Fi Fi 1 4
Exemple 23 : La rpartition de la surface, en m, de 100 logements est reprsente dans le
tableau suivant :

Surface en m Nombre de logements Frquences cumules croissantes


0 20 10 10
20 40 20 30
40 60 40 70
60 100 18 88
100 160 8 96
160 260 4 100
Total 100

En consultant les frquences absolues cumules croissantes, q1, qui correspond la


25me observation, se trouve dans la classe 20 40 m. q3, qui correspond la 75me
observation, se trouve dans la classe 60 100 m.
100
10
q 1 20 20 4 35 m
20

3 100
70
q 3 60 40 4 71,11 m
18

25 % des logements ont une superficie infrieure ou gale 35 m.


75 % des logements ont une superficie infrieure ou gale 71,11 m.
50 % des logements ont une superficie comprise entre 35 m et 71,11 m.

2.5.2. Les dciles.

Les dciles partagent le nombre total des observations en dix parties gales, chaque
partie contient 10% des observations. On dfinit neuf dciles.

70
Statistique descriptive 2. Caractristiques de tendance centrale

Le premier dcile d1 : C'est une valeur pour laquelle un dixime des observations
(10%) lui sont infrieures ou gales et neuf diximes des observations (90%) lui sont
suprieures ou gales.
Le deuxime dcile d2 : C'est une valeur pour laquelle deux diximes des observations
(20%) lui sont infrieures ou gales et huit diximes des observations (80%) lui sont
suprieures ou gales.
Le kme dcile dk : C'est une valeur pour laquelle k dixime des observations lui sont
infrieures ou gales et (10 - k) dixime des observations lui sont suprieures ou
gales.
Le cinquime dcile correspond aussi la mdiane et au deuxime quartile.
Pour le calcul des dciles, on utilise la mme mthode de calcul que pour la mdiane et
les quartiles. Pour des donnes groupes en classes, on dtermine un dcile par
interpolation linaire.
Dsignons par :

[Ci ; Ci+1[ : la classe qui contient le dcile ;


n : le nombre total des observations ;
Fi : la frquence absolue cumule croissante ;
ni : la frquence absolue de la classe qui contient le dcile ;

Le dcile dk est compris entre Ci et Ci+1

Ci < dk < Ci+1

Fi-1 < k n < Fi


10

71
Statistique descriptive 2. Caractristiques de tendance centrale

Frquence cumule

Fi

k n /10

Fi-1

Caractre
Ci Qj Ci+1

On suppose que la distribution au sein de la classe est rgulire.

Ainsi : Ci 1 Ci = d k Ci
Fi Fi 1 k n Fi 1
10

d k Ci Ci 1 Ci ( k n Fi 1)
Fi Fi 1 10
Exemple 24 : La rpartition de la surface, en m, de 100 logements est reprsente dans le
tableau suivant :

Nombre de Frquences cumules


Surface en m
logements croissantes
0 20 10 10
20 40 20 30
40 60 40 70
60 100 18 88
100 160 8 96
160 260 4 100
Total 100

72
Statistique descriptive 2. Caractristiques de tendance centrale

En consultant les frquences absolues cumules croissantes, d1, qui correspond la


10me observation, se trouve dans la classe 0 20 m. d9, qui correspond la 90me
observation, se trouve dans la classe 100 160 m.
100
0
d1 0 20 10 20 m 2
10

9 100
88
d9 100 60 10 115 m 2
8
- 10 % des logements ont une superficie infrieure ou gale 20 m.
- 90 % des logements ont une superficie infrieure ou gale 115 m.
- 80 % des logements ont une superficie comprise entre 20 m et 115 m.

2.6. EXERCICES DAPPLICATION.

2.6.1. Exercice.

Soit la distribution suivante du nombre de pices dans 300 logements :

Nombre de pices Effectifs


1 35
2 51
3 68
4 55
5 49
6 42
Total 300

On demande de dterminer pour cette srie statistique la moyenne arithmtique, le mode la


mdiane et les quartiles.

k
Solution : x f i x i = 3,53 pices ; Mode = 3 pices ; Me = 2,95 soit 3 pices
i 1
q1 = 1,76 soit 2 pices ; q2 = Me = 3 pices et q3 = 4,31 soit 4 pices

73
Statistique descriptive 2. Caractristiques de tendance centrale

2.6.2. Exercice.

On a relev la recette hebdomadaire en milliers de dirhams de 40 commerces. Les donnes


brutes sont :

57 60 52 49 56 46 51 63 49 57
86 93 77 67 81 70 71 91 67 82
47 87 92 55 48 90 49 50 58 62
67 89 69 72 75 48 85 90 83 66

On demande de dterminer pour cette srie statistique la moyenne arithmtique et la


mdiane :

- A partir de la srie brute ;


- A partir de la distribution des frquences tablies lexercice 1.3.4.
- Comparer les rsultats obtenus.

Solution : Srie brute : Moyenne = 67 675 DH ; Me = 67 000 DH

k
Srie des frquences : x f i x i = 68 200 DH ; Me = 66 444 Dh
i 1
Comparaison des rsultats : Les rsultats obtenus partir de la distribution des
frquences sont des rsultats approximatifs.

2.6.3. Exercice.

Le tableau suivant prsente le nombre de femmes en activit selon l'ge de 500 femmes
actives :
Tranche d'ges Effectif
[15 20[ 14
[20 25[ 70
[25 30[ 100
[30 35[ 65
[35 40[ 69
[40 45[ 56
[45 50[ 63
[50 55[ 61
55 et plus 2

On demande de dterminer pour cette srie statistique la moyenne arithmtique, le mode, la


mdiane et les quartiles.

Dterminer lintervalle central qui contient 60 % des femmes actives.


74
Statistique descriptive 2. Caractristiques de tendance centrale

k
Solution : x f i x i = 35,92 ans ; Mo = 27,5 ans ; Me = 35,07 ans
i 1
q1 = 27,05 ans ; q2 = Me = 35,07 ans et q3 = 45,08 ans
d2 = 25,8 ans ; d8 = 47,06 ans => 60 % des femmes actives sont ges entre 25,8 et 47,06 ans.
2.6.4. Exercice.
Le tableau suivant donne le niveau de scolarit, en nombre dannes passes lcole, dun
chantillon de 200 personnes.

Niveau de scolarit Effectif


[0 ; 6[ 40
[6 ; 12[ 80
[12 ; 14[ 50
[14 ; 16[ 30
Total 200

On demande de dterminer pour la srie statistique la moyenne arithmtique, le mode, la


mdiane et les quartiles.
k
Solution : x f i x i = 9,72 annes soit 10 annes environ ; Mode = 13 et
i 1
Me = 10,5 annes
q1 = 6,75 annes ; q2 = Me = 10,5 annes et q3 = 13,2 annes
2.6.5. Exercice.
Un organisme charg de raliser des enqutes statistiques gre un rseau de 125 enquteurs. La
direction de cet organisme dcide d'tudier la rpartition de ses enquteurs selon le nombre
d'enqutes qu'ils ont ralises. Les donnes collectes ce sujet sont rsumes dans le tableau
ci-aprs :

Nombre d'enqutes ralises Effectifs


5 8
10 12
15 35
20 40
25 20
30 10

75
Statistique descriptive 2. Caractristiques de tendance centrale

On demande de dterminer pour cette srie statistique la moyenne arithmtique, le mode et


la mdiane.

k
Solution : x f i x i = 18,28 enqutes ; Mode = 20 enqutes et Me = 15,94 soit 16
i 1
enqutes environ.

2.6.6. Exercice.

Une cooprative laitire fabrique un fromage qui doit contenir, selon les tiquettes, 45 % de
matires grasses. Un institut de consommation dont le rle est de vrifier que la qualit des
produits est bien celle qui est affirme par l'tiquette, fait prlever et analyser un chantillon de
100 fromages. Les rsultats de l'analyse sont consigns dans le tableau suivant :

Taux de matires grasses Nombre de fromages


[41,5 - 42,5[ 1
[42,5 - 43,5[ 11
[43,5 - 44,5[ 24
[44,5 - 45,5[ 38
[45,5 - 46,5[ 22
[46,5 - 47,5[ 3
[47,5 - 48,5[ 1
On demande de dterminer pour la srie statistique la moyenne arithmtique, le mode, la
mdiane, la mdiale et les quartiles.
k
Solution : x f i x i = 44,82 % ; Mode = 45 % ; Me = 44,87 % et Ml = 44,89 %
i 1
q1 = 44,04 % ; q2 = Me = 44,87 % et q3 = 45,55 %

2.6.7. Exercice.

Si le prix d'un article double tous les quatre ans, quel est le taux moyen d'augmentation du prix
par an ?

4
Solution : Moyenne gomtrique : Taux moyen = 2 -1 = 0,189 = 18,9 %

2.6.8. Exercice.

Une enqute, abordant la crise de logement, a t ralise auprs d'un chantillon de 1000
personnes choisies dans quatre rgions diffrentes. Parmi les rsultats de cette enqute on a
relev le nombre moyen de personnes par pice pour chaque rgion.

76
Statistique descriptive 2. Caractristiques de tendance centrale

Nombre moyen de Nombre d'habitants


Rgion
personnes par pice (en milliers)
Nord 2,2 5146
Est 2,6 5600
Ouest 3,1 6350
Sud 3,3 7000

Quel est le nombre moyen de personnes par pice pour l'ensemble des quatre rgions ?
Solution : Moyenne harmonique = 2,78 personnes par pices soit 278 personnes pour 100
pices.

2.6.9. Exercice.

Le coefficient budgtaire de la consommation des mnages en services de sant est pass de 6,9
% en 1990 8,5 % en 1995, puis 9,8 % en 2000, 10,6 % en 2004 et enfin 10,9 % en 2005.

a) Calculer les taux annuels moyens de croissance pour les priodes suivantes : (1990 1995) ;
(1995 2000) ; (2000 2004) et (2004 2005).
b) Dterminer le taux de croissance annuel moyen de 1990 2005.
c) Donner une estimation du coefficient budgtaire en 2010 si la tendance relative de la priode
2000 - 2005 se maintenait.

Solution : a) t1995/1990 = 4,26 % par an ; t2000/1995 = 2,89 % par an ; t2004/2000 = 1,98 % par an et
t2005/2004 = 2,83 %. b) t2005/1995 = 3,10 % par an. c) Coefficient budgtaire estim en 2010 = 12,1
%.

2.6.10. Exercice.

Le prix la tonne d'une matire premire a volu au cours de la priode allant de 2001 2005,
comme suit :

Anne 2001 2002 2003 2004 2005


Prix unitaire 310 266 220 200 150

a) Sachant que chaque anne une socit achte la mme quantit de cette matire premire,
calculer le cot moyen pour les cinq annes.
b) Quel est le cot moyen si la socit dpense, chaque anne, la mme somme : 1 00 000 DH,
pour l'achat de cette matire premire ?

Solution : a) Cot moyen = 229,2 DH/t. b) Cot moyen = 215,54 DH/t.

77
Statistique descriptive 3. Caractristiques de dispersion

CHAPITRE 3
CARACTERISTIQUES DE DISPERSION

Les paramtres de dispersion dune srie statistique permettent de chiffrer la variation des
valeurs observes autour d'un paramtre de position. Les principaux paramtres de dispersion
sont : lcart absolu moyen, la variance, l'cart type, le coefficient de variation et le coefficient
de concentration.

Comme pour les caractristiques centrales, nous ne nous intressons ici quaux sries
statistiques relatives des caractres quantitatifs discrets ou continus, cest--dire des sries
statistiques donnes sous les formes : (xi) , (xi ; ni) , (xi ; fi) ou {[Ci ; Ci+1[ ; fi }.

3.1. LECART ABSOLU MOYEN.

Lcart absolu dune variable xi par rapport la moyenne de la srie est donn par la
formule simple : xi x o x est la moyenne de la srie.

Lcart absolu moyen Em est la moyenne de tous les carts ainsi dfinis, il est donn par la
formule simple suivante :
n
x i x
Em i 1

n
Dans le cas dune srie statistique donne par un ensemble (xi , ni), c'est--dire lorsque
chaque valeur xi est rpte ni fois et quil y a k valeurs xi diffrentes, lcart absolu moyen se
dduit simplement de la formule prcdente :
k
n x x i i
Em i 1
k

n
i 1
i

78
Statistique descriptive 3. Caractristiques de dispersion

k n k
En effet : n = n
i 1
i et x x n
i 1
i
i 1
i x i x lorsque chaque valeur xi est rpte ni

fois dans la srie.

De mme, dans le cas dune srie statistique donne par un ensemble (xi , fi) lcart absolu
moyen se dduit simplement de la formule prcdente :

k
Em f i xi x
i 1

En effet lorsque chaque valeur xi est rpt ni fois dans la srie, c'est--dire fi % , on peut
crire :

k k
ni
n= ni ;
i 1
fi
n
et f
i 1
i =1

k
ni xi x k
n
f
i 1 k
Em k
= i xi x = i xi x
i 1 n
ni i 1
i 1

Dans le cas dune srie statistique donne sous la forme de classes [Ci ; Ci+1[, sachant que
pour faire des calculs, on doit remplacer cette srie par une srie quivalente en remplaant
chaque classe [Ci ; Ci+1[ par le point central ci , la formule de lcart absolu moyen devient :

k
n i ci x k
ni k
Em i 1
k
= ci x = f i ci x
n i 1 n i 1
i
i 1

C i C i 1
Avec ci = centre de la classe : [Ci ; Ci+1[
2
Remarque : On parle dcart absolu plutt que dcart tout court car lcart moyen est nul.

Exemple 1 : On considre lensemble des notes obtenues par les tudiants dune cole, dans
une matire ; on a la srie statistique suivante donne sous la forme simple (xi) et pour laquelle
on demande de calculer lcart absolu moyen.
79
Statistique descriptive 3. Caractristiques de dispersion

12 11 13 12 13
15 13 12 13 11
13 15 11 11 12
12 12 10 12 15

La moyenne de cette srie est facile calculer, elle est gale 12,4. De l nous pouvons
calculer les carts absolus de chaque variable par rapport la moyenne :

0,4 1,4 0,6 0,4 0,6


2,6 0,6 0,4 0,6 1,4
0,6 2,6 1,4 1,4 0,4
0,4 0,4 2,4 0,4 2,6

La somme de tous ces carts absolus est 21,6 et la moyenne est 1,08 qui est lcart absolu
moyen.

Exemple 2 : On considre la mme srie statistique quon reprsente sous la forme (xi ; ni)
pour laquelle on demande de calculer lcart absolu moyen.

xi ni
10 1
11 4
12 7
13 5
15 3

La moyenne de la srie tant toujours gale 12,4, le calcul des carts absolus puis de
lcart absolu moyen peut tre facilement fait selon le tableau suivant :

xi ni ni xi xi x ni xi x
10 1 10 2,4 2,4
11 4 44 1,4 5,6
12 7 84 0,4 2,8
13 5 65 0,6 3
15 3 45 2,6 7,8
Total 20 248 --- 21,6
Moyenne --- 12,4 --- 1,08

Exemple 3 : On considre la mme srie statistique quon reprsente sous la forme (xi ; fi)
pour laquelle on demande de calculer lcart absolu moyen.

80
Statistique descriptive 3. Caractristiques de dispersion

xi ni fi
10 1 5%
11 4 20%
12 7 35%
13 5 25%
15 3 15%
Total 20 100%

La moyenne de la srie tant toujours gale 12,4, le calcul des carts absolus des variables
xi par rapport la moyenne puis de lcart absolu moyen peut tre facilement fait selon le
tableau suivant :

xi ni fi fi xi xi x fi xi x
10 1 0,05 0,5 2,4 0,12
11 4 0,20 2,2 1,4 0,28
12 7 0,35 4,2 0,4 0,14
13 5 0,25 3,25 0,6 0,15
15 3 0,15 2,25 2,6 0,39
Total 20 100% 12,4 --- 1,08
Moyenne --- --- 12,4 --- 1,08

On remarque que sur ces 3 exemples, pour calculer lcart absolu moyen, on utilise lune
des 3 formules selon la forme sous laquelle la srie statistique est donne.

Exemple 4 : On considre un chantillon de 30 personnes pour lesquelles on mesure la


taille. On demande de calculer lcart absolu moyen sachant que les rsultats des mesures sont
donns dans le tableau suivant.

Tailles [Ci ; Ci+1[ en m Effectifs ni


[1,50 ; 1,60[ 2
[1,60 ; 1,70[ 4
[1,70 ; 1,80[ 18
[1,80 ; 1,90[ 5
[1,90 ; 2,00[ 1
Total 30

Aprs avoir remplac la srie donne sous la forme ([Ci ; Ci+1[) en une srie quivalente
reprsente sous la forme (ci ; ni), avec ci = (Ci + Ci+1) / 2, les calculs de lcart absolu moyen
peuvent tre rsums dans le tableau synthtique suivant :

81
Statistique descriptive 3. Caractristiques de dispersion

ci ni ni ci xi x ni xi x
1,55 2 3,10 0,20 0,40
1,65 4 6,60 0,10 0,40
1,75 18 31,50 0,00 0,00
1,85 5 9,25 0,10 0,50
1,95 1 1,95 0,20 0,20
Total 30 52,40 --- 1,50
Total / n 1,75 0,050

La moyenne de la srie est 1,75 m et lcart absolu moyen est 0,05 m.

3.2. LA VARIANCE.

La variance V(x), note aussi S, est la moyenne des carrs des carts par rapport la
moyenne ; elle est donne, par dfinition, par la formule simple suivante :
n
(x i x) 2
S2 i 1

n
Dans le cas dune srie statistique donne par un ensemble (xi , ni), c'est--dire lorsque
chaque valeur xi est rpte ni fois et quil y a k valeurs xi diffrentes, la variance se dduit
simplement de la formule prcdente :
k
n (x i i x) 2
S2 i 1
k

n i 1
i

k n k
En effet : n = ni et
i 1
(xi x) ni (xi x) lorsque chaque valeur xi est rpte
i 1 i 1

ni fois dans la srie.

De mme dans le cas dune srie statistique donne par un ensemble (xi , fi) la variance se
dduit simplement de la formule prcdente :

k
S 2 f i ( x i x )
i 1

82
Statistique descriptive 3. Caractristiques de dispersion

En effet lorsque chaque valeur xi est rpt ni fois dans la srie, c'est--dire fi % , on peut
crire :
k
ni
n
k
n= i ; fi et fi = 1
i 1 n i 1

n (x i i x) 2 k
ni k
S2 i 1
k
= (x i x) 2 = f (x i i x) 2
n i 1 n i 1
i
i 1
Dans le cas dune srie statistique donne sous la forme de classes [Ci ; Ci+1[, sachant que
pour faire des calculs, on doit remplacer cette srie par une srie quivalente en remplaant
chaque classe [Ci ; Ci+1[ par le point central ci , la formule de la variance devient :
k

n (c i i x) 2 k
ni k
S2 i 1
k
= (c i x ) 2 = f (c i i x) 2
n i 1 n i 1
i
i 1
C i C i 1
Avec ci = centre de la classe : [Ci ; Ci+1[
2
Formule dveloppe de la variance : elle est donne, selon la forme de la srie statistique :

* Cas dune srie statistique de n observations xi distinctes :


n
xi
2
2 2
S i 1
x x2 x
n
* Cas dune srie statistique de k observations xi distinctes dont chacune est rptes ni
fois :
k
nixi
2
2 2
S i 1
k
x x2 x
ni
i 1

* Cas dune srie statistique de k observations xi distinctes dont chacune est prsentes fi fois
(en %) :
k 2 2
S f i x i x x 2 x
2

i 1

83
Statistique descriptive 3. Caractristiques de dispersion

* Cas dune srie statistique donne sous la forme de k classes [Ci ; Ci+1[ayant chacune un
effectif ni ou une frquence fi :
k 2 2
S f i c i x x 2 x
2

i 1

C i C i 1
Avec ci = centre de la classe : [Ci ; Ci+1[
2
Toutes ces formules peuvent tre crites, comme nous lavons bien montr, sous la forme
simple et condense :
2
S2 x 2 x

Transformation linaire

Si Y = ax + b avec a et b deux constantes quelconques alors la variance de y est :


Sy a Sx .
2 2

Exemple 5 : Le tableau suivant prsente les prix en DH de 100 ordinateurs portables


achets dans diffrents points de vente :

Prix Nombre dordinateurs


[10000 ; 11000[ 9
[11000 ; 12000[ 10
[12000 ; 13000[ 10
[13000 ; 14000[ 14
[14000 ; 15000[ 16
[15000 ; 16000[ 14
[16000 ; 17000[ 12
[17000 ; 18000[ 15
Total 100

Pour calculer la variance des prix des ordinateurs, on peut utiliser la proprit de la
transformation linaire dans le but de simplifier les calculs.

On effectue un changement de variable, c'est--dire, on remplace la variable prix par une


autre variable y de telle sorte que le prix soit une transformation linaire de y.
pb
p = ay + b Donc : y=
a

84
Statistique descriptive 3. Caractristiques de dispersion

Il faut choisir les constantes a et b qui donnent des valeurs trs simples de y. On choisit la
constante b parmi les valeurs de p, de prfrence une valeur du milieu, pour avoir une valeur
nulle de y au milieu. On choisit la constante a comme tant le plus grand diviseur commun des
valeurs de (p - b) (le plus souvent a est l'amplitude constante des classes) pour avoir des valeurs
entires de y.

Pour notre exemple, on choisit :

b = 13500 et a = 1000

p 13500
Y=
1000
Les valeurs de y deviennent trs simples, on peut alors calculer facilement la moyenne et la
variance de y.

Nombre
Point central
Prix dordinateurs yi niyi ni yi
(ci)
(ni)
[10000 ; 11000[ 9 10500 -3 -27 81
[11000 ; 12000[ 10 11500 -2 -20 40
[12000 ; 13000[ 10 12500 -1 -10 10
[13000 ; 14000[ 14 13500 0 0 0
[14000 ; 15000[ 16 14500 1 16 16
[15000 ; 16000[ 14 15500 2 28 56
[16000 ; 17000[ 12 16500 3 36 108
[17000 ; 18000[ 15 17500 4 60 240
Total 100 83 551

n y i i

y i 1
8
83 0,83
100
n
i 1
i

n y
2
i i
2
Sy y 551 0,83 4,82
2 i 1
8
100
n i 1
i

85
Statistique descriptive 3. Caractristiques de dispersion

On calcule facilement la moyenne et la variance grce aux formules de la transformation


linaire :


p 1000 y 13500 1000 0,83 13500 14330 DH
S p 1000 S y 1000 4,82 4820000
2 2

3.3. LECART TYPE.

Lcart type S est la racine carre de la variance, il est donn, par dfinition, par les
formules suivantes :

* Cas dune srie statistique de n observations xi distinctes :


n
(x x) i

S i 1
n

* Cas dune srie statistique de k observations xi distinctes dont chacune est rptes ni fois
:
k
n (x i i x) 2
S i 1
k

n
i 1
i

* Cas dune srie statistique de k observations xi distinctes dont chacune est prsentes fi fois
(en %) :
k
S f (x
i 1
i i x)

* Cas dune srie statistique donne sous la forme de k classes [Ci ; Ci+1[ ayant chacune un
effectif ni ou une frquence relative fi :
k
S f i (c i x ) 2
i 1

C i C i 1
avec ci = centre de la classe : [Ci ; Ci+1[
2

86
Statistique descriptive 3. Caractristiques de dispersion

Dune faon gnrale, nous pouvons utiliser, quelque soit la forme sous laquelle est donne
la srie statistique, la formule condense simple :
2
S x2 x

3.4. LE COEFFICIENT DE VARIATION.

Le coefficient de variation CV ou coefficient de dispersion est le rapport de l'cart type la


moyenne. Il est exprim sous la forme d'un pourcentage.
S
CV
100 en %
x
Le coefficient de variation est indpendant des units choisies, il est utile pour comparer des
distributions qui ont des units diffrentes.

Exemple 6 : On considre toujours la mme srie, des 3 premiers exemples de ce chapitre.


Soit lensemble des notes obtenues par les tudiants dune cole, dans une matire ; on a la
srie statistique suivante donne sous la forme simple (xi ; ni) et pour laquelle on demande de
calculer la variance, lcart type et le coefficient de dispersion.

xi ni fi fi xi xi fi xi
10 1 0,05 0,5 100 5
11 4 0,20 2,2 121 24,2
12 7 0,35 4,2 144 50,4
13 5 0,25 3,25 169 42,25
15 3 0,15 2,25 225 33,75
Total 20 100% 12,4 --- 155,6
Moyenne --- --- 12,4 --- 155,6

Ainsi la variance de le srie est S = 155,6 12,4 =1,84


Lcart type est gal S = 1,356
1,356
Le coefficient de dispersion CV = 100 10,94% ce qui dnote dune lgre
12,4
dispersion de la srie autour de sa moyenne.
Exemple 7 : On considre la srie de lexemple 4 relative au poids de 30 personnes et on
demande de calculer la variance, lcart type et le coefficient de variation de cette srie qui est
donne par le tableau suivant :

87
Statistique descriptive 3. Caractristiques de dispersion

Tailles [Ci ; Ci+1[ en m Effectifs ni


[1,50 ; 1,60[ 2
[1,60 ; 1,70[ 4
[1,70 ; 1,80[ 18
[1,80 ; 1,90[ 5
[1,90 ; 2,00[ 1
Total 30

Aprs avoir remplac la srie donne sous la forme ([Ci ; Ci+1[) en une srie quivalente
reprsente sous la forme (ci ; ni)

avec ci = (Ci + Ci+1) / 2, les calculs de la variance, de lcart type et du coefficient de variation
peuvent tre rsums dans le tableau synthtique suivant :

ci ni ni ci ni ci2
1,55 2 3,10 4,8050
1,65 4 6,60 10,8900
1,75 18 31,50 55,1250
1,85 5 9,25 17,1125
1,95 1 1,95 3,8025
Total 30 52,40 91,7350
Total / n 1,7467 3,0578

La moyenne de la srie est gale 52,40 / 30 = 1,75 m

La variance est V = 3,0578 1.7467 = 0,0064 m

Lcart type est gal S 3,0578 1,7467 = 0,08 m

Le coefficient de dispersion est gal 0,08 / 1.75 = 4,57% ce qui dnote dune trs faible
dispersion de la srie autour de sa moyenne.

Exemple 8 : Allal est un marchand de journaux, il comptabilise le nombre de journaux quil


vend, par jour, en un mois et dresse ses rsultats dans le tableau suivant.

125 118 127 110 107 125


118 110 107 125 127 127
107 125 118 107 107 118
107 118 125 127 125 107
110 125 127 127 125 125

Calculer la variance, lcart type et le coefficient de dispersion de cette srie.

88
Statistique descriptive 3. Caractristiques de dispersion

Commenons dabord par reprsenter cette srie, donne sous la forme (xi) en une srie
quivalente sous la forme (xi ; ni) aprs avoir compt combien de fois chaque valeur xi est
rpte.

On obtient la srie quivalente suivante :

Nombre de journaux vendus Nombre de fois


107 7
110 3
118 5
125 9
127 6
Total 30

Les calculs de la moyenne, de la variance, de lcart type et du coefficient de variation de la


srie peuvent tre rsums dans le tableau suivant :

xi ni ni xi ni xi
107 7 749 80143
110 3 330 36300
118 5 590 69620
125 9 1125 140625
127 6 762 96774
Total 30 3556 423462
Total/n 118,53 14115,40

La moyenne de la srie se situe entre 118 et 119 journaux vendus par jour.

La variance est gale V = 14115,40 118,53 = 66,04

Lcart type est gal S 66,04 = 8,13

Le coefficient de dispersion est gal 8,13 / 118,53 = 6,86% ce qui dnote dune lgre
dispersion de la srie.

Exemple 9 : Les salaires verss, par une entreprise, ses 130 salaris sont rpartis comme
suit :

89
Statistique descriptive 3. Caractristiques de dispersion

Nombre de salaris Nombre de salaris


Tranches de salaire Total
hommes femmes
[1000 ; 2000[ 8 4 12
[2000 ; 3000[ 12 9 21
[3000 ; 4000[ 10 6 16
[4000 ; 5000[ 14 10 24
[5000 ; 6000[ 11 8 19
[6000 ; 7000[ 8 6 14
[7000 ; 8000[ 7 5 12
[8000 ; 10000[ 5 2 7
[10000 ; 15000[ 3 1 4
[15000 ; 20000[ 1 0 1
Total 79 51 130

On demande de calculer la moyenne, la variance, lcart type et le coefficient de variation


pour lensemble des salaris et pour chaque sexe.

Calculs pour lensemble des salaris.

Calcul de la moyenne, la variance, lcart type et le coefficient de


variation.

Tranches de salaire ci ni ni ci ci ni ci
[1000 ; 2000[ 1500 12 18000 2250000 27000000
[2000 ; 3000[ 2500 21 52500 6250000 131250000
[3000 ; 4000[ 3500 16 56000 12250000 196000000
[4000 ; 5000[ 4500 24 108000 20250000 486000000
[5000 ; 6000[ 5500 19 104500 30250000 574750000
[6000 ; 7000[ 6500 14 91000 42250000 591500000
[7000 ; 8000[ 7500 12 90000 56250000 675000000
[8000 ; 10000[ 9000 7 63000 81000000 567000000
[10000 ; 15000[ 12500 4 50000 156250000 625000000
[15000 ; 20000[ 17500 1 17500 306250000 306250000
Total - 130 650500 - 4179750000

La moyenne est : x 650500 = 5003,85 DH.
130
La variance est : S = 4179750000 5003,85 = 7113446,75
130
Lcart type est : S = 7113446,75 = 2667,10 DH

90
Statistique descriptive 3. Caractristiques de dispersion

2667,10
Le coefficient de variation est : CV = x 100 = 53,3 %
5003,85

Calculs pour les salaris hommes.

Calcul de la moyenne, la variance, lcart type et le coefficient de variation

Tranches de
ci ni ni ci ci ni ci
salaire
[1000 ; 2000[ 1500 8 12000 2250000 18000000
[2000 ; 3000[ 2500 12 30000 6250000 75000000
[3000 ; 4000[ 3500 10 35000 12250000 122500000
[4000 ; 5000[ 4500 14 63000 20250000 283500000
[5000 ; 6000[ 5500 11 60500 30250000 332750000
[6000 ; 7000[ 6500 8 52000 42250000 338000000
[7000 ; 8000[ 7500 7 52500 56250000 393750000
[8000 ; 10000[ 9000 5 45000 81000000 405000000
[10000 ; 15000[ 12500 3 37500 156250000 468750000
[15000 ; 20000[ 17500 1 17500 306250000 306250000
Total - 79 405000 2743500000

La moyenne est : x 405000 = 5126,58 DH.
79
La variance est : S = 2743500000 5126,58 = 8446002,24
79
Lcart type est : S = 8446002,24 = 2906,20 DH
2906,20
Le coefficient de variation est : CV = x 100 = 56,7 %
5126,58
Calculs pour les salaris femmes.

Calcul de la moyenne, la variance, lcart type et le coefficient de variation

Tranches de salaire ci ni ni ci ci ni ci
[1000 ; 2000[ 1500 4 6000 2250000 9000000
[2000 ; 3000[ 2500 9 22500 6250000 56250000
[3000 ; 4000[ 3500 6 21000 12250000 73500000
[4000 ; 5000[ 4500 10 45000 20250000 202500000
[5000 ; 6000[ 5500 8 44000 30250000 242000000
[6000 ; 7000[ 6500 6 39000 42250000 253500000
91
Statistique descriptive 3. Caractristiques de dispersion

[7000 ; 8000[ 7500 5 37500 56250000 281250000


[8000 ; 10000[ 9000 2 18000 81000000 162000000
[10000 ; 15000[ 12500 1 12500 156250000 156250000
[15000 ; 20000[ 17500 0 0 306250000 0
Total - 51 245500 1436250000


La moyenne est : x 244500 = 4794,12 DH.
51
La variance est : S = 1436250000 4794,12 = 5178200,69
51
Lcart type est : S = 5178200,69 = 2275,57 DH
2275,57
Le coefficient de variation est : CV = x 100 = 47,47 %
4794,12
Rcapitulatif des rsultats

Salaris Moyenne Ecart type Coefficient de variation


Hommes 5126,58 2906,20 56,7 %
Femmes 4794,12 2275,57 47,47 %
Ensemble 5003,85 2667,10 53,3 %

En moyenne, un salari de lentreprise peroit un salaire de 5003,85. La rpartition des


salaires est caractrise par une forte dispersion.

La rpartition des salaires varie selon le sexe, en effet, un salari


homme touche, en moyenne, plus quun salari femme,
(respectivement 5126,58 DH et 4794,12 DH). Les salaires sont plus
disperss chez les hommes que chez les femmes, 56,7 % pour les
premiers et 47,47 % pour les seconds.

92
Statistique descriptive 3. Caractristiques de dispersion

Rpartition des salaires selon le sexe

0,016

0,014

0,012
densit di
0,01

0,008

0,006

0,004

0,002

0
1500

2500

3500

4500

5500

6500

7500

8500

9500

10500

11500

12500

13500

14500

15500

16500

17500

18500

19500
salaires
hommes femmes

3.5. INDICE DE CONCENTRATION.

Lindice de concentration est donn par la formule :

Mdiale - Mdiane
Indice de concentration 100
Etendu
Exemple 10 : On considre lensemble des buts marqus par une quipe durant les 30
matchs du championnat de football, on a la srie statistique suivante donne sous la forme
simple (xi) et pour laquelle on demande de calculer la moyenne, la variance, lcart type, le
coefficient de variation et le coefficient de concentration.

1 2 1 2 0
3 1 3 2 4
0 2 0 1 1
2 0 1 3 2
1 3 2 0 5
5 2 1 2 3

La somme et la somme des carres de cette srie sont faciles calculer :

30 30

xi = 55
i 1
x
i 1
i = 155

93
Statistique descriptive 3. Caractristiques de dispersion


La moyenne de cette srie est : x = 55 = 1,83 but par match.
30
La variance de cette srie est : S = 155 - 1,83 = 1,82
30
Lcart type de cette srie est : S = 1,82 = 1,35 but
1,35
Le coefficient de variation est : CV = x 100 = 73,77 %
1,83

Pour dterminer la mdiane de cette srie, on considre le nombre d'observations, 30 qui est
pair, la mdiane est comprise entre l'observation de rang 15 et l'observation de rang 16. On
prend comme valeur de la mdiane la moyenne arithmtique simple des deux observations. La
srie classe par ordre croissant est :

0 1 1 2 3
0 1 2 2 3
0 1 2 2 3
0 1 2 2 4
0 1 2 3 5
1 1 2 3 5

x15 < Me x16

2 Me 2 ce qui donne : Me = 2 buts

Pour dterminer la mdiale de cette srie on cumule les valeurs de la srie classe jusqu
arriver la moiti de la somme totale, cest dire 22,5. Elle correspond la valeur 2.

La mdiane est gale la mdiale, le coefficient de concentration de cette srie est donc nul.

Exemple 11 : On considre la mme srie statistique de lexemple 10 et on la reprsente


sous la forme (xi ; ni). On demande de calculer la moyenne, la variance, lcart type, le
coefficient de variation et le coefficient de concentration de cette srie.

xi ni
0 5
1 8
2 9
3 5
4 1
5 2
Total 30

94
Statistique descriptive 3. Caractristiques de dispersion

La somme et la somme des carrs de cette srie sont faciles calculer :

6 6

n x
i 1
i i = 55 n x
i 1
i i = 155


La moyenne de cette srie est : x = 55 = 1,83 but par match.
30
La variance de cette srie est : S = 155 - 1,83 = 1,82
30
Lcart type de cette srie est : S = 1,82 = 1,35 but

Le coefficient de variation de cette srie est :


1,35
CV = x 100 = 73,77 %
1,83

Calcul de lindice de concentration :

xi ni Fi ni xi ni xi cumul
0 5 5 0 0
1 8 13 8 8
2 9 22 18 26
3 5 27 15 41
4 1 28 4 45
5 2 30 10 55
Total 30 --- 55 ---

Pour dterminer la mdiane de cette srie on considre le nombre d'observations, 30 qui est
pair ; la mdiane est comprise entre l'observation de rang 15 et l'observation de rang 16. On
prend comme valeur de la mdiane la moyenne arithmtique simple des deux observations.

x15 < Me x16

2 Me 2 ce qui donne : Me = 2 buts

La mdiale de cette srie est la moiti de la somme totale, cest dire 22,5 qui correspond
la valeur 2

La mdiane est gale la mdiale, le coefficient de concentration de cette srie est donc nul.
Exemple 12 : Une cooprative laitire fabrique un fromage qui doit contenir, selon les
tiquettes, 45 % de matires grasses. Un institut de consommation dont le rle est de vrifier
que la qualit des produits est bien celle qui est affiche par l'tiquette, fait prlever et analyser
95
Statistique descriptive 3. Caractristiques de dispersion

un chantillon de 120 fromages. Les rsultats de l'analyse sont consigns dans le tableau suivant
:

Taux de matires grasses Nombre de fromages


[41,5 - 42,5[ 10
[42,5 - 43,5[ 11
[43,5 - 44,5[ 24
[44,5 - 45,5[ 38
[45,5 - 46,5[ 22
[46,5 - 47,5[ 4
[47,5 - 48,5[ 11

On demande de calculer la moyenne, la variance, lcart type, le coefficient de variation et


le coefficient de concentration de cet chantillon.

ci ni fi f i ci ci fi ci
42 10 8,33% 3,4986 1764 146,9412
43 11 9,17% 3,9431 1849 169,5533
44 24 20% 8,8 1936 387,2
45 38 31,67% 14,2515 2025 641,3175
46 22 18,33% 8,4318 2116 387,8628
47 4 3,33% 1,551 2209 73,5597
48 11 9,17% 4,4016 2304 211,2768
Total 120 100% 44,8776 2017,7113
Moyenne 44,8776 2017,7113

La moyenne est : 44,8776 % de matires grasses.

La variance est : S = 2017,7113 44,8776 = 3,712

Lcart type est : S = 3,712 = 1,93 % de matires grasses.


1,93
Le coefficient de variation est : CV = x100 = 4,3 %
44,8776
Les calculs de lindice de concentration peuvent tre rsums dans le tableau suivant :

Taux de matires
ni fi Fi f i ci fi ci cumul
grasses
[41,5 42,5[ 10 8,33% 8,33% 3,4986 3,4986
[42,5 43,5[ 11 9,17% 17,5% 3,9431 7,4417
[43,5 44,5[ 24 20% 37,5% 8,8 16,2417
96
Statistique descriptive 3. Caractristiques de dispersion

[44,5 45,5[ 38 31,67% 69,17% 14,2515 30,4932


[45,5 46,5[ 22 18,33% 87,5% 8,4318 38,925
[46,5 47,5[ 4 3,33% 90,83% 1,551 40,476
[47,5 48,5[ 11 9,17% 100% 4,4016 44,8776
Total 120 100% --- 44,8776 ---

En consultant les frquences cumules croissantes, la classe mdiane qui correspond 50%,
est la classe [44,5 45,5[. La mdiane est donc :
44,5 < Me < 45,5
37,5 < 50 < 69,17

Un calcul simple dextrapolation donne pour la mdiane :


45,544,5 Me44,5
=
69,1737,5 5037,5
Me = 44,5 + 1 x 12,5 = 44,89
31,67
En consultant les sommes cumules croissantes, la moiti de la somme totale (soit 22,4388)
se trouve dans la classe [44,5 45,5[. La mdiale est donc :

44,5 < Ml < 45,5


16,2417 < 22,4388 < 30,4932

Un calcul simple dextrapolation donne pour la mdiale :

45,544,5 Ml44,5
=
30,493216,2417 22,438816,2417
Ml = 44,5 + 1 x 6,1971 = 44,93
14,2515

Ltendu de la srie est : 48,5 41,5 = 7

Lindice de concentration est donn par la formule :


Mdiale - Mdiane
Indice de concentration 100 =0,57%
Etendu
Exemple 13 : On reprend les donnes de lexemple 8 relatives aux ventes de journaux faites
par Allal, pour calculer lindice de concentration de la srie qui est donne par le tableau
suivant :

125 118 127 110 107 125

97
Statistique descriptive 3. Caractristiques de dispersion

118 110 107 125 127 127


107 125 118 107 107 118
107 118 125 127 125 107
110 125 127 127 125 125

Calculons lindice de concentration de cette srie.

Rappelons les rsultats que nous avons dj trouvs lors de ltude de lexemple 8,
savoir :

La moyenne est : 118,53.

Lcart type est : 8,13.

Le coefficient de variation est : 6,86%.

Pour dterminer la mdiane, sagissant dune srie donne sous la forme brute (xi), il nous
faudra la classer par valeurs croissantes des ventes. On obtient le tableau suivant :

107 107 107 107 107 107


107 110 110 110 118 118
118 118 118 125 125 125
125 125 125 125 125 125
127 127 127 127 127 127

Il y a 30 observations, la mdiane est la moyenne arithmtique des 15 et 16 observations,


soit :

Me = (118 + 125) / 2 = 121,5

Pour dterminer la mdiane, on doit consulter les frquences cumules croissantes, la valeur
mdiane est exactement 118.

Pour dterminer la mdiale, nous devons rorganiser la srie sous la forme (xi ; ni).

Xi ni fi Fi Somme ni xi Sommes cumules croissantes


107 7 0,2333 0,2333 749 749
110 3 0,1000 0,3333 330 1079
118 5 0,1667 0,5000 590 1669
125 9 0,3000 0,8000 1125 2794
127 6 0,2000 1,0000 762 3556
98
Statistique descriptive 3. Caractristiques de dispersion

En consultant les sommes cumules croissantes, la moiti de la somme totale (soit 1778) se
trouve entre les valeurs 118 et 125. La mdiale est donc :

118 < Ml < 125


1669 < 1778 < 2794

Un calcul simple dextrapolation donne pour la mdiale :

125 118
= Ml118
2794 1669 17781669
La mdiale est : Ml = 118 + 109 x 0,006 222 = 118,68

Ltendu de la srie est : 127 107 = 20

Lindice de concentration est donn par la formule :

Mdiale - Mdiane
Indice de concentration 100 =3,4%
Etendu
Exemple 14 : On reprend les donnes de lexemple 9 et on demande de calculer le
coefficient de concentration des sries statistiques relatives aux salaires des hommes, des
femmes et de lensemble du personnel. Conclure.

a) Calculs pour lensemble des salaris

Tranches de salaire ci ni ni cumul ni ci ni ci cumul


[1000 ; 2000[ 1500 12 12 18000 18000
[2000 ; 3000[ 2500 21 33 52500 70500
[3000 ; 4000[ 3500 16 49 56000 126500
[4000 ; 5000[ 4500 24 73 108000 234500
[5000 ; 6000[ 5500 19 92 104500 339000
[6000 ; 7000[ 6500 14 106 91000 430000
[7000 ; 8000[ 7500 12 118 90000 520000
[8000 ; 10000[ 9000 7 125 63000 583000
[10000 ; 15000[ 12500 4 129 50000 633000
[15000 ; 20000[ 17500 1 130 17500 650500
Total Total 130 650500

99
Statistique descriptive 3. Caractristiques de dispersion

La mdiane correspond la 65me observation (130/2). En consultant les frquences


cumules croissantes, la classe mdiane est la classe [4000 ; 5000[. La mdiane est donc :

4000 < Me < 5000


49 < 65 < 73

5000 - 4000 = Me - 4000


73 - 49 65 - 49

Me = 4000 + 1000 x 16 = 4666,67 DH


24
En consultant les sommes cumules croissantes, la moiti de la somme totale (325250 DH)
se trouve dans la classe [5000 ; 6000[. La mdiale est donc :

5000 < Ml < 6000


234500 < 325250 < 339000

6000 - 5000 = Ml - 5000


339000 - 234500 325250 - 234500

Ml = 5000 + 1000 x 90750 = 5868,42 DH


104500
Ltendu de la srie est : 20000 1000 = 19000

Lindice de concentration est donn par la formule :

Mdiale - Mdiane
Indice de concentration 100
Etendu
5868,42 - 4666,67
Indice de concentration 100 = 6,33 %
19000

b) Calculs pour les salaris hommes

Tranches de salaire ci ni ni cumul ni ci ni ci cumul


[1000 2000[ 1500 8 8 12000 12000
[2000 3000[ 2500 12 20 30000 42000
[3000 4000[ 3500 10 30 35000 77000
[4000 5000[ 4500 14 44 63000 140000
100
Statistique descriptive 3. Caractristiques de dispersion

[5000 6000[ 5500 11 55 60500 200500


[6000 7000[ 6500 8 63 52000 252500
[7000 8000[ 7500 7 70 52500 305000
[8000 10000[ 9000 5 75 45000 350000
[10000 15000[ 12500 3 78 37500 387500
[15000 20000[ 17500 1 79 17500 405000
Total Total 79 405000

La mdiane correspond la 39,5me observation (79/2). En consultant les frquences cumules


croissantes, la classe mdiane est la classe [4000 5000[. La mdiane est donc :

4000 < Me < 5000


30 < 39,5 < 44
5000 - 4000 = Me - 4000
44 - 30 39,5 - 30
Me = 4000 + 1000 x 9,5 = 4678,57 DH
14
En consultant les sommes cumules croissantes, la moiti de la somme totale (202500 DH) se
trouve dans la classe [5000 6000[. La mdiale est donc :
6000 < Ml < 7000
200500 < 202500 < 252500
7000 - 6000 = Ml - 6000
252500 - 200500 202500 - 200500
Ml = 6000 + 1000 x 2000 = 6038,46 DH
52000
Ltendu de la srie est : 20000 1000 = 19000

Lindice de concentration est donn par la formule :

Mdiale - Mdiane
Indice de concentration 100
Etendu

6038,46 - 4678,57
Indice de concentration 100 = 7,16 %
19000
c) Calculs pour les salaris femmes

101
Statistique descriptive 3. Caractristiques de dispersion

Tranches de salaire ci Ni ni cumul ni ci ni ci cumul


[1000 ; 2000[ 1500 4 4 6000 6000
[2000 ; 3000[ 2500 9 13 22500 28500
[3000 ; 4000[ 3500 6 19 21000 49500
[4000 ; 5000[ 4500 10 29 45000 94500
[5000 ; 6000[ 5500 8 37 44000 138500
[6000 ; 7000[ 6500 6 43 39000 177500
[7000 ; 8000[ 7500 5 48 37500 215000
[8000 ; 10000[ 9000 2 50 18000 233000
[10000 ; 15000[ 12500 1 51 12500 245500
[15000 ; 20000[ 17500 0 51 0 245500
Total Total 51 245500

La mdiane correspond la 25,5me observation (51/2). En consultant les frquences cumules


croissantes, la classe mdiane est la classe [4000 5000[. La mdiane est donc :

4000 < Me < 5000


19 < 25,5 < 29

5000 - 4000 = Me - 4000


29 - 19 25,5 - 19

Me = 4000 + 1000 x 6,5 = 4650,00 DH


10
En consultant les sommes cumules croissantes, la moiti de la somme totale (122750 DH) se
trouve dans la classe [5000 6000[. La mdiale est donc :

102
Statistique descriptive 3. Caractristiques de dispersion

5000 < Ml < 6000


94500 < 122750 < 138500

6000 - 5000 = Ml - 5000


138500 - 94500 122750 - 94500

Ml = 5000 + 1000 x 28250 = 5642,05 DH


44000
Ltendu de la srie est : 15000 1000 = 14000

Lindice de concentration est donn par la formule :

Mdiale - Mdiane
Indice de concentration 100
Etendu

5642,05 - 4650,00
Indice de concentration 100 = 7,09 %.
14000
Rcapitulatif des rsultats.

Nous reproduisons, sur un mme tableau, les rsultats de lexemple 8 et ceux trouvs dans
cet exemple.

Coefficient de Indice de
Salaris Moyenne Ecart type
variation concentration
Hommes 5126,58 2906,20 56,7 % 7,16 %
Femmes 4794,12 2275,57 47,47 % 7,09 %
Ensemble 5003,85 2667,10 53,3 % 6,33 %

En moyenne, un salari de lentreprise peroit un salaire de 5003,85. La rpartition des


salaires est caractrise par une forte dispersion.

La rpartition des salaires varie selon le sexe, en effet, un salari homme touche,
en moyenne, plus quun salari femme, (respectivement 5126,58 DH et 4794,12 DH).
Les salaires sont plus disperss chez les hommes que chez les femmes, 56,7 % pour
les premiers et 47,47 % pour les seconds, alors que la concentration des salaires est
lgrement moins forte chez les femmes (7,09 % contre 7,16 % pour les hommes). Ce
rsultat peut tre illustr par cette reprsentation graphique :

103
Statistique descriptive 3. Caractristiques de dispersion

Rpartition des salaires selon le sexe

0,016

0,014

0,012
densit di
0,01

0,008

0,006

0,004

0,002

0
1500

2500

3500

4500

5500

6500

7500

8500

9500

10500

11500

12500

13500

14500

15500

16500

17500

18500

19500
salaires
hommes femmes

3.6. EXERCICES DAPPLICATION.

3.6.1. Exercice.

Les relevs statistiques des tailles, en mtre, de 20 personnes sont consigns dans le tableau
suivant :

1,58 1,62 1,75 1,58 1,70


1,75 1,70 1,58 1,62 1,82
1,62 1,82 1,70 1,58 1,75
1,70 1,58 1,62 1,70 1,85

a) Classer cette srie statistique de 20 observations en srie statistique quivalente sous la


forme dune srie (xi ; ni) ;
b) Calculer la variance et lcart type de cette srie ;
c) Calculer le coefficient de dispersion et lindice de concentration de cette srie.

Solution : a) Facile faire ; b) S = 0,0075 et S = 8,64 cm


c) CV = 5,14 % et Indice de concentration = 2,59 %

3.6.2. Exercice.

On a relev, sur 2 mois, les chiffres daffaires des ventes dun magasin, les rsultats sont
donns dans le tableau suivant :

104
Statistique descriptive 3. Caractristiques de dispersion

CA en DH Nombre de jours CA en DH Nombre de jours


[2 000 ; 4 000[ 2 [10 000 ; 12 000[ 14
[4 000 ; 6 000[ 6 [12 000 ; 14 000[ 11
[6 000 ; 8 000[ 8 [14 000 ; 16 000[ 5
[8 000 ; 10 000[ 10 [16 000 ; 18 000[ 4

a) Calculer la moyenne et lcart type de chiffre daffaires ;


b) Calculer le coefficient de dispersion

Solution : a) x 10366,67 DH et S = 3549,491356 DH ; b) CV = 34 %

3.6.3. Exercice.

On a recens lanciennet, en annes par dfaut, de 45 agents dune entreprise, elle se rpartit
comme suit :

2 6 3 5 3 2 6 5 1
3 3 2 5 6 1 4 5 6
1 2 3 5 2 5 6 1 3
5 5 1 2 2 3 3 6 6
3 2 3 3 3 6 5 5 1

a) Calculer la moyenne et lcart type de lanciennet ;


b) Calculer le coefficient de dispersion et donner une interprtation du rsultat.

Solution : a) Moyenne = 3.56 et S = 1,73 ; b) CV = 49 %

3.6.4. Exercice.

La srie statistique donnant les effectifs de 40 classes dune cole est reprsente par le tableau
suivant :

Nombre Nombre Nombre Nombre


dtudiants de classes dtudiants de classes
[12 ; 16[ 3 [24 ; 28[ 12
[16 ; 20[ 5 [28 ; 32[ 7
[20 ; 24[ 9 [32 ; 36[ 4

a) Calculer la moyenne dtudiant par classe et lcart type de cette srie ;


b) Calculer le coefficient de dispersion et donner une interprtation du rsultat ;
c) Calculer lindice de concentration. Quen dduire ?

Solution : a) x 24,7 tudiants par classe et S = 5,47 ; b) CV = 22 %


105
Statistique descriptive 3. Caractristiques de dispersion

c) Indice de concentration = 4,58 %

3.6.5. Exercice.

Les rendements lhectare dune exploitation agricole compose de 200 lots, dun hectare
chacun, sont rpartis comme suit :

Rendements en Nombre Rendements en Nombre


quintaux de lots quintaux de lots
[15 ; 17[ 3 [25 ; 27[ 26
[17 ; 19[ 5 [27 ; 29[ 28
[19 ; 21[ 9 [29 ; 31[ 33
[21 ; 23[ 12 [31 ; 33[ 34
[23 ; 25[ 18 [33 ; 35[ 32

a) Calculer la moyenne et lcart type de cette srie ;


b) Calculer le coefficient de dispersion et donner une interprtation du rsultat ;
c) Calculer lindice de concentration. Interprter le rsultat.

Solution : a) x 28,2 quintaux et S = 4,56 quintaux ; b) CV = 16 %


c) Indice de concentration = 3,85 %.

3.6.6. Exercice.

On considre les notes obtenues par les tudiants dune classe, dans plusieurs matires, ayant
chacune un coefficient de pondration diffrent.
Matires Coefficients Notes Nombre dtudiants
[10 ; 12[ 8
Math 4 [12 ; 14[ 12
[14 ; 16[ 10
[7 ; 9[ 4
[9 ; 11[ 7
Economie 2
[11 ; 13[ 13
[13 ; 15[ 6
[6 ; 8[ 2
[8 ; 10[ 6
[10 ; 12[ 7
Compta 3
[12 ; 14[ 10
[14 ; 16[ 4
[16 ; 18[ 1
a) Calculer les moyennes et les carts types des notes des tudiants dans chaque matire ;
b) Calculer la moyenne gnrale et lcart type de tous les tudiants.

106
Statistique descriptive 3. Caractristiques de dispersion

Solution : a) Pour les math : x 13,13 et S = 1,54


Pour lconomie : x 11,40 et S = 1,87
Pour la compta : x 11,73 et S = 2,45
b) Moyenne gnrale = 12,28 Ecart type gnral = 0,77

3.6.7. Exercice.

Lentreprise SONFI commercialise du matriel, des logiciels et des consommables


informatiques, la rpartition des chiffres daffaires en pourcentage des 5 dernires annes est
donne par le tableau suivant :

Chiffres daffaires en pourcentage (%)


Annes
Micro Logiciels Consommables Total CA
2001 40 30 30 100
2002 41 34 25 100
2003 40 37 23 100
2004 42 33 25 100
2005 43 32 25 100

a) Calculer les moyennes et les carts types des pourcentages des chiffres daffaires de chaque
dpartement ;
b) lentreprise SONFI ralise, en 2006, un chiffre daffaires de 2 524 312,36 DH dans le
dpartement micro, combien a-t-elle ralis, en moyenne, dans les 2 autres dpartements ?

Solution : a) Pour le dpartement micro : x 41,2 et S = 1,30


Pour le dpartement logiciels : x 33,2 et S = 2,59
Pour le dpartement consommables : x 25,6 et S = 2,61
b) Pour le dpartement logiciels : CA = 2034154,62 DH
Pour le dpartement consommables : CA = 1568504,77 DH.

3.6.8. Exercice.

La socit CDG rmunre ses 25 salaris mensuellement et calcule :


25 25
x i 125 000,00 DH x i 652 456 000,00 DH
2
et
i 1 i 1
a) Calculer la moyenne et lcart type des salaires des 25 agents de la socit ;
b) Que deviennent cette moyenne et cet cart type si lon augmente chaque agent de 10% ?
c) Que deviennent cette moyenne et cet cart type si lon augmente chaque agent de 1000
DH par mois ?
107
Statistique descriptive 3. Caractristiques de dispersion

Solution : a) x 5 000,00 DH et S = 1047,97 DH


b) y 5 500,00 DH et Sy = 1 152,77 DH
c) y 6 000,00 DH et Sy = 1 047,97 DH

3.6.9. Exercice.

Le relev statistique des poids et des longueurs des barres de fer fabriques par la socit
MARFER a donne, pour une journe de production, les rsultats suivants :
Poids Longueurs Poids Longueurs
ni ni
(Kg) (cm) (Kg) (cm)
[490 ; 500[ 12 [540 ; 550[ 2
5,80 [500 ; 510[ 25 [550 ; 560[ 4
[510 ; 520[ 5 [560 ; 570[ 8
6,20
[500 ; 510[ 4 [570 ; 580[ 12
5,90 [510 ; 520[ 36 [580 ; 590[ 6
[520 ; 530[ 9 [590 ; 600[ 2
[510 ; 520[ 8 [560 ; 570[ 1
6,00 [520 ; 530[ 41 [570 ; 580[ 5
[530 ; 540[ 10 [580 ; 590[ 4
6,30
[540 ; 550[ 3 [590 ; 600[ 20
6,10 [550 ; 560[ 14 [600 ; 610[ 10
[560 ; 570[ 2 [610 ; 620[ 4

ni : nombre de barres ayant les caractristiques de poids et de longueur indiques dans le


tableau.

a) Calculer la longueur moyenne et lcart type des barres de fer de 6,20 Kg de poids ;
b) Calculer le poids moyen et lcart type des barres de fer de longueurs comprises entre 560 et
570 cm ;
c) Calculer le poids moyen et lcart type dune barre de fer ;
d) Calculer la longueur moyenne et lcart type dune barre de fer ;
e) Quels sont les modes en poids et en longueur des barres de fer fabriques par la socit
MARFER ?
f) Quelle est la longueur mdiane des barres de fer ?
g) Quel est le poids mdiant des barres de fer ?

Solution : a) x 571,47 cm et S = 12,34 cm ; b) x 6,19 Kg et S = 0,051 Kg


c) x 6,03 Kg et S = 0,173 Kg ; d) x 540,79 cm et S = 33,98 cm
e) Mode en poids : Mo = 6 Kg et Classe modale en longueur : [520 ; 530[

108
Statistique descriptive 3. Caractristiques de dispersion

0,1
f) Me = 526,7 cm ; g) Me = 5,9 + x 0,13 = 5,95 Kg
0,24
3.6.10. Exercice.

Le relev des entres des 5 salles dun cinma, releves au cours de la semaine passe, a donn
le tableau suivant :

Jours Cin N 1 Cin N 2 Cin N 3 Cin N 4 Cin N 5


Lundi 100 201 350 250 283
Mardi 102 210 362 242 241
Mercredi 110 204 342 236 263
Jeudi 105 206 382 246 285
Vendredi 100 212 366 283 299
Samedi 102 220 354 255 201
Dimanche 121 231 328 222 204
Capacits 250 250 400 350 300

a) Calculer la moyenne et lcart type des entres de lensemble des cinmas pour chaque jour
de la semaine ;
b) Calculer la moyenne et lcart type des entres de chaque cinma pendant la semaine
passe ;
c) Quel est le cinma qui affiche le meilleur taux de remplissage pour la semaine passe ?
d) Quel est le jour qui affiche le meilleur taux de remplissage global pour les 5 cinmas ?

Solution
a)
Jours Moyenne Ecart type
Lundi 236,8 62,5
Mardi 231,4 67,2
Mercredi 231,0 59,0
Jeudi 244,8 75,4
Vendredi 252,0 63,2
Samedi 226,4 68,1
Dimanche 221,2 55,6
b)
Cin N 1 Cin N 2 Cin N 3 Cin N 4 Cin N 5
Moyenne 105,7 212,0 354,9 247,7 253,7
Ecart type 7,6 10,4 17,4 18,9 39,6
c) Cest le cinma N3 qui affiche le meilleur taux de remplissage pour la semaine passe.
d) Cest le Vendredi qui affiche le meilleur taux de remplissage global pour les 5 cinmas.

109
Statistique descriptive Partie 2 : statistique descriptive deux variables

PARTIE 2
STATISTIQUE DESCRIPTIVE A DEUX VARIABLES

La statistique descriptive deux variables est lensemble des mthodes qui permet dobtenir
et de faire un 1er traitement des informations relatives deux caractres particuliers dindividus
dune population donne.

La statistique descriptive a plusieurs objectifs :

- recueillir lensemble des donnes relatives deux caractres particuliers dindividus dune
population donne ;

- classer lensemble de ces donnes selon des sries statistiques afin de permettre den
faire :
* des reprsentations graphiques pour en visualiser lallure ;
* des traitements mathmatiques pour en dterminer certaines caractristiques ;
* des traitements mathmatiques pour en dterminer les relations possibles existants entre
ces caractres.

Dans cette partie, nous axerons notre propos sur le dernier point relatif la dtermination
des relations de corrlation entre les caractres tudis.

111
Statistique descriptive Partie 2 : statistique descriptive deux variables

112
Statistique descriptive 4. Rgression et corrlation

CHAPITRE 4

REGRESSION ET CORRELATION

4.1. INTRODUCTION.

On constate, trs souvent, dans la pratique, qu'il existe des relations entre deux ou plusieurs
variables. En analyse de rgression, on cherche expliquer une variable mtrique y qui dpend
dune ou de plusieurs variables explicatives mtriques x1, x2, x3, . . . .xp. A cette fin, un modle
mathmatique peut reprsenter convenablement la relation entre y et les xi, ce modle servira
aussi pour faire des prvisions.

Y = f (x1, x2, . . . .xp)

La variable Y sappelle la variable explique, dpendante, endogne, tandis que les


variables x1, x2, x3, . . . .xp sont les variables explicatives, indpendantes, exognes.

Sappuyant sur des donnes observes, lanalyse de rgression consiste ajuster un modle
explicatif y = f(xi).

4.2. REGRESSION SIMPLE.

Sil ny a quune seule variable explicative, on dira que le modle de rgression est simple.
Son but est de confirmer empiriquement une relation de cause effet entre deux variables.
Ensuite, si cette relation est confirme, il y aura lieu den valuer lintensit.

4.2.1. Notion de covariance.

4.2.1.1. Dfinition.

On dfinit la covariance de deux variables statistiques par la moyenne arithmtique des


produits des diffrences des observations par rapport leur moyenne :

113
Statistique descriptive 4. Rgression et corrlation

- Cas d'une srie statistique double :

x1, x2, x3, xi, ......, xn


y1, y2, y3, yi, ......, yn

n
( x i x ) ( y i y)
COV( x , y) i 1

n
- Cas d'un tableau de contingences :

si x possde k modalits : x1, x2, x3, xi, ......, xk

et si y possde p modalits : y1, y2, y3, yj, ......, yp

n p
n ij ( x i x ) ( y j y)
i 1 j1
COV ( x , y)
n
La covariance a pour but dtudier le sens de la relation entre deux variables statistiques :

- Une covariance positive indique une relation croissante, cest--dire que les deux
variables statistiques varient dans le mme sens ; les valeurs leves d'une srie correspondent
aux valeurs leves de l'autre ;

- Une covariance ngative indique une relation dcroissante, c'est--dire que les deux
variables statistiques varient en sens inverse ; les valeurs leves d'une srie correspondent aux
valeurs faibles de l'autre.

4.2.1.1. Proprits.

- Formule dveloppe de la covariance :

n
( x i x ) ( y i y)
COV ( x , y) i 1

n
n
( x i y i x i y x y i x y)
COV( x , y) i 1

114
Statistique descriptive 4. Rgression et corrlation

n n n n
x i yi y x i x yi x y
COV( x , y) i 1 i 1 i 1 i 1

n
n n
x i yi x i yi
COV ( x , y) i 1
- y x - x y x y COV( x , y) i 1
- xy
n n
La covariance est gale la diffrence entre la moyenne des produits et le produit des
moyennes.

Dans le cas d'un tableau de contingences :

n p
n ij x i y i
i 1 j1
COV( x , y) - xy
n
- Transformation linaire :

Soit la transformation linaire d'une variable statistique x :

x' = ax + b, avec a et b deux constantes quelconques.

Soit la transformation linaire d'une variable statistique y :

y' = a'y + b', avec a' et b' deux constantes quelconques.

n
( x i ' x ' ) ( y i ' y' )
COV( x ' , y' ) i 1

n
n
(ax i b a x b) (a ' y i b'a ' y b' )
COV( x ' , y' ) i 1

n
n
a ( x i x ) a ' ( y i y)
COV( x ' , y' ) i 1

115
Statistique descriptive 4. Rgression et corrlation

n
a a ' ( x i x ) ( y i y)
COV ( x ' , y' ) i 1

COV ( x ' , y' ) a a' COV ( x , y)

- On peut dmontrer la relation suivante :

COV( x, y) Sx Sy

Exemple 1 : On considre un chantillon de 12 clients choisis au hasard. On note, pour un


trimestre :
- x : le nombre d'articles achets par chacun des 12 clients ;
- y : le nombre de visites un centre commercial, de chaque client.

On obtient les rsultats suivants :

xi 34 42 53 30 50 60 46 57 32 24 36 28
yi 12 14 15 10 15 17 12 14 10 09 11 10

Dans le but dtudier le sens de la relation entre X et Y, calculons la


covariance (X,Y).

xi yi xi yi xi yi
34 12 1156 144 408
42 14 1764 196 588
53 15 2809 225 795
30 10 900 100 300
50 15 2500 225 750
60 17 3600 289 1020
46 12 2116 144 552
57 14 3249 196 798
32 10 1024 100 320
24 9 576 81 216
36 11 1296 121 396
28 10 784 100 280
Total 492 149 21774 1921 6423

116
Statistique descriptive 4. Rgression et corrlation

12 12
x i 492 et y i 149
i 1 i 1

12 12
x i 21774 et y i 1921
i 1 i 1

12
x i y i 6423
i 1

12
xi 492
x i 1
41
n 12
12

y i

y i 1
149 12,4166667 = 12,42
n 12
12
xi 21774
S x i 1
x 41 133,5
n 12

S x 133,5 11,55

12
yi 1921
S y i 1 - y - 12,4166667 = 5,91
n 12

S y 5,91 = 2,43

12
x i yi
COV ( x , y) i 1
- x y = 6423 - 41 x 12,4166667 = 26,17
n 12

On vrifie bien que : COV(x,y) < Sx Sy en effet :

COV(x,y) = 26,17 < Sx Sy = 11,55x2,43 = 28,06

117
Statistique descriptive 4. Rgression et corrlation

La covariance est positive, il y a donc une relation croissante entre le nombre d'articles
achets et le nombre de visites au centre commercial : c'est--dire que plus il y a de visites, plus
il y a darticles achets, ce qui semble tout fait logique.

Exemple 2 : Le concours d'accs un tablissement de formation porte sur deux preuves :


"Expression et communication" et "Informatique". Les candidats qui se sont prsents ce
concours se rpartissent, en fonction des notes obtenues ces deux preuves, de la manire
suivante :

y 3 7 10 12 15
x
7 0 3 9 7 11
9 10 13 18 16 13
11 9 11 14 17 14
14 12 9 7 5 2

x : note sur 20 obtenue en expression et communication ;


y : note sur 20 obtenue en informatique.

Dans le but dtudier le sens de la relation entre x et y, calculons la


covariance (x,y).

Distribution marginale de x

x 7 9 11 14 Total
Effectifs 30 70 65 35 200

n x i i 21865
4 S x i 1
x 10,23 4,67
nixi
2045
200 200
x
i 1
10,23
200 200
Sx 4,67 2,16

En moyenne, les candidats qui se sont prsents au concours ont obtenu une note de 10,23
sur 20 en expression et communication.

Les notes obtenues en expression et communication s'cartent, en moyenne, de 2,16 points


de la note moyenne.

118
Statistique descriptive 4. Rgression et corrlation

Distribution marginale de Y

y 3 7 10 12 15 Total
Effectifs 31 36 48 45 40 200
5
n i yi 22323
5 S y i 1
y 9,83 14,99
n i yi
1965
200 200
y
i 1
9,83
200 200
Sy 14,99 3,87

En moyenne, les candidats qui se sont prsents au concours ont obtenu une note de 9,83
sur 20 en informatique.

Les notes obtenues en informatique s'cartent, en moyenne, de 3,87 points de la note


moyenne.

Intensit de la relation linaire entre X et Y

4 5

n
i 1 j1
ij xi y j

COV ( x , y) -x y
200
4 5

n
i 1 j1
ij x i y j = 7x3x0+7x7x3+7x10x9+7x12x7+7x15x11

+ 9x3x10+9x7x13+9x10x18+9x12x16+9x15x13
+11x3x9+11x7x11+11x10x14+11x12x17+11x15x14
+14x3x12+14x7x9+14x10x7+14x12x5+14x15x2
4 5

n
i 1 j1
ij x i y j = 19576.

19576
COV ( x , y) - 10,23 9,83 = -2,68
200
La covariance est ngative, il y a donc une relation dcroissante entre les notes d'expression
communication et les notes d'informatique. En dautres termes, les candidats bons en
informatique sont, en moyenne, faibles en expression et communication.

119
Statistique descriptive 4. Rgression et corrlation

4.2.2. Identification du modle.

On doit prciser la variable dont on veut expliquer les variations (variable dpendante y),
puis celle qui est la cause de ces variations (variable explicative x).

Le diagramme de dispersion d'une variable y en fonction d'une autre variable x est form des
points moyens conditionnels de coordonnes (xi , yi), et donne une ide de la faon dont varie,
en moyenne, la variable y en fonction de la variable x.

A partir du diagramme de dispersion, on peut souvent reprsenter une courbe continue


approchant les donnes. Cette courbe est appele courbe d'ajustement (voir graphe page
suivante).
Diagramme de dispersion
400

300

200

100
Y

0 10 20 30

Bien que la relation entre deux variables ne soit pas toujours linaire, on accepte, dans une
premire approximation, de considrer que cette relation est linaire et ce pour les raisons
simples suivantes :

- On peut toujours, dans une premire approximation, approcher une courbe par la
corde qui la soutient ;
- la thorie de la rgression linaire est beaucoup plus dveloppe et surtout beaucoup
plus simple appliquer et interprter que celle de la rgression non linaire ;

La rgression linaire permet donc de dterminer la droite qui s'ajuste au mieux aux valeurs
observes. Cette droite est appele droite de rgression de y en fonction de x.

Exemple 3 : Reprenons les donnes de lexemple 1, et traons le diagramme de dispersion de


Y en fonction de X :

Xi 34 42 53 30 50 60 46 57 32 24 36 28
Yi 12 14 15 10 15 17 12 14 10 09 11 10
120
Statistique descriptive 4. Rgression et corrlation

Diagramme de Y en fonction de X
18

Nombre d'articles achets


16

14

12

10

0
0 10 20 30 40 50 60 70

Nombre de visites

4.2.3. Ajustement du modle.

Le modle thorique en rgression linaire simple scrit :

yaxb

Le paramtre a donne la pente de la droite, appele coefficient de rgression ; il mesure


la variation de y lorsque x augmente dune unit. Le paramtre b est l'ordonne l'origine,
cest--dire la valeur prise par y lorsque x = 0.

Reprsente l'erreur alatoire, elle est non observable et comprend la fois les erreurs de
mesure sur les valeurs observes de Y et tous les autres facteurs explicatifs non pris en compte
dans le modle.

Lanalyse de rgression repose sur un certain nombre dhypothses qui sont :

- La variable explicative x est mesure sans erreur ;


- Les erreurs alatoires sont distribues normalement avec une moyenne nulle et une
variance constante inconnue ;
- Les erreurs alatoires sont indpendantes avec la variable explicative ;
- Les erreurs alatoires sont indpendantes entre elles.

Il existe diffrentes mthodes pour ajuster une droite de rgression. La mthode la plus
utilise est la mthode des moindres carrs.

121
Statistique descriptive 4. Rgression et corrlation

La mthode des moindres carrs est une mthode d'ajustement qui consiste minimiser la
somme des carrs des diffrences entre les valeurs observes, yi, et les valeurs estimes par la
^
droite, y i diffrence appele rsidu.

Le modle empirique, estim partir des observations, sera dsign de cette faon :
^
y a 0x b0

a0 et b0 sont des estimations des paramtres a et b du modle thorique.


y

y 4
.
e4 { ^y =a x + b

y3 .} e3
y2 e2 {.

y 1 .} e1
x 1
x 2 x 3
x 4
x
On dfinit le i-me rsidu ( not ei ) comme tant la diffrence mesure verticalement sur
^
le graphique entre la valeur observe de yi et sa valeur estime : ei yi - yi .

On remarque que :

- le rsidu est positif (ei >0) si yi se trouve au-dessus de la droite au point xi.
- le rsidu est ngatif (ei < 0) si yi se trouve au-dessous de la droite au point xi.
- le rsidu est nul (ei = 0) si yi se trouve prcisment sur la droite au point xi.

On dsire expliquer les variations observes sur la variable dpendante y, c'est pour cette
raison quil faut considrer les diffrences mesures verticalement.

122
Statistique descriptive 4. Rgression et corrlation

La mthode des moindres carres est celle qui minimise la somme des carrs des rsidus;
symboliquement, on cherche :

2
n ^
n
Minimiser l' expression : y i y i e i
2

i 1 i 1

Avec le critre des moindres carrs, tous les rsidus deviennent positifs; car sinon, en nous
limitant aux rsidus simples, il est impossible que des rsidus positifs annulent des rsidus
ngatifs.

Les dmonstrations algbriques sont facilites par le recours aux outils du calcul diffrentiel.
La minimisation dune fonction quadratique plusieurs variables seffectue en annulant les
drives partielles de premier ordre et en vrifiant le signe des drives partielles de deuxime
ordre.

4.2.3.1. Calcul des coefficients.

Par calcul diffrentiel, on cherche les 2 valeurs a0 et b0 qui minimisent la somme des carrs
des rsidus, cette somme quadratique est note f( a0 , b0), puisquelle est fonction de 2 termes
inconnus a0 et b0 :

^
f (a 0 , b 0 ) e i (y i - y i ) (y i - a 0 x i b 0 )

f(a0 , b0) est minimum lorsque les drives premires partielles de f(a0 , b0) par rapport a0
et b0 sont nulles et que les drives secondes partielles sont positives.

Appelons :
- f ' a 0 , la drive premire partielle de f par rapport a0;
- f ' ' a 0 , la drive seconde partielle de f par rapport a0

Les 2 conditions seront vrifies si :


- f 'a 0 0 et f ' b0 0 ;
- f ' 'a 0 0 et f ' ' b0 0

1re Condition : crivons que les drives premires partielles sont nulles, c'est--dire que :
f ' a 0 0 et f ' b 0 0 .

123
Statistique descriptive 4. Rgression et corrlation

^
f (a 0 , b 0 ) e i (y i - y i ) (y i - a 0 x i b 0 )

On a :

f 'b 0 - (yi - a 0 x i b 0 ) 0

(y i - a 0 x i b 0 ) 0

yi - n b0 - a 0 x i 0

yi n b0 a 0 x i

On a aussi :

f ' a 0 - 2 x i (y i - a 0 x i b 0 ) 0

(x y i i - b 0 x i - a 0 x i ) 0

x i yi - b0 x i - a 0 x i 0

x i yi b0 x i a 0 x i

On a donc un systme de deux quations deux inconnues, ces deux quations qui sont
appeles quations normales sont :

yi n b0 a 0 x i
x i yi b0 x i a 0 x i

Calcul de b0 : En considrant la seconde quation, on a successivement les galits


suivantes :

y i n b 0 a 0 x i => n b0 yi - a 0 x i
yi xi
b0 - a0
n n
b0 y - a 0 x
124
Statistique descriptive 4. Rgression et corrlation

Calcul de a0 : En considrant le premire quation et en y remplaant b0 par lexpression


quon vient dtablir, on a successivement les galits suivantes :

x i yi b0 x i a 0 x i
x i y i (y - a 0 x) x i a 0 x i
x i yi y x i - a 0 x x i a 0 x i
2
x i y i n x y a 0 ( x i - n x )

a0
x y -n x y
i i

x -n x
2
i

La droite de rgression de Y en fonction de X, selon la mthode des moindres carrs est la


droite d'quation :
^
y a 0 x b0
x i yi - n x y
avec : a0 2
et b0 y - a 0 x
xi - n x

Lestimation de a et de b par la mthode des moindres carrs conduit aux formules


quivalentes suivantes :

x i yi - n x y COV ( x , y)
a0 2

xi - n x S 2x


^
Do y a 0 x b0 a 0 x y a 0 x a 0 x x y

Ces estimateurs sont des fonctions linaires des observations x1, x2, . . . xn.

2 Condition : montrons que les drives secondes partielles sont positives, c'est--dire
que : f ' ' a 0 0 et f ' ' b 0 0 .
^
f (a 0 , b 0 ) e i (y i - y i ) (y i - a 0 x i b 0 )

125
Statistique descriptive 4. Rgression et corrlation

On a :

f ' a 0 - 2 x i (y i - a 0 x i b 0 )
f ' 'a 0 - 2 x (y i i - a 0x i b0 ) '
2 x i2 qui est bien positif.

et :

f ' b 0 2 - (y i - a 0 x i b 0 )
f ' ' b0 2 - (y i
- a 0 x i b 0 ) ' 2 qui est bien positif.

Nous pouvons donc conclure que les valeurs de a0 et b0 que nous avons dtermines
2
^
n n
correspondent bien un minimum de lexpression : y i y i e i
2

i 1 i 1

Exemple 4 : Reprenons les donnes de lexemple 1 et dterminons la droite de rgression de y


en fonction de x.

xi yi xi yi xi yi
34 12 1156 144 408
42 14 1764 196 588
53 15 2809 225 795
30 10 900 100 300
50 15 2500 225 750
60 17 3600 289 1020
46 12 2116 144 552
57 14 3249 196 798
32 10 1024 100 320
24 9 576 81 216
36 11 1296 121 396
28 10 784 100 280
Total 492 149 21774 1921 6423

126
Statistique descriptive 4. Rgression et corrlation

12 12
x i 492 et y i 149
i 1 i 1

12 12
x i 21774 et y i 1921
i 1 i 1

12
x i y i 6423
i 1

12 12
xi 492 yi149
x i 1
41 et y i 1 12,42
n 12 n 12
12
xi 21774
S x i 1
x 41 133,5
n 12

S x 133,5 11,55
12
y i

S y i 1
- y 1921 - 12,4166667 = 5,91
n 12

Sy 5,91 = 2,43

12
x i yi
COV( x , y) i 1
- x y = 6423 - 41 x 12,4166667 = 26,17
n 12

La droite de rgression de y en fonction de x, selon la mthode des moindres carrs est la


droite d'quation :
^
y a 0 x b0
x i yi - n x y
avec : a0 et b0 y - a 0 x
x i - n x

127
Statistique descriptive 4. Rgression et corrlation

Les calculs donnent :

6423 - 12 41 12,4166667
a0 = 0,196005 = 0,20
21774 - 12 41
On peut vrifier que :

COV ( x , y) 26,17
a0 = = 0,196005 = 0,20
S x 133,5

b0 12,4166667 - 0,196005 x 41 = 4,3804617

La droite de rgression de y en fonction de x, selon la mthode des moindres carrs est la


droite d'quation :

^
y 0,20 x 4,38

4.2.3.2. Proprits de la droite de rgression.


1) La droite de rgression passe par le point moyen de coordonnes : ( x , y)
^ ^
2) yi yi et (yi yi ) 0
^
3) (y i y i ) 2 est la plus petite somme des carrs des carts que l'on peut obtenir.

4.2.3.3. Interprtation des coefficients a et b.

Nous donnerons, sur des exemples pratiques, les interprtations quil y a lieu de donner des
coefficients a et b, mais dores et dj, nous pouvons dire :

Le coefficient a est le taux de croissance de la variable explique chaque fois que la variable
explicative augment dune unit.

Le coefficient b est lordonne lorigine, son interprtation requiert, dans chaque cas, de
revenir au problme pos.

128
Statistique descriptive 4. Rgression et corrlation

Dans le cas de lexemple 4, le modle dajustement a pour expression :


^
y 0,20 x 4,38 on peut interprter les coefficients a et b comme suit :
* a = 0,20 veut dire que pour toutes les 10 visites, il y a 2 achats qui se ralisent ;
* b = 4,38 veut dire que mme sans visite, il y a entre 4 et 5 articles vendus, ce qui
semble aberrant car on ne peut imaginer des achats sans quil y ait des visites. Cette valeur non
nulle de b na donc pas de signification physique, dans le cas de notre cas.

Exemple 5 : Reprenons les donnes de lexemple 1 et vrifions les 3 remarques quon vient de
citer.

La droite de rgression de y en fonction de x selon la mthode des moindres carrs est la


droite d'quation :
^
y 0,20 x 4,38

^ ^ ^
xi yi yi (yi - y i ) (yi - y i )
34 12 11,04 0,96 0,91
42 14 12,61 1,39 1,92
53 15 14,77 0,23 0,05
30 10 10,26 -0,26 0,07
50 15 14,18 0,82 0,67
60 17 16,14 0,86 0,74
46 12 13,40 -1,40 1,95
57 14 15,55 -1,55 2,41
32 10 10,65 -0,65 0,43
24 9 9,08 -0,08 0,01
36 11 11,44 -0,44 0,19
28 10 9,87 0,13 0,02
Total 492 149 149 0,00 9,37

1) Vrifions que la droite de rgression passe bien par le point moyen de



coordonnes ( x , y) , en effet :
^
y 0,20 41 4,38 = 12,42 = y

129
Statistique descriptive 4. Rgression et corrlation

^
2) Vrifions aussi que y i y i = 149 ce qui donne bien
^
(yi yi ) 0
^
3) Enfin, on vrifie bien que ( y i y i ) = 9,37 est la plus petite somme des carrs des
2

carts que l'on peut obtenir. Rappelons que ce minimum est assur par le choix des coefficients
a et b.

4.3. QUALITE DE LAJUSTEMENT.

4.3.1. Coefficient de dtermination.

La modle dajustement que nous avons dtermin est de la forme : y = a x + b ;


mathmatiquement parlant, cette quation peut scrire aussi sous la forme : x = a y + b. Pour
que ces deux quations aient une cohrence mathmatique, on doit avoir :

y = a x + b = a ( a y + b ) + b = a a y + a b + b

Ce qui donne, en identifiant les termes y dans les deux membres, les conditions ncessaires
suivantes :

a a = 1 et a b + b = 0

Mais comme les points de coordonnes ( xi , yi ) ne sont pas tous sur la droite de rgression
y = a x + b, la condition a a = 1 ne peut tre satisfaite avec exactitude.

La 1re condition donne, en dduisant la formule de a partir de celle de a :



(x i x )( y i y) COV( x , y)
a a = R =

S x S 2y
(x i x ) (y i y)

Compte tenu de lingalit : COV( x , y) Sx Sy , le coefficient R 1. De ce fait,


le modle dajustement adopt sera dautant plus valide que le coefficient R sera proche de 1.

On appelle R, le coefficient de dtermination du modle dajustement ; il est gal au


pourcentage de la variation totale dans la variable y qui est explique par la rgression. Il
synthtise la capacit de la droite de rgression retrouver les diffrentes valeurs de la variable
dpendante yi

130
Statistique descriptive 4. Rgression et corrlation

On pourrait introduire le coefficient R dune autre manire, en effet, la variation totale


^
( yi - y i ) observe sur la variable explique y peut tre dcompose en 2 parties :


2 2
^
2 ^

yi y yi y yi yi

2
^
- Le premier terme y i y dsign par SCR mesure la variation autour de la droite de

rgression, on lappelle Somme des Carrs due la Rgression ;
2
^

- Le second terme, y i y i dsign par SCE, mesure la variation rsiduelle, on

lappelle la somme des carrs due lerreur.

La somme des carrs totale SCT scrit donc :

SCT = SCR + SCE

Puisquon cherche expliquer la variation totale de y autour de sa moyenne, SCT, on peut



utiliser le coefficient de dtermination R comme indice de la qualit de l'ajustement de la
droite aux donnes.
^

R = SCR = ( y y)i

SCT
( yi y)
Etudions tous les cas possibles des valeurs que peut prendre R :

- Cas o R2 = 0 :

Il faut pour cela que SCR = 0, alors le modle utilis n'explique aucune variation dans la
variable dpendante y. En outre, SCR = 0 implique que toutes les valeurs prdites sont gales
^
la moyenne des y, soit y i = y pour i = 1, 2, . . . .n.

Graphiquement, dans le cas dune rgression simple, on aura la situation suivante, dans
laquelle on peut voir clairement que la variable explicative x nest daucune utilit pour
prdire y.

131
Statistique descriptive 4. Rgression et corrlation

- Cas o R2 = 1 :

Il faut pour cela que SCR = SCT, ce qui revient SCE = 0. Sil en est ainsi, le modle
utilis explique toute la variation observe sur y. En outre, SCE = 0 implique que toutes les
i
valeurs prdites sont gales aux valeurs observes correspondantes de y, cest--dire : yi = y
pour i = 1, 2, . . . n.

Graphiquement, on a la situation suivante dans laquelle le modle de rgression explique


parfaitement les variations de y. La variable explicative x peut prdire sans erreur les valeurs de
y, au moins pour les valeurs de lchantillon.

- Cas gnral : R < 1

En gnral, nous ne sommes ni dans le cas de R = 0 ni dans celui de R = 1 mais nous


trouvons R < 1 et plus R est proche de 1 plus le modle peut prtendre expliquer les valeurs
de y par celles de x.

Le coefficient de dtermination R sert dfinir le coefficient de corrlation de PEARSON


R comme nous allons le voir juste aprs.

Exemple 6 : Reprenons les donnes de lexemple 1 et dcomposons la somme des carrs totale
et calculons le coefficient de dtermination.

132
Statistique descriptive 4. Rgression et corrlation

^ ^ ^ ^
xi yi Yi (yi - y i ) ( y i y ) (yi - y i )
34 12 11,04 0,18 1,89 0,91
42 14 12,61 2,50 0,04 1,92
53 15 14,77 6,66 5,52 0,05
30 10 10,26 5,86 4,66 0,07
50 15 14,18 6,66 3,10 0,67
60 17 16,14 20,98 13,84 0,74
46 12 13,40 0,18 0,95 1,95
57 14 15,55 2,50 9,81 2,41
32 10 10,65 5,86 3,12 0,43
24 9 9,08 11,70 11,13 0,01
36 11 11,44 2,02 0,97 0,19
28 10 9,87 5,86 6,51 0,02
Total 492 149 149,00 70,92 61,55 9,37

SCT = ( yi - y) = 70,92
2
^
SCR = y i y = 61,55

2
^

SCE = y i y i = 9,37

On vrifie bien que :

SCR + SCE = 61,55 + 9,37 = 70,92 = SCT

R = SCR = 61,55 = 0,87


SCT 70,92
On peut vrifier aussi que :

R = 0,93 = 0,87

Le nombre de visites au centre commercial explique 87 % des variations du nombre


darticles achets.

133
Statistique descriptive 4. Rgression et corrlation

4.3.2. Coefficient de corrlation de PEARSON.

4.3.2.1. Dfinition.

On dfinit partir du coefficient de dtermination R, le coefficient de corrlation linaire


R, il a pour objet de mesurer l'intensit de la liaison linaire entre deux variables statistiques x
et y.

Le coefficient de corrlation de x et y peut tre estim laide dun chantillon alatoire de


n couples dobservations par la formule suivante :


( x i x ) ( y i y) x i yi n x y
R= =
( x i x ) ( y i y)
x i n x yi n y

COV( x , y)
R=
Sx Sy

Cette dfinition montre que le coefficient de corrlation possde le mme signe que la
covariance et qu'il est toujours compris entre -1 et +1 puisque comme on la vu : R < 1

Le signe du coefficient de corrlation linaire indique le sens de la relation entre x et y,


ainsi :

R = +1 : dans ce cas, les points se trouvent tous sur une mme droite croissante, on
parle de corrlation linaire positive parfaite.

R = -1 : dans ce cas, les points se trouvent tous sur une mme droite dcroissante, on
parle de corrlation linaire ngative parfaite.

R = 0 : dans ce cas, il n'y a aucune dpendance linaire entre les deux variables, on
parle de corrlation linaire nulle.

-1 < R < 0 : dans ce cas, les deux variables varient en sens inverse, la relation
linaire est faible ou forte selon que le coefficient de corrlation linaire est proche de
0 ou de -1.

0 < R < 1 : dans ce cas, les deux variables varient dans le mme sens, la relation
linaire est faible ou forte selon que le coefficient de corrlation linaire est proche de
0 ou de 1.

134
Statistique descriptive 4. Rgression et corrlation

Le problme de la rgression est intimement li celui de la corrlation : plus la corrlation


est forte entre deux variables, mieux lon pourra prdire ou expliquer la valeur de la variable
dpendante y en fonction de la variable explicative x.

On peut affirmer que la corrlation mesure lintensit de la relation linaire entre 2


variables alatoires, tandis que la rgression simple est une quation dcrivant le plus
adquatement possible cette relation.

Exemple 7 : Reprenons les donnes de lexemple 1 et calculons le coefficient de corrlation.

xi yi xi yi xi yi
34 12 1156 144 408
42 14 1764 196 588
53 15 2809 225 795
30 10 900 100 300
50 15 2500 225 750
60 17 3600 289 1020
46 12 2116 144 552
57 14 3249 196 798
32 10 1024 100 320
24 9 576 81 216
36 11 1296 121 396
28 10 784 100 280
Total 492 149 21774 1921 6423

12

x
12
i 492 et y i 149
i 1 i 1

12 12
x i 21774 et y i 1921
i 1 i 1

12
x i y i 6423
i 1

12 12
xi 492 yi
149
x i 1
41 et y i 1 12,42
n 12 n 12

135
Statistique descriptive 4. Rgression et corrlation

12
xi 21774
S x i 1
x 41 133,5
n 12

S x 133,5 11,55
12
y i

S y i 1
- y 1921 - 12,4166667 = 5,91
n 12

Sy 5,91 = 2,43

12
x i yi
COV( x , y) i 1
- x y = 6423 - 41 x 12,4166667 = 26,17
n 12

x i yi n x y
R=

x i n x yi n y

6423 - 12 41 12,4166667
R= = 0,93
21774 - 12 41 1921 - 12 12,4166667

On peut aussi vrifier que :

COV( x , y) 26,17
R= = = 0,93
Sx Sy 11,552,43

Il y a donc une forte corrlation linaire croissante entre le nombre d'articles achets et le
nombre de visites des clients au centre commercial.

4.3.2.2. Proprits du coefficient de corrlation.

Ces proprits sont au nombre de deux :

- Le coefficient de corrlation linaire est indpendant des units de mesure.

- Le coefficient de corrlation linaire est indpendant de toute transformation linaire positive.

136
Statistique descriptive 4. Rgression et corrlation

En effet, soit les transformations linaires des variables statistiques x et y :

x' = ax + b, avec a et b deux constantes quelconques.

y' = a'y + b', avec a' et b' deux constantes quelconques.

COV( x ' , y' )


R ( x ' , y' )
Sx ' Sy'

a a ' COV( x , y)
R ( x ' , y' )
a Sx a ' Sy

COV( x , y)
R ( x ' , y' ) => R(x ,y) = R(x ,y)
Sx Sy

Une transformation linaire ne change pas l'intensit de la relation linaire mais elle peut
changer le sens de la relation.

4.4. CALCULS DES PREVISIONS.

Pour obtenir une prvision ponctuelle de Y pour une valeur particulire x0 de X, il suffit de
remplacer X par x0 dans le modle empirique, ce qui scrit :

^
y = a0 x0 + b0

Exemple 8 : Reprenons les donnes de lexemple 1 et effectuons une prvision du nombre


darticles que pourrait acheter un client aprs 25 visites au centre commercial.

La droite de rgression de y en fonction de x, selon la mthode des moindres carrs est la


droite d'quation :

^
y = 0,20 x 4,38
^
Si x0 = 25 alors y = 0,20 x 25 + 4,38 = 9,38 soit 9 ou 10 articles achets aprs 25 visites
au centre commercial.

137
Statistique descriptive 4. Rgression et corrlation

4.5. REGRESSION NON LINEAIRE SIMPLE.

Dans certaines situations, il arrive que le nuage de points du diagramme ne ressemble pas
une relation linaire. La rgression linaire n'est donc pas adapte. On doit donc ajuster une
courbe non linaire. On parle de rgression non linaire.

Certains modles non linaires peuvent tre ramen des rgressions linaires grce des
transformations de variables. Cest les cas notamment du modle exponentiel en ax et du
modle polynomial en xa .

4.5.1. Modle exponentiel.

Le modle gnral exponentiel a pour quation :

y = a0 b0x

Grce une transformation logarithmique, le modle devient linaire :

Log(y) = Log (a0 b0x)

Log(y) = Log (a0) + Log (b0) x

On pose :

y' = Log(y), a0 = Log(b0) et b0 = Log(b0)

Le modle devient :

y' = a0 + b0 x

On dtermine a0 et b0 par les formules gnrales de la rgression linaire.

a0 =
x y' x y'
i i
et b0 = y' - b1 ' x
x -n x
2
i

On retrouve les constantes b0 et b1 grce l'exponentiel :

a 0 ea '0 et b0 e b '0

138
Statistique descriptive 4. Rgression et corrlation

Exemple 9 : Le tableau suivant indique lvolution des ventes d'un produit pour
les 12 premiers mois de son lancement :

Mois : xi Ventes : yi
1 1
2 6
3 10
4 14
5 25
6 48
7 63
8 108
9 161
10 240
12 325

Diagramme de dispersion
350

300

250

200
Ventes

1 50

1 00

50

0
0 2 4 6 8 10 12 14

Mois

Le nuage de points du diagramme de dispersion indique que la relation entre le temps et les
ventes n'est pas linaire, mais exponentielle.

On ajuste une courbe exponentielle d'quation :


y = a0 b0x
Grce une transformation logarithmique, le modle devient linaire :

Log(y) = Log (a0 b0x)

Log(y) = Log (a0) + Log(b0) x


139
Statistique descriptive 4. Rgression et corrlation

On pose :

y' = Log(y), a0 = Log(b0) et b0 = Log(b0)

Le modle devient : y' = a0 + b0 x

xi yi y'i xi y'i xi y'i


1 1 0,000 1 0,000 0,000
2 6 1,792 4 3,210 3,584
3 10 2,303 9 5,302 6,908
4 14 2,639 16 6,965 10,556
5 25 3,219 25 10,361 16,094
6 48 3,871 36 14,986 23,227
7 63 4,143 49 17,166 29,002
8 108 4,682 64 21,922 37,457
9 161 5,081 81 25,821 45,733
10 240 5,481 100 30,037 54,806
12 325 5,784 144 33,453 69,406
Total 67 38,995 529 169,223 296,773

12 12
xi = 67
i 1
y'
i 1
i = 38,995

12 12
xi = 529
i 1
y' = 169,223
i 1
i

12
x y'
i 1
i i = 296,773

12

x i

x i 1
67 5,58
n 12
12

y i
38,995
y' i 1
3,250
n 12
12
x i y' i
296,773
COV( x , y' ) i 1
- x y' = - 5,58 x 3,25 = 6,596
n 12
140
Statistique descriptive 4. Rgression et corrlation

On dtermine b0' et b1' par les formules de la rgression linaire.

- -
x i y i ' - n x y' 296,773 - 12 5,58 3,25
a0 = = = 0,509
- 529 - 12 5,58
xi - n x

- -
b0 = Y' - b1' X = 3,25 0,509 x 5,58 = 0,410

On retrouve les constantes b0 et b1 grce l'exponentiel :

a 0 e a '0 e 0,509 1,66


b 0 e b '0 e 0, 410 1,51

L'quation du modle est donc :

y = 1,66 x 151x

4.5.2. Modle polynomial.

Nous nous contenterons dtudier, ce niveau, le modle polynomial simple et nous


laisserons le cas du modle polynomial gnral, lorsque nous aborderons la rgression multiple.

Le modle polynomial simple a pour quation gnrale :

y = a0 xbo

Grce une transformation logarithmique, le modle devient linaire :

Log(y) = Log (a0 xbo)

Log(y) = Log (a0) + b0 Log (x)

On pose :

y' = Log(y), a0 = Log(a0) et x = Log(x)

Le modle devient : y' = a0 + b0 x

141
Statistique descriptive 4. Rgression et corrlation

On dtermine a0 et b0 par les formules gnrales de la rgression linaire.

x 'i y'i x' y'


a0 = 2
et b0 = y' - b1 ' x '
x 'i - n x'

On retrouve les constantes a0 grce l'exponentiel : a 0 e a '0

Aprs la dtermination de a0 et b0, le modle se trouve entirement dtermin.

Remarque : dans le cas du modle polynomial du second degr qui a comme quation
gnrale : y = a x + b x + c, on peut montrer, par un simple changement de variables, quon
peut revenir au modle polynomial simple du paragraphe 2.5.1., en effet, si lon pose :

x = X X0 et y = Y Y0

Le modle devient :

Y Y0 = a (X X0) + b (X X0) + c

Y = a X + b (1 2aX0) X+ a X0 b X0 + Y0 +c

Il suffit de prendre :

X0 = 1/2a et Y0 = - a X0 + b X0 c = - a/4 + b/2a c

Le modle devient : Y = a X qui est le modle polynomial simple.

4.6. REGRESSION MULTIPLE.

La rgression multiple a pour but dexpliquer les variations dune variable dpendante y et
p variables explicatives x1 , x2 , ..., xp (p > 1), ensuite, si cette relation est confirme dvaluer
son intensit.

Lutilisation de plusieurs variables indpendantes, permet damliorer le pourcentage de


variation explique, cest dire augmenter le coefficient de dtermination R , qui reflte la
qualit de lajustement. Ce qui implique une rduction de la variance rsiduelle, S2e , ce qui a
pour effet daugmenter la prcision des estimations de y.

142
Statistique descriptive 4. Rgression et corrlation

4.6.1. Identification du modle.

Le modle thorique en rgression linaire multiple scrit :

yi = a1x1i + a2x2i + a3x3i + . . . . +apxpi + b0 + i

Les paramtre ai sont appels coefficients de rgression partielle, ils mesurent la variation
de y lorsque xi augmente dune unit et que les autres variables explicatives sont maintenues
constantes.

i reprsente l'erreur alatoire, elle est non observable et comprend la fois les erreurs de
mesure sur les valeurs observes de yi et tous les autres facteurs explicatifs non pris en compte
dans le modle.

Lanalyse de rgression repose sur les mmes hypothses prsentes dans la rgression
simple auxquels il faut ajouter quil ny a pas de colinarit parfaite entre les variables
explicatives xi, cest--dire que leurs coefficients de corrlation linaire doivent tre nuls ou
proches de zro.

4.6.2. Ajustement du modle.

De la mme manire que la rgression simple, la mthode des moindres carrs consiste
minimiser la somme des carrs des diffrences entre les valeurs observes, yi, et les valeurs
i diffrence appele rsidu.
estimes par le modle, y

Le modle empirique, estim partir des observations, sera dsign de cette faon :
^
y i a'1 x 1i a'2 x 2i a'3 x 3i ... a'p x pi b'0
pour : (i=1, 2, , n)

a1 , a2 et ap ainsi que b0 sont des estimations des paramtres a1 , a2 et ap ainsi que b0 du


modle thorique.

^
On dfinit le i-me rsidu e par : ei = Yi - Yi
i

La mthode des moindres carrs minimise la somme des carrs des rsidus, somme dsigne
par f(a1, a2, . . .ap, b0), une fonction de ( p + 1 ) inconnues :

f (a 1 , a 2 ,..., a p ,b 0 ) e y i y i y i a 1 x 1i ... a p x pi b 0
2
2 ^
2
i

143
Statistique descriptive 4. Rgression et corrlation

En annulant simultanment les drives partielles par rapport a1, a2, . . .ap et b0, on obtient
un systme de ( p + 1 ) quations linaires homogne (p+1) inconnues qui sont justement a1,
a2, . . .ap et b0. Ce systme est semblable celui montr dans le cas de la rgression linaire
simple.

Dans le cas de la rgression multiple, les calculs deviennent trs complexes, et pratiquement
impossibles faire sans laide de lordinateur. Il existe un nombre important de logiciels
informatiques qui traitent le problme de la rgression simple et de la rgression multiple. Les
logiciels fournissent en plus des estimations des coefficients du modle, toutes les statistiques et
tests ncessaires pour juger de la validit du modle.

Nous allons, dans ce qui suit, tudier, dans les dtails, le cas de la rgression linaire simple
deux variables explicatives.

4.6.3. Rgression linaire 2 variables explicatives.

La formule gnrale du modle est : y = a1 x1 + a2 x2 + b

La mthode des moindres carrs est celle qui minimise la somme des carrs des rsidus;
symboliquement, on cherche :

2
n ^
n
Minimiser l' expression : y i y i e i
2

i 1 i 1

De mme que pour la rgression simple, avec le critre des moindres carrs, tous les rsidus
deviennent positifs; car sinon, en nous limitant aux rsidus simples, il est impossible que des
rsidus positifs annulent des rsidus ngatifs.

Les dmonstrations algbriques sont facilites par le recours aux outils du calcul diffrentiel.
La minimisation dune fonction quadratique plusieurs variables seffectue en annulant les
drives partielles de premier ordre et en vrifiant que les signes des drives partielles de
deuxime ordre sont tous positifs.

4.6.3.1. Calcul des coefficients.

Par calcul diffrentiel, on cherche les valeurs a1 a2 et b0 qui minimisent la somme des carrs
des rsidus, cette somme quadratique est note f(a1,a2,b0), puisquelle est fonction des 3 termes
inconnues : les 2 termes a1 et a2 et le 3 terme b0 :

^
f (a 1 , a 2 , b 0 ) e i (y i - y i ) (y i - a 1 x 1i a 2 x 2i b 0 )

144
Statistique descriptive 4. Rgression et corrlation

f(a1,a2,b0) est minimum lorsque les drives premires partielles de f(a1, a2, b0) par rapport
a1 , a2, et b0 sont nulles et que les drives secondes partielles sont toutes positives.

Convenons de garder les mmes notations pour ai et sont estimation a0i pour simplifier les
critures.

Appelons :
- f ' a 0 , la drive premire partielle de f par rapport a0;
- f ' ' a 0 , la drive seconde partielle de f par rapport a0.

Les 2 conditions seront vrifies si :


- f ' a1 0 , f' a 2 0 , et f ' b0 0 ;
- f ' 'a 0 0 , f' ' a 2 0 et f ' ' b0 0 .

1re Condition : crivons que les drives premires partielles sont nulles, c'est--dire que :
f ' a 0 0 , f' a 2 0 et f ' b 0 0 .

^
f (a 1 , a 2 , b 0 ) e i (y i - y i ) (y i - a 1 x 1i a 2 x 2i b 0 )

On a :

f 'b 0 - (yi - a1x1i a 2 x 2i b0 ) 0


(y i - a 1 x 1i a 2 x 2i b 0 ) 0
y i - n b 0 - a 1 x 1i - a 2 x 2i 0
y i n b 0 a 1 x 1i a 2 x 2i

On a aussi :

f ' a1 - 2 x 1i (y i - a 1 x 1i a 2 x 2i b 0 ) 0
(x 1i y i - b 0 x 1i - a 1 x 1i - a 2 x 1i x 2i ) 0
2

x 1i y i - b 0 x 1i - a 1 x 1i - a 2 x 1i x 2i 0
2

x 1i y i b 0 x 1i a 1 x 1i a 2 x 1i x 2i
2

On a enfin :

145
Statistique descriptive 4. Rgression et corrlation

f ' a 2 - 2 x 2i (y i - a 1 x 1i a 2 x 2i b 0 ) 0
(x 2i y i - b 0 x 2i - a 1 x 1i - a 2 x 1i x 2i ) 0
2

x 2i y i - b 0 x 2i - a 1 x 1i x 2i - a 2 x 2i 0
2

x 2i y i b 0 x 2i a 1 x 1i x 2i a 2 x 2i
2

On a donc un systme de trois quations trois inconnues, ces deux quations qui sont
appeles quations normales sont :

y i n b 0 a 1 x 1i a 2 x 2i
x 1i y i b 0 x 1i a 1 x 1i a 2 x 1i x 2i
2

x 2i y i b 0 x 2i a 1 x 1i x 2i a 2 x 2i
2

Calcul de b0 : En considrant la dernire quation, on a successivement les galits


suivantes :

y i n b 0 a1 x1i a 2 x 2i
yi x 1i x 2i
b0 - a1 a2
n n n
b 0 y - a1 x1 a 2 x 2

Calcul de a1 et de a2 : En considrant les deux premires quations, on a :

x 1i y i b 0 x 1i a 1 x 1i a 2 x 1i x 2i
2

x 2i y i b 0 x 2i a 1 x 1i x 2i a 2 x 2i
2

Nous remplaons b0 par sa valeur : b 0 y - a 1 x 1 a 2 x 2 et nous divisons les deux


membres des deux galits par n. On trouve successivement :

x 1i y i ( y - a 1 x 1 a 2 x 2 ) x 1i a 1 x 1i a 2 x 1i x 2i
2

x 2i y i ( y - a 1 x 1 a 2 x 2 ) x 2i a 1 x 1i x 2i a 2 x 2i
2

Qui deviennent aprs remplacement de b0 :

x 1 y ( y - a 1 x 1 a 2 x 2 ) x 1 a 1 x 12 a 2 x 1 x 2
146
Statistique descriptive 4. Rgression et corrlation

x 2 y ( y - a 1 x 1 a 2 x 2 ) x 2 a 1 x 1 x 2 a 2 x 22

Soit, en utilisant les notations de S et COV :

S 2x1 a 1 COV( x 1 , x 2 ) COV( x 1 , y)


COV( x 1 , x 2 )a 1 S 2x 2 a 2 COV( x 2 , y)

Pour rsoudre ce systme de deux quations deux inconnues a1 et a2 on procde par


addition. Ainsi, pour calculer a1, on multiplie les 2 membres de la 1re quation par S 2x 2 et ceux
de la 2 quation par COV( x 1 , x 2 ) et on soustrait, aprs, membre membre, la 2 quation
de la 1. De mme, pour calculer a2, on multiplie les 2 membres de la 1 quations par
COV( x 1 , x 2 ) et ceux de la 2 quations par S 2x1 et on soustrait, aprs, membre membre la
1re quation de la 2. On trouve alors les rsultats suivants :

S 2x 2 COV ( x 1 , y) COV ( x 1 , x 2 )COV ( x 2 , y)


a1
S 2x1 S 2x 2 COV ( x 1 , x 2 )
S 2x1 COV ( x 2 , y) COV ( x 1 , x 2 )COV ( x 1 , y)
a2
S 2x1 S 2x 2 COV ( x 1 , x 2 )

La rgression de y en fonction de x1 et de x2, selon la mthode des moindres carrs, est


l'quation :
^
y a1 x1 a 2 x 2 b 0

Lestimation de a1, de a2 et de b par la mthode des moindres carrs conduit aux formules
suivantes :

b 0 y - a1 x1 a 2 x 2

S 2x 2 COV ( x 1 , y) COV ( x 1 , x 2 )COV ( x 2 , y)


a1
S 2x1 S 2x 2 COV ( x 1 , x 2 )

147
Statistique descriptive 4. Rgression et corrlation

S 2x1 COV ( x 2 , y) COV ( x 1 , x 2 )COV ( x 1 , y)


a2
S 2x1 S 2x 2 COV ( x 1 , x 2 )


^
y a1 x1 a 2 x 2 b 0 a1 x1 a 2 x 2 y - a1 x1 a 2 x 2
do :
^
y a 1 (x 1 - x 1 ) a 2 ( x 2 x 2 ) y

Ces estimateurs sont des fonctions linaires des observations x 1i , x 2i et y i .

2 Condition : montrons que les drives secondes partielles sont positives, c'est--dire
que : f ' ' a1 0 f ' ' a 2 0 et f ' ' b 0 0 .

f ' a1 - 2 x 1i (y i - a 1 x 1i a 2 x 2i b 0 )
f ' ' a1 2 x 12i ce qui est bien positif.

f ' a 2 - 2 x 2i (y i - a 1 x 1i a 2 x 2i b 0 )
f ' ' a 2 2 x 22i ce qui est bien positif.

f ' b 0 - (y i - a 1 x 1i a 2 x 2i b 0 )
f ' ' b0 1 ce qui est bien positif.

Nous pouvons donc conclure que les valeurs de a1 de a2 et b0 que nous avons dtermines
2
p 1
n ^
n
yi yi ei
2
correspondent bien un minimum de lexpression : x
i 1 i 1

p
Remarque : Dans le cas de la rgression polynomiale gnrale qui a pour forme : y = ap x +
p 1
ap-1 x + . . . + a2x + a1x + a0, il suffit de remplacer x k par xk pour revenir au modle
multilinaire quon vient dtudier.

Lquation du modle devient, aprs le changement de variables :


y = apxp + ap-1xp-1 + . . . .+ a2x2 + a1x1 + b0

Noublions pas que, dans un modle multilinaire, il est ncessaire que les variables x k
soient indpendantes pour justifier le recours plusieurs variables, mais cela nest pas tout

148
Statistique descriptive 4. Rgression et corrlation

fait le cas, dans notre modle polynomial gnral transform en modle multilinaire car les
x k ne sont pas indpendantes, en effet prenons le cas simple de x et x et montrons, par un
exemple, que ces deux variables ne sont pas indpendantes :

x1 x = x2 x1 x2 x1x2
1,1 1,21 1,21 1,4641 1,331
1,3 1,69 1,69 2,8561 2,197
1,7 2,89 2,89 8,3521 4,913
1,8 3,24 3,24 10,4976 5,832
2,4 5,76 5,76 33,1776 13,824
3,2 10,24 10,24 104,8576 32,768
3,5 12,25 12,25 150,0625 42,875
3,9 15,21 15,21 231,3441 59,319
4,2 17,64 17,64 311,1696 74,088
4,7 22,09 22,09 487,9681 103,82
Somme 27,8 92,22 92,22 1341,749 340,97
Sommes/10 2,78 9,222 9,222 134,1749 34,097

On calcule les variances, les carts types des variables et leur covariance :

V(x1) = 1,4936 => Sx1 = 1,222129

V(x) = 49,129656 => Sx = 7,009255

COV(x1,x) = 8,45984

R(x1,x) = 8,45984/(1,222129x7,009255) = 0,988

k l
Le mme calcul pourra montrer que les x et x ne sont pas indpendantes quels que
soient k et l mais nous admettons, dans une 1re approximation, la validit du modle malgr
cette entorse lhypothse dindpendance des variables.

Exemple 10 : Le tableau suivant regroupe les donnes relatives une variable dpendante y et 2
variables explicatives x1 et x2.

149
Statistique descriptive 4. Rgression et corrlation

x1 x2 y
15 20 90
28 15 115
40 10 120
70 9 100
120 11 130
130 8 118
160 4 98
250 7 135

Le modle empirique, estim partir des observations, sera dsign de cette faon : y = a1
x1 + a2 x2 + b.

x1 x2 y X1 X2 y x1x2 x1 y x2y
15 20 90 225 400 8100 300 1350 1800
28 15 115 784 225 13225 420 3220 1725
40 10 120 1600 100 14400 400 4800 1200
70 9 100 4900 81 10000 630 7000 900
120 11 130 14400 121 16900 1320 15600 1430
130 8 118 16900 64 13924 1040 15340 944
160 4 98 25600 16 9604 640 15680 392
250 7 135 62500 49 18225 1750 33750 945
Total 813 84 906 126909 1056 104378 6500 96740 9336

Les moyennes :

x 1 = 101,625 x 2 = 10,5 et y = 113,25

Les variances :

V(x1) = 5535,984V(x2) = 21,75 et V(Y) = 221,688

Les covariances :

COV(x1,x2) = -254,563 , COV(x1,y) = 583,469


et COV(x2;y) = -22,125

150
Statistique descriptive 4. Rgression et corrlation

On calcule les coefficients a1 et a2 par les formules dj trouves :

S 2x 2 COV( x 1 , y) COV( x 1 , x 2 )COV( x 2 , y)


a1
S 2x1 S 2x 2 COV( x 1 , x 2 )
21,75x 583,469 254,563x 22,125
0,1269
5535,984 x 21,75 254,563x 254,563

S2x1 COV( x 2 , y) COV( x1 , x 2 )COV( x1 , y)


a2
S2x1 S2x 2 COV( x1 , x 2 )
5535,984 x 22,125 254,563x 583,469
0,4684
5535,984 x 21,75 254,563x 254,563

b 0 y - a1 x1 - a 2 x 2
113,25 0,1269 x101,625 0,4684 x10,5 95,4321

Le modle linaire de rgression multiple est donc :

y = 0,1269 x1 + 0,4684 x2 + 95,4321

4.6.4. Qualit de lajustement.

4.6.4.1. Coefficient de corrlation.

Dans le cas de la rgression multiple, on parle de coefficient de corrlation multiple, il


mesure la corrlation combine de toutes les variables du modle. Les valeurs du coefficient de
corrlation sinterprtent de la mme manire que pour la rgression simple.

4.6.4.2. Coefficient de dtermination multiple.

De la mme manire que pour la rgression simple, le coefficient de dtermination indique


le pourcentage de la variation totale de y autour de sa moyenne qui est explique par la
rgression.

La variation totale ( y i - y) observe sur la variable explique y peut tre dcompose


en 2 parties :
2 2
^
y i Yy y i y y i y i
^
2


151
Statistique descriptive 4. Rgression et corrlation

2
^
Le premier terme y i y dsign par SCR mesure la variation autour du modle de

rgression, on lappelle Somme des Carrs due la Rgression. Lautre terme,
2
^

y i y i dsign par SCE, mesure la variation rsiduelle, on lappelle la somme des

carrs due lerreur.

La somme des carres totale scrit :

SCT = SCR + SCE

2
Le coefficient de dtermination multiple R est dfinit par :
^

SCR = ( y i y)
R =
SCT
( yi y)
2
On pourrait montrer par ailleurs que R est gal au carr du coefficient de corrlation
multiple.

Le coefficient de dtermination multiple ne peut tre infrieur au plus lev des coefficients
de dtermination simple entre y et chacune des variables explicatives. Si les variables
explicatives sont parfaitement indpendantes entre elles, le coefficient de dtermination
multiple sera gal la somme des coefficients de dtermination simple entre y et chacune des
variables explicatives.

Le coefficient de dtermination multiple tend augmenter avec le nombre de variables


explicatives. Pour pallier cet inconvnient, on calcule un coefficient de dtermination ajust
R aj2 qui tient compte du nombre de variables explicatives (p) et de la taille de lchantillon (n).

Le coefficient de dtermination ajust se calcule en terme de variances, il est dfinit par :


S e2 SCE
R 1 2 avec S e2
2
variance due lerreur
n p 1
aj
Sy
SCT
S 2y variance de y
n 1
SCE / n p 1 SCE n 1
R aj2 1 1 x
SCT / n 1 SCT n p 1
152
Statistique descriptive 4. Rgression et corrlation

n 1
R aj2 1 (1 R 2 )
n p 1
Le R ajust est infrieur au R. Ce dernier est un estimateur biais, tandis que le premier est
non biais.

2
Le R ajust est prfrable R si la taille de lchantillon est faible. Quand n sera suprieur
30, il ny aura habituellement pas beaucoup de diffrence entre les 2 indices.

Le R ajust est plus appropri pour comparer des modles de rgression dune variable
explique Y en fonction de diffrents sous-groupes de variables explicatives.

Exemple 11 : Reprenons les donnes de lexemple 10 et calculons le coefficient de


dtermination.

Le modle de rgression linaire multiple explique 29,83 % des variations de Y.

4.7. EXERCICES DAPPLICATION.

4.7.1. Exercice.

Lentreprise SATEX dsire contrler sa consommation dnergie lectrique, pour ce faire, elle
dresse le tableau des statistiques de consommation et de production des 10 derniers mois et
essaie, dans un premier temps de voir si la consommation dpend de la production.

Le tableau des statistiques est le suivant :

Productions Consommation lectrique yi


xi (kg) (kwh)
125 4650
135 5010
154 5800
162 6000
175 6500
183 7000
195 7100
220 8000
235 8500
257 9500

a) Tracer le nuage de points (xi , yi) et dire si cela inspire lexistence dune liaison entre y et x.
Donner une justification de cette liaison.
153
Statistique descriptive 4. Rgression et corrlation

b) Dterminer sil y a une corrlation entre consommation lectrique et production et si oui


tablir la relation liant ces deux variables.
c) Interprter la valeur de b, coordonne lorigine du modle linaire, cest--dire au point
dabscisse xi = 0.
d) Donner quelle serait la consommation nergtique pour une production de 300 kg.

Solution : a) Facile faire ; b) R = 0,998 avec a = 35,6


et b = 245,3 ; c) sans aucune production, on consomme 245,3 kwh dlectricit ; d) 10925,3
kwh.

4.7.2. Exercice.

Une teinturerie consomme beaucoup deau, cette consommation est naturellement fonction du
poids des tissus teints. Le tableau des consommations deau et des poids des tissus teints est
donn ci-dessous.

Tissus teints Consommation deau yi


xi (kg) (m3)
24 10
26 10,2
28 11
30 11,5
32 12
34 12,6
36 12,9
38 13
40 13,6
42 14,3

a) Tracer le nuage de points (xi , yi) et dire si cela inspire lexistence dune liaison entre y et x.
Donner une justification de cette liaison.
b) Dterminer sil y a une corrlation entre consommation deau et poids des tissus teints et si
oui tablir la relation liant ces deux variables.
c) Interprter la valeur de la coordonne lorigine du modle linaire, cest--dire au point
dabscisse xi = 0.
d) Donner quelle serait la consommation deau pour une production de 50 kg de tissus teints.

Solution : a) Facile faire ; b) R = 0,992 avec a = 0,2 et b = 4,4


c) sans teindre de tissu, on consomme 4,4 m3 deau ; d) 14,4 m3 deau.

4.7.3. Exercice.
Un commerant dsire savoir si son chiffre daffaires dune journe est fonction du nombre de
154
Statistique descriptive 4. Rgression et corrlation

clients quil reoit pendant cette journe. Il dresse le tableau statistique de ses chiffres daffaires
et du nombre de clients quil reoit pendant les 10 derniers jours.
Nombre de clients Chiffres daffaires
xi yi (DH)
12 190
13 230
15 280
18 300
22 310
23 400
26 420
31 480
32 540
37 620
a) Tracer le nuage de points (xi , yi) et dire si cela inspire lexistence dune liaison entre y et x.
Donner une justification de cette liaison.
b) Dterminer sil y a une corrlation entre nombre de clients et chiffres daffaires et si oui
tablir la relation liant ces deux variables.
c) Interprter la valeur de b, coordonne lorigine du modle linaire, cest--dire au point
dabscisse xi = 0
d) Donner quel serait le chiffre daffaires pour 50 clients.
Solution : a) Facile faire ; b) R = 0,983 avec a = 16,0
et b = 10,5 ; c) sans aucun client, on peut raliser 10,5 DH de chiffre daffaires, ce qui semble
difficile croire. Il sagit dun rsultat aberrant ; d) 810,50 DH.
4.7.4. Exercice.
Le directeur dune filature de nylon dsire connatre la relation liant la consommation
nergtique de son usine avec la production de fil total et de fil teint. Pour ce faire, il dresse le
tableau de huit jours de production et classe ce tableau par ordre croissant. Etablir sil y a :
a) une corrlation entre consommation dlectricit et production totale de fil et si oui, tablir la
relation liant ces deux variables.
b) une corrlation entre consommation dlectricit et production totale de fil teint et si oui,
tablir la relation liant ces deux variables.
c) une corrlation entre consommation dlectricit, production totale de fil et production de fil
teint ; et, si oui, tablir la relation liant ces deux variables
d) Interprter la valeur de la coordonne lorigine du modle linaire, cest--dire au point
dabscisses x1i = x2i = 0.
e) Compte tenu des rsultats des questions a), b) et c) calculer de 3 faons diffrentes la
consommation lectrique pour une production globale de fil de 400kg et une production de fil
teint de seulement 300 kg ? Interprter chacun des 3 rsultats et dire lequel choisir et
pourquoi ?

155
Statistique descriptive 4. Rgression et corrlation

On donne le tableau des relevs de la consommation dlectricit, de production totale de fil et


de la production de fil teint
x1 (kg) x2 (kg) yi (kwh)
250 125 1510
275 130 1635
281 237 2400
292 246 2520
307 265 2730
314 268 2780
340 271 2800
355 272 2840

Solution : a) R = 0,853 avec a = 13,2 et b = -1568,6 ;


b) R = 0,996 avec a = 8,5 et b = 472,6 ; c) a1 = 2,12 a2 = 7,56 et b = 48,79 et R = 0,999 ; d) Si
lusine ne produit pas de fil total et de fil teint, elle peut sattendre une consommation
nergtique de 48,79 kwh ;
e) Selon le premier modle : Y = 13,2 x 400 1568,6 = 3711,4 kwh avec R = 0,853
Selon le deuxime modle : Y = 8,5 x 300 472,6 = 2077,4 kwh avec R = 0,996
Selon le troisime modle : y = 2,12 x 400 + 7,56 x 300 + 48,79 = 3164,79 kwh avec R = 0,999
On choisit le troisime rsultat puisque ce modle a le plus grand coefficient de corrlation.
4.7.5. Exercice.
La production cralire, en millions de quintaux, dun pays volue, avec le temps, comme le
montre le tableau donn ci-dessous :
Annes xi Productions yi
1 6
2 6,5
3 7
4 9
5 11
6 15
7 19
8 22
a) Tracer le nuage de points (xi , yi) et dire si cela inspire lexistence dune liaison entre y et x.
Donner une justification de cette liaison.
b) On opte pour un modle dajustement exponentiel. Dterminer sil y a une corrlation entre
la production cralire du pays et le temps et si oui dtablir la relation liant ces deux
variables.
c) Interprter la valeur de la coordonne lorigine du modle linaire, cest--dire au point
dabscisse xi = 0.
d) Donner quelle serait la production lanne 10.

156
Statistique descriptive 4. Rgression et corrlation

Solution : a) Facile faire ; b) R = 0,99 avec a = 4,31


et b = 1,22 ; c) Lordonne lorigine 1,46 indique que si x = 0, cest dire lanne 0, ce qui
na aucun sens, la production serait de 4,31 millions de quintaux ; d) 31,5 millions de quintaux.

4.7.6. Exercice.

Les relevs des consommations moyennes dessence dun vhicule, au 100 km, ainsi que ceux
des vitesses auxquelles ces consommations ont t enregistres sont donns dans le tableau ci-
dessous :

Vitesse en km/h Consommation en l/100 km


vi ci
95 7,05
100 7,21
105 7,41
110 7,81
115 8,12
120 8,65
125 9,41
130 10,13

a) Tracer le nuage de points (vi , ci) et dire si cela inspire lexistence dune liaison entre vi et ci.
Donner une justification de cette liaison.
b) On doit choisir entre un modle dajustement exponentiel et un modle dajustement
parabolique, pour ce faire, il y a lieu dabord de faire un changement de variables pour centrer
le graphe. On pose donc : Vi = vi 90 et Ci = ci 7
Calculer le tableau des nouvelles variables.
c) Calculer les coefficients du modle exponentiel ainsi que le coefficient de corrlation
correspondant.
d) Calculer les coefficients du modle parabolique ainsi que le coefficient de corrlation
correspondant.
e) Choisir le modle qui sajuste le mieux.
f) Donner quelles seraient les consommations pour des vitesses de 50 km/h, 70 km/h et 160
km/h.

Solution : a) Facile faire ; b) Facile faire ;


c) R = 0,96 avec a = 0,06 et b = 1,11 ; d) a = 0,0021 b = -0,0098 et c = 0,0716 avec R = 0,999 ;
e) Le modle parabolique a le coefficient de corrlation le plus lev, cest donc le modle qui
sajuste le mieux ;
f) La consommation est donc Ci = 0,0021 Vi - 0,0098 Vi + 0,0716
Pour une vitesse de 50 km/h, Ci = 10,91 l/100km ;
Pour une vitesse de 70 km/h, Ci = 8,13 l/100km ;
Pour une vitesse de 160 km/h, Ci = 16,94 l/100km.
157
Statistique descriptive 4. Rgression et corrlation

4.7.7. Exercice.

Lentreprise SATEL dsire connatre comment volue son chiffre daffaires mensuel en fonction
de la publicit quelle passe dans les journaux et des prospectus quelle distribue dans les boites
aux lettres des particuliers.
Les relevs de 10 mois des chiffres daffaires, des dpenses publicitaires et des dpenses pour
les prospectus sont rsums dans le tableau ci-dessous :

Dpenses en 1 000 DH CA en 1 000 DH


pi fi vi
100,00 1,20 195,25
125,00 2,10 235,65
130,00 3,20 241,15
132,00 3,30 242,85
140,00 4,20 250,55
152,00 4,80 265,25
155,00 5,50 270,15
157,00 5,70 274,55
159,00 5,90 275,95
163,00 6,50 281,45

a) Etablir sil y a une corrlation entre le chiffre daffaires mensuel et la publicit que passe
lentreprise dans les journaux.
b) Etablir sil y a une corrlation entre le chiffre daffaires mensuel et les prospectus que
distribue lentreprise dans les boites aux lettres.
c) Calculer les lments du modle dajustement linaire du chiffre daffaires mensuel en
fonction de la publicit que passe lentreprise dans les journaux.
d) Calculer les lments du modle dajustement linaire du chiffre daffaires mensuel en
fonction de la dpense pour les prospectus que distribue lentreprise dans les boites aux lettres.
e) Calculer les lments du modle dajustement linaire du chiffre daffaires mensuel en
fonction de la dpense de la publicit que passe lentreprise dans les journaux et de celle des
prospectus que distribue lentreprise dans les boites aux lettres.
f) Interprter la valeur de la coordonne aux origines (au point de coordonnes pi = 0 et fi =
0,00 DH) du modle linaire.
g) Indiquer sur quelle variable pi ou fi doit agir le chef dentreprise pour avoir la meilleure
augmentation du chiffre daffaires.
h) Compte tenu des rsultats des questions c), d) et e) calculer, de 3 faons diffrentes, le
chiffre daffaires pour des dpenses de publicit de 185 735,32 DH et des dpenses de
prospectus de 7 245,36 DH ? Indiquer lequel des 3 rsultats choisir et dire pourquoi.

Solution : a) R = 0,99619 ; b) R = 0,9637 ; c) vi = 1,31 pi + 67,54 ; d) vi = 14,34 fi + 192,48 ;

158
Statistique descriptive 4. Rgression et corrlation

e) Vi = 1,67 pi 4,08 fi + 34,79 avec R = 0,998 ; f) Sans dpense de la publicit dans les
journaux ni de dpenses dans des prospectus que distribue lentreprise dans les boites aux
lettres, on peut sattendre en moyenne un chiffre daffaires mensuel de 34790 DH ; g) La
dpense de la publicit dans les journaux est plus corrle (0,99619) la dpense dans des
prospectus que distribue lentreprise dans les boites aux lettres (0,9637). Le chef dentreprise
doit agir sur la dpense de la publicit dans les journaux pour avoir la meilleure augmentation
du chiffre daffaires ;
h) vi = 1,31 pi + 67,54 = 1,31 x 185,73532 + 67,54 = 310,853 soit 310853 DH
vi = 14,34 fi + 192,48 = 14,34 x 7,24536 +192,48 = 296,378 soit 296378 DH
vi = 1,67 pi 4,08 fi + 34,79 = 1,67 x 185,73532 4,08 x 7,24536 + 34,79 = 315,407 soit
315407 DH.
On peut retenir le troisime rsultat (315407 DH) puisque ce modle possde le coefficient de
corrlation le plus lev.

4.7.8. Exercice.

La production intrieure brute dun pays volue, avec le temps, comme indiqu, dans le tableau,
ci-dessous :
PIB en milliards de DH
annes xi
pi
1997 1 2,79
1998 2 2,87
1999 3 2,95
2000 4 3,01
2001 5 3,15
2002 6 3,25
2003 7 3,27
2004 8 3,33
2005 9 3,45
a) Tracer le nuage de points (xi , pi) et dire si cela inspire lexistence dune liaison entre pi et xi.
Donner une justification de cette liaison.
b) On doit choisir entre un modle dajustement exponentiel et un modle dajustement
parabolique, pour ce faire comparer les coefficients de corrlation des deux modles.
c) Calculer les coefficients du modle qui possde le meilleur coefficient de corrlation.
d) Donner quelles seraient les PIB pour les annes 2006 et 2007.

Solution : a) Facile faire ; b) Pi = 2,73 x 1,03xi avec R = 0,992


c) Pi = -0,001 xi + 0,093 xi +2,69 avec R = 0,994 ;
d) Pour lanne 2006, xi = 10
Pi = -0,001 x 10 + 0,093 x 10 +2,69 = 3,52 milliards de DH
Pour lanne 2007, xi = 11
Pi = -0,001 x 11 + 0,093 x 11 +2,69 = 3,592 milliards de DH

159
Statistique descriptive 4. Rgression et corrlation

4.7.9. Exercice.

Le nombre dabonns un service tlphonique au cours des neuf premiers mois de son
lancement sont comme suit :

Mois Priode t Nombre dabonns y(t)


Janvier 1 1
Fvrier 2 6
Mars 3 10
Avril 4 14
Mai 5 25
Juin 6 48
Juillet 7 63
Aot 8 108
septembre 9 161

a) Tracer le nuage de points (ti , yti) et dire si cela inspire lexistence dune liaison linaire ou
non linaire. Donner une justification de cette liaison ;
b) On doit choisir entre un modle dajustement exponentiel et un modle dajustement linaire,
pour ce faire comparer les coefficients de corrlation des deux modles ;
c) Calculer les coefficients du modle qui possde le meilleur coefficient de corrlation ;
d) Donner quelles seraient le nombre de nouveaux abonns pour les trois derniers mois de
lanne.

Solution : a) Facile faire ; b) Modle linaire R = 0,91 ; Modle exponentiel R = 0,97 ;


Modle qui possde le meilleur coefficient de corrlation : Yti = 1,29 x 1,76ti
d) Pour le mois 10 : Yti = 1,29 x 1,7610 = 368 abonns ;
Pour le mois 11 : Yti = 1,29 x 1,7611 = 647 abonns ;
Pour le mois 12 : Yti = 1,29 x 1,7612 = 1140 abonns.

4.7.10. Exercice.

Une entreprise agricole dispose de donnes observes au cours de 10 annes successives


relatives aux variables suivantes :

y : Rendement dune culture sous serre.


x1 : Quantit deau dirrigation en mm.
x2 : Temprature moyenne.

Les donnes sont les suivantes :

Anne x1 x2 y
1 87,9 19,6 28,37
160
Statistique descriptive 4. Rgression et corrlation

2 89,9 15,2 23,77


3 153,0 19,7 26,04
4 132,1 17,0 25,74
5 88,8 18,3 26,68
6 220,9 17,8 24,29
7 117,7 17,8 28,00
8 109,0 18,3 28,37
9 156,1 17,8 24,96
10 181,5 16,8 21,66

A partir de ces donnes, on cherche le modle de rgression linaire qui permet dexpliquer au
mieux le rendement en fonction des variables mtorologiques.

a) Etablir sil y a une corrlation entre y et x1.


b) Etablir sil y a une corrlation entre y et x2.
c) Calculer les coefficients du modle dajustement linaire de y en fonction de x 1.
d) Calculer les coefficients du modle dajustement linaire de y en fonction de x2.
e) Calculer les coefficients du modle dajustement linaire de y en fonction de x 1 et de x2.
f) Calculer et interprter le coefficient de dtermination du modle dajustement linaire de y
en fonction de x1 et de x2.
g) Indiquer sur quelle variable mtorologique lexploitant agricole doit agir pour avoir le
meilleur rendement.

Solution : a) Corrlation entre y et x1 : 0,52


b) Corrlation entre y et x2 : - 0,30
c) Modle dajustement linaire de y en fonction de x1 : y = 0,31 x1 + 212,12
d) Modle dajustement linaire de y en fonction de x2 : y = - 5,86 x2 + 357,74
e) Y = 0,30 x1 5,60 x2 + 312,60 ; f) R = 0,354
g) La variable x1 est plus corrle avec y (0,52) que la variable x2 (-0,30), lexploitant agricole
doit donc agir sur la quantit deau dirrigation pour avoir le meilleur rendement.

161
Statistique descriptive 5. Les sries chronologiques

CHAPITRE 5
LES SERIES CHRONOLOGIQUES

5.1. DEFINITION.

Une srie chronologique ou temporelle, est une suite dobservations numriques dune
grandeur effectues intervalles rguliers au cours du temps.
Les exemples dans le monde conomique et social sont donc nombreux : inflation, cours
boursiers, chmage, productions, exportations, natalit, immigration, scolarisation,
logement, chiffre daffaires, stocks, ventes, prix, vie dun produit, clientle, etc.
Si on note y la grandeur laquelle se rapportent les observations, une srie chronologique
est donc une srie statistique deux variables (t , y) dont la seconde variable est le temps t.
La spcificit de lanalyse dune srie chronologique est limportance accorde lordre
dans lequel sont effectues les observations. En sries chronologiques la dpendance
temporelle entre les variables constitue la source principale dinformation.
Lchelle de mesure de la grandeur sera toujours reprsente par une variable continue
valeurs relles.
La frquence des observations peut tre journalire, hebdomadaire, mensuelle, trimestrielle,
annuelle ou autre. Dans bien des situations conomiques, un effet saisonnier li une
priode connue est pressenti. Une srie journalire sera observe pendant plusieurs
semaines avec une priodicit de 5, 6 ou 7 jours selon le cas; pour une srie mensuelle
observe sur plusieurs annes, la priode est gale 12 ; pour une srie trimestrielle
observe sur plusieurs annes, la priode est gale 4.
La variable mesure peut tre ltat dune grandeur linstant de mesure, on parle de niveau
dun stock, du chiffre daffaires, du bilan dune activit au cours de la dernire priode
coule, etc.

163
Statistique descriptive 5. Les sries chronologiques

Une srie chronologique doit respecter les points suivants :


- Rgularit des observations : ce nest pas toujours vrai pour beaucoup de variables
conomiques ou financires puisque les mois ne comportent pas le mme nombre de jours, en
particulier de jours ouvrables.
- Stabilit des structures conditionnant le phnomne tudi : La plupart des sries
tudies concernent des grandeurs conomiques et les techniques danalyse cherchent
dterminer lvolution lente du phnomne ainsi que ses variations saisonnires (pour une
meilleure comprhension ou des fins de prvision). Cela suppose une certaine stabilit qui,
lorsquelle nest pas vrifie, peut tre obtenue en dcomposant la srie observe en plusieurs
sries successives.
- Permanence de la dfinition de la grandeur tudie : Cette condition, qui parait
vidente, nest parfois pas respecte. Cest en particulier le cas de certains indices conomiques
(changement de base ou carrment du mode de calcul de lindice).
- Aspect priodique dune partie de la grandeur observe : Cette condition est
indispensable dans lusage des techniques cherchant dterminer des variations saisonnires.
Elle suppose comparable deux observations relatives au mme mois de deux annes diffrentes.
Elle nexclut pas lexistence dune volution lente. Elle indique quune part du phnomne (la
composante saisonnire) se rpte de faon plus ou moins identique dune anne lautre. Dans
ce cas il est souvent commode de prsenter les donnes dans une table double entre.

Exemple 1 : les ventes trimestrielles en milliers de DH ralises par une entreprise au cours
des quatre dernires annes sont regroupes dans le tableau suivant :

Annes Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4


2002 190 160 251 200
2003 320 290 359 317
2004 426 405 483 433
2005 558 525 607 550

5.2. REPRESENTATION GRAPHIQUE.

La reprsentation graphique des observations est une tape indispensable avant


dentreprendre une analyse plus technique dune srie chronologique. Les points (t , y), avec
t = 1, 2, 3, etc. sont reprsents dans un systme daxes orthogonaux. Ils sont joints
chronologiquement par des segments de droite pour faciliter la visualisation. Cette
reprsentation permet dapprcier lvolution lente du phnomne, de dgager les priodes
de stabilit. Elle suggre parfois doprer une transformation de la grandeur. Cette
reprsentation graphique est galement utile pour le choix dun modle.

Exemple 2 : Reprenons les donnes de lexemple 1 et reprsentons graphiquement la srie


des ventes. Pour ce faire, classons les donnes par ordre chronologique en affectant chaque
trimestre son numro dordre.

164
Statistique descriptive 5. Les sries chronologiques

Pour cette prsentation, les donnes doivent tre transformes en une srie statistique deux
variables, la variable y dsignant les ventes et la variable t reprsentant le temps.

Temps t Vente y
1 190
2 160
3 251
4 200
5 320
6 290
7 359
8 317
9 426
10 405
11 483
12 433
13 558
14 525
15 607
16 550

Ventes trimestrielles entre 2002 et 2005

700
600
500
Ventes y

400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Temps t

165
Statistique descriptive 5. Les sries chronologiques

5.3. LES PRINCIPAUX MOUVEMENTS DES SERIES CHRONOLOGIQUES.

La succession des donnes observes ou srie brute, rsulte de quatre composantes ou


mouvements :

5.3.1. Tendance.

La composante fondamentale ou tendance (trend, en Anglais) traduit lvolution moyen


terme du phnomne. On parle aussi de mouvement conjoncturel ou mouvement extra-
saisonnier. La srie chronologique peut tre globalement croissante, dcroissante ou stable.
La connaissance du trend permet la comparaison des sries chronologiques. De plus cest
partir de la tendance que seront tudies les autres composantes de la srie. En effet, la
grandeur tudie ne suit pas gnralement un mouvement rgulier, mais fluctue au cours du
temps. Ces fluctuations sont de natures diffrentes selon leur priodicit.

Le trend est une fonction variation lente, elle sera estime sous forme paramtrique ou
comme le rsultat dune opration de lissage.

5.3.2. La composante saisonnire.

La composante saisonnire ou mouvement saisonnier reprsente des effets priodiques de


priode connue p qui se reproduisent de faon plus ou moins identique dune priode sur
lautre. La composante saisonnire permet simplement de distinguer lintrieur dune
mme priode une rpartition stable dans le temps deffets positifs ou ngatifs qui se
compensent sur lensemble de la priode, cest--dire, au-dessus ou au-dessous du trend.
Ltude de ces fluctuations est indispensable pour la prvision court terme. Llimination
du mouvement saisonnier est ncessaire la poursuite de ltude de la srie.
5.3.3. La composante cyclique.

La composante cyclique rend compte des fluctuations longues que la variable peut parfois
prsenter autour de la tendance. Les fluctuations cycliques qui traduisent la vie conomique
peuvent avoir une amplitude de plusieurs annes qui est souvent mal dfinie. Cette
composante est prise en compte dans la tendance sur les sries de taille moyenne et ne sera
pas tudie en tant que telle ici.
5.3.4. La composante rsiduelle.

La composante rsiduelle ou variations accidentelles est la partie non structure du


phnomne. Ce sont des variations caractre souvent imprvisible et qui modifient
ponctuellement la srie chronologique : grve, guerre, mesures fiscales, scheresse pour les
productions agricoles. On parle de bruit blanc.

166
Statistique descriptive 5. Les sries chronologiques

Exemple 3 : Reprenons le graphique de lexemple 2.


Ventes trim estrielles entre 2002 et 2005

700
600
500
Ventes Yt

400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Temps t

On remarque sur la reprsentation graphique ci-dessus, ce qui suit :


- lvolution moyen terme des ventes se traduit par une tendance croissante ;
- la reprsentation graphique nindique aucune fluctuation non structure qui modifie
ponctuellement la srie des ventes. Il y a donc une faible prsence de la composante
rsiduelle.
- la srie des ventes ne suit pas un mouvement rgulier, mais fluctue au cours du temps,
autour de sa tendance. Ces fluctuations sont de natures diffrentes selon leur priodicit.
La reprsentation graphique indique des fluctuations priodiques de priode 4 qui se
reproduisent de faon plus ou moins identique dun trimestre sur lautre. En effet :
- du premier au deuxime trimestre de chaque anne on constate une baisse des ventes ;
- au troisime trimestre de chaque anne, il y a une hausse des ventes ;
- au quatrime trimestre de chaque anne, on note de nouveau une baisse des ventes.
On peut donc parler dun effet saisonnier.
5.4. LES SCHEMAS DE COMPOSITION.

La donne observe la date t ou donne brute dune srie chronologique, dsigne par
y(t), peut donc sinterprter comme rsultant de la superposition des quatre composantes, le
Trend dsign par Tt ; la composante saisonnire St, la composante cyclique Ct et la
composante rsiduelle Rt.

167
Statistique descriptive 5. Les sries chronologiques

Pour pouvoir sparer les quatre composantes servant dcrire la srie observe, il est
ncessaire de prciser leur mode d'interaction. La plupart des sries chronologiques entrent
dans l'un des schmas suivants :
5.4.1. Schma additif.

Selon ce schma, la srie brute rsulte de la somme du mouvement de longue dure Tt, du
mouvement saisonnier St, du mouvement cyclique Ct et du mouvement accidentel ou
rsiduel Rt :
y(t) = Tt + St + Ct + Rt
St, Ct, et Rt sont alors les lments que lon doit ajouter la valeur Tt de la tendance la
date t pour obtenir la donne observe y(t). Ce modle considre que les mouvements
saisonnier et cyclique sont indpendants du niveau de y atteint sur le trend.

5.4.2. Schma multiplicatif.

On peut au contraire penser que les variations cycliques et saisonnires suivent lvolution
gnrale de la grandeur. On adopte alors un modle multiplicatif :

Y(t) = Tt x St x Ct x Rt

O St, Ct et Rt sont les coefficients par lesquels on doit multiplier Tt, position sur le Trend
la date t, pour obtenir la donne observe y.

5.4.3. Schma mixte.

On peut aussi noter que ces deux hypothses ne sont pas incompatibles. Le schma additif
et le schma multiplicatif peuvent tre combins pour donner un schma dit mixte .

Yt = Tt x St + Ct + Rt

Les modles sus-indiqus sont tous acceptables. Cependant, il est frquemment fait usage
du modle multiplicatif pour tudier les techniques associes lanalyse des sries
chronologiques.

Exemple 4 : Reprenons le graphique de lexemple 2.

168
Statistique descriptive 5. Les sries chronologiques

Ventes trimestrielles entre 2002 et 2005

700
600
Ventes Yt 500
400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Temps t

On peut remarquer sur le graphique que les variations saisonnires suivent lvolution
gnrale de la srie, on adopte alors un modle multiplicatif :

Y(t) = Tt x St x Rt

O St et Rt sont les coefficients par lesquels on doit multiplier Tt, position sur le Trend la
date t, pour obtenir la donne observe y(t).

5.5. LES METHODES DE LISSAGE.

Les mthodes de lissage sont des mthodes de rduction ou dlimination des fluctuations
alatoires dans le but de dcouvrir lexistence dautres composantes.
5.5.1. La mthode des moyennes mobiles.

Les oprations de lissage sont ralises par le biais de moyennes mobiles. Celles-ci sont trs
utilises car elles sont la fois de conceptions simples, faciles mettre en uvre et
suffisantes dans bien des situations.
Une srie chronologique est lisse en remplaant chaque valeur y(t) par une moyenne
arithmtique des valeurs qui lentourent. Une moyenne mobile pour une priode de temps
est une moyenne arithmtique simple des valeurs de cette priode et de celles avoisinantes.
Le lissage dune srie chronologique y(t), par une moyenne mobile dordre impair n = 2k +
1 est dfini pour t = k + 1, . . . , T - k, par :

MM(y(t)) = 1 (Y + + Yt + + Yt+k)
n t-k

169
Statistique descriptive 5. Les sries chronologiques

Par exemple, pour calculer les moyennes mobiles de longueur 3 pour une priode
quelconque, nous sommons 3 valeurs de la srie chronologique : la valeur de la srie de la
priode en question, la valeur de celle qui prcde et la valeur de celle qui suit et nous
divisons par 3. Nous calculons les moyennes mobiles pour toutes les priodes excepts la
premire et la dernire.

Il est difficile de discerner les composantes de la srie chronologique si lon se rfre


uniquement au graphe reprsentatif de la srie brute et ce en raison du large volume ou effet
de la variation alatoire prsente. Pour essayer de voir comment la mthode des moyennes
mobiles rduit les fluctuations alatoires, on se rfre la reprsentation graphique de la
srie des moyennes mobiles.
Il est noter aussi que les moyennes mobiles de longueur 5 lissent la srie brute plus que
lorsquon utilise les moyennes mobiles de longueur 3. En gnral, plus la priode sur
laquelle nous faisons les moyennes est longue, plus la srie brute devient lisse.
La srie lisse est plus courte que loriginale puisque des valeurs sont manquantes chaque
extrmit de la priode dobservation.
Exemple 5 : Reprenons les donnes de lexemple 1 et calculons les moyennes mobiles
dordre 3 et les moyennes mobiles dordre 5.

Utilisons la prsentation des donnes sous forme dune srie statistique deux variables, la
variable y(t) dsignant les ventes et la variable t reprsentant le temps.
Pour calculer les moyennes mobiles de longueur 3 pour une priode quelconque, nous
sommons la valeur de la srie chronologique de la priode en question aux valeurs de celle
qui prcde et de celle qui suit et nous divisons par 3. Nous calculons les moyennes mobiles
pour toutes les priodes excepts la premire et la dernire.

MM3(y(t)) = 1 (yt-1 + yt + yt+1)


3
Temps t Ventes y
1 190
2 160
3 251
4 200
5 320
6 290
7 359
8 317
9 426
10 405
11 483
170
Statistique descriptive 5. Les sries chronologiques

12 433
13 558
14 525
15 607
16 550

Faisons, par exemple, les calculs pour MM3(Y2) et MM3(Y3) :


MM3(y2) = 1 (190 + 160 + 251) = 200,33
3
MM3(y3) = 1 (160 + 251 + 200) = 203,67
3
Pour calculer les moyennes mobiles de longueur 5, pour une priode quelconque, nous
sommons la valeur de la srie chronologique de la priode en question aux 2 valeurs
prcdentes et aux 2 valeurs suivantes et nous divisons par 5. Nous calculons les moyennes
mobiles pour toutes les priodes excepts les 2 premires et les 2 dernires.

MM5(y(t)) = 1 ( yt-2 + yt-1 + yt + yt+1+ yt+2)


5
Faisons, par exemple, les calculs pour MM5(Y3) et MM5(Y4) :
MM5(Y3) = 1 (190 + 160 + 251 + 200 + 320) = 224,20
5
MM5(Y4) = 1 (160 + 251 + 200 + 320 + 290) = 244,20
5
Le tableau ci-dessous donne les rsultats pour les moyennes mobiles de longueur 3, MM3 et
de longueur 5, MM5 :

Moyennes mobiles d'ordre 3 Moyennes mobiles d'ordre 5


Temps t Vente y
(MM3) (MM5)
1 190 - -
2 160 200,33 -
3 251 203,67 224,20
4 200 257,00 244,20
5 320 270,00 284,00
6 290 323,00 297,20
7 359 322,00 342,40
8 317 367,33 359,40
9 426 382,67 398,00
10 405 438,00 412,80
11 483 440,33 461,00
12 433 491,33 480,80
13 558 505,33 521,20
171
Statistique descriptive 5. Les sries chronologiques

14 525 563,33 534,60


15 607 560,67 -
16 550 - -

Pour essayer de voir comment la mthode des moyennes mobiles rduit les fluctuations
alatoires, examinons les reprsentations graphiques de la srie brute, de la srie des
moyennes mobiles MM3 et de la srie des moyennes mobiles MM5.

600

500

400

300

200

100

0
3 4 5 6 7 8 9 10 11 12 13 14

Ventes Yt MM3 MM5

On remarque bien, sur le graphique, que les moyennes mobiles de longueur 5 lissent la
srie brute plus que les moyennes mobiles de longueur 3. En gnral, plus la priode sur
laquelle nous faisons les moyennes est longue, plus la srie brute devient lisse.

5.5.2. La mthode des moyennes mobiles centres.

Si lon dcide dadopter un nombre pair de priodes pour calculer les moyennes mobiles,
nous serons confronts au problme de la place ou position des moyennes mobiles
calcules. Obtenir des moyennes mobiles qui se situent entre deux priodes cause des
problmes notamment dinterprtation. La mthode des moyennes mobiles centres corrige
ce problme. Cette mthode consiste calculer des moyennes mobiles dordre 2 aux
moyennes mobiles dj obtenues.
Exemple 6 : Reprenons les donnes de lexemple 5 et calculons les moyennes mobiles
dordre 4.

Pour calculer les moyennes mobiles de longueur 4 nous sommons les valeurs de la srie
chronologique de 4 priodes successives et nous divisons par 4. Les moyennes mobiles ainsi
calcules se positionnent entre 2 priodes. La mthode des moyennes mobiles centres
172
Statistique descriptive 5. Les sries chronologiques

corrige ce problme. Cette mthode consiste calculer des moyennes mobiles dordre 2 aux
moyennes mobiles dj obtenues.

1 (yt-2 + yt-1 + yt+ yt+1)


MM4(y(t-1 ; t)) =
4
1
MM4(y(t ; t+1)) = (yt-1 + yt + yt+1+ yt+2)
4
La moyenne mobile centre pour la priode t est :
MMC4(yt) = 1 [MM4(y(t-1; t)) + MM4(y(t ; t+1))]
2

Des trois galits prcdentes, nous pouvons, sans calculer les moyennes mobiles dordre 4,
donner directement lexpression de la moyenne mobile centre pour la priode t :

MMC4(yt) = 1 (0,5 yt-2 + yt-1 + yt+ yt+1+ 0,5 yt+2)


4
Faisons, par exemple, les calculs pour MM4(Y(2; 3)) et MM4(Y(3; 4) :
MM4(y(2 ; 3)) =1 (190 + 160 + 251 + 200) = 200,25
4
MM4(y(3 ; 4) = 1 (160 + 251 + 200 + 320) = 232,75
4
La moyenne mobile centre pour la priode 3 est :
MMC4(y3) = 1 (200,25 + 232,75) = 216,5
2
La moyenne mobile centre pour la priode 3 peut tre directement calcule par :

MMC4(y3) = 1 (0,5 x190 + 160 + 251 + 200 + 0,5 x 320) = 216,5


4
Le tableau ci-dessous donne les rsultats pour les moyennes mobiles de longueur 4 MM4 et
les moyennes mobiles centres MMC4 :

Vente Moyennes mobiles d'ordre 4 Moyennes mobiles centres d'ordre 4


Temps t
Y(t) (MM4) (MMC4)
1 190 -
2 160 -
200,25
173
Statistique descriptive 5. Les sries chronologiques

3 251 216,50
232,75
4 200 249,00
265,25
5 320 278,75
292,25
6 290 306,88
321,50
7 359 334,75
348,00
8 317 362,38
376,75
9 426 392,25
407,75
10 405 422,25
436,75
11 483 453,25
469,75
12 433 484,75
499,75
13 558 515,25
530,75
14 525 545,38
560,00
15 607 -
16 550 -

Examinons la reprsentation graphique de la srie brute et de la srie des moyennes mobiles


centres dordre 4 MMC4.

174
Statistique descriptive 5. Les sries chronologiques

600
500
400
300
200
100
0
3 4 5 6 7 8 9 10 11 12 13 14

Ventes Yt MMC4

On remarque bien, sur le graphique, que les moyennes mobiles centres dordre 4 ont liss
la srie brute.

5.5.3. La mthode exponentielle

Deux inconvnients sont associs la mthode des moyennes mobiles pour le lissage dune
srie chronologique :
- Premirement, nous navons pas de moyennes mobiles pour le premier et le dernier
groupes de priodes de la srie. Au cas o la srie chronologique serait compose dun
nombre limit dobservations, les valeurs omises peuvent reprsenter une importante perte
dinformation ;
- Deuximement, les moyennes mobiles ngligent la plupart des valeurs prcdentes de la
srie chronologique, la moyenne mobile reflte des priodes avoisinantes mais nest pas
affecte par tout le pass.
Ces deux inconvnients sont corrigs par la mthode exponentielle dune srie qui est
dfinie de la faon suivante :
St = w yt + (1-w) S t-1 pour t 2
Avec :

- St : valeur de la srie chronologique lisse exponentiellement la date t.


* y(t) = yt : valeur de la srie chronologique la date t .
* S t-1 : valeur de la srie chronologique lisse exponentiellement la date t 1.
* w : constante ou coefficient de lissage, avec 0 w 1 .
* (1-w), appel facteur doubli, reprsente le poids accord la nouvelle acquisition.

175
Statistique descriptive 5. Les sries chronologiques

On commence par poser : S1 = y1, ce qui donne :

S2 = w y2 + (1-w) S1 = wy2 + (1-w) y1


S3 = w y3 + (1-w) S2 = w y3 + (1-w) [w y2 + (1-w) y1]
S3 = w y3 + w (1-w) y2 + (1-w) 2 y1

En rgle gnrale, on obtient :

St = w yt + w (1-w) y t-1 + w (1-w)2 y t-2 + + (1-w) t-1 y1

Cette dernire formule indique que la srie lisse la date t, dpend de toutes les
observations antrieures de la srie chronologique. Lintrt de la mthode rside dans la
facilit de mise jour lors de lacquisition dune nouvelle donne.
Le choix de la constante de lissage est important. Les valeurs proches de 0 produisent un
degr de lissage assez important et correspondent un lissage rigide, car le pass intervient
peu, alors que les valeurs proches de 1 rsultent dans un lissage assez limit de la srie et
donnent un lissage souple o le pass conserve, assez longtemps, son influence.
La particularit consiste accorder aux valeurs passes une importance qui dcrot de
manire exponentielle avec le temps, on parle de facteur doubli. Lautre point important est
que la mise jour, lors de lacquisition dune nouvelle observation yT+1, est ralise de
faon simple.
Le lissage exponentiel nest pas adapt une srie chronologique prsentant une tendance
variant fortement ou un effet saisonnier trs marqu.

Exemple 7 : Reprenons les donnes de lexemple 5 et appliquons la mthode exponentielle


de lissage avec w = 0,2 et w = 0,7 et reprsentons graphiquement les rsultats.

Les valeurs lisses exponentiellement sont obtenues partir de la formule suivante :

St = w yt + (1-w) S t-1 Pour t 2

On commence par poser : S1 = y1 = 190

Pour w = 0,2 on a :

S2 = 0,2 x 160 + 0,8 x 190 = 184


S3 = 0,2 x 251 + 0,8 x 184 = 197,40

Pour w = 0,7 on a :

S2 = 0,7 x 160 + 0,3 x 190 = 169


176
Statistique descriptive 5. Les sries chronologiques

S3 = 0,7 x 251 + 0,3 x 169 = 226,40

Le tableau, ci-dessous, donne les rsultats de calculs pour le lissage exponentiel, pour w =
0,2 et le lissage exponentiel, pour w = 0,7 :
Lissage exponentiel Lissage exponentiel
Temps t Ventes yt
w = 0,2 w = 0,7
1 190 190,00 190,00
2 160 184,00 169,00
3 251 197,40 226,40
4 200 197,92 207,92
5 320 222,34 286,38
6 290 235,87 288,91
7 359 260,50 337,97
8 317 271,80 323,29
9 426 302,64 395,19
10 405 323,11 402,06
11 483 355,09 458,72
12 433 370,67 440,72
13 558 408,14 522,81
14 525 431,51 524,34
15 607 466,61 582,20
16 550 483,29 559,66

Pour essayer de voir comment la mthode exponentielle rduit les fluctuations alatoires,
examinons les reprsentations graphiques de la srie brute, de la srie lisse
exponentiellement 0,2 et de la srie lisse exponentiellement 0,7.

700
600
500
400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 1 12 13 14 15 16

Ventes Yt w = 0,2 w = 0,7

177
Statistique descriptive 5. Les sries chronologiques

On voit bien, sur le graphique, que le lissage exponentiel w = 0,2 lissent la srie brute
plus que le lissage exponentiel w = 0,5. En gnral, plus le coefficient de lissage est faible,
plus la srie brute devient lisse.
5.6. ETUDE DU TREND.

La rgression linaire est la mthode la plus simple pour analyser la tendance gnrale
dune srie chronologique o la variable indpendante est le temps t.
Le trend peut tre soit linaire ou non linaire et par consquent peut prendre des formes
fonctionnelles assez diverses.
5.6.1. Modle linaire.

Si nous estimons que la tendance de longue priode est essentiellement linaire, on utilisera
le modle suivant :
^
yt a t b

Lestimation de a et de b par la mthode des moindres carrs se fait par les formules
dveloppes dans le chapitre prcdent :

a t y - n t y
i i

COV(t, y)
et b y-a t
t - n t
2
i
S2t

Exemple 8 : Reprenons les donnes de lexemple 1 et dterminons lquation du trend.

Lquation du trend sera dtermine partir de la srie lisse par la mthode des moyennes
mobiles centres dordre 4 calcule lexemple 6.
Reprsentons graphiquement la srie lisse :

srie lisse

600

500

400

300

200

1 00

3 4 5 6 7 8 9 10 11 12 13 14

178
Statistique descriptive 5. Les sries chronologiques

Daprs le graphique, on voit bien que le trend est linaire.


^
Calculons alors lquation du trend : yt a t b

Temps t MMC4 t t x MMC4


3 216,5 9 649,5
4 249 16 996
5 278,75 25 1393,75
6 306,875 36 1841,25
7 334,75 49 2343,25
8 362,375 64 2899
9 392,25 81 3530,25
10 422,25 100 4222,5
11 453,25 121 4985,75
12 484,75 144 5817
13 515,25 169 6698,25
14 545,375 196 7635,25
Total 102 4561,375 1010 43011,75


t 102 8,5
12
4561,375
MMC4 380,11
12
1010
St - 8,5 11,92
12
43011,75
COV(t ; MMC4) - 8,5 380,11 353,3775
12
353,3775
a= 29,65
11,92
b = 380,11 29,65 x 8,5 = 128,08

^
Lquation du trend est : yt = 29,65 t + 128,08

Reportons la droite dquation y = 29,65 t + 128,08 sur le graphe de la srie tel que nous
lavons reprsent pour lexemple 1.

179
Statistique descriptive 5. Les sries chronologiques

700
600
500
400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Ventes Yt trend

La droite de rgression sajuste bien au nuage de points de la srie chronologique, elle


montre clairement une tendance linaire croissante de la srie.
5.6.2. Modle exponentiel.
^
y t = a bt

Le modle logarithmique peut tre traduit en termes de log de la faon suivante :


^
Log ( y t ) = log (a) + (log b) t

Si lon pose les changements de variables suivants :

Y' = log y a = log (a) et b = log (b)

Le modle devient linaire :

Y' = a + b' t

On calcule a et b laide de la mthode des moindres carrs, comme dveloppe, dans le


chapitre prcdent :
COV(t, y')
b' et a' y' - b' t
S2t

Les constantes a et b sont alors :


b = eb et a = ea

180
Statistique descriptive 5. Les sries chronologiques

Exemple 9 : Le nombre dabonns un service tlphonique au cours des neuf premiers


mois de son lancement est comme suit :

Mois Priode Nombre dabonns y(t)


Janvier 1 1
Fvrier 2 6
Mars 3 10
Avril 4 14
Mai 5 25
Juin 6 48
Juillet 7 63
Aot 8 108
septembre 9 161

Reprsentons graphiquement cette srie :

Nombre dabonns y(t)

180

160

140

120

100

80

60

40

20

t
1 2 3 4 5 6 7 8 9

Daprs le graphique, on voit bien que la srie prsente une tendance exponentielle de la
forme :
^
y t = a bt
Le modle logarithmique peut tre traduit en termes de log de la faon suivante :
^
Log ( yt ) = log (a) + (log b) t

181
Statistique descriptive 5. Les sries chronologiques

Si lon pose les changements de variables suivants :


y' = log y a = log (a) et b = log (b)

Le modle devient linaire :


y' = a + b' t

On calcule a et b laide de la mthode des moindres carrs :

t yt y' t t y'
1 1 0,000 1 0,000
2 6 1,792 4 3,584
3 10 2,303 9 6,908
4 14 2,639 16 10,556
5 25 3,219 25 16,094
6 48 3,871 36 23,227
7 63 4,143 49 29,002
8 108 4,682 64 37,457
9 161 5,081 81 45,733
Total 45 --- 27,730 285 172,561


t 45 5
9

27,73
Y' 3,08
9
St 285 - 5 6,67
9
172,561
COV(t ; Y') - 5 3,08 3,773
9
3,773
b = 0,566
6,67
a = 3,08 0,566 x 5 = 0,25

Les constantes a et b sont alors :

b = eb = e0,566 = 1,76
a = ea = e0,25 = 1,28
^
Lquation du trend est donc : y t = 1,28 b1,76

5.7. ETUDE DE LA COMPOSANTE SAISONNIERE.

182
Statistique descriptive 5. Les sries chronologiques

5.7.1. Calcul des coefficients saisonniers.

Dans le but de mesurer leffet saisonnier, on calcule des coefficients saisonniers, qui ont
pour objet de mesurer le degr de diffrence entre les saisons.
Le calcul des coefficients saisonniers repose sur une dmarche gnrale qui peut tre
dcompose en trois tapes essentielles :
^
- La premire tape consiste estimer les valeurs de la tendance y t . La dtermination de
la tendance trend consiste rduire les fluctuations et dgager une volution long terme ;

- La deuxime tape consiste, par une confrontation entre les valeurs de la srie brute et
celles de la tendance, calculer les valeurs du mouvement saisonnier. Cette confrontation peut
se faire, de deux faons :
* Par un modle multiplicatif, sous forme de rapports entre les valeurs de la srie brute et
celles de la tendance, ces rapports sont appels rapports aux trends rt :
rt = Yt
^
Yt
* Par un modle additif, on calcule les diffrences entre les valeurs de la srie brute et
celles de la tendance, on parle de diffrences aux trends.

- La troisime tape consiste mesurer leffet saisonnier laide des coefficients


saisonniers. Ces derniers sont obtenus en calculant, pour chaque saison, la moyenne des
rapports ou des diffrences aux trends.

r t

rk =
n
Avec k = 1 jusquau nombre de saisons et n est le nombre dobservations pour chaque
saison.

Les coefficients saisonniers correspondent aux rapports moyens ajusts :


csk = rk
r
Exemple 10 : Reprenons les donnes de lexercice 1 et calculons les coefficients
saisonniers.

183
Statistique descriptive 5. Les sries chronologiques

^
Calculons les valeurs du trend y t laide de lquation du trend dj calcule dans
lexemple 8 savoir :

^
yt = 29,65 t + 128,08

^ ^
Yt yt yt rt
3 251 217,03 1,1565
4 200 246,68 0,8108
5 320 276,33 1,1580
6 290 305,98 0,9478
7 359 335,63 1,0696
8 317 365,28 0,8678
9 426 394,93 1,0787
10 405 424,58 0,9539
11 483 454,23 1,0633
12 433 483,88 0,8948
13 558 513,53 1,0866
14 525 543,18 0,9665

rapports aux trend

1,4
1,2
1
0,8
0,6
0,4
0,2
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Le graphique des rapports aux valeurs du trend fait apparatre des fluctuations saisonnires.
Les priodes 2 ; 4 ; 6 ; 8 ; 10 ; 12 ; 14 et 16 qui correspondent aux deuxime et quatrime
trimestres sont des basses saisons, alors que les priodes 1 ; 3 ; 5 ; 7 ; 9 ; 11 ; 13 et 15 qui
correspondent aux premier et troisime trimestres sont des hautes saisons.

Calculons les coefficients saisonniers dans le cas dun modle multiplicatif :


Annes Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4

184
Statistique descriptive 5. Les sries chronologiques

2002 - - 1,1565 0,8108


2003 1,1580 0,9478 1,0696 0,8678
2004 1,0787 0,9539 1,0633 0,8948
2005 1,0866 0,9665 - -
1,1078 0,9561 1,0965 0,8578
rk
1,00455
r
Cs 1,1028 0,9518 1,0915 0,8539

185
Statistique descriptive 5. Les sries chronologiques

Les coefficients saisonniers du premier et troisime trimestre sont suprieurs 1 alors que
ceux du deuxime et quatrime trimestre sont infrieurs 1. Le deuxime et le quatrime
trimestre sont donc des basses saisons, alors que le premier et le troisime trimestre sont des
hautes saisons.

5.7.2. Dsaisonnalisation dune srie chronologique.

Les techniques de dsaisonnalisation consistent liminer dune srie chronologique leffet


de la composante saisonnire.

La srie dsaisonnalise est obtenue :

* dans le cas du modle multiplicatif, en divisant les valeurs de la srie brute par les
coefficients saisonniers moyens correspondants ;
* dans le cas du modle additif, en soustrayant des valeurs de la srie brute les
coefficients saisonniers moyens correspondants.

Exemple 11 : Reprenons les donnes de lexemple 10 et calculons la srie dsaisonnalise.

Rappelons que nous avons opt, dans lexemple 10, pour un modle multiplicatif, de ce fait
et pour dsaisonnaliser notre srie, on divise les valeurs de la srie brute par les coefficients
saisonniers moyens correspondants, on obtient, aprs calculs :

Annes Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4


2002 172,29 168,10 229,96 234,22
2003 290,17 304,69 328,91 371,24
2004 386,29 425,51 442,51 507,09
2005 505,98 551,59 556,12 644,10

S rie dsaisonnalise

800

600

400

200
0
1 3 5 7 9 11 13 15

La reprsentation de la srie dsaisonnalise montre clairement llimination de leffet


saisonnier. La srie dsaisonnalise conserve les irrgularits dues la composante

186
Statistique descriptive 5. Les sries chronologiques

rsiduelle. En effet, au deuxime trimestre 2002 et premier trimestre 2005 on note une
petite baisse accidentelle.
5.7.3. Calcul des prvisions.

A partir de lquation du trend et des coefficients saisonniers, on peut prvoir les valeurs de
la srie pour les priodes venir.
La prvision de la valeur de la srie la priode t+k est, pour un modle multiplicatif, la
valeur estime du trend multiplie par le coefficient saisonnier moyen de la saison
correspondante.
Exemple 12 : Reprenons les donnes de lexemple 10 et calculons les prvisions des ventes
pour les quatre trimestres de lanne 2006.

Lquation du trend dj calcule lexemple 8 est :


^
yt = 29,65 t + 128,08
^
yt+k = y t k CS

Valeurs du trend : Prvisions


Trimestres ^ Coefficients
Priodes ^
anne 2006 yt saisonniers Y t k CS
1er trimestre t = 17 615,13 1,1028 678
2me trimestre t = 18 644,78 0,9518 614
3me trimestre t = 19 674,43 1,0915 736
4me trimestre t = 20 704,08 0,8539 601

Exemple 13 : Reprenons les donnes de lexemple 1, relatives aux ventes trimestrielles


ralises par une entreprise au cours des quatre dernires annes, et utilisons un modle additif
pour le calcul des coefficients saisonniers.

Annes Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4


2002 190 160 251 200
2003 320 290 359 317
2004 426 405 483 433
2005 558 525 607 550

Le modle additif scrit : Yt = Tt + St + Ct + Rt

187
Statistique descriptive 5. Les sries chronologiques

Le tableau suivant regroupe la srie brute, les valeurs du trend et les diffrences au trend :

^ ^
t yt yt yt dt
3 251 217,03 33,97
4 200 246,68 -46,68
5 320 276,33 43,67
6 290 305,98 -15,98
7 359 335,63 23,37
8 317 365,28 -48,28
9 426 394,93 31,07
10 405 424,58 -19,58
11 483 454,23 28,77
12 433 483,88 -50,88
13 558 513,53 44,47
14 525 543,18 -18,18

diffrences au trend

60

40

20

-20

-40

-60

Le graphique des diffrences aux valeurs du trend fait apparatre des fluctuations
saisonnires. Les priodes 2 ; 4 ; 6 ; 8 ; 10 ; 12 ; 14 et 16 qui correspondent aux deuxime et
quatrime trimestres sont des basses saisons, alors que les priodes 1 ; 3 ; 5 ; 7 ; 9 ; 11 ;
13 et 15 qui correspondent aux premier et troisime trimestres sont des hautes saisons.

188
Statistique descriptive 5. Les sries chronologiques

Calculons les coefficients saisonniers dans le cas du modle additif :

Annes Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4


2002 - - 33,97 - 46,68
2003 43,67 - 15,98 23,37 - 48,28
2004 31,07 - 19,58 28,77 - 50,88
2005 44,47 - 18,18 - -

cs = d k 39,74 - 17,91 28,70 - 48,61

Les coefficients saisonniers du premier et troisime trimestre sont suprieurs 0 alors que
ceux du deuxime et quatrime trimestre sont infrieurs 0. Le deuxime et le quatrime
trimestre sont donc des basses saisons, alors que le premier et le troisime trimestre sont des
hautes saisons.

Dsaisonnalisation de la srie brute :

La srie dsaisonnalise est obtenue en soustrayant le coefficient saisonnier moyen de la


valeur de la srie brute.

Annes Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4


2002 150 178 222 249
2003 280 308 330 366
2004 386 423 454 482
2005 518 543 578 599
Srie dsaisonnalise

700

600

500

400

300

200

100

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

189
Statistique descriptive 5. Les sries chronologiques

La reprsentation de la srie dsaisonnalise montre clairement llimination de leffet


saisonnier.

Exemple 14 : Le tableau suivant donne la consommation mensuelle en lectricit de


lentreprise Matex, pendant 8 ans.

annes jan fv mar avr mai juin juil ao sep oct nov Dc
1998 318 281 278 250 231 216 223 245 269 302 325 347
1999 342 309 299 268 249 236 242 262 288 321 342 364
2000 367 328 320 287 269 251 259 284 309 345 367 394
2001 392 349 342 311 290 273 282 305 328 364 389 417
2002 420 378 370 334 314 296 305 330 356 396 422 452
2003 453 412 398 362 341 322 335 359 392 427 454 483
2004 487 440 429 393 370 347 357 388 415 457 491 516
2005 529 477 463 423 398 380 389 419 448 493 526 560

Reprsentation graphique :

La prsentation des donnes doit tre transforme en une srie statistique deux variables,
la variable y(t) dsignant les ventes et la variable t reprsentant le temps.

y(t)

600
500
400
300
200
100
0
1

7
10

13

16

19

22

25

28

31

34

37

40

43

46

49

52

55

58

61

64

67

70

73

76

79

82

85

88

91

94

Daprs ce graphe, la consommation mensuelle en lectricit prsente une tendance


croissante. La srie fluctue au cours du temps.

On pourrait donner une meilleure apprciation de ces fluctuations en reprsentant les


graphes des nuages de points pour les 12 mois de chaque anne. On obtient ainsi 8 courbes
qui ont la mme allure :

190
Statistique descriptive 5. Les sries chronologiques

600
500
400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 1 12

1998 1999 2000 2001 2002 2003


2004 2005

Ce deuxime graphique indique des fluctuations priodiques de priode 12 qui se


reproduisent de faon plus ou moins identique dun mois lautre. On peut donc parler dun
effet saisonnier mensuel trs net.
La reprsentation graphique nindique aucune fluctuation accidentelle qui modifie
ponctuellement la srie. Il y a donc une faible prsence de la composante rsiduelle. La
srie brute peut tre lisse un ordre faible.
Lissage de la srie brute par la mthode des moyennes mobiles dordre 3 :

Pour calculer les moyennes mobiles de longueur 3 pour une priode quelconque, nous
sommons la valeur de la srie chronologique de la priode en question aux valeurs de celle
qui prcde et de celle qui suit et nous divisons par 3. Nous calculons les moyennes mobiles
pour toutes les priodes excepts la premire et la dernire. La formule de calcul est donc :

MM3(yt) = 1 (yt-1 + yt + yt+1)


3
Faisons, titre dexemple, le calcul de MM3(y2) et de MM3(y3) :

MM3(y2) =1 (318 + 281 + 278) = 292,33


3
1
MM3(y3) = (281 + 278 + 250) = 269,67
3

191
Statistique descriptive 5. Les sries chronologiques

jan fv mars avr mai juin juil aot sept oct nov dc
292,3 269,6 232,3 223,3 245,6 298,6 324,6
- 3 7 253 3 3 228 7 272 7 7 338
332,6 316,6 242,3 246,6 290,3 342,3 357,6
7 7 292 272 251 3 7 264 3 317 3 7
338,3 311,6 259,6 264,6 312,6 340,3 368,6 384,3
353 3 7 292 269 7 7 284 7 3 7 3
378,3 314,3 291,3 281,6 286,6 332,3 360,3 408,6
3 361 334 3 3 7 7 305 3 3 390 7
389,3 360,6 339,3 314,6 310,3 330,3 360,6 391,3 423,3 442,3
405 3 7 3 7 305 3 3 7 3 3 3
390,6 341,6 332,6 338,6 392,6 424,3 454,6 474,6
439 421 7 367 7 7 7 362 7 3 7 7
420,6 397,3 386,6 454,3
470 452 7 3 370 358 364 7 420 3 488 512
507,3 489,6 454,3 400,3 418,6 453,3 526,3
3 7 3 428 3 389 396 7 3 489 3 -

Pour essayer de voir comment la mthode des moyennes mobiles rduit les fluctuations
alatoires, examinons la reprsentation graphique de la srie des moyennes mobiles MM3.

MM3

600,00

500,00

400,00

300,00

200,00

100,00

0,00
11

14

17

20

23

26

29

32

35

38

41

44

47

50

53

56

59

62

65

68

71

74

77

80

83

86

89

92

95
2

On voit bien, sur le graphique, que la srie des moyennes mobiles de longueur 3 est plus
lisse que la srie brute.
Dtermination du trend :

Daprs le graphique de la srie brute, on peut affirmer que la tendance de longue priode
est linaire, on utilisera le modle suivant :
^
yt a t b
192
Statistique descriptive 5. Les sries chronologiques

Lestimation de a et de b par la mthode des moindres carrs se fait par les formules :

a t y - n t y
i i

COV(t, y)
et b y-a t
t - n t
2
i
S2t
Les rsultats des calculs sont regroups dans le tableau suivant :

Temps t MM3 t t x MM3


Total 4559,0 33480,66 290319 1775869,35
moyenne 48,5 356,2 3088,5 18892,2
variance 736,3
covariance 1617,6
a 2,2
b 249,6
^
Lquation du trend est donc : yt = 2,2 t + 249,6
Calcul des valeurs du trend :

jan fv mars avr mai juin juil aot sept oct nov dc
251,8 254,0 256,2 258,4 260,6 262,8 265,0 267,2 269,4 271,6 273,8 276,0
278,2 280,4 282,6 284,8 287 289,2 291,4 293,6 295,8 298 300,2 302,4
304,6 306,8 309 311,2 313,4 315,6 317,8 320 322,2 324,4 326,6 328,8
331 333,2 335,4 337,6 339,8 342 344,2 346,4 348,6 350,8 353 355,2
357,4 359,6 361,8 364 366,2 368,4 370,6 372,8 375 377,2 379,4 381,6
383,8 386 388,2 390,4 392,6 394,8 397 399,2 401,4 403,6 405,8 408
410,2 412,4 414,6 416,8 419 421,2 423,4 425,6 427,8 430 432,2 434,4
436,6 438,8 441 443,2 445,4 447,6 449,8 452 454,2 456,4 458,6 460,8

Dtermination des coefficients saisonniers :

jan fv mars
avr mai juin juil aot sept oct nov dc
- 1,151 1,053
0,979 0,892 0,850 0,860 0,919 1,010 1,100 1,186 1,225
1,196 1,129 1,033
0,955 0,875 0,838 0,846 0,899 0,982 1,064 1,140 1,183
1,159 1,103 1,009
0,938 0,858 0,823 0,833 0,888 0,970 1,049 1,129 1,169
1,143 1,083 0,996
0,931 0,857 0,824 0,833 0,880 0,953 1,027 1,105 1,151
1,133 1,083 0,997
0,932 0,859 0,828 0,837 0,886 0,962 1,037 1,116 1,159
1,144 1,091 1,006
0,940 0,870 0,843 0,853 0,907 0,978 1,051 1,120 1,163
1,146 1,096 1,015
0,953 0,883 0,850 0,860 0,909 0,982 1,057 1,129 1,179
1,162 1,116 1,030
0,966 0,899 0,869 0,880 0,926 0,998 1,071 1,148 -
Calcul des rapports moyens par mois
1,155 1,106 1,017 0,949 0,874 0,840 0,850 0,902 0,979 1,057 1,134 1,552
Calcul de la moyenne des rapports moyens
193
Statistique descriptive 5. Les sries chronologiques

0,964
Calcul des coefficients saisonniers moyens
1,198 1,148 1,055 0,985 0,907 0,872 0,882 0,936 1,016 1,097 1,177 1,610

rapports au trend

1,4

1,2

1,0

0,8

0,6

0,4

0,2

0,0
2

8
11

14

17

20

23

26

29

32

35

38

41

44

47

50

53

56

59

62

65

68

71

74

77

80

83

86

89

92

95
Le graphique des rapports aux valeurs du trend fait apparatre des fluctuations saisonnires.
Les mois 4 ; 5 ; 6 ; 7 et 8 correspondent une basse saison, alors que les mois 1 ; 2 ; 3 ; 9 ;
10 ; 11 et 12 correspondent une haute saison.
Dtermination de la srie dsaisonnalise :

jan fv mars avr mai juin juil aot sept oct nov Dc
1998 265 245 264 254 255 248 253 262 265 275 276 216
1999 285 269 283 272 275 271 274 280 283 293 291 226
2000 306 286 303 291 297 288 294 303 304 314 312 245
2001 327 304 324 316 320 313 320 326 323 332 331 259
2002 351 329 351 339 346 339 346 353 350 361 359 281
2003 378 359 377 368 376 369 380 384 386 389 386 300
2004 407 383 407 399 408 398 405 415 408 417 417 320
2005 442 416 439 429 439 436 441 448 441 449 447 348

194
Statistique descriptive 5. Les sries chronologiques

srie dsaisonnalise

500
450
400
350
300
250
200
150
100
50
0
1

7
10

13

16

19

22

25

28

31

34

37

40

43

46

49

52

55

58

61

64

67

70

73

76

79

82

85

88

91

94
La reprsentation de la srie dsaisonnalise montre clairement llimination de leffet
saisonnier. La srie dsaisonnalise fait apparatre quelques irrgularits dues la
composante rsiduelle.
5.8. EXERCICES DAPPLICATION.

5.8.1. Exercice.

Le tableau suivant indique, pour les annes 1995 2005, la production annuelle de crales en
millions de quintaux.

Anne 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
Production 50 36,5 43 44,5 38,9 38,1 32,6 38,7 41,7 41,1 33,8

a) Reprsenter graphiquement la srie brute. Quelle est la nature du trend ?


b) Lisser la srie brute par la mthode des moyennes mobiles dordre 3 puis dordre 5.
Reprsenter graphiquement les deux sries des moyennes mobiles et interprter les graphiques
obtenus.
c) Lisser la srie brute, dans la cas dun modle multiplicatif, par la mthode des moyennes
mobiles dordre 4. Reprsenter graphiquement la srie des moyennes mobiles et interprter.
d) Lisser la srie brute par la mthode exponentielle avec un coefficient de lissage de 0,7 puis
0,1. Reprsenter graphiquement les deux sries lisses et interprter.
e) Dterminer lquation du trend.

Solution : On ne donnera que la rponse la question e


^
Lquation du trend est : yt = - 0,54 t + 42,95.

5.8.2. Exercice.
195
Statistique descriptive 5. Les sries chronologiques

Au cours des deux exercices 2004, 2005, les chiffres daffaires mensuels d'une entreprise de
transports ont t les suivants :

ans jan fv mar avril mai juin juil aot Sept oct nov dc
2004 50 46 64 65 63 70 85 63 59 56 49 56
2005 54 51 69 71 70 78 93 70 65 62 54 61

a) Lisser la srie, selon le modle multiplicatif, par la mthode des moyennes mobiles d'ordre 12.
b) Reprsenter graphiquement la srie lisse. Interprter.
c) Dterminer lquation du trend.

Solution : On ne donnera que la rponse la question c.


^
Lquation du trend est : yt = 0,5 t + 51,6.

5.8.3. Exercice.

Considrons la production trimestrielle, en tonnes, durant 5 annes de lentreprise SATAM.

Annes Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4


1 920 1114 1310 1047
2 953 1241 1468 1183
3 1002 1343 1571 1314
4 1128 1544 1747 1446
5 1257 1589 1911 1465

a) Reprsenter graphiquement la srie brute. Quelle est la nature du trend ? Juger les
fluctuations alatoires et leffet saisonnier.
b) Lisser la srie brute, selon un modle multiplicatif, par la mthode des moyennes mobiles.
Reprsenter graphiquement la srie des moyennes mobiles et interprter.
c) Dterminer lquation du trend.
d) Calculer les coefficients saisonniers.
e) Dsaisonnaliser la srie chronologique. Reprsenter graphiquement la srie dsaisonnalise
et interprter.
f) Calculer les prvisions des ventes trimestrielles pour lanne 6.

Solution : On ne donnera que la rponse la question c, d, et f.


^
c) Lquation du trend est : yt = 31,74 t + 994,36 ;
d) cs 0,8254 1,0424 1,1925 0,9397
f)
Trimestres anne 6 Prvisions

196
Statistique descriptive 5. Les sries chronologiques

1er trimestre 1371


2me trimestre 1765
3me trimestre 2056
4me trimestre 1650

5.8.4. Exercice.

Le tableau ci-dessous indique les ventes mensuelles, en millions de dirhams, pendant les annes
1998 2005, de lentreprise MOTEL :

ans jan fv mars avr mai juin juil aot sept oct nov Dc
1998 12,63 11,72 13,43 12,53 13,29 13,27 12,36 13,27 13,10 13,86 13,39 15,38
1999 11,84 11,74 12,74 13,40 14,85 13,81 13,40 13,45 13,62 14,82 14,01 16,91
2000 13,05 12,33 13,96 14,17 14,66 14,58 14,38 14,18 14,08 14,95 13,96 16,44
2001 12,34 12,06 13,54 14,32 14,25 14,66 14,39 13,90 14,14 14,66 14,53 17,87
2002 13,15 12,64 14,57 15,49 15,33 15,60 15,26 15,48 15,76 15,68 15,75 19,12
2003 13,73 13,55 15,72 14,89 16,11 16,58 15,38 16,19 15,58 16,13 16,49 19,38
2004 14,74 14,06 15,79 16,44 17,20 17,11 16,86 17,49 16,37 16,95 17,13 19,84
2005 15,29 13,78 15,55 16,27 17,36 16,60 16,60 17,00 16,33 17,36 17,04 21,17

a) Reprsenter graphiquement la srie brute. Quelle est la nature du trend ? Juger les
fluctuations alatoires et leffet saisonnier.
b) Lisser la srie brute, selon le modle multiplicatif, par la mthode des moyennes mobiles.
Reprsenter graphiquement la srie des moyennes mobiles et interprter.
c) Dterminer lquation du trend.
d) Calculer les coefficients saisonniers.
e) Dsaisonnaliser la srie chronologique. Reprsenter graphiquement la srie dsaisonnalise
et interprter.
f) Calculer les prvisions des ventes mensuelles pour lanne 2007.

Solution : On ne donnera que la rponse la question c, d, et f.


^
c) Lquation du trend est : yt = 0,04 t + 11,62
d)
cs 0,91 0,86 0,97 0,99 1,03 1,02 0,99 1,00 0,99 1,03 1,01 1,20

f)
Anne 2007 Prvisions
Janvier 14,31

197
Statistique descriptive 5. Les sries chronologiques

Fvrier 13,66
Mars 15,44
Avril 15,71
Mai 16,45
Juin 16,32
Juillet 15,82
Aot 16,12
Septembre 15,88
Octobre 16,61
Novembre 16,29
Dcembre 19,44

5.8.5. Exercice.

L'volution du chiffre d'affaires trimestriel (en milliers de dirhams) d'une entreprise


commerciale a t la suivante, au cours de trois annes conscutives :

Trimestres 2003 2004 2005


1er trimestre 880 810 740
2me trimestre 960 880 800
3me trimestre 1030 950 960
4me trimestre 920 840 760

a) Reprsenter graphiquement la srie brute. Quelle est la nature du trend ? Juger les
fluctuations alatoires et leffet saisonnier.
b) Lisser la srie brute, selon le modle multiplicatif par la mthode des moyennes mobiles
dordre 4. Reprsenter graphiquement la srie des moyennes mobiles et interprter.
c) Dterminer lquation du trend.
d) Calculer les coefficients saisonniers.
e) Dsaisonnaliser la srie chronologique. Reprsenter graphiquement la srie dsaisonnalise
et interprter.
f) Calculer les prvisions des chiffres daffaires trimestriels pour lanne 2008.

Solution : On ne donnera que la rponse la question c, d, et f.


^
c) Lquation du trend est : yt = - 12,83 t + 960,91

d)
Trimestres Cs
1er trimestre 0,9023
2me trimestre 0,9943
198
Statistique descriptive 5. Les sries chronologiques

3me trimestre 1,1261


4me trimestre 0,9773
f)

Trimestres anne 2008 Prvisions


1er trimestre 624
2me trimestre 675
3me trimestre 750
4me trimestre 638

5.8.6. Exercice.

Les ventes quotidiennes dune socit commerciale sont consignes dans le tableau ci-dessous :

Jours Semaine 1 Semaine 2 Semaine 3 Semaine 4


Lundi 43 51 40 64
Mardi 45 41 57 58
Mercredi 22 37 30 33
Jeudi 25 22 33 38
Vendredi 31 25 37 25

a) Reprsenter graphiquement la srie brute. Quelle est la nature du trend ? Juger les
fluctuations alatoires et leffet saisonnier.
b) Lisser la srie brute par la mthode des moyennes mobiles. Reprsenter graphiquement la
srie des moyennes mobiles et interprter.
c) Dterminer lquation du trend.
d) Calculer les coefficients saisonniers.
e) Dsaisonnaliser la srie chronologique. Reprsenter graphiquement la srie dsaisonnalise
et interprter.
f) Calculer les prvisions des ventes pour la cinquime semaine et pour la sixime semaine.

Solution : On ne donnera que la rponse la question c, d, et f.


^
c) Lquation du trend est : yt = 0,85 t + 29,50.

d)
Jours Cs
Lundi 1,3395
Mardi 1,3139
Mercredi 0,8015
Jeudi 0,7217
199
Statistique descriptive 5. Les sries chronologiques

Vendredi 0,8235
f)
Semaines 5 et 6 Prvisions
Lundi 63
Mardi 63
Mercredi 39
Jeudi 36
Vendredi 42
Lundi 69
Mardi 69
Mercredi 43
Jeudi 39
Vendredi 45

5.8.7. Exercice.

Le tableau suivant donne l'volution trimestrielle des exportations par tonne denres pour une
entreprise donne.

Anne Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4


2002 185 155 246 195
2003 315 285 354 312
2004 421 400 478 428
2005 553 520 602 545

a) Dterminer les coefficients saisonniers ;


b) Donner des prvisions des exportations pour les quatre trimestres de lanne 2006.

Solution :
a)
Anne Cs
Trimestre 1 1,1202
Trimestre 2 0,9236
Trimestre 3 1,0854
Trimestre 4 0,8708

b)
Anne 2006 Prvisions
Trimestre 1 692
Trimestre 2 597
Trimestre 3 733
Trimestre 4 613

200
Statistique descriptive 5. Les sries chronologiques

5.8.8. Exercice.

Le tableau ci-dessous indique la quantit mensuelle de marchandises transportes, en tonnes,


pendant les annes 1998 2005.

ans jan fv mars avr mai juin juil aot sept oct nov Dc
1998 3661 2834 2999 3152 3977 3295 3807 3307 3312 4317 3139 2700
1999 3562 2911 2868 2912 3678 2606 2969 3149 3364 4156 3139 2672
2000 3351 2730 2801 2957 3883 3204 3758 3229 3153 4024 2797 2413
2001 2967 2462 2412 2445 3345 2730 3251 2708 2711 3629 2685 2518
2002 2505 2556 3256 2757 3754 3052 3015 3883 3148 3282 3758 2669
2003 2713 2751 3517 2971 3835 3143 2397 3700 3155 3284 3740 2641
2004 2565 2616 3446 2696 3558 2959 2708 3737 2849 2920 3223 2221
2005 2164 2108 2702 2105 2729 2489 2138 3146 2570 2733 2462 2188

a) Reprsenter graphiquement la srie brute. Quelle est la nature du trend ? Juger les
fluctuations alatoires et leffet saisonnier.
b) Lisser la srie brute, selon un modle multiplicatif, par la mthode des moyennes mobiles.
Reprsenter graphiquement la srie des moyennes mobiles et interprter.
c) Dterminer lquation du trend.
d) Calculer les coefficients saisonniers.
e) Dsaisonnaliser la srie chronologique. Reprsenter graphiquement la srie dsaisonnalise
et interprter.
f) Calculer les prvisions pour les annes 2006 et 2007.

Solution : On ne rpondra quaux questions c, d et f.


^
c) Lquation du trend est : y t = - 4,92 t + 3035,97
d)
cs 0,954 0,857 0,987 0,901 1,181 0,968 0,987 1,115 1,004 1,170 1,039 0,833
0 2 7 8 7 1 2 2 2 3 1 6

f)
Annes 2006 Prvisions Annes 2007 Prvisions
Janvier 2006 2441 Janvier 2385
Fvrier 2189 Fvrier 2139
Mars 2518 Mars 2459
Avril 2294 Avril 2241

201
Statistique descriptive 5. Les sries chronologiques

Mai 3000 Mai 2931


Juin 2453 Juin 2396
Juillet 2497 Juillet 2439
Aot 2815 Aot 2749
Septembre 2530 Septembre 2471
Octobre 2943 Octobre 2874
Novembre 2608 Novembre 2546
Dcembre 2088 Dcembre 2039

5.8.9. Exercice.

La srie chronologique dfinie par le tableau ci-aprs reprsente l'volution, de 2002 2005, du
nombre trimestriel de mariages enregistrs dans un pays donn (donnes brutes en milliers).

Trimestres
Annes
1er trimestre 2me trimestre 3me trimestre 4me trimestre
2002 64 82 76 68
2003 60 80 70 66
2004 58 76 66 65
2005 57 73 64 63
a) Dterminer l'quation du Trend linaire ;
b) Dsaisonnaliser la srie brute ;
c) Calculer les prvisions pour lanne 2007.
^
Solution : a) Lquation du trend est : y t = - 0,60 t + 73,08
c)
Anne 2007 Prvisions
Trimestre 1 52
Trimestre 2 68
Trimestre 3 60
Trimestre 4 57

5.8.10. Exercice.

Le tableau suivant donne, pour 15 trimestres conscutifs, les valeurs des deux variables
suivantes :

X : l'indice d'offre d'emploi.


Y : le taux de chmage.

202
Statistique descriptive 5. Les sries chronologiques

Annes Trimestres X Y
1 159 8,40
2 154 8,50
2002
3 161 8,40
4 187 8,16
1 175 7,96
2 186 7,70
2003
3 198 7,13
4 196 7,23
1 204 7,50
2 195 7,70
2004
3 204 7,50
4 210 7,40
1 231 7,30
2 221 7,15
2005
3 241 7,13
4 252 7,11
Etudier les deux sries chronologiques : l'indice d'offre d'emploi et le taux de chmage et
dterminer quels devraient tre l'indice d'offre d'emploi et le taux de chmage pour les 4
trimestres de 2006.
Indice de loffre demploi :
Equation du Trend : y t 5,76 t 149,43
Coefficients saisonniers :
Trimestres CS
Trimestre 1 1,014
1
Trimestre 2 0,969
2
Trimestre 3 0,999
1
Trimestre 4 1,017
6

Prvisions 2006 :

Trimestres Prvisions
Trimestre 1 251
Trimestre 2 245
Trimestre 3 259
Trimestre 4 269

Taux de chmage :

203
Statistique descriptive 5. Les sries chronologiques

Equation du Trend : - 0,09 t + 8,41


Coefficients saisonniers :

Trimestres CS
Trimestre 1 1,003
5
Trimestre 2 1,011
6
Trimestre 3 0,994
7
Trimestre 4 0,990
2

Prvisions 2006 :

Trimestres Prvisions
Trimestre 1 6,9
Trimestre 2 6,9
Trimestre 3 6,7
Trimestre 4 6,5

204
Statistique descriptive 6. Indices statistiques

CHAPITRE 6
INDICES STATISTIQUES

Les indices sont des instruments de mesure de lvolution des grandeurs, ils sont
habituellement exprims en pourcentage.

Un indice est donc destin comparer deux grandeurs ou les valeurs dune mme grandeur
deux moments ou dans deux espaces diffrents. Ces grandeurs peuvent tre soit simples, et
lindice est dit lmentaire ou simple, soit des grandeurs complexes, et lindice est dit
synthtique.

6.1. LES INDICES ELEMENTAIRES.

6.1.1. Dfinition.

Considrons une grandeur simple, G, mesure par un nombre qui caractrise directement
une situation, si nous notons Go la valeur de la grandeur G la date 0, appele date ou priode
de base ou de rfrence et Gt sa valeur la date t, appele date ou priode courante, lindice
lmentaire de la grandeur G la date t, par rapport la date 0 est :

Gt
It / 0 100
G0

Exemple 1 : On considre les prix successifs du Kg de sucre, des dates diffrentes :

Dates 1999 2000 2001 2002


Prix (DH/kg) 4,50 4,65 4,97 5,12

On pourra calculer les indices du prix du sucre, selon les priodes, avec comme date de
rfrence 1999, on a :

Dates 1999 2000 2001 2002


205
Statistique descriptive 6. Indices statistiques

Indices des prix


100 103,33 110,44 113,78
avec 1999 base

Cette faon de faire permet de remplacer la suite des prix du sucre, diffrentes priodes,
par la suite des indices, plus facile manipuler.

Pour mieux comprendre cette affirmation on considre lvolution du prix de la tonne du


fuel domestique sur plusieurs annes :

Exemple 2 : On donne lvolution du prix du fuel domestique entre 1999 et 2005. On


demande de calculer les indices du prix du fuel domestique pour les mmes dates avec comme
date de base 1999.

Dates 1999 2001 2003 2005


Prix (DH/t) 4926,84 5237,77 5876,34 6735,98
Indices des prix
100 106,31 119,27 136,72
avec 1999 base

Ainsi, au lieu de manipuler des prix qui sont des nombres plusieurs chiffres, on se
contente, avec les indices, de ne manipuler que des pourcentages qui sont faciles transcrire
et mmoriser. Do lintrt considrable des indices.
Remarques :

1) Il ne faut jamais oublier quun indice est un pourcentage. Bien quil soit not
conventionnellement, par exemple, 121,67 ou 95,32 il faut avoir, constamment lesprit quen
fait il sagit de 121,67% c'est--dire 1,2167 ou 95,32% c'est--dire 0,9532.

2) Lorsquon manipule des indices et conformment la premire remarque, il faut, selon le


cas, utiliser la notation en pourcentage (121,67% ou 94,32%) ou la notation en dcimale
(1,2167 ou 0,9532).

3) Pour nous rsumer et tre le plus explicite possible, il est important de comprendre et
daccepter les notations suivantes, mme si elles paraissent, premire vue, incorrectes :

- Pour laddition dindices :


121,67 + 95,32 = 216,99 = 216,99% = 2,1699
- Pour la multiplication dindices :
121,67 x 95,32 = 115,98 = 115,98% = 1,1598

6.1.2. Proprits des indices lmentaires.

206
Statistique descriptive 6. Indices statistiques

6.1.2.1. Dimension dun indice.

Un indice na pas de dimension du fait que, par dfinition, il est le rapport dune mme
grandeur deux dates diffrentes ou dans deux endroits diffrents.

6.1.2.2. Indicateur de lvolution de la grandeur.

Un indice simple est un indicateur du sens de lvolution de la grandeur laquelle il est


rattach, en effet

- si I > 100 la grandeur a accus une augmentation ;


- si I = 100 la grandeur na pas vari ;
- si I < 100 la grandeur a accus une diminution.

6.1.2.3. Proprit didentit.

La proprit didentit sexprime par la relation simple suivante :


G0
Io/o = 100 100 %
G0
6.1.2.4. Proprit de rversibilit.

La proprit de rversibilit sexprime par la relation :


1
I0 / t
It /0
En effet, on a : I0 / t G 0 1 1
G t G t It / 0
G0
6.1.2.5. Proprit de circularit.

La proprit de circularit sexprime par la relation suivante :

I t / 0 I t / t ' I t '/ 0
En effet, on a :

G t G t G t'
It /0 I t / t ' I t '/ 0
G 0 G t' G 0

Cette proprit de circularit est essentielle pour les indices simples car elle permet :

- de changer de date de base, cest--dire de date de rfrence ;


207
Statistique descriptive 6. Indices statistiques

- de comparer des indices ayant une mme date de base ;


- de comparer des indices ayant des dates de base diffrentes ;
- de calculer lindice simple moyen entre deux priodes.

6.1.2.5.1. Changement de date de base.

Le changement de date de rfrence est une opration courante dans la manipulation des
indices, nous en donnerons plusieurs exemples dans les paragraphes suivants.

Pour le moment nous allons expliquer, par un exemple simple, comment procder.

Exemple 3 : On considre les indices du prix du sucre de lexemple 1 et lon voudrait prendre
comme date de rfrence 2000 au lieu de 1999.

Rappelons le tableau de lexemple 1.

Dates 1999 2000 2001 2002


Indices des prix
100 103,33 110,44 113,78
avec 1999 base

Pour changer la date de base, nous utilisons la proprit de circularit des indices simples et
nous essayons de calculer lindice des prix du sucre avec comme date de base 2000 partir des
indices du prix du sucre ayant comme date de base 1999.
Gt
Gt Gt G G I
I t / 2000 1999 1999 t / 1999
G 2000 G 1999 G 2000 G 2000 I 2000 / 1999
G 1999
Nous pouvons alors dresser le tableau des indices du prix du sucre, avec comme base de
rfrence 2000, partir du tableau des indices du prix ayant comme base 1999.

Dates 1999 2000 2001 2002


Indices des prix
100 103,33 110,44 113,78
avec 1999 base
Indices des prix
96,78 100 106,88 110,11
avec 2000 base

6.1.2.5.2. Comparaison de deux indices ayant mme date de base.

La proprit de circularit permet aussi de comparer deux indices, ayant les mmes dates de
base, en effet considrons lexemple suivant :

208
Statistique descriptive 6. Indices statistiques

Exemple 4 : On considre deux indices relatifs deux grandeurs diffrentes, ayant la mme
date de rfrence 2001 et ayant les valeurs suivantes ; on demande lequel des 2 indices a
augment le plus entre 2003 et 2006.

Dates 2003 2006


Indice I1 ayant 2001 comme base 124 145
Indice I2 ayant 2001 comme base 117 137

Pour faire une telle comparaison, il est ncessaire de changer de base de rfrence et de
prendre comme nouvelle base, 2003. Le tableau prcdant devient dans ce cas :

Dates 2003 2006


Indice I1 ayant 2003 comme base 100 116,94
Indice I2 ayant 2003 comme base 100 117,09

Pour calculer la valeur des indices, en 2006, on utilise la proprit de circularit des indices,
savoir :

I 2006 / 2001
I2006/2003 =
I 2003 / 2001

On voit sur ce nouveau tableau que le deuxime indice a augment plus que le premier.

6.1.2.5.3. Comparaison de deux indices ayant des dates de base diffrentes.

La proprit de circularit permet aussi de comparer deux indices, ayant des dates de base
diffrentes, en effet considrons lexemple suivant :

Exemple 5 : On considre les indices des quantits consommes dorge et de bl, I o et Ib et


on demande laquelle de ces quantits a subi la plus forte augmentation, entre 2000 et 2004,
sachant que les indices Io et Ib qui ont des dates de base diffrentes ont les valeurs suivantes :

Dates 2000 2004


Quantits dorge consommes en Kg 2 345 965,00 2 607 070,90
Indice Io ayant 1998 comme base 124,87 138,77
Quantits de bl consommes en Kg 1 634 961,00 1 729 461,75
Indice Ib ayant 1997 comme base 132,65 140,32
Afin de faire une telle comparaison, il est ncessaire de changer, pour les 2 indices, les dates
de base de rfrence et de prendre comme nouvelle base, 2000. Le tableau prcdent devient
dans ce cas :

Dates 2000 2004

209
Statistique descriptive 6. Indices statistiques

Quantits dorge consommes en Kg 2 345 965,00 2 607 070,90


Indice Io ayant 2000 comme base 100 111,13
Quantits de bl consommes en Kg 1 634 961,00 1 729 461,75
Indice Ib ayant 2000 comme base 100 105,78

Pour calculer la valeur des indices, en 2004 avec 2000 comme date de rfrence, on utilise
la proprit de circularit des indices, savoir :

I 2004 / 1998 I 2004 / 1997


Io2004/2000 = et Ib2004/2000 =
I 2000 / 1998 I 2000 / 1997

On voit, sur ce nouveau tableau, que le premier indice a augment plus que le deuxime ;
c'est--dire quentre 2000 et 2004, la quantit consomme dorge a augment, en pourcentage,
plus que celle du bl.

6.1.2.5.4. Dtermination de lindice simple moyen.

La dtermination dun indice simple moyen est ncessaire lorsque des donnes relatives
certaines priodes sont manquantes.

Exemple 6 : En effet prenons lexemple 2 relatif aux indices du prix du fuel domestique.

Dates 1999 2001 2003 2005


Prix (DH/t) 4926,84 5237,77 5876,34 6735,98
Indices des prix
100 106,31 119,27 136,72
avec 1999 base

Dans cet exemple, les indices de prix relatifs aux annes 2000, 2002 et 2004 manquent ; la
question qui se pose est la suivante : Comment dterminer les indices de prix des annes 2000,
2002 et 2004 ?

Pour ce faire, nous devons faire une hypothse vraisemblable ; elle consiste supposer
quentre 1999 et 2001, le prix du fuel domestique a augment rgulirement, cest--dire quil a
subi le mme taux daugmentation entre 2000 et 2001 quentre 1999 et 2000.

Soit t ce taux moyen daugmentation annuel du prix du fuel domestique entre 2000 et 2001
puis entre 1999 et 2000.

On a, si lon se rappelle quun indice de prix est justement le taux de variation du prix entre
deux priodes et quil est donn en pourcentage :

I2001/1999 = I2001/2000 x I2000/1999 = t

210
Statistique descriptive 6. Indices statistiques

On a suppos que I2001/2000 = I2000/1999 = t

106,31% = 1,0631 = t => t = 1,03107 = 103,11%

Le taux de variation du prix du fuel, entre 1999 et 2000 qui est suppos gal au taux de
variation du prix entre 2000 et 2001 est gal 103,11%.

6.2. LES INDICES SYNTHETIQUES.

Nous navons considr, dans le paragraphe prcdent, pour tudier les indices simples, que
le cas simple et particulier de grandeurs simples, comme prix, quantits, etc. Or habituellement,
dans la vie courante des affaires, on est amen considrer, en mme temps, plusieurs
grandeurs et essayer de discuter de la variation de lensemble de ces grandeurs.

Considrons alors n grandeurs simples notes Gi (avec i = 1,., n) et posons Gi0 (toujours
avec i = 1,., n) les valeurs des grandeurs simples pour les diffrentes grandeurs i releves la
date 0 et Git les valeurs des mmes grandeurs simples i relevs la date t. Pour tudier
lvolution de lensemble des grandeurs Gi, nous avons besoin de dfinir des indices globaux
ou synthtiques.

Ces grandeurs peuvent tre des prix Pi, des quantits Qi, des valeurs globales QiPi, etc. Elles
ont donc toutes la mme dimension (Kg, m, m3, l, DH, etc.).

On peut dfinir plusieurs types dindices moyens synthtiques relatifs lensemble des
grandeurs i observes aux dates 0 et t :

- un indice des moyennes ;


- un indice moyenne des indices

6.2.1. Indice synthtique des moyennes.

6.2.1.1. Dfinition.

Lexpression de lindice des moyennes est donne, par dfinition, par la formule suivante :

G it n
i 1

n
G it
It /0 n
i 1
n

G
i 1
i0 G
i 1
i0

n
211
Statistique descriptive 6. Indices statistiques

Par un tel indice des moyennes des grandeurs entre linstant t et la date de rfrence, on
estime donner une image de lvolution de lensemble des grandeurs Gi.

6.2.1.2. Proprits de lindice des moyennes.

Lindice synthtique simple des moyennes possde la proprit :

- de rversibilit ;
- de circularit.

Nous pouvons montrer cela dans les exemples 7 et 8 suivants.

Exemple 7 : Proprit de rversibilit de lindice des moyennes : Reprenons lexemple 5


relatif aux quantits consommes dorge et de bl entre 1998 et 2004 et posons-nous la
question suivante : Comment valuer lvolution des quantits consommes de crales entre
1998 et 2004 ?

Rappelons le tableau qui nous a servi pour les calculs de lexemple 5.

Dates 2000 2004


Quantits dorge consommes en Kg 2 345 965,00 2 607 070,90
Indice Io ayant 2000 comme base 100 111,13
Quantits de bl consommes en Kg 1 634 961,00 1 729 461,75
Indice Ib ayant 2000 comme base 100 105,78

Calculons, pour ce cas, lindice des moyennes.

Dates 2000 2004


Quantits dorge consommes en Kg 2 345 965,00 2 607 070,90
Quantits de bl consommes en Kg 1 634 961,00 1 729 461,75
Sommes des quantits 3 980 926,00 4 336 532,65
I2004 / 2000
100 x 4 336 532,65 / 3 980 926,00 = 108,93
(moyenne des quantits)
I2000 / 2004
100 x 3 980 926,00 / 4 336 532,65 = 91,80
(moyenne des quantits)

On a bien (1/1,0893) = 0,9180

On peut montrer, dune faon gnrale, que lindice synthtique simple des moyennes est
rversible, en effet, cet indice se calcule comme suit :

212
Statistique descriptive 6. Indices statistiques

G
i 1
i 2000
1
I2000 / 2004 = n
=
G
I 2004 / 2000
i 2004
i 1

Exemple 8 : Proprit de circularit de lindice des moyennes : Reprenons donc


lexemple 5 relatif aux quantits consommes dorge et de bl, pour 2000, 2004 et 2006 et
calculons les diffrents indices synthtiques simples.

Rappelons le tableau qui nous a servi pour les calculs de lexemple 7.

Indice des moyennes :

Dates 2000 2004 2006


Quantits dorge consommes
2 345 965,00 2 607 070,90 2 876 554,12
en Kg
Quantits de bl consommes
1 634 961,00 1 729 461,75 2 347 885,23
en Kg
Sommes des quantits 3 980 926,00 4 336 532,65 5 224 439,35
I2006 / 2000 5 224 439,35 / 3 980 926,00
(moyenne des quantits) = 131,24
I2006 / 2004 5 224 439,35 / 4 336 532,65
---
(moyenne des quantits) = 120,48
4 336 532,65 /
I2004 / 2000
3 980 926,00 ---
(moyenne des quantits)
= 108,93

0n voit bien que : I2006 / 2004 x I2004 / 2000 = 1,2048 x 1,0893


= 131,24
Et que : I2006 / 2000 = 131,24

Ce qui fait : I2006 / 2000 = I2006 / 2004 x I2004 / 2000

Lindice synthtique simple des moyennes des grandeurs possde la proprit de circularit.

On peut montrer, dune faon gnrale, que lindice synthtique simple des moyennes
possde la proprit de circularit, en effet, cet indice se calcule comme suit :

213
Statistique descriptive 6. Indices statistiques

n n n

G
i 1
i 2006 G
i 1
i 2006 G
i 1
i 2004

I2006 / 2000 = n
n
n

G i 2000
i 1
G i 2004
i 1
G
i 1
i 2000

= I2006 / 2004 x I2004 / 2000

6.2.2. Indice synthtique moyenne des indices.

6.2.2.1. Dfinition.

Lexpression de lindice synthtique moyenne des indices est donne, par dfinition, par la
formule suivante :
n

1 n G
I i t/0

it
i 1
It /0
n i 1 G i 0 n

Par un tel indice moyenne des indices des grandeurs Gi entre linstant t et la date de
rfrence, on estime donner une image de lvolution de lensemble des grandeurs G i.

6.2.2.2. Proprits de lindice synthtique moyenne des indices.

Lindice synthtique moyenne des indices ne possde :

- ni la proprit de rversibilit ;
- ni la proprit de circularit.

Nous pouvons montrer cela dans les exemples suivants.

Exemple 9 : Reprenons lexemple 5 relatif aux quantits consommes dorge et de bl entre


2000 et 2004 et posons-nous la question suivante : Comment valuer lvolution des quantits
consommes de crales entre 2000 et 2004.

Rappelons le tableau qui nous a servi pour les calculs de lexemple 5.


Dates 2000 2004
Quantits dorge consommes en Kg 2 345 965,00 2 607 070,90
Indice Io ayant 2000 comme base 100 111,13
Quantits de bl consommes en Kg 1 634 961,00 1 729 461,75
Indice Ib ayant 2000 comme base 100 105,78

Calculons, pour ce cas, lindice moyenne des indices.


214
Statistique descriptive 6. Indices statistiques

Dates 2000 2004


Indice Io ayant 2000 comme base 100 111,13
Indice Ib ayant 2000 comme base 100 105,78
Sommes des indices 200 216,91
I2004 / 2000 (moyenne des indices) 216,91 / 2 = 108,46

Pour le calcul de lindice synthtique moyenne des indices I2000 / 2004 , nous devons, dabord,
reprendre le tableau ci-dessus et calculer les indices simples avec 2004 comme date de
rfrence :

Dates 2000 2004


Indice Io ayant 2004 comme base 89,98 100
Indice Ib ayant 2004 comme base 94,54 100
Sommes des indices 184,52 200
I2000 / 2004 (moyenne des indices) 184,52 / 2 = 92,26

Lindice synthtique moyenne des indices nest donc pas rversible.

On peut aussi montrer, dune faon gnrale, que lindice synthtique moyenne des indices
nest pas rversible, en effet, cet indice se calcule comme suit :
n n

Ii t / 0
i 1
I
i 1
i 0/ t

It /0 et I0 / t
n n
Ces deux expressions sont trs diffrentes puisque si lon a bien
n n
1
Ii t / 0
Ii 0 / t
on a, en gnral, Ii t / 0
i 1
I
i 1
i 0/ t

Pour montrer que lindice synthtique moyenne des indices ne possde pas la proprit de
circularit, nous conservons lexemple prcdent en y ajoutant les donnes de lanne 2006.

Exemple 10 : Reprenons donc lexemple 5 relatif aux quantits consommes dorge et de


bl, pour 2000, 2004 et 2006 et calculons les diffrents indices synthtiques simples.

Rappelons le tableau qui nous a servi pour les calculs de lexemple 7.

Dates 2000 2004 2006


Indice Io ayant 2000 comme
100 111,13 122,62
base
Indice Ib ayant 2000 comme
100 105,78 143,60
base
Sommes des indices 200 216,91 266,22
215
Statistique descriptive 6. Indices statistiques

I2006 / 2000 (122,62 + 143,60) / 2


(moyenne des indices) = 133,11
I2006 / 2004 (110,34 + 135,75) / 2
---
(moyenne des indices) = 123,05 (1)
I2004 / 2000 (111,13 + 105,78) / 2
---
(moyenne des indices) = 108,46

Pour le calcul de I2006 / 2004 indice moyenne des indices, pour lanne 2006, avec comme date
de rfrence 2004, nous devons changer de dates de base des indices du tableau, et prendre
lanne 2004 comme date de rfrence :

Dates 2000 2004 2006


Indice Io ayant 2004 comme
89,98 100 110,34
base
Indice Ib ayant 2004 comme
94,54 100 135,75
base
I2006 / 2004 (110,34 + 135,75) / 2
---
(moyenne des indices) = 123,05

0n voit bien que : I2006 / 2004 x I2004 / 2000 = 1,2305 x 1,0846


= 1,3346
Et que : I2006 / 2000 = 1,3311

Ce qui fait : I2006 / 2000 I2006 / 2004 x I2004 / 2000


Lindice synthtique moyenne des indices ne possde donc pas la proprit de circularit.

Mais de tels indices, quoique synthtiques, restent simples. On leur prfre dautres indices
plus explicites. Ce sont les indices synthtiques pondrs.

6.3. LES INDICES SYNTHETIQUES PONDERES.

Si les grandeurs simples Gi sont de mme nature (mme unit) mais n'ont pas la mme
importance, on associe chaque grandeur Gi un poids diffrent. Si lon note i le coefficient de
pondration affect la grandeur Gi, la formule retenue pour le calcul de l'indice synthtique
devient :

6.3.1. Indice synthtique pondr des moyennes.

216
Statistique descriptive 6. Indices statistiques

n
i G it
It /0 i 1
n
i G i0
i 1

6.3.2. Indice synthtique pondr des moyennes des indices.

n G it
i ( )
i 1 G i0
It /0 n
i
i 1

Nous verrons, dans la suite du cours, que le problme le plus important qui se pose au
statisticien est justement la pertinence du choix des coefficients de pondration i .

6.4. LES PRINCIPAUX INDICES SYNTHETIQUES.

Les indices synthtiques les plus couramment utiliss sont les indices de LASPEYRES et de
PAASCHE.

6.4.1. Indice de LASPEYRES.

Lindice de LASPEYRES adopte des coefficients de pondration de la priode de base, soit


i0, il est gal la moyenne arithmtique des indices lmentaires, pondrs par les coefficients
de la priode de rfrence. Sa formule est donc :

Pour lindice de LASPEYRES, moyenne pondre des grandeurs :


n
i 0 G it
i 1
Lt /0 n
i0 G i0
i 1
Pour lindice de LASPEYRES, moyenne pondre des indices :
n G it
i0 ( )
i 1 G i0
Lt /0 n
i0
i 1
REMARQUE.

217
Statistique descriptive 6. Indices statistiques

Le choix des coefficients de pondration, pour les indices LASPEYRES, ceux relatifs la
priode 0, fait que les indices de LASPEYRES ne sont reprsentatifs de la ralit que dans la
mesure o les valeurs des coefficients de pondration restent stables, avec le temps, ou varient
dans les mmes proportions ou varient trs peu. Cela nous permet de comparer des indices
des dates t1 et t2 diffrentes, bien que les indices de LASPEYRES ne possdent pas la proprit
de circularit.

Dans le cas o les coefficients de pondration varient significativement beaucoup, on est en


droit de parler de dure de vie dun indice, c'est--dire le temps au bout duquel les coefficients
de pondration ont tellement vari au point que la situation, linstant t, soit trs diffrente par
rapport linstant zro.

On effectue, ce moment l, pour les indices de LASPEYRES, un changement de date de


rfrence pour prendre comme nouvelle base, la date laquelle les coefficients de pondration
ont beaucoup vari, cest--dire, lexpiration de la dure de vie de lindice.

Mais se pose alors la question de circularit des indices de LASPEYRES pour pouvoir
relier les indices ayant diffrentes dates de rfrence. Et, traditionnellement, bien que lon
sache pertinemment que les indices LASPEYRE ne possdent pas la proprit de circularit,
nous faisons comme sils la possdaient parce que nous ne pouvons pas faire autrement.

6.4.2. Indice de PAASCHE.

Lindice de PAASCHE adopte des coefficients de pondration de la priode courante, soit


it, il est gal la moyenne harmonique des indices lmentaires, pondrs par les coefficients
de la priode courante. Sa formule est donc :

Pour lindice de PAASCHE, moyenne pondre des grandeurs :


n
it G it
i 1
Pt / 0 n
it G i 0
i 1

Pour lindice de PAASCHE, moyenne pondre des indices :


n

it
Pt / 0 n
i 1
Gi0

i 1
it (
G it
)

Remarque.

218
Statistique descriptive 6. Indices statistiques

Le choix des coefficients de pondration, pour les indices PAASCHE, ceux relatifs la
priode t, fait que les indices de PAASCHE ne sont reprsentatifs de la ralit que dans la
mesure o les valeurs des coefficients de pondration de linstant t soient les mmes que ceux
des priodes antrieures.

Dans le cas contraire, on est en droit de parler de dure de vie dun indice, c'est--dire le
temps en de duquel les coefficients de pondration sont tellement diffrents par rapport
ceux de la priode t que la situation ce moment l ne soit pas traduite assez fidlement par des
coefficients de la priode t.

On pourrait alors effectuer, ce moment l, pour les indices de PAASCHE, un changement


de date de rfrence pour prendre comme nouvelle base, la date laquelle les coefficients de
pondration sont trs diffrents par rapport ceux de la priode t.

Mais se pose alors la question de circularit des indices de PAASCHE pour pouvoir relier
les indices ayant diffrentes dates de rfrence. Et, traditionnellement, bien que lon sache
pertinemment que les indices PAASCHE ne possdent pas la proprit de circularit, nous
faisons comme sils la possdaient parce que nous ne pouvons pas faire autrement.

6.4.3. Relation entre indice de LASPEYRES et indice de PAASCHE.

Les indices de LASPEYRES et de PAASCHE ne satisfont ni la condition de rversibilit, ni


celle de circularit, ils ont la proprit de schanger lun contre lautre lorsquon permute la
date de rfrence et la date courante. En effet :
n G i0
it ( )
i 1 G it 1
L0/ t n

Pt / 0
it
i 1
n
i0 1
P0 / t i 1

n G it Lt /0
i0 ( )
i 1 G i0
6.4.4. Indice de FISCHER.

Lindice de FISCHER est la moyenne gomtrique des deux indices de PAASCHE et de


LASPEYRES, soit :
Ft / 0 L t / 0 Pt / 0

219
Statistique descriptive 6. Indices statistiques

1 1
F0 / t L 0 / t P0 / t
L t / 0 Pt / 0
1 1
F0 / t
L t / 0 Pt / 0 Ft / 0

Lindice de FISCHER possde, de ce fait, la proprit de rversibilit mais il ne possde


pas celle de la circularit puisque ni les indices de LASPEYRES ni ceux de PAASCHE ne la
possdent.

6.5. LINDICE DES PRIX A LA CONSOMMATION.

Encore appel indice des prix de dtail ou indice du cot de la vie, lindice des prix la
consommation est calcul partir des prix dun ensemble darticles spcifiques reprsentant les
produits de consommation et les services essentiels (le panier de la mnagre). Il est utilis
pour mesurer les variations, dans le temps, des prix pays pour ces produits et services par un
mnage type et sert de mesure la plus courante linflation.

La composition de lindice des prix la consommation est gnralement dfini la suite


dtudes gouvernementales sur les dpenses de mnages types. Les composantes sont
pondres en fonction de leur poids respectif dans ces dpenses.

Considrons les dpenses du mnage aux dates 0 et t. Soient pi le prix du produit i et qi la


quantit achete.

A la date 0 les dpenses du mnage en produit i sont :

di0 = pi0 qi0

La dpense totale la date 0 est donc :

n
d 0 p i0 q i0
i 1

A la date t les dpenses du mnage en produit i sont :

dit = pit qit

La dpense totale la date t est donc :

220
Statistique descriptive 6. Indices statistiques

n
d t p it q it
i 1

A la date t, les prix et les quantits ont vari. On peut calculer pour chaque produit :

Indices lmentaires de prix du produit i :


p it
I pi t / 0
p i0
Indices lmentaires de quantit du produit i :
q it
I qi t / 0
q i0
Indices lmentaires de dpenses du produit i :
p it q it
I di t / 0 D it / 0 I qi t / 0 I pi t / 0
p i0 q i0

On affecte chaque indice lmentaire i un coefficient de pondration qui exprime la part


du produit i dans les dpenses totales du mnage, cette part est gale :

p i0 q i0
A la date 0, i0 n

p
i 1
i0 q i0

p it q it
A la date t, it n

p q
i 1
it it

La somme des coefficients de pondration tant gale 1 :

n n
Car : i 0 it 1
i 1 i 1

On peut ds lors crire les indices de LASPEYRES et de PAASCHE des prix et des
quantits.

6.5.1. Indices de prix.

Indice LASPEYRES de prix :


221
Statistique descriptive 6. Indices statistiques

n n
p it p q p
L pt / 0 i0 ( ) n i 0 i 0 ( it )
p i0 q i0 i0
i 1 p i0 i 1 p
i 1
n

p it q i0
Soit : L pt / 0 i 1
n

p
i 1
i0 q i0
Indice PAASCHE de prix :

1 1
Pp t / 0 n
n
p i0 p it q it p i0
it ( ) n
( )
p
i 1 p it i 1 p it
it q it
i 1
n
p it q it
i 1
Soit : Pp t / 0 n
p i 0 q it
i 1

6.5.2. Indices de quantits.

Indice LASPEYRES de quantits :

n n
q it p q q
L qt / 0 i0 ( ) n i 0 i 0 ( it )
p i0 q i0 i0
i 1 q i0 i 1 q
i 1
n

q p it i 0
Soit : Lq t / 0 i 1
n

q
i 1
i0 i0p

Indice PAASCHE de quantits :

222
Statistique descriptive 6. Indices statistiques

1 1
Pq t / 0 n
n
q i0 p it q it q i0
it ( ) n
( )
p
i 1 q it i 1 q it
it q it
i 1
n

q it p it
Soit : Pq t / 0 i 1
n

q
i 1
i0 p it

Exemple 11 : Considrons un mnage dont la consommation de 5 produits et/ou services,


au cours des 3 dernires annes, a volu comme le montre le tableau synthtique suivant :

Priode 1 Priode 2 Priode 3


N Quantit Prix Quantit Prix Quantit Prix
q1 p1 q2 p2 q3 p3
1 2,5 10,45 3,2 10,65 4,4 11,32
2 5,9 43,87 6,8 43,88 6,7 43,90
3 4,8 120,78 5,7 121,76 6,1 135,99
4 1,2 156,98 1,6 166,87 1,7 178,91
5 0,5 548,67 0,7 650,88 0,8 700,76

On demande de calculer, pour le cas de ce mnage, les indices prix et les indices quantits
de LASPEYRES relatifs aux 3 dernires annes.

On demande aussi dvaluer, pour chaque type dindice, lordre de grandeur de lerreur
quon commet en appliquant injustement la proprit de circularit aux indices de
LASPEYRES.

Il sagit, en fait, dun cas trs particulier de calcul de lindice du cot de la vie.

a) Calculons les indices de prix de LASPEYRES, pour ce faire, on dresse le tableau de


calculs suivant :

N pi1qi1 pi2qi1 pi3qi1 pi2qi2 pi3qi2


1 26,13 26,63 28,30 34,08 36,22
2 258,83 258,89 259,01 298,38 298,52
3 579,74 584,45 652,75 694,03 775,14
4 188,38 200,24 214,69 266,99 286,26
5 274,34 325,44 350,38 455,62 490,53

223
Statistique descriptive 6. Indices statistiques

1327,41 1395,65 1505,13 1749,10 1886,68


Lp2/1 1,0514 --- --- ---
Lp3/1 1,1339 --- ---
Lp3/2 1,0787

Nous pouvons alors calculer lerreur quon commet en appliquant, injustement, la proprit
de circularit lindice de prix de LASPEYRES, en effet :
Lp3/2 x Lp2/1 = 1,0787 x 1,0514 = 1,1341 or Lp3/1 = 1,1339
L p3/2 L p 2 / 1 L p 3 / 1 1,1341 1,1339
0,0002 0,02%
L p3 / 1 1,1339
On voit bien que lerreur est minime puisquelle est peine gale 0,02%.

b) Calculons maintenant les indices de quantits de LASPEYRES, pour ce faire, on dresse


le tableau de calculs suivant :

N qi1pi1 qi2pi1 qi3pi1 qi2pi2 qi3pi2


1 26,13 33,44 45,98 34,08 46,86
2 258,83 298,32 293,93 298,384 293,996
3 579,74 688,45 736,76 694,032 742,736
4 188,38 251,17 266,87 266,992 283,679
5 274,34 384,07 438,94 455,616 520,704
1327,41 1655,44 1782,47 1749,104 1887,975
Lq2/1 1,2471 --- --- ---
Lq3/1 1,3428 --- ---
Lq3/2 1,0794

Nous pouvons alors calculer lerreur quon commet en appliquant, injustement, la proprit
de circularit lindice de quantit de LASPEYRES, en effet :

Lq3/2 x Lq2/1 = 1,0794 x 1,2471 = 1,3461 or L3/1 = 1,3428

L q3/2 L q 2 / 1 L q 3 / 1 1,3461 1,3428


0,25%
L q3 /1 1,3428
On voit bien que lerreur est minime puisquelle est peine gale 0,25%.

Exemple 12 : Reprenons les donnes de lexemple 11, On demande de calculer, pour le cas
de ce mnage, les indices prix et les indices quantits de PAASCHE relatifs aux 3 dernires
annes.

224
Statistique descriptive 6. Indices statistiques

On demande aussi dvaluer, pour chaque type dindice, lordre de grandeur de lerreur
quon commet en appliquant injustement la proprit de circularit aux indices de PAASCHE.

a) Calculons les indices de prix de PAASCHE, pour ce faire, on dresse le tableau de calculs
suivant :

N pi1qi2 pi2qi2 pi1qi3 pi3qi3 pi2qi3


1 33,4 34,08 45,98 49,81 46,86
2 298,3 298,38 293,93 294,13 293,996
3 688,4 694,03 736,76 829,54 742,736
4 251,2 266,99 266,87 304,15 283,679
5 384,1 455,62 438,94 560,61 520,704
1655,4 1749,10 1782,47 2038,23 1887,98
Pp2/1 1,0566 --- ---
Pp3/1 1,1435 ---
Pp3/2 1,0796

Nous pouvons alors calculer lerreur quon commet en appliquant, injustement, la proprit
de circularit lindice de prix de PAASCHE, en effet :

Pp3/2 x Pp2/1 = 1,0796 x 1,0566 = 1,1407 or Pp3/1 = 1,1435

Pp3/2 Pp2 /1 Pp3/1 1,1407 1,1435


0,0025 0,25%
Pp3/1 1,1435

On voit bien que lerreur est minime puisquelle est peine gale 0,25%.

b) Calculons les indices de quantits de PAASCHE, pour ce faire, on dresse le tableau de


calculs suivant :

N qi1pi2 qi2pi2 qi1pi3 qi3pi3 qi2pi3


1 26,63 34,08 28,30 49,81 36,22
2 258,89 298,38 259,01 294,13 298,52
3 584,45 694,03 652,75 829,54 775,14
4 200,24 266,99 214,69 304,15 286,26
5 325,44 455,62 350,38 560,61 490,53
1395,6 1749,10 1505,13 2038,23 1886,68
Pq2/1 1,2533 --- --- ---
Pq3/1 1,3542 ---

225
Statistique descriptive 6. Indices statistiques

Pq3/2 1,0803

Nous pouvons alors calculer lerreur quon commet en appliquant, injustement, la proprit
de circularit lindice de quantit de PAASCHE, en effet :
Pq3/2 x Pq2/1 = 1,0803 x 1,2503 = 1,3507 or Pq3/1 = 1,3542
Pq3/2 Pq 2 / 1 Pq 3 / 1 1,3507 1,3542
0,26%
Pq 3 / 1 1,3542
On voit bien que lerreur est minime puisquelle est peine gale 0,26%.

Exemple 13 : Reprenons les donnes de lexemple 11, On demande de calculer, pour le cas
de ce mnage, les indices prix et les indices quantits de FISCHER relatifs aux 3 dernires
annes.

On demande aussi dvaluer, pour chaque type dindice, lordre de grandeur de lerreur
quon commet en appliquant injustement la proprit de circularit aux indices de FISCHER.

a) Calculons les indices de prix de FISCHER, pour ce faire, on dresse le tableau de calculs
suivant :

Lp2/1 Pp2/1 Lp3/1 Pp3/1 Lp3/2 Pp3/2


1,0514 1,0566 1,1339 1,1435 1,0787 1,0796
Fp2/1 Fp3/1 Fp3/2
1,0540 1,1387 1,0791

Nous pouvons alors calculer lerreur quon commet en appliquant, injustement, la proprit
de circularit lindice des prix de FISCHER, en effet :

Fp3/2 x Fp2/1 = 1,0791 x 1,0540 = 1,1374 or Fp3/1 = 1,1387


Fp3/2 Fp 2 / 1 Fp 3 / 1 1,1374 1,1387
0,0011 0,11%
Fp 3 / 1 1,1387
On voit bien que lerreur est minime puisquelle est peine gale 0,11%.

b) Calculons les indices de quantit de FISCHER, pour ce faire, on dresse le tableau de


calculs suivant :

Lq2/1 Pq2/1 Lq3/1 Pq3/1 Lq3/2 Pq3/2


1,2471 1,2533 1,3428 1,3542 1,0794 1,0803
Fq2/1 Fq3/1 Fq3/2
1,2502 1,3485 1,0798

226
Statistique descriptive 6. Indices statistiques

Nous pouvons alors calculer lerreur quon commet en appliquant, injustement, la proprit
de circularit lindice des quantits de FISCHER, en effet :

Fq3/2 x Fq2/1 = 1,0798 x 1,2502 = 1,3500 or Fq3/1 = 1,3485


Fq3/2 Fq 2 / 1 Fq 3 / 1 1,3500 1,3485
0,11%
Fq 3 / 1 1,3485

On voit bien que lerreur est minime puisquelle est peine 0,11%.

On voit bien sur cet exemple que tant pour lindice prix que pour lindice quantit de
FISCHER, lapplication de la proprit de circularit induit de faibles erreurs.

6.5.3. Indice des valeurs globales.

Les indices synthtiques de prix et de quantits de LASPEYRES et de PAASCHE, peuvent


tre combins deux deux pour retrouver lindice des dpenses totales ou indice des
valeurs globales.

Cet indice des dpenses totales est le rapport des valeurs globales aux prix et quantits de la
priode t sur les valeurs globales aux prix et quantits de la priode 0.

Il est gal, par dfinition :


n

p it q it
Dt /0 i 1
n

p
i 1
i0 q i0

Nous pouvons calculer cet indice en fonction des indices de prix et de quantits de
LASPEYRES et de PAASCHE.

n
En effet multiplions le numrateur et le dnominateur de Dt/0 par p
i 1
it q i0 :
n n n n

p it q it p it q i0 p it q i0 p it q it
Dt /0 i 1
n
i 1
n
i 1
n
i 1
n

p
i 1
i0 q i0 p
i 1
it q i0 p
i 1
i0 q i0 p
i 1
it q i0

Ce qui donne : Dt/0 = Lp t/0 x Pq t/ 0

227
Statistique descriptive 6. Indices statistiques

n
De mme, on aurait pu multiplier le numrateur et le dnominateur de Dt/0 par p
i 1
q :
i0 it

n n n n

p q p q q
it it i0 it it pi0 p q it it

Dt / 0 i 1
n i 1
n i 1
n i 1
n

p q p q q
i 1
i0 i0
i 1
i0 it
i 1
i0 pi0 p q
i 1
i0 it

Ce qui donne : Dt/0 = Lq t/0 x Pp t/ 0

Les deux galits quon vient dtablir entre 3 indices, savoir, ceux de LASPEYRES, de
PAASCHE et des valeurs globales, permettent de calculer lun des 3 indices si lon connat les
deux autres.

Lindice des valeurs globales possde la proprit de circularit :

Dt/t x Dt/0 = Dt/0

En effet on a :

n n n

p it q it
i 1
p it ' q it '
i 1
p i 1
it q it
Dt/t x Dt/0 = n
n
n
= Dt/0
p
i 1
it ' q it ' p
i 1
i0 q i0 p
i 1
i0 q i0

Exemple 14 : Reprenons les donnes de lexemple 11, On demande de calculer, pour le cas
de ce mnage, lindice des valeurs globales relatif aux 3 dernires annes.

Calculons les indices de valeurs globales, pour ce faire, on utilisera lune des deux formules
quon vient dtablir comme indiqu dans le tableau de calculs suivant :

Lp2/1 Pq2/1 Lp3/1 Pq3/1 Lp3/2 Pq3/2


1,0514 1,2533 1,1339 1,3542 1,0787 1,0803
D2/1 D3/1 D3/2
1,3177 1,5355 1,1653

D3/2xD2/1 = 1,1653 x 1,3177 = 1,5355 or D3/1 = 1,5355

On voit bien que lindice des valeurs globales possde la proprit de circularit puisque :
228
Statistique descriptive 6. Indices statistiques

D3/2xD2/1 = D3/1

Les indices de prix servent aussi dterminer les indices de rvision de prix, dans les
marchs de travaux dont la dure de ralisation stale sur plusieurs annes. Ces marchs
comportent, la plupart du temps, des formules de rvision de prix simples ou complexes.

6.5.4. Formules de rvision des prix dun march.

Une formule de rvision des prix est un indice synthtique qui permet de calculer les prix,
la date de ralisation des travaux, partir des prix la date de signature du contrat.

Le principe de rvision des prix dun march vient du fait que le contrat est sign, une
date 0 et les travaux sont raliss, des dates ultrieures t1, t2, tn, il est donc normal de
recalculer les nouveaux prix auxquels doivent tre facturs les travaux.

La formule gnrale de rvision des prix dun march est un indice synthtique qui donne le
rapport de prix Pt / Po entre les instants t et 0, elle scrit de la faon suivante :

n
I it
Pt / Po = 0 +
i 1
i0 (
I i0
)
n
Avec 0 + i0 = 1
i 1

Les rapports Iit et Ii0 donnent lvolution de lindice dun constituant du march : main
duvre, matires premires, produits finis ou semi finis, etc. Ces indices peuvent tre simples
ou synthtiques. En gnral, on admet que 10 20% du montant du march ne soit pas
rvisable et que le reste le soit au prorata des montants des diffrents corps dtat dans le
montant total du march

Exemple 15 : On considre un march pass, en mars 2004, entre la socit SAMTOL et


lentreprise BATIMAROC pour la construction du local pour stockage de la socit SAMTOL.
Le montant de ce march se dcompose comme suit :

Intituls Montants HT
- Gnie civil : 2 358 500,00
- Electricit : 452 360,00
- Plomberie : 235 125,00
- Menuiserie : 354 750,00
- Appareillages lectriques : 175 855,00

Total : 3 576 590,00


229
Statistique descriptive 6. Indices statistiques

On suppose que 15% du march ne sont pas rvisables et que le reste lest au prorata des
montants des diffrents corps dtat que sont le gnie civil, llectricit, la plomberie, la
menuiserie et lappareillage lectrique dont les indices sont respectivement I gc, Ilec, Ipl, Ime et Iap

Pour des raisons dautorisations administratives, les travaux de ce march nont dmarr
quen mai 2005, ont dur 3 mois et ont t facturs selon lavancement des travaux comme
suit :

- Juin 2005 : 1 249 965,00 DH


- Juillet 2005 : 1 103 769,00 DH
- Aot 2005 : 1 222 856,00 DH

On demande de donner la formule de rvision de prix de ce march et de dterminer le


montant total de la rvision de prix si lon suppose que les indices des diffrents corps dtat
ont volu, entre mars 2004 et les mois de ralisation, comme lindique le tableau suivant :

Intituls/mois Mars 04 Juin 05 Juillet 05 Aot 05


- Igc Gnie civil 425,32 471,22 475,52 482,61
- Ilec Electricit 256,54 281,62 293,22 301,05
- Ipl Plomberie 356,23 392,26 394,66 400,02
- Ime Menuiserie 332,56 382,12 390,21 392,35
- Aap Appar lec 517,31 550,21 562,38 581,54

a) Dterminons la formule de rvision des prix du march conformment la formule


gnrale de rvision de prix dun march, c'est--dire une formule de la forme :

n
Pt I it
P0
= 0 +
i 1
i0 (
I i0
)

Avec 0 = 0,15 et les autres dtermins comme suit, au prorata des montants :

Intituls Montants HT En % de 85%


- Gnie civil 2 358 500,00 56,05
- Electricit 452 360,00 10,75
- Plomberie 235 125,00 5,59
- Menuiserie 354 750,00 8,43
- Appareillages lectriques 175 855,00 4,18

Total 3 576 590,00 85%

La formule de rvision des prix pour ce march est donc :


230
Statistique descriptive 6. Indices statistiques

Pt I gc t I lec t I pl t
= 0,15 + 0,5605 0,1075 0,0559
P0 I gc 0 I lec 0 I pl 0
I me t I ap t
0,0843 0,0418
I me 0 I ap 0

On trouve bien une formule similaire avec la somme des gale 1, en effet :

0,15 + 0,5605 + 0,1075 + 0,0559 + 0, 0843 + 0,0418 = 1

b) Pour calculer le montant total de la rvision des prix de ce march, on doit dabord
calculer les taux dvolution des diffrents indices, selon les mois de ralisation et appliquer
ces taux aux montants de factures :

Facture de juin 2005


Juin
Indices Mars 04 coeff taux Coeff x taux
05
Invariant --- --- 0,1500 1,0000 0,1500
- Igc 425,32 471,22 0,5605 1,1079 0,6215
- Ilec 256,54 281,62 0,1075 1,0978 0,1180
- Ipl 356,23 392,26 0,0559 1,1011 0,0616
- Ime 332,56 382,12 0, 0843 1,1490 0,0969
- Aap 517,31 550,21 0,0418 1,0636 0,0445
Total de la rvision pour juin 2005 1,0920
Facture de juillet 2005

Indices Mars 04 Juillet 05 coeff taux Coeff x taux


Invariant --- --- 0,1500 1,0000 0,1500
- Igc 425,32 475,52 0,5605 1,1180 0,6267
- Ilec 256,54 293,22 0,1075 1,1430 0,1229
- Ipl 356,23 394,66 0,0559 1,1079 0,0619
- Ime 332,56 390,21 0, 0843 1,1734 0,0989
- Aap 517,31 562,38 0,0418 1,0871 0,0454
Total de la rvision pour juillet 2005 1,1058

Facture daot 2005


Aot
Indices Mars 04 coeff taux Coeff x taux
05
Invariant --- --- 0,1500 1,0000 0,1500
- Igc 425,32 482,61 0,5605 1,1347 0,6360

231
Statistique descriptive 6. Indices statistiques

- Ilec 256,54 301,05 0,1075 1,1735 0,1262


- Ipl 356,23 400,02 0,0559 1,1229 0,0628
- Ime 332,56 392,35 0, 0843 1,1798 0,0995
- Aap 517,31 581,54 0,0418 1,1242 0,0470
Total de la rvision pour aot 2005 1,1215

Ainsi la rvision de prix, pour lensemble du march, slve :

P P1 P2 P3 P0
or P1 = 1 249 965,00 x 1,0920 = 1 364 961,78 DH
P2 = 1 103 769,00 x 1,1058 = 1 220 547,76 DH
P3 = 1 222 856,00 x 1,1215 = 1 371 433,00 DH
Total = 3 956 942,54 DH

Ce qui donne : P 3956942,54 3576590,00 380352,54 DH

Soit + 10,63 % du montant total du march.

On voit l, lintrt de prvoir des formules de rvision de prix pour des marchs qui ne
sont pas raliss dans des dlais assez courts, en effet du fait que les dlais sont, parfois longs,
les prix des diffrents produits et services augmentent et il nest pas raisonnable dexiger de
lentrepreneur de raliser des travaux ou de fournir des produits des prix qui nont plus
aucune ralit.

Dans notre exemple, lentrepreneur peut facturer des rvisions de prix dun montant total de
380352,54 DH qui doit reprsenter les augmentations de prix quil a subies.

6.6. INDICES BOURSIERS.

Un indice boursier est un indice synthtique, il est calcul quotidiennement et correspond


la moyenne pondre du cours des valeurs boursires slectionnes de manire reflter la
tendance gnrale des cours des valeurs immobilires la Bourse.

Les principaux indices boursiers dans le monde sont :


- la Bourse de New York (Wall Street), le Dow Jones ;
- Londres (Stock Exchange), le Footsie ;
- Tokyo (Kabuto cho), le Nikkei ;
- Francfort, le Dax ;
- Paris, le C.A.C. 40 ;
- etc.

232
Statistique descriptive 6. Indices statistiques

En toute rigueur, un indice synthtique de la bourse doit tre un indice de valeurs globales,
sous la forme :
n
I it
I t / 0 N it
i 1 I i0
Avec :
- I t / 0 indice boursier t par rapport linstant 0 ;
- Nit nombre daction i existant en bourse ;
- Iit indice actuel de laction i ;
- Ii0 indice de dpart de laction i.

Cependant et traditionnellement, dans le calcul des indices boursiers, on se contente de ne


considrer que les valeurs mobilires les plus significatives, c'est--dire celle relatives aux
entreprises les plus importantes en capitalisation mobilires (cest--dire les plus fortes
n
sommes : N
i 1
it Pit : Nombre daction i multipli par le prix de cette action linstant t).

Ceci explique, par exemple, la dnomination explicite de CAC40 de lindice boursier de la


place de Paris, pour lequel on retient les 40 entreprises les plus importantes. Ce panel de 40
entreprises peut videmment changer, selon les priodes.

Dans le cas particulier de la bourse des valeurs de Casablanca, on fait appel deux types
dindices boursiers, le MASI et le MADEX.

Le MASI est un indice boursier synthtique global qui traduit lvolution de lensemble des
valeurs cotes, la bourse de Casablanca, par contre, le MADEX est un indice boursier
synthtique partiel qui, par la traduction de lvolution de quelques valeurs importantes (20)
ambitionne de traduire assez fidlement lvolution de lensemble de la place de Casablanca.
Le choix dun indice boursier synthtique partiel est intressant dans la mesure o il rsume
assez fidlement lvolution boursire de la place quil reprsente et que son calcul est assez
rapide et facile.

6.7. EXERCICES DAPPLICATION.

6.7.1. Exercice.

Les prix ainsi que les quantits consommes des produits A et B sont donns dans le tableau
suivant, selon les annes :

2000 2002 2004 2006


Produits/Annes
t=0 t=2 t=4 t=6
A Prix 132,00 125,00 121,00 130,00
233
Statistique descriptive 6. Indices statistiques

Quantits 25 30 31 35
Prix 112,00 121,00 126,00 137,00
B
Quantits 26 33 34 36

a) Calculer les indices lmentaires de prix des biens A et B avec lanne 2000 comme date
de base.
b) Calculer les indices de prix de LASPEYRES suivants : Lp2/0 et Lp4/0.
c) Calculer l'indice de PAASCHE suivant : Pp6/0.

Solution :
a) Indices lmentaires de prix des biens A et B avec lanne 2000 comme date de base :
Produits/Annes 2000 (t = 0) 2002 (t = 2) 2004 (t = 4) 2006 (t = 6)
A 100 94,70 91,67 98,48
B 100 108,04 112,5 122,32

b) Indices de prix de LASPEYRES : Lp2/0 et Lp4/0.


Produits pi0qi0 pi2qi0 pi4qi0
A 3300 3125 3025
B 2912 3146 3276
6212 6271 6301
Lp2/0 100,95
Lp4/0 101,43

c) Indice de PAASCHE : Pp6/0.


Produits pi6qi6 pi0qi6
A 4550 4620
B 4932 4032
9482 8652
Pp6/0 109,59

6.7.2. Exercice.

On donne les relevs des prix et des quantits consomms pour deux groupes de produits,
alimentation et habillement, deux priodes diffrentes : 2002 et 2006.

Priodes 2002 2006


Groupe de produits Prix Quantits Prix Quantits
Alimentation 21,00 29 22,00 27
Habillement 18,00 19 25,00 21

234
Statistique descriptive 6. Indices statistiques

En prenant lanne 2002 comme date de rfrence :

a) Dterminer les indices lmentaires de prix pour chacun des groupes.


b) Dterminer les indices lmentaires de quantits pour chacun des groupes de produits.
c) partir des indices calculs aux deux questions prcdentes, dterminer l'indice des prix
LASPEYRES et l'indice des quantits PAASCHE de lanne 2006.

Solution :
a) Indices lmentaires de prix pour chacun des groupes :
Groupe de produits I2006/2002
Alimentation 104,76
Habillement 138,89

b) Indices lmentaires de quantits pour chacun des groupes de produits.


Groupe de produits I2006/2002
Alimentation 93,10
Habillement 110,53

c) - Indice des prix LASPEYRES de lanne 2006 partir des indices calculs aux deux
questions prcdentes.
Groupe de produits pi2002qi2002 I2006/2002 pi2002qi2002 x I2006/2002
Alimentation 609 104,76 63798,84
Habillement 342 138,89 47500,38
951 - 111299,22
Lp2006/2002 117,03

- Indice des quantits PAASCHE de lanne 2006 partir des indices calculs aux deux
questions prcdentes.
Groupe de produits pi2006qi2006 I2006/2002 pi2006qi2006 / I2006/2002
Alimentation 594 93,10 6,3802
Habillement 525 110,53 4,7498
1119 - 11,1300
Pq2006/2002 100,54

6.7.3. Exercice.

On donne les prix et les consommations suivantes pour 4 produits A, B, C et D.

Produits A B C D
Prix en 2002 35,00 15,00 93,00 278,00
235
Statistique descriptive 6. Indices statistiques

Prix en 2004 40,00 18,00 110,00 301,00


Consommation en 2002 93 110 30 171

Calculer un indice de prix global base 100 en 2002. Justifier votre choix et interprter votre
rsultat.
Solution :
On calcule lindice de prix LASPEYRES puisquon ne dispose que de la consommation de
lanne de base.
Produits pi2002qi2002 pi2004qi2002
A 3255 3720
B 1650 1980
C 2790 3300
D 47538 51471
55233 60471
Lp2004/2002 109,48

6.7.4. Exercice.

On donne les relevs des prix et des quantits consomms pour deux groupes de produits,
logement et transport, deux priodes diffrentes : 2002 et 2006.
Priodes 2002 2006
Groupe de produits Prix Quantits Prix Quantits
Logement 25,00 125 26,0 125
Transport 7,25 56 7,85 60

En prenant lanne 2002 comme date de rfrence :


a) Dterminer les indices lmentaires de prix pour chacun des groupes.
b) Dterminer les indices lmentaires de quantits pour chacun des groupes de produits
c) En supposant que ces indices voluent rgulirement, dterminer les mmes indices pour
les annes 2003, 2004 et 2005.
Solution :
a) Indices lmentaires de prix pour chacun des groupes.
Groupe de produits I2006/2002
Logement 104
Transport 108,28

b) Indices lmentaires de quantits pour chacun des groupes de produits.


Groupe de produits I2006/2002
236
Statistique descriptive 6. Indices statistiques

Logement 100
Transport 107,14

c) Indices pour les annes 2003, 2004 et 2005.


Indice des prix de logement annuel moyen = 100,99
Indice des prix de transport annuel moyen = 102,01
Indice des quantits de logement annuel moyen = 100
Indice des quantits de transport annuel moyen = 101,74

Groupe de 200 2003 2004 2005 2006


produits 2
Indice des 100 100,9 101,9 102,9 104
prix Logement 9 8 9
100 102,0 104,0 106,1 108,2
Transport 1 6 5 8
Indice des Logement 100 100 100 100 100
quantits
100 101,7 103,5 105,3 107,1
Transport 4 1 1 4

6.7.5. Exercice.

Considrons un portefeuille de valeurs mobilires, compose de 2 actions X et Y dont les cours


sont donns dans le tableau suivant :

Cours des actions 31/12/2001 31/12/2005


X 625 700
Y 1000 1800

237
Statistique descriptive 6. Indices statistiques

a) Calculer les indices simples pour lanne 2005 avec comme date de base 2001.
b) Calculer les indices synthtiques pour lanne 2005 avec comme date de base 2001.
c) Interprter les rsultats des questions a) et b)
d) En supposant que le 1er indice volue rgulirement, dterminer le mme indice pour les
annes 2002, 2003 et 2004.

Solution :
a) Indices simples pour lanne 2005 avec comme date de base 2001.
Cours des actions I2005/2001
X 112
Y 180

b) Indices synthtiques pour lanne 2005 avec comme date de base 2001.
- Moyenne des indices : I2005/2001 =112180 = 146
2
- Indice des moyennes : I2005/2001 = 7001800 = 153,85
6251000
c) Interprtation des rsultats des questions a) et b)
Entre le 31/12/2001 et le 31/12/2005, le cours de laction X a augment de 12 %
Entre le 31/12/2001 et le 31/12/2005, le cours de laction Y a augment de 80 %
Entre le 31/12/2001 et le 31/12/2005, les cours des action X et Y ont connu une
augmentation moyenne de 46 %
Entre le 31/12/2001 et le 31/12/2005, le cours moyen des actions X et Y a augment de
53,85 %

d) Indices simples pour les annes 2002, 2003 et 2004.


Indice annuel moyen de laction X = 102,87
Indice annuel moyen de laction Y = 115,83
6.7.6. Exercice.

On a enregistr, diffrentes priodes, les prix et les quantits de 2 produits A et B.

Priodes 2001 2003 2005


Produits Prix Quantits Prix Quantits Prix Quantits
A 11 35 12 41 15 42
B 18 10 21 12 24 ?

a) Quelle quantit de B a t enregistre en 2005 sachant que l'indice de PAASCHE des


quantits de 2005 par rapport 2001 tait gal 126,27 % ?
b) Donner les indices de prix des 2 produits pour les annes 2003 et 2005 en prenant 2001
comme date de rfrence.
238
Statistique descriptive 6. Indices statistiques

c) Calculer les indices de prix de LASPEYRES et de PAASCHE, partir des indices


simples de la question b).

Solution :
a) Quantit de B enregistre en 2005 sachant que l'indice de PAASCHE des quantits de
2005 par rapport 2001 tait gal 126,27 % ?
n
q p
i2005 i2005
4215q24
Pq2005/ 2001 i n1 = = 1,2627 soit : q = 14
35151024
q
i 1
p
i2001 i2005

b) Indices de prix des 2 produits pour les annes 2003 et 2005 en prenant 2001 comme date
de rfrence.
Produits/Annes 2001 2003 2005
A 100 109,09 136,36
B 100 116,67 133,33

c) Indices de prix de LASPEYRES et de PAASCHE, partir des indices simples de la


question b).

- Indices de prix LASPEYRES.


Produits pi2001qi2001 I2003/2001 pi2001qi2001 x I2003/2001 I2005/2001 pi2001qi2001 x I2005/2001
A 385 109,09 41999,65 136,36 52498,60
B 180 116,67 21000,60 133,33 23999,40
565 - 63000,25 - 76498,00
Lp2003/2001 111,50
Lp2005/2001 135,39

- Indices de prix PAASCHE.

Produits pi2003qi2003 I2003/2001 pi2003qi2003 / I2003/2001 pi2005qi2005 I2005/2001 pi2005qi2005 / I2005/2001


A 492 109,09 4,51 630 136,36 4,62
B 252 116,67 2,16 336 133,33 2,52
744 - 6,67 966 - 7,14
Pp2003/2001 111,54
Pp2005/2001 135,29

6.7.7. Exercice.

239
Statistique descriptive 6. Indices statistiques

On considre une place boursire avec 10 entreprises cotes. On se propose de dfinir et de


calculer, pour le jour j, un certain nombre dindices boursiers relatifs cette place.
a) Dterminer la valeur de lindice global de cette bourse qui tient compte de toutes les
actions cotes.
b) Dterminer la valeur de lindice partiel de cette bourse relatif aux 4 plus fortes
capitalisations.
c) Dterminer la valeur de lindice partiel de cette bourse relatif aux 4 plus fortes valeurs
liquides en valeur.
Le tableau rcapitulatif des cotations du jour j est donn ci-dessous :

Nombre Valeur Valeur Mvt Total Mvt


Noms
actions V( j-1 ) V( j ) Nbre capitalisation DH
Alma 250 52,23 53,11 21 13277,50 1115,31
Blal 200 31,00 31,25 62 6250,00 1937,50
Cali 125 52,00 55,25 38 6906,25 2099,50
Dile 230 36,12 37,86 150 8707,80 5679,00
Elma 410 19,85 19,85 10 8138,50 198,50
Faty 210 21,13 19,22 51 4036,20 980,22
Grs 230 28,36 25,41 21 5844,30 533,61
Hly 245 46,32 46,32 23 11348,40 1065,36
Ikam 185 71,11 70,08 0 12964,80 0,00
Joly 245 39,46 45,96 150 11260,20 6894,00
Total 2330 88733,95 20503,00

Solution :
a) Valeur de lindice global de cette bourse qui tient compte de toutes les actions cotes.
2349,49
Ij/j-1 = x 100 = 101 %
2330
b) Valeur de lindice partiel de cette bourse relatif aux 4 plus fortes capitalisations.
966,89
Ij/j-1 = x 100 = 105 %
925
c) Valeur de lindice partiel de cette bourse relatif aux 4 plus fortes valeurs liquides en
valeur.

814,34
Ij/j-1 = x 100 = 101 %
805
6.7.8. Exercice.

240
Statistique descriptive 6. Indices statistiques

Le tableau suivant donne quelques produits imports par le Maroc partir de la France en 2002
et 2006.

Quantits en 1000 tonnes Prix en 1.000.000 DH


Produits
2002 2006 2002 2006
Acier 256 352 23 41
Aluminium 25 36 126 195
Cuivre 75 70 201 168

a) Calculer l'indice de quantit selon la pondration de LASPEYRES, base 100 l'anne


2002.
b) Calculer l'indice de prix selon la pondration de PAASCHE, base 100 l'anne 2002.
c) Calculer l'indice de Fisher.
d) Calculer ces mmes indices pour lanne 2004 en supposant que les indices simples de
prix et de quantits des diffrents produits voluent rgulirement entre 2002 et 2006.
e) Calculer ces mmes indices pour lanne 2004 en supposant quils voluent
rgulirement entre 2002 et 2006.

Solution :
a) Indice de quantit selon la pondration de LASPEYRES, base 100 l'anne 2002.
Lq2006/2002 = 110,74

b) Calculer l'indice de prix selon la pondration de PAASCHE, base 100 l'anne 2002.
Pp2006/2002 = 124,38

c) Indice de Fisher. : Fp2006/2002 = 120,12 et Fq2006/2002 = 114,67

d) Calcul des mmes indices pour lanne 2004 en supposant que les indices simples de prix
et de quantits des diffrents produits voluent rgulirement entre 2002 et 2006.

Indices simples de prix et de quantits pour chacun des produits.


Produits Ip2006/2002 Iq2006/2002
Acier 178,26 137,5
Aluminium 154,76 144
Cuivre 83,58 93,33

Produits Ip2004/2002 Iq2004/2002


Acier 133,51 117,26
Aluminium 124,40 120
Cuivre 91,42 96,61

Lq2004/2002 = 104,31 ; Pp2004/2002 = 108,37 ; Lp2004/2002 = 106,42 et Pq2004/2002 = 106,22


241
Statistique descriptive 6. Indices statistiques

Fp2006/2002 = 107,39 et Fq2006/2002 = 105,26

e) Calcul des mmes indices pour lanne 2004 en supposant quils voluent rgulirement
entre 2002 et 2006.
Indices 2006/2002 Indice annuel moyen 2004/2002
Lp 116 103,78 107,7
Pp 124,38 105,61 111,53
Lq 110,74 102,58 105,23
Pq 118,74 104,39 108,97
Fp 120,12 104,69 109,60
Fq 114,67 103,48 107,08

6.7.9. Exercice.

Un march pass, en mars 2002 na t excut quen octobre 2002. Calculer la rvision de
prix faire si la formule de rvision est donne par :
Pt = P0 ( 0,20 + 0,15Alt/Al0 + 0,30ACut/Cu0 + 0,35Fet/Fe0)

Les indices Fet/Fe0 , Alt/Al0 et Cut/Cu0 sont ceux du fer, de laluminium et du cuivre,
principales fournitures du march qui ont volu de mars octobre, respectivement de 5%, de
7% et de 4%.

Solution : Poct 2002 / Pmars 2002 = 104 %

6.7.10. Exercice.

Ladministration a sign un march avec lentreprise SOTAG pour la ralisation dun projet sur
plusieurs mois. MATAG facture ses travaux tous les deux mois.

Calculer les rvisions de prix dues pour toutes les factures que SOTAG soumet au
paiement, sachant que :
Date de signature du march : Mars 2001.
Dbut des travaux : Septembre 2001.
Fin des travaux : Mars 2002.
Base de rfrence des indices : Janvier 2000
Formule de rvision des prix : Pt = P0(0,25 + 0,25St/S0 + 0,30GOt/GO0 + 0,20CSt/CS0)

Lvolution des indices est donne par le tableau suivant:

Mois / Anne Si GOi CSi


Mars 2001 124 345 225

242
Statistique descriptive 6. Indices statistiques

Septembre 2001 125 345 233


Novembre 2001 125 355 245
Janvier 2002 126 365 256
Mars 2002 130 370 261

Avec Si : indice des salaires


GOi : indice des gros oeuvres
CSi : indice des corps dtat secondaires

Les factures tablies par MATAG ont t comme suit :

F1 = 234 345,98 DH fin septembre 2001


F2 = 543 768,56 DH fin novembre 2001
F3 = 354 621,34 DH fin janvier 2002
F4 = 147 869,24 DH fin mars 2002

Solution :
Formule de rvision des prix : Pt = P0(0,25 + 0,25St/S0 + 0,30GOt/GO0 + 0,20CSt/CE0)

Pour calculer le montant total de la rvision des prix de ce march, on doit dabord calculer
les taux dvolution des diffrents indices, selon les mois de ralisation et appliquer ces taux
aux montants de factures :

Facture de fin septembre 2001


Indices Mars 01 Septembre 01 coeff taux Coeff x taux
Invariant --- --- 0,25 1,0000 0,2500
- IS 124 125 0,25 1,0081 0,2520
- IGO 345 345 0,30 1 0,30
- ICS 225 233 0,20 1,0356 0,2071
Total de la rvision pour fin septembre 2001 1,0091

Facture de fin novembre 2001


Indices Mars 01 Novembre 01 coeff taux Coeff x taux
Invariant --- --- 0,25 1,0000 0,2500
- IS 124 125 0,25 1,0081 0,2520
- IGO 345 355 0,30 1,0290 0,3087
- ICS 225 245 0,20 1,0889 0,2178
Total de la rvision pour fin novembre 2001 1,0285

Facture de fin janvier 2002


Indices Mars 01 janvier 2002 coeff taux Coeff x taux
Invariant --- --- 0,25 1,0000 0,2500
- IS 124 126 0,25 1,0161 0,2540
243
Statistique descriptive 6. Indices statistiques

- IGO 345 365 0,30 1,0580 0,3174


- ICS 225 256 0,20 1,1378 0,2276
Total de la rvision pour fin janvier 2002 1,0490

Facture de fin fin mars 2002


Indices Mars 01 mars 2002 coeff taux Coeff x taux
Invariant --- --- 0,25 1,0000 0,2500
- IS 124 130 0,25 1,0484 0,2621
- IGO 345 370 0,30 1,0725 0,3217
- ICS 225 261 0,20 1,1600 0,2320
Total de la rvision pour fin mars 2002 1,0658

Ainsi la rvision de prix, pour lensemble du march, slve :


P = P1 + P2 + P3 + P4 P0 = 1 325 341,31 1 280 605,12 = 44 736,19 DH
Soit + 3,5 % du montant total du march.

244
Statistique descriptive Bibliographie

BIBLIOGRAPHIE

TITRES AUTEURS EDITIONS


AIDE MEMOIRE DE PROBABILITES ET J. MARCEIL ELLIPSES 92
STATISTIQUES
ANALYSE STATISTIQUE DES DONNEES H. FENNETEAU ELLIPSES 93
APPLICATIONS ET CAS POUR LE
MARKETING
COURS DE STATISTIQUE G. HERNIAUX MASSON 71
COURS DE STATISTIQUE DESCRIPTIVE G. CALOT DUNOD 73
DE L'ANALYSE A LA PREVISION D. SCHLACTHER ELLIPSES 86
ELEMENT DE MATHEMATIQUES ET NAJIB MIKOU WALLADA 93-94
STATISTIQUES POUR L'ECONOMIE TOME
1 ET TOME 2
ETUDE STATISTIQUE DES DEPENDANCES S. AIVAZIAN MOSCOU 70
EXERCICES CORRIGES DE STATISTIQUES B. GRAIS DUNOD 83
DESCRIPTIVE
EXERCICES DE PROBABILITES ET D. DACCUNHA MASSO 96
STATISTIQUE
EXERCICES ET PROBLEMES RESOLUS DE M. ELLATIFI AFRIQUE ORIENT 84
STATISTIQUE PROBABILITE
EXERCICES ET PROBLEMES RESOLUS DE M. ELLATIFI AFRIQUE ORIENT 84
STATISTIQUES
EXERCICES RESOLUS DE STATISTIQUES J. FOURASTIE MASSON 93
APPLIQUEES A L'ECONOMIE
FORMULAIRE DE PROBABILITES ET DE J. RENAULT DUNOD 92
STATISTIQUES
INTRODUCTION A LA METHODE B. GOLDFARB DUNOD 99
STATISTIQUE
INTRODUCTION A LA STATISTIQUE J. P. BELISLE GAETAN MORIN 83
INTRODUCTION A LA STATISTIQUE S. ALALOUF WESLEY 90
APPLIQUEE
INTRODUCTION A LA STATISTIQUE G. BAILLAGEON S.M.G. 81
DESCRIPTIVE
INTRODUCTION AUX PROBABILITES ET A E. AMIOT GAETAN MORIN 90
LA STATISTIQUE

246
Statistique descriptive Bibliographie

TITRES AUTEURS EDITIONS


METHODES STATISTIQUES P. TASSI ECONOMICA 89
METHODES STATISTIQUES B. GRAIS DUNOD 2000
METHODES STATISTIQUES EN GESTION M. TENENHAUS DUNOD 96
PREVISION Approche empirique d'une mthode M. DAVID MASSON 89
statistique
PROBABILITES ET STATISTIQUE ET G. BAILLARGEON S.M.G 89
TECHNIQUES DE REGRESSION
PROBABILITES ET STATISTIQUES J. FOURASTIE DUNOD 87
PROBABILITES ET STATISTIQUES AUDET, BOUCHER GAETAN MORIN 93
PROBABILITES ET STATISTIQUES COURS L. CACOGNE EYROLLES 90
DE MATHEMATIQUES
REGRESSION Nouveaux regards sur une R. TOMASSONE MASSON 92
ancienne mthode statistique
STATISTIQUE APPLIQUEE G. BAILLARGEON SMG 79
STATISTIQUE CONCEPTS ET METHODES S. LESSARD MASSON 93
AVEC EXERCICES CORRIGES
STATISTIQUE DESCRIPTIVE B. GRAIS DUNOD 91
STATISTIQUE DESCRIPTIVE BERNARD PY ECONOMICA 88
STATISTIQUE DESCRIPTIVE - MANUEL B. GRAIS DUNOD 94
STATISTIQUE DESCRIPTIVE : EXERCICES B. GRAIS DUNOD 99
CORRIGES
STATISTIQUE DESCRIPTIVE EXERCICES I. ABBASSI LA SOURCE 94
RESOLUS A. EL MARHOUM
STATISTIQUE ET CALCUL DES W. MASIERI SIREY 82
PROBABILITES
STATISTIQUE ET PROBABILITE : J. P. LECOUTRE DUNOD 2000
TRAVAUX DIRIGES
STATISTIQUE ET PROBABILITES ERIC FAVRO DUNOD 91
STATISTIQUE EXERCICES CORRIGES C. LABROUSSE DUNOD
AVEC RAPPELS DE COURS TOMME 1 ET
TOME 2
STATISTIQUE INITIATION PRATIQUE J. P. CABANNES HACHETTE 90
STATISTIQUE RESUME DE COURS- P. JAFFARD MASSON 90
EXERCICES-PROBLEMES
STATISTIQUE SANS MATHEMATIQUE J. BADIA ELLIPSES 97
STATISTIQUES : ANNALES CORRIGES G. PUPION DUNOD 94
STATISTIQUES ET PROBABILITES EN C. M. BAUMONT ELLIPSES 90
MATHEMATIQUES
STATISTIQUES EXERCICES CORRIGES C. LABROUSSE DUNOD 78
AVEC RAPPELS DE COUR
STATISTIQUES POUR L'ECONOMIE J. HUBLER BREAL 96
STATISTIQUES UN OUTIL DU C. RAMEAU ORGANISATION 7
MANAGEMENT

247
Statistique descriptive Bibliographie

248

Vous aimerez peut-être aussi