Statistique 1

Université de Goma
e o
aD
n d w
u g a
Faculté des Sciences Économiques et de Gestion
t1 B
S t a
Cours de Statistique I (Descriptive)
Prof Deogratias BUGANDWA MUNGU AKONKWA
A l'usage des étudiants de première année de Graduat en Sciences Économiques
Année académique 2019-2020

c Université
Catholique de Bukavu Notes de Statistique I
e o
aD
n d w
u g a
t1 B
S t a
Prof. Bugandwa M. 2 Version provisoire

Table des matières
1 Dénitions et Terminologie de base 9

1.1 Brève historique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.1 Préhistoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.2 Du 11ème au 18ème siècle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2 Dénition et champ de la statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
eo
1.2.1 Dénition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.2 Champ de la statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
D
1.3 Terminologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
a
1.3.1 Population et Unités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
w
1.3.2 Échantillon et sous-ensemble d'une population . . . . . . . . . . . . . . . . . . 12
d
1.3.3 Répartition des unités statistiques d'une population selon diérents caractères 13
n
1.3.4 Caractères quantitatifs discrets et continus . . . . . . . . . . . . . . . . . . . . 14
a
1.3.5 Caractères qualitatifs nominaux et ordinaux . . . . . . . . . . . . . . . . . . . 15
g
1.3.6 Exemple de caractère qualitatif nominal . . . . . . . . . . . . . . . . . . . . . 15
u
1.3.7 Les échelles de mesures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
B
2 ORGANISATION D'UNE SÉRIE STATISTIQUE UNI-VARIÉE 19
t1
2.1 Distribution par valeurs ou par modalités . . . . . . . . . . . . . . . . . . . . . . . . . 21
a
2.1.1 Distribution par modalités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
t
2.1.2 Distribution par valeurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
S
2.2 Série observée et série ordonnée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3 Distribution observée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4 Fréquences, Eectifs Cumulés et Fréquences cumulées . . . . . . . . . . . . . . . . . . 26
2.4.1 Eectifs, Fréquences, Pourcentages . . . . . . . . . . . . . . . . . . . . . . . . 26
2.5 Distribution Groupée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5.1 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.5.2 Le regroupement des classes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.5.3 Construction d'une distribution groupée . . . . . . . . . . . . . . . . . . . . . 36
2.5.4 Exercice d'application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.5.5 Représentation graphique d'une DG1 . . . . . . . . . . . . . . . . . . . . . . . 37
2.6 La Transformation des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.6.1 La transformation Linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.6.2 Transformations fonctionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.6.3 Rapports et indices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.7 Compléments du chapitre II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3 ÉTUDE DES INDICATEURS DE TENDANCE CENTRALE, DE DISPERSION

ET DE FORME 51
3.1 Le concept de position ou de tendance centrale . . . . . . . . . . . . . . . . . . . . . . 51
3
c Université
3.1.1 Les moyennes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

3.1.2 La Médiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.1.3 Les autres quantiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.1.4 Le Mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.2 Le concept de Dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.2.1 L'étendu ou l'empan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.2.2 L'écart Moyen Absolu et l'écart Médian Absolu . . . . . . . . . . . . . . . . . 74
3.2.3 La Variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.2.4 L'écart-type . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.2.5 Le Coecient de variation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
3.2.6 Variable centrée réduite et détection des valeurs aberrantes . . . . . . . . . . . 84
3.2.7 Autres mesures de Dispersion : Rapports et Écarts inter-quartiles/inter-déciles 86
3.2.8 Représentation graphique de la dispersion : La Boîte-à-moustaches . . . . . . . 87
3.3 Les indicateurs de concentration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.3.1 L'Indice Cx . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
o
3.3.2 L'indice d'Herndahl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
e
3.3.3 L'Indice de Gini associé à la Courbe de Lorenz . . . . . . . . . . . . . . . . . . 92
D
3.4 Le concept de Forme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
a
3.4.1 Analyse de la Symétrie d'une distribution . . . . . . . . . . . . . . . . . . . . 100
w
3.4.2 Analyse de l'aplatissement d'une distribution . . . . . . . . . . . . . . . . . . . 108
d
4 CALCUL DES INDICES ET LEUR RÔLE ÉCONOMIQUE 111
an
4.1 Les Indices élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
g
4.1.1 Exemples et dénitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
u
4.1.2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.2 Les indices synthétiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
B
4.2.1 Dénition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
t1
4.2.2 Diérentes formules d'indices synthétiques . . . . . . . . . . . . . . . . . . . . 114
a
4.2.3 Les diérents types d'indices . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
t
4.2.4 Calcul pratique d'un indice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
S
4.3 Relation entre indices de Laspeyres et de Paasche de prix et de quantités . . . . . . . 121
4.4 Avantages et Inconvénients des Indices de Laspeyres et de paasche . . . . . . . . . . . 122
4.4.1 Avantages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.4.2 Inconvénients . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
5 LES SÉRIES STATISTIQUES BIVARIÉES 125

5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
5.2 Les étapes d'une analyse statistique bivariée . . . . . . . . . . . . . . . . . . . . . . . 125
5.2.1 Niveau de mesure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
5.2.2 Représentation graphique d'une série bivariée . . . . . . . . . . . . . . . . . . 125
5.2.3 Association et dépendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
5.2.4 Analyse conrmatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
5.3 Organisation d'une série statistique bivariée . . . . . . . . . . . . . . . . . . . . . . . 126
5.3.1 Le Nuage de points . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
5.3.2 Tableau de contingence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
5.4 Association entre deux variables Quantitatives . . . . . . . . . . . . . . . . . . . . . . 128
5.4.1 Séries et Distributions marginales . . . . . . . . . . . . . . . . . . . . . . . . . 128
5.4.2 Distributions conditionnelles et Prols . . . . . . . . . . . . . . . . . . . . . . 130
5.4.3 Coecient de Corrélation d'une série statistique bivariée . . . . . . . . . . . . 132

c Université
5.4.4 Remarque sur la Covariance . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

5.4.5 Retour sur le Coecient de Corrélation . . . . . . . . . . . . . . . . . . . . . . 133
5.5 La Droite de régression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.5.1 Le principe de Moindres Carrés . . . . . . . . . . . . . . . . . . . . . . . . . . 136
5.5.2 Méthode d'Estimation par Moindres Carrés . . . . . . . . . . . . . . . . . . . 137
5.5.3 Décomposition de la Variance . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
5.6 Corrélation entre deux Variables Ordinales : Les données rangées . . . . . . . . . . . . 140
5.6.1 Ranger les données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
5.6.2 Le Coecient de Corrélation de Spearman pour données rangées . . . . . . . . 140
5.7 L'association entre deux variables nominales . . . . . . . . . . . . . . . . . . . . . . . 141
6 ANALYSE DES SÉRIES CHRONOLOGIQUES OU TEMPORELLES 145

6.1 INTRODUCTION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
6.1.1 Le concept de série chronologique . . . . . . . . . . . . . . . . . . . . . . . . . 145
6.1.2 Représentation graphique d'une série chronologique . . . . . . . . . . . . . . . 145
o
6.2 DÉCOMPOSITION D'UNE SÉRIE CHRONOLOGIQUE . . . . . . . . . . . . . . . . 147
e
6.2.1 La Périodicité d'une série chronologique . . . . . . . . . . . . . . . . . . . . . 147
D
6.2.2 Tendance, variations saisonnières et accidentelles . . . . . . . . . . . . . . . . 149
a
6.3 MODÈLES EMPIRIQUES D'AGRÉGATION . . . . . . . . . . . . . . . . . . . . . . 149
6.3.1 Modèle additif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
w
6.3.2 Modèle multiplicatif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
d
6.4 ANALYSE DE LA TENDANCE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
n
6.4.1 Approche exploratoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
a
6.4.2 Ajustement par Moyennes mobiles . . . . . . . . . . . . . . . . . . . . . . . . . 152
g
6.4.3 Ajustement analytique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
u
6.5 ÉTUDE DE LA COMPOSANTE CYCLIQUE . . . . . . . . . . . . . . . . . . . . . . 160
B
6.6 ÉTUDE DE LA COMPOSANTE SAISONNIÈRE . . . . . . . . . . . . . . . . . . . . 160
t1
6.6.1 Vocabulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
6.6.2 Les étapes du calcul de la série CVS . . . . . . . . . . . . . . . . . . . . . . . 160
t a
6.6.3 Détails du calcul pratique des coecients saisonniers Sj en modèle additif . . . 161
S
6.6.4 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
6.7 LES VARIATIONS ACCIDENTELLES . . . . . . . . . . . . . . . . . . . . . . . . . . 164
6.7.1 Dénition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
6.7.2 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
6.8 COEFFICIENT D'AUTOCORRELATION . . . . . . . . . . . . . . . . . . . . . . . . 165
6.9 MÉTHODES EMPIRIQUES DE PRÉVISION . . . . . . . . . . . . . . . . . . . . . . 166
6.9.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
6.9.2 Prévision naïve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
6.9.3 Prévision par Moyenne Mobile simple unilatérale . . . . . . . . . . . . . . . . 168
6.9.4 Prévision par Lissage exponentiel . . . . . . . . . . . . . . . . . . . . . . . . . 169
6.9.5 Prévision par Courbe de tendance . . . . . . . . . . . . . . . . . . . . . . . . . 172

c Université
e o
aD
n d w
u g a
t1 B
S t a

Bibliographie
Dehon, Jean-Jacques Droesbeke et Vermandaele Catherine Éléments de statis-
tiques, 6ème éd.
[1] Catherine
, Presses Universitaires de Bruxelles, Bruxelles, 2016
Dehon Droesbeke et Vermandaele Catherine Éléments de statis-

tiques
[2] Catherine , Jean-Jacques
, Presses Universitaires de Bruxelles, Bruxelles, 2008
[3] Fabrice Mazerolle, Sommaire cours de statistique ; cours inédit (voir site du professeur Ma-
o
zerolle retrouvable par moteur de recherche)
Mazerolle, Statistique Descriptive : série statistique à une et deux variables, séries

chronologiques, indices
e
[4] Fabrice
D
, Galinot ed., Paris, 2006
Tukey Exploratory Data analysis
a
[5] J.W. , , Reading, MA : Addison-Wesley, 1977
Applied Statis-
w
Cox
tics
[6] D.R. (1978) "Some remarks on the role in statistics of graphical methods".
d
, Vol.29, 4-9
Les graphiques en statistique

n
Droesbeke
a
[7] Jean-Jacques (1994), , ULB, Publications du Labora-
g
toire de Méthodologie du traitement des données.
Droesbeke(1997), "Le vice et la vertu au pays du graphique", Cahiers du CERO,
u
[8] Jean-Jacques
B
36, PP.77-104
Leboucher et Marie-José Voisin, Introduction à la Statistique Descriptive : Cours et
t1
Exercices avec tableur
[9] Lucien
, Cepaduès-édition, Toulouse, 2011
S t a
7
c Université
e o
aD
n d w
u g a
t1 B
S t a

Chapitre 1
Dénitions et Terminologie de base
1.1 Brève historique
o
1.1.1 Préhistoire
D e
On peut situer des éléments relevant de la statistique déjà à l'époque des grandes civilisations
a
telles que la Mésopotamie, en Égypte, chez les Hébreux, en Chine, en Grèce,. . .. Parmi ces faits :
w
On retrouve le souci de l'ordre des princes, des rois, des gouvernants, voire des dieux,. . . ; Ce
d
souci de l'ordre conduit à des activités telles que le dénombrement, l'inventaire,. . .qui font
n
partie de l'objet de la statistique.
a
Ces activités sont conduites dans le but de de maîtriser la connaissance de leurs biens, leurs
g
armées, populations (recensement). La statistique doit donc servir aux dirigeants, aux gou-
u
vernants, aux décideurs.
B
Pendant cette période, on se contentait de compter, rassembler, classer les données ; mais il
t1
n'y avait pas de traitement des données (au sens de les analyser pour en tirer une meilleure
information.)
S t a
1.1.2 Du 11ème au 18ème siècle
Dès 1086 : L'Angleterre produit des Domesday Books qui vont au-delà du simple dénombrement.
Ils relèvent le nombre d'occupants des maisons (en distinguant hommes, femmes, hommes-libres,
serfs, existence des moulins, étangs, pâturages,. . .Le classement apparaît donc.
14ème siècle : Sous l'impulsion des paroisses, on voit apparaître les premiers enregistrements
statistique pour des objectifs précis
réticence
des actes de l'État civil, et le besoin de la (payer les
des individus
militaires, préparer une bataille, contrôler le comportement religieux des personnes,. . .) La
à fournir certaines informations fait apparaître les 1ère dicultés méthodologiques (non
réponses, ou réponses biaisées).
Au 17ème siècle, pendant que Colbert développe des nombreuses enquêtes, Vauban (1633-1707)
développe une approche à la fois théorique et pratique dans ce qu'il appelle "Méthodologie gé-
nérale et facile pour faire le dénombrement des peuples". L'Allemagne quant à elle voit se
développer une école descriptive fondée par Conring (1606-1681) qui se limite à rassembler tout ce
qui permet d'apprécier la composition d'un État et de comparer ensuite plusieurs États entre eux.
Une attention particulière doit cependant être accordée à l'importance de l'arithmétique politique
anglaise (avec Grant : 1620-1674) et Petty (1623-1687) : (Polical Arithmetic).
Sans ignorer la description statistique, elle a un grand souci de mettre en évidence certaines
permanences ou lois statistiques qui peuvent même conduire à des prévisions.
9
c Université
Ex : Grant note pour la 1ère fois une diérence entre le taux des naissances des lles et celui
des garçons (plus nombreux à la naissance) Se développent ensuite les calculs des probabilités (avec
Laplace en 1785) On peut donc situer à +/- 1600 la naissance de la statistique moderne.
1.2 Dénition et champ de la statistique

1.2.1 Dénition
L'origine de la statistique est peu précise. Elle est considérée comme emprunté au latin moderne :
Statisticus = Relatif à l'État (racines italiennes statistica, stata, stato. . .). Entendu comme tel, le
mot est lié à la nalité même de la statistique : ÉVALUER, ESTIMER, et TAXER. Il y a deux
acceptions possibles pour dénir le terme statistique :
Dénition 1 Tout d'abord, la statistique est dénie comme un ensemble de données souvent nu-
o
mériques dont on devra analyser les caractéristiques principales an de traduire la réalité qu'elles
représentent.
D e
wa
Ainsi entendu, une observation fournirait une statistique, mais c'est quand les données sont nom-
d
breuses qu'il faudra tenter de les organiser, synthétiser, pour créer d'autres statistiques plus faciles
n
à interpréter.
a
Dans la deuxième acception, qui est encore plus intéressante pour ce cours,
Dénition 2
u g
la statistique désigne l'ensemble des méthodes ayant notamment pour but de traiter
les données mentionnées ci-dessus. Il s'agit plus précisément de savoir comment recueillir ces infor-
t1 B
mations, comment les organiser, en décrire les principales caractéristiques, les interpréter en vue de
fournir à l'économiste, au sociologue, au physicien,...le moyen de les apprécier à leur juste valeur.
S t a Ces deux sens du mot statistique ont entre eux des liens très forts. D'une part, on recueille
les statistiques pour les traiter et comprendre une situation donnée. D'autre part, les méthodes de
traitement et d'analyse sont fonction des caractéristiques des statistiques recueillies.
1.2.2 Champ de la statistique

On distingue deux grands domaines ou champs de la statistique. Il s'agit de la statistique des-
criptive et de la statistique inférencielle.
Dénition 3 La statistique descriptive : C'est un ensemble de méthodes permettant de décrire

les unités statistiques qui composent une population.
La statistique mathématique (inférentielle), dont l'objectif est de formuler des lois à partir
de l'observation d'échantillons, c'est-à-dire des tirages limités eectués au sein d'une population. Elle
intervient dans les enquêtes et les sondages, et s'appuie sur la statistique descriptive, mais aussi sur
le calcul des probabilités.
Le schéma suivant illustre les deux domaines de la statistique :

c Université
Schéma synthétique des deux domaines ou champs de la Statistique
STATISTIQUE
DESCRIPTIVE INFERENTIELLE
e o
Organisation des Extrapolation des résultats
d’échantillons pour faire des
D
données
prévisions basées sur les
a
Tableaux descriptifs
calculs des probabilités
w
Graphiques et
d
Diagrammes
n
Statistiques résumées
a
Corrélations
u g
t1 B
S t a
La statistique, qu'elle soit descriptive ou mathématique, est employée dans toutes les sciences, ainsi
que dans la vie quotidienne. Son utilisation très intensive dans le champ de l'économie a fait naître
une nouvelle discipline : l'économétrie (Confer Cours de 1ère licence).
1.3 Terminologie
1.3.1 Population et Unités
Dénition 4 En statistique, la population désigne un ensemble d'unités statistiques. Les unités sta-
tistiques (individus) sont des personnes, animaux ou objets concrets ou abstraits sur lesquels porte
l'analyse.
Dans ce cours nous parlerons soit de population, soit de Base de Données pour exprimer la même
réalité. Ce qui signie que nous restreignons notre étude aux populations statistiques qui ont un
nombre ni d'unités.
Le schéma suivant illustre les concepts de population, échantillon et unités élémentaires.

c Université
UNITES STATISTIQUES, POPULATIONS ET ECHANTILLONS:

SCHEMA ILLUSTRATIF.
Population
x x x x x x x
x x x x x x x x
xxx x x x x x x x
o
x x x x xxx x
x x x x x x x x
e
x
x x x x x x
D
xxx x x x
a
x x x x x x x x x
xx xx xx xx
w
x x x x x x x x x x x x x x x
d
x
g an
u
x x
B
x Echantillons Individus ou Unités
t1
statistiques (unités
x
élémentaires
a
x x x x x x x
S t
1.3.2 Échantillon et sous-ensemble d'une population

Il est fréquent que l'on prélève un échantillon dans une population statistique.
Dénition 5 En général, on parle d'échantillon d'une population statistique quand quelques unités
c Université
statistiques sont tirées au sort ou alors choisies par une méthode qui permet d'assurer la représen-
tativité de l'échantillon par rapport à la population total.
En théorie, on doit soigneusement distinguer la description d'un échantillon de celle d'une popu-
lation. C'est d'ailleurs l'un des objectifs principaux de la statistique mathématique que de préciser
les conditions dans lesquelles un échantillon est représentative d'une population. De ce fait, certaines
formules qui sont valables pour une population peuvent être légèrement diérentes lorsqu'on les ap-
plique pour un échantillon. C'est le cas notamment de la variance. Cependant, sauf mention contraire
explicite, nous considérons dans ces notes que les séries étudiées constituent une population complète
et non un échantillon.
e o
aD
1.3.3 Répartition des unités statistiques d'une population selon diérents
w
caractères
an d
Dans une population, par exemple celle des étudiants d'une faculté, les unités sont repérées par
g
les noms et les prénoms des étudiants (on a donc une liste). Si l'on souhaite étudier cette population,
u
on va retenir certains critères d'études comme le sexe, la lière principale à laquelle chaque étudiant
B
se rattache, les matières optionnelles qu'il a choisies, l'âge, le poids et la taille de l'étudiant, le
t1
pourcentage qu'il avait obtenu à la n du secondaire,. . ..
S t a
Dénition 6 Ces critères qui permettent de catégoriser les individus composant une population sont
appelés variables ou caractères.
On distingue les caractères quantitatifs (le poids, l'âge, les points obtenus en n de secon-
daire,. . .) et les caractères qualitatifs (le sexe, la lière principale, les matières optionnelles,. . .).
caractère
variable
An de diérencier les deux types de caractères, on parle généralement de lorsqu'il s'agit
de caractère qualitatif, et de lorsqu'il s'agit de caractère quantitatif.
Parmi les caractères quantitatifs ou variables, on distingue les caractères quantitatifs discrets, et
les caractères quantitatifs continues. Et parmi les caractères qualitatifs, on distingue les caractères
qualitatifs nominaux et les caractères qualitatifs ordinaux. Nous synthétisons tous ces éléments dans
le schéma ci-dessous :

c Université
I.4 TABLEAU RECAPITULATIF
CARACTERES
QUANTITATIFS QUALITATIFS
e o
DISCRETS CONTINUS NOMINAUX ORDINAUX
aD
n d w
u g a
t1 B
1.3.4 Caractères quantitatifs discrets et continus
S t a Ce sont les caractères qui sont mesurés par des nombres et sur lesquels les opérations et manipu-
lations arithmétiques de base ont un sens (calcul de la moyenne, des additions,. . .). Elles prennent
des valeurs numériques, d'où l'idée de les appeler "variables".
Dénition 7 On appelle caractère quantitatif discret un caractère qui prend un nombre ni de
valeurs.
Par exemple, le nombre d'enfants dans un ménage, le nombre de doigts sur une main, le nombre
d'étudiants dans un auditoire, etc. On appelle caractère quantitatif continu les caractères qui prennent
une innité de valeurs. C'est le cas du revenu (il peut être = 0, 0.5, 10, 10.9, 100,. . .) ; de la supercie
d'un champs, d'un pays, le poids d'un étudiants, les montants de dépenses des ménages,. . ..
Exemple de caractère quantitatif

Exemple 1 Soit un échantillon de 10 étudiants ayant passé un examen. Ils ont obtenu les notes
suivantes (sur 20) :
{16, 8, 6, 14, 10, 18, 13, 9, 10, 15}
Il convient de noter qu'il n'y a que 9 valeurs parce que 10 est répété deux fois. Ce qui montre
l'importance de distinguer les valeurs prises par la variable avec l'eectif de la population.
L'eectif varie de 1 à n (avec n = 10), mais les valeurs varient de 1 à 9 (avec h = 9).

c Université
Table 1.1 Exemple de présentation d'un caractère
Symbole Échantillon Eectif de l'échantillon : n = 10

i Unités statistiques chaque étudiant, i = 1, 2, . . . , n
X Variables Notes obtenues
x1 , x2 , . . . , xn Valeurs 6, 8, 9, 10, 13, 14, 15, 16, 18,
n1 , n2 , . . . , nn Eectifs associés à chaque valeur 1, 1, 1, 2, 1, 1, , 1, 1, 1
Table 1.2 Exemple2 de présentation d'un caractère
Symbole Population Eectif total : n = 600

i Unités statistiques Chaque étudiant, i = 1, 2, . . . , n
X Caractères Le sexe
XF XM Modalités Féminin ou Masculin
nF nM Eectifs associés à chaque modalité 370 hommes, 230 femmes
1.3.5 Caractères qualitatifs nominaux et ordinaux
e o
Dans le schéma sur les types de caractères, nous avons vu que l'on distinguait parmi les caractères
D
qualitatifs, le qualitatif nominal et le qualitatif ordinal.
a
Dénition 8 Lorsque les valeurs possibles d'une variable (les modalités de la variable ou d'un ca-
w
ractère) ne peuvent pas être ordonnés (sont des mots, des lettres,...), alors on parle de caractère
qualitatif nominal (Couleurs, race, religion,...).
an d
n'établissent aucun ordre de grandeur ou aucune comparaison entre les
Ces caractères
g
valeurs qu'on a observées.
race
u
C'est ainsi que le caractère permet seulement d'identier les unités de la population selon
B
qu'ils sont noirs, blancs, jaunes, rouges, sans les comparer car c'est impossible statistiquement.
t1
1.3.6 Exemple de caractère qualitatif nominal
S t a
Exemple 2 Soit une population de 600 étudiants avec un eectif de 230 lles et un eectif masculin
de 370 (voir tableau 1.2 ci-haut).
Traduisons ces informations dans le vocabulaire de statistique descriptive :
L'eectif total n va se répartir entre l'eectif féminin et l'eectif masculin, ce qui nous permet
d'écrire que n = nF + nM .
Cette égalité nous pouvons l'écrire parce que les diérentes modalités sont à la fois exhaustives
et incompatibles.
Exhaustives parce qu'elles décrivent toutes les valeurs ou états possibles d'un caractère. Incom-
patibles parce qu'un individu ne peut avoir qu'une modalité à la fois.
Dénition 9 Les modalités d'un caractère qualitatif, même si elles ne peuvent pas être mesurées
quantitativement, peuvent être ordonnées (classées). On dit qu'elles sont ordinales (caractère qualitatif
ordinal).
Exemple 3 Par exemple, un questionnaire de satisfaction demande aux clients d'évaluer une presta-
tion en cochant l'une des 6 catégories suivantes : (a)=nulle; (b))=médiocre; (c)=moyenne; (d)=assez
bonne; (e)=très bonne; (f)=excellente.
Il s'agit des modalités ordinales puisqu'elles peuvent être hiérarchisées.
Une prestation jugée "excellente" est préférable à une prestation jugée "bonne", etc.
Un autre exemple est celle des chemises qui peuvent être classées par tailles (S,M,L,XL,XXL,XXXL,etc).
c Université
Ces diérents types de caractères ou variables donnent lieu à diérentes échelles de mesure. Nous
les présentons ci-dessous dans l'ordre d'importance en termes statistiques (de la moins intéressante
à la plus intéressante)
1.3.7 Les échelles de mesures

1. L'échelle nominale :
Il s'agit de répartir les individus en catégories. Les modalités jouent le rôle d'étiquette. Permettent
d'identier les individus selon leur appartenance à l'une des catégories. L'exigence de base est que
chaque individu doit pouvoir recevoir une aectation et une seule. L'échelle nominale peut comporter :
Deux échelons : Ex : Homme/Femme : Variable dichotomique ;
Plusieurs échelons : Ex : nationalité, commune de résidence, état civil, etc.
2. L'échelle ordinale :
Il s'agit à nouveau de répartir les individus dans des catégories mais contrairement au premier
cas, ces derniers sont comparables. L'échelle ordinale permet d'établir un ordre entre les données (de
o
plus faibles aux plus élevés) : ordre croissant ; ou inversement : ordre décroissant. Dans ces conditions,
e
si A etB sont deux individus, on peut dire p.ex. "A est meilleur que B ", ou "A est au moins aussi
D
bon que B ". Ce type d'échelle est particulièrement utilisé dans l'évaluation d'une situation, d'une
a
performance, une satisfaction.
w
Par exemple dans un questionnaire, on a demandé aux consommateurs d'un produits de s'exprimer
sur le goût de ce produit : très mauvais ? mauvais ? moyen ? bon ? très bon (marketing, psychologie).
d
Il est important de relever ici qu'une limite de cette échelle est qu'il est impossible de comparer
an
les distances entre par exemple très mauvais, mauvais, moyen... Concrètement, supposons que l'on
g
note "1=très mauvais" ; "2=mauvais" ; "3=moyen" ; "4=Bon" ; "5=très bon".
u
Il est vrai que sur le plan arithmétique, la distance entre 1 et 2 est la même que celle entre 3 et 4.
Pourtant ici, il n'est pas sûr qu'il faut augmenter "1" à ceux qui cochent "moyen" pour qu'ils soient
B
dans "bon". Ce qui signie qu'il n'est pas possible de calculer les diérences entre ces catégories.
t1
Et donc nombreuses opérations arithmétiques ne seront pas autorisées sur cette échelle (sauf si l'on
1
a
pause quelques hypothèses théoriques complémentaires .
3. L'échelle d'intervalle :
S t
Elle permet de tenir compte de la diérence entre deux valeurs d'une variable. Les valeurs ob-
servables sont numériques. L'Exemple classique : Échelle des températures (Celcius par ex.) Si la
◦ ◦
température d'un individu est de 36 C et celle de son voisin de 38 C, leur diérence de température
◦
vaut 2 C. Mais le rapport entre ces deux valeurs n'a pas de sens, à cause du caractère arbitraire du
choix de l'origine de cette échelle. Le zéro ne représente pas une absence du phénomène étudié, mais
correspond à un choix lié à une réalité physique : le passage de l'état liquide à l'état solide pour l'eau.
Il y a d'ailleurs d'autres échelles comme l'échelle Fahrenheit. En dehors de l'exemple cité ici et très
peu d'autres, l'usage de ce type d'échelle est assez limité.
4. L'échelle de rapport ou échelle métrique :
C'est la plus riche en propriétés. Elle possède un zéro naturel qui indique l'absence du phénomène
étudié. Les Diérences et les rapports entre valeurs y ont un sens précis. Des nombreuses variables
échelle métrique
utilisent une telle échelle pour exprimer leurs valeurs : durée de vie, poids, taille, vitesse, prix, nombre
d'enfants,. . .Cette échelle est aussi souvent appelée .
Remarque 1 1. L'échelle de rapport permet de réaliser toutes les opérations réalisables sur les
autres échelles, mais l'inverse n'est pas vrai. Cette échelle permet en fait de classer les unités
observées, de les ordonner ou les classer dans un ordre hiérarchique de plus grand à plus élevé,
1. C'est le cas lorsqu'en psychométrie on utilise l'échelle de Likert qui est une échelle ordinale), en posant entre
autres hypothèses qu'elle se comporte comme une échelle d'intervalle

c Université
de moins préféré à plus préféré,..., on peut également créer des intervalles. Par ailleurs, on
peut facilement passer d'une échelle plus riche (en propriétés statistiques) à une échelle plus
pauvre.
2. Certaines modalités purement nominales sont parfois codées par des chires. Par exemple,
en étudiant le "sexe", on peut coder sexe masculin par "1" et sexe féminin par "2". Il s'agit
là d'une tentative de quantication d'une variable purement nominale. On parle alors de va-
riable pseudo-numérique. Ce traitement est encore plus intéressant lorsqu'on codie par
"1" et "0". La somme des 1 divisée par l'eectif total (hommes et femmes) donnera alors
une moyenne (qui est la proportion de la modalité codiée par "1" dans le total). Ce type de
codication est approfondi dans le traitement des variables qualitatives en économétrie.
e o
aD
n d w
u g a
t1 B
S t a

c Université
e o
aD
n d w
u g a
t1 B
S t a

Chapitre 2
ORGANISATION D'UNE SÉRIE

STATISTIQUE UNI-VARIÉE
e o
aD
Lorsqu'un chercheur récolte les données sur le terrain, celles-ci arrivent "pêle-mêle", c'est-à-dire
w
sans aucun ordre. or très souvent il aura besoin d'obtenir beaucoup d'observations (des centaines,
d
voir des milliers) qu'il doit utiliser pour répondre à ses questions de recherche. Pour s'en sortir, il
n
doit être capable de les organiser sous-forme des tableaux et/ou des graphiques, en vue de les rendre
a
faciles à interpréter. Dans ce chapitre, nous apprenons diérentes manières d'organiser les données,
g
qu'elles soient quantitatives ou qualitatives.
B
Exemple illustratif :
u
t a t1
S
Exemple 4 Soient les données suivantes sur les pays occidentaux :
19
c Université
2
Pays Monnaie Supercie (km ) Année adhésion Nb frontières P IB/Hab en $
UE avec d'autres 2008
pays UE
Allemagne Euro 357021 1956 8 34800
Belgique Euro 30528 1956 4 37500
France Euro 547030 1956 5 32700
Italie Euro 301320 1956 3 31000
Luxembourg Euro 2588 1956 3 61100
Pays-Bas Euro 41528 1956 2 40300
Danemark Couronne da- 43094 1973 1 37400
noise
Irlande Euro 70280 1973 1 46200
UK Livre sterling 244820 1973 1 36600
Grèce Euro 131940 1981 1 32000
Espagne Euro 504782 1986 2 34600
eo
Portugal Euro 92931 1986 1 22000
Autriche Euro 83855 1995 6 39200
D
Finlande Euro 337030 1995 1 37200
a
Suède Couronne 449984 1995 1 38500
w
suédoise
d
Chypre Euro 9280 2004 0 28600
n
Estonie Couronne es- 45226 2004 1 21200
a
tonnienne
g
Hongrie Forint 39030 2004 4 19800
u
Lettonie Lat 64589 2004 2 17800
B
Lituanie Litas 65200 2004 2 17700
t1
Malte Euro 316 2004 0 24200
Pologne Zloty 312685 2004 4 17300
a
République Couronne 78866 2004 4 26100
t
Tchèque tchèque
S
Slovaquie Euro 48848 2004 4 21900
Slovénie Euro 20253 2004 3 29500
Bulgarie Lev 110910 2007 2 12900
Roumanie Leu 238391 2007 2 12200
Suisse Francs suisses 41290 4 40900
USA Dollars 9826630 0 47000
Chine Yuan 9596960 0 6000
Inde Roupie 3287592 0 2800
Japon Yen 377686 0 34200
Russie Rouble 17075200 5 15800
Taïwan Dollars tai- 35920 0 31900
wannais
Hong- Dollars de 1092 0 43800
Kong H.Kong
Monde xxx 510072000 10400
Source : Mazerolle
Ce tableau pris du syllabus de Mazerolle ([3] Chap.I page 4) est un tableau dans lequel les unités
statistiques n'ont pas été regroupées. C'est un tableau des données brutes (Nous l'appellerons série
c Université
observée dans la suite. Chaque colonne correspond à une série simple des valeurs numériques ou
des modalités.
2.1 Distribution par valeurs ou par modalités

Le plus souvent, les données sont collectées et entrées dans l'ordinateur sous-forme d'un tableau
brut, puis elles sont regroupées. Suivant que le caractère est quantitatif ou qualitatif, on peut eectuer
un regroupement par valeurs ou par modalités. Dans ce cas, on parle de distribution.
Prenons le cas de la dimension "supercie", il y a 35 valeurs diérentes, donc nous n'avons aucun
intérêt à faire le regroupement.
Dans le cas du caractère "monnaie", il y a 20 modalités diérentes.
Dans le cas de la dimension "nombre de frontière d'autres pays de l'UE27", les 35 pays se répar-
tissent seulement 8 valeurs (si on exclut la valeur 7) 9 si on l'inclut.
o
2.1.1 Distribution par modalités
D e
On parlera de distribution par modalité lorsque la variable à regrouper est qualitative.
Dans le cas de notre base de données sur les pays de l'Union Européenne et hors-union
a
Exemple 5
européenne, on peut regrouper les pays selon la monnaie utilisée (Exercice à l'auditoire)
d w
Exemple 6 Un questionnaire de satisfaction demande à un échantillon de 10 consommateurs d'éva-
n
luer une prestation en cochant l'une des six catégories suivantes :
u g a
"a=nulle", "b=médiocre", "c=moyen", "d=bon", "e=très bon", "f=excellent".
B
On peut présenter les données individuellement, les grouper par modalité ou même par classes de
t1
modalités. Voici la série de données :
a
Indicateurs(*) 1 2 3 4 5 6 7 8 9 10
t
Évaluation a e e c e f a f e b
S Regroupement par modalité :
Évaluation
Eectif
a
2
b
1
c
1
d
0
e
4
f
2
Interprétation :
Deux personnes ont évalué par "Nulle", il y a plus de personnes qui ont donné la cote "Très bon",
deux personnes évaluent par excellent, tandis que personne n'a donné la cote "bon". Nous avons 1
personne pour respectivement "médiocre" et "moyen".
On voit que l'interprétation devient plus facile avec ce regroupement par modalité plutôt qu'avec
la "série observée".
On peut également regrouper par classe de modalité comme dans le tableau ci-dessous :
Classes De Nulle à Assez bon (a-b-c-d) De très bonne à excellente (e-f )

Eectifs 4 6
On voit ici qu'il y a 6 personnes sur 10, qui évalue la prestation comme soit très bonne, soit
excellente, ce qui est une bonne nouvelle pour l'entreprise.

c Université
Table 2.1 Distribution par nombre de frontières entre pays
NA Nombre frontières terrestres entre pays Eectif

Distribution sur 9 valeurs(*) 0 8
1 8
2 6
3 3
4 6
5 2
6 1
7(*) 0
8 1
NA 35=somme des eectifs
Table 2.2 Regroupement par classes d'amplitudes égale
Taille (Xj ) 135 142 145 148 152 165 170 173 175 180
e o
Eectif(nj ) 1 1 2 3 1 2 3 1 1 5
D
2.1.2 Distribution par valeurs
Exemple 7
wa
Reprenons l'exemple de la variable nombre des frontières terrestres avec d'autres pays de
l'UE27. Un regroupement des 35 unités statistiques pour chacune des valeurs possibles de la variable
donnera alors le tableau suivant :
an d
u g
On aurait pu ne pas mettre la valeur "7" car il n'y a aucun pays qui a 7 frontières avec les autres
B
pays de l'Union Européenne ; et on aurait le même résultat. Ici, nous avons choisi d'insérer la valeur
t1
7 avec comme eectif 0 pour éviter qu'il y ait une discontinuité. Mais une présentation exhaustive
a
dans laquelle aucun regroupement n'est eectué n'est pas toujours pratique.
t
Exemple 8 On a mesuré la taille de 20 personnes, et les résultats obtenus sont présentés ci-dessous :
S
.
148, 165, 145, 173, 148, 145, 152, 180, 135, 170, 170, 170, 142, 148, 165, 175, 180, 180, 180, 180
Il s'agit d'une variable continue mais dont les valeurs sont connues individuellement. On peut aussi
eectuer un regroupement par taille car certaines tailles comme 170 ou 180 apparaissent plusieurs
fois. Le résultat est donné dans le tableau numéro 2.2 ci-haut) :
Il est également possible d'eectuer un regroupement par classes de valeurs (voir 2.3 et 2.4 page
23).
On choisira à titre d'exemple un regroupement par classe d'amplitudes égales puis un regroupe-
ment par classes d'amplitudes inégales.
Nous venons d'introduire et d'appliquer les concepts qui seront formalisées dans les sections
suivantes.
2.2 Série observée et série ordonnée

série observée
Nous avons vu que la saisie des données se fait toujours de manière brute. Elle fournit les valeurs
disparates notées x1 , x2 , . . . , xn , et c'est cette série que nous appelons par référence à
[1]

c Université
Table 2.3 Regroupement par classes d'amplitudes égale
Classes Eectifs
[130 − 140[ 1
[140 − 150[ 6
[150 − 160[ 1
[160 − 170[ 2
[170 − 180] 10
Table 2.4 Regroupement par classes d'amplitudes inégales
Classes Eectifs
[130 − 150[ 7
[150 − 170[ 3
[170 − 180] 10
o
Si X est mesurée sur une échelle ordinale ou quantitative, une manière naturelle d'organiser les
e
données consiste à ordonner les valeurs observées, généralement de la plus petite à la plus grande.
D
On a ainsi la série ordonnée qu'on note :
wa x(1) , x(2) , . . . , x(n) ; ∀i = 1, 2, . . . , n
d
ou
n
x(i) ; ∀i = 1, 2, . . . , n
g a
ou encore x(i)
u
Elle est obtenue en permutant les valeurs observées de façon telle que xi ≤ xj .
B
Exemple (tiré de [1]) :
Une enquête a relevé le nombre de voitures (variables X ) possédées par des familles d'un
t1
Exemple 9
quartier d'une ville. En considérant les familles du type "père", "mère", 3 enfants d'âge inférieur à
a
18, on isole 10 observations.
S t En identiant chaque famille par un entier entre 1 et 10, on a obtenu le tableau suivant :
Les valeurs observées sont numériques. On peut les ranger par ordre croissant : Il y a d'abord 2
valeurs nulles (familles sans voiture : la 2ème et 10). Viennent ensuite les familles ayant une voiture
(familles 3, 4, 7, 8, 9), suivi de 2 familles avec 2 voitures (la 1ère et la 5ème) ; et enn la 6ème famille
x(i) = 0, 0, 1, 1, 1, 1, 1, 2, 2, 3.
rang de l'observation
qui possède 3 voitures. On peut noter
L'indice i de x(i) est appelé . La plus petite observation est donc celle de
rang 1, qu'on peut noter xmin . La plus grande est de rang n, notée xmax .
Ordonner une série d'observations permet, quand c'est possible, de mieux apprécier la répartition
des valeurs observées et de faciliter la construction des distributions observées.
2.3 Distribution observée

Dénition
Table 2.5 Distribution du nombre de voiture possédées par les ménages
i 1 2 3 4 5 6 7 8 9 10
xi 2 0 1 1 2 3 1 1 1 0

c Université
Table 2.6 Distribution du nombre de voiture possédées par les ménages
xj 0 1 2 3
nj 2 5 2 1
Dénition 10 Une distribution observée à une dimension (D.O.1) est dénie par les valeurs dis-
tinctes qui apparaissent dans la série observée (ou la série ordonnée) et le nombre de fois que chacun
d'elles apparaît. Désignons par J le nombre de valeurs distinctes observées.
Chacune de celles-ci est représentée par la notation x , où j est un nombre entier compris entre 1 et
J . La distribution observée D.O.1 qui résulte de la série observée (ou ordonnée) est alors dénie par
j
l'ensemble des couples :

(x , n ); j = 1, 2, . . . , J ou (x , n ), avec n l'eectif associé à x , (nombre de fois que x a été ob-
servé).
j j j j j j j
Exemple 10
e o
aD
d w
Le cas des voitures nous montre 4 valeurs distinctes : 0, 1, 2, 3.
n
Quand le nombre d'observations est faible, il sut de faire le décompte. La D.O.1 qui résulte de
a
cette opération est présentée ci-dessous :
u g
Le tableau des eectifs résume l'information statistique en précisant par exemple que parmi les
B
10 familles, deux d'entre elles possèdent 2 voitures. Une relation importante unit les eectifs nj :
t1
Leur somme correspond au nombre total d'observations et l'on note :
S t
Ou
a n1 + n2 + . . . + nJ = n
n
X
nj = n
j=1
Le diagramme en bâtons .
Lorsque la variable est quantitative , on peut visualiser une D.O.1 en associant au tableau des
eectifs un diagramme en bâtons qui constitue la représentation graphique. Cette opération consiste
à construire, dans un système d'axes orthogonaux, une suite de segments de droite parallèles à l'axe
des ordonnées, élevés à partir des points de l'axe des abscisses dénis par les valeurs xj et dont la
hauteur est égale à l'eectif correspondant nj .

c Université
nj
o
xj
D e
wa
an d
u g
t1 B
S t a
Diagrammes en barres et représentation en secteurs .
Lorsque la variable est qualitative , la diérence entre deux valeurs ne signie rien. Si la notion
de D.O.1 a toujours un sens, la représentation graphique au moyen d'un diagramme en bâtons n'est
plus conseillée. On procédera alors comme suit :
A. DIAGRAMMES EN BARRES OU EN TUYAUX
Pour construire un diagramme en barres (ou en tuyaux), on associe à chaque valeur distincte obser-
vée, un rectangle de base xée a priori (dont la longueur n'a pas de réelle signication) et de hauteur
égale à l'eectif correspondant.
Exemple 11 Dans une enquête réalisée auprès de 100 étudiants, on demande d'émettre un avis péda-
gogique à l'égard d'un enseignant selon une échelle à 5 modalités : Très défavorable (TD), Défavorable
(D), moyen (M), favorable (F), et très favorable (TF).
c Université
xj TD D M F TF
La D.O.1 est présentée dans le tableau suivant :
nj 2 4 54 31 9
Si l'échelle de mesure est ordinale, l'ordre de présentation des modalités est évident. Dans le cas
nominal, le choix est plus arbitraire.
B. DIAGRAMMES EN SECTEURS OU EN CAMEMBERT
S'obtient en découpant un cercle de surface xée a priori comme valant l'eectif n en parties dont
les surfaces sont égales aux eectifs nj . Cette construction est facilitée si on introduit au préalable
le concept de fréquence.
Le graphique est proposé ci-dessous :
Exemple 12 Le faire comme application à l'auditoire pour les données sur les avis pédagogiques.
Exemple 13 Faire un diagramme en camembert sur la répartition de la supercie de la RDC par
province avant le tout dernier découpage des provinces (voir Annuaire Statistique de la RDC page
26).
e o
aD
2.4 Fréquences, Eectifs Cumulés et Fréquences cumulées
d w
Nous venons de voir comment construire une distribution observée à partir d'une série observée.
n
La distribution observée permet de synthétiser l'information collectée en vue de mieux l'interpréter.
g a
Le calcul des fréquences et des fréquences cumulées peut fournir des information encore plus riches
sur les données.
B u
2.4.1 Eectifs, Fréquences, Pourcentages
t1
Eectifs ou Fréquences absolues
a
Il s'agit de la répartition brute des données. Lorsque les don-
t
nées sont présentées individuellement, chaque donnée a la même fréquence unitaire d'apparition ;
S
leur eectif ou fréquence absolue est égal à 1. Lorsque les données sont groupées, par valeurs ou
modalités, les eectifs ou fréquences absolues correspondent au nombre de données qui ont la valeur
ou modalité, ou encore qui sont groupées dans une classe donnée. Symboliquement, les eectifs ou
Pn
fréquences absolus s'écrivent nj . Et la somme des eectifs est égale à n ( j=1 nj = 1).
Ainsi, dans la distribution construite précédemment (cf. 2.6), les fréquences absolues sont données
dans la deuxième ligne. On y lit que 2 familles n'ont aucune voiture, 5 familles n'ont qu'une voiture,
2 familles ont 2 voitures et une famille a 3 voitures. La distribution donnée par le tableau 2.4 par
contre nous dit que 7 étudiants ont une taille comprise entre 130 et 150 cm, 3 entre 150 et 170 et 10
entre 170 et 180 cm.
Fréquence relative et pourcentages La fréquence relative est égale à la fréquence absolue (ou
eectif ) divisée par l'eectif total. On note :
nj
fj = n
, ∀j = 1, 2 . . . , J
La distribution des fréquences (relatives) consiste donc à associer à chaque valeur de xj , sa
fréquence dénie comme ci-haut. Cette quantité exprime l'importance relative de la présence de la
valeur xj dans la série observée, puisqu'elle correspond à la proportion d'observations de la série égale
à xj .

c Université
Les fréquences sont bien sûr reliées entre elles par la relation :
PJ
j=1 fj = 1.
Dénition 11 L'ensemble des couples formés par (x , f ) dénit une distribution des fréquences dont
la représentation graphique est analogue à celle décrite à partir des eectifs.
j j
Il sut en eet de multiplier par n la longueur de l'unité choisie en ordonnées pour qu'un dia-
gramme des eectifs soit identique à un diagramme des fréquences.
o
Le pourcentage des données qui correspondent à une modalité, à une valeur, ou à une classe est
e
obtenu en multipliant la fréquence fj par 100 (fj x100).
aD
Nous pouvons par la même occasion dénir la notion de ratio.
d w
Un ratio est une fraction qui divise deux quantités.
n
Les fréquences relatives sont des ratios puisqu'elles satisfont à cette dénition. Leur particularité
a
est d'être toujours inférieur ou égal à 1 parce que nj ≤ n.
u g
t1
Exemple 14
donnée : B Soit la série des pièces défectueuses produites par une machine pendant une semaine
S t a 8, 16, 9, 33, 14, 5, 3, 7, 10, 7
On peut calculer des ratios comparant par exemple le nombre de pièces défectueuses le plus élevé au
nombre le plus faible. On a :
33/3 = 11. Et on interprète que la machine numéro 4 a produit 11 fois plus de pièces défectueuses
que la machine numéro 7.
L'eectif cumulé L'idée ici est de s'intéresser non pas à une seule valeur xj , mais plutôt à toutes
celles qui sont inférieures ou égales à xj .

c Université
x1 xj
A chaque valeur xj, on associe alors un effectif cumulé Nj,
o
représentant le nombre d’observations ≤ xj, et définies par
∑D
e
a
J
n w
N j = n1 + n2 + ...+ n j =
d j =1
nj
u g a
t1 B
S t a
On s'intéresse donc à un ensemble de valeurs : celles qui sont au maximum égales à xj . Il est évident
inférieure ou égale
que ce concept n'a pas de sens pour une variable nominale. Dans le cas ordinal, la relation d'ordre
dénit l'expression . Par ailleurs, on peut aisément établir les relations suivante
entre eectifs et eectifs cumulés :
N1 = n1 ; Nj = Nj−1 + nj ; ∀j = 2, 3, . . . , J − 1; NJ = n (2.1)
Ces dernières expressions vont nous permettre de visualiser l'intérêt d'un eectif cumulé au moyen
de la gure ci-dessous.

c Université
Effectifs cumulés
nj
o
Nj
D e
wa
an
x1
d x2 xj xJ Valeurs de la
g
variable
B u
t a t1
S
On construit une courbe en escaliers dans un système d'axes orthogonaux, à partir des points du
plan dont l'abscisse est la valeur xj observée et l'ordonnée, l'eectif Nj . Pour chacun de ces points,
on trace un segment de droite horizontale jusqu'à atteindre la verticale passant par la valeur observée
suivante xj+1 . On peut, mais ce n'est pas obligatoire, représenter le passage d'un palier de la courbe
au suivant par un trait vertical en pointillé. Cette manière d'agir fait mieux apparaître le caractère
cumulatif de la construction :
Si la hauteur d'un palier correspond à Nj , celle de la contremarche qui précède représente nj .
La fréquence cumulée
Dénition 12 Elle exprime l'importance relative de N par rapport au Nombre total d'observations.
Elle est notée F , associée à chaque valeur x et dénie comme suit :
j
j j
Nj
Fj = , ∀j = 1, 2, . . . , J (2.2)
n
Elle nous indique la proportion d'observations inférieures ou égales à x . j

c Université
Son rôle vis-à-vis de Nj est analogue à celui de la fréquence fj par rapport à l'eectif nj . Par
ailleurs, on peut aisément établir des relations analogues :
J
X
F 1 = f1 ; F j = fj = Fj−1 + fj ; ∀j = 2, 3, . . . , J (2.3)
j=1
et
FJ = 1
De même, la représentation graphique associée aux fréquences cumulées Fj sera semblable à celle
associée aux Nj , si l'on multiplie l'unité choisie en ordonnée par n.
Eectifs et fréquences cumulés à droite Nj et Fj concernent l'ensemble des valeurs ≤ à xj
o
(par rapport à une représentation graphique traditionnelle, on pourrait dire "à gauche" de xj ou en
e
xj ).
D
Il peut aussi être intéressant de regarder l'importance absolue ou relative de l'ensemble des obser-
a
vations supérieures ou égales à xj (à droite de xj ), ce qui nous conduit aux notions d'eectif cumulés
w
∗ ∗
à droite Nj et de fréquence cumulée à droite Fj .
d
Nous n'approfondissons pas ici la représentation graphique, celle-ci se faisant sur les mêmes cri-
n
tères que précédemment.
Exercice d'application
u g a
Reprenons la distribution donnée dans le tableau 2.6, et reprise ci-dessous :
t1 B
xj 0 1 2 3
nj 2 5 2 1
t a
Nous pouvons compléter ce dernier de manière à présenter tous les concepts introduits jusqu'ici.
S
On obtient le tableau suivant :
xj nj fj Nj Fj Nj∗ Fj∗
0 2 0,2 2 0,2 10 1
1 5 0,5 7 0,7 8 0,8
2 2 0,2 9 0,9 3 0,3
3 1 0,1 10 1 1 0,1
Total 10 1
Ce tableau nous indique par exemple : Qu'il y a 2 familles possédant 2 voitures ; ce qui représente
20% de l'ensemble étudié. Que 9 familles possèdent au maximum 2 voitures, soit 90% de l'ensemble
des familles étudiées ; que 3 familles possèdent au minimum 2 voitures, soit 30% de l'ensemble ; Etc.
En outre, on peut ajouter au diagramme en bâtons déjà construit, les graphiques cumulés qui donnent
∗
les courbes cumulatives représentant N(x) et N(x) ; comme dans la gure ci-dessous :

c Université
Nj Nj *
10 10
9 8
7
e o
aD 3
n d w
a
1
u g 0 1 2 3
B
0 1 2 3 xj xj
t a t1
S Considérons à présent le cas d'une variable ordinale. Les représentations graphiques (diagramme
en bâtons, courbes cumulatives) n'ont plus de raisons d'être puisque les modalités placées en abscisses
ne sont pas des nombres réels. On peut cependant introduire une représentation en barres que nous
évoquerons à partir de l'exemple suivant :
Exemple 15 Reprenons notre DO1 d'avis pédagogiques, présentée dans le tableau :

xj TD D M F TF
nj 2 4 54 31 9
Nous pouvons compléter ce dernier de manière à introduire les diérents concepts introduits pré-
cédemment :
xj nj fj Nj Fj Nj∗ Fj∗
TD 2 0,02 2 0,02 100 1
D 4 0,04 6 0,06 98 0,98
M 54 0,54 60 0,60 94 0,94
F 31 0,31 91 0,91 40 0,40
TF 9 0,09 100 1 9 0,09
Total 100 1 - - - -

c Université
Intéressons-nous par exemple aux fréquences. Le diagramme en barres présenté dans la partie gauche
de la gure d'histogramme permet de visualiser la distribution des fréquences.
nj
nj
e o
D
54
wa
31
d
9
4
n
2
a
TD D M F TF
u g
t1 B
S t a
N.B. :
Les concepts cumulés n'ont pas de sens dans le cas nominal. Nous pouvons évidemment construire
une répartition en barres comme les graphiques précédents, mais l'ordre des rectangles superposés
est alors arbitraire.
2.5 Distribution Groupée

Lorsque la variable est réelle (taille, poids, durée, salaire, etc.), l'instrument de mesure utilisé
fournit souvent des valeurs arrondies. La précision d'une observation dépend des caractéristiques de
l'instrument de mesure utilisé. Ainsi, un poids peut être exprimé en mg, en gr, en Kgs, ou tonnes selon
l'objectif et les moyens de l'étude. Si la précision de la mesure est ne, et que le nombre d'observations
est grand, il peut arriver que le nombre des valeurs distinctes observées soit relativement élevé. La

c Université
Table 2.7 Série observée des tailles des étudiants
176 155 184 173 185 176 180 185 196 177 185 156
166 186 170 182 158 172 187 189 179 184 176 183
177 163 189 172 192 186 183 165 198 178 172 182
150 184 178 184 196 180 164 175 151 190 157 160
181 176 187 175 151 192 185 176 197 153 176 174
169 180 198 185 187 179 161 184 163 198 165 181
175 188 180 178 178 184 177 155 190 175 171 179
173 178 176 183 177 170 165 181 154 169 174 180
184 169 155 174 190 150 167 175 174 164 194 161
162 177 165 181 175 170 174 177 171 170 175 179
169 175 177 168 162 171 190 169 189 181 166
171 152 164 176 181 177 178 183 176 177 195
193 160 182 177 163 169 182 170 182 167 180
o
154 168 170 161 172 175 173 186 171 183 191
e
170 171 175 166 168 191 188 169 183 179 180
aD
distribution qui en découle peut alors présenter les caractéristiques suivantes :
w
Un grand nombre de lignes dans le tableau des eectifs ;
d
Des nombreux eectifs de faible amplitude.
n
Cette situation ne permet pas de dégager facilement les caractéristiques essentielles de la distribution.
2.5.1 Exemple
u g a
Une étude réalisée auprès de 175 étudiants d'une université pratiquant le Volley comporte une
B
question sur leur taille. Les valeurs de cette variable, arrondies au centimètre le plus proche, ont été
t1
saisies dans l'ordre du dépouillement de l'enquête. On dispose ainsi d'une série statistique d'eectif
a
total 175 de nombre à 3 chires.
t
Si on se réfère à la manière de procéder telle que nous l'avons proposée plus haut, nous pouvons
S
mieux apprécier la structure des observations en construisant la série ordonnée. Le tableau 2.8 nous
permet de construire aisément la distribution observée que nous avons déjà représenté graphiquement.
2.5.2 Le regroupement des classes

Si l'on produit un graphique en histogramme ou barres par exemple, on verra qu'il est ou. On
peut y voir bien sûr apparaître les eectifs les uns par rapport aux autres, mais leur comparaison
ne sera pas aisée. On peut tenter de favoriser une approche plus globale de cette série en réalisant
un groupement des données. Il s'agit en fait de rassembler dans une même catégorie des valeurs
relativement proches les unes par rapport aux autres. Plusieurs méthodes permettent d'opérer des
regroupements :
Dénombrement
Les règles empiriques
Etc.
diagramme en tiges
Une manière simple de procéder a été proposée par [5]. Sous la forme d'un
et feuilles (encore appelé en branches et rameaux). Ce procédé généralise le décompte habituel
du cas où il n'y a pas trop d'observations. Pour notre exemple ([2] ; p.49), tous les nombres ont 3
chires. Les 2 premiers d'entre eux sont identiques sur plusieurs valeurs :

c Université
Ex : 150, 151, 152,. . .,158.
la feuille
On peut donc diérencier ces observations vis-à-vis de cette propriété commune (qui constitue la
tige par l'intermédiaire du 3ème chire (que l'on dénomme ).
15 0452
16 6925
17 6753
18 1464084...
19 38260210
La première observation (176) est sur la tige 17 et est représentée par la première feuille égale à
6.
La deuxième observation (166) se situe sur la tige 16 et représentée par la feuille 6, etc.
Cette construction du diagramme en tiges et feuilles nous amène à grouper les observations dans
des classes qui découle du système décimal de notation.
150 à 159 ; 160 à 169 ; 170 à 179 ; 180 à 189 ; 190 à 199.
o
Le diagramme en tiges et feuilles nous permet de calculer aisément les nombres de feuilles par
e
tige (nombre d'observations par classe) qui valent respectivement 14, 32, 65, 47, et 17.
D
Remarquons que nous pouvons encore mieux nous rendre compte de la répartition des feuilles sur
a
chaque tige en ordonnant les valeurs observées, comme dans la gure ci-dessous :
w
15 001123...
d
16 0011122...
17 000000011...
an
18 000000011111...
g
19 0000112...
facilite
u
On a là le diagramme en tiges et feuilles ordonnées.
Cette démarche nous conduit à construire le schéma suivant qui la création des classes :
t1 B
S t a

(1)
o
14 32 65 47 189
e
159 169 179 17
D
150 160 170 180 190 199
wa
d
(2)
an
149,5 159,5 169,5 179,5 189,5 199,5
u g
B
(3) Eléments caractéristiques d’une classe
t a Lj-
t1 xcj Lj+
S hj
c Université
Table 2.8 Série observée des tailles des étudiants
150 160 165 169 172 175 177 178 181 184 187 192
150 161 165 170 172 175 177 179 181 184 187 193
151 161 166 170 172 175 177 179 181 184 187 194
151 161 166 170 173 175 177 179 181 184 188 195
152 162 166 170 173 175 177 179 182 184 188 196
153 162 167 170 173 175 177 179 182 184 189 196
154 163 167 170 174 176 177 180 182 184 189 197
154 163 168 170 174 176 177 180 182 185 189 198
155 163 168 171 174 176 177 180 182 185 190 198
155 164 168 171 174 176 177 180 183 185 190 198
155 164 169 171 174 176 178 180 183 185 190
156 164 169 171 175 176 178 180 183 185 190
157 165 169 171 175 176 178 180 183 186 191
o
158 165 169 171 175 176 178 181 183 186 191
e
160 165 169 172 175 176 178 181 183 186 192
2.5.3 Construction d'une distribution groupée
aD
d w
L'ensemble des couples formés, d'une part, des classes que nous avons construites et, d'autre
part, des eectifs de classe associées ? qui représentent les nombres d'observations appartenant à
an
ces classes - est qualiée de distribution groupée (Nous l'appelons "Distribution Groupée d'ordre
g
1 ou DG1 en abrégé). On peut la représenter par un schéma (voir (1)) qui conduit à identier les
u
classes à considérer, classes qui ont été dénies par la plus petite et la plus grande valeur observable
qu'elles peuvent contenir. Il est plus souvent judicieux de dénir les classes par les limites de classes
B
communes. Ainsi, la valeur 159,5 peut servir de limite supérieure à la première classe et de limite
t1
inférieure à la deuxième classe. Les classes peuvent dès lors être dénies comme sur le graphique
a
identié par (2) ; dont les limites se présentent comme suit :
t
Limites des classes :
S
| 149, 5 − 159, 5 | ;| 159, 5 − 169, 5 | ;| 169, 5 − 179, 5 | ;| 179, 5 − 189, 5 | ;| 189, 5 − 199, 5 |
Nous pouvons remarquer qu'en procédant de la sorte, on fait mieux apparaître le caractère déci-
mal qui a justié le choix des classes. Ces dernières sont toutes de longueur égale à 10.
Comment construire une distribution groupée ?

On doit d'abord choisir un nombre de classes que nous notons J;
Chaque classe est alors identiée par un nombre entier j compris entre 1 et J
Chaque classe j est dénie ou caractérisée par les éléments suivants :
Son centre xcj ;
Sa longueur ou amplitude hj ;
−
Sa limite (borne) inférieure lj ;
+
Sa limite (borne) supérieure lj ; et son eectif nj .
L'amplitude ou longueur d'une classe est obtenue par la diérence entre la borne supérieure et la
borne inférieurs, c'est-à-dire que :
hj = lj+ − lj− .
Et le centre d'une classe est obtenue, sous l'hypothèse que les éléments sont réparties de façon

c Université
homogène dans la classe, en calculant la moyenne de la classe par :
lj− +lj+
xcj = 2
.
La manière de présenter une D.G.1 est inspirée de celle suivie pour une D.O.1. A chaque classe
j, on associe un eectif de classe nj ou l'un des concepts suivants :
nj
Fréquence de classe :
n
fj =
Eectifs cumulés des classes : Nj = n1 + n2 + . . . + nJ
Fréquences cumulées des classes : Fj = f1 + f2 + . . . + fJ
2.5.4 Exercice d'application
e o
Reprenons l'exemple sur les tailles des étudiants, pour lequel nous avons commencé par construire
les classes. L'application des autres concepts donne le tableau suivant :
aD
n d w
lj− , lj+ xcj nj fj Nj Fj Nj∗ Fj∗
a
149,5-159,5 154,5 14 0,080 14 0,080 175
g
159,5-169,5 164,5 32 0,183 46 0,263 161
u
169,5-179,5 174,5 65 0,371 111 0,634 129
B
179,5-189,5 184,5 47 0,269 158 0,903 64
t1
189,5-199,5 194,5 17 0,097 175 1,00 17
a
TOTAL - - - - -
S t L'interprétation des éléments de ce tableau est aisée. Remarquons en particulier que Nj représente
+
le nombre d'observations appartenant aux j premières classes ou encore ≤ lj . De façon analogue,
Nj∗ est le nombre d'observations appartenant aux (J − j + 1) dernières classes, ou ≥ lj− .
2.5.5 Représentation graphique d'une DG1

A. HISTOGRAMME DES EFFECTIFS OU DES FRÉQUENCES
Il s'agit de construire dans un système d'axes coordonnées, une suite de rectangles associés à chacune
des classes j
et dont la surface est = à nj . Si hj est la longueur de la classe j , la hauteur du rectangle
nj
associé est .
hj
Cette quantité représente donc un eectif par unité de longueur de classe. Le graphique obtenu
ci-dessous est appelé histogramme des eectifs.

c Université
Surface = nj
e o
aD
n d w
a
L1- Lj- Lj+ LJ+ Valeurs de x
u g
t1 B 1
S t a
NOTA BENE :
L'eectif d'une classe sera toujours égal à la surface du rectangle considéré dans l'histogramme ;
Lorsque les longueurs de classe hj sont relativement petites, l'histogramme des fréquences est
parfois appelé "Graphe de densité locale"
B. HISTOGRAMME DES EFFECTIFS CUMULES ET COURBE CUMULATIVE
Si on associe à chaque j un rectangle de hauteur égale à Nj , l'ensemble des rectangles ainsi
construits porte le nom d'histogramme des eectifs cumulés.
On peut compléter cette représentation en dénissant la courbe cumulative comme étant la
+
ligne brisée joignant par des segments de droite, tous les points d'abscisses lj et d'ordonnées Nj
−
(∀j = 1, 2, . . . , J ) à partir d'un point initial (lj , 0). Cette courbe est dénie par une équation
y = N (x), (2.4)
où N (x) est appelé fonction cumulative. (voir [1] ; insérer)

Si on émet l'hypothèse que les observations sont réparties uniformément au sein de chaque classe,
N (x) nous permet d'estimer alors le nombre d'observations inférieures ou égales à x (x ∈ R). Comme
dans le cas précédent, on introduit un histogramme des fréquences cumulées en remplaçant les eec-
tifs cumulés Nj par les fréquences cumulées Fj . Par ailleurs, on peut, de façon analogue, dénir des

c Université
eectifs cumulés à droite Nj∗ un histogramme des eectifs cumulés à droite, et une courbe cumulative
à droite, dénie par la courbe cumulative à droite N ∗ (x). Notons aussi la possibilité de prendre en
compte les fréquences plutôt que les eectifs.
C. QUELQUES RÉFLEXIONS SUR LE REGROUPEMENT EN CLASSES
Le groupement en classe présente a priori une certaine part de subjectivité tant au niveau du nombre
de classes choisies que de leurs longueur.
Choix de la longueur de classes Dans l'exemple sur les tailles, nous avons choisi 5 classes de
longueur égale à 10 cm, en nous basant sur les diagrammes en tiges et en feuilles. Nous aurions pu
aussi retenir un nombre de classes diérent, p.ex. 6 classes de longueur h = 9cm ; ou encore 7 classes
de longueur h = 7cm. (A faire comme TP !). Ces diérents choix auront un impact sur les résultats
obtenus (ce qui est évident dès que le centre change, les eectifs aussi,. . .) Il peut aussi arriver qu'il
o
soit préférable d'utiliser des classes de longueurs diérentes. Il en est ainsi par ex. pour la distribution
e
des salaires (exprimés en centaines d'euros) comme dans la gure suivante :
aD
n d w
a
nj/hj
u g
B
25
t1
Distribution
des salaires
t a
en
S
17 centaines
d’Euros
5 5
2
Salaires
10 12 14 16 18 20 28
La dernière classe a été choisie quatre fois plus longue que les précédentes, de manière à pouvoir y

c Université
inclure des observations élevées sans devoir créer des classes intermédiaires vides.
Enn, signalons qu'il n'est pas toujours nécessaire de construire des limites de classe comportant
une décimale de plus que les observations. C'est le cas de la distribution des salaires ci-dessus pour
laquelle les classes ont des valeurs observables pour limites 1000,. . ., 2800.
Dans ce cas, les classes correspondent aux intervalles : 1000 ≤ x ≤ 1200 ; 1200 ≤ x ≤ 1400, etc.
La longueur de classe est telle qu'il serait absurde de faire intervenir des limites exactes telles que
1199.5 ou 1399,5 par exemple.
Choix du nombre de classes Le choix du nombre de classes est souvent guidé par le bon sens
et la pratique. Il dépend aussi des objectifs du groupement. S'il s'agit seulement de se faire une idée
sur la répartition générale des observations, on peut eectuer ce choix de façon relativement souple :
Pas trop peu de classes et pas trop de classes. Il existe dans la littérature, des règles empiriques pour
aider le praticien à choisir le nombre de classes. Il n'y a cependant aucune obligation à suivre ces
e o
règles.
D. AUTRES TYPES DE GRAPHIQUES
aD
w
Il existe des nombreux autres types de graphiques, spéciques des disciplines, ou des problèmes
d
particuliers. On peut citer :
n
La cartographie
a
La pyramide des âges
g
Des graphiques mettant ensemble les informations relatives à des enquêtes ou répartissant les
u
données en catégories.
B
Pour plus de détails, voir les références [7], [8], [6], [4] de notre bibliographie.
t a t1
2.6 La Transformation des données
S
La pratique de la statistique fait vite apparaître qu'en dehors de l'étude des données recueillies,
il est souvent judicieux de transformer ces données de façon à mieux répondre aux objectifs que l'on
s'est xés. Il s'agit en règle générale, de remplacer une série d'observations :
x1 , x2 , . . . , xn , par une série transformée y1 , y2 , . . . , yn , comptant ou non le même nombre d'obser-

vations. Le choix de la transformation est lié à la recherche des propriétés qui n'apparaissent pas
immédiatement ou ne sont pas rencontrées par les données de départ. Ces propriétés sont celles de
linéarité, de symétrie, de variabilité constante,. . .dont nous verrons l'importance tant dans la suite
de ce cours que dans d'autres cours tels que la statistique mathématique et l'économétrie.
2.6.1 La transformation Linéaire

On y distingue le changement d'origine et le changement d'unités.
Le changement d'origine Exemple : Considérons la série relative aux bénéces réalisés par une
société spécialisée en librairie au cours de 8 semaines successives comportant le même nombre de
jours ouvrables (ces semaines sont notées i = 1,2,. . .,8).

c Université
Semaine i 1 2 3 4 5 6 7 8
Bénéces xi 6572 12400 5272 8435 7012 10171 4237 8881
Si le directeur s'est xé un bénéce-type de 8000$ par semaine, il sera intéressé par l'écart entre le
bénéce réellement observé (xi ) et cette valeur. Notons par ei = xi − 8000 cet écart ∀i = 1, 2, . . . , 8 :
Résidus. La série ei est représentée dans le tableau suivant :
Semaines
Variables 1 2 3 4 5 6 7 8
Bénéces 6572 12400 5272 8435 7012 10171 4237 8881
Résidus -1428 4400 -2728 435 -988 2191 3793 881
Un écart négatif signicatif signie qu'il y a manque à gagner. Au contraire un écart positif donne
de la réserve. La série ei est obtenue à partir de xi au moyen d'un changement d'origine dénie par
la relation :
o
ei = x − 8000. Graphiquement, il s'agit d'une translation d'axes, c'est-à-dire qu'on remplace l'axe du
e
temps 0x t1 par l'axe 0e t2 .
D
Oe x = 8000 ;
a
L'origine des écarts correspond en eet à l'allure du graphique n'est bien sûr pas
modié.
Le changement d'unité
n d w
Une deuxième transformation linéaire importante consiste à eectuer un
changement d'unité. Dans le même exemple, on peut vouloir exprimer le bénéce en milliers d'euros.
a
Il sut de diviser toutes les valeurs observées par 1000. Le tableau suivant donne les valeurs trans-
g
formées. Le tableau suivant donne les valeurs transformées.
Semaines
B u
t1
Variables 1 2 3 4 5 6 7 8
Bénéces 6572 12400 5272 8435 7012 10171 4237 8881
t a
Résidus 6.572 12.400 5.272 8.435 7.012 10.171 4.237 8.881
S
Changement d'origine et d'unité On peut aussi décider de prendre conjointement une nouvelle
origine-que nous appellerons xo -et une nouvelle unité-que nous désignons par d (c'est-à-dire à d fois
la précédente). Dans ce cas, nous introduisons une transformation linéaire dénie par l'équation
x − xo
u=
d
où u est une variable transformée.
Exemple :
Notre directeur estime qu'un excédent de bénéce ne devient intéressant que s'il dépasse l'objec-
tif de 8000 de plus de 1000 euros. De même, il ne commence à s'inquiéter que si le bénéce est à plus
de 1000 en-dessous de cet objectif.
Pour prendre en compte cette situation, il eectue en même temps un changement d'origine (il
prend xo = 8000 comme nouvelle origine) et un changement d'unités (il choisit d = 1000 comme
nouvelle unité), ce qui l'amène à considérer les valeurs :
x − 8000 ei
u= =
1000 1000

c Université
Ce rapport correspond à l'écart du bénéce par rapport à 8000$, exprimé en pourcentage par rapport
à 1000$. Comme on peut le voir, la variable obtenue suite à un changement d'origine et d'unité est
sans dimension. Nous verrons dans la suite l'importance particulière d'une telle variable dans les
analyses statistiques.
Semaines
Variables 1 2 3 4 5 6 7 8
Bénéces 6572 12400 5272 8435 7012 10171 4237 8881
Résidus -1.428 4.400 -2.728 .435 .-988 2.191 3.793 .881
14000
e o
aD
12000
w
10000
d
8000
n
6000 semaine i
a
Bénéfice
4000
g
Résidus
u
2000 ui
B
0
1 2 3 4 5 6 7 8
t1
-2000
-4000
t a
-6000
2.6.2 Transformations fonctionnelles
famille simple des transformations

Dans le but de simplier l'analyse en rendant les phénomènes moins asymétriques, plus linéaires,
de Tukey
on recourt fréquemment à des transformations appartenant à la
:
1 1 1 √
..., 2
; ; √ ; log x; x; x, x2 , x3 , . . .
x x x

c Université
On verra dans beaucoup de cours avancés de statistiques et méthodes quantitatives que la transfor-
mation logarithmique est particulièrement intéressante.
En eet, si on remplace les valeurs xi par les valeurs :
Yi = log10 xi
On constate un tassement des données qui diminue l'importance des grandes valeurs et donc réduit
la variabilité des observations et rend leur distribution plus symétrique.
o
1 10 100 1000
e
xi
aD
d w
yi
an
0 1 2 3
u g
t1 B
S t a
2.6.3 Rapports et indices

Un autre type de transformation très utilisée consiste à eectuer le rapport entre deux valeurs de
la variable an de les comparer. Si en outre on compare toutes les observations à l'une d'entre elles
(Ex : la 1ère), on dénit le concept d'indice. Ce dernier permet de comparer des situations dans des
endroits diérents, ou le plus souvent, à des époques diérentes.
Exemple :

c Université
Supposons que l'on dispose d'observations d'une variable X à des époques distinctes t1 , t2 , . . . ; On
choisit une époque de base, destinée à servir de référence (Ex : date t1 ).
Un indice permet de mesurer les modications relatives de X en des instants quelconques par rapport
à cette époque de base, en comparant les valeurs de la série observée Xt à la valeur correspondant à
la date t1 .
it xt
(x) =
t1 xt1
Cette notation signie que l'on considère l'indice pour la variable X de l'époque courante t par rap-
port à l'époque de base t1 . Considérons le prix xt en dollars d'un produit de consommation relevé le
1er janvier des années 2001 à 2008.
2001 2002 2003 2004 2005 2006 2007 2008

t 1 2 3 4 5 6 7 8
xt 25 25 27 28 32 33 34 35
o
it
Indice 1 1 1.08 1.12 1.28 1.32 1.36 1.40
e
tx
Année de base=2001. En pratique, les indices sont exprimés en pourcentage (100, 100, 108, 112,. . .).
D
On peut alors constater que de 2001 à 2008, le prix du produit s'est accru de 40%. Un indice, comme
a
on vient de le voir, est un nombre sans dimension (nous y reviendrons en détails au chapitre IV).
2.7 Compléments du chapitre II
n d w
a
Dans cette section, nous insérons quelques pages tirées de Mazerolle (2006) sur les taux de crois-
g
sance, ainsi que le rappel sur l'utilisation des sommes.
B u
t a t1
S

' !0&1 & &+ &+2 ! ! 3+4&+ !
"
&
#
R !
D E ': 5?6
R
e o
1 E RC E ! R E! ! A
aD
& R XR C
n d9
w
A
u g a
E ': 5O6
B
5F6
t1
E:T
S t
&
S
a #
R E :OC
RC E :CC
$CO :CC E OC[
R / RC ! $ :OC':CC E OC
:6 S # ! ! !
! $ R / RC 9 !
$ :OC ' :CC E OC +
!
5B6
!
;6 + "
& ) :CC $ :OC $ 5:OCX:CC6 / : E C O

! H OC[ $
:OC :OC5:'C O6 E BO A ! ! & " '
. " OC[ ! OC[
o
:OC
e
TOC[
'OC[
D
:CC
a
BO
n d w C : ;
a
1 ; I # &
g
:
:I
u
5M6
B
" O[ ! " ;[
t1
?[ 5 ? 6\
S t a
1 : ; I
:I
# &
5K6
3 '$'
5K':6
! :E :C[ ;E ;C[
? E NC[ ? 1
E 5:TC :65:TC ;65:TC N6':EC MNM

' !0&1 & &+ &+2 ! ! 3+4&+ !
5:C6
) *
1 $
o
5::6
&
D e
a
5:;6
d w
+
n
5:?6
1 4
!
u g a ?[ &
N[ ]
t1 B 5: T C CN65: ' C C?6 / : E 5: CN C KB6 / : E T C CCMM
t a
1 " C MM[
S 1
)
$
*
5:N6
&
5:O6
$
5:F6
4 N[ ]
C MM[ Q
!
o
5: T C CCMM6X5: T C CN6 ' :E C KB / : E ' C C?
e
! ?[
D
!
a
! 5?[6
5N[6
n d w
g a
# 4 )
u
) <1 <
t1 B
1
a
! ! &
t
: ; ? N
N !
S & " < : $ N<
! ! 3
: ;
'? ?
'N N
; O
' !0&1 & &+ &+2 ! ! 3+4&+ !
9 =
: ; : ? ;
'? ? K C ;B
e o
'N N :F C FN
D
; O N B ;C
wa
!$
an d
g
+*
u
# 4 )
B
)
t a t1 ! ! &
S
: ; ? N
N!
& " < : $ N<
! ! 3
: ;
'? ?
'N N
; O
9 =
: ; : ? ;
'? ? K C ;B
e o
'N N :F C FN
D
; O N B ;C
a
$
n d w
u g a
t1 B
S t a
Chapitre 3
ÉTUDE DES INDICATEURS DE
TENDANCE CENTRALE, DE
DISPERSION ET DE FORME
e o
D
Les tableaux et Graphiques sont généralement insusants pour tirer les informations essentielles
a
comprises dans les données. Il faut : résumer l'information, pour mieux l'interpréter. Il y a donc
nécessité de calculer les valeurs typiques, les indicateurs ou paramètres. Cela peut alors donner lieu
w
à des nouvelles représentations graphiques. Dans ce chapitre, nous nous intéressons au calcul des ces
d
paramètres, en considérant les données univariées. Dans le cinquième chapitre, on verra comment que
n
ces calculs du cas univarié se généralisent aisément dans les cas multivariés et les séries chronologiques.
g a
3.1 Le concept de position ou de tendance centrale
u
t1 B
Qu'il s'agisse d'une série observée, d'une distribution observée, ou d'une distribution groupée (par
nombres résumés
valeurs), les variables quantitatives peuvent être utilement résumées par des caractéristiques dites de
a
tendance centrale (ou de position). Ces sont ainsi appelés parce qu'ils privilégient
t
les valeurs principales de la distribution ; au détriment par exemple de ceux qui caractérisent la
S
dispersion ou la concentration des valeurs d'une série (Mazerolle, 2006). Ces valeurs centrales sont
la moyenne, la médiane et le mode. Nous exposerons leur mode de calcul et leurs signications
en distinguant pour chacune d'elles le cas des séries observées, des distributions observées, et des
distributions groupées.
3.1.1 Les moyennes

Nous mettons ce titre au pluriel parce qu'il existe plusieurs types de moyennes.
La moyenne arithmétique :
A. Dénition
Dénition 13 La moyenne arithmétique d'une série statistique x1 , x2 , . . . , xn se dénit comme étant
égale à la somme des observations divisées par l'eectif n de la série. Elle est notée x̄ ou µ.
Comme une somme de nombre ne dépend pas de l'ordre dans lequel il se présente, on peut aussi
dénir la moyenne à partir de la série ordonnée x(i) , i = 1, 2, . . . , n.
Formellement, on a
n n
1X 1X
x̄ = µ = xi = x(i) (3.1)
n i=1 n i=1
51
c Université
B. Exemple
Exemple 16 Soit la série des chires 8, 5, 9, 13, 25. La moyenne arithmétique de cette série est :
8 + 5 + 9 + 13 + 25 60
= = 12
5 5
Comme nous l'avons indiqué précédemment, nous ne distinguerons pas la moyenne de la popula-
tion et la moyenne de l'échantillon (ça sera matière du cours de Théorie de sondage). Nous traitons
donc les chires sans nous préoccuper de ce problème.
Remarques 1 C. Remarques
Une moyenne arithmétique n'a de sens que pour les valeurs observées numériques ;
Cette valeur typique est unique : une série ne peut pas posséder plusieurs moyennes distinctes.
En revanche, deux séries distinctes peuvent (de manière tout à fait fortuite !) posséder la même
o
moyenne arithmétique ;
e
Il en résulte que la moyenne arithmétique à elle seule ne peut sure pour résumer l'information
D
statistique d'une série ;
a
Il est utile de noter que la moyenne arithmétique est rarement une valeur observée car il n ?y
w
a a priori aucune raison pour cela.
d
x̄ a donc un statut diérent de xi .
g an
L'individu moyen n'existe donc que ctivement, et sa seule raison d'être est de représenter un
u
centre, un milieu (La moyenne est un centre de gravité ;)
B
Cet indicateur présente cependant plusieurs avantages que nous présentons à travers ses pro-
t1
priétés
Propriétés :
a
A partir de :
t
Propriété 1
S
n
1X
x̄ = xi (3.2)
n i=1
On tire : n
X
xi = nx̄ (3.3)
i=1
Cette relation 3.3 est fort utilisée dans les développements futurs en vue de dégager d'autres
propriétés théoriques importantes.
Propriété 2 La somme des valeurs centrées (x − x̄) est toujours nulle.

i
Pn Pn
En eet, en utilisant la propriété de l'addition, on a i=1 (xi − x̄) = i=1 xi − nx̄ = nx̄ − nx̄ = 0
par la relation 3.3.
Exemple :
xi 8 5 9 13 25
P5
xi − x̄ -4 -7 -3 1 1 i=1 (xi − x̄) = 0

c Université
Propriété 3 Si on agrège deux ensembles E et E d'observations; le premier d'eectif n et de

moyenne x̄ , Et l'autre d'eectif n et de moyenne x̄ , La moyenne de la série agrégée E, d'eectif
1 2 1
n = n + n s'exprime à partir des moyennes arithmétiques de E et E par la relation :

1 2 2
1 2 1 2
n1 x̄1 + n2 x̄2
x̄ = (3.4)
n
Il s'agit d'une moyenne pondérée 1
des moyennes des deux séries . La démonstration de cette rela-
tion se fera dans le cadre des travaux pratiques.
Exemple 17 Soient E 1 = 1, 2, 3, 4, 5 et E 2 = 10, 11, 12 .

n1 = 5 , n = 3. 2
= 3, x̄ = 11.
o
x̄1 2
D e
L'application directe de la formule donne :
a
5x3 + 3x11
n= =6
w
8
d
Ce qui est la même chose que
g an x̄ =
1 + 2 + 3 + 4 + 5 + 10 + 11 + 12
8
=6
u
Cette propriété peut aisément être généralisée au cas de l'agrégation de plusieurs séries observées.
B
En outre, la propriété est vraie, quelles que soient les valeurs observées. Elle est très utile notamment
t1
dans le cas des sondages stratiés. Un cas particulier intéressant est celui où le groupe E2 est de
a
taille 1. Si E2 se réduit à une seule observation xp , alors n2 = 1 et x̄2 = xp . On a donc :
S t
n1 x̄1 + xp
x̄ = (3.5)
n
où n = n1 + 1 Cette expression permet de mettre à jour le calcul d'une moyenne arithmétique à
chaque fois que l'on ajoute une valeur supplémentaire.
Propriété 4 Le calcul de la moyenne implique la prise en compte de toutes les observations, c'est
leur somme qui est divisée par l'eectif n. D'où la moyenne arithmétique simple peut être inuencée
par la présences des observations soient extrêmement petites soit extrêmement grandes. On dit que
la moyenne est inuencée par les les données aberrantes ou extrêmes.
Exemple 18 Dans un auditoire de première année à l'université, on a des étudiants dont l'âge varie
entre 18 et 21 ans. Il se pourrait toutefois qu'il y ait quelqu'un qui, après avoir travaillé plusieurs
années, a décidé de rentrer au banc de l'université.
Soit la série illustrative suivante : {18, 19, 21, 20, 18, 19, 50}.
L'âge moyen de cette série est 23.57 ans (ceci est anormal car cet âge moyen est supérieur à tous
les étudiants sauf celui de 50 ans! Et ce dernier n'est même pas "bien représenté" par cette valeur.)
Si on ignore cet étudiant qui est "trop âgé" par rapport aux autres, la moyenne de la série sans lui
devient 19.1 qui représente mieux ces étudiants.
1. Nous reviendrons sur cette notion dans la section suivante

c Université
moyenne élaguée
moyenne tronquée
Ainsi, en retirant la valeur "extrême" ou "aberrante", on dit qu'on a calculé la
ou . De manière générale, le statisticien ordonne la série, puis décide de manière
plus ou moins arbitraire (en fonction de l'observation qu'il fait sur les données, et de l'expérience qu'il
fait sur ces donnés), de supprimer quelques observations au début de la série et quelques observations
à la n de la série. Supposons que l'on décide de tronquer une valeur avant (la plus petite car la série
est ordonnée) et une valeur après (la plus grande pour la même raison) ; la formule serait alors la
suivante :
n−1
1 X
x̄tr = x(i) (3.6)
n − 2 i=2
Avec x̄tr la moyenne tronquée, et x(i) la série ordonnée où x(1) est le minimum et x(n) est le
maximum.
D. Moyenne dans le cas d'une Distribution observée, D.O.1 :
o
L'analyse d'une série statistique conduit souvent à la construction d'une distribution observée obte-
e
nue en associant à chaque valeur distincte recueillie xj , un eectif nj représentant le nombre de fois
(j = 1, 2, . . . , J).
D
qu'elle est apparue Dans ces conditions, on peut écrire :
wa 1X
J
d
x̄ = nj x̄j (3.7)
n j=1
Exemple 19
g an
Reprenons le cas du nombre de voitures possédées par les familles
u
{0, 0, 1, 1, 1, 1, 1, 2, 2, 3}
t1 B
0+0+1+1+1+1+1+2+2+3
x̄ = = 1, 2
10
t a
L'on pouvait également calculer par :
S
2x0 + 5x1 + 2x2 + 1x3
x̄ = = 1, 2
10
Nous pouvons partir de cette notion pour dénir ce qu'on appelle la moyenne pondérée . De ma-
nière générale, soient {x1 , x2 , . . . , } une série de chires, et {n1 , n2 , . . . , } les eectifs correspondants.
La formule de la moyenne arithmétique pondérée est donnée par 3.7, que l'on peut encore écrire :
PJ nj
x̄ = j=1 f j xj ; avec fj = n
appelé Coecients de pondération.

On peut noter qu'une propriété importante de ces pondérations est que leur somme
PJ
j=1 fj = 1
(cette relation doit toujours être respectée). L'utilisation de la moyenne pondérée est très fréquente,
notamment dans l'évaluation des étudiants (chaque cours ayant une pondération diérente selon la
faculté par exemple), dans le calcul des indices de prix (chaque article du panier de la ménagère :
viande, légumes, habits, dépenses scolaires, dépenses des soins de santé,. . .ayant une importance dif-
férente). Prenons le cas de l'évaluation d'un étudiant ayant suivi un certain nombre de cours inscrits

c Université
dans un programme :
Cours points sur 20 pondération

Mathématiques 19 6
Statistiques 19 6
Comptabilité 16 5
Langues 14 3
Informatique 17 5
Recherches opérationnel 15 6
Civisme 12 1
Religions et morale 12 1
Sports 14 2
Total 138 35
e o
Si l'on ne tient pas compte de l'importance de chaque cours dans le programme (c'est-à-dire sa
pondération), cet étudiant a 138/180 = 15, 33/20 = 76.6%. Par contre, si l'on tient compte des
D
coecients de pondération, le pourcentage pourrait changer comme suit :
wa
19x6/35 + 19x6/35 + 16x5/35 + 14x3/35 + 17x5/35 + 15x6/35 + 12x1/35 + 12x1/35 + 14x2/35 =
d
16, 49/20 = 82, 45%
g an
On voit que le pourcentage de l'étudiant va varier en fonction des pondérations des cours, ce
u
qui pousse parfois à se concentrer davantage aux cours qui sont fortement pondérés dans votre pro-
B
gramme d'étude.
t1
Supposons que tous les cours avaient une pondération 4. Le total de pondérations serait 4x9=36 ;
a
puis on multiplierait les points de chaque cours par 4/36 c'est-à-dire par 1/9, ce qui revient à calculer
t
la moyenne arithmétique simple. L'étudiant aurait donc 76, 6%.
S E. Moyenne dans le cas d'une Distribution Groupée D.G.1

Lorsqu'on ne dispose que d'une distribution groupée, sans posséder les données initiales, il n'est
plus possible de déterminer la moyenne arithmétique de la série observée. On peut cependant en
calculer une valeur approchée qu'on notera également x̄ et que l'on dénit par :
J
1X
x̄ = nj xcj
n j=1
avec xcj le centre de la classe j.

Cette dénition, basée sur les centres de classe xcj et les eectifs de classe nj , est telle que nous
agissons comme si la valeur centrale xcj était apparue nj fois (j = 1, ?, J ) ; ce qui suppose une certaine
répartition uniforme des observations dans chaque classe ou tout au moins une répartition telle que
le centre de la classe puisse être considérée comme la moyenne des valeurs observées dans la classe.
Exemple 20 Reprenons les données sur les tailles des étudiants. Comme nous disposons de toutes
les valeurs observées, la détermination de la moyenne arithmétique simple nous fournit 175.5. La
c Université
Table 3.1 Éléments permettant le calcul de la Moyenne dans une distribution groupée
Classes nj xcj nj xcj

149.5-159.5 14 154.5 2163
159.5-169.5 32 164.5 5264
169.5-179.5 65 174.5 11342.5
179.5-189.5 47 184.5 8671.5
189.5-199.5 17 194.5 3306.5
TOTAL 175 30747.5
valeur approchée de x̄ pour la D.G.1 dans cet exemple peut être obtenue par l'intermédiaire du tableau
suivant (disposition pratique) :
Le tableau 3.1 (spécialement sa 4ème colonne) permet d'obtenir l'élément principal qui permet
de calculer aisément la moyenne dans une distribution groupée. L'application directe de la formule
o
donne :
e
30747,5
x̄ = = 175.7.
D
175
a
On constate une légère diérence avec la moyenne d'une série observée. Il convient de noter que
w
la valeur 175.7 n'est qu'une approximation, et qu'elle pouvait changer si l'on regroupait les données
d
en un nombre diérent de classes. En l'occurrence, un groupement en 6 et 7 classes, par exemple
n
conduira à des approximations diérentes pour la moyenne d'une distribution groupée. Celles-ci se
a
répartissent néanmoins autour d'une valeur exacte de x̄ et sont du même ordre de grandeur que cette
g
dernière. F. Inuence d'un changement d'origine ou d'unité Les calculs nécessaires pour ob-
u
tenir x̄ peuvent être parfois relativement laborieux, même si on utilise des moyens ecaces. Surtout
B
lorsque les valeurs observées xj ou xcj sont élevées, ou que les nj sont assez grands. C'est pourquoi il
t1
peut être utile d'eectuer un changement d'origine et éventuellement d'unité dans le but de réduire
le volume des opérations. Ce type de transformation a d'ailleurs d'autres objectifs tant du point
a
théorique que pratique. Plaçons-nous dans le cas d'une D.O.1 :
S t
(xj , nj )∀j = 1, 2, . . . , J .
Nous avons déjà vu que le choix dune nouvelle origine

valeurs xj sont transformées en :
xo et d'une nouvelle unité d implique que les
xj − xo
uj = ; j = 1, 2, . . . , J (3.8)
d
Notons par
J
1X
ū = nj uj (3.9)
n j=1
la moyenne arithmétique de la distribution uj , nj ; ∀j = 1, 2, . . . , J .
En remplaçant uj par sa dénition 3.8 dans 3.9, on a :
J
1X xj − xo
ū = nj
n j=1 d
ce qui donne :

c Université
x̄ − xo
ū = (3.10)
d
Nous avons vu que si xj , xo et d s'expriment en unités spéciques (mètres, cm, poids, euros, etc),
uj reste sans dimensions. Il en sera de même pour ū.
Cette propriété sera très utile dans la suite.
Et de 3.10 on peut tirer :

x̄ = dū + xo (3.11)
3.11 est valable dans le cas d'une série statistique comme dans le cas d'une distribution groupée.
Exemple d'illustration
Reprenons la distribution groupée en 5 classes présentées dans le tableau précédent (3.1). Pour
réduire l'importance des valeurs xcj , choisissons une nouvelle origine xo = 174.5 et une nouvelle unité
o
d = 10. Les valeurs de uj dénies par 3.8 sont contenues dans le tableau suivant :
e
Classes xcj nj uj nj u j
aD
149.5-159.5 154.5 14 -2 -28
159.5-169.5 164.5 32 -1 -32
w
169.5-179.5 174.5 62 0 0
d
179.5-189.5 184.5 47 1 47
n
189.5-199.5 194.5 17 2 34
a
TOTAL 175 0 21
u g
Comme on le constate, le choix d'un centre de classe pour origine et de la longueur de classe pour
unité (constante) nous fournit pour valeur transformée, des entiers relatifs proches de zéro. Il s'agit
B
ū
t1
des nombres plus faciles à manier ainsi qu'on le constate lors du calcul de :
a
L'utilisation de 3.9 donne :
S t
1
PJ 21
ū = n j=1 nj uj = 175
= 0.12.
Et 3.11 donne :
x̄ = dū + xo = 10x0.12 + 174.5 = 175.7.
Les autres types de moyennes :
A. LA MOYENNE GÉOMÉTRIQUE
multiplicateur moyen
Elle est utilisée quand on étudie les variations relatives en particulier les accroissements. La
moyenne géométrique est utilisée pour calculer le d'une grandeur.
Soit X une grandeur qui croît successivement de r1 , r2, . . . , ri
Xi = X(1 + r1 )(1 + r2 ) . . .
Si le taux de croissance r est constant (par hypothèse), on obtient :
Xi = Xo (1 + r)n
Le multiplicateur moyen (1 + r) peut être obtenu par
r
n Xi
(1 + r) =
Xo

c Université
De manière générale, soit x1 , x2 , . . . , xn une série de chires.

La formule de la moyenne géométrique simple est donnée par :
" n
# n1
Y
G= xi (3.12)
i=1
On peut démontrer (cf. Travaux pratiques), que cette formule peut s'écrire sous-forme logarith-
mique pour plus de simplicité. En eet, son développement conduirait à :
1 P
logXi
n G = 10 (3.13)
et si nous utilisons le logarithme népérien, il sut de remplacer 10 par e et log par "ln".
Exemple 21 Soit une série de chires {8, 5, 9, 13, 25}

La moyenne géométrique de cette série est égale à :
√
G = [8x5x9x13x25]1/5 = 117000 ∼
5
o
= 10.32
e
Généralement, lorsqu'on s'intéresse aux accroissements moyens en pourcentage (d'une population,
D
d'une production, des stocks,. . .), ou des ratios moyens en général, on recourt à la moyenne géomé-
a
trique. Non seulement celle-ci est moins sensible aux valeurs extrêmes, mais aussi elle ne surévalue
w
pas les estimations futures.
Exemple 22
n d
Calculez le taux moyen de dividende pour les entreprises suivantes :
a
u g
Entreprises Taux X de dividendes log X
A 37.1 1.5694
t1 B
B 1140 3.0569
C 0.927 -0.0329
a
D 2.70 0.4314
t
E 842 2.9253
S
7.9501
Le taux moyen de dividendes pour les entreprises de ce secteur est :
√
5
37.1x1140x0.927x2.70x842 = 38.90
La procédure logarithmique 3.13 permet de simplier les calculs. En eet :
Pn
logXi
i=1 7.9501
log G = = = 1.59
n 5
1.59
D'où l'accroissement moyen des dividendes est égale à 10 = 38.9%.
Il est intéressant de constater que cette moyenne contraste très fort avec la moyenne arithmétique
qui serait de
37.1+1140+0.927+2.70+842
5
= 404, 54 qui est fort éloigné des valeurs observées !
Lorsqu'on est en présence d'une distribution observée, il convient de calculer la moyenne géomé-
trique pondérée, qui tient compte de la taille de chaque groupe ni . Dans ce cas la formule devient :
" # 1
n
Y n
G= xni i
i=1

c Université
Table 3.2 données d'illustration type de moyennes
xi 25 8 4 12
ni 10 16 25 20
Exemple 23 Soit la distribution donnée ci-dessous :

L'application directe de la formule donne :
1 1
G = [ ni=1 xni i ] n = [2510 + 816 + 425 + 1220 ] 71 .
Q
L'utilisation directe de la calculatrice, ou la démarche logarithmique donne G = 8, 2488.
B. LA MOYENNE HARMONIQUE
Dénition 14 La moyenne harmonique Mh correspond à l'inverse de la moyenne arithmétique des
o
inverses des observations.
Soit
D e
{x1 , x2 , . . . , xn } une série d'observations. La formule de la moyenne harmonique de cette série
a
est :
n
MH = Pn (3.14)
w
1
i=1 xi
d
Exemple 24 Soit la série des chires {8, 5, 9, 13, 25}.
g an
La moyenne harmonique de cette série est :
5 5
u
MH = = ∼
= 9.04
1 1 1 1 1
+ + + + 0.5530342
B
8 5 9 13 25
t1
Cette moyenne est surtout utilisée lorsque la grandeur a une dimension de vitesse (vitesse de
circulation de la monnaie, rotation moyenne des travailleurs, etc ; et en démographie pour calculer la
a
moyenne d'enfants par génération).
t
Pour illustrer cet aspect, introduisons la version pondérée de la moyenne harmonique ( moyenne
S
harmonique pondérée), qui est celle utilisée lorsque l'on dispose d'une distribution observée.
Dans ce cas, la formule change légèrement en vue de tenir compte des eectifs de chaque groupe,
ce qui donne :
n
MH = Pn ni (3.15)
i=1 xi
Exemple 25 Une petite usine fabrique 2 machines. La première machine a produit 500 pièces à la
vitesse de 100 pièces à l'heure. Une seconde machine a produit 300 pièces à la vitesse de 60 pièces
à l'heure. Calculez la vitesse moyenne (exprimée en nombre de pièces par heure) de production dans
l'usine.
RÉSOLUTION :
n = 800, n1 = 500, x1 = 100 n2 = 300, x2 = 60.
L'utilisation directe de la formule donne :
800 800
Vitesse Moyenne = 500
+ 300
= 10
= 80
100 60
Donc la vitesse moyenne est de 80 pièces par heure.

c Université
Exemple 26 Application personnelle : Reprendre les données du tableau 3.2, et calculez la moyenne
harmonique.
C. LA MOYENNE QUADRATIQUE
La moyenne quadratique simple Soit la série de chire {−4, −2, 0, 2, 4}. Si l'on calcule la
moyenne arithmétique simple on obtiendra 0. Parfois on souhaite obtenir une caractéristique de
tendance centrale ayant une valeur positive là où le calcul de la moyenne simple aurait donné zéro.
Dénition 15 On calcule alors la Moyenne Quadratique en additionnant les carrés de toutes les
valeurs de la série et en prenant la racine carrée du total.
Dans notre exemple, nous obtenons :
q q
(−42 )+(−22 )+02 +22 +42
= 40 ∼
= 2.83.
o
5 5
e
La formule générale de la moyenne quadratique simple s'écrit comme suit :
D
v
u n
a
u1 X
Q=t x2 (3.16)
n i=1 i
La moyenne quadratique pondérée
n d w :
a
Soit x1 , x2 , . . . , xn un ensemble de chires (variables) et n1 , n2 , . . . , nh les eectifs correspondants
g
(après regroupement sous-forme de Distribution observée). La formule de la moyenne quadratique
u
pondérée de cette série est donnée par :
t1 B
v
u n
u1 X
Q=t (ni x2i ) (3.17)
a
n i=1
S t
Exemple 27 A partir des données du tableau 3.2, il sut de construire un tableau comprenant x et
qui sont des éléments importants de la formule, puis de faire la somme de n x et de la diviser
ni x2i
par n.
2
i i
2
i
Un tel tableau est repris ci-dessous :
xi ni x2i ni x2i
25 10 625 6250
8 16 64 1024
4 25 16 400
12 20 144 2880
Pn 2
i=1 (ni xi ) = 6250 + 1024 + 400 + 2880 = 10554
10554
En appliquant la formule 3.17, nous obtenons Q= 71
= 12.19.
Lorsque les données sont sous-forme groupée (distribution groupée), on remplace xi par xci qui
est le centre de la classe, et on applique la formule 3.17.

c Université
3.1.2 La Médiane
A. LA MÉDIANE D'UNE SÉRIE STATISTIQUE :
La médiane est une valeur typique qui, comme la moyenne arithmétique, se situe au milieu d'une
série ordonnée x1 , x2 , . . . , xn . Mais contrairement au paramètre précédent, elle n'est pas liée à la
valeur numérique des observations : c'est la position de cette dernière les unes par rapport aux autres
qui va être prise en compte.
Sa dénition s'obtient dès lors à partir de la série ordonnée x(1) , x(2) , . . . , x(n) , où l'indice i est le
rang de l'observation concernée. On constate ainsi que ce paramètre ne peut être déni que si
les valeurs de la variable sont mesurées sur une échelle ordinale ou quantitative.
Dénition :
Dénition 16 Dans une première approche, nous pouvons dire que la médiane est une valeur, notée
, telle que le nombre d'observations de la série ordonnée qui la précèdent est égale au nombre
o
x1/2
d'observations qui la suivent.
Si n
D e
est impair, la médiane est donnée par :
x1/2 = x n+1 .
wa
d
2
l'observation de rang
n
n+1
La médiane est donc .
2
Exemple 28
u g a
Dans la série {1, 2, 3, 4, 5, 10, 11}, la médiane est :
x 7+1 = x4
t1 B = 4.
a
2
t
Si n est pair, il y a une diculté de dénition.
S
Supposons en eet qu'il y ait une huitième observation x8 = 12. Toute observation comprise entre
intervalle médian
4 et 5 laissera 4 observations avant et 4 observations après et donc satisfait à la propriété désirée.
On dit alors que ces 2 observations dénissent un . Son usage n'est pas aussi
la moyenne arithmétique des deux observations qui

simple que celui d'une valeur. Aussi, lorsque les observations sont numériques, on décide générale-
délimitent cet intervalle

ment (convention !) de dénir comme médiane,
.
x n2 + x n+1
2
x1/2 =
2
Cette formule a l'avantage d'assurer l'unicité de la médiane.
Propriété 5 Contrairement à la moyenne arithmétique, la médiane n'est pas inuencée par les va-
leurs extrêmes (aberrantes). Elle est donc plus "robuste" que la moyenne.
Médiane d'une distribution observée :
La dénition de la médiane telle que nous l'avons donnée ci-dessus est particulièrement simple quand
les valeurs observées sont distinctes, et que l'on dispose de la série ordonnée. Mais comment peut-on
procéder pour déterminer x1/2 si on possède plutôt une distribution observée

c Université
{(xj , nj ), j = 1, 2, . . . , J}
Rappel :
On va se baser sur la dénition de la fonction cumulative N (x) qui représente le nombre d'observations
o
qui sont inférieures ou égales à x ; et la fonction cumulative à droite N ∗ (x) (Correspondant au nombre
e
d'observations supérieures ou égales à x).
Les fonctions
aD
N (x) et N ∗ (x) vont nous permettre de formuler aisément la dénition de la médiane
w
qui s'exprime au moyen de l'équation :
an d
u g
t1 B N (x1/2 ) = N ∗ (x1/2 )
S t a
La solution de cette équation est soit unique (correspondant au cas où n était impaire dans une
série ordonnée) ; soit indéterminée (correspondant à la situation de n paire dans une série ordonnée ;
et on dénissait alors un intervalle médian). Dans ce dernier cas, on prend pour médiane, la moyenne
des valeurs qui dénissent cet intervalle (si ces valeurs sont numériques). La démarche suivante basée
sur la courbe cumulative des eectifs sera utilisée dans la pratique :
S'il existe une valeur xj telle que Nj−1 < n2 < Nj , alors x1/2 = xj , en posant N0 = 0 si j=1
S'il existe une valeur xj telle que Nj = n/2, alors
x +x
x1/2 = j 2 j+1
Graphiquement, nous avons les deux situations suivantes :

c Université
Nj Nj
n/2 n/2
e o
x1
a
x1/2
D xJ xj x1
w
x1/2
unique.
an d
Dans cette situation, la médiane est
Dans cette situation, la médiane est
g
indéterminée: classe médiane.
B u
t a t1
S
− +
Sur le deuxième graphique, il faut (conventionnellement) calculer la moyenne entre lm et lm , et la
extrapolation linéaire
valeur trouvée est l'approximation de la médiane.
Toutefois, algébriquement, il s'agira de procéder par une , ce qui conduit géné-
ralement à une valeur légèrement diérente de celle trouvée par l'approche graphique.
Nous prenons deux illustrations pour appuyer ces deux situations.
Première illustration : Médiane unique :

Reprenons le cas des données sur les véhicules que possèdent diérentes familles, ce qui donne une
médiane de 1 suivant la démarche graphique illustrée ci-dessous :

c Université
Illustration
Construisons la courbe cumulative associée à la D.O1 {(0,2), (1,5), (2,2), (3,1)}
représentée dans la figure ci-dessous.
Nj
o
10/2=5
e
Donc médiane = 1
aD
d w
2
g an 1 2 3 xj
B u
t a t1
S
Exercice d'application individuelle Il apparaît que cet exemple conduit à une situation où la
médiane est unique.
A partir de ce graphique, du tableau d'eectifs et fréquences cumulés que nous avions construit
avec les mêmes données, montrez que :
N (1) < 5 et N ∗ (1) > 5 ; respectant ainsi la dénition de la médiane à partir des eectifs cumu-
lés et eectifs cumulés à droite.
Deuxième illustration : Pluralité de médiane et extrapolation linéaire pour trouver une

médiane unique :
Soient la distribution donnée par le tableau suivant :
xj 2 8 9 10 11 12 13 15 18
nj 2 3 4 4 5 3 6 1 2
La disposition pratique suivante permet de décrire la démarche pour trouver la médiane :

c Université
xj nj fj Nj Fj
2 2 0.066 2 0.066
8 3 0.1 5 0.167
9 4 0.133 9 0.3
10 4 0.133 13 0.433
11 5 0.167 18 0.6
12 3 0.1 21 0.7
13 6 0.2 27 0.9
15 1 0.033 28 0.933
18 2 0.067 30 1
Pour déterminer la médiane :
n
1. On repère 0.5 dans la colonne des fréquences, ou dans la colonne des eectifs cumulés (Nj ) ;
2
F (x) égale ou immédiatement supérieure à 0.5 ou alors la valeur N (x)
eo
2. On choisit alors la valeur
n
égale ou immédiatement supérieure à . Choisissons de procéder avec les eectifs cumulés (les
2
étudiants sont invités à essayer avec les fréquences cumulées). Dans l'approche des eectifs
D
cumulés, la valeur directement supérieure à n/2 est 18. Or, nous cherchons la valeur de xj
a
pour laquelle N (x) est égale à 15, c'est-à-dire N (x1/2 ) = 15.
d w
3. Comme il n'y a pas une telle valeur dans le tableau, nous cherchons les valeurs qui encadrent
n
15 (n/2) :
g a
15 est compris entre 13 et 18 dans le tableau. Pour N (x) = 13, xj = 10. Et pour N (x) = 18,
u
xj = 11.
t1 B
L'extrapolation linéaire permet de trouver une valeur de la médiane x1/2 = 10.4 ; et comme
on peut le voir, cette valeur est comprise entre 10 et 11, les deux valeurs de xj qui encadrent
a
la médiane.
S tMédiane d'une distribution groupée :
Plaçons-nous à présent dans le cas où nous disposons d'une distribution groupée, mais où nous
ne disposons pas de la série ordonnée qui a permis sa construction. Dans ce cas, nous ne pouvons pas
déterminer avec précision la médiane x1/2 . Il est cependant possible d'obtenir une valeur approchée
de ce paramètre par l'intermédiaire de la courbe cumulative d'équation
Y = N (x) et de la courbe cumulative à droite Y = N ∗ (x)

Nous pouvons dénir la valeur approchée de x1/2 comme étant la solution à l'équation
N (x1/2 ) = N ∗ (x1/2 ).
Étant donné le caractère de continuité de N (x) et N ∗ (x), la médiane est telle que :
N (x1/2 ) = n/2 et
N ∗ (x1/2 ) = n/2.
Et graphiquement, c'est l'intersection entre la courbe cumulative et la courbe cumulative à droite
comme sur ce graphique illustratif :

c Université
FORME DU GRAPHIQUE DE LA COURBE CUMULATIVE ET DETERMINATION DE LA MEDIANE
e o
aD
n d w
u g a
t1 B
S t a La valeur approchée de cette intersection est obtenue par :
−
x1/2 = lm + hm 2
n
− Nm−1
nm
, avec :
− − +
lm la limite inférieure de la classe médiane qui est (lm , lm ) ;
hm : L'amplitude de la classe médiane ;

Nm−1 : Eectif cumulé avant la classe médiane, et
nm l'eectif de la classe médiane.
Dénition 17 On appelle classe médiane, la première classe dont l'eectif cumulé est supérieur
ou égale à la moitié du nombre d'observations :
n
Nm−1 < ≤ Nm
2
Exemple 29 Reprenons l'exemple sur les tailles des étudiants, regroupées en classes :
c Université
(lj− , lj+ ) nj Nj
149.5-159.5 14 14
159.5-169.5 32 46
169.5-179.5 65 111
179.5-189.5 47 158
189.5-199.5 17 175
La valeur approchée de la médiane dans le cas d'une distribution groupée est donc trouvée par
interpolation linéaire comme ci-dessous :
x1/2 = 169.5 + 10 87−46

65
= 175.9
En termes des fréquences, la formule est :
0.5 − Fm−1
o
−
x1/2 = lm + hm
e
fm
Avec Fm−1 =
aD
la fréquence cumulée précédent la classe médiane, et fm = la fréquence de la classe
w
médiane.
n d
L'application directe donne :
g a
x1/2 = 169.5 + 10 0.5−0.263
0.371
= 175.89.
3.1.3 Les autres quantiles
B u quantile fractile
t1
La médiane est un cas particulier d'une valeur plus générale appelée ou , et qui
quantile d'ordre p, la valeur xp d'une
a
permet de diviser la série en quatre parties égales. On appelle
t
variable, telle que
S
N (xp ) ≤ n.p et N ∗ (xp ) ≥ n(1 − p).
Ceci signie que nous avons au moins une proportion p d'observations ayant une valeur inférieure
ou égale à xp , et une proportion complémentaire (1 − p) d'observations dont la valeur est supérieure
ou égale à xp .
Si une seule observation satisfait à cette double inégalité, alors cette observation est le quantile
recherché. Si nous avons deux observations satisfaisant à cette double inégalité, nous sommes dans la
situation d'indétermination. Dans ce cas, nous calculons (conventionnellement) la moyenne entre les
deux observations pour trouver le quantile recherché. Ainsi, empiriquement, nous pouvons dire que
xp divise l'ensemble des observations en 2 sous-ensembles qui doivent avoir un nombre d'observation
égale à n.p pour le premier et n(1 − p) pour le deuxième.
Les quantiles suivants sont les plus rencontrés dans la pratique étant donné leur importance dans
l'analyse et l'interprétation des données :
Ceux qui divisent la série en 4 parties égales, on parle de Quartiles , ceux qui divisent la série en
10 parties égales (les déciles), et ceux qui divisent la série en 100 parties égales (les Centiles ou
percentiles).

c Université
Les Quartiles .
Pour diviser la série des données en quatre parties, on calcule les statistiques suivantes :
p = 0.5 = 1/2 : C'est la médiane : en eet, il sut de multiplier n par 0.5 et on retrouve la
dénition de la médiane c'est-à-dire la valeur de xp qui divise la série ordonnée en deux parties
égales.
p = 0.25 = 1/4 : C'est le premier quantile ou fractile. Il donne les 25% des observations ayant
une valeur inférieure ou égale à x1/4 . On le note x1/4 ou Q1
p = 0.75 = 3/4 ou Q3 : C'est le troisième quantile ou fractile. Il donne les 75% d'observations
ayant une valeur inférieure ou égale à x3/4 .
Empiriquement, ces 3 quantiles divisent la série en 4 parties égales. Même si nous les présentons
en prolongement de la médiane (pour mettre en évidence le fait que la médiane est un quantile
particulier), ils sont beaucoup utilisés pour étudier la dispersion (voir construction de la boîte-à-
moustache) et la concentration des observations.
Levine et al. (2002) donnent les règles suivantes pour le calcul de ces quantiles :
Q1 = n+1
4
: c'est le 1er quantile.
o
n+1
Q2 = 2 : c'est la médiane ou deuxième quantile.
e
Q3 = 3(n+1)
4
. C'est le troisième quartile.
D
Si la position ou rang résultant de ce calcul donne un entier, l'observation numérique corres-
a
pondant à ce rang est le quantile recherché ;
w
Si la position ou rang obtenus est tout juste entre deux entiers (c'est-à-dire un nombre virgule
d
5), alors il faut calculer la moyenne entre les deux observations successives. Exemple si on
n
trouve 12.5 ; calculer la moyenne entre la 12ème et la 13ème observation pour trouver le
a
quantile recherché ;
g
Si on n'a ni (1) ni (2), alors conventionnellement, il faut arrondir la réponse pour obtenir le
u
quantile.
Ces trois valeurs jouent un rôle capitale dans la division de la série, et nous verrons comment on
B
les utilise même dans l'analyse de la dispersion et de la concentration des observations.
t1
Exemple d'illustration :
a
Reprenons la série observée sur les tailles des étudiants et calculons les diérents quantiles de
t
cette série.
S
Bien entendu, on commencera toujours par ordonner la série.
175 + 1
Q1 = = 44
4
série ordonnée 25%
de ces étudiants ont une taille inférieure ou égale à 169cm
La 44ème observation dans la est 169. On peut donc interpréter en disant :
.
175+1
Q2 = 2
= 88
La 88ème observation est... qui est la médiane de la série ; et qui signie que la moitié de ces
étudiants ont une taille inférieure ou égale à...
Q3 = 3(175+1)
4
= 132.
La 132ème observation est 183, c'est-à-dire que 75% de ces étudiants ont une taille inférieure ou
égale à 183cm.
Les Déciles Les déciles sont les valeurs de la variables qui partagent la population en 10 groupes de
même eectif. Ainsi, D1 ou premier décile est la valeur de la variable en-dessous de la quelle on trouve
10% de la population, et au-dessus de laquelle on trouve 90% de la population (donc ensemble de
valeurs inférieures ou égales à 10%, ou encore xp tel que p = 0.1 pour reprendre les même notations.)
D2 ou deuxième décile est la valeur de la variable en-dessous de la quelle on trouve 20% de la
population et au-dessus de laquelle se trouvent 80% de la population.

c Université
EXEMPLE D'ILLUSTRATION :
La série suivante donne le nombre de jours de fortes pluies par mois entre 1949 et 1997 à Lubum-
bashi.
5 16 5 22 17 9 16 12 2 20 7 7 2 22 29 18 21 14 11 22 31 36 18 13 12 5 12 12 8 23 24 10 13 13 9 12
22 14 19 7 1 5 12 2 5 4 12 18 4 6.
Calculer D1 , D2 ,. . .,D9 et interprétez. Pour rappel, on doit commencer par ordonner la série (comme
on le faisait pour les autres quartiles)
Les Centiles ou Percentiles .
Nous venons de présenter les statistiques qui permettent de diviser la série en 4 parties égales. Ici,
nous généralisons la démarche au cas où nous voulons diviser la série en 100 parties. Cette démarche
permet de pouvoir trouver n'importe quel quantile, pas seulement les quartiles. Par exemple on peut
o
trouver le 10ème quantile ou percentile, le 15ème, 20ème, etc. ce qui peut être très intéressant, no-
e
tamment dans les analyses des inégalités en sciences économiques et sociales.
p-ème percentile, la valeur telle que au moins p% des observations ont une valeur infé-
D
On appelle
a
rieure ou égale à cette valeur, et au moins (100−p)% observations restantes ont une valeur supérieure
w
ou égale à cette valeur.
d
Comment calculer le percentile ?
n
Ordonner la série pour obtenir {x(i) } ;
a
Calculer un rang i comme ci-dessous :
g
p
100
.n, avec p le percentile recherché et n l'eectif de l'échantillon ou la population.
u
(a) Si i n'est pas un entier, l'arrondir à l'unité supérieur, puis prendre l'observation corres-
pondant à ce rang. C'est le percentile recherché.
B
i i-ème (i + 1)-ème
t1
(b) Si est un entier, calculer la moyenne entre la observation et la obser-
vations pour trouver le percentile recherché.
a
Soit les données du tableau suivant :
t
Exemple 30
S Travailleur
1
2
3
4
Salaire mensuel
2350
2450
2550
2380
Travailleur
7
8
9
10
Salaire mensuel
2390
2630
2440
2825
5 2255 11 2420
6 2210 12 2380
Il est demandé de calculer le 85ème percentile.
85
Après avoir ordonné la série, il sut de trouver i= 100
.12 = 10.2.
Puis on arrondit 10.2 à 11 (donc à l'unité immédiatement supérieur). La 11ème observation est
2630. Ainsi, 85% de ces travailleurs gagnent un salaire inférieur ou égal à 2630$.
Mutatis mutandis, on peut trouver que le 50ème percentile (c'est-à-dire la médiane) est obtenue
par la moyenne entre la 6ème et la 7ème observations (2390+2420)/2=2405 (50% de ces travailleurs
ont un salaire inférieur ou égal à 2405$).

c Université
Dans la série sur le nombre de jours de fortes pluies par mois, après avoir ordonné la série, on
p
peut également utiliser cette formule
100
.n. Il sut pour cela de calculer le 10ème, le 20ème, 30ème,
etc. percentiles.
Nous verrons dans la section sur l'étude de la dispersion, comment ces diérents quantiles peuvent
être utilisés pour analyser la dispersion des observations.
L'on constate donc que selon l'objectif du chercheur, celui-ci peut diviser sa série en plusieurs parties
qui peuvent donner lieu à des interprétations intéressantes.
e o
aD
n d w
3.1.4 Le Mode
u g a
t1 B
a
C'est une valeur de position qui permet de connaître dans une D.O.1, la valeur ob-
t
Dénition 18
servée qui apparaît le plus souvent. C'est donc la valeur la plus fréquente dans une série de données.
S
Distribu-
tion plurimodale
Si plusieurs valeurs observées qui apparaissent le même nombre de fois, on parlera de :
(bi-modale pour 2 modes). Nous illustrons ces deux situations ci-dessous par deux
graphiques :

c Université
Illustrations graphiques d’une distribution unimodale et une distribution bi-modale.
fj ou fj ou
nj nj
e o
aD
n d w
g a
xj xj
B u
t a t1
S Exemple 31 Lors d'une journée, on a relevé les âges de 20 personnes venant se présenter à l'examen
pratique du permis de conduire :
18 19 19 23 36 21 57 23 22 19
18 18 20 21 19 26 32 19 21 20
Pour déterminer le mode, nous commençons par construire une distribution observée à partir de
cette série des âges :
Âge(xj ) 18 19 20 21 22 23 26 32 36 57
Eectif nj 3 5 2 3 1 2 1 1 1 1
Fréquence fj 0.15 0.4 0.1 0.15 0.05 0.1 0.05 0.05 0.05 0.05
Le mode pour cette série statistique est 19, car cette valeur apparaît avec une plus grande fré-
quence (Il y a plus de personnes âgées de 19 ans parmi les personnes qui ont fait l'examen du permis
de conduire).

c Université
Graphiquement, cette distribution se présente comme suit :
Effectif nj
6
3
Effectif nj
2
0
18' 19' 20' 21' 22' 23' 26' 32' 36' 57'
e o
aD
n d w
u g a
t1 B
S t a
Supposons que l'on regroupe ces personnes par classes d'âges comme ci-dessous :
nj
Classes nj hj hj
[17-19[ 3 2 1.5
[19-21[ 7 2 3.5
[21-26[ 6 5 1.2
[26-57] 4 31 0.129
La formule pour trouver la valeur approximative du mode dans le cas d'une distribution groupée
est la suivante :
− ∆i
M0 = lM + hM
∆i + ∆i+1

c Université
Avec
M0 = Le mode ;
hM = Amplitude de la classe modale ;

∆i = Diérence entre la fréquence de la classe modale et la fréquence de la classe précédente ;
∆i+1 = Diérence entre la fréquence de la classe modale et la fréquence de la classe suivante.
L'application de cette formule nous donne :
2
M0 = 19 + 2 = 19.93
2 + 2.3
o
. Cette approximation peut changer si on change l'amplitude des classes.
Exercice d'application :
D e
wa
Soient les données suivantes sur les supercies cultivées par diérents agriculteurs :
d
Classes en ha nj hj
n
[0-5[ 7800
a
[5-10[ 9600
g
[10-20[ 13200
u
[20-50[ 20400
B
[50-100[ 7200
t1
[100-170[ 1800
a
TOTAL
t
Déterminez le mode de cette distribution, et interprétez.
S Nota bene :
Généralement, la présence de deux modes (distribution bimodale) indique une population hétéro-
stratication
gène composée de deux sous populations. Le nombre de modes dans une distribution peut donc être
utilisé comme un premier critère de
2
d'une population.
3.2 Le concept de Dispersion

Les séries statistiques relatives à des variables quantitatives peuvent avoir même valeur centrale
mais se diérencier par la concentration ou la dispersion des valeurs observées autour de cette der-
nière. Sauf dans les cas extrêmement rares où une variables a la même valeur partout (Ex. Un
étudiant qui aurait 15 sur 20 dans chaque cours !), les variables que nous étudions varient très sou-
vent d'un individu (statistique) à un autre. Le prix par mètre carré varie d'une maison à une autre,
le poids des étudiants varie d'un étudiant à l'autre, les pourcentages obtenus varient d'une année
2. La stratication est le fait de diviser une population en sous-ensembles plus ou moins homogènes, puis à calculer
des statistiques à l'intérieur de chaque sous-population. Cette notion est approfondie dans un cours spécialisé appelé :
Théorie et Pratique des Sondages

c Université
à l'autre pour un étudiant, et au sein d'une même classe ils varient d'un étudiant à l'autre, etc. Il
est donc important de savoir comment mesurer l'ampleur de ces variations. Sont-elles très élevées ou
faibles ? Quel impact cela a sur l'interprétation des variables étudiées ? C'est l'objectif poursuivi dans
cette section. Nous analysons ici les indicateurs les plus utilisés : L'intervalle de variation ou empan,
l'écart moyen absolu et l'écart médian absolu, la variance et l'écart-type, le coecient de variation,
l'intervalle interquartile et interdécile, l'écart médiale-médiane. Nous verrons également deux outils
graphiques utiles pour analyser la dispersion et la concentration : La boîte-à-moustaches et la courbe
de concentration.
3.2.1 L'étendu ou l'empan

Dénition 19 C'est la diérence entre la plus grande et la plus petite valeur observées.
A partir d'une série ordonnée, on le calcule comme suit :
o
E = x(n) − x(1)
D e
Cette statistique présente deux désavantage majeures :
a
Ne tient pas compte de toutes les observations ;
w
Il est trop sensible aux valeurs aberrantes (valeurs extrêmes). Cet indicateur est même trop
d
dangereux si la série de données comprend une valeur extrême trop petite, et une trop grande
n
par rapport aux autres ; car ce ne sont que ces valeurs extrêmes qui seront utilisées pour le
a
calcul de E
g
En conséquence, cette mesure de dispersion ne peut être envisagée que pour des séries dont les
u
observations sont réparties de façon homogène (sans valeurs aberrantes).
t1 B
3.2.2 L'écart Moyen Absolu et l'écart Médian Absolu
t a
L'objectif poursuivi ici est de mesurer la dispersion d'une série statistique en utilisant les valeurs
x̄. Une forte
S
de toutes les observations recueillies. Considérons une valeur centrale comme la moyenne
concentration des observations autour de ce paramètre se traduit par des écarts (xi − x̄) faibles en
amplitudes. Inversement, une grande dispersion implique qu'il existe des écarts importants. Une façon
de mesurer la dispersion d'une série peut dès lors consister à calculer la moyenne de tous les écarts. Il
convient de calculer les diérences sans leurs signes (en valeurs absolues) : si non la somme sera nulle :
| (xi − x̄) |
On est alors amené à introduire, comme mesure de dispersion, l'écart moyen absolu, noté em , qui se
dénit comme étant
Dénition 20 la moyenne des valeurs absolues des diérences entre les observations et leur moyenne.
n
1X
em = | xi − x̄ |
n i=1
Ce paramètre nous indique que les observations se situent en moyenne à em unités de leur valeur
centrale x̄

c Université
Nous avons pris la moyenne x̄ comme valeur centrale de référence. Nous aurions pu choisir la mé-
diane
3
x1/2 au lieu de x̄. Dans ce cas, le paramètre porte le nom de Écart Médian Absolu et est
∗
noté em .
n
1X
e∗m = | xi − x1/2 |
n i=1
Lorsque les séries sont symétriques (nous reviendrons sur ce terme dans la section suivante), em et
e∗m peuvent être égaux.
Soit la série {1, 2, 3, 4, 5, 10, 11, 12}. La moyenne de cette série est x̄ = 6 ; et sa médiane est x1/2 = 4.5.
On peut calculer l'écart moyen absolu et l'écart médian absolu en utilisant le petit tableau ci-dessous :
e o
xi 1 2 3 4 5 10 11 12 Somme
| xi − x̄ | 5 4 3 2 1 4 5 6 30
D
| xi − x1/2 | 3.5 2.5 1.5 0.5 0.5 5.5 6.5 7.5 28
a
em = 30
= 3.75 e∗m = 28
= 3.5.
w
8 8
d
Interprétation :
an
En moyenne, les observations sont à 3.75 par rapport à la moyenne de la série ; ou à 3.5 par rapport
g
à la médiane de la série.
u
Le calcul de ces 2 paramètres est simple lorsqu'on dispose d'une série observée de petite taille.
B
Cela change quand n est grand. En outre, l'outil "valeur absolue" utilisé est peu maniable et ne
t1
possède que des maigres propriétés mathématiques. C'est pourquoi ces mesures de dispersions sont
a
rarement utilisées dans la pratique.
S t3.2.3 La Variance
La variance d'une série observée :
la variance
L'objectif d'ignorer le signe peut être atteint en élevant les diérences au carré. On obtient une
2
mesure de dispersion aux propriétés plus riches : , notée s . Ce paramètre est donc déni
par :
n
1X
s2 = (xi − x̄)2
n i=1
Par dénition, la variance est la moyenne du carré des écarts par rapport à la moyenne de la série .
Malgré sa complexité apparente, ce coecient joue un rôle très remarqué dans l'étude de la dispersion.
Si un groupe est homogène, les valeurs xi
sont proches les unes des autres, et donc de leur moyenne.
2
Dans ce cas, les écarts (xi − x̄) seront faibles, et s sera petit. Au contraire, plus un groupe est
2
hétérogène, plus s s'accroît. La variance repose sur la connaissance de la moyenne arithmétique
2
et a donc des propriétés inuencées par celle-ci. Nous étudions donc les propriétés de s comme
3. Contrairement à la moyenne qui est fort inuencée par les valeurs aberrantes, la médiane est un rang et donc
n'est pas inuencée par la présence d'une valeur trop faible ou trop grande. On dit que la médiane est une statistique
plus robuste que la moyenne

c Université
une continuité de celles de la moyenne (et selon la même démarche). Mais avant de présenter ces
propriétés, une petite application permet de xer cette matière.
Exercice d'application :
Considérons la série simple des salaires horaires de 7 ouvriers.
Observations xi (xi − x̄) (xi − x̄)2

1 3 -3 9
2 4.5 -1.5 2.25
3 5.1 -0.9 0.81
4 6.2 0.2 0.04
5 7 1 1
6 7.8 0.8 3.24
7 8.4 2.4 5.76
o
Total 0 22.10
e
La moyenne arithmétique de cette série est de 6 francs.
L'application directe de la formule donne
aD
d w
22.10
s2 = = 3.16
n
7
a
.
Propriétés :
u g
B
Propriété 6 Le choix de x̄ comme valeur centrale n'est pas arbitraire. Nous pouvons le constater
t1
par l'intermédiaire du théorème de König-Huygens :
t a
Considérons un paramètre de centralité quelconque que nous notons c. La moyenne des carrés
S
des écarts entre les observation et le paramètre c est alors dénie par :
n
1X
s2c = (xi − c)2 (3.18)
n i=1
L'expression 3.18 peut encore s'écrire :

s2c = n1 ni=1 (xi − c)2 = n1 ni=1 [(xi − x̄ + x̄ − c)]2
P P
1
Pn
= n i=1 [(xi − x̄) + (x̄ − c)]2
Il s'en suit que
n n
1X 1X
(xi − c)2 = (xi − x̄)2 + (x̄ − c)2 (3.19)
n i=1 n i=1
Le premier terme de cette expression ne dépend pas de c. C'est la variance de s2 qui correspond
au cas où x̄ = c.
Le second terme fait intervenir la diérence entre la moyenne et c. Ils sont tous 2 positifs car au
2
carré. Il s'en suit que sc est minimum quand (x̄ = c).
Ainsi, la moyenne arithmétique x̄ est la meilleure valeur de centralité de référence dans la mesure où
elle donne la plus petite valeur possible à la variance.

c Université
Un résultat qui découle de cette propriété mérite l'attention. Réécrivons cette expression en iso-
lant c (qui est égal à x̄).
1
Pn
s2 = n i=1 (xi − c)2 − (x̄ − c)2 .
Prenons le cas particulier où c = 0. On obtient :
n
2 1X 2
s = xi − x̄2 (3.20)
n i=1
Cette expression est très utile dans la pratique et pouvait être obtenue en développant la formule
de la variance. Prenons par exemple la série {2, 3, 3, 3, 4}
Un exemple d'illustration de cette propriété est donné ci-dessous :
Soit la série {2, 3, 3, 3, 4}. Le tableau ci-après donne les valeurs de l'expression (xi − x̄)2
x̄ = 2+3+3+3+4
= 3.
e o
D
5
a
s2 = 15 [(2 − 3)2 + (3 − 3)2 + (3 − 3)2 + (3 − 3)2 + (4 − 3)2 ] = 0.4
d w
22 +32 +32 +32 +42
s2 = 5
− 32 = 0.4. Cette expression évite notamment de manipuler des écarts qui
n
peuvent donner lieu aux calculs fastidieux.
a
Deux relation utiles découlent de la dénition :
u g
n
2 1X
s = (xi − x̄)2
B
n i=1
t1
et
n
1X 2
a
2
s = x − x̄2
n i=1 i
S tns2 =
En multipliant par
Propriété 7
Pn
i=1 (xi − x̄)2 et
n,
Pn
on a :
i=1 x2i = ns2 + nx̄2

Soit x , une série identique à la série initiale. Comparer les observations à la moyenne
revient-à un facteur constant près-à comparer toutes les observations entre elles, c'est-à-dire
j
x̄
n n
2 1 XX
s = 2 (xi − xj )2
2n i=1 j=1
Exemple 32 Pour la série {2, 3, 3, 3, 4}, le tableau ci-dessous permet de calculer l'expression (x −
qui permet alors d'appliquer la formule :
i
xj ) 2
xj
xi 2 3 3 3 4
2 0 1 1 1 4
3 1 0 0 0 1
3 1 0 0 0 1
3 1 0 0 0 1
4 4 1 1 1 0

c Université
n=5 et n2 = 25.
2
La somme des carrés des diérences vaut 20. Comme le tableau contient 25 nombres (n ), leur
moyenne vaut 20/25=0.80. Comme on a 2 séries (xi et xj ) bien qu'identiques, on doit faire 0.80/2
pour trouver la variance d'une série.
Nous avons déjà vu comment calculer la moyenne de la série globale lorsque la série est scindée
en plusieurs sous-groupes. Nous présentons cette propriété pour le cas des variances :
Propriété 8 Si une série statistique d'eectif n , de moyenne x̄ et de variance s est jointe à une 2
seconde série d'eectif n , de moyenne x̄ et de variance s ; et qu'on souhaite déterminer la variance

1 1 1
2
s de la série globale à partir des paramètres des séries partielles :

2 2 2
2
On peut montrer que s s'exprime comme suit :

2
n1 s21 + n2 s22 n1 (x̄1 − x̄)2 + n2 (x̄2 − x̄)2

s2 = +
n1 + n2 n1 + n2
variance dans les groupes variance-dans

Le premier terme du second membre représente une moyenne pondérée des variances des séries
e o variance entre les

initiales. Il est appelé ou tout simplement . Le second terme
x̄1 x̄2
groupes variance-entre
peut être considéré comme la variance des moyennes et et porte le nom de
D
ou tout simple . Cette propriété concerne aussi la décomposition de la variance
a
lorsqu'on divise un groupe d'observations en deux parties. Elle peut, en outre, être généralisée à
w
l'agrégation (ou la décomposition de plusieurs séries statistiques).
d
Exemple 33 Reprenons la série ordonnée {1, 2, 3, 4, 5, 10, 11, 12} partagée en 2 groupes :
n
et
a
E1 = {1, 2, 3, 4, 5}
.
g
E2 = {10, 11, 12}
u
La moyenne globale x̄ = 6
t1 B
La variance peut se calculer à partir de la série globale. Elle vaut s2 = 16.5. En utilisant la for-
a
mule précédente, on obtient :
S t
2 5(2) + 3(2/3) 5(3 − 6)2 + 3(11 − 6)2
s = + = 1.5 + 15 = 16.5
5+3 5+3
avec 1.5 la variance-dans et 15 la variance-entre.
Remarques :
1. Un cas particulier de cette propriété est le suivant : Ajoutons une observation xp à une série
statistique x1 , x2 , . . . , xp de moyenne x̄ et de variance s2 . Cette observation supplémentaire xp
constitue à elle seule un groupe dont la moyenne vaut xp , et la variance est nulle. On peut
2
alors calculer la variance sp de la série complétée par l'expression :
2
ns2

xp − x̄
s2p = +n
n+1 n+1
2. La variance ne se conçoit que si la variable d'intérêt est quantitative.
3. Si une série ne contient que des valeurs identiques, sa variance est nulle.
4. Comme la moyenne arithmétique, la variance est sensibles aux valeurs aberrantes, non seule-
ment parce que celles-ci sont éloignées de la moyenne, mais aussi parce que leur présence va
éloigner la moyenne des autres valeurs non aberrantes.

c Université
La variance d'une distribution observée :
Si l'on dispose plutôt d'une distribution observée (D.O.1) {(xj , nj ); j = 1, 2, . . . , J}, il est aisé de
vérier que l'expression
n
21X
s = (xi − x̄)2
n i=1
se transforme en :
J
2 1X
s = nj (xj − x̄)2
n j=1
qui peut aussi s'écrire

J
1X 2
s2 = x − x̄2
n j=1 j
o
Application à l'auditoire :
xi 0 1 2 3 4 5
D e 6 7 et plus
a
ni 24 57 75 53 33 7 4 0
w
xi c'est le nombre de ventes réalisées par jours, et ni c'est le nombre de jours où ces ventes ont
d
été réalisées.
Application : Voir Mazerolle (2006)
g an
u
Variance d'une Distribution Groupée :
t1 B
Parfois, les données individuelles n'existent pas ou ne sont pas mises à la disposition du statisti-
a
cien. Ce dernier peut néanmoins disposer des données regroupées en classes. Nous avons déjà vu
t
comment calculer les indicateurs de tendance centrale avec ces types de données. Pour le calcul de
S
la variance, la démarche est la même que celle suivie pour la Distribution observée (D.O.1). Le seul
changement est qu'à la place de xj , on utilise xcj c'est-à-dire le centre de chaque classe. La formule
est donc :
J
2 1X
s = nj (xcj − x̄)2
n j=1
Exemple d'application :
Exemple1 : Reprendre les données regroupées sur les tailles des étudiants, et calculer la variance
à partir de ces données.
Exemple2 :
Voici la Distribution de la durée d'un audit réalisé par une Maison d'audit :
Durée Audit 10-14 15-19 20-24 25-29 30-34 Total

Eectifs 4 8 5 2 1 20
On peut calculer la variance de la durée de cet audit à partir du tableau suivant :

c Université
Durée Centre (xcj ) nj nj xcj xcj − x̄ (xcj − x̄)2 nj (xcj − x̄)2

10-14 12 4 48 -7 49 196
15-19 17 8 136 -2 4 32
20-24 22 5 110 3 9 45
25-29 27 2 54 8 64 128
30-34 32 1 32 13 169 169
Total - 20 380 570
380
La durée moyenne d'audit est x̄ = 20
= 19 jours.
570
La variance s'obtient par
20
= 28.5
(la dernière colonne a permis de calculer tout le numérateur dans la formule de la variance).
Inuence d'un changement d'origine et d'unité :
o
LA VARIANCE NE DÉPEND PAS D'UN CHANGEMENT D'ORIGINE
e
:
D
0
a
En eet, quelle que soit l'origine choisie (xo , xo , . . .), les diérences (xi − x̄) restent égales à elles-
2
mêmes. Un changement d'origine peut néanmoins simplier le calcul de s .
d w
Considérons la série statistique des revenus mensuels nets :
n
a
{xi } = {13291; 13296; 13303; 13292; 13314; 13307}, et posons que
U = x − 13300.
u g
t1 B
La série des valeurs
sa moyenne est 0.5.
ui qui résultent de ce changement d'origine est Ui = {−9, −4, 3, −8, 14, 7},
t a
La variance de Ui est égale à celle de xi et donnée par :
S
1
Pn 81+16+9+64+196+49
s2 = n i=1 Ui2 − Ū = 6
− 0.52 = 68.92.
Le changement d'origine a donc simplié les calculs de la variance de la série.
CHOIX D'UNE NOUVELLE UNITE :
Si on choisit une nouvelle unité d, nous avons vu que les observations xi , (i = 1, 2, . . . , n) et la

moyenne arithmétique sont divisées par d.
xi
xi −→ ui = , (i = 1, 2, . . . , n) (3.21)
d
x̄
x̄ −→ ū = (3.22)
d
Il s'en suit que
s2u devient :
x̄ 2
1
Pn xi

s2u = n i=1 d
− d

c Université
1 1
Pn
= d2 n i=1 (xi − x̄)2 ,
d'où on a :
s2x
s2u = (3.23)
d2
CHANGEMENT D'ORIGINE ET D'UNITÉ A LA FOIS :
En eectuant à la fois un changement d'origine (xo ) et d'unité (d), il résulte des propriétés pré-
cédentes que :
xi −xo
xi −→ ui = d
et
s2x
s2x −→ s2u = d2
, où
o
1
Pn
s2u = i=1 (ui − ū)2
e
n
EXEMPLE D'ILLUSTRATION
D
:
wa
Reprenons la distribution des tailles des étudiants groupées en 5 classes, ainsi que le changement
d'origine et d'unité eectué précédemment (xo = 174.5; d = 10). Nous recourons à la procédure sui-
d
2
vante pour calculer sx : voir tableau :
Classes
149.5-159.5
xcj
154.5
nj
14
g an uj
-2
nj u j
-28
nj u2j
56
u
159.5-169.5 164.5 32 -1 -32 32
B
169.5-179.5 174.5 65 0 0 0
t1
179.5-189.5 184.5 47 1 47 47
a
189.5-199.5 194.5 17 2 34 68
t
Total - 175 0 21 203
S
1
PJ 21
ū = n j=1 nj uj = 175
= 0.12
La variance s2u est
1
PJ 203
s2u = n j=1 nj u2j − ū2 = 175
− (0.12)2 = 1.1456
Il s'en suit que
s2x = d2 s2u = 100(1.1456) = 114.56.
Cette valeur constitue bien sûr une approximation de la valeur exacte obtenue à partir de la sé-
rie statistique.
Autres dénition de la variance :
La littérature anglo-saxonne dénit souvent la variance par l'expression :
n
1 X
s2corr = (xi − x̄)2
n − 1 i=1

c Université
Cette expression, peu diérente en pratique de s2 lorsque n est susamment grand, est justiée
par des raisons théoriques qui seront étudiées plus tard. De manière brève, on l'utilise lorsque l'on
veut distinguer les statistiques calculées sur l'échantillon et celles calculées sur la population. Dans
le cadre de ce cours (voir début), nous avons décidé de ne pas distinguer les deux cas pour la simple
raison que dans la pratique, le chercheur travaille généralement avec des échantillons assez grands ;
ce qui permet d'obtenir presque les mêmes résultats, que l'on divise par n (N ) ou par (n − 1).
Le cours de théorie et pratique des sondages donnera plus de détails sur cette diérence. En
attendant, nous restons dèle au choix fait au début de ce support, celui de considérer que nous
travaillons sur la population ou les grands échantillons. Elle est souvent utilisée dans les calculatrices
d'origine américaine.
La Variance n'est pas un nombre sans dimension :
L'unité dans laquelle s'exprime la variance vaut le carré des unités utilisées pour les valeurs observées.
Par exemple, si les observations s'expriment en centimètres, la variance s'exprimera en centimètre
o
carré. Ceci rend dicile l'interprétation de cette statistique, notamment lorsqu'il faut savoir si la
e
variance (dispersion) est forte ou faible.
3.2.4 L'écart-type
aD
w
Dénition
d
:
n
C'est la racine carrée de la variance s2 et est désignée par la lettre s ou σ.
g a
v
u n
u1 X
u
s=t (xi − x̄)2
n i=1
t1 B
Cette quantité a l'avantage de s'exprimer dans les mêmes unités que les observations, et est donc
a
plus facile à interpréter que la variance. Les propriétés de l'écart-type d'une série observée peuvent
t
être partagées en 2 groupes :
S
Celles qui découlent des propriétés de s2 et qui sont conservées par passage à la racine-carrée ;
D'autres qui sont spéciques à l'écart-type et que nous évoquerons dans les sous-sections
suivantes.
Exemple
√ 34 En reprenant la série simple sur les salaires, où la variance valait 3.16, l'écart-type
sera de 3.16 = 1.78 . Les dispositions pratiques utilisées pour la variance sont d'usage ici également.
Valeurs Réduites et Centrées réduites :
Si {xi } est une série statistique et sx l'écart-type de cette série, la série {yi } des valeurs réduites
peut être obtenue par
xi
yi = s
.
Diviser chaque observation par l'écart-type sx nous donne une série des valeurs sans dimension
dont la variance et l'écart-type valent 1. Nous avons en eet
s2x
s2y = s2x
par application de 3.23, dans lequel d n'est plus une valeur quelconque mais bien l'écart-type de

c Université
la série ou de la distribution.
D'autre part, les valeurs centrées réduites (notées zi )sont obtenues à partir de la série initiale, en
appliquant la formule suivante :
xi − x̄
zi = , (3.24)
sx
On constate aisément que ces valeurs sont sans dimension, de moyenne nulle, et de variance égale
à 1 (à démontrer dans les TP). Ces transformations sont très utiles dans le cours de statistique
inférencielle (stat. Math) et permettent de générer d'autres résultats théoriques intéressants. Dans
le cadre de ce cours, nous verrons comment on utilise cette transformation pour détecter la présence
des valeurs aberrantes (extrêmes).
Remarques :
L'écart-type permet de mesurer un risque ; celui de voir une valeur observée éloignée de la moyenne.
o
Ce risque est faible quand s est petit, et plus élevé dans le cas contraire. Comme la variance, l'écart-
e
type permet d'évaluer la dispersion d'une variable par rapport à sa moyenne.
3.2.5 Le Coecient de variation
aD
d w
La comparaison de 2 écarts-types est relativement simple quand les séries ou distributions pos-
n
sèdent des moyennes du même ordre de grandeur et sont exemptes de valeurs aberrantes. Il n'en est
a
plus ainsi dans le cas contraire.
Deux magasins comparent leurs bénéces nets hebdomadaires en euros sur 100 se-
g
Exemple 35
maines comprenant toutes 6 jours d'ouverture.
B u1000 2000 3000 4000 5000
t1
x
10 25 37 21 7
cj
n j
a
11000 12000 13000 14000 15000
t
y
8 24 38 20 10
cj
S
n j
x̄ = 2900 sx = 1063
ȳ = 13000 sy = 1077.
La comparaison sur base des bénéces moyens peut nous induire en erreur. Ainsi, on peut calcu-
ler le coecient de variation
s
CV = x̄
:
Dénition 21 C'est l'écart-type par unité de moyenne. Ce coecient est une mesure relative de dis-
persion et permet donc une interprétation plus nuancée. On l'exprime généralement en pourcentage.
Ainsi, pour nos 2 magasins, les CV sont respectivement de 36.7% et 8.3%. Les données du premier
magasin sont donc plus dispersées que celles du deuxième magasin. Quand est-ce qu'un coecient
de variation permet de dire que la dispersion est forte ? Bien qu'il n'y ait pas de consensus sur cette
question, les statisticiens canadiens donnent les critères suivants :
Si CV < 15, on peut dire que la dispersion est assez faible, ce qui permet d'être à l'aise dans
l'interprétation de la moyenne.

c Université
Si 15 ≤ CV ≤ 30, il faut interpréter prudemment car la dispersion devient assez forte ;

Si CV > 30, alors la dispersion est très forte et rend problématique l'interprétation des
résultats statistiques, notamment de la moyenne.
3.2.6 Variable centrée réduite et détection des valeurs aberrantes

L'une des utilisations de la variable centrée réduite obtenue par l'équation 3.24, c'est de pouvoir
détecter la présence des valeurs extrêmes dans la série de données. Pour mieux illustrer le rôle de
cette équation, nous présentons d'abord le théorème de Tchebychev.
Théorème de Tchebychev :
Ce théorème, dont la formulation rigoureuse sera développée en deuxième année, permet de déter-
miner le pourcentage des observations situées à un certain nombre d'écarts-types de part et d'autre
de la moyenne. Selon Tchebychev,
e o
1
"Au moins (1 −
z2
) des observations doivent être situées au moins à z.s de la moyenne de la sé-
D
rie ou de la distribution, dans l'intervalle :
[x̄ − z.s, x̄ + z.s], avec z > 1.
wa
n d
Ci-dessous quelques conséquences empiriques de ce théorème :
a
Au moins 75% des observations sont situées au moins à [x̄ − 2s, x̄ + 2s], c'est-à-dire à 2
g
écarts-types de part et d'autre de la moyenne
u
Au moins 89% des observations sont situées au moins à [x̄ − 3s, x̄ + 3s], c'est-à-dire à 3
écarts-types de part et d'autre de la moyenne ;
B
[x̄ − 4s, x̄ + 4s],
t1
Au moins 94% des observations sont situées au moins à c'est-à-dire à 4
écarts-types de part et d'autre de la moyenne.
a
Le revenu moyen de 100 femmes a été calculé et l'on a trouvé 70$, avec un écart-type
t
Exemple 36
de 5$. Combien de femmes ont-elles un revenu compris entre 60 et 80? Et combien ont-elles un
S revenu entre 58 et 82?
SOLUTION :
Pour le premier volet de la question, il est facile de voir que 2.s = 10.
Il faut calculer le z comme suit :
60−70 80−70
z= 5
= −2 et
5
= +2
Nous avons donc l'intervalle x̄ − 2.z qui correspond à 75%. D'où, 75% de cet échantillon des femmes
ont un revenu compris entre 60 et 80.
Concernant la deuxième question, on procède de la même façon :
58−70 82−70
5
= −2.4 et
5
= +2.4.
Le théorème de Tchebychev donne :

c Université
1 1
(1 − z2
) =1− 2.42
= 82.6.
Donc 82.6% de ces femmes ont un revenu compris entre 58 et 82.

L'utilisation du théorème de Tchebychev nécessite z > 1, mais pas forcément entier.
L'un des avantages de ce théorème est qu'il peut s'appliquer à n'importe quel ensemble des don-
nées. Toutefois, il a été démontré que lorsqu'on utilise des grands échantillons, la représentation
Distribution normale
graphique de la plupart des données a une forme de cloche (nous parlerons des formes symétriques
dans la section suivante). On parle de . Si un chercheur a des raisons de penser
que ses données suivent une telle distribution (ce qui est souvent le cas), il peut utiliser des règles
empirique pour déterminer le pourcentage des observations situées à une certaine distance de la
moyenne (mesurée en terme d'écarts-types). Pour les raisons qui seront développées dans le cours de
statistique mathématique (inférencielle), nous poserons l'hypothèse que les données que nous utili-
sons suivent une distribution normale. Pour les données suivant cette distribution, le théorème de
o
Tchebichev a été adapté comme suit :
e
Environ 68% des observations sont comprises dans l'intervalle [x̄ − s, x̄ + s] ;
D
Environ 95% des observations sont comprises dans l'intervalle [x̄−1.96s, x̄+1.96s] ; On arrondit
a
généralement 1.96 à 2 écarts-types.
Environ toutes les observations (99.7%) seront comprises dans l'intervalle [x̄ − 3s, x̄ + 3s]
d w
Ces intervalles signie (en bref ) que plus l'écart-type de la distribution est élevé, plus l'intervalle
comprenant la variable est large, et donc moins la moyenne est précise. Ils seront très utilisés dans
an
le cours de Statistique mathématique (2ème année) et dans celui de Théorie des Sondage (première
g
licence ou Master 1 au sens de LMD). Pour ce qui nous concerne, il est important de voir comment
z
u
utiliser le qui résulte de ce théorème pour détecter la présence des valeurs aberrantes.
Nous venons de voir que lorsque les données ont la forme symétrique (de cloche), l'intervalle com-
B
prenant toutes les observations est celui obtenu avec 3s c'est-à-dire z = 3. Cet intervalle suppose
t1
que le chercheur n'a commis aucune erreur, ce qui est souvent impossible. Nous utiliserons donc plus
a
souvent le cas où z=2 comme critère pour exclure les observations aberrantes. Le critère est donc :
t
xi − x̄
S
z= ≷ +/ − 2
sx
Si le z calculé est supérieur à +2, alors la valeur de x correspondante peut être considérée comme
extrêmement grande par rapport aux autres observations.
Si le z calculé est inférieur à −2, alors la valeur de x correspondante peut être considérée comme
extrêmement petite par rapport aux autres observations.
Exemple 37 Reprenons les données sur les salaires de 12 travailleurs d'une entreprise. Calculons
la moyenne et l'écart-type, puis trouvons les z (i = 1, 2 . . . , n) correspondant à chaque observation.
Quelles sont les observations qui apparaissent comme aberrantes (extrêmement petite ou extrêmement
i
grande)?
Travailleur Salaire mensuel Travailleur Salaire mensuel
1 2350 7 2390
2 2450 8 2630
3 2550 9 2440
4 2380 10 2825
5 2255 11 2420
6 2210 12 2380

c Université
Une fois qu'on a identié les valeurs aberrantes, diérentes actions sont possibles :
Les corriger si elles proviennent des erreurs survenues au moment de l'encodage des données ;
Supprimer si l'observation a été introduite à tort, ou si le chercheur trouve qu'elle peut com-
Infé-
pliquer l'interprétation des résultats ;
rence robuste
Les garder, mais utiliser des méthodes appropriées en présence des valeurs aberrantes (
). Ca sera le cas lorsque l'observation provient de l'enquête et pour des raisons
contextuelles, doit être gardée dans les analyses.
3.2.7 Autres mesures de Dispersion : Rapports et Écarts inter-quartiles/inter-

déciles
Prenons (voir [9]), la distribution des salaires nets annuels par sexe dans le privé et le public en
2007 en France (en Euros courants) :
e o
a
Déciles
D Femmes Hommes Ensemble
w
1er Décile 12364 13538 13038
d
2è Décile 13792 15202 14609
n
3è Décile 14932 16689 15989
a
4è Décile 16162 18239 17461
g
5è Décile = Médiane 17612 20019 19147
u
6è Décile 19438 22248 21247
B
7è Décile 21883 25391 24052
t1
8è Décile 25287 30590 28590
9è Décile 32003 41413 37975
a
Rapport Interdécile 2.6 3.1 2.9
S t Une interprétation possible des chires de ce tableau est par exemple qu'en 2007,
vailleurs du privé et public avaient un salaire inférieur ou égal à 37975.
voit donc déjà que 90% des hommes gagnaient mieux que les femmes.
90%
90% des tra-
des hommes gagnaient
un salaire inférieur ou égal à 41413$, tandis que cette proportion était de 32003 pour les femmes. On
On peut élargir ces interprétations à tous les diérents déciles, et comme pour tous les quantiles.
Le Rapport Interdécile .
Permet de mesurer la dispersion de ces salaires. La valeur du rapport interdécile pour les salariés
du privé et public est, pour ces donnée :
D9
= 37975/13038 = 2.9
D1
Interprétation :
Le salaire au-dessus duquel sont payés 10% des salariés de ces secteurs est 2.9 fois plus élevé que le
salaire en-dessous duquel sont payés 10% des salariés. Pour simplier, cela signie tout simplement
que les hauts salaires sont environ 3 fois plus élevés que les bas salaires ; sachant qu'en utilisant le
rapport interdéciles, on a éliminé 10% des salaires les plus faibles, et 10% des salaires les plus élevés

c Université
pour évaluer les inégalités. Dans notre exemple, ce rapport interdécile permet aussi de mesurer la
disparité des salaires entre hommes et femmes.
Le rapport interdécile est en eet de 2.6 pour les femmes et 3.1 pour les hommes. La distribution
des salaires est donc plus inégalitaires chez les hommes que chez les femmes. On pourrait aussi faire
des comparaisons dans le temps. Si le rapport interdécile augmente, cela signie que les inégalités
(disparités) augmentent avec le temps. Dans le cas contraire, elles diminuent.
Pour savoir si la dispersion des salaires se fait plutôt par augmentation des valeurs supérieures ou par
étalement vers le bas, on peut mesurer les rapport D9 /D5 et D1 /D5 . Dans notre exemple cela donne :
Femmes Hommes Ensemble

D9 /D5 1.82 2.07 1.98
D1 /D5 0.70 0.68 0.68
Les valeurs prises par ces rapports interdéciles D9 /D5 et D1 /D5 nous permettent de dire que les
o
écarts de salaires hommes/femmes sont plus importants pour les hauts salaires (ceux au-dessus du
e
salaire médian) que pour les bas salaires.
D
Il convient de noter que ces rapports inter-déciles ne peuvent être utilisés que pour des variables
a
prenant des valeurs positives.
w
Intervalle ou Écart Inter-décile .
d
On peut également utiliser l'intervalle ou écart inter-décile : D9 − D1 .
an
Celui-ci est une mesure de la dispersion de la série qui ne dépend pas des valeurs extrêmes ou
g
aberrantes parce qu'il donne une indication sur 80% des observations, les 10% de chaque extrémité
u
des observations n'étant pas pris en compte.
B
Le Rapport Inter-quartile et l'écart Inter-quartile
t1
.
De la même façon qu'avec les déciles, on peut construire un rapport inter-quartile et un écart
a
inter-quartile.
S tDénition 22 Le Rapport Inter-quartile, noté Q /Q mesure l'écart entre la valeur au-dessous de

laquelle se trouve 25% de la population et au-dessus de la quelle se trouve 25% de la population.
étendue
On peut également calculer l'Écart-Inter-quartile noté
population. C'est en fait une
3 1
Q3 − Q1 et qui comprend les 25% de la

mesurée sur la moitié centrale des observations. Plus il est
élevé, plus la dispersion est forte, et inversement la série est concentrée autour de la moyenne.
L'écart inter-décile comme l'écart inter-quartile partagent la même limite que l'écart-type en se
sens qu'ils s'expriment dans les mêmes unités que l'écart-type. Cela rend impossible la comparaison
des distributions qui s'expriment dans des unités diérentes.
Nous verrons son utilisation dans la construction de la boîte-à-moustaches.
3.2.8 Représentation graphique de la dispersion : La Boîte-à-moustaches

A. DÉFINITION La boîte-à-moustache ou en anglais boxplot ou encore box-and-whiskers est un
graphique qui résume la dispersion d'une série à partir de 5 statistiques ou valeurs :
La moustache de gauche, Q1 − 1.5EIQ : les valeurs situées à gauche de cette moustache
peuvent être considérées comme aberrantes, trop faibles ;
La moustache de droite, Q3 + 1.5EIQ : les valeurs situées à droite de cette moustache peuvent
être considérées comme aberrantes, trop élevées ;

c Université
Le premier quartile : c'est la "largeur" gauche de la boîte ;

Le troisième quartile : c'est la "largeur" droite de la boîte ;
La médiane : elle divise la boîte en 2 parties.
e o
aD
B. EXEMPLES D'APPLICATION :
n d w
u g a
t1 B
S t a 1. Construire la boîte-à-moustaches correspondant aux données sur les salaires (cf. tableau ci-
dessus).
2. Voir référence [4] (Mazerolle, 2006)
Pour les données sur les salaires, la boîte-à-moustache se présente comme ci-dessous :

c Université
BOÎTE-A-MOUSTACHES POUR LES SALAIRES
e o
aD
n d w
u g a
t1 B
S t a
C. UTILITÉ DE LA BOÎTE-A-MOUSTACHES POUR COMPARER LES SÉRIES

La boîte-à-moustaches permet de comparer des séries du point de vue de leurs dispersions mais aussi
de leurs caractéristiques de tendance centrale étant donné que la médiane y est repérée. Par exemple,
soient les notes sur 20 obtenus par 4 groupes d'étudiants :

c Université
Groupe A : {1, 2, 2, 12, 5, 5, 9, 5, 7, 11, 7, 8, 2}.
Groupe B : {16, 13, 15, 13, 11, 13, 16, 3, 18, 11}.
Groupe C : {8, 8, 8, 7, 4, 16, 13, 16, 18, 11}.
Groupe D : {12, 10, 6, 8, 5, 16, 12, 15, 10, 15, 12, 10}.
Produire les boîtes-à-moustaches correspondant à ces données et comparez du point de vue de leur
dispersion.
3.3 Les indicateurs de concentration

C'est pour l'étude de la répartition des salaires, des revenus, des patrimoines (propriétés), des
o
marchés (répartition des chires d'aaires) entre entreprises, etc que les premiers indicateurs de
e
concentration ont été élaborés. C'est en fait une autre façon de mesurer la dispersion puisque, par
dénition, plus une série est concentrée, moins elle est dispersée et réciproquement. Cependant,
D
contrairement à la dispersion, la concentration n'a de sens que pour des données positives et a des
a
variables dont l'addition a un sens (les revenus, les salaires, les surfaces cultivables, les chires d'af-
w
faires,. . .). La notion de concentration appliquée à des variables telles que l'âge, la taille, ou le poids
d
d'une population, quoiqu'envisageable en théorie, n'a pas nécessairement de signication pratique
n
ou d'interprétation possible. Dans cette section, nous présentons l'indice Cx , l'indice d'Herndahl, et
a
l'indice de Gini associé à la Courbe de Lorenz.
3.3.1 L'Indice Cx
u g
B
Dénition 23 Il mesure les fréquences cumulées des valeurs de la variable pour les x premières
t1
entreprises du domaine considéré. Le C représente l'importance relative des x premières entreprises.
a
x
t
Si les 4 plus grandes entreprises du secteur de l'énergie font ensemble 75% du chire d'aaires
S
des entreprises du secteur, le C4 du secteur énergie, pour les chires d'aaires, sera de 75.
Si mi représente la part de marché, ou du chire d'aaires hors-taxes, ou de l'eectif salarié de
l'entreprise i :
x
X
Cx = mi
i=1
Le tableau ci-dessous illustre l'utilisation courante de ce type d'indicateur. Il donne le C4 et le

C10 dans diérents secteurs économiques français au premier janvier 2005.
L'avantage de cet indicateur est de nécessiter peu d'informations statistiques. Il sut de connaître
la production totale d'un secteur et la production totale ou le chire d'aaires total des x premières
unités statistiques. Cet indicateur ne tient pas compte des n−x unités. L'indice de concentration
permet de construire une typologie des marchés. Ainsi :
Monopole : La première rme occupe plus de 80% du marché

Firme leader : La première rme réalise entre 50 et 80% du marché, les autres rmes sont
de taille négligeable ;
Duopole : Deux rmes se partagent à peu près également 80% du marché ;
c Université
Table 3.3 Niveau de concentration de l'industrie française
Secteurs VAbrut au coût des facteurs

4 1ers groupes 10 1ers groupes
Agroalimentaires 13 21
Biens de consommation 14 20
Automobile 71 79
Biens d'équipement 16 29
Biens intermédiaires 10 17
Énergie 79 93
Construction 12 16
Commerce 9 13
Transports 34 44
Immobilier 8 14
Services aux Entreprises 23 30
Services aux particuliers 9 15
o
Éducation, santé, action sociale 3 4
D e
Oligopole asymétrique : trois ou quatre rmes réalisent 80% du marché, dont environ 40%
a

pour la première
w
Concurrence asymétrique : La première rme réalise entre 20 et 50% du marché, les autres
d
sont des tailles très inférieures ;
n
Concurrence totale : La première rme occupe moins de 20% du marché.
a
Travail :
g
Calculer le C5 dans diérents secteurs de la vie socioéconomique à Bukavu (détails : voir fascicule
u
des Travaux pratiques).
t1 B
3.3.2 L'indice d'Herndahl
S t a L'indice Cx ne permet pas toujours de diérencier, sauf de manière qualitative, des situations
pourtant fort diérentes. Par exemple, le
90%.
C4 des quatre distributions suivantes est proche ou égale à
DI DII DIII DIV

77 42 40 25
5 38 20 25
4 6 16 20
4 4 14 20
Les 4 distributions ne sont pas équivalentes en termes de répartition des pouvoirs de marché.
Dénition 24 L'Indice de Herndahl-Hirschman permet de mettre en évidence ces diérentes

situations. Il est calculé comme la somme des carrés des parts de marché de toutes les entreprises :
n 2 n
X Xi X
CH = = m2i
i=1
X i=1

c Université
Avec Xi la part de la variable que représente l'entreprise i;

Pn
X= i=1 Xi ; et
mi est la part de marché détenue par l'entreprise i des n entreprises du secteur. L'indice de Her-
ndahl est compris entre 0 et 10000 si l'importance de chaque entreprise est exprimée en pourcentage.
Les données du tableau ci-haut nous permettent d'appliquer cette formule et de donner des in-
terprétations possibles du résultats :
Rang de l'entreprise DI DII DIII DIV

1 77 42 40 25
2 5 38 20 25
3 4 6 16 20
e o
4 4 4 14 20
2
P
i=4 mi 5986 3260 2452 2050
aD
La distribution I est deux fois plus concentrée que la distribution IV. Pour décrire un marché à
nombre équivalent d'Herndahl,
w
le nombre d'entreprises de taille identique qui réaliseraient la même valeur de
un instant donné, il est souvent plus éloquent de se référer au
ηH .
concentration que celle donnée par le C
d
noté Il représente
H.
g an ηH =
1
CH
u
Nombre équivalent de Herndahl pour les mêmes données :
t1 B
a
Rang de l'entreprise DI DII DIII DIV
t
1 77 42 40 25
S
2 5 38 20 25
3 4 6 16 20
4 4 4 14 20
2
P
i=4 mi 5986 3260 2452 2050
ηH 1.7 3.1 4.1 4.9
Le nombre équivalent montre bien la diversité des structures de marché de ces quatre distributions.
La distribution DI tend mieux vers une situation de rme leader ;
La distribution DII correspondrait à un duopole ;
La distribution DIII à un oligopole asymétrique ;
La distribution DIV à un oligopole symétrique.
Remarque :
Il convient de retenir qu'en pratique, l'interprétation de ces situations devra être beaucoup plus
subtile et nécessite la prudence et l'intuition du chercheur.
3.3.3 L'Indice de Gini associé à la Courbe de Lorenz

Telle que dit dans ce titre, l'Indice de Gini se calcule à partir de la Courbe de Lorenz. Il faut donc
d'abord construire la courbe de Lorenz avant de calculer l'indice qui lui est associé. La construction

c Université
de la courbe de Lorenz part d'une statistique très importante qu'il convient d'abord de dénir : La
médiale
La médiale :
C'est un indicateur qui s'apparente à la médiane, mais appliquée à une distribution. En eet, alors
que la médiane s'applique aux valeurs de la variables (les xi ), la médiale s'applique aux valeurs de
la variable multipliées par leurs eectifs respectifs (il faudra donc construire d'abord la distribution
observée ou groupée !)
Dénition 25 La médiale est la valeur de la variable (caractère) qui partage l'eectif cumulé des
n x en deux parties égales. Elle sert à déterminer la concentration d'une distribution par comparaison
avec la médiane et l'intervalle de variation.
j j
Sa formule est :
eo
 PJ 
j=1 nj xj
− N
D
− 2 ml−1
Ml = lml + hml  (3.25)
a

nml xml
w
Avec :
Ml = : Médiale recherchée
an d
g
−
lml =
u
: Borne inférieure de la classe médiale ;
B
hml = : Amplitude de la Classe médiale ;
a t1
Nml−1 = : Eectif cumulé juste avant la classe médiale ;
S t
nml xml = : Eectif correspondant à la classe médiale.
Classe médiale la classe correspondant à la valeur qui est directement supérieure

à l'eectif cumulé n x
Nous appelons
j j.
Généralement on travaillera avec des distributions groupées, d'où on remplacera xj par xcj comme
nous l'avons fait dans les chapitres précédents.
Exemple 38 Soit le tableau suivant :

Classes [0-1[ [1-5[ [5-10[ [10-20[ [20-50]
Eectifs 6 39 30 27 24
An de calculer la médiale, il faut d'abord faire un tableau des fréquences cumulées et des masses
cumulées (le cumul des nj xcj ).

c Université
Classes xcj nj nj xxj n∗j x∗cj

[0-1[ 0.5 6 3 3
[1-5[ 3 39 117 120
[5-10[ 7.5 30 225 345
[10-20[ 15 27 405 750
[20-50] 35 24 840 1590
Total - 126 1590 -
e o
aD
PJ
j=1 nj xcj = 1590. 1590/2 = 795.
w
Le nombre qui est directement supérieur à 795, c'est 1590 qui correspond à la classe [20-50]. Cette
d
dernière est donc la classe médiale. D'où l'application directe de la formule 3.25 donne :
an
795−750
g
Ml = 20 + 30 840
= 21.61
B u
t a t1
S
Détermination de la Concentration par la méthode graphique : Courbe de Lorenz
Courbe de concentration Courbe de Lorenz
.
Il s'agit de construire une gure appelée ou encore , du
nom de son inventeur, l'américain Max O. Lorenz (1880-1962) qui cherchait un moyen commode
de comparer les inégalités de revenus entre diverses populations. Elle peut aussi servir à mesurer
En abscisses gurent les fréquences (relatives)

d'autres formes d'inégalités que celles de revenu.
cumulées de la variable en ordonnées se trouvent les n x cumulés (notés dans le tableau précédent
La courbe de Lorenz se trace dans un carré de côté 1.
par n x ), rapportés à la somme des n x

, et j cj
∗ ∗
j cj j cj .
Le graphique ci-dessus illustre la forme de la courbe de Lorenz en France en 2010 pour les données
sur la répartition des patrimoine, et celle des revenus.
ILLUSTRATION GRAPHIQUE :

c Université
e o
aD
n d w
u g a
t1 B
S t a
On commence toujours la construction par le tracé d'une bissectrice, puis on continue en faisant
associer aux éléments de l'abscisse ceux de l'ordonnée.
Plus la courbe de Lorenz est éloignée de la première diagonale (bissectrice), plus la distribution est
concentrée. Plus au contraire elle se rapproche de cette diagonale, moins elle est concentrée. Si la
courbe de Lorenz se confond avec la diagonale, on dit que la distribution est "égalitaire", ce qui est

c Université
très rare en pratique. La courbe de Lorenz est donc un moyen géométrique et visuel d'observer la
concentration d'une série. Elle permet d'eectuer des comparaisons des séries à un même moment
(les salaires dans deux ou plusieurs entreprises ; les revenus dans plusieurs classes sociales,. . .) ; ou
d'une série à plusieurs moments diérents (l'évolution de la répartition du salaire dans une entreprise.)
Avec les mêmes données que celles utilisées pour calculer la médiale, construisons la courbe de
Lorenz. Nous utilisons une disposition pratique contenue dans le tableau ci-dessous :
n∗ x∗
Classes nj fj Fj nj xcj n∗j x∗cj Fj0 = PJ j(ncj∗ x∗ )
j=1 j cj
[0-1[ 6 0.147619 0.147619 3 3 0.001887
[1-5[ 39 0.309524 0.357143 117 120 0.075472
[5-10[ 30 0.238095 0.595238 225 345 0.216981
[10-20[ 27 0.214286 0.809524 405 750 0.471698
o
[20-50] 24 0.190476 1 840 1590 1
e
La quatrième colonne de ce tableau comprend les éléments de l'abscisse de la courbe de Lorenz.
D
La dernière colonne est l'ordonnée de cette courbe
wa
Le tracé manuel du de la courbe de Lorenz associée à ces données donne ce qui suit (application
d
à l'auditoire).
g an
B u
t a t1
S
L'Indice de Gini associé à la Courbe de Lorenz .
Géométriquement, l'Indice de Gini-du nom du statisticien italien Corrado Gini (1884-1965)-est égal
à l'aire de concentration (voir courbe de Lorenz) divisé par la moitié de la surface du carré (1/2). En
d'autres termes :
Ac
IG = = 2.Ac
1/2
Avec IG = : Indice de Gini ;
Ac = :Aire de concentration sur la courbe de Lorenz. La formule analytique ci-dessous permet-

tra de calculer directement cet Indice :

c Université
Pn Pn
i=1 j=1|xi − xj |ni nj
IG =
2n(n − 1)x̄
Pour voir ce que représente xi et xj ainsi que les ni et nj , nous proposons l'exemple ci-dessous :
Gains Eectifs nj Centre de classe xcj

0.5-1 1 0.75
1-2 2 1.5
2-3 6 2.5
3-4 4 3.5
4-5 2 4.5
An de calculer le numérateur, il faut disposer les chires dans le tableau de la manière suivante :
P
xi 0.75 1.5 2.5 3.5 4.5
e o
xj ni /nj 1 2 6 4 2 15
0.75 1 0 1.5 10.5 11 7.5 30.5
D
1.5 2 1.5 0 12 16 12 41.5
a
2.5 6 10.5 12 0 24 24 70.5
w
3.5 4 11 16 24 0 8 59
d
4.5 2 7.5 12 24 8 0 51.5
n
P
15 30.5 41.5 70.5 59 51.5 253
g a
Exemple de calcul : Prenons troisième ligne, quatrième colonne : 1.5 est obtenu comme suit :
u
|xi − xj |ni nj = |1.5 − 0.75|1x2 = 0.75x2 = 1.5
t1 B
La somme de la dernière colonne est égale à la somme de la dernière ligne (ce qui signie qu'il
a
n'y a pas d'erreurs !) et donne :
S t
P P
i j |xi − xj |ni nj = 253.
Reste à calculer la moyenne x̄ en vue de pouvoir trouver le dénominateur :
1
15
[1x0.75 + 2x1.5 + 6x2.5 + 4x3.5 + 2x4.5] = 2.78333
Ce qui donne pour le dénominateur :
2n(n − 1)x̄ = 2x15(15 − 1)2.78333 = 1169
Et enn, on peut trouver l'Indice de Gini par le rapport entre numérateur et dénominateur :
253
IG = 1169
= 0.22.
Remarque On peut également calculer le coecient de Gini en utilisant les fréquences. L'exercice
suivant illustre la démarche dans ce cas :

c Université
Salaires Pourcentages Fréquences cumulées Fj

30-60 4.5 4.5
60-70 9.8 14.3
70-80 19 33.3
80-90 12.6 45.9
90-100 10.8 56.7
100-110 11 67.7
110-120 11.2 78.9
120-140 8.2 87.1
140-180 8.4 95.5
180-260 4.0 99.5
260-400 0.5 100
e o
aD
Le tableau suivant nous permet de calculer les diérents termes dont nous avons besoin pour le
w
calcul du Coecient de Gini.
an d
u g
t1 B x f
a
xcj fj Fréquences cumulées Fj xcj fj P cj j Fraction de masse salariale cumulée qj
xcj fj
t
0.000 0.000
S
45 0.045 0.045 2.025 0.0197 0.0197
65 0.098 0.143 6.37 0.0621 0.0818
75 0.19 0.333 14.25 0.1389 0.2207
85 0.126 0.459 10.71 0.1044 0.3251
95 0.108 0.567 10.26 0.1000 0.4251
105 0.11 0.677 11.55 0.1126 0.5377
115 0.112 0.789 12.88 0.1255 0.6632
130 0.082 0.871 10.66 0.1039 0.7631
160 0.084 0.955 13.44 0.1310 0.8981
220 0.04 0.995 8.8 0.0858 0.9839
330 0.005 1 1.65 0.0161 1.000
Avec ces données, on peut construire la courbe de Lorenz sur la même logique que précédemment :

c Université
e o
aD
n d w
u g a
t1 B
S t a
L'indice de Gini est le double de la surface comprise entre la courbe de Lorenz et la diagonale
principale, dans l'intervalle [0, 1]. Numériquement, il est donné par la formule :
X
G = 2S = 1 − fj+1 (qj+1 + qj )
ce qui donne :

c Université
G = 1−(0.045×(0.0197+0.0000)+0.098× (0.0818+0, 0197)+0.190×(0.2207+0.0818)+0.126×

(0.3251 + 0.2207) + 0.108 × (0.4251 + 0.3251) + 0.110 × (0.5377 + 0.4251) + 0.112 × (0.6632 + 0.5377) +
0.082×(0.7671+0.6632)+0.084×(0.8981+0.7671)+0.040×(0.9839+0.8981)+0.005×(1.0000+0.9839))
G = 0.199.
3.4 Le concept de Forme

On désigne généralement par ce vocable, deux catégories de concepts :
l'asymétrie et
l'aplatissement.
Nous ne considérons ici que le cas des variables quantitatives ou ordinales pour lesquelles le problème
a un sens.
3.4.1 Analyse de la Symétrie d'une distribution
e o
D
dissymétriques à gauche, symé-
a
On distingue 3 types de distributions selon qu'elles sont
triques, ou dissymétriques à droite.
n d w
u g a
t1 B
S t a

c Université
Souvent, l'analyse du diagramme en bâtons ou de l'histogramme des eectifs dans le cas d'une DG1
nous permet de nous rendre compte du caractère symétrique ou non d'une distribution. L'examen
de la boîte à moustaches permet aussi de se faire une idée sur cette question selon que la boîte et
les moustaches sont symétriques ou, au contraire, de plus petite amplitude à gauche (asymétrie à
gauche) ou à droite (asymétrie à droite). Ainsi, par exemple, le diagramme en bâtons et la boîte à
moustaches ci-dessous permettent de se rendre compte aisément que la distribution observée pré-
sente une asymétrie gauche, c'est-à-dire que les petites valeurs observées sont plus fréquentes que les
valeurs plus élevées.
e o
aD
n d w
u g a
t1 B
S t a

c Université
e o
aD
n d w
u g a
t1 B
S t a
Mais il est
également possible de caractériser l'asymétrie et d'en quantier l'importance via l'un ou l'autre
coecient d'asymétrie.
Nous les présentons dans les paragraphes qui suivent.
1. Le Coecient de Fisher :

c Université
On peut construire un paramètre permettant de caractériser l'asymétrie d'une distribution {(xj , nj ); j =

1, 2, . . . , J}. Ce paramètre est basé sur la détermination préalable du moment centré d'ordre 3, déni
par :
Pour une série observée :
n
1X
m3 = (xi − x̄)3
n i=1
pour une Distribution observée d'ordre 1 (D01) :
J
1X
m3 = nj (xj − x̄)3
n j=1
valeur approchée pour une distribution groupée d'ordre 1 (DG1), avec xcj le centre de la classe j :
J
1X
o
m3 = nj (xcj − x̄)3
e
n j=1
D
Pour une distribution dissymétrique à gauche, m3 > 0 ;
a
Pour une distribution symétrique, m3 = 0 ;
w
Pour une distribution dissymétrique à droite, m3 < 0.
Remarques 2
n d
1. Le premier résultat est évident : quand la distribution est symétrique, à chaque
diérence (x − x̄) correspond une autre diérence de même valeur absolue mais de signe
a
opposé, associées toutes deux à un même eectif. Comme l'élévation à la puissance 3 conserve
j
u g
le signe des diérences, la somme est nulle.
2. Les deux autres résultats peuvent aussi se justier intuitivement sans trop de dicultés.
t1 B
3. m est indépendant d'un changement d'origine puisqu'il est basé sur des écarts. En revanche,
il dépend des unités choisies, ce qui rend son interprétation assez délicate. Ainsi, par exemple,
3
a
le moment centré d'ordre 3 d'une DO1 de tailles mesurées en mètres est une quantité qui
S t s'exprimera en "mètres cubes". Si l'on retraduit les tailles observées en centimètres-il sut
de multiplier les tailles initiales par 100-, la distribution observée se verra alors associer un
moment centré d'ordre 3 exprimé en "centimètres cubes", dont la valeur sera 100 fois plus3
élevée que celle obtenue avec les tailles en mètres. En conséquence, si donc le signe de m
permet d'objectiver l'existence d'une asymétrie de la distribution observée, sa valeur ne permet
3
pas de quantier sans ambiguïté l'importance de l'asymétrie. La solution à ce problème consiste

à proposer un coecient d'asymétrie qui :
A le même signe que m ;
Est un coecient sans unité (sans dimension), c'est-à-dire un coecient dont la valeur
3
reste inchangée quelle que soit l'unité choisie pour exprimer les observations de la distri-
bution.
C'est pourquoi Fisher a introduit un coecient qui porte son nom et qui se calcule comme suit :
m3
g1 = s3
3
C'est le rapport entre le moment centré d'ordre 3 (m3 ) et le cube de l'écart-type (s ) : Remarques :
Puisque l'écart-type est toujours positif, son cube l'est aussi ; ceci implique que m3 a bien le
même signe que g1

c Université
L'écart-type s'exprime dans la même unité que les observations ; son cube s'exprime donc dans
3
l'(unité des observations) exposant 3, tout comme m3 . Il s'ensuit que le rapport de m3 et s
est bien un nombre sans unité (sans dimension).
e o
aD
n d w
u g a
t1 B
S t a
Exemple :
Considérons la distribution de tailles (n = 360) ci-dessous, avec les tailles mesurées tantôt en mètres
(tableau de gauche), tantôt en centimètres (tableau de droite) :

c Université
e o
aD
n d w
u g a
t1 B
S t a
Et le graphique associé à ces données montre bien une distribution dissymétrique à gauche :

c Université
e o
aD
n d w
u g a
t1 B
S t a
Que les tailles soient mesurées en mètres ou en centimètres, le coecient de Fisher a toujours la
même valeur positive : g1 = 1.5619 (asymétrie à gauche).
Les coecients empiriques .

Il existe d'autres coecients d'asymétrie comparables à g1 du point de vue de la caractérisation

c Université
1. Le Coecient empirique de Pearson

d'une distribution, mais dont les propriétés résultent de constatations empiriques.
:
Le coecient empirique de Pearson SK se fonde sur l'écart entre la moyenne x̄ et le mode xM de
la distribution observée. Cet écart est divisé par l'écart-type s de telle sorte que SK soit un nombre
sans unité :
x̄ − xM
SK =
s
Remarques :
SK possède les propriétés semblables à celles de g1 . En eet :
Pour une distribution symétrique, x̄ = xM SK = 0 ;
et donc
Pour une distribution dissymétrique à gauche x̄ > xM , et donc SK > 0
droite x̄ < xM , et donc SK < 0
2. Le Coecient empirique de Yule et Kendall
Pour une distribution dissymétrique à
:
Le coecient empirique de Yule et Kendall se dénit à partir des trois quartiles de la distribution
o
observée :
D e
(x3/4 − x1/2 ) − (x1/2 − x1/4 ) x1/4 + x3/4 − 2x1/2
a
YK = =
x3/4 − x1/2 x3/4 − x1/2
d w
On peut également vérier (confer T.P) que −1 ≤ YK ≤ +1.
n
Remarques :
YK
u g a
possède des propriétés semblables à celles de
sans dimension, on vérie aisément que :
g1 . En eet, outre le fait d'être lui aussi un nombre
t1 B
pour une distribution symétrique : x3/4 − x1/2 = x1/2 − x1/4 et donc YK = 0 ;
a
pour une distribution dissymétrique à gauche : x3/4 − x1/2 > x1/2 − x1/4 et donc YK > 0
t
pour une distribution dissymétrique à droite : x3/4 − x1/2 < x1/2 − x1/4 et donc YK < 0
S
Il convient de noter que l'interprétation de ces coecients requiert beaucoup de prudence. Ainsi,
par exemple, une distribution observée presque symétrique peut fournir des coecients SK et YK de
signes contraires. Ils ne peuvent donc être considérés que comme des outils d'appréciation, simples
à obtenir, mais pouvant parfois être contradictoires. Dans des cours plus approfondis, on verra qu'il
existe des tests spéciques qui permettent de caractériser la forme d'une distribution avec plus de
précision. Ces tests se construisent néanmoins à partir de ces coecients, d'où la nécessité de connaître
leur calcul.
D. UTILITÉ DE LA BOÎTE-A-MOUSTACHES POUR DÉTERMINER LA FORME D'UNE
DISTRIBUTION (voir Mazerolle, [4]).
Suivant la position de la médiane au sein de la boîte, on peut en déduire des informations sur la
forme de la distribution.
1. Si la médiane est proche du centre de la boîte, c'est que la distribution est symétrique ;
2. Si la médiane est à gauche du centre de la boîte, c'est que la distribution est étalée à droite ;
3. Si la médiane est à droite du centre de la boîte, c'est que la distribution est étalée à gauche.
De même, en comparant la longueur respective de chaque moustache, on peut en déduire des

informations sur la forme de la distribution.
1. Si les moustaches sont à peu près de la même longueur, c'est que la distribution est symétrique ;

c Université
2. Si la moustache de droite est plus longue que la moustache de gauche, c'est que la distribution
est étalée à droite ;
3. Si la moustache de gauche est plus longue que la moustache de droite, c'est que la distribution
est étalée à gauche.
Exemple 39 Soit les trois séries suivantes :

A = {1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5}
B = {1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5}
C = {1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5}
Produire les boîtes-à-moustaches correspondant à A, B et C, et les interpréter en termes de
symétrie.
3.4.2 Analyse de l'aplatissement d'une distribution
e o
moment centré d'ordre 4
On peut aussi caractériser l'aplatissement d'une distribution par l'un ou l'autre des paramètres
D
suivants, basés sur le :
a
Pour une série observée :
w
n
1X
d
m4 = (xi − x̄)4
n
n i=1
g a
Pour une Distribution observée d'ordre 1 (DO1)
u
J
B
1X
m4 = nj (xj − x̄)4
t1
n j=1
a
xcj
t
Valeur approchée pour une distribution groupée d'ordre 1 (DG1), avec le centre de la classe
j :
S Ces paramètres sont :

m4 =
1X
n j=1
J
nj (xcj − x̄)4
a) Le coecient d'aplatissement de Pearson .
m4
b2 =
s4
b) Le coecient d'aplatissement de Fisher .
m4
g2 = −3
s4
Plus la série est elée (alternativement aplatie), plus ces coecients sont grands (alternativement
petits).

c Université
e o
aD
n d w
u g a
t1 B
t a
Leur utilisation est très délicate, d'où on ne peut les développer dans le cadre de ce cours.

c Université
e o
aD
n d w
u g a
t1 B
S t a

Chapitre 4
CALCUL DES INDICES ET LEUR RÔLE
ÉCONOMIQUE
o
Ce chapitre s'inscrit dans le prolongement du troisième chapitre, parce qu'il insiste sur une utili-
e
sation particulière des indicateurs de tendance centrale, et ceux de dispersion : Les indices. L'impor-
D
tance des indices dans les analyses socioéconomiques a justié de leur consacrer un chapitre entier.
a
On les utilisent en eet pour étudier l'évolution des prix, de la production, les taux de fécondité. . ..
Ils permettent également de faire des comparaisons dans le temps et dans l'espace (le prix de la
w
viande à Goma vs. à Rubavu ; le prix de l'éducation en 2010 et en 2015 ;. . .). Pour ce faire, on cal-
d
cule les rapport des grandeurs considérées et on parle d'indice statistiques élémentaires. Les
n
indices permettent aussi de suivre l'évolution des grandeurs complexes : on parlera alors d'indices
a
synthétiques.
4.1 Les Indices élémentaires

u g
t1 B
4.1.1 Exemples et dénitions
S t a 1. Le prix du Kilo de farine a été de 34,10 FC en moyenne en 2005, et de 43,41 FC en janvier

2008. L'indice élémentaire du prix de farine en janvier 2008, base 100 en 2005 est le rapport des deux
prix exprimé en % :
43.41
Ijanv2008/moy2005 = = 127.3
34.10
C'est-à-dire que le prix a augmenté de 27.3% de 2005 à 2008.
2. La production d'électricité est passée de 140385 millions de KWh en 2000 à 193900 en 2006.
L'indice élémentaire de la consommation d'électricité est :
193900
I2006/2000 =140385
, soit une augmentation de 38.12%.
Plus généralement, considérons la variation dans le temps ou dans l'espace d'une grandeur simple
X dénie avec précision. Cette grandeur prend les valeurs xo , x1 , . . . , xt , . . . aux dates ou périodes
successives 0, 1, 2,. . ., t.
Dénition 26 On appelle indice élémentaire de la grandeur simple X à la date (ou pé-

riode) t par rapport à la date ou période 0, le rapport :
xt
it/0 =
x0
111
c Université
La date (période 0) est la date de référence ou base de l'indice. La date (période) t est la date
courante ou de comparaison. Généralement, ce rapport est exprimé en pourcentage (%) comme suit :
xt
It/0 = it/0 .100 = .100
x0
4.1.2 Propriétés
a. La Circularité :
On peut comparer les grandeurs aux dates t et t0 grâce aux quotients des indices it/0 et it0 /0 .
xt/0
it/t0 =
xt0 /0
Exemple 40 Le prix de gros du cuivre était de 404.9 les 100 kg en 2002, de 494.58 en 2005, et de
687.19 en 2007.
e o
Les indices élémentaires du prix du cuivre, base 100 en 2002 sont :
D
I05/02 = 494.58/404.9 = 1.221x100 = 122.1
a
I07/02 = 687.19/404.9 = 1, 697x100 = 169.7
d w
Si l'on prend 2005 comme base, on peut calculer de 2 façons :
n
a
I07/05 = 687.19/494.58x100 = 138.9
g
I07/05 = (I07/02 )/(I05/02 )x100 = (169.7)/122, 1x100 = 138.9
B u
La propriété de circularité peut se généraliser à une suite d'indices successifs :
a t1
xt
it/0 = it/t−1 .it−1/t−2 . . . . i2/1 .i1/0 ∼
=
t
x0
S
b. La Réversibilité
1 1 x0
it/0 = = xt =
it/0 x0
xt
Exemple :
1
L'indice du prix du cuivre en 2002, base 100 en 2007 est
1.697
I02/07 =
.100 = 57.9.
Pour calculer le pourcentage de variation entre 2003 et 2005 en ignorant les prix aux diérentes
périodes, il faut passer par les indices.
Exemple :
Prix d'un produit en 2003 : 200 FC

Variation de 2003 à 2004 : (250-200)/200=25% ou I04/03 = 125
Variation de 2004 à 2005 : (400-250)/250=60% ou I05/04 = 160
Pour calculer la variation entre 2003 et 2005, on a 2 possibilités : (400-200)/200=100%

c Université
I05/03 = I05/04 xI04/03 x100 = 1.60x1.25x100 = 200
Le pourcentage de variation est donc de 200-100=100%.
Les pourcentages de variations ne sont pas réversibles. Si le prix du produit a augmenté de 2003 à
2005 de 100%, on ne revient pas au prix initial par une diminution de 100%. En eet, dans l'exemple
plus haut, pour repasser du prix de 400 à 200, il faut une diminution de (200-400)/400=-50%. En
vertu de la réversibilité des indices élémentaires :
1
I03/05 = i05/03
x100 = 12 x100 = 50
Le pourcentage de variation est donc 50-100=-50%
4.2 Les indices synthétiques

4.2.1 Dénition
e o
aD
Les indices élémentaires retracent l'évolution d'une seule grandeur parfaitement dénie et homo-
w
gène. Le plus souvent, l'économiste, le citoyen, le dirigeant d'entreprise. . .désire suivre les variations
d
des grandeurs complexes : indices général des prix, de production industrielle, volume des impor-
n
tations,. . .Ces grandeurs complexes sont composées d'un nombre plus ou moins grand de grandeurs
a
simples. Par exemple, le niveau général des prix est constitué des prix des divers aliments et boissons,
g
du logement, de l'équipement ménager, de l'habillement, des services médicaux, etc. L'évolution de
u
chacune de ces grandeurs simples est décrite par un indice élémentaire.
L'opération de construction d'un indice synthétique relatif à la variation d'une gran-

B
Dénition 27
deur complexe consiste donc à résumer une série d'indices élémentaires. Elle pose des problèmes
t1
analogues au résumé d'une distribution statistique par une caractéristique de tendance centrale.
S t a De même qu'il existe diérentes dénitions de la tendance centrale d'une distribution, il y a

diérentes méthodes de construction d'un indice synthétique qui consiste généralement à calculer une
moyenne, arithmétique ou non, des indices élémentaires. Chacune de ces formules a des avantages et
des inconvénients. Chacune représente un aspect de la réalité, mais aucune ne peut être considérée
comme "exacte" tandis que d'autres seraient "fausses".
Donc pas de méthodes unique, seule compte la cohérence, le contexte.
Soit X une grandeur complexe constituée des éléments x1 , x2 , . . . , xj , xk

X est, par exemple, le niveau général des prix, x1 , x2 , etc représentent les prix des diérents
articles ou services oerts au public. Comme on l'a déjà vu, les indices élémentaires des constituants
xj de X peuvent être calculés :
xjt
ßt/0 =
xjt
Mais sont insusants pour rendre compte de l'évolution du niveau général des prix : certains
augmentent, d'autres diminuent sans qu'il soit généralement possible de conclure à leur seul examen.
Il faut résumer, synthétiser par un seul indice (indice synthétique de la grandeur complexe X) les
indices élémentaires, comme on le fait pour une distribution statistique.

c Université
4.2.2 Diérentes formules d'indices synthétiques

De même que n'importe quelle caractéristique de tendance centrale résume correctement une
série statistique si celle-ci est peu dispersée, de même n'importe quel indice synthétique donne une
Formule de Laspeyres, de Paasche et de Fisher

indication satisfaisante si les indices élémentaires sont peu diérents les uns des autres.Trois formules
d'indices synthétiques sont utilisées en pratique : .
j
Désignons par ao l'importance relative du constituant j dans la grandeur complexe X à la date
j
0 et par at son importance relative à la date t.
j
Si X représente le niveau général des prix, at peut être, par exemple, la part des dépenses de loyer
ou de pain dans la dépense totale des ménages à la date t.
X X
aj0 = ajt = 1
(Les aj sont les coecients de pondération. Les deux premières formules d'indices (Laspeyres et
Paasche) sont des moyennes pondérées des indices élémentaires par les grandeurs aj . La troisième
(Fisher) est une combinaison des deux.
L'indice de Laspeyres .
e o
D
Dénition 28 C'est la moyenne arithmétique des indices élémentaires pondérés par les coecients
a
ajo de la date ou période de référence.
d w xjt
X X
ajo ijt/0 =
n
Lt/0 = ao
xj0
a
j j
g
Dans l'indice de Laspeyres, les coecients de pondération sont xes. Ce sont ceux de la période
u
de base.
An d'incorporer à un indice général des prix à la consommation, on désire calculer

B
Exemple 41
t1
l'indice synthétique du prix de la viande en janvier 2006. La période de base retenue est l'année
2002. Les articles entrant dans l'indice sont le boeuf, le mouton, le cheval, le porc, le poulet et le
a
lapin. Le tableau suivant donne les prix observés en 2002 et en 2006 de ces diérents articles, et les
S t
coecients de pondération relatifs à 2002. Ceux-ci représentent la part, dans la dépense totale de
viande des ménages des consommations de ces diérents en 2002.
Numéro Articles
j
Prix moyen 2002 (Po )
j
Prix janvier 2006 (Pt ) Coecients
pondération
j
2002 (ao )
1 Boeuf 12.04 14.29 35.1
2 Veau 12.47 17.07 18.8
3 Mouton 14.76 16.76 10.8
4 Cheval 13.18 17.06 10.2
5 Port 7.32 8.31 10.8
6 Poulet 6.21 5.67 10.8
7 Lapin 7.07 8.94 3.5
Total 100
L'application directe de la formule de Laspeyres à ces données donne :

L06/02 = 0.351 14.29
12.04
+ 0.188 17.07
12.47
+ 0.108 16.76
14.76
17.06
+ 0.102 13.18 + 0.108 8.31
7.32
+ 0.108 5.67
6.21
+ 0.035 8.94
7.07
=

c Université
Ce calcul peut se faire de manière plus simple dans un tableau comme suit :
Articles (1) Poj (2) Ptj (3) ajo (4) Indice élémentaire
j j
(6)=(4).(5)=ao .at/o
j
base 100 en 2002=it/o
(5)=(3)/(2)
Boeuf 12.04 14.29 0.351 118.7 41.6637
Veau 12.47 17.07 0.188 136.9 25.7372
Mouton 14.76 16.76 0.108 113.6 12.2688
Cheval 13.18 17.06 0.102 129.4 13.1988
Porc 7.32 8.31 0.108 113.5 12.2580
Poulet 6.21 5.67 0.108 91.3 9.8604
Lapin 7.07 8.94 0.035 126.4 4.4240
Total 1.00 119.4109
ajo = ajo .ijt/o

P
1
Les indices élémentaires (colonne 5) sont obtenus en divisant terme à terme les éléments de la
o
colonne (3) par ceux de la colonne (2). La valeur de l'indice de Laspeyres du prix de la viande en
e
janvier 2006, base 100 en 2002 se lit au bas de la colonne (6).
aD
L06/02 = 119.40.
w
N.B.
d
Le calcul d'un indice est chose très sérieuse. L'opinion que l'on se fait de l'évolution d'un phéno-
n
mène dépend de l'exactitude de l'indice. Éventuellement des contrats ou des politiques économiques
a
peuvent se baser sur cet indice ou être indexés sur lui. Un indice de prix à la consommation de
g
Laspeyres est pondéré par la structure de consommation des ménages pendant l'année de base. Cette
u
structure est gardée xe au cours des années successives pour lesquelles on calcule l'indice. Un indice
B
de Laspeyres de prix décrit l'évolution dans le temps du prix d'un "panier de consommation" dont la
t1
composition reste xe. En réalité, bien entendu, avec le progrès économique et technique, la structure
des consommations évolue.
S t a
L'Indice de Paasche
Dénition 29
.
L'indice de Paasche est la moyenne harmonique des indices élémentaires, pondérés

par les coecients a de la période courante.
j
t
1 1
Pt/o = P =P
ajt j
j ajt . xxoj
j ijt/o t
Dans l'indice de Paasche, les coecients de pondération sont ceux de la période courante . Ils
changent avec celle-ci.
Exemple 42 Pour calculer l'indice de Paasche du prix de la viande en 2006, destiné à être incorporé
à un indice général des prix à la consommation, il faut connaître les coecients de pondération relatifs
à 2006, c'est-à-dire la part dans les dépenses totales de viande des ménages, des consommations de
ces diérents articles en 2006 (voir tableau ci-dessous) :
c Université
Articles j Coecients de pondération

j
2006 en % (at )
Boeuf 35.6
Veau 12.1
Mouton 15.9
Cheval 14.2
Porc 10.4
Poulet 9.7
Lapin 2.1
1
L'application directe de la formule de Paasche donne (calcul de plus facile) :
Pt/o
1 12.04 12.47 14.76 0.104 7.32 6.21 7.07

= 0.356 + 0.121 + 0.159 + 0.142 17.06 + 0.104 + 0.097 + 0.021
Pt/o 14.29 17.07 16.76 13.18 8.31 5.67 8.94
o
Comme pour Laspeyres, la disposition pratique dans un tableau facilite ces calculs :
e
Poj ajt
Articles (1) Poj (2) Ptj (3) ajt (4)
1
ijt/o
= Ptj
(5)=(2)/(3)
ijt/o
(6)=(4).(5)
D
Boeuf 12.04 14.29 0.356 84.3 30.0108
a
Veau 12.47 17.07 0.121 73.1 8.8451
w
Mouton 14.76 16.76 0.159 88.1 14.0079
d
Cheval 13.18 17.06 0.142 77.3 10.9766
n
Porc 7.32 8.31 0.104 88.1 9.1624
a
Poulet 6.21 5.67 0.097 109.5 10.6215
g
Lapin 7.07 8.94 0.021 79.1 1.6611
u
Total 1.00 85.2854
B
Les inverses des indices élémentaires sont obtenus (colonne 5) en divisant terme à terme les
t1
éléments de la colonne (2) par ceux de la colonne (3). L'inverse de l'indice de Paasche du prix de la
viande en janvier 2006, base 100 en 2002 se lit au bas de la colonne (6) :
S t a D'où
1
Pt/o
=
X ajt
j
ijt/o
= 0.852854
1
P60/02 = x100 = 117.3
0.852854
pondéré par la structure de consomma-
tion des ménages pendant l'année courante
Un indice des prix à la consommation de Paasche est donc
. Cette structure varie pour chacune des années pour
lesquelles on calcule l'indice. Un indice de Paasche de prix décrit l'évolution entre la période courante
d'un panier de consommation dont la composition correspond à la structure des consommations
de la période courante.
L'indice de Fisher .
On vient de voir que les formules de Laspeyres et de Paasche conduisent à des résultats diérents.
On ne peut dire que l'une soit plus vraie que l'autre. Il n'y a a priori pas de raison de comparer les
prix en 2002 et 2006 avec la structure des consommations de 2002 plutôt qu'avec celle de 2006. On
peut penser que la "vérité" se trouve quelque part entre les deux ; d'où l'idée de calculer un indice
qui soit une moyenne des deux.

c Université
Dénition 30 L'indice de Ficher est donc la moyenne géométrique simple des indices de Las-
peyres et de Paasche :
p
Ft/o = Lt/o Pt/o
Dans notre exemple on a :
√
F06/02 = 119.4109x117.3 = 118.3
La diculté de cet indice-qui fait d'ailleurs qu'il n'est pas souvent utilisé-c'est son interprétation .
4.2.3 Les diérents types d'indices

En calculant un indice synthétique, on peut chercher à saisir des variations de valeur, de prix, ou
de quantité. Quel que soit le cas, le calcul de l'indice met toujours en jeu à la fois des prix et des
quantités.
Désignons respectivement par pjo , pjt , qoj , qtj les prix et les quantités se rapportant au constituant
o
élémentaire j entrant dans le calcul de l'indice synthétique. Diérents types d'indices peuvent alors
e
être calculés, tous fondés sur ceux que nous avons analysés précédemment.
L'indice de valeur
aD
Dénition 31 C'est le rapport de la somme des valeurs (produit du prix par la quantité correspon-
n d w
dante) relatives à la période courante à la somme des valeurs de la période de base :
g a
Ptj qtj
P
j
u
Vt/o = P
j Poj qoj
B
A la diérence des indices de prix ou de quantité, il n'y a donc qu'une seule formule d'indice de
t1
valeur.
a
Un tel indice n'a pas grande signication économique. En eet, son évolution dépend aussi bien
t
de l'évolution des prix que des variations de quantités.
S
Un indice de prix, comme un indice de quantité, peut être calculé selon l'une ou l'autre des
formules de Laspeyres, de Paasche, ou de Fisher. On s'intéressera ici aux deux premières.
Exemple :
Indice des prix à la consommation .
Pour l'établissement des coecients de pondération, on se réfère à la structure moyenne des
consommations des familles.
a) Indice de Laspeyres de Prix
Les coecients de pondération sont constitués par la part de la dépense totale des familles,
consacrée à la consommation des diérents articles pendant la période de base.
qoj pjo
ajo =P j j
j q o po
Dans le cas d'un indice des prix à la consommation, les coecients de pondération sont encore appelés
Coecients budgétaires . La dénition de l'indice de Laspeyres conduit à la formule suivante :
j j t
P pj
j qo po . pjo
Lt/o (p) = P j j
j q o po

c Université
Ou après simplication :
qoj pjt
P
j
Lt/o (p) = P
j qoj pjo
=Dépense totale de la période de base évaluée au prix courant/Dépense totale de la période de base.
Dans ce rapport, les quantités sont constantes et les prix variables parce que c'est un indice de
prix. Étant donné qu'il s'agit d'un indice de Laspeyres, les quantités se rapportent à la période de
base.
b) Indice de Paasche de Prix
Les coecients de pondération sont constitués par la part de la dépense totale des familles consa-
crées à la consommation des diérents articles pendant la période courante :
qtj pjt
ajt =P j j
j q t pt
o
La dénition de l'indice de Paasche, moyenne harmonique conduit à la formule :
e
qtj pjt qtj pjt
P P
D
j j
Pt/o (P ) = P =P
a
qtj pjo
j
j qtj pjt ppoj j

t
w
Après simplication.
d
=Dépense totale de la période courante sur la Dépense de la période courante évaluée au prix de la
n
période de base. Dans ce rapport, les quantités sont constantes et les prix variables. Comme c'est un
a
indice de Paasche, les quantités sont celles de la période courante.
Indice de quantité ou de volume
u g .
B
Exemple : Indice de la production industrielle.
t1
Pour le calcul des coecients de pondération, on se réfère aux valeurs ajoutées à chaque stade de
j j j j
fabrication. Po , Pt représentent les valeurs ajoutées unitaires et qo et qt les quantités produites.
a
a) Indice de Laspeyres du volume ou de quantités
S t
D'après la dénition générale de l'indice de Laspeyres,
P
j
qj
pjo qoj . qtj
o
Lt/o (q) = P j j = P j j
P j j
j po qt
j po qo j po qo
après simplication.
Dans ce rapport, les prix (valeurs ajoutées) sont xes et les quantités variables parce qu'il s'agit
d'un indice de volume. Les prix se réfèrent à la période de base puisque c'est un indice de Laspeyres.
b) Indice de Paasche de quantité ou de Volume.
D'après la dénition générale de l'indice de Paasche :
j j
pjt qtj
P P
j pt q t j
Pt/o (q) = P =P
pjt qoj
j
j j qo
j pt qt . q j j
t
après simplication.
S'agissant d'un indice de volume, les prix (valeurs ajoutées) sont constants et les quantités variables.
Les prix sont ceux de la période courante puisque c'est un indice de Paasche.

c Université
Table 4.1 Disposition pratique calcul d'indices synthétiques
j Articles PM2002 F/KG PM2006 F/KG Valeur moy consommation annuelle

En 2002 En 2006
1 Boeuf 12.04 14.29 465 600
2 Veau 12.47 17.07 249 205
3 Mouton 14.76 16.76 143 268
4 Cheval 13.18 17.06 135 239
5 Porc 7.32 8.31 144 175
6 Poulet 6.21 5.67 143 164
7 Lapin 7.07 8.94 47 36
xxx Total xxx xxx 1326 1687
4.2.4 Calcul pratique d'un indice
o
L'utilisation de telle ou telle formule pour le calcul pratique d'un indice dépend de la forme sous
e
laquelle on dispose des informations.
Exemple :
aD
Reprenons le calcul de l'indice synthétique du prix de la viande en janvier 2006, base 100 en 2002.
w
a) On dispose des informations contenues dans le tableau suivant
d
:
1. Indice de Laspeyres de Prix
g an
u
L'indice de Laspeyres des prix s'écrit :
B
pj
t1
qoj pjo . pjt
P
j
Lt/o (p) = P j j o
a
j q o po
S tLes indices élémentaires ont été calculés précédemment. Nous exécutons le reste des calculs dans le
tableau suivant :
pj
Articles (1) (2) Indices élé- (3) Valeur de la consomma- (4)=(3)x(2) qoj pjo ( qjt )
j j t
mentaires base tion en 2002 (qo po )
100 en 2002
j pjt
it/o = pj
o
1 118.7 465 55195.5
2 136.9 249 34088.1
3 113.6 143 16244.8
4 129.4 135 17469.0
5 113.5 144 16344.0
6 91.3 143 13055.9
7 126.4 47 5940.8
Total 1326 158338.1
pj
qoj pjo qoj pjo . pjt
P P
Formule utilisée j j o

c Université
On obtient la valeur de l'indice en divisant le total de la colonne (4) par le total de la colonne
(3) :
Lt/o (p) = 158338.1/1326 = 119.4
La signication des coecients de pondération utilisés précédemment apparaît clairement. Ainsi

pour le boeuf :
465
a1o = x100 = 35.1%
1326
La part des dépenses de viande consacrée à la consommation de boeuf s'élevait à 35,1% pendant
la période de base.
Bien entendu, le calcul eectué ici est strictement équivalent à celui des paragraphes précédents
sauf que le coecient de pondération ne sont pas calculés explicitement, ce qui évite les erreurs
d'arrondi.
o
2. Indice de Paasche
e
L'indice de Paasche de prix s'écrit :
aD pjt qtj
P
j
w
Pt/o (P ) = P j
qtj pjt . ppoj
d
j
t
an
Les inverses des indices élémentaires ont été calculés précédemment. On eectue la suite des calcul
dans le tableau ci-dessous :
g
B u
j
(1) Articles (2) Indices élémen- (3) Valeur de la (4)=(3)x(2) qtj pjt .( ppoj )
t1
t
taires base 100 en 2006 consommation en
j
j j
1
= ppoj 2006 qt .pt
a
ijt/o t
t
1 0.843 600 505.800
S
2 0.731 205 149.855
3 0.881 268 236.108
4 0.773 239 184.747
5 0.881 175 154.175
6 1.095 164 179.580
7 0.791 36 28.476
Total 1687 1438.741
j
j j
qtj pjt . ppoj
P P
Formule utilisée j qt .pt j
t
On obtient la valeur de l'indice en divisant le total de la colonne (3) par le total de la colonne
(4) :
Pt/o = 1687/1438.741x100 = 117.3
Là encore la signication des coecients de pondération utilisés directement dans les paragraphes
précédents devient claire. Ainsi, la part des dépenses de viande consacrée à la consommation de boeuf
s'élevait, en 2006 à :
600
a1t = 1687
x100 = 35.6%

c Université
Table 4.2 Disposition pratique calcul d'indices synthétiques
j
j Articles PrixMoy 2002 Prix M 2006 F/KG (Pt ) Val. cons annuelle
j
F/KG (Po )
En 2002(Kg) qoj En 2006(Kg) qtj
1 Boeuf 12.04 14.29 38.6 42.0
2 Veau 12.47 17.07 20 12.0
3 Mouton 14.76 16.76 9.7 16.0
4 Cheval 13.18 17.06 10.2 14.0
5 Porc 7.32 8.31 19.7 21.0
6 Poulet 6.21 5.67 23 28.0
7 Lapin 7.07 8.94 16.6 3.8
xxx Total xxx xxx
b) Il se peut au contraire, que l'on dispose directement des informations concernant les
prix et les quantités physiques consommées comme dans le tableau suivant :
e o
Il est alors préférable d'utiliser les formules :
D
P j j P j j
j qo pt j qt pt
Lt/o (p) = et Pt/o (p) =
a
j j j j
qo po qt po
w
Pour le calcul des indices de Laspeyres et de Paasche. On calcule les valeurs de la consommation
d
P j j P j j P j j
annuelle en 2002 ( j qo po ), en 2002 au prix de 2006 ( j qo pt ), en 2006 ( j qt pt ), et en 2006 au prix
n
P j j
de 2002 ( j qt po ).
a
Les résultats arrondis au franc près gurent dans le tableau suivant :
u g
Articles j En 2002 au prix En 2002 au prix En 2006 au prix En 2006 au prix
j j j j j j j j
de 2002 (qo po ) de 2006 (qo pt ) de 2006 (qt pt ) de 2002 (qt po )
B
1 465 552 600 506
t1
2 249 341 205 150
a
3 143 163 268 236
t
4 135 174 239 185
S
5 144 164 175 154
6 143 130 164 180
7 47 59 36 27
Total 1326 1583 1687 1438
j j j j
j j
qtj pjo
P P P P
Formule j qo po j qo p t j qt p t j
utilisée
Les valeurs des indices peuvent alors être facilement calculées
Lt/o = 1583/1326 = 119.4

et
Pt/o = 1687/1438 = 117.3
4.3 Relation entre indices de Laspeyres et de Paasche de prix

et de quantités
L'indice de valeur (produit x quantité) est égal au produit de l'indice de Laspeyres des prix par
l'indice de Paasche des quantités, ou inversement. En eet (à démontrer comme exercice de Travail

c Université
pratique) :
P j j P j j
P j j j j
P P j j
j qt pt j qo pt j qt pt
j p o p t j q t pt
P j j = P j j xP j j = P j j xP j j
j q o po j q o po j qt p o j po q o j qt po
C'est-à-dire :
Vt/o = Lt/o (p)xPt/o (q) = Lt/o (q)xPt/o (p)

Il en résulte directement que l'indice de valeur est égal au produit des indices de Fisher de prix et de
quantité :
p
Vt/o = Lt/o (p)xPt/o (q)xLt/o (q)xPt/o (p)
p p
= Lt/o (p)xPt/o (p)x Lt/o (q)xPt/o (q)
o
⇒ Vt/o = Ft/o (p)xFt/o (q)
D e
Cette propriété présente une grande importance pratique. On dispose assez souvent, en eet, de
a
séries de valeur totale : par exemple, chires d'aaires ou montants des investissements. Pour obtenir
w
les indices de volume correspondants représentatifs de l'évolution réelle compte tenu des variations
d
de prix, il faut diviser les indices de valeur par les indices de prix correspondants. Si l'indice de prix
n
utilisé est un indice de Laspeyres, on obtient un indice de Paasche du volume, et inversement.
g a
Remarque :
u
Pour que cette opération soit rigoureuse, il faut que les indices de valeur et de prix utilisés aient le
B
même champ, autrement dit qu'ils se rapportent à la même population statistique.
t1
Exemple 43 La comptabilité nationale donne l'évolution en valeur de nombreuses grandeurs éco-
nomiques. Très souvent, en réalité, c'est l'évolution en volume de celles-ci qui présente un intérêt
a
économique et social. Ainsi, selon les comptes, la consommation des ménages s'est élevée de 1023.4
S t
à 1144.1 millions francs de 2006 à 2007.
L'indice de valeur de la consommation, base 100 en 2006 est donc égal à :
V07/06 = 1144.1/1023.4x100 = 111.8
4.4 Avantages et Inconvénients des Indices de Laspeyres et de

paasche
4.4.1 Avantages
Les deux indices ont une signication économique claire. Celui de Laspeyres mesure l'évolution de
grandeurs dont les pondérations restent xes (évolution dans le temps, d'un panier de provisions
xe). La composition de ce panier est celle observée pendant l'année de base (choisie au début de la
période couverte par l'indice). Les coecients de pondération sont constantes. L'indice de Paasche
mesure l'évolution des grandeurs dont les pondérations sont variables : ce sont celles de la période
courante. L'indice de Paasche des prix se réfère à un ensemble de consommation dont la composition
évolue en même temps que celle des prix.En réalité, la structure en valeur des consommations ne

c Université
reste pas constantes (voir théorie économique sur les déplacements de la courbe de demande, eet de
substitution et eet revenu). En dénitive, tout dépend de la façon dont la consommation des ménages
évolue. Pour eectuer la comparaison, il n'y a aucune raison théorique de préférer les pondérations
de la période courante ou celles de l'année de base ; et, par conséquent de donner préférence à la
formule de Paasche ou celle de Laspeyres.
4.4.2 Inconvénients
Aucun de ces indices ne possèdent les propriétés de circularité ou de réversibilité. Ainsi, si on
change de base, on doit refaire tous les calculs. Par ailleurs, La détermination des pondérations est
une opération longue, coûteuse et souvent délicate. La connaissance des quantités de marchandises
fabriquées ou consommées exige de très bonnes informations sur la production ou sur les budgets
familiaux. Souvent on ne peut recueillir des telles données qu'à l'occasion d'un recensement ou d'une
enquête spéciale. Pour l'établissement d'un indice de Laspeyres, cette étude, qui concerne uniquement
la période de base, est faite une fois pour toutes. Pour un indice de Paasche, elle doit être recommencée
o
chaque année. Ce ne sont donc pas les considérations théoriques, mais les dicultés pratiques de
e
détermination des pondérations qui conduisent généralement à préférer la formule de Laspeyres à
D
celle de Paasche.
wa
an d
u g
t1 B
S t a

c Université
e o
aD
n d w
u g a
t1 B
S t a

Chapitre 5
LES SÉRIES STATISTIQUES BIVARIÉES
5.1 Introduction
o
Il est fréquemment nécessaire d'étudier les liaisons qui peuvent exister entre deux ou plusieurs
e
dimensions qui caractérisent une population statistique. Pour qualier ce lien, on parle de corrélation
D
ou liaison statistique ; mais c'est important de le préciser, il ne s'agit pas d'une causalité car la
a
statistique descriptive n'a pas pour objectif de prouver des causalités.
w
Ce chapitre se limite à l'étude des séries à deux dimensions X et Y. Cela ore déjà un large
d
éventail de possibilité lorsque l'on tient compte du fait que chacune de ces dimensions peut être
n
quantitative ou qualitative, et que les données peuvent être dans chaque cas groupées par valeur ou
a
groupe des valeurs. A ces diérents cas correspondent des outils d'analyse appropriés que nous allons
g
évoquer successivement.
B u
5.2 Les étapes d'une analyse statistique bivariée
t a t1
5.2.1 Niveau de mesure
S
La mesure de 2 variables X et Y sur n individus, donne lieu à une série statistique bivariée
{(x1 , y1 ), (x2 , y2 ), . . . , (xn , yn )}
L'analyse bivariée adoptée dépendra également du niveau de mesure des variables. Il conviendra
donc de préciser si chaque variables a été mesurée sur une échelle nominale, ordinale, d'intervalle, ou
de rapports. Il peut être important de transformer l'une ou l'autre des variable an d'homogénéiser les
analyses statistique, ou de réduire les dispersions. Une variable exprimant un salaire est généralement
mesurée sur une échelle de rapport. Par un groupement en classes, nous pouvons lui donner un
aspect ordinal en considérant par exemple trois classes : PETITS SALAIRES, SALAIRES MOYENS,
GROS SALAIRES ; ou même nominal. Comme pour les séries univariées, nous distinguerons donc 3
catégories de niveau pour chacune des variables : quantitatif, ordinal et nominal.
5.2.2 Représentation graphique d'une série bivariée

Pour les Variables quantitatives : la Série Statistique bivariée sera représentée par un nuage
des points ou graphique de dispersion. La série statistique bivariée peut aussi donner lieu à
un TABLEAU DE CONTINGENCE (Celui-ci croise généralement deux variables qualitatives), et
permet de dénir une Distribution Observée à 2 dimensions (on notera D.O.2).
125
c Université
En présence d'un travail statistique sur 2 variables, il est toujours important de commencer par
une analyse graphique parce que le sens du graphique (croissant, décroissant, logarithmique, ou
indéterminée) peut déjà fournir des informations importantes sur les liens éventuels entre les deux
tableau de contingence
variables en étude. La Construction des distributions (on parlera des distributions marginales et
conditionnelles) à partir d'un peut également permettre de faire quelques
interprétations avant toute analyse approfondie.
5.2.3 Association et dépendance

On s'interroge sur les liens entre les 2 variables X et Y . Varient-elles dans le même sens ou systé-
matiquement dans le sens opposé ? (les augmentations de l'une étant suivies par des augmentations
ou des diminutions de l'autre et vice-versa). Dans ce cas, il peut être intéressant d'étudier le lien
Y
prédites
d'association entre les deux variables. Sont-elles dépendantes l'une de l'autre ? (les variations de
sont par les variations de X ). Que ce soit pour étudier l'association ou le lien de prédiction
(causalité), on vamesurer ce lien à partir des données recueillies ; puis interpréter les coe-
eo
cients représentant cette association. Il convient de retenir qu'une association n'implique pas
une causalité. Plus clairement :
D
Si la recherche a pour objet de permettre une "prédiction" de Y sur la base d'informations sur X,
"Régression". La régression sous-entend donc le LIEN DE CAUSALITÉ (Cause
a
nous parlerons de
w
à eet). Si par contre elle ne vise qu'à obtenir une statistique exprimant le degré de relation ou
"Corrélation".
d
association (linéaire) entre les deux variables, nous parlerons de
n
Ainsi notre problème sera : Développer une équation qui permette de prédire une variable à partir
a
d'informations collectées sur l'autre (régression) et d'obtenir une mesure du degré de cette relation
g
(corrélation).
5.2.4 Analyse conrmatoire
B u
t1
La détermination d'un coecient d'association et la construction éventuelle d'une relation de dé-
a
pendance peut être considérées d'un point de vue purement descriptif. C'est même souvent un point
t
de départ, d'explorer les relations entre variables avant toute autre analyse. Après cette exploration,
S
il est aussi possible (et souvent indispensable) d'envisager ce problème sous un aspect de "Conr-
aléatoire
mation" (Analyse conrmatoire), en supposant que la série observée peut être considérée comme un
échantillon prélevé de façon dans une population.
Lorsque le chercheur a eectivement prélevé son échantillon de façon aléatoire, des problèmes
d'inférence statistique peuvent être considérés (estimation, intervalles de conances, tests d'hypo-
thèses,. . ..) Dans ce cours nous nous limiterons aux aspects descriptifs de l'analyse, les aspects infé-
renciels étant abordés dans le cours de Statistique mathématique en deuxième année.
5.3 Organisation d'une série statistique bivariée

Soit une série statistique bivariée {(xi , yi ); i = 1, . . . , n} résultant de la mesure de deux variables
X et Y sur n individus.
5.3.1 Le Nuage de points

Si les 2 variables X et Y sont quantitatives, une manière simple de visualiser les données c'est de
représenter chaque individu i par un point dénie dans les systèmes d'axes orthogonaux au moyen
de ses coordonnées Xi et Yi .

c Université
Table 5.1 Illustration nuage des points
Xi 12 12 15 14 16 14 12 13 11 11
Yi 4.1 3.4 11.3 10.2 11.5 7.2 6.2 7.8 3.5 3
Exemple :
Intéressons nous à l'argent de poche donné à des jeunes dont l'âge est compris entre 11 et 16
ans en utilisant l'information disponible sur une année. On a mesuré pour chaque individu d'un
échantillon, l'âge (X ) et le montant hebdomadaire moyen (Y ), exprimé en dollars. La série observée
est représentée ci-dessous :
Graphiquement, le nuage de points associant à chaque Xi , la valeur de Yi correspondante se

présentera comme suit :
e o
D
yi
a
14
w
12
10
d
8
n
6 yi
4
a
2
g
0
0 5 10 15 20
B u
t a t1
S
graphique de dispersion
Puisque ce graphique indique la façon dont les points se dispersent dans le plan, on l'appelle aussi
. Le graphique ainsi réalisé doit donner lieu à des interprétations concernant la
forme du nuage des points : Structure, tendance générale, présence ou non des valeurs aberrantes,. . .

c Université
Table 5.2 Tableau de contingence pour une DO2
Valeurs de X Valeurs prises par Y

Y1 Yk YK
x1 n11 n1k n1K
... ... ... ...
xj nj1 njk njK
... ... ... ...
xJ nJ1 nJk nJK
5.3.2 Tableau de contingence

L'exemple précédent se caractérisait par le faible nombre de valeurs recueillies. Dans le cas où
n est plus élevé, chaque couple d'observations peut apparaître à plusieurs reprises. Représentons les
valeurs distinctes de X et Y par x1 , x2 , . . . , xJ d'une part ; et y1 , y2 , . . . , yK d'autre part. Désignons
par njk l'eectif associé au couple (xj , yk ). Nous pouvons dès lors dénir une Distribution Observée
o
à 2 dimensions (D.O.2) par l'ensemble des triplets
D e
{(xj , yk , njk ); j = 1, 2, . . . , J; k = 1, 2, . . . , K}
a
Cette D.O.2 peut être présentée sous la forme du tableau de contingence :
w
Il va de soi que nous pouvons aussi associer à chaque couple (xj , yk ), sa fréquence fjk dénie par :
d
njk
n
n
; j = 1, 2, . . . , J et k = 1, 2, . . . , K .
a
Les eectifs et les fréquences satisfont bien sûr aux relations suivantes :
u g J X
X K
B
njk = n
t1
j=1 k=1
et
a
J X
K
t
X
fjk = 1
S
j=1 k=1
La représentation graphique d'un tableau de contingence devient plus dicile à construire. On

peut par exemple associer un point de coordonnées (xj , yk ) au couple déni par la jème valeur de X
et la kème valeur de Y, en le dotant d'une surface égale à njk
Exemple 44 Une enquête réalisée auprès des femmes d'une ville comporte les 2 questions suivantes :
Combien avez-vous eu d'enfants à ce jour? (variable X );
Combien de frères et soeurs (vivants ou décédés) avez-vous (variable Y ).
En ne considérant que les 80 femmes âgées de plus de 40 ans et ayant au moins 1 enfant, on
construit le tableau de contingence résumant les réponses données à ces 2 questions :
5.4 Association entre deux variables Quantitatives

5.4.1 Séries et Distributions marginales
L'étude d'une série bivariée {(x1 , y1 ); i = 1, . . . , n} comporte en premier lieu l'analyse des séries
marginales univariées obtenues en ne considérant qu'une variable à la fois dans le tableau. Nous avons
donc les séries marginales suivantes (pour une distribution bivariée :)

c Université
Table 5.3 Tableau de contingence pour une DO2
Xj Yk
0 1 2 3 4
1 4 4 2 0 0
2 9 16 4 0 0
3 4 12 9 2 0
4 1 6 1 1 2
5 0 1 0 1 1
1 Série marginale en X : {xi ; i = 1, . . . , n}

2 Série marginale en Y : {yi ; i = 1, . . . , n}
Si l'on dispose d'une D.O.2 sous forme d'un tableau de contingence
{(xj , yk , njk ); j = 1, . . . , J; k = 1, . . . , K} ;
e o
on peut, par une démarche analogue, dénir les distributions marginales :
1. Distribution marginale en
aD X : [DM (X)] :
w
Dénition 32 La DM (X) est dénie par l'ensemble des couples {(x , n ); ∀j = 1, . . . , J} où l'on
d
associe aux valeurs x les eectifs marginaux dénis par :
j j.
n
j
a
K
g
X
nj. = njk ; ∀j = 1, . . . , J
u
k=1
B
2. Distribution marginale en
t1
Y : [DM (Y )] :
Dénition 33 Par analogie, la DM (Y ) est dénie par {(y , n ; Où nous associons

a
.k ); ∀k = 1, . . . , K}
aux valeurs y les eectifs marginaux dénis par :
t
k
S
k
J
X
n.k = njk ; ∀k = 1, . . . , K
j=1
Remarques 3 La somme des eectifs marginaux est bien évidemment égale à n, c'est-à-dire :
J
X K
X
nj. = n.k = n
j k
Dans notre exemple sur le nombres d'enfants des femmes de plus ou moins 40 ans, on peut faire
le tableau :
Ces distributions sont univariées et donnent lieu aux 2 diagrammes en bâtons présentés ci-dessous :
(faire ces diagrammes manuellement et/ou sur Excel :)
On peut aussi introduire des fréquences marginales :
nj.
fj. = ; j = 1, . . . , J
n
n.k
f.k = ; k = 1, . . . , K
n

c Université
Table 5.4 Calculs pratiques tables de contingences
Xj Yk
0 1 2 3 4 nj.
1 4 4 2 0 0 10
2 9 16 4 0 0 29
3 4 12 9 2 0 27
4 1 6 1 1 2 11
5 0 1 0 1 1 3
n.k 18 39 16 4 3 80
Table 5.5 Tableau général de la distribution conditionnelle
Valeurs de X Y
Y1 ... Yk ... YK Total nj.
X1 n11 ... n1k ... n1K n1.
o
... ... ... ... ... ... ...
e
xj nj1 ... njk ... njK nj.
... ... ... ... ... ... ...
D
xJ nJ1 ... nJk ... nJK nJ.
a
n.1 ... n.k ... n.K n
5.4.2 Distributions conditionnelles et Prols
n d w
Une distribution conditionnelle consiste à xer à priori la valeur d'une variable et à
a
Dénition 34
décrire la distribution des valeurs de l'autre.
u g
B
A. Distribution Conditionnelles de Y en X :
t1
Fixons-nous une valeur X, par exemple X = xj
a
Comment se distribuent les valeurs y1 , . . . , yk de Y parmi les individus chez qui la variable X a
t
pris la valeur xj ?
S
La réponse a cette question est fournie par la ligne du tableau de contingence associée à la valeur
xj de X (voir tableau précédent).
Lorsque X = xj , la valeur yk de Y ; (k = 1) est observée njk fois.
Nous pouvons ainsi dénir la distribution conditionnelle de Y en X , ou X est xée à la valeur
xj , que nous désignerons plus brièvement par la notation DC(Y /X = xj ) : {(yk , njk )}, j xé,
k = 1, . . . , K .
Le tableau ci-dessous formalise la distribution conditionnelle de Y en X :
Remarquons que cette distribution observée univariée comporte nj. observations.
Les fréquences conditionnelles auront donc pour valeurs :
njk
fyk /xj = fk/j =
nj.
j k = 1, . . . , K .
prols-lignes
xé,
Les J distributions de fréquence ainsi dénies sont encore appelées les du tableau
de contingence.
Distribution Conditionnelle de X en Y :
Par analogie, on peut se xer une valeur de Y, par exemple Y = yk (voir tableau ci-dessous).

c Université
Les fréquences conditionnelles sont données par :

njk
fxj /yk = fj/k =
n.k
k j = 1, . . . , J .
prols-colonnes
xé,
Les K distributions de fréquence ainsi dénies sont encore appelées les du tableau
de contingence.
Les distribution marginales et conditionnelles sont des distributions observés univariées. Elles
peuvent donc être analysées de manière détaillée à l'aide de l'une ou l'autre des représentations
graphiques déjà vues (au chapitre 2), et au moyen de diverses mesures de position, de dispersion, et
de forme.
Cette analyse peut s'avérer bien utile. En eet, la comparaison des prols-colonnes (ou lignes)
entre eux et avec le prol-colonne (ou ligne) marginal permet de déceler s'il existe ou non une associa-
tion entre les variables X et Y . Si c'est le cas, elle ore la possibilité d'en étudier les caractéristiques.
Exemple : Prols-colonnes en pourcentages :DC(X/Y = yk )
o
Val(x) Y =0 Y =1 Y =2 Y =3 Y =4 DM (X)
e
1 22.2 10.3 12.5 0 0 12.5
D
2 50 41 25 0 0 36.3
a
3 22.2 30.8 56.3 50 0 33.8
w
4 5.6 15.4 6.3 25 66.7 13.8
d
5 0 2.6 0 25 33.3 3.8
Total 100 100
n
100 100 100 100
a
Les distributions conditionnelles de X et Y ont des eectifs totaux diérents, ce qui rend dif-
g
cile leur comparaison directe. C'est pourquoi il est plus judicieux de considérer les distributions
u
conditionnelles de fréquences ou prols-colonnes. C'est ce qui est présentés dans le tableau ci-haut,
B
complété par le prol-colonne marginal (toutes les fréquences y sont exprimées en pourcents). Les
t1
diagramme en bâtons représentant les distributions conditionnelles de X en Y =1 et en Y =2 sont
présentés dans le gure suivante :
S t a fj/1
D.C.(X/Y = 1)
41%
30,8%
15,4%
10,3%
2,6%
xj

c Université
D.C.(X/Y = 2)
fj/2
56,3%
25%
12,5%
6,3%
o
0%
e
1 2 3 4 5 xj
aD
variables X (nombre d'enfants) et
n d w
Une première observation rapide du tableau suggère qu'il existe bien une
Y (nombres de frères et s ?urs).
association entre les
g a
Il semble en eet que les femmes issues d'une famille nombreuse (famille de grande taille) soient
u
plus fréquemment que leurs condisciples, mères de 3 enfants ou plus.
t1 B
5.4.3 Coecient de Corrélation d'une série statistique bivariée
t a
Peut on quantier l'intensité de l'association entre deux variables ?
S
Si l'association entre deux variables traduit en réalité une dépendance statistique entre Y et
X, comment peut-on analyser pareille dépendance ?
Cette sous-section tente de répondre à ces questions. Dans le cas où l'association entre les 2
variables étudiées est de nature linéaire, le Coecient de Corrélation permet de répondre à la première
question.
L'étude de la droite de régression nous permettra de répondre à la deuxième question. Le co-

ecients de corrélation est l'une de valeurs typiques majeures de l'analyse statistique bivariée. La
formulation actuelle de ce coecient est due à Karl Pearson, qui dans ses écrits historiques a attribué
la paternité de cette notion à Auguste Bravais. C'est pour cette raison qu'actuellement on appelle ce
coecient "coecient de corrélation de Bravais-Pearson".
Considérons une série statistique bivariée {(xi ; yi ), i = 1, . . . , n}.

Le Coecient de Corrélation étant une mesure statistique basée sur une statistique appelée la Cova-
riance (COVXY ou SXY ) ; il convient d'abord d'étudier cette dernière avant d'en arriver au Coecient
de corrélation.
La covariance est un nombre qui reète le degré auquel deux variables varient ensemble.
Sa formule est :

c Université
n
1X
COVXY = SXY = (xi − x̄)(yi − ȳ)
n i=1
; ce qui est exactement la même chose
que :
n
1X
COVXY = SXY = xi yi − (x̄ȳ) (5.1)
n i=1
Pour appliquer cette formule, nous reprenons les données sur l'argent de poche remis par les
parents à leurs adolescents. Il y aurait-il un lien (association) assez fort entre l'âge de l'adolescent et
l'argent qui lui est donné ? (confer 5.1).
xi yi xi − x̄ yi − ȳ (xi − x̄)2 (yi − ȳ)2 (xi − x̄)(yi − ȳ)

12 4.1
12 3.4
o
15 11.3
e
14 10.2
16 11.5
aD
14 7.2
12 6.2
w
13 7.8
d
11 3.5
n
11 3
a
130 68 0 0
5.4.4 Remarque sur la Covariance
u g
t1 B
L'interprétation de la valeur de la covariance est inuencée par un changement des unités. C'est
pourquoi il est conseillé de recourir à l'usage de coecient de corrélation de Bravais-Pearson. Lors-
a
qu'on étudie une série bivariée ou une D.O.2, il est commode de présenter les variances marginales
t
et la covariance par l'intermédiaire d'une matrice variance-covariance :
S

s2x sxy
V =
sxy s2x
Cette présentation matricielle est intéressante dans la mesure la mesure ou elle est aisément
généralisable à la prise en compte de plusieurs variables.
5.4.5 Retour sur le Coecient de Corrélation

Habituellement désigné par r, il est dénie comme suit :
Covxy
r= (5.2)
sx sy
où sx et sy sont les écarts-types respectivement de X et de Y, et COVxy est la covariance entre
ces deux variables. Ce coecient présente des propriétés très utiles que nous présentons ci-dessous :
1. r est indépendant de l'origine et de l'unité choisies sur chaque axe. Il s'agit d'un nombre sans
dimension. Ce résultat provient des propriétés de la variance et de la covariance. L'on peut
voir que la r
s'obtient en ajustant la Covariance par les écarts-types des deux variables (il
2
s'agit d'un changement d'unité où d = sx sy )

c Université
2. Si l'on considère les valeurs centrées et réduites
xi −x̄ yi −ȳ
ui = sx
et vi = sy
∀i = 1, . . . , n
Le coecient de corrélation r est égale à la covariance de la série {ui , vi }, c'est-à-dire covariance

entre ui et vi .
n
1X
r= ui vi (5.3)
n i=1
e o
En d'autres termes, le coecient de corrélation est la covariance entre deux variables centrées
D
et réduites.
a
Comme application, reprendre l'exemple 5.1. Et comme exercice, il est demandé aux étu-
w
diants de démontrer cette propriété.
an d
3. A partir de cet exercice, on a pu remarquer qu'aussi bien s2u que s2v sont toutes égales à 1.
g matrice de corrélation
Nous avions d'ailleurs déjà vu que la variance d'une variable centrée réduite est toujours égale
u
à 1 (cf. 3.24). La matrice de variance-covariance 5.4.4 devient alors une
B
qui s'écrit :
t a t1
S

1 r
V = . (5.4)
r 1
4. Interprétation du Coecient de corrélation :
Les écarts-types sx et sy étant toujours positifs, le coecient de corrélation a le même signe

que la covariance. Nous pouvons donc déduire-à l'instar de la covariance-qu'un coecient de
corrélation positif correspond à des variations des deux variables qui vont globalement dans
le même sens. Inversement, le coecient de corrélation sera négatif quand les variables ont
1
tendance à varier en sens opposé. Les graphiques ci-dessous permettent de mieux comprendre
l'interprétation de la corrélation :
1. Ce graphique a été téléchargé sur google-images. Plusieurs autres illustrations peuvent y être trouvées pour
comprendre les interprétations du coecient de corrélation.

c Université
e o
aD
n d w
u g a
B
En l'absence d'association entre les 2 variables, le nuage de points ne montre aucune structure
t1
particulière et le coecient de corrélation prend une valeur pratiquement nulle.
Plus les points du nuage se concentrent autour d'une droite ascendante, plus forte est l'association
t a
linéaire positive, et plus proche de 1 est la valeur de r.
S
Lorsque les points du nuage se positionnent tous parfaitement le long d'une droite ascendante,
le coecient de corrélation est exactement égal à 1. A l'inverse, plus les points du graphique se
concentrent autour d'une droite descendante, plus marquée est l'association linéaire négative entre
les deux variables et plus r se rapproche de sa valeur minimale, -1. Celle-ci est atteinte lorsque tous
les points du nuage se trouvent sur une droite de pente négative.
Nous voyons donc que le coecient de corrélation r est une mesure de l'intensité du lien LI-
NÉAIRE unissant les variables X et Y.
Nous étudierons après le cas du lien non linéaire.
5.5 La Droite de régression

Dans l'exemple précédent, nous avons admis que le montant hebdomadaire moyen (Y ) attribué
Y variable
dépendante (ou expliquée) variable indépendante ou explicative
aux dix jeunes pouvait être fonction de leur âge. Nous dirons alors que la variable est une
et que la variable X est une . Ce type
de dépendance est appelée Régression linéaire, où la variable X CAUSE la variable Y. D'autres
situations où le chercheur s'intéresse à la manière dont une variable prédit une autre sont par exemple :
Le revenu de peut prédire le niveau de consommation des individus (Les gens qui ont des
revenus élevés consomment plus que ceux qui ont des faibles revenus, toutes choses égales par
ailleurs ;)

c Université
Le prix explique la quantité demandée sur un marché : Si le prix augmente, les acheteurs
achètent des quantités plus faibles ; et si le prix diminuent, ils peuvent acheter plus ;
La quantité de carburant consommée mensuellement dans la voiture, est une fonction crois-
sante de la puissance du moteur : Les véhicules qui ont des moteurs très puissants consomment
plus de carburant ;
Etc. : Il est demandé aux apprenants de trouver plusieurs autres cas où une variable expliquent
une autre, et même où plusieurs variables expliquent le comportement d'une variable
5.5.1 Le principe de Moindres Carrés
eo
Nous avons déjà parlé du nuage des points dont le rôle est de montrer la tendance dans la relation
entre une variable dépendante (Y ) et la variable indépendante (X ). Après avoir produit le nuage de
points, l'objectif de la régression est de trouver une droite qui ajuste au mieux les diérents points
D
représentant la dépendance entre les 2 variables : c'est la DROITE DE REGRESSION DE Y EN
a
X. L'idéal est que la droite puisse passer au plus près des points du nuage, de façon à représenter
w
ce nuage par une droite (soit croissante soit décroissante). Le critère d'optimalité retenu est celui
d
de "Moindres carrés". Avant d'expliciter ce critère, nous allons préciser quelques notions et notations :
an
Comme toute relation linéaire, la droite de régression de
g
équation du premier degré. De manière générale, désignons par
Y en X peut être dénie au moyen d'une
(x, ŷ) les coordonnées d'un point ap-
u
partenant à la droite de régression. L'abscisse x de ce point est une valeur quelconque de la variable
B
explicative X et son ordonnée ŷ correspond à la valeur ajustée ou prédite pour Y lorsque X = x.
t1
Dans ce cas, l'équation de la droite de régression de Y en X est de la forme :
S t a
Où :
ŷ = a + bx (5.5)
b ŷ x
Coecient de régression de Y en X
est la pente de la droite, correspondant à la quantité dont varie lorsque augmente d'une
unité (b est aussi appelé );
a est l'ordonnée à l'origine de la droite, ou encore la valeur de ŷ lorsque x = 0.
Déterminer la droite de régression revient alors à déterminer les valeurs des coecients a et b qui
permettent à la droite d'assurer un ajustement optimal au nuage de points.

c Université
y
yˆ = a + bx
b unités
1 unité
e o
aD
a
n d w x
u g a
t1 B
a
Le graphique montre qu'il y a un écart entre la valeur yi réellement observée et la valeur ajustée
t
ŷi fournie par la droite de régression. On note :
S L'équation 5.6 donne

ei = yi − ŷi
ei = yi − (a − bxi ), ∀i = 1, . . . , n
(5.6)
(5.7)
Nous pouvons dès lors considérer que le meilleur ajustement est celui qui minimise globalement
l'amplitude des erreurs d'ajustement ei ; (i = 1, . . . , n).
Plus précisément, le principe des moindres carrés stipule de donner à a et b les valeurs qui minimisent
la somme des carrés des résidus ; ce qui se note :
n
X
min e2i (5.8)
i=1
5.5.2 Méthode d'Estimation par Moindres Carrés

Elle consiste à trouver les valeurs a et b qui minimisent la somme des carrés des erreurs, c'est-à-dire
qui minimisent 5.8
On a :

c Université
n
X
min (yi − ŷi )2
i=1
Pn
Pn min i=1 [yi − (a + bxi )]2
min i=1 [yi − a − bxi ]2
La résolution de ce problème de minimisation sans contrainte permet d'obtenir les paramètres a

et b tels que donnés dans les formules ci-dessous :
Sxy
b= Sx2
et a = ȳ − bx̄.
Application :
o
a) Voir exemple sur l'argent de poche ;
e
b) Relation entre dépenses publicitaires et Chire d'Aaires.
D
Pub 1 2 4 8 6 5 8 9 7
a
Ventes 4 6 8 14 12 10 16 16 12
d w
On peut démontrer (Exercice) que la pente de la droite de régression de Y en X et le coecient de
n
corrélation sont reliés par la relation :
a
b = r ssxy
Comme sy et sx
u g
sont tous positifs, le signe de b sera toujours le même que celui de r.
t1 B
5.5.3 Décomposition de la Variance
t a
Considérons d'abord les résidus :
S En remplaçant a et b
ei = yi − ŷi , ∀i = 1, 2, . . . , n
par leurs valeurs, on peut vérier qu'on a :
ē =
1X
n
ei = 0
n i=1
La variance des résidus (variance résiduelle) notée s2y.x est dès lors dénie par :
n n
1X 2 1X
s2y.x = ei = (yi − a − bxi )2
n i=1 n i=1
Cette variance résiduelle est la mesure de la dispersion des points du nuage autour de la droite
de régression. Le principe des moindres carrés consiste à minimiser la variance des erreurs, ce qui
revient à déterminer la droite du plan autour de laquelle la dispersion du nuage est la plus faible. En
remplaçant a et b par leurs valeurs dans l'expression ci-dessus, on peut montrer que :
s2y.x = (1 − r2 )s2y (5.9)
Avec s2y la variance de y.

c Université
La moyenne des valeurs ajustées ŷ = a + bxi (i = 1, . . . , n) correspond à celle des valeurs observées
yi (i = 1, . . . , n).
n n
1X 1X
⇒ ŷi = yi = ȳ (5.10)
n i=1 n i=1
Et la variance des valeurs ajustées notée s2reg satisfait la relation :
s2reg = r2 s2y (5.11)
Exercice :
Démontrer les relations 5.9, 5.10, et 5.11
En combinant 5.9 et 5.11, on obtient :
s2y = s2reg + s2y.x (5.12)
variation totale ou variance totale de y
o
La relation 5.12 est appelée . Elle établit que l'importance
e
des uctuations (variations) de la variable y (l'objectif étant justement d'expliquer les variations de
y ) mesurée par s2y peut être expliquée par deux facteurs : s2reg et s2y.x .
aD
1. Le premier (la variance des valeurs ajustées : s2reg ) est la variance due à la régression, ou encore
2 2
w
à la variable explicative (x). Cette variance représente une proportion de sy mesurée par r .
Coecient de détermination et correspond au carré du coecient
d
Ce dernier est appelé
r. Il indique le pourcentage de variance (de
n
de corrélation variation) des valeurs observées
a
yi (i = 1, . . . , n) qui peut être expliqué par la dépendance linéaire de Y en X. Plus cette
g
dépendance statistique est forte, plus la valeur du coecient de corrélation r est proche de
2 2
u
+1 ou -1, plus r est proche de 1, et plus sreg constitue une part importante de la variance
2
totale sy .
B
variance résiduelle
s2y.x . Celle-ci quantie les uctuations de la variable
t1
2. Le second terme est la
Y qui ne sont pas expliquées par la droite de régression, c'est-à-dire par la variable explicative
a
x. On peut remarquer que plus la dépendance statistique linéaire de Y en X est intense (forte),
t
2
plus sy.x est faible. On peut par ailleurs remarquer que :
S APPLICATIONS :
2
s2y.x
r =1− 2
sy
Reprendre l'exemple sur l'argent de poche. Calculer la part de variance expliquée par la régres-
2
sion, celle expliquée par les résidus (variance résiduelle), puis calculez le r et commenter chacun de
ces résultats.
Remarque :
s2y.x ≥ 0, s2y > 0. Il s'en suit que :
−1 ≤ r ≤ +1
1 − r2 ≥ 0 ⇒ r2 ≤ 1
Le coecient de détermination est toujours inférieur ou égal à 1. Plus il tend vers 1, plus
l'explication de Y par X est grande.

c Université
5.6 Corrélation entre deux Variables Ordinales : Les données

rangées
Dans certaines expériences, les données apparaissent sous forme de rangs, de classement. Par
exemple, on pourrait demander à des juges de classer des objets par ordre de préférence, et vouloir
connaître la corrélation entre les deux ensembles de rangs. Cela est intéressant pour évaluer la abilité
de certaines procédures de classement.
5.6.1 Ranger les données

Supposons qu'on ait un ensemble de données suivant, disposé par ordre croissant :
5 8 9 12 12 15 16 16 16 17
On donne le rang (1) à la plus petite valeur 5. Les 2 valeurs suivantes reçoivent les rangs (2) et
o
(3). On a ensuite 2 valeurs égales 12 qui doivent être classées. Si elles n'étaient pas égales, on leur
e
attribuerait les rangs (4) et (5). Ici, on va donc faire (4 + 5)/2 = 4.5 et on donne à chacune d'elles
les rangs (4.5). Le 6ème nombre reçoit le rang (6). Les valeurs suivantes sont égales et correspondent
D
aux rangs (7), (8) et (9). Comme la moyenne de ces rangs est 8, elles reçoivent toutes les trois le rang
a
(8). La dernière valeur se voit attribuer le rang (10). Les données et leurs rangs correspondants sont
w
indiqués ci-dessous :
n d
X 5 8 9 12 12 15 16 16 16 17
a
Rangs 1 2 3 4.5 4.5 6 8 8 8 10
u g
5.6.2 Le Coecient de Corrélation de Spearman pour données rangées
B
Rho de Spearman et on note ρ ou rs . C'est le coecient de Corrélation de
t1
On l'appelle encore
Bravais-Pearson appliquée sur les séries rangées
S t a
{[R(xi )], [R(yi )]; i = 1, 2, . . . , n}.
rs = ρ = q P
On a donc :
1
Pn
i=1 [R(xi ) − R̄x ][R(yi ) − R̄y ]
n
{ n1 ni=1 [R(xi ) − R̄x ]2 }{ n1 ni=1 [R(yi ) − R̄y ]2 }

P (5.13)
Avec
1
Pn n+1
R̄x = n i=1 R(xi ) = 2
et
1
Pn n+1
R̄y = n i=1 R(yi ) = 2
Comme les rangs sont des nombres entiers compris entre 1 et n, s'il n'y a pas coïncidence , cette
formule peut encore s'écrire :
Pn 2
6 i=1 [R(xi ) − R(yi )]
rs = ρ = 1 − (5.14)
n(n2 − 1)

c Université
Table 5.6 Illustration sur la corrélation de Spearman
Notes SPORTIFS
A C D F G L M N R V
Xi
Note 8.3 7.6 9.1 9.5 8.4 6.9 9.2 7.8 8.6 8.2
Rang R(xi ) 5 2 8 10 6 1 9 3 7 4
Note Yi 7.9 7.4 9.1 9.3 8.4 7.5 9.0 7.2 8.2 8.1
Rang R(yi ) 4 2 9 10 7 3 8 1 6 5
Table 5.7 Disposition de Calculs corrélation de Spearman
Rangs SPORTIFS
A C D F G L M N R V
R(xi ) 5 2 8 10 6 1 9 3 7 4
R(yi ) 4 2 9 10 7 3 8 1 6 5
[R(xi ) − R(yi )]2 1 0 1 0 1 4 1 4 1 1
e o
Application Deux juges attribuent des scores à dix sportifs au cours d'une compétition. Les notes
D
présentées dans le tableau suivant peuvent être considérées d'un point de vue ordinal. A chaque note
a
attribuée par un juge (xi pour le premier, yi pour le second), on associe son rang dans la série
w
ordonnée.
d
Construisons le tableau permettant de calculer le Coecient de Corrélation de Rang de Spearman
6x14
Il s'en suit que rs = 1 − = 0.915
n
10x(102 −1)
a
Il y a donc une association positive importante entre la liste de notes du premier juge et celle du
Les sportifs bien notés par le premier juge le sont aussi par le deuxième.
g
second juge :
u
5.7 L'association entre deux variables nominales
B
t1
Soit un tableau de contingence
S t a {(xj , yk , njk ), j = 1, . . . , J; k = 1, . . . , K}
On a vu que l'analyse des prols lignes et/ou des prols-colonnes associés à ce tableau permet de
mettre en évidence l'existence d'une association entre les deux variables. Mais comment pouvons-nous
en mesurer l'intensité ?
Pour répondre à cette question, dénissons les ÉCARTS A L'INDÉPENDANCE à partir de
l'exemple suivant :
Sur un échantillon de 100 habitants d'un quartier, on voudrait savoir si "L'ATTITUDE VIS-A-
VIS DU SPORT" notée (variable Y) est liée au "sexe" des habitants (variable X ). Ces variables
prennent les attributs suivantes :
Attitude vis-à-vis du sport (Y ) : P = : Favorable ; D = : Défavorable ; I= : indépendant.
Sexe (X) : F = : femme et H = : homme.
Ce qui donne le tableau de contingence suivant (voir 5.8 à la page suivante) :
Dans le cas où il n'existe aucune association particulière entre X et Y , nous parlerons de situation
d'indépendance : Les prols-lignes et les prols colonnes sont identiques aux distributions des
fréquences marginales.
Ainsi par exemple, 45% des individus prélevés sont des femmes (fréquence n1 ./n).
La situation d'indépendance signie qu'on doit retrouver le même pourcentage de femmes parmi
les individus favorables au sport, parmi les défavorables et parmi les indiérents : soit 45% de 60, 28
et 12 respectivement. Ces valeurs sont dénies par :

c Université
Table 5.8 Tableau de contingence
Xj Yk
P D I nj.
F 21 15 9 45
H 39 13 3 55
n.k 60 28 12 100
Table 5.9 Tableau de contingence
Xj Yk
P D I nj.
F 27 12.6 5.4 45
H 33 15.4 6.6 55
n.k 60 28 12 100
e o
n1. n1. n1.
n
n .1
= 27 n
n .2
= 12.6 n
n .3
= 5.4
aD
w
En appliquant la même procédure pour chaque ligne et chaque colonne, nous obtenons le tableau
d
suivant(voir 5.9)
eectifs théoriques
n
Les quantités contenues dans ce tableau sont qualiées d' puisqu'il s'agit
a
des eectifs que nous aurions théoriquement dû observer dans l'échantillon si aucun lien n'existait
g
entre les variables (caractères) X et Y.
u
A chaque eectif njk d'un tableau de contingence, on associe donc un eectif théorique n∗jk déni
B
par :
nj.
t1
n∗jk = n.k ; ∀j = 1, . . . , J; k = 1, . . . , K
n
a
Nous appelons alors écart à l'indépendance, la quantité :ejk = njk − n∗jk
t
Plus ces écarts sont élevés (en valeurs absolues), plus on s'éloigne de la situation d'indépendance.
S
La mesure d'association la plus courante se base sur ces écarts. Elle est appelée Khi-carré et est
dénie par l'expression :
J X
K
2 2
X (njk − n∗jk )2 X X ejk
D =χ = =
j=1 k=1
n∗jk j k
n∗jk
ejk
Pour notre exemple, le tableau des écarts et celui des quantités vont nous permettre de calculer
n∗jk
la valeur de D2 .
En sommant les éléments du dernier tableau, nous obtenons D2 = 7.61.
Il est utile, en outre de connaître la part prise par chaque cellule du tableau dans la valeur de D2 .
2 ∗ 2
En divisant chaque élément par ejk /njk par D , nous obtenons le tableau suivant (5.10) :
Table 5.10 Contribution des éléments du tableau contingence
e2jk /n∗jk /D2

P D I
F 0.175 0.060 0.315
H 0.143 0.049 0.258

c Université
On constate ainsi que le comportement qui participe le plus à l'écart à l'indépendance est celui
D2 est dû à cette case du tableau. Le coecient D2 est aussi
Mesure du Khi-deux
des "femmes indiérentes" : 31,5% de
appelé la .
Il fait l'objet d'un test statistique qui sera développé dans le cours de Statistique mathématique.
Cette statistique varie en fonction de la taille de l'échantillon (n). Pour éviter cette inuence, on
calcule parfois une autre statistique :
D2
φ2 =
n
e o
aD
n d w
u g a
t1 B
S t a

c Université
e o
aD
n d w
u g a
t1 B
S t a

Chapitre 6
ANALYSE DES SÉRIES
CHRONOLOGIQUES OU TEMPORELLES
o
6.1 INTRODUCTION
6.1.1 Le concept de série chronologique
D e
Dénition 35
wa
Une série chronologique est une variable statistique dont les observations sont re-
pérées dans le temps. C'est une série d'observations quantitatives réalisées à des dates successives
t1 , t2 , . . . , tn
an d
u g
Nous désignerons par Y la variable observée, et par {y1 , y2 , . . . , yn } la série observée. Pour simplier
l'écriture, nous ne considérerons que le cas où les dates d'observations sont équidistantes, ce qui
B
1, 2, . . . , n.
t1
permet de les représenter par
Dans ces conditions, la série chronologique est notée {y1 , y2 , . . . , yn } ou {yt , t = 1, 2, . . . , n} ou
a
encore plus simplement {yt }. Les séries chronologiques sont extrêmement utilisées dans les sciences
t
sociales et, en particulier, en économie parce que la plupart des variables étudiées en économie
S
évoluent avec le temps. Le chercheur essaie généralement de comprendre cette évolution (causes
possibles) et de pouvoir prévoir le comportement de la variable dans le futur.
L'étude d'une série chronologique peut répondre à des objectifs divers : Dehon et al. (2015) en
retiennent trois que nous présentons ci-dessous :
Description du phénomène étudié et sa décomposition ;

Son lissage ;
La détermination des prévisions.
6.1.2 Représentation graphique d'une série chronologique

Exemple :
1
Le tableau suivant et le graphique retracent le nombre mensuel de création d'entreprises en
France de janvier à juin 2005.
Les données du tableau 6.1 portent sur une série chronologique relative au nombre mensuel
d'intérimaires employés par une entreprise dont l'activité est liée au tourisme (voir le tableau suivant).
1. INSEE, Conjoncture, Bulletin d'informations rapides, numéro 2005, 11 juillet 2005
145
c Université
Table 6.1 Données nombre de créations d'entreprises
Nombre de créations d'entreprises

Janvier 24966
Février 26942
Mars 26790
Avril 25684
Mai 25050
Juin 26566
Table 6.2 Données nombre d'intérimaires
Années Mois yt
J F M A M J J A S O N D
2012 3 3 5 7 8 12 15 13 11 7 6 6
2013 5 7 8 12 14 16 17 12 11 11 10 6
2014 7 8 11 13 15 18 23 20 15 13 11 9
e o
2015 7 7 8 12 16 20 25 27 23 17 15 14
aD
n d w créations
g a
27500
27000
u
26500
B
26000
t1
25500
créations
25000
a
24500
t
24000
S
23500
janvier février mars avril mai juin
interim
30
25
20
15
10
interim
5
0
J A Ju O J A Ju O J A Ju O J A Ju O
2012 2013 2014 2015

c Université
Le deuxième graphique montre que l'entreprise a tendance à employer de plus en plus d'intéri-
maires au l des ans. De plus, ce nombre uctue de mois en mois de telle façon que l'emploi est
plus important durant les mois d'été que durant les mois de la saison sèche, que pendant les autres
saisons.
e o
aD
n d w
u g a
t1 B
6.2 DÉCOMPOSITION D'UNE SÉRIE CHRONOLOGIQUE
S t a
6.2.1 La Périodicité d'une série chronologique
Les séries chronologiques peuvent être annuelles, trimestrielles, mensuelles, hebdomadaires, jour-
nalières et même infra-journalières. Par exemple, le graphique suivant illustre l'évolution journalière
de la mortalité, en comparaison du niveau de concentration du carbone dans l'air :

c Université
e o
aD
n d w
u g a
t1 B
S t a
A l'inverse, certaines données sont disponibles beaucoup plus rarement. On aura alors des observations
sporadiques qui permettront de retracer l'évolution sur une longue période, mais avec une périodicité
irrégulière.
Remarques 4 Pour représenter graphiquement les séries chronologiques, on mettra toujours le temps
c Université
en abscisse et les valeurs de la variable en ordonnée.

La représentation la plus habituelle est le nuage de points. Mais il est fréquent que l'on relie les
points entre eux.
6.2.2 Tendance, variations saisonnières et accidentelles
tendance trend
L'observation des séries chronologiques permet de distinguer trois composantes principales. La
variations accidentelles
première de ces composantes, la ou , donne le sens de l'évolution sur la durée. La
seconde composante, ce sont les .
En examinant le graphique de la page 296 de [1] (série mensuelle observée sur plusieurs années),
nous constatons empiriquement l'existence d'une évolution à Long terme, appelée Tendance, repré-
sentée par la ligne continue en grisé clair. On remarque aussi la présence d'une deuxième composante
à plus ou moins Long Terme (représentée par la ligne discontinue en grisée foncé) qui, contrairement
à la tendance, est supposée périodique : C'est la composante cyclique. Elle rend compte de mouve-
o
ments importants, successivement à la hausse et à la baisse, du phénomène étudié. Une troisième
e
composante, périodique elle aussi, se reproduit chaque année : Il s'agit de la composante saisonnière
due, la plupart du temps, à des inuences extérieures, naturelles ou non. C'est le cas de l'inuence
aD
climatique des saisons (achat intensif des jouets en décembre), l'importance des voyages pendant les
vacances scolaires,... Enn, il existe toujours une composante accidentelle ou erreur - représentant
w
généralement des inuences mineures et souvent imprévisibles sur le phénomène étudié. Par exemple,
d
une journée de soleil ou de pluie intensive inuencera de façon opposée la fréquentation des parcs
n
publics sans cependant bouleverser à moyen ou long terme les habitudes des uns ou des autres.
a
Le tout se combine pour constituer la série en traits pleins noirs. Ces trois composantes ne
g
sont pas toujours simultanément présentes dans une série chronologique. Certaines séries n'ont pas
u
de tendance, d'autres n'ont aucune composante périodique. D'autres enn, ne connaissent aucune
B
variation accidentelle. L'existence de ces composantes peut notamment dépendre de l'intervalle de
t1
temps entre deux dates d'observations successives.
a
Ainsi, une composante saisonnière est généralement absente dans une série d'observations an-
t
nuelles. Par ailleurs, un phénomène stable en moyenne, ne présentera pas de tendance (on parle de
S
tendance constante). En outre, la longueur de la série (nombre d'observations), peut être un obstacle
une composante cyclique n'apparaî-
à la mise en évidence d'une composante. En particulier,
tra complètement que si l'intervalle entre la première date d'observation et la dernière
est au moins égale au double de la longueur de ce mouvement périodique. Dans le cas
contraire, on peut être amené à ne pas pouvoir distinguer la composante cyclique de la tendance.
Il faut donc être extrêmement prudent an de ne pas tirer des conclusions hâtives sur l'existence
ou non de ces diérentes composantes.
Nous étudierons dans la suite les méthodes qui permettent d'identier et de quantier ces trois
composantes.
6.3 MODÈLES EMPIRIQUES D'AGRÉGATION

Désignons les 4 composantes introduites ci-dessus par les lettres respectives T (tendance), C
(cycle ou composante cyclique), S (composante saisonnière), et E (erreur). Si l'on ne désire pas - ou
si l'on ne peut pas - distinguer T de C , nous noterons par f la composante jointe (extra-saisonnière
ou conjoncturelle). Il y a des multiples façons d'agréger ces composantes. Deux d'entre elles sont
particulièrement simples : elles consistent à les ajouter ou à les multiplier. Nous examinons les deux
cas.

c Université
6.3.1 Modèle additif

Si l'on indice les composantes par la date d'observation t (t = 1, 2, . . . , n), le modèle additif se
note
yt = Tt + Ct + St + Et (6.1)
ou encore
yt = ft + St + Et (6.2)
Dans ce cas, les diverses composantes agissent de façon indépendante, ce qui donne généralement
un comportement semblable à celui du premier graphique de la gure ci-dessous :
e o
aD
n d w
u g a
t1 B
S t a
6.3.2 Modèle multiplicatif

Le modèle multiplicatif se présente sous la forme
yt = Tt × Ct × St × Et (6.3)
où t = 1, 2, . . . , n.
Si l'on pose St = 1 + st et Et = 1 + et , le modèle peut encore s'écrire

c Université
yt = ft (1 + st )(1 + et ) (6.4)
ou encore
yt = ft + ft st + ft (1 + st )et (6.5)
Cette dernière expression nous montre qu'un modèle multiplicatif peut être reformulé sous la
forme d'un modèle additif dans laquelle la composante saisonnière est proportionnelle à ft , et l'erreur
proportionnelle à ft et à (1 + st ). Le comportement de la série adopte dès lors une allure dont la
variabilité se modie dans le temps, comme dans le cas du 2ème graphique de la gure 6.3.1.
Plus clairement, Dans le modèle additif, les variations autour du trend demeurent dans une bande
de variation à peu près constante ; tandis que dans le modèle multiplicatif, les variations autour du
trend s'amplient.
Le plus simple pour déterminer le modèle le mieux adapté à une série chronologique particulière
est de faire un graphique, d'y ajouter le trend linéaire et d'observer les uctuations autour du trend.
2
Si ces uctuations sont régulières (graphique a a), il s'agit d'un modèle additif. Si au contraire elles
o
s'amplient (graphique b), il s'agit d'un modèle multiplicatif :
e
Dans le cas de données saisonnières (par exemple des données trimestrielles), on peut aussi calculer
D
la moyenne annuelle de la variable et ensuite pour chaque trimestre, on retranche de la valeur du
a
trimestre la valeur de la moyenne annuelle et on obtient un écart. il sut alors de comparer les écarts.
w
Si les écarts ne cessent d'augmenter avec le temps, on en conclut que le modèle est multiplicatif. Si
d
non, c'est que le modèle est additif.
n
Remarques 5 An de faciliter la lecture et l'usage des données d'une série chronologique présentant
a
un caractère saisonnier de longueur J , il est utile de les présenter dans un tableau à double entrée
g
où les colonnes correspondent aux saisons j = 1, 2, . . . , J et les lignes correspondent aux périodes
u
successives que nous noterons i = 1, 2, . . . , I .
Dans ce cas, le modèle 6.2 (page 150) et 6.5 (page 151) peuvent être réécrits en désignant l'ob-
t1 B
servation y par y , la composante conjoncturelle f par f , et ainsi de suite. Nous utiliserons cette
notation dans la suite.
t ij t ij
S t a
6.4 ANALYSE DE LA TENDANCE
Le Trend en français la Tendance est ce qui, au-delà des variations saisonnières et accidentelles
d'une série, indique le sens de son évolution. Autrement dit, le trend nous renseigne sur le fait de
savoir si la variable augmente, diminue ou reste stable de façon tendancielle.
6.4.1 Approche exploratoire

L'étude du graphique des données observées constitue généralement la manière d'aborder ce
problème. Ainsi l'examen de la gure de la page 150 fait apparaître une tendance croissante. La
mise en évidence d'un type de croissance particulière peut cependant être gênée par un nombre
trop restreint de données (une série plus longue faciliterait la tâche) ou par des uctuations trop
importantes. L'analyse graphique peut donc être trop délicate pour permettre un traitement de la
tendance (trend).
C'est ainsi que pour déterminer la tendance d'une série, il y a deux méthodes principales : La
méthode des moyennes mobiles et L'Ajustement analytique qui comprend la tendance linéaire
et la tendance non-linéaire.
2. https ://www.google.be/search ?q=modele++serie+chronologique

c Université
Table 6.3 Recettes journalières du restaurateur
Semaines Jours
Lu Ma Me Je Ve Sa Di
1 12.5 11.5 28.5 16.5 31.0 40.5 34.5
2 9.5 7.5 23.5 10.5 26.0 34.5 28.5
3 5.5 5.5 16.5 7.5 21.0 25.5 23.5
4 6.5 6.0 17.5 4.0 21.0 26.0 24.0
6.4.2 Ajustement par Moyennes mobiles
On peut atténuer les variations d'une série chronologique en calculant la moyenne arithmétique
d'un nombre xé k de valeurs successives, que l'on aecte à la moyenne arithmétique des dates
o
d'observations. Prenons le cas où k=5 (moyenne mobile d'ordre 5). La manière de procéder est la
e
suivante :
D
Calculer la valeur centrale des 5 premières observations : (5 + 1)/2 = 3
a
Calculer la moyenne des 5 premières observations et l'attribuer à la date 3 (valeur centrale) :
w
Ainsi
an d ȳ3 =
y1 + y2 + y3 + y4 + y5
(6.6)
g
5
B u
t1
On recommence la procédure sur le groupe des observations {y2 , y3 , . . . , y6 } qui nous donne
une moyenne ȳ4 , et ainsi de suite.
S t a
Dans la mesure où le groupe de valeurs est chaque fois décalé d'un rang vers la droite sur l'axe du
temps, on parle de
Le nombre
valeur de k
k
moyenne mobile, que l'on désigne plus brièvement par MM.
d'observations utilisées à chaque fois est appelé
est généralement choisie en fonction de notre objectif de lisser la série.
ordre de la moyenne mobile. La
Remarques 6 Lorsqu'une composante saisonnière est présente, on constate aisément qu'il est plus
judicieux de choisir sa longueur comme valeur de k.
Considérons le tableau suivant présentant les recettes quotidiennes d'un restaurateur dont le
restaurant est ouvert 7 jours sur 7 pendant 4 semaines consécutives.
Le graphique 6.3.1 nous montre l'existence d'une composante saisonnière dont la longueur est
la semaine.
c Université
Graphique des recettes journalières

45
40
35
30
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
semaines recettes
e o
aD
n d w
u g a
t1 B
S t a
Calculons dès lors les moyennes mobiles d'ordre 7. Nous commencerons par la 4ème (7+1)/2=4. Ainsi
yt−3 + yt−2 + yt−1 + yt + yt+1 + yt+2 + yt+3

ȳt = , ∀t = 4, . . . , 25 (6.7)
5
7
1 12.5+11.5+...+34.5
P
ȳ4 = 7
yt = 7
= 25
t=1
7
1 11.5+...+34.5+9.5
P
ȳ5 = 7
yt = 7
= 24.57
t=2
On continue jusqu'à la 25ème moyenne mobile (on perd 3 observations avant et 3 observations
après !). Le tableau suivant reprend les MM trouvées :
Et le graphique comprenant les moyennes mobiles :

c Université
Table 6.4 Recettes journalières ajustées
Semaines Jours
Lu Ma Me Je Ve Sa Di
1 - - - 25 24.57 24.00 23.29
2 22.43 21.71 20.86 20.00 19.43 19.14 18.14
3 17.71 17.00 15.71 15 15.14 15.21 15.36
4 14.86 14.86 14.93 15.00 - - -
45
40
35
30
25 Série1
o
20 Série2
e
Série3
15
10
D
5
a
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
n d w
u g a
t1 B
S t a
Le graphique suivant contient les moyennes mobiles qui sont représentées par la courbe descen-
dante. On vérie ainsi que le lissage de la série souligne bien le caractère décroissant de la tendance
(nous considérons ici que 4 semaines d'observations représentent le long terme).
Au vu de l'exemple 6.4, il convient d'énoncer d'autres remarques suivantes ([1]) :
Remarques 7 Si l'ordre k est impair (k = 2p + 1), les moyennes mobiles sont aectées à des dates
d'observation.
Remarques 8 si k = 2p + 1, la série des moyennes mobiles d'ordre k, construite à partir d'une
série chronologique de n observations, contient (n − 2p) valeurs. Elle est donc plus courte que cette
dernière.
c Université
Remarques 9 Comme, d'une part, toutes les observations interviennent avec le même poids (voir
6.6 et 6.7; pages 152 et 153) dans le calcul de ȳ , et que, d'autre part, on utilise en l'instant t autant
d'observations passées que futures, la moyenne mobile est dite symétrique simple. En posant à
t
nouveau k = 2p + 1, elle s'exprime sous la forme :
p
1 X
ȳt = yt+j (6.8)
k j=−p
où t = p + 1, . . . , n − p.
Une Moyenne mobile d'ordre k impair est représentée par la notation M M (k).
o
6.4.3 Ajustement analytique
D e
On rencontre fréquemment des séries qui, au vu des graphiques des données observées et de celui
a
des moyennes mobiles judicieusement choisies, semblent présenter une tendance dont la forme est
w
proche d'une courbe dénie analytiquement (une droite, une courbe exponentielle, etc)
d
On peut dès lors être tenté d'ajuster cette série par une courbe qui représente son évolution à
n
long terme. Il est usuel de déterminer cette courbe d'ajustement à partir de valeursỹi (i = 1, . . . , m)
a
qui ne sont plus inuencées par la présence d'une composante périodique dans la série {yt }. On peut
g
ainsi considérer une série de moyennes mobiles, de moyennes annuelles,... Dans ce cas, le problème
u
s'étudie en deux étapes.
t1 B
Etape1 On choisit une courbe particulière d'équation y = φ(x), où x représente le temps. Le
{yt }
a
choix de φ(x) repose d'abord sur l'examen du graphique de la série et des séries trans-
t
formées.
S
Etape2 Si a1 , . . . , a r désignent les paramètres intervenant dans la fonction φ(x) qui dénit cette
courbe, il faut déterminer leurs valeurs de manière à ajuster au mieux les points observés
{(xi , ỹi ); i = 1, . . . , m} où xi désigne la date à laquelle ỹi est aectée. Nous distinguerons le
cas où la tendance est supposée linéaire du cas contraire.
Tendance linéaire On calcule les coecients a et b de la droite de régression comme expliqué au

chapitre sur la régression simple.
Exemple 1 :
Soit le tableau suivant qui donne l'évolution d'une série chronologique en fonction du temps,
repéré par l'indice t.
t 0 1 2 3 4 5 6
z 4 3 9 10 11 16 15
Le graphique en nuages de points de cette série chronologique est illustré par la gure ci-après :

c Université
z
18
16
14
12
10
8 z
6
4
2
0
0 1 2 3 4 5 6 7
e o
aD
n d w
u g a
t1 B
S t a
Nous allons déterminer la tendance de cette série par une droite y = ax + b en calculant les
coecients d'après les formules précédentes. Ces calculs permettent d'obtenir l'équation suivante
pour le Trend (tendance) :
ẑ = 2.18t + 3.17
Et sa représentation graphique (la droite qui ajuste "au mieux" le nuage précédent) est donnée

c Université
ci-dessous :
18
16
14
12
10
z
8 zi
6
Linéaire (zi)
4
2
0
0 2 4 6 8
t
e o
aD
n d w
u g a
t1 B
S t a
Exemple numéro 2 :
t 2009 2010 2011 2012 2013 2014 2015 2016 2017

Xt 32 38 48 52 61 73 80 84 95

c Université
Eectuer un ajustement linéaire par la méthode des moindre carrés puis Représenter les résultats
graphiquement.
Tendance non-linéaire .
La possibilité de déterminer une courbe de tendance non linéaire repose sur une démarche ana-
logue. A partir de l'examen du graphique des données observées ou des données transformées, on
recherche une courbe d'ajustement qui semble décrire raisonnablement le comportement à long terme
de la série. Dans cette démarche empirique, il est conseillé de retenir des courbes dénies avec peu
de paramètres, à condition qu'elles soient acceptables au vu de l'évolution du phénomène étudié.
Quelques exemples de fonctions pouvant représenter des phénomènes non-linéaires sont présentés
ci-dessous :
1. Ajustement exponentiel
ŷ = 10a+bx (6.9)
Ou encore
o
ŷ = ea+bx (6.10)
e
Les deux donnent lieu à la fonction dite log-linéaire
aD
2. Ajustement double logarithmique
Y = AX β ; A > 0 (6.11)
d w
A et β sont des constantes.
n
Une caractéristique intéressante de l'ajustement double logarithmique, est qu'il peut être
a
linéarisé juste en introduisant le logarithme de part et d'autre de l'équation.
g
3. L'ajustement semi-logarithmique
B u ŷ = a + bln xi , ∀i = 1, 2, . . . , n (6.12)
t1
4. Ajustement quadratique
a
ŷ = a + bx + cx2 (6.13)
S t 5. Ajustement hyperbolique
< 0),
1
ŷ = a + b( )
x
Cette fonction est souvent utilisée pour des phénomènes qui connaissent des points de "satieté"
dans le temps (b ou qui ont des limites inférieures (b > 0).
(6.14)
6. Ajustement Logistique
k
ŷ = ; (a, b, k > 0) (6.15)
1 + be−ax
L'estimation des paramètres des courbes dénies par les équations 6.9, 6.10, 6.11, 6.12, 6.13 et
même 6.14 ne pose aucune diculté. Cela suit la démarche de régression que nous avons déjà illustrer,
sauf que pour le cas de l'ajustement quadratique, cela conduit à une régression multiple (plusieurs
variables explicatives). L'ajustement donné par 6.15 des courbes logistiques est en revanche plus
complexe. Nous y reviendrons en première licence dans le cours d'économétrie.
Exemple 45 Considérons la production annuelle d'électricité d'un pays de 2005 à 2015, exprimée
en millions de Kw/h. La série observée est contenue dans le tableau suivant :
Année (t) 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015
Production (y ) 320 325 340 355 380 395 425 450 485 520 560
t

c Université
1. Représentez graphiquement l'évolution annuelle de cette production et dites quelles fonction

peut "mieux" l'ajuster"
2. Trouvez les paramètres de l'équation de la tendance représentant cette évolution.
3. Écrivez cette équation d'ajustement exponentiel.
Voici la représentation graphique des données brutes et logarithmiques (base 10) :
Production (yt)
600
500
400
300
200 Production (yt)
o
100
e
0
aD
w
log10(yt)
d
2,8
2,75
n
2,7
2,65
a
2,6
2,55
log10(yt)
g
2,5
2,45
u
2,4
2,35
t1 B
S t a
L'examen du graphique fait penser à un comportement exponentiel de la tendance décrit par
l'équation 6.9 (page 158).
Si l'on dénit ẑ = log10 ŷ , il en découle que
log10 ŷ = a + bx (6.16)
L'ajustement de cette équation conduit à la courbe pour yt
ŷ = 102.61+0.02x
Les valeurs de tendance sont alors présentées dans le tableau suivant :

c Université
Table 6.5 Valeurs de tendance (logarithmique)
t 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015
Tt 305 324 343 363 385 407 432 457 484 513 543
6.5 ÉTUDE DE LA COMPOSANTE CYCLIQUE

L'étude de cette composante est plus délicate dans la mesure où l'existence d'un phénomène
périodique à long terme n'est pas toujours certaine. Par ailleurs, il faut déjà disposer d'un nombre
important d'observations et/ou d'informations extérieures à la série pour mettre en évidence une
telle composante. Nous n'allons donc pas présenter cette question ici.
6.6 ÉTUDE DE LA COMPOSANTE SAISONNIÈRE

6.6.1 Vocabulaire
e o
D
composante sai-
a
sonnière
Beaucoup de phénomènes, en particulier les phénomènes économiques, ont une
w
. Certains produits se vendent mieux en Saisons des pluies, d'autres en saison sèche ; certains
d
produits se vendent mieux pendant la période scolaire (ou seulement à la rentrée scolaire). L'ap-
n
pellation de "Variation Saisonnière" ne signie pas pour autant que la composante saisonnière se
a
répartisse sur l'année, même si c'est souvent le cas. Il y a aussi des récurrences de type saisonnier
g
à l'intérieur d'un mois, d'une semaine, voir d'un jour. Certains produits se vendent mieux certains
u
jours et à certaines heures.
On est ainsi amené à calculer une composante saisonnière, puis un coecient saisonnier, an de
B
déterminer la série corrigée des variations saisonnière ou série CVS.
t1
L'intérêt de ce calcul est d'obtenir une série chronologique dont l'évolution est débarrassée de
a
la composante saisonnière qui parfois masque la tendance. Dans le cas souvent cité du chômage,
t
par exemple, on peut avoir l'impression d'une augmentation ou d'une diminution tendancielle du
S désaisonnalisation
chômage alors qu'il y a seulement des embauches ou des mises à pied qui ont lieu chaque année à la
même période et avec la même ampleur. On parle ainsi de du taux de chômage,
laquelle atténue les variations dues aux embauches pendant la période concernée et aux mises à pied
pendant la période correspondante.
Pour obtenir une série corrigée des variations saisonnière, ou série CVS, on procède en trois
étapes : (1) on calcule la composante saisonnière, (2) on en déduit le coecient saisonnier et (3) on
retranche le coecient saisonnier de la série originale.
Dans l'exemple qui suit, nous supposerons que la série suit un modèle additif, l'application au cas
multiplicatif étant légèrement diérente. voir Py, 2004).
6.6.2 Les étapes du calcul de la série CVS

Ci-après, les étapes du calcul de la série CVS sont détaillées, puis appliquées à un exemple concret :
1. Détermination de l'équation de la Tendance (Trend) par Régression linéaire ;
2. Calcul des coecients saisonniers ;
3. Détermination de la série CVS

c Université
6.6.3 Détails du calcul pratique des coecients saisonniers Sj en modèle

additif
Soit une série brute yt observée sur n années (n = 1, 2, . . . , i, . . . , n) par période p. p = 12 mois
(j = 1, 2, . . . , 12) ou 4 trimestres (j = 1, 2, 3, 4).
Les variations saisonnières St sont égales par hypothèse du modèle additif à
S t = y t − ft (6.17)
Les yt sont les valeurs observées. Les ft sont les valeurs calculées précédemment. On obtient donc
n×j valeurs de St qu'on peut écrire Sij (ici, St = Sij )
On retiendra 12 valeurs de Sj (mois) ou 4 valeurs de Sj (trimestres) comme coecients saisonniers
Sj , en calculant mois par mois ou trimestre par trimestre, la moyenne arithmétique des St sur
l'ensemble des n années
o
1X
Sj = Sij (6.18)
e
n i=1
D
Note importante :
a
On peut remplacer le calcult de la moyenne par celui de la médiane de la série des Sij , pour éviter
w
l'inuence des valeurs abérrantes.
d
La somme sur l'année de ces coecients saisonniers Sj devrait en toute logique être égale à 0. En
n
fait, bien souvent, les approximations des calculs conduisent à un résultat légèrement diérent. Dès
a
lors, dans le cas où la somme Sj est diérente de 0, on calcule un coecient correcteur noté "Rho"
g
(ρ) qui est la somme des Sj sur l'année :
u
12
B
1 X
ρ= Sj (6.19)
t1
12 j=1
a
ou pour les trimestres
S t
4
1X
ρ= Sj (6.20)
4 j=1
et l'on retient en dénitive comme coecient saisonnier corrigé la valeur

Sj0 = Sj − ρ (6.21)
Le coecient correcteur ρ répartit l'erreur d'approximation sur l'ensemble des périodes, et le

principe théorique selon lequel la somme ou la moyenne des coecients saisonniers est égale à zéro
0
est respecté pour les Sj (coecients saisonniers corrigés).
P 0 1
P 0 0
j Sj = 0 ou p j Sj = 0 ou S̄ = 0.
Dans la section suivante, nous illustrons cette démarche de manière chirée.
6.6.4 Exemple
Soit le tableau suivant, qui donne l'évolution d'une série chronologique trimestrielle :
2002 2003 2004
T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4
2 4 14 18 2 6 22 24 10 12 20 24

c Université
Le graphique suivant montre la série et sa tendance. Il révèle deux caractéristiques qu'il est
nécessaire de vérier pour employer la méthode proposée.
1) D'une part, la série étudiée suit un modèle additif. En eet, les variations autour du trend ne
semblent pas s'amplier avec le temps.
valeur
30
25
20
15
e o
10 valeur
D
5
a
0
w
T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4
d
2002 2003 2004
g an
B u
t a t1
S
2) D'autre part, il existe bien une composante saisonnière, ici trimestrielle, qui se superpose à une

c Université
tendance à la hausse. On note en eet qu'à l'intérieur de chacun des trois cycles annuels, la variable
débute à un niveau faible au premier trimestre, puis augmente à chaque trimestre pour atteindre un
maximum au dernier trimestre, avant de repartir à la baisse au début de l'année suivante.
a) Détermination de l'équation de la Tendance (Trend) .

On peut aisément utiliser les formules de la régression simple et obtenir l'équation de la tendance,
donnée ci-dessous (à quelques arrondissements près)
fi = ati + b = 1.45ti + 3.78
b) Calcul des Coecients saisonniers .

Pour calculer les coecients saisonniers, il faut d'abord isoler la composante saisonnière de la
série. Pour ce faire, il convient de calculer les valeurs tendancielles, soit fi pour i=1 à 12, grâce à
l'équation du trend, puis de retrancher fi de yi .
o
Par exemple, quand i = 1, on a :
e
f1 = 1.45 × 1 + 3.78 = 5.23
La composante saisonnière quand
aD t=1 est donc
d w
S1 = y1 − f1 = 2 − 5.23 = −3.23
n
En réitérant les calculs pour les 12 valeurs, on obtient le tableau suivant :
a
(Ce tableau doit être complété Ã l'auditoire sous-forme d'exercice dirigé par l'enseignant).
g
ti yi fi Si = yi − fi
u
1 2
B
2 4
t1
3 14
a
4 18
t
5 2
S
6 6
7 22
8 24
9 10
10 12
11 20
12 24
Les quatre coecients saisonniers s'obtiennent en faisant la moyenne arithmétique des compo-
santes saisonnières (dernière colonne du tableau, Si ) pour 2002, 2003, et 2004. On obtient : Compléter
ces opérations à l'auditoire :
C1 = (1/3)(S1 + S5 + S9 ) =
C2 = (1/3)(S2 + S6 + S10 ) =
C3 = (1/3)(S3 + S7 + S11 ) =
C4 = (1/3)(S4 + S8 + S12 ) = P4
On remarque que la somme j=1 Cj = 0 (ici c'est presque nul, à cause des arrondissements !)
Dans le cas contraire, il faudrait appliquer un coecient correcteur
à chaque coecient saisonnier.

c Université
La formule de ce coecient correcteur est :
4
1X
ρ= Cj
4 j=1
On obtient un coecient saisonnier corrigé, Ci0 :
Ci0 = Ci − ρ
c) Détermination de la série CVS La série corrigée des variations saisonnières, dite "série CVS"
s'obtient en retranchant les coecients saisonniers du trend. Désignons par yi∗ la série CVS :
yi∗ = yi − Ci0
où Ci0 représente le coecient saisonnier, éventuellement corrigé (ici cela n'a pas été nécessaire).
o
La dernière colonne du tableau ci-après donne la série CVS. Et le graphique suivant fait apparaître
e
que la série CVS épouse davantage le trend que la série originale. C'est normal parce que nous avons
D
eacé (corrigé) les variations saisonnières.
ti
wa yi yi∗ = yi − Ci0
d
1 2
n
2 4
a
3 14
g
4 18
u
5 2
B
6 6
t1
7 22
8 24
a
9 10
t
10 12
S
11 20
12 24
INSÉRER GRAPHIQUE ICI

On notera néanmoins que la méthode est loin d'être parfaite. En eet, les variations saisonnières
sont atténuées mais non supprimées. Cela vient du fait que la méthode ne permet pas de décompo-
ser très nement les variations saisonnières et les variations accidentelles que nous allons présenter
maintenant.
6.7 LES VARIATIONS ACCIDENTELLES

6.7.1 Dénition
Les variations accidentelles sont ce qui reste lorsqu'on a enlevé le trend de la série ajustée des
variations saisonnières. Comme on vient de le voir, la décomposition entre les variations accidentelles
et les variations saisonnières est loin d'être parfaite.
i = yi∗ − fi

c Université
6.7.2 Exemple
Reprenons les données de l'exemple précédent et calculons la série des variations accidentelles en
appliquant la formule.
On obtient le tableau suivant et la gure correspondante (les chires de la deuxième colonne
doivent être complétés avec la participation des apprenants, puis avec l'aide de l'enseignant, le gra-
phique peut être produit avec Excel) :
Temps ti i = yi∗ − fi
1
2
3
4
5
6
7
o
8
e
9
D
10
a
11
12
w
La somme des 12 éléments de cette série donne un nombre pratiquement égal à zéro. Cela signie
d
que les hausses sont compensées par les baisses (principe de conservation des aires). On peut même
n
bien le vérier sur le graphique.
6.8 COEFFICIENT D'AUTOCORRELATION
u g a
t1 B
Dans la mesure où une série chronologique est une suite de valeurs observées qui, par nature, sont
généralement dépendantes les unes des autres, notamment en raison de l'existence des composantes
a
T, C ou S, il peut être intéressant de mesurer la corrélation entre des observations distantes d'un
t
intervalle de temps xé a priori. Dans ce but, on peut calculer le coecient de corrélation de Bravais-
S
Pearson de la série bivariée
{(yt , yt+k ); t = 1, . . . , n − k; k ∈ N}
appelé le coecient d'autocorrélation d'ordre k et noté rk :
n−k
1
P
n−k
(yt − ȳ1 )(yt+k − ȳ2 )
t=1
rk = s (6.22)
n−k n−k
1 1
P P
[ n−k (yt − ȳ1 )2 ][ n−k (yt+k − ȳ2 )2 ]
t=1 t=1
Dans cette expression, ȳ1 est la moyenne des valeurs y1 , y2 , . . . , yn−k et ȳ2 celle de yk+1 , . . . , yn .
D'autres expression de rk peuvent être envisagées. Remarquons que l'expression 6.22 peut encore
s'écrire, compte tenu de 3.20 (page 77) et 5.1 (page 133) :
n−k
1
P
n−k
yt yt+k − ȳ1 ȳ2
t=1
rk = s (6.23)
n−k n−k
1 1
yt2 − ȳ1 )( n−k 2
P P
( n−k yt+k − ȳ2 )
t=1 t=1

c Université
Table 6.6 Détermination de rk
t k=1 k=2
yt yt+1 yt2 2
yt+1 yt yt+1 yt yt+2 yt2 2
yt+2 yt yt+2
1 0 1 0 1 0 0 2 0 4 0
2 1 2 1 4 2 1 1 1 1 1
3 2 1 4 1 2 2 0 4 0 0
4 1 0 1 0 0 1 1 1 1 1
5 0 1 0 1 0 0 2 0 4 0
6 1 2 1 4 2 1 1 1 1 1
7 2 1 4 1 2 2 0 4 0 0
8 1 0 1 0 0 1 1 1 1 1
9 0 1 0 1 0 0 2 0 4 0
10 1 2 1 4 2 1 1 1 1 1
11 2 1 4 1 2 2 0 4 0 0
12 1 0 1 0 0 1 1 1 1 1
o
13 0 1 0 1 0 - - - - -
e
Totaux 12 13 18 19 12 12 12 18 18 6
Exemple 46
aD
Considérons la série chronologique suivante composée de 13 valeurs : {0, 1, 2, 1, 0, 1, 2, 1, 0, 1, 2, 1, 0, 1}
Elle présente une composante périodique de longueur 4 - et rien d'autre. Le tableau 6.6 et l'expression
n d w
6.23 (page 165) nous permettent de calculer les coecients d'Autocorrélation r pour k = 1, 2. k
g a
12
13
− ( 1213
× 1313
)
u
r1 = q =0
18
− ( 12 19 13 2

)2 − ( )
B
12 13 13 13
t1
6
12
− ( 1212
× 1212
)
r2 = q = −1
a
18
− ( 12
18 12 2
) 2 − ( )
t
12 12 12 12
S
Par analogie, on peut vérier que r3 = 0, r4 = 1, r5 = 0, r6 = −1. Ces résultats peuvent aisément
être visualisés sur des graphiques des séries bivariées mettant yt en abscisse et respectivement yt+1 ,
yt+2 , yt+3 , jusque yt+6 en ordonnée.
Le caractère périodique strict de yt implique que le coecient d'autocorrélation dont l'ordre est
égal à la longueur du mouvement périodique, vaut 1. On peut faire un graphique appelé corrélo-
gramme exprimant le comportement de rk en fonction de k (rk en ordonnée).
Pour des séries plus réelles, le comportement de rk est plus complexe, mais le corrélogramme
aura tendance à présenter un pic en k = J, si J est la longueur d'une composante périodique. Un
tel graphique est utilisé aussi bien pour l'étude de {yt } - pour mettre en évidence ou conrmer
l'existence d'une composante saisonnière et en déterminer la longueur - que de séries créées par
l'analyse, comme par exemple la série des résidus {Et } - pour vérier que celle-ci ne possède aucune
structure particulière et, notamment, ne présente aucun caractère périodique.
6.9 MÉTHODES EMPIRIQUES DE PRÉVISION

6.9.1 Introduction
La prévision est un problème très ancien. Savoir de quoi demain sera fait, ou en tout cas essayer
de le cerner, est une préoccupation de nombreux scientiques ou gestionnaires. Dans sa conception

c Université
t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
yt 12.5 26.2 25.1 11.2 15.7 15.8 16.3 16.7 17.1 17.3 18.3 18.5 19.0 19.3 20.0
la plus simple, ce problème peut se présenter comme suit :

Soit T l'origine de la prévision, c'est-à-dire l'instant en lequel on veut construire cette dernière,
à partir d'un historique {y1 , . . . , yT }.
Par rapport à la série {y1 , . . . , yn } dont on dispose, T peut être égal à n ou à une autre date
antérieure. De même, il n'est pas obligatoire d'utiliser les premières observations de la série, comme
l'illustre l'exemple suivant.
Exemple 47 Considérons la série chronologique du nombre d'acheteurs (en milliers) d'une revue
habitant dans une ville. Elle est présentée dans le tableau suivant, ainsi que sa représentation gra-
phique.
e o
aD yt
w
30
d
25
n
20
a
15
yt
10
g
5
u
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
t1 B
S t a
Il apparaît que les 4 premières périodes sont trop diérentes des autres. Il conviendra donc de
comprendre la raison.
La mesure du phénomène était-elle correcte ?

c Université
t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
yt 4 6 5 7 3 5 6 4 7 5 4 5 3 6 5
N'a-t-on pas intégré des informations concernant d'autres revues ?

S'agit-il d'une campagne de promotion mal gérée ou mal comprise ?
Dans tous les cas, au vue de la régularité du mouvement qui va suivre, il semble inopportun d'utiliser
l'historique avant la période 4 pour prévoir la vente de cette revue dans le futur.
Plaçons-nous dans la situation où l'on désire prévoir la valeur de la variable Y pour un horizon
h, c'est-à-dire, quand on se trouve en T, pour lr'instant (T + h).
Désignons par ŷT (h) cette valeur prédite.
On peut imaginer un certain nombre de méthodes extrapolatives simples qui utilisent l'historique
de la série observée.
h=1 T (T + 1)).
o
Nous examinons d'abord le cas où (prévision faite en pour l'instant Puis nous
e
évoquerons le cas général où h > 1.
6.9.2 Prévision naïve
aD
d w
Une manière d'agir, assez fréquente mais trop simpliste, consiste à choisir
an
ŷT (1) = yT (6.24)
u g
Si cette prévision peut se justier pour un horizon h = 1, elle est généralement à déconseiller
B
dans le cas où h est plus grand.
t a t1
6.9.3 Prévision par Moyenne Mobile simple unilatérale
S
Nous avons vu en 6.8 (page 155) que le concept de moyenne mobile symétrique simple permet
de lisser une série observée à des ns de description. Nous pouvons reprendre le même principe en
utilisant les observations yT , yT −1 , . . . , yT −p situées d'un seul côté de l'instant T
1
ŷT (1) = (yT + yT −1 + . . . + yT −p ) (6.25)
p+1
L'expression 6.25 dénit une Moyenne mobile simple unilatérale qui utilise le présent de la série
(yT ) et son passé. Cette manière de faire ne se conçoit empiriquement que si le phénomène est stable,
c'est-à-dire sans comporter de composantes telles que tendance, cycle ou mouvement saisonnier.
Exemple 48 Considérons la série du nombre quotidien de communications téléphoniques reçues

par une personne à son domicile (donnée dans le tableau suivant). Le calcul de la moyenne des 15
observations peut fournir une prévision acceptable pour les jours à venir, tout au moins si la vie
apparemment routinière de notre individu n'est pas bouleversée par des événements nouveaux :
14
1 75
P
ŷ15 (1) = 15
y15−j = 15
=5
j=0

c Université
yt
8
6
y15(h)
5
4
yt
3
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
T=15
e o
aD
n d w
u g a
t1 B
S t a
6.9.4 Prévision par Lissage exponentiel
Reprenons l'exemple précédent dans lequel la prévision reposait sur l'utilisation d'une moyenne
mobile simple unilatérale (6.25), c'est-à-dire d'une moyenne où toutes les valeurs présentes (relatives
à T) et passées (avant T) interviennent avec le même coecient de pondération 1/(p + 1)
On pourrait cependant supposer que plus une observation est ancienne, moins elle intervient dans
la détermination d'une prévision. Ce type de raisonnement est utilisé dans le lissage exponentiel
simple qui consiste à dénir une valeur prédite ŷT (1) au moyen de l'expression.
ŷT (1) = wo yT + w1 yT −1 + w2 yT −2 + . . . (6.26)
où les coecients wj sont
wj = α(1 − α)j , j = 0, 1, 2, . . . (6.27)
Le coecient α intervenant dans 6.27 est un paramètre réel compris entre 0 et 1. On constate
ainsi que l'observation yT −j a un poids wj d'autant plus faible que j est grand. Le tableau suivant
montre un exemple pour α = 0.9.
j 0 1 2 3 4 5 ...
wj 0.9 0.09 0.009 0.0009 0.00009 0.000009 ...

c Université
L'expression 6.26 peut alors s'écrire sous la forme :
X
ŷT (1) = α(1 − α)j yT −j labelprev5 (6.28)
j≥0
On peut aisément vérier que ŷT (1) est une moyenne pondérée unilatérale car
X X
wj = α(1 − α)j = 1 (6.29)
j≥0 j≥0
Par ailleurs, la détermination de ŷ(1) se fait aisément grâce à la relation de récurrence suivante :
e o
ŷT (1) = αyT + (1 − α)ŷT −1 (1) (6.30)
Si on désigne par
aD
n d w eT = yT − ŷT −1 (1) (6.31)
u g a
l'erreur de prévision faite en l'origine (T − 1), l'expression 6.30 peut encore s'écrire
t1 B ŷT (1) = ŷT −1 (1) + αeT (6.32)
S t a L'interprétation de 6.30 nous indique que la valeur prédite

avec un poids α et le passé de la série représentée par ŷT −1 (1)
Par ailleurs, l'utilisation de 6.30 nécessite de dénir une valeur initiale
y1
ŷT (1) fait intervenir le présent
avec le poids complémentaire
(yT )
(1 − α).
ŷo (1) - souvent choisie égale à
ou à la moyenne des deux ou trois premières observations - et de sélectionner une valeur pour α 3.
On peut aisément se rendre compte que cette méthode de prévision est intéressante dans le cas
d'une série ne présentant ni tendance, ni cycle, ni mouvement saisonnier. Elle est supérieur à la
méthode par moyennes mobiles quand la série a une moyenne qui est constante sur des périodes
déterminées, mais variables entre ces périodes distinctes.
Exemple 49 Considérons la série d'observations {y : t = 1, . . . , 15} présentée dans la première

colonne du tableau suivant et relative à la valeur d'une action (en dollars), étudiée sur une période
t
de 15 mois.
3. Souvent choisie de manière à minimiser la somme des carrés des erreurs de prévisions ; voir l'expression 6.31

c Université
Table 6.9 Détermination des valeurs prédites
t yt ŷt−1 (1) et αet ŷt (1)

0 - - - - 82.00
1 82 82.00 0.00 0.00 82.00
2 84 82.00 2.00 1.80 83.80
3 85 83.80 1.20 1.08 84.88
4 85 84.88 0.12 0.11 84.99
5 83 84.99 -1.99 -1.79 83.20
6 81 83.20 -2.20 -1.98 81.22
7 80 81.22 -1.22 -1.10 80.12
8 42 80.12 -38.12 -34.31 45.81
9 35 45.81 -10.81 -9.73 36.08
10 36 36.08 -0.08 -0.07 36.01
11 29 36.01 -7.01 -6.31 29.70
o
12 33 29.70 3.30 2.97 32.67
e
13 34 32.67 1.33 1.20 33.87
14 32 33.87 -1.87 -1.68 32.19
aD
15 31 32.19 -1.19 -1.07 31.12
n d w
a
Evolution d'une action
g
90
u
80
70
B
60
y_t, y_(t-1)(1)
50
t1
yt
40
y_(t-1)(1)
30
a
20
t
10
0
S
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

c Université
La gure ci-dessus nous indique que très clairement une chute de cette action entre la 7ème et
la 9ème date d'observation. Nous allons réaliser un lissage exponentiel de paramètre α = 0.9, en
utilisant la relation 6.32.
A cette n, nous posons hatyo (1) = y1 = 82.
Le tableau 6.9 contient les valeurs de hatyt (1), pour t = 1, 2, . . . , 15.
Rappelons à cet eet que l'erreur de prévision et est dénie en tout instant t par
et = yt − ŷt−1 (1) (6.33)
On constate que la méthode de prévision par lissage exponentiel absorbe très rapidement la chute
des 7ème et 8ème périodes. Le temps de réaction serait un peu plus long si α avait été plus petit.
On peut aussi envisager la détermination de prévision par lissage exponentiel en présence d'une
tendance et d'un mouvement saisonnier. Nous ne considérons pas ces cas ici.
6.9.5 Prévision par Courbe de tendance
e o
Considérons le cas d'une série ne présentant ni cycle, ni mouvement saisonnier. S'il s'avère ac-
ceptable de dénir l'extra-saisonnier f (qui est alors la tendance) par un ajustement analytique, on
D
prendra pour valeur prédite
wa ŷT (h) = f (T + h) (6.34)
d
où f (T + h) est l'ordonnée de la courbe de tendance correspondant à l'instant (T + h). Ici aussi,
n
plus h est grand, plus on est à la merci de modications du comportement du phénomène étudié.
u g a
Exemple 50 La série {y , . . . , y } issue du tableau 6.7 (page 167) peut raisonnablement être ajustée
linéairement. Le recours à la procédure présentée dans le paragraphe sur l'Ajustement analytique
15
(droite de tendance) donne les résultats suivants :
t1 B y = 13.24 + 0.44t (6.35)
t a
Les prévisions pour t = 16, 17, 18, . . . sont alors donnée en remplaçant ces périodes dans l'équation
S
6.35 ci-dessus.
ŷ15 (1) = 13.24 + 0.44 × 16 = 20.3
ŷ15 (2) = 13.24 + 0.44 × 17 = 20.7

Statistique 1

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Statistique 1

Transféré par

Droits d'auteur :

Formats disponibles

Université de Goma

A l'usage des étudiants de première année de Graduat en Sciences Économiques

Année académique 2019-2020

Prof. Bugandwa M. 2 Version provisoire

1 Dénitions et Terminologie de base 9

3 ÉTUDE DES INDICATEURS DE TENDANCE CENTRALE, DE DISPERSION

3.1.1 Les moyennes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5 LES SÉRIES STATISTIQUES BIVARIÉES 125

Prof. Bugandwa M. 4 Version provisoire

5.4.4 Remarque sur la Covariance . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

6 ANALYSE DES SÉRIES CHRONOLOGIQUES OU TEMPORELLES 145

Prof. Bugandwa M. 5 Version provisoire

Prof. Bugandwa M. 6 Version provisoire

Dehon Droesbeke et Vermandaele Catherine Éléments de statis-

Mazerolle, Statistique Descriptive : série statistique à une et deux variables, séries

Tukey Exploratory Data analysis

Les graphiques en statistique

Droesbeke(1997), "Le vice et la vertu au pays du graphique", Cahiers du CERO,

Leboucher et Marie-José Voisin, Introduction à la Statistique Descriptive : Cours et

Prof. Bugandwa M. 8 Version provisoire

1.1 Brève historique

1.2 Dénition et champ de la statistique

1.2.2 Champ de la statistique

Dénition 3 La statistique descriptive : C'est un ensemble de méthodes permettant de décrire

Prof. Bugandwa M. 10 Version provisoire

Schéma synthétique des deux domaines ou champs de la Statistique

Le schéma suivant illustre les concepts de population, échantillon et unités élémentaires.

Prof. Bugandwa M. 11 Version provisoire

UNITES STATISTIQUES, POPULATIONS ET ECHANTILLONS:

1.3.2 Échantillon et sous-ensemble d'une population

Prof. Bugandwa M. 13 Version provisoire

I.4 TABLEAU RECAPITULATIF

Exemple de caractère quantitatif

Prof. Bugandwa M. 14 Version provisoire

Table 1.1  Exemple de présentation d'un caractère

Symbole Échantillon Eectif de l'échantillon : n = 10

Symbole Population Eectif total : n = 600

1.3.5 Caractères qualitatifs nominaux et ordinaux

1.3.7 Les échelles de mesures

Prof. Bugandwa M. 16 Version provisoire

Prof. Bugandwa M. 17 Version provisoire

Prof. Bugandwa M. 18 Version provisoire

ORGANISATION D'UNE SÉRIE

2.1 Distribution par valeurs ou par modalités

S Regroupement par modalité :

Classes De Nulle à Assez bon (a-b-c-d) De très bonne à excellente (e-f )

Prof. Bugandwa M. 21 Version provisoire

Table 2.1  Distribution par nombre de frontières entre pays

NA Nombre frontières terrestres entre pays Eectif

Table 2.2  Regroupement par classes d'amplitudes égale

2.2 Série observée et série ordonnée

Prof. Bugandwa M. 22 Version provisoire

Table 2.3  Regroupement par classes d'amplitudes égale

Table 2.4  Regroupement par classes d'amplitudes inégales

wa x(1) , x(2) , . . . , x(n) ; ∀i = 1, 2, . . . , n

2.3 Distribution observée

Prof. Bugandwa M. 23 Version provisoire

Table 2.6  Distribution du nombre de voiture possédées par les ménages

l'ensemble des couples :

Prof. Bugandwa M. 24 Version provisoire

A. DIAGRAMMES EN BARRES OU EN TUYAUX

B. DIAGRAMMES EN SECTEURS OU EN CAMEMBERT

Prof. Bugandwa M. 26 Version provisoire

S t a 8, 16, 9, 33, 14, 5, 3, 7, 10, 7

1 Dénitions et Terminologie de base 9

1.2 Dénition et champ de la statistique

Dénition 3 La statistique descriptive : C'est un ensemble de méthodes permettant de décrire

Table 1.1 Exemple de présentation d'un caractère

Symbole Échantillon Eectif de l'échantillon : n = 10

Symbole Population Eectif total : n = 600

Table 2.1 Distribution par nombre de frontières entre pays

NA Nombre frontières terrestres entre pays Eectif

Table 2.2 Regroupement par classes d'amplitudes égale

Table 2.3 Regroupement par classes d'amplitudes égale

Table 2.4 Regroupement par classes d'amplitudes inégales

Table 2.6 Distribution du nombre de voiture possédées par les ménages

Eectifs et fréquences cumulés à droite Nj et Fj concernent l'ensemble des valeurs ≤ à xj

Table 2.7 Série observée des tailles des étudiants

Table 2.8 Série observée des tailles des étudiants

Propriété 3 Si on agrège deux ensembles E et E d'observations; le premier d'eectif n et de

appelé Coecients de pondération.

Nous avons déjà vu que le choix dune nouvelle origine

En remplaçant uj par sa dénition 3.8 dans 3.9, on a :

De manière générale, soit x1 , x2 , . . . , xn une série de chires.

Exemple 21 Soit une série de chires {8, 5, 9, 13, 25}