Vous êtes sur la page 1sur 98

ECOLE PREPARATOIRE EN SCIENCES ECONOMIQUES COMMERCIALES ET

DES SCIENCES DE GESTION DE CONSTANTINE

Introduction la
Statistique Descriptive

DAKHMOUCHE Meghlaoui

Ecole Prparatoire en Sciences Economiques


Commerciales et des Sciences de Gestion
de Constantine

Introduction la Statistique Descriptive


Dr. Meghlaoui Dakhmouche

Anne Universitaire 2010/2011

Table des matires


1 Notions fondamentales de la statistique descriptive
1.1 Concepts de base de la statistique descriptive . . . .
1.1.1 Population - Individu . . . . . . . . . . . . . .
1.1.2 Caractre - Modalit
. . . . . . . . . . . .
1.1.3 Tableau statistique . . . . . . . . . . . . . . .
1.2 Les dirents types de caractres . . . . . . . . . . .
1.2.1 Caractre qualitatif . . . . . . . . . . . . . . .
1.2.2 Caractre quantitatif . . . . . . . . . . . . . .
1.2.3 Notion de classe . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

4
4
5
5
6
6
6
7
8

2 Les distributions statistiques une dimension


2.1 Prsentation gnrale des tableaux statistiques .
2.2 Les distributions caractre qualitatif . . . . .
2.2.1 Reprsentation par tuyaux dorgue . . .
2.2.2 Reprsentation par secteur . . . . . . . .
2.3 Les distributions caractre quantitatif . . . . .
2.3.1 Variable discrte . . . . . . . . . . . . .
2.3.2 Variable continue . . . . . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

9
9
11
11
12
13
13
18

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

3 Caractristiques de tendance centrale


3.1 Les direntes caractristiques de tendance centrale . .
3.1.1 Le mode . . . . . . . . . . . . . . . . . . . . . .
3.1.2 Calcul du mode pour une distribution en classes
ngales amplitudes . . . . . . . . . . . . . . . .
3.1.3 La mdiane . . . . . . . . . . . . . . . . . . . .
3.1.4 La mdiale . . . . . . . . . . . . . . . . . . . . .
3.2 La moyenne arithmtique . . . . . . . . . . . . . . . . .
3.2.1 Moyenne arithmtique simple . . . . . . . . . .
1

. . .
. . .
din. . .
. . .
. . .
. . .
. . .

26
. 27
. 27
.
.
.
.
.

28
30
33
34
35

3.2.2 Moyenne arithmtique pondre . . . . . . . .


3.3 Calcul pratique de la moyenne arithmtique . . . . .
3.3.1 Cas dune variable discrte . . . . . . . . . . .
3.3.2 Cas dune variable continue . . . . . . . . . .
3.3.3 Proprits de la moyenne arithmtique . . . .
3.4 Autres types de moyennes . . . . . . . . . . . . . . .
3.4.1 Moyenne gomtrique . . . . . . . . . . . . . .
3.4.2 Proprits de la moyenne gomtrique . . . .
3.4.3 Moyenne harmonique . . . . . . . . . . . . . .
3.4.4 Gnralisation de la notion de moyenne . . . .
3.4.5 Proprits compares des direntes moyennes

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

35
36
36
38
40
42
42
43
44
45
46

4 Les caractristiques de dispersion


4.1 Les direntes caractristiques de dispersion . . . . .
4.1.1 Ltendue . . . . . . . . . . . . . . . . . . . .
4.1.2 Les quartiles et lintervalle interquartile . . . .
4.1.3 Gnralisation de la notion de quartile . . . .
4.1.4 Lcart absolu moyen . . . . . . . . . . . . . .
4.1.5 La variance et lcart-type . . . . . . . . . . .
4.2 Calcul pratique de la variance et de lcart-type . . .
4.2.1 Cas dune variable discrte . . . . . . . . . . .
4.2.2 Cas dune variable continue . . . . . . . . . .
4.3 Autres caractristiques dune distribution statistique
4.3.1 Coe cient de variation . . . . . . . . . . . . .
4.3.2 Courbe de concentration . . . . . . . . . . . .
4.3.3 Indice de concentration ou indice de Gini . . .
4.3.4 Calcul pratique de lindice de Gini . . . . . .
4.4 Les caractristiques de forme . . . . . . . . . . . . . .
4.4.1 Coe cient dasymtrie (skewness) . . . . . . .
4.4.2 Coe cient daplatissement (Kurtosis) . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

48
48
48
49
51
52
52
53
53
56
60
60
61
62
63
65
65
67

5 Distributions statistiques deux dimensions


5.1 Prsentation gnrale dun tableau double entre . . . . . .
5.2 Distributions marginales . . . . . . . . . . . . . . . . . . . . .
5.3 Distributions conditionnelles . . . . . . . . . . . . . . . . . . .
5.3.1 Proprits des frquences marginales et conditionnelles
5.4 Reprsentations graphiques des distributions deux caractres
5.4.1 Cas des caractres qualitatifs . . . . . . . . . . . . . .

68
68
70
71
72
73
73

5.4.2 Cas des caractres quantitatifs . . . . . . .


5.5 Covariance entre deux variables statistiques . . .
5.5.1 Covariance . . . . . . . . . . . . . . . . . .
5.5.2 Coe cient de corrlation . . . . . . . . . .
5.5.3 Dirents genres de corrlation . . . . . .
5.6 Ajustement linaire ou droite des moindres carrs

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

73
75
75
76
77
78

6 Les sries chronologiques


6.1 Gnralits . . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Analyse empirique dune srie chronologique . . . . . . .
6.2.1 Dcomposition dune srie chronologique . . . . .
6.2.2 Les modles de composition des trois composantes
6.2.3 Choix du modle . . . . . . . . . . . . . . . . . .
6.3 Les indices statistiques . . . . . . . . . . . . . . . . . . .
6.3.1 Les indices lmentaires . . . . . . . . . . . . . .
6.3.2 Les indices synthtiques . . . . . . . . . . . . . .
6.3.3 Les dirents types dindices statistiques . . . . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

83
83
85
85
86
87
87
88
90
91

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

INTRODUCTION
Dun point de vue pdagogique, il nous apparat ncessaire de distinguer
trois tapes naturelles pour lenseignement des probabilits et des statistiques : la statistique descriptive, le calcul des probabilits lmentaires et
thoriques, et la statistique thorique ou infrencielle. La statistique descriptive vise rsumer quantitativement et graphiquement linformation recueillie sur un ensemble concret au moyen dune investigation exhaustive.
Son but nest pas dexpliquer mais de dcrire et de dgager lessentiel de linformation vhicule par les donnes. Elle synthtise numriquement et graphiquement cette information. Le calcul de probabilit, quant lui, a pour
objet ltude des phnomnes alatoires. Il est fond sur une axiomatique approprie et se dveloppe suivant une logique mathmatique trangre toute
proccupation concrte immdiate. Enn, la statistique thorique se rapporte
ltude de linduction statistique, cest dire lanalyse de linformation obtenue partir dun mcanisme alatoire. Tandis que la statistique descriptive
"constate" laide dune analyse exhaustive, en gnral coteuse et parfois
impossible entreprendre, la statistique mathmatique vise cerner les caractristiques de la population mre sur la base de ltude dchantillons
alatoires. Le dveloppement historique de la connaissance dans ce domaine
a plus ou moins respect ces trois tapes. Souvent, on introduit la notion
de probabilit comme une frquence relative avant mme la dnition de la
notion lmentaire de frquence. Les lments du langage des probabilits
tels que, ensemble fondamental, vnement, probabilit, sont des gnralisations naturelles des notions de population, caractre, frquence. De mme,
la variable alatoire est un prolongement naturel de la variable statistique.
Comme le cheminement de la pense va de lobservation des faits vers leur
idalisation abstraite, la statistique descriptive apparat, par les problmes
quelle pose et les limites de ses possibilits, comme une introduction heuristique pour aborder le calcul des probabilits.
La statistique descriptive est, comme son nom lindique, une mthode descriptive base sur les observations recueillies propos de ltude de certains
phnomnes dordre conomique, sociologique ou exprimental. Lanalyse des
donnes se fait essentiellement dans deux directions principales. La premire,
dessence gomtrique, consiste les classer et les disposer de la manire la
plus explicite possible, sous forme de tableaux, de graphiques ou de courbes.
4

La seconde a pour but de rsumer linformation contenue dans les donnes


laide de certaines caractristiques numriques. Ces deux axes ne sont pas
exclusifs et sont souvent utiliss simultanment.
Le premier chapitre est consacr aux dnitions des notions et des concepts
fondamentaux de la statistique descriptive. Dans le deuxime chapitre nous
proposons une mthode gnrale pour ltude des distributions statistiques
une dimension. Nous y verrons les direntes faons de prsenter des donnes
statistiques et de les visualiser graphiquement. Au troisime chapitre on sintresse trs sommairement ltude des distributions deux caractres. On
y dnit aussi les notions de distributions marginales et conditionnelles. Le
quatrime chapitre de ce cours est consacr ltude des caractristiques de
tendance centrale. Et on insistera plus spcialement sur le calcul pratique de
la moyenne arithmtique et on introduira dautres types de moyennes. Quant
aux caractristiques de dispersion, elles seront abordes dans lavant-dernire
partie de cet expos o on dnira les notions fondamentales de variance et
dcart-type. De mme, il y sera fait allusion aux caractristiques de forme.
Enn on termine cet expos par la dnition de la notion de srie chronologique et par la dnition des indices statistiques et leurs calculs pratiques.

Chapitre 1
Notions fondamentales de la
statistique descriptive
La statistique est une mthode danalyse des ensembles comportant un
grand nombre dlments. Cest une science qui permet de traiter et danalyser les rsultats des mesures eectues sur les individus dune population
relativement un certain nombre de caractres. Les rsultats des mesures
sont, en gnral, appels observations. Pour extraire linformation contenue
dans ces observations il est ncessaire dutiliser un certain nombre doprations logiques qui caractrisent les mthodes statistiques. Les lments soumis
lanalyse doivent appartenir un ensemble homogne et tre dlimits avec
prcision. Par la suite, ces lments sont ordonns et classs relativement
leurs mesures.
Pour tre e cace, les mthodes statistiques doivent formaliser simplement le problme pos en utilisant des concepts mathmatiques abstraits.
Par exemple, tous les lments classs dans le mme sous-groupe sont considrs comme quivalents.

1.1

Concepts de base de la statistique descriptive

Les observations constituent la source principale de linformation statistique. Le statisticien doit dnir avec prcision lensemble tudi et les
critres qui permettent sa description chire. De ses origines historiques,
la statistique a conserv en partie la terminologie de la dmographie. On y
6

parle, par exemple, de population pour dsigner un ensemble, et dindividus


pour nommer les lments de cet ensemble.

1.1.1

Population - Individu

Denition 1 On appelle population lensemble des units statistiques ou individus tudis par le statisticien.
Remarque 2 Chaque observation porte sur un individu. On emploiera les
termes de population et dindividu aussi bien lorsquil sagit dun ensemble
dtres humains (population algrienne la date du recensement, lves dun
tablissement scolaire, etc) ou dun ensemble dobjets inanims (production
de pices dune usine, stocks de marchandises, etc) ou mme dun ensemble
plus ou moins abstrait (ensemble des accidents de la route survenus au cours
dun mois de lanne, ensemble des jours ouvrables de lanne, etc). Les individus dune population peuvent donc tre, selon les cas, des tres humains,
des objets ou des vnements.

1.1.2

Caractre - Modalit

Pour dcrire une population on classe les individus qui la composent en


un certain nombre de sous-ensembles. Le classement peut se faire relativement un ou plusieurs caractres. Par exemple, pour dcrire la population
algrienne on pourra retenir les caractres sexe, ge, tat matrimonial, catgorie socioprofessionnelle, etc. Sil sagit du personnel dune entreprise, le
sexe et lge restent des caractres intressants et on pourra y rajouter la
profession, la qualication, etc.
Le choix dun caractre dtermine le critre qui servira classer les individus de la population en deux ou plusieurs sous-ensembles. Le nombre de
ces derniers correspond aux direntes situations possibles ou modalits du
caractre. An que le classement dun individu soit toujours possible sans
ambigut, les direntes modalits dun caractre doivent tre la fois exhaustives et incompatibles. Un individu ne doit appartenir qu un et un
seulement des sous-ensembles obtenus. Ainsi, le caractre sexe a deux modalits qui dterminent dans une population le sous-ensemble des individus
masculins et le sous-ensemble des individus fminins. Le nombre de modalits
selon lesquelles on considre un caractre est x plus ou moins conventionnellement.
7

1.1.3

Tableau statistique

Ltude dune population suivant un seul caractre est rsume dans un


tableau statistique une seule dimension ou simple entre, dont chaque
case correspond lune des modalits du caractre. Dans chacune de ces
dernires on y inscrit le nombre dindividus prsentant cette modalit. Mais
une population peut aussi tre tudie simultanment suivant deux ou plusieurs caractres. Le nombre de cases, donc de sous-ensembles incompatibles
et exhaustifs, est alors gal au produit du nombres de modalits des dirents caractres. Ainsi, le croisement du caractre sexe avec le caractre tat
matrimonial (en deux modalits) nous donne le tableau suivant :
Etat Matr/Sexe
Homme
Femme
Mari
H. maries
F. maries
Non Mari
H.n. maries F.n. maries
Il est possible de croiser trois caractres, quatre caractres ou plus. Ainsi,
on obtient des tableaux statistiques trois, quatre dimensions ou plus. Mais
en pratique, on ne peut croiser un trop grand nombre de caractres, car le
nombre de cases du tableau augmente trs vite et son utilisation devient
fastidieuse.

1.2

Les dirents types de caractres

Un caractre peut tre qualitatif ou quantitatif. Les mthodes danalyse


dune population dirent suivant la nature du caractre tudi.

1.2.1

Caractre qualitatif

Denition 3 Un caractre qualitatif est un caractre dont les modalits chappent


la mesure.
Remarque 4 On ne peut pas quantier numriquement les caractres qualitatifs, on ne peut que les constater. Par exemple, le sexe, la nationalit, la
profession, etc.
Example 5 Considrons la rpartition par nationalit des trangers vivants
en France (en Milliers) :
Nat. All Bene Esp Ita Pol Port Autres Eu Alg Mar Tun Autres Etr
Nb 25
60
120 80 100 210
140
650 310
60
420
8

1.2.2

Caractre quantitatif

Denition 6 Un caractre est quali de quantitatif lorsquil est mesurable


ou reprable.
Denition 7 A chaque unit statistique ou individu correspond un nombre
reprsentant la mesure ou la valeur du caractre. Cette mesure est alors appele variable statistique et est note en gnral x.
Remarque 8 Les modalits du caractre sont les valeurs possibles ou ensemble de variation de la variable statistique.
Une variable statistique peut tre discrte ou continue.
Variable statistique discrte
Denition 9 Une variable statistique est dite discrte lorsquelle ne peut
prendre que des valeurs isoles dans son intervalle de variation.
Remarque 10 Les valeurs prises par une variable discrte sont en gnral
des valeurs entires, par exemple le nombre denfants charge dans une
famille.
Example 11 Considrons la rpartition du nombre de ventes dun certain
type dappareil sur les jours ouvrables de lanne. Soit x la variable statistique
"le nombre de ventes par jour ouvrable" :
Nombre de ventes x
Nombre de jours ni

0 1 2 3 4 5 6
24 57 75 53 33 7 4

Variable statistique continue


Denition 12 Une variable statistique est dite continue lorsquelle peut prendre
toutes les valeurs lintrieur de son intervalle de variation.
Remarque 13 Le nombre des valeurs possibles dune variable statistique
continue est toujours inni. Ainsi, on prendra pour modalits du caractre
des classes de valeurs.
Example 14 La taille, le poids, lge dune personne. La dure de vie dune
lampe, la distance sparant deux points.
9

Remarque 15 Souvent, la distinction entre variable statistique continue et


variable statistique discrte est di cile. Par exemple, toute mesure est discrte du fait de sa prcision limite, alors que la nature intrinsque de la
variable statistique est continue (par exemple le diamtre dune pice usine).
Rciproquement, une variable de nature discrte pouvant prendre un trs
grand nombre de valeurs possibles, est considre comme une variable statistique continue et ainsi ses valeurs sont regroupes en classes.
Example 16 Le salaire dun ouvrier, les bnces annuels des entreprises,
la date de naissance dune personne, la note dun tudiant, le diamtre dune
pice usine.

1.2.3

Notion de classe

Pour tudier une variable statistique continue on divise son ensemble de


variation en intervalles ou classes de valeurs ayant une amplitude constante
ou variable.
Example 17 La variable "ge" est souvent dcoupe en classes quinquennales : 0 moins de 5 ans, de 5 ans moins de 10 ans, etc.
Remarque 18 Le choix du nombre de classes et de leur amplitude se fait
en fonction de leectif de la population et de la prcision des mesures. Les
eectifs des classes doivent tre signicatifs pour liminer les variations accidentelles qui apparaissent lorsquon considre de trop faibles eectifs. Par
ailleurs, le nombre de classes doit aussi tre su sant et leurs amplitudes
pas trop grandes pour ne pas masquer certaines particularits de la distribution statistique. Toute diminution inconsidre du nombre de classes ou toute
augmentation exagre des amplitudes de celles-ci, induit une perte dinformation.
En conclusion, on remarque que la statistique descriptive porte sur une
population sur laquelle aucun modle statistique nest dni a priori. On ne
dispose que dun ensemble de mesures sans structuration a priori.

10

Chapitre 2
Les distributions statistiques
une dimension
Aprs la dnition du caractre tudier sur la population, les observations obtenues sont ordonnes et forment ainsi une distribution statistique.
Les distributions les plus simples sont naturellement celles relatives un seul
caractre. Elles sont gnralement prsentes sous forme de tableaux statistiques simple entre. Linformation synthtise dans un tableau statistique
nest pas souvent facile obtenir par simple lecture. Alors la reprsentation
de cette distribution statistique sous forme de diagramme rend plus simple
laccs cette information. Selon que le caractre tudi soit qualitatif ou
quantitatif, et suivant quil soit de nature discrte ou continue, on est amen
utiliser des reprsentations graphiques de dirents types.

2.1

Prsentation gnrale des tableaux statistiques

Considrons une population P compose de n individus. Sur chacun de ces


individus on eectue une observation concernant un caractre C. Supposons
que le caractre C admet k modalits :
M1 ; M2 ; :::; Mk
Lopration prliminaire est la mise en ordre des observations. Cela consiste
classer chacun des n individus de la population dans les k sous-ensembles
11

dnis par les diverses modalits du caractre C. Pour chaque modalit Mi ,


i = 1; 2; :::; k , on inscrira dans le tableau statistique le nombre dlments
(i.e. le cardinal) du sous-ensemble de la population correspondant.
Denition 19 Le cardinal du sous-ensemble de la population correspondant
la modalit Mi est appel e ectif ou frquence absolue et est not ni .
Remarque 20 Tous les individus de la population prsentant la modalit
Mi sont considrs comme quivalents relativement au caractre C. On ne
retient alors que leur nombre.
Denition 21 La frquence relative fi de la modalit Mi est dnie par le
rapport :
ni
fi =
n
Remarque 22 La frquence fi est la proportion des individus de la population prsentant la modalit Mi . Alors, les frquences permettent de comparer
les structures des populations deectifs dirents relativement un caractre commun. Les modalits sont incompatibles, i.e. deux modalits distinctes
dun caractre donn ne peuvent pas tre prsentes chez un mme individu en
mme temps . Elles sont aussi exhaustives, i.e. chaque individu de la population est class dans un et un seul sous-groupe correspondant une modalit.
Donc chaque observation gure dans un et un seul sous-groupe de la population.

Consquence
La somme des eectifs ni est gale leectif total n de la population ,
i.e.
n = n1 + n2 + ::: + nk =

k
X

ni

i=1

Alors, il en rsulte que la somme des frquences relatives fi est gale 1 , i.e.
k
X
i=1

fi =

k
X
ni
i=1

1X
ni = 1
n i=1
k

12

Un tableau statistique dcrivant une population P relativement un caractre C, sera prsent sous la forme gnrale suivante :
Modalits du caract. C
M1
M2
:::
Mi
:::
Mk

2.2

Eectifs ni
n1
n2
:::
ni
:::
nk

Les distributions caractre qualitatif

La prsentation dun tableau statistique concernant un caractre qualitatif suit les rgles gnrales. Une premire synthse de linformation contenue
dans un tableau statistique est fournie par un graphique. Le principe de la
reprsentation graphique des caractres qualitatifs est la proportionnalit des
surfaces reprsentatives aux eectifs (ou aux frquences) reprsents. Il existe
deux types de reprsentations frquemment utilises.

2.2.1

Reprsentation par tuyaux dorgue

Cette reprsentation fait gurer les direntes modalits du caractre


sous forme de rectangle ou de cylindres dont la base est constante et dont la
hauteur est proportionnelle leectif (ou la frquence).
Remarque 23 Gnralement, les direntes modalits sont ordonnes sur
le graphique dans le sens des eectifs croissants ou dcroissants.
Example 24 Reprenons lexemple 5 et a chons la reprsentation par tuyaux
dorgue de la distribution des trangers en France.

13

Fig. 2.1 Rpartition par tuyaux dorgues des trangers en France

2.2.2

Reprsentation par secteur

Dans cette reprsentation les aires et par consquent les angles au centre
sont proportionnels aux eectifs (ou aux frquences) des direntes modalits. En eet,
ni
= 360 fi
i = 360
n
Example 25 Mieux que les tuyaux dorgue, ce mode de guration permet de
visualiser limportance relative de chaque modalit dans lensemble de la population. Pour des comparaisons dans lespace, la reprsentation par secteur
permet de mieux faire apparatre les dirences entre les classes dindividus
en valeurs absolues et en valeurs relatives.
Example 26 Reprenons lexemple 5 et a chons la reprsentation par secteur de la distribution des trangers en France.

14

Fig. 2.2 Reprsentation par secteur des trangers en France

2.3
2.3.1

Les distributions caractre quantitatif


Variable discrte

Tableau statistique
Les direntes modalits sont constitues par les valeurs possibles xi de la
variable statistique x. En face de chacune de ces valeurs on inscrit leectif ni
correspondant. Pour permettre les comparaisons entre populations deectifs
dirents, le tableau est complt par lindication de la frquence relative fi
correspondant chaque valeur xi .
Denition 27 La frquence cumule croissante, note Fi , est la somme des
frquences correspondantes aux valeurs de la variable statistique infrieures
ou gales xi , i.e.
Fi = f1 + f2 + ::: + fi =

i
X
h=1

15

fh

La distribution statistique dune variable quantitative discrte est en gnral prsente dans un tableau statistique tel que :
M odalites
x1
x2
:::
xi
:::
xk
T otal

Ef f ectif s F requences F requences cumulees


n1
f1
F1 = f1
n2
f2
F2 = f1 + f2
:::
:::
:::
ni
fi
Fi = f1 + f2 + ::: + fi
:::
:::
:::
nk
fk
Fk = 1
n
1
Tableau statistique : variable discrte

Remarque 28 La frquence cumule croissante Fi indique la frquence ou la


proportion des individus de la population pour lesquels la variable statistique
x est infrieure ou gale xi .
Denition 29 Leectif cumul croissant, not Ni , est dni, similairement
la frquence cumule croissante, par la formule suivante :
Ni = n1 + n2 + ::: + ni =

i
X

nh

h=1

Proposition 30 La frquence cumule croissante et leectif cumul croissant sont lis par la relation :
Fi =

Ni
n

Dmonstration : En eet,
i
X

Ni X n h X
=
=
Ni =
nh =)
fh = Fi
n
n
h=1
h=1
h=1
i

Denition 31 Il est parfois utile de dnir les eectifs cumuls dcroisants,


0
nots Ni , tels que :
0
Ni = nk + nk 1 + ::: + ni
16

Remarque 32 Leectifs cumul dcroissant est le rsultat de laddition, de


proche en proche, des eectifs dune distribution observe en commenant par
le dernier eectif, i.e.
0

Nk = n k ; N k

= nk + nk

; ::: ; Ni = nk + nk

+ ::: + ni

En dautres termes, Ni est le nombre dindividus prsentant une mesure du


caractre x infrieure ou gale xi , i.e.
0

Ni = nombre de valeurs de x

xi

Il est clair que lon peut dnir les frquences cumules dcroissantes,
notes Gi , telles que :
0

Gi =

Ni
nk + nk 1 + ::: + ni
=
= fk + fk
n
n

+ ::: + fi

Example 33 Considrons la distribution des jours douverture dun magasin suivant le nombre de ventes dun certain appareil A.
Nombre de ventes xi
0
1
2
3
4
5
6
7
Totaux

nombre de jours
fi
Ni
Fi
24
0; 096 24 0; 096
57
0; 228 81 0; 324
75
0; 300 156 0; 624
53
0; 212 209 0; 836
33
0; 132 242 0; 968
4
0; 016 246 0; 984
3
0; 012 249 0; 996
1
0; 004 250 1; 00
250
1

Reprsentation graphique Dans le cas des sries statistiques discrtes il


existe deux types de reprsentations graphiques.

17

La reprsentation en diagramme en btons


Denition 34 La reprsentation en diagramme en btons est la reprsentation de la distribution des frquences ou des eectifs dune variable discrte.
A chaque valeur xi porte en abscisse on fait correspondre un segment vertical de longueur proportionnelle leectif ni ou la frquence fi de cette
valeur.
Example 35 Reprenons lexemple prcdent et reprsentons la distribution
des jours de lanne en fonction du nombre de ventes.

Fig. 2.3 Reprsentation en diagramme en batns

Courbe cumulative
Denition 36 La courbe cumulative est la reprsentation graphique des effectifs cumuls ou des frquences cumules. Cest un graphique en escalier
dont les paliers horizontaux ont pour ordonnes respectivement Fi ou Ni . Les
marches de lescalier correspondent aux valeurs possibles xi de la variable
statistique x et sont des hauteurs proportionnelles aux eectifs cumuls ou
aux frquences cumules.

18

Fig. 2.4 Courbe cumulative

Example 37 Reprenons lexemple 31 et traons la courbe cumulative de la


distribution des jours de lanne en fonction du nombre de ventes.
Remarque 38 La courbe cumulative est la reprsentation graphique de la
proportion F (x) des individus de la population pour lesquels la valeur de la
variable statistique est infrieure ou gale x . Cette fonction, dnie pour
toute valeur de x , est appele fonction cumulative ou fonction de rpartition.
Elle est constante dans chaque intervalle sparant deux valeurs de la variable
statistique, i.e. F (x) = Fi , xi x < xi+1 , elle est nulle pour toutes les valeurs
de x infrieures la plus petite valeur des xi et est gale 1 pour toutes les
valeurs de x suprieures la plus grande valeur des xi . On peut aussi dnir
la fonction de rpartition de la variable statistique x, note aussi F (x), comme
la ligne brise qui joint les milieux des paliers de la courbe cumulative.
Example 39 On reprend lexemple prcdent et on trace la fonction de rpartition sur le graphe de la courbe cumulative.

19

Fig. 2.5 Fonction de rpartition

2.3.2

Variable continue

Tableau statistique
Dans le cas dun caractre quantitatif continu x, ltablissement du tableau de frquences implique deectuer au pralable une rpartition en
classes des donnes. Cela ncessite de dnir le nombre de classes attendu
et donc lamplitude associe chaque classe ou intervalle de classe. En rgle
gnrale, on choisit des classes de mme amplitude. Pour que la distribution
des frquences ait un sens, il faut que chaque classe comprenne un nombre
(ni ) su sant de valeurs. Diverses formules empiriques permettent dtablir
le nombre de classes pour un chantillon de taille n. Les plus frquemment
utilises sont :
La rgle de Sturge : N ombre de classes = 1 +p(3; 3 ln n)
La rgle de Yule : N ombre de classes = 2; 54 4 n
Lamplitude a des classes est obtenue de la manire suivante :
a=

xmax xmin
N ombre de classes
20

avec xmax et xmin respectivement la plus grande et la plus petite valeur de x


dans la srie statistique.
Les modalits du caractre sont reprsentes par les direntes classes. Si lon
dsigne respectivement par ei 1 et ei les extrmits infrieure et suprieure
de la classe n i , on dnit cette dernire comme suit :
ei

x < ei

Remarque 40 Les frquences et les frquences cumules sont dnies de


la mme faon que dans le cas discret, ainsi que les eectifs et les eectifs
cumuls.
En gnral, les rsultats des observations dune variable statistique continue x sont disposs dans un tableau statistique tel que :
Classe n i
1
2
3
:::
i
:::
k

Lim des classes


e0 x < e1
e1 x < e2
e2 x < e3
:::
ei 1 x < ei
:::
ek 1 x < ek

T otal

ni
n1
n2
n3
:::
ni
:::
nk
k
X

ni = n

i=1

fi
f1
f2
f3
:::
fi
:::
fk
k
X

Ni
N1
N2
N3
:::
Ni
:::
Nk = n

Fi
F1
F2
F3
:::
Fi
:::
Fk = 1

fi = 1

i=1

Tableau statistique : Cas continu


Reprsentation graphique
Comme pour les variables discrtes il existe pour les variables statistiques
contines deux types de reprsentations graphiques utiliss frquemment.

Histogramme
Denition 41 Lhistogramme est la reprsentation graphique de la distribution des eectifs ou des frquences dune variable statistique continue. A
chaque classe de valeurs de la variable statistique porte en abscisse, on fait
correspondre un rectangle bas sur cette classe. Alors chaque modalit est reprsente par un rectangle dont laire (et non la hauteur) est proportionnelle
la frquence ou leectif de cette classe.
21

Remarque 42 En gnral les classes de valeurs ont la mme amplitude.


Mais dans le cas contraire, on prendra pour unit damplitude u le P:G:C:D
des direntes amplitudes ai = ei ei 1 . Ensuite, on exprime lamplitude des
classes dans la nouvelle unit telle que :
Ai =

ei ei
ai
=
u
u

Par suite, la hauteur du rectangle reprsentatif de chaque classe sera gale


hi = Afii de telle sorte que la surface du rectangle soit gale la frquence de
la classe correspondante, i.e.
S = Ai

fi
Ai

= fi

Example 43 Considrons la rpartition des ouvriers dune entreprise suivant leur salaire mensuel net :
Classe de Salaire(DA) ni
12000 x < 14000
26
14000 x < 16000
33
16000 x < 20000
64
20000 x < 24000
7
24000 x < 30000
10
T otal
140

fi
Ni
Fi
0; 186 26 0; 186
0; 235 59 0; 421
0; 458 123 0; 879
0; 050 130 0; 929
0; 071 140 1; 000
1; 000

Traons lhistogramme des frquences de cette distribution.

22

Fig. 2.6 Histogramme des frquences

Denition 44 La courbe des frquences est la fonction en escalier dont les


paliers sont constitus par les bases suprieures des rectangles formant lhistogramme des frquences.
Denition 45 Le polygne des frquences est la ligne brise qui relie les
milieux des cots suprieurs des rectangles de lhistogramme des frquences.
Example 46 Reprenons lexemple de la rpartition des ouvriers dune entreprise suivant leur salaire mensuel net et traons la courbe des frquences
et le polygne des frquences de cette distribution.

23

Fig. 2.7 Courbe des frquences et polygne des frquences

Au moment de ltude des lois de probabilit on comprendra mieux la signication de cette courbe des frquences. Elle reprsente une approximation
(ou estimation) de la distribution de probabilit thorique de la population
relativement au caractre tudi.

Courbe cumulative
Denition 47 Comme pour les variables discrtes, la coube cumulative ou
histogramme des frquences cumules, est la reprsentation graphique de la
fonction cumulative ou fonction de rpartition F (x).
Les observations tant regroupes en classes, on ne connait de cette fonction que les valeurs correspondant aux extrmits suprieures des classes,
i.e.
F (ei ) = Fi
i = 1; 2; :::; k
Elle est estime par le polygne des frquences cumules qui est la ligne brise
joignant les milieux des cots suprieurs des rectangles de lhistogramme des
frquences cumules.
24

Remarque 48 Dans une certaine littrature on parle de frquence "cumule


descendante" Gi et de frquence "cumule ascendante" Fi . Cette dnomination implique une confusion. En eet, on a tendance admettre implicitement
que Gi est gale 1 Fi , ce qui nest le cas. Par contre, quand on parle de
fonction cumulative F (x) qui est dnie sur lensemble R en entier et telle
que lim F (x) = 1 et lim F (x) = 0, on peut dnir la fonction G(x) telle
x !+1
x ! 1
que :
G(x) = 1 F (x)
Ainsi, sachant que F (Me ) = 21 alors G(Me ) = 12 , i.e. lintersection des fonctions F (x) et G(x) a lieu au point dabscisse x = Me . Lutilit de la fonction
G(x) intervient dans la dtermination graphique de la mdiane condition
que les tracs de F (x) et G(x) soient trs prcis.
Example 49 Repenons lexemple 41 et traons lhistogramme des frquences
cumules et le polygne des frquences cumules.

Fig. 2.8 Histogramme et polygne des frquences cumules

Conclusion 50 La notion de courbe des frquences (resp. la courbe des frquences cumules) dcoule de lide suivante : si les amplitudes des classes
diminuent et si le nombre des observations est su samment grand pour viter les irrgularits dues la faiblesse des eectifs, alors lhistogramme des
25

frquences (resp. lhistogramme des frquences cumules) tend, en tant que


fonction en escalier, vers une courbe continue appele courbe des frquences
(resp. courbe des frquences cumules) et qui, la limite, converge vers la densit de la distribution thorique (resp. la fonction de rpartition thorique) de
la population.
Example 51 On a mesur la taille en centimtres dune population de 8585
hommes. Les rsultats sont rsums dans le tableau suivant :
x
ni
Ni

x < 145 [145; 148[ [148; 151[ [151; 154[ [154; 157[ [157; 160[ [160; 163[
2
4
14
41
83
169
394
2
6
20
61
144
313
707

[163; 166[ [166; 169[ [169; 172[ [172; 175[ [175; 178[ [178; 181[ [181; 184[
669
990
1223
1329
1230
1063
640
1376
2366
3589
4918
6148
7211
7851
[184; 187[ [187; 190[ [190; 193[ [193; 196[ [196; 199[ [199; 202[ 202 x
392
202
84
33
16
5
2
8243
8445
8529
8562
8578
8583
8585
En traant la courbe des frquences de cette distribution statistique, on
peut remarquer que lallure de cette courbe a une forme qui se raproche trs
nettement de celle dune courbe normale. De mme, si on trace la courbe
des frquences cumules de cette distribution, on remarque que son allure est
trs voisine de celle de la fonction de rpartition dune loi normale.
.

26

Fig. 2.9 Courbe des frquences

Fig. 2.10 Courbe des frquences cumules

27

Chapitre 3
Caractristiques de tendance
centrale
La reprsentation graphique des distributions statistiques a permis une
premire synthse de linformation contenue dans les tableaux statistiques.
On peut comparer les direntes sries statistiques par simple comparaison
de leurs reprsentations graphiques. Cette comparaison reste toutefois incommode et devient quasi-impossible si elle doit porter sur un grand nombre
de distributions statistiques. Il est inconcevable de classer 1500 candidats
un concours de grandes coles au vu de la reprsentation graphique des 1500
sries de 25 notes obtenues aux diverses preuves par chaque candidat. Il
est videmment plus commode de calculer une note moyenne pour chacun
des candidats et ensuite faire un classement. La tendance centrale caractrise
lordre de grandeur de la variable statistique. Quant la notion de dispersion,
elle mesure la uctuation des observations autour de cette tendance centrale.
Le statisticien Yule a prcis les proprits souhaitables que doit satisfaire
une caractristique de tendance centrale ou de dispersion : elle doit tre dnie de faon objective ; elle doit dpendre de toutes les observations ; elle doit
avoir une signication concrte ; elle ne doit pas tre sensible aux uctuations
dchantillonnage ; elle doit tre simple calculer et doit se prter aisment
au calcul algbrique.
Trois caractristiques de tendance centrale sont couremment utilises : le
mode, la mdiane et la moyenne arithmtique. Dans certains cas,usage dautres
caractristiques de tendance centrale telles que la moyenne gomtrique ou la
moyenne harmonique, simpose. Mais la caractristique de tendance centrale
la plus couramment utilise est la moyenne arithmtique.
28

3.1
3.1.1

Les direntes caractristiques de tendance


centrale
Le mode

Denition 52 Le mode dune distribution statistique, quon notera Mo , est


la valeur de la variable statistique pour laquelle la frquence est la plus grande.
Remarque 53 Le mode est donc la valeur de la variable statistique la plus
frquente.
Dtermination graphique
Lorsque la variable est discrte le mode est dni avec prcision. Si, par
exemple, deux valeurs successives de la variable statistique ont la mme frquence maximum, on dit quil y a un intervalle modal dont les extrmits
correspondent ces deux valeurs.

Dtermination du mode : variable discrte


Lorsque la variable est continue, la dtermination du mode est beaucoup
moins prcise car les frquences dpendent du dcoupage en classe. Lutilisation de la courbe des frquences ajuste sur lhistogramme, bien que peu
29

prcise, conduit une bonne estimation du mode dans le cas o les classes
sont dgale amplitude.

Dtermination du mode : variable continue


Il est possible dtablir une formule dinterpolation linaire pour le calcul
exacte du mode dans le cas dune rpartition en classes damplitude quelconque.

3.1.2

Calcul du mode pour une distribution en classes


dinngales amplitudes

Considrons une srie statistique continue regroupe en classes damplitudes ingales. Le mode est alors dtermin lintrieure de la classe modale
(correspondant la frquence ou leectif le plus grand). On peut identier
le mode comme la valeur mdiane de la classe modale ou bien eectuer une
interpolation linaire pour obtenir la valeur exacte du mode comme suit :
Mo = ei

ai (ni ni 1 )
(ni ni+1 ) (ni ni 1 )

o
ei 1 est la limite infrieure de la classe modale
30

(3.1)

ai est lamplitude de la classe modale


ni est leectif de la classe modale
ni 1 est leectif de la classe infrieure la plus proche de la classe modale
ni+1 est leectif de la classe suprieure la plus proche de la classe modale
En adoptant les notations suivantes :
m

= ni

ni

et

= ni

ni+1

la relation (3:1) peut tre prsente telle que :


Mo = ei

ai

Example 54 Soit x la variable statistique taille dune exploitation (en


ha) . Les rsultats dobservations sont rsums dans le tableau statistique
suivant :
x
ni
Ni
]0; 2[
2
2
[2; 6[
20 22
[6; 21[
80 102
[21; 41[ 50 152
[41; 81[ 98 250
[81;P
121[ 30 280
280
La valeur du mode est calcule telle que :
- Valeur approche :
La classe modale [41; 81[ est deectif ni = 98, do
Mo = 61 hectares
- Valeur exacte :
On utilise la formule dinterpolation linaire :
Mo = 41 +
avec ei

= 41, ai = 40,

1920
40 48
= 41 +
= 57; 55 hectares
48 + 68
116
m

= 98

50 = 48 et

= 98

30 = 68

Remarque 55 Une distribution de frquences peut prsenter un seul mode


(distribution unimodale) ou plusieurs modes (distribution bi ou trimodale).
31

Proprits
Les principaux avantages du mode font quil est facile dterminer et
quil a une signication immdiate. Par contre sa dtermination nest pas
assez prcise dans le cas continu. Elle dpend en partie du dcoupage en
classes. Ainsi, il est sensible aux uctuations dchantillonnage et se prte
trs mal au calcul algbrique.

3.1.3

La mdiane

Denition 56 La mdiane dune distribution statistique, note Me , est la


valeur de la variable statistique telle que le nombre des observations qui prsentent une valeur infrieure Me soit gal au nombre des observations qui
prsentent une valeur suprieure Me .
Remarque 57 La mdiane partage en deux eectifs gaux les observations
ranges par ordre croissant ou dcroissant. La mdiane est la valeur Me de
la variable statistique pour laquelle la frquence cumule est gale 21 , i.e.
F (Me ) =

1
2

Dtermination pratique
Cas dune variable discrte
Dans une srie statistique compose de 2k + 1 observations et dispose
par ordre croissant ou dcroissant, la valeur de la (k + 1)ieme observation
correspond la mdiane.
Example 58 Considrons une srie statistique compose de 9 mesures :
18; 17; 13; 9; 8; 24; 19; 23; 28. Alors, la srie dispose par ordre croissant donne :
8; 9; 13; 17; 18; 19; 23; 24; 28. Donc la mdiane est Me = 18.
Dans le cas dune srie statistique comportant 2k observations, il ny a
pas proprement parler de mdiane. Ainsi, on introduit la notion dintervalle
mdian dont les extrmits correspondent aux valeurs de la k ieme et de la
(k + 1)ieme observations.

32

Example 59 Supposons que la srie statistique soit : 8; 9; 13; 15; 17; 18; 19; 23; 24; 28.
On convient de retenir pour valeur mdiane la valeur Me telle que :
F (xi ) <

1
< F (xi+ )
2

i.e telle que :


f1 + f2 + ::: + fi

<

1
< f1 + f2 + ::: + fi
2

Graphiquement cette dtermination est simple partir de la courbe des


eectifs cumuls ou celle des frquences cumules.
Example 60 Considrons une distribution statistique reprsente par le tableau suivant :
xi
Ni
Fi

0
1
2
3
4
5
6
24
81
156
205
240
248
250
0; 096 0; 324 0; 624 0; 820 0; 960 0; 992 1; 00

Dtermination graphique de la mdiane : variable discrte


Cas dune variable continue
Dans le cas dune variable statistique continue la mdiane est dnie avec
exactitude. Mais, en raison du regroupement par classe on ne peut gnralement que la situer lintrieur dune classe quon qualiera de classe
mdiane.
33

Denition 61 La classe n i est une classe mdiane si :


1
Fi 1 < < Fi
2
Dtermination exacte de la mdiane La solution de lquation
F (M ) = 21 est trs simple graphiquement. On va montrer que la valeur de
Me est la mme que celle obtenue par le calcul algbrique.
Proposition 62 Lestimation de la valeur exacte de la mdiane peut tre
obtenue par interpolation linaire lintrieur de la classe mdiane laide
de la relation suivante :
n
Ni 1
Me = ei 1 + ai 2
ni
o
ai
Ni
ni
n

ei 1 est la borne infrieure de la classe mdiane


est lamplitude de la classe mdiane
1 est leectif cumul de la classe prcdant la classe mdiane
est leectif de la classe mdiane
est leectif total de la population tudie
Dmonstration : Considrons la gure suivante :

Dtermination graphique de la mdiane : variable continue


34

Alors, en utilisant quelques proprits de gomtrie euclidienne on remarque


que :
OM = OA0 + A0 M
Mais en vertu du thorme de Thals :
A0 M
AC
A00 C 00
=
=
A0 B 0
AB
A00 B 00
do
A 0 M = A0 B 0

A00 C 00
A00 B 00

et par suite
A00 C 00
A00 B 00
En remplaant ces quantits par leurs mesures algbriques, on obtient :
OM = OA0 + A0 B 0

OM = ei

+ ai

n
2

nF (ei 1 )
nF (ei ) nF (ei 1 )

Do
Me = ei

+ ai

n
2

Ni
ni

Proprits La mdiane rpond assez bien la plupart des conditions


de Yule. Elle sinterprte aisment et se calcule facilement. Elle dpend de
lensemble des observations. La valeur de la mdiane nest pas inuence par
les observations aberrantes. Mais elle est sensible aux uctuations dchantillonnage et elle se prte mal au calcul algbrique en tant que solution de
F (M ) = 12 .

3.1.4

La mdiale

Denition 63 La mdiale est la valeur de la variable statistique qui divise


en deux la somme des valeurs de la variable.

35

Example 64 Considrons la rpartition des employs dune entreprise selon


leur salaire mensuel net.
Salaires (euros)
[800; 900[
[900; 1000[
[1000; 1100[
[1100; 1500[
[1500;
P2000[

ni
25
30
28
25
10
118

Fi
Somme des salaires
0,212
21250
0,466
28500
0,703
29400
0,915
32500
1
17500
129150

F Qi : P art cumu:des salaires


0,164
0,385
0,613
0,865
1

Alors, la mdiale est dterminer par interpolation dans la classe [1000; 1100[,
i.e.
0; 5 0; 385
M ediale = 1000 + (1100 1000)
= 1050; 4 euros
0; 613 0; 385
Par comparaison, la mdiane est dtermine par interpolation telle que :
M ediale = 1000 + (1100

1000)

0; 5 0; 466
= 1014; 3 euros
0; 703 0; 466

Remarque 65 La mdiale ne peut tre infrieure la mdiane. La mdiale


est dautant suprieure la mdiane que la distribution est plus concentre.
Dans lexemple, lcart mdiale mdiane = 1050; 4 1014; 3 = 36; 1 euros.
Do, le ratio
1050; 4 1014; 3
mediale mediane
=
= 0; 03
etendue
2000 800

3.2

La moyenne arithmtique

Denition 66 La moyenne arithmtique dune variable statistique x, note


x, est gale la somme des valeurs prises par cette variable divise par le
nombre des observations.
Example 67 Les 8 ouvriers dune petite entreprise ont peru en janvier 1990
les salaires suivants : 7500; 8300; 9100; 9600; 10700; 11300; 12000; 12500 D:A.
Le salaire moyen des ouvriers de cette entreprise en janvier 1990 est alors :
7500 + 8300 + 9100 + 9600 + 10700 + 11300 + 12000 + 12500
= 10125 D:A
8
36

3.2.1

Moyenne arithmtique simple

Denition 68 Considrons une srie statistique comportant n observations


x1 ; x2 ; :::; xi ; :::; xn . Alors la moyenne arithmtique simple est calcule laide
de lexpression suivante :
x1 + x2 + ::: + xi + ::: + xn
1X
x=
=
xi
n
n i=1
n

Remarque 69 A chaque valeur prise par la variable statistique correspond


un seul individu. Cette moyenne arithmtique est dite simple par opposition
la moyenne arithmtique pondre.

3.2.2

Moyenne arithmtique pondre

Example 70 Reprenons lexemple prcdent et supposons que les 8 ouvriers


de lentreprise aient peru les salaires suivants : 8300; 8300; 9600; 9600; 9600; 10800; 10800;
12500 D:A. Le calcul du salaire moyen peut tre eectu comme prcdemment. Cependant, on aurait pu prsenter les observations dans un tableau
statistique tel que :
Salaire x Eectif ni
8300
2
9600
3
10800
2
12500
1
T otal
8
Il serait bien entendu erron de dire que le salaire moyen des ouvriers est :
8300 + 9600 + 10800 + 12500
= 10300 D:A
4
Les salaires doivent tre pondrs par les eectifs correspondants, et donc :
x=

8300 + 3

9600 + 2
8

10800 + 12500

= 9937; 50 D:A

La moyenne ainsi calcule est appele moyenne arithmtique pondre. Les


coe cients de pondration sont les frquences absolues des direntes valeurs
de la variable statistique. Ce type de calcul de la moyenne est naturellement
utilis dans le cas dobservations regroupes en classe.
37

Denition 71 Soit x une variable statistique pouvant prendre les k valeurs


x1 ; x2 ; :::; xi ; :::; xk auquelles correspondent respectivement les k frquences absolues ou eectifs n1 ; n2 ; :::; ni ; :::; nk . Alors la moyenne arithmtique pondre de cette variable a pour expression :
1X
x=
ni xi
n i=1
k

Remarque 72 x peut aussi scrire :


x=

k
X
ni
i=1

xi x =

k
X

fi xi

i=1

o fi reprsente la frquence relative des direntes valeurs de la variable


statistique. Les fi , i = 1; 2; :::; k sont appels coe cients de pondration.

3.3
3.3.1

Calcul pratique de la moyenne arithmtique


Cas dune variable discrte

Example 73 Reprenons lexemple du nombre de ventes dun certain type


dappareil par jour ouvrable. Le nombre moyen de ventes nest autre que la
moyenne arithmtique des ventes. Pour calculer cette moyenne, il est toujours
possible dutiliser directement la formule de la dnition. Mais souvent on
utilise le tableau statistique o lon dispose les direntes tapes des calculs
tel que :
xi
ni
ni xi
0
24
0
1
57
57
2
75
150
3
53
159
4
33
132
5
7
35
6
4
24
Pk
Pk
T otaux
i=1 ni = 253
i=1 ni xi = 557
38

Alors,
1 X
557
x=
ni xi =
253 i=1
253
k

2; 20

Le nombre moyen de ventes par jour ouvrable est donc 2; 20.


Souvent les calculs qui rsultent de lapplication de la formule de dnition
sur les valeurs brutes, peuvent savrer assez fastidieux. Il est alors possible
dallger ces calculs en procdant une transformation des donnes brutes,
par exemple en choisissant une nouvelle origine x0 pour la variable statistique
x. On dnit ainsi une nouvelle variable x0i appele variable auxiliaire telle
que :
x0i = xi x0
(3.2)
Thorme 74 En adoptant le changement dorigine x0i = xi
la mme relation entre x0 et x, i.e :
x0 = x

x0 , on obtient

x0

Dmonstration : En eet, chaque valeur xi correspond une nouvelle


valeur x0i . Et daprs (3:2) on a :
ni x0i = ni xi

ni x0

i = 1; 2; :::; k

(3.3)

Et en sommant les k quations (3:3), on obtient :


k
X
i=1

ni x0i

k
X

ni xi

i=1

k
X

ni x0

i=1

P
Comme ki=1 ni = n, alors en divisant par n les deux membres de lgalit
ci-dessus, il vient :
k
k
1X
1X
0
ni xi =
ni xi x0
n i=1
n i=1
Do

x0 = x

x0

Remarque 75 Ainsi on pourra calculer x0 et en dduire x.


39

Example 76 Reprenons lexemple 84 ci-dessus et prenons pour nouvelle origine x0 = 2. La variable auxiliaire est alors dnie par :
x"i = xi

On obtient ainsi le tableau statistique suivant :


xi
0
1
2
3
4
5
6
T otaux
Alors, x0 =
Do

3.3.2

1
n

Pk

i=1

ni
24
57
75
53
33
7
4
Pk
i=1 ni = 253

ni x0i =

51
253

0; 20.

x0i
2
1
0
1
2
3
4

ni x0i
48
57
0
53
66
21
16
Pk
0
i=1 ni xi = 51

x = x0 + 2 = 2; 20

Cas dune variable continue

La distribution dune variable statistique continue est prsente, en gnral, sous forme de classes. La formule de dnition de la moyenne ne peut
tre applique directement car on ne connait pas les valeurs exactes prises
par la variable statistique, mais seulement le nombre dobservations lintrieur de chaque classe. On supposera alors que les observations sont rparties
uniformment dans chaque classe. Cest dire nimporte quelle valeur lintrieur de la classe peut reprsenter cette dernire. Par convention et sans
trop de perte dinformation, on prendra le centre de la classe comme reprsentant. Cette convention implique un biais systmatique dans le calcul de
la moyenne. Le centre de la classe n i sera not en gnral Xi , et il est donn
par la relation suivante :
ei + ei 1
Xi =
2
o ei et ei 1 dsignent respectivement la borne suprieure et la borne infrieure de la classe n i.
40

Ainsi on est ramen au calcul de la moyenne arithmtique dans le cas dune


variable discrte que lon peut eectuer directement partir de la dnition
ou en utilisant une variable auxiliaire.
Example 77 Reprenons la distribution des ouvriers dune entreprise suivant
leur salaire mensuel.
On prendra pour origine le centre de la classe modale, i.e. XMo = 18000. On
remarque aussi que les nombres i = Xi 18000, i = 1; 2; :::; k sont divisibles
par 1000. Donc on prendra pour variable auxiliaire telle que :
x0i =

Xi

18000
1000

Les calculs seront toujours disposs dans un tableau du genre ci-dessous :


Classe de Salaire ni
12000 x < 14000 26
14000 x < 16000 33
16000 x < 20000 64
20000 x < 24000 7
24000 x < 30000 10
T otal
140
Do

1 X
=
ni Xi0 =
148 i=1
5

X0
Et par consquent

Xi
13000
15000
18000
22000
27000

Xi0
2
1
0
1
2

58
140

X = 1000X 0 + 18000

ni Xi0
52
33
0
7
20
Pk
0
i=1 ni xi =

58

0; 414

17586 D:A

Dune faon gnrale, le choix dune nouvelle origine XMo et dune nouvelle chelle de mesure u va permettre de rduire le volume des calculs.
On dnit une variable auxiliaire Xi0 par la transformation linaire :
Xi0 =

Xi

XMo
u

(3.4)

o XMo est, en gnral, le centre de la classe modale et u est le P GCD des


amplitudes de classes.
En suivant le mme raisonnement que pour le cas discret, on remarque que
41

si lon adopte le changement de variable (3:4) il existe la mme relation entre


X et X 0 , i.e.
X = uX 0 + XMo

3.3.3

Proprits de la moyenne arithmtique

La moyenne arithmtique rpond assez bien lensemble des conditions


de Yule. Elle se prte facilement au calcul algbrique et a une signication concrte. Mais elle est sensible aux uctuations dchantillonnage.
La somme algbrique des carts des observations la moyenne est nulle,
i.e.
k
X
ni (xi x) = 0
i=1

En eet

k
X

ni (xi

x) =

i=1

k
X

ni xi

i=1

k
X

ni = nx

nx = 0

i=1

La somme des carrs des carts des observations la moyenne est infrieure la somme des carrs des carts par rapport toute autre valeur.
En eet, soit :
k
X
S(b) =
ni (xi b)2
i=1

o S(b) est un polynme du second degr en b.


Le polynme S(b) est minimum au point o sa drive par rapport b
est nulle, i.e.
dS(b)
= S 0 (b) =
db

Do

k
X

ni xi

i=1

Et par consquent

k
X

ni (xi

i=1

k
X

ni = nb

i=1

1X
ni xi = x
b=
n i=1
k

42

b) = 0

La moyenne x dune population compose de deux sous-populations P1


de moyenne x1 et P2 de moyenne x2 , sexprime simplement en fonction
de x1 et x2 .
Supposons que la population P possde un eectif de n individus, et
que les sous-populations P1 et P2 ont des eectifs respectifs n1 et n2 tels
que n1 +n2 = n. Soit n1i le nombre dindividus de la sous-population P1
prsentant la modalit xi du caractre et soit n2i le nombre dindividus
prsentant la mme modalit dans la sous-population P2 . Donc, dans
la population P leectif des individus prsentant la modalit xi est
ni = n1i + n2i .
Dautre part
x1 =

k
1 X
n1i xi
n1 i=1

et x2 =

k
1 X
n2i xi
n2 i=1

Alors, la moyenne x de la population est :


X
1X
1
x =
ni xi =
(n1i + n2i ) xi
n i=1
n1 + n2 i=1
( k
)
k
X
X
1
n1i xi +
n2i xi
=
n1 + n2 i=1
i=1
k

k
k
n1
1 X
n2
1 X
=
n1i xi +
n2i xi
n1 + n2 n1 i=1
n1 + n2 n2 i=1

Do

1
(n1 x1 + n2 x2 )
n
Donc la moyenne de la population totale apparait comme la moyenne
pondre des moyennes des sous populations.
Plus gnralement, pour h populations on a :
x=

1X
x=
ni xi
n i=1
h

43

Positions respectives du mode, de la mdiane et de la moyenne


arithmtique
Pour les distributions symtriques on a :
x = Me = Mo
Pour les distributions asymtriques on a deux situations selon que la distribution est plus plate gauche qu droite et vice versa :
x < Me < Mo

3.4

ou bien Mo < Me < x

Autres types de moyennes

En plus de la moyenne arithmtique, il existe dautres types de moyennes.


On les rencontre beaucoup moins frquemment, mais leur utilisation est cependant recommande dans certains cas.

3.4.1

Moyenne gomtrique

Denition 78 La moyenne gomtrique simple dune srie de valeurs x1 ; x2 ; :::; xn ,


note G, est dnie par :
! n1
n
Y
(3.5)
G=
xi
i=1

Remarque 79 En prenant le logarithme de la relation (3:5), on obtient une


autre formule pour la moyenne gomtrique simple :
1X
ln xi
n i=1
n

ln G =

(3.6)

Example 80 Considrons une srie de neuf nombres : 18; 17; 13; 9; 8; 24; 19; 23; 28.
Leur moyenne gomtrique est alors :
G = (18

17

13

24

19

23

28) 9 = 16; 36

On peut aussi calculer la moyenne gomtrique en utilisant la formule (3:6).


En eet
ln G =

1
ln (18
9

17

13

8
44

24

19

23

28) = 2; 795

Alors
eln G = e2;795 = 16; 36
Denition 81 Soit x une variable statistique pouvant prendre les k valeurs
x1 ; x2 ; :::; xn . On dispose dune srie statistique de taille n comportant n1
fois x1 , n2 fois x2 ,..., nk fois xk . Alors la moyenne gomtrique pondre est
donne par lexpression :
! n1
k
Y
(3.7)
G=
xni i
i=1

Remarque 82 En prenant le logarithme dans la formule (3:7) on obtient


une autre expression pour la moyenne gomtrique pondre :
1X
ln G =
ni ln xi
n i=1
k

(3.8)

Par ailleurs, la formule (3:7) peut aussi scrire :


!
!
k
k
ni
Y
Y
G=
xin =
xfi i
i=1

o fi =

3.4.2

ni
n

i=1

est la frquence de la modalit xi .

Proprits de la moyenne gomtrique

Considrons deux sries statistiques de mme taille n, de deux variables


statistiques x et y :
x1 ; x2 ; :::; xn

et y1 ; y2 ; :::; yn

Formons les produits zi = xi yi , i = 1; 2; :::; n et calculons moyenne


gomtrique G(z) de ces produits :
G(z) =

n
Y
i=1

zi

! n1

n
Y
i=1

xi yi

! n1

n
Y
i=1

xi

! n1

n
Y
i=1

yi

! n1

= G(x)G(y)

Donc la moyenne gomtrique du produit xy est gale au produit de


moyennes gomtriques de x et de y.
45

Formons les rapports qi =


G(q) telle que :

G (q) =

n
Y

qi

i=1

! n1

xi
yi

et calculons leur moyenne gomtrique

n
Y

xi
yi

i=1

! n1

n
Y

xi

! n1

G (x)
1 =
!
G (y)
n
n
Y
yi
i=1

i=1

Donc la moyenne gomtrique du rapport


gomtriques de x et de y.

3.4.3

x
y

est le rapport des moyennes

Moyenne harmonique

Denition 83 La moyenne harmonique dune srie de valeurs x1 ; x2 ; :::; xn ,


note H, est dnie par lexpression :
H=

1
x1

n
n
Pn
1 =
+ + ::: xn
i=1
1
x2

1
xi

Example 84 Reprenons lexemple 88 et calculons la moyenne harmonique :


H=

9
1
18

1
17

1
13

1
9

1
8

+ + +

1
24

1
19

1
23

1
28

= 14; 97

Example 85 Un spculateur a consacr pendant 4 annes la mme somme


S lachat de lingots dor aux prix respectifs 5400 ; 5500 ; 5800 et 6400 U le
kg. Le prix moyen dachat du kilogramme dor par le spculateur nest pas la
moyenne arithmtique. En eet, la dpense totale eectue par le spculateur
S
kg dor, la deuxime anne
est 4S. La premire anne il a achet q1 = 5400
S
q2 = 5500 kg dor, etc. Au total il a achet la quantit dor suivante :
q1 + q2 + q3 + q4 = S

1
1
1
1
+
+
+
5400 5500 5800 6400

Le prix dachat moyen du kg dor est donc :


P =

4S
=
q1 + q2 + q3 + q4

1
5400

46

1
5500

4
+

1
5800

1
6400

= 5750; 6

Denition 86 Considrons une variable statistique pouvant prendre les valeurs x1 ; x2 ; :::; xk . Et supposons que lon a obtenu n ralisations
de cette
P
variable avec les eectifs respectifs n1 ; n2 ; :::; nk tels que ki=1 ni = n. Alors
la moyenne harmonique pondre est donne par lexpression suivante :
n
n
H = n1 n2
nk = Pk
ni
+ x2 + ::: xn
x1
i=1 x
i

Example 87 Une entreprise de transport possde 10 camions qui font la


rotation entre un endroit A et un endroit B. Au cours dune de ces rotations le
trajet AB (distance D) a t couvert par ces vhicules aux vitesses moyennes
suivantes :
Vitesse Moy (Km/h) 40 60 70
Nombre de camions
3 5 2
Au total les camions ont parcouru une distance 10D. Pour couvrir le trajet
D
D
, 5 camions un temps T2 = 60
et
AB, 3 camions ont mis un temps T1 = 40
D
les deux autres un temps T3 = 70
. Au total le temps T mis par lensemble des
camions pour parcourir la distance 10D a t :
T = 3T1 + 5T2 + 2T3 = D

5
2
3
+
+
40 60 70

Donc, pour lensemble des camions la vitesse moyenne V a t :


10D
10
V =
= 3
5
2 = 53; 5 Km=h
3T1 + 5T2 + 2T3
+ 60
+ 70
40

3.4.4

Gnralisation de la notion de moyenne

Toutes les moyennes tudies ont t dnies suivant un principe commun.


En eet, pour le calcul de chaque type de moyenne les observations ont
t introduites sous une forme particulire. Par exemple, pour la moyenne
harmonique ce fut linverse des observations, pour la moyenne gomtrique
ce fut leur logarithme. Dune manire gnrale, la dnition dune moyenne
fait intervenir une fonction f des observations.
Denition 88 Soit ' (x) une fonction monotone de la variable statistique
x. On appelle ' moyenne le nombre C dni tel que :
1X
ni ' (xi )
' (C) =
n i=1
k

47

(3.9)

Remarque 89 A partir de cette dnition gnrale on retrouve facilement


les formules des direntes moyennes :
1. Si on considre la fonction ' (x) = x1 . Daprs la relation (3:9), ' (H) =
Pk
1
i=1 ni ' (xi ) o H est la moyenne harmonique. Alors
n
1
1 X ni
=
H
n i=1 xi
k

n
=) H = Pk

ni
i=1 xi

2. Si on prend ' (x) = ln x, alors on retrouve la moyenne gomtrique :


! n1
k
k
X
Y
1
ln G =
ni ln xi =) G =
xni i
n i=1
i=1
3. La fonction Identit f (x) = x redonne, bien entendu, la moyenne arithmtique x :
k
1X
x=
ni xi
n i=1

4. A partir de cette formule gnrale on peut construire de nouvelles moyennes.


Par exemple, si on considre la fonction ' (x) = x2 , on dnit ainsi la
moyenne quadratique M Q :
v
u k
k
u1 X
1X
2
2
(M Q) =
ni xi
=)
MQ = t
ni x2i
n i=1
n i=1

3.4.5

Proprits compares des direntes moyennes

De toutes les moyennes cest certainement la moyenne arithmtique qui


rpond le mieux aux conditions de Yule. En particulier, elle est dun calcul
ais et rapide, et sa signication est facile concevoir. Les moyennes arithmtique et quadratique sont inuences par les lments le plus frquents
de la srie. Au contraire, les moyennes hamonique et gomtrique tendent
rduire linuence des valeurs les plus frquentes en faveur des valeurs les
plus rares. Les moyennes harmonique H, gomtrique G, arithmtique x et
quadratique M Q dune mme srie statistique sont, en gnral, classes dans
lordre suivant :
H G x MQ

48

Example 90 Pour la srie des nombres 18; 17; 13; 9; 8; 24; 19; 23 et 28, les
dirents types de moyennes sont telles que :
H = 14; 97

G = 16; 36

x = 17; 66

49

M Q = 18; 78

Chapitre 4
Les caractristiques de
dispersion
Les caractristiques de dispersion les plus frquemment utilises sont
ltendue, lintervalle interquartile, lcart absolu moyen, la variance et lcarttype. Ces deux dernires caractristiques sont les plus couramment utilises.
Le calcul de lindice de concentration peut tre recommand dans certains
cas. Ltendue et lintervalle interquartile sont, dans leur principe, du type
de la mdiane. Les observations y interviennent par leurs rangs et non par
leurs valeurs. Lcart absolu moyen et lcart-type, au contraire, font intervenir lcart la moyenne arithmtique de chacune des observations. Ceux
sont des moyennes dcart la moyenne. Lindice de concentration repose,
quant lui, sur un principe tout fait dirent.

4.1
4.1.1

Les direntes caractristiques de dispersion


Ltendue

Denition 91 Ltendue dune distribution statistique, note w, est la diffrence entre la plus grande et la plus petite des valeurs observes, i.e.
w = x(n)
o x(n) = max (xi ) et x(1) = min (xi ).
i

50

x(1)

Proprits
La signication de ltendue est vidente et son calcul est immdiat.
Mais cette caractristique prsente des inconvnients. Elle ne dpend que
des termes extrmes de la srie et elle est donc trs sensibles aux uctuations dchantillonnage. La forme de la distribution entre les extrmes nest
pas prise en compte. Donc, ltendue est une caractristique de dispersion
imparfaite.

4.1.2

Les quartiles et lintervalle interquartile

Pour remdier aux inconvnients de ltendue, on a pens minimiser


linuence des termes extrmes de la srie sur le calcul de la caractristique de
dispersion. Pour cela, on dnit les quartiles Q1 , Q2 et Q3 . Ces derniers sont
les valeurs de la variable statistique telles que, les observations tant ranges
par ordre croissant, un quart de celles-ci est infrieur Q1 , un quart est
compris entre Q1 et Q2 , un quart compris entre Q2 et Q3 , et le dernier quart
est suprieur Q3 . En dautres termes Q1 , Q2 et Q3 sont les valeurs de la
variable statistique pour lesquelles la fonction cumulative est respectivement
est telle que :
F (Q1 ) = 0; 25 ; F (Q2 ) = 0; 50 et F (Q3 ) = 0; 75
Remarque 92 Le deuxime quartile Q2 est donc gal la mdiane.
Denition 93 On appelle intervalle interquartile, not IQ, la dirence
entre les valeurs du troisime et du premier quartile, i.e.
IQ = Q3

Q1

Remarque 94 Lintervalle interquartile est donc lintervalle qui contient


50% des observations tout en laissant 25% sa droite et 25% sa gauche.
Dtermination pratique des quartiles
Le quartile se dtermine de la mme manire que la mdiane. Soit il
est dtermin graphiquement partir de la courbe des eectifs cumuls ou
celle des frquences cumules, Soit il est calcul par interpolation linaire. La

51

formule de dtermination des quartiles est la mme que celle utilise pour la
dtermination de la mdiane Me = Q2 . En eet,
Qh = eh

1 + ah

hn
4

Nh
nh

o eh 1 est la borne infrieure de la classe contenant le quartile n h, h =


1; 2; 3; 4
ah est lamplitude de la classe contenant le quartile n h, h = 1; 2; 3; 4
Nh 1 est leectif cumul de la classe prcdant celle contenant le quartile
n h, h = 1; 2; 3; 4
nh est leectif de la classe contenant le quartile n h, h = 1; 2; 3; 4
n est leectif total de la population tudie

Proprits
Les avantages de lintervalle interquartile sont la rapidit de son calcul et
sa signication immdiate. Sa dtermination nest pas prcise et il se prte
mal au calcul algbrique.
Diagramme en bote (ou bote moustaches) Il sagit dun diagramme permettant de positionner les quartiles Q1 , Q2 , Q3 , au moyen de
rectangles de largeur arbitraire, prolongs par des "moustaches" de part et
dautre, de longueur au plus gale une fois et demie Q3 Q1 .

Si la plus petite ou la plus grande valeur observe se trouvent lintrieur, on


raccourcit les moustaches correspondantes ; si elles se trouvent lextrieur,
on positionne part les valeurs "aberrantes" qui dpassent des moustaches :

Ces diagrammes sont surtout utiles pour comparer rapidement lallure gnrale de plusieurs distributions.

52

4.1.3

Gnralisation de la notion de quartile

Les dciles
Pour obtenir les quartiles on a divis en quatre parties gales leectif de la
srie statistique pralablement ordonne par ordre croissant. Les dciles, au
nombre de 9, sparent leectif de la population tudie en 10 parties gales.
1
des observations lui est infrieur et dune
Le premier dcile D1 est tel que 10
1
faon gnrale 10 des observations est compris entre deux dciles successifs
et on a :
F (D1 ) = 0; 1 ; F (D2 ) = 0; 2 ; F (D3 ) = 0; 3 ; :::; F (D9 ) = 0; 9
Remarque 95 Les dciles sont dtermins de la mme manire que les quartiles. La formule de dtermination des dciles est la mme que celle utilise
pour la dtermination de la mdiane Me = Q2 . En eet,
Qh = eh

+ ah

hn
10

Nh
nh

o eh 1 est la borne infrieure de la classe contenant le dcile n h, h = 1; 2; :::


ah est lamplitude de la classe contenant le quartile n h, h = 1; 2; :::
Nh 1 est leectif cumul de la classe prcdant celle contenant le dcile n h,
h = 1; 2; :::
nh est leectif de la classe contenant le quartile n h, h = 1; 2; :::
n est leectif total de la population tudie

Les percentiles
Pour des sries comportant su samment dobservations on peut dnir les
percentiles tels que 1% des observations est compris entre deux percentiles
successifs, i.e.
F (P1 ) = 0; 01 ; F (P2 ) = 0; 02 ; :::; F (P99 ) = 0; 99
Les quantiles
Plus gnralement, on peut dnir les quantiles.
Denition 96 Le quantile dordre (0
1), not q , est la solution de
lquation F (x) = . Ainsi, en dsignant par F 1 la fonction inverse de la
fonction F on a alors :
q = F 1( )
53

Remarque 97 Une proportion des individus de la population possde un


caractre C de mesure infrieure q .

4.1.4

Lcart absolu moyen

Denition 98 Soit x une variable statistique pouvant prendre les k valeurs


x1 ; x2 ; :::; xk auxquelles correspondent les eectifs respectifs n1 ; n2 ; :::; nk . Lcart
absolu moyen, not e, est alors la moyenne arithmtique des valeurs absolues
des carts la moyenne arithmtique, i.e.
1X
e=
ni jxi
n i=1
n

xj

Proprits
Lcart absolu moyen satisfait assez bien aux premires conditions de
Yule. Mais il se prte trs mal au calcul algbrique. Lcart absolu moyen est
minimum lorsquon prend les carts par rapport la mdiane.

4.1.5

La variance et lcart-type

Lcart-type sera dni partir des carrs des carts des observations
leur moyenne arithmtique. On dterminera de cette faon une sorte de distance moyenne des observations la moyenne arithmtique. Cette distance,
au sens mathmatique du terme, servira comme mesure de dispersion de la
variable statistique autour de sa caractristique de tendance centrale.
Denition 99 Considrons une variable statistique x pouvant prendre k valeurs
Pk x1 ; x2 ; :::; xk auxquelles correspondent les eectifs n1 ; n2 ; :::; nk tels que
i=1 ni = n. Alors la variance de la variable statistique x , note V ar(x)
ou bien 2x , est la moyenne arithmtique des carrs des carts la moyenne
arithmtique :
k
1X
2
ni (xi x)2
V ar (x) = x =
n i=1
Denition 100 Lcart-type, not x , est gal la racine carre de la variance :
v
u k
u1 X
p
t
=
V
ar
(x)
=
ni (xi x)2
x
n i=1
54

Remarque 101 Lcart-type est appel parfois cart quadratique moyen (EQM ).
Example 102 Considrons la srie des salaires horaires de sept ouvriers
dune entreprise : 30; 45; 51; 62; 70; 78; 84 D.A. Alors
x = 60 D:A
Les carts la moyenne arithmtique (xi x) sont : 30; 15; 9; 2; 10; 18; 24.
Leurs carrs (xi x)2 sont : 900; 225; 81; 4; 100; 324; 576.
Do
p
p
2210
V ar (x) =
= 315; 71 et x = V ar (x) = 315; 71 = 17; 76 DA
7

4.2

Calcul pratique de la variance et de lcarttype

Les calculs de la moyenne arithmtique et de lcart-type vont gnralement de pair. On conservera le tableau dj utilis dans le calcul de la
moyenne.

4.2.1

Cas dune variable discrte

Calcul au moyen de la formule brute


Example 103 Considrons le tableau statistique suivant et calculons lcarttype.
xi
1
2
3
4
5
6
T otaux

ni
ni xi
25
25
55
110
75
225
50
200
35
175
10
60
Pk
Pk
i=1 ni = 250
i=1 ni xi = 795

Leectif n = 250 et x = 3; 18, alors


V ar(x) =

2
x

= 1; 78 et

xi x
2; 18
1; 18
0; 18
0; 82
1; 82
2; 82

ni (xi x)2
136; 81
76; 582
2; 43
33; 62
115; 934
79; 524
Pk
x)2 = 444; 9
i=1 ni (xi

1; 78 = 1; 335

Notons que mme pour une distribution statistique aussi simple que celle
tudie, le calcul de lcart-type est assez long et fastidieux
55

Calcul au moyen de la formule dveloppe


Il est possible de dvelopper la formule de dnition de la variance telle
que :
1X
V ar (x) =
ni (xi
n i=1
k

1X
ni x2i
=
n i=1
k

Do

1X
x) =
ni x2i
n i=1
k

2xxi + x2

k
k
2x X
x2 X
ni xi +
ni
n i=1
n i=1

1X
V ar (x) =
ni x2i
n i=1
k

x2

(4.1)

Remarque 104 La relation (4:1) est appele formule dveloppe de la variance.


Remarque 105 Reprenons lexemple 111 et calculons lcart-type :
xi
ni
ni xi
ni x2i
1
25
25
25
2
55
110
220
3
75
225
675
4
50
200
800
5
35
175
875
6
10
60
360
Pk
Pk
Pk
2
T otaux
i=1 ni = 250
i=1 ni xi = 795
i=1 ni xi = 2955

Alors , x = 3; 18 et V ar(x) =
Do

2
x

= 11; 82

(3; 18)2 = 1; 71.

p
1; 71 = 1; 31

Remarque 106 Le rsultat ainsi obtenu est plus prcis que celui obtenu par
la mthode prcdente, car lapproximation nintervient qu travers le terme
x. Il est encore possible de simplier les calculs en utilisant une translation
dorigine.
56

Calcul avec changement de variable


Considrons le changement de variable (changement dorigine) suivant :
x0i = xi

(4.2)

x0

Nous avons dj tabli quil existe la mme relation entre x0 et x, i.e.


x0 = x

(4.3)

x0

Do, en retranchant les relations (4:2) et (4:3) membre membre, on obtient :


x0i x0 = xi x
Par suite, et daprs la dnition de la variance :
1X
=
ni (xi
n i=1
k

2
x

1X
x) =
ni x0i
n i=1
k

x0

x0

Thorme 107 La valeur de lcart-type est invariante par translation sur


lorigine de la variable statistique.
Example 108 On considre toujours lexemple 111. Prenons pour nouvelle
origine de la variable statistique x0 = 3 et considrons le changement de
variable x0i = xi 3. On obtient alors le tableau statistique suivant :
xi
1
2
3
4
5
6
T otaux

ni
25
55
75
50
35
10
Pk
i=1 ni = 250

x0i
2
1
0
1
2
3

ni x0i
ni x02
i
50
100
55
55
0
0
50
50
70
140
30
90
Pk
Pk
2
0
i=1 ni xi = 45
i=1 ni x = 435

Alors, x0 = 0; 18 do x = 0; 18 + 3 = 3; 18
Et
435
V ar (x") = 2x" =
(0; 18)2 = 1; 70
250
Do
x = x0 = 1; 3
57

4.2.2

Cas dune variable continue

Les observations lintrieur dun mme intervalle sont reprsentes par


la valeur mdium Xi (centre de la classe n i) dnie telle que :
ei + ei 1
Xi =
2
o ei et ei 1 dsignent respectivement les extrmits suprieure et infrieure
de la classe n i.
Ainsi la variable Xi joue le mme rle quune variable discrte aecte dun
eectif gale au nombre des valeurs de la variable statistique appartenant
lintervalle [ei 1 ; ei [. On ramne ainsi le calcul de la moyenne et de lcarttype dans le cas continu celui utilis dans le cas discret. La moyenne est
P
P
2
alors X = n1 ki=1 ni Xi et la variance est 2X = n1 ki=1 ni Xi X . Dans
la suite, on ntudiera que la mthode de changement de variable.
Calcul avec changement de variable
Il est souvent intressant de considrer le changement de variable suivant :
Xi XMo
(4.4)
Xi0 =
u
o u est le P GCD des amplitudes des classes et XMo est gnralement le
centre de la classe modale.
Daprs les rsultats prcdents, il existe entre les moyennes X et X 0 la mme
relation que celle entre Xi et Xi0 , i.e.
XMo
(4.5)
u
En retranchant les relations (4:4) et (4:5) membre membre, il vient :
X0 =

Xi0

X0 =

Xi

XMo
u

XMo
Xi X
=
u
u

Par suite, en remplaant (Xi X) par u Xi0 X 0 dans la dnition de


on obtient :
k
k
1X
u2 X
2
2
2
ni Xi X =
ni Xi0 X 0 = u2 2X 0
X =
n i=1
n i=1

Do

2
X

= u2
58

2
X0

2
X,

Thorme 109 Si Xi et Xi0 sont en relation fonctionnelle telle que Xi =


uXi0 + XMo , alors X et X 0 sont tels que :
X

=u

X0

Example 110 Reprenons lexemple 85 de la distribution des ouvriers dune


entreprise suivant leur salaire mensuel.
Classe de Salaire ni
12000 x < 14000 26
14000 x < 16000 33
16000 x < 20000 64
20000 x < 24000 7
24000 x < 30000 10
T otal
140

Xi0
2
1
0
1
2

Xi
13000
15000
18000
22000
27000

ni Xi0
52
33
0
7
20
Pk
0
i=1 ni xi =

ni Xi02
104
33
0
7
40
58 184

Le centre de la classe modale est XMo = 18000. Alors le changement de


18000
variable eectu est Xi0 = Xi 1000
. Ainsi, X 0 = 0; 414 do X = 17586.
0
2
Par ailleurs, V ar (X ) = X 0 = 1; 143, do
X

= 103

X0

= 1069

Correction de Sheppard
Lorsque les observations sont regroupes par classe, lhypothse de la
concentration au centre de la classe des observations se situant dans le mme
intervalle (i.e. quand le centre de la classe est substitu aux direntes valeurs
observes) implique une approximation dans le calcul de lcart-type. Pour le
calcul de la moyenne arithmtique en gnral les erreurs se compensent, alors
que pour celui de lcart-type elles se rajoutent . Si la distribution statistique
est unimodale et support compact (i.e. si la courbe de la distribution est
tangente laxe des abscisses aux extrmits), alors on peut corriger la valeur
de lecart-type calule partir des observations regroupes en classe, avec la
formule propose par W.F. Sheppard :
r
u2
2
corrige =
X
12
o u reprsente le P GCD de lamplitude des classes.
59

Proprits de lcart-type
Lcart-type satisfait assez bien lensemble des conditions de Yule. Il
tient compte de toutes les observations. Il se prte facilement au calcul algbrique. Cest la caractristique de dispersion la moins sensible aux uctuations dchantillonnage.

Proprits de la variance
La variance dune population P compose de deux sous-populations P1
et P2 de moyennes respectives x1 et x2 , et de variances respectives 21 et 22 ,
peut sexprimer simplement en fonction de x1 , x2 , 21 et 22 . Supposons que
leectif de la population P soit n et que les eectifs des sous-populations
sont respectivement n1 et n2 tels que :
n = n1 + n2 et ni = n1i + n2i i = 1; 2; :::; k
Par dnition, la variance de la sous-population P1 a pour expression :
2
1

k
1 X
n1i (x1i
n1 i=1

x1 )2

Que lon peut mettre sous la forme :


2
1

k
1 X
n1i (x1i
=
n1 i=1

x)2

(x1

x)2

(4.6)

De mme, la variance de la sous-population P2 a pour expression :


2
2

k
1 X
=
n2i (x2i
n2 i=1

x2 )2

que lon peut mettre sous la forme :


2
2

k
1 X
n2i (x2i
n2 i=1

60

x)2

(x2

x)2

(4.7)

Par ailleurs, la variance de la population P est dnie telle que :


1X
ni (xi
=
n i=1
k

1X
=
n1i (xi
n i=1
k

n1
=
n

1X
x) =
(n1i + n2i ) (xi
n i=1
2

1X
x) +
n2i (xi x)2
n i=1
!
k
k
1 X
n2 1 X
2
n1i (x1i x) +
n2i (x2i
n1 i=1
n n2 i=1
k

Et daprs les relations (4:6) et (4:7), la vriance


2

x)2

n1
n

2
1

x)2 +

+ (x1

n2
n

2
2

x)2

peut tre crite telle que :

+ (x2

x)2

Finalement
2

1
n1
n

2
1

2
2

+ n2

1
n1 (x1
n

x)2 + n2 (x2

x)2

(4.8)

La relation (4:8) se gnralise aisment une population constitue dun


nombre ni h quelconque de sous-populations. En eet, en dsignant par ni ,
i = 1; 2; :::; h, les eectifs des sous-populations Pi tels que :
n=

h
X

ni et ni =

i=1

k
X

nij

j=1

La variance totale de la population P est alors :


1X
=
ni
n i=1
h

1X
+
ni (xi
n i=1
h

2
i

x)2

Ainsi, on vient de dmontrer le thorme suivant :


Thorme 111 La variance totale dans une population constitue dun nombre
ni quelconque de sous-populations, est une somme de la moyenne des variances dans les sous-populations et de la variance entre les sous-populations,
i.e
h
h
1X
1X
2
=
ni 2i +
ni (xi x)2
n i=1
n i=1
61

o xi , i = 1; 2; :::; h est la moyenne arithmtique dans la sous-population n i,


x est la moyenne arithmtique de la population totale et 2i , i = 1; 2; :::; h est
la variance de la sous-population n i
P
Denition 112 Le terme n1 hi=1 ni 2i est appel variance intra-groupe et
P
est note 2intra . Le terme n1 hi=1 ni (xi x)2 est appel variance inter-groupe
et est not 2inter .
Remarque 113 La variance totale
2

peut tre exprime alors telle que :

2
intra

2
inter

Dune manire gnrale, la variance dune population compose de plusieurs


sous-populations rsulte de deux facteurs : la variabilit interne chaque
sous-population et la variabilit entre les direntes sous-populations.

4.3
4.3.1

Autres caractristiques dune distribution


statistique
Coe cient de variation

En gnral, lcart-type et la moyenne sexpriment dans la mme unit


de mesure que la variable statistique. Or, on peut avoir comparer des dispersions de distributions qui ne sont pas exprimes dans la mme unit de
mesure ou bien qui dirent par leurs moyennes. Alors, on introduit une
caractristique de dispersion relative.
Denition 114 On appelle coe cient de variation, et on note CV , le rapport de lcart-type la moyenne arithmtique, i.e.
CV =

Remarque 115 Le coe cient de variation est un nombre sans dimension.


Il est par consquent indpendant des units de mesure choisies.
Example 116 Les distributions des salaires dans deux entreprises semblables
E1 et E2 ont les caractristiques suivantes :
x1 = 19600 DA

et
62

= 2500 DA

x2 = 18000 DA

et

= 1400 DA

Les coe cients de variation sont donc :


CV1 =

2500
1400
= 0; 1275 et CV2 =
= 0; 0778
19600
18000

Supposons que lon dsire comparer ces distributions avec celle observe
propos dune entreprise amricaine comparable, avec les caractristiques :
x = 2800 $ ;
CV =

4.3.2

= 450 $

450
= 0; 0143
2800

Courbe de concentration

La courbe de concentration exige comme pour la mdiale, la connaissance


pour chaque classe du nombre dobservations et de la somme des valeurs
correspondantes.
Soit Fi la frquence cumule des observations et F Qi le pourcentage cumul
de la somme des valeurs. Alors, la courbe de concentration est obtenue en
traant le graphe de F Qi (ordonne) en fonction de Fi (abscisse). On obtient
alors la courbe suivante :

Courbe de concentration ou courbe de Lorenz


63

Remarque 117 La courbe de concentration ou courbe de Lorenz est notamment utilise en conomie pour mesurer les ingalits de possession de
richesse (on supposera donc que x reprsente un certain bien possd par les
individus de la population). Elle est fabrique de la faon suivante. Soit xi
une valeur prise par x. On note F (x) la proportion de la population pour
laquelle x < xi (F est donc la courbe cumulative (fonction de rpartition)
de x). On note F Q(xi ) la proportion du bien possd par ces individus par
rapport au bien total. Alors la courbe de Lorenz est la courbe joignant tous
les points (F (xi ); F Q(xi )). La courbe de Lorenz joint donc toujours le point
(0; 0) au point (1; 1). Elle est situe sous le segment joignant ces deux points.
Denition 118 La diagonale du carr circonscrit la courbe de Lorenz sappelle droite dqui-rpartition.
Remarque 119 La diagonale principale du graphique (droite dquirpartition)
reprsente une distribution parfaitement galitaire. Plus la courbe de concentration scarte de la droite dquirpartition, plus la distribution est ingalitaire. Dautre part, plus la dispersion est faible plus la courbe de concentration
sapplatit sur la diagonale.

4.3.3

Indice de concentration ou indice de Gini

Cest une mesure de dispersion propose par le statisticien italien Corrado


Gini. Lindice de concentration ou indice de Gini, not G, est une mesure de
dispersion relative dune srie statistique. Cette caractristique ne sapplique
quaux variables statistiques continues et valeurs positives. Son calcul exige
la connaissance pour chaque classe du nombre dobservations et de la somme
des valeurs correspondantes. Lindice de concentration est dni en gnral
partir de la courbe de Lorenz dune variable statistique positive x.
Denition 120 Lindice de Gini dune distribution statistique est le double
de laire de la surface dlimite par la courbe de Lorenz et la premire diagonale du carr unit.
Remarque 121 Du fait que F (x) et F Q(x) varient dans lintervalle [0; 1]
et quils sont nuls ou gaux 1 en mme temps, la courbe de concentration
sinscrit dans un carr unitaire. Elle se situe en dessous de la diagonale
du carr car, en gnral, F (x) est suprieur F Q(x). Lindice de Gini est
64

toujours compris entre 0 et 1.


Lindice de Gini est trs utilis en conomie comme mesure des ingalits
dans une population. Supposons par exemple que la variable x correspond
aux revenus dans une population. Si lindice de Gini est proche de 0, ceci
signie que les dirences relatives sont en moyenne faible par rapport
la moyenne des revenus, i.e. les ingalits dans la population sont faibles.
Si lindice de Gini est proche de 1, au contraire il y a de fortes dirences
relatives en moyenne, i.e. les ingalits sont fortes.

4.3.4

Calcul pratique de lindice de Gini

Laire comprise entre la courbe de Lorenz et la diagonale du carr est


calcule par approximation. Pour rappel, laire dun trapze est telle que :
hauteur

(petite base + grande base)


2

Pour obtenir laire entre la courbe de Lorenz et la diagonale du carr, il faut


soustraire laire des trapzes en dessous de la courbe de concentration 0; 5.
Alors en posant F0 = F Q0 = 0 et Fk = F Qk = 1 o k est le nombre de
classes, lidice de Gini est donn par la formule suivante :
!
k
X
(Fi Fi 1 ) (F Qi 1 + F Qi )
G = 2 0; 5
2
i=1
Que lon peut crire aussi sous la forme :
G=1

k
X

(Fi

Fi 1 ) (F Qi

+ F Qi )

i=1

Example 122 Reprenons lexemple de la rpartition des employs dune entreprise selon leur salaire mensuel net.
Salaires (euros)
[800; 900[
[900; 1000[
[1000; 1100[
[1100; 1500[
[1500;
P2000[

ni
25
30
28
25
10
118

Fi
0; 212
0; 466
0; 703
0; 915
1

F Qi Fi Fi
0; 164
0; 212
0; 385
0; 254
0; 613
0; 237
0; 865
0; 212
1
0; 085

65

F Qi 1 + F Qi
0; 164
0; 549
0; 998
1; 478
1; 865

(Fi

Fi 1 ) (F Qi 1 + F Qi )
0; 034768
0; 139446
0; 236526
0; 313336
0; 158525
0; 882601

Fig. 4.1 Calcul de lindice de Gini

Alors, lindice de Gini est tel que :


G=1

0; 8826

66

0; 117

4.4

Les caractristiques de forme

En plus des caractristiques de tendance centrale et de dispersion, il serait instructif de dnir des indices pour rsumer linformation vhicule par
les donnes, sur lallure et la forme de la distribution dune srie statistique.
Pour une distribution statistique symtrique la moyenne, le mode et la mdiane concident. Il est donc naturel de considrer la dviation de la moyenne
par rapport au mode ou bien par rapport la mdiane, comme mesure dasymtrie de la distribution statistique. K. Pearson a propos comme mesure de
lasymtrie une quantit fonction du mode. Mais cette quantit est sujette
linconvnient dterminer le mode. Cependant, pour une large classe de
distributions de frquences, la mesure dasymtrie peut tre dtermine exactement laide des quatre premiers moments de la distribution.
Denition 123 Soit x1 ; x2 ; :::; xn une distribution statistique dune variable
x. On appelle moment centr dordre r de la variable statistique x, not r ,
la quantit dnie telle que :
1X
(xi
n i=1
n

4.4.1

x)r

Coe cient dasymtrie (skewness)

Une distribution statistique symtrique a tous ses moments centrs impairs nuls et a fortiori la moyenne 1 .
Denition 124 Soit 3 et 2 les moments centrs dordre respectifs 3 et
2 de la distribution statistiques. On appelle caractristique dasymtrie le
coe cient 1 dni tel que :
1

3
3

3
3
2

67

Distributions asymtriques

Distribution symtrique
Remarque 125 Le coe cient 1 est sans dimension, invariant par changement dorigine et dchelle. Il est nul pour les distributions symtriques.
On utilise galement comme indice dasymtrie le rapport :
d=

Q1 + Q3 2Me
2Me

o Q1 et Q3 sont les quartiles, et Me la mdiane.


Pour les distributions unimodales 1 et d sont de mme signe et ils sannulent
pour les distributions symtriques.
68

4.4.2

Coe cient daplatissement (Kurtosis)

Denition 126 On appelle caractristique daplatissement le coe cient


dni tel que :
4
3 = 44 3
2 = 2

et

sont les moments centrs dordre respectifs 4 et 2 de x.

Remarque 127 Le coe cient 2 est sans dimension. Il est invariant par
changement dorigine et dchelle. La constante 3 est choisie de telle sorte
que le coe cient 2 soit nul pour les distributions normales.
Le coe cient 2 est positif si la distribution est moins aplatie que la distribution normale et il est ngatif dans le cas contraire.
Les courbes pour lesquelles 2 = 0 sont dites msokurtiques, celles pour
lesquelles 2 > 0 sont dites leptokurtiques et celles pour lesquelles 2 < 0
sont dites platicurtiques.
2
Du fait de lingalit 4
2 , le coe cient daplatissement est toujours suprieur 2.

69

Chapitre 5
Distributions statistiques
deux dimensions
Pour ltude de certains phnomnes complexes, il savre insu sant de
prendre en compte un seul caractre. Alors il en faut considrer deux caractres ou plus. Lanalyse et la reprsentation des tableaux statistiques obtenus deviennent videmment plus complexes. La reprsentation graphique,
par exemple, nest possible que dans un espace trois dimensions au plus. En
dnissant les distributions marginales et conditionnelles, on peut ramener
la reprsentation dune distribution plusieurs dimensions quelques reprsentations unidimensionnelles. Dans la suite, on ne considrera que les sries
statistiques deux dimensions.

5.1

Prsentation gnrale dun tableau double


entre

Considrons une population de n individus. Chacun de ces derniers est


identi par deux caractres A et B. Le caractre A comporte k modalits
A1 ; A2 ; :::; Ak et le caractre B en comporte m , B1 ; B2 ; :::; Bm . Lopration
prliminaire consiste classer les n individus dans k m cases dun tableau
o gurent en ligne les modalits de A et en colonne les modalits de B.
Dans chaque case (i; j); i = 1; 2; :::; k et j = 1; 2; :::; m, on inscrira le nombre
nij des lments du sous-ensemble de la population contenant les individus
prsentant simultanment la modalit Ai du caractre A et la modalit Bj
du caractre B.
70

Pour allger les notations on indiquera par un point (.)la sommation eectue suivant lindice iou lindice j, i.e.
m
X

nij = ni:

; i = 1; 2; :::; k

nij = n:j

; j = 1; 2; :::; m

j=1

k
X
i=1

k
X

ni: =

i=1

m
X

n:j =

j=1

nij = n:: = n

i;j

Nous donnons ci-aprs la forme gnrale dun tableau statistique double


entre, appel aussi tableau de contingence :
A/ B
A1
A2
:::
Ai
:::
Ak
T otal

B1
n11
n21

B2
n12
n22

ni1

ni2

nk1
n:1

nk2
n:2

:::

Bj
n1j
n2j

:::

Bm
n1m
n2m

T otal
n1:
n2:

nij

nim

ni:

nkj
n:j

nkm
n:m

nk:
n:: = n

Tableau statistique double entre


Denition 128 On appelle frquence de lvnement (Ai ; Bj ) la proportion
des observations qui prsentent simultanment les modalits Ai et Bj . Elle
est note fij et est dnie telle que :
fij =

nij
n

Remarque 129 Si on adopte les mmes conventions dcriture que pour les
eectifs, en indiquant par un pointles sommations eectues par rapport
lindice iou par rapport lindice j, alors fi: est la somme des frquences
de la ligne n i.

71

Proposition 130 Il est vident que daprs la dnition de la frquence fi ,


on a :
fi: =

ni:
n

et

i = 1; 2; :::; k

f:j =

n:j
n

j = 1; 2; :::; m

Dmonstration :
fi: =

m
X

fij =

j=1

et
f:j =

k
X

m
X
nij
j=1

fij =

i=1

k
X
nij
i=1

ni:
n

n:j
n

Remarque 131 Comme pour les distributions un caractre la somme des


frquences est gale lunit. En eet ,
k X
m
X
i=1 j=1

5.2

fij =

k
X

fi: =

i=1

m
X

f:j = 1

j=1

Distributions marginales

Denition 132 La sommation suivant les lignes ou les colonnes des eectifs
ou des frquences, dnit la distribution marginale du caractre A ou celle de
B respectivement.
Remarque 133 La distribution marginale est la distribution statistique de
lun des caractres indpendamment de lautre. Elle est lue sur lune ou
lautre des marges du tableau, do son nom. Par exemple, la distribution
marginale associe au caractre A est :
n1: ; n2: ; :::; nk: ou bien

f1: ; f2: ; :::; fk:

et la distribution marginale associe au caractre B est :


n:1 ; n:2 ; :::; n:m ou bien
72

f:1 ; f:2 ; :::; f:m

Example 134 Ltude dune population de 50 individus suivant le poids (caractre B) et la taille (caractre A), a donn les rsultats suivants :
A/ B 60 70 80 90 M arge
160
2 5 4 1
12
170
2 8 9 4
23
180
0 4 6 5
15
M arge 4 17 19 10
50
A/ B
160
170
180
M arge

60
0; 04
0; 04
0; 00
0; 08

70
0; 10
0; 16
0; 08
0; 34

80
0; 08
0; 18
0; 12
0; 38

90 M arge
0; 02
0; 24
0; 08
0; 46
0; 10
0; 30
0; 20
1; 00

Les rsultats peuvent tre rsums dans un tableau statistique double entre
en fonction des ectifs ou des frquences relatives.

5.3

Distributions conditionnelles

Denition 135 Considrons la sous population des individus prsentant la


modalit Bj . Sur cette sous-population la distribution du caractre A est appele distribution conditionnelle de A sachant Bj ralis.
Remarque 136 Considrons les n:j individus prsentant la modalit Bj .
n
Parmi ceux-ci, il y a une proportion nij:j dindividus qui prsentent en mme
temps la modalit Ai .
Denition 137 On dit que la frquence conditionnelle de la modalit Ai lie
par la modalit Bi est :
fi=j = f (Ai =Bj ) =

nij
n:j

j = 1; 2; :::; m

Remarque 138 Lensemble des frquences conditionnelles du caractre A


lies la mme modalit Bj du caractre B constitue la distribution conditionnelle de A sachant Bj ralis. Cest une distribution un seul caractre
et il y a autant de distributions conditionnelles de A quil y a de modalits
de B, i.e. autant que de colonnes du tableau statistique.
73

Denition 139 On dnit de faon analogue la distribution conditionnelle


de B lie par les modalits Ai tel que :
fj=i = f (Bj =Ai ) =

nij
ni:

i = 1; 2; :::; k

Remarque 140 Les distributions conditionnelles conservent les mmes proprits que les distributions statistiques normales, i.e.
k
X

fi=j = 1 , j = 1; 2; :::; m

i=1

m
X

fj=i = 1 , i = 1; 2; :::; k

j=1

Example 141 On reprend lexemple 55 et on dtermine les distributions


conditionnelles.
A/ B
160
170
180
M arge

60
0; 50
0; 50
0; 00
1; 00

70
80
90
0; 30 0; 211 0; 10
0; 47 0; 474 0; 40
0; 23 0; 315 0; 50
1; 00 1; 00 1; 00

Distributions conditionnelles de A sachant Bj ; j = 1; 2; 3; 4


B/ A
60
70
80
90
M arge

160
0; 167
0; 416
0; 334
0; 083
1; 00

170
180
0; 087 0; 00
0; 350 0; 267
0; 391 0; 400
0; 172 0; 333
1; 00 1; 00

Distributions conditionnelles de B sachant Ai ; i = 1; 2; 3; 4

5.3.1

Proprits des frquences marginales et conditionnelles

Il est facile dtablir que :


fij = f (Bj / Ai ) fi: = f (Ai / Bj ) f:j = fj=i fi: = fi=j f:j
74

En eet,

nij
nij ni:
nij n:j
=
=
n
ni: n
n:j n

On retrouvera cette formule plus tard en calcul de probabilit sous le nom


daxiome des probabilits conditionnelles.
Moyennes conditionnelles
Il nous est possible de dnir plus tard la notion de moyenne conditionnelle. Les moyennes conditionnelles sont les moyennes des distributions
conditionnelles. On peut parler, par exemple, de la moyenne du caractre B
chez les individus prsentant la modalit Ai , i = 1; 2; :::; k du caractre A ou
bien de la moyenne du caractre A prsentant la modalit Bj , j = 1; 2; :::; m
du caractre B.

5.4

Reprsentations graphiques des distributions deux caractres

Le mode de reprsentation graphique dune distribution deux caractres


nest strictement possible que dans un espace trois dimensions. Chacun des
caractres est port sur une dimension et la troisime est aecte aux eectifs
ou aux frquences.

5.4.1

Cas des caractres qualitatifs

Il nest pas toujours possible de reprsenter les deux caractres de faon


absolument symtrique. Cependant, on peut reprsenter la famille des distributions conditionnelles A/ Bj , j = 1; 2; :::; m (ou bien B/ Ai , i = 1; 2; :::; k),
de telle sorte que nij soit reprsent par un rectangle de base n:j (ou ni: )
et que la hauteur soit proportionnelle la frquence conditionnelle fi=j (ou
fj=i ).

5.4.2

Cas des caractres quantitatifs

Dans ce cas aussi on peut utiliser le mode de reprsentation nonc plus


haut. De plus, soient x et y les deux variables statistiques quantitatives discrtes. Soit nij leectif correspondant la modalit (xi ; yj ), on peut repr75

senter cet eectif par un cercle centr au point (xi ; yj ) et de surface proportionnelle nij .
Denition 142 La reprsentation graphique dune distribution deux variables continues regroupes par classes est appele strogramme. Cest un
solide constitu par un ensemble de paralllpipdes rectangles dont la base
est forme par les couples dintervalles de classe et dont les volumes sont
proportionnels aux frquences fij ou aux eectifs nij .
Remarque 143 Le paralllpipde relatif la classe n i damplitude ai de
x, et la classe n j damplitude bi de y, a pour hauteur :
hij =

fij
ai b j

de telle sorte que le volume de ce paralllpipde soit :


Vij = ai bj

fij
ai b j

= fij

Ainsi le strogramme apparat comme la gnralisation de lhistogramme.


Example 144 Reprenons lexemple 55 et reprsentons par un strogramme
la distribution du poids (caractre B) et de la taille (caractre A) des individus de la population.

Reprsentation par strogramme


76

5.5

Covariance entre deux variables statistiques

Dans le cas des variables statistiques deux dimensions, il est intressant


de pouvoir quantier la variabilit de la population due leet conjugu
des variables considres simultanment. Pour cela on introduit la notion de
covariance.

5.5.1

Covariance

En gnral, la distribution des observations dune population suivant deux


caractres (x; y) sont disposes dans un tableau de contingence, alors la covariance est dnie telle que :
Denition 145 Soit (x; y) un couple de variables statistiques pouvant prendre
les valeurs (xi ; yj ), i = 1; 2; :::; k et j = 1; 2; :::; m avec les eectifs respectifs
(nij ), i = 1; 2; :::; k et j = 1; 2; :::; m. On appelle covariance des variables
statistiques x et y , note Cov(x; y), la quantit dnie telle que :
1 XX
nij (xi
n i=1 j=1
k

Cov (x; y) =

x) (yj

y)

Remarque 146 Pour le calcul pratique, on utilisera souvent la formule dveloppe de la covariance dnie telle que :
1 XX
nij xi yj
Cov (x; y) =
n i=1 j=1
k

xy

Dans certaines situations il arrive que que les observations dune population suivant deux caractres (x; y) soient apparies, i.e. les observations sont
disponibles sous forme dune suite (xi ; yi ), i = 1; 2; :::; n, alors dans cette
situation la covariance est dnie telle que :
Denition 147 Soit (xi ; yi ), i = 1; 2; :::; n une srie dobservation dun
couple de variables statistiques (x; y). On appelle covariance des variables
statistiques x et y , note Cov(x; y), la quantit dnie telle que :
1X
Cov (x; y) =
(xi
n i=1
n

77

x) (yi

y)

Remarque 148 Pour le calcul pratique, on utilisera souvent la formule dveloppe de la covariance dnie telle que :
n
1X
Cov (x; y) =
xi yi xy
n i=1

5.5.2

Coe cient de corrlation

Il arrive souvent de vouloir comparer la variation dune variable statistique par rapport une autre dnie sur les mmes individus dune quelconque population. Mais ces variables ne sexpriment pas souvent dans la
mme unit. Pour cela on dnit le coe cient de corrlation qui est un
coe cient normalis sans dimension.
Denition 149 On appelle coe cient de corrlation de deux variables statistiques x et y, et on le note Corr(x; y) ou , la quantit dnie telle que :
= Corr(x; y) =

Cov (x; y)
x y

Remarque 150 Le coe cient de corrlation


cosinus de langle entre les vecteurs !
x et !
y.

est, une constante prs, le

Proprit
Quelque soit le couple de variables statistiques (x; y) leur coe cient de
corrlation = Corr (x; y) vrie lingalit suivante :
1

= Corr (x; y)

+1

(5.1)

Les galits ont lieu si et seulement si il existe deux constantes a 6= 0 et b


telles que y = ax + b ou bien x = ay + b.
Example 151 Reprenons lexemple 55 et calculons la covariance et le coe cient de corrlation entre les caractres Aet B que lon noteras x et y
respectivement.
Posons (Ai ; Bj ) = (xi ; yj ) ; i = 1; 2; 3 et j = 1; 2; 3; 4. Alors : x = 170; 6 ;
y = 77 ; x = 7; 32 et y = 8; 77 Par ailleurs
1 XX
nij xi yj = 13156
n i=1 j=1
3

Do

Cov (x; y) = 19; 8 et


78

= Corr (x; y) = 0; 3

5.5.3

Dirents genres de corrlation

Corrlations positives

Corrlation nulle

79

Corrlations ngatives

5.6

Ajustement linaire ou droite des moindres


carrs

Soient x et y deux variables statistiques dnies sur la mme population.


Les observations du couple (x; y) peuvent tre prsentes sous forme dune
srie brute (xi ; yi ), i = 1; 2; :::; n ou bien sous forme dun tableau de contingence. On sait (5:1) que si le coe cient de corrlation entre x et y est voisin
de +1 ou 1, il existe deux nombres rels a 6= 0 et b tels que y = ax + b ou
bien x = ay + b.
Denition 152 Soient x et y deux variables statistiques dnies sur la mme
population. Lquation y = ax + b (rep. x = a0 y + b0 ) est appele droite de
rgression ou ajustement linaire de y en x (resp. de x en y).
Sachant que les constantes a et b existent, comment peut-on les dterminer ?
Les observations sur une population par rapport deux caractres ou variables statistiques x et y nous fournissent une suite de couples (xi ; yi ),
i = 1; 2; :::; n. En gnral, en raison des erreurs de mesure, les points (xi ; yi )
ne sont pas aligns, mais sont "presque" sur une mme droite. Il faut alors
choisir a et b de sorte que la droite soit la meilleure possible. Pour cela, il
faut choisir une mesure de lcart entre une droite y = ax + b et le nuage de
80

points exprimentaux (xi ; yi ). On choisit en gnral le carr de la dirence


entre le point thorique et le point exprimental, cest--dire (yi (axi + b))2 .
Lcart total est donc :
f (a; b) =

n
X

(yj

b)2

axi

(5.2)

i=1

Eectuer une rgression linaire, cest trouver la droite qui minimise lcart
total, i.e. la somme des carrs des dirences. On parle alors de droite des
moindres carrs.
Proposition 153 Soient x et y deux variables statistiques dnies sur la
mme population. La fonction numrique dnie sur R2 par lquation (5:2) admet
un minimum au point ( ; ) tel que :
=

Cov (x; y)
= Corr (x; y)
V ar (x)
=y

y
x

Dmonstration : Le minimum de la fonction f (a; b) est obtenu au point


( ; ) solution du systme dquations :
(
@f (a;b)
=0
@a
@f (a;b)
=0
@b
Nous allons considrer deux situations.
A. Les observations sont prsentes sous forme dune srie statistique brute
(i.e. elle na pas t ordonne dans un tableau). On dit, en gnral, que cest
une srie dobservations
couples.
P
Alors, f (a; b) = ni=1 (yi axi b)2 et donc
@f (a; b)
=
@a

2
2

n
X
i=1
n
X

xi (yi

xi yi + 2a

i=1

Sachant que

n
X
i=1

axi

n
X

b)

x2i

+ 2b

i=1

xi yi = n fCov (x; y) + x:yg


81

n
X
i=1

xi = 0

et

n
X

x2i

= n V ar (x) + x

n
X

et

i=1

i=1

On dduit

xi = nx

a V ar (x) + x2

Cov (x; y) + x:y

(5.3)

bx = 0

Dautre part
@f (a; b)
=
@b

n
X

(yi

axi

i=1

n
X

yi + 2a

i=1

Sachant que

n
X

yj = ny

n
X

xi + 2

i=1

n
X

et

n
X

b=0

i=1

xi = nx

i=1

j=1

On dduit

b)

ax

(5.4)

b=0

B. Les observations sont prsentes dans un tableau de contingence.


Alors
@f (a; b)
=
@a
=

k X
m
X

nij xi (yj

axi

k X
m
X

nij xi yj + 2a

i=1 j=1

b)

i=1 j=1

k X
m
X

k X
m
X

nij x2i

+ 2b

i=1 j=1

nij xi yj + 2a

i=1 j=1

k
X

k X
m
X
i=1 j=1

ni: x2i + 2b

i=1

k
X

ni: xi = 0

i=1

Sachant que
k X
m
X
i=1 j=1

et

k
X

nij xi yj = n fCov (x; y) + x:yg

ni: x2i = n V ar (x) + x2

i=1

et

k
X
i=1

82

nij xi

ni: xi = nx

On dduit
a V ar (x) + x2

Cov (x; y) + x:y

(5.5)

bx = 0

Dautre part
@f (a; b)
=
@b
=

k X
m
X

nij (yj

axi

i=1 j=1

k X
m
X

nij yj + 2a

i=1 j=1

b)

m
X

k X
m
X

nij xi + 2b

i=1 j=1

n:j yj + 2a

j=1

k
X

k X
m
X

nij

i=1 j=1

ni: xi + 2nb = 0

i=1

Sachant que
m
X

n:j yj = ny

et

j=1

On dduit

k
X

ni: xi = nx

i=1

ax

(5.6)

b=0

La solution du systme dquations f(5:5) ; (5:6)g est le point ( ; ) tel que :


=

Cov (x; y)
V ar (x)

=y

Remarque 154 Il est vident que les couples dquations f(5:3) ; (5:4)g et
f(5:5) ; (5:6)g sont les mmes. Donc, que lon utilise les donnes brutes ou les
donnes disposes dans un tableau de contingence, le minimum de la fonction
f (a; b) est le mme.
La quantit = Cov(x;y)
peut tre exprime telle que :
V ar(x)
=

Cov (x; y)
= Corr (x; y)
V ar (x)

83

y
x

En eet
=

Cov (x; y)
Cov (x; y)
=
V ar (x)
x x

Cov (x; y)
x y

y
x

= Corr (x; y)

y
x

On peut constater que la pente de la droite de rgression est proportionnelle


au ce cient de corrlation et est de mme signe. Le point de coordonnes
(x; y) appartient toujours la droite de rgression.

84

Chapitre 6
Les sries chronologiques
6.1

Gnralits

Denition 155 On appelle srie chronologique ou temporelle une suite Yt ,


t = 1; 2; 3; :::, dobservations chires et ordonnes dans le temps dun mme
phnomne.
Example 156 Nombre mensuel de vente de voitures neuves.
Nombre annuel de naissance en Algrie.
Remarque 157 Les dates dobservations sont gnralement ordonnes de
manire rgulire dans le temps : on manipule des sries journalires, mensuelles, trimestrielles, annuelles. Plus gnralement, pour les sries statistiques deux dimensions, lorsque lun des caractres est le temps, la srie
statistique est alors appele srie chronologique. Le deuxime caractre est
quelconque.

Reprsentation graphique
Pour la reprsentation graphique des sries chronologiques un certain
nombre de prcautions doivent tre prises :
Sil sagit dun stock de leectif de la population une date dtermine,
le point reprsentatif se place exactement laplomb de la date de
rfrence.
Sil sagit dun ux comme la production mensuelle dnergie lectrique
par exemple, ou dune moyenne comme le prix moyen mensuel du kilogramme de pomme de terre par exemple, le point reprsentatif sera
alors plac la verticale du milieu de la plage.
85

Le temps est toujours port en abscisse et le deuxime caractre en


ordonne.
On reprsente les points (t; Yt ), que lon relie par des segments de
droites. On reprsente lvolution de la grandeur considre sur lensemble de la priode observe.
Example 158 Considrons la srie trimestrielle du chire daaires en milliers de DA des ventes dun magasin de 1978 1982.
t
1
2
3
4
5
6
7
8
9

Yt
2614
3010
2765
4856
3010
3397
3168
5624
3406

Reprsentation graphique de Y(t)

86

6.2
6.2.1

Analyse empirique dune srie chronologique


Dcomposition dune srie chronologique

Le but de la dcomposition dune srie chronologique est de distinguer


dans lvolution de la srie, une tendance gnrale , des variations saisonnires qui se rptent chaque anne, et des variations accidentelles imprvisibles. Lintrt de ceci est dune part de mieux comprendre, de mieux dcrire
lvolution de la srie, et dautre part de prvoir son volution ( partir de
la tendance et des variations saisonnires).
La tendance ou trend
Denition 159 La tendance dune srie chronologique, note Ct , est lvolution long terme de la srie ou lvolution fondamentale de la srie.
Example 160 Laugmentation du chire daaire de 1978 2005.
Les variations saisonnires ou saisonnalits
Denition 161 Les variations saisonnires ou saisonnalits, nots St , sont
des uctuations priodiques lintrieur dune anne, et qui se reproduisent
de faon plus ou moins permanente dune anne sur lautre.
Example 162 Ces variations sont dues au rythme des saisons : climat, matires premires, congs, . . .

Proprits
Les variations saisonnires se caractrisent par deux principes :
Principe de rptition lidentique : Les variations saisonnires sont
priodiques de priode p (nombre de mois) :
St+p = St
Principe de conservation des aires : Par an, linuence des variations
saisonnires est nulle. Cela sera traduit laide de la moyenne des St .

87

Les variations accidentelles ou rsiduelles


Denition 163 Les variations accidentelles ou rsiduelles, notes "t , sont
des uctuations irrgulires et imprvisibles. Elles sont supposes en gnral
de faible amplitude. Cest la composante alatoire dune srie chronologique.
Example 164 Les variations rsiduelles proviennent de circonstances non
prvisibles : catastrophes naturelles, crise boursire, grves . . .

6.2.2

Les modles de composition des trois composantes

Le modle additif
Denition 165 Un modle additif suppose que les trois composantes : tendance, variations saisonnires et variations accidentelles sont indpendantes
les unes des autres. La srie Yt scrit comme la somme de ces 3 composantes :
Yt = Ct + St + "t
Remarque 166 Graphiquement, lamplitude des variations est constante
autour de la tendance. En eet, si on joint les minima et les maxima de
la srie chronologique on obtient deux droites parallles la tendance.
Le modle multiplicatif
Il ya deux forme de modles multiplicatifs.
Denition 167 (1re forme) Les variations saisonnires sont supposes
dpendre de la tendance. Alors, on considre que Yt scrit de la manire
suivante :
Yt = Ct St + "t
Remarque 168 Graphiquement, lamplitude des variations (saisonnires)
varie. En eet, en joignant les minima et les maxima de la srie chronologique
on constate que les deux droites ne sont pas parallles entre elles.
Denition 169 (2me forme) On suppose que les variations saisonnires
et les variations accidentelles dpendent de la tendance. Alors, on considre
que Yt scrit de la manire suivante :
Yt = Ct

St
88

"t

Remarque 170 1) Dans le cas dune srie chronologique Yt valeurs positives, le deuxime modle multiplicatif se ramne un modle additif en
considrant la srie des logarithmes de Yt :
ln (Yt ) = ln (Ct ) + ln (St ) + ln ("t )
2) La seule dirence entre les deux modles multiplicatifs rside dans lestimation des "t , qui na pas une grande importance pour linstant.

6.2.3

Choix du modle

Mthode de la bande
On utilise le graphe de la srie et la droite passant par les minima et celle
passant par les maxima.
Si ces 2 droites sont peu prs parallles : le modle est additif.
Si ces 2 droites ne sont pas parallles : le modle est multiplicatif.

Mthode du tableau de Buys et Ballot

On calcule, pour chacune des annes, la moyenne et lcart type. On


reprsente les points dabscisse la moyenne et dordonne lcart type de la
mme anne sur un plan. On trace la droite des moindres carrs de ces points.
Si lcart type est indpendant de la moyenne le modle est additif. La
pente (a) de la droite des moindres carrs est trs proche de 0.
Si lcart type est fonction de la moyenne le modle est multiplicatif.
La pente (a) de la droite des moindres carrs nest pas nulle.
En conclusion pour dcomposer une srie chronologique on doit commencer par tracer son graphique, choisir un modle de composition (additif ou
multiplicatif), estimer la tendance Ct , estimer les variations saisonnires.

6.3

Les indices statistiques

Pour ltude de certains phnomnes conomiques et sociaux, on est souvent amen dcrire ou comparer les variations de grandeurs simples telles
que le prix du bl, la production dacier ou le taux de fcondit dune certaine
population, etc. Pour les comparaisons dans le temps et dans lespace de ces
grandeurs, on introduit la notion dindice statistique lmentaire. Ceux sont
gnralement des rapports de ces grandeurs. Mais il est plus instructif de

89

pouvoir suivre les volutions de grandeurs plus complexes telles que le niveau gnral des prix, la production industrielle, le volume des importations,
etc. Ces volutions sont rsumes par lune ou lautre des caractristiques
de tendance centrale de la srie des indices lmentaires correspondants. On
parle dans ce cas dindices synthtiques.

6.3.1

Les indices lmentaires

Example 171 a) Le prix du kilogramme dun certain produit a t de 15DA


en moyenne en 1980 et il est de 32DA en Octobre 1998. Lindice lmentaire
du prix de ce produit en Octobre 1998, base 100 en 1980, est le rapport des
deux prix exprim en pourcentage :
32
100 = 213; 33
15
b) La consommation dlectricit a t de 16500 Millions de Kwh en 1988
et de 6200 Millions de Kwh en 1973. Lindice lmentaire de la consommation
dlectricit en 1988, base 100 en 1973, est le rapport des consommations des
deux annes exprim en % :
IOct98=M oy80 =

16500
100 = 266; 13
6200
Plus gnralement, considrons la variation dans le temps dune grandeur simple X, prenant les valeurs X0 ; X1 ; :::; Xt ; :::, aux dates (ou priodes)
successives 0; 1; 2; :::; t; :::.
I1988=1973 =

Denition 172 On appelle indice lmentaire de la grandeur X la date


(ou priode) t par rapport la date (ou priode) 0, le rapport :
It=0 =

Xt
X0

Remarque 173 La date ou priode 0 est appele date de rfrence ou


base de lindice. La date ou priode t est appele date courante. En gnral, ce rapport est exprim en % tel que :
It=0 =

Xt
100
X0

On dit alors que lindice la date t est exprim base 100 la date de rfrence
0.
90

Les indices statistiques lmentaires sont utiliss surtout pour retracer


lvolution des grandeurs simples dans le temps. Mais ils peuvent aussi servir
des comparaisons dans lespace.
Example 174 La densit de la population algrienne a t de 14; 6 h=Km2
en 1996, alors que pour la rgion algroise elle a t de 1540 h=Km2 . Lindice
de densit de la rgion algroise, lensemble de lAlgrie tant choisi comme
base, est :
1540
100 = 10580
IRA=Al =
14; 6
Lindice de densit du sud algrien dont la densit de la population est de
0; 5 h=Km2 , par rapport celle du pays, est alors :
ISA=Al =

0; 5
100 = 3; 4
14; 6

Proprits
Les indices lmentaires possdent deux proprits fondamentales, la circularit et la rversibilit.
La circularit On dit quun indice statistique I est circulaire si 8 t, t0on
a:
It=0 = It=t0 It0 =0
En eet,
Xt
Xt
=
X0
Xt0

Xt0
X0

Remarque 175 On peut comparer les grandeurs aux dates t et t0en prenant
le quotient des indices It=0 et It0 =0 . On obtient ainsi un changement de base
(la date de rfrence t0a t substitue la date 0) . La proprit de circularit
peut tre gnralise une suite dindices, i.e.
It=0 = It=t

It

1=t 2

91

:::

I2=1

I1=0

Rversibilit On dit quun indice statistique I est rversible si 8 t, on a :


I0=t =

1
It=0

En eet,
1
X0
= Xt
Xt
X0
Remarque 176 Lvolution dun phnomne est souvent prsente sous forme
dune augmentation ou dune diminution en pourcentage laide de la formule suivante :
V aleur nouvelle
V aleur primitive
V aleur primitive

100

Le pourcentage de variation ne possde pas les proprits de circularit et


de rversibilit des indices, et est donc moins maniable. Les pourcentages de
variation ne se rajoutent pas.

6.3.2

Les indices synthtiques

Les grandeurs complexes sont fonction de quelques grandeurs simples.


Ainsi le niveau gnral des prix est constitu des prix des divers aliments
et boissons, du logement, de lquipement mnager, de lhabillement, des
services mdicaux, des transports, des loisirs, etc. La construction dun indice
synthtique relatif la variation dune grandeur complexe consiste rsumer
une srie dindices lmentaires.

Position du problme
Soit X une grandeur complexe compose des lments X 1 ; X 2 ; :::; X j ; :::; X h .
La variable complexe X est, par exemple, le niveau gnral des prix, et
X 1 ; X 2 ; :::; X j ; :::; X h reprsentent les prix des dirents produits ou services
oerts au public . Les indices lmentaires des constituants X j , j = 1; 2; :::; h,
Xj
j
de X sont calculs par la formule It=0
= Xtj , j = 1; 2; :::; h. Mais cette suite
0
dindices napporte aucune information sur lvolution du niveau gnral des
prix. Il serait judicieux de les rsumer ou de les synthtiser par un seul indice
quon appellera indice synthtique de la grandeur complexe X.

Les direntes formules dindices synthtiques


Trois formules dindices synthtiques sont utilises en pratique. Ceux sont
les formules de Laspeyres, de Paasche et de Fisher.
92

Soit aj0 le poids ou limportance relative du constituants n j dans la grandeur


complexe X la date 0, et par ajt son poids la date t. Si X reprsente le
niveau gnral des prix, ajt peut reprsenter, par exemple, la proportion des
dpenses dans lhabillement ou dans lachat des viandes, par rapport la
dpense totale des mnages la date t. Ces importances relatives ou poids
sont soumis la contrainte suivante :
X j X j
at = 1
a0 =
j

Remarque 177 Les coe cients aj0 et ajt sont appels coe cients de pondration.

Indice de Laspeyres
Denition 178 Lindice de Laspeyres, not L, est la moyenne arithmtique
des indices lmentaires pondrs par les coe cients aj0 la date de rfrence :
X j
X j Xtj
Lt=0 =
a0 It=0 =
a0 j
X0
j
j

Indice de Paasche
Denition 179 Lindice de Paasche, not P, est la moyenne harmonique
des indices lmentaires pondrs par les coe cients ajt la date courante :
Pt=0 = P

1
ajt

j It=0

Indice de Fisher

=P

1
Xj

ajt X0j
t

Denition 180 Lindice de Fisher, not F, est la moyenne gomtrique


simple des indices de Laspeyres et de Paasche :
p
Ft=0 = Lt=0 Pt=0

6.3.3

Les dirents types dindices statistiques

Dsignons par pj0 , pjt et q0j , qtj respectivement les prix et les quantits
(volumes) correspondant au constituant j entrant dans le calcul dindice.
93

Indice de valeur
Denition 181 La valeur, pour un constituant j, est le produit du prix par
la quantit correspondante.
Denition 182 Lindice de valeur, not V, est le rapport de la somme des
valeurs relatives la priode courante, la somme des valeurs relatives la
priode de base :
P j j
j p 0 qt
Vt=0 = P j j
j p 0 q0
Indice des prix

Lindice des prix comme lindice de quantit peut tre calcul selon lune
des formules de Laspeyres , de Paasche ou de Fisher .
Denition 183 Lindice de Laspeyres des prix est donn par la formule suivante :
P j j pjt
j q0 p 0
pj
Lt=0 (p) = P j j 0
j q0 p 0

Remarque 184 Les coe cients de pondration sont constitus par la part
de la dpense totale des familles consacre la consommation des dirents
constituants pendant la priode de base :
q j pj
aj0 = P 0 j0 j
j q0 p 0

Dans le cas dun indice de prix de dtail, les coe cients de pondration sont
appels coe cients budgtaires.
Lindice de Laspeyres des prix peut aussi tre dni tel que :
Lt=0 (p) =

Depense totale de la periode de base evaluee au prix courant


Depense totale de la periode de base

Denition 185 Lindice de Paasche des prix est donn par la formule suivante :
P j j
j qt p t
Pt=0 (p) = P
pj0
j j
j qt p t
pj
t

94

Remarque 186 Les coe cients de pondration sont constitus par la part
de la dpense totale des familles consacre la consommation des dirents
constituants pendant la priode courante :
ajt

qtj pjt
=P j j
j qt p t

Lindice de Paasche des prix peut aussi tre dni tel que :
Pt=0 (p) =

Depense totale de la periode courante


Depense totale de la periode courante evaluee au prix de l0 annee de base

Indice de quantit ou de volume


Denition 187 Lindice de Laspeyres de volume est dni tel que :
P j j
j p 0 qt
Lt=0 (q) = P j j
j p 0 q0

Denition 188 Lindice de Paasche de volume est dni tel que :


P j j
j p t qt
Pt=0 (q) = P j j
j p t q0

Proprits

Les indice de Laspeyres et de Paasche nont pas les proprits de circularit et de rversibilit. Lindice de Fisher na pas la proprit de circularit,
mais il est rversible :
F0=t =

p
L0=t

P0=t = p

1
Lt=0

Pt=0

1
Ft=0

Les trois types dindices sont ordonns de la faon suivante :


Lt=0

Ft=0

95

Pt=0

Bibliographie
[1] Calot, G. (1969) Cours de statistique descriptive, Dunod.
[2] Delmas, B. (2009) Statistique descriptive pour lconomie et la gestion,
Presses universitaires du Septentrion, 978-2-7574-0074-6
[3] Delmas, J. F. (2010) Introduction au calcul des probabilits et la
statistique, ENSTA, 978-2-7225-0922-1
[4] Duthil, G. (1998) Initiation la statistique descriptive , Ellipse Marketing
[5] Grais, B. (2003) Statistique descriptive : Techniques statistiques , Dunod.
[6] Lejeune, M. (2010) Statistique : la thorie et ses applications, Springer,
978-2-8178-0156-8
[7] Olivier, E. (2008) Lessentiel de statistique descriptive, Gualino, 978-2297-01103-7
[8] Mazerolle, F. (2005) Statistique descriptive : sries statistiques une et
deux variables, sries chronologiques, indices, Gualino, 2-84200-891-X
[9] Moore, D. and McCABE G. P. (2002) Introduction to the Practice of
Statistics, 4me dition, W.H. Freeman & Company.
[10] Morgenthaler, S. (2007) Introduction la statistique, Presses polytechniques et universitaires romandes, 978-2-88074-734-3
[11] Spiegel, M. et Stephens, L. Statistique : Cours et problmes, 3me dition, Srie Schaum/McGraw Hill
[12] Tassi, P. (2004) Mthodes statistiques, Economica, 2-7178-4859-2

96

Vous aimerez peut-être aussi