Vous êtes sur la page 1sur 384

Introduction

la mthode
statistique
Manuel et exercices corrigs
Bernard Goldfarb
Catherine Pardoux

6e dition

P001-002R-9782100549412.indd 1 24/11/10 11:59


Dunod, Paris, 2011
ISBN 978-2-10-055892-6

P001-002R-9782100549412.indd 2 24/11/10 11:59


P003-008R-9782100549412.fm Page III Jeudi, 18. novembre 2010 11:59 11

Table des matires


Avant-propos IX

1. Distributions statistiques un caractre 1


I. Dfinitions 1
A. Population, individu, chantillon 1
B. Variables 2
II. Reprsentations graphiques 3
A. Distributions statistiqueset reprsentations graphiques 4
B. Le diagramme branche et feuille 10
III. Les indicateurs statistiques 13
A. Conditions de Yule 13
B. Les indicateurs de tendance centrale et de position 14
C. Les indicateurs de dispersion 23
D. Les caractristiques de forme 26
E. Les caractristiques de dispersion relative 29
IV. La bote de distribution 33
A. Rsum dune distribution par des quantiles 33
B. Reprsentation dune bote de distribution 34
C. Interprtation dune bote de distribution 36
Dunod. La photocopie non autorise est un dlit.

V. Bilan 37
Testez-vous 39
Exercices 41

2. Indices statistiques 47
I. Indices lmentaires 47
A. Dfinition 47
B. Proprits 48

TABLE DES MATIRES III


P003-008R-9782100549412.fm Page IV Jeudi, 18. novembre 2010 11:59 11

II. Indices synthtiques 49


A. Indices synthtiques de Laspeyres et Paasche :
premires formules 50
B. Formules dveloppes 51
C. Comparaison des indices de Laspeyres et de Paasche 52
D. Indice de Fisher 54
E. Proprits des indices de Fisher, Laspeyres et Paasche 55
F. Utilisation de ces trois indices 56
III. Indices-chanes 56
A. Raccord dindices 56
B. Les indices-chanes 57
C. Indices publis par lINSEE 58
IV. Traitement statistique des indices 58
A. chelle logarithmique 59
B. Proprits dun graphique ordonne logarithmique 60
V. Bilan 61
Testez-vous 62
Exercices 63

3. Distributions statistiques deux caractres 67


I. Distributions statistiques deux variables 67
A. Distribution conjointe 67
B. Distributions marginales 69
C. Distributions conditionnelles 69
D. Dpendance et indpendance statistique 71
II. Deux variables quantitatives 72
A. Caractristiques dun couple
de deux variables quantitatives 73
B. Ajustement linaire dun nuage de points 74
C. Interprtation du coefficient de corrlation linaire 76
D. Comparaison des deux droites des moindres carrs 81
E. Le coefficient r et la qualit de lajustement linaire 82
III. Une variable qualitative et une variable quantitative 86
A. Mesure de la liaison par le rapport de corrlation 87
B. Comparaison du coefficient de corrlation linaire
et des rapports de corrlation 89

IV INTRODUCTION LA MTHODE STATISTIQUE


P003-008R-9782100549412.fm Page V Jeudi, 18. novembre 2010 11:59 11

IV. Deux variables qualitatives 90


V. Bilan 92
Testez-vous 94
Exercices 97

4. Sries chronologiques et prvision 103


I. lments constitutifs dune srie chronologique 103
A. La tendance long terme 103
B. Le mouvement saisonnier 104
C. Les irrgularits 104
D. Les perturbations 104
II. Les modles de composition dune srie chronologique 105
III. Analyse de la tendance 108
A. Ajustement de la tendance par une fonction analytique 108
B. Dfinition dune moyenne mobile 109
C. Dtermination de la tendance par la mthode
des moyennes mobiles 110
D. Inconvnients de la mthode des moyennes mobiles 112
IV. Correction des variations saisonnires 113
A. Modle additif 113
B. Modle multiplicatif 114
C. Autres approches 115
V. Un exemple de dcomposition dune srie chronologique 115
A. Schma additif 116
B. Schma multiplicatif 118
VI. Les mthodes de lissage exponentiel 120
Dunod. La photocopie non autorise est un dlit.

A. Le lissage exponentiel simple 120


B. Le lissage exponentiel double 125
Testez-vous 127
Exercices 128

5. Modle probabiliste et variable alatoire 131


I. lments de calcul des probabilits 133
A. Notion de probabilit 133
B. Probabilits conditionnelles 136

TABLE DES MATIRES V


P003-008R-9782100549412.fm Page VI Jeudi, 18. novembre 2010 11:59 11

II. Variables alatoires une dimension 142


A. Dfinitions 142
B. Loi de probabilit dune variable alatoire 144
C. Loi dune fonction de variable alatoire 149
III. Couple de variables alatoires 151
A. Fonction de rpartition dun couple alatoire 151
B. Loi dun couple alatoire discret 151
C. Loi dun couple de variables alatoires continues 154
IV. Indicateurs des variables alatoires 155
A. Mode 156
B. Esprance mathmatique 156
C. Variance 160
D. Covariance de deux variables alatoires,
coefficient de corrlation linaire 162
E. Moment, fonction gnratrice des moments 163
F. Indicateurs de forme 164
G. Quantiles 165
V. Convergence des variables alatoires relles 166
Testez-vous 172
Exercices 176

6. Les principaux modles statistiques discrets 179


I. Les modles lmentaires 181
A. Le schma de Bernoulli 181
B. La loi uniforme discrte 183
II. Les schmas de Bernoulli itratifs 184
A. Le schma binomial 185
B. Le schma hypergomtrique 191
C. La loi gomtrique et la loi de Pascal 193
III. La loi de Poisson 198
A. Dfinitions et proprits 199
B. Abord statistique 203
C. Abord probabiliste 203
Exercices 207

VI INTRODUCTION LA MTHODE STATISTIQUE


P003-008R-9782100549412.fm Page VII Jeudi, 18. novembre 2010 11:59 11

7. Les principaux modles statistiques continus 211


I. Modles continus simples 211
A. La loi uniforme continue 211
B. La loi exponentielle 214
II. La loi normale ou loi de Laplace-Gauss 219
A. La loi normale centre rduite 219
B. La loi normale (m, ) 220
C. Usage des tables 226
D. Abord statistique de la loi normale 233
E. Abord probabiliste de la loi normale 235
F. Correction de continuit 239
III. Les lois drives de la loi normale 240
A. La loi du khi-deux 240
B. La loi de Student 247
C. La loi de Fisher-Snedecor 252
IV. Quelques autres modles continus courants 256
A. La loi log-normale 256
B. La loi de Pareto 260
C. La loi de Weibull 265
D. La loi logistique 268
V. Bilan 271
Testez-vous 273
Exercices 276

Rponses aux questionnaires Testez-vous 283


Dunod. La photocopie non autorise est un dlit.

Corrigs des exercices 289

Annexes 335
I. Formulaire lmentaire de combinatoire 335
A. Ensemble des parties dun ensemble 335
B. Arrangements avec rptition 335
C. Permutations 336
D. Arrangements sans rptition 336
E. Combinaisons sans rptition 337
F. Coefficients multinomiaux 339

TABLE DES MATIRES VII


P003-008R-9782100549412.fm Page VIII Jeudi, 18. novembre 2010 11:59 11

II. Principaux modles de probabilits : mthodes de calculs 339


A. Loi binomiale 339
B. Loi de Poisson 340
C. Loi de Gauss centre rduite 340
D. Loi du khi-deux 341
E. Loi de Student 341
F. Loi de Fisher-Snedecor 342
III. Introduction la simulation des lois de probabilit 343
A. La place des mthodes de simulation 343
B. Les principes de la simulation sur tableur 343
C. Simulation de lois discrtes 344
D. Simulations de lois continues 344
E. Quelques exemples et applications 346
IV. Tables 351

Bibliographie 361

Lexique anglais/franais 363

Lexique franais/anglais 367

Index 371

VIII INTRODUCTION LA MTHODE STATISTIQUE


P009-010R-9782100549412.fm Page IX Jeudi, 18. novembre 2010 12:00 12

Avant-propos
Tout le monde sait et dit que celui qui observe sans ide, observe en vain.
lments de philosophie, Alain (1868 1951)

Le recueil, le traitement et lanalyse de linformation sont au cur de tous


les processus de gestion et de dcision. Les mthodes de description, de pr-
vision et de dcision se sont considrablement enrichies et dveloppes, ce
qui place la statistique applique1 au carrefour de lobservation et de la mod-
lisation.
Lutilisation des mthodes statistiques sest gnralise avec le dveloppe-
ment et linterprtation de logiciels et progiciels (gnralistes ou spcialiss),
assurant la gestion des donnes, les calculs, les reprsentations graphiques
Plusieurs gnrations de logiciels statistiques 2 se sont succd en modi-
fiant considrablement, dabord, lanalyse des donnes statistiques et main-
tenant, lenseignement de la statistique. Sous peine dtre noy, non plus
dans les calculs mais dans les rsultats, lutilisateur doit disposer dides pr-
cises sur les outils, leurs fonctions et leurs champs dapplication.
Nous avons ainsi voulu guider les futurs consommateurs et utilisateurs
de donnes vers les descriptions statistiques majeures et les reprsentations
courantes des phnomnes rencontrs dans tous les domaines de lactivit
humaine.
La visualisation par tableaux et graphiques 3 est une clef indispensable
pour traiter et comprendre efficacement les multiples ensembles de donnes
statistiques ; lusage gnralis qui en est fait pour tous les publics et par de
nombreux mdias confirme son importance.
Dunod. La photocopie non autorise est un dlit.

Dans cette sixime dition, nous avons maintenu toute notre attention sur
les visualisations, ainsi que sur la pratique et lutilisation du tableur Excel
largement rpandu.

1. laquelle les programmes, tant de lenseignement secondaire que de lenseignement sup-


rieur, accordent une place de plus en plus importante.
2. Sans compter les versions volues des langages de programmation scientifique qui mettent
lapplication de traitements trs sophistiqus la porte du plus grand nombre.
3. La reprsentation visuelle est remarquablement mise en valeur dans le trs bel ouvrage de
Edward R. Tufte (1991) : The Visual Display of Quantitative Information , Graphics Press,
Cheshire, Connecticut

AVANT-PROPOS IX
P009-010R-9782100549412.fm Page X Jeudi, 18. novembre 2010 12:00 12

La thorie reste volontairement limite pour donner toute son importance


lapproche interprtative des donnes. Le lecteur, selon ses connaissances
pralables et son intrt pour la formalisation, pourra en premire lecture pas-
ser outre la prsentation de certains supports thoriques. Ce livre nest quune
introduction la mthode statistique, et nous donnons quelques rfrences
douvrages pour largir ides et connaissances.
Dans cette sixime dition, nous avons remis jour, partir des recueils
les plus rcents, les donnes de nombreux exemples et des exercices (com-
plts et enrichis). Nous avons galement inclus une trs brve introduction
illustre la pratique et lusage de la simulation, outil de plus en plus incon-
tournable dans des secteurs tels que la logistique, la stratgie, ou encore
lanalyse financire
Issu de nombreuses expriences denseignement en formation initiale
comme en formation continue pour des tudiants en sciences conomiques,
en sciences de gestion et en informatique de gestion, ce livre tient compte de
leurs besoins et des dernires volutions. Nous pensons quil correspond bien
aux exigences actuelles. Nous remercions par avance les lectrices et les lec-
teurs qui voudront bien nous faire part de leurs remarques ou suggestions.
Bernard Goldfarb
Catherine Pardoux

X INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 1 Mercredi, 24. novembre 2010 9:46 09

1. D istributions
statistiques
un caractre
Le savant doit ordonner ; on fait la science avec des faits
comme une maison avec des pierres ;
mais une accumulation de faits nest pas plus une science
quun tas de pierres nest une maison.
La Science et lhypothse, Henri Poincar (1854-1912)

L
a statistique descriptive est un ensemble de mthodes permettant
de dcrire, prsenter, rsumer des donnes souvent trs nom-
breuses. Ces mthodes peuvent tre numriques (tris, laboration
de tableaux, calcul de moyennes) et/ou mener des reprsentations
graphiques.

I. Dfinitions
A. Population, individu, chantillon
Dunod. La photocopie non autorise est un dlit.

Une population est lensemble des lments auxquels se rapportent les don-
nes tudies. En statistique, le terme population sapplique des ensem-
bles de toute nature : tudiants dune acadmie, production dune usine,
poissons dune rivire, entreprises dun secteur donn
Des enqutes de lOffice statistique des communauts europennes don-
nent la dure hebdomadaire moyenne du travail des salaris temps com-
plet pour 15 pays membres. Les rsultats de ces enqutes ne donnent pas
dinformation atomise un niveau plus bas que le pays ; la population
de rfrence nest donc pas ici lensemble (plusieurs millions) de tous les
salaris des 15 pays. Ltude de ces 15 observations concerne un ensemble

DISTRIBUTIONS STATISTIQUES UN CARACTRE 1


P001-046-9782100549412.fm Page 2 Mercredi, 24. novembre 2010 9:46 09

de 15 units (statistiques), les 15 pays slectionns qui constituent la popu-


lation de ltude.
Dans une population donne, chaque lment est appel individu ou
unit statistique .
La collecte dinformations sur une population peut tre effectue sur la
totalit des individus ; on parle alors denqutes exhaustives. Lorsque la
taille de la population tudie est leve, de telles enqutes sont fort co-
teuses ou impossibles, et le cas chant, leurs rsultats souvent trs longs
rassembler peuvent tre dpasss avant mme la fin de lenqute. Cest
la raison pour laquelle on a souvent recours aux enqutes par sondage qui
portent sur une partie de la population appele chantillon. Les observa-
tions obtenues sur une population ou sur un chantillon constituent un
ensemble de donnes auxquelles sappliquent les mthodes de la statistique
descriptive dont le but est de dcrire le plus compltement et le plus sim-
plement lensemble des observations quelles soient relatives toute la
population ou seulement un sous-ensemble.

B. Variables
Chaque individu dune population peut tre dcrit selon une ou plusieurs
variables qui peuvent tre des caractristiques qualitatives ou prendre des
valeurs numriques.
Une variable est dite qualitative si ses diffrentes ralisations (modalits)
ne sont pas numriques. Ainsi : le sexe, la situation matrimoniale, la catgorie
socioprofessionnelle sont des variables qualitatives. On peut toujours rendre
numrique une telle variable en associant un nombre chaque modalit ; on
dit alors que les modalits sont codes. Bien entendu, les valeurs numriques
nont dans ce cas aucune signification particulire, et effectuer des oprations
algbriques sur ces valeurs numriques na pas de sens.
Une variable est dite quantitative lorsquelle est intrinsquement numri-
que : effectuer des oprations algbriques (addition, multiplication) sur une
telle variable a alors un sens. Une variable quantitative peut tre une variable
statistique discrte ou continue.
Les variables statistiques discrtes sont des variables qui ne peuvent pren-
dre que des valeurs isoles, discrtes. Le nombre denfants dune famille, le
nombre de ptales dune fleur, le nombre de buts marqus lors dune rencon-
tre de football sont des variables quantitatives discrtes. Le plus frquem-
ment, les valeurs possibles sont des nombres entiers.
Les variables statistiques continues peuvent prendre toutes les valeurs
numriques possibles dun ensemble inclus dans  : le revenu, la taille, le
taux de natalit sont des variables continues.

2 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 3 Mercredi, 24. novembre 2010 9:46 09

La distinction entre variables quantitatives discrtes et continues peut


paratre factice, car toute mesure est discrte en raison dune prcision tou-
jours limite ; et inversement, lorsquune variable discrte peut prendre un
grand nombre de valeurs et que la taille de la population (ou de lchantillon)
tudie est leve, on regroupera des valeurs voisines et la variable sera, par
extension, traite comme une variable continue. En pratique, lorsque les
valeurs dune variable sont regroupes en k classes, la variable est traite
comme une variable quantitative continue, mais elle peut aussi tre envisage
comme une variable qualitative k modalits.
Les donnes dont on dispose sont les modalits ou valeurs prises par
plusieurs variables qualitatives ou quantitatives sur les individus dune
population ou dun chantillon ; pour une population dentreprises, on peut
disposer, par exemple, de donnes sur le chiffre daffaire, le bnfice net,
le nombre demploys, la masse salariale annuelle, le secteur dactivit
principale
On peut, dans un premier temps, dcrire chaque variable sparment, puis
ensuite, tudier les relations ou liaisons existantes entre elles. Ainsi, dans ce
livre, nous envisagerons dabord les populations statistiques dcrites selon
une seule variable, puis selon deux variables. Ltude des populations carac-
trises par plus de deux variables nest pas aborde dans cet ouvrage.

II. Reprsentations graphiques


Deux mthodes de reprsentation des donnes vont tre exposes. On com-
mencera par celles adaptes aux donnes nombreuses et/ou anonymes, cest-
-dire pour lesquelles lidentit des individus na pas t releve ou ne pr-
sente pas dintrt tre conserve pour linterprtation. Ceci nest pas le cas
lorsque les individus sont peu nombreux (rgions, pays), o on dfinira un
Dunod. La photocopie non autorise est un dlit.

nouveau mode de reprsentation graphique d J.W. Tukey ( II.B.). Ltude


dune population selon une variable sera restreinte au cas des variables quan-
titatives, car la description dune population selon une variable qualitative est
totalement rsume dans un tableau de pourcentages ou dans un diagramme
circulaire, appel aussi diagramme en camembert ( cf. figure 1.1).

DISTRIBUTIONS STATISTIQUES UN CARACTRE 3


P001-046-9782100549412.fm Page 4 Mercredi, 24. novembre 2010 12:55 12

Prune
Pomme de table

10 % Pche et nectarine
24 %
10 %

Autres fruits
10 %
12 % Noix
10 %
8,8 %
5%
8% Olives
5% 6%
Poire de table
Abricot
Pomme cidre
Cerise

Extrait de Agreste, GraphAgri 2006,


Ministre de lAgriculture et de la Pche.

Figure 1.1 Surface du verger franais en 2005

A. Distributions statistiques
et reprsentations graphiques
Considrons une variable observe sur une population  de n individus. Si
la variable X prend k valeurs ou ensembles de valeurs (appels dans ce qui
suit, modalits), le premier traitement des donnes brutes consiste compter
le nombre ni dindividus qui prsentent la ie modalit ( i = 1, 2 , , k ).

1) Variables statistiques discrtes


Les rsultats concernant les observations de la variable X dont lensemble des
valeurs est { xi , i = 1, , k }, sont prsents dans le tableau des effectifs ( xi , ni)
ou dans le tableau des frquences ( xi , fi) avec fi = ni /n (on utilise souvent le
pourcentage 100 fi). Il est prfrable de calculer les frquences partir des
effectifs cumuls ( II.A.3) afin que des erreurs successives darrondis ne
donnent pas une somme totale de frquences diffrente de 1.

4 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 5 Mercredi, 24. novembre 2010 9:46 09

Tableau des effectifs Tableau des frquences

Modalit Effectif Modalit Frquence


x1 n1 x1 f1 = n1/n
. . . .
. . . .
. . . .
xi ni xi fi = ni/n
. . . .
. . . .
. . . .
xk nk xk fk = nk/n
k k

i=1
ni = n
f i = 1
i=1

On prsente logiquement les modalits numriques en ordre croissant. On


peut associer ces tableaux une reprsentation graphique appele
diagramme en btons .
Un diagramme en btons (cf. figure 1.2) est construit dans un systme
daxes rectangulaires ; les valeurs de la variable statistique X sont portes en
abscisse ; partir de chaque valeur xi , on trace un segment de droite vertical
et dont la hauteur est proportionnelle leffectif correspondant. On peut rete-
nir indiffremment une chelle qui explicite les effectifs ni , ou une chelle
qui explicite les frquences fi . Pour les distributions du tableau 1.1, on pour-
rait reprsenter sur le mme graphique les diagrammes en btons de plusieurs
pays avec des couleurs diffrentes, chaque couleur correspondant un pays,
ce qui permettrait de comparer les distributions du nombre de personnes par
mnage.
Tableau 1.1 Mnages suivant le nombre de personnes du mnage
dans quelques pays en 1995 (%)

Allemagne Espagne Finlande France Grce Irlande Italie Pays-Bas Portugal

Mnages de :
1 personne 34,4 12,7 37,4 29,2 20,7 22,8 22,7 30,6 13,7
Dunod. La photocopie non autorise est un dlit.

2 personnes 32,3 24,5 31,0 31,8 28,9 23,1 23,1 34,0 26,4
3 personnes 16,0 21,8 14,4 16,8 19,8 15,6 15,6 13,4 24,7
4 personnes 12,6 24,0 11,9 14,2 21,7 17,1 17,1 15,9 22,8
5 personnes et plus 4,7 17,0 5,3 8,0 8,9 21,4 21,4 6,2 12,4

Ensemble (en milliers) 34 413 12 112 2 222 23 126 3 756 1 146 1 146 6 425 3 275

Source : Tableaux de lconomie Franaise 1999-2000, INSEE.

DISTRIBUTIONS STATISTIQUES UN CARACTRE 5


P001-046-9782100549412.fm Page 6 Mercredi, 24. novembre 2010 9:46 09

Nombre de f (%)
i
personnes 30 %

1 29,2
2 31,8 20 %

3 16,8
10 %
4 14,2
5 ou plus 8,0
100 % 1 2 3 4 5 ou +

Figure 1.2 Diagramme en btons Nombre de personnes par mnage en France en 1995

2) Variables statistiques continues


Linfinit des valeurs observables ne rend pas possible la gnralisation du
diagramme en btons. Le domaine de variation dune variable statistique
continue X est partag en k parties . Lintervalle [ xi1 , xi [ ferm gauche,
ouvert droite, est appel ie classe (i = 1,2, ,k) ; son amplitude est gale :
ai = xi xi1
Il arrive que lamplitude des classes extrmes soit indtermine : la pre-
mire classe tant dfinie par moins de , et la dernire par plus de
(cf. tableau 1.2).
Le choix des extrmits des classes se fait partir des donnes brutes ; le
nombre k de classes doit tre modr (usuellement entre 4 et 10). Le dcou-
page en classes est assez souvent choisi tel que lamplitude des classes soit
constante, ou tel que les effectifs des classes soient constants (par exemple,
10 % de la population dans chaque classe, cf. tableau 1.6).
Le classement dune srie statistique correspond une perte dinformation
par rapport aux donnes initiales puisque seuls les effectifs des classes sont
retenus. Le travail sur une telle srie impose alors lhypothse que les don-
nes sont rparties uniformment lintrieur de chacune des classes. On
parle aussi d quirpartition des individus ou encore d homognit dans
chacune des classes. Chaque partie de la classe correspond alors un effectif
proportionnel sa longueur. Lide est, bien sr, que chaque classe repr-
sente une entit qui doit se distinguer par rapport aux autres classes. Comme
prcdemment, les rsultats sont prsents dans un tableau deffectifs ou de
frquences. On associe un tel tableau un histogramme qui est une reprsen-
tation graphique trs rpandue. Lhistogramme est constitu de la juxtaposi-
tion de rectangles (pour respecter lhypothse dquirpartition) dont les
bases reprsentent les diffrentes classes et dont les surfaces sont proportion-
nelles aux effectifs des classes (cf. figure 1.3).

6 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 7 Mercredi, 24. novembre 2010 9:46 09

On verra par la suite quune difficult du travail avec des sries classes
est le choix des limites pour les classes extrmes, indispensable aussi pour le
trac de lhistogramme.
la ie classe, correspond un rectangle dont la base est lintervalle [ xi 1, x i [
et dont la surface est proportionnelle la frquence fi (ou leffectif ni). Si
les classes ont toutes la mme amplitude, les hauteurs des rectangles sont
proportionnelles aux frquences. Dans le cas o les classes sont damplitudes
ingales, la hauteur du rectangle correspondant la ie classe damplitude ai
sera hi = fi /ai. La surface du rectangle reprsentant la ie classe sera ainsi gale
fi
Pour une srie dobservations relatives une variable statistique X dis-
crte ou continue classe, la donne des modalits et de leurs frquences est
appele distribution statistique de la variable X.

Tableau 1.2 Chmeurs BIT selon le sexe et lanciennet de chmage en septembre 2006

Distribution en milliers Distribution en pourcentage


Anciennet dinscription Hommes Femmes Hommes Femmes
Moins dun mois 180,3 181,0 16,5 16,8
Dun moins de trois mois 203,9 204,9 18,6 19,0
De trois moins de six mois 169,3 163,1 15,5 15,1
De six mois moins dun an 202,1 191,1 18,5 17,7
Dun moins de deux ans 197,3 199,3 18,0 18,5
De deux moins de trois ans 74,5 75,4 6,8 7,0
Trois ans ou plus 67,1 62,9 6,1 5,8
Ensemble 1 094,5 1 077,7 100,1 100,1
Anciennet moyenne en jours 341,5 334,5
Source : Bulletin Mensuel des Statistiques du Travail, www.travail.gouv.fr, octobre 2006.
Dunod. La photocopie non autorise est un dlit.

DISTRIBUTIONS STATISTIQUES UN CARACTRE 7


P001-046-9782100549412.fm Page 8 Mercredi, 24. novembre 2010 9:46 09

fi
ai

Mois
01 3 6 12 24 36 60

Figure 1.3 Histogramme de la distribution des chmeurs Femmes selon lanciennet


(voir tableau 1.2)

La classe Trois ans ou plus est suppose borne suprieurement par


5 ans (60 mois).

3) Frquences cumules et courbe cumulative

a) Tableau des frquences cumules


Les tableaux de frquences (ou deffectifs) qui viennent dtre dfinis peu-
vent tre modifis de facon prsenter un rsum des donnes sous une
forme diffrente.
On appelle effectif cumul de la ie classe, le nombre dindividus Ni pour
lesquels la variable prend une valeur infrieure xi :

Ni = n j pour i = 1, 2, , k
ji

On dfinit de mme Fi , la frquence cumule de la ie classe : Fi = Ni /n

8 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 9 Mercredi, 24. novembre 2010 9:46 09

Les tableaux deffectifs cumuls ou de frquences cumules se dduisent


des tableaux deffectifs ou de frquences (non cumuls) en substituant aux
effectifs ou frquences non cumuls les effectifs ou frquences cumuls. Les
deux types de tableaux sont donc quivalents (cf. figures 1.2 et 1.4).

b) Fonction cumulative et courbe cumulative


La courbe cumulative ou courbe des frquences cumules est la reprsentation
graphique des frquences cumules. Plus prcisment, la courbe cumulative
est la reprsentation graphique de la proportion F(t) des individus de la popu-
lation dont le caractre prend une valeur infrieure t. Cette fonction, appele
fonction cumulative ou fonction de rpartition , est :
1. dfinie pour tout t 
2. croissante (mais non strictement croissante)
3. nulle pour t infrieur min xi
1in
4. gale 1 pour t au moins gal max xi
1in

Pour une variable statistique discrte, cette fonction est une fonction en
escalier, prsentant en chacune des valeurs possibles xi, un saut gal la fr-
quence correspondante fi (cf. figure 1.4).
Dans le cas dune variable statistique continue, la fonction cumulative
nest connue que pour les valeurs de X gales aux extrmits des classes.
Lhypothse dquirpartition ( II.A.2) implique que la fonction F est
linaire entre ces valeurs ( cf. figure 1.5). Cette fonction est donc continue et
linaire par morceaux. Ici encore, il est ncessaire de choisir des limites pour
les classes extrmes.

t F(t) (%)
100 %
<1 0
[1 ; 2[ 29,2
Dunod. La photocopie non autorise est un dlit.

[2 ; 3[ 61,0
[3 ; 4[ 77,8
[4 ; 5[ 92,0
5 100
1 2 3 4 5 et +
Figure 1.4 Graphe des frquences cumules de la distribution reprsente la figure 1.2

Ces frquences cumules sont des frquences cumules ascendantes, car


elles ont t obtenues en calculant les frquences Fi dindividus pour lesquel-
les le caractre tudi X est au plus gal xi ; on peut aussi dfinir les fr-

DISTRIBUTIONS STATISTIQUES UN CARACTRE 9


P001-046-9782100549412.fm Page 10 Mercredi, 24. novembre 2010 9:46 09

t F(t) (%)
Fi
0 0
1 16,8 100
3 35,8
6 50,9
12 68,7
24 87,2
36 94,2
0
13 6 12 24 36 60
60 100 Mois

Figure 1.5 Courbe cumulative de la distribution reprsente la figure 1.3

quences cumules descendantes, cest--dire les frquences pour lesquelles


le caractre tudi X est suprieur xi. Quand on ne spcifie pas le type de
frquences cumules, on sous-entend quil sagit des frquences cumules
ascendantes.

B. Le diagramme branche et feuille


Lorsque la taille de la population tudie nest pas trop leve (infrieure
la centaine), il est intressant dutiliser la reprsentation en diagramme
branche et feuille due J. W. Tukey 1. Ce diagramme tient la fois du
tableau et de la reprsentation graphique et donne une vision densemble des
donnes sans perdre linformation numrique valeur par valeur.

1) Profondeur dune observation


Selon quon range les valeurs observes de la variable statistique X de la plus
faible la plus leve ou de la plus leve la plus faible, on associe cha-
que observation xi deux rangs, croissant et dcroissant. On dit alors que la
distribution est ordonne.
On appelle profondeur de xi le nombre gal au plus petit des deux rangs .
Les dures hebdomadaires du travail des salaris temps complet dans les
pays de lUnion europenne ( cf. tableau 1.3) peuvent tre ordonnes, et on
en dduit la profondeur de chaque valeur de chacune des sries.

1. J. W. Tukey, Exploratory Data Analysis (EDA), Addison-Wesley, 1977.

10 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 11 Mercredi, 24. novembre 2010 9:46 09

Tableau 1.3 Dure hebdomadaire du travail des salaris temps complet


dans lUnion europenne (heures)

1990 1995 2000

Allemagne 39,9 39,7 40,1


Autriche 40,1 39,3 40,1
Belgique 38 38,4 38,5
Danemark 39 39 39,3
Espagne 40,7 40,7 40,6
Finlande 38,4 38,6 39,3
France 39,6 39,9 38,9
Grce 40,2 40,3 40,9
Irlande 40,4 40,2 39,9
Italie 38,6 38,4 38,6
Luxembourg 39,9 39,5 39,8
Pays-Bas 39 39,5 39
Portugal 41,9 41,2 40,3
Royaume-Uni 43,7 43,9 43,6
Sude 40,7 40 40

Source : Tableaux de lconomie Franaise, INSEE.

Le nombre de pays tant impair et gal 15, il y a deux valeurs de pro-


fondeur 1, 2, 3, 4, 5, 6, 7 et une seule valeur de profondeur 8 (cf. tableau 1.4).

Tableau 1.4 Pays ordonns selon la dure hebdomadaire du travail des salaris
temps complet en 2000
Rang Rang
Profondeur Dure (heures) Pays
croissant dcroissant
1 15 1 38,5 Belgique
2 14 2 38,6 Italie
3 13 3 38,9 France
Dunod. La photocopie non autorise est un dlit.

4 12 4 39,0 Pays-Bas
5 11 5 39,3 Danemark
6 10 6 39,3 Finlande
7 9 7 39,8 Luxembourg
8 8 8 39,9 Irlande
9 7 7 40,0 Sude
10 6 6 40,1 Allemagne
11 5 5 40,1 Autriche
12 4 4 40,3 Portugal
13 3 3 40,6 Espagne
14 2 2 40,9 Grce
15 1 1 43,6 Royaume-Uni

DISTRIBUTIONS STATISTIQUES UN CARACTRE 11


P001-046-9782100549412.fm Page 12 Mercredi, 24. novembre 2010 9:46 09

2) La reprsentation en diagramme branche et feuille


Son principe consiste distinguer deux parties pour tout nombre : les chiffres de
plus faible poids , la feuille, et les chiffres de plus haut poids , la branche.
La figure 1.6 reproduit les diagrammes Branche et feuille donns par
le logiciel SPSS pour les sries du tableau 1.3.

1990 1995 2000


Frequency Stem & Leaf Frequency Stem & Leaf Frequency Stem & Leaf

3,00 38 . 046 3,00 38 . 446 0,00 38 .


5,00 39 . 00699 6,00 39 . 035579 3,00 38 . 569
5,00 40 . 12477 4,00 40 . 0237 3,00 39 . 033
1,00 41 . 9 1,00 41 . 2 2,00 39 . 89
1,00 Extrmes (>=43,7) 1,00 Extrmes (>=43,9) 4,00 40 . 0113
2,00 40 . 69
1,00 Extrmes (>=43,6)

Stem width : 1,0 Stem width : 1,0 Stem width : 1,0


Each leaf : 1 case(s) Each leaf : 1 case(s) Each leaf : 1 case(s)

Figure 1.6 Branche et feuille (logiciel SPSS) pour les sries du tableau 1.3

Par exemple, pour le diagramme de lanne 1995 de la figure 1.6, en se


rfrant aux valeurs ordonnes :
la valeur 38,4 est reprsente par la branche 38 et la feuille 4 (pour les
deux observations) ;
la valeur 38,6 est reprsente par la branche 38 et la feuille 6.
Ces trois observations conduisent lcriture : 3,00 38. 446
La valeur 43,9 est beaucoup plus leve que les autres ; elle est mention-
ne comme valeur extrme . On verra comment une valeur est ainsi clas-
se ( IV.B). Le nombre de feuilles de chaque branche donnant leffectif, un
histogramme classes gales damplitude 1 donne une reprsentation simi-
laire, mais lavantage du diagramme branche et feuille est de conserver ici
linformation donne par le premier chiffre dcimal, donc de garder linfor-
mation de la rpartition lintrieur des classes.
Les logiciels choisissent, selon la structure des donnes, des amplitudes
gales 1, 0,5 ou 0,25. La plage des valeurs tant plus restreinte en 2000 quen
1990 et 1995, le logiciel SPSS a choisi des amplitudes gales 1 pour les
annes 1990 et 1995, et des amplitudes gales 0,5 pour lanne 2000.
On peut complter ce type de diagramme pour garder lidentit des indivi-
dus en indiquant symtriquement lidentit de chaque feuille ( cf. figure 1.7).
On pourrait aussi reprsenter dos dos les distributions correspondant deux
annes diffrentes pour suivre lvolution de la dure hebdomadaire du travail.

12 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 13 Mercredi, 24. novembre 2010 9:46 09

Frequency Stem & Leaf

3,00 Fin It Bel 38 . 446


6,00 Fr All P.Bas Lux Aut Dk 39 . 035579
4,00 Esp Gr Irl Sud 40 . 0237
1,00 Por 41. 2
1,00 R-U Extremes (> = 43,9)

Stem width : 1,0


Each leaf : 1 case(s)

Figure 1.7 Diagramme Branche et feuille complt par lidentit des pays (1995)

III. Les indicateurs statistiques


Le tableau de distribution dune variable statistique prsente linformation
recueillie sur cette variable. Une reprsentation graphique en fournit un por-
trait pour apprhender plus facilement la globalit de linformation. On peut
dsirer aller plus loin en cherchant caractriser la reprsentation visuelle
par des lments synthtiques sur :
la valeur de la variable situe au centre de la distribution : la ten-
dance centrale et, plus gnralement, un indicateur de position non
ncessairement centrale, lie un rang donn ;
la variation des valeurs : la dispersion ;
la forme de la distribution ;
les aspects particuliers : valeurs extrmes, groupes de valeurs
Ces indicateurs tant exprims dans les units de la variable tudie, on
verra quil peut tre intressant pour comparer plusieurs distributions entre
elles de calculer des caractristiques de dispersion relative.
Dunod. La photocopie non autorise est un dlit.

A. Conditions de Yule
Le statisticien britannique Yule 1 a nonc un certain nombre de proprits
souhaites pour les indicateurs des sries statistiques ; ceux-ci doivent tre
dune part, des rsums maniables et dautre part, les plus exhaustifs pos-
sibles relativement linformation contenue dans les donnes.
1. G. Udny Yule et M. G. Kendall, An Introduction to the Theory of Statistics, Charles Griffin
& Co, 14 e dition, 1950.

DISTRIBUTIONS STATISTIQUES UN CARACTRE 13


P001-046-9782100549412.fm Page 14 Mercredi, 24. novembre 2010 9:46 09

Dans son schma, une caractristique statistique doit tre une valeur-type :
1. dfinie de faon objective et donc indpendante de lobservateur ;
2. dpendante de toutes les observations ;
3. de signification concrte pour tre comprise par des non-spcialistes ;
4. simple calculer ;
5. peu sensible aux fluctuations dchantillonnage ;
6. se prtant aisment aux oprateurs mathmatiques classiques.
En ralit, on ne dispose pas de caractristiques rpondant simultanment
ces six conditions. Le choix dun indicateur sera lobjet dun compromis
guid par la spcificit de ltude en cours.

B. Les indicateurs de tendance centrale et de position


Selon lusage courant, toutes les mesures de tendance centrale mritent le
nom de moyenne . Lorsquon parle de moyenne, on pense la moyenne
arithmtique ; mais il existe dautres types de moyennes, chacune dentre
elles ayant la proprit de conserver une caractristique de lensemble quand
on remplace chaque lment de lensemble par cette valeur unique ; chaque
moyenne na donc dintrt que pour autant que cette proprit soit utile 1.
Les moyennes sont des valeurs abstraites qui, sauf par hasard, ne cor-
respondent aucune ralisation concrte.

1) La moyenne arithmtique
On appelle moyenne arithmtique la somme de toutes les donnes statistiques
divise par le nombre de ces donnes. La moyenne arithmtique conserve la
somme totale des valeurs observes : si on modifie les valeurs de deux obser-
vations dune srie statistique tout en conservant leur somme, la moyenne de
la srie sera inchange.
Soit la srie statistique de donnes brutes : x1 , , x i , , x n , sa moyenne
arithmtique a pour expression :
n
1
x = --- x i
ni = 1
Bien entendu, si une valeur xi de X est observe ni fois, comme
xi + xi + + xi = ni xi , la formule prcdente devient :






ni fois
k k
1
ni = 1
x = --- n i x i = fx
i=1
i i

1. Ch. Antoine, Les moyennes au quotidien , dans Les Moyennes, Que Sais-je, PUF, n 3383,
1998, p. 107.

14 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 15 Mercredi, 24. novembre 2010 9:46 09

n
o k dsigne le nombre de valeurs distinctes de X et fi = ----i
n
Lorsquon a une variable statistique continue, on ne connat pas les valeurs
exactes prises par la variable, mais seulement le nombre dobservations
lintrieur de chaque classe. Pour calculer la moyenne arithmtique dune
telle variable, on ramne chaque observation au centre de sa classe, ceci en
raison de lhypothse dquirpartition lintrieur des classes, et cel revient
considrer la moyenne des individus de la ie classe gale (xi1+ x i)/2.
Dans le cas des classes extrmes non limites, le choix des limites de ces
classes influe videmment sur la valeur de la moyenne arithmtique. Ces
limites devront tre choisies en fonction des connaissances sur les donnes
et en noubliant pas lhypothse de base : lhomognit lintrieur des
classes. Pour une classe extrme dans laquelle on sait quil ny a pas quir-
partition, les observations tant vraisemblablement en majorit regroupes
sur une partie de la classe, il conviendra de choisir la borne extrme :
moins faible que la borne relle (suppose) sil sagit de la premire
classe ;
plus faible que la borne relle (suppose) sil sagit de la dernire classe.
Cest ce qui a t fait pour la srie prsente au tableau 1.2 et la figure 1.3,
lanciennet moyenne du chmage a t considre gale 48 mois pour ceux
dont lanciennet tait au moins gale 36 mois et la borne suprieure de la
dernire classe a t de ce fait fixe 60 mois (lhypothse dquirpartition
amne considrer que la moyenne des observations dune classe est gale au
centre de la classe).

Proprits
1. La moyenne est une caractristique qui satisfait toutes les conditions
de Yule, sauf la conditions 5 : une observation extrme (exceptionnel-
lement leve ou faible) peut avoir une forte incidence sur sa valeur.
Dunod. La photocopie non autorise est un dlit.

2. La somme algbrique des carts des valeurs dune variable statisti-


k
que sa moyenne arithmtique est nulle : f (x x)
i=1
i i = 0

3. Lorsquon fait subir une variable statistique X une transformation


affine, cest--dire un changement dorigine et dunit { Y = aX + x 0}, sa
moyenne arithmtique subit la mme transformation : y = ax + x 0
4. Soit une population  de taille n partage en deux sous-populations
1 de taille n1 et 2 de taille n2.
Soit X, une variable statistique observe sur la population , on peut
exprimer sa moyenne x en fonction de ses moyennes x 1 sur 1 et x 2 sur

DISTRIBUTIONS STATISTIQUES UN CARACTRE 15


P001-046-9782100549412.fm Page 16 Mercredi, 24. novembre 2010 9:46 09

2 en remarquant que la somme totale nx sobtient en additionnant


n 1 x 1 et n 2 x 2 :
1
x = --- ( n 1 x 1 + n 2 x 2 )
n
Ce rsultat se gnralise une partition en k sous-populations (k 2) :
k
1

x = --- n i x i
ni = 1

 Exemple
Lanciennet moyenne dinscription au chmage pour hommes et femmes
runis en septembre 2006 est gale (cf. tableau 1.2 pour les donnes) :
1
x = ------------------ ( 1 094,5 341 + 1 077,7 334 )  338 jours
2 172,2

2) Dautres moyennes
a) La moyenne gomtrique
Cest la moyenne applicable des mesures de grandeurs dont la croissance
est gomtrique ou exponentielle.
La moyenne gomtrique conserve le produit des x i : si on modifie les
valeurs de deux observations tout en conservant leur produit, la moyenne
gomtrique sera inchange.
La moyenne gomtrique G de la srie de valeurs x1 , , x i , , x n sup-
poses toutes positives (strictement), est dfinie ainsi :
n n
1
G= n x
i=1
i
ln ( G ) = --- ln ( x i )
ni = 1
Lorsque la distribution de la variable statistique est donne par les k couples
(xi ,ni), les xi tant tous positifs ; la moyenne gomtrique a pour expression :
k ni k fi k
G= n xi = xi ln ( G ) = f ln ( x )
i=1
i i
i=1 i=1

 Exemple
Supposons que pendant une dcennie, les salaires aient t multiplis
par 2 et que pendant la dcennie sui vante, ils aient t multiplis par 4 ;
le coefcient multiplicateur moyen par dcennie est gal :
2 4 = 8 2,83
La moyenne arithmtique (= 3) nest pas gale au coefcient demand.

16 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 17 Mercredi, 24. novembre 2010 9:46 09

Prenons, par exemple, un salaire de 300 au dbut de la premire dcennie,


il sera de 300 2 4 = 2 400 au bout des vingt ans, ce qui qui vaut
2
300 (2,83) , soit un coefcient multiplicateur moyen de 2,83 par dcennie.
b) La moyenne harmonique
La moyenne harmonique est linverse de la moyenne arithmtique des inverses
des valeurs. Linverse de la moyenne harmonique conserve ainsi la somme des
inverses des x i : si on modifie les valeurs de deux observations tout en conser-
vant la somme de leurs inverses, la moyenne harmonique sera inchange.
1 -
n - ou H = -----------
H = -----------
n
1- k


i=1 i
---
x
f
----i
x i
i=1
La moyenne harmonique peut tre utilise lorquil est possible dattribuer
un sens rel aux inverses des donnes en particulier pour les taux de change,
les taux dquipement, le pouvoir dachat, les vitesses. Elle est notamment
utilise dans les calculs d indices.
 Exemple
On achte des dollars une premire fois pour 100 au cours de 1,23 le
dollar, une seconde fois pour 100 au cours de 0,97 le dollar.
Le cours mo yen du dollar pour lensemble de ces deux oprations est
gal :
200
--------------------------- 1,085
100- + --------- 100-
---------
1,23 0,97
La moyenne arithmtique (= 1,1) ne reprsente pas le cours mo yen du
dollar.
Comparaison des 3 moyennes tudies
On montre que si les xi sont tous positifs :
min xi H G x max xi
Dunod. La photocopie non autorise est un dlit.

lin lin
Lgalit de deux de ces moyennes entre elles entrane leur galit dans
leur ensemble, et dans ce cas, toutes les valeurs xi sont gales.
3) Le mode
Pour obtenir une mesure de la tendance centrale non influence par les
valeurs extrmes de la distribution, on peut prendre la valeur ou la classe
de valeurs du caractre pour laquelle le diagramme en btons respective-
ment lhistogramme prsente son maximum : cest le mode respectivement
lintervalle modal de la distribution ; dans le cas o le diagramme en btons
ou lhistogramme prsente aussi un maximum local, il y a deux modes
respectivement deux classes modales.

DISTRIBUTIONS STATISTIQUES UN CARACTRE 17


P001-046-9782100549412.fm Page 18 Mercredi, 24. novembre 2010 9:46 09

Lorsque la variable statistique est discrte, le mode se dfinit donc laide


du tableau de distribution ou du diagramme en btons. Pour la distribution
prsente la figure 1.2, le mode est gal 2. Si la frquence maximum cor-
respond deux valeurs successives de la variable, il y a un intervalle modal.
Lorsquune distribution prsente plusieurs modes auxquels correspondent
(gnralement) des frquences diffrentes, cest souvent lindice du mlange
de deux ou plusieurs populations ayant chacune leur mode propre
(cf. figure 1.8). Un exemple peut en tre la distribution des pointures de
chaussures des hommes et femmes runies.
Lorsque la variable statistique est continue, la classe modale est la classe
dont la frquence par unit damplitude est la plus leve. Pour la distribution
prsente la figure 1.3, la classe modale est la classe [1, 3[. Mais cette
dtermination nest absolument pas prcise, car elle dpend du dcoupage en
classes retenu ; son intrt est limit par cette imprcision.
Dans le cas dune distribution discrte, le mode satisfait aux conditions 1,
3, 4 et 5 de Yule. Dans le cas de la distribution du nombre denfants par
famille, le mode est rellement une valeur typique et parat mieux correspon-
dre la ralit que la moyenne arithmtique qui est rarement un nombre
entier et qui est sensiblement influence par un nombre relativement petit de
familles trs nombreuses. linverse de la moyenne arithmtique, le mode
nglige dlibrement la prcision numrique au profit de la reprsentativit.
Dans un tel cas, il est souvent souhaitable de disposer de ces deux mesures
de la tendance centrale.
Le mode, historiquement lun des premiers paramtres de position utili-
ss, est un peu moins employ aujourdhui.

1er mode 2e mode


Figure 1.8 Exemple de distribution bimodale
dune variable discrte

4) La mdiane et les quantiles


Bien quhomognes dans leur composition, de nombreuses distributions pr-
sentent de trs grands carts entre les valeurs extrmes de leurs lments.
De plus, elles ont souvent un manque de symtrie prononc, les lments
ayant tendance sagglomrer plus prs dun extrme que de lautre. Les

18 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 19 Mercredi, 24. novembre 2010 9:46 09

distributions de salaires ou de revenus en donnent des exemples typiques .


Il est vident que, dans de tels cas, nous avons besoin dune mesure de la
tendance centrale qui ne soit pas influence par un nombre relativement petit
de valeurs extrmes se situant en queue de la distribution.

a) La mdiane
La mdiane est la valeur de la variable statistique telle quil y ait autant
dobservations suprieures et dobservations infrieures cette valeur. Elle
partage la srie statistique en deux parties dgal effectif. Elle se dtermine
soit partir de la srie des valeurs ordonnes, soit partir de la fonction
cumulative ( II.A.3).
Pour les variables statistiques discrtes , la mdiane est dtermine
laide de la profondeur .
Dans le cas o la srie comporte un nombre impair n dobservations, la
mdiane est gale la valeur de profondeur maximum (n + 1)/2 : pour la srie
des 15 valeurs du tableau 4, la mdiane est gale la valeur de profondeur
8, soit 39,9 h.
Dans le cas o la srie comporte un nombre pair n dobservations, la
mdiane est la moyenne arithmtique des deux valeurs de profondeur n/2 et
est ainsi dfinie comme la valeur de profondeur ( n + 1)/2.
La mdiane est ainsi dans tous les cas la valeur de profondeur (n + 1)/2.
Lorsque les donnes dune variable statistique discrte sont classes, il
nexiste gnralement pas une valeur mdiane Me pour laquelle la fonction
cumulative vaut 50 %. Il faut dans ce cas utiliser dautres valeurs typiques
pour caractriser la tendance centrale de la srie : ceci est le cas pour la dis-
tribution du nombre de personnes par mnage dont la fonction cumulative est
reprsente la figure 1.4.
Pour les variables statistiques continues , la valeur mdiane Me est
telle que F(Me) = 50%. On commence par chercher la classe mdiane
laide des frquences cumules, la classe mdiane [xi 1 , xi[ tant telle que
Dunod. La photocopie non autorise est un dlit.

Fi 1 < 50% et Fi > 50%. La valeur de la mdiane sobtient ensuite par inter-
polation linaire en raison de lhypothse dquirpartition lintrieur des
classes. Cette dtermination peut se faire par le calcul ou graphiquement
(cf. figure 1.9) :
Me x i 1 0, 5 Fi 1 0,5 Fi 1
----------------------- = ------------------------ Me = x i 1 + ( x i x i 1 ) ----------------------
-
xi xi 1 fi fi
Pour la distribution de lanciennet du chmage des femmes (tableau 1.2
et figure 1.5), la mdiane appartient la classe [3 ; 6[ :
50 35,8
Me = 3 + 3 ---------------------- 5,8 mois
15,1

DISTRIBUTIONS STATISTIQUES UN CARACTRE 19


P001-046-9782100549412.fm Page 20 Mercredi, 24. novembre 2010 9:46 09

Fi

fi
0,5

Fi-1
 0,5- Fi-1

x i-1 Me xi
Figure 1.9 Dtermination graphique de la mdiane pour une variable continue
La mdiane peut aussi tre dtermine partir de la courbe des frquences
cumules comme labscisse du point dordonne 50 %.
Une seule observation trs leve (ou trs faible) peut influencer fortement
la moyenne, alors que la mdiane peut supporter sans tre modifie quune
moiti des observations soit trs leve (ou trs faible) : on dit que la mdiane
est rsistante. La mdiane satisfait aux conditions 1, 3, 4 et 5 de Yule.
Dans le cas de distribution unimodale, la mdiane est frquemment com-
prise entre la moyenne arithmtique et le mode, et plus prs de la moyenne
que du mode. Si la distribution est symtrique, ces trois caractristiques de
tendance centrale sont confondues (cf. figure 1.10).

Distribution
symtrique

{ Mo = Me = x } x

Distribution tale
Distribution tale vers la gauche
vers la droite

Mo Me x x x Me Mo x

Figure 1.10 Positions respectives du mode, de la mdiane et de la moyenne

20 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 21 Mercredi, 24. novembre 2010 9:46 09

b) Les quantiles
Les quantiles sont des indicateurs de position .
Le quantile dordre (0 1), not x , est tel quune proportion
des individus ait une valeur du caractre X infrieure ou gale x
Le quantile x0,5 est gal la mdiane.
On utilise couramment les quantiles dordre 1/4, 1/2 et 3/4. Ils sont ainsi
nots et nomms :
Q1 = premier quartile = x 0,25
Q2 = deuxime quartile = mdiane = x 0,5
Q3 = troisime quartile = x 0,75
Les quartiles se dterminent, comme la mdiane, laide de la profondeur
(variable discrte), ou laide des frquences cumules (variable continue).
Dans le cas dune variable statistique discrte, le premier quartile Q1 et le troi-
sime quartile Q3 sont des lments de mme profondeur gale (m + 1)/2 o
m dsigne la partie entire de la profondeur de la mdiane. On peut aussi
considrer Q1 comme la mdiane des m premires valeurs de la srie et Q3
comme la mdiane des m dernires valeurs. Ainsi par exemple, pour une srie
de 39 observations, la mdiane a une profondeur gale 20, et les quartiles
Q1 et Q3 sont de profondeur 10,5 ; pour une srie de 50 observations, la
mdiane a une profondeur de 25,5 et la partie entire de cette profondeur
tant 25, les quartiles Q1 et Q3 sont de profondeur 13.
La pratique de la dtermination des quartiles ne respecte pas toujours la
dfinition prcdente due Tukey. Ainsi les calculatrices de poche (TI,
Casio,) dterminent le 1 er quartile (resp. le 3 e quartile) comme la mdiane
des valeurs de profondeur infrieure (resp. suprieure) la profondeur de la
mdiane. Le rsultat diffre de celui calcul avec la dfinition de Tukey dans
le cas dun nombre impair dobservations. Le logiciel SPSS dtermine deux
types de quartiles : Valeurs charnires selon la dfinition de Tukey, et
Moyenne pondre laide dune formule dinterpolation linaire
Dunod. La photocopie non autorise est un dlit.

[Dodge, 1993]. La dtermination des premier et troisime quartiles nest pas


standardise.
Pour la distribution de la dure hebdomadaire du travail dans les 15 pays
de lUnion europenne en 2000 ( cf. tableau 1.4), les premier et troisime
quartiles sont les valeurs de profondeur 4,5 :
Q1 = 39,15 h et Q3 = 40,2 h
Dans le cas dune variable statistique continue, on a F(Q1) = 0,25 et
F(Q3) = 0,75 et on calcule les quartiles par interpolation linaire, en raison
de lhypothse dquirpartition. Pour la distribution de lanciennet du ch-
mage des femmes ( cf. figure 1.5) :

DISTRIBUTIONS STATISTIQUES UN CARACTRE 21


P001-046-9782100549412.fm Page 22 Mercredi, 24. novembre 2010 9:46 09

25 16,8
Q 1 = 1 + 2 ---------------------- 1,9 mois
19
75 68,7
Q 3 = 12 + 12 ---------------------- 16,1 mois
18,5
On peut dfinir partir des quartiles Q1 et Q3 le paramtre de tendance
centrale (Q1 + Q3)/2, gal la mdiane dans le cas dune distribution sym-
trique, ainsi que lintervalle interquartile [Q1, Q3] qui contient 50 % des obser-
vations.
Plus gnralement, deux quantiles dordres complmentaires x et x1-
dfinissent un intervalle dont le milieu peut tre considr comme un para-
mtre de tendance centrale.
De la mme faon, on dfinit les dciles D1, D2, , D9 qui sont les quan-
tiles xi/10 (i = 1 9), les vingtiles, quantiles xi/20 ( i = 1 19), les centiles, etc.
Les classes dune variable statistique continue sont souvent dfinies
laide des dciles. Dans ce cas, on a 10 classes contenant chacune 10 % de
leffectif total ( cf. tableau 1.5 et figure 1.11).

Tableau 1.5 Distribution des salaires annuels nets de tous prlvements


pour les salaris temps complet du secteur priv et semi-public

Dciles* Ensemble Hommes Femmes


(en euros courants)
2000 2006 2000 2006 2000 2006

D1 10 790 12 718 11 230 13 181 10 190 12 075


D2 12 220 14 219 12 760 14 776 11 420 13 431
D3 13 520 15 545 14 140 16 209 12 500 14 531
D4 14 910 16 977 15 580 17 729 13 710 15 715
Mdiane 16 500 18 631 17 270 19 466 15 130 17 141
D6 18 410 20 685 19 330 21 657 16 810 18 924
D7 20 890 23 430 22 170 24 734 18 850 21 300
D8 24 780 27 826 26 660 29 787 21 620 24 590
D9 32 810 36 941 35 020 40 305 26 950 30 962

D9 /D1 3 2,9 3,2 3,1 2,6 2,6

Salaire moyen 20 400 23 292 21 890 24 912 17 510 20 232


*En 2006, 10 % des salaris temps complet du secteur priv et semi-public gagnent un salaire annuel
net infrieur 12 718 euros, 20 % infrieur 14 219 euros

Source : INSEE.

22 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 23 Mercredi, 24. novembre 2010 9:46 09

hi = 10
Di Di 1
h2

h1

D1 D2 D3 D4 D5 D6 D7 D8 D9

Figure 1.11 Histogramme de la distribution des salaires Ensemble en 2000


(voir tableau 1.5)

C. Les indicateurs de dispersion


1) Ltendue
Ltendue est la diffrence entre la plus grande et la plus petite des valeurs
observes :
tendue = max xi min xi
lin lin

Cette mesure de la dispersion ne dpend que des valeurs extrmes souvent


exceptionnelles ; elle ne satisfait pas aux conditions 2 et 5 de Yule. Il faut
remarquer aussi que la forme de la distribution entre les valeurs extrmes
ninflue pas sur ltendue. Cependant, cette caractristique, tant facile cal-
culer et ayant une signification concrte facile comprendre, est frquem-
ment utilise en contrle industriel de fabrication.
Dunod. La photocopie non autorise est un dlit.

2) Ltendue interquartile
De par la dfinition des quartiles, lintervalle interquartile [ Q1, Q3] contient
50 % des observations. Sa longueur, note EIQ (tendue InterQuartile), est
un indicateur de dispersion :
EIQ = Q3 Q1
Le calcul de ltendue interquartile a lavantage par rapport celui de
ltendue dcarter les valeurs extrmes, souvent sans signification.
Plus gnralement, les longueurs des fourchettes dfinies par les dciles
extrmes, les centiles extrmes constituent des indicateurs de dispersion
contenant respectivement 80 % et 98 % des observations.

DISTRIBUTIONS STATISTIQUES UN CARACTRE 23


P001-046-9782100549412.fm Page 24 Mercredi, 24. novembre 2010 9:46 09

3) Lcart absolu moyen


On peut dfinir une caractristique de dispersion dune distribution statisti-
que en calculant les carts des observations une tendance centrale C. La
tendance centrale de la srie ( xi C) ne peut pas tre une mesure de disper-
sion puisque les carts positifs sont compensables par les carts ngatifs.
Par contre, la srie x i C dfinit une variable statistique positive dont les
valeurs centrales constituent une mesure de dispersion.
Lcart absolu moyen la mdiane est la moyenne arithmtique des
valeurs absolues des carts la mdiane ; on dmontre que cest le plus petit
cart absolu moyen :
n k
1
e Me = ---
ni = 1
x i Me ou e Me = f
i=1
i x i Me

Lcart absolu moyen la moyenne est la moyenne arithmtique des


valeurs absolues des carts la moyenne arithmtique :
n k
1
e x = ---
ni = 1
x i x ou e x =
i=1
f i xi x

Dans le cas dune variable continue classe, on considre, comme pour le


calcul de la moyenne, que chaque individu a sa valeur gale au milieu de sa
classe daffectation.

4) Lcart-type
Lcart-type sX dune variable statistique X est la mesure de dispersion la plus
couramment utilise.
Algbriquement, il se dfinit comme la racine carre de la variance, et la variance
est la moyenne arithmtique des carrs des carts la moyenne arithmtique :
n k
1
ni = 1
var ( X ) = --- ( x i x ) 2 ou var ( X ) = f (x x)
i=1
i i
2
sX = var ( X )

Il est possible de dvelopper la formule de la variance pour obtenir une


expression mieux adapte au calcul (mais cette formule devient inusite de
par la diffusion des calculatrices munies des fonctions statistiques 1) :
1. Les calculatrices munies des fonctions statistiques donnent les valeurs de la moyenne et de
lcart-type dune variable statistique dont on a saisi la distribution. Certaines calculatrices
(dont les calculatrices de marque CASIO ) proposent deux carts-types : n et n-1. La valeur
de n correspond celle de lcart-type sX dfini ici et utilis en statistique descriptive ; quant
celle de n 1 , elle est utilise en infrence statistique et se dduit de n par la formule
n
suivante : n2 1 = ------------ n2
n1

24 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 25 Mercredi, 24. novembre 2010 9:46 09

n n
1 1

var ( X ) = --- ( x i x ) 2 = --- x i2 ( x ) 2
ni = 1 ni = 1
k k
ou var ( X ) = f (x i i x )2= f x 2
i i ( x )2
i1 i=1

Dans le cas dune variable statistique continue, on ramne la valeur de cha-


que individu au milieu de sa classe daffectation. L encore, le choix des bornes
des classes extrmes non limites doit tre fait avec prcaution.
Mais, alors que pour le calcul de la moyenne, lerreur lie ce choix tait
faible dans le cas de distributions approximativement symtriques autour de
la moyenne, il nen est pas de mme pour le calcul de la variance o les
erreurs sajoutent et ne peuvent pas se compenser.
Lcart-type est exprim dans la mme unit que les observations, alors
que la variance sexprime dans le carr de cette unit.
On dmontre que lcart-type, donnant plus de poids aux observations
extrmes que lcart absolu moyen la moyenne, lui est toujours suprieur :
sX ex

Proprits
1. Lcart-type satisfait aux conditions 1, 2 et 6 de Yule ; lcart-type
est plus sensible aux fluctuations dchantillonnage et aux valeurs extr-
mes que la moyenne, en raison des lvations au carr.
2. On montre que la variance est le plus petit cart quadratique moyen,
cest--dire :
n
1

var ( X ) --- ( x i C ) 2 pour tout C
ni = 1
3. Lorsque deux variables X et Y sont en correspondance par le chan-
Dunod. La photocopie non autorise est un dlit.

gement dorigine x0 et le changement dchelle a, les cart-types se cor-


respondent par le seul changement dchelle a pris en valeur absolue :
Y = aX + x 0 s Y = a s X
4. Soit une population  de taille n compose de deux sous-populations
1 de taille n1 et 2 de taille n2. Soit X, une variable statistique observe
sur la population , on peut exprimer sa variance var( X) en fonction de
x , ,x,1 x 2 var(X1) et var( X2) :

1 2
var ( X ) = --- n 1 var ( X 1 ) + n 2 var ( X 2 ) + n 1 ( x 1 x ) 2 + n 2 ( x 2 x )
n

DISTRIBUTIONS STATISTIQUES UN CARACTRE 25


P001-046-9782100549412.fm Page 26 Mercredi, 24. novembre 2010 9:46 09

Il faut bien remarquer que la variance de X sur  est la somme pond-


re des variances de X sur 1 et 2 augmente de la somme pondre des
carrs des diffrences entre la moyenne de X sur  et les moyennes sur
1 et 2. Ce rsultat se gnralise une partition en k sous-populations
(k 2).
5. Les distributions statistiques symtriques telles quenviron :
2/3 de la distribution se situent moins dun cart-type de x ;
95 % de la distribution se situent moins de deux carts-types de x
sont dites normales (chapitre 7, II).
Le triplet ( n, x, s X ) est un rsum exhaustif des distributions de ce type.
Dans de nombreux cas, la normalit tant approximative, ( n, x, s X ) est alors
un rsum (quasi-exhaustif) qui prsente un intrt primordial.

Dautres mesures de la dispersion peuvent tre envisages. On peut cal-


culer un cart mdian, gal la mdiane de la srie des valeurs absolues des
carts une valeur centrale choisie. On peut aussi calculer la diffrence
moyenne gale la moyenne arithmtique des valeurs absolues des diffren-
ces entre les observations prises deux deux. Cest cet indicateur de disper-
sion qui est utilis pour le calcul de lindice de concentration de Gini ( III.E)
et qui, ne mesurant pas la dispersion par rapport la moyenne, est adapt aux
distributions non symtriques.

D. Les caractristiques de forme


La plupart des distributions statistiques sont unimodales. En complment de
ltude de la tendance centrale et de la dispersion, il est intressant de reprer
la forme (dj mise en vidence par une reprsentation graphique) par des
mesures de son asymtrie (en anglais, skewness) et de son aplatissement
(kurtosis).
La symtrie est un concept important pour plusieurs raisons. Tout
dabord, la dfinition de la tendance centrale est sans ambiguit pour une dis-
tribution symtrique puisque pour une telle distribution, la mdiane est gale
la moyenne et ( x + x 1 )/2 pour tout compris entre 0 et 0,5, et la
dispersion des observations est symtrique par rapport la moyenne. Dautre
part, de nombreuses mthodes statistiques reposent sur une hypothse de dis-
tribution(s) normale(s) ou sen approchant (chapitre 7). Le caractre de sym-
trie dune distribution apparat donc particulirement important.
Les mesures de la forme sont indpendantes des units de mesure de la
variable tudie.

26 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 27 Mercredi, 24. novembre 2010 9:46 09

1) Dfinition des moments centrs


Le moment centr dordre r dune distribution est gal la moyenne arith-
mtique des puissances dordre r des carts ( x i x ) :
n k
1
ni = 1
r = --- ( x 1 x ) r ou r = f ( x x)
i=1
i i
r

Remarque
Le moment centr 1 est nul, et le moment centr 2 nest autre que la
variance et ne peut tre nul, comme tous les moments centrs dordre
pair, que si toutes les observations ont la mme valeur.

2) Lasymtrie
Pour une distribution symtrique, la moyenne arithmtique est gale la
mdiane et ( x + x 1 )/2 pour compris entre 0 et 0,5. Dautre part, les
moments centrs dordre impair sont nuls pour une distribution symtrique,
ngatifs pour une distribution unimodale tale gauche, positifs pour une
distribution unimodale tale droite. Ces proprits sont utilises pour dia-
gnostiquer et mesurer lasymtrie.

a) Diagnostic et mesure de lasymtrie laide des quantiles


Dans un cas dasymtrie, la comparaison des quantits ( x + x 1 )/2 ,
milieux des intervalles [x , x1-], pour diffrentes valeurs de (0 0,5)
donne une indication rapide sur le type de lasymtrie. Certains logiciels don-
nent la reprsentation graphique de ces quantits en fonction des amplitudes
( x 1 x ) . Pour une distribution symtrique, on obtient une droite parallle
laxe des abscisses puisque les termes ( x + x 1 )/2 sont tous gaux la
mdiane (et la moyenne !).
Dunod. La photocopie non autorise est un dlit.

Pour la distribution des salaris masculins en 2000 ( cf. tableau 1.5), la


comparaison des milieux des intervalles des dciles symtriques par rapport
la mdiane montre quil sagit dune distribution tale vers la droite :
D6 + D4 D7 + D3 D8 + D2 D9 + D1
- = 17 455 < ------------------
D5 = 17 270 < ------------------ - = 18 155 < ------------------
- = 19 710 < ------------------
- = 23 125
2 2 2 2
Le quotient suivant dfinit un coefficient dasymtrie, appel coefficient
de Yule et Kendall :
( Q3 Q2 ) ( Q2 Q1 ) Q 3 + Q 1 2Q 2
----------------------------------------------------- = ----------------------------------
-
( Q3 Q2 ) + ( Q2 Q1 ) Q3 Q1

DISTRIBUTIONS STATISTIQUES UN CARACTRE 27


P001-046-9782100549412.fm Page 28 Mercredi, 24. novembre 2010 9:46 09

Ce coefficient, compris entre 1 et + 1, est nul pour une distribution


symtrique, positif pour une distribution unimodale tale vers la droite et
ngatif dans le cas contraire, et il est, de plus invariant par changement dori-
gine et dchelle.
On obtient des variantes de ce coefficient en remplaant les quartiles par
les dciles. Pour les distributions des salaires prsentes dans le tableau 1.5,
on peut calculer le coefficient dasymtrie suivant :
D 9 + D 1 2D 5
----------------------------------
-
D9 D1
qui vaut respectivement 0,49 et 0,41 pour les distributions des salaires mas-
culins et fminins en 2000 ; ces valeurs indiquent des distributions asymtri-
ques, tales vers la droite.

b) Le coefficient dasymtrie de Fisher


Le coefficient dasymtrie de Fisher , not 1, est ainsi dfini :
3
1 = ---------
- pour 2 0
23 2
Comme tout coefficient dasymtrie, il est nul pour une distribution sym-
trique, ngatif pour une distribution unimodale tale vers la gauche, positif
pour une distribution unimodale tale vers la droite (figure 1.12).

1 > 0 1 = 0 1 < 0
Figure 1.12 Signe du coefficient dasymtrie

Les coefficients calculs par les logiciels statistiques sont soit celui de
Fisher, soit des variantes de mme linterprtation. Par exemple, le logiciel
SPSS donne un coefficient dasymtrie lgrement modifi :
n - 1
------------------------------------- pour n3
(n 1) (n 2)
3) Laplatissement
Les coefficients daplatissement mesurent laplatissement dune distribution
ou limportance des queues dune distribution. Le coefficient daplatisse-
ment de Fisher, not 2 , est ainsi dfini :

2 = -----42 3 pour 2 0
2

28 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 29 Mercredi, 24. novembre 2010 9:46 09

Ce coefficient est nul pour une distribution normale (chapitre 7), positif
ou ngatif selon que la distribution est plus ou moins aplatie que la distribu-
tion normale de mme moyenne et de mme cart-type.
Les coefficients calculs par les logiciels sont celui de Fisher ou des
variantes de mme interprtation.
Ces coefficients dasymtrie et daplatissement sont invariants par chan-
gement dorigine et dchelle, mais ils sont sensibles aux fluctuations
dchantillonnage puisquils font intervenir des moments dordre lev.

E. Les caractristiques de dispersion relative


Ces caractristiques permettent de comparer les distributions statistiques de
plusieurs sous-ensembles dune mme population, ou de faire des comparai-
sons dans le temps ou dans lespace.

1) Le coefficient de variation et linterquartile relatif


Supposons que nous sachions que lcart-type de poids dune certaine popula-
tion est de 8 kg, limportance du degr de variabilit que cela suggre dpend
de la valeur du poids moyen : 10 kg, 50 kg ou plusieurs centaines de kg
Pour remdier cette difficult dinterprtation, il est naturel dexaminer
le rapport s X x appel coefficient de variation et dfini en gnral pour des
variables positives.
Cest un nombre sans dimension , invariant si on effectue un changement
dunit de mesure.
Plus le coefficient de variation est lev, plus la dispersion autour de la
moyenne est leve.
Ce coefficient permet de comparer les dispersions de distributions qui ne
sont pas exprimes dans la mme unit (comme des distributions de salaires
de pays diffrents) ou de distributions dont les moyennes sont diffrentes
Dunod. La photocopie non autorise est un dlit.

(comme des distributions de salaires pour diffrentes qualifications).


On peut construire dautres coefficients de ce type en utilisant les statis-
tiques dordre comme les quartiles et les dciles ; citons l interquartile
Q3 Q1 D9 D1
relatif : ------------------ et l interdcile relatif : -------------------
Q2 D5
Pour les distributions des salaires Hommes et Femmes en 2001 (cf.
tableau 1.5), les interdciles relatifs valent respectivement 1,45 et 1,12.

DISTRIBUTIONS STATISTIQUES UN CARACTRE 29


P001-046-9782100549412.fm Page 30 Mercredi, 24. novembre 2010 9:46 09

2) Les caractristiques de concentration


La notion de concentration a t introduite propos des distributions de
salaires et de revenus. Cette notion est apparente celle de dispersion
puisquelle concerne lintensit du groupement des donnes.
Elle ne sapplique qu des variables continues valeurs positives, et pour
des ensembles statistiques dont chaque lment est affect dun caractre sus-
ceptible daddition :
un ensemble de mnages classs selon le revenu, lpargne, le
patrimoine ;
un ensemble dentreprises classes selon le chiffre daffaire, le nombre
de salaris, les montants des factures ;
un ensemble dexploitations agricoles classes selon la surface agricole
utilise.
Il est clair que la notion de concentration ne peut pas sappliquer, par
exemple, des ensembles dindividus classs selon lge, la taille ou le poids,
puisque la somme des ges, des tailles ou des poids dune population est sans
signification.
La concentration peut se caractriser, soit par un procd graphique, soit
par le calcul.

a) Construction de la courbe de concentration


Considrons la distribution des exploitations agricoles par classes de gran-
deurs des rgions Provence-Alpes-Cte dAzur (PACA) et Midi-Pyrnes en
2005 (cf. tableau 1.6). Lintervalle de variation de la SAU (superficie agricole
utilise) est partag en k classes (ici, k = 9) dont les bornes suprieures sont
notes dans lordre : x1 , , xi , , xk
On calcule pour chaque classe ( i = 1 k) :
la proportion cumule p i des exploitations de SAU infrieure xi
la proportion cumule qi de la SAU totale des exploitations de SAU inf-
rieure xi
Sur un diagramme cartsien, on reprsente les k points de coordonnes
(pi , q i). Ces points sinscrivent dans un carr OABC dont la longueur des
cts est gale 1 (ou 100 si les proportions sont exprimes en pourcentage).
La courbe qui joint les points successifs est la courbe de concentration
ou courbe de Lorenz (cf. figure 1.13). La courbe, toujours en-dessous de la
bissectrice, permet de lire que les % des exploitations les moins bien
loties cultivent % de la SAU totale. Si toutes les exploitations ont une part
gale de SAU, la courbe se confond avec la bissectrice OB. La courbe sen
loigne lorsque lingalit saccrot.

30 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 31 Mercredi, 24. novembre 2010 9:46 09

Tableau 1.6 Distribution des exploitations agricoles par classes de grandeurs


en rgions PACA et Midi-Pyrnes

Midi-
Midi-Pyrnes PACA PACA
Pyrnes

f Proportion f Proportion p q p q
i SAU i SAU i i i i

Moins de 5 ha 15,5 0,8 44,9 2,6 15,5 0,8 44,9 2,6


5 moins de 10 ha 9,0 1,4 12,5 3,1 24,6 2,2 57,4 5,7
10 moins de 20 ha 13,2 4,2 14,8 7,6 37,7 6,4 72,2 13,2
20 moins de 35 ha 15,7 9,2 9,3 8,6 53,4 15,7 81,5 21,9
35 moins de 50 ha 12,2 11,1 5,1 7,4 65,6 26,8 86,6 29,3
50 moins de 100 ha 23,1 35,1 7,2 17,6 88,7 61,9 93,8 46,9
100 moins de 200 ha 9,6 27,5 3,7 18,1 98,2 89,4 97,5 65,0
200 moins de 300 ha 1,3 6,6 1,4 11,5 99,5 96,0 98,9 76,5
300 ha ou plus 0,5 4,0 1,1 23,5 100,5 100,5 100,5 100,5
100,5 100,5 100,5 100,5
Source : agreste.agriculture.gouv.fr

Ceci suggre dutiliser laire, dite aire de concentration , comprise entre


la courbe et la bissectrice OB comme indicateur dingalit.

q 100
C B
80
1I
2 G
60
Dunod. La photocopie non autorise est un dlit.

40

0 p 20
A PACA
Figure 1.13 Courbe de Lorenz Midi-Pyrnes
0
0 20 40 60 80 100

Figure 1.14 Courbes de concentration des SAU


dans les rgions PACA et Midi-Pyrnes

DISTRIBUTIONS STATISTIQUES UN CARACTRE 31


P001-046-9782100549412.fm Page 32 Mercredi, 24. novembre 2010 9:46 09

On peut comparer la concentration de deux ou plusieurs populations selon


un mme caractre en reprsentant sur un mme graphique leurs courbes de
Lorenz. Les terres agricoles sont plus concentres dans la rgion PACA que
dans la rgion Midi-Pyrnes puisque la courbe de Lorenz de la SAU de la
rgion Midi-Pyrnes est incluse dans celle de la rgion PACA (cf. figure 1.14).
On peut aussi comparer la concentration de deux caractres sur une mme
population : sur la figure 1.15, on constate que la concentration du patrimoine
financier des mnages est plus forte que celle des revenus.
Dans les cas o les courbes se coupent, on ne peut pas comparer les degrs
dingalit.
En %
100
Patrimoine financier
90
Revenu disponible
80
70
60
50
40
30
20
10
0
0 10 20 30 40 50 60 70 80 90 100
Lecture : plus la courbe sloigne de la diagonale, plus la distribution de la variable considre est concentre. La moiti des
mnages les moins riches possde 27 % de la masse des revenus disponibles tandis que la moiti des mnages les moins
bien dots possde environ 4 % de la masse totale de patrimoine financier. Les 10 % les mieux dots en patrimoine
financier en possdent environ 63 %.
Champ : mnages dont la personne de rfrence nest pas tudiante et dont le revenu dclar est positif ou nul.
Sources : enqute Revenus fiscaux 2003, Insee-DGI pour le revenu disponible et enqute Patrimoine 2004, Insee, montants
de patrimoine financier recals sur les donnes de la Comptabilit nationale.
Source : INSEE, conomie et Statistique, n 414, 2008.
Figure 1.15 Courbes de concentration

b) Dtermination de l indice de concentration ou indice de Gini


Lindice IG de Gini est gal au double de laire de concentration ( cf. figure
1.13). Cet indice, compris entre 0 et 1, a une valeur dautant plus leve que
la rpartition est plus ingalitaire, et peut tre valu selon la formule 1 :
n n


i = 1j = i+1
xi x j
I G = --------------------------------------
n(n 1) x
les xi (i = 1, , n) dsignant ici les valeurs prises (supposes toutes distinctes)
par la variable sur chacun des n individus de la population tudie.
1. Le statisticien italien Corrado Gini a propos cette mesure de la concentration en 1912 et a
montr deux annes plus tard que son indice tait gal au double de laire comprise entre la
droite dquirpartition et la courbe propose par Max Otto Lorenz en 1905.

32 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 33 Mercredi, 24. novembre 2010 9:46 09

Cet indice sapparente donc bien la notion de dispersion relative des


lments dune srie. Cest un nombre sans dimension . Cette caractristique
de dispersion ne fait pas appel au calcul dcarts la moyenne. Elle est ainsi
particulirement bien adapte ltude de distributions trs dissymtriques
pour lesquelles la notion dcart la moyenne est sans grande signification.

IV. La bote de distribution


La bote de distribution (box-plot en anglais, ou encore bote--pattes ,
bote moustaches , bote de dispersion en franais) est un outil pri-
vilgi de l analyse exploratoire des donnes . Elle fournit en un seul coup
doeil des informations sur sa tendance centrale, sa dispersion, son asymtrie,
limportance des valeurs extrmes. Elle est aussi particulirement intres-
sante pour la comparaison de distributions sur plusieurs de ces critres.

A. Rsum dune distribution par des quantiles


Les trois quartiles Q1 , Q2 et Q3 et les deux valeurs extrmes fournissent pour
une distribution des informations sur sa tendance centrale par les quantits
1
2 ( 1
)
Q2 , --- ( Q 1 + Q 3 ) e t --- min xi + max xi , sur sa dispersion par ltendue et
2 1in 1in
ltendue interquartile, et sur sa forme par la comparaison des trois indica-
teurs de tendance centrale.
En analyse exploratoire des donnes, ces cinq valeurs sont prsents avec
leur profondeur dans un tableau. Pour la distribution de la dure hebdoma-
daire du travail en 2000 ( cf. tableau 1.4) :
Dunod. La photocopie non autorise est un dlit.

n = 15 Dure hebdomadaire

8 Me = 39,9 h

4,5 Q1 = 39,15 Q3 = 40,2

1 min xi = 38,5 max xi = 43,6


1in 1in

On peut complter ce tableau en indiquant ltendue interquartile, le


milieu de lintervalle interquartile, ltendue et le milieu de lintervalle dter-
min par les deux valeurs extrmes. On obtient ainsi un rsum des informa-
tions sur la dispersion et lasymtrie :

DISTRIBUTIONS STATISTIQUES UN CARACTRE 33


P001-046-9782100549412.fm Page 34 Mercredi, 24. novembre 2010 9:46 09

n = 15 Dure Dispersion Position


hebdomadaire

8 39,9 h

1
4,5 39,15 40,2 EIQ = 1,05 --- ( Q 1 + Q 3 ) = 39,615
2

1 38,5 43,6 tendue = 5,1 1


---
2 ( min x + max x ) = 41,05
1in
i
1in
i

B. Reprsentation dune bote de distribution


Dans une bote de distribution , la bote reprsente lintervalle interquartile,
et lintrieur, la mdiane la spare en deux parties. Les lignes qui partent
du bord de la bote stendent jusquaux valeurs les plus extrmes qui ne sont
pas considres comme loignes. Le logiciel SPSS note valeur loigne
(o), les points situs plus de 1,5 fois ltendue interquartile par rapport aux
bords de la bote, et valeur extrme (), les points situs plus de 3 fois
ltendue interquartile ( cf. figure 1.17).
Ainsi, la taille de la bote reprsente ltendue interquartile, la position de
la mdiane est un bon indicateur de la symtrie de la distribution, la taille des
lignes de part et dautre de la bote traduit la dispersion, et les valeurs loi-
gnes ou extrmes sont immdiatement repres.
On reprsente une bote de distribution de la faon suivante (cf. figure 1.16) :
a) on trace un rectangle de largeur fixe priori et de longueur
EIQ = (Q3 Q1), et on y situe la mdiane par un segment positionn la
valeur Q2, par rapport Q3 et Q1 ; on a alors la bote,
b) on calcule ( Q3 + 1,5 EIQ) et ( Q1 1,5 EIQ) et on cherche :
la dernire observation xh en de de la limite ( Q3 + 1,5 EIQ) soit
xh = max{xi xi Q3 + 1,5 EIQ}
la premire observation xb au del de la limite ( Q1 1,5 EIQ) soit
xb = min { xi xi Q1 1,5 EIQ}
c) on trace deux lignes allant des milieux des largeurs du rectangle aux
valeurs xb et xh

Ainsi, pour la distribution reprsente la figure 1.16, la valeur


loigne associe au Royaume-Uni et mise en vidence sur le diagramme
Branche et feuille de la figure 1.6, est lextrieur de la bote de distribution.

34 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 35 Mercredi, 24. novembre 2010 9:46 09

38 39 40 41 42 43
tendue

Minimum xb Q1 Me Q3 xh Maximum
Q1 1,5 EIQ Q3 + 1,5 EIQ

Figure 1.16 Construction de la bote de distribution de la dure du travail en 2000


(tableau 1.4)

Ce type de diagramme permet aussi de comparer facilement plusieurs dis-


tributions en terme de mdiane, quartiles et valeurs loignes ou extrmes.
On peut reprsenter en parallle les botes de distribution de la dure heb-
domadaire du travail des salaris temps complet de lUnion europenne en
1990,1995 et 2000, et comparer les trois distributions ( cf. figure 1.17).

45

44 * R-Uni
R-Uni * R-Uni

43

42

41
Dunod. La photocopie non autorise est un dlit.

40

39

38

37
N= 15 15 15
1990 1995 2000
Figure 1.17 Reprsentation SPSS des botes de distribution du tableau 1.3

DISTRIBUTIONS STATISTIQUES UN CARACTRE 35


P001-046-9782100549412.fm Page 36 Mercredi, 24. novembre 2010 9:46 09

La mdiane nvolue pas de faon monotone, la dispersion diminue, le


Royaume-Uni passe de valeur loigne en 1990 valeur extrme en
1995 et 2000.
Pour les distributions prsentes par leurs dciles ( cf. tableau 1.5), on ne
connat pas les valeurs individuelles. Dans ce cas, on peut convenir de
considrer valeurs loignes les valeurs infrieures au premier dcile ou
suprieures au neuvime dcile.
La reprsentation des botes de distribution des distributions de salaires en
2000 permet de comparer les salaires selon le sexe (cf. figure 1.18). La repr-
sentation par des histogrammes ( cf. figure 1.11) ne permettrait pas de com-
parer aussi aisment les distributions, les histogrammes ne pouvant pas tre
superposs si on veut conserver la lisibilit, mais seulement juxtaposs.

Euros

Ensemble Hommes Femmes


40 000

30 000

20 000

10 000

Figure 1.18 Reprsentation des botes de distribution des salaires en 2000

C. Interprtation dune bote de distribution


Une bote de distribution rend compte de la tendance centrale, de la disper-
sion, des valeurs loignes ou extrmes et de la forme de la distribution ( cf.
figure 1.19), mme si dautre modes de reprsentation (histogramme, branche
et feuille) peuvent apporter un complment dinformation sur la forme.

36 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 37 Mercredi, 24. novembre 2010 9:46 09

Maximum

Minimum
1. 2. 3. 4.
Figure 1.19 Quelques types de botes de distribution :
1. Distribution symtrique
2. Distribution peu disperse
3. Distribution tale vers les valeurs leves
4. Distribution tale vers les valeurs faibles

En statistique descriptive, on a vu limportance du triplet (n , ,x sX).


Pour la distribution de la dure hebdomadaire du travail du tableau 1.4, ce
triplet prend les valeurs (15 ; 39,93 ; 1,2) pour lanne 2000. La bote de
distribution (cf. figures 1.15 et 1.16) est un complment qui se rvle int-
ressant puisquelle permet de dtecter lasymtrie, les valeurs extrmes, et
de reprer la mdiane et lintervalle interquartile qui contient la moiti des
observations.
Dans le cas dune asymtrie, lcart-type qui mesure la dispersion sym-
triquement par rapport la moyenne nest pas la mesure de dispersion la
mieux adapte, et peut tre complt par ltendue interquartile. Dautre part,
si la bote de distribution indique des valeurs loignes ou extrmes, on sait
que la moyenne et lcart-type sont particulirement influencs par ces
valeurs.
Dunod. La photocopie non autorise est un dlit.

V. Bilan
Avant toute tude formelle, il est ncessaire de procder une valuation
descriptive des donnes. Cette approche descriptive prsente deux difficults,
lune lie aux calculs, lautre la diversit des indicateurs. Si les calculatrices
de poche ont permis depuis longtemps dj de rendre aiss les calculs de
moyenne et cart-type, il a fallu attendre la gnralisation des moyens de calcul

DISTRIBUTIONS STATISTIQUES UN CARACTRE 37


P001-046-9782100549412.fm Page 38 Mercredi, 24. novembre 2010 9:46 09

automatique (en particulier, des logiciels statistiques sur m icro-ordinateurs)


pour que tous les indicateurs bass sur la notion de profondeur, et en parti-
culier la mdiane, soient facilement accessibles. Cest aussi lenvironnement
rcent des micro-ordinateurs qui a permis de dvelopper les modes de reprsen-
tation graphique par lesquels on peut apprhender des indicateurs trs divers.
Lapproche descriptive des donnes trouve dans la reprsentation graphique un
enrichissement et une aide linterprtation. Simplicit et inter activit de cette
dmarche en font une premire tape maintenant indispensable toute tude
statistique.

38 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 39 Mercredi, 24. novembre 2010 9:46 09

Testez-vous (les rponses sont donnes page 283)


Il y a au moins une rponse exacte par question.

1. Pour une srie dobservations dune variable statistique :


a) on peut calculer quatre quartiles
b) lintervalle interquartile contient 50 % des observations
c) le cinquime dcile est gal la mdiane
d) 50 % des observations sont suprieures au premier quartile

2. Pour une variable statistique de distribution symtrique :


a) la moyenne est gale la mdiane
b) 50 % des observations sont suprieures la moyenne
c) la bote de distribution contient toutes les observations
d) ( Q3 Q1) = 2( Me Q1)

3. Pour comparer des distributions de variables statistiques exprimes dans des


units diffrentes (par exemple des distributions de salaires exprims dans des
monnaies diffrentes), on peut utiliser les caractristiques suivantes :
a) la mdiane
b) ltendue interquartile
c) le coefficient de variation
d) le rapport D9 /D1

4. Pour une srie dobservations dune variable statistique :


a) la somme des carts la moyenne est nulle
b) lcart absolu moyen la moyenne est un indicateur de dispersion
c) la mdiane de la srie des carts absolus la moyenne est une mesure de lasymtrie
d) les trois quartiles sont des indicateurs de tendance centrale

5. Une tude des notes obtenues par deux classes dune cole un test commun
a fourni les rsultats suivants :
Dunod. La photocopie non autorise est un dlit.

Classe Classe 1 Classe 2

Effectif 20 30
Moyenne 12 10
cart-type 4 6
Mdiane 12 12

a) la note moyenne des deux classes runies est gale 11


b) lcart-type des notes des deux classes runies est gal 5
c) la mdiane des notes des deux classes runies est gale 12
d) lcart absolu moyen des notes la mdiane est infrieur ou gal 4 pour la classe 1

DISTRIBUTIONS STATISTIQUES UN CARACTRE 39


P001-046-9782100549412.fm Page 40 Mercredi, 24. novembre 2010 9:46 09

6. Si on veut minimiser linfluence des valeurs extrmes :


a) on prfre la mdiane la moyenne
b) on prfre lcart-type lcart absolu moyen la moyenne
c) on prfre ltendue ltendue interquartile
d) on prfre ltendue interdcile ( D9 D1) ltendue

7. Soit une grandeur dont le taux de croissance au cours de 3 annes successives


a t de 0,5 % pour les 2 premires annes et de 2 % pour la dernire anne.
Le taux annuel moyen de croissance pendant ces 3 annes est gal :
13
a) ( 0,005 ) 2 ( 0, 02 )

1
b) --- ( 2 0,005 + 0,02 )
3
13
c) ( 1,005 ) 2 1,02 1

d) une moyenne harmonique

8. Pour la distribution dune variable statistique continue (ou suppose


continue) :
a) lhistogramme est la reprsentation graphique des frquences cumules
b) 15 % des observations sont comprises entre le troisime quartile et le neuvime
dcile
c) la mdiane peut se dterminer laide de la courbe cumulative
d) ltendue interdcile ( D9 D1) contient 90 % des observations

9. Si les notes (comprises entre 4 et 16) obtenues une preuve de statistique


dans une classe de 30 lves sont toutes augmentes de 2 points :
a) la moyenne sera augmente de 2 points
b) lcart-type sera augment de 2 points
d) la mdiane sera augmente de 2 points
d) ltendue sera augmente de 2 points

40 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 41 Mercredi, 24. novembre 2010 9:46 09

Exercices (corrigs page 289)


Exercice 1.1
Le tableau suivant donne la rpartition des familles selon le nombre denfants et leur
ge de 1968 1999 :

Enfants de 0 18 ans (milliers)

1968 1975 1982 1990 1999


Ensemble 12 063 13 176 14 119 15 391 16 097
sans enfant 5 302 5 836 6 508 7 900 8 679
avec enfants 6 760 7 340 7 610 7 491 7 418
1 enfant 2 723 3 110 3 303 3 281 3 317
2 enfants 2 052 2 374 2 734 2 756 2 772
3 enfants 1 063 1 088 1 081 1 063 1 008
4 enfants 481 427 310 259 230
5 enfants 441 342 183 132 91
ou plus
Nombre total 14 569 14 826 14 294 13 748 13 308
denfants
Sources : Recensements de la population, INSEE

1. Dfinir les populations tudies, lunit statistique, le caractre tudi et sa nature.


2. Examinez lvolution du nombre total de familles sans enfant, du nombre de
familles avec enfants, avec un enfant, avec deux enfants
3. On considre dans cette dernire question les familles avec enfant(s).
3.1. Aprs avoir calcul les frquences, tracez les diagrammes en btons de ces
distributions, et indiquez le mode.
3.2. Pour chacune des cinq annes, calculez le nombre moyen denfants par
famille et lcart-type (on considrera le nombre moyen denfants des familles
ayant cinq enfants ou plus gal 6). Commentez les rsultats.
Dunod. La photocopie non autorise est un dlit.

Exercice 1.2
Le tableau suivant donne la distribution du niveau de lindice de la qualit de lair
ATMO en agglomration parisienne de 2000 2006 (en nombre de jours par an).
1. Dfinir les populations tudies, lunit statistique, le caractre tudi et sa nature.
2. Tracez le diagramme en btons de la distribution en 2006, et indiquez le mode.
3. Calculez les niveaux annuels moyens de 2000 2006.

DISTRIBUTIONS STATISTIQUES UN CARACTRE 41


P001-046-9782100549412.fm Page 42 Mercredi, 24. novembre 2010 9:46 09

Niveau Qualit 2000 2001 2002 2003 2004 2005 2006 Total

1 Trs bon 0 0 0 0 0 0 0 0
2 Trs bon 8 15 9 15 23 23 25 118
3 Bon 206 190 183 138 186 188 177 1 268
4 Bon 99 97 111 109 96 99 106 717
5 Moyen 36 33 45 47 39 34 26 260
6 Mdiocre 13 13 8 30 19 11 16 110
7 Mdiocre 2 14 7 16 2 6 11 58
8 Mauvais 2 3 2 10 1 4 4 26
9 Mauvais 0 0 0 0 0 0 0 0
10 Trs mauvais 0 0 0 0 0 0 0 0

Total 366 365 365 365 366 365 365 2 557

Source : AIRPARIF.

Exercice 1.3
On a relev pendant 50 quinzaines successives les niveaux de ventes, exprims en
milliers dunits de produit, de deux prsentations notes G (Gel) et P (Poudre) dun
mme produit. Les rsultats sont les suivants :

Prsentation G Prsentation P

Niveau de <5 [5-10[ [10-12[ [12-20] Niveau de < 10 [10-12[ [12-16[ [16-20]
vente vente

Nombre de 5 20 15 10 Nombre de 10 25 10 5
quinzaines quinzaines

1. Calculez les moyennes, carts-types et mdianes des niveaux de ventes pour cha-
cune des deux prsentations.
Quelle est la condition ncessaire sur la moyenne et la mdiane dune distribution
pour que celle-ci soit symtrique ?
2. Sur lensemble des points de vente pour toute la priode de ltude, on disposait
de 30 % du produit en gel, et de 70 % du produit en poudre.
Quel a t le niveau de ventes moyen pour lensemble des deux prsentations du
produit ?
3. Les niveaux de ventes tant maintenant exprims en centaines dunits de produit,
donnez les nouvelles valeurs des moyennes, carts-types et mdianes calcules
la 1 re question.

42 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 43 Mercredi, 24. novembre 2010 9:46 09

Exercice 1.4
Afin dtudier les disparits de salaires entre hommes et femmes, une enqute a t
ralise auprs du personnel ouvrier dun secteur industriel. Les rsultats concernant
les salaires annuels nets en euros sont rsums dans les deux tableaux suivants :

Tableau 1. Hommes

Effectif 180 Tableau 2. Femmes

Salaire moyen 15 400 Salaire annuel Nombre douvrires


(en milliers d)
cart-type 3 620
[10 ; 12[ 82
1er dcile 10 950 [12 ; 14[ 34
[14 ; 16[ 12
1er quartile 12 750 [16 ; 20] n4

Mdiane 14 800 Total N


3e quartile 17 660

9e dcile 20 220

1. Dfinir la population tudie, lunit statistique, le caractre tudi et sa nature.


2. Proposez pour la distribution du salaire des hommes en prcisant les valeurs cor-
respondantes :
trois indicateurs de tendance centrale ;
deux indicateurs de dispersion ;
deux indicateurs de dispersion relative.
3. Sachant que le salaire annuel moyen des femmes enqutes est gal 12 000 ,
dterminez leffectif n4 de la dernire classe de la distribution du salaire des fem-
mes, ainsi que leffectif total N.
4. Dterminez lcart-type et le coefficient de variation de la distribution des
femmes.
5. Dterminez le salaire annuel moyen de lensemble des ouvriers hommes et
Dunod. La photocopie non autorise est un dlit.

femmes de lenqute.

Exercice 1.5
Dans un atelier, le cot horaire de la main doeuvre est de 8 (base 35 h par
semaine). Une heure supplmentaire revient 10 , et le service de paie indique que
le cot total des heures supplmentaires reprsente 30 % du cot total de la main
doeuvre.
Calculez le cot horaire moyen et indiquez le type de moyenne utilise.

Exercice 1.6
Une mme somme S a t confie deux banques B1 et B2 pour une dure de 10 ans.
Les rendements successifs des placements effectus par les deux banques ont t les
suivants :

DISTRIBUTIONS STATISTIQUES UN CARACTRE 43


P001-046-9782100549412.fm Page 44 Mercredi, 24. novembre 2010 9:46 09

Banque B1 : 12 % pendant 2 ans, puis 8 % pendant 4 ans, puis 6 % pendant 4 ans ;


Banque B2 : 10 % pendant 3 ans, puis 8 % pendant 3 ans, puis 7 % pendant 4 ans.
Les intrts sont toujours capitaliss en fin danne.
1. Calculez le taux moyen de croissance du placement dans chaque banque.
2. quel taux la moins performante des deux banques aurait-elle d placer largent
pendant la troisime priode pour galer lautre ?

Exercice 1.7
Le tableau ci-aprs donne des caractristiques des 30 premiers groupes franais de
lindustrie et des services selon leur chiffre daffaires en 2001 (Source : Tableaux de
lconomie Franaise 2003-2004, INSEE) :

CAHT CAHT
Socit (millions Effectif Socit (millions Effectif
d) d)

TotalFinaElf 105 318 122 025 Aventis 22 941 91 729

Carrefour 69 486 382 821 Groupe Casino 21 984 106 736


(Rallye)

Vivendi Universal 57 360 321 000 Bouygues 20 473 126 560

PSA Peugeot 51 663 192 500 Airbus (EADS) 20 427 2 000


Citron

France Telecom 43 026 206 184 SNCF 20 129 220 747

Suez 42 359 188 050 Vonci 17 172 129 499

EDF 40 716 161 738 La poste 17 028 313 854

Les Mousquetaires 37 200 112 000 Publicis Groupe 16 667 20 592

Renault 36 351 140 417 Michelin 15 775 127 467

Saint-Gobain 30 390 173 329 Havas 14 950 20 373

Pinault-Printemps- 27 799 115 935 Usinor (Arcelor) 14 523 59 516


La Redoute

Groupe Auchan 26 200 136 000 Groupe Danone 14 470 100 560

Alcatel Alsthom 25 353 99 314 Gaz de France 14 357 36 451

Galec (Leclerc) 25 000 75 000 LOral (Gespartal) 13 740 49 150

Alstom 23 453 118 995 Lafarge 13 698 82 892

1. Dfinir la population tudie, lunit statistique et les caractres tudis.


2. Calculez la moyenne et lcart-type du chiffre daffaires et de leffectif.
3. tude du chiffre daffaires des 30 premiers groupes franais.
3.1. Dterminez les trois quartiles.
3.2. Reprsentez le diagramme branche et feuille de cette distribution.
3.3. Reprsentez la bote de distribution.

44 INTRODUCTION LA MTHODE STATISTIQUE


P001-046-9782100549412.fm Page 45 Mercredi, 24. novembre 2010 9:46 09

4. Quel est lintrt de chacune de ces deux reprsentations graphiques comparative-


ment un histogramme ?
5. Reprendre la question 3 pour ltude de leffectif.

Exercice 1.8
Le tableau suivant donne le revenu annuel moyen des mnages, en euros, pour les
dix intervalles dfinis par les dciles, et la part de chaque intervalle dans le revenu
total.

% de la masse totale
Valeur des dciles Revenu moyen
Intervalle des revenus
(euros) dans lintervalle
dans lintervalle

D1 = 7 304 < D1 13 845 12

D2 = 11 091 [D1 ; D2[ 19 318 13

D3 = 14 099 [D2 ; D3[ 12 601 15

D4 = 17 219 [D3 ; D4[ 15 640 16

D5 = 20 631 [D4 ; D5[ 18 863 17

D6 = 24 653 [D5 ; D6[ 22 579 19

D7 = 29 361 [D6 ; D7[ 26 904 11

D8 = 35 757 [D7 ; D8[ 32 324 13

D9 = 46 642 [D8 ; D9[ 40 548 16

 D9 69 930 28

Source : INSEE, Revenus fiscaux 1999, hors revenus du patrimoine.

1. Dfinir la population, lunit statistique, le caractre tudi et sa nature.


Dunod. La photocopie non autorise est un dlit.

2. Calculez le revenu annuel moyen des mnages.


3. Est-il lgitime de faire lhypothse dquirpartition dans les classes dfinies par
les dciles ?
4. Proposez trois indicateurs de tendance centrale, un indicateur de dispersion et un
indicateur de dispersion relative. Donnez les valeurs de ces indicateurs.
5. Cette distribution de revenus est-elle symtrique ? (justifiez votre rponse)
6. Proposez un indicateur de disparit des revenus, et donnez sa valeur. Interprtez.
7. Quelle est la part de lensemble des revenus perus par les 4 diximes des mnages
aux revenus les plus faibles ?
8. Soit F1 = 10 %, F2 = 20 %, , F10 = 100 %, et Ri la part de lensemble des reve-
nus perus par lensemble des Fi mnages aux revenus les plus faibles.

DISTRIBUTIONS STATISTIQUES UN CARACTRE 45


P001-046-9782100549412.fm Page 46 Mercredi, 24. novembre 2010 9:46 09

8.1. Tracez la courbe joignant, dans lordre, les points ( Fi , Ri). Comment sappelle
cette courbe ?
8.2. Rappelez linterprtation graphique de lindice de concentration de Gini ?
8.3. Quelles sont les valeurs minimum et maximum de cet indice ?
8.4. quelles situations correspondent-elles ?
Daprs examen de juin 2004, GEA 1re anne Paris-Dauphine.

Exercice 1.9
Le tableau suivant donne le nombre (en milliers) et la superficie agricole utilise
(SAU, en milliers dha) des exploitations agricoles en France mtropolitaine par clas-
ses de grandeur pour les annes 1979, 1988, 2000 et 2005.

1979 1988 2000 2005

Nombre SAU Nombre SAU Nombre SAU Nombre SAU

Moins de 5 ha 357 677 278 519 193 362 132 262


5 moins de 20 ha 410 4 778 279 3 238 132 1 464 104 1 163
20 moins de 50 ha 347 10 962 288 9 348 138 4 666 109 3 714
50 moins de 100 ha 114 7 683 128 8 709 122 8 662 113 8 083
100 moins de 29 3 798 37 4 864 64 8 655 70 9 486
200 ha 6 1 598 7 1 918 15 4 047 17 4 762
200 ha ou plus

Ensemble 1 263 29 496 1 017 28 596 664 27 856 545 27 470

Source : INSEE.

1. Dfinir la population, lunit statistique, le caractre tudi et sa nature.


2. Calculez, en pourcentage, les taux annuels moyens de variation du nombre des
exploitations agricoles de 1979 1988, de 1988 2000, de 2000 2005.
Exprimez le taux annuel moyen de variation de 1979 2005 en fonction de ces
3 taux, de quel type de moyenne sagit-il ?
Calculez sa valeur.
3. Pour les annes 1979, 1988, 2000 et 2005, calculez la SAU moyenne et la SAU
moyenne des exploitations de 50 ha ou plus.
4. Pour lanne 2005, reprsentez lhistogramme de la distribution des exploitations
agricoles, ainsi que la courbe de concentration de la SAU.

46 INTRODUCTION LA MTHODE STATISTIQUE


P047-066-9782100549412.fm Page 47 Jeudi, 18. novembre 2010 12:03 12

2. I ndices statistiques
P
our ltude des problmes conomiques et sociaux, on a souvent
besoin de dcrire les variations de grandeurs simples telles que
le prix du baril de ptrole, la production de bl, le taux de
fcondit Ces comparaisons dans le temps (ou dans lespace) se font
gnralement en effectuant le rapport des valeurs de la grandeur consi-
dre deux dates diffrentes (ou en deux lieux distincts) ; on parle
dindice statistique lmentaire.
Mais, il est important dtre en mesure de suivre les volutions de gran-
deurs complexes telles que le niveau gnral des prix, la production
industrielle, les exportations Celles-ci peuvent tre rsumes par une
caractrisque de tendance centrale dindices lmentaires, ce qui amne
la construction d indices synthtiques.
Toute caractristique de tendance centrale, notamment les diffrents types
de moyennes, prsentant la fois des avantages et des inconvnients, il
nest pas possible de proposer une mthode unique de construction des
indices synthtiques. Il existe diffrentes formules. On va exposer les plus
utilises.
De par limportance que revtent ces indicateurs dvolution dans les dis-
cussions conomiques et politiques, il est ncessaire de bien comprendre
leur laboration, danalyser leurs modes de construction et dtudier
leurs proprits.

I. Indices lmentaires
Dunod. La photocopie non autorise est un dlit.

A. Dfinition
On appelle indice lmentaire de la grandeur simple x la date (ou priode)
t, dite date courante , par rapport la date 0, dite date de rfrence , le
rapport :
x
I t 0 ( x ) = ----t
x0

INDICES STATISTIQUES 47
P047-066-9782100549412.fm Page 48 Jeudi, 18. novembre 2010 12:03 12

On a lhabitude, pour viter de traiter des valeurs dindice avec trop de


chiffres aprs la virgule de multiplier le rsultat par 100 et de laisser un chif-
fre aprs la virgule. Une variation ngative est repre par une valeur inf-
rieure 100.
 Exemple
La population de la France mtropolitaine est passe de 53 731 milliers
dhabitants au 1 er janvier 1980 56 577 milliers dhabitants au
1er janvier 1990 et 58 749 milliers dhabitants au 1 er janvier 2000
(source : Tableaux de lconomie franaise 2003-2004, INSEE) :
56 577
I 1990 1980 ( P ) = 100 ---------------- 105, 3
53 731
58 749
I 2000 1980 ( P ) = 100 ---------------- 109, 3
53 731
La population franaise a augment de 5,3 % de 1980 1990 et de
9,3 % de 1980 2000.

B. Proprits
1) Circularit (ou transitivit ou transfrabilit)

I t 0 ( x ) = I t t ( x ) I t 0 ( x )
Cette formule permet de changer de base en passant de la date de rf-
rence 0 la date de rfrence t :
I t 0( x)
I t t ( x ) = ----------------
-
I t 0 ( x )
Lutilisateur a en effet souvent besoin de mesurer lvolution dune gran-
deur entre deux dates diffrentes de la date de rfrence.
De cette proprit, rsulte la proprit denchanement :
I t 0( x) = I t t 1( x) I 1 0( x)

2) Rversibilit

1
I 0 t ( x ) = ---------------
-
I t 0( x)
Cette proprit est intressante dans le cas de comparaison gographique,
car le choix du lieu de rfrence est arbitraire.

48 INTRODUCTION LA MTHODE STATISTIQUE


P047-066-9782100549412.fm Page 49 Jeudi, 18. novembre 2010 12:03 12

3) Multiplication
Si une grandeur simple z est le produit de deux grandeurs x et y, lindice
lmentaire de la grandeur produit est gal au produit des indices des gran-
deurs facteurs :
quel que soit t : zt = xt yt It/0(z) = It/0(x) It/0(y)

Cas particulier fondamental :


Valeur = Prix Quantit ou encore : Dpense = Prix Volume
Cette galit entrane :
Indice lmentaire de valeur =
Indice lmentaire de prix Indice lmentaire de quantit

Ces proprits immdiates dun indice lmentaire ne sont gnralement


pas satisfaites par un indice synthtique.

II. Indices synthtiques


Les indices lmentaires retracent lvolution dune seule grandeur parfaite-
ment dfinie et homogne.
Mais, le plus souvent, lconomiste ou le dirigeant dentreprise, si ce nest
le citoyen dsire suivre les variations de grandeurs complexes telles que les
prix, la production industrielle
Ces grandeurs complexes sont composes dun nombre plus ou moins
important de grandeurs simples dont lvolution est dcrite par un indice l-
mentaire.
Dunod. La photocopie non autorise est un dlit.

On appelle indice synthtique, un indice faisant intervenir dans son calcul


plusieurs grandeurs intressant un mme phnomne conomique. Ce type
dindice rsulte dun calcul de moyenne .
Il est impossible de proposer une mthode unique et incontestable permet-
tant de dcrire lvolution dune grandeur complexe.
Les indices synthtiques ont linconvnient de ne pas prsenter gnrale-
ment les proprits de circularit et rversibilit. Or, ces proprits seraient
trs utiles au calcul conomique ; les changements de base et les raccorde-
ments dindices ne peuvent tre effectus de faon rigoureuse que sur des
indices possdant la proprit de circularit.

INDICES STATISTIQUES 49
P047-066-9782100549412.fm Page 50 Jeudi, 18. novembre 2010 12:03 12

A. Indices synthtiques de Laspeyres et Paasche :


premires formules
Soient deux dates 0 et t, la situation chaque date est caractrise par les quantits
disponibles de n biens physiques htrognes q 0i (i = 1, 2, , n) respectivement
q ti non sommables, le prix de chaque unit tant p 0i respectivement p ti
Seules les valeurs des divers biens sont sommables . On peut dfinir un
indice lmentaire de valeur qui retrace lvolution de la valeur sous
linfluence simultane des variations de prix et de quantit :

vt
p ti q ti
Vt 0 = ---- = ------------------
i -
v0
p 0i q 0i
i

Pour sparer les deux influences et chiffrer les variations moyennes


des prix et celles des quantits, il est ncessaire de recourir des indices syn-
thtiques. Le problme est de dcomposer la variation entre la situation 0 et
la situation t en ce qui est d la variation des prix et en ce qui est d la
variation des quantits vendues.
Premire ide :
Quelle aurait t la recette (ou la dpense) si les prix tant rests ce quils taient
la date 0, les ventes (ou les achats) avaient t celles (ou ceux) de la date t ?
Cela revient mesurer seulement leffet de la variation des quantits :

p q i
0
i
t
L t 0 ( q ) = ------------------
i -
i
p 0i q 0i

On dfinit t 0 (p) tel que :

p q i i
t t
V t 0 = Lt 0 ( q ) t 0 ( p ) t 0 ( p ) = -----------------
i -
i
p 0i q ti

On peut aussi proposer l autre solution suivante :

p q p q i i
t 0
i i
t t
V t 0 = L t 0 ( p ) t 0 ( q ) = ------------------
i - -----------------
i -
i i
p0 q0
i
p ti q 0i
i

50 INTRODUCTION LA MTHODE STATISTIQUE


P047-066-9782100549412.fm Page 51 Jeudi, 18. novembre 2010 12:03 12

L(p) et L(q) sont les indices de Laspeyres des prix et des quantits, (p)
et (q) sont les indices de Paasche des prix et des quantits 1.
Essayons dexprimer littrairement la diffrence entre lindice de Laspey-
res et lindice de Paasche. Pour un indice des prix par exemple :
indice de Laspeyres : on fige le panier2 dans sa composition de la
priode de base et on compare la valeur quil aurait la priode courante
avec sa valeur relle la priode de base ;
indice de Paasche : on fige le panier dans sa composition de la priode
courante, on calcule rtrospectivement ce quaurait t sa valeur la
priode de base et on la compare avec sa valeur actuelle.

B. Formules dveloppes
1) Indice de Laspeyres

q
i i
0 pt
q 0i p 0i . p ti
L t 0 ( p ) = ------------------
i -= ------------------
- -----i
i
q 0i p 0i i i
q 0i p 0i p 0

q 0i p 0i q 0i p 0i
La pondration k 0i = ------------------
- = ----------
- sinterprte dans un indice des prix
q 0i p 0i
i
v0

de dtail, comme le coefficient budgtaire (structure de valeurs) du produit


i , cest--dire la part de dpense totale qui lui est consacre, la priode
de base. On constate que la somme de ces pondrations est gale 1. Lindice
de Laspeyres des prix apparat comme une moyenne arithmtique pondre
des indices lmentaires des prix des biens individuels.
On montre de mme :
Dunod. La photocopie non autorise est un dlit.

p q
i i
0 t
p 0i q 0i . q ti
L t 0 ( q ) = ------------------
I - = ------------------
- -----i
I
p 0i q 0i i i
p 0i q 0i q 0

1. tienne Laspeyres (conomiste et statisticien allemand dorigine franaise) et Hermann


Paasche (statisticien allemand) proposrent ces formules respectivement en 1864 et 1874.
2. Panier : expression INSEE, le panier par rapport celui de la mnagre a la particularit
de contenir aussi des services immatriels (tickets dautobus, mois de loyer, biens durables
comme appareils mnagers).

INDICES STATISTIQUES 51
P047-066-9782100549412.fm Page 52 Jeudi, 18. novembre 2010 12:03 12

Ces formules dveloppes apparemment plus compliques que les pre-


mires, sont plus pratiques appliquer ; cest sous cette dernire forme que
les instituts de statistique calculent les indices de Laspeyres, les plus fr-
quemment utiliss. Ils dterminent dabord les coefficients de pondration,
structure des valeurs de la priode de base, et les appliquent aux indices
lmentaires de prix ou de quantits relevs mois aprs mois.

2) Indice de Paasche

q p q p
i i i i
t t t t
1 q ti p ti p 0i
t 0 ( p ) = -----------------
i - = ----------------------------
i -
p 0i
------------------- =
t 0 ( p ) - -----i
----------------

i
q ti p 0i

i i
q t p t . -----i
pt
i i
q ti p it p t
i

Lindice de Paasche des prix ou des quantits est la moyenne harmonique


des indices lmentaires (de prix et de quantits) pondre par les structures
de valeurs de la priode courante.

C. Comparaison des indices de Laspeyres et de Paasche


On sait que la moyenne harmonique est infrieure la moyenne arithmtique,
mais on ne peut comparer les indices de Laspeyres et de Paasche que si les
coefficients de pondration sont les mmes.
Lindice de Paasche est souvent plus petit que lindice de Laspeyres. En
effet, si les coefficients ne changeaient pas entre la date de base et la date
courante, lindice de Paasche, moyenne harmonique, serait infrieur celui
de Laspeyres qui est une moyenne arithmtique. Pour que lindice de Paasche
dpasse lindice de Laspeyres, il faut que les pondrations des indices
lmentaires tendent se modifier dans le sens dun accroissement pour ceux
qui sont levs, et dune diminution pour ceux qui sont faibles.
Conformment la loi conomique de loffre et de la demande, les consom-
mateurs ont tendance acheter moins lorsque les prix sont levs et acheter
davantage quand les prix baissent. Ce phnomne, appel parfois la demande
lastique, nest valable que dans le cas o les biens ne servent pas de faon
essentielle.

q
i i
Dans le cas de lindice de Laspeyres, le numrateur 0 pt (cf. premi-
i
res formules) est un peu plus fort quil ne devrait ltre, car, conformment
la loi de loffre et de la demande, les consommateurs ont tendance acheter

52 INTRODUCTION LA MTHODE STATISTIQUE


P047-066-9782100549412.fm Page 53 Jeudi, 18. novembre 2010 12:03 12

moins de biens de prix levs et davantage de biens bon march. Il en rsulte


q
i i
que le cot total sera infrieur celui donn par 0 pt . Ainsi, l indice de
i
Laspeyres a tendance survaluer une hausse.
Dans le cas de lindice de Paasche, les rles jous par les quantits consom-
mes pendant lanne de rfrence et les quantits consommes pendant
lanne considre sont diamtralement opposs de ceux jous par ces mmes
quantits dans le cas de lindice de Laspeyres. Lindice de Paasche a donc ten-
dance sous-valuer une hausse.

 Exemple
Entre janvier 2006 et janvier 2010, lvolution des prix et du nombre
dexemplaires de journaux vendus en un mois par une socit de presse
ditant trois journaux mensuels A, B et C a t la suivante :

Janvier 2006 Janvier 2010

Prix (en euros) Quantit Prix (en euros) Quantit

Journal A 2,5 8 000 3 6 500

Journal B 4 4 000 4,5 5 000

Journal C 5 2 000 6 1 500

i) La variation des recettes de la socit de presse entre janvier 2006 et


janvier 2010 est de 10,9 %, en effet :
51 000
V 2010 2006 100 = ---------------- 100 110,9
46 000
ii) Cette variation fait intervenir un effet-quantit et un effet-prix quon
Dunod. La photocopie non autorise est un dlit.

peut valuer en calculant les indices des prix et des quantits de


Laspeyres et de Paasche :
L2010/2006(p) = 117,4 2010/2006(p) = 116,6
L2010/2006(p) > 2010/2006(p)
L2010/2006(q) = 95,1 2010/2006(q) = 94,4
L2010/2006(q) > 2010/2006(q)

iii) La variation de la valeur globale peut tre dcompose en ses deux


effets prix et quantit. En effet, partir de la formule :
V2010/2006 = L2010/2006(p) 2010/2006(q) = L2010/2006(q) 2010/2006(p)

INDICES STATISTIQUES 53
P047-066-9782100549412.fm Page 54 Jeudi, 18. novembre 2010 12:03 12

On peut tablir le schma de dcomposition donn la figure 2.1.


Prix constants

q
i
i
2010 p 2006 = 43 750
i
Effet volume Effet prix
4,9 % 16,6 %

Valeur (janvier 2006) Valeur (janvier 2010)

= 46 000 Effet valeur q = 51 000


i i i i
q 2006 p 2006 2010 p 2010
i 10,9 % i

Effet prix Effet volume


17,4 % 5,5 %

Quantits constantes

q = 54 000
i i
2006 p 2010
i
Figure 2.1 Schma de dcomposition de lvolution dun indice de valeur

D. Indice de Fisher
Cet indice a t construit la suite de la recherche dun indice idal.

Dfinition

Ft 0( p) = Lt 0 ( p ) t 0 ( p )

Cette dfinition provient du dveloppement suivant :


Vt/0 = Lt/0(p) t/0(q) = Lt/0(q) t/0(p)
Les indices de Laspeyres et de Paasche tant des nombres positifs, on
peut crire :
V t2 0 = L t 0 ( p ) t 0 ( p ) L t 0 ( q ) t 0 ( q ) V t 0 = F t 0 ( p ) F t 0 ( q )
Moyenne gomtrique des indices de Laspeyres et de Paasche, la valeur
de lindice de Fisher est comprise entre les valeurs de ces deux indices.
Comme lindice de Laspeyres a tendance surestimer une hausse de
prix, tandis que lindice de Paasche a tendance la sous-estimer, on en
dduit que lindice de Fisher doit donner une meilleure estimation dune
hausse des prix.

54 INTRODUCTION LA MTHODE STATISTIQUE


P047-066-9782100549412.fm Page 55 Jeudi, 18. novembre 2010 12:03 12

E. Proprits des indices de Fisher, Laspeyres et Paasche


Les indices de Laspeyres et de Paasche ne sont pas rversibles, mais :
1
t 0 = --------- t 0 L0 t = 1
L0 t
Lindice de Fisher est donc rversible, ce qui en fait un outil privilgi
dans les comparaisons gographiques.
Ces trois indices ne sont pas transitifs.
Agrgation
Les indices de Laspeyres et de Paasche ont des structures de moyenne. On
peut calculer la moyenne arithmtique dun ensemble partir des moyennes des
sous-ensembles qui le composent. Il en rsulte que lindice de Laspeyres (resp.
de Paasche) dun ensemble peut sobtenir partir des indices des groupes for-
mant cet ensemble en leur appliquant la formule de Laspeyres (resp. de Paasche).
Les 303 postes de dpenses, rpartis en 159 groupes, servant aux calculs
des indices actuels des prix la consommation, base 100 en 1998, font lobjet
de regroupements en 12 fonctions (ex : 01 produits alimentaires et boissons
non alcoolises) et 37 sous-fonctions (ex : 01.1 produits alimentaires) 1. Cest
la formule de Laspeyres qui est utilise. On commence par calculer lindice
de Laspeyres de chacun des regroupements. On obtient ensuite lindice
densemble en appliquant nouveau la formule de Laspeyres ces sous-indi-
ces, avec des coefficients de pondration gaux aux parts de chacun des
regroupements dans la valeur de la consommation totale. Cette proprit per-
met de publier non seulement un indice global, mais aussi des sous-indices
correspondant aux groupes et sous-groupes.

Qualit Laspeyres Paasche Fisher

Rversibilit non non oui


Dunod. La photocopie non autorise est un dlit.

1- 1-
mais : L 0 t = ---------- mais : 0 t = ---------
t 0 Lt 0

Transitivit non non non

Agrgation oui oui non

Emploi couramment utilis peu utilis quasiment


inusit

1. Le nouvel indice des prix la consommation, anne de base 1998 , Bulletin Mensuel de
la Statistique, n 2-1999, INSEE.

INDICES STATISTIQUES 55
P047-066-9782100549412.fm Page 56 Jeudi, 18. novembre 2010 12:03 12

F. Utilisation de ces trois indices


Lindice de Laspeyres est le plus commode utiliser ; la plupart des indices
courants tablis par les instituts du monde entier sont du type Laspeyres .
Lindice de Paasche, symtrique de celui de Laspeyres quant sa signifi-
cation, prsente des inconvnients pratiques cause de la mise jour perma-
nente de ses pondrations. Il nest, de ce fait, pas utilis dans le calcul direct
des indices courants. Son calcul est nanmoins intressant pour obtenir avec
lindice de Laspeyres une fourchette destimation.
Lindice de Fisher est quasiment inusit, car son calcul ne peut pas se faire
par agrgation progressive.
Lorsquon divise un indice de valeur par un indice de Laspeyres de prix
(resp. de quantits), on obtient un indice de Paasche de quantits (resp. de
prix). Si on dflate1 lindice rendant compte de lvolution de la masse sala-
riale (indice de valeur) par un indice de Laspeyres des prix (se rapportant
videmment aux mmes dates), on obtient un indice de pouvoir dachat de la
masse salariale qui est un indice de Paasche des quantits consommables.
On dispose assez souvent de sries de valeur totale : chiffre daffaire,
montant des investissements Pour obtenir les indices de volume correspon-
dants reprsentatifs de lvolution relle compte tenu des variations des prix,
il faut diviser les indices de valeur par les indices de prix correspondants.
Mais, on nobtient pas un indice de Paasche de volume puisque lindice des
prix utilis en France et dans la plupart des pays trangers nest pas un
indice de Laspeyres, mais un indice-chane de Laspeyres.

III. Indices-chanes
A. Raccord dindices
Les indices ont une dure de vie limite en raison de lvolution des structures
conomiques. Lorsquon veut dcrire lvolution dune grandeur complexe

1. Dflater : annuler la hausse due leffet de linflation.


La dflation du revenu nominal par lindice des prix la consommation permet de raisonner
en revenus constants en vitant lillusion montaire, et de comparer les niveaux de vie des
priodes diffrentes sans tenir compte dune augmentation du revenu ne compensant que la
hausse des prix.

56 INTRODUCTION LA MTHODE STATISTIQUE


P047-066-9782100549412.fm Page 57 Jeudi, 18. novembre 2010 12:03 12

sur une longue priode, on est amen se poser le problme du raccord de


deux sries dindices synthtiques conscutives.
Soit un indice I, base 100 la date 0, calcul jusqu la date t o il a t
remplac par un indice I*. La valeur de I une date t postrieure la date t
svalue en multipliant lindice I*t/t par lindice It/0 :
It/0 = I*t/t It/0
Cette formule, obtenu par un raccord dindice, nest quune approximation, car:
les indices synthtiques ne possdent pas la proprit de circularit ;
il est frquent que les indices I et I* naient ni le mme champ, ni la
mme composition (changement du nombre darticles d lintroduction
de produits nouveaux).

B. Les indices-chanes
Pour valuer lvolution dune grandeur complexe sur une longue priode,
lemploi de la formule de Laspeyres prsente un inconvnient, car la pond-
ration vieillit. Les prfrences des consommateurs comme les procds
auxquels recourent les producteurs se modifient : les articles choisis pour
reprsenter lvolution de certaines catgories de biens cessent dtre bien
adapts cet objectif et les pondrations de la priode de base et de la priode
courante deviennent trop diffrentes pour que la comparaison reste valable.
On a donc propos de calculer des indices dont la base changerait cha-
que priode.
Mais, comment comparer alors la situation entre deux dates o ont t calcu-
ls deux ou plusieurs indices ayant des bases diffrentes ? On adopte une solution
parfaitement empirique : le raccordement entre ces indices intermdiaires.
Les indices-chanes rsultent de la gnralisation de lopration de rac-
cord de deux indices. Ce sont des indices dfinis partir du produit des indi-
ces ayant pour base lanne prcdente. Lindice-chane de Laspeyres est un
Dunod. La photocopie non autorise est un dlit.

produit dindices de Laspeyres, mais nest pas un indice de Laspeyres :


t
CL t 0 = L ii1 CL t 0 = L t t 1 CL t 1 0
i=1

On dfinit de mme lindice-chane de Paasche.


Lindice-chane permet, mieux que les indices de Laspeyres ou de Paas-
che, de suivre lvolution de la grandeur tudie entre deux dates successives.
Si chaque maillon est calcul selon la formule de Laspeyres :
CL t 0 Lt 0
------------------
- = Lt t 1 alors que : -------------- Lt t 1
CL t 1 0 Lt 1 0

INDICES STATISTIQUES 57
P047-066-9782100549412.fm Page 58 Jeudi, 18. novembre 2010 12:03 12

On est donc dans dexcellentes conditions pour comparer deux priodes


successives.
On a la mme proprit si chaque maillon est un indice de Paasche. Par contre:
toute erreur sur lun des lments de la chane se retrouve dans tous les
indices suivants ;
lindice obtenu na pas une signification bien prcise, le rsultat dpen-
dant des modifications des pondrations dune priode lautre.
Un indice-chane sera donc moins bien adapt quun indice de Laspeyres
ou de Paasche pour tudier les variations survenues depuis la priode de base.

C. Indices publis par lINSEE


Les principaux indices publis par lINSEE 1 sont les suivants :
indices des prix : prix la consommation, prix de gros ;
indices du commerce extrieur ;
indices de la production industrielle ;
indices boursiers
Les indices des prix la consommation des mnages (IPC) calculs par
lINSEE sont des indices-chanes de Laspeyres. LINSEE publie chaque
mois plusieurs indices des prix, base 1998. Lindice des mnages urbains
dont le chef est ouvrier ou employ (mtropole et DOM) sert, dans sa version
hors tabac , lindexation du SMIC. Les autres indices concernant
lensemble des mnages ont un usage conomique dans leur version y com-
pris tabac et un usage indexation dans leur version hors tabac .
Lindice des prix la consommation harmonis (IPCH) sert aux compa-
raisons internationales.

IV. Traitement statistique des indices


Pour reprsenter certains phnomnes, on peut tre amen graduer les axes
selon des chelles particulires. Le papier semi-logarithmique est particuli-
rement adapt certains types de sries chronologiques, et les sries cono-
miques sont souvent des sries dindices.

1. www.insee.fr/fr/themes

58 INTRODUCTION LA MTHODE STATISTIQUE


P047-066-9782100549412.fm Page 59 Jeudi, 18. novembre 2010 12:03 12

A. chelle logarithmique
Le papier semi-logarithmique comporte un axe des abscisses chelle arith-
mtique et un axe des ordonnes chelle logarithmique. Sur laxe des abs-
cisses, on peut choisir lorigine et une unit de longueur quelconque. Mais
pour laxe des ordonnes, on utilise une chelle logarithmique ; la place des
nombres est fixe par leur logarithme dcimal (cf. figure 2.2) :

Nombre 1 2 3 4 5 6 7 8 9 10

log 0 0,301 0,477 0,602 0,699 0,778 0,845 0,903 0,954 1

chelle chelle x 10 x 100


arithmtique logarithmique
1 10 100 1000
9 90 900
0,9 8 80 800
7 70 700
0,8 6 60 600

0,7 5 50 500

0,6 4 40 400

0,5 3 30 300

0,4

0,3 2 20 200

0,2

0,1
Dunod. La photocopie non autorise est un dlit.

0 1 10 100

Figure 2.2 Construction dune chelle logarithmique

Sur une chelle logarithmique, la distance sparant deux multiples succes-


sifs de dix est toujours la mme puisque :
log 10 k log 10 k 1 = log 10 log 10k + 1 log 10 k = log 10
Lintervalle entre deux puissances successives de 10 sappelle un module
et lintrieur dun module, la place des nombres est donc fixe par leur
logarithme dcimal (cf. figures 2.2 et 2.4).

INDICES STATISTIQUES 59
P047-066-9782100549412.fm Page 60 Jeudi, 18. novembre 2010 12:03 12

Les papiers semi-logarithmiques ont habituellement 2, 3 ou 4 modules ;


un papier trois modules permet de reprsenter des sries temporelles xt dont
le rapport entre la plus grande et la plus petite valeur est au plus de 10 3. Les
reprsentations graphiques des logiciels usuels (Excel ) offrent directe-
ment la possibilit dutiliser les chelles logarithmiques.

B. Proprits dun graphique ordonne logarithmique


Une grandeur dont le taux daccroissement (ou de diminution) est constant
sur des laps de temps gaux a son volution reprsente sur du papier
ordonne logarithmique par une suite de points aligns (cf. figure 2.3).
En effet, si une grandeur x a un taux de variation annuel i constant, la
valeur x0 de x la date initiale prend, aprs t annes, la valeur xt telle que :
xt = x0 (1 + i)t log xt = log x0 + t log(1 + i)

xt = (1 + 0,5)t log xt
10
8
7
6
5
4
3
2
1
0 1
0 1 2 3 4 5 t 0 1 2 3 4 5 t
Ordonne arithmtique Ordonne logarithmique

Figure 2.3 Grandeur taux de croissance annuel constant

Une reprsentation avec une ordonne logarithmique permet :


la dtermination graphique du rapport entre deux valeurs de la variable
pour en dduire le taux de variation entre les deux dates considres ; une
diffrence de logarithme reprsentant un rapport, celui-ci est gal la dif-
frence des ordonnes entre les deux valeurs de la variable ;
la dtermination graphique du taux moyen de variation i, la pente de
la droite joignant les deux points extrmes ( cf. figure 2.4a) tant gale
(1 + i) ;
la comparaison graphique entre les taux de variation de deux grandeurs
reprsentes sur le mme graphique ordonne logarithmique ; deux droi-
tes parallles indiquent des taux de variation gaux ;
la reprsentation des sries aux variations importantes puiquavec qua-
tre modules, on peut reprsenter une srie variant de 1 10 4.

60 INTRODUCTION LA MTHODE STATISTIQUE


P047-066-9782100549412.fm Page 61 Jeudi, 18. novembre 2010 12:03 12

V. Bilan
Un indice nest ni parfait, ni rigoureux, ni parfaitement reprsentatif ; en fait,
il existe autant dindices que le statisticien veut en construire, et chacun a la
signification qui rsulte de son calcul mme. Parmi tous ces indices, lco-
nomiste choisira celui qui lui parat le mieux correspondre lusage quil
veut en faire.
Pour construire un indice synthtique, on est amen faire quatre choix :
deux choix dordre conomique :
choix des grandeurs entrant dans la composition de lindice,
choix de la priode de rfrence ;

deux choix dordre statistique :


choix de la moyenne utiliser pour le calcul de lindice partir des
grandeurs composantes,
choix de la pondration appliquer aux valeurs des grandeurs afin de
tenir compte de leur importance relative.
Dunod. La photocopie non autorise est un dlit.

INDICES STATISTIQUES 61
P047-066-9782100549412.fm Page 62 Jeudi, 18. novembre 2010 12:03 12

Testez-vous (les rponses sont donnes page 284)


Il y a au moins une rponse exacte par question.
1. Lindice de Laspeyres des prix est :
a) un indice des dpenses
b) une moyenne arithmtique dindices lmentaires
c) lindice des prix actuellement calcul par lINSEE
d) sexprime dans une unit montaire
2. Lindice de Paasche est :
a) nest pas un indice des prix
b) transitif
c) une moyenne harmonique dindices lmentaires
d) au plus gal lindice de Laspeyres
3. Un indice des dpenses est :
a) un indice de valeur
b) rversible
c) transitif
d) un indice de prix
4. Une grandeur mesure tous les ans :
a) est reprsente sur un papier semi-logarithmique par une suite de points aligns si
le taux annuel de variation est constant
b) a un taux annuel moyen de variation qui peut tre dtermin graphiquement
c) a un taux annuel moyen de variation gal la moyenne arithmtique des taux
annuels de variation
d) est reprsente sur un papier chelles arithmtiques par une suite de points ali-
gns si laccroissement annuel est constant
5. Les taux annuels moyens de croissance du PIB en volume en France ont t
les suivants de 1997 2002 (source : Tableaux de lconomie franaise ,
INSEE) :

Anne 1997 1998 1999 2000 2001 2002

Taux annuel moyen de croissance (en %) 2,0 3,2 2,9 3,8 2,1 1,2

a) le taux de croissance sur les cinq annes est la somme des cinq taux de croissance
b) le taux annuel moyen de croissance sur la priode 1997 2002 est gal la
moyenne arithmtique des taux annuels moyens de croissance
c) le taux annuel moyen de croissance sur la priode 1997 2002 se calcule laide
dune moyenne gomtrique
d) pour la priode 1999 2001, le taux de croissance du PIB en volume a t de 9 %

62 INTRODUCTION LA MTHODE STATISTIQUE


P047-066-9782100549412.fm Page 63 Jeudi, 18. novembre 2010 12:03 12

Exercices (corrigs page 297)


Exercice 2.1
Une entreprise utilise pour ses fabrications trois types de matires premires qui sont
notes respectivement A, B et C.
En 2000 et 2004, les prix observs et les quantits achetes par cette entreprise ont
t les suivants :

Quantits achetes Quantits achetes


Matires Prix par tonne Prix par tonne
en tonnes en tonnes
premires en euros 2000 en euros 2004
en 2000 en 2004

A 800 10 900 6
B 500 4 700 4
C 600 5 600 8

1. Calculez les indices lmentaires rendant compte de lvolution des prix de cha-
cune des matires premires entre 2000 et 2004.
2. Calculez la moyenne arithmtique des indices lmentaires prcdents pondre
par la part des dpenses engages par lentreprise pour chacune de ces matires
premires en 2000. De quel indice sagit-il ?
3. Effectuez le mme calcul pour rendre compte de lvolution des quantits entre
2000 et 2004.
4. Calculez lindice mesurant lvolution globale des dpenses de matires premires
entre 2000 et 2004.
5. Dterminez, en utilisant les rsultats des questions prcdentes, les taux de varia-
tion (exprims en pourcentage) des prix, des quantits et de la dpense totale.
Comment sexplique lvolution de la dpense totale ?

Exercice 2.2
Entre 1980 et 2000, les quantits de sel extraites dune mine ont t multiplies par
1,5 entre 1980 et 1985, sont passes de lindice 130 en 1985 lindice 168 en 1992
avant daugmenter de 6 % par an entre 1992 et 2000.
Dunod. La photocopie non autorise est un dlit.

1. Quel est le taux annuel moyen de variation des quantits de sel extraites entre
1980 et 2000 ?
2. Au cours de la mme priode, le taux de variation annuel moyen du prix du sel a
t de 5 %. Quelle est la valeur de lindice du chiffre daffaire en 2000, base
1980 ?

INDICES STATISTIQUES 63
P047-066-9782100549412.fm Page 64 Jeudi, 18. novembre 2010 12:03 12

Exercice 2.3
Ce tableau donne les indices trimestriels des salaires horaires de base de lensemble
des ouvriers (secteurs non agricoles), base 100 au 4e trimestre 2008. La srie est rtro-
pole depuis le 4 e trimestre 1998 (Source : INSEE) :

1999 2000 2001 2002 2003


31 mars 72,3 76,1 79,4 82,5 84,8
30 juin 72,8 76,8 80 83 85,3
30 septembre 73,7 77,6 80,8 83,7 86,1
31 dcembre 74,4 78,1 81,3 84,1 86,4

2004 2005 2006 2007 2008 2009


31 mars 87,1 89,7 92,5 95,2 97,9 100,8
30 juin 87,6 90,2 93,1 95,8 99 101,2
30 septembre 88,6 91,4 94 96,6 99,7 101,7
31 dcembre 88,9 91,8 94,3 97 100

Sachant que cet indice vaut 71,9 au 31 dcembre 1998, calculez le taux trimestriel
moyen de croissance entre le 31 dcembre 1998 et le 30 septembre 2009, et le taux
annuel moyen de croissance entre le 31 dcembre 1998 et le 31 dcembre 2008.

Exercice 2.4
Le tableau suivant est un extrait du tableau Production et valeur ajoute de lagri-
culture :

2008 2008/2007 en %
En Mds
Volume Prix Valeur
deuros
Produits vgtaux 38,2 3,6 ? 0,3
Crales 10,7 19,2 21,3 6,2
Olagineux, protagineux 2,4 4,8 ? 3,2
Betteraves industrielles 0,8 7,2 3,4 10,3
Autres plantes industrielles* 0,3 2,9 13,5 10,3
Fruits, lgumes, pommes de terre 7,4 3,1 6,3 3,0
Vins 9,4 ? 3,7 2,1
Fourrages, plantes, fleurs 7,4 1,2 9,7 8,4
* Tabac, lin textile, houblon, canne sucre, etc.
Source : Tableaux de lconomie franaise, dition 2010.

64 INTRODUCTION LA MTHODE STATISTIQUE


P047-066-9782100549412.fm Page 65 Jeudi, 18. novembre 2010 12:03 12

1. Donnez lindice de valeur de la production des Produits vgtaux en 2008,


base 100 en 2007. Mme question pour Olagineux, protagineux et pour
Vins .
2. Calculez lvolution 2008/2007 (en pourcentage) des prix la production des
Produits vgtaux . Mme question pour Olagineux, protagineux .
3. Calculez lvolution 2008/2007 (en pourcentage) du volume de la production des
Vins .
4. Commentez les rsultats obtenus.

Exercice 2.5
Considrons la consommation mdicale totale en France (en milliards deuros cou-
rants) de 1970 2000 ( Source : Tableaux de l'conomie franaise , INSEE).

Anne CM Anne CM Anne CM


(milliards (milliards (milliards
d'euros) d'euros) d'euros)
1970 6,494
1971 7,516 1981 35,399 1991 87,430
1972 8,568 1982 41,146 1992 93,482
1973 9,833 1983 46,848 1993 98,665
1974 11,586 1984 52,000 1994 101,866
1975 14,452 1985 57,046 1995 106,257
1976 16,815 1986 61,711 1996 109,245
1977 18,812 1987 64,776 1997 111,059
1978 22,547 1988 70,447 1998 112,731
1979 26,084 1989 76,377 1999 117,093
1980 30,215 1990 81,911 2000 123,545
Dunod. La photocopie non autorise est un dlit.

1. Calculez la variation relative (en %) de la consommation mdicale entre 1970


et 2000.
2. Calculez la srie des indices de la consommation mdicale base 1970.
3. Reprsentez la srie des indices sur un graphique ordonne logarithmique, et
calculez le taux annuel de croissance de cet indice pendant la priode 1970-1982.
4. Reprsentez la srie des indices sur un graphique ordonne arithmtique, et cal-
culez laugmentation annuelle moyenne entre 1982 et 2000.
5. tude de lvolution de lindice en volume :
sachant que lindice des prix I82/70 est gal 318,7, calculez la variation de
lindice en volume entre 1970 et 1982, et en dduire le taux annuel moyen de
variation de cet indice entre 1970 et 1982 ;

INDICES STATISTIQUES 65
P047-066-9782100549412.fm Page 66 Jeudi, 18. novembre 2010 12:03 12

sachant quon utilise le coefficient de raccordement 1 de 5,584 pour calculer un


prix en 2000 partir dun prix en 1970, calculez le taux annuel moyen de crois-
sance de lindice en volume entre 1982 et 2000.
6. Conclusion.

1. http://www.insee.fr/fr/indicateur/achatfranc.htm

66 INTRODUCTION LA MTHODE STATISTIQUE


P067-102-9782100549412.fm Page 67 Mercredi, 24. novembre 2010 9:53 09

3. Distributions
statistiques
deux caractres
L
orsque les observations portent simultanment sur deux caract-
res, et lorsquelles sont trop nombreuses pour quon les cite une
une, on les prsente sous la forme dun tableau double
entre. On dfinit alors la distribution conjointe, les distributions margi-
nales et les distributions conditionnelles. Ltude de la distribution de
deux variables se pousuit par celle de leur liaison.
Ltude de la liaison entre les variables observes, appele commun-
ment ltude des corrlations, dpend de leur nature. On envisagera les
trois cas suivants : deux variables quantitatives, une variable quantitative
et une variable qualitative, deux variables qualitatives . Lorsque le
domaine de variation dune variable quantitative a t dcoup en clas-
ses et que les observations sont prsentes dans un tableau double
entre, alors cette variable peut tre traite comme une variable quali-
tative et dans ce cas, on a plusieurs mthodes pour ltude de la liaison.

I. Distributions statistiques deux variables


Dunod. La photocopie non autorise est un dlit.

A. Distribution conjointe
Dsignons par X et Y les deux variables qui peuvent tre qualitatives ou quan-
titatives, et qui peuvent ne pas tre de mme nature. Les k modalits de X
sont dsignes par x1 , , x i , , x k ; les l modalits de Y sont dsignes par
y1, , y j , , y l . La ie modalit dune variable dsigne le centre de la ie classe
dans le cas dune variable quantitative continue.

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES 67


P067-102-9782100549412.fm Page 68 Mercredi, 24. novembre 2010 9:53 09

La rpartition des n observations, ou distribution conjointe , suivant les


modalits de X et Y se prsente sous forme dun tableau double entre,
appele tableau de contingence (cf. tableaux 3.1 et 3.2).
Tableau 3.1 Tableau de contingence : distribution conjointe de deux variables X et Y

Modalit de Y
y1 yj yl Total
Modalit de X
x1 n 11 n1 j n 1l n 1
. . . . . . .
. . . . . . .
. . . . . . .
xi n i1 n ij n il n i
. . . . . . .
. . . . . . .
. . . . . . .
xk n k1 n kj n kl n k

Total n 1 n j n l n

Tableau 3.2 Exemple de tableau de contingence : distribution des notes de 100 tudiants
une preuve dun concours selon leur filire dorigine

Classe de notes Y [0 ; 6[ [6 ; 10[ [10 ; 14[ [14 ; 20] Total


3 8 12 17
Filire dorigine X
Filire A 26 6 4 1 37
Filire B 12 9 3 1 25
Filire C 1 4 5 6 16
Filire D 10 8 3 1 22
Total 49 27 15 9 100

Leffectif nij dsigne le nombre de fois o la modalit xi de la variable X


et la modalit yj de la variable Y ont t observes simultanment.
Leffectif ni est le nombre total dobservations de la modalit x i de X,
quelle que soit la modalit de Y :
l
ni = n ij
j=1
De mme, leffectif n j est le nombre total dobservations de la modalit yj
de Y, quelle que soit la modalit de X :
k
n j = n ij
i=1

68 INTRODUCTION LA MTHODE STATISTIQUE


P067-102-9782100549412.fm Page 69 Mercredi, 24. novembre 2010 9:53 09

k l
On a videmment : ni = n j = n
i=1 j=1

La distribution conjointe peut aussi tre dfinie par les frquences :


n
fij = ----ij-
n

B. Distributions marginales
Les k couples (xi , ni) forment la distribution marginale de la variable X.
Les l couples (yj , n j) forment la distribution marginale de la variable Y.
Les distributions marginales peuvent aussi tre donnes sous forme de fr-
quences :
ni n j
fi = ------ et f j = ------
n n
Disposant dune distribution conjointe, on peut dduire les distributions
marginales qui permettent dtudier sparment chaque variable en reprsen-
tant graphiquement sa distribution et sil sagit dune variable quantitative, en
calculant ses caractristiques de tendance centrale, de dispersion, de forme

C. Distributions conditionnelles
La distribution de la variable Y, la variable X tant gale xi, est appele
distribution conditionnelle de Y pour X = x i :

Y/X = xi y1 yj yl Total

Effectif ni1 nij nil ni


Dunod. La photocopie non autorise est un dlit.

Cette distribution des ni observations, satisfaisant la condition X = x i ,


est prsente sous la forme de frquences conditionnelles :
l
n ij
f j/i = ------
ni
avec : f j/i = 1
j=1

Y/X = xi y1 yj yl Total

Frquence f1/i fj/i fl/i 1

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES 69


P067-102-9782100549412.fm Page 70 Mercredi, 24. novembre 2010 9:53 09

La frquence 1 fj/i se lit f indice j si i , cest--dire frquence de yj si


X = x i . Il y a k distributions conditionnelles de Y pour X = x i (i = 1, , k).
Lorsque la variable Y est quantitative, on peut calculer pour chaque valeur
xi sa moyenne conditionnelle yi et son cart-type conditionnel si :
l l

f
2
yi = f j/i y j et s i2 = j/i ( ( y j yi )
j=1 j=1

Les k modalits de X induisant une partition des observations en k sous-


groupes, la moyenne y peut sexprimer comme somme pondre des k
moyennes y i (chapitre 1) :
k
y = f y i i
i=1

Symtriquement, on a l distributions conditionnelles de X et on dfinit les


frquences conditionnelles f indice i si j :
k
n
fi/j = -----ij-
n j
avec : f i/j = 1
i=1

X/Y = yj x1 xi xk Total

Frquence f1/j fi/j fk/j 1

Lorsque la variable X est quantitative, on peut calculer pour chaque valeur


yj sa moyenne conditionnelle x j et son cart-type conditionnel sj :
k k

f
2
xj = fi/j x i et s 2j = i/j ( xi x j )
i=1 i=1

et on a la relation suivante entre la moyenne x et les l moyennes condition-


nelles x j :
l
x = f j xj
j=1

Lorsquon dispose dobservations portant simultanment sur deux varia-


bles, il est frquent de les prsenter dans un tableau donnant lensemble des
distributions conditionnelles de Y, et on a alors un tableau dont toutes les

1. Les frquences fj/i sont aussi parfois notes f ji

70 INTRODUCTION LA MTHODE STATISTIQUE


P067-102-9782100549412.fm Page 71 Mercredi, 24. novembre 2010 9:53 09

sommes en ligne sont gales 100 % ; ce tableau est appel tableau des pro-
fils en ligne (cf. tableau 3.3).
Tableau 3.3 Tableau des profils en ligne correspondant au tableau de contingence 3.2

Classe de notes Y [0 ; 6[ [6 ; 10[ [10 ; 14[ [14 ; 20]


3 8 12 17 Total
Filire dorigine X

Filire A 70,3 16,2 10,8 2,7 100


Filire B 48,0 36,0 12,0 4,0 100
Filire C 6,3 25,0 31,2 37,5 100
Filire D 45,5 36,4 13,6 4,5 100

Distribution marginale de Y 49,0 27,0 15,0 9,0 100

Bien videmment, on dfinit dune faon symtrique le tableau des profils


en colonne qui est le tableau des distributions conditionnelles de X avec des
sommes en colonne gales 1 ( cf. tableau 3.4).
Tableau 3.4 Tableau des profils en colonne

Modalit de Y Distribution
y1 yj yl marginale
Modalit de X de X

x1 f1/1 f1/j f1/l f1


. . . . . . .
. . . . . . .
. . . . . . .
xi f i/1 f i/j f i/l fi
. . . . . . .
. . . . . . .
. . . . . . .
xk f k/1 f k/j f k/l fk

Total 1 1 1 1
Dunod. La photocopie non autorise est un dlit.

D. Dpendance et indpendance statistique


Si tous les profils en colonne du tableau 3.4 sont identiques, cela signifie que
la distribution de la variable X ne dpend pas de la variable Y, on dit alors
que les variables X et Y sont statistiquement indpendantes dans lensemble
des n individus considrs, et dans ce cas toutes les distributions condition-
nelles de X sont identiques la distribution marginale de X.

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES 71


P067-102-9782100549412.fm Page 72 Mercredi, 24. novembre 2010 9:53 09

On peut crire en termes deffectifs ou de frquences ce que signifie


lindpendance statistique entre X et Y ; pour tout couple ( i, j) :
f ni n j
fi/j = fi ------ij- = fi fij = fi f j n ij = --------------
f j n

Par raison de symtrie, lindpendance statistique entre X et Y implique


aussi des profils en ligne identiques la distribution marginale de Y:
fj/i = f j pour tout couple ( i , j).
Lorsque deux variables dpendent statistiquement lune de lautre, on
cherche valuer lintensit de leur liaison et dans le cas de deux variables
quantitatives, on examine si on peut les considrer lies par une relation
linaire.

II. Deux variables quantitatives


Si les observations de deux variables statistiques X et Y sont connues indivi-
duellement, on commence par les visualiser en les reprsentant sous la forme
dun nuage de points (cf. figure 3.1) : dans un repre cartsien, chaque obser-
vation (xi , yi) est figure par le point Mi de coordonnes ( xi , yi), et la forme
du nuage donne une information sur le type dune ventuelle liaison.
y

Mi
yi

0 xi x

Figure 3.1 Nuage de points


Supposons que lexamen du nuage de points conduise rechercher une
droite dajustement. Le calcul des coefficients de cette droite va tre expos
dans le cas o les observations sont connues individuellement. La gnra-
lisation des rsultats au cas dune distribution rsume dans un tableau de
contingence se fait sans difficult.

72 INTRODUCTION LA MTHODE STATISTIQUE


P067-102-9782100549412.fm Page 73 Mercredi, 24. novembre 2010 9:53 09

A. Caractristiques dun couple


de deux variables quantitatives
1) Moyenne dune somme de deux variables statistiques
On montre sans difficult le rsultat suivant : x + y = x + y
a, b, c  ax + by + c = a x + by + c

2) Covariance entre deux variables statistiques


Cas de donnes individuelles :
n n
1 ( x i x ) ( y i y ) = 1---
cov(X,Y) = ---
n n x y x y
i i
i=1 i=1

Cas de donnes groupes dans un tableau de contingence (covariance


pondre) :
k l k l

cov(X,Y) = f ij ( x i x ) ( yj y ) = f ij xi yi x y
i=1j=1 i=1j=1

Proprits de la covariance
1. cov(X,Y) = cov(Y, X)
2. cov(X, X) = var(X)
3. var(X + Y) = var(X) + var(Y) + 2 cov(X, Y)
4. a, b, c, x 0, y0  : cov(aX + x0, bY + y0) = ab cov(X,Y)
var(aX + bY + c) = a2 var(X) + b2 var(Y) + 2ab cov(X,Y)
5. cov ( X , Y ) var ( X ) var ( Y )
Dunod. La photocopie non autorise est un dlit.

Les proprits 1 et 2 sont videntes. Montrons la proprit 3 dans le cas


de donnes individuelles, la dmonstration pour des donnes groupes dans
un tableau de contingence se faisant de la mme faon en utilisant les formu-
les pondres par les frquences :
n n
1 ( x i + y i x + y ) = 1---
2

2
var ( X + Y ) = --- ( xi + yi x + y )
n n i=1
i=1

1
n n n


2 2
= --- ( x i x ) + ( y i y ) + 2 ( x i x ) ( y i y )
n i = 1 i=1 i=1
= var ( X ) + var ( Y ) + 2cov ( X , Y )

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES 73


P067-102-9782100549412.fm Page 74 Mercredi, 24. novembre 2010 9:53 09

La proprit 4 se dmontre sans difficult si on se souvient que


ax + x 0 = a x + x 0 . Quant la proprit 5, elle sera dmontre au II.C.1.

3) Coefficient de corrlation linaire


On appelle coefficient de corrlation linaire entre deux variables statistiques
X et Y, le rapport de leur covariance par le produit de leurs carts-types :
cov ( X , Y -)
r ( X , Y ) = -----------------------
s X sY

Proprits du coefficient de corrlation linaire


On a pour tout a, b, x0, y0  :
cov ( aX + x 0 , bY + y 0 ) abcov ( X , Y -)
r ( aX + x 0 , bY + y 0 ) = -------------------------------------------------------
- = ------------------------------
s aX + x s bY + y ab s X s Y
0 0

+ r ( X , Y ) si a et b de mme signe
=
""

r ( X , Y ) si a et b de signe oppos
Ce coefficient, invariant par changement dorigine et dchelle , est un
nombre sans dimension qui, daprs la proprit 5 de la covariance, varie
entre 1 et + 1. On montrera que sil est gal 1, les n points ( xi , y i )
sont aligns.

B. Ajustement linaire dun nuage de points


Les points (xi , yi) forment un nuage dont on cherche une approximation dans
un but de simplification. Mais qui dit simplification dit dformation : nous
voudrions quelle soit minimale ; encore faut-il prciser ce que lon entend
par l. Disons tout de suite que le choix du critre sera arbitraire mme si
lon tente de le justifier par des considrations plus ou moins intuitives .
On peut vouloir par exemple :
prserver au mieux les distances entre points ;
prserver au mieux les angles des droites joignant les points
Il nexiste pas de moyen de satisfaire toutes ces exigences la fois. Il
nous faut donc choisir.
Nous allons chercher la meilleure droite au sens des moindres carrs ,
n

MH
2
cest--dire telle que : i i soit minimum ( cf. figure 3.2) :
i=1

74 INTRODUCTION LA MTHODE STATISTIQUE


P067-102-9782100549412.fm Page 75 Mercredi, 24. novembre 2010 9:53 09

M2
y

Mi y = ax + b
yi H1
H2

axi + b
Hi
M1

xi x
Figure 3.2 Interprtation gomtrique de la droite des moindres carrs

Les distances sont comptes paralllement lun des axes des coordon-
nes ; nous avons choisi ici laxe des ordonnes ( cf. figure 3.2).
Il sagit de dterminer la droite  dquation { y = ax + b } telle que :
n
y ( ax + b ) 2 soit minimum
F ( a, b ) = i i
i=1

Nos inconnues sont a et b.


Commenons par chercher le minimum de F(a, b) relativement b lorsque
a est fix. On peut crire F(a, b) comme un trinme du second degr en b :
n 2 n
F ( a, b ) = ( y ax ) b
i i = ( y ax )
i i
2 2b ( y i ax i ) + b 2

i=1 i=1

n n
= ( y i ax i ) 2 2b ( y ax ) + nb
i i
2

i=1 i=1

Quand a est fix, le dernier membre constitue une fonction de b qui atteint
F
son minimum pour b = b tel que ------- ( a, b ) = 0 , soit :
b
Dunod. La photocopie non autorise est un dlit.

F n
b
------- ( a, b ) = 2 ( y i ax i ) nb = 0
i = 1

n
1
b = ---
n ( y ax )
i i = y ax
i=1

1re consquence : la droite des moindres carrs passe par le point de


coordonnes ( x , y ) quon appelle parfois le centre de gravit ou point
moyen du nuage.

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES 75


P067-102-9782100549412.fm Page 76 Mercredi, 24. novembre 2010 9:53 09

Notre problme est maintenant de trouver le minimum de F ( a, b ) relati-


vement a :
n 2
F ( a, b ) = ( y y ) a ( x x )
i=1
i i

n n n
=
i=1
( y i y ) 2 2a
i=1
( yi y ) ( xi x ) + a 2 (x x )
i=1
i
2

ce qui peut encore scrire :

F ( a, b ) = n a 2 var ( X ) 2a cov ( X , Y ) + var ( Y )



Le coefficient de a 2 tant positif ou nul, ce trinme du second degr en
a atteint son minimum relativement a pour a = a avec :
( X, Y )
a = cov
------------------------
var ( X )
Ainsi le couple ( a, b ) avec b = y ax ralise le minimum de la
fonction F
2e consquence : la droite des moindres carrs a pour quation
y = ax + b soit
cov ( X , Y )
y y = ------------------------ ( x x )
var ( X )
On posera pour tout i variant de 1 n : y i = ax i + b , y i est la valeur
estime de Y par la droite des moindres carrs lorsque X = xi

C. Interprtation du coefficient de corrlation linaire


1) Interprtation laide de la droite 
Il est toujours possible de tracer la droite des moindres carrs prcdente
quelle que soit la forme du nuage. Lapproximation du nuage par cette droite
est-elle lgitime ? Quel sens, quelle signification donner cette droite ?
Cest l une autre question, et fort importante. On pourra dire quil
est dautant plus lgitime de remplacer le nuage par la droite trouve que
la dispersion du nuage de points par rapport la droite des moindres
carrs :

76 INTRODUCTION LA MTHODE STATISTIQUE


P067-102-9782100549412.fm Page 77 Mercredi, 24. novembre 2010 9:53 09

n n

( y y )
2

i=1
M i H i 2 = F ( a, b ) =
i=1
i i sera plus faible

En remplaant a par son estimation a , on obtient :


n
( cov ( X , Y ) )2 ( cov ( X , Y ) )2

2
F ( a, b ) = ( y i y i ) = n ------------------------------- 2 ------------------------------- + var ( Y )
i=1 var ( X ) var ( X )

( cov ( X , Y ) )2
= n var ( Y ) -------------------------------
var ( X )

( cov ( X , Y ) )2
et comme : r 2 = --------------------------------------
var ( X ) var ( Y )
on a :
n n n
2
( y y ) (1 r )
2 2
( y i y i ) = n var ( Y ) ( 1 r 2 ) ( y i y i ) = i
2

i=1 i=1 i=1

ce qui implique :
1 r2 0 r +1 et cov ( X , Y ) var ( X ) var ( Y )
n

( y y )
2
La quantit i i , appele Somme des Carrs Rsiduelle (SCrs),
i=1
est dautant plus faible que r2 est proche de 1.
Elle est nulle pour r = + 1 et dans ce cas, on a une liaison linaire entre X et
Y, car si { y i = y i pour tout i}, alors les n points (xi , yi) sont aligns.
n
2
La quantit (y y )
i tant appele Somme des Carrs Totale (SC tot)
Dunod. La photocopie non autorise est un dlit.

i=1
de Y, il sensuit :
n

( y y )
2
i i
i=1 SC rs
1 r 2 = ------------------------------ = -----------
-
n
2 SC tot

( yi y )
i=1

la quantit { 1 r 2 } est gale la proportion de variation de Y non expli-


que par la droite des moindres carrs  (cf. figures 3.3 et 3.4) .

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES 77


P067-102-9782100549412.fm Page 78 Mercredi, 24. novembre 2010 9:53 09

yi

xi

n 2
Figure 3.3 ( y i y ) = SC tot
i=1

yi

yi

xi

n 2
Figure 3.4 ( y i y i ) = SC rs
i=1

Notons que la somme des carts la droite  est nulle :


n n
y = ax + b
i=1
( y i ax i b ) = 0 ( y y )
i=1
i i = 0

ce qui implique aussi que les moyennes des y i et des y i sont gales : y = y
et ceci est d au fait que la droite des moindres carrs passe par le point
moyen ( x , y ) du nuage des n points.
La dcomposition de la variation totale de Y permet une autre interprta-
tion de r2 :
n n


2
( y y + y y )
2
( yi y ) = i i i
i=1 i=1

n n n
2
=
i=1
( y i y i ) 2 +
i=1
( y i y ) + 2 ( y y ) ( y y )
i=1
i i i

78 INTRODUCTION LA MTHODE STATISTIQUE


P067-102-9782100549412.fm Page 79 Mercredi, 24. novembre 2010 9:53 09

Montrons que le 3 e terme du dernier membre est nul. On peut crire :


y i y = a ( x i x ) et y i y i = y i y ( y i y ) = y i y a ( x i x )
ce qui donne une nouvelle expression de ce 3 e terme :
n n

( y y ) ( y y )
i=1
i i i = a y y a ( x x ) ( x x )
i=1
i i i

n n
2

i = 1 i=1

= a ( y i y ) ( x i x ) a ( x i x )

n
( y y ) ( y y )
i=1
i i i = n a cov ( X , Y ) avar ( X ) = 0

( X , Y -)
puisque a = cov
-----------------------
var ( X )
n

( y y )
2
La quantit i tant appele Somme des Carrs Explique (SCexpl),
i=1
on obtient l quation de la dcomposition de la variation totale de Y :
n n n
2 2
( y y )
2
( yi y ) = ( y i y ) + i i SC tot = SC expl + SC rs
i=1 i=1 i=1

et une autre interprtation de r 2, complmentaire celle de ( 1 r 2 ) :


n

( y y )
2
i
i=1 SC expl
r 2 = ------------------------------ = --------------
n
2 SC tot

i=1
( yi y )
Dunod. La photocopie non autorise est un dlit.

le carr r 2 du coefficient de corrlation linaire est gal la proportion de


la variation de Y explique par la droite des moindres carrs 
Conclusion sur linterprtation de la valeur du coefficient de corrlation
linaire :
r = 1 y i = y i = ax i + b i

r = 1 les n points (xi , yi) sont aligns


r = 0 pas de liaison linaire, mais possibilit dune liaison
dun autre type

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES 79


P067-102-9782100549412.fm Page 80 Mercredi, 24. novembre 2010 9:53 09

Voici un exemple de deux variables X et Y non indpendantes avec


r ( X, Y ) = 0 :
X 2 1 0 1 2
Y 4 1 0 1 4
n
n = 5, x = 0, y = 2 et x y
i=1
i i = 0 r ( X , Y ) = 0 et Y = X 2

Le coefficient de corrlation linaire entre deux variables quantitatives


indpendantes est nul, mais la rciproque nest pas vraie :

X et Y indpendantes
r(X, Y) = 0

2) Droite des moindres carrs 


Dans toute ltude prcdente, on a fait jouer des rles non symtriques X
et Y. On a procd comme si la variable X pouvait tre mesure, et quon
cherchait prvoir la variable Y.
Inversement, la droite  des moindres carrs pour laquelle les distances sont
comptes paralllement laxe des abscisses ( cf. figure 3.5) a pour quation :
cov ( X , Y ) var ( Y )
x x = ------------------------ ( y y ) y y = ------------------------ ( x x )
var ( Y ) cov ( X , Y )
Mais, dans certains cas, comme celui o la variable X dsigne le temps,
seule la droite  a un sens.
Le coefficient r tant symtrique par rapport X et Y, la Somme des
Carrs Rsiduelle associe la droite  est gale :
n n

( x x )
2 2
M i Gi = i i = n var ( X ) ( 1 r 2 )
i=1 i=1

y
Mi
yi
Gi

xi xi x

Figure 3.5 Interprtation gomtrique de la droite des moindres carrs 

80 INTRODUCTION LA MTHODE STATISTIQUE


P067-102-9782100549412.fm Page 81 Mercredi, 24. novembre 2010 9:53 09

D. Comparaison des deux droites des moindres carrs


Les deux droites  et  sont gnralement distinctes. Elles se coupent au
point moyen du nuage, et leurs coefficients directeurs sont de mme signe et
du signe de r :
cov ( X , Y ) var ( Y ) var ( Y ) 1 var ( Y )
------------------------ = r ---------------- et ------------------------ = --- ----------------
var ( X ) var ( X ) cov ( X , Y ) r var ( X )
De plus, la valeur absolue du coefficient de corrlation r tant comprise
entre 0 et 1, la valeur absolue de la pente de la droite  est toujours inf-
rieure ou gale celle de la droite  (cf. figure 3.6).
Ces deux droites seront confondues si et seulement si les variables X et Y
sont lies par une relation linaire :
r = 1/r r = 1

'
y y

y G y G



'
y '
x x x x
r = -1 -1 < r < 0
G
y


' x x
y r=0 y 
'
G G
y  y
Dunod. La photocopie non autorise est un dlit.

x x x x
0 < r < +1 r = +1

Figure 3.6 Positions respectives des droites des moindres carrs selon les valeurs de r

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES 81


P067-102-9782100549412.fm Page 82 Mercredi, 24. novembre 2010 9:53 09

E. Le coefficient r et la qualit de lajustement linaire


Comment juger la qualit de lajustement linaire ? Il est clair que si le coefficient
r est voisin de 0, il faut rejeter lajustement linaire, mais pour quelles valeurs de
r, le considre-t-on de bonne qualit ? Cest une question importante, et beaucoup
dexemples montrent quon ne peut pas tablir de rgles de dcision partir du
seul examen de la valeur de r. Moyennant certaines hypothses dont il ne faut
pas oublier dexaminer la validit, la formalisation du modle linaire (qui
dpasse le cadre de ce livre) rpond partiellement la question.
Un rsum numrique est insuffisant pour rendre compte de la pertinence
dune liaison linaire. Pour sen convaincre, on se reportera aux rsultats de
F. J. Anscombe (cf. figure 3.7) : pour quatre sries de 11 observations simul-
tanes de deux variables X et Y, on obtient la mme valeur du coefficient de
corrlation linaire { r = 0,82} et la mme droite des moindres carrs
{y = 3 + 0,5x}, mais lexamen graphique montre que lajustement linaire
nest adapt quau premier cas.

I II III IV
X Y X Y X Y X Y
10,0 8,04 10,0 9,14 10,0 7,46 8,0 6,58
8,0 6,95 8,0 8,14 8,0 6,77 8,0 5,76
13,0 7,58 13,0 8,74 13,0 12,74 8,0 7,71
9,0 8,81 9,0 8,77 9,0 7,11 8,0 8,84
11,0 8,33 11,0 9,26 11,0 7,81 8,0 8,47
14,0 9,96 14,0 8,10 14,0 8,84 8,0 7,04
6,0 7,24 6,0 6,13 6,0 6,08 8,0 5,25
4,0 4,26 4,0 3,10 4,0 5,39 8,0 12,50
12,0 10,84 12,0 9,13 12,0 8,15 19,0 5,56
7,0 4,82 7,0 7,26 7,0 6,42 8,0 7,91
5,0 5,68 5,0 4,74 5,0 5,73 8,0 6,89

I II III IV
10 10 10 10

5 5 5 5

10 20 10 20 10 20 10 20
Figure 3.7 Extrait de F. J. Anscombe : Graphs in Statistical Analysis ,
adapt avec la permission de The American Statistician, 27 (February 1973), 17-21,
American Statistician Association

Lajustement linaire de la srie de la composition minrale en fluorures


et sodium (mg/l) de 21 eaux minrales gazeuses ( cf. tableau 3.5) ne peut que
renforcer lide de la ncessit dune tude graphique.

82 INTRODUCTION LA MTHODE STATISTIQUE


P067-102-9782100549412.fm Page 83 Mercredi, 24. novembre 2010 9:53 09

Tableau 3.5 Donnes extraites du journal Que Choisir ?, n 422 bis, 2005

Eau minrale Fluorures Sodium

Arcens 1,3 439


Arvie 0,9 650
Badoit 1 150
Beckerich 0,6 34
Chteauneuf 3 651
Eau de Perrier 0,05 11,5
Faustine 2 230
La Salvetat 0,25 7
Perrier 0,05 11,5
Puits St-Georges 0,5 434
Pyrnes 0,05 31
Quzac 2,1 255
San Pellegrino 0,6 35
St-Diry 0,3 385
St-Jean 1,1 228
St-Pierre 1,7 383
St-Yorre 9 1 708
Vernet 1,3 120
Vernire 0,05 154
Vichy-Clestins 5 1 172
Wattwiller 1,6 3

Moyenne 1,55 338

cart-type 2,03 417

Le coefficient de corrlation linaire entre les deux composants minraux


est gal 0,90. Cette valeur assez proche de 1 peut conduire considrer que
la droite des moindres carrs ( cf. figure 3.8) permet dvaluer approximati-
vement la teneur Y en sodium en fonction de la teneur X en fluorures :
Dunod. La photocopie non autorise est un dlit.

s
Y 185X + 51 puisque r ----Y- 185 et y 185x 51
sX

Mais la reprsentation graphique du nuage des 21 points ( cf. figure 3.8)


montre deux points caractriss par une minralit particulirement leve :
Vichy-Clestins et Saint-Yorre .
La reprsentation des botes de distribution des deux variables Fluorures
et Sodium (cf. figure 3.9) confirme que ces deux eaux minrales ont respec-
tivement des valeurs loigne et extrme pour les deux composants
minraux (chapitre 1, IV).

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES 83


P067-102-9782100549412.fm Page 84 Mercredi, 24. novembre 2010 9:53 09

Sodium

2 100

1 800

1 500

1 200

900

600

300

0
0 1 2 3 4 5 6 7 8 9 10
Fluorures
Figure 3.8 Nuage des 21 eaux minrales gazeuses et droite des moindres carrs

10 2 000
St-Yorre
*
St-Yorre
8 *
1 500

6 Vichy-Clestins
Vichy-Clestins
1 000

500
2

0 0

Fluorures Sodium
Figure 3.9 Botes de distribution des deux composants Fluorures et Sodium

84 INTRODUCTION LA MTHODE STATISTIQUE


P067-102-9782100549412.fm Page 85 Mercredi, 24. novembre 2010 9:53 09

En supprimant ces deux points et en ralisant lajustement sur les


19 autres points, on obtient :
r 0,50 a = 129 et b = 96
Le coefficient r est pass de 0,9 0,5, et il faut aussi remarquer que les
coefficients de la droite des moindres carrs sont passs respectivement de
185 129 et de 51 96.87
Quel crdit apporter un ajustement pour lequel deux points ont une telle
influence ? On est donc oblig dabandonner lide dune relation linaire
entre les deux composants minraux.
Cet exemple nous montre que le calcul du coefficient de corrlation
linaire doit toujours tre complt par un examen graphique.
Lanalyse exploratoire des donnes propose dautres mthodes et dautres
coefficients pour lajustement linaire. Voici un exemple de coefficient pro-
pos pour la mesure de la qualit de lajustement et pouvant tre considr
comme un quivalent du carr du coefficient de corrlation linaire qui,
rappelons-le, peut tre ainsi dfini :
n

( y y )
2
i i
i=1
r 2 = 1 ------------------------------
n
2
(y y )
i=1
i

Le deuxime terme de cette galit peut tre interprt comme le rapport


de la variance des carts ( y i y i ), puisque ceux-ci sont de moyenne nulle,
la variance des yi . Lanalyse exploratoire des donnes propose de mesurer
les dispersions de ces quantits par leur tendue interquartile , do le
coefficient :
EIQ ( y i y i )
1 -----------------------------
-
EIQ ( y i )
Dunod. La photocopie non autorise est un dlit.

Si les points du nuage sont aligns, ce coefficient est gal 1, et plus la


dispersion des carts la droite sera faible (cest le cas lorsque lajustement
linaire du nuage est adapt), plus il sera proche de 1. Pour lajustement des
donnes Eaux minrales gazeuses ralis par la mthode des moindres
carrs, ce coefficient est gal : 1 221/400  0,45
Au cas o lexamen graphique naurait pas t fait, cette valeur trs dif-
frente de 1 doit amener remettre en cause lajustement linaire.
Tous ces rsultats montrent quil ne faut jamais conclure sur la dpen-
dance entre deux variables quantitatives au seul examen de la valeur du coef-
ficient de corrlation linaire.

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES 85


P067-102-9782100549412.fm Page 86 Mercredi, 24. novembre 2010 9:53 09

Dautre part, lorsquune liaison linaire entre deux variables a t mise en


vidence par ltude dune srie de n observations sur ce couple, il faut bien
se garder de conclure une relation de cause effet entre ces variables sans
en avoir examin attentivement la signification : une corrlation voisine de 1
entre la taille (en cm) et la note un contrle de mathmatiques pour un
groupe de 12 lves ne doit pas amener conclure que plus on est grand,
mieux on russit en mathmatiques !
Lexamen graphique, ainsi que celui de la signification des variables, sont
des complments indispensables linformation donne par la valeur du
coefficient de corrlation linaire.
Dans le cas dobservations non connues individuellement et dont la dis-
tribution est donne dans un tableau de contingence , le coefficient de corr-
lation linaire et les droites des moindres carrs sont calculs partir des
formules pondres. Cependant, si le groupement de donnes quantitatives
en classes a lavantage de permettre de prsenter la distribution sous une
forme synthtique et de pouvoir en dduire des profils en ligne ou en
colonne, il constitue une perte dinformation quil est prfrable dviter de
rpercuter sur les calculs du coefficient de corrlation linaire et des coeffi-
cients des droites des moindres carrs.
Nous avons expos la mthode des moindres carrs pour lajustement
dun nuage de points par une droite qui est la fonction analytique la plus sim-
ple, mais cette mthode peut se gnraliser un ajustement par dautres fonc-
tions analytiques. Les logiciels proposent des ajustements par un polynme
du second degr, une fonction exponentielle Cest lexamen graphique qui
donne une indication sur le type de fonction adopter. On peut aussi dans
certains cas transformer une des deux variables ou les deux variables avant
denvisager une relation linaire.

III. Une variable qualitative


et une variable quantitative

Soient n observations portant simultanment sur une variable qualitative X


k modalits {x1, , xi , , xk} et sur une variable quantitative Y l modalits
{y1, , yj , , yl}.

86 INTRODUCTION LA MTHODE STATISTIQUE


P067-102-9782100549412.fm Page 87 Mercredi, 24. novembre 2010 9:53 09

A. Mesure de la liaison par le rapport de corrlation


1) Dfinition du rapport de corrlation
Pour les ni (i = 1, , k) observations de chaque modalit xi de la variable X,
on calcule la moyenne conditionnelle y i et la somme des carrs des carts
la moyenne ( cf. tableau 3.6). On supposera tous les effectifs ni (ou les fr-
quences fi = ni/n) non nuls, cette hypothse impliquant la suppression des
modalits pour lesquelles on ne dispose pas dobservations.
Tableau 3.6 Caractristiques de Y conditionnellement X
pour les donnes des tableaux 2 et 3

n 2
Modalit de X ni yi n ij ( y ij yi )
j=1

Filire A 37 5,16 496,91


Filire B 25 6,44 368,25
Filire C 16 12,31 293,44
Filire D 22 6,68 340,78
k
La moyenne y i tant la moyenne de Y pour X = xi , on a y =
(I.C), et pour notre exemple, y = 6,96 i=1
fi yi
On dfinit la Somme des Carrs Intraclasse , la Somme des Carrs Inter-
classe et la Somme des Carrs Totale :
k l k
SC intra = n ij ( x ij yi ) 2 SC inter = n (y y )
i i
2

i=1j=1 i=1
k l
SC tot = n ij ( y ij y )2
i=1j=1

On montre que : SCtot = SCintra + SCinter


Dunod. La photocopie non autorise est un dlit.

Le rapport de corrlation Y2 / X de Y en x est ainsi dfini :


SC inter
Y2 / X = -------------
-
SC tot

2) Interprtation du rapport de corrlation


Ce rapport est toujours positif et infrieur ou gal 1. Il est gal 0 si la
somme des carrs interclasse est nulle, cest--dire si les moyennes condition-
nelles y i sont toutes gales y , mais cette condition nest pas suffisante
lindpendance des variables X et Y.

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES 87


P067-102-9782100549412.fm Page 88 Mercredi, 24. novembre 2010 9:53 09

Si une variable quantitative Y est indpendante dune variable qualitative X,


alors leur rapport de corrlation est nul, mais la rciproque nest pas vraie :

X et Y indpendantes 2 = 0
Y /X

Le rapport de corrlation est gal 1 si la somme des carrs intraclasse


est nulle, donc si chaque modalit x i de X, correspond une seule valeur de
Y gale y i
Dans ce cas, la variable Y est lie fonctionnellement la variable X.

Y2 / X = 1 chaque xi , correspond une seule valeur de Y


Y lie fonctionnellement X

Pour les donnes du tableau 3.6 :


SCinter = SCtot SCintra = 2 086 1 499,38 = 586,62 Y2 / X = 0,28
Lexamen du tableau 3.3 des profils en ligne montre la dpendance entre
la filire dorigine et la note, rsultat en accord avec la valeur 0,28
Considrons maintenant une variable qualitative X 3 modalits et une
variable quantitative Y (discrte ou continue) rapporte 2 valeurs ( cf.
tableau 3.7). Les observations portent sur n individus : n11 + n22 + n31 = n :
Tableau 3.7 Tableau de contingence avec calculs des moyennes conditionnelles de Y

Y
y1 y2 yi
X
x1 n11 0 y1
x2 0 n22 y2
x3 n31 0 y1

Pour ces donnes :


{ X = xi Y = yi pour i = 1, 2, 3 } Y2 / X = 1
et ce rsultat ne dpend pas des valeurs de y1, y2, n11, n22 et n31. Quelles que
soient ces valeurs, la variable Y est lie fonctionnellement la variable X.
Supposons maintenant que X soit une variable quantitative rapporte
3 valeurs ainsi dfinies :
x1 = 1 x2 = 4 x3 = 6
et que les effectifs soient les suivants ( cf. tableau 3.8) :
n11 = 20 n22 = 50 n31 = 30

88 INTRODUCTION LA MTHODE STATISTIQUE


P067-102-9782100549412.fm Page 89 Mercredi, 24. novembre 2010 9:53 09

Tableau 3.8 Valeurs particulires pour les effectifs du tableau 3.7

Y
y1 y2 yi
X

1 20 0 y1
4 0 50 y2
6 30 0 y1

xj 4 4

La variable X tant quantitative, on peut aussi calculer le rapport de cor-


rlation de X en y. Les moyennes conditionnelles de X tant gales, la somme
des carrs interclasse est nulle et le rapport de corrlation Y2 / X est nul.
Il y a donc absence de corrlation entre la variable X et toute fonction de
Y. Cet exemple montre quon peut avoir la fois Y li fonctionnellement X
et absence de corrlation entre X et toute fonction de Y.
On remarquera que le rapport de corrlation Y2 / X de cet exemple est nul
quelles que soient les valeurs n11, n22, n31 et x1, x2, x3 telles que les moyennes
x 1 et x 2 soient gales, cest--dire si :
n 11 x 1 + n 31 x 3
- = x2
------------------------------
n 11 + n 31

B. Comparaison du coefficient de corrlation linaire


et des rapports de corrlation
Si la variable X est une variable quantitative k modalits, on peut repr-
senter graphiquement les moyennes conditionnelles y i en fonction des moda-
lits de la variable X. On obtient k points quon peut joindre, dans lordre,
par des segments de droite. On appelle la ligne brise obtenue courbe de
rgression de Y en x (cf. figure 3.10).
Dunod. La photocopie non autorise est un dlit.

yk

yi

y1

x1 xi xk
Figure 3.10 Courbe de rgression de Y en x

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES 89


P067-102-9782100549412.fm Page 90 Mercredi, 24. novembre 2010 9:53 09

Dans ce cas o X et Y sont toutes les deux des variables quantitatives, on


peut calculer le rapport de corrlation X2 /Y de X en y (gnralement non gal
Y2 / X ) et tracer la courbe de rgression de X en y .
Disposant de n observations portant simultanment sur deux variables
quantitatives, on peut aussi calculer leur coefficient de corrlation linaire et
on montre quon a toujours la relation suivante entre les rapports de corrla-
tion et le coefficient de corrlation linaire :
0 r 2 min ( X2 /Y ; Y2 / X ) max ( X2 /Y ; Y2 / X ) 1
Si lun des rapports de corrlation est nul, alors le coefficient de corrla-
tion linaire lest aussi. Le lecteur peut vrifier que cest le cas pour lexem-
ple du tableau 3.8, et il peut constater un nouvel exemple de deux variables
non indpendantes avec un coefficient de corrlation linaire nul.
Si Y2 / X = 0 , toutes les moyennes conditionnelles de Y sont gales et la
courbe de rgression de Y en x est une droite parallle laxe des
abscisses ; et rciproquement, si X2 /Y = 0 , les moyennes conditionnelles
de X sont gales et la courbe de rgression de X en y est une droite paral-
lle laxe des ordonnes.
Si r 2 = Y2 / X , alors les moyennes conditionnelles y i sont lies aux moda-
lits xi par une relation linaire, et la courbe de rgression de Y en x est une
droite qui nest autre que la droite des moindres carrs  de Y en x :
r 2 = Y2 / X y i = a + bx i
et symtriquement, si r 2 = X2 /Y , alors la courbe de rgression de X en y
nest autre que la droite des moindres carrs  de X en y.

IV. Deux variables qualitatives


Les donnes relatives aux observations portant simultanment sur deux
variables qualitatives X et Y sont gnralement prsentes dans un tableau de
contingence ( cf. tableau 3.1), ou dans un tableau de profils en ligne ou en
colonne (cf. tableaux 3.3 et 3.4).
condition de disposer des effectifs marginaux , on peut retrouver le
tableau de contingence partir dun tableau de profils en ligne ou en colonne.
La question qui se pose est celle de lexistence dune liaison entre les
deux caractres X et Y. On a vu que sils sont statistiquement indpendants
dans lensemble des n individus considrs ( I.D) :
ni n j
fij = fi f j n ij = ----------------
-
n
pour tous les couples ( i , j) tels que i = 1, , k et j = 1,, l

90 INTRODUCTION LA MTHODE STATISTIQUE


P067-102-9782100549412.fm Page 91 Mercredi, 24. novembre 2010 9:53 09

Dans le cas o les observations ne portent pas sur la population totale,


mais sur une partie de la population appele chantillon, on ne peut pas con-
clure lindpendance de X et Y par le seul examen des relations dindpen-
dance, leur non-vrification sur un chantillon pouvant tre due au fait que
les observations ne sont pas exhaustives ; autrement dit, il faut tenir compte
des fluctuations dchantillonnage.
La comparaison des effectifs thoriques (ou attendus ) sous lhypo-
ni n j
thse dindpendance n ij* = ----------------
- et des effectifs observs n ij donne une
n
ide de la dpendance entre X et Y. Mais pour tre plus prcis, il convient de
calculer lcart entre ces effectifs thoriques et observs.
Pour des raisons thoriques, la mesure usuellement adopte est celle du
2 (khi-deux) qui peut tre considre comme un coefficient dassociation
entre deux variables :
( n ij n ij* ) 2 ( fij fij* ) 2 n*
2 = i, j
-----------------------
n ij*
- = n
i, j
------------------------
fij*
- avec : fij = fi f j = -----ij
n
Le 2 est nul lorsque les effectifs thoriques et observs concident, et
plus les effectifs thoriques et observs diffrent, plus sa valeur est leve.
Une autre mesure de la dpendance est le coefficient dassociation 2
2
(phi-deux) de Pearson gal ----- . Ce coefficient ne dpend donc pas de la
n
taille n de la population :

( fij fij* ) 2
2 = i, j
------------------------
fij*
-

Les valeurs de ces mesures d association entre deux variables peuvent


permettre de comparer plusieurs groupes dobservations sur un mme couple
de variables.
Dunod. La photocopie non autorise est un dlit.

Reprenons les donnes du tableau 3.8 en considrant maintenant les varia-


bles X et Y comme des variables qualitatives et calculons les effectifs thori-
ques (ceux-ci sont crits entre parenthses dans le tableau 3.9) :

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES 91


P067-102-9782100549412.fm Page 92 Mercredi, 24. novembre 2010 9:53 09

Tableau 3.9 Calcul des effectifs thoriques du tableau 3.8

Y y1 y2 ni
X

x1 20 0 20
(10) (10)

x2 0 50 50
(25) (25)

x3 30 0 30
(15) (15)

nj 50 50 100

Les valeurs des mesures dassociation 2 et 2 sont les suivantes :

( n ij n ij* ) 2 2 ( fij fij* )2


2 = -----------------------
i, j n *
ij
- = 100 et 2 = ----- =
n
------------------------
i, j f *
ij
- = 1

V. Bilan
La mesure de lassociation de deux variables dpend de leur nature. Lorsque
les observations de deux variables quantitatives sont suffisamment nombreu-
ses pour tre prsentes dans un tableau de contingence, on peut traiter lune
delles comme une variable qualitative ou mme les deux variables comme
des variables qualitatives. Leur association peut se mesurer par le coefficient
de corrlation linaire , les rapports de corrlation et le khi-deux.
Pour les donnes du tableau 3.8, les deux variables X et Y ne sont pas
indpendantes, mais :
elles sont linairement indpendantes puisque r = 0
il y a absence de corrlation entre X et toute fonction de Y puisque
X2 /Y = 0
la variable Y est lie fonctionnellement la variable X puisque Y2 / X = 1
Lanalyse conjointe de deux variables est un problme trs dlicat ; il faut
bien examiner les donnes avant de conclure lindpendance, et en cas de
liaison, il convient de ne pas conclure htivement une relation de cause
effet sans stre pench sur sa signification concrte.

92 INTRODUCTION LA MTHODE STATISTIQUE


Dunod. La photocopie non autorise est un dlit.

On noubliera pas les diffrents modes dtudes de la liaison de deux variables selon leur nature

Nature des variables et prsentation des donnes tude de la liaison entre deux variables X et Y

X et Y quantitatives : Calcul du coefficient de corrlation linaire :


n couples (xi , yi), ou tableau de contingence ( X, Y )
r = cov
------------------------ avec : 1 r + 1
s X sY
Calcul et reprsentation graphique des deux droites des moindres carrs :
s 1 s
y y = r ----Y- ( x x ) y y = --- ----Y- ( x x )
sX r sX
Elles se coupent au point moyen ( x , y )

Y quantitative et X qualitative k modalits k


(ou quantitative avec k classes de valeurs) ni ( yi y ) 2
i=1 SC inter
-
Calcul du rapport de corrlation de Y en x : Y2 / X = ------------------------------------- = ---------------
Pour chaque modalit xi de X, on dispose de : SC tot SC tot
P067-102-9782100549412.fm Page 93 Mercredi, 24. novembre 2010 9:53 09

ni = nbre de valeurs de Y associes {X = xi} Si X est une variable quantitative classe, graphique de la courbe de rgression
moyenne conditionnelle y i pour {X = xi} de Y en x qui joint les points (xi , yi )

X et Y quantitatives classes : Calcul des rapports de corrlation de Y en x et de X en y : Y2 / X et X2 /Y


tableau de contingence
Graphiques de la courbe de rgression de Y en x qui joint les points (xi , yi ),
les valeurs xi tant ordonnes, et de la courbe de rgression de X en y qui joint
les points ( x j , yj), les valeurs yj tant ordonnes.

X qualitative, Y qualitative : * *
( n n )2
ij ij ( fij fij ) 2

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES


tableau de contingence Calcul du khi-deux : 2 = -
-------------------------
*
-
= n --------------------------

i, j n ij i, j fij*

93
P067-102-9782100549412.fm Page 94 Mercredi, 24. novembre 2010 9:53 09

Testez-vous (les rponses sont donnes page 284)


Il y a au moins une rponse exacte par question.

1. Le coefficient de corrlation linaire entre deux variables statistiques :


a) ne peut tre calcul que si les deux variables sont quantitatives
b) est un nombre positif ou nul
c) est gal 0 si les variables sont indpendantes
d) est un nombre sans dimension

2. Deux variables statistiques X et Y sont lies par la relation X + Y = 2, alors :


a) la somme de leur moyenne est gale 2
b) les carts-types des deux variables sont gaux
c) les deux droites des moindres carrs sont confondues
d) les deux droites des moindres carrs ont une pente positive

3. On dispose de deux observations {(2, 3) et ( 3, 1)} sur un couple ( X, Y) de


variables quantitatives :
a) les deux droites des moindres carrs sont confondues
b) le coefficient de corrlation linaire entre X et Y est gal + 1
c) la pente de la droite des moindres carrs de Y en x est ngative
d) on peut calculer le rapport de corrlation de X en y

4. On dispose pour 10 annes du nombre X dabonns au tlphone et du nom-


bre Y de botes dantalgiques (mdicament contre la douleur) vendues dans
une ville moyenne ; le coefficient de corrlation linaire calcul partir de ces
10 couples dobservations est gal 0,996 :
a) les deux variables X et Y sont lies par une relation linaire
b) pour diminuer la consommation dantalgiques, il suffit de refuser des abonnements
tlphoniques
c) les deux droites des moindres carrs sont quasi-confondues
d) les droites des moindres carrs ont des pentes ngatives

5. Sur une population, on a observ une variable quantitative X et une variable


qualitative Y trois modalits. La distribution est la suivante :

Y
y1 y2 y3
X
0 75 40 100 50
1 25 60 0 50
100 100 100 100

94 INTRODUCTION LA MTHODE STATISTIQUE


P067-102-9782100549412.fm Page 95 Mercredi, 24. novembre 2010 9:53 09

a) ce tableau est un tableau de contingence


b) la variable X a une moyenne gale 0,5
c) on peut mesurer la liaison entre X et Y par un rapport de corrlation
d) si les profils en colonne taient tous identiques, alors X et Y seraient indpendantes

6. Le tableau suivant donne la distribution de deux variables statistiques X et Y :

Y
0 3 4
X
0 20 20 0
1 10 40 10

a) la moyenne conditionnelle x 1 est gale 1/3


b) les moyennes conditionnelles de X sobtiennent partir du tableau des profils en
colonnes
c) la moyenne x est gale la somme des moyennes conditionnelles x 1
d) les moyennes conditionnelles de Y sobtiennent partir du tableau des profils en
lignes

7. Le tableau suivant donne la distribution conjointe de deux variables


quantitatives X et Y :

Y
0 1
X
1 a 10
1 10 b

a) si a = 20 et b = 5, alors le coefficient de corrlation linaire r est nul


b) si a = 0 et b = 0, alors r = 1
c) si a = 0 et b = 10, alors r = 1
d) si a = 10 et b = 10, alors r = 0

8. Pour dfinir un tableau de contingence deffectif total n k lignes et


Dunod. La photocopie non autorise est un dlit.

l colonnes :
a) il suffit de connatre les effectifs marginaux
b) il suffit de connatre k (l 1) lments du tableau
c) il suffit de connatre k (l 1) lments du tableau et les sommes en lignes
d) il suffit de connatre ( k 1) (l 1) lments du tableau et ses marges

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES 95


P067-102-9782100549412.fm Page 96 Mercredi, 24. novembre 2010 9:53 09

9. Parmi un groupe de 100 malades qui se plaignent de ne pas bien dormir, cer-
tains ont pris un somnifre sous forme de cachet, dautres ont pris un cachet
de sucre ; tous pensaient prendre un somnifre. Aprs la nuit, on leur a
demand si le cachet avait t efficace. Le tableau suivant donne la rparti-
tion des rponses (on suppose que tous les malades ont dit la vrit) :

Ont bien dormi Nont pas bien dormi


Somnifre 26 6
Sucre 48 20

a) ce tableau est un tableau de contingence


b) parmi les malades qui ont pris un somnifre, 26 % ont bien dormi
c) pour calculer le 2, il faut calculer les effectifs marginaux
d) le 2 est gal 1,284

10. Ce tableau donne la rpartition des salaris et non-salaris par sexe pour les
actifs de 15 ans ou plus ayant un emploi et vivant en France mtropolitaine :

Hommes Femmes

Non-salaris 13,4 7,3

Salaris 86,6 92,7

Intrimaires 2,8 1,4


Apprentis 1,7 0,9
Contrats dure dtermine 6,0 10,8
Contrats dure indtermine 76,1 79,6

100,0 100,0

Total des emplois (milliers) 13 670 12 243


Source : INSEE, enqutes Emploi du 1er au 4e trimestre 2008.
a) les femmes plus souvent salaries que les hommes
b) la rpartition entre les statuts salaris et non-salaris est indpendante du sexe
c) pour lensemble des hommes et des femmes, il y a 20,7 % de non-salaris
d) pour lensemble des hommes et des femmes, il y a 89,5 % de salaris

96 INTRODUCTION LA MTHODE STATISTIQUE


P067-102-9782100549412.fm Page 97 Mercredi, 24. novembre 2010 9:53 09

Exercices (corrigs page 300)


Exercice 3.1
Une tude mene par un groupe de compagnies dassurances auprs de 30 000 assu-
rs pour le risque vhicules moteur a permis de dterminer les proportions (en
pourcentage) dassurs correspondant la puissance fiscale , note X, du vhicule
assur et au kilomtrage parcouru au cours de la dernire anne, not Y. Les rsultats
sont reports dans le tableau suivant :

Y (milliers de km)
< 10 [10 ; 20[ [20 ; 30[ [30 ; 40[ 40
X (chevaux
fiscaux)
4 4,4 1,6
56 7,2 8,2 4,0 2,6
78 2,4 7,2 13,6 14,4 4,4
9 10 2,4 11,6 6,0
> 10 4,4 5,6

1. Prcisez la population tudie, les caractres tudis et leur nature.


2. Donnez la distribution du kilomtrage parcouru. Comment sappelle cette
distribution ? Calculez sa moyenne et son cart-type en supposant que tous les
assurs ont fait au moins 2 000 km et au plus 50 000 km. Dterminez la mdiane.
3. Donnez la distribution, en pourcentage, du kilomtrage parcouru par les posses-
seurs dune voiture dune puissance fiscale dau plus 6 CV. Quel est le type de
cette distribution ?
Calculez sa moyenne et son cart-type.

Exercice 3.2
Dans une entreprise, on tudie la rpartition de 100 salaries femmes ( cf. tableau 1)
et 140 salaris hommes ( cf. tableau 2) selon le salaire mensuel brut X exprim en
euros et lanciennet Y exprime en annes.
Dunod. La photocopie non autorise est un dlit.

Tableau 1 Salaries femmes

Y
[0 ; 4[ [4 ; 8[ [8 ; 12[ [12 ; 20[ [20 ; 28]
X
[1 200 ; 1 800[ 12 10 10 8
[1 800 ; 2 200[ 8 14 5 4 4
[2 200 ; 3 000[ 6 5 6 3
[3 000 ; 4 200] 2 3

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES 97


P067-102-9782100549412.fm Page 98 Mercredi, 24. novembre 2010 9:53 09

Tableau 2 Salaris hommes

Y
[0 ; 4[ [4 ; 8[ [8 ; 12[ [12 ; 20[ [20 ; 28]
X
[1 200 ; 1 800[ 10 6
[1 800 ; 2 200[ 4 9 18 8 8
[2 200 ; 3 000[ 4 8 16 12 4
[3 000 ; 4 200] 5 8 8 12

1. Dfinissez la population tudie, lunit statistique, les caractres tudis et leur


nature.
2. Quel pourcentage de femmes gagnent moins de 2 200 parmi les femmes qui ont
moins de 8 ans danciennet ?
3. Calculez la moyenne et lcart-type du salaire des femmes, ainsi que la moyenne
et lcart-type du salaire des hommes. En dduire le salaire moyen de lensemble
des 240 salaris.
4. Calculez la moyenne et lcart-type de lanciennet des femmes.
5. Reprsentez le graphe des frquences cumules de la distribution marginale de
lanciennet des femmes.
6. Calculez la distribution (en pourcentage) de lanciennet des femmes gagnant au
moins 1 800 .
7. On considre la distribution conjointe du salaire et de lanciennet des cent sala-
ris femmes. Sachant que le coefficient de corrlation entre X et Y est gal
0,45 pour cette distribution, donnez lquation de la droite des moindres carrs de
Y en X. Quel est le point dintersection de cette droite avec lautre droite des moin-
dres carrs de X en Y ?

Exercice 3.3
Le tableau suivant donne les pourcentages de variation par rapport la priode pr-
cdente du produit intrieur brut (prix constants) et de la consommation finale prive
(prix constants) en France ( source : http://stats.oecd.org/)

Anne 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999

PIB 2,6 1,0 1,4 0,9 2,2 2,1 1,1 2,2 3,5 3,3

Consommation 2,5 0,6 1,0 0,4 1,4 1,7 1,6 0,4 3,9 3,5

Anne 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009

PIB 3,9 1,9 1,0 1,1 2,5 1,9 2,2 2,3 0,4 2,2

Consommation 3,6 2,6 2,4 2,0 2,5 2,6 2,4 2,5 1,0 0,8

1. Calculez les sries des indices, base 1989, du PIB et de la Consommation prive.
Calculez le coefficient de corrlation linaire entre les indices du PIB et de
la consommation prive.

98 INTRODUCTION LA MTHODE STATISTIQUE


P067-102-9782100549412.fm Page 99 Mercredi, 24. novembre 2010 9:53 09

2. Peut-on considrer qu'il y a approximativement une liaison linaire entre les indi-
ces de volume du PIB et de la Consommation prive ? Calculez lquation de la
droite des moindres carrs expliquant lindice de la Consommation prive en fonc-
tion de lindice du PIB.
Reprsentez le nuage des 21 points avec la droite des moindres carrs.
Quelle est la part de variation de l'indice de la consommation prive explique par la
relation linaire ?
3. Calculez le coefficient de corrlation linaire entre les variations du PIB et de la
Consommation prive. Calculez lquation de la droite des moindres carrs expli-
quant la variation de la Consommation prive en fonction de la variation du PIB.
Reprsentez le nuage des 20 points avec la droite des moindres carrs.
4. Vous semble-t-il plus intressant d'analyser la liaison entre les variations du PIB
et celles de la Consommation prive qu'entre les indices du PIB et de la Consom-
mation prive ? Si oui, pourquoi ?

Exercice 3.4
Une entreprise a effectu un sondage auprs de sa clientle pour connatre son appr-
ciation sur le service livraison. Les rsultats ont t les suivants :

Pas du Plutt
Plutt Trs
tout pas
satisfait satisfait
satisfait satisfait
Clients de plus de 2 ans danciennet 10 50 245 195
Clients dau plus 2 ans danciennet 40 90 205 165

1. Calculez le pourcentage total de clients plutt satisfaits ou trs satisfaits.


2. Calculez le pourcentage de clients de plus de 2 ans danciennet parmi les clients
plutt satisfaits ou trs satisfaits.
3. Donnez le tableau des profils en ligne.
4. Donnez le tableau de contingence obtenu en regroupant :
dune part les clients pas du tout satisfaits et plutt pas satisfaits ;
Dunod. La photocopie non autorise est un dlit.

et dautre part les clients plutt satisfaits et trs satisfaits.


5. Si les 2 caractres taient indpendants, combien aurait-on de clients de plus de
2 ans danciennet dans la catgorie plutt satisfait ou trs satisfait ?
Daprs examen de juin 2001, GEA 1re anne Paris IX-Dauphine.

Exercice 3.5
Lobservation des quantits offertes sur un march de raisin de table et des prix de
vente a donn les rsultats suivants :

Quantit X la vente (tonnes) 100 120 84 78 87 80 110 95

Prix moyen Y par kg (euros) 1,60 1,40 1,95 2,10 1,75 2,25 1,50 1,80

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES 99


P067-102-9782100549412.fm Page 100 Mercredi, 24. novembre 2010 9:53 09

1. Calculez le coefficient de corrlation linaire entre X et Y.


2. Dterminez lquation de la droite des moindres carrs de Y en X. Sans faire de
calcul, donnez le signe de la pente de la droite des moindres carrs de X en Y.
3. On admet que la valeur du prix moyen Y par kg en fonction de la quantit la
vente X est dtermine par lquation trouve la question 2.
La recette globale correspondant la vente de la totalit du raisin est-elle une fonc-
tion constamment croissante de x ?
Sinon, quelle est la valeur critique xc que les producteurs ont intrt ne pas
dpasser ?

Exercice 3.6
Le tableau suivant, extrait de la revue Synthses, Revenus et patrimoine des
mnages (INSEE, n 19, 1998), donne la rpartition (en %) des mnages selon leur
niveau de vie et leur type socio-conomique.

Niveau de vie
Infrieur Du 1er dcile Du 3e quartile au Au moins gal
(en F/uc/mois)
au 1er dcile au 3e quartile 9e dcile au 9e dcile Ensemble
< 3 700 [3 700 ; 9 933[ [9 933 ; 13 900[ 13 900
Type socio-conomique

Communes agricoles 22 13 7 5 12
18 70 8 4 100

Communes et quartiers ouvriers 41 41 31 22 37


11 71 12 6 100

Communes et quartiers 28 34 39 32 34
des classes moyennes tertiaires 8 65 17 9 100

Communes et quartiers 3 5 11 13 7
techniques trs qualifis 5 51 25 19 100

Quartiers hupps 6 6 12 28 9
6 44 20 30 100

Ensemble 100 100 100 100 100


10 65 15 10 100

uc : unit de consommation.
Lecture : 30 % des habitants des quartiers hupps appartiennent au 10e dcile de niveau de vie (cest--dire parmi les
10 % des mnages les plus aiss). Et 28 % des mnages du 10e dcile habitent dans des quartiers hupps.
Champ : mnages hors tudiants.
Source : Enqute Logement 1996, INSEE.

1. Prcisez la population tudie, lunit statistique, les caractres et leur nature.


2. Quels types de distributions avez-vous dans ce tableau ? crire les deux tableaux
de distributions conditionnelles.
3. Donnez la valeur mdiane du niveau de vie en F/uc/mois des mnages appartenant
aux Quartiers hupps .
4. Proposez un indicateur de disparit des niveaux de vie pour lensemble des mna-
ges. Donnez sa valeur.
5. Parmi les mnages ayant un niveau de vie suprieur au 3 e quartile (mnages qui
se situent parmi les 25 % ayant le niveau de vie le plus lev, soit plus de

100 INTRODUCTION LA MTHODE STATISTIQUE


P067-102-9782100549412.fm Page 101 Mercredi, 24. novembre 2010 9:53 09

9 933 F/uc/mois), quel pourcentage habite dans un quartier hupp ou dans un


quartier technique trs qualifi .
6. Calculez la distribution (en %) du niveau de vie en F/uc/mois des mnages appar-
tenant aux communes et quartiers techniques trs qualifis ou aux quartiers
hupps .

Exercice 3.7
Le tableau suivant donne la distribution de 200 tudiants selon leur note dexamen X
en conomie et leur note dexamen Y en Statistique.

Y
[5 , 7[ [7 , 9[ [9 , 11[ [11 , 13[ [13 , 15[ [15 , 17[ [17 , 19]
X
[5 , 7[ 7 3 2
[7 , 9[ 2 12 12 2
[9 , 11[ 1 10 18 8 2
[11 , 13[ 7 15 21 10 1
[13 , 15[ 11 12 13 5
[15 , 17[ 1 3 10 7 1
[17 , 19] 1 1 2

1. Calculez les rapports de corrlation de Y en x, et de X en y.


2. Tracez la courbe de rgression de Y en x.
3. Peut-on calculer une autre mesure de la liaison des variables X et Y ?

Exercice 3.8
Reprenons les donnes relatives aux 21 eaux minrales gazeuses (cf. tableau 3.5). On
recode la variable X (fluorures) en trois classes et la variable Y (sodium) en quatre
classes, de la faon suivante :
Dunod. La photocopie non autorise est un dlit.

C1X [0 ; 1[ C1Y [0 ; 100[

C2X [1 ; 2[ C2Y [100 ; 300[

C3X [2 ; 9] C3Y [300 ; 500[

C4Y [500 ; 2 000]

1. crire un tableau qui a pour premire colonne les eaux minrales, pour deuxime
colonne la variable XC (variable X recode) gale au numro de classe dans le
recodage de X, et pour troisime colonne la variable YC (variable Y recode) gale
au numro de classe dans le recodage de Y.

DISTRIBUTIONS STATISTIQUES DEUX CARACTRES 101


P067-102-9782100549412.fm Page 102 Mercredi, 24. novembre 2010 9:53 09

2. Construire le tableau de la distribution conjointe des variables XC et YC (XC en


ligne et YC en colonne). Donnez le tableau des profils en ligne associ.
3. Les variables XC et YC sont-elles indpendantes ? (justifiez votre rponse)
4. Donnez le tableau de distribution de la variable XC sachant que Y est suprieur
300 mg/l. Comment sappelle cette distribution ?

Exercice 3.9
Soit les donnes trimestrielles suivantes relatives des souscriptions de contrats
dassurance vie de fin mars 2000 fin dcembre 2002 :

Y = Nombre
t de contrats
souscrits
400
1 117 350
2 178
Nombre de contrats

300
3 149
250
4 189
200
5 145
150
6 173
100
7 170
223 50
8
0
9 223
0 1 2 3 4 5 6 7 8 9 10 11 12 t
10 281
Reprsentation graphique
11 285
12 339

Tous les rsultats de cet exercice seront donns avec une prcision de deux dcimales.
1. Calculez le taux trimestriel moyen de croissance du nombre de contrats souscrits.
2. On ajuste cette srie par le modle linaire : Y = a t + b.
2.1. Calculez les coefficients de ce modle par la mthode des moindres carrs.
2.2. Quelle est la part de variation de Y non explique par le modle ?
3. On ajuste maintenant cette srie par le modle quadratique : Y = at2 + b.
3.1. Calculez les coefficients de ce modle par la mthode des moindres carrs.
3.2. Quelle est la part de variation de Y non explique par ce nouveau modle ?
4. Quel modle choisissez-vous ? (justifiez votre rponse)
Daprs examen de juin 2006, DUGEAD 1re anne Paris-Dauphine.

102 INTRODUCTION LA MTHODE STATISTIQUE


P103-130-9782100549412.fm Page 103 Mercredi, 24. novembre 2010 10:14 10

4. Sries chronologiques
et prvision
U
ne srie chronologique ou chronique est constitue par une
suite ordonne dobservations dune grandeur au cours du
temps. Ltude de ces sries intresse tous ceux qui dsirent
dcrire, expliquer, contrler, prvoir des phnomnes voluant au cours
du temps.

I. lments constitutifs dune srie chronologique


Ltude dune srie chronologique { xt , t = 1, , T} consiste dissocier les
diffrents mouv ements qui la composent et les analyser . Cette dcom-
position est une construction de lesprit puisque les sries composantes sont
des concepts abstraits et ne peuv ent pas tre directement observes. Une
reprsentation graphique simpose en dbut danalyse de toute chronique an
de faire apparatre les lments fondamentaux.
Les intervalles entre deux observations successives sont supposs de
mme longueur. Dans la pratique, cette hypothse est rarement ralise.
Pour des sries mensuelles de productions, de ventes, le nombre de jours
ouvrables de chaque mois varie : le nombre de dimanches dans le mois, les
Dunod. La photocopie non autorise est un dlit.

jours de certaines ftes mobiles ne sont pas les mmes chaque anne. Pour
que ces variations ne soient pas intgres dans la composante rsiduelle du
modle, on corrige les donnes en adoptant une correction proportionnelle
qui consiste pour des donnes mensuelles, par exemple, ramener chaque
mois un mme nombre thorique de jours.

A. La tendance long terme


La tendance long terme ou trend, note ft , est le f acteur reprsentant
lvolution long terme de la grandeur, et traduit laspect gnral de la srie :

SRIES CHRONOLOGIQUES ET PRVISION 103


P103-130-9782100549412.fm Page 104 Mercredi, 24. novembre 2010 10:14 10

croissance de la consommation dlectricit, croissance du trac arien,


diminution de la population rurale, par exemple.
Pour de longues sries, un mouvement cyclique peut se superposer la
tendance. La composante cyclique lie la succession des phases du cycle
conomique (prosprit, dpression, reprise), a donn lieu jusquau milieu du
XXe sicle de multiples travaux, mais nest plus actuellement lobjet dun
intrt aussi marqu.

B. Le mouvement saisonnier
Le facteur saisonnier, not st , se rpte intervalles de temps gaux avec une
forme peu prs constante. Il peut tre d au rythme des saisons ou des
facteurs humains. Sa priode est de 12 pour des sries mensuelles, de 4 pour
des sries trimestrielles
Si p dsigne la priode du mouvement saisonnier : st = st + p = st + 2p =
Le facteur saisonnier est donc totalement dtermin par p coefficients
saisonniers :
s1 , , sj , , sp

C. Les irrgularits
Cette composante, appele aussi mouvement rsiduel et note et , re groupe
tout ce qui na pas t pris en compte par la tendance et le f acteur saisonnier.
Elle est la rsultante de uctuations irrgulires et imprvisibles dues des
facteurs perturbateurs non permanents ; ces uctuations sont supposes de
faible amplitude et de moyenne nulle sur un petit nombre dobserv ations
conscutives.

D. Les perturbations
Les perturbations sont des uctuations ponctuelles de forte amplitude. Elles
sont dues, par e xemple, une grv e, des conditions mtorologiques
exceptionnelles pour lagriculture, un krach nancier Il con vient de les
liminer avant tout traitement de la srie . Les mthodes pour le f aire sont
simples ; pour faire comme si ces vnements na vaient pas eu lieu, les
instruments pri vilgis sont linterpolation et la rgle de tr ois. La
reprsentation de la srie chronologique des Voyageurs RATP de 1995
2002 ( cf. gure 4.1) montre une baisse importante du nombre de v oyageurs
en dcembre 1995 due une longue grv e. Avant destimer les composantes
de cette chronique, il est ncessaire de corriger la v aleur 0,19 milliard de
voyageurs-km de ce mois de dcembre en la remplaant, par e xemple par la

104 INTRODUCTION LA MTHODE STATISTIQUE


P103-130-9782100549412.fm Page 105 Mercredi, 24. novembre 2010 10:14 10

moyenne des mois de dcembre 1994 et 1996 (resp. 1,06 et 0,95 milliards de
voyageurs-km), soit 1 milliard de voyageurs-km.
On traite gnralement des sries deux composantes : tendance et mou-
vement rsiduel, ou trois composantes : tendance, mouvement saisonnier
et mouvement rsiduel. Les observations dune chronique possdant une
composante saisonnire peuvent tre disposes dans un tableau selon les
deux dimensions du temps, annuelle et mensuelle (ou trimestrielle), comme
pour les tableaux 4.1, 4.2 et 4.4. Cette prsentation, introduite par C. Buys-
Ballot en 1847, est appele table de Buys-Ballot .

II. Les modles de composition dune srie


chronologique
La dcomposition dune srie chronologique possdant un mouv ement
saisonnier peut seffectuer selon trois types de modles :
modle additif xt = ft + st + et t = 1, , T
modle multiplicatif xt = ft (1+ st) (1+ et) t = 1, , T
modle mixte xt = ft (1+ st) + et t = 1, , T
On choisit un modle multiplicatif ou mixte si le mouvement saisonnier
prsente des amplitudes proportionnelles la tendance.
Notons quune transformation logarithmique du modle multiplicatif
ramne au modle additif :
log ( x t ) = log f t ( 1 + s t ) ( 1 + e t ) log ( f t ) + log ( 1 + s t ) + e t

puisque log ( 1 + e t ) e t
Nous nenvisagerons de mthodes de dcomposition que pour les modles
Dunod. La photocopie non autorise est un dlit.

additif et multiplicatif.
Pour le mouvement saisonnier de priode p, on fait lhypothse dune
compensation exacte sur une priode entre les variations saisonnires positi-
ves et les variations saisonnires ngatives, sinon, le partage entre le facteur
saisonnier et la tendance serait indtermin :
p

s j = 0
j=1
Quand on analyse une srie chronologique, le premier problme est le
suivant : la srie prsente-t-elle des variations saisonnires et si oui, quel est
le schma de composition le mieux adapt ?

SRIES CHRONOLOGIQUES ET PRVISION 105


P103-130-9782100549412.fm Page 106 Mercredi, 24. novembre 2010 10:14 10

On commence par reprsenter la srie graphiquement. Si la srie prsente des


variations saisonnires, les points hauts (maxima) ainsi que les points bas
(minima), sont toujours distants du mme nombre de dates, ce nombre tant la
priode du mouvement saisonnier. La chronique reprsente la figure 4.1 a une
composante saisonnire de priode 12 (srie mensuelle), et la chronique reprsen-
te la figure 4.2 a une composante saisonnire de priode 4 (srie trimestrielle).

Tableau 4.1 Voyageurs RATP (milliards de voyageurs/km)


Anne Moyenne
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Mois mensuelle
Janvier 1,04 0,91 0,98 1,01 1,05 1,09 1,14 1,18 1,22 1,21 1,08
Fvrier 0,93 0,95 0,89 0,91 0,98 0,99 1,00 1,09 1,06 1,12 0,99
Mars 1,06 0,94 1,02 1,07 1,13 1,17 1,19 1,23 1,24 1,31 1,14
Avril 0,89 0,93 0,96 0,98 1,01 1,00 1,02 1,11 1,08 1,15 1,01
Mai 0,98 0,92 0,94 0,94 0,99 1,12 1,10 1,12 1,01 1,18 1,03
Juin 1,01 0,94 0,97 1,01 0,99 1,03 1,12 1,16 1,04 1,26 1,05
Juillet 0,79 0,85 0,86 0,88 0,90 0,99 0,99 1,08 1,01 1,07 0,94
Aot 0,65 0,62 0,65 0,67 0,71 0,76 0,79 0,80 0,76 0,84 0,73
Septembre 0,87 0,92 0,93 1,00 1,02 1,04 1,05 1,12 1,14 1,2 1,03
Octobre 0,98 1,07 1,08 1,10 1,14 1,20 1,21 1,28 1,27 1,31 1,16
Novembre 0,83 0,96 0,99 1,04 1,05 1,14 1,14 1,16 1,16 1,24 1,07
Dcembre 0,19 0,95 1,00 1,08 1,07 1,14 1,09 1,18 1,23 1,28 1,02
Moyenne
0,85 0,91 0,94 0,97 1,00 1,06 1,07 1,13 1,10 1,18 1,02
annuelle

Source : www.insee.fr

Tableau 4.2 Indices de valeur des produits alimentaires (base 2000)


Anne Moyenne
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Mois mensuelle
Janvier 62,2 68,4 69,4 76,1 78,5 75,9 87,0 87,8 90,3 96,0 79,2
Fvrier 64,7 67,2 70,7 79,3 76,3 79,1 82,5 89,1 90,1 93,9 79,3
Mars 81,3 77,9 78,9 92,4 99,0 99,7 98,7 99,9 102,7 117,5 94,8
Avril 72,4 83,3 87,1 92,7 90,1 88,5 89,6 103,0 108,9 118,2 93,4
Mai 85,3 85,0 84,6 91,8 90,8 103,8 100,7 100,0 103,1 108,1 95,3
Juin 84,5 85,8 86,3 98,3 100,5 98,6 102,6 103,6 116,4 133,6 101,0
Juillet 89,0 90,4 95,0 99,9 102,9 95,0 101,4 110,8 125,2 130,9 104,1
Aot 82,5 81,1 88,6 93,3 102,4 108,1 107,7 107,6 117,6 125,0 101,4
Septembre 89,1 86,5 98,0 102,7 110,4 113,9 105,9 112,4 121,7 130,3 107,1
Octobre 85,1 92,9 101,7 96,0 104,0 105,3 111,0 119,8 125,8 118,4 106,0
Novembre 91,9 90,9 96,2 106,3 118,6 119,7 122,8 126,9 127,8 141,5 114,3
Dcembre 88,5 98,5 101,5 107,3 111,9 112,6 107,8 122,5 134,8 142,3 112,8
Moyenne
81,4 84,0 88,2 94,7 98,8 100,0 101,5 107,0 113,7 121,3 99,0
annuelle

Source : www.insee.fr

106 INTRODUCTION LA MTHODE STATISTIQUE


P103-130-9782100549412.fm Page 107 Mercredi, 24. novembre 2010 1:08 13

Figure 4.1 Reprsentation graphique de la chronique du tableau 4.1


Dunod. La photocopie non autorise est un dlit.

Figure 4.2 Reprsentation graphique de la chronique du tableau 4.2

Pour choisir le modle de composition , on peut relier par une courbe (ou
plutt par une ligne brise) les maxima distants dune priode p et faire de
mme avec les minima.
Si ces deux courbes sont peu prs parallles, alors le facteur saisonnier
a des amplitudes peu prs constantes, cest--dire quil affecte la ten-
dance indpendamment de son niveau, et le schma additif est adapt.

SRIES CHRONOLOGIQUES ET PRVISION 107


P103-130-9782100549412.fm Page 108 Mercredi, 24. novembre 2010 1:09 13

Cest le cas de la chronique des Voyageurs RATP de 1995 2004


(cf. figure 4.1).
Sinon, on reprsente la chronique sur un papier ordonne logarithmique
(chapitre 2, IV.A). Si les deux courbes reliant les extrema sont peu prs
parallles, alors le facteur saisonnier a des amplitudes peu prs proportion-
nelles la tendance, cest--dire que les effets des variations saisonnires
sont proportionnels au niveau atteint par la tendance, et le schma multipli-
catif est adapt. Cest le cas de la chronique des Indices de valeur des
produits alimentaires de 1995 2004 ( cf. figures 4.2 et 4.3).

Figure 4.3 Reprsentation de la chronique du tableau 4.2


avec une ordonne logarithmique

Le modle multiplicatif convient dans la plupart des cas puisque dune


part, leffet saisonnier est gnralement proportionnel la tendance, et que
dautre part, dans le cas dune chronique tendance faiblement croissante o u
faiblement dcroissante, les deux schmas sont quasiment quivalents. Cest la
raison pour laquelle on nvoque bien souvent que le modle multiplicatif.

III. Analyse de la tendance


A. Ajustement de la tendance par une fonction analytique
Les logiciels spcialiss (SPSS), mais aussi les tableurs (Excel ),
proposent des fonctions analytiques pour ajuster la tendance, lajustement se

108 INTRODUCTION LA MTHODE STATISTIQUE


P103-130-9782100549412.fm Page 109 Mercredi, 24. novembre 2010 10:14 10

faisant par la mthode des moindres carrs (mthode qui minimise les carts
quadratiques entre modle et observ ations). Citons quelques-uns de ces
modles :
modle linaire : y(t) = a + b t
modle quadratique : y(t) = a + b t + c t 2
modle exponentiel : y(t) = exp (a + b t), ce type de modle convient
des quantits voluant taux constant puisque y(t + 1) = exp(b) y(t)
( y (t + 1) = c y(t) o c est constant)
modle logarithmique : y(t) = a + b ln (t)
modle S (courbe sigmode ) : y(t) = exp(a + b/t), ce type dajuste-
ment convient la description du cycle de vie de certains produits.
Ces mthodes analytiques sont simples, mais reposent sur lhypothse
dune tendance voluant selon une fonction analytique dtermine, hypothse
quon ne peut pas frquemment faire, mme la suite dune transformation
de variable.
En labsence de rfrence un modle prcis pour la tendance, on prf-
rera utiliser une mthode non-paramtrique qui filtre la tendance en liminant
le facteur saisonnier tout en rduisant les irrgularits. Dans la suite, nous
appellerons filtre une sorte de bote noire rgularisant une chronique X en
la transformant en une chronique Y qui est une approximation de la compo-
sante tendancielle de la chronique X :

X
filtre
Y
Nous tudierons deux des principaux filtres linaires qui sont la moyenne
mobile et le lissage exponentiel simple. Un filtre linaire est une application
linaire de lensemble des chroniques dans lui-mme transformant la chroni-
que X en une nouvelle chronique Y de la faon suivante :
yt = x
kK
k t+k avec K et k = 1
kK
Dunod. La photocopie non autorise est un dlit.

Le choix du filtre linaire appropri certains objectifs se fait par linter-


mdiaire du choix de ses coefficients k

B. Dfinition dune moyenne mobile


On appelle moyennes mobiles centres de longueur p (p < T) de la srie
{xt , t = 1, , T} les moyennes successives calcules en fonction de la parit
de p selon les formules qui suivent.

SRIES CHRONOLOGIQUES ET PRVISION 109


P103-130-9782100549412.fm Page 110 Mercredi, 24. novembre 2010 10:14 10

1
+m
Premier cas, p impair, p = 2m + l : M p ( t ) = ---
p k = m
x t+k
Il y a ( T p + 1) moyennes mobiles centres de longueur impaire p.
Deuxime cas, p pair, p = 2m :

1 xt m x t + m
m1
M p ( t ) = --- ---------
p 2
-+ x t + k + ----------
k = m+1
2
-

La moyenne mobile centre M2m(t) apparat comme la moyenne pondre


de valeurs de la srie encadrant la date t avec les coefficients de pondration
1 1
gaux ------ pour les deux valeurs extrmes xt m et xt + m et gaux --- pour
2p p
les (p 2) valeurs intermdiaires xt m + 1 xt + m 1 .
Elle comporte donc ( p + 1) termes :

Valeurs x xt m + 1 . xt . xt + m 1 xt + m
tm

1 1 . 1 . 1 1
Pondrations ------ --- --- --- ------
2p p p p 2p

Il y a ( T p ) moyennes mobiles centres de longueur paire p.


Pour simplifier, la longueur p de la moyenne mobile tant fixe, on notera
dsormais yt la moyenne mobile centre de longueur p la date t.

C. Dtermination de la tendance par la mthode


des moyennes mobiles
Si une srie X est priodique de priode p, cest--dire si la srie rede vient
identique elle-mme tous les p termes, alors toute suite de mo yennes
mobiles de longueur p (diffrente de p) a pour priode p.
Dmontrons cette proprit dans le cas o p est impair ( p = 2m + 1).
Soit yt la moyenne mobile centre de longueur p la date t de la srie X,
montrons que la srie Y est de priode p :
+m +m
1 1 -

y t + p = --------------
2m+1 k = m
x t + p + k = -------------
2 m +1 k = mxt + k = yt

La dmonstration de cette proprit est laisse au lecteur pour le cas o p


est pair, et celui-ci pourra montrer en sus que lorsque la priode de la srie

110 INTRODUCTION LA MTHODE STATISTIQUE


P103-130-9782100549412.fm Page 111 Mercredi, 24. novembre 2010 10:14 10

X est gale la longueur de la moyenne mobile ( p' = p), les moyennes mobi-
les forment alors une suite de termes constants gaux la moyenne des ter-
mes de la srie X sur une priode.
La moyenne mobile centre de longueur p rend constantes les sries
priodiques de priode p.
Deux chroniques ont la mme suite de moyennes mobiles centres de
longueur p si leur diffrence est une srie priodique de priode p dont la
somme des termes sur une priode est nulle.
 Exemple
La chronique {xt , t = 1, ,12} du tableau 4.3 est priodique de priode
p = 4 ; les suites des moyennes mobiles de longueur 2, 3, 5 sont aussi
de priode 4, et la suite des moyennes mobiles de priode 4 est une suite
de termes constants gaux -1/4, moyenne des termes sur une priode.
Tableau 4.3 Calcul de moyennes mobiles

Soit C, la courbe joignant les points ( t , xt). Si la concavit de C est


tourne vers le haut, alors yt est suprieur xt pour tout t ; dans le cas
contraire, yt est infrieur xt pour tout t. Si C est une droite, yt est gal
xt pour tout t.
Dunod. La photocopie non autorise est un dlit.

En conclusion, la moyenne mobile centre transforme une srie aligne


en elle-mme et plus gnralement, une srie monotone faible cour-
bure en une srie peu diffrente.
La moyenne mobile transforme des carts dus des irrgularits ind-
pendantes, de moyenne nulle sur un petit nombre de dates successives
(par hypothse) et de mme variance en carts de variance plus faible;
on dit quelle a un effet de rabot , ou aussi quelle lisse la chro-
nique, en ce sens que la srie Y est moins disperse que la srie initiale
X. Mais les nouvelles irrgularits qui sont corrles entre elles, peuvent
faire apparatre des oscillations parasites qui ne figuraient pas dans la
srie initiale (effet de Slutsky-Yule).

SRIES CHRONOLOGIQUES ET PRVISION 111


P103-130-9782100549412.fm Page 112 Mercredi, 24. novembre 2010 10:14 10

Si la priode du mouvement saisonnier est gale p, alors la


moyenne mobile centre de longueur p est un filtre linaire qui limine
le mouvement saisonnier tout en rduisant lamplitude du mouvement
rsiduel. De plus, on montre que sa valeur yt la date t peut tre assi-
mile la tendance ft si celle-ci est faible courbure faible variation
dans le cas dun schma multiplicatif sur p dates conscutives.

D. Inconvnients de la mthode des moyennes mobiles


Un changement de niveau ou de pente de la tendance une date t entrane une
mauvaise approximation de cette composante pendant toute une priode
prcdant et sui vant cette date (gure 4.4). Cest la raison pour laquelle on
fait lhypothse dune tendance monotone faible courbure.

Figure 4.4 Reprsentation dune chronique et de ses moyennes mobiles centres de longueur 4

Si on dispose de T = np observations (n = nombre dannes et p = priode


du mouvement saisonnier) et si p est pair, on ne peut calculer que ( T p )
moyennes mobiles de longueur p. On ne disposera pas de valeurs pour la
tendance sur les p/2 dernires dates qui ne pourront pas tre prises en compte
pour une prvision.
Malgr ces inconvnients, on admettra que dans la plupart des cas, la
valeur ft de la tendance svalue par la moyenne mobile centre yt de lon-
gueur gale la priode du mouvement saisonnier.

112 INTRODUCTION LA MTHODE STATISTIQUE


P103-130-9782100549412.fm Page 113 Mercredi, 24. novembre 2010 10:14 10

IV. Correction des variations saisonnires


Si on tudie une chronique a vec v ariations saisonnires, lv aluation de la
tendance chaque date t par la mo yenne mobile centre de longueur
adquate, conduit pour chaque coefcient saisonnier plusieurs valeurs quil
faut rsumer. Pour bien comprendre toutes les oprations successi ves pour la
dtermination des coef cients saisonniers et de la srie corrige des
variations saisonnires, on se reportera lexemple trait au paragraphe 5.

A. Modle additif
Le modle est le suivant : xt = ft + st + et
On approxime la tendance ft par la moyenne mobile centre yt .
Soient n le nombre dannes et p la priode du facteur saisonnier :
T = np observations np p = p (n 1) moyennes mobiles si
p est pair ( cf. tableau 4.5).
Les coefficients saisonniers tant priodiques de priode p, on dispose
pour chacun des p coefficients saisonniers de ( n 1) valeurs qui sont ( n 1)
diffrences {xt yt}. On rsume ces ( n 1) valeurs par leur moyenne arith-
mtique, ou leur mdiane, ou leur moyenne arithmtique aprs limination
de la valeur la plus faible et de la valeur la plus leve (le logiciel SPSS
utilise ce dernier rsum).
Si la somme des coefficients saisonniers nest pas nulle sur une priode,
on corrige les coefficients saisonniers obtenus de faon avoir une somme
nulle :
p
1
st s t* = s t s avec s = ---
p s t
t=1

On appelle srie corrige des variations saisonnires (srie CVS) la srie


Dunod. La photocopie non autorise est un dlit.

des diffrences :
x t* = x t s t*
Pour toutes les dates pour lesquelles on dispose de la valeur de la
moyenne mobile, et donc dune valuation de la tendance, on peut calculer
lcart entre le modle et lobservation :
et = x t y t s t* = x t* yt
Si le modle est adapt, les valeurs absolues des carts ne doivent pas tre
leves, et leur somme voisine de zro.

SRIES CHRONOLOGIQUES ET PRVISION 113


P103-130-9782100549412.fm Page 114 Mercredi, 24. novembre 2010 10:14 10

B. Modle multiplicatif
Le modle est le suivant : xt = ft (l + st) (l + et)
Comme prcdemment, on approxime la tendance ft par la moyenne
mobile centre yt .
Les coefficients saisonniers tant priodiques de priode p, on dispose
pour chacun des p coefficients saisonniers de (n 1) valeurs qui sont ( n 1)
quotients {xt / yt}. On rsume ces ( n 1) valeurs par leur moyenne arithm-
tique, ou leur mdiane, ou leur moyenne arithmtique aprs limination de la
valeur la plus faible et de la valeur la plus leve (le logiciel SPSS utilise ce
dernier rsum).
Si la somme des (1 + st) nest pas gale p sur une priode, on fait une
correction proportionnelle :
p
1+s 1
1 + st 1 + s t* = -------------t
1+s
avec
s = --- s t
pt = 1
On tablit ensuite la srie corrige des variations saisonnires :
xt
x t* = -------------
-
1 + s t*
Dans le cas du modle multiplicatif, les coefficients saisonniers sexpri-
ment en pourcentage de la tendance. Ils ont une interprtation plus concrte
que ceux du modle additif.
Le modle multiplicatif prdit ainsi des valeurs y t ( 1 + s t* ) et il est alors
naturel, pour toutes les dates auxquelles on dispose de la valeur de la
moyenne mobile, et donc dune valuation de la tendance, de considrer les
rsidus et sous la forme :
xt x*
- 1 = ----t- 1
e t = ---------------------------
yt
y t 1 + s t*

Les carts entre le modle et les observations sont gaux :


x t y t ( 1 + s t* ) = y t ( 1 + s t* ) e t
Si le modle est adapt, les valeurs absolues des carts ne doivent pas tre
leves, et leur somme voisine de zro.

114 INTRODUCTION LA MTHODE STATISTIQUE


P103-130-9782100549412.fm Page 115 Mercredi, 24. novembre 2010 10:14 10

C. Autres approches
On peut chercher amliorer lv aluation de la tendance en repassant un
ltre mo yenne mobile sur la srie CVS. On choisit gnralement une
longueur assez faible pour cette nouvelle suite de moyennes mobiles : 5 ou 7
dans le cas dune srie de priode 12, et 3 dans le cas dune srie de priode
4. Avec cette nouv elle valuation de la tendance, on dtermine de nouv eaux
coefcients saisonniers et une nouv elle srie CVS. Cette mthode itrati ve
pourrait videmment tre poursuivie, mais le g ain devient peu prs nul au-
del de deux tapes.
On peut aussi remplacer la moyenne mobile centre par la mdiane mobile
centre qui est un filtre non linaire : au lieu de synthtiser une suite de valeurs
de la srie par une moyenne pondre, on les rsume par leur mdiane (par-
ticulirement aise dterminer la main avec p = 3). Les mdianes mobiles,
dveloppes par Tukey, sont robustes puisqutant fondes sur lutilisation
de statistiques dordre, elles liminent les valeurs singulires (chapitre 1,
III.B.4). Elles constituent des lisseurs aux proprits complmentaires des
moyennes mobiles. Certaines mthodes de dsaisonnalisation reposent sur
une association de ces deux types de lisseurs.
Disposant des coefficients saisonniers, on peut ajuster la srie CVS par
une fonction, faire une prvision pour la tendance en extrapolant cette fonc-
tion dajustement ou en utilisant une mthode de lissage exponentiel sur la
srie CVS ( VI). Mais, il ne faut pas oublier que ce mode de prvision ne
peut tre envisag que sur du court terme puisquil suppose une volution
future non perturbe par des changements sur lenvironnement.

V. Un exemple de dcomposition dune srie


chronologique
Dunod. La photocopie non autorise est un dlit.

Pour dterminer la tendance et les coef cients saisonniers dune chronique,


on peut actuellement utiliser un logiciel ou un tableur.
Nanmoins, une bonne comprhension des mthodes demande de les
avoir appliques. On va montrer les tapes successives du traitement de la
chronique des ventes trimestrielles en France dessences aviation
(cf. tableau 4.4).

SRIES CHRONOLOGIQUES ET PRVISION 115


P103-130-9782100549412.fm Page 116 Mercredi, 24. novembre 2010 10:14 10

Tableau 4.4 Ventes en France dessence aviation (en milliers de tonnes)


Trimestre Moyenne
1er trimestre 2e trimestre 3e trimestre 4e trimestre
Anne annuelle
2005 3,6 7,0 7,6 3,7 5,5
2006 3,6 6,7 7,4 3,9 5,4
2007 3,7 6,4 7,1 4,1 5,3
2008 3,6 5,7 7,1 3,7 5
Moyenne
3,7 6,5 7,6 3,9 5,3
trimestrielle

Source : Comit Professionnel du Ptrole

Figure 4.5 Chronique du tableau 4.4 et suite des moyennes mobiles de longueur 4

Une saisonnalit de priode 4 (nombre de trimestres dans lanne) appa-


rat sur la reprsentation graphique ( cf. figure 4.5), ce qui explique que la
suite des moyennes mobiles de longueur 4 filtre la tendance.
Pour une dcomposition de cette chronique, nous allons envisager succes-
sivement le modle additif et le modle multiplicatif.

A. Schma additif
Pour obtenir la srie CVS et la srie des rsidus, les calculs ont t raliss
laide du tableur Excel selon les tapes indiques (cf. tableau 4.5). Dans cet
exemple, la synthse des coef cients saisonniers a t ralise par la
moyenne.

116 INTRODUCTION LA MTHODE STATISTIQUE


P103-130-9782100549412.fm Page 117 Mercredi, 24. novembre 2010 10:14 10

Tableau 4.5 Dcomposition de la chronique du tableau 4.4 avec le schma additif

colonne C : moyennes mobiles de longueur 4 valuant la tendance


C4 =(B2/2 + SOMME(B3 : B5) + B6/2)/4, puis recopier vers le bas
colonne D : diffrence entre valeurs observes et tendance
D4 = B4 C4, puis recopier vers le bas
colonne E : E4 = (D4 + D8 + D12) / 3
E5 = (D5 + D9 + D13) / 3
E6 = (D6 + D10 + D14) / 3
E7 = (D7 + D11 + D15) / 3
premires valeurs des 4 coefficients saisonniers quon reporte sur
toute la colonne laide du collage spcial , option coller
Dunod. La photocopie non autorise est un dlit.

valeurs , puis recopier vers le bas


colonne F : calcul des coefficients saisonniers normaliss : F2 = E2 s
puis recopier vers le bas
colonne G : calcul de la srie CVS
G2 = B2 F2, puis recopier vers le bas
colonne H : calcul de la srie des carts ( IV.A)
H4 = G4 C4, puis recopier vers le bas

SRIES CHRONOLOGIQUES ET PRVISION 117


P103-130-9782100549412.fm Page 118 Mercredi, 24. novembre 2010 10:14 10

B. Schma multiplicatif
Comme pour le modle additif, les calculs ont t raliss laide du tableur
Excel (cf. tableau 4.6). La synthse des coef cients saisonniers a aussi t
ralise par la mo yenne. Les diffrences entre certains rsultats donns dans
le tableau 4.6 avec ceux obtenus par calcul direct, sont e xpliquer par le fait
que Excel utilise pour les calculs un grand nombre de dcimales.

Tableau 4.6 Dcomposition de la chronique du tableau 4.4


selon le schma multiplicatif

colonne C : moyennes mobiles de longueur 4 valuant la tendance


C4 = (B2/2 + SOMME(B3:B5) + B6/2)/4, puis recopier vers le bas
colonne D : quotient entre valeurs observes et tendance
D4 = B4 / C4, puis recopier vers le bas
colonne E : E4 = (D4 + D8 + D12) / 3
E5 = (D5 + D9 + D13) / 3
E6 = (D6 + D10 + D14) / 3
E7 = (D7 + D11 + D15) / 3
premires valeurs des 4 coefficients (1 + st) quon reporte sur toute
la colonne laide du collage spcial , option coller valeurs

118 INTRODUCTION LA MTHODE STATISTIQUE


P103-130-9782100549412.fm Page 119 Mercredi, 24. novembre 2010 10:14 10

colonne F : calcul des coefficients saisonniers normaliss : F2 = E2 s ,


puis recopier vers le bas
colonne G : calcul de la srie CVS
G2 = B2 / F2, puis recopier vers le bas
colonne H : calcul de la srie (1 + et)
H4 = G4 / C4, puis recopier vers le bas
colonne I : calcul de la srie et
I4 = H4 1, puis recopier vers le bas
colonne J : calcul de la srie des carts ( IV.B)
J4 = C4 F4 I4, puis recopier vers le bas
Les sries CVS induites par les deux modles de composition sont presque
confondues (cf. figure 4.6).

Figure 4.6 Sries CVS


Dunod. La photocopie non autorise est un dlit.

La reprsentation des sries des carts (colonne H du tableau 4.5 et


colonne J du tableau 4.6) permet de comparer les ajustements entre les deux
modles et les observations ( cf. figure 4.7). On constate que les deux sries
des carts sont presque confondues.

SRIES CHRONOLOGIQUES ET PRVISION 119


P103-130-9782100549412.fm Page 120 Mercredi, 24. novembre 2010 10:14 10

Modle multiplicatif Modle additif

Figure 4.7 carts entre les modles et les observations

VI. Les mthodes de lissage exponentiel


Les mthodes de lissage e xponentiel, dveloppes par R. G. Bro wn dans les
annes 60 1, sont des mthodes de xtrapolation qui donnent un poids
prpondrant aux v aleurs rcentes. Elles se caractrisent, en outre, par la
simplicit des calculs et le petit nombre des donnes garder en mmoire.

A. Le lissage exponentiel simple


Cette mthode de prvision sapplique des chroniques sans variations
saisonnires et tendance localement constante . On suppose la grandeur
observe caractrise par des variations irrgulires autour de la moyenne :
xt = a + et t =1, , T
Les sries conomiques prsentent souvent un niveau moyen qui volue
travers le temps. Pour la chronique reprsente la figure 4.4, il est clair
1. R. G. Brown, Smoothing, forecasting and prediction of discrete time series , Prentice Hall,
1962.

120 INTRODUCTION LA MTHODE STATISTIQUE


P103-130-9782100549412.fm Page 121 Mercredi, 24. novembre 2010 10:14 10

que le recours la moyenne arithmtique des observations conduirait sous-


valuer les valeurs futures. Il convient de donner aux observations les plus
rcentes un poids prpondrant.
La prvision x T ( h ) faite par la mthode de lissage exponentiel simple la
date T pour lhorizon h, cest--dire pour la date T + h, est la suivante :
T 1
x T ( h ) = (1 ) x
i=0
i
T i avec 0<<1

Le paramtre est la constante de lissage. Si T est lev, la somme des


pondrations est peu diffrente de 1, en effet :
T 1
1 ( 1 )T

i=0
( 1 ) i = ----------------------------- = 1 ( 1 ) T 1

et la prvision x T ( h ) apparat comme la moyenne pondre des valeurs
x1 , , xT . Cette prvision ne dpendant pas de lhorizon h, nous la noterons
dsormais x T
Cette mthode de prvision repose sur lide que les observations influen-
cent dautant moins la prvision quelles sont loignes de la date T. En
outre, on suppose cette dcroissance exponentielle. Plus la constante de
lissage est proche de 0, plus linfluence des observations passes remontera
loin dans le temps et plus la prvision sera rigide , cest--dire peu sensi-
ble aux fluctuations conjoncturelles. Au contraire, plus la constante de
lissage est voisine de 1, plus la prvision sera souple , cest--dire prin-
cipalement influence par les observations rcentes.

1) Autres interprtations de la mthode


On voit aisment que :
x T = ( 1 ) x T 1 + x T (1)
La prvision apparat comme la moyenne pondre entre la prvision
x T 1 faite la date T 1 et la dernire observation xT, le poids donn cette
Dunod. La photocopie non autorise est un dlit.

observation tant dautant plus fort que est plus lev.


Dans le cas o est gal 1 : x T = s T , ce qui signifie que la prvision
est gale la dernire valeur observe, on parle de prvision nave .
On peut encore crire :
x T = x T 1 + ( x T x T 1 ) (2)
La prvision apparat alors comme gale la prvision la date prc-
dente corrige dun terme proportionnel la dernire erreur de prvision.
Dans ces deux formules qui fournissent des mthodes lmentaires de
mise jour de la prvision, linformation apporte par le pass est rsume
dans x T 1

SRIES CHRONOLOGIQUES ET PRVISION 121


P103-130-9782100549412.fm Page 122 Mercredi, 24. novembre 2010 10:14 10

On peut montrer que la valeur de a qui minimise la quantit :


T 1

(1 ) ( x
i
T 1 a )2 (3)
i=0
est la suivante :
T 1

(1 ) x
i=0
i
T i

- x T
a = -----------------------------------------
1 ( 1 )T
La prvision sinterprte alors comme la constante qui sajuste le mieux
la srie au voisinage de T, lexpression au voisinage traduisant le
fait que dans la minimisation, linfluence des observations dcrot lorsquon
sloigne de la date T.
Cette dernire interprtation montre clairement que le lissage exponentiel
simple ne sapplique que si la chronique peut tre approche par une droite hori-
zontale au voisinage de T, ce qui implique une tendance localement constante.

2) Proprits du lissage exponentiel simple


1. La chronique lisse { x t , t = 1 , ,T } a une variance infrieure celle
de la chronique initiale { x t , t = 1 , ,T } Comme tout filtre, le lissage expo-
nentiel simple ralise un crtage des irrgularits de la srie.
2. Le lissage exponentiel simple est un filtre linaire.
3. De mme que la moyenne mobile, le lissage exponentiel simple
sadapte avec retard un changement de niveau de la chronique (cf. figures 4.4
et 4.8). Cest de la valeur de la constante de lissage que dpendent la sta-
bilit et le taux de rponse de la srie lisse, ces deux caractristiques ayant
un aspect complmentaire.

3) Mise en uvre de la mthode


a) Initialisation
La mthode du LES utilise laide des formules (1) ou (2) ncessite
linitialisation de lalgorithme. On prend gnralement x 1 gal x 1 ou x 1 gal
x (initialisation par df aut du logiciel SPSS), et il est clair que la v aleur
choisie pour x 1 aura dautant moins dinuence sur que T sera grand.

b) Choix de la constante de lissage


Ce choix peut se f aire selon des critres subjectifs de rigidit ou de
souplesse de la prvision. Mais une mthode plus objecti ve consiste
choisir minimisant :

122 INTRODUCTION LA MTHODE STATISTIQUE


P103-130-9782100549412.fm Page 123 Mercredi, 24. novembre 2010 10:14 10

soit l Erreur Quadratique Moyenne de prvision :


T 1
1
EQM = ------------
T 1t = 1
( x t + 1 x t ) 2

soit l Erreur Absolue Moyenne de prvision :


T 1
1
EAM = ------------
T 1t = 1
x t + 1 x t

Il ne faut pas manquer dexaminer aussi l Erreur Moyenne de prvision


qui peut indiquer dans certains cas une sous-valuation ou une survaluation
systmatique de la prvision qui sobserve dailleurs lexamen des graphi-
ques des sries initiales et lisses :
T 1
1
EM = ------------
T 1t = 1 ( x t + 1 x t )

La minimisation de ces critres peut tre faite sur toute la srie des
erreurs de prvision ou sur un pourcentage donn de ses derniers termes
(dans ce cas, on prend souvent le dernier tiers de la srie, tableau 4.7). Cer-
tains logiciels proposent actuellement les mthodes de lissage avec une
constante dtermine par la minimisation dun critre. Le logiciel SPSS
calcule la constante optimale en minimisant lErreur Quadratique Moyenne
de prvision.
Dunod. La photocopie non autorise est un dlit.

Figure 4.8 Chronique du tableau 4.6 et srie obtenue par LES avec = 0,4

SRIES CHRONOLOGIQUES ET PRVISION 123


P103-130-9782100549412.fm Page 124 Mercredi, 24. novembre 2010 10:14 10

Tableau 4.7 Prsentation des calculs du LES avec les critres calculs
sur le dernier tiers de la srie

= 0,4 = 0,5

t xt LES et ABS (et) (et)2 LES et ABS (et) (et)2

1 130
2 121 130,00 9,00 9,00 81,00 130,00 9,00 9,00 81,00
3 120 126,40 6,40 6,40 40,96 125,50 5,50 5,50 30,25
4 127 123,84 3,16 3,16 9,99 122,75 4,25 4,25 18,06
5 122 125,10 3,10 3,10 9,63 124,88 2,88 2,88 8,27
6 129 123,86 5,14 5,14 26,39 123,44 5,56 5,56 30,94
7 124 125,92 1,92 1,92 3,68 126,22 2,22 2,22 4,92
8 120 125,15 5,15 5,15 26,53 125,11 5,11 5,11 26,11
9 139 123,09 15,91 15,91 253,12 122,55 16,45 16,45 270,45
10 136 129,45 6,55 6,55 42,85 130,78 5,22 5,22 27,28
11 135 132,07 2,93 2,93 8,57 133,39 1,61 1,61 2,60
12 134 133,24 0,76 0,76 0,57 134,19 0,19 0,19 0,04
13 136 133,55 2,45 2,45 6,02 134,10 1,90 1,90 3,62
14 133 134,53 1,53 1,53 2,33 135,05 2,05 2,05 4,20
15 138 133,92 4,08 4,08 16,67 134,02 3,98 3,98 15,81
16 133 135,55 2,55 2,55 6,50 136,01 3,01 3,01 9,07
17 134,53 134,51

EM = EAM = EQM = EM = EAM = EQM =


0,64 2,27 6,42 0,12 2,23 6,55

Le tableau 4.8 donne, selon la constante de lissage variant par pas de


0,1, les valeurs des critres EM, EQM et EAM pour le LES appliques la
srie de la figure 4.8, ces critres ayant t calculs sur le dernier tiers de la
srie, cest--dire avec les cinq dernires erreurs de prvision.
Le critre EQM est minimum pour = 0,4, le critre EAM pour = 0,5
et la valeur absolue de lerreur moyenne est minimum pour = 0,5
Tableau 4.8 Valeurs des critres calculs sur le dernier tiers de la srie du tableau 4.7

Valeur de EM EQM EAM

0,1 4,548 25,311 4,548


0,2 2,931 14,068 3,101
0,3 1,545 8,151 2,495
0,4 0,643 6,421 2,274
0,5 0,125 6,547 2,227
0,6 0,148 7,361 2,449
0,7 0,280 8,436 2,648
0,8 0,339 9,670 2,833
0,9 0,369 11,095 3,012

124 INTRODUCTION LA MTHODE STATISTIQUE


P103-130-9782100549412.fm Page 125 Mercredi, 24. novembre 2010 10:14 10

B. Le lissage exponentiel double


Le lissage e xponentiel double est une gnralisation du lissage e xponentiel
simple au cas dune chronique tendance localement linaire ; on suppose
que la srie peut tre ajuste par une droite au voisinage de T :
xt = a1(T) + a2(T) ( t T)
Les coefficients a1(T) et a2(T) sont choisis de faon minimiser la quan-
tit suivante qui est lanalogue de la quantit (3) minimise pour le lissage
exponentiel simple :
2
T 1
( 1 ) x T i a 1 ( T ) + a 2 ( T ) ( i )
i

i=0
On obtient la solution suivante :

T 1
a 1 ( T ) = 2S 1 ( T ) S 2 ( T )

S1( T ) =


i=0
( 1 )i xT i
avec

- S 1 ( T ) S 2 ( T )
a 2 ( T ) = ----------- T 1
1 S2( T ) =


i=0
( 1 )i S1( T i )

ce qui conduit la prvision : x T ( h ) = a 1 ( T ) + a 2 ( T ) h

La quantit S1(T) rsultant du lissage exponentiel simple de la srie


{xt , t = 1, ,T} et la quantit S2(T) du lissage exponentiel simple de la
srie {S1 (t), t = 1, ,T } do le nom de lissage exponentiel double, on
dispose pour leurs calculs des formules de mise jour du LES :
Dunod. La photocopie non autorise est un dlit.

S1 ( T ) = xT + ( 1 ) S1 ( T 1 )

S2( T ) = S1 ( T ) + ( 1 ) S2 ( T 1 )
Linitialisation de ces formules de mise jour peut tre :

S1 ( 1 ) = x1

S2 ( 2 ) = S1 ( 2 )

SRIES CHRONOLOGIQUES ET PRVISION 125


P103-130-9782100549412.fm Page 126 Mercredi, 24. novembre 2010 10:14 10

En dveloppant les galits ci-dessus, on obtient les formules de mise


jour des coefficients a 1 ( T ) et a 2 ( T ) :

{
a 1 ( T ) = a 1 ( T 1 ) + a 2 ( T 1 ) + ( 1 ( 1 ) 2 ) x T x T 1 ( 1 )

= x T ( 1 ) 2 x T x T 1 ( 1 )

a 2 ( T ) = a 2 ( T 1 ) + 2 x T x T 1 ( 1 )

a 1 ( 2 ) = x 2
Linitialisation de ces formules peut tre :
a 2 ( 2 ) = x 2 x 1

Comme pour le lissage exponentiel simple, le choix de la constante de


lissage peut se faire par la minimisation dun critre choisi.

La mthode de Holt-Winters tend les mthodes de lissage exponentiel


aux sries saisonnires. Cest une mthode de prvision trs utilise.

126 INTRODUCTION LA MTHODE STATISTIQUE


P103-130-9782100549412.fm Page 127 Mercredi, 24. novembre 2010 10:14 10

Testez-vous (les rponses sont donnes page 286)


Il y a au moins une rponse exacte par question.

1. Pour une chronique 12 termes :


a) on peut calculer 8 moyennes mobiles centres de longueur 4
b) on peut calculer une moyenne mobile centre de longueur 12
c) on peut calculer 10 mdianes mobiles centres de longueur 3
d) on peut calculer 2 moyennes mobiles centres de longueur 11

2. Identification du modle de dcomposition adapt :


a) si le facteur saisonnier est proportionnel la tendance, on choisit le modle additif
b) si les deux courbes joignant respectivement les maxima et les minima sont quasi-
parallles sur un graphique ordonne logarithmique, on choisit le modle multipli-
catif
c) si les maxima de la courbe reprsentative de la chronique sont distants de 5 dates,
on choisit le modle additif
d) on peut toujours ramener un modle multiplicatif un modle additif

3. Si une chronique X a une composante saisonnire de priode p, alors :


a) les moyennes mobiles centres de longueur 2 p liminent la saisonnalit
b) on peut approximer la tendance par la suite des moyennes mobiles centres de
longueur p
c) la somme de p termes successifs de X donne une approximation de la moyenne de
la tendance
d) on peut toujours calculer ( T p) moyennes mobiles centres de longueur p si elle
a T termes

4. Une prvision par lissage exponentiel simple :


a) tient dautant plus compte des valeurs rcentes de la srie que la constante est
faible
Dunod. La photocopie non autorise est un dlit.

b) peut senvisager pour une chronique possdant une composante saisonnire


c) ne peut pas senvisager pour une chronique possdant une tendance la hausse
d) sadapte dautant plus rapidement un changement de niveau de la chronique que
est leve

SRIES CHRONOLOGIQUES ET PRVISION 127


P103-130-9782100549412.fm Page 128 Mercredi, 24. novembre 2010 10:14 10

Exercices (corrigs page 309)


Exercice 4.1
On dispose aussi de la rpartition mensuelle du niveau de lindice de la qualit de
lair ATMO dans lagglomration parisienne selon trois classes de niveau pour les
six annes agrges.
Frquences mensuelles dapparition des indices de 1998 2003

Niveau 14 57 8 10 Nombre total de jours

Janvier 164 22 0 186


Fvrier 136 29 4 169
Mars 151 35 0 186
Avril 152 28 0 180
Mai 132 54 0 186
Juin 115 65 0 180
Juillet 123 59 4 186
Aot 93 83 10 186
Septembre 155 25 0 180
Octobre 155 31 0 186
Novembre 172 8 0 180
Dcembre 177 9 0 186

Nombre total de jours 1725 448 18 2191

Lgende : Niveau 1 4 : trs bon bon.


Lgende : Niveau 5 7 : moyen mdiocre.
Lgende : Niveau 8 10 : mauvais trs mauvais.

On sintresse la classe de niveau 5 7 .


1. Reprsentez graphiquement son volution au cours des 12 mois.
2. Calculez la suite des moyennes mobiles de longueur 3 et reprsentez-la sur le
mme graphique. Quelle proprit de la moyenne mobile venez-vous dillustrer ?

Exercice 4.2

t 1 2 3 4 5 6 7 8 9 10 11 12

xt 3 1 51 3 15 1 3 15 1

1. Calculez les suites des moyennes mobiles de longueurs 2, 3, 4 et 5.


Quelles sont les proprits de la moyenne mobile qui sont illustres par cet
exemple ?
2. Soit la chronique zt = 10 2t + xt , calculez la suite des moyennes mobiles de
longueur 4 de la nouvelle srie zt

128 INTRODUCTION LA MTHODE STATISTIQUE


P103-130-9782100549412.fm Page 129 Mercredi, 24. novembre 2010 10:14 10

Exercice 4.3
Le tableau suivant donne la srie chronologique bimestrielle du transport des voya-
geurs sur le rseau Air France International (en milliards de passagers-km) de 2002
2005.

Janv.-Fv Mars-Avril Mai-Juin Juil.-Aot Sept.-Oct. Nov.-Dc.

2002 13,3 15,1 14,8 16,3 14,8 14,2


2003 13,8 14,2 14,1 17,0 15,2 14,8
2004 14,4 16,0 16,2 18,5 16,2 15,3
2005 15,4 16, 8 17,4 19,9 17,9 17,4

Source : www.insee.fr

1. On choisit de modliser cette chronique par un schma additif. Justifiez ce choix.


2. Dterminez la tendance de cette chronique par la suite des moyennes mobiles de
longueur adapte, et reprsentez-la sur le mme graphique que la srie initiale.
3. Calculez les coefficients saisonniers.
4. Calculez la srie corrige des variations saisonnires. Ajustez cette chronique par
une droite en utilisant la mthode des moindres carrs.
5. Au vu des rsultats, quelles prvisions pouvait-on faire fin 2005 pour janvier-
fvrier, mars-avril et mai-juin 2006 ?
6. Sachant quon a observ 17,2 milliards de passagers-km en janvier-fvrier 2006,
18,5 en mars-avril et 18,6 en mai-juin, calculez lerreur absolue moyenne de pr-
vision.
Exercice 4.4
1. Voici pour ses trois premiers mois douverture, le nombre de places xt vendues
par semaine par le cinma PARADISO (t dsignant le numro de la semaine varie
de 1 12) :

t 1 2 3 4 5 6 7 8 9 10 11 12

xt 3 428 3 295 3 376 3 195 3 573 3 334 3 434 3 300 3 703 3 411 3 545 3 327
Dunod. La photocopie non autorise est un dlit.

1. Reprsentez cette chronique graphiquement. A-t-elle une composante saisonnire ?


Si oui, de quelle priode ?
2. Calculez la suite des moyennes mobiles de longueur approprie pour valuer la
tendance de la srie chronologique. Reprsentez cette suite sur le graphique pr-
cdent.
3. On choisit un modle multiplicatif. valuez les coefficients saisonniers.
4. Calculez la srie corrige des variations saisonnires (srie CVS) et reprsentez-la
sur le graphique prcdent. Calculez la srie des rsidus.
5. Ajustez la srie CVS par une droite en utilisant la mthode des moindres carrs.
Reprsentez cette droite sur le graphique prcdent.
6. Donnez une prvision pour le nombre de places vendues pendant les deux pre-
mires semaines du quatrime mois.

SRIES CHRONOLOGIQUES ET PRVISION 129


P103-130-9782100549412.fm Page 130 Mercredi, 24. novembre 2010 10:14 10

Exercice 4.5
La demande dun certain article a t releve au cours de 15 mois conscutifs :

Mois 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Demande 37 41 39 40 42 39 41 39 42 41 40 42 43 40 42

1. Appliquez un lissage exponentiel simple cette srie chronologique en


prenant = 0,6 jusquau 6e mois inclus et = 0,3 pour les mois suivants. Tracez
sur le mme graphique la chronique initiale et la srie lisse.
2. Justifiez le changement de valeur de la constante de lissage .
3. Calculez lerreur moyenne, lerreur absolue moyenne et lerreur quadratique
moyenne.
4. Donnez les prvisions de la demande pour les trois mois suivants.

Exercice 4.6
Le tableau ci-dessous donne les valeurs des indices trimestriels (base 2000) de la pro-
duction industrielle des boissons pour les annes 2002 2005 :

1er trimestre 2e trimestre 3e trimestre 4e trimestre

2002 194,2 105,3 103,5 127,5


2003 198,3 103,8 115,7 125,5
2004 100,9 110,7 106,6 126,3
2005 198,7 109,8 110,8 129,4

Source : www.insee.fr

1. Commentez lvolution de cette srie chronologique en utilisant sa reprsentation


graphique. Justifiez le recours un schma de composition additif.
2. Dterminez la tendance de cette chronique par la suite des moyennes mobiles de
longueur adapte, et reprsentez-la sur le mme graphique que la srie initiale.
3. Calculez les coefficients saisonniers et la srie corrige des variations saison-
nires.
4. Appliquez un lissage exponentiel simple la srie CVS avec = 0,3.
5. Quelles prvisions pouvait-on faire au dernier trimestre 2005 pour les deux pre-
miers trimestres 2006 ? Sachant que cet indice a pris les valeurs 100,8 et 110,8
pour les 1 er et 2 e trimestres 2006, calculez lerreur moyenne et lerreur absolue
moyenne de prvision.

130 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 131 Mercredi, 24. novembre 2010 10:19 10

5. M odle probabiliste
et variable alatoire
Il ne faut donc pas se demander si nous percevons vraiment un monde, il faut se dire au
contraire : le monde est cela que nous percevons.
Phnomnologie de la perception, Maurice Merleau-Ponty (1908-1961)

L
a statistique descriptive permet de rsumer les mesures dune ou
plusieurs grandeurs obtenues sur les individus dun chantillon ou
dune population par un classement (tri simple dans le cas dune
seule variable, tri crois dans le cas de plusieurs variables). Une grandeur
est alors dcrite par sa distribution, qui est dtermine partir des obser-
vations, justifiant ainsi le nom de distribution empirique de la grandeur
(ou de la variable). Cest la reprsentation de base pour apprcier
une grandeur aprs quelle a t classe.
Lobservation de nombreuses distributions empiriques montre pour cer-
taines dentre elles des analogies de formes, et des caractristiques voi-
sines. Ceci conduit dfinir des distributions thoriques afin de disposer
dinstruments plus formels regroupant les proprits. Ces distributions
thoriques sont une abstraction destine non pas simplement prsen-
ter les donnes, mais les interprter ou les expliquer. Ce paralllisme
entre lobservation et la reprsentation thorique se retrouve galement
au niveau de lobservation individuelle quon replace dans un ensemble
potentiel dobservations supposes homognes. Les variations entre dif-
frentes observations sont considres comme des fluctuations non attri-
Dunod. La photocopie non autorise est un dlit.

buables une cause identifie (contrlable ou non), et on dit alors


quelles sont le rsultat du hasard.
Il est ncessaire de disposer dun outil thorique permettant de consid-
rer globalement les diffrentes observations provenant dune mme
population en tenant compte dune part, de lhomognit lie leur
origine commune et dautre part, des fluctuations entre observations.
Cest le concept de variable alatoire qui remplit ce double rle. Son
intrt dpend des proprits gnrales quon pourra lui associer, et de
leur fiabilit.
Le calcul des probabilits (puis son axiomatique) est le support formel de
cette reprsentation. Il a t introduit initialement au XVIIe sicle pour

MODLE PROBABILISTE ET VARIABLE ALATOIRE 131


P131-178-9782100549412.fm Page 132 Mercredi, 24. novembre 2010 10:19 10

tudier les jeux de socit (ds, cartes, roulette), et son dveloppement


a permis une approche intgrant les lments fluctuants et non perma-
nents des phnomnes physiques, sociaux ou encore psychologiques. Les
probabilits se fondent sur la notion d exprience alatoire , cest--dire
dont les conditions dexcution bien que parfaitement dfinies, ne per-
mettent pas de sassurer priori de lissue de lexprience.
contrario les expriences, dites dterministes, celles dont le rsultat est
matris par les conditions initiales, ont un seul rsultat possible, en
ngligeant les ventuelles erreurs de mesure. Ces situations sopposent
celles o le hasard intervient dans le rsultat attendu et pour lesquelles
on parle d incertitude. Cest pour ce dernier contexte qua t fond le
calcul des probabilits. Sous le terme de hasard, on a longtemps rsum
les facteurs considrs comme mineurs 1 dans ltude dun phnomne.
On pourrait plutt dire actuellement quentre dterminisme et incerti-
tude repose toute la notion de ce qui chappe au contrle, ou encore de
linformation non disponible.
Le caractre alatoire dune grandeur peut tre partie intrinsque du
phnomne tudi. Cest le cas du rsultat dun jet de d, ou bien de la
quantit de fuel consomm annuellement en France. Dans dautres cas,
il nen est pas ainsi. Si on sintresse la distance moyenne parcourue sur
une autoroute par les automobilistes passant un poste de page
donn, un certain jour, on peut interroger tous les automobilistes se pr-
sentant au page et calculer la moyenne. On peut aussi chercher cette
information en interrogeant un chantillon dautomobilistes se prsen-
tant ce page. La valeur moyenne observe sur cet chantillon va
dpendre de lchantillon retenu qui nest pas lui-mme fix lavance
(il y a beaucoup dchantillons possibles), et peut tre considr comme
le rsultat dune exprience alatoire (le choix de lchantillon dauto-
mobilistes). Ainsi, alors quinitialement le problme se posait en termes
dterministes, la procdure surajoute de choix de lchantillon introduit
un lment alatoire. La grandeur tudie (moyenne) nest pas elle-
mme alatoire, mais les donnes recueillies sur lchantillon le sont
puisque le contenu de lchantillon nest pas dtermin par son mode de
tirage.
Lobjectif du calcul des probabilits est lanalyse et lexplication des ph-
nomnes non dterministes. Ses fondements thoriques, et en particulier
laxiomatique de Kolmogorov , lui donnent une valeur scientifique rela-
tivise toutefois par la signification de la notion de probabilit.

1. Historiquement, ces facteurs mineurs ont t dabord restreints la notion derreur.

132 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 133 Mercredi, 24. novembre 2010 10:19 10

I. lments de calcul des probabilits


Le calcul des probabilits est bas, comme nous lavons dj vu, sur la notion
dexprience alatoire. On associe une telle exprience  lensemble de
tous les rsultats possibles, appel ensemble fondamental, quon dsigne
communment par . Chaque rsultat possible est une partie de .
Lensemble fondamental associ une preuve non dterministe peut
contenir un nombre fini dlments (de la forme { 1, 2, , n}) ou bien
tre de type infini dnombrable 1 ou enfin tre de type infini non dnombra-
ble. On assimile, comme dans la thorie classique des ensembles, un v-
nement, donc une partie de , la proprit qui le caractrise au sein de
lensemble fondamental, cest--dire la ralisation de cette proprit. On
dsigne par le rsultat qui sera observ lissue de lexprience alatoire,
et on crit G (avec G ()) lorsque la situation dcrite par G est
le rsultat de la ralisation de lpreuve E. La non-ralisation de lvne-
ment G est note G (o G dsigne lensemble complmentaire 2 de G
dans ).
La notation et le vocabulaire ensembliste sont tout fait adapts la des-
cription des situations alatoires, et lvnement dont on a la certitude de la
ralisation est dsign par (vnement certain), tandis que lvnement
dont on sait quil ne se produira pas est dsign par (vnement impossi-
ble). La runion ensembliste G H correspond la ralisation dau moins
un des vnements G et H. Lintersection ensembliste G H correspond
la ralisation des deux vnements G et H. Lincompatibilit de G et H se
traduit par G H = . Enfin, la diffrence ensembliste G H correspond
la ralisation de G et la non-ralisation de H, ou encore lintersection
G H.
La reprsentation ensembliste justifie la caractrisation des issues dune
preuve alatoire au sein dune structure mathmatique sur laquelle on pourra
Dunod. La photocopie non autorise est un dlit.

dfinir une probabilit. Cette structure est celle dune algbre de Boole (cas
fini), ou dune -algbre (cas infini).

A. Notion de probabilit
Soit lensemble fondamental associ une preuve alatoire et  ()
lensemble des parties de .
1. Cest--dire pouvant tre mis en bijection avec tout ou partie de lensemble des entiers naturels.
2. Le complmentaire de lensemble G est not indiffremment G ou Gc.

MODLE PROBABILISTE ET VARIABLE ALATOIRE 133


P131-178-9782100549412.fm Page 134 Mercredi, 24. novembre 2010 10:19 10

On dit que  () est une algbre de Boole si les deux conditions
suivantes sont vrifies :
C1 : G  G 
C2 : G  et H  G H 
Cette structure dalgbre de Boole correspond la traduction ensembliste
de la logique des vnements dans le cas o lensemble fondamental est fini.
On dit que   () est une -algbre de Boole (ou plus simplement
une -algbre) si les deux conditions suivantes sont vrifies :
C1 : G  G 

C2 : Gi  pour i  UG 
i
i

La notion de -algbre tend la correspondance entre la logique vne-


mentielle et la thorie des ensembles au cas dpreuves alatoires dont
lensemble fondamental est infini.
On notera que si E est un vnement quelconque de ,  = {, , E, }E
est une -algbre.
Lorsquon a dfini une -algbre  dvnements de , on dit que le
couple (, ) est un espace probabilisable dans le sens o il ne reste plus
qu prciser la probabilit de chaque vnement de .
Les premires fondations de la notion de probabilit1 visaient dfinir une
chelle ordonne des chances de russite certains jeux. Lapproche frquen-
tiste qui en a rsult est construite sur lobservation et le dnombrement de
situations dites lmentaires, cest--dire reprsentant toutes les issues diff-
rentes de lpreuve alatoire. Ce point de vue ne peut sappliquer qu des
cas o lensemble fondamental associ est fini.
On suppose tout dabord que les vnements lmentaires ont une chance
gale de ralisation, contexte dit d quiprobabilit, ce qui implique ladditi-
vit des chances. Pour cette hypothse et pour un ensemble fondamental de
type fini, on dfinit la probabilit dun vnement comme lanalogue dune
frquence relative afin davoir une chelle de valeurs comprise entre 0 et 1,
et de disposer dune mesure additive : pour des vnements lmentaires
quiprobables, la probabilit dun vnement quelconque  est sa frquence
relative dapparition dans lensemble fondamental. Ce point est connu sous
le nom de rgle de Laplace.
1. Blaise Pascal et Pierre de Fermat correspondent en 1654, sur la rpartition quitable des
enjeux dans les jeux de hasard ; et Christian Huyghens, en 1657, formule et rsout le problme
dit de la ruine du joueur.

134 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 135 Mercredi, 24. novembre 2010 10:19 10

Donnons-en un exemple dapplication, en calculant la probabilit de faire


apparatre les chiffres 4, 2 et 1 en lanant trois ds parfaitement quilibrs.
Chaque d possde 6 faces, ce qui implique que lensemble fondamental
possde 6 3 = 216 lments. Dans cet ensemble fondamental form des figu-
res 3 chiffres entre 1 et 6, celles qui permettent de reconstituer 421 sont
toutes les 3 ! = 6 permutations des trois chiffres 1, 2 et 4. La frquence rela-
tive de la figure 421 ou probabilit de lvnement obtention des chif-
fres 4, 2, 1 est gale 1/36
Ds lors que lensemble fondamental nest pas fini et/ou que lquiproba-
bilit nest pas assure sur les vnements lmentaires de , on ne peut plus
appliquer cette rgle du nombre de cas favorables sur nombre de cas possi-
bles. On doit gnraliser cette dmarche et dfinir abstraitement la probabilit
pour quelle concide avec la rgle de Laplace lorsque cette dernire sappli-
que. On utilise alors la reprsentation ensembliste des vnements pour dfi-
nir une probabilit sur un espace probabilisable ( , ).

Soit (, ) un espace probabilisable. Une probabilit1 P sur cet espace


est une application de  valeurs dans lintervalle [0;1] vrifiant :
i) P () = 1
ii) pour des vnements {Gi , i } incompatibles (i j Gi Gj = ) :

P U G =
i  i
P(G )
i
i

On dit alors que le triplet (, , P) est un espace probabilis. Il est cons-


truit sur une preuve alatoire dont on se donne lensemble fondamental ,
tous les vnements simples ou complexes tant dcrits par , sur laquelle
on se donne lchelle des chances P.1
De cette dfinition, ou axiomatique de Kolmogorov, on dduit les propri-
Dunod. La photocopie non autorise est un dlit.

ts suivantes :
1. Si G , alors P( G ) 1= P(G)
En effet, on a : G =G et G G = , ce qui donne :
P() = 1 = P (G G ) = P(G) + P( G )
2. La probabilit de lvnement impossible est nulle : P() = 0
Il suffit dappliquer la proprit prcdente en posant G =
1. On dit encore une mesure de probabilit pour bien faire rfrence aux qualits mtrologiques
de cette application. On dsignera indiffremment par la suite la probabilit par Pr ou par P.

MODLE PROBABILISTE ET VARIABLE ALATOIRE 135


P131-178-9782100549412.fm Page 136 Mercredi, 24. novembre 2010 10:19 10

3. Si G  et H  sont tels que G H, alors P(G) P(H)


Puisque H = G ( G H) et que G ( G H) = , on a :
P(H) = P(G) + P( G H), et P( G H) 0 implique P(H) P(G)
Il est important de noter que lingalit entre les probabilits est au sens large.
4. Si G et H sont deux lments quelconques de  :
P(G H) = P(G) + P(H) P(G H)
En effet, on a : G H = G ( G H) avec G ( G H) =
donc P(G H) = P(G) + P( G H)
De mme H = (G H) ( G H) avec ( G H) ( G H) =
donc P(H) = P(G H) + P( G H)
En combinant les deux rsultats, on obtient :
P(G H) = P(G) + P(H) P(G H)
Ce dernier rsultat est connu sous le nom de thorme des probabilits
totales.

B. Probabilits conditionnelles
Nous avons voqu en introduction de ce chapitre le lien particulier entre
linformation disponible, le contrle des facteurs dterminants dun phnomne
et limportance de sa partie alatoire, donc de sa probabilit de ralisation.
Nous allons retrouver ceci au travers de la notion de probabilit conditionnelle.
Soit une preuve alatoire donne, munie de son ensemble fondamental ,
de la -algbre des vnements, et de la probabilit P associe chacun de ces
derniers, en dautres termes, nous supposons donn un espace probabilis
(, , P). La connaissance dune information complmentaire sur le droule-
ment de lpreuve quivaut la modification des probabilits dfinies sur les
lments de . En effet, cette information acquise nest autre quune condition
dsormais suppose ralise quel que soit le rsultat de lexprience alatoire.
Prenons-en un exemple. Nous avons vu que la probabilit de raliser la
figure 421 lors du jet de 3 ds tait de 1/36. Supposons maintenant que le
premier d soit lanc avant les deux autres, et quil fasse apparatre le chiffre
2. Lensemble fondamental associ au jet des 2 ds restant contient 36 vne-
ments lmentaires, mais parmi ceux-ci, seuls les couples (4 ;1) et (1 ; 4) permet-
tent de complter la configuration 421 . On en dduit donc que si on sait que
le premier d a affich la valeur 2, la probabilit de raliser un 421 est de 1/18.
On remarque dans cet exemple que lensemble fondamental a t modifi, et
donc aussi la -algbre des vnements, ainsi que la mesure de probabilit P.

136 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 137 Mercredi, 24. novembre 2010 10:19 10

Cette modification sappelle un conditionnement, car elle correspond la prise


en compte dune condition supplmentaire sur la ralisation de lpreuve ala-
toire (ici le fait que le premier d doit tre lanc sparment et quil affichera la
valeur 2). On est ainsi conduit dfinir les probabilits conditionnelles.

Dfinition 1
Soit (, , P) un espace probabilis et soit C  un vnement par-
ticulier, appel condition, de probabilit non nulle. Pour tout vnement
A , on appelle probabilit conditionnelle de A sachant C , note
P ( A C ), la quantit :
P( A C )
P ( A C ) = ------------------------
P(C )

Cette dfinition est bien videmment drive de lapproche frquentiste des


probabilits puisquen raisonnant avec la rgle de Laplace, on pourrait dire que
les cas favorables sont ceux o les vnements A et C sont tous deux raliss,
alors que les cas possibles sont ceux pour lesquels de toutes faons lvnement
C est observ. Il faut noter quune probabilit conditionnelle na de sens que si
la condition est ralisable (de probabilit non nulle). La notion de probabilit
conditionnelle, ou encore de conditionnement des probabilits, revient modi-
fier lensemble fondamental puisque lvnement C  se trouve tre rap-
port une probabilit gale un. Ainsi, sur la figure 5.1, par conditionnement
la probabilit de A devient ramene la seule part de A incluse dans C.

A A
C C


Dunod. La photocopie non autorise est un dlit.

Figure 5.1 Conditionnement dune probabilit

On peut vrifier que lapplication qui tout A  associe P ( A C ) est


bien une mesure de probabilit.

Proprit
Si A1, A2, , An sont n vnements quelconques dune -algbre 
dun espace probabilis ( , , P), on peut crire :
P ( A1 A2 An ) =
P ( A1 ) P ( A2 A1 ) P ( An A1 A2 An 1 )

MODLE PROBABILISTE ET VARIABLE ALATOIRE 137


P131-178-9782100549412.fm Page 138 Mercredi, 24. novembre 2010 10:19 10

En effet, si n = 2, cette proprit nest autre que la formule de dfinition des


probabilits conditionnelles. Supposons cette proprit vraie lordre n 1 :
P ( A1 A2 An 1 ) =
P ( A1 ) P ( A2 A1 ) P ( An 1 A1 A2 An 2 )
et montrons quelle est encore vraie lordre n.
On peut crire A 1 A 2 A n = ( A 1 A 2 A n 1 ) A n
On pose : B = A 1 A 2 A n 1 et on obtient :
P ( A1 A2 An ) = P ( An B ) = P ( An B ) P ( B )
soit :
P ( A1 A2 An ) =
P(An A1 A2 An1) P(A1) P(A2 A1) P(An1 A1 A2 An2)

Dfinition 2
Deux vnements A et B dun espace probabilis ( , , P) sont dits
indpendants en probabilit si la ralisation de lun deux ne modifie pas
la probabilit de survenue de lautre.
Il sagit dune relation symtrique. On parle galement dvnements sto-
chastiquement indpendants. Dans la suite de ce livre, on crira toutefois
simplement vnements indpendants.
On voit alors que si A et B sont deux vnements indpendants, on a :
P( A B) = P( A)
P(B A) = P(B)
et chacune de ces galits montre que :
A et B indpendants P ( A B ) = P ( A ) P ( B )
Dautre part, il est important de ne pas confondre les notions dindpen-
dance et dincompatibilit. Dans le premier cas, si les deux vnements A et
B sont de probabilit non nulles, alors la probabilit P ( A B ) est aussi non
nulle. Dans le second cas, mme si A et B sont de probabilit non nulles,
lintersection ( A B ) est de probabilit nulle. Il sensuit que deux vne-
ments la fois indpendants et incompatibles sont tels quau moins lun
deux est un vnement impossible (cest--dire de probabilit nulle).
Notons encore que si A et B sont deux vnements indpendants, alors :
P( A B) = P( A B) = P( A)
P( B A) = P( B A) = P( B)

138 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 139 Mercredi, 24. novembre 2010 10:19 10

Cette notion dindpendance stend plus de deux vnements.

Dfinition 3
Soient n vnements dun espace probabilis ( , , P). On dit quils
sont mutuellement indpendants si quels que soient A1, A2, , Ak choisis
parmi ces n vnements, on a :
P ( A1 A2 Ak ) = P ( A1 ) P ( A2 ) P ( Ak )

Des vnements mutuellement indpendants sont indpendants deux deux


(simple application particulire de la dfinition), mais des vnements A1, A2, ,
An qui sont indpendants deux deux ne sont pas toujours mutuellement ind-
pendants.
Cette notion dindpendance sera tendue plus loin au cas des variables alatoi-
res, et peut aussi tre gnralise plusieurs preuves (ou expriences alatoires).
La mise en uvre des probabilits conditionnelles a conduit une rflexion
trs importante sur le concept de probabilit lui-mme, ce que nous verrons plus
loin. Cest certainement lapport de Thomas Bayes 1 qui en a reprsent le point
de dpart. Nous donnerons donc dabord le rsultat connu sous le nom de tho-
rme de Bayes, pour examiner ensuite le dbat sur la notion de probabilit.

Thorme de Bayes
Soit (, , P) un espace probabilis, et soient A1, A2, , An un ensem-
n
ble dvnements deux deux incompatibles vrifiant U
A k = (on dit
k=1
que les Ak forment un systme complet dvnements). Pour tout vne-
P ( B Ai ) P ( Ai )
ment B, on a alors : P ( A i B ) = ------------------------------------------------
- pour i = 1, 2, , n
n

P( B A ) P( A )k k
k=1
Dunod. La photocopie non autorise est un dlit.

En effet, on sait que :


P ( Ai B ) P ( B Ai ) P ( Ai )
P ( A i B ) = ------------------------
- = --------------------------------------
P( B) P( B)

n n

et dautre part que B = B = B k = 1 A k = U U (B A )
k =1 k

1. Le rvrend Thomas Bayes (1701-1761) est lauteur de An Essay Towards Solving a Pro-
blem in the Doctrine of Chances qui ne fut publi quen 1763, aprs sa mort.

MODLE PROBABILISTE ET VARIABLE ALATOIRE 139


P131-178-9782100549412.fm Page 140 Mercredi, 24. novembre 2010 10:19 10

Les vnements B A k tant incompatibles deux deux puisque les Ak le


sont, on en dduit que :
n n
P( B) = P ( B Ak ) = P( B A ) P( A )
k k
k=1 k=1

et la formule de Bayes est dmontre.


On dit frquemment que les vnements Ai , qui forment une partition de
, sont les causes. Une autre dnomination, trs courante, consiste nommer
probabilits a priori les valeurs P(Ak), et probabilits a posteriori les valeurs
P ( A k B ). En effet, la formule de Bayes permet dobtenir une valeur rvise
des probabilits des vnements Ai une fois connue la ralisation de
lvnement B.
On notera que lapplication de la formule de Bayes demande lvaluation
des probabilits dites a priori P(Ak) ainsi que des probabilits P ( B A k ) de
leffet B connaissant chacune des causes.
 Exemple
Pour un systme de crdit la clientle on distingue trois types de
dossiers : les dossiers aboutissant en contentieux, les dossiers dif cults
temporaires ou lgres et les dossiers sans dif cults de paiement. On a
valu sur la base de xpriences antrieures les proportions respecti ves
des trois catgories 1/5, 3/10 et 1/2. Dautre part, on dispose pour
chaque dossier dun score dapprciation global du client rapport lune
des deux modalits sui vantes : lev ou bas. Enn, on sait que 90 % des
dossiers en contentieux correspondaient un score bas, que 60 % des
dossiers difcults lgres correspondaient un score bas, et que 85 %
des dossiers sans difcults correspondaient un score lev. Si on tire un
dossier au hasard pour lequel le score est bas, quelle est la probabilit
quil ait abouti en contentieux ? (resp. quil nait donn lieu aucune
difcult de paiement ? quil ait engendr des difcults lgres ?)
Les trois vnements A1 = aboutir en contentieux , A2 = difcults
lgres et A3 = aucune difcult forment un systme complet. On
dispose des probabilits a priori :
P(A1) = 0,2 P(A2) = 0,3 P(A3) = 0,5
ainsi que des probabilits conditionnelles pour les vnements
B = score bas et B = score lev
P ( B A 1 ) = 0,9 P ( B A 2 ) = 0,6 P ( B A 3 ) = 0,15
do :
P ( B ) = P ( B A1 ) + P ( B A2 ) + P ( B A3 )
= P ( B A1 ) P ( A1 ) + P ( B A2 ) P ( A2 ) + P ( B A3 ) P ( A3 )
= 0,435

140 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 141 Mercredi, 24. novembre 2010 10:19 10

On en dduit :
P ( Ai B ) P ( B A1 ) P ( A1 ) 0,5
P ( A 1 B ) = ------------------------ - = 0,9
- = --------------------------------------- ------------------- = 0,414
P( B) P( B) 0,435
ainsi que : P ( A 2 B ) = 0,414 et P ( A 3 B ) = 0,172
Ce calcul montre que linformation complmentaire le dossier tudi
correspond un score bas a permis une augmentation de la probabilit
associe au de venir contentieux (0,414 au lieu de 0,2) et de la
probabilit associe au de venir difcults lgres (0,414 au lieu de
0,3), et une forte diminution de la probabilit associe au de venir
aucune difcult (0,172 au lieu de 0,5).
On nomme aussi probabilits rvises, les probabilits a posteriori P ( A k B ).
Le thorme de Bayes est lorigine de nombreux dveloppements for-
mant ce quon a appel la statistique baysienne. Les domaines dapplication
sont trs varis : gestion financire, prvisions, diagnostic,
Cependant, son utilisation est trs conteste, notamment en raison de la
ncessit dune valuation a priori , subjective, de probabilits. De plus les
causes Ak se trouvent affectes de probabilits, ce qui peut apparatre
paradoxal si on se rfre la notion dterministe de causalit. Pour ceux qui
contestent la statistique baysienne, un phnomne est, ou nest pas, cause
(ventuellement partielle) dun autre, et ne saurait donc tre muni dune pro-
babilit sur cette causalit 1.
De nombreuses difficults persistent autour de la notion de probabilit, et
particulirement celle du choix des probabilits quon affecte aux vne-
ments rapports une preuve alatoire. Lanalyse combinatoire et lappro-
che frquentiste offrent une solution, dite objectiviste . Cependant, ce
point de vue se heurte :
quelques contradictions logiques : le lien entre la probabilit et la fr-
quence relative, qui permet dvaluer une probabilit, est relativiser par
la loi faible des grands nombres ( cf. infra ), donc par une probabilit ; on
Dunod. La photocopie non autorise est un dlit.

dfinit concrtement une probabilit en se basant sur une autre probabilit


qui demande tre value, et ainsi de suite ;
quelques paradoxes : le paradoxe de Bertrand 2 montre 3 solutions dis-
tinctes, 1/4, 1/3 et 1/2 (toutes par lapproche frquentiste) au calcul de la
probabilit que la longueur dune corde dun cercle soit suprieure au ct
du triangle quilatral inscrit dans ce cercle ; le paradoxe de St Peters-
1. On ne vise pas, dans ce livre, prendre parti pour ou contre loptique baysienne, mais
donner au lecteur des lments simples sur les arguments en prsence. Le dbat nest pas
encore clos !
2. Prsent en dtail, par exemple, dans le livre de G. Saporta, pages 11, op. cit .

MODLE PROBABILISTE ET VARIABLE ALATOIRE 141


P131-178-9782100549412.fm Page 142 Mercredi, 24. novembre 2010 10:19 10

bourg1 montre que la notion frquentiste de probabilit (donc


objective ) peut parfois demander des apprciations complmentaires
(utilit) trs subjectives ;
et quelques limites (comment valuer les probabilits pour une preuve
qui nest pas rptable ?).
Lanalyse baysienne cherche contourner ces obstacles, surtout ceux lis
lapproche frquentiste, mais au prix de valeurs subjectives pour certaines
probabilits, ainsi que de quelques difficults mathmatiques de mise en
uvre.

II. Variables alatoires une dimension


A. Dfinitions
tant donn un espace probabilis ( , , P), une variable alatoire (v.a. en
abrg) est une application X dfinie sur lensemble fondamental et
valeurs relles :
X: 
X()
tout vnement lmentaire , lapplication X associe une valeur num-
rique X() ; cest pourquoi on prcise parfois en parlant de variable alatoire
relle2 nomme aussi ala ou ala numrique .
On observe que la terminologie utilise peut paratre abusive, car X est
une application, donc une fonction de dans . Les variables alatoires
seront notes par des lettres majuscules telles que X, Y, Z, pour les distin-
guer des valeurs quelles sont susceptibles de prendre (ou ralisations), gn-
ralement notes en minuscules.
1. Jacques et Pierre jouent avec une pice. Pierre paie Jacques 1 si pile sort ds le premier
jet, 2 si pile sort seulement au 2e jet, 4 sil ne sort quau 3e jet et ainsi de suite en doublant
la somme paye par Pierre Jacques chaque jet supplmentaire o pile nest pas sorti. On
cherche savoir quelle somme Jacques devrait accepter de payer Pierre pour jouer ce jeu
si lon veut quil soit quilibr, cest--dire que leurs espoirs de gain soient gaux ; le paradoxe
de cette situation provient du fait quon peut montrer que le prix alors payer par Jacques
devrait tre infini. Ce paradoxe a longuement t tudi par Daniel et Nicolas Bernoulli, puis
par Buffon, Laplace, Poisson entre autres ; il a contribu dgager la notion dutilit.
2. Il faut distinguer une variable alatoire laquelle est associe une loi, appele aussi
distribution , de probabilit (thorique) dune variable statistique quantitative laquelle est
associe une distribution statistique (observe), chapitre 1, II.A.

142 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 143 Mercredi, 24. novembre 2010 10:19 10

 Exemple
On jette deux ds non pips ; lensemble fondamental associ cette
exprience alatoire est form de 36 vnements lmentaires quipro-
bables :
= ({1,1} ; {1,2} ; {2,1} ; ; {6,6})
Si on sintresse la somme des points marqus par les deux ds, on
dnira sur cet espace probabilis une v .a. X gale cette somme ;
lensemble de ses valeurs possibles est :
{2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
Pour obtenir la probabilit dune v aleur quelconque de X, il suf t de
dnombrer les vnements lmentaires de qui ralisent cette valeur;
ainsi :
P ( X = 4 ) = P ( { 1,3 } { 2,2 } { 3,1 } )
= P ( { 1,3 } ) + P ( { 2,2 } ) + P ( { 3,1 } ) = 3/36 = 1/12

On dit que la variable alatoire X est :


discrte finie si lensemble X() est fini, discrte infinie si lensemble
X() est infini dnombrable,
continue si lensemble X() est un intervalle de  non rduit un point
(ou une runion dintervalles de ).
On retrouve une classification analogue celle rencontre pour les varia-
bles statistiques (chapitre 1), la notion de probabilit remplaant la notion de
frquence ; la loi des grands nombres ( V) permet dtablir un lien entre ces
deux notions.

Remarque
Pour une variable alatoire continue X, il faut complter la dfinition
en ajoutant que limage rciproque de tout intervalle ] , x] doit
appartenir la -algbre  :
Dunod. La photocopie non autorise est un dlit.

x  X1(],x]) = ( ( X ) ( ) x ) 
La probabilit tant dfinie sur la famille des parties de formant
une -algbre, cette condition permet de dterminer la probabilit de
tout intervalle de .
Notons que cette condition est gnrale puisquelle est ralise pour
les variables alatoires discrtes ; pour ces variables alatoires, limage
rciproque de tout intervalle de  est une partie de laquelle est
associe une probabilit.

MODLE PROBABILISTE ET VARIABLE ALATOIRE 143


P131-178-9782100549412.fm Page 144 Mercredi, 24. novembre 2010 10:19 10

B. Loi de probabilit dune variable alatoire


1) Fonction de rpartition dune variable alatoire
La fonction de rpartition FX (ou F) dune variable alatoire X valeurs dans
lintervalle [0, 1] est dfinie par : FX ( x ) = P ( X x )

Proprits caractristiques dune fonction de rpartition


dune variable alatoire
F est une fonction de rpartition si :
1. F est croissante (au sens large)
2. lim F ( x ) = 0 et lim F ( x ) = 1
x x+
3. F est continue droite

Compte tenu de la proprit ii) dune probabilit ( I.A), on peut crire


pour tout a, b , a < b :
F(b) = F(a) + P(a < X b) P(a < X b) = F(b) F(a)
la probabilit pour que X appartienne un intervalle de  pouvant se
calculer partir de sa fonction de rpartition FX , cette fonction caractrise la
loi de X.

2) Loi de probabilit dune variable alatoire discrte


La fonction de rpartition dune telle v.a. est une fonction constante par inter-
valle (ou en escalier ) continue droite, les points de discontinuit corres-
pondant des valeurs possibles de X (cf. figure 5.2) ; sa courbe reprsentative
sappelle la courbe de rpartition ou courbe cumulative ; on peut remarquer
que cette fonction prsente une identit formelle avec la fonction de rparti-
tion dune variable statistique discrte.
Considrons le cas dune v.a. X discrte finie ; ses diffrentes valeurs possi-
bles, en nombre fini, sont supposes distinctes et ranges dans lordre croissant :
X ( ) = { x 1 , , x i , ,x k }
Connaissant la fonction de rpartition de X, on peut calculer la probabilit
pi de ralisation de toute valeur x i ( 1 i k ) :
F ( x1 ) pour i = 1
pi = P ( X = xi ) =
F ( xi ) F ( xi 1 ) pour i = 2, , k
Une telle distribution de probabilit peut se reprsenter par un diagramme
en btons ( cf. figure 5.3).

144 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 145 Mercredi, 24. novembre 2010 10:19 10

Valeur de X x1 xi xk k
pi = 1
Probabilit p1 pi pk i=1

 Exemple 1
Loi de probabilit de la v.a. discrte nie X gale la somme des points
marqus lors du lancer de deux ds non pips :

Valeur de X 2 3 4 5 6 7 8 9 10 11 12

1 1 1 1 5 1 5 1 1 1 1
Probabilit ------ ------ ------ --- ------ --- ------ --- ------ ------ ------
36 18 12 9 36 6 36 9 12 18 36

Inversement, on calcule aisment la fonction de rpartition partir de la


connaissance des k couples (xi , pi) :
0 si x < x 1

i
F( x) =
j = 1
pj si x i x < x i + 1 pour 1( i k 1 )

1 si x x k
Lorsque la v .a. est discrte innie , lensemble X() est inni
dnombrable, et on peut, comme dans le cas ni, calculer les
probabilits de chaque v aleur possible partir de la fonction de
rpartition ; en sens inverse, on peut dduire la fonction de rpartition de
la connaissance des valeurs possibles et des probabilits associes.
 Exemple 2
Loi de probabilit de la v .a. discrte innie X gale au nombre de jets
ncessaires dune pice de monnaie non pipe pour obtenir la f ace
pile :
Dunod. La photocopie non autorise est un dlit.

Valeur de X 1 2 3 i
1- = 1
---
2 i
1 1- 1- 1- i=1
Probabilit --- ---- ---- ---
2 22 23 2i

On verra au chapitre 6 ( II.C) que X suit une loi gomtrique de


paramtre 0,5

MODLE PROBABILISTE ET VARIABLE ALATOIRE 145


P131-178-9782100549412.fm Page 146 Mercredi, 24. novembre 2010 10:19 10

F(x)
1
35/36
33/36
30/36
26/36

21/36

15/36

10/36
6/36
3/36
1/36
0 1 2 3 4 5 6 7 8 9 10 11 12 x
Figure 5.2 Fonction de rpartition (exemple 1)

1/6

1/12

0
1 2 3 4 5 6 7 8 9 10 11 12 x

Figure 5.3 Diagramme en btons (exemple 1)

3) Loi de probabilit dune variable alatoire continue


Une variable alatoire X absolument continue est une variable alatoire dont
la fonction de rpartition FX possde en sus des trois proprits dj non-
ces, les deux proprits suivantes :1

4. FX est une fonction continue sur tout 


5. FX est drivable presque partout 1

1. Cest--dire que la fonction Fx peut ne pas tre drivable sur un ensemble dnombrable de
points de 

146 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 147 Mercredi, 24. novembre 2010 10:19 10

Toute fonction vrifiant ces cinq proprits peut tre considre comme
la fonction de rpartition dune variable alatoire absolument continue.
La drive de FX , note fX , est appele densit de probabilit de la varia-
ble alatoire X.
Une fonction f, dfinie sur tout , peut tre considre comme la densit
de probabilit dune variable alatoire absolument continue si elle possde
les trois proprits suivantes :1

1. f ( x ) 0 x 
2. f continue presque partout 1
+
3.
f ( x ) dx

= 1

La fonction de densit est une reprsentation trs utile de la loi de proba-


bilit dune variable alatoire continue. On peut dfinir la loi de probabilit
dune variable alatoire continue, soit par sa fonction de rpartition, soit par
sa fonction de densit, et on a la relation fondamentale suivante :
x
x  F( x) =
f ( t ) dt

La probabilit relative un intervalle se calcule laide de la fonction de


rpartition ou de la fonction de densit ( cf. figure 5.4) :
b
P(a < X b) = F (b) F (a) =
f ( x ) dx
a

f(x)
Dunod. La photocopie non autorise est un dlit.

a b x
Figure 5.4 Reprsentation de la probabilit dun intervalle

1. Cest--dire que la fonction f peut ne pas tre continue sur un ensemble dnombrable de
points de  ; on dit encore que f est continue par morceaux ; mentionnons que les points de
non-drivabilit de F correspondent aux points de discontinuit de f

MODLE PROBABILISTE ET VARIABLE ALATOIRE 147


P131-178-9782100549412.fm Page 148 Mercredi, 24. novembre 2010 10:19 10

Probabilit attache un point x


Soient deux nombres rels a et b positifs :
0 P( X = x) P( x a < X x + b) = F ( x + b) F ( x a)

= F ( x + b ) F ( x ) + F ( x ) F ( x a )

la fonction F tant continue : F ( x + b ) F ( x ) 0 si b 0


F ( x ) F ( x a ) 0 si a 0

do : P ( X = x ) = 0
la probabilit quune v.a. continue X prenne une valeur donne x est
nulle, on dit que la loi de X est diffuse (ou continue).
Par consquent, pour une variable alatoire continue :

F(x) = P(X x) = P(X < x) a, b , a < b :

P(a < X < b) = P(a X b) = P(a < X b)


b
= P(a X < b) = F(b) F(a) =
f ( x ) dx
a

 Exemple
Soit la fonction f dnie par :
0 pour x 0

1
f ( x ) = ---------- pour 0 < x 1
2 x
0 pour x > 1

Montrons que cette fonction peut tre considre comme la fonction de
densit dune v.a. continue :
1. f(x) 0 x 
2. f continue sauf en x = 0 et x = 1
+ 1 1
1 12
3.


2
f ( x ) dx = --- x 1 2 dx = x
0
= 1
0

148 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 149 Mercredi, 24. novembre 2010 10:19 10

Calculons sa fonction de rpartition :


x
pour x 0 F(x) =
0 dt = 0

0 1 x
1
pour 0 < x 1 F(x) =

0

0 dt + --------- dt =
2 t
t 0
= x

0 1 x
1 - dt + 0 dt = 1
pour x >1 F(x) =

0
2 t
0 dt + --------
0

On vrie aisment que cette fonction F possde les proprits de la
fonction de rpartition dune v.a. continue1.
On peut calculer la probabilit de tout interv alle ou runion dintervalles,
par exemple :
P(0,16 < X < 0,25) = F(0,25) F(0,16) = 0,5 0,4 = 0,1

C. Loi dune fonction de variable alatoire


Si est une fonction dfinie sur  valeurs dans , lapplication X,
note Y = (X) est une variable alatoire dont on peut dterminer la fonc-
tion de rpartition et donc la loi de probabilit partir de celle de X.

1) Changement de variable Y = aX + b
Les paramtres a (a 0) et b sont des nombres rels. Connaissant la fonction
de rpartition de X, on peut calculer la fonction de rpartition FY de la v.a. Y :
pour a > 0 :
yb yb
F Y ( y ) = P ( Y y ) = P ( aX + b y ) = P X ----------- = F X -----------
Dunod. La photocopie non autorise est un dlit.

a a

1. On peut remarquer que les deux points de discontinuit de la fonction de densit { x = 0} et


{x = 1} correspondent aux deux points de non-drivabilit de la fonction de rpartition.

MODLE PROBABILISTE ET VARIABLE ALATOIRE 149


P131-178-9782100549412.fm Page 150 Mercredi, 24. novembre 2010 10:19 10

pour a < 0 :
yb
F Y ( y ) = P ( Y y ) = P X -----------
a

yb
1 F X ----------- si X est une v.a. continue
a
=
y a
1 P X < -----------
a
si X est une v.a. discrte

Lorsque la variable alatoire X est continue, on obtient la fonction de den-


sit fY par drivation de la fonction FY

2) Autres types de fonctions


bijective (donc monotone)
croissante : F Y ( y ) = P ( Y y ) = P ( X 1 ( y ) ) = F X ( 1 ( y ) )
dcroissante :
F Y ( y ) = P ( Y y ) = P ( X 1 ( y ) )

1 F X ( 1 ( y ) ) si X est une v.a. continue


=
1 P ( X < 1 ( y ) ) si X est une v.a. discrte
Si X est une v.a. continue et si la fonction est drivable, on obtient la
fonction de densit fY par drivation de la fonction FY
 Exemple
Soit une v.a. continue X, on peut calculer les fonctions de rpartition et
de densit de Y = exp(X), la fonction exponentielle tant croissante :
0
0 pour y0 pour y0
FY ( y) = f Y ( y) = 1
F X ( lny ) pour y>0 --y- f X ( lny ) pour y>0

quelconque
Le principe consiste toujours identifier la fonction de rpartition FY en
recherchant lantcdent pour X de lvnement { Y y = (x)}.
Par exemple, pour Y = X2 :
0 si y < 0
FY(y) =
P( y X + y) = F X ( y) F X ( y) si y 0

150 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 151 Mercredi, 24. novembre 2010 10:19 10

III. Couple de variables alatoires


A. Fonction de rpartition dun couple alatoire
Soient deux variables alatoires X et Y dfinies sur le mme espace probabi-
lis ( , ,P) ; on appelle fonction de rpartition du couple alatoire (X,Y) ,
la fonction F dfinie sur 2 par :

(x , y)2 F ( x , y ) = P ( X x ) ( Y y )

Caractrisation dune fonction de rpartition dun couple alatoire (X,Y )

1. F croissante par rapport chacune des variables x et y


2. lim F(x , y) = 1 et lim F(x , y) = 0
x + x
y + y
3. Continuit droite : lim F(x , y ) = F(x0 , y0)
x x 0+
y y 0+

B. Loi dun couple alatoire discret


Les variables alatoires discrtes finies X et Y sont dfinies sur le mme
espace probabilis ( ,,P). Leurs valeurs, supposes distinctes, sont ran-
ges dans lordre croissant :
X() = { x1, , xi , , xk } et Y() = { y1, , yj , , yl }
Dunod. La photocopie non autorise est un dlit.

La loi du couple alatoire ( X,Y) est dfinie par les probabilits pij asso-
cies tout couple de valeurs possibles ( xi , yj) (cf. tableau 5.1) :
l k
p ij = P ( X = x i ,Y = y j ) p
j = 1i = 1
ij =1

MODLE PROBABILISTE ET VARIABLE ALATOIRE 151


P131-178-9782100549412.fm Page 152 Mercredi, 24. novembre 2010 10:19 10

Tableau 5.1 Distribution de probabilit dun couple alatoire (X,Y)

Valeur de Y
Loi marginale
y1 yj yl
de X
Valeur de X
x1 p11 p1j p1l p1
. . . . . . .
. . . . . . .
. . . . . . .
xi pi1 pij pil pi
. . . . . . .
. . . . . . .
. . . . . . .
xk pk1 pkj pkl pk

Loi marginale
de Y p1 pj p1 1

On notera lanalogie du tableau 5.1 avec le tableau dune distribution con-


jointe en statistique descriptive (chapitre 3, I.A).
l
On a : p i = p
j=1
ij = P ( X = xi )

k
p j = p ij = P ( X = xi )
i=1

Les couples ( xi, pi ) constituent la loi marginale de X et les couples


(yj, pj) constituent la loi marginale de Y.
Si la probabilit que X prenne la valeur xi nest pas nulle (pi 0), on peut
calculer la probabilit conditionnelle pj/i de Y = yj sachant que X = xi :
p
p j i = P ( Y = y j X = x i ) = -----ij-
p i
Les couples ( yj, pj/i ) constituent la loi conditionnelle de Y lie par X = xi
On note cette v.a. { Y X = xi }, et on prsente sa distribution comme celle de
toute v.a. une dimension :
Valeur de Y y1 . yj . yl l

P(Y = y j X = x i ) p1/i . pj/i . pl/i


p j/i = 1
j=1

Il y a k lois conditionnelles de Y sachant que X prend une valeur donne.


De mme, si la probabilit pj nest pas nulle :
p
p i j = P ( X = x i Y = y j ) = ------ij
p j

152 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 153 Mercredi, 24. novembre 2010 10:19 10

Les couples (xi , pi/j ) constituent la loi conditionnelle de X lie par Y = yj :


{ Y X yj }=
Il y a l lois conditionnelles de X sachant que Y prend une valeur donne.
Les deux formules prcdentes entranent 1 :
p ij = p i p j i = p j p i j
Indpendance
Les variables alatoires X et Y sont indpendantes si pour tout couple
(xi , yj), on a la relation :
P((X = xi) (Y = yj)) = P ( X = x i ) P ( Y = y i )

X et Y indpendantes pij = pi p j pour tout couple (i , j)

En cas dindpendance, les lois conditionnelles sont gales la loi mar-


ginale correspondante :
p pij
pj i = -----ij- = p j et pi j = ------
- = pi
pi p j
ce qui signifie que la connaissance de la valeur prise par X napporte aucune
information sur la valeur de Y, et inversement.
La loi de probabilit dun couple alatoire (X,Y) permet de calculer les lois
marginales des deux variables X et Y. En revanche, la connaissance de ces
lois ne permet pas de dterminer la loi conjointe, sauf si les variables X et Y
sont indpendantes.
Mentionnons lanalogie existant entre les notions de lois de probabilit
marginales et conditionnelles dfinies pour un couple alatoire et celles de
distributions marginales et conditionnelles rencontres en statistique descrip-
tive (chapitre 3).
Dunod. La photocopie non autorise est un dlit.

Toutes les notions dveloppes pour les couples de variables alatoires dis-
crtes finies peuvent tre gnralises des variables alatoires discrtes infinies.
La loi de probabilit dun couple alatoire discret peut aussi tre dfinie
par sa fonction de rpartition.
Pour {xi x < xi+1} et { yj y < yj+1}:
j i
F ( x , y) = P(( X x) (Y y)) = p
n=1 m=1
mn

i j
1. Les probabilits conditionnelles pj/i et pi/j sont aussi parfois notes p j et p i

MODLE PROBABILISTE ET VARIABLE ALATOIRE 153


P131-178-9782100549412.fm Page 154 Mercredi, 24. novembre 2010 10:19 10

C. Loi dun couple de variables alatoires continues


La fonction de rpartition dun couple (X,Y) de variables alatoires continues pos-
sde en sus des trois proprits dj nonces, les deux proprits suivantes :

4. F est une fonction continue sur 2


5. F est drivable presque partout

Toute fonction vrifiant les cinq proprits peut tre considre comme la
fonction de rpartition dun couple de variables alatoires continues.
2 F (x , y)
La densit f du couple ( X, Y) est donne par : f ( x , y ) = -----------
-
xy
La loi de probabilit dun couple de variables alatoires continues peut
tre dfinie, soit par la fonction de rpartition, soit par la fonction de densit,
et on a la relation fondamentale suivante :
y x

(x , y )  2 F ( x , y) =
f ( u , v ) d u dv

La probabilit relative un sous-ensemble de 2 du type [ a ; b] [c ; d]


est gale :
d b
P ( X , Y ) [ a ; b ] [ c ; d ] =
f ( u , v ) d u dv
c a
Plus gnralement, la probabilit que
le couple alatoire ( X,Y) appartienne
un domaine  2 est gale :

P ( X, Y )  =

f ( x , y ) dx dv

Les densits marginales g de X et h de Y sont respectivement :


+ +
g( x) =


f ( x , y ) dy et h( y) =
f ( x , y ) dx

 Exemple
Un couple (X, Y) de variables alatoires continues suit une loi uniforme
sur [ 0 ; 1 ] [ 0 ; 1 ] si sa densit de probabilit est la suivante :
0 pour tout ( x , y) [0 ; 1] [0 ; 1]
F ( x, y ) =
1 pour tout ( x , y) [0 ; 1] [0 ; 1]

154 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 155 Mercredi, 24. novembre 2010 10:19 10

Connaissant la fonction de densit, on peut calculer la probabilit de


2
tout sous-ensemble de  :
0,8 0,3
P ( X < 0,3 ) ( 0,1 Y < 0,8 ) =

0,1 0
1 dx dy = 0,21

2
Considrons le domaine  de  ainsi dni :
 = {(x , y) 2 x > 0, y > 0 et x + y < 1},
1 1u
alors P{X, Y } =

0 0
1 du dv = 0,5

1
Le lecteur peut vrier que les
lois marginales de X et Y sont des 
lois uniformes continues sur
[0 ; 1] (chapitre 7, I.A). x
0 1

Indpendance

Les variables alatoires X et Y sont indpendantes si et seulement si


2
(x , y)  :
f(x , y) = g(x) h(y)

Plus gnralement, un n-uplet de variables alatoires ( X1 , X2 , , Xn) de


densit de probabilit f est un n-uplet de variables alatoires indpendantes si
et seulement si la densit f du n-uplet est le produit des n densits marginales fi :
f ( x1 , x2 , , xn ) = f1 ( x1 ) f2 ( x2 ) fn ( xn )

IV. Indicateurs des variables alatoires


Dunod. La photocopie non autorise est un dlit.

Une diffrence entre la statistique descriptive et la thorie des probabilits


rside dans le fait que la premire discipline vise reprsenter les donnes
de faon les rendre plus lisibles , tandis que la seconde a pour objectif
de fournir des modles adapts au traitement mathmatique, donc abstraits,
qui se veulent des images, la fois idales et approches de ces donnes.
Lutilisation simultane de ces deux dmarches doit permettre de faire
apparatre les lois susceptibles de rgir les phnomnes dont proviennent les
donnes, puis de les exprimer de manire plus prcise et maniable grce au
formalisme mathmatique qui en dgage les proprits essentielles.

MODLE PROBABILISTE ET VARIABLE ALATOIRE 155


P131-178-9782100549412.fm Page 156 Mercredi, 24. novembre 2010 10:19 10

Il est naturel, comme on la fait en statistique descriptive, de dfinir et dtu-


dier des indicateurs (ou caractristiques) des variables alatoires. La motivation
est la mme : la loi de probabilit constitue une grande quantit dinformations,
et est souvent trop riche pour tre apprhende dans sa globabilit. Il est donc
utile den rsumer certains aspects (les mmes que ceux envisags en statisti-
que descriptive) par des valeurs numriques convenablement choisies.
Des indicateurs relatifs aux trois aspects principaux des lois de probabilit
sont dfinis, savoir :
la tendance centrale ;
la dispersion ;
la forme (asymtrie et aplatissement).
Les outils mathmatiques qui interviennent dans la dfinition de ces indi-
cateurs varient dun type de loi lautre. Les lois discrtes finies utilisent les
mmes outils que ceux ncessaires la dfinition des indicateurs des varia-
bles statistiques. Pour les lois discrtes infinies, quelques connaissances sur
les sries numriques (et parfois sur les sries entires) sont utiles. Pour les
lois absolument continues, des notions sur lintgration sont utilises. Cepen-
dant, la signification de ces indicateurs ne dpend pas du type de loi de pro-
babilit considre, ni des techniques mathmatiques utilises.

A. Mode
Le mode dune variable alatoire est la valeur pour laquelle le diagramme en
btons ou la courbe de densit prsente son maximum. On appelle mode rela-
tif une valeur correspondant un maximum local du diagramme en btons
ou de la courbe de densit, mais en gnral, le mode est unique. Le mode est
un indicateur de tendance centrale.

B. Esprance mathmatique
Lesprance mathmatique dune variable alatoire X est aussi appele
moyenne ou valeur moyenne de X. Elle est gnralement note m.

1) Cas discret
Soit X une variable alatoire discrte finie :

Valeur de X x1 ..... xi ..... xk

Probabilit p1 ..... pi ..... pk

156 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 157 Mercredi, 24. novembre 2010 10:19 10

On appelle esprance mathmatique ou moyenne E(X) de X :


k
E(X ) = x p
i=1
i i

titre dillustration, le lecteur peut vrifier que la v.a. de lexemple 1 du


II.B a une moyenne gale 7. On peut remarquer la similitude des dfini-
tions de lesprance mathmatique et de la moyenne arithmtique dune
variable statistique discrte. On a remplac dans la formulation de cette der-
nire les frquences par les probabilits.
Lesprance mathmatique est un nombre rel, mais souvent, pour une
variable alatoire discrte, sa valeur ne correspond pas une des valeurs pos-
sibles de cette variable alatoire.
 Exemple
Une loterie comporte 1 000 billets et un seul lot de 10 000 . Si tous les
billets ont t v endus et si le tirage se f ait au hasard , lesprance
mathmatique de la valeur V dun billet sera :
1 999
E ( V ) = 10 000 ------------
- + 0 ------------- = 10
1 000 1 000
Mais, en f ait, aucun billet ne rapporte 10 : chacun rapporte 0 ou
10 000 . Cependant, si on achte un billet chaque tirage de cette
loterie (en supposant quelle ait lieu rgulirement dans les mmes
conditions), la moyenne des gains sera voisine de 10 au bout dun
grand nombre de tirages ; ce rsultat qui f ait limportance du concept
desprance mathmatique se rfre la loi des grands nombres ( V).

La moyenne dune variable alatoire X a ainsi la signification dun indi-


cateur de tendance centrale de X.

Dans le cas dune variable alatoire X discrte infinie : E ( X ) = x p i i
Dunod. La photocopie non autorise est un dlit.

i=1
sous rserve que la srie de terme gnral xi pi soit absolument convergente 1,
sinon, et mme si elle est simplement convergente, on dira que la v.a. X na
pas desprance mathmatique.

+ + +
1. La srie x i p i est absolument convergente si la srie xi pi = x i p i est
i=1 i=1 i=1
convergente.

MODLE PROBABILISTE ET VARIABLE ALATOIRE 157


P131-178-9782100549412.fm Page 158 Mercredi, 24. novembre 2010 10:19 10

Lesprance mathmatique de la v.a. discrte conditionnelle { Y X = xi},


dfinie au III.B. est appele esprance conditionnelle de Y sachant que
X = xi. Elle a pour expression :
l
E { Y X = xi } = y p
j=1
j j/i

k
De mme : E { X Y = yi } = x p
i=1
i i/ j

2) Cas continu
La variable alatoire X tant continue de densit f, on appelle esprance
mathmatique E(X) de X :
+
E(X ) =
x

f ( x ) dx

Cette dfinition suppose lintgrale du second membre absolument con-


vergente1, sinon et mme si elle est simplement convergente, on dira que
la v.a. X na pas desprance mathmatique.

Remarque
Lesprance mathmatique dune variable certaine X, cest--dire une
v.a. ne prenant quune seule valeur, note b, avec la probabilit 1, est
gale cette valeur : E(b) = b. Notons quune telle variable ne mrite
pas exactement le nom de variable alatoire puisquelle peut tre iden-
tifie la constante b.
On appelle variable alatoire centre une variable alatoire dont
lesprance mathmatique est nulle.

3) Proprits de lesprance mathmatique


1. Si a et b sont deux nombres rels : E(aX + b) = a E(X) + b
si une v.a. X possde une esprance mathmatique m, alors la variable
alatoire Y = X m est la variable alatoire centre associe X.

+ +
1. Lintgrale


x f ( x ) dx est absolument convergente si lintgrale


x f ( x ) dx est

convergente.

158 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 159 Mercredi, 24. novembre 2010 10:19 10

2. Soit une fonction dfinie sur  valeurs dans , alors si X est une v.a.,
(X) est une v.a. ( II.C) dont on peut calculer lesprance sans avoir dter-
miner sa loi.
Cas discret
E (( X )) = ( x ) p
i
i i en supposant toujours que la srie du second mem-

bre est absolument convergente. En particulier :

E( X 2) = x
i
2p
i

Cas continu

E (( X )) =
( x ) f ( x ) dx
R
en supposant toujours lintgrale du second

membre absolument convergente. En particulier :


E( X 2) =
x
R
2 f ( x ) dx

3. Lesprance dune somme de variables alatoires est gale la somme des


esprances :
E(X + Y) = E(X) + E(Y)
1re consquence :
E(X Y) = E(X) + E( Y) = E(X) E(Y)
2de consquence :
Soient n variables alatoires X1, X2,, Xn ayant la mme esprance math-
matique m. Lesprance de leur somme est gale :
n n


E X i =
i = 1
E(X )
i=1
i = nm
Dunod. La photocopie non autorise est un dlit.

n
1

si on dsigne par X leur moyenne : X = --- X i , on obtient : E ( X ) = m
ni = 1
4. Esprance dun produit de variables alatoires
Cas discret
Soit (X, Y) un couple de v.a. discrtes, on a, si la srie du second membre
est absolument convergente :

E(X Y ) = x y p
i, j
i i ij

MODLE PROBABILISTE ET VARIABLE ALATOIRE 159


P131-178-9782100549412.fm Page 160 Mercredi, 24. novembre 2010 10:19 10

Cas continu
Soit (X, Y) un couple de v.a. continues, on a, si lintgrale du second mem-
bre est absolument convergente :

E(X Y ) =
xy f ( x, y ) d x d y
R2

Si X et Y sont indpendantes, de la proprit { pij = pi p j ou


f(x,y) = g(x) h(y)}, on dduit E(X Y) = E(X) E(Y), mais la rciproque nest
pas vraie :

X et Y indpendantes E(X Y) = E(X) E(Y)

C. Variance
La variance dune variable alatoire X est lesprance mathmatique du carr
de la v.a. centre associe X (si elle existe) :
var ( X ) = E ( X m ) 2
La variance est un nombre positif ou nul ; sa racine carre, note , est
appele cart-type1 :
= var ( X )
Lcart-type dune v.a. X, exprim dans les mmes units que la variable
X, a la signification dun indicateur de dispersion autour de la moyenne
m de X. Illustrons cette ide par un exemple. Soient les variables alatoires
X et Y :

Valeur de X 2 4 8 E(X) = 4 Valeur de Y 6 2 30 E(Y) = 4

1 1 1 X = 6 1 1 1 Y = 148
Probabilit --- --- --- Probabilit --- --- ---
2 4 4 3 2 6

Ces deux variables alatoires ont mme esprance. Cette grandeur typi-
que ne permet pas de les distinguer. Cet exemple montre bien que lcart-
type dune variable alatoire est un indicateur de dispersion autour de sa
moyenne.
1. Les calculs de la moyenne et de lcart-type des v.a. discrtes finies peuvent se faire avec
des calculatrices possdant les fonctions statistiques, les frquences tant remplaces par les
probabilits.

160 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 161 Mercredi, 24. novembre 2010 10:19 10

Proprits de la variance
1. var(X) est la valeur minimale de E ( X b ) 2 , car on montre que :

2
E ( X b ) 2 = var ( X ) + E ( X ) b

De cette formule, on dduit :
{var(X) = 0 X est une variable certaine}
2
la relation usuelle : var ( X ) = E ( X 2 ) E ( X )

2. laide de cette dernire expression de la variance, on montre sans
difficult :
a et b , var ( aX + b ) = a 2 var ( X ) aX + b = a X
3. La variance dune somme de deux variables alatoires indpendantes
X et Y est gale la somme des variances :
var(X + Y) = var(X) + var(Y)
en effet :
var ( X + Y ) = E ( ( X + Y E ( X + Y ) ) 2 )
= E ( X E ( X ) + (Y E ( Y ) ) 2
= E ( ( X E ( X ) )2 ) + E ( ( Y E ( Y ) )2 )
+ 2E (( X E ( X ))(Y E (Y )))
= var ( X ) + var ( Y ) + 2 E ( X E ( X ) ) ( Y E ( Y ) )
pour deux variables indpendantes, le dernier terme est nul
var(X + Y) = var(X) + var(Y)
1re consquence
X et Y indpendantes var(X Y) = var(X) + var( Y) = var(X) + var(Y)
2de consquence
Dunod. La photocopie non autorise est un dlit.

Soient n variables alatoires X1 , X2 , ,Xn mutuellement indpendantes


et de mme variance 2, la variance de leur somme est gale n2 :
n n


var X i =
i = 1 i=1
var ( X i ) = n 2

n
1

Si on dsigne par X leur moyenne : X = --- X i , on obtient :
ni = 1

var ( X ) =
2
-----
n

MODLE PROBABILISTE ET VARIABLE ALATOIRE 161


P131-178-9782100549412.fm Page 162 Mercredi, 24. novembre 2010 10:19 10

Une variable alatoire rduite est une variable alatoire dont lcart-type
est gal 1. Si X a une moyenne m et un cart-type , on peut lui associer
une variable alatoire Y centre rduite :
Xm
Y = -------------
-

D. Covariance de deux variables alatoires,


coefficient de corrlation linaire
On appelle covariance dun couple de variables alatoires X et Y la quantit :
cov ( X , Y ) = E { ( X E ( X ) ) ( Y E ( Y ) ) } = E ( XY ) E ( X ) E ( Y )
var(X + Y) = var(X) + var(Y) + 2cov(X, Y)

On dduit de la proprit 4 de lesprance mathmatique :


X et Y indpendantes cov(X, Y) = 0

Proprits de la covariance
1. cov(X,Y) = cov(Y, X)
2. cov(X, X) = var(X)
3. a, b, c et d  :
cov ( aX + b, cY + d ) = ac cov ( X , Y )
var ( aX + bY + c ) = a 2 var ( X ) + b 2 var ( Y ) + 2ab cov ( X , Y )
4. cov ( X , Y ) var ( X ) var ( Y ) , cette ingalit est une consquence
de lingalit de Schwarz.
On appelle coefficient de corrlation linaire entre X et Y le rapport :
( X , Y )-
= cov-----------------------
X Y

Des proprits de la covariance, on dduit que le coefficient de corrlation


linaire est invariant par changement dorigine et dchelle et quil est com-
pris entre 1 et + 1. On peut montrer quil est gal + 1 si et seulement si X
et Y sont lies par une relation linaire. Dautre part, si X et Y sont indpen-
dantes, leur coefficient de corrlation linaire est nul, mais la rciproque nest
pas vraie. On retrouve lanalogie de ce coefficient avec le coefficient de
corrlation linaire r dfini entre deux variables statistiques au chapitre 3, II.A.

162 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 163 Mercredi, 24. novembre 2010 10:19 10

E. Moment, fonction gnratrice des moments


1) Moment
On appelle moment mk dordre k (k entier positif) dune variable alatoire X
lesprance mathmatique de Xk si elle existe :
mk = E ( X k )
Lesprance mathmatique nest autre que le moment dordre 1.
On appelle moment centr k dordre k (k entier positif) dune variable
alatoire X lesprance mathmatique de ( X E(X))k, si elle existe :
k
k = E X E ( X )

La variance nest autre que le moment centr dordre 2 ; le moment centr
dordre 1 est toujours nul.

2) Moment factoriel
On appelle moment factoriel [k] dordre k (k entier positif) dune variable
alatoire X lesprance mathmatique de X ( X 1 )..... ( X k + 1 ) si elle
existe :

[ k ] = E X ( X 1 )..... ( X k + 1 )

Le moment factoriel dordre k est une combinaison linaire des moments
non centrs m1 , m2 , , mk
Relations entre moments et moments factoriels jusqu lordre 4 :

[1] = m1 m1 = [1]

Dunod. La photocopie non autorise est un dlit.

[2] = m2 m1 m2 = [2] + [1]



[3] = m 3 3m 2 + 2m 1 m3 = [3] + 3 [2] + [1]

[4] = m 4 6m 3 + 11m 2 6m 1 m 4 = [ 4 ] + 6 [ 3 ] + 7 [ 2 ] 11 [ 1 ]

3) Fonction gnratrice des moments


La fonction gnratrice des moments va tre prsente en se restreignant
une variable alatoire discrte valeurs possibles entires non ngatives.
Cette fonction caractrise la loi dune variable alatoire, et elle permet de
plus dobtenir les moments factoriels par drivation.

MODLE PROBABILISTE ET VARIABLE ALATOIRE 163


P131-178-9782100549412.fm Page 164 Mercredi, 24. novembre 2010 10:19 10

On appelle fonction gnratrice gX des moments dune variable alatoire


X discrte, valeurs possibles entires non ngatives , lesprance mathma-
tique de uX, u tant compris entre 0 et +1 :
+
gX (u) = E (uX ) = u p
i=0
i
i pour 0u1

Proprits de la fonction gnratrice des moments


1. Pour 0 u 1 , la fonction gX est continue, car la srie qui la dfinit
est uniformment convergente en u :
+ +
gX (u) =
i=0
u i pi p
i=0
i = 1

2. gX(0) = 0 et gX(1) = 1
3. Si le moment factoriel dordre k de X existe, on montre que pour u
compris entre 0 et 1:
+
g X( k ) ( u ) = [ i ( i 1 )..... ( i k + 1 )u
i=k
i k] pi g X( k ) ( 1 ) = [ k ]

en notant g X( k ) la drive dordre k de la fonction g X

Cette proprit de la fonction gnratrice est utilise pour le calcul des


moments factoriels qui permettent de calculer les moments non centrs, puis
centrs.

F. Indicateurs de forme
Ces indicateurs donnent des informations sur la forme de la loi de X, et en
particulier, ils la comparent la loi normale (chapitre 7, II.B). Ils sont direc-
tement inspirs des coefficients dasymtrie (en anglais skewness) et dapla-
tissement ( kurtosis) dfinis en statistique descriptive.
Fisher a dfini les coefficients dasymtrie et daplatissement dune varia-
ble alatoire X, dont les premiers moments existent, par :
3
coefficient dasymtrie 1 = --------
23/2

coefficient daplatissement 2 = -----24 3
2
Les moments centrs dordre impair tant nuls pour une distribution
symtrique, 1 est nul si la distribution de X est symtrique par rapport la

164 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 165 Mercredi, 24. novembre 2010 10:19 10

moyenne m, mais la rciproque nest pas vraie : 1 peut tre nul sans que la
loi de X soit symtrique. Si la distribution de X est unimodale tale vers la
droite, 1 est positif. Dans le cas contraire, 1 est ngatif.
Le coefficient daplatissement 2 est nul pour une variable distribue selon
une loi normale, mais l encore, la rciproque nest pas vraie. Selon que la
loi de X est plus ou moins aplatie que la loi normale, 2 sera positif ou ngatif.
Plus que laplatissement, ce coefficient mesure limportance des queues
dune distribution.
Ces coefficients 1 et 2 sont invariants par changement dorigine et
dchelle.

G. Quantiles
Comme pour les variables statistiques, on dfinit pour les variables alatoires
les quantiles, encore appels fractiles, qui sont indicateurs de position partir
desquels on peut dfinir des indicateurs de tendance centrale et de dispersion.
On appelle quantile dordre (0 1) dune variable alatoire X de fonc-
tion de rpartition F toute valeur x telle que : F(x) = ( P(X x) = )
Notons que si F est continue et strictement croissante, le quantile x, pour
donn, existe et est unique. Si F nest pas continue et strictement crois-
sante, il peut ne pas exister ou il peut y avoir plusieurs solutions possibles.
La mdiane Me dune v.a. X est le quantile dordre 1/2 : Me = x0,5
Le premier quartile , not Q1, est le quantile dordre 1/4. Le troisime
quartile, not Q3, est le quantile dordre 3/4. La mdiane est le second quar-
tile. On dfinit aussi les dciles : le ime dcile Di est le quantile dordre i /10
(1 i 9).
Comme en statistique descriptive, on peut dfinir plusieurs indicateurs
partir des quantiles :
des indicateurs de tendance centrale comme par exemple, la mdiane
Me ou encore le milieu de lintervalle interquartile :
Dunod. La photocopie non autorise est un dlit.

1
--- ( Q 1 + Q 3 )
2
des indicateurs de dispersion comme, par exemple, ltendue interquar-
tile (Q3 Q1) ou lesprance mathmatique des carts absolus la mdiane :
E X Me ( = min E X b )
b

des indicateurs de forme comme, par exemple :


Q 3 + Q 1 2Q 2
-----------------------------------
Q3 Q1

MODLE PROBABILISTE ET VARIABLE ALATOIRE 165


P131-178-9782100549412.fm Page 166 Mercredi, 24. novembre 2010 10:19 10

Ce coefficient, compris entre 1 et + 1, est nul pour une distribution


symtrique, positif pour une distribution unimodale tale vers la droite, et
ngatif dans le cas contraire.

V. Convergence des variables alatoires relles


Les variables alatoires relles sont des applications de lensemble fonda-
mental dans . Dans certains cas, il est utile (voire ncessaire) de consi-
drer des suites de v.a. correspondant des suites dpreuves alatoires (ou
comme on le verra aux chapitres suivants, des suites de modles). Pour ces
suites, on va dfinir plusieurs notions de convergence, visant toutes dfinir
un comportement (ou une distribution) limite. Chacune correspond des con-
ditions diffrentes, mais bien entendu, plus ces conditions seront gnrales,
moins les proprits qui sen dduisent seront puissantes. Nous partirons du
mode de convergence le plus gnral, donc le plus faible.

Soit (Xn) une suite de v.a. relles, de fonctions de rpartition Fn . On


dit quelle converge en loi vers la v.a. X de fonction de rpartition F si
on a :
lim F n ( x ) = F ( x ) en tout point x , sauf aux points de disconti-
n
nuit de F
L
On crit alors X n X , et on parle aussi de convergence faible.

Cette notion de convergence est particulirement simple en pratique. En


effet, pour des variables alatoires { Xn } et X discrtes, elle revient :
lim P ( X n = x ) = P ( X = x )
n
et dans tous les autres cas, elle met en uvre les critres classiques de con-
vergence des fonctions.
Pour le cas des variables alatoires discrtes, cette notion de convergence
est utilise par exemple pour lapproximation dune loi binomiale par une loi
de Poisson ( laide de la formule de Stirling), ce que nous voyons au chapi-
tre 6, III.E. On notera cependant quil est possible par la convergence en
loi, qui ne fait intervenir que les fonctions de rpartition, de rechercher (et/
ou de poser) la convergence de v.a. discrtes vers une v.a. continue.
Dautre part, si on suppose la convergence en loi des v.a. { Xn } vers X, on
peut approcher Fn par F, et si leurs densits existent on peut approximer fn
par f, ce qui est pratiqu dans les chapitres suivants.

166 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 167 Mercredi, 24. novembre 2010 10:19 10

Plus restrictive que la convergence en loi, la convergence en probabilit


est dfinie ainsi :

Une suite Xn de v.a. relles converge en probabilit vers la v.a. X, si on a :


lim P ( X n X > ) = 0 pour tout > 0
n
P
On crit alors X n X ou galement plim Xn = X

Dans le cas de la convergence en probabilit vers une v.a. certaine, on


peut se ramener des conditions portant sur les deux premiers moments des
v.a. Xn. Pour passer au cas gnral de la convergence de Xn vers X, on con-
sidre alors la convergence vers 0 de la suite { Xn X}.
Pour le montrer, nous allons dabord tablir un rsultat intermdiaire.
Ingalit de Bienaym-Tchbychev
Soit Z une v.a. de moyenne et dcart-type , on a alors pour tout nom-
bre rel k :
1
P ( Z > k ) ----2
k
Supposant la variable Z continue, soit  lensemble des valeurs z de Z
tels que Z > k , on peut crire, en partant de la dfinition de la
variance de Z :

2 = var ( Z ) =
(z )
R
2

f ( z ) dz > ( z ) 2 f ( z ) dz



2 k 2 2 f ( z ) dz = k 2 2 f ( z ) dz = k 2 2 P ( Z > k )
 

et lingalit sen dduit. La dmonstration pour une v.a. discrte, identique


dans son principe, est laisse au lecteur.
Appliquons maintenant ce rsultat dans le contexte de la convergence en
Dunod. La photocopie non autorise est un dlit.

probabilit dune suite de v.a. Zn vers 0. En posant alors k = , lingalit


de Bienaym-Tchebychev scrit :
var ( Z n )
P Z n E ( Z n ) > -----------------
-
2
On voit par consquent que si la suite des moyennes E(Zn) converge vers
0, et si la suite des variances var( Zn) converge aussi vers 0, alors on a :
lim P ( Z n > ) = 0
n

ce qui montre que la suite de v.a. { Zn} converge en probabilit vers la v.a.
certaine 0.

MODLE PROBABILISTE ET VARIABLE ALATOIRE 167


P131-178-9782100549412.fm Page 168 Mercredi, 24. novembre 2010 10:19 10

Il suffit alors de prendre {Zn = Xn a} pour voir que si la suite des moyen-
nes E(Xn) converge vers a et la suite des variances var( Xn) converge vers 0,
alors la suite des v.a. { Xn} converge en probabilit vers a.
Une suite de v.a. dont la suite des moyennes converge vers une limite a
et dont la suite des variances converge vers 0, converge en probabilit vers a.
On notera cependant que ce dernier rsultat nest pas quivalent la dfi-
nition, et que lon peut parler de convergence en probabilit sans supposer
lexistence des moments dordre 1 et 2.
On peut montrer que la convergence en probabilit implique la conver-
gence en loi, mais que la rciproque nest pas exacte.
Le troisime mode de convergence que nous prsenterons, la convergence
en moyenne quadratique, est trs utilis dans les problmes destimation sta-
tistique.

Soit Xn une suite de v.a. relles de moyennes et de variances finies. On


dit que la suite Xn converge en moyenne quadratique vers X si
lim E ( X n X ) 2 = 0
n

Il sagit en fait dun cas particulier de la convergence dite en moyenne


dordre p, et dfinie pour des v.a. Xn telles que E X n X p existe, par :

lim E X n X p = 0
n
Dans la convergence en moyenne dordre p de la suite Xn vers X, on notera
lhypothse dexistence de :

E X n X p

On montre que si la suite Xn converge en moyenne quadratique vers X, et
que si la suite Yn converge en moyenne quadratique vers Y, alors la suite XnYn
converge en moyenne dordre 1 vers XY, cest--dire que la suite des
moyennes E(XnYn) converge vers E(XY). Ce rsultat est videmment parti-
culirement intressant dans ltude des liaisons entre variables alatoires.
Plus gnralement, on montre que si g(x, y) est une fonction continue en x
et en y, et si Xn (resp Yn) converge en probabilit vers X (resp. vers Y), alors
g(Xn , Yn) converge en probabilit vers g(X, Y).
Il sagit dun mode de convergence fort qui implique la convergence en
probabilit.
Dautre part, il est important de noter que la convergence en moyenne
dordre p implique la convergence en moyenne dordre q pour tout q < p. On

168 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 169 Mercredi, 24. novembre 2010 10:19 10

notera aussi que la convergence en probabilit nimplique pas la convergence


en moyenne dordre 1, cest--dire la convergence des moyennes.
Lensemble de ces trois modes de convergence est donc hirarchiquement
ordonn.
Mais il existe dautres modes de convergence, quil est plus difficile de
placer dans une telle squence hirarchique.
Ainsi, la convergence presque sre est dfinie comme suit.
La suite de v.a. relles Xn converge presque srement vers la v.a. relle
X si on a :
P lim ( X n X ) = 0 = 1
n
Ce mode de convergence implique aussi la convergence en probabilit,
donc galement la convergence en loi. Il nest pas li la convergence en
moyenne dordre p, mais les deux modes de convergence peuvent cependant
exister simultanment pour une suite de v.a. relles Xn.
Le diagramme de la figure 5.9 montre les relations que lon peut tablir
entre les diffrents modes de convergence.
Dautres modes de convergence (dont ltude est en dehors du cadre de
cet ouvrage) sont utiliss pour obtenir certaines proprits en thorie des pro-
babilits, parmi lesquelles on citera :
la convergence complte ;
la convergence uniforme presque sre.

Convergence
en moyenne dordre p

Convergence Convergence
Dunod. La photocopie non autorise est un dlit.

en moyenne dordre q < p presque sre

Convergence
en probabilit

Convergence en loi

Figure 5.9 Hirarchie des diffrents modes de convergence

MODLE PROBABILISTE ET VARIABLE ALATOIRE 169


P131-178-9782100549412.fm Page 170 Mercredi, 24. novembre 2010 10:19 10

Lapplication majeure des convergences de v.a., et particulirement de la


convergence en probabilit est la loi faible des grands nombres :

Soient Xi (i = 1, 2,, n) n v.a. relles indpendantes desprances mi


et dcarts-types i toutes finies, telles que :
n n
1 1
lim ---
n n
i=1
mi = m et
n n2
lim ----- i2 = 0
i=1
n
1--- P
alors on a :
n i=1
Xi m

Soit alors une preuve alatoire lissue de laquelle un rsultat R peut se pro-
duire avec la probabilit p. On rpte cette preuve indpendamment n fois, et
lon dsigne par Fn la variable alatoire gale la proportion dpreuves ayant
donn le rsultat R. Ces variables sont appeles frquences empiriques.
On applique directement la loi des grands nombres pour montrer la con-
vergence en probabilit des frquences empiriques vers la probabilit p. Cest
le thorme de De Moivre-Laplace.
partir de ce rsultat, toute lapproche frquentiste des probabilits ( supra,
I) sest dveloppe sur lvaluation de la probabilit dun vnement par la
limite de la frquence relative dapparition de cet vnement lorsquon rpte
indfiniment lpreuve alatoire lors de laquelle il peut se raliser.
On peut aussi dmontrer un rsultat plus gnral.
Loi forte des grands nombres

Soient Xi (i = 1, 2, , n) n variables alatoires relles indpendantes


desprances mi et dcarts-types i tous finis, telles que :
1
n n
2
lim ---
n n
i=1
mi = m et lim
n
i=1
-----2i- <
i
n
1--- p.s
alors on a :

n i=1
Xi m

Lune des applications de ce rsultat est la gnralisation du thorme


central-limite sous la condition de Lindeberg (chapitre 7, II.E).
Au total, ce sont donc toutes les bases des applications du calcul des pro-
babilits en statistique classique qui reposent sur ces deux rsultats, loi faible
et loi forte des grands nombres, donc sur les diffrentes notions de conver-
gence des suites de variables alatoires.

170 INTRODUCTION LA MTHODE STATISTIQUE


Dunod. La photocopie non autorise est un dlit.

On noubliera pas :

Cas discret Cas continu

Loi ou Les vnements lmentaires sont : X prend ses valeurs dans un intervalle (ou une runion
distribution de {X = xi}, xi , i I, I  dintervalles) de , ou dans  tout entier
probabilit dune Densit de probabilit fX :
variable avec : P(X = xi) = pi > 0 et pi = 1
iI
alatoire relle 1. f ( x ) 0 x 
La loi de probabilit est dfinie par les couples :
{xi , pi}, i I 2. f presque continue partout

3. f ( x ) dx = 1
a, b , a < b :

P(X [a ; b]) = p i avec I * = ( i I x i [a ; b] )
i I*
P(X = x) = 0
P(X ]a ; b ] ) = a, b , a < b :
P ( X b ) P ( X a ) = FX ( b ) FX ( a ) P(X [a ; b]) = P(X [a ; b[) = P(X ]a ; b]) = P(X ]a ; b[)
P131-178-9782100549412.fm Page 171 Mercredi, 24. novembre 2010 10:19 10

b
= F X (b) F X (a) =
f ( x ) dx
a

Esprance E(X ) = si x i p i < +


mathmatique
xi pi E(X ) = si
iI iI xf ( x )dx x f ( x )dx < +
 

Moment dordre k : k
si

MODLE PROBABILISTE ET VARIABLE ALATOIRE


mk = xi pi x i k p i < + mk = k f ( x ) dx si k f ( x ) dx < +
mk = E(Xk) iI iI x x

 

171
P131-178-9782100549412.fm Page 172 Mercredi, 24. novembre 2010 10:19 10

Testez-vous (les rponses sont donnes page 286)


Il y a au moins une rponse exacte par question.

1. Dans lensemble des classes Terminales dun lyce, 14 % des lves tu-
dient le russe, 68 % ntudient ni le russe ni lespagnol, 2 % tudient ces deux
langues :
a) 20 % des lves tudient au moins lespagnol
b) 16 % des lves tudient seulement le russe
c) 18 % des lves tudient seulement lespagnol
d) 32 % des lves tudient le russe ou lespagnol

2. Soient deux vnements A et B dun mme espace de probabilit tels que :


AB=
a) P(A B) = 0
b) A et B sont deux vnements incompatibles
c) A et B sont deux vnements indpendants
d) A et B sont la fois incompatibles et indpendants

3. Soient deux vnements A et B dun mme espace de probabilit tels que :


P(A) = 0,3 P(B) = 0,2 et P(A B) = 0,09
a) P( A B ) = 1,50 et P( B A ) = 0,60
b) P( A B ) = 0,30 et P( B A ) = 0,45
c) P( A B ) = 0,45 et P( B A ) = 0,30
d) P( A B ) = 0,27 et P( B A ) = 0,18

4. Soient deux vnements indpendants A et B dun mme espace de probabilit


tels que : P(A) = 0,3 et P(B) = 0,2
a) P(A B) = 0,5
b) P(A B) = 0,06
c) P(A B) = 0,06
d) P(A B) = 0,44

5. Trois chasseurs visent simultanment un mme livre et tirent en mme


temps. Soient p1, p2, p3 les probabilits respectives de toucher le livre pour cha-
que chasseur, alors la probabilit que le livre soit touch par au moins un des
chasseurs :
a) peut tre infrieure p1
b) est gale ( p1 + p2 + p3)
c) est gale (1 (1 p1)(1 p2)(1 p3))
d) est comprise entre ( p1 p2 p3) et (p1 + p2 + p3)

172 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 173 Mercredi, 24. novembre 2010 10:19 10

6. Soient deux vnements A et B dun mme espace de probabilit tels que :


P(A) = 0,6 P(B) = 0,5 et P(A B) = 0,1
a) les vnements A et B sont indpendants
b) les vnements A et B sont incompatibles
c) lvnement A B est certain
d) P( A B ) = 0,2

7. Si X est une variable alatoire continue, on a, quelque soient les nombres rels a
et b :
a) P(X = a) = 0
b) P(a < X < b) = P(a < X b)
c) P(a < X < b) P(a X < b)
d) P(X > a) = 1 P(X < a)

8. Une fonction de rpartition :


a) est une fonction strictement croissante
b) est dfinie sur tout 
c) prend ses valeurs dans lintervalle [0 ; 1]
d) est toujours continue et drivable

9. La loi de probabilit dune variable alatoire :


a) est entirement dfinie par la fonction de rpartition
b) est entirement dfinie par la fonction de densit
c) est entirement dfinie par lesprance mathmatique et la variance
d) est associe un espace probabilis

10. Lesprance mathmatique dune variable alatoire relle :


a) est toujours gale lune des valeurs possibles de la variable alatoire
b) est un nombre rel
c) est gale la mdiane si la distribution de probabilit est symtrique
d) existe toujours si la variable alatoire est discrte

11. Soient X une variable alatoire, a et b deux nombres rels :


Dunod. La photocopie non autorise est un dlit.

a) E(aX + b) = aE(X) + b
b) var( X + b) = var(X) + b
c) P(X > E(X)) = 0,5
yb
d) Y = aX + b FY(y) = F X -----------
a

MODLE PROBABILISTE ET VARIABLE ALATOIRE 173


P131-178-9782100549412.fm Page 174 Mercredi, 24. novembre 2010 10:19 10

12. La loi jointe des deux variables alatoires X et Y est donne dans le tableau
suivant :

Y
0 1 2
X
1 0,10 0,20 0,10
2 0,15 0,30 0,15

a) X et Y sont indpendantes
b) P(Y = 2 X = 1) = 1/4
c) (X,Y) = +1
d) E(Y) = 1

13. Soient deux variables alatoires X et Y lies par la relation X 2Y = 1 :


a) E(X) = 2E(Y) + 1
b) var(X) = 2var(Y)
c) (X,Y) = + 1
d) X et Y sont indpendantes

14. Soient deux variables alatoires X et Y telles que var(X) = 144, var(Y) = 81 et
var(X + Y) = 25
a) cov(X,Y) = -100
b) (X,Y) = 0
c) var(X Y) = 425
d) X et Y sont lies par une relation linaire

15. Soit un couple de v.a. (X,Y) pour lequel on dispose des lois conditionnelles de
X pour chaque valeur possible de Y et de la loi marginale en Y :

Y
1 2 3
X
1 0,2 0 0,5
2 0,8 1 0,5

et de la loi marginale de Y :

Valeur de Y 1 2 3
Probabilit 0,5 0,3 0,2

a) disposant de cette information, on peut calculer la loi du couple


b) la distribution de la v.a. { X Y = 3} est symtrique
c) la v.a. { X Y = 2} est certaine
d) P(X = 1) = 0,7

174 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 175 Mercredi, 24. novembre 2010 10:19 10

16. La loi jointe des deux variables alatoires X et Y est donne dans le tableau
suivant :

Y
0 1 2
X

0 0,15 0,20 0,15

1 0,10 0,25 0,15

a) le coefficient dasymtrie de la v.a. X est nul


b) var(X) = 0,25
c) E( Y X = 0) = 1
d) X et Y sont indpendantes

17. La loi jointe dun couple ( X, Y) de variables alatoires discrtes finies :


a) est entirement spcifie par le tableau donnant les xi , yj et pij
b) est entirement spcifie par les k lois conditionnelles { Y X = xi}
c) est entirement spcifie par les l lois conditionnelles { X Y = yj}
d) est entirement spcifie par les esprances, variances de X et Y et leur covariance
Dunod. La photocopie non autorise est un dlit.

MODLE PROBABILISTE ET VARIABLE ALATOIRE 175


P131-178-9782100549412.fm Page 176 Mercredi, 24. novembre 2010 10:19 10

Exercices (corrigs page 315)


Exercice 5.1
Dans un club sportif, il y a 75 adultes (dont 45 femmes) et 45 enfants (dont 25 filles).
On interroge au hasard un adhrent du club. Quelle est la probabilit que cet adhrent :
soit un adulte ;
soit de sexe masculin ;
soit une femme adulte ;
soit un adulte ou soit de sexe fminin.

Exercice 5.2
Aprs une enqute auprs dune population, on sait que 40 % des individus ne sont
jamais alls en Espagne et que 55 % des individus nont jamais pris lavion, mais que
25 % ont t en Espagne et ont dj pris lavion.
Quelle est la probabilit quun individu tir au hasard dans cette population ne soit
pas all en Espagne et nait jamais pris lavion ?

Exercice 5.3
Une enqute exhaustive sur un campus universitaire montre que sur les 32 564 tu-
diants, 23 522 lisent la revue Notre campus publie par lUniversit, 18 859 lisent la
revue La Vie tudiante publie par le BDE, et 11 422 tudiants lisent Notre campus
et La Vie tudiante.
1. On interroge au hasard un tudiant du campus. Calculez la probabilit que cet
tudiant :
ne lise ni Notre campus, ni La Vie tudiante ;
lise Notre campus et ne lise pas La Vie tudiante.
2. On interroge au hasard deux tudiants du campus et on admet que leurs rponses
sont indpendantes. Calculez la probabilit
que les deux tudiants ne lisent aucune des deux revues ;
quun tudiant lise les deux revues et que le second nen lise aucune.

Exercice 5.4
On lance n fois une pice de monnaie, on suppose que la probabilit dobtenir pile
est gale la probabilit dobtenir face. Soient A et B les vnements suivants :
A = obtenir au plus une fois pile
B = obtenir au moins une fois pile et au moins une fois face
1. Calculez P(A), P(B) et P(AB) pour n = 2 ; A et B sont-ils indpendants pour
n=2?
2. Mme question pour n = 3.

Exercice 5.5
Calculez la probabilit quil y ait 3 filles et 2 garons dans une famille de 5 enfants :
1. Si on suppose la probabilit de naissance dune fille gale la probabilit de nais-
sance dun garon
2. Si on suppose la probabilit de naissance dune fille gale 0,48

176 INTRODUCTION LA MTHODE STATISTIQUE


P131-178-9782100549412.fm Page 177 Mercredi, 24. novembre 2010 10:19 10

Exercice 5.6
La demande journalire X dun bien fabriqu par une entreprise est une v.a. qui suit
la loi suivante : P(X = 0) = 1/6 P(X = 1) = 1/6 P(X = 2) = 1/2 P(X = 3) = 1/6.
On suppose que le profit, fonction de la demande et du cot, vrifie la relation :
(X) = p.X C, p tant le prix unitaire du bien fix 600 , C tant le cot suppos
indpendant de la demande et gal 800 .
1. Calculez lesprance et lcart-type du profit. Quelle est la signification de lesp-
rance du profit ?
2. Dterminez la fonction de rpartition du profit et tracez son graphe.
Exercice 5.7
Une compagnie dassurances admet pour lanne venir et pour un certain type de
contrat, que 60 % des assurs nauront pas de sinistre. Par ailleurs on suppose que le
cot moyen de rglement des accidents est de 500 avec une probabilit de 0,25, de
1 500 avec une probabilit de 0,1, de 2 500 avec une probabilit de 0,05. Un
assur dclare au plus un sinistre de ce type dans lanne.
1. Pour esprer un bnfice moyen de 50 par assur, quel doit tre le montant de
la cotisation ?
2. Quelle est la probabilit pour que le cot de rglement total de deux assurs pris
au hasard nexcde pas le montant encaiss de leurs cotisations (au tarif dtermin
au 1) ?
Exercice 5.8
Dans une banque, un systme de guichet automatique a t mis en place et permet de
faire des oprations bancaires courantes : extrait de compte, remise de chque, retrait.
Le nombre de clients utilisant le guichet automatique dans un intervalle de temps de
5 minutes est une v.a. X telle que :
P(X = 0) = 0,3, P(X = 1) = 0,3 et P(X = 2) = 0,4
1. Calculez E(X) et var(X).
2. On suppose que les nombres de clients utilisant le guichet automatique sur deux
priodes de 5 minutes ne se chevauchant pas sont indpendants. Soit Y la v.a.
gale au nombre de clients utilisateurs sur une priode dune heure. La v.a. Y peut
scrire :
12
Y = Xi
i=1
o Xi dsigne le nombre de clients utilisateurs au cours de ie intervalle de 5 minutes
Dunod. La photocopie non autorise est un dlit.

lorsquon dcoupe lheure en 12 intervalles de 5 minutes ; chaque Xi suit la mme loi


que X.
Quelles sont les valeurs possibles de Y ?
Calculez E(Y), var(Y) et P(Y = 0).
3. Chaque client ne peut effectuer plus de 2 oprations au guichet automatique. La
banque a constat que chaque client effectue :
3 fois sur 10 : 2 oprations
6 fois sur 10 : 1 opration
1 fois sur 10 : 0 opration (compte non approvisionn, par exemple)
Soit Z, le nombre doprations effectues dans un intervalle de temps de
5 minutes.

MODLE PROBABILISTE ET VARIABLE ALATOIRE 177


P131-178-9782100549412.fm Page 178 Mercredi, 24. novembre 2010 10:19 10

3.1. Donnez dans un tableau double entre lensemble des probabilits condition-
nelles de Z sachant X.
3.2. Quelle est la loi de Z ? Calculez E(Z) et var(Z).

Exercice 5.9
Une usine de pellicules de photo dispose de trois machines A, B et C qui fabriquent
respectivement 20 %, 50 % et 30 % de la production totale. Les proportions de pelli-
cules dfectueuses fabriques par les machines A, B ou C sont respectivement gales
6 %, 5 % et 3 %.
On tire au hasard une pellicule dans la production, calculez :
la probabilit que cette pellicule soit dfectueuse ;
la probabilit quelle provienne de la machine A sachant quelle est dfectueuse ;
la probabilit quelle provienne de la machine A sachant quelle est non dfec-
tueuse.

Exercice 5.10
Un couple ( X, Y) de variables alatoires suit la loi jointe donne dans le tableau
suivant :

Y
u 0 1
X

0 1/4 a 1/8

1 1/5 b 1/10

u, a et b tant des valeurs relles.


1. Pouvez-vous dterminer a et b de telle sorte que les variables alatoires X et Y
soient indpendantes en probabilit ?
2. Dans ces conditions, dterminez la loi marginale de X, et les lois conditionnelles
de X pour les diffrentes valeurs de Y.
3. Si a = 1/5, existe-t-il une valeur de u telle que le coefficient de corrlation
linaire (X, Y) soit nul ? Les variables alatoires X et Y sont-elles alors indpen-
dantes en probabilit ?

Exercice 5.11
Soient deux variables alatoires X et Y : X prend les valeurs 0 et 1 avec les pro-
babilits 1/2 et 1/2, Y prend les valeurs 0 et 2 avec les probabilits 1/3 et 2/3. On
note : P(X = 0 et Y = 0) = p.
1. Calculez, en fonction de p, les probabilits suivantes :
P(X = 0 et Y = 2) P(X = 1 et Y = 0) et P(X = 1 et Y = 2)
Entre quelles limites peut varier p ?
2. Calculez, en fonction de p, le coefficient de corrlation linaire (X, Y).

178 INTRODUCTION LA MTHODE STATISTIQUE


P179-210-9782100549412.fm Page 179 Jeudi, 18. novembre 2010 12:09 12

6. L es principaux
modles statistiques
discrets
Notion de modle

Par modle on entend une reprsentation simplifie dun processus,


dun systme.
Dans les domaines des sciences conomiques et de gestion, on cherche
disposer de modles pour analyser, prvoir et dcider. La nature mme
des facteurs intervenant en gestion et en conomie explique le caractre
alatoire, cest--dire non dterministe, donc non contrlable totale-
ment du modle quon cherche dfinir pour reprsenter le systme
tudi.
Dans la plupart des cas, on dispose dun ensemble fragmentaire de don-
nes partir desquelles on cherche une reprsentation globale. Cest l
une des dmarches classiques en statistique, dduire des informations
fournies par un chantillon une ou plusieurs caractristiques concernant
la population do lon extrait lchantillon ; il sagit l de linfrence sta-
tistique.
La construction dun modle est destine donc analyser, prvoir ou
dcider partir dun support rigoureux et fiable ; sa recherche est ainsi
un travail formel. Pour laborder il est ncessaire de dfinir avec prcau-
Dunod. La photocopie non autorise est un dlit.

tion tous les lments dont on dispose :


la population pour laquelle le modle est destin ;
lindividu, ou unit lmentaire de la population ;
le caractre tudi sur chacun des individus, et qui dfinit le phno-
mne tudi ;
la nature de ce caractre (qualitatif, quantitatif, discret ou continu).
partir de l, on peut associer par une dmarche analogue celle vue
en statistique descriptive une variable alatoire chaque individu de
la population. Cest cette variable alatoire et sa distribution de proba-
bilit qui vont constituer les lments du modle ; on dit que cette varia-
ble alatoire est la variable gnrique de la population (on dit aussi

LES PRINCIPAUX MODLES STATISTIQUES DISCRETS 179


P179-210-9782100549412.fm Page 180 Jeudi, 18. novembre 2010 12:09 12

variable parente) puisque tout individu tant quon ne connat pas ses
caractristiques individuelles peut tre reprsent par une variable
alatoire de mme loi quelle. Il sera alors possible dtudier un ensem-
ble dindividus extrait de la population gnrale comme un ensemble de
variables alatoires ayant toutes comme loi, la loi de la variable gnri-
que de la population. Lorsque ces variables sont indpendantes entre
elles, on dit quelles forment un chantillon de la variable parente ; cette
condition dindpendance est quivalente un tirage avec remise des
individus formant lchantillon au sein de la population.
Modles empiriques (ou exprimentaux)
Ce sont des modles qui sont construits sur lobservation dune srie sta-
tistique. Leur validit dpend tout particulirement de la taille de la
srie statistique des observations. On recherche ici les caractristiques
essentielles de la srie observe (moyenne, mdiane, mode, quartiles,
symtrie ou non). Parmi les reprsentations en lois de probabilit con-
nues, on en cherche une qui soit cohrente avec les donnes observes,
du point de vue de ces caractristiques. On procde par analogie.
Modles thoriques (ou analytiques)
On tudie le phnomne en essayant de le dcomposer en composantes
lmentaires directement reprsentes et de faon naturelle par une loi
de probabilit (telle que la loi de Bernoulli ou la loi uniforme).
Le schma binomial comme le schma hypergomtrique ( infra II.B et
II.C), ou encore la loi gomtrique ( II.D) sont des exemples de cette
approche.
Classification des modles
On doit distinguer les modles discrets pour lesquels les diverses occu-
rences sont ponctuelles et parfaitement bien isoles (spares) les unes
des autres, des modles continus pour lesquels les occurences sont beau-
coup trop nombreuses pour pouvoir tre isoles ponctuellement et ne
peuvent tre tudies que par classes de valeurs. lintrieur des mod-
les discrets, on distingue encore les modles discrets finis (cest--dire
dont le domaine des valeurs est de cardinal fini) des modles discrets
infinis dnombrables.
Il existe dautres classifications mais qui concernent des modles qui ne
sont pas abords dans ce cours du fait de leur plus grande complexit et
de leur utilisation moins frquente.
De trs nombreux modles (discrets ou continus) ont t construits pour
correspondre des situations pratiques dtermines. N ous prsentons
dans ce chapitre et dans le suivant ceux qui sont le plus frquemment
utiliss, mais bien entendu il ne faudra pas croire que tout phnomne
puisse tre rapport aux quelques modles dcrits ici.

180 INTRODUCTION LA MTHODE STATISTIQUE


P179-210-9782100549412.fm Page 181 Jeudi, 18. novembre 2010 12:09 12

I. Les modles lmentaires


A. Le schma de Bernoulli
Toute preuve alatoire nayant que deux rsultats possibles peut tre consi-
dre comme une situation dalternative : si lun des deux rsultats ne se ra-
lise pas, cest que lautre le sera obligatoirement. En dautres termes, dans
une telle situation, les deux rsultats possibles sont complmentaires lun de
lautre, la somme de leurs probabilits tant gale 1.
Il sagit l dune situation extrmement frquente puisque ds quon cherche
mettre en vidence la prsence dun caractre particulier pour les individus
dune population, tout individu de cette population peut tre dcrit selon une
telle alternative : ou bien il prsente ce caractre ou bien il ne le prsente pas.
Ainsi par exemple lorsquon cherche valuer limpact dune campagne
publicitaire sur les achats dun nouveau produit, on peut associer chaque
individu sond (parmi ceux ayant acquis ce produit aprs la campagne publi-
citaire) trois variables alatoires :
la premire met en vidence si lindividu possdait dj auparavant ce produit ;
la seconde met en vidence si lindividu a t touch par la campagne
publicitaire ;
la troisime dcrit si lacquisition du produit a t induite par la campa-
gne publicitaire.
Il sagit l dune possibilit de formalisation (et bien entendu ce nest pas
la seule !), mais chacune de ces trois variables correspond bien une situa-
tion dalternative. Ltude des effets ventuels de cette campagne publicitaire
met en uvre les outils appropris de lanalyse statistique.
Dans ces situations de dualit, lune des deux issues est celle que privil-
gie ltude, elle correspond la positivit dun index, la prsence du carac-
Dunod. La photocopie non autorise est un dlit.

tre pour chaque individu de la population faisant lobjet de ltude, par


opposition son absence. Les alas quon peut dfinir dans ces cas tant des
alas qualitatifs, il faut trouver le codage le plus appropri. Cest cet aspect
de prsence/absence qui limpose, et on code par 0 et 1 les deux issues pos-
sibles, celle quon cherche mettre en vidence tant code 1.
On dfinit ainsi une variable alatoire qui ne peut prendre que
deux valeurs, savoir 0 et 1. Elle porte alors le nom de variable alatoire de
Bernoulli1, et possde alors une loi de probabilit trs simple pour laquelle p
1. Jacques Bernoulli (1654-1705), scientifique suisse a beaucoup contribu au dveloppement
du calcul des probabilits (loi des grands nombres) et aux statistiques.

LES PRINCIPAUX MODLES STATISTIQUES DISCRETS 181


P179-210-9782100549412.fm Page 182 Jeudi, 18. novembre 2010 12:09 12

reprsente la probabilit de lissue quon veut mettre en vidence (notation


conventionnelle). On note souvent q = 1 p la probabilit de lautre terme
de lalternative. Le terme de variable alatoire de Bernoulli est synonyme de
celui de variable alatoire indicatrice (indiquant la ralisation ventuelle de
lvnement de probabilit p). Il faut bien se souvenir quune variable de
Bernoulli est dfinie par les 2 valeurs 0 et 1 (et celles-l seulement ; toute
autre paire de valeurs ne permet plus lappellation de variable de Bernoulli ;
ceci se justifie comme on le verra dans la suite pour la construction des
modles binomial, hypergomtrique et de Pascal). Le tableau de la loi de
probabilit dune telle variable est parfaitement connu ds que p lest. La loi
de Bernoulli dpend du seul paramtre p.
Valeur de X 0 1

Probabilit q=1p p

Le diagramme en btons et le graphe de la fonction de rpartition dune


variable de Bernoulli ( cf. figure 6.1) sont particulirement simples.
Diagramme en btons Fonction de rpartition

1 1

1p 1p

0 1 0 1

Figure 6.1 Loi de Bernoulli

Lesprance dune variable de Bernoulli de paramtre p est gale p. En


effet :
E(X) = 0 (1 p) + 1 p = p
Le moment dordre 2 est gal aussi p, puisque :
E(X2) = 02 (1 p) + 12 p = p
Par consquent, la variance est gale pq :
var(X) = E(X2) (E(X))2 = p p2 = p(1 p) = pq
On remarquera au passage que la fonction x(1 x) dont la drive est gale
(1 2x) a un maximum pour x = 1/2, maximum gal 1/4. Par consquent,

182 INTRODUCTION LA MTHODE STATISTIQUE


P179-210-9782100549412.fm Page 183 Jeudi, 18. novembre 2010 12:09 12

la variance dune variable de Bernoulli est au plus gale 1/4, et lcart-type


est au plus gal 1/2.
En conclusion, on retiendra que toute situation alatoire dalternative
peut tre reprsente par une variable de Bernoulli dont le paramtre p,
gal la probabilit de lissue quon cherche mettre en vidence, est
gal lesprance, la variance tant gale p(1 p).

B. La loi uniforme discrte


Un exemple particulier de loi de Bernoulli est celui pour lequel p = q = 1/2.
Dans ce cas, les deux termes de lalternative pouvant se prsenter lissue
de lpreuve alatoire sont quiprobables. Cette situation dquiprobabilit
correspond souvent des situations dans lesquelles on ne dispose daucune
information permettant de mieux apprhender lvnement auquel on sint-
resse.
La loi uniforme discrte en est la gnralisation. On suppose cette fois que
lexprience alatoire possde k issues distinctes, possdant chacune la mme
chance dtre ralise. On dfinit alors dans ce contexte une variable alatoire
X pouvant prendre toutes les valeurs entires comprises entre 1 et k, chacune
de ces valeurs tant associe lune des k issues de lpreuve alatoire. On
peut donc crire dune part :
k k
( X = i ) = 1
P( X = i) = P
i =1 U
i=1
et dautre part, P(X = i) tant constante, on peut la dsigner par p.
On en dduit :
k k
1 =
i=1
P( X = i) = p = k p
i=1
Dunod. La photocopie non autorise est un dlit.

et la probabilit commune p est gale 1/ k


La loi de probabilit de cette variable alatoire est rsume dans le tableau
suivant :
Valeur de X 1 2 k

Probabilit 1/ k 1/ k 1/ k

On dduit les caractristiques essentielles :


k k
1 1 1 k(k + 1) +1
E(X ) = i --- = --- i = --- -------------------- = k-----------
-
i=1
k k i=1
k 2 2

LES PRINCIPAUX MODLES STATISTIQUES DISCRETS 183


P179-210-9782100549412.fm Page 184 Jeudi, 18. novembre 2010 12:09 12

autrement dit, lesprance de cette variable alatoire se situe lexact milieu


des valeurs possibles. Ce rsultat est tout fait naturel compte tenu de lqui-
probabilit.
Dautre part :
k k
1 1 1 k ( k + 1 ) ( 2k + 1 )
E( X 2) = i 2 --- = --- i 2 = --- ---------------------------------------- = (------------------------------------

k + 1 ) ( 2k + 1 )
-
i=1
k k i=1
k 6 6
do lexpression de la variance :
2 ( k + 1 ) ( 2k + 1 ) ( k + 1 ) 2 k2 1
var ( X ) = E ( X 2 ) [ E ( X ) ] = ------------------------------------- ------------------- = -------------
6 4 12
En ce qui concerne ces rsultats, on notera quils sont obtenus pour une
loi uniforme discrte dont les valeurs sont les entiers compris entre 1 et k (au
sens large). Par consquent, ils peuvent sappliquer toute situation alatoire
k issues quiprobables ds que celles-ci peuvent tre codes par les nom-
bres 1, 2, ,k. Si on doit adopter un autre codage, les valeurs de lesprance
et de la variance (comme de tout autre moment) seront modifies puisquelles
dpendent des valeurs possibles de la variable alatoire.
On peut encore donner la fonction gnratrice des moments de cette varia-
ble alatoire uniforme discrte. On a :
k
1
gX (u) = E (uX ) = u --k-
i=1
i

ce qui permet dobtenir les moments successifs, mais aussi de retrouver les
rsultats prcdents. On constate aussi par ailleurs que les moments factoriels
dordre strictement suprieur k sont nuls : [n](X) ds que n > k
On ajoutera simplement pour terminer que le diagramme en btons de
cette loi est form de btons de mme hauteur, et que le graphe de la fonction
cumulative est form de marches descalier galement espaces (lespace
entre deux dentre elles tant de 1/ k) et de mme largeur (lunit).

II. Les schmas de Bernoulli itratifs


Le schma de Bernoulli est le plus simple des modles probabilistes, cependant
il est fondamental. Ceci est d au fait que le plus grand nombre de situations
alatoires peuvent se dcomposer en successions dpreuves lmentaires de
Bernoulli. On nenvisagera ici que la situation o le rsultat du phnomne
complexe initial est gal la somme des rsultats des preuves lmentaires
de Bernoulli.

184 INTRODUCTION LA MTHODE STATISTIQUE


P179-210-9782100549412.fm Page 185 Jeudi, 18. novembre 2010 12:09 12

Dans ce cadre, on tudiera une succession dpreuves de Bernoulli :


en nombre fix, et avec indpendance schma binomial,
en nombre fix et sans indpendance schma hypergomtrique,
en nombre alatoire, jusqu ce que lon ait obtenu pour la 1 re fois
lissue recherche de lalternative ainsi rpte schma gomtrique,
en nombre alatoire, jusqu ce que lon ait obtenu pour la kme fois
lissue recherche de lalternative ainsi rpte schma de Pascal.
Les deux premiers cas sont de nature totalement diffrente des deux der-
niers, car le nombre des itrations du modle lmentaire de Bernoulli est,
pour les premiers, connu au dpart, alors quil est la quantit alatoire pour
les derniers.

A. Le schma binomial
Dfinition
Une variable alatoire est dite suivre une loi binomiale de paramtres
n et p, note (n ; p), si elle peut tre considre comme la somme de n
variables alatoires de Bernoulli, indpendantes et de mme paramtre p.

Soit par exemple, une population dans laquelle une proportion p dindividus
prsente un caractre donn. On se pose la question de savoir si un chan-
tillon1 de n individus choisis au hasard dans la population a de grandes chan-
ces de contenir k individus ayant le caractre.
Chaque individu de la population (et donc de lchantillon) est prsent
dans ce problme par une alternative : il possde le caractre tudi ou non.
Il est parfaitement justifi de lui associer une variable de Bernoulli prenant
la valeur 1 sil a le caractre tudi, et la valeur 0 sinon. Cette variable ainsi
Dunod. La photocopie non autorise est un dlit.

dfinie pour chaque individu est la variable gnrique de la population (ou


encore la variable parente). Si on la note X, on a P(X = 1) = p, et donc aussi
P(X = 0) = 1 p = q. Les n individus (1, 2, n) de lchantillon seront ainsi
reprsents par n variables de Bernoulli X1, X2, , Xn ayant toutes la mme
loi de probabilit, celle de X, une loi de Bernoulli de paramtre p. On peut
supposer toutes ces variables indpendantes pour la simplicit du problme,
ce qui correspond par exemple un tirage des n individus avec remise, ou
bien un taux de sondage n / N infrieur 10 %, N tant la taille de la popu-
lation (ce point important sera revu au II.C avec la loi hypergomtrique).
1. Ce terme dchantillon se rfre la fois au sens usuel, et galement une collection de
variables alatoire indpendantes et de mme distribution.

LES PRINCIPAUX MODLES STATISTIQUES DISCRETS 185


P179-210-9782100549412.fm Page 186 Jeudi, 18. novembre 2010 12:09 12

Considrons la variable alatoire Y, somme des n v.a. Xi :


Y = X1 + X2 + + Xn
Les ralisations de cette variable alatoire tant des sommes de 0 et de 1,
sont des nombres entiers compris entre 0 et n.
La ralisation de la v.a Y associe un chantillon donn reprsente le
nombre dindividus qui possdent le caractre tudi dans lchantillon .
Cest ce type de construction par itration dun processus de Bernoulli, le
nombre ditrations tant fix et les preuves tant indpendantes, quon
appelle schma binomial.
La loi de probabilit de la variable somme Y est dfinie par :
les valeurs susceptibles dtre prises, ici les valeurs entires comprises
entre 0 et n
les probabilits correspondant ces valeurs :
n
P( Y = k ) = pk ( 1 p )n k
k
En effet, chaque groupe de k individus associs la valeur 1 (possdant
le caractre tudi), correspond un groupe form de ( n k) individus associs
la valeur 0. La probabilit de ralisation dune telle situation ( k fois prsence
du caractre et (n k) fois son absence) sobtient en multipliant les probabilits
associes aux ralisations des variables de Bernoulli correspondant chaque
individu (ces variables tant indpendantes, les vnements le sont aussi) :
p p p ( 1 p ) ( 1 p ) ( 1 p ) = p k ( 1 p ) n k




k fois (n k) fois
n n!
Il y a exactement = ------------------------ faons disoler k individus parmi les
k k! ( n k )!
n de lchantillon (les k premiers, les ( k 1) premiers et le dernier, , les
k derniers), donc dobtenir une somme gale k, chacun de ces
assemblages tant incompatible avec lun quelconque des autres
puisquau moins une paire dindividus passe dun tat lautre. La probabi-
lit que la somme Y prenne la valeur k, sans tenir compte du rang des Xi
prenant la valeur 1 condition quil y en ait k et k seulement, est ainsi laddi-
n
tion de fois la probabilit p k ( 1 p ) n k
k
Le tableau suivant prsente la loi de probabilit binomiale (n ; p) :
Valeur de Y 0 1 2 k n

n n k
Probabilit ( 1 p ) n np ( 1 p ) n 1 p 2 ( 1 p ) n 2 p ( 1 p ) n k pn
2 k

186 INTRODUCTION LA MTHODE STATISTIQUE


P179-210-9782100549412.fm Page 187 Jeudi, 18. novembre 2010 12:09 12

Les caractristiques dune loi binomiale (n ; p) sont trs faciles calcu-
ler si on utilise la dcomposition en somme de variables de Bernoulli ind-
pendantes. En effet :
E(Y ) = E( X1 + X2 + + Xn)
= E( X1) + E( X2) + + E( Xn)
= n E(X )
et par consquent :
E ( Y ) = np
Pour le calcul de la variance, la proprit dadditivit, toujours vraie pour
lesprance, suppose que les variables de Bernoulli Xi sont indpendantes, et
cette hypothse est fondamentale pour la validit du rsultat :
var ( Y ) = var ( X 1 + X 2 + + X n )
= var ( X 1 ) + var ( X 2 ) + + var ( X n )
= n var ( X ) = np ( 1 p )
On obtient le rsultat :
var ( Y ) = npq
On pourra comparer ce dernier rsultat avec celui du II.B obtenu pour
une loi hypergomtrique, cas dune somme de variables alatoires de Ber-
noulli non indpendantes.
La proprit suivante est intressante en pratique.

Proprit 1
Si Y et Z sont deux variables alatoires indpendantes, respectivement
distribues selon des lois binomiales (n1 ; p) et (n2 ; p), leur somme
Y + Z suit une loi binomiale (n1 + n2 ; p)
Dunod. La photocopie non autorise est un dlit.

En effet, Y tant la somme de n1 variables de Bernoulli indpendantes de


mme paramtre p, et Z tant la somme de n2 variables de Bernoulli indpen-
dantes de mme paramtre p, la v.a. Y + Z est la somme de (n1 + n2) variables
alatoires de Bernoulli indpendantes de mme paramtre p, et suit une loi
binomiale (n1 + n2 ; p).
Une seconde proprit trs utilise est la suivante.

Proprit 2
Si Y suit une loi (n ; p), alors n Y suit une loi (n ; 1 p)

LES PRINCIPAUX MODLES STATISTIQUES DISCRETS 187


P179-210-9782100549412.fm Page 188 Jeudi, 18. novembre 2010 12:09 12

En effet, nous avons vu que Y reprsente le nombre de fois, sur n indivi-


dus, o on a observ lun des termes de lalternative, celui de probabilit p.
Il sensuit que ( n Y) est le nombre des autres rsultats, ceux correspondant
une probabilit lmentaire (1 p). Or, il serait tout fait possible de reco-
der les deux termes de lalternative, en dfinissant une nouvelle variable de
Bernoulli prenant la valeur 1 avec la probabilit (1 p) et la valeur 0 avec la
probabilit p. La somme de ces n nouvelles variables alatoires reprsente de
nombre dpreuves (parmi les n ralises) qui donnent le rsultat de proba-
bilit (1 p), cest--dire la variable alatoire ( n Y) que nous tudions.
Cest une somme de variables alatoires de Bernoulli, indpendantes et de
mme paramtre (1 p). Do le rsultat annonc.
La construction du schma binomial par les variables de Bernoulli justifie
dautre part la notation (1 ; p) adopte parfois pour dsigner un ala de
Bernoulli de paramtre p.
Une variante de la loi binomiale est la loi dite binomiale en proportion .
On a vu quune loi binomiale caractrise le nombre de rsultats cods 1 dans
une succession dpreuves de Bernoulli (dont le nombre est fix lavance)
indpendantes. Dans un certain nombre de circonstances, on sintresse plu-
tt la proportion des rsultats cods 1. Or si Y est le nombre des rsultats
cods 1 dans une suite de n preuves de Bernoulli indpendantes, Y/n est la
frquence relative ou proportion.
Lorsque Y prend une valeur quelconque k comprise entre 0 et n, Y/n prend
la valeur k/n et rciproquement. Les deux vnements quivalents { Y = k} et
{Y/n = k/n} ont ainsi la mme probabilit. La loi de Y/n est dfinie par ses
valeurs et les probabilits correspondantes :

Valeur de Y/n 0 1/n 2/n k/n 1

Probabilit n n
p k ( 1 p ) n k p
n
( 1 p ) n np ( 1 p ) n 1 p 2 ( 1 p ) n 2
2 k

Le tableau de cette loi de probabilit se dduit de celui dune loi binomiale


en divisant simplement chaque valeur possible par n.
Le diagramme en btons et la fonction de rpartition dune loi (n ; p)
dpendent des 2 paramtres n et p. Le cas particulier o p = 0,5 correspond
lquiprobabilit des deux termes de lalternative de base (prsence/
absence) et se traduit graphiquement par une symtrie du diagramme en
btons (cf. figure 6.2).

188 INTRODUCTION LA MTHODE STATISTIQUE


P179-210-9782100549412.fm Page 189 Jeudi, 18. novembre 2010 12:09 12

Diagramme Fonction
1 en btons 1 de rpartition

0 1 2 3 4 5 6 0 1 2 3 4 5 6
Figure 6.2 Loi binomiale (6 ; 0,5)

Les calculs relatifs aux distributions binomiales peuvent se faire laide


de tables statistiques ( cf. annexe IV). Ces tables donnent pour quelques
valeurs de n et de p, les probabilits cumules de telles rpartitions. Le nom-
bre des valeurs de n et de p envisages est forcment trs limit. Grce la
proprit 2, on peut dduire les probabilits dune loi (n ; 1 p) de celles
dune loi (n ; p). Au lieu de recourir des interpolations linaires (parfois
causes dimportantes erreurs dapproximation), on utilisera plutt la formule
de rcurrence suivante (rappele lannexe II), entre les probabilits de deux
valeurs successives k et (k + 1) dune distribution binomiale (n ; p) :

n pk + 1( 1 p )n k 1 n!
----------------------------------------------- p
P( X = k + 1) k + 1 ( k + 1 )! ( n k 1 )!
-------------------------------- = ------------------------------------------------------------ = ---------------------------------------------------
P( X = k ) n
pk ( 1 p )n k n!
------------------------ ( 1 p )
k k! ( n k )!
(n k) p
= ----------------------------------
(k + 1)(1 p)
Dunod. La photocopie non autorise est un dlit.

Cette formule permet de calculer successivement les probabilits indivi-


duelles, en partant de P(X = 0) = (1 p)n
 Exemple
Aprs une lection deux candidats A et B, cest A qui lemporte avec
un score de 52 %. On suppose que le nombre dlecteurs qui se sont
exprims est lev.
On cherche dterminer la probabilit quun sondage prlectoral
portant sur 50 lecteurs ait donn une majorit de suffrages pour B
(cest--dire un rsultat loppos de la ralit des intentions de vote de
la population).

LES PRINCIPAUX MODLES STATISTIQUES DISCRETS 189


P179-210-9782100549412.fm Page 190 Jeudi, 18. novembre 2010 12:09 12

Ce problme doit tre modlis en dfinissant la population, celle des


lecteurs, puis lindividu, un lecteur et le caractre tudi, le bnfi-
ciaire du vote : soit A, soit B (B quivalant non A ).
Le caractre est un caractre qualitatif deux modalits, et chaque
lecteur est associe une variable de Bernoulli qui prend la valeur 1 sil
vote pour A et la valeur 0 sinon. La variable gnrique de la population
est une variable de Bernoulli de paramtre 0,52 puisque chaque lecteur
tir au hasard vote pour A avec une probabilit gale la proportion de
votants en faveur de A (cf. lanalogie entre probabilit et frquence rela-
tive vue au chapitre 5).
Les 50 lecteurs interrogs avant le scrutin forment un ensemble de
50 variables de Bernoulli de mme paramtre, savoir 0,52. De plus ces
variables sont indpendantes si le tirage est effectu avec remise ou si le
taux de sondage est infrieur 10 % (ce qui est suppos ici compte tenu
de la taille de lchantillon).
La somme de ces 50 variables Y = X1 + X2 + + X50 contient autant de
1 que dlecteurs favorables A, et reprsente le nombre dlecteurs,
parmi les 50 sonds, favorables A. Cette somme de variables de Ber-
noulli suit une loi binomiale (50 ; 0,52).
La probabilit que cet chantillon donne une majorit pour B est gale
la probabilit que le nombre dlecteurs favorables A soit strictement
infrieur 25.
Puisque Y reprsente le nombre dlecteurs favorables A, la variable
alatoire (50 Y) reprsente le nombre dlecteurs favorables B. Par un
raisonnement identique celui fait pour Y, la variable alatoire (50 Y) suit
une loi binomiale (50 ; 0,48). Lorsque B a la majorit, on a {50 Y > 25}
et la probabilit cherche vaut :
P(Y < 25) = P(50 Y > 25) = 1 P(50 Y 25)
Le calcul (programme ou table) donne P(50 Y 25) = 0,6648 pour la
loi (50 ; 0,48), et il y a donc prs de 33,5 % de chances quun chan-
tillon de 50 personnes donne un rsultat contraire la ralit ! Ceci est
d la conjonction de deux lments :
le rsultat final est assez serr car les deux termes de lalternative
sont trs peu spars en probabilit (0,52 contre 0,48) ce qui signifie que
si lchantillon tait lexact reflet de la population, on aurait 26 contre
24, soit 2 voix de diffrence seulement ;
on ninterroge que 50 personnes, et cela est bien peu, compte tenu des
scores rels, pour discriminer les 2 candidats de manire fiable (donc
crdible).
On notera enfin sur cet exemple que si le nombre de votants favorable
A suit une loi binomiale (50 ; 0,52), la proportion de votants favora-
bles A suit une loi binomiale en proportion.

190 INTRODUCTION LA MTHODE STATISTIQUE


P179-210-9782100549412.fm Page 191 Jeudi, 18. novembre 2010 12:09 12

B. Le schma hypergomtrique
Dans le schma binomial, on rpte une preuve de Bernoulli n fois, mais de
telle faon que les preuves soient indpendantes.
Cette condition peut paratre peu raliste. En pratique lorsquon tire un
chantillon de taille n dans une population de taille N(n < N), le bon sens veut
quon ne prenne pas 2 fois le mme individu, ce qui quivaut tirer lchan-
tillon sans remise (on parle encore de tirage exhaustif). Les variables ala-
toires de Bernoulli associes aux diffrents lments de lchantillon, et
indicatrices de la prsence ou de labsence dun caractre donn, sont, du fait
du tirage sans remise, mutuellement dpendantes.
La variable alatoire Y gale au nombre dindividus de lchantillon pos-
sdant le caractre considr est dans ce cas somme de n v.a. de Bernoulli
dpendantes, et de mme paramtre.
Notons p, la proportion dindividus dans la population (dont on dsigne
la taille par N) possdant le caractre tudi, et tudions la loi de cette varia-
ble alatoire Y dabord en ce qui concerne les valeurs possibles, puis pour ce
qui est des probabilits associes.
Le nombre dindividus de la population possdant le caractre tudi est
gal Np, et le nombre de ceux qui ne le possde pas est gal Nq. Le nombre
maximum dindividus de lchantillon possdant le caractre tudi ne peut
tre suprieur ni la taille de lchantillon, ni Np. Par consquent, la valeur
maximum de Y est gale min( n, Np). Le nombre minimum dindividus de
lchantillon possdant le caractre tudi est, bien entendu, au moins gal 0,
mais aussi au moins gal ( n Nq). En effet, si le nombre dindividus ne
possdant pas le caractre tudi, soit Nq, est plus petit que la taille n de
lchantillon, on aura au moins (n Nq) individus qui possderont le caractre
tudi dans lchantillon. Il sensuit que le nombre minimum dindividus de
lchantillon possdant le caractre tudi est gal max(0, n Nq).
La variable alatoire Y peut prendre toutes les valeurs entires comprises
Dunod. La photocopie non autorise est un dlit.

entre :
max(0, n Nq) et min(n, Np)
Pour le calcul de P(Y = k), k tant lune des valeurs possibles entre
max (0, n Nq) et min(n, Np), on peut utiliser la mthode combinatoire clas-
sique et calculer le rapport du nombre des occurences favorables au nombre
des occurences possibles.
Les occurences possibles sont reprsentes par le nombre dchantillons
de taille n quon peut extraire sans remise dune population de taille N, cest-
-dire . N
n

LES PRINCIPAUX MODLES STATISTIQUES DISCRETS 191


P179-210-9782100549412.fm Page 192 Jeudi, 18. novembre 2010 12:09 12

Les occurrences favorables sont reprsentes par les chantillons de taille


n pour lesquels k individus possdent le caractre tudi et ( n k) individus
ne le possdent pas.
Ces cas favorables sont ceux o lon a tir k units parmi les Np ayant le
caractre tudi, en nombre Np , et ( n k) units parmi les Nq ne le pos-
k
sdant pas, en nombre Nq . On a donc :
n k
Np Nq
k n k
- pour max(0, n Nq) k min (n, Np)
P ( Y = k ) = -----------------------------
N
n
On dit que la variable alatoire Y suit une loi hypergomtrique de para-
mtres N, n et p, ce quon note (N ; n ; p).
Lesprance dune telle variable alatoire est E(Y) = np puisque Y est la
somme de n variables de Bernoulli de paramtre p. La variance est gale :
Nn
var ( Y ) = np ( 1 p ) -------------
N1
mais, le calcul est plus dlicat en raison de la non indpendance des varia-
Nn n 1 est appel facteur
bles de Bernoulli. Le terme correctif ------------ - = 1 ------------ -
N1 N1
dexhaustivit. On remarque tout de suite que si le taux de sondage n/N est
trs petit, ce facteur dexhaustivit est trs proche de 1, et donc que lexpres-
sion de la variance dune loi hypergomtrique est trs voisine de celle dune
loi binomiale.
Plus gnralement on peut montrer que la loi (N ; n ; p) peut tre
approxime par une loi (n ; p) ds que le taux de sondage n/N est inf-
rieur 10 %. Cette conclusion justifie lutilisation des calculs sous lhypo-
thse dindpendance ds que le taux de sondage est assez petit, mme si
le tirage est exhaustif.
Cest la raison pour laquelle en pratique, malgr des tirages dchantillons
le plus souvent exhaustifs, on se rfre la loi binomiale, les probabilits
calcules laide de la loi binomiale donnant une bonne approximation des
probabilits de la loi hypergomtrique ds que le taux de sondage est assez
petit (cest--dire infrieur 10 %).
En conclusion, la loi hypergomtrique (N ; n ; p) est la distribution
dune somme de n variables alatoires de Bernoulli non indpendantes.
Une variable alatoire hypergomtrique reprsente, dans un contexte de
tirage exhaustif cest--dire de variables dpendantes le nombre de ra-
lisations parmi n preuves de Bernoulli de lun des termes dune alterna-
tive. Elle prend des valeurs comprises entre max(0, n Nq) et min(n, Np).

192 INTRODUCTION LA MTHODE STATISTIQUE


P179-210-9782100549412.fm Page 193 Jeudi, 18. novembre 2010 12:09 12

Cette variable alatoire a la mme esprance np que la variable binomiale


qui serait obtenue dans un contexte dindpendance, mais sa variance est
plus petite, diminue dans un rapport
Nn
-------------
N1
appel facteur dexhaustivit. Dans le cas dune trs grande population ou
plus gnralement dun taux de sondage faible (infrieur 0,1), on peut
supposer les tirages indpendants et remplacer la loi hypergomtrique
(N ; n ; p) par la loi binomiale (n ; p)

C. La loi gomtrique et la loi de Pascal


On se place dans une optique totalement diffrente, les conditions de base
restant inchanges, cest--dire quil y a toujours une succession dpreuves
de Bernoulli de mme paramtre p, mais dont on ne connat pas le nombre
de rptitions : on ne sarrte que lorsque le rsultat auquel on sintresse est
obtenu pour la l re fois (cas de la loi gomtrique) ou pour la Ke fois (loi de
Pascal).
chaque preuve lmentaire, est associe une variable de Bernoulli Xi
qui prend la valeur 1 si le rsultat auquel on sintresse sest ralis, et la
valeur 0 sinon. On pose :
P(Xi = 1) = p et P(Xi = 0) = 1 p = q
On suppose que les preuves sont rptes indpendamment les unes des
autres. On dsigne par Y le nombre total dpreuves ralises jusqu
lobtention du premier rsultat lmentaire de probabilit p. Il est clair
que Y peut prendre toute valeur entire au moins gale 1 (cest--dire stric-
tement positive), et que ces valeurs peuvent tre aussi grandes que lon veut.
Nous rencontrons ici pour la premire fois une variable alatoire dont le nom-
Dunod. La photocopie non autorise est un dlit.

bre de valeurs possibles est infini.


Cette dfinition doit tre bien comprise, car dans certains cas on sint-
resse au nombre Z dpreuves prcdant la premire ralisation du rsultat de
probabilit p, et on a bien sr : Z = Y 1
Pour ce qui concerne la variable alatoire Y, si le rsultat cod 1 se produit
pour la 1re fois la ke preuve, cela signifie que les (k 1) premires preuves
ont produit le rsultat complmentaire cod 0 de probabilit q. En raison de
lindpendance des preuves on a :
P( Y = k ) = q q q p = qk 1 p
}

(k 1) fois

LES PRINCIPAUX MODLES STATISTIQUES DISCRETS 193


P179-210-9782100549412.fm Page 194 Jeudi, 18. novembre 2010 12:09 12

On en dduit la fonction de rpartition :


n n1
1 qn
P(Y n) = qk 1 p = p q k = p -------------- = 1 q n
1q
k=1 k=0

On calcule aussi :

d
E(Y) =
k=1
k qk 1 p = p
k=1
k qk 1 = p -----
dq
k=1
-(q ) k

La srie de terme gnral tant absolument convergente, la srie des


qk
drives est gale la drive de la srie :

d k d
E(Y ) = p
k=1
dq
-----
- ( q ) = p ------ q k
dq k = 1
d q 1 1
= p ------ ------------ = p -------------------2 = ---
dq 1 q (1 q) p
On calcule de mme le moment dordre 2 :

E(Y 2) = k 2 qk 1 p = p . k 2 qk 1
k=1 k=1

= p k ( k 1 ) + k q
k=1
k1
= p k(k 1)q k 2q
+p kq k1

k=1 k=1

Le second terme de lexpression obtenue nest autre que E(Y). Pour le pre-
mier terme, on remarque que :

p k ( k 1 )q k 2 q = p q k ( k 1 )q
k=1
k2

k=1


d2
= pq k(k 1 )q k 2 = pq -------
dq
k=2
-(q )2
k

k=2

car encore une fois la double drivation sous le signe somme est licite en
raison de la convergence absolue de la srie.
On obtient :

d2
p k ( k 1 )q k 2 q = p q -------
-2 q k
dq k = 2

k=1

d 2 q2 2 2q
= p q --------2 ------------ = p q -------------------3 = -----2-
dq 1 q (1 q) p

194 INTRODUCTION LA MTHODE STATISTIQUE


P179-210-9782100549412.fm Page 195 Jeudi, 18. novembre 2010 12:09 12

et par consquent :
2q 1 2q + p q+ p+q q+1
E ( Y 2 ) = -----2- + --- = ---------------
2
- = ---------------------
2
- = -----------
-
p p p p p2
On dduit la variance dune variable alatoire de loi gomtrique :
q+1 1 q
var ( Y ) = -----------
- -----2 = -----2
p2 p p
Dans ltude de la modlisation des situations concrtes de ce type, on
doit faire trs attention de prciser si on sintresse au nombre total Y
dpreuves alternatives ralises jusqu lobtention du premier rsultat l-
mentaire de probabilit p (cas tudi), ou si on sintresse au nombre Z
dpreuves lmentaires de probabilit (1 p) ralises jusqu lobtention
du premier rsultat de probabilit p.
Comme nous lavons dj mentionn Z = Y 1. Les valeurs possibles de
Z sont toutes les valeurs entires positives ou nulle, alors que les valeurs pos-
sibles de Y sont toutes les valeurs entires strictement positives. La relation
entre Y et Z implique quon peut calculer les probabilits associes Z par-
tir de celles de Y :
P( Z = k ) = P( Y = k + 1 ) = qk p
P( Z n ) = P( Y n + 1 ) = 1 qn + 1
Lesprance mathmatique de Z est gale celle de Y diminue dune
unit :
1p
E ( Z ) = E ( Y 1 ) = E ( Y ) 1 = --1- 1 = ------------ = ---
q
p p p
alors que les variances de Y et Z sont gales :
q
var ( Z ) = var ( Y 1 ) = var ( Y ) = -----2
p

En rsum
Dunod. La photocopie non autorise est un dlit.

La loi gomtrique de paramtre p caractrise le nombre dpreuves de


Bernoulli indpendantes quil faut raliser pour obtenir pour la 1 re fois le
rsultat (de lpreuve de Bernoulli) auquel on sintresse (cod 1). Lesp-
1 1p
rance est gale --- et la variance -----------
-
p p2

La loi de Pascal est la gnralisation de la loi gomtrique lorsquon


recherche lobtention pour la Ke fois du rsultat considr. Une variable ala-
toire de Pascal Y dpend de deux paramtres p et K et peut prendre toutes
valeurs entires au moins gales K.

LES PRINCIPAUX MODLES STATISTIQUES DISCRETS 195


P179-210-9782100549412.fm Page 196 Jeudi, 18. novembre 2010 12:09 12

Pour calculer P(Y = j) pour j K, on remarque que si le je essai a donn le


rsultat de probabilit p, cest quau cours des (j 1) essais prcdents, on aura
obtenu (K 1) fois ce rsultat et ( j K) fois le rsultat contraire. On applique
la combinatoire du schma binomial, et la probabilit dobserver ( j K) fois le
rsultat de probabilit { q = 1 p} et ( K 1) fois le rsultat de probabilit p
au cours de ( j 1) essais est donne par :
j 1 pK 1 ( 1 p ) j K
K 1
Pour obtenir lvnement { Y = j}, il faut et il suffit que dans les ( j 1) pre-
miers essais, on ait obtenu (K 1) fois le rsultat de probabilit p et (j K) fois
le rsultat contraire, et que le je essai donne le rsultat de probabilit p. En
raison de lindpendance des preuves :
P(Y = j) = j 1 p (1 p)
K jK
pour j K
K 1
On peut montrer que moyenne et variance de la loi de Pascal de
paramtres p et K sont donns par :
K (1 p)
E(Y ) = K ---- et var ( Y ) = -------------------------
-
p p2
On doit bien porter attention au fait que la ressemblance avec les probabi-
lits dune loi binomiale nest quapparente. En effet, non seulement la somme
des exposants des termes p et (1 p) nest pas gale au nombre ( j 1), mais
ces probabilits sont dfinies pour toutes les valeurs de j au moins gales K,
et donc pour un ensemble de valeurs non born. Pour une loi de Pascal, gn-
ralisant la loi gomtrique, cest le nombre total dpreuves, et non pas le nom-
bre dpreuves conduisant au rsultat de probabilit p qui est alatoire .
Ces deux lois prsentent une diffrence trs importante avec la loi
binomiale : le nombre de rptitions de lpreuve lmentaire de Bernoulli
nest pas connu, et cest lui qui reprsente lalatoire du problme. En parti-
culier, une variable gomtrique peut prendre toute valeur entire positive,
sans limite suprieure.
Lexemple suivant montre lapplication de ces modles et linterprtation
de leurs caractristiques.
 Exemple
Supposons quon observe en moyenne 5 % de pices dfectueuses en
sortie dune chane de production lorsquelle est optimise. Si on souhaite
connatre la probabilit quun chantillon de 20 pices issu de cette chane
ne contienne aucune pice dfectueuse, on associe chaque pice un
caractre deux modalits, et cette modlisation de base amne dfinir
des variables de Bernoulli.
Le paramtre de ces variables de Bernoulli tant gal 0,05 puisque si
5 % des pices en moyennes sont dfectueuses, cela revient dire que la

196 INTRODUCTION LA MTHODE STATISTIQUE


P179-210-9782100549412.fm Page 197 Jeudi, 18. novembre 2010 12:09 12

probabilit quune pice prise au hasard soit dfectueuse est gale 0,05
(chapitre 5). On peut supposer les tirages indpendants en raison de la
grande taille de la population (ici la production).
Le schma binomial est ici adapt puisquon recherche la probabilit
dun nombre donn de dfectueux sur un chantillon de taille fixe.
Pour cette loi (20 ; 0,05), on a P(X = 0) = (0,95)20 = 0,3585
Si dautre part, on cherche calculer la probabilit que le premier dfec-
tueux ne soit pas lune des 20 premires pices, on gardera la modlisa-
tion des units statistiques par les alas de Bernoulli de paramtre 0,05
toujours supposs indpendants pour les mmes raisons. Mais le nom-
bre de pices tudies ntant plus donn, ce nombre devient lala dont
on a besoin de dterminer la loi de probabilit.
Soit Y le nombre de pices observes jusqu lobtention de la premire
pice dfectueuse. La variable alatoire Y est une variable alatoire dis-
tribue selon une loi gomtrique de paramtre 0,05 ; par consquent :

0,95 0,95 0,95


k1 k1 j
P ( Y 21 ) = 0,05 = 0,05 = 0,05
k 21 k 21 j 20

0,95
j
P ( Y 21 ) = 0,05 0,95
20

j0

20 1 20
= 0,05 0,95 ------------------- = 0,95 = 0,3585
1 0,95
Lesprance mathmatique de cette variable alatoire Y tant gale 20,
on doit tirer en moyenne 20 pices pour en observer une dfectueuse,
cest--dire quavant de tirer une pice dfectueuse, on tire, en
moyenne, 19 pices qui ne le sont pas.
La relation entre tous ces rsultats est laisse au lecteur.
Si on stait intress au nombre de pices examiner pour en tirer deux
dfectueuses, on aurait une loi de Pascal desprance mathmatique
gale 40. Ici encore, on laisse au lecteur le soin de comparer les deux
Dunod. La photocopie non autorise est un dlit.

derniers rsultats.
Ces deux lois, loi gomtrique et loi de Pascal, interviennent particulirement
en contrle de qualit, mais aussi dans la surveillance des vnements dont une
certaine frquence de survenue est interprte en terme de signal dalarme.
Les formules de la loi gomtrique sont suffisamment simples pour que les cal-
culs ne posent aucune difficult avec une petite calculatrice, et pour la loi de Pas-
cal, on peut recourir quelques pas de programme comme pour la loi binomiale.

Remarque
Les lois binomiale, hypergomtrique, gomtrique et de Pascal sont
donc toutes construites sur la base de la rptition dpreuves deux

LES PRINCIPAUX MODLES STATISTIQUES DISCRETS 197


P179-210-9782100549412.fm Page 198 Jeudi, 18. novembre 2010 12:09 12

issues (ou preuves de Bernoulli). lexception de la loi hypergom-


trique, elles se placent toutes dans un contexte dpreuves indpendan-
tes dont la caractristique p (probabilit de lissue de lalternative
quon cherche observer) est constante au cours du temps.
Ceci correspond une notion trs dveloppe dans la modlisation des
phnomnes dpendant du temps, savoir la stationnarit. Cette pro-
prit nest pas systmatiquement rencontre, et il faut apporter la plus
grande attention lanalyse de cette hypothse dans toutes les situa-
tions quon cherche reprsenter.
Beaucoup de cas ne correspondent pas en effet une succession station-
naire dpreuves de Bernoulli indpendantes. Nous avons vu que lind-
pendance stricto sensu pouvait quelquefois servir de reprsentation
approche des tirages exhaustifs (pour un taux de sondage suffisam-
ment faible), mais on devra soigneusement analyser le contexte pour
reconnatre sil est celui dune parfaite stationnarit (cest--dire de
constance dans le temps du paramtre p des preuves de Bernoulli suc-
cessives), sil est celui dune stationnarit approximative, ou si cette con-
dition ne peut tre suppose (auquel cas les outils mettre en uvre sont
plus complexes et dbordent du propos de cet ouvrage).
Le tableau suivant rsume de faon synthtique les principaux modles cons-
truits partir de litration du schma de Bernoulli.

Nombre Valeur Valeur Type


Loi Esprance Variance
ditrations minimale maximale de tirage

Bernoulli fix 0 1 sans p p(1 p)

Binomiale fix 0 n indpendant np np(1 p)

Nn
Hypergomtrique fix max(0, n Nq) min(n, Np) exhaustif np np ( 1 p ) -------------
N1

1 1 p
Gomtrique alatoire 1 sans indpendant --- ------------
p p2

K K (1 p)
Pascal alatoire K sans indpendant ---- ----------------------
p p2

III. La loi de Poisson


Cette loi peut tre envisage dans un contexte empirique (statistique), ou
danalyse (probabiliste).

198 INTRODUCTION LA MTHODE STATISTIQUE


P179-210-9782100549412.fm Page 199 Jeudi, 18. novembre 2010 12:09 12

A. Dfinitions et proprits 1

Dfinition
Une variable alatoire X ayant pour valeur possible tout nombre entier
positif ou nul, et telle que :
mk
P ( X = k ) = e m ------
k!
pour tout k 0 entier, est dite distribue selon une loi de Poisson1 de para-
mtre m, m tant un nombre rel strictement positif.

On remarque tout de suite quune telle variable alatoire prsente une diff-
rence essentielle avec les variables de Bernoulli ou binomiales, car elle est
discrte, mais non finie (cest--dire ici que les valeurs possibles ne sont pas
limites suprieurement). Nous avons dj rencontr cette situation avec la
loi gomtrique et la loi de Pascal.
Il sagit bien dune distribution de probabilit car, il est facile de le constater que :
toutes les probabilits sont positives ;
la somme des probabilits est gale 1, compte tenu de lexpression de
la srie exponentielle :
mk m k = m . e m = e 0 = 1
k0
P( X = k ) =
k0
e m ------ = e m
k! k0

------ e
k!
Le calcul de la moyenne est assez simple :
mk
E(X ) = k P( X = k ) = k e
k0 k0
m ------
k!
mk mk
= e m
k0

k ------ = e m
k! k1

k ------
k!
Dunod. La photocopie non autorise est un dlit.

car le premier terme de la somme est nul. Par consquent,


m mk 1 mk 1
E ( X ) = e m --------------------
k1
( k 1 )!
= m e m ------------------
( k 1 )!
k1

1. Simon-Denis Poisson (1781-1840), mathmaticien, probabiliste et physicien franais, qui


on doit dimportant dveloppements sur la loi des grands nombres, sur les suites dpreuves
de Bernouilli, sur la loi de Poisson, mais aussi sur les applications des probabilits dans les
domaines du droit.

LES PRINCIPAUX MODLES STATISTIQUES DISCRETS 199


P179-210-9782100549412.fm Page 200 Jeudi, 18. novembre 2010 12:09 12

Le changement de variable j = k 1 donne :


mj
E ( X ) = m e m -----j!-
j0
= m e m e m = m

Ce rsultat justifie la notation m adopte pour le paramtre de la loi de


Poisson puisque ce paramtre nest autre que la valeur moyenne.
En ce qui concerne le moment dordre 2, le calcul du mme type donne :
mk
E( X 2) = k
k0
2 P( X = k ) = k
k0
2 e m ------
k!
mk mk
= e m k
k0
2 ------ = e m
k! k1

k 2 ------
k!
car le l er terme de la srie tant nul, on peut commencer cette somme pour
k=1
On obtient ensuite :
mk mk
E ( X 2 ) = e m
k1
k 2 ------ = e m
k!
k1
( k ( k 1 ) + k ) ------
k!
mk mk
= e m { k ( k 1 ) } ----- ------
k!
-+ k
k!
k1 k1

Le deuxime terme de la dernire parenthse nest autre que E(X) soit


m. Pour le calcul du premier terme, on remarque que le terme initial pour
k = 1 est nul. On dbute la somme k = 2, et on simplifie par k(k1) :
mk mk
E ( X 2 ) = e m . k ( k 1 ) ------ + m = e m
k! k2

k ( k 1 ) ------ + m
k!
k1
m2 mk 2
= e m
k2
----------------------- + m
( k 2 )!
soit :
mk 2
E ( X 2 ) = m 2 e m ------------------
( k 2 )!
k2
+m

En faisant le changement de variable { j = k 2} dans la dernire somme,


on retrouve encore le dveloppement de la srie exponentielle, do :
E ( X 2 ) = m 2 e m e m + m = m 2 + m
Et on dduit la variance :
2
var ( X ) = E ( X 2 ) E ( X ) = m 2 + m m 2 = m

200 INTRODUCTION LA MTHODE STATISTIQUE


P179-210-9782100549412.fm Page 201 Jeudi, 18. novembre 2010 12:09 12

Ce rsultat a un intrt considrable, comme on le verra plus loin :

Pour une distribution de Poisson, moyenne et variance sont gales (et


gales la valeur du paramtre).

On peut aussi calculer la fonction gnratrice :


k m m
k ( um ) k = e m e um = e m ( 1 u )
gX (u) = E (uX ) = u e
k0
------
k!
= e m -------------
k0
k!
-

ce qui permet dobtenir le moment factoriel dordre r(r *) : [r](X) = mr


La proprit suivante est trs utile dans la construction des modles rgis
par des lois de Poisson.

Proprit 1
Si X1 et X2 sont deux variables alatoires indpendantes qui suivent des
lois de Poisson respectivement de paramtres m1 et m2, alors Y = X1 + X2
suit une loi de Poisson de paramtre m1 + m2

En effet, la variable Y peut prendre toutes les valeurs entires, positives ou


nulle. Calculons la probabilit quelle prenne lune quelconque de ces valeurs.

i = k

P(Y = k ) = P
i
U ({ X
= 0
1 = i } { X 2 = k i } )

i=k
= P({ X
i=0
1 = i} { X2 = k i})

i=k
= P({ X = i}) P({ X 2 = k i})
Dunod. La photocopie non autorise est un dlit.

1
i=0

donc :
i=k i=k
mi m 2k i
P(Y = k ) =
i=0
P( X 1 = i) P( X 2 = k i) =
i=0
e m1 -----1- e m2 ----------------
i! ( k i )!
-

soit :
( m + m ) i = k
i=k
m 1i m 2k i e 1 2 k!

( m1 + m2 )
P(Y = k ) = e ---------------------- = -------------------- ---------------------- m 1i m 2k i
i=0
i! ( k i )! k! i = 0 i! ( k i )!

LES PRINCIPAUX MODLES STATISTIQUES DISCRETS 201


P179-210-9782100549412.fm Page 202 Jeudi, 18. novembre 2010 12:09 12

et on reconnat dans la dernire somme le dveloppement du binme de


Newton appliqu la somme ( m 1 + m 2 ) k . Ce qui permet dcrire :
( m1 + m2 ) ( m1 + m2 )k
P(Y = k ) = e -------------------------
-
k!
ce rsultat prouvant le rsultat annonc.

Remarque
Ce rsultat peut stendre une somme finie de variables alatoires
indpendantes distribues toutes selon des lois de Poisson .
Il existe une forme rciproque de cette proprit.

Proprit 2
Si les variables alatoires indpendantes X et Y sont telles que la
somme (X + Y) est distribue selon une loi de Poisson, alors les variables
X et Y sont elles-mmes distribues selon des lois de Poisson.

On ne dmontrera pas cette proprit trs utile. Il faut remarquer ici quon
na pas le moyen direct de dcomposer (pour cette proprit 2) le paramtre
de (X + Y) en deux paramtres, lun pour X et lautre pour Y.
Une proprit, elle aussi caractristique de la loi de Poisson, est celle qui
suit, obtenue aisment en crivant le rapport des probabilits et en simplifiant :

Proprit 3
Si X suit une loi de Poisson de paramtre m, on a :
P( X = k )
-------------------------------- = m
----
P( X = k 1) k

Cette proprit implique la croissance des probabilits ponctuelles


P(X = k) tant que k m, et la dcroissance (rapide puisquinversement pro-
portionnelle k) ds que k > m.
P( X = m)
Dautre part si m est un entier, le rapport --------------------------------- est gal 1. Ceci
P( X = m 1)
signifie quil existe deux valeurs, m et m 1, qui ont mme probabilit. Cette
probabilit commune est la plus leve daprs ce quon vient de voir. Par
consquent, la loi de Poisson possde deux valeurs modales lorsque son
paramtre est un nombre entier .

202 INTRODUCTION LA MTHODE STATISTIQUE


P179-210-9782100549412.fm Page 203 Jeudi, 18. novembre 2010 12:09 12

B. Abord statistique
Daprs les proprits qui viennent dtre montres, on remarque quil est
justifi denvisager une loi de Poisson comme un modle reprsentatif de
donnes statistiques discrtes pour lesquelles la variable ne prend que
des valeurs entires, positives ou nulle, et pour lesquelles :
la moyenne et la variance sont sensiblement gales ;
fk