Vous êtes sur la page 1sur 48

i

M. BALDE UCAD/ESP/GCBA
ii

Université Cheikh Anta Diop de Dakar

Ecole Supérieure Polytechnique

Cours de Statistique
2e année

Mamadou BALDE

Département Génie Chimique et Biologie Appliquée

2011-2012

M. BALDE UCAD/ESP/GCBA
Sommaire

1 Généralités sur la statistique v


1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v
1.1.1 vocabulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v
1.1.2 Effectifs et Fréquences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v
1.2 Densité de classe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi
1.3 Graphiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii
1.3.1 Caractères Qualitatif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii
1.3.2 Caractères quantitatifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii

2 Séries Simples x
2.1 Moyenne arithmétique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x
2.2 Le Mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi
2.3 Médiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xii
2.3.1 Caractéristiques de position : les quantiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xii
2.4 Boîtes à moustaches (Box & Whiskers Plot) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv
2.5 Caractéristiques de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xv
2.5.1 Ecart Absolu moyen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xv
2.5.2 Variance, Ecart-type . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xv
2.5.3 Coefficient de variation (CV) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvi
2.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvii

3 Séries doubles xix


3.1 Cas de données non groupées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix
3.1.1 Moyenne et écart-type . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix
3.1.2 Corrélation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xx
3.1.3 Nuage de points . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxi
3.1.4 Droite de régression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxi
3.1.5 Prévision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxii
3.2 Cas de données groupées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxii
3.3 Distributions Marginales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxii
3.3.1 Effectifs marginaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxii
3.3.2 Fréquence marginales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxii
3.3.3 Distribution marginale de X . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxiii
3.3.4 Distribution marginale de Y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxiii
3.4 Indépendance Statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxiv
3.4.1 2 (khi-carré) de contingence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxiv
3.4.2 Paramètres d’une distribution à deux dimensions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxiv
3.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxvi

iii
Sommaire iv

4 Variables aléatoires réelles discrètes.Lois fondamentales xxviii


4.1 Notion de variable aléatoire discrète . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxviii
4.1.1 Définitions. Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxviii
4.1.2 Variables aléatoires discrète . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxix
4.1.3 Loi d’une variable aléatoire discrète . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxx
4.1.4 Espérence d’une variable aléatoire discrète . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxi
4.1.5 Variance et écart-type d’une variable aléatoire discrète . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxii
4.1.6 Fonction de répartition d’une variable aléatoire discrète . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxiv
4.2 Quelques lois classiques et fondamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxiv
4.2.1 La loi de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxiv
4.2.2 La loi Binomiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxv
4.3 La loi de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxvi
4.3.1 Table de la loi de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxvii
4.3.2 Espérence et variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxvii
4.3.3 La loi de Poisson comme loi de limite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxvii

5 Variables aléatoires réelles continues. Lois fondamentales xxxix


5.1 Variables aléatoires continues : généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxix
5.1.1 Nécessité de considérer des variables aléatoires continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxix
5.1.2 Impossibilité de donner simplement la loi d’une variable aléatoire continue . . . . . . . . . . . . . . . . . . . xxxix
5.1.3 Fonction de répartition d’une variable aléatoire continue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xl
5.1.4 Densité d’une variable aléatoire absolument continue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xli
5.1.5 Espérance d’une variable aléatoire continue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xliii
5.1.6 Variance et écart-type d’une variable aléatoire continue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xliii
5.2 Quelques lois classiques et fondamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xliii
5.2.1 La loi normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xliii
5.2.2 La loi Exponentielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xlvii

M. BALDE UCAD/ESP/GCBA
Chapitre 1
Généralités sur la statistique

1.1 Introduction
La statistique est une science, qui consiste à étudier des données, à les analyser et à les commenter. Elle
n’a pas pour objet d’étudier les éléments dans ce qui fait leur individualité mais plutôt dans ce qu’ils ont en
commun. Ainsi, une étude statistique portant sur des personnes n’a pas besoin de les étudier par rapport à leur
nom, prénom mais plutôt à leur sexe, age, revenues, localité...Il ne faut pas confondre la statistique, qui est la
science qui vient d’être définie à une statistique qui est un tableau résumant les données d’un événement.

1.1.1 vocabulaire
Les ensembles étudiés en statistique sont appelés populations ; leurs éléments portent le nom d’individus

Exemple 1.1 : Population d’étudiants du département de Chimie, population de véhicules importés au Sénégal
en 2009. Les facettes des individus de la population sont appelés caractères. Par exemple le sexe, la situation
matrimoniale, le salaire, la taille, le poids... sont des caractères. On convient de mettre entre guillemets les
caractères. Les valeurs prises par un caractère sont les modalités de celui-ci : le caractère "sexe" a deux
modalités : mâle et femelle ; le caractère situation matrimoniale en a quatre : célibataire, marié(e), veuf (ve) et
divorcé.
Un caractère peut être qualitatif ou bien quantitatif. Le caractère est dit qualitatif si ses modalités ne sont pas
mesurables. C’est le cas des caractères "sexe","situation matrimoniale", "couleur des yeux"... Si les modalités
du caractère sont mesurables, alors celui ci est dit quantitatif. Le caractère quantitatif porte aussi le nom de
variable statistique. Un caractère quantitatif est dit discret si ses valeurs sont isolées, il est dit continu s’il prend
n’importe qu’elle valeur intermédiaire entre deux valeurs données.

Exemple 1.2 Les caractères "nombre d’enfants par ménage", "nombre d’étudiants par classe" sont quantitatifs
discrets. Par contre les caractères "poids", "taille" et "âge" sont quantitatifs continus. Du fait de leurs nombres
interminables de valeurs, les caractères continus ont des modalités regroupés en intervalles de la forme [a; b[ ou
]a; b] (a et b 2 R) appelés classes.

1.1.2 Effectifs et Fréquences


Définition 1.1 Etant donné un caractère (qualitatif ou quantitatif) X de modalités x1 ; x2 ; :::; xn , on appelle
X
n
effectif de la modalité xi , le nombre ni ; d’individus ayant la modalité xi . En notant N= ni l’effectif total
i=1

v
Chapitre 1. Généralités sur la statistique vi

de ce caractère, on appelle fréquence de la modalité i ;, la quantité définie par


ni
fi = (1.1)
N
Définition 1.2 L’effectif cumulé croissant de la modalité xk est la somme de l’effectif de cette modalité et
des effectifs de toutes les modalités qui la précèdent, il s’écrit
X
k
Nk = ni = n1 + n2 +    + nk (1.2)
i=1
De même, la fréquence cumulée croissante de la modalité xk est la somme de la fréquence de cette modalité
et des fréquences de toutes les modalités qui la précèdent,elle s’écrit
X
k
Nk Xk
Fk = fi = = f = f + f +    + fk
N i=1 i 1 2
(1.3)
i=1
Exemple 1.3 Considérons le tableau statistique suivant donnant la répartition de 10 étudiants selon leur notes
obtenues à l’orale d’algèbre.

Tableau 1.1

Notes sur 20 07 08 10 11 15
Nombre d’étudiants 2 1 4 2 1

2 = 0; 2: Le nombre d’étudiants ayant au plus 10=20 est l’effectif


07=20 est f1 = nN1 = 10
La fréquence de la note
3
X N
cumulé N3 = ni = n1 + n2 + n3 = 2 + 1 + 4 = 7: La fréquence cumulée correspondant est F3 = 3 = 70%
i=1
N
Définition 1.3 L’effectif cumulé décroissant de la modalité xk est la somme de l’effectif de cette modalité et
des effectifs de toutes les modalités qui la suivent, il s’écrit
X
n
Nk0 = ni (1.4)
i=k
De même, la fréquence cumulée décroissante de la modalité xk est la somme de la fréquence de cette modalité
et des fréquences de toutes les modalités qui la suivent, elle s’écrit
X
n
Fk0 = fi (1.5)
i=k
Exemple 1.4 Le nombre d’étudiants ayant la note 10/20 et plus dans l’exemple (1.3) est N30= n3 + n4 + n5 =
N 03 7 = 70%
4 + 2 + 1 = 7: Leur pourcentage correspond à la fréquence cumulée décroissante F30 = N = 10
Propriété 1.1 La somme de toutes les fréquences donne 100%.

1.2 Densité de classe


Etant donnée une variable statistique continue X dont la distribution est présentée dans la tableau ( 1.2
page vii) :

Définition 1.4 L’amplitude de la classe i est par définition la différence


i = ai+1 ai (1.6)

Définition 1.5 La densité di de la classe i est définie par


n
di = i (1.7)
i

M. BALDE UCAD/ESP/GCBA
Chapitre 1. Généralités sur la statistique vii

Tableau 1.2 Tableau général d’une variable continue

Classes [a1 ; a2 [ [a2 ; a3 [ : : : [ai ; ai+1 [ : : : [ak 1 ; ak [ [ak ; ak+1 [


Effectifs n1 n2 ::: ni ::: nk 1 nk

1.3 Graphiques

1.3.1 Caractères Qualitatif

Considérons le tableau statistique suivant donnant la distribution de salariés selon leur situation matrimo-
niale.

Tableau 1.3

Situation Matrimoniale célibataire marié veuf divorcé


Fréquence d’individus en % 16 69 4 11

Les représentations graphiques les mieux adaptées pour ce type de caractère (caractère qualitatif) sont : les
diagrammes à secteurs et les diagrammes à bandes.

Diagramme à bandes

Il est composé de bandes superposées ou juxtaposées dont les hauteurs sont proportionnelles aux effectifs
des modalités qu’elles représentent. La représentation des données du tableau (1.3) donne

Fréquence en %
Fréquence en %

100 Veuf
96
Divorcé
85

Marié

16
Célibataire

at
.
ar
ié rcé uf Situation 0 Situation
éli
b
M i vo Ve
C D a) juxtaposées b) superposées

Fig. 1.1 Diagrammes à bandes

M. BALDE UCAD/ESP/GCBA
Chapitre 1. Généralités sur la statistique viii

Diagramme à secteurs

C’est un diagramme à secteurs angulaires inclus dans un cercle ou un demi-cercle ou même une portion
quelconque de cercle. A chaque modalité correspond un angle

= frequence  angle total:


La construction de ce diagramme de l’exemple sur la situation matrimoniale du tableau 1.3 dans un secteur
angulaire total 180˚ donne la figure suivante :
Marié

69%

Célibataire Divorcé
16% 11%
4% Veuf

Fig. 1.2 Diagramme à secteurs

1.3.2 Caractères quantitatifs


Selon que le caractère soit discret ou continu, nous avons différents types de représentations adaptés.

Diagramme à bâtons

Considérons la distribution suivante donnant le nombre d’enfants par ménage dans 10 familles.
Tableau 1.4 Exemple de caractère discret

Nombre d’enfants 0 1 3 4 6
Nombre de familles 2 1 4 2 1

Le diagramme à bâtons est obtenu en représentant chaque modalité par un "bâton" de longueur proportionnelle
à sa modalité.

Nombre de familles

4 
3

2 
1  

00 1 3 4 6 Nombre d’enfants
Fig. 1.3 Diagramme à bâtons

M. BALDE UCAD/ESP/GCBA
Chapitre 1. Généralités sur la statistique ix

Histogramme

Il est utilisé dans le cas de variables continues. Il est construit en portant en abscisse les modalités (les
classes) et en ordonnée les effectifs ou bien les fréquences.

Exemple 1.5 Considérons la distribution suivante donnant la longueur en cm de plantes d’un jardin botanique.

Tableau 1.5 Exemple de caractère continu

Taille (cm) [35; 40[ [40; 45[ [45; 50[ [50; 55[ [55; 60[ [60; 65[
Effectif 7 6 10 15 24 5

Effectif

Taille (cm)
Fig. 1.4 Histogramme

Remarque 1.1 Dans l’exemple précédent,les classes sont de même amplitude. Cependant, si elles étaient
d’amplitude différente, à la place des effectifs, on mettrait les densités de classes.

Polygone des fréquences

Le polygone des fréquences (ou courbe des fréquences) est un polygone qui est obtenu en joignant successi-
vement les milieux des segments supérieurs des bandes juxtaposées.

M. BALDE UCAD/ESP/GCBA
Chapitre 2
Séries Simples

Les tableaux et diagrammes sont souvent longs à consulter sans qu’ils ne fournissent des informations assez
claires sur la distribution statistique observée. On cherche alors à résumer celle-ci par une caractéristique
centrale : un seul nombre destiné à caractériser l’ensemble. Une série statistique simple est une série à une seule
variable (statistique).

2.1 Moyenne arithmétique


Considérons la distribution fournie dans le tableau suivant : la variable statistique étant X , ses modalités
x1 ; x2 ; x3 : : : xk d’effectifs respectifs ; n1 ; n2 ; n3 ; : : : nk .

Tableau 2.1

X x1 x2 x3 ::: xk
Effectif n1 n2 n3 ::: nk

La moyenne de la variable X notée X est définie par


P
nx
X = P i i (2.1)
ni
Pk
ni x i X ni X X
On peut écrire aussi X = = xi = fi xi , où fi = fréquence de la modalité xi N = ni
N N
Exemple 2.1 Considérons la distribution suivante donnant la répartition d’étudiants selon leur notes de maths.

Tableau 2.2 Notes de maths d’étudiants

Notes sur 20 07 08 10 11 15 16
Nombre d’étudiants 2 2 4 2 1 1

La moyenne de la classe est par application de la formule (2.1)

X =
7  2 + 8  2 + 10  4 + 11  2 + 15  1 + 16  1 = 10; 25
2+2+4+2+1+1

x
Chapitre 2. Séries Simples xi

Remarque 2.1 Dans le cas d’une variable continue, à la place de la modalité xi on met la valeur ci du centres
de la classe numéro i.

2.2 Le Mode
Le mode ou valeur modale M0 de la variable X est la modalité qui a le plus grand effectif (ou la plus grande
fréquence).

Exemple 2.2 En reprenant l’exemple (2.1) des notes d’étudiants, on voit que le mode est la note 10=20. En
d’autres termes, la note la plus fréquente dans cette classe est 10=20 Dans le cas d’une variable continue on
détermine d’abord la classe modale avant de calculer le mode. La classe modale est alors la classe de plus grand
effectif.

cas d’une variable continue

Dans ce cas, on utilise un calcul basé sur une représentation de la classe modale et des deux classes qui
l’encadrent immédiatement. Considérons l’exemple suivant :

Exemple 2.3 Etant donné la distribution suivante :

Tableau 2.3

Taille(cm) [35; 40[ [40; 45[ [45; 50[ [50; 55[ [55; 60[ [60; 65[
Effectif 7 6 10 15 24 5

La classe modale est l’intervalle [55; 60[. Pour obtenir le mode, l’histogramme limité à la classe modale et
des deux classes qui l’encadrent comme indiqué dans la figure (2.1). Le Mode M0 est l’abscisse du point

Effectif

J I0

!
K K0
I

J0

M0
Taille (cm)
Fig. 2.1 Mode d’une variable continue

M. BALDE UCAD/ESP/GCBA
Chapitre 2. Séries Simples xii

d’intersection des droites (II 0 ) et (J; J 0 ). Les triangles !I 0 J 0 et !IJ sont semblables, on a
!K !K 0
=
IJ 0 IJ 0
M0 55 60 M0
ce qui équivaut à
24 15 = 24 5
19(M0 55) = 9(60 M0 )
M0 =
1585 ' 56; 61cm
28

2.3 Médiane
C’est la modalité Me qui divise l’effectif total en deux effectifs égaux. Autrement dit : il y a autant d’obser-
vations supérieures à la médiane que d’observations qui lui sont inférieures.

Cas d’une variable discrète

La médiane correspond à la première modalité dont l’effectif cumulé croissant est supérieur ou égal à la
moitié de l’effectif total (ou bien la fréquence cumulée croissante supérieure ou égal à 50%).
Exemple 2.4 Revenons dans le tableau (2.4) sur la distribution de ménages selon leur nombre d’enfants. Le
N
N = 10. Sa moitié,
calcul des Effectifs cumulés croissants (ECC) fournit l’effectif total
2 = 5 ne figurant pas
parmi les effectifs cumulés croissants, alors on prend l’effectif cumulé 7 qui vient tout juste après ; ce qui fournit
Me = 3 comme médiane.

Tableau 2.4 Médiane d’une variable discrète

Nombre d’enfants 0 1 3 4 6
Nombre de familles 2 1 4 2 1
ECC 2 3 7 9 10

En guise d’interprétation, nous dirons que plus de la moitié des familles ont au plus 3 enfants.

Cas d’une variable continue

Dans ce cas on définit d’abord la classe médiane, classe dont l’effectif cumulé croissant est la première à
dépasser N=2 puis on cherche la médiane par interpolation linéaire. Le paragraphe suivant explique dans les
détails la détermination de la médiane d’une variable continue.

2.3.1 Caractéristiques de position : les quantiles


De même que les mode, médiane et moyenne, les quantiles correspondent à des positions d’une variable
statistique.
Les quantiles composés des quartiles déciles et centiles jouent un rôle similaire à celui de la médiane. Ainsi les
quartiles sont au nombre de 3:
Q1 ; Q2 ; Q3

M. BALDE UCAD/ESP/GCBA
Chapitre 2. Séries Simples xiii

et sont les modalités de la variable qui correspondant respectivement aux effectifs cumulés (croissants)
N 2N 3N
; ;
4 4 4
De même, on a 9 déciles
N 2N 3N 9N
D1 ; D2 ; D3 ; : : : D9 qui correspondent respectivement aux effectifs cumulés ; ; ;:::; :
10 10 10 10
Les centiles sont aux nombre de 99
N 2N 3N 99N
C1 ; C2 ;3 ; : : : C99 et correspondent respectivement aux effectifs cumulés
100 ; 100 ; 100 ; : : : ; 100
.

Remarque 2.2 La médiane correspond au deuxième quartile, cinquième décile et cinquantième centile.

Remarque 2.3 Dans les définitions des quantiles, à la place des effectifs cumulés croissants , on peut utiliser
les fréquences cumulées croissantes en divisant tout juste l’effectif cumulé par N , l’effectif total.

Cas d’une variable discrète

Q1 de la
Le procédé est similaire à celui utilisé pour calculer la médiane. Par exemple le premier quartile
distribution de ménages selon leur nombre d’enfants (tableau (2.4)) est Q1 = 1 et le deuxième décile D2 = 0.

Cas d’une variable continue : interpolation linéaire

Dans ce cas, les quartiles sont obtenus par interpolation linéaire. Ce qui n’est rien d’autre qu’une application
du théorème de Thalès. Utilisons un exemple pour ce faire.

Exemple 2.5 : Considérons la distribution suivante donnant les masses des disciples d’un club de Karaté dans
laquelle on cherche à déterminer la médiane Me .

Tableau 2.5 quantiles d’une variable continue

Masses(kg ) [40; 50[ [50; 60[ [60; 70[ [70; 80[ [80; 90[
Fréquences 0; 05 0; 35 0; 25 0; 20 0; 15
F.C.C. 0; 05 0; 4 0; 65 0; 85 1

La classe médiane est celle de fréquence cumulée50%. A défaut d’une classe pareille, on prend celle dont la
fréquence cumulée est la première à dépasser 50%. Ici il s’agit de la classe [60; 70[. La courbe (polygone) des
fréquences cumulées est construite comme suit : Chaque classe est représentée par un point d’abscisse la borne
supérieure de la classe et d’ordonnée la fréquence cumulée. on ajoute éventuellement une classe de fréquence
nulle avant la première (ici c’est la classe [30; 40[ qui a été ajoutée).
D’après le théorème de Thalès, on a
IK 0 KK 0
IJ 0
= JJ 0
En remplaçant par les données on a :
Me 60 0; 5 0; 4
70 60 = 0; 65 0; 4
ce qui équivaut à Me = 10 
0; 1 + 60
0; 25
Me = 64 kg

M. BALDE UCAD/ESP/GCBA
Chapitre 2. Séries Simples xiv

Fréquence cumulée croissante

Masse en Kg
Fig. 2.2 Graphe des fréquences cumulées croissantes

Fréquence cumulée croissante


J

I J0
K0

Masse en Kg
Fig. 2.3 Interpolation linéaire

Remarque 2.4 A la place des fréquences cumulées croissantes , on pourrait utiliser les fréquences cumulées
décroissantes. La constitution de la courbe des FCD se fait comme suit : on place les points d’abscisses les bornes
inférieures des classes et d’ordonnées respectives les FCD. Eventuellement, on rajoute après la dernière classe,
une classe de même amplitude que celle-ci mais de fréquence nulle. Graphiquement, la médiane correspond à
l’abscisse du point d’intersection des courbes cumulés décroissante et croissante.

2.4 Boîtes à moustaches (Box & Whiskers Plot)

Une boîte à moustache est un diagramme qui permet de représenter schématiquement une distribution. Elle
consiste en un rectangle dont les deux extrémités sont les premier et dernier quartiles (Q1 et Q3 ). La médiane
est représentée par un trait à l’intérieure de la boîte. Les extrémités de la boîte se prolongent par des traits qui
leur sont orthogonaux (les moustaches). La longueur des moustaches varie selon les auteurs. Dans l’exemple
de la figure 2.4 , nous avons délimiter les moustaches par D1 et D9 respectivement premier et neuvième décile .

On aurait pu utiliser à la place des déciles d’autres quantiles ou même les valeurs minimale et maximale
de la distribution. Les boîtes à moustaches sont utilisées principalement pour comparer un même caractère
dans deux populations de tailles différentes.

M. BALDE UCAD/ESP/GCBA
Chapitre 2. Séries Simples xv

Q1 Me Q3

D1 D9

x
Fig. 2.4 Boîte à moustaches

2.5 Caractéristiques de dispersion

Considérons les séries suivantes.

S1 : 3 5 7 10 13 15 17
S2 : 7 8 9 10 11 12 13

Ces deux séries ont même moyenne et même médiane,10. Cependant, elles sont complètement différentes de
point de vue de la dispersion de leurs modalités.

2.5.1 Ecart Absolu moyen

Etant donnée la variable statistique étant X , ses modalités x1 ; x2 ; x3 : : : xk d’effectifs respectifs ; n1 ; n2 ; n3 ; : : : nk ,


l’écart absolue moyen e est égal à la moyenne des valeurs absolues des écarts à la moyenne.

P
ni jX xi j
e= (2.2)
N
X3 =X x1 , x2 ; : : : xr , l’effectif ; n1 ,n2 : : :
N = ni ; X = moyenne de X
Pour la série S1
e1 =
(10 3) + (10 5) + (10 7) + (10 10) + (13 10) + (15 10) + (17 10)
7
On trouve e1 = 4; 29 et de même e2 = 1; 71.
Avec le calcul des écarts de e1 et e2 , la série S1 ayant le plus grand des écarts est moins homogène que la série
S2 .

2.5.2 Variance, Ecart-type

Considérons la variable statistiques X et ses modalités x1 ; x2 ; x3 : : : xk d’effectifs respectifs ; n1 ; n2 ; n3 ; : : : nk .


On définit la variance comme étant la moyenne des carrés des écarts à la moyenne.
Pk Pk
V=
(  xi )2 =
i=1 ni X i=1 ni (X xi )2
Pk N
(2.3)
i=1 ni

X
k
où N= ni
i=1 p
L’écart type noté  est la racine carrée de la variance :  = V .
M. BALDE UCAD/ESP/GCBA
Chapitre 2. Séries Simples xvi

Autres Formulations de la variance et de l’écart-type

On a :
Pk P P P Pk
V=
(X xi )2 =
i=1 ni (ni X 2 2ni xi X + ni x2i ) =
ni X 2
2X ni xi +
2
i=1 ni xi

Pk
N Pk
N Pk
N N N
2 2
=1 ni
= X 2 iN 2X 2 + i=1N i = X 2 2X 2 + i=1N i xi
n i x n
Pk 2
= i=1Nni xi X 2

Exemple 2.6 Soit à déterminer la variance et l’écart-type de la distribution suivante :

Tableau 2.6

Taille 33 34 35 36 37 38 39 40 41 42
Effectif 2 1 5 2 4 10 2 6 1 3

La moyenne de cette distribution est :

X =
33  2 + 34  1 + 35  5 + 36  2 + 37  4 + 38  10 + 39  2 + 40  6 + 41  1 + 42  3 = 37; 8
2 + 1 + 5 + 2 + 4 + 10 + 2 + 6 + 1 + 3
Sa variance est :

V=
332  2 +2 342  1 + 352  5 + 362  2 + 372  4 + 382  10 + 392  2 + 402  6 + 412  1 + 422  3 37; 82
36
' 4; 00
et son écart -type vaut donc 2.

Remarque 2.5 Si on est en présence d’une variable continue, les modalités xi sont remplacées par les centres
de classe leur correspondant.

2.5.3 Coefficient de variation (CV)

Il joue un rôle similaire à celui de la variance et de l’écart type. Il est définie par :


CV =  (2.4)
X
Le CV est exprimé généralement en % et est utilisé pour mesurer l’homogénéité d’une distribution : plus le CV
est proche de 0 plus la distribution est homogène. Dans la pratique, on considère qu’une série est homogène si
son CV 6 30%,.

Remarque 2.6 La variance précédemment définie est utilisée à l’échelle de la population entière. Cependant,
elle présente un biais (une distorsion) . Pour corriger ce biais, on utilise la variance empirique ou variance
Pk
corrigée. Elle est définie par s2 = i=1 ni (X xi )2 .
N 1
Cette variance est utilisée au sein des échantillons d’une population.

M. BALDE UCAD/ESP/GCBA
Chapitre 2. Séries Simples xvii

A AB B AB AB B 1. Quels sont la population et le caractère étudiés ?


AB B O O B A 2. Quelles sont la nature et les modalités de ce caractère ?
A A A B B B 3. Dresser un tableau statistique de cette étude.
O A AB B O A 4. Quel est le pourcentage d’individu dont leur sang peut être
B O AB B A AB reçu par tout le monde ?
5. Quelle est la fréquence des receveurs universels ?
6. Dresser deux graphiques pour cette distribution.

2.6 Exercices
1 On donne la répartition de 30 personnes selon leur groupe sanguin :

2
1. L’assemblée nationale veut pendre des mesures concernant la cherté de la location des appartements à
Dakar ; ainsi, elle a mis sur pied une commission chargée d’enquêter sur ce fait. Donner pour cette étude,
la meilleure représentation du ou des caractères. Donner la nature de ce ou ces caractères.
2. Dans une classe de 24 enfants, on enregistre les caractères suivants :
– la nationalité ;
– la couleur des yeux ;
– l’obéissance, appréciée sur l’échelle : absolue, très grande, assez grande, normale, faible, nulle.
– le nombre de dents, réparti en 7 catégories : 10 et moins, entre 11 et 14, 15 ou 16, 17, 18 ou 19, entre
20 et 23, 24 et plus.
Pour lesquels de ces caractères les paramètres de position : mode, médiane, moyenne, quartiles et ceux de
dispersions : variance, écart-type, ont-ils un sens ?
3 Le nombre d’interventions graves par jour des pompiers d’une caserne pour l’an 1985 est donné dans le
tableau qui suit :
Nbre de sorties graves/jour 0 1 2 3 4 5 6 Total
Effectifs 84 105 72 59 28 15 2 365
1. Quelle est la variable statistique étudiée ? Est elle discrète ou continue ?
2. Représenter cette série statistique par un graphique adapté.
4 Le tableau suivant donne la répartition d’un groupe d’enfants selon leur taille.
Taille (en cm) [80,90[ [90,95[ [95,100[ [100,105[ [105,110[ [110,120[
Effectifs 3 15 22 18 12 5
Mêmes questions que dans l’exercice précédent.

5 Les tailles d’un échantillon d’arbustes sont réparties dans le tableau suivant :
Classes [155,160[ [160,165[ [165,170[ [170,175[ [175,180[ [180,185[
Effectifs 3 7 9 16 11 4
1. Tracer l’histogramme et la courbe des fréquences et fréquences cumulées de cette distribution.
2. Calculer le mode, la médiane, les quartiles, la moyenne, la variance et le coefficient de variation.
3. On décide de regrouper les classes N˚1 et 2, celles N˚3 et 4 et les deux dernières. Calculer comme dans les
deux précédentes questions les paramètres de la nouvelle distribution.

M. BALDE UCAD/ESP/GCBA
Chapitre 2. Séries Simples xviii

6 Utiliser les données de l’exercice 1 et calculer si possible les paramètres suivants : mode, moyenne, médiane,
écart-type, coefficient de variation.

7 Mêmes questions que celles de l’exercice précédent mais en employant les données de l’exercice 2

8 La distribution de logements suivant le nombre de pièces dans un quartier est donnée dans la tableau qui
suit.
Nombre de pièces 1 2 3 4 5 6 et plus
Effectifs 15 24 27 19 9 6
1. Quel est le caractère étudié ? Sa nature ? Ses modalités ?
2. Représenter le diagramme à bâtons, le polygone des fréquences et le diagramme cumulatif de cette distri-
bution.
3. Déterminer le mode, la médiane et les premier et 3e quartiles
4. Calculer la moyenne arithmétique, la variance, l’écart type et le coefficient de variation de cette série.

M. BALDE UCAD/ESP/GCBA
Chapitre 3
Séries doubles

il est souvent intéressant d’étudier les individus d’une population donnée selon deux ou plusieurs caractères :
âge, taille et masse ; partie politique et sexe, : : : . Dans ce chapitre, nous allons étudier des individus suivant
deux caractères.

3.1 Cas de données non groupées


Il s’agit de données présentant distinctement les valeurs du couple de caractères (X; Y ) relevées auprès de
chaque individu. Considérons X et Y comme étant deux caractères quantitatifs ou qualitatifs prenant les valeurs
du couple (xi ; yi ) chez l’individu Ii .
Le tableau statistique de ce cas de figure se présente ainsi.

Tableau 3.1

Individus I1 I2 : : : In
X x1 x2 : : : xn
Y y1 y2 : : : yn

3.1.1 Moyenne et écart-type

Si la variable X est quantitative, sa moyenne est :


P
xi
X = (3.1)
n
sa variance est :
P 2
x
VX = i X 2 (3.2)
n
et son écart-type :
rP
x2i
X = X 2 (3.3)
n
xix
Chapitre 3. Séries doubles xx

3.1.2 Corrélation
Covariance

La covariance entre les variables X et Y et est définie par :

Cov(X; Y ) =
1 X(x X )(y Y ) (3.4)
i i
N

Propriété 3.1

Ê On a

Cov(X; Y ) =
1 X(x X )(y Y )
i i
N
€X X X X Š
= N1 xi yi Y xi X yi + X Y
€X Š 1 X
= N1 xi yi 2nY X + nX Y =
N
xi yi X Y
X
= 1 x y X Y
N i i

Ë
Cov(X; Y ) = Cov(Y; X )
Ì
Cov(X; X ) = V (X )
Í Si (a; b; c; d) 2 R4 on a :
Cov(aX + b; cY + d) = ac:cov(X; Y )
A l’aide de la covariance on définit la corrélation entre les variables X et Y.

Coefficient de corrélation

Le coefficient de corrélation linéaire de X et Y est le nombre


cov(X; Y )
r(X; Y ) =
X Y
Il permet de mesurer la dépendance linéaire entre X et Y . Plus il est proche de 1 ou 1 plus il y a dépendance
linéaire. Dans la pratique, on dira qu’il y a dépendance linéaire entre X et Y si jrj > 0; 87. La dépendance
linéaire entre X et Y se manifeste par le fait qu’il existe a etb ou a0 et b0 tel que :

Y = aX + b ou bien X = a0 Y + b0 :
Si r(X; Y ) est proche de zéro, alors il n’existe aucune forme de liaison linéaire entre X et Y . On dit que X et
Y sont non corrélés linéairement.

Propriété 3.2 On a

1 6 r(X; Y ) 6 1 (3.5)

M. BALDE UCAD/ESP/GCBA
Chapitre 3. Séries doubles xxi

Propriété 3.3 On a

ac:cov(X; Y )
r(aX + b; cY + d) =
jacjX Y (3.6)

Remarque 3.1

V (aX + b) = cov(aX + b; aX + b)
= a2 cov(X; X )
= a2 (V (X ))
Et l’on a
È
(aX + b) = jaj V (X ) = jaj(X ) (3.7)

3.1.3 Nuage de points


Le nuage de point, est l’ensemble des points M (xi ; yi )
Y =X
DY
Mi

Hi

X
Fig. 3.1 Droite de régression

3.1.4 Droite de régression


Si le nuage de point semble s’allonger sur une droite alors on peut chercher l’équation d’une droite donnant
le lien entre X etY . La méthode dite des moindres carrés permet de trouver l’équation de cette droite. Elle
consiste à trouver une droite D(X ; Y ) telle que la somme des carrés des distances des points Mi à la droite D
soit minimale.
Hi = p(Mi ) = projection de Mi sur DY =X
La droite obtenue ainsi est appelée droite de régression de Y en X ou droite d’ajustement linéaire. En notant

Y = aX + b (3.8)

la droite de régression. On démontre que :


Cov(X ; Y )
Ê a= ;
V (X )
Ë le point moyen G(X  ; Y ) appartient à DY =X . De ce fait, on déduit la valeur de b qui vaut
b = Y aX .
M. BALDE UCAD/ESP/GCBA
Chapitre 3. Séries doubles xxii

3.1.5 Prévision
Etant données deux variables X et Y Y = aX + b. Pour une valeur donnée
liées par l’équation de régression
x0 de la variable X , on déduit la valeur y0 lui correspondant par y0 = ax0 + b.

3.2 Cas de données groupées


Soient X et Y deux caractères qualitatifs ou quantitatifs mesurés au sein d’individus d’une population
donnée. Les modalités de X
sont : x1 ; x2 ; : : : xp ; celles de Y sont : y1 ; y2 , : : : yq
Le tableau suivant qui est à double entrée donnent les effectifs nij des individus présentant la modalité (xi ; yj )

Tableau 3.2

HH Y
HH
y1 y2 ::: Y ::: yq ni:
X H
H
H
x1 n11 n12 : : : n1 j ::: n1 q n1 :
x2 n21 n22 : : : n2 j ::: n1 q n2 :
.. ..
. .
xi ni 1 ni 2 ::: nij ::: niq ni:
.. ..
. .
xp np1 np2 : : : npj ::: npq np:
n:j n:1 n:2 : : : n:j ::: n:q N

3.3 Distributions Marginales


Il set souvent intéressant, à partir du tableau de contingence (tableau précédent) d’étudier une des variables
sans tenir compte de l’autre ; on parle alors de distribution marginales de la variable X (ou Y ).

3.3.1 Effectifs marginaux


Ils sont de deux types et sont exprimés à partir des effectifs partiels nij :
X
q
– l’effectif marginal de la variable X , ni: = nij ;
j =1
X p
– l’effectif marginal de la variable Y , n:j = nij
i=1
On montre aisément que l’effectif total est

X
q X
p X
p X
q
N= nij = ni: = n:j
j =1 i=1 i=1 j =1

3.3.2 Fréquence marginales


A chaque effectif marginal correspond une fréquence marginale qui peut s’exprimer en fonction des fré-
quences partielles fij = nNij . Ainsi :
M. BALDE UCAD/ESP/GCBA
Chapitre 3. Séries doubles xxiii

X
p
ni:
– la fréquence marginale de la variable X , fi: = fij =
;
j =1
N
X p
n
– la fréquence marginale de la variable Y , f:j = fij = :j
i=1
N

3.3.3 Distribution marginale de X


Elle consiste à ne considérer la série (X; Y ) que suivant la variable X . Ce qui nous permet d’avoir le tableau
suivant :
X x1 x2 : : : xp
Eff n1: n2: : : : np:

3.3.4 Distribution marginale de Y


Elle consiste à ne regarder la série (X; Y ) que suivant la variable de Y
Y y1 y2 : : : yq
Eff n:1 n:2 : : : n:q
Exemple 3.1 On considère le tableau suivant représentant la distribution de 12 ménages selon leur nombre
de garçons et de filles.
X caractère "nombre de garçon"
Y "nombre de fille"
H
Y
6 8
HH
X H
HH
H
4 5 1
3 4 2
Fréquences partielles

f11 =
5; f = 1;
12 12 12
4
f21 = ; f22 =
2
12 12
Fréquences marginales

n: 6 n 6
f1 : = 1 = ; f2 = 2 =
N 12 N 12
HH Y 6 8
HH

X H
HH
4 5 1 6
3 4 2 6
9 3 12
On montre que

f1 : + f2 : =
6 6 9 3
12 + 12 = 1; f:1 = 12 ; f:2 = 12
M. BALDE UCAD/ESP/GCBA
Chapitre 3. Séries doubles xxiv

3.4 Indépendance Statistique


L’idée est de voir si, partant des distributions marginales de XY , on arrive à construire la distribution
et
de (X; Y ). Deux variables X , Y sont dites indépendantes statistiquement si quels que soient i etj , on a

Nnij = ni: n:j (3.9)

3.4.1 2 (khi-carré) de contingence


La mesure de la liaison entre X et Y est faite grâce aux effectifs partiels nij et aux effectifs dits théoriques
ni: n:j
cij = à travers le 2 de contingence défini par
N
X
p X
q
(nij cij )2
2 = (3.10)
i=1 j =1
cij
Si 2 = 0 alors les variables X et Y sont indépendantes. Dans la pratique, on supposera qu’il y a indépendance
si 2 < 30%
Remarque 3.2 2 est une quantité positive et peut s’écrire
Xp X
q
2 = N( n2ij =ni: nj : 1)
i=1 j =1
„ Ž
X 2
2 X n2ij
2 = N 1
n  n:j
i=1 j =1 i:
 2 2 2 2 
= 12 n n11n + n n12n + n n21n + n n22n 1
 1:2 :1 2 1: :2
2
2:
2
:1
 2: :2

= 12 6 5 9 + 3 1 6 + 6 4 9 + 3 2 6 1
On a des formules similaires pour les variables Y

Distribution Conditionnelles

j de 1 à q, la distribution dont les modalités sont yj (j = 1; : : : ; q) est appelée


En fixant i et en faisant varier
distribution conditionnelle de «Y liée par (X = xi )» et est notée (yj ; xij ); j = 1; : : : ; q
De même pour j fixé et i variant de 1 à p ; (xi ; nij ) est la distribution p conditionnelle de «X liée par (Y = yj )
».
La fréquence conditionnelle de (X = xi ) liée par (Y = yj ) se note f (xi =yj ) et vaut :
n
f (xi =yj ) = ij
n :j

Remarque 3.3 On démontre que X et Y sont indépendantes si est seulement si

8i ; 8j f (yj =xi ) = f:j ou bien f (xi =yj ) = fi :

3.4.2 Paramètres d’une distribution à deux dimensions


Moyennes marginales

X =
1Xp
ni :xi : Y =
1Xq
n:j yj
N i=1
N j =1

M. BALDE UCAD/ESP/GCBA
Chapitre 3. Séries doubles xxv

Variance marginale

V ar(X ) =
1 :X
p
n :(x X )2 =
1 :X
p
ni :x2i X 2 V ar(Y ) =
1 X n:j (y Y )2 = 1 X n:jy2 : Y 2
i i j
N i=1 N i=1
N N j
j j

V ar = r2 reste valable

covariance

cov(X:Y ) =
1 X X n j (x X )(yj Y =
1 X X n jx y X Y
i i i i i
N i j
N i j

Propriété 3.4 V ar(X + Y ) = var(X ) + var(Y ) + 2cov(X; Y )


V ar(X Y ) = var(X ) + var(Y ) 2cov(X; Y )
Si X et Y sont indépendant alors cov (X; Y ) = 0. Cependant la réciproque est fausse.

Moyenne Conditionnelles

m(X=Y = yj ) = Xj =
1 X n jx = X(x =y )x
i i i j i
n:j i f

1 X X
q
m(Y=X = xi ) = Yi = ni iyj = f (yj =xi )yj
ni : i j =1

Variance conditionnelles

V ar(X=Y = yj ) =
1 X n j (x x )2
i i j
n:j i

V ar(X=Y = xi ) =
1 X n j (y y )2
i j i
n:j i

Relation entre paramètre marginaux et conditionnels. On montre que

X =
1Xq
n:j xj de même que Y =
1 X n :y (3.11)
i i
N j =1
N i

X X
V (X ) = f:jV ar(X=Y = yj ) + f:j (xj X )2 (3.12)
j j
X
p X
V (X ) = fi :V ar(Y=X = xi ) + fi :(yi Y )2 (3.13)
i=j i

Variance Total = moyenne des variances + Variance des moyennes conditionnelles.

M. BALDE UCAD/ESP/GCBA
Chapitre 3. Séries doubles xxvi

3.5 Exercices
1
On a relevé sur des plantes les résidus fongicides x exprimés en fonction du temps t
Dates 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Résidus 10 9 8 7 6 5,5 5 4,5 3,8 3,4 3 2,7 2,4 2
1. Dessiner le nuage statistique
2. On pose y = log x. Déterminer le coefficient de corrélation de y et t. Tracer le nouveau nuage. Déterminer
l’équation de la droite d’ajustement de y en t, puis celle de la courbe de x en t.
3. A partir de quelle date les résidus ont-ils diminué de moitié ?
2
Le tableau suivant donne les valeurs expérimentales de la pression P d’une masse de gaz pour différentes valeurs
V du volume. D’après les principes de la thermodynamique, on a la relation

PV = C
où et C sont des constantes dépendant des conditions expérimentales.
Volume V (en cm3 ) 54,3 61,8 72,4 88,7 118,6 194,0
Pression P (en kg=cm2 ) 61,2 49,5 37,6 28,4 19,2 10,1
1. En posant Y = ln P et X = ln V , trouver une relation linéaire entre X et Y .
2. Dresser le tableau du couple (X; Y ). Tracer le nuage de cette distribution.
3. Donner le coefficient de corrélation linéaire entre X et Y et l’équation de la droite de régression de Y en
X.
4. Estimer P pour V = 100; 0cm3 .
3
On donne la série statistique double de cinq éléments :
X 1,2 1,4 1,6 1,8 2
Y 13 12 14 16
1. Déterminer sachant que la droite de régression de Y en X à pour équation y = 9x + 0; 6
2. Calculer le coefficient de correlation des caractères X et Y
4
L’alcoolémie est le taux (en g=l) d’alcool présent dans le sang et se mesure après une prise de sang. On souhaite
modéliser la relation entre l’alcoolémie, la quantité d’alcool ingéré et le poids de l’individu. On a pris 8 individus
de poids différents, on leur a donné des quantités différentes d’alcool ‘a ingérer et on a mesuré leur alcoolémie
une heure après (environ le moment o‘u l’alcoolémie est maximale). On note P le poids de l’individu, Q la
quantité d’alcool ingéré et A l’alcoolémie. On note Y le quotient Y = Q=P et on s’intéresse aux éventuelles
relations entre Y et A. Les mesures obtenues sur les 8 individus sont les suivantes :
Alcoolémie A 0,2 0,28 0,4 0,75 0,35 0,71 0,56 0,64
Y = Q/P 0,14 0,18 0,25 0,5 0,24 0,46 0,36 0,44

Dans cet exercice, on donnera tous les résultats avec une précision de 3 chiffres après la virgule.
1. Tracer le nuage de points (Ai ; Yi ).
2. Calculer les moyennes A et Y ainsi que les écart-types A et Y .

M. BALDE UCAD/ESP/GCBA
Chapitre 3. Séries doubles xxvii

3. Calculer la covariance cov(A; Y ) et le coefficient de corrélation linéaire r(A; Y ).


4. Dites pourquoi il est assez raisonnable d’envisager une relation linéaire entre A etY . Donnez l’équation
de la droite de régression linéaire DY =A . Proposez une formule modélisant la relation entre A, Q et P .

M. BALDE UCAD/ESP/GCBA
Chapitre 4
Variables aléatoires réelles discrètes.Lois
fondamentales

4.1 Notion de variable aléatoire discrète


4.1.1 Définitions. Exemples
Définition on appelle variable aléatoire associée a une expérience aléatoire toute fonction dont la valeur
dépend du résultat de cette expérience.
L’image d’un événement ! 2
est une réalisation de l’événement !, ou encore valeur de la variable aléatoire
sur l’événement ! .

Remarque 4.1 30 Une variable aléatoire à valeur réelles est la donnée d’une fonction
8
<
! R
X::
! 7! X (!)
compatible avec les opérations sur l’espace des possibilités ! .

Exemple 4.1 On lance un dé traditionnel équilibré à 6 faces. On appelle X le numéro de la face obtenue à un
certain lancé. Ici, l’ensemble des possibilités est
= 1; 2; 3; 4; 5; 6, et on a défini avec X une variable aléatoire
réelle, par la relation :
Pour tout ! 2
; X (!) = !:
En clair, X (1) = 1; X (2) = 2; X (3) = 3; X (4) = 4; X (5) = 5 et X (6) = 6.
On fabrique ainsi une variable aléatoire, puisque la valeur de X dépend du tirage réalisé : : : .

Exemple 4.2 Un jeu de hasard consiste à lancer un dé traditionnel équilibré à 6 faces. Le lanceur gagne la
somme double de la valeur de la face obtenue si celle-ci est paire, sinon, il perd le double de la valeur indiquée
par le dé. On appelle X le gain, positif ou négatif, du joueur après un lancé. Ici, l’ensemble des issus possibles
est
= 1; 2; 3; 4; 5; 6, et on a défini avec X une variable réelle, par la relation :
8
< 2!; si ! est pair
pour tout ! 2
; X (! ) =
: 2!; si ! est impair

xxviii
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxix

En clair,X (1) = 2, X (2) = 4, X (3) = 6, X (4) = 8, X (5) = 10, X (6) = 12.


On fabrique ainsi d’une variable aléatoire, puisque la valeur de X dépend du tirage réalisé . . .

Exemple 4.3 On dispose d’un jeu de belote traditionnel de 32 cartes. On tire une carte dans ce jeu, et on
attribue à ce tirage la valeur X calculée suivant la règle suivante :

– Si la carte est un As, X vaut 11 points ;


– Si la carte est un Roi, X vaut 4 points ;
– Si la carte est une Dame, X vaut 3 points ;
– Si la carte est un Valet, X vaut 1 pont ;
– Toutes les autres cartes valent 0 point.
On fabrique ainsi une variable aléatoire, puisque la valeur de X dépend du tirage réalisé . . .

Exemple 4.4 Un professeur peu consciencieux décide de corriger ainsi ses copies : sur son escalier composé de
21 marches, qu’il a au préalable numérotées de 0 à 20, il jette le paquet de copies, et attribue à chaque copie la
note correspondant au numéro de la marche. On note X la note obtenue par Paul. Il est claire que X est une
variable (très) aléatoire,puisqu’il s’agit d’attribuer une valeur à X (la note), qui est le résultat d’une expérience
aléatoire (le lancé de copies, et leur atterrissage).

4.1.2 Variables aléatoires discrète


Toutes les variables aléatoires rencontrées jusqu’ici sont des exemples de variables aléatoires discrètes. Ceci
signifie en gros que ces variables ne peuvent prendre que des valeurs ”éloignées” les unes des autres comme, le
sont les nombres entiers les uns par rapport aux autres.
Définition Une variable aléatoire discrète est une variable qui ne prend que des valeurs qui peuvent être séparées
les unes des autres (au moins en théorie).

Remarque 4.2 Plus concrètement, une variable aléatoire discrète est une variable dont les valeurs possibles
ne sont pas infiniment proches (au moins théoriquement).

Exemple 4.5 Un exemple de variables aléatoires discrètes est fourni par les variables aléatoires prenant des
valeurs entières, ou qui peuvent être transformées en variables aléatoires définies sur le même univers, et ne
prenant que des valeurs entières.
Autrement dit
est l’univers sur lequel la variable aléatoire X est définie, alors on peut transformer X en une
autre variable aléatoire Y définie sur
, telle que Y (
)  NouY (
)  N. Ceci revient à dire que pour tout
! 2
; Y (!) 2 N ou Y (!) 2 Z

Exemple 4.6 Un jeu de hasard consiste à lancer un dé traditionnel équilibré à 6 faces. On note X le nombre
obtenu en calculant l’inverse du carré du chiffre affiché sur le dé.
X est une variable aléatoire discrète, car ces valeurs possibles sont ”éloignées” les unes des autres : Celles-ci
valent en effet 1; 1=4; 1=9; 1=16; 1=25; 1=36. En posant Y = X 1 , on définit une nouvelle variable aléatoire sur
l’univers de l’expérience (ici,
= 1; 2; 3; 4; 5; 6), et les valeurs prisent par Y sont entières (elles valent en effet

M. BALDE UCAD/ESP/GCBA
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxx

1; 4; 9; 16; 25; ou36), ce qui revient à écrire que


Y (
) = 1; 4; 9; 16; 25; 36

(Cette dernière relation montre que Y , transformation de X , ne prend que des valeurs entières)

4.1.3 Loi d’une variable aléatoire discrète


Définition un univers probabilisé est une univers sur lequel on connaît les probabilités de chacun des événe-
ments élémentaires.
Définition Soit X une variable aléatoire définie sur un univers probabilisé . On appelle loi de la variable aléatoire
la donnée de toutes les probabilités de réalisation d’une valeur de X.
Remarque 4.3 En général, on présente la loi d’une variable aléatoire X discrète sous la forme d’un tableau,
qui récapitule les valeurs des probabilités des valeurs prises par X .

Valeurs de X x1 x2 x3 : : : xn
P (X = xi ) p1 p2 p3 : : : pn
Ce tableau doit bien sûr faire penser à celui d’une série statistique à une variable, présentée par distribution de
fréquences.

Exemple 4.7 On lance un dé traditionnel équilibré de 6 faces. On appelle X le numéro de la face obtenue à un
certain lancer. Ici, l’ensemble des possibilités est
= 1; 2; 3; 4; 5; 6, et on a défini avec X une variable aléatoire
réelle. En clair, X (1) = 1; X (2) = 2; X (3) = 3; X (4) = 4; X (5) = 5etX (6) = 6, et la loi de X est donnée par

X 1 2 3 4 5 6
P (X = xi ) 1=6 1=6 1=6 1=6 1=6 1=6
Exemple 4.8 Un jeu de hasard consiste à lancé un dé traditionnel équilibré à 6 faces. Le lanceur gagne la
somme double de la valeur de la face obtenue si celle-ci est paire, sinon, il perd le double de la valeur indiquée
X (1) = 2; X (2) = 4; X (3) = 6; X (4) = 8; X (5) = 10etX (6) = 12.
La loi de X est donnée par

X 10 6 2 4 8 12
P (X = xi ) 1=6 1=6 1=6 1=6 1=6 1=6
On fabrique ainsi une variable aléatoire, puisque la valeur de X dépend du tirage réalisé...

Exemple 4.9 On dispose d’un jeu de belote traditionnel de 32 cartes. On tire une carte dans ce jeu, et on
attribue à ce tirage la valeur X calculée suivant la règle suivante :

– Si la carte est un As, X vaut 11 points


– Si la carte est un Roi, X vaut 4 points
– Si la carte est une Dame, X vaut 3 points
– Si la carte est un Valet, X vaut 1 points
– Si toutes les autres cartes valent 0 point.
La loi de X est donnée par

M. BALDE UCAD/ESP/GCBA
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxxi

X 0 1 3 4 11
16 4 4 4 4
P (X = xi )
32 32 32 32 32
Exemple 4.10 La loi de la somme de deux dés à 6 faces, traditionnels, équilibrés, est donnée par

X 2 3 4 5 6 7 8 9 10 11 12
P (X = xi )
1 2 3 4 5 6 5 4 3 2 1
36 36 36 36 36 36 36 36 36 36 36
Exemple 4.11 Dans le cas où la variable aléatoire X serait discrète mais prendrait une infinité de valeurs
(xi )i > 1, donner la loi de X consiste à déterminer les probabilités (pi )i > 1 de chacun des événements X = xi .
Un premier lancer qui amène Pile.
On a
1 1 1 1 1 1 1
P (X = 1) = ; P (X = 2) =  = ; P (X = 3) =   = 1=8, et que de manière généraleP (X =
2 2 2 4 2 2 2
k) =
1
2k .
La loi de X est donc donnée par les relations : pour tout k 2 N ? ; P (X = k ) =
1
2k , ou encore par le tableau
Valeurs de X 1 2 3 4 ::: k :::
1 1 1 1 1
Probabilités associées
2 4 8 16 : : : 2k :::
+1
X
(Notons que pour k; 0 6 P (X = k) 6 1, et que P (X = k) = 1.)
i=k

4.1.4 Espérence d’une variable aléatoire discrète


Définition soit X une variable aléatoire réelle finie sur un univers probabilisé. On suppose que X a pour loi

Valeurs de X x1 x2 x3 : : : xn
P (X = xi ) p1 p2 p3 : : : pn
X
n
E (X ) = p1 x1 + p2 x2 +    + pn xn = pi xi :
i=1

Remarque 4.4 L’espérance de la variable aléatoire X est la moyenne de la série statistique discrète X , selon
les fréquences p1 ; p2 ; : : : ; pn .

Remarque 4.5 Dans le cas où la variable aléatoire X serait discrète mais prendrait une infinité de valeurs
(xi )i>1 , chacune respectivement avec la probabilité (pi )i>1 , On adopte la définition suivante
+1
X
E (X ) = pi xi ;
i=1

Si cette dernière quantité est finie. Ce nombre généralise alors celui retenu dans la définition précédente.
On adopte la convention suivante : si (xi )i > 1 est une suite de réels,
+1
X X
N
ui := N !lim
++1
ui :
i=1 i=1

M. BALDE UCAD/ESP/GCBA
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxxii

Exemple 4.12 Considérons par exemple les lancers successifs d’une pièce équilibrée. On note X le numéro du
premier lancer qui amène Pile.
On a vu plus haut que la loi de X était donnée par les relations : pour tout k 2 N ? ; P (X = k ) =
1 , ou encore
2k
par le tableau

Valeurs de X 1 2 3 4 ::: k :::


1 1 1 1 1
Probabilités associées
2 4 8 16 : : : 2k : : :
S’il existe, l’espérance de X est le réel
X
N
i
lim
N !+1 2i :
i=1
N  ‹i
X
Calculons, pour N 2 N, la quantité
1 i .
i=1
2
X
N
xN +1 1
On montre en première que, si x 6= 1 est réel xi = 1 = f (x). Par dérivation, pour x 6= 0 et
i=1
x 1
x 6= 1, il vient
X
N
1X N
f 0 (x) = ixi 1 = ixi
i=1
x i=1
d’une part, et

f 0 (x) =
(N + 1)xN (x 1) (xN +1 1) 2 = NxN +1 (N + 1)xN + 1
x 1 (x 1)2
d’autre part. Donc
X
N
NxN +1 (N + 1)xN + 1
ixi = x: :
i=1
(x 1)2
1
Pour x = , il vient
2
N  ‹i 
X 1i = 1 : 2NN+1 (N +1)
2N +1
= 2 2N +1 N (N + 1) + 1‹ = 2 1 N + 2 ‹ :
i=1
2 2 1
4 2N 2N +1
Pour N ! +1, cette quantité tend vers 2. Donc E (X ) existe, et vaut 2.

4.1.5 Variance et écart-type d’une variable aléatoire discrète


Définition Soit X une variable aléatoire réelle sur un univers probabilisé. On suppose que X a pour loi

Valeurs de X x1 x2 x3 : : : xn
P (X = xi ) p1 p2 p3 : : : pn
On suppose que, X a pour espérance le nombre E (X ).
On appelle variance de la variable aléatoire X le réel, noté V (X ), et qui vaut
X
n
V (X ) = p1 (x1 E (X ))2 + p2 (x2 E (X ))2 +    + pn (xn E (X ))2 = pi (xi E (X ))2 :
i=1
On appelle écart-type de X le réel, noté (X ),défini par
p
(X ) = V (X )
.

M. BALDE UCAD/ESP/GCBA
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxxiii

Remarque 4.6 La variance et l’écart-type de la variable aléatoire X sont la variance et l’écart-type de la série
statistique discrète X , présentée selon les fréquences p1 ; p2 ; : : : ; pn :

Remarque 4.7 Dans le cas où la variable aléatoire X serait discrète mais prendrait une infinité de valeurs
(xi )i > 1, chacune respectivement avec la probabilité (pi )i > 1, on adopte les définitions suivantes
!
X
V (X ) = ++1i=1 pi (xi E (X )2
si cette dernière quantité est finie. Ce nombre généralise alors celui retenu dans la définition précédente.
On adopte la même convention que plus haut : si(xi )i > 1 est une suite de réels,

+1
X X
N
ui := N !
lim+1 ui
i=1 i=1
È
Par ailleurs, on pose toujours (X ) = V (X ).

Remarque 4.8 Dans tous les cas, on a


€ Š
V (X ) = E (X E (X ))2

Exemple 4.13 Considérons par exemple les lancés successifs d’une pièce équilibré. On note X le numéro du
premier lancer qui amène Pile.
On a vu plus haut que la loi de X était par les relations : pour tout k 2 N? , P ( X = k ) =
1 , ou encore par le
2k
tableau

Valeurs de X 1 2 3 4 ::: k :::


1 1 1 1 1
Probabilités associées
2 4 8 16 dots 2k : : :
et que l’espérance de X était E (X ) = 2. Calculons maintenant sa variance et son écart-type ; nous avons pour
cela besoin de quelques résultats démontrés plus loin :
Lemme
+1
X +1
X
– Pour tout 1 < x < 1,on a xk =
1 et xk =
x
k=0
1 x k=1
1 x;
+1
X +1
X
– Pour tout 1 < x < 1, on a kxk 1 =
1 et k(k 1)xk 2 =
2
k=1
(1 x)2 k=2
(1 x)3 ;
Pour toute variable aléatoire X; V (X ) = E (X 2 ) E (X )2 .
En admettant les résultats de ce %lemma, on a donc, en posant x=
1
2,
+1
X +1
X +1
X +1
X +1
X +1
X
E (X 2 ) = k2 xk = k2 xk = k(k 1)xk + kxk = k(k 1)xk + x kxk 1
k=0 k=1 k=1 k=1 k=2 k=1
+1 +1 2 14 1
=x 2X k(k 1)xk 2 + x
X
kxk 1 =
2x2 x 2
k=2 k=1
(1 x)3 + (1 x)2 = 1
8
+ =4+2=6
1
4
p
reste à dmter lme lemme Or E (X )2 = 4. Donc V (X 2 ) E (X )2 = 6 4 = 2, et x = 2
M. BALDE UCAD/ESP/GCBA
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxxiv

4.1.6 Fonction de répartition d’une variable aléatoire discrète


Définition soit X une variable aléatoire sur un univers probabilisé. On appelle fonction de répartition de X
la fonction 8
<R ! R
FX : :
t 7! FX (t) = P (X 6 t)
1 Donner la fonction de répartition de la variable aléatoire X qui est définie comme étant la valeur obtenue
sur le dé.

2 Donner la fonction de répartition de la variable aléatoire X qui est définie comme étant la somme des
lancers de deux dés traditionnels à 6 faces et équilibrés.
Définition soit X une variable aléatoire continue sur un univers probabilisé. On appelle fonction de répartition
de X la fonction 8
<R ! R
FX : :
t 7! FX (t) = P (X 6 t)

Remarque 4.9 Par définition, pour tout t 2 R; FX (t) = P (X 2] 1; t]).


Les principales propriétés d’une fonction de répartition sont suivantes :
Proposition La fonction de répartition Fx d’une variable aléatoire discrète X a les propriétés suivantes :

– FX R;
est définie sur
– Pour tout t 2 R; 0 6 FX (t) 6 1 ;
– Fx est une fonction croissante sur R ;
– lim FX (t) = 0 et t!lim
t! 1
F (t) = 1
+1 X
– Fx est une fonction constante par morceaux sur R et sa représentation présente des sauts sur les valeurs
de X , dont la hauteur traduit la loi de X .

Remarque 4.10 Il y a une analogie entre la courbe des fréquences cumulés croissants d’une série statistique
discrète et la fonction de répartition d’une variable aléatoire discrète.
Les propriétés de l’une et de l’autre sont identiques (voir ci-dessus), ainsi que leurs formes, même si le rapport
entre variables aléatoires et séries statistiques est encore à préciser.

Remarque 4.11 Pour une variable aléatoire discrète, il est équivalent de connaître sa loi, ou sa fonction de
répartition : la proposition précédente explique comment obtenir l’une à partir de l’autre (les discontinuités de
la fonction de répartition correspondant exactement à la loi de la variable aléatoire).

4.2 Quelques lois classiques et fondamentales

4.2.1 La loi de Bernoulli


Définition et cadre naturel d’apparition Cette loi est celle qui traduit le résultat d’un unique tirage ne
comportant que deux issues : échec ou réussite .
définition On appelle la loi de Bernoulli de paramètrep la loi d’une variable aléatoire (discrète) X ne prenant
que deux valeurs 0 et 1 avec P (X = 1) = p(où 0 6 p 6 1) ; on a donc P (X = 0) = q = 1 p.

M. BALDE UCAD/ESP/GCBA
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxxv

Espérance et variance Théorème Soit X une variable aléatoire suivant une loi de Bernoulli. Alors on a :
E (X ) = p et V (X ) = pq, où q = 1 p
Sommes de variables aléatoires suivant une loi de Bernoulli Théorème Soient X1 ; X2 ; : : : Xn ; n va-
riable aléatoires indépendantes suivant une loi de Bernoulli de paramètre p. On considère la variable aléatoire
Z = X1 ; +X2 ; +    + Xn . Alors :

– La loi de Z est donnée par : pour tout 0 6 k 6 n; k entier, P (Z = k) = ckn pk qn k


où q = 1 p;
– E (Z ) = np ;
– Si de plus les X1 sont indépendantes, alors V (Z ) = npq , où q = 1 p.
Preuve CCes deux derniers résultats découlent des propriétés de l’espérance et de la variance.
Pour le premier point : soit k entier, avec 06k 6 n. L’événement Z=k est réalisé par le fait que k va-
riablesX1 valent nécessairement 1 (ce qui laisse choix de ces variables), chacune réalisant de cet événement
Cnk
avec probabilité p, tandis que les (n k) restantes valent nécessairement 0 avec probabilité q = 1 p. D’où
P (Z = k) = ckn pk qn k . B

4.2.2 La loi Binomiale


Définition et cadre naturel d’apparition Cette loi est celle qui traduit le nombre total de réussites
obtenues lors d’un nombre fini de processus aléatoires successifs et indépendants, ne comportant chacun que
deux issues possibles à chaque répétition (0 ou 1, ou autrement dit échec ou réussite), chaque processus de la
file étant régi par une loi de Bernoulli.
La loi Binomiale est donc obtenue comme loi la somme de plusieurs variables aléatoires indépendantes suivant
une loi de Bernoulli, ainsi que nous l’avons rencontré ci-dessus.
Définition Soit 0 6 p 6 1. On appelle loi de Binomiale de paramètre n et p la loi, notée B (n; p) d’une variable
aléatoire X discrète prenant les n + 1 valeurs entières de 0 à n, avec
pour tout k entier,0 6 k 6 n,P (X = k) = ckn pk q n k ,
où q = 1 p. Espérence et variance Résumons ce que nous savons déjà, pour mémoire :
Théorème Soit 0 6 p 6 n et n 2 N . Soit X une variable aléatoire suivant une loi Binomiale de paramètres n
et p(On note X B (n; p)). alors :
E (X ) = np et V (X ) = npq, où q = 1 p.
Preuve Cces résultats sont une reformulation des résultats du théorème précédent. B Situations conduisant
à l’étude de variables aléatoires suivant une loi Binomiale L’exemple ci-dessous montre que cette
approche peut être très utile dans la compréhension de phénomènes d’actualité fort concrets :

Exemple 4.14 Le clan mafieux (”Canal Historique”) de César Angéli avait la main sur le trafic de pastis
frelaté, mais les descentes de police ont eu raison de la plupart de ses hommes, aujourd’hui emprisonnés sur le
Continent. Charli Pasquadi, le chef du clan rival (”Canal Postaga”) en a profité, et commence à concurrencer
dangereusement les affaires de César Angéli.
Décidé à ne pas perdre la force, ce dernier propose 10 ”contrats” à Raoul Volfini, alias ”Raoul-la-Gachette ” pour
décimer le clan Pasquali (10 ”contrats”, un par mois, mais pas en été, car il fait tés chaud à l’île de Beauté).
Ce tueur à gage est surtout un tueur à la gomme, car, en homme d’honneur, il n’utilise pas les explosifs pour
réaliser ses ”contrats” : il préfère les méthodes traditionnelles d’embuscade dans le maquis. Mais comme son chef
César Angéli, Raoul a vieilli en même temps que ses méthodes, et aujourd’hui on estime à 0; 2 sa probabilité
de ”descendre” une cible lors d’une tentative d’assassinat.
César Angéli a par ailleurs été formel : il ne doit pas y avoir plus d’une tentative d’assassinat sur chaque tête

M. BALDE UCAD/ESP/GCBA
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxxvi

du clan Pasquali, il faut pouvoir faire croire à des ”accidents”. Par ailleurs, les tentatives de Raoul-la-Gachette
sont couronnés de succès ou non, mais toujours indépendamment les unes des autres.
On note X le nombre de ”contrats” que Raoul sera en mesure d’honorer cette année pour le compte de César
Angéli. Ce dernier brutalement soucieux à l’heure de la sieste, ne parvient pas à trouver le sommeil, et convoque
ses meilleurs amis, pour connaître :
– La probabilité de chacune des valeurs de X
– La rentabilité de Raoul, c’est-à-dire le nombre moyen de ”contrats” qu’il sera en mesure d’honorer cette
année ;
– La probabilité de réussir strictement moins de 2 assassinats, ce qui ridiculiserait le ”Canal Historique” du
vieux César Angéli aux yeux du ”Canal Postaga” de Charly Pasquali (qui préfère, lui, les explosifs... et
n’hésiterait pas à s’en servir si d’aventure le ”Canal Historique” s’avérait très affaibli). Aidez-vous César
Angéli à profiter enfin de sa une sieste réconfortante ?
Réponse : Pour répondre aux questions de César Angéli, notons X1 la variable aléatoire qui vaut 1 si Raoul
réussit sa i-ème tentative d’assassinat, et 0 sinon.
Le nombre total de ”contrats” remplis par Raoul est alors X = X1 + X2 + ::: + X10 .Chaque variable aléatoire
X1 est une variable de Bernoulli de paramètre p = 0; 2, et les X1 sont supposées indépendantes entres elles.
Donc X suit une loi Binomiale, de paramètre 10 et 0; 2. On a donc X B (10; 0; 2), ce qui signifie que pour
tout k = 0; 1; :::; 10, on a
P (X = k) = C10
k
(0; 2)k (0; 8)10 k

Nous pouvons donc présenter au chef du ”Canal Historique” les probabilités des diverses valeurs de X (arrondies
à 10 3 près) :

Valeurs de X 0 1 2 3 4 5 6 7 8 9 10
Probabilités 0; 107 0; 268 0; 302 0; 201 0; 088 0; 026 0; 006 0; 001 0 0 0
Le nombre moyen de contrats assurés par Raoul est E (X ) = 10  0; 2 = 2. En fin, la probabilité pour le ”Canal
Historique” de César Angéli de se ridiculisai en assurant strictement moins de 2 assassinats est
P (X < 2) = P (X = 0)u(X = 1) = P (X = 0) + P (X = 1) ' 0; 375
car les événements (X = 0) et (X = 1) sont incomparables. César Angéli peut être légitimement inquiet, mais
son rival Charly Pasquali n’a pas encore la main sur le marché du pastis corse de contrebande !

4.3 La loi de Poisson


Définition et cadre d’apparition
Cette loi est la loi des processus assimilable à l’étude des temps d’entente (dans une file, ou une caisse de super
marché par exemple). Elle modélise aussi les situations de panne d’un appareil (temps d’attente avant la panne
...)

Définition 4.1 Soit  > 0. On appelle loi de Poisson de paramètre  la loi notée P () d’une variable aléatoire
X discrète prenant toutes les valeurs entières naturelles (0; 1; 2; 3; :::etc), avec
pour tout k entier,

k
P (X = k) = e :
k!
M. BALDE UCAD/ESP/GCBA
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxxvii

4.3.1 Table de la loi de Poisson


Les valeurs des probabilités d’une variable aléatoire suivant une loi de Poisson présentaient des difficultés
de calculs pratiques, avant que les calculatrices et les ordinateurs ne fassent leur apparition. On avait donc
calculé les valeurs de ces probabilités pour diverses valeurs de k et , et regroupé les résultats dans des tables.
Elles sont en (partie) reprises dans les formulaires d’examens, ainsi que dans la plupart des ouvrages sur le sujet.

4.3.2 Espérence et variance


Théorème Soit  > 0. Soit X une variable aléatoire discrète suivant une loi de Poisson de paramètre (On
note X P (). Alors
E (X ) =  et V (X ) = 

4.3.3 La loi de Poisson comme loi de limite


Une des applications de la loi de Poisson est de fournir une approximation de certaines lois Binomiales.

Exemple 4.15 Dans une entreprise, on estime que la probabilité pour un article fabriqué d’être défectueux est
de p = 0; 05 (Cette valeur a été obtenue en accumulant une grande série de tests). On prélève dans un stock de
80000 pièces 120 articles. On s’intéresse au nombre d’articles défectueux dans l’échantillon prélevé.
hypothèses Bien que le choix des articles prélevés se passe sans remise, on considère que le stock contient
suffisamment d’articles pour que l’on puisse assimiler ce prélèvement à un tirage avec remise.
Ceci revient à formuler l’hypothèse que le prélèvement de 120 articles sur les 80000 ne modifie pratiquement
pas la composition global du stock.
Modélisation Sous les hypothèses précédentes, tout se passe comme si l’on procédé à l’expérience suivante : On
retire du stock un article, on le teste, on relève s’il est conforme ou non, et on le remet dans le stock. On prélève
alors une autre pièce, on la teste, et on le remet, etc.L’expérience est donc une série d’épreuves de Bernoulli, et
on s’intéresse au nombre d’échecs relevés dans la série.
Ainsi, si X est la variable aléatoire égale au nombre d’articles défectueux sur la série de 120 prélèvements, on peut
affirmer que X suit une loi Binomiale de paramètres n = 120, et p = 0; 05. De plus, E (X ) = np = 120  0; 05 = 6.
Loi binomiale, ou loi de Poisson ? Observons les probabilités approchées des diverses valeurs de X (suivant une
binomiale B (120; 0; 05)), et Y (suivant une poisson P (6) :

k 0 1 2 3 4 5 6 7 8 9 10 11 12
P (X = k) 0; 002 0; 013 0; 041 0; 087 0; 134 0; 163 0; 165 0; 141 0; 105 0; 069 0; 040 0; 021 0; 010
P (Y = k) 0; 002 0; 015 0; 045 0; 089 0; 134 0; 161 0; 161 0; 138 0; 103 0; 069 0; 041 0; 023 0; 011
On constate que les lois de X et de Y sont finalement assez proches.
On peut donc considérer que X et Y suivent pratiquement la même loi, et donc que l’on peut estimer que X
suit pratiquement une loi de Poisson de paramètre 6.

Theorème 4.1 Soit 0 6 p 6 1, et n2 N. Soit X une variable aléatoire suivant une loi binomiale de
paramètres n et p. Si n est ”assez grand”, si p est ”assez petit” et si np n’est ”pas trop grand”, alors on
peut raisonnablement considérer que X suit une loi de Poisson de paramètre  = E (X ) = np.
Remarque 4.12 Conditions usuelles d’application du théorème sur les valeurs de n et p : pour que ce théorème
soit applicable, autrement dit pour réaliser une assez bonne approximation de X B (n; p) par X P (np),
on doit se trouver dans le cas :

M. BALDE UCAD/ESP/GCBA
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxxviii

n p np
Situation 1 n > 30 p 6 0; 1 np 6 15
Situation 2 n > 50 p 6 0; 1 np 6 10

Remarque 4.13 On notera que si X suit une B (n; p), on a E (X ) = np, et que V (X ) = np(1 p).
Si l’on réalise une approximation de X par Y suivant une loi de Poisson P (), il faut-au moins-faire en sorte que
cette dernière variable aléatoire ait une espérance et une variance proches de celles de X . Comme par ailleurs
E (Y ) = , on choisit  = E (Y ) = E (X ) = np. On constate alors que V (Y ) =  = np ' np(1 p) si l’on
formule l’hypothèse que p est proche de 0.

M. BALDE UCAD/ESP/GCBA
Chapitre 5
Variables aléatoires réelles continues. Lois
fondamentales

5.1 Variables aléatoires continues : généralités

5.1.1 Nécessité de considérer des variables aléatoires continues


Les variables aléatoires discrètes sont malheureusement bien insuffisantes pour rendre compte de résultats
dont les valeurs ne sont pas nécessairement entières. Intéressons-nous aux expériences aléatoires suivantes :

Exemple 5.1 On choisit au hasard un point sur le segment [0; 2] de la droite réelle. On note X la valeur
obtenue. L’univers de cette expérience aléatoire est l’intervalle [0; 2], et la variable aléatoire X est évidemment
à valeurs dans [0; 2].
Ici, les valeurs de X possibles sont trop proches les unes des autres (en fait, infiniment proche) et on ne peut
donc pas parler de variables aléatoire discrète.
On dit que X est une variable aléatoire continue. Définition Une variable aléatoire continue est une variable
aléatoire qui prend ses valeurs dans un intervalle de R.

Remarque 5.1 Ainsi, une variable aléatoire continue est une variable aléatoire dont les valeurs possibles sont
(au moins théoriquement) toutes infiniment proche les unes des autres, et dont aucune ne peut être séparée
d’autre valeurs de la variable aléatoire (au moins en théorie).

Exemple 5.2 On mesure la longueurs de tiges métalliques immédiatement après leur production. On note X
le résultat de l’expérience aléatoire qui consiste à faire correspondre à une tige choisie au hasard sa longueur.
Il s’agit d’une variable aléatoire définie sur l’univers formé de l’ensemble des tiges, à valeur dans [0; +1[, donc
à valeurs réelles. Dans la mesure où les longueurs possibles peuvent être (au moins théoriquement)infiniment
proches les unes des autres, la variable aléatoire X est continue.

5.1.2 Impossibilité de donner simplement la loi d’une variable aléatoire continue


Contrairement à ce qui se passait pour une variable aléatoire discrète, il n’est pas possible de donner le
nombre P (X = r) pour toutes les valeurs de r 2 R. Par contre pour tout intervalle I de R,il est possible de

xxxix
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xl

donner la valeur de P (I ). Prenons un exemple :

Exemple 5.3 On choisit au hasard un point sur le segment [0; 2]de la droite réelle. On note X la valeur obtenue.
On a déjà vu que X était une variable aléatoire continue.
Cherchons à donner la loi de X. Nous pouvons supposer que la situation est un cas d’équiprobabilité (il n’y
a pas de raison de choisir un point particulier plutôt qu’un autre). Dans les cas d’équiprobabilité, on a vu en
probabilité que l’on a

P (A) =
Nombre de cas favorables
Nombre de cas possibles
pour tout événement A.
Considérons ici l’événement A = r. Nous pouvons estimer que la probabilité de choisir un point r particulier
de [0; 1] est donner par
P (r) =
0
+1
En nous inspirant de la formule précédente. Mais les règles habituelles sur les limites conduisent à penser
que la seule valeur raisonnable que l’on peut donner à ce quotient 0.
Donc pour tout r 2 [0; 2], on a P (r) = 0. autrement dit, la probabilité de choisir 0 est nulle, celle de choisir 1
1 1
est nulle, tout comme celle de ou , et de manière générale comme celle de choisir un réel r particulier de
2 3
[0; 1].
En particulier, on peut, pour tout réel t 2 [0; 1] estimer correctement P (X 2 [0; t]), qui vaut aussi P (X 6 t),
puisque X ne pas prendre de valeurs négatives. On a ainsi, en décidant que la probabilité de choix d’un intervalle
est proportionnel à sa longueur :
t 1
P (X 6 t) = = t:
2 2
Autrement dit, on est en mesure de donner l’expression8de la fonction de répartition de la variable aléatoire
8 > 0 si t 6 0
<R ! R >
<
X . Cette fonction est FX : : avec FX (t) =
1 t si 0 6 t 6 2 Ainsi, dans le cas d’une variable
t 7! FX (t) >
> 2
: 1 si 1 6 t
aléatoire continue, on ne peut pas connaître la loi de la variable, mais on peut en connaître la fonction de la
répartition... C’est donc sur elle que nous allons nous appuyer pour connaître la variable aléatoire de X.

5.1.3 Fonction de répartition d’une variable aléatoire continue


Dans l’exemple précédent, on a vu qu’on ne pouvait pas connaître la loi d’une variable aléatoire continue
comme celle d’une variable. Par contre, on a montré qu’il était possible de calculer la probabilité P (I ) de choisir
un élément qui soit dans le sous-intervalle I de [0; 1]. En particulier, il était possible de déterminer une fonction
de répartition pour cette variable aléatoire, en reprenant la définition choisie pour une variable aléatoire discrète.
Nous adopterons donc le point de vue suivant :

Définition 5.1 Soit X une variable aléatoire continue sur un univers probabilisé. On appelle fonction de répartition
de X la fonction
8
<R ! R
FX : :
t 7! FX (t) = P (X 6 t)

M. BALDE UCAD/ESP/GCBA
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xli

Remarque 5.2 Par définition, pour tout t 2 R; FX (t) = P (X 2] 1; t]). Les principales propriétés d’une
fonction de répartition sont les mêmes que celles obtenues dans le cas discret. Rappelons-les pour mémoire :
Proposition La fonction de répartition FX d’une variable aléatoire continue X a les propriétés suivantes :

– F X est définie sur R ;


– Pour tout t 2 R; 0 6 FX (t) 6 1 ;
– FX est une fonction croissante et continue sur R (sa représentation graphique et sans ”sauts” ;
– lim FX (t) = 0et t!lim
t! 1
F (t) = 1.
+1 X
Remarque 5.3 Il y a une analogie entre la courbe des fréquences cumulées croissantes d’une série statistique
continue et la fonction de répartition d’une variable aléatoire continue.
Les propriétés de l’une et de l’autre sont identiques (voir ci-dessus), ainsi que leurs formes, même si le rapport
entre variables aléatoires et séries statistiques est encore à préciser.
Fig -Allure générale d’une fonction de répartition Théorème Soit X une variable aléatoire continue sur
un univers probabilisé. Soient a et b deux réels. Alors
P (x 2 [a; b]) = P (x 2]a; b[) = P (x 2 [a; b[) = P (x 2 [a; b[) = FX (b) FX (a):
Cet important théorème indique comment la connaissance de la fonction de répartition permet de calculer
toutes les probabilités des événements x 2 I, où I est un intervalle de R. On retrouve ici le phénomène qui
avait été observé au paragraphe précédent, dans lequel on montré que la connaissance de la loi d’une variable
aléatoire continue était illusoire. Cependant, puisqu’il est possible de connaître toutes les possibilités P (x 2 I ),
où I est un intervalle, connaître la loi de X
revient en fait de connaître sa fonction de répartition FX :
Théorème Soit X une variable aléatoire continue sur un univers probabilisé. Alors connaître la loi de X revient
à connaître sa fonction de répartition FX .

5.1.4 Densité d’une variable aléatoire absolument continue


Définition 5.2 Soit X une variable aléatoire continue sur un univers probabilisé, dont la fonction de répartition
sur R est noté FX . On dit que X est absolument continue si FX est une fonction dérivable.

Définition 5.3 Soit X une variable aléatoire absolument continue sur un univers probabilisé. On appelle
densité de X la fonction FX0 sur R.

Expliquons à présent comment la connaissance de la densité d’une variable aléatoire X absolument continue
permet de connaître la loi de X :
Théorème Soit X une variable aléatoire absolument continue sur un univers probabilisé. Soient a et b deux
réels. On note FX la fonction de répartition de X , et fX sa densité. Alors on a :

fx = FX0
et
Z b
P (x 2 [a; b]) = P (x 2]a; b[) = P (X 2 [a; b[) = P (x 2 [a; b[) = fX (t)dt;
a

On en tire aussi le résultat suivant :


Corollaire Soit X une variable aléatoire absolument continue sur un univers probabilisé. Alors connaître la loi
de X revient à connaître sa densité fX .
Des exemples de toutes ces notions seront vus plus tard, lors de l’étude des lois de certaines variables aléatoires

M. BALDE UCAD/ESP/GCBA
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xlii

classiques (Loi exponentielle, loi normale).


Fig- La fonction de répartition FX de X détermine la loi de X
Fig- Lien entre fonction de répartition et densité

Remarque 5.4 (Intégrale impropre) Soit f : R ! R une fonction primitive. On note


Z +1 Z B
f (x)dx à la place de A!
lim1 B!lim+1 f (x)dx; si cette (double) limite existe:
1 A

Notons que cette limite n’est pas nécessairement un nombre réel fini, et que donc la précaution prise plus haut
n’est pas seulement oratoire, comme le montre les deux exemples suivants.

8
< 1=x2 si x 2= [ 1; 1]
Exemple 5.4 Soit f : R ! R la fonction définie par la relation fX =
: 1six 2 [ 1; 1]
Fig-Allure d’une fonction de densité de probabilité
Fig- La fonction de densité fX de X détermine la loi de X
A < 1 et B > 1 deux réels. Alors on a :
Z Z1 Z1 Z Z1
B
f (x)dx = f (x)dx + f (x)dx +
B
f (X )dx =
1 dx + Z 1 dx
A A 1 1 A x2 1
Z1 Z1 ZB
= x12 dx + dx + 1 dx
A 1 1 x2
• ˜x= 1 • ˜x=B
= 1 + [x]x=1 + 1
x x=A x= 1 x x=1
= 1 + A1 + 2 + B1 + 1
=4+ 1 + 1 A B
Comme lim lim 4 + 1 + 1 = 0, on a donc lim lim Z B f (X )dx = 4, et donc cette (double) limite
A! 1 B !+1 A B A! 1 B !+1 A
existe et est finie. On peut donc écrire
Z +1
f (X )dx = 4:
1
Fig-Courbe représentative de la fonction de l’exercice 46
n
Exemple 5.5 Soit f : R ! R la fonction définie par la relation fX = 1=jxjsix 2= [ 1; 1]1six 2 [ 1; 1] .Soient
Z Z1 Z1 Z Z1
B
f (x)dx = f (x)dx + f (x)dx +
B
f (X )dx =
1 dx + Z 1 dx + Z B 1 dx = [ ln( x)]x= 1 + [x]x=1 + ” ln(x)—
x=a x= 1
A A 1 1 A x 1 x 1
Z B
Comme lim lim 2+ln( A)+ln(B ) = +1, on a donc A!lim1 B!lim+1
A! 1 B !+1
f (x)dx qui est une quantité infinie,
Z +1 A
f (x)dx n’a donc pas de sens. Courbe représentative de la
et qui donc n’est pas un réel fini. L’écriture
1
fonction de l’exercice Proposition Soit X une variable aléatoire absolument continue, de densité fX . Alors
les propriétés de fX sont les suivantes :

– fX est définie sur R ;


– fZX > 0 ;
+1
– f (x)dx = 1 ;
1

M. BALDE UCAD/ESP/GCBA
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xliii

5.1.5 Espérance d’une variable aléatoire continue


Définition 5.4 Soit X une variable aléatoire absolument continue sur un univers probabilisé. Soit fX la densité
de X . On appelle espérance de X le réel, noté E (X ), défini par la relation
Z +1
E (X ) = x:fX (x)dx
1
, si cette dernière quantité est finie.

5.1.6 Variance et écart-type d’une variable aléatoire continue


Définition 5.5 Soit X une variable aléatoire absolument continue sur un univers probabilisé. On appelle
variance de X le réel, noté V (X ), qui, s’il existe, est définie par la relation
V (X ) = E ((X E (X ))2 ):
Remarque 5.5 La variance d’une variable aléatoire de X est donc l’espérance de la variable aléatoire E E (X ).
Ceci est également valable pour des variables discrètes. Pour une variable aléatoire X continue, de densité fX ,
on a : Z +1
V (X ) = (x E (X ))2 fX (x)dx:
1

Définition 5.6 Soit X une variable aléatoire absolument continue sur un univers probabilisé, admettant une
variance V (X ). On appelle écart-type de X le réel, noté X ; défini par la relation
È
X = V (X ):

5.2 Quelques lois classiques et fondamentales

5.2.1 La loi normale


Définition 5.7 Cette loi est celle qui rend compte de diverses mesures d’une grandeur donnée, opérées à
diverses reprises, chaque mesure étant sujette à des erreurs.

Définition 5.8 On appelle loi Normale de paramètres m 2 R et  > 0 la loi d’une variable aléatoire continue
X prenant toutes les valeurs réelles, de densité de probabilité la fonction

1 1 x m 2
fX (x) = p e 2 :
 2 
On note X N (m; ):
Remarque 5.6 On a donc en clair, pour tous a 6 b réels,
Z
P (a 6 X 6 b) = p
1 b
e
1  x m 2 dx:
 2 a 2 

Définition 5.9 La loi N (0; 1) est appelée loi Normale centrée et réduite. Sa densité est p1 e x2
2 :
 2
Définition 5.10 Si X est une variable aléatoire suivant une loi Normale, X est dite variable aléatoire gaussienne.
Si la loi de X est en plus centrée et réduite, on dit que X est une variable aléatoire gaussienne, centrée et réduite.

M. BALDE UCAD/ESP/GCBA
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xliv

Tables de la loi Normale Seule la table des valeurs de la loi N (0; 1); et pour être précis, celle de sa fonction de
répartition q(t) sur laquelle nous allons revenir, est utile, ainsi que nous le verrons au cours de ce paragraphe.
Notons toutefois que, à la différence de la loi exponentielle que nous aborderons au paragraphe suivant,une
calculatrice ne permet pas de calculer simplement les valeurs prises par la fonction (de deux variables)
Zb
(a; b) 7 ! p1 e
1  x m 2 dx;
 2 a 2 
ce qui explique qu’en pratique, on ne peut guète se dispenser de cette table (même si les ordinateurs actuels
permettent de calculer les valeurs figurant dans cette table, avec une bonne précision ; les logiciels spécifiques
sont tout de même encore difficiles d’accès...)

Définition 5.11 On note q la fonction de répartition d’ une variable aléatoire suivant une loi N (0; 1). On a
donc

pour tout t 2 R; q(t) = P (X 6 t):


Remarque 5.7 La fonction q est une fonction de répartition d’ une variable aléatoire à densité : c’est donc
une fonction croissante, avec lim q(t) = 0; lim q(t) = 1
t! 1 t!+1
Proposition pour tout t 2 R; q( t) = 1 q(t): Preuve J Cette propriété découle immédiatement du fait
que la densité associée à q est une fonction paire, donc dont la représentation graphique est symétrique par
rapport à l’axe des ordonnées. Cette symétrie entraine l’égalité des aires de portions de plan située sous la
courbe représentant la densité. I Théorème Soit X une variable aléatoire gaussienne centré et réduite.
– Pour tous a; b 2 R; a 6 b; on a P (a 6 X 6 b) = q(a);
– Pour tous t > 0; P ( t 6 X 6 t) = 2 q (t) 1;
Preuve J Le point i. est résultat général pour une variable aléatoire à densité.
Le point q. découle de la proposition précédente : t > 0 étant fixé, on a
P ( t 6 X 6 t) = q(t) q( t) = q(t) (1 q(t) = 2 q (t) 1: I
Dans tout ce qui précède, on a travaillé avec une variable aléatoire gaussienne centrée et réduite, mais l’immense
majorité des applications fait apparaître des variables aléatoires gaussiennes non centrées et /ou non réduites. Le
dernier résultat de ce paragraphe explique comment on peut calculer des probabilités du type P (a 6 X 6 b) ou
encore P ( t 6 X 6 t) pour de telles variables aléatoires. Théorème Soit X une variable aléatoire gaussienne
suivant une loi Normale N (m;  ). Alors pour tous a; b 2 R; la variable aléatoire aX + b suit une loi Normale
N (a  m + b; jaj): Preuve J Voir au paragraphe suivant la démonstration de ce programme. I Colloraire Soit
X m
X une variable aléatoire gaussienne suivant une loi Normale N (m; ). Alors la variable aléatoire X ? :=

suit une loi Normale N (0; 1). Preuve J On pose donc X ? := X
1 m
: D’après le théorème précédent, X ? suit
 
une loi normale N ( m
1 m 1
; ) = N (0; 1): I Autrement dit, il n’est pas nécessaire de dresser des tableaux
  
de toutes les lois normales, la seule connaissance de la table de la loi Normale centrée et réduite permet d’en
réduire tous les renseignement utiles à la connaissance d’une variable aléatoire gaussienne non-centrée et /ou
non réduite. Voici quelques applications pratique de ce très important théorème, illustrées sur des exemples.

Exemple 5.6 La production de poutres métalliques de longueur théorique 2 mètres ne fait pas toujours de
manière exacte ; un certain nombre de défaut de production sont susceptibles d’influer sur la longueur réellement
obtenue en fin d’usinage de la pièce. Ainsi, si on note X la variable aléatoire qui,à chaque poutre produite, associe

M. BALDE UCAD/ESP/GCBA
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xlv

sa longueur réelle, on peut admettre que X suit une loi Normale de paramètres (2; 0; 01):
Ceci signifie concrètement que, lors d’étude statistiques, l’observation d’un grand nombre de pièces produites
a conduit à une moyenne observée de 2 mètres, avec un écart-type de 0; 01 mètre. On voudrait déterminer la
probabilité d’avoir X 2 [1; 98; 2; 02]:
X m
On commence par centrer la variable aléatoire X , et on considère la variable aléatoire X ? := ; dont on

sait qu’elle suit une loi Normale N (0; 1):
On a alors
 ‹
(1; 98 6 X 6 2; 02) = 1; 98 m 6 X  m 6 2; 02 m = ( 2 6 X ? 6 2)
car m = 2; et  = 0; 01: On a donc P (X 2 [1; 98; 2; 02]) = P (1; 98 6 X 6 2; 02) = P ( 2 6 X ? 6 2). Mais
comme X ? N (0; 1); on a
P (X 2 [1; 98; 2; 02]) = P ( 2 6 X ? 6 2) = 2 q (2) 1 ' 2  0; 9772 1 ' 0; 9544:

Exemple 5.7 On voudrait estimer, sous les mêmes hypothèses, la probabilité que X 2 [1; 99; 2; 01]: On applique
la même méthode, et on commence par centrer et réduire la variable aléatoire X : on considère la variable
X m
aléatoire X =?
; dont on sait qu’elle suit une loi Normale N (0; 1):

On a alors
 ‹
(1; 99 6 X 6 2; 01) = 1; 99 m 6 X  m 6 2; 01 m = ( 2 6 X ? 6 2);
car m = 2; et  = 0; 01: On a donc P (X 2 [1; 99; 2; 01]) = P (1; 99 6 X 6 2; 01) = P ( 1 6 X ? 6 1). Mais
comme X ? N (0; 1); on a
P (X 2 [1; 99; 2; 01]) = P ( 1 6 X ? 6 1) = 2 q (1) 1 ' 2  0; 8413 1 ' 0; 6826:

Exemple 5.8 On voudrait estimer, sous les mêmes hypothèses, la probabilité que X 2 [1; 97; 2; 03]: On applique
la même méthode, et on commence par centrer et réduire la variable aléatoire X : on considère la variable
X m
aléatoire X :=
?
; dont on sait qu’elle suit une loi Normale N (0; 1):

On a alors
 ‹
(1; 97 6 X 6 2; 03) = 1; 97 m 6 X  m 6 2; 03 m = ( 2 6 X ? 6 2)
car m = 2, et  = 0; 01: On a donc P (X 2 [1; 97; 2; 03]) = P (1; 97 6 X 6 2; 03) = P ( 3 6 X ? 6 2). Mais
comme X ? N (0; 1); on a
P (X 2 [1; 97; 2; 03]) = P ( 3 6 X ? 6 3) = 2 q (3) 1 ' 2  0; 99865 1 ' 0; 9973:

Exemple 5.9 On voudrait estimer, sous les mêmes hypothèses, la probabilité que X 2 [1; 99; 2; 03]: On applique
la même méthode, et on commence par centrer et réduire la variable aléatoire X : on considère la variable
X m
aléatoire X :=
?
; dont on sait qu’elle suit une loi Normale N (0; 1):

On a alors
 ‹
(1; 99 6 X 6 2; 03) = 1; 99 m 6 X  m 6 2; 03 m = ( 2 6 X ? 6 2)

M. BALDE UCAD/ESP/GCBA
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xlvi

carm = 2; et  = 0; 01: On a donc P (X 2 [1; 99; 2; 03]) = P (1; 99 6 X 6 2; 03) = P ( 1 6 X ? 6 2). Mais
comme X ? N (0; 1); on a
P (X 2 [1; 99; 2; 03]) = P ( 1 6 X ? 6 3) = q(3) q( 1) = q(3) (1 q(1) = q(3) + q(1) 1 =' 0; 99865 + 0; 8413 1 ' 0; 8
Espérance et variance Théorème Soit soit X une variable aléatoire gaussienne suivant une loi Normale
N (m; ): Alors
E (X ) = m; V (X ) = 2 et X = 
Une application de ce résultat est la démonstration du théorème 47 : Preuve J En admettant le point délicat de
ce théorème (le fait que la transformation affine d’une variable gaussienne soit encore gaussienne), nous pouvons
utiliser les résultats généraux, démontrés plus haut, sur l’expérience et la variance (ou l’écart-type)d’une variable
aléatoire :
– d’une part, ma X + b = E (aX + b) = aE (X ) + b = am + b ;
– d’autre part, a X + b = jajX
.I La loi Normale comme loi limite de lois Binomiales Il est parfois intéressant d’utiliser, dans un but de
simplification, les lois Normales, comme des lois limites de variables aléatoires suivant une loi Binomiale. L’étude
de ces approximations fait l’objet du théorème suivants, suivi de remarques intuitivement assez évidentes, qui
ne constituent nullement des preuves de cet important résultat, dont la démonstration supposerait de définir
clairement des outils nouveaux, permettant l’étude de la notion de convergences de sujet de variables aléatoires.
Notons qu’un problème apparaît dans la mise enœuvre de ces approximations, que l’on expose dans l’important
exemple final. Théorème Soit 0 6 p 6 1; et n 2 N: Soit X une variable aléatoire suivant une
00
loi binomiale
de paramètres n et p. Si np et n(1 p) sont ”assez grands”, et si p est ”assez proche de
1
 È  2 ; alors on peut
raisonnablement considérer que X suit une loi Normale N np; np(1 p :

Remarque 5.8 Condition usuelles d’application du théorème sur les valeurs de n et p : pour que ce théo-
 soit
rème 
È applicable,autrement dit pour réaliser une assez bonne approximation de X B (n; p) par X
N np; np(1 p ; on doit se trouver dans les cas :
p np n(1 p)
Situation 1 0; 3 6 p 6 0; 7 np > 15 n(1 p) > 15
Situation 2 0; 3 6 p 6 0; 7 np > 20 n(1 p) > 20

È
Remarque 5.9 On notera que si X B (n; p), on a E (X ) = np, et que X = np(1 p):
suit une
Si l’on réalise une approximation de X par Y suivant une loi Normale N (m;  ); il faut - au moins - faire en
sorte que cette dernière variable aléatoire ait une espérance et un écart-type proches deÈceux de X: Comme par
ailleurs E (X ) = m, et que y =  , on choisit m = E (Y ) = E (X ) = np, et y = X = np(1 p):
1
L’hypothèse 00 p est assez proche de ” se justifie aussi bien sur le plan intuitif. En effet, la loi Normale N (m;  )
2
admet, pour toutes valeurs de m et  , une fonction de répartition parfaitement symétrique ; elle ne peut
approcher correctement la fonction de répartition d’une loi Binomiale que si celle-ci est elle-même relativement
symétrique. Cette dernière condition impose une valeur de p la plus proche possible de :
1
2
Ainsi qu’on l’a annoncé plus haut, la mise en œuvre concrète des approximations énoncées ci-dessus pose
quelques difficultés, que nous signalons par l’étude de deux exemples éclairants. Elles sont dues au fait qu’il
s’agit de réaliser l’approximation d’une loi discrète par une loi continue (au contraire de l’approximation d’une
loi Binomiale par une loi de poisson, qui constituait l’approximation d’une loi discrète par une loi discrète).

M. BALDE UCAD/ESP/GCBA
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xlvii


Exemple 5.10 Soit X une variable aléatoire discrète, suivant une loi Binomiale B 50;
1 ‹ : Les conditions
2
d’approximation de la loi de X
 par une‹ loi Normale sont remplies, et l’on peut donc raisonnablement considérer
que X suit la loi Normale N 25; p5 :
2
Evaluons maintenant P (24 6 X 6 26) de deux manières différentes :
– de manière exacte,

24
P ((24 6 X 6 26) = P (X = 24) + P (X = 25) + P (X = 26) = C50
1 1
25 26 1 1 24 1 1 1
224 22 6 + C50 225 225 + C50 226 224 = 250 (C50 +



en utilisant l’approximation de la loi de X par une N 25; p ; et le fait que 2
p X 25
suit une loi
2 5
Normale N (0; 1) (car centrée et réduite),
p ‚p Œ
24 25 p X 25 p 26 25 ‹
P (24 6 X 6 26) = P 2
5 6 2 5 6 2 5 = 2 q 52 1 ' 0; 2227:
Il apparaît donc un important décalage entre les calculs réalisés (erreur relative de l’ordre de 33%). Pour
retrouver des résultats cohérents, nous remarquons que P (24 6 X 6 26) =P (23; 5‹6 X 6 26; 5) (en loi exacte
5 p X 25
discrète), et utilisons l’approximation en loi Normale de X suivant une N 25; p ; et le fait que 2
2 5
suit une loi Normale N (0; 1) (car centrée et réduite),
p
P (23; 5 6 X 6 26; 5) = P 2
23; 5 25 6 p2 X 25 6 p2 26; 5 25 ‹ = 2 q  1p; 5 5‹ 1 ' 0; 3286:
5 5 5 2
Cette fois-ci, les évaluations exactes et approchées par une loi normale correctement employée de P (24 6 X 6
26) coïncident autour de 0; 328; avec une erreur de l’ordre de 4:10 4 (erreur relative de l’ordre 0; 2%).
L’exemple suivant cerne la difficulté d’ encore plus près, et montre clairement la position de l’erreur à ne pas
commettre lorsque l’on approche une loi discrète par une loi continue, en se plaçant dans un cas extrême, qu’il
faudra constamment garder à l’esprit.

Exemple 5.11 Soit X une variable aléatoire discrète, suivant une loi Binomiale B 50;
1 ‹ : Les conditions
2
d’approximation de la loi de X
 par une‹ loi Normale sont remplies, et l’on peut donc raisonnablement considérer
que X suit la loi Normale N 25; p5 :
2
Evaluons maintenant la probabilité limite P (X = 25) de deux manières différentes :
– de manière exacte,
1 1 1
225 225 = C50 250 ' 0; 1122;
25
P (X = 25) = C50 25

– en utilisant l’approximation en loi Normale de X; P (24; 5 6 X 6 25; 5) (en loi exacte discrète), et utiliser
l’approximation en loi Normale de X ,
p
24; 5 25 p X 25 p 25; 5 25 ‹ 
1 ; 5 ‹
P (24; 5 6 X 6 25; 5) = P 2
5 6 2
56 2
5 = 2 q p 10 1 ' 0; 1125:
2
Cette fois-ci, les évaluations exactes et approchées par une loi normale correctement employée de P (X = 25)
coïncident avec une erreur de l’ordre de 3:10 4 (erreur relative de l’ordre 0; 3%).

5.2.2 La loi Exponentielle


Définition et cadre naturel d’apparition Cette loi se rencontre lors de l’étude de problèmes liés à la
fiabilité d’un équipement. Ce problème, éminemment concret, sera abordé (superficiellement) plus tard dans
l’année. Nous nous contentons de donner ici les bases mathématiques nécessaires à cette étude.

Définition 5.12 On appelle loi exponentielle de paramètre  > 0 la loi d’une variable aléatoire continue X
prenant toutes les valeurs réelles positives, de densité de probabilité la fonction

M. BALDE UCAD/ESP/GCBA
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xlviii

8
< 0 si x<0
fX (x) = : 
e x si x > 0

On note X "():
Remarque 5.10 On a donc en clair, pour tous a 6 b réels,
8 Z b
>
> 0:dx = 0 a6b<0
>
>
si
< Za b
P (a 6 X 6 b) = > e x dx = 1 e b
si a606b
>
> Z0 b
>
: e x dx = e a
e b
si 0 < a 6 b:
0
La fonction de répartition associée à une variable aléatoire suivant une loi exponentielle est donc la fonction
8
< 0 si x<0
FX (x) = :
1 e x
si x>0

Remarque 5.11 Attention à la confusion entre la loi exponentielle et la loi de Poisson : la loi continue (Ex-
ponentielle) et la loi discrète (de Poisson) ont un rapport, mais il n’est pas complètement immédiat (à part le
paramètre, et la présence d’une exponentielle) ! Espérance et variance þéorème Soit X une variable aléatoire
continue suivant une loi Exponentielle de paramètre  > 0: Alors X admet une espérance, une variance et un
écart-type, qui sont données par les relations
1
E (X ) = ; V (X ) = 2
1 et X = 1 :
 

M. BALDE UCAD/ESP/GCBA

Vous aimerez peut-être aussi