Académique Documents
Professionnel Documents
Culture Documents
M. BALDE UCAD/ESP/GCBA
ii
Cours de Statistique
2e année
Mamadou BALDE
2011-2012
M. BALDE UCAD/ESP/GCBA
Sommaire
2 Séries Simples x
2.1 Moyenne arithmétique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x
2.2 Le Mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi
2.3 Médiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xii
2.3.1 Caractéristiques de position : les quantiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xii
2.4 Boîtes à moustaches (Box & Whiskers Plot) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv
2.5 Caractéristiques de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xv
2.5.1 Ecart Absolu moyen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xv
2.5.2 Variance, Ecart-type . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xv
2.5.3 Coefficient de variation (CV) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvi
2.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvii
iii
Sommaire iv
M. BALDE UCAD/ESP/GCBA
Chapitre 1
Généralités sur la statistique
1.1 Introduction
La statistique est une science, qui consiste à étudier des données, à les analyser et à les commenter. Elle
n’a pas pour objet d’étudier les éléments dans ce qui fait leur individualité mais plutôt dans ce qu’ils ont en
commun. Ainsi, une étude statistique portant sur des personnes n’a pas besoin de les étudier par rapport à leur
nom, prénom mais plutôt à leur sexe, age, revenues, localité...Il ne faut pas confondre la statistique, qui est la
science qui vient d’être définie à une statistique qui est un tableau résumant les données d’un événement.
1.1.1 vocabulaire
Les ensembles étudiés en statistique sont appelés populations ; leurs éléments portent le nom d’individus
Exemple 1.1 : Population d’étudiants du département de Chimie, population de véhicules importés au Sénégal
en 2009. Les facettes des individus de la population sont appelés caractères. Par exemple le sexe, la situation
matrimoniale, le salaire, la taille, le poids... sont des caractères. On convient de mettre entre guillemets les
caractères. Les valeurs prises par un caractère sont les modalités de celui-ci : le caractère "sexe" a deux
modalités : mâle et femelle ; le caractère situation matrimoniale en a quatre : célibataire, marié(e), veuf (ve) et
divorcé.
Un caractère peut être qualitatif ou bien quantitatif. Le caractère est dit qualitatif si ses modalités ne sont pas
mesurables. C’est le cas des caractères "sexe","situation matrimoniale", "couleur des yeux"... Si les modalités
du caractère sont mesurables, alors celui ci est dit quantitatif. Le caractère quantitatif porte aussi le nom de
variable statistique. Un caractère quantitatif est dit discret si ses valeurs sont isolées, il est dit continu s’il prend
n’importe qu’elle valeur intermédiaire entre deux valeurs données.
Exemple 1.2 Les caractères "nombre d’enfants par ménage", "nombre d’étudiants par classe" sont quantitatifs
discrets. Par contre les caractères "poids", "taille" et "âge" sont quantitatifs continus. Du fait de leurs nombres
interminables de valeurs, les caractères continus ont des modalités regroupés en intervalles de la forme [a; b[ ou
]a; b] (a et b 2 R) appelés classes.
v
Chapitre 1. Généralités sur la statistique vi
Tableau 1.1
Notes sur 20 07 08 10 11 15
Nombre d’étudiants 2 1 4 2 1
M. BALDE UCAD/ESP/GCBA
Chapitre 1. Généralités sur la statistique vii
1.3 Graphiques
Considérons le tableau statistique suivant donnant la distribution de salariés selon leur situation matrimo-
niale.
Tableau 1.3
Les représentations graphiques les mieux adaptées pour ce type de caractère (caractère qualitatif) sont : les
diagrammes à secteurs et les diagrammes à bandes.
Diagramme à bandes
Il est composé de bandes superposées ou juxtaposées dont les hauteurs sont proportionnelles aux effectifs
des modalités qu’elles représentent. La représentation des données du tableau (1.3) donne
Fréquence en %
Fréquence en %
100 Veuf
96
Divorcé
85
Marié
16
Célibataire
at
.
ar
ié rcé uf Situation 0 Situation
éli
b
M i vo Ve
C D a) juxtaposées b) superposées
M. BALDE UCAD/ESP/GCBA
Chapitre 1. Généralités sur la statistique viii
Diagramme à secteurs
C’est un diagramme à secteurs angulaires inclus dans un cercle ou un demi-cercle ou même une portion
quelconque de cercle. A chaque modalité correspond un angle
69%
Célibataire Divorcé
16% 11%
4% Veuf
Diagramme à bâtons
Considérons la distribution suivante donnant le nombre d’enfants par ménage dans 10 familles.
Tableau 1.4 Exemple de caractère discret
Nombre d’enfants 0 1 3 4 6
Nombre de familles 2 1 4 2 1
Le diagramme à bâtons est obtenu en représentant chaque modalité par un "bâton" de longueur proportionnelle
à sa modalité.
Nombre de familles
4
3
2
1
00 1 3 4 6 Nombre d’enfants
Fig. 1.3 Diagramme à bâtons
M. BALDE UCAD/ESP/GCBA
Chapitre 1. Généralités sur la statistique ix
Histogramme
Il est utilisé dans le cas de variables continues. Il est construit en portant en abscisse les modalités (les
classes) et en ordonnée les effectifs ou bien les fréquences.
Exemple 1.5 Considérons la distribution suivante donnant la longueur en cm de plantes d’un jardin botanique.
Taille (cm) [35; 40[ [40; 45[ [45; 50[ [50; 55[ [55; 60[ [60; 65[
Effectif 7 6 10 15 24 5
Effectif
Taille (cm)
Fig. 1.4 Histogramme
Remarque 1.1 Dans l’exemple précédent,les classes sont de même amplitude. Cependant, si elles étaient
d’amplitude différente, à la place des effectifs, on mettrait les densités de classes.
Le polygone des fréquences (ou courbe des fréquences) est un polygone qui est obtenu en joignant successi-
vement les milieux des segments supérieurs des bandes juxtaposées.
M. BALDE UCAD/ESP/GCBA
Chapitre 2
Séries Simples
Les tableaux et diagrammes sont souvent longs à consulter sans qu’ils ne fournissent des informations assez
claires sur la distribution statistique observée. On cherche alors à résumer celle-ci par une caractéristique
centrale : un seul nombre destiné à caractériser l’ensemble. Une série statistique simple est une série à une seule
variable (statistique).
Tableau 2.1
X x1 x2 x3 ::: xk
Effectif n1 n2 n3 ::: nk
Notes sur 20 07 08 10 11 15 16
Nombre d’étudiants 2 2 4 2 1 1
X =
7 2 + 8 2 + 10 4 + 11 2 + 15 1 + 16 1 = 10; 25
2+2+4+2+1+1
x
Chapitre 2. Séries Simples xi
Remarque 2.1 Dans le cas d’une variable continue, à la place de la modalité xi on met la valeur ci du centres
de la classe numéro i.
2.2 Le Mode
Le mode ou valeur modale M0 de la variable X est la modalité qui a le plus grand effectif (ou la plus grande
fréquence).
Exemple 2.2 En reprenant l’exemple (2.1) des notes d’étudiants, on voit que le mode est la note 10=20. En
d’autres termes, la note la plus fréquente dans cette classe est 10=20 Dans le cas d’une variable continue on
détermine d’abord la classe modale avant de calculer le mode. La classe modale est alors la classe de plus grand
effectif.
Dans ce cas, on utilise un calcul basé sur une représentation de la classe modale et des deux classes qui
l’encadrent immédiatement. Considérons l’exemple suivant :
Tableau 2.3
Taille(cm) [35; 40[ [40; 45[ [45; 50[ [50; 55[ [55; 60[ [60; 65[
Effectif 7 6 10 15 24 5
La classe modale est l’intervalle [55; 60[. Pour obtenir le mode, l’histogramme limité à la classe modale et
des deux classes qui l’encadrent comme indiqué dans la figure (2.1). Le Mode M0 est l’abscisse du point
Effectif
J I0
!
K K0
I
J0
M0
Taille (cm)
Fig. 2.1 Mode d’une variable continue
M. BALDE UCAD/ESP/GCBA
Chapitre 2. Séries Simples xii
d’intersection des droites (II 0 ) et (J; J 0 ). Les triangles !I 0 J 0 et !IJ sont semblables, on a
!K !K 0
=
IJ 0 IJ 0
M0 55 60 M0
ce qui équivaut à
24 15 = 24 5
19(M0 55) = 9(60 M0 )
M0 =
1585 ' 56; 61cm
28
2.3 Médiane
C’est la modalité Me qui divise l’effectif total en deux effectifs égaux. Autrement dit : il y a autant d’obser-
vations supérieures à la médiane que d’observations qui lui sont inférieures.
La médiane correspond à la première modalité dont l’effectif cumulé croissant est supérieur ou égal à la
moitié de l’effectif total (ou bien la fréquence cumulée croissante supérieure ou égal à 50%).
Exemple 2.4 Revenons dans le tableau (2.4) sur la distribution de ménages selon leur nombre d’enfants. Le
N
N = 10. Sa moitié,
calcul des Effectifs cumulés croissants (ECC) fournit l’effectif total
2 = 5 ne figurant pas
parmi les effectifs cumulés croissants, alors on prend l’effectif cumulé 7 qui vient tout juste après ; ce qui fournit
Me = 3 comme médiane.
Nombre d’enfants 0 1 3 4 6
Nombre de familles 2 1 4 2 1
ECC 2 3 7 9 10
En guise d’interprétation, nous dirons que plus de la moitié des familles ont au plus 3 enfants.
Dans ce cas on définit d’abord la classe médiane, classe dont l’effectif cumulé croissant est la première à
dépasser N=2 puis on cherche la médiane par interpolation linéaire. Le paragraphe suivant explique dans les
détails la détermination de la médiane d’une variable continue.
M. BALDE UCAD/ESP/GCBA
Chapitre 2. Séries Simples xiii
et sont les modalités de la variable qui correspondant respectivement aux effectifs cumulés (croissants)
N 2N 3N
; ;
4 4 4
De même, on a 9 déciles
N 2N 3N 9N
D1 ; D2 ; D3 ; : : : D9 qui correspondent respectivement aux effectifs cumulés ; ; ;:::; :
10 10 10 10
Les centiles sont aux nombre de 99
N 2N 3N 99N
C1 ; C2 ;3 ; : : : C99 et correspondent respectivement aux effectifs cumulés
100 ; 100 ; 100 ; : : : ; 100
.
Remarque 2.2 La médiane correspond au deuxième quartile, cinquième décile et cinquantième centile.
Remarque 2.3 Dans les définitions des quantiles, à la place des effectifs cumulés croissants , on peut utiliser
les fréquences cumulées croissantes en divisant tout juste l’effectif cumulé par N , l’effectif total.
Q1 de la
Le procédé est similaire à celui utilisé pour calculer la médiane. Par exemple le premier quartile
distribution de ménages selon leur nombre d’enfants (tableau (2.4)) est Q1 = 1 et le deuxième décile D2 = 0.
Dans ce cas, les quartiles sont obtenus par interpolation linéaire. Ce qui n’est rien d’autre qu’une application
du théorème de Thalès. Utilisons un exemple pour ce faire.
Exemple 2.5 : Considérons la distribution suivante donnant les masses des disciples d’un club de Karaté dans
laquelle on cherche à déterminer la médiane Me .
Masses(kg ) [40; 50[ [50; 60[ [60; 70[ [70; 80[ [80; 90[
Fréquences 0; 05 0; 35 0; 25 0; 20 0; 15
F.C.C. 0; 05 0; 4 0; 65 0; 85 1
La classe médiane est celle de fréquence cumulée50%. A défaut d’une classe pareille, on prend celle dont la
fréquence cumulée est la première à dépasser 50%. Ici il s’agit de la classe [60; 70[. La courbe (polygone) des
fréquences cumulées est construite comme suit : Chaque classe est représentée par un point d’abscisse la borne
supérieure de la classe et d’ordonnée la fréquence cumulée. on ajoute éventuellement une classe de fréquence
nulle avant la première (ici c’est la classe [30; 40[ qui a été ajoutée).
D’après le théorème de Thalès, on a
IK 0 KK 0
IJ 0
= JJ 0
En remplaçant par les données on a :
Me 60 0; 5 0; 4
70 60 = 0; 65 0; 4
ce qui équivaut à Me = 10
0; 1 + 60
0; 25
Me = 64 kg
M. BALDE UCAD/ESP/GCBA
Chapitre 2. Séries Simples xiv
Masse en Kg
Fig. 2.2 Graphe des fréquences cumulées croissantes
I J0
K0
Masse en Kg
Fig. 2.3 Interpolation linéaire
Remarque 2.4 A la place des fréquences cumulées croissantes , on pourrait utiliser les fréquences cumulées
décroissantes. La constitution de la courbe des FCD se fait comme suit : on place les points d’abscisses les bornes
inférieures des classes et d’ordonnées respectives les FCD. Eventuellement, on rajoute après la dernière classe,
une classe de même amplitude que celle-ci mais de fréquence nulle. Graphiquement, la médiane correspond à
l’abscisse du point d’intersection des courbes cumulés décroissante et croissante.
Une boîte à moustache est un diagramme qui permet de représenter schématiquement une distribution. Elle
consiste en un rectangle dont les deux extrémités sont les premier et dernier quartiles (Q1 et Q3 ). La médiane
est représentée par un trait à l’intérieure de la boîte. Les extrémités de la boîte se prolongent par des traits qui
leur sont orthogonaux (les moustaches). La longueur des moustaches varie selon les auteurs. Dans l’exemple
de la figure 2.4 , nous avons délimiter les moustaches par D1 et D9 respectivement premier et neuvième décile .
On aurait pu utiliser à la place des déciles d’autres quantiles ou même les valeurs minimale et maximale
de la distribution. Les boîtes à moustaches sont utilisées principalement pour comparer un même caractère
dans deux populations de tailles différentes.
M. BALDE UCAD/ESP/GCBA
Chapitre 2. Séries Simples xv
Q1 Me Q3
D1 D9
x
Fig. 2.4 Boîte à moustaches
S1 : 3 5 7 10 13 15 17
S2 : 7 8 9 10 11 12 13
Ces deux séries ont même moyenne et même médiane,10. Cependant, elles sont complètement différentes de
point de vue de la dispersion de leurs modalités.
P
ni jX xi j
e= (2.2)
N
X3 =X x1 , x2 ; : : : xr , l’effectif ; n1 ,n2 : : :
N = ni ; X = moyenne de X
Pour la série S1
e1 =
(10 3) + (10 5) + (10 7) + (10 10) + (13 10) + (15 10) + (17 10)
7
On trouve e1 = 4; 29 et de même e2 = 1; 71.
Avec le calcul des écarts de e1 et e2 , la série S1 ayant le plus grand des écarts est moins homogène que la série
S2 .
X
k
où N= ni
i=1 p
L’écart type noté est la racine carrée de la variance : = V .
M. BALDE UCAD/ESP/GCBA
Chapitre 2. Séries Simples xvi
On a :
Pk P P P Pk
V=
(X xi )2 =
i=1 ni (ni X 2 2ni xi X + ni x2i ) =
ni X 2
2X ni xi +
2
i=1 ni xi
Pk
N Pk
N Pk
N N N
2 2
=1 ni
= X 2 iN 2X 2 + i=1N i = X 2 2X 2 + i=1N i xi
n i x n
Pk 2
= i=1Nni xi X 2
Tableau 2.6
Taille 33 34 35 36 37 38 39 40 41 42
Effectif 2 1 5 2 4 10 2 6 1 3
X =
33 2 + 34 1 + 35 5 + 36 2 + 37 4 + 38 10 + 39 2 + 40 6 + 41 1 + 42 3 = 37; 8
2 + 1 + 5 + 2 + 4 + 10 + 2 + 6 + 1 + 3
Sa variance est :
V=
332 2 +2 342 1 + 352 5 + 362 2 + 372 4 + 382 10 + 392 2 + 402 6 + 412 1 + 422 3 37; 82
36
' 4; 00
et son écart -type vaut donc 2.
Remarque 2.5 Si on est en présence d’une variable continue, les modalités xi sont remplacées par les centres
de classe leur correspondant.
Il joue un rôle similaire à celui de la variance et de l’écart type. Il est définie par :
CV = (2.4)
X
Le CV est exprimé généralement en % et est utilisé pour mesurer l’homogénéité d’une distribution : plus le CV
est proche de 0 plus la distribution est homogène. Dans la pratique, on considère qu’une série est homogène si
son CV 6 30%,.
Remarque 2.6 La variance précédemment définie est utilisée à l’échelle de la population entière. Cependant,
elle présente un biais (une distorsion) . Pour corriger ce biais, on utilise la variance empirique ou variance
Pk
corrigée. Elle est définie par s2 = i=1 ni (X xi )2 .
N 1
Cette variance est utilisée au sein des échantillons d’une population.
M. BALDE UCAD/ESP/GCBA
Chapitre 2. Séries Simples xvii
2.6 Exercices
1 On donne la répartition de 30 personnes selon leur groupe sanguin :
2
1. L’assemblée nationale veut pendre des mesures concernant la cherté de la location des appartements à
Dakar ; ainsi, elle a mis sur pied une commission chargée d’enquêter sur ce fait. Donner pour cette étude,
la meilleure représentation du ou des caractères. Donner la nature de ce ou ces caractères.
2. Dans une classe de 24 enfants, on enregistre les caractères suivants :
– la nationalité ;
– la couleur des yeux ;
– l’obéissance, appréciée sur l’échelle : absolue, très grande, assez grande, normale, faible, nulle.
– le nombre de dents, réparti en 7 catégories : 10 et moins, entre 11 et 14, 15 ou 16, 17, 18 ou 19, entre
20 et 23, 24 et plus.
Pour lesquels de ces caractères les paramètres de position : mode, médiane, moyenne, quartiles et ceux de
dispersions : variance, écart-type, ont-ils un sens ?
3 Le nombre d’interventions graves par jour des pompiers d’une caserne pour l’an 1985 est donné dans le
tableau qui suit :
Nbre de sorties graves/jour 0 1 2 3 4 5 6 Total
Effectifs 84 105 72 59 28 15 2 365
1. Quelle est la variable statistique étudiée ? Est elle discrète ou continue ?
2. Représenter cette série statistique par un graphique adapté.
4 Le tableau suivant donne la répartition d’un groupe d’enfants selon leur taille.
Taille (en cm) [80,90[ [90,95[ [95,100[ [100,105[ [105,110[ [110,120[
Effectifs 3 15 22 18 12 5
Mêmes questions que dans l’exercice précédent.
5 Les tailles d’un échantillon d’arbustes sont réparties dans le tableau suivant :
Classes [155,160[ [160,165[ [165,170[ [170,175[ [175,180[ [180,185[
Effectifs 3 7 9 16 11 4
1. Tracer l’histogramme et la courbe des fréquences et fréquences cumulées de cette distribution.
2. Calculer le mode, la médiane, les quartiles, la moyenne, la variance et le coefficient de variation.
3. On décide de regrouper les classes N˚1 et 2, celles N˚3 et 4 et les deux dernières. Calculer comme dans les
deux précédentes questions les paramètres de la nouvelle distribution.
M. BALDE UCAD/ESP/GCBA
Chapitre 2. Séries Simples xviii
6 Utiliser les données de l’exercice 1 et calculer si possible les paramètres suivants : mode, moyenne, médiane,
écart-type, coefficient de variation.
7 Mêmes questions que celles de l’exercice précédent mais en employant les données de l’exercice 2
8 La distribution de logements suivant le nombre de pièces dans un quartier est donnée dans la tableau qui
suit.
Nombre de pièces 1 2 3 4 5 6 et plus
Effectifs 15 24 27 19 9 6
1. Quel est le caractère étudié ? Sa nature ? Ses modalités ?
2. Représenter le diagramme à bâtons, le polygone des fréquences et le diagramme cumulatif de cette distri-
bution.
3. Déterminer le mode, la médiane et les premier et 3e quartiles
4. Calculer la moyenne arithmétique, la variance, l’écart type et le coefficient de variation de cette série.
M. BALDE UCAD/ESP/GCBA
Chapitre 3
Séries doubles
il est souvent intéressant d’étudier les individus d’une population donnée selon deux ou plusieurs caractères :
âge, taille et masse ; partie politique et sexe, : : : . Dans ce chapitre, nous allons étudier des individus suivant
deux caractères.
Tableau 3.1
Individus I1 I2 : : : In
X x1 x2 : : : xn
Y y1 y2 : : : yn
3.1.2 Corrélation
Covariance
Cov(X; Y ) =
1 X(x X )(y Y ) (3.4)
i i
N
Propriété 3.1
Ê On a
Cov(X; Y ) =
1 X(x X )(y Y )
i i
N
X X X X
= N1 xi yi Y xi X yi + X Y
X 1 X
= N1 xi yi 2nY X + nX Y =
N
xi yi X Y
X
= 1 x y X Y
N i i
Ë
Cov(X; Y ) = Cov(Y; X )
Ì
Cov(X; X ) = V (X )
Í Si (a; b; c; d) 2 R4 on a :
Cov(aX + b; cY + d) = ac:cov(X; Y )
A l’aide de la covariance on définit la corrélation entre les variables X et Y.
Coefficient de corrélation
Y = aX + b ou bien X = a0 Y + b0 :
Si r(X; Y ) est proche de zéro, alors il n’existe aucune forme de liaison linéaire entre X et Y . On dit que X et
Y sont non corrélés linéairement.
Propriété 3.2 On a
1 6 r(X; Y ) 6 1 (3.5)
M. BALDE UCAD/ESP/GCBA
Chapitre 3. Séries doubles xxi
Propriété 3.3 On a
ac:cov(X; Y )
r(aX + b; cY + d) =
jacjX Y (3.6)
Remarque 3.1
V (aX + b) = cov(aX + b; aX + b)
= a2 cov(X; X )
= a2 (V (X ))
Et l’on a
È
(aX + b) = jaj V (X ) = jaj(X ) (3.7)
Hi
X
Fig. 3.1 Droite de régression
Y = aX + b (3.8)
3.1.5 Prévision
Etant données deux variables X et Y Y = aX + b. Pour une valeur donnée
liées par l’équation de régression
x0 de la variable X , on déduit la valeur y0 lui correspondant par y0 = ax0 + b.
Tableau 3.2
HH Y
HH
y1 y2 ::: Y ::: yq ni:
X H
H
H
x1 n11 n12 : : : n1 j ::: n1 q n1 :
x2 n21 n22 : : : n2 j ::: n1 q n2 :
.. ..
. .
xi ni 1 ni 2 ::: nij ::: niq ni:
.. ..
. .
xp np1 np2 : : : npj ::: npq np:
n:j n:1 n:2 : : : n:j ::: n:q N
X
q X
p X
p X
q
N= nij = ni: = n:j
j =1 i=1 i=1 j =1
X
p
ni:
– la fréquence marginale de la variable X , fi: = fij =
;
j =1
N
X p
n
– la fréquence marginale de la variable Y , f:j = fij = :j
i=1
N
f11 =
5; f = 1;
12 12 12
4
f21 = ; f22 =
2
12 12
Fréquences marginales
n: 6 n 6
f1 : = 1 = ; f2 = 2 =
N 12 N 12
HH Y 6 8
HH
X H
HH
4 5 1 6
3 4 2 6
9 3 12
On montre que
f1 : + f2 : =
6 6 9 3
12 + 12 = 1; f:1 = 12 ; f:2 = 12
M. BALDE UCAD/ESP/GCBA
Chapitre 3. Séries doubles xxiv
= 12 6 5 9 + 3 1 6 + 6 4 9 + 3 2 6 1
On a des formules similaires pour les variables Y
Distribution Conditionnelles
X =
1Xp
ni :xi : Y =
1Xq
n:j yj
N i=1
N j =1
M. BALDE UCAD/ESP/GCBA
Chapitre 3. Séries doubles xxv
Variance marginale
V ar(X ) =
1 :X
p
n :(x X )2 =
1 :X
p
ni :x2i X 2 V ar(Y ) =
1 X n:j (y Y )2 = 1 X n:jy2 : Y 2
i i j
N i=1 N i=1
N N j
j j
V ar = r2 reste valable
covariance
cov(X:Y ) =
1 X X n j (x X )(yj Y =
1 X X n jx y X Y
i i i i i
N i j
N i j
Moyenne Conditionnelles
m(X=Y = yj ) = Xj =
1 X n jx = X(x =y )x
i i i j i
n:j i f
1 X X
q
m(Y=X = xi ) = Yi = ni iyj = f (yj =xi )yj
ni : i j =1
Variance conditionnelles
V ar(X=Y = yj ) =
1 X n j (x x )2
i i j
n:j i
V ar(X=Y = xi ) =
1 X n j (y y )2
i j i
n:j i
X =
1Xq
n:j xj de même que Y =
1 X n :y (3.11)
i i
N j =1
N i
X X
V (X ) = f:jV ar(X=Y = yj ) + f:j (xj X )2 (3.12)
j j
X
p X
V (X ) = fi :V ar(Y=X = xi ) + fi :(yi Y )2 (3.13)
i=j i
M. BALDE UCAD/ESP/GCBA
Chapitre 3. Séries doubles xxvi
3.5 Exercices
1
On a relevé sur des plantes les résidus fongicides x exprimés en fonction du temps t
Dates 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Résidus 10 9 8 7 6 5,5 5 4,5 3,8 3,4 3 2,7 2,4 2
1. Dessiner le nuage statistique
2. On pose y = log x. Déterminer le coefficient de corrélation de y et t. Tracer le nouveau nuage. Déterminer
l’équation de la droite d’ajustement de y en t, puis celle de la courbe de x en t.
3. A partir de quelle date les résidus ont-ils diminué de moitié ?
2
Le tableau suivant donne les valeurs expérimentales de la pression P d’une masse de gaz pour différentes valeurs
V du volume. D’après les principes de la thermodynamique, on a la relation
PV
= C
où
et C sont des constantes dépendant des conditions expérimentales.
Volume V (en cm3 ) 54,3 61,8 72,4 88,7 118,6 194,0
Pression P (en kg=cm2 ) 61,2 49,5 37,6 28,4 19,2 10,1
1. En posant Y = ln P et X = ln V , trouver une relation linéaire entre X et Y .
2. Dresser le tableau du couple (X; Y ). Tracer le nuage de cette distribution.
3. Donner le coefficient de corrélation linéaire entre X et Y et l’équation de la droite de régression de Y en
X.
4. Estimer P pour V = 100; 0cm3 .
3
On donne la série statistique double de cinq éléments :
X 1,2 1,4 1,6 1,8 2
Y 13 12 14 16
1. Déterminer sachant que la droite de régression de Y en X à pour équation y = 9x + 0; 6
2. Calculer le coefficient de correlation des caractères X et Y
4
L’alcoolémie est le taux (en g=l) d’alcool présent dans le sang et se mesure après une prise de sang. On souhaite
modéliser la relation entre l’alcoolémie, la quantité d’alcool ingéré et le poids de l’individu. On a pris 8 individus
de poids différents, on leur a donné des quantités différentes d’alcool ‘a ingérer et on a mesuré leur alcoolémie
une heure après (environ le moment o‘u l’alcoolémie est maximale). On note P le poids de l’individu, Q la
quantité d’alcool ingéré et A l’alcoolémie. On note Y le quotient Y = Q=P et on s’intéresse aux éventuelles
relations entre Y et A. Les mesures obtenues sur les 8 individus sont les suivantes :
Alcoolémie A 0,2 0,28 0,4 0,75 0,35 0,71 0,56 0,64
Y = Q/P 0,14 0,18 0,25 0,5 0,24 0,46 0,36 0,44
Dans cet exercice, on donnera tous les résultats avec une précision de 3 chiffres après la virgule.
1. Tracer le nuage de points (Ai ; Yi ).
2. Calculer les moyennes A et Y ainsi que les écart-types A et Y .
M. BALDE UCAD/ESP/GCBA
Chapitre 3. Séries doubles xxvii
M. BALDE UCAD/ESP/GCBA
Chapitre 4
Variables aléatoires réelles discrètes.Lois
fondamentales
Remarque 4.1 30 Une variable aléatoire à valeur réelles est la donnée d’une fonction
8
<
! R
X::
! 7! X (!)
compatible avec les opérations sur l’espace des possibilités ! .
Exemple 4.1 On lance un dé traditionnel équilibré à 6 faces. On appelle X le numéro de la face obtenue à un
certain lancé. Ici, l’ensemble des possibilités est
= 1; 2; 3; 4; 5; 6, et on a défini avec X une variable aléatoire
réelle, par la relation :
Pour tout ! 2
; X (!) = !:
En clair, X (1) = 1; X (2) = 2; X (3) = 3; X (4) = 4; X (5) = 5 et X (6) = 6.
On fabrique ainsi une variable aléatoire, puisque la valeur de X dépend du tirage réalisé : : : .
Exemple 4.2 Un jeu de hasard consiste à lancer un dé traditionnel équilibré à 6 faces. Le lanceur gagne la
somme double de la valeur de la face obtenue si celle-ci est paire, sinon, il perd le double de la valeur indiquée
par le dé. On appelle X le gain, positif ou négatif, du joueur après un lancé. Ici, l’ensemble des issus possibles
est
= 1; 2; 3; 4; 5; 6, et on a défini avec X une variable réelle, par la relation :
8
< 2!; si ! est pair
pour tout ! 2
; X (! ) =
: 2!; si ! est impair
xxviii
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxix
Exemple 4.3 On dispose d’un jeu de belote traditionnel de 32 cartes. On tire une carte dans ce jeu, et on
attribue à ce tirage la valeur X calculée suivant la règle suivante :
Exemple 4.4 Un professeur peu consciencieux décide de corriger ainsi ses copies : sur son escalier composé de
21 marches, qu’il a au préalable numérotées de 0 à 20, il jette le paquet de copies, et attribue à chaque copie la
note correspondant au numéro de la marche. On note X la note obtenue par Paul. Il est claire que X est une
variable (très) aléatoire,puisqu’il s’agit d’attribuer une valeur à X (la note), qui est le résultat d’une expérience
aléatoire (le lancé de copies, et leur atterrissage).
Remarque 4.2 Plus concrètement, une variable aléatoire discrète est une variable dont les valeurs possibles
ne sont pas infiniment proches (au moins théoriquement).
Exemple 4.5 Un exemple de variables aléatoires discrètes est fourni par les variables aléatoires prenant des
valeurs entières, ou qui peuvent être transformées en variables aléatoires définies sur le même univers, et ne
prenant que des valeurs entières.
Autrement dit
est l’univers sur lequel la variable aléatoire X est définie, alors on peut transformer X en une
autre variable aléatoire Y définie sur
, telle que Y (
) NouY (
) N. Ceci revient à dire que pour tout
! 2
; Y (!) 2 N ou Y (!) 2 Z
Exemple 4.6 Un jeu de hasard consiste à lancer un dé traditionnel équilibré à 6 faces. On note X le nombre
obtenu en calculant l’inverse du carré du chiffre affiché sur le dé.
X est une variable aléatoire discrète, car ces valeurs possibles sont ”éloignées” les unes des autres : Celles-ci
valent en effet 1; 1=4; 1=9; 1=16; 1=25; 1=36. En posant Y = X 1 , on définit une nouvelle variable aléatoire sur
l’univers de l’expérience (ici,
= 1; 2; 3; 4; 5; 6), et les valeurs prisent par Y sont entières (elles valent en effet
M. BALDE UCAD/ESP/GCBA
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxx
(Cette dernière relation montre que Y , transformation de X , ne prend que des valeurs entières)
Valeurs de X x1 x2 x3 : : : xn
P (X = xi ) p1 p2 p3 : : : pn
Ce tableau doit bien sûr faire penser à celui d’une série statistique à une variable, présentée par distribution de
fréquences.
Exemple 4.7 On lance un dé traditionnel équilibré de 6 faces. On appelle X le numéro de la face obtenue à un
certain lancer. Ici, l’ensemble des possibilités est
= 1; 2; 3; 4; 5; 6, et on a défini avec X une variable aléatoire
réelle. En clair, X (1) = 1; X (2) = 2; X (3) = 3; X (4) = 4; X (5) = 5etX (6) = 6, et la loi de X est donnée par
X 1 2 3 4 5 6
P (X = xi ) 1=6 1=6 1=6 1=6 1=6 1=6
Exemple 4.8 Un jeu de hasard consiste à lancé un dé traditionnel équilibré à 6 faces. Le lanceur gagne la
somme double de la valeur de la face obtenue si celle-ci est paire, sinon, il perd le double de la valeur indiquée
X (1) = 2; X (2) = 4; X (3) = 6; X (4) = 8; X (5) = 10etX (6) = 12.
La loi de X est donnée par
X 10 6 2 4 8 12
P (X = xi ) 1=6 1=6 1=6 1=6 1=6 1=6
On fabrique ainsi une variable aléatoire, puisque la valeur de X dépend du tirage réalisé...
Exemple 4.9 On dispose d’un jeu de belote traditionnel de 32 cartes. On tire une carte dans ce jeu, et on
attribue à ce tirage la valeur X calculée suivant la règle suivante :
M. BALDE UCAD/ESP/GCBA
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxxi
X 0 1 3 4 11
16 4 4 4 4
P (X = xi )
32 32 32 32 32
Exemple 4.10 La loi de la somme de deux dés à 6 faces, traditionnels, équilibrés, est donnée par
X 2 3 4 5 6 7 8 9 10 11 12
P (X = xi )
1 2 3 4 5 6 5 4 3 2 1
36 36 36 36 36 36 36 36 36 36 36
Exemple 4.11 Dans le cas où la variable aléatoire X serait discrète mais prendrait une infinité de valeurs
(xi )i > 1, donner la loi de X consiste à déterminer les probabilités (pi )i > 1 de chacun des événements X = xi .
Un premier lancer qui amène Pile.
On a
1 1 1 1 1 1 1
P (X = 1) = ; P (X = 2) = = ; P (X = 3) = = 1=8, et que de manière généraleP (X =
2 2 2 4 2 2 2
k) =
1
2k .
La loi de X est donc donnée par les relations : pour tout k 2 N ? ; P (X = k ) =
1
2k , ou encore par le tableau
Valeurs de X 1 2 3 4 ::: k :::
1 1 1 1 1
Probabilités associées
2 4 8 16 : : : 2k :::
+1
X
(Notons que pour k; 0 6 P (X = k) 6 1, et que P (X = k) = 1.)
i=k
Valeurs de X x1 x2 x3 : : : xn
P (X = xi ) p1 p2 p3 : : : pn
X
n
E (X ) = p1 x1 + p2 x2 + + pn xn = pi xi :
i=1
Remarque 4.4 L’espérance de la variable aléatoire X est la moyenne de la série statistique discrète X , selon
les fréquences p1 ; p2 ; : : : ; pn .
Remarque 4.5 Dans le cas où la variable aléatoire X serait discrète mais prendrait une infinité de valeurs
(xi )i>1 , chacune respectivement avec la probabilité (pi )i>1 , On adopte la définition suivante
+1
X
E (X ) = pi xi ;
i=1
Si cette dernière quantité est finie. Ce nombre généralise alors celui retenu dans la définition précédente.
On adopte la convention suivante : si (xi )i > 1 est une suite de réels,
+1
X X
N
ui := N !lim
++1
ui :
i=1 i=1
M. BALDE UCAD/ESP/GCBA
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxxii
Exemple 4.12 Considérons par exemple les lancers successifs d’une pièce équilibrée. On note X le numéro du
premier lancer qui amène Pile.
On a vu plus haut que la loi de X était donnée par les relations : pour tout k 2 N ? ; P (X = k ) =
1 , ou encore
2k
par le tableau
f 0 (x) =
(N + 1)xN (x 1) (xN +1 1) 2 = NxN +1 (N + 1)xN + 1
x 1 (x 1)2
d’autre part. Donc
X
N
NxN +1 (N + 1)xN + 1
ixi = x: :
i=1
(x 1)2
1
Pour x = , il vient
2
N i
X 1i = 1 : 2NN+1 (N +1)
2N +1
= 2 2N +1 N (N + 1) + 1 = 2 1 N + 2 :
i=1
2 2 1
4 2N 2N +1
Pour N ! +1, cette quantité tend vers 2. Donc E (X ) existe, et vaut 2.
Valeurs de X x1 x2 x3 : : : xn
P (X = xi ) p1 p2 p3 : : : pn
On suppose que, X a pour espérance le nombre E (X ).
On appelle variance de la variable aléatoire X le réel, noté V (X ), et qui vaut
X
n
V (X ) = p1 (x1 E (X ))2 + p2 (x2 E (X ))2 + + pn (xn E (X ))2 = pi (xi E (X ))2 :
i=1
On appelle écart-type de X le réel, noté (X ),défini par
p
(X ) = V (X )
.
M. BALDE UCAD/ESP/GCBA
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxxiii
Remarque 4.6 La variance et l’écart-type de la variable aléatoire X sont la variance et l’écart-type de la série
statistique discrète X , présentée selon les fréquences p1 ; p2 ; : : : ; pn :
Remarque 4.7 Dans le cas où la variable aléatoire X serait discrète mais prendrait une infinité de valeurs
(xi )i > 1, chacune respectivement avec la probabilité (pi )i > 1, on adopte les définitions suivantes
!
X
V (X ) = ++1i=1 pi (xi E (X )2
si cette dernière quantité est finie. Ce nombre généralise alors celui retenu dans la définition précédente.
On adopte la même convention que plus haut : si(xi )i > 1 est une suite de réels,
+1
X X
N
ui := N !
lim+1 ui
i=1 i=1
È
Par ailleurs, on pose toujours (X ) = V (X ).
Exemple 4.13 Considérons par exemple les lancés successifs d’une pièce équilibré. On note X le numéro du
premier lancer qui amène Pile.
On a vu plus haut que la loi de X était par les relations : pour tout k 2 N? , P ( X = k ) =
1 , ou encore par le
2k
tableau
2 Donner la fonction de répartition de la variable aléatoire X qui est définie comme étant la somme des
lancers de deux dés traditionnels à 6 faces et équilibrés.
Définition soit X une variable aléatoire continue sur un univers probabilisé. On appelle fonction de répartition
de X la fonction 8
<R ! R
FX : :
t 7! FX (t) = P (X 6 t)
– FX R;
est définie sur
– Pour tout t 2 R; 0 6 FX (t) 6 1 ;
– Fx est une fonction croissante sur R ;
– lim FX (t) = 0 et t!lim
t! 1
F (t) = 1
+1 X
– Fx est une fonction constante par morceaux sur R et sa représentation présente des sauts sur les valeurs
de X , dont la hauteur traduit la loi de X .
Remarque 4.10 Il y a une analogie entre la courbe des fréquences cumulés croissants d’une série statistique
discrète et la fonction de répartition d’une variable aléatoire discrète.
Les propriétés de l’une et de l’autre sont identiques (voir ci-dessus), ainsi que leurs formes, même si le rapport
entre variables aléatoires et séries statistiques est encore à préciser.
Remarque 4.11 Pour une variable aléatoire discrète, il est équivalent de connaître sa loi, ou sa fonction de
répartition : la proposition précédente explique comment obtenir l’une à partir de l’autre (les discontinuités de
la fonction de répartition correspondant exactement à la loi de la variable aléatoire).
M. BALDE UCAD/ESP/GCBA
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxxv
Espérance et variance Théorème Soit X une variable aléatoire suivant une loi de Bernoulli. Alors on a :
E (X ) = p et V (X ) = pq, où q = 1 p
Sommes de variables aléatoires suivant une loi de Bernoulli Théorème Soient X1 ; X2 ; : : : Xn ; n va-
riable aléatoires indépendantes suivant une loi de Bernoulli de paramètre p. On considère la variable aléatoire
Z = X1 ; +X2 ; + + Xn . Alors :
Exemple 4.14 Le clan mafieux (”Canal Historique”) de César Angéli avait la main sur le trafic de pastis
frelaté, mais les descentes de police ont eu raison de la plupart de ses hommes, aujourd’hui emprisonnés sur le
Continent. Charli Pasquadi, le chef du clan rival (”Canal Postaga”) en a profité, et commence à concurrencer
dangereusement les affaires de César Angéli.
Décidé à ne pas perdre la force, ce dernier propose 10 ”contrats” à Raoul Volfini, alias ”Raoul-la-Gachette ” pour
décimer le clan Pasquali (10 ”contrats”, un par mois, mais pas en été, car il fait tés chaud à l’île de Beauté).
Ce tueur à gage est surtout un tueur à la gomme, car, en homme d’honneur, il n’utilise pas les explosifs pour
réaliser ses ”contrats” : il préfère les méthodes traditionnelles d’embuscade dans le maquis. Mais comme son chef
César Angéli, Raoul a vieilli en même temps que ses méthodes, et aujourd’hui on estime à 0; 2 sa probabilité
de ”descendre” une cible lors d’une tentative d’assassinat.
César Angéli a par ailleurs été formel : il ne doit pas y avoir plus d’une tentative d’assassinat sur chaque tête
M. BALDE UCAD/ESP/GCBA
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxxvi
du clan Pasquali, il faut pouvoir faire croire à des ”accidents”. Par ailleurs, les tentatives de Raoul-la-Gachette
sont couronnés de succès ou non, mais toujours indépendamment les unes des autres.
On note X le nombre de ”contrats” que Raoul sera en mesure d’honorer cette année pour le compte de César
Angéli. Ce dernier brutalement soucieux à l’heure de la sieste, ne parvient pas à trouver le sommeil, et convoque
ses meilleurs amis, pour connaître :
– La probabilité de chacune des valeurs de X
– La rentabilité de Raoul, c’est-à-dire le nombre moyen de ”contrats” qu’il sera en mesure d’honorer cette
année ;
– La probabilité de réussir strictement moins de 2 assassinats, ce qui ridiculiserait le ”Canal Historique” du
vieux César Angéli aux yeux du ”Canal Postaga” de Charly Pasquali (qui préfère, lui, les explosifs... et
n’hésiterait pas à s’en servir si d’aventure le ”Canal Historique” s’avérait très affaibli). Aidez-vous César
Angéli à profiter enfin de sa une sieste réconfortante ?
Réponse : Pour répondre aux questions de César Angéli, notons X1 la variable aléatoire qui vaut 1 si Raoul
réussit sa i-ème tentative d’assassinat, et 0 sinon.
Le nombre total de ”contrats” remplis par Raoul est alors X = X1 + X2 + ::: + X10 .Chaque variable aléatoire
X1 est une variable de Bernoulli de paramètre p = 0; 2, et les X1 sont supposées indépendantes entres elles.
Donc X suit une loi Binomiale, de paramètre 10 et 0; 2. On a donc X B (10; 0; 2), ce qui signifie que pour
tout k = 0; 1; :::; 10, on a
P (X = k) = C10
k
(0; 2)k (0; 8)10 k
Nous pouvons donc présenter au chef du ”Canal Historique” les probabilités des diverses valeurs de X (arrondies
à 10 3 près) :
Valeurs de X 0 1 2 3 4 5 6 7 8 9 10
Probabilités 0; 107 0; 268 0; 302 0; 201 0; 088 0; 026 0; 006 0; 001 0 0 0
Le nombre moyen de contrats assurés par Raoul est E (X ) = 10 0; 2 = 2. En fin, la probabilité pour le ”Canal
Historique” de César Angéli de se ridiculisai en assurant strictement moins de 2 assassinats est
P (X < 2) = P (X = 0)u(X = 1) = P (X = 0) + P (X = 1) ' 0; 375
car les événements (X = 0) et (X = 1) sont incomparables. César Angéli peut être légitimement inquiet, mais
son rival Charly Pasquali n’a pas encore la main sur le marché du pastis corse de contrebande !
Définition 4.1 Soit > 0. On appelle loi de Poisson de paramètre la loi notée P () d’une variable aléatoire
X discrète prenant toutes les valeurs entières naturelles (0; 1; 2; 3; :::etc), avec
pour tout k entier,
k
P (X = k) = e :
k!
M. BALDE UCAD/ESP/GCBA
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxxvii
Exemple 4.15 Dans une entreprise, on estime que la probabilité pour un article fabriqué d’être défectueux est
de p = 0; 05 (Cette valeur a été obtenue en accumulant une grande série de tests). On prélève dans un stock de
80000 pièces 120 articles. On s’intéresse au nombre d’articles défectueux dans l’échantillon prélevé.
hypothèses Bien que le choix des articles prélevés se passe sans remise, on considère que le stock contient
suffisamment d’articles pour que l’on puisse assimiler ce prélèvement à un tirage avec remise.
Ceci revient à formuler l’hypothèse que le prélèvement de 120 articles sur les 80000 ne modifie pratiquement
pas la composition global du stock.
Modélisation Sous les hypothèses précédentes, tout se passe comme si l’on procédé à l’expérience suivante : On
retire du stock un article, on le teste, on relève s’il est conforme ou non, et on le remet dans le stock. On prélève
alors une autre pièce, on la teste, et on le remet, etc.L’expérience est donc une série d’épreuves de Bernoulli, et
on s’intéresse au nombre d’échecs relevés dans la série.
Ainsi, si X est la variable aléatoire égale au nombre d’articles défectueux sur la série de 120 prélèvements, on peut
affirmer que X suit une loi Binomiale de paramètres n = 120, et p = 0; 05. De plus, E (X ) = np = 120 0; 05 = 6.
Loi binomiale, ou loi de Poisson ? Observons les probabilités approchées des diverses valeurs de X (suivant une
binomiale B (120; 0; 05)), et Y (suivant une poisson P (6) :
k 0 1 2 3 4 5 6 7 8 9 10 11 12
P (X = k) 0; 002 0; 013 0; 041 0; 087 0; 134 0; 163 0; 165 0; 141 0; 105 0; 069 0; 040 0; 021 0; 010
P (Y = k) 0; 002 0; 015 0; 045 0; 089 0; 134 0; 161 0; 161 0; 138 0; 103 0; 069 0; 041 0; 023 0; 011
On constate que les lois de X et de Y sont finalement assez proches.
On peut donc considérer que X et Y suivent pratiquement la même loi, et donc que l’on peut estimer que X
suit pratiquement une loi de Poisson de paramètre 6.
Theorème 4.1 Soit 0 6 p 6 1, et n2 N. Soit X une variable aléatoire suivant une loi binomiale de
paramètres n et p. Si n est ”assez grand”, si p est ”assez petit” et si np n’est ”pas trop grand”, alors on
peut raisonnablement considérer que X suit une loi de Poisson de paramètre = E (X ) = np.
Remarque 4.12 Conditions usuelles d’application du théorème sur les valeurs de n et p : pour que ce théorème
soit applicable, autrement dit pour réaliser une assez bonne approximation de X B (n; p) par X P (np),
on doit se trouver dans le cas :
M. BALDE UCAD/ESP/GCBA
Chapitre 4. Variables aléatoires réelles discrètes.Lois fondamentales xxxviii
n p np
Situation 1 n > 30 p 6 0; 1 np 6 15
Situation 2 n > 50 p 6 0; 1 np 6 10
Remarque 4.13 On notera que si X suit une B (n; p), on a E (X ) = np, et que V (X ) = np(1 p).
Si l’on réalise une approximation de X par Y suivant une loi de Poisson P (), il faut-au moins-faire en sorte que
cette dernière variable aléatoire ait une espérance et une variance proches de celles de X . Comme par ailleurs
E (Y ) = , on choisit = E (Y ) = E (X ) = np. On constate alors que V (Y ) = = np ' np(1 p) si l’on
formule l’hypothèse que p est proche de 0.
M. BALDE UCAD/ESP/GCBA
Chapitre 5
Variables aléatoires réelles continues. Lois
fondamentales
Exemple 5.1 On choisit au hasard un point sur le segment [0; 2] de la droite réelle. On note X la valeur
obtenue. L’univers de cette expérience aléatoire est l’intervalle [0; 2], et la variable aléatoire X est évidemment
à valeurs dans [0; 2].
Ici, les valeurs de X possibles sont trop proches les unes des autres (en fait, infiniment proche) et on ne peut
donc pas parler de variables aléatoire discrète.
On dit que X est une variable aléatoire continue. Définition Une variable aléatoire continue est une variable
aléatoire qui prend ses valeurs dans un intervalle de R.
Remarque 5.1 Ainsi, une variable aléatoire continue est une variable aléatoire dont les valeurs possibles sont
(au moins théoriquement) toutes infiniment proche les unes des autres, et dont aucune ne peut être séparée
d’autre valeurs de la variable aléatoire (au moins en théorie).
Exemple 5.2 On mesure la longueurs de tiges métalliques immédiatement après leur production. On note X
le résultat de l’expérience aléatoire qui consiste à faire correspondre à une tige choisie au hasard sa longueur.
Il s’agit d’une variable aléatoire définie sur l’univers formé de l’ensemble des tiges, à valeur dans [0; +1[, donc
à valeurs réelles. Dans la mesure où les longueurs possibles peuvent être (au moins théoriquement)infiniment
proches les unes des autres, la variable aléatoire X est continue.
xxxix
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xl
Exemple 5.3 On choisit au hasard un point sur le segment [0; 2]de la droite réelle. On note X la valeur obtenue.
On a déjà vu que X était une variable aléatoire continue.
Cherchons à donner la loi de X. Nous pouvons supposer que la situation est un cas d’équiprobabilité (il n’y
a pas de raison de choisir un point particulier plutôt qu’un autre). Dans les cas d’équiprobabilité, on a vu en
probabilité que l’on a
P (A) =
Nombre de cas favorables
Nombre de cas possibles
pour tout événement A.
Considérons ici l’événement A = r. Nous pouvons estimer que la probabilité de choisir un point r particulier
de [0; 1] est donner par
P (r) =
0
+1
En nous inspirant de la formule précédente. Mais les règles habituelles sur les limites conduisent à penser
que la seule valeur raisonnable que l’on peut donner à ce quotient 0.
Donc pour tout r 2 [0; 2], on a P (r) = 0. autrement dit, la probabilité de choisir 0 est nulle, celle de choisir 1
1 1
est nulle, tout comme celle de ou , et de manière générale comme celle de choisir un réel r particulier de
2 3
[0; 1].
En particulier, on peut, pour tout réel t 2 [0; 1] estimer correctement P (X 2 [0; t]), qui vaut aussi P (X 6 t),
puisque X ne pas prendre de valeurs négatives. On a ainsi, en décidant que la probabilité de choix d’un intervalle
est proportionnel à sa longueur :
t 1
P (X 6 t) = = t:
2 2
Autrement dit, on est en mesure de donner l’expression8de la fonction de répartition de la variable aléatoire
8 > 0 si t 6 0
<R ! R >
<
X . Cette fonction est FX : : avec FX (t) =
1 t si 0 6 t 6 2 Ainsi, dans le cas d’une variable
t 7! FX (t) >
> 2
: 1 si 1 6 t
aléatoire continue, on ne peut pas connaître la loi de la variable, mais on peut en connaître la fonction de la
répartition... C’est donc sur elle que nous allons nous appuyer pour connaître la variable aléatoire de X.
Définition 5.1 Soit X une variable aléatoire continue sur un univers probabilisé. On appelle fonction de répartition
de X la fonction
8
<R ! R
FX : :
t 7! FX (t) = P (X 6 t)
M. BALDE UCAD/ESP/GCBA
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xli
Remarque 5.2 Par définition, pour tout t 2 R; FX (t) = P (X 2] 1; t]). Les principales propriétés d’une
fonction de répartition sont les mêmes que celles obtenues dans le cas discret. Rappelons-les pour mémoire :
Proposition La fonction de répartition FX d’une variable aléatoire continue X a les propriétés suivantes :
Définition 5.3 Soit X une variable aléatoire absolument continue sur un univers probabilisé. On appelle
densité de X la fonction FX0 sur R.
Expliquons à présent comment la connaissance de la densité d’une variable aléatoire X absolument continue
permet de connaître la loi de X :
Théorème Soit X une variable aléatoire absolument continue sur un univers probabilisé. Soient a et b deux
réels. On note FX la fonction de répartition de X , et fX sa densité. Alors on a :
fx = FX0
et
Z b
P (x 2 [a; b]) = P (x 2]a; b[) = P (X 2 [a; b[) = P (x 2 [a; b[) = fX (t)dt;
a
M. BALDE UCAD/ESP/GCBA
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xlii
Notons que cette limite n’est pas nécessairement un nombre réel fini, et que donc la précaution prise plus haut
n’est pas seulement oratoire, comme le montre les deux exemples suivants.
8
< 1=x2 si x 2= [ 1; 1]
Exemple 5.4 Soit f : R ! R la fonction définie par la relation fX =
: 1six 2 [ 1; 1]
Fig-Allure d’une fonction de densité de probabilité
Fig- La fonction de densité fX de X détermine la loi de X
A < 1 et B > 1 deux réels. Alors on a :
Z Z1 Z1 Z Z1
B
f (x)dx = f (x)dx + f (x)dx +
B
f (X )dx =
1 dx + Z 1 dx
A A 1 1 A x2 1
Z1 Z1 ZB
= x12 dx + dx + 1 dx
A 1 1 x2
x= 1 x=B
= 1 + [x]x=1 + 1
x x=A x= 1 x x=1
= 1 + A1 + 2 + B1 + 1
=4+ 1 + 1 A B
Comme lim lim 4 + 1 + 1 = 0, on a donc lim lim Z B f (X )dx = 4, et donc cette (double) limite
A! 1 B !+1 A B A! 1 B !+1 A
existe et est finie. On peut donc écrire
Z +1
f (X )dx = 4:
1
Fig-Courbe représentative de la fonction de l’exercice 46
n
Exemple 5.5 Soit f : R ! R la fonction définie par la relation fX = 1=jxjsix 2= [ 1; 1]1six 2 [ 1; 1] .Soient
Z Z1 Z1 Z Z1
B
f (x)dx = f (x)dx + f (x)dx +
B
f (X )dx =
1 dx + Z 1 dx + Z B 1 dx = [ ln( x)]x= 1 + [x]x=1 + ln(x)
x=a x= 1
A A 1 1 A x 1 x 1
Z B
Comme lim lim 2+ln( A)+ln(B ) = +1, on a donc A!lim1 B!lim+1
A! 1 B !+1
f (x)dx qui est une quantité infinie,
Z +1 A
f (x)dx n’a donc pas de sens. Courbe représentative de la
et qui donc n’est pas un réel fini. L’écriture
1
fonction de l’exercice Proposition Soit X une variable aléatoire absolument continue, de densité fX . Alors
les propriétés de fX sont les suivantes :
M. BALDE UCAD/ESP/GCBA
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xliii
Définition 5.6 Soit X une variable aléatoire absolument continue sur un univers probabilisé, admettant une
variance V (X ). On appelle écart-type de X le réel, noté X ; défini par la relation
È
X = V (X ):
Définition 5.8 On appelle loi Normale de paramètres m 2 R et > 0 la loi d’une variable aléatoire continue
X prenant toutes les valeurs réelles, de densité de probabilité la fonction
1 1 x m 2
fX (x) = p e 2 :
2
On note X N (m; ):
Remarque 5.6 On a donc en clair, pour tous a 6 b réels,
Z
P (a 6 X 6 b) = p
1 b
e
1 x m 2 dx:
2 a 2
Définition 5.9 La loi N (0; 1) est appelée loi Normale centrée et réduite. Sa densité est p1 e x2
2 :
2
Définition 5.10 Si X est une variable aléatoire suivant une loi Normale, X est dite variable aléatoire gaussienne.
Si la loi de X est en plus centrée et réduite, on dit que X est une variable aléatoire gaussienne, centrée et réduite.
M. BALDE UCAD/ESP/GCBA
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xliv
Tables de la loi Normale Seule la table des valeurs de la loi N (0; 1); et pour être précis, celle de sa fonction de
répartition q(t) sur laquelle nous allons revenir, est utile, ainsi que nous le verrons au cours de ce paragraphe.
Notons toutefois que, à la différence de la loi exponentielle que nous aborderons au paragraphe suivant,une
calculatrice ne permet pas de calculer simplement les valeurs prises par la fonction (de deux variables)
Zb
(a; b) 7 ! p1 e
1 x m 2 dx;
2 a 2
ce qui explique qu’en pratique, on ne peut guète se dispenser de cette table (même si les ordinateurs actuels
permettent de calculer les valeurs figurant dans cette table, avec une bonne précision ; les logiciels spécifiques
sont tout de même encore difficiles d’accès...)
Définition 5.11 On note q la fonction de répartition d’ une variable aléatoire suivant une loi N (0; 1). On a
donc
Exemple 5.6 La production de poutres métalliques de longueur théorique 2 mètres ne fait pas toujours de
manière exacte ; un certain nombre de défaut de production sont susceptibles d’influer sur la longueur réellement
obtenue en fin d’usinage de la pièce. Ainsi, si on note X la variable aléatoire qui,à chaque poutre produite, associe
M. BALDE UCAD/ESP/GCBA
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xlv
sa longueur réelle, on peut admettre que X suit une loi Normale de paramètres (2; 0; 01):
Ceci signifie concrètement que, lors d’étude statistiques, l’observation d’un grand nombre de pièces produites
a conduit à une moyenne observée de 2 mètres, avec un écart-type de 0; 01 mètre. On voudrait déterminer la
probabilité d’avoir X 2 [1; 98; 2; 02]:
X m
On commence par centrer la variable aléatoire X , et on considère la variable aléatoire X ? := ; dont on
sait qu’elle suit une loi Normale N (0; 1):
On a alors
(1; 98 6 X 6 2; 02) = 1; 98 m 6 X m 6 2; 02 m = ( 2 6 X ? 6 2)
car m = 2; et = 0; 01: On a donc P (X 2 [1; 98; 2; 02]) = P (1; 98 6 X 6 2; 02) = P ( 2 6 X ? 6 2). Mais
comme X ? N (0; 1); on a
P (X 2 [1; 98; 2; 02]) = P ( 2 6 X ? 6 2) = 2 q (2) 1 ' 2 0; 9772 1 ' 0; 9544:
Exemple 5.7 On voudrait estimer, sous les mêmes hypothèses, la probabilité que X 2 [1; 99; 2; 01]: On applique
la même méthode, et on commence par centrer et réduire la variable aléatoire X : on considère la variable
X m
aléatoire X =?
; dont on sait qu’elle suit une loi Normale N (0; 1):
On a alors
(1; 99 6 X 6 2; 01) = 1; 99 m 6 X m 6 2; 01 m = ( 2 6 X ? 6 2);
car m = 2; et = 0; 01: On a donc P (X 2 [1; 99; 2; 01]) = P (1; 99 6 X 6 2; 01) = P ( 1 6 X ? 6 1). Mais
comme X ? N (0; 1); on a
P (X 2 [1; 99; 2; 01]) = P ( 1 6 X ? 6 1) = 2 q (1) 1 ' 2 0; 8413 1 ' 0; 6826:
Exemple 5.8 On voudrait estimer, sous les mêmes hypothèses, la probabilité que X 2 [1; 97; 2; 03]: On applique
la même méthode, et on commence par centrer et réduire la variable aléatoire X : on considère la variable
X m
aléatoire X :=
?
; dont on sait qu’elle suit une loi Normale N (0; 1):
On a alors
(1; 97 6 X 6 2; 03) = 1; 97 m 6 X m 6 2; 03 m = ( 2 6 X ? 6 2)
car m = 2, et = 0; 01: On a donc P (X 2 [1; 97; 2; 03]) = P (1; 97 6 X 6 2; 03) = P ( 3 6 X ? 6 2). Mais
comme X ? N (0; 1); on a
P (X 2 [1; 97; 2; 03]) = P ( 3 6 X ? 6 3) = 2 q (3) 1 ' 2 0; 99865 1 ' 0; 9973:
Exemple 5.9 On voudrait estimer, sous les mêmes hypothèses, la probabilité que X 2 [1; 99; 2; 03]: On applique
la même méthode, et on commence par centrer et réduire la variable aléatoire X : on considère la variable
X m
aléatoire X :=
?
; dont on sait qu’elle suit une loi Normale N (0; 1):
On a alors
(1; 99 6 X 6 2; 03) = 1; 99 m 6 X m 6 2; 03 m = ( 2 6 X ? 6 2)
M. BALDE UCAD/ESP/GCBA
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xlvi
carm = 2; et = 0; 01: On a donc P (X 2 [1; 99; 2; 03]) = P (1; 99 6 X 6 2; 03) = P ( 1 6 X ? 6 2). Mais
comme X ? N (0; 1); on a
P (X 2 [1; 99; 2; 03]) = P ( 1 6 X ? 6 3) = q(3) q( 1) = q(3) (1 q(1) = q(3) + q(1) 1 =' 0; 99865 + 0; 8413 1 ' 0; 8
Espérance et variance Théorème Soit soit X une variable aléatoire gaussienne suivant une loi Normale
N (m; ): Alors
E (X ) = m; V (X ) = 2 et X =
Une application de ce résultat est la démonstration du théorème 47 : Preuve J En admettant le point délicat de
ce théorème (le fait que la transformation affine d’une variable gaussienne soit encore gaussienne), nous pouvons
utiliser les résultats généraux, démontrés plus haut, sur l’expérience et la variance (ou l’écart-type)d’une variable
aléatoire :
– d’une part, ma X + b = E (aX + b) = aE (X ) + b = am + b ;
– d’autre part, a X + b = jajX
.I La loi Normale comme loi limite de lois Binomiales Il est parfois intéressant d’utiliser, dans un but de
simplification, les lois Normales, comme des lois limites de variables aléatoires suivant une loi Binomiale. L’étude
de ces approximations fait l’objet du théorème suivants, suivi de remarques intuitivement assez évidentes, qui
ne constituent nullement des preuves de cet important résultat, dont la démonstration supposerait de définir
clairement des outils nouveaux, permettant l’étude de la notion de convergences de sujet de variables aléatoires.
Notons qu’un problème apparaît dans la mise enœuvre de ces approximations, que l’on expose dans l’important
exemple final. Théorème Soit 0 6 p 6 1; et n 2 N: Soit X une variable aléatoire suivant une
00
loi binomiale
de paramètres n et p. Si np et n(1 p) sont ”assez grands”, et si p est ”assez proche de
1
È 2 ; alors on peut
raisonnablement considérer que X suit une loi Normale N np; np(1 p :
Remarque 5.8 Condition usuelles d’application du théorème sur les valeurs de n et p : pour que ce théo-
soit
rème
È applicable,autrement dit pour réaliser une assez bonne approximation de X B (n; p) par X
N np; np(1 p ; on doit se trouver dans les cas :
p np n(1 p)
Situation 1 0; 3 6 p 6 0; 7 np > 15 n(1 p) > 15
Situation 2 0; 3 6 p 6 0; 7 np > 20 n(1 p) > 20
È
Remarque 5.9 On notera que si X B (n; p), on a E (X ) = np, et que X = np(1 p):
suit une
Si l’on réalise une approximation de X par Y suivant une loi Normale N (m; ); il faut - au moins - faire en
sorte que cette dernière variable aléatoire ait une espérance et un écart-type proches deÈceux de X: Comme par
ailleurs E (X ) = m, et que y = , on choisit m = E (Y ) = E (X ) = np, et y = X = np(1 p):
1
L’hypothèse 00 p est assez proche de ” se justifie aussi bien sur le plan intuitif. En effet, la loi Normale N (m; )
2
admet, pour toutes valeurs de m et , une fonction de répartition parfaitement symétrique ; elle ne peut
approcher correctement la fonction de répartition d’une loi Binomiale que si celle-ci est elle-même relativement
symétrique. Cette dernière condition impose une valeur de p la plus proche possible de :
1
2
Ainsi qu’on l’a annoncé plus haut, la mise en œuvre concrète des approximations énoncées ci-dessus pose
quelques difficultés, que nous signalons par l’étude de deux exemples éclairants. Elles sont dues au fait qu’il
s’agit de réaliser l’approximation d’une loi discrète par une loi continue (au contraire de l’approximation d’une
loi Binomiale par une loi de poisson, qui constituait l’approximation d’une loi discrète par une loi discrète).
M. BALDE UCAD/ESP/GCBA
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xlvii
Exemple 5.10 Soit X une variable aléatoire discrète, suivant une loi Binomiale B 50;
1 : Les conditions
2
d’approximation de la loi de X
par une loi Normale sont remplies, et l’on peut donc raisonnablement considérer
que X suit la loi Normale N 25; p5 :
2
Evaluons maintenant P (24 6 X 6 26) de deux manières différentes :
– de manière exacte,
24
P ((24 6 X 6 26) = P (X = 24) + P (X = 25) + P (X = 26) = C50
1 1
25 26 1 1 24 1 1 1
224 22 6 + C50 225 225 + C50 226 224 = 250 (C50 +
–
5
en utilisant l’approximation de la loi de X par une N 25; p ; et le fait que 2
p X 25
suit une loi
2 5
Normale N (0; 1) (car centrée et réduite),
p p
24 25 p X 25 p 26 25
P (24 6 X 6 26) = P 2
5 6 2 5 6 2 5 = 2 q 52 1 ' 0; 2227:
Il apparaît donc un important décalage entre les calculs réalisés (erreur relative de l’ordre de 33%). Pour
retrouver des résultats cohérents, nous remarquons que P (24 6 X 6 26) =P (23; 56 X 6 26; 5) (en loi exacte
5 p X 25
discrète), et utilisons l’approximation en loi Normale de X suivant une N 25; p ; et le fait que 2
2 5
suit une loi Normale N (0; 1) (car centrée et réduite),
p
P (23; 5 6 X 6 26; 5) = P 2
23; 5 25 6 p2 X 25 6 p2 26; 5 25 = 2 q 1p; 5 5 1 ' 0; 3286:
5 5 5 2
Cette fois-ci, les évaluations exactes et approchées par une loi normale correctement employée de P (24 6 X 6
26) coïncident autour de 0; 328; avec une erreur de l’ordre de 4:10 4 (erreur relative de l’ordre 0; 2%).
L’exemple suivant cerne la difficulté d’ encore plus près, et montre clairement la position de l’erreur à ne pas
commettre lorsque l’on approche une loi discrète par une loi continue, en se plaçant dans un cas extrême, qu’il
faudra constamment garder à l’esprit.
Exemple 5.11 Soit X une variable aléatoire discrète, suivant une loi Binomiale B 50;
1 : Les conditions
2
d’approximation de la loi de X
par une loi Normale sont remplies, et l’on peut donc raisonnablement considérer
que X suit la loi Normale N 25; p5 :
2
Evaluons maintenant la probabilité limite P (X = 25) de deux manières différentes :
– de manière exacte,
1 1 1
225 225 = C50 250 ' 0; 1122;
25
P (X = 25) = C50 25
– en utilisant l’approximation en loi Normale de X; P (24; 5 6 X 6 25; 5) (en loi exacte discrète), et utiliser
l’approximation en loi Normale de X ,
p
24; 5 25 p X 25 p 25; 5 25
1 ; 5
P (24; 5 6 X 6 25; 5) = P 2
5 6 2
56 2
5 = 2 q p 10 1 ' 0; 1125:
2
Cette fois-ci, les évaluations exactes et approchées par une loi normale correctement employée de P (X = 25)
coïncident avec une erreur de l’ordre de 3:10 4 (erreur relative de l’ordre 0; 3%).
Définition 5.12 On appelle loi exponentielle de paramètre > 0 la loi d’une variable aléatoire continue X
prenant toutes les valeurs réelles positives, de densité de probabilité la fonction
M. BALDE UCAD/ESP/GCBA
Chapitre 5. Variables aléatoires réelles continues. Lois fondamentales xlviii
8
< 0 si x<0
fX (x) = :
e x si x > 0
On note X "():
Remarque 5.10 On a donc en clair, pour tous a 6 b réels,
8 Z b
>
> 0:dx = 0 a6b<0
>
>
si
< Za b
P (a 6 X 6 b) = > e x dx = 1 e b
si a606b
>
> Z0 b
>
: e x dx = e a
e b
si 0 < a 6 b:
0
La fonction de répartition associée à une variable aléatoire suivant une loi exponentielle est donc la fonction
8
< 0 si x<0
FX (x) = :
1 e x
si x>0
Remarque 5.11 Attention à la confusion entre la loi exponentielle et la loi de Poisson : la loi continue (Ex-
ponentielle) et la loi discrète (de Poisson) ont un rapport, mais il n’est pas complètement immédiat (à part le
paramètre, et la présence d’une exponentielle) ! Espérance et variance þéorème Soit X une variable aléatoire
continue suivant une loi Exponentielle de paramètre > 0: Alors X admet une espérance, une variance et un
écart-type, qui sont données par les relations
1
E (X ) = ; V (X ) = 2
1 et X = 1 :
M. BALDE UCAD/ESP/GCBA