Académique Documents
Professionnel Documents
Culture Documents
Cours Statistique 2020 2021
Cours Statistique 2020 2021
1
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
https://myfsth.wordpress.com -2-
Chapitre 1
1.1 Généralités
La statistique désigne l’ensemble des méthodes ou des techniques consistant à
collecter des données, à les traiter, les analyser et à les interpréter afin de tirer des
conclusions et prendre des décisions dans les situations d’incertitudes.
La statistique s’applique à la plupart des disciplines : agronomie, biologie, démogra-
phie, économie, sociologie,... On distingue deux catégories, la statistique descriptive
et la statistique inférentielle :
1. L’objectif de la statistique descriptive est de résumer et synthétiser l’informa-
tion contenue dans les données étudiés afin d’en déduire un certain nombre
de propriétés. On utilise à cette fin, des tableaux, des graphiques et on calcule
certains indicateurs ou caractéristiques.
2. Le but de la statistique inférentielle consiste à extrapoler à partir d’un échan-
tillon (une partie restreinte) de la population à étudier, le comportement de
la population dans son ensemble. En d’autre terme, elle généralise à une po-
pulation toute entière des propriétés constatées sur un échantillon. On peut
citer comme exemples, les sondages, les contrôle de qualité, ....
Remarque 1.1. La statistique descriptive ne s’applique que si les données ont été collectées
sur toute la population, alors que pour la statistique inférentielle ça ne concerne qu’un échan-
tillon de la population. On se limitera dans ce cours à la statistique descriptive seulement.
1.2 Vocabulaire
Population : ensemble des éléments sur lesquels porte l’étude ou l’activité sta-
tistique. Cet ensemble est généralement noté Ω.
( Étudiants, entreprises, plantes, pièces, produits,...).
Individu (ou unité statistique) : chaque élément de la population.
(Un étudiant, une plante, une pièce, un homme, une femme,...).
Échantillon : sous-ensemble issu de la population.
3
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Variable : caractère (ou propriété) mesuré ou observé sur chaque individu notée
X, Y,...(Note, taille, poids, sexe, âge, couleur,...).
Modalités : les différentes valeurs possibles que peut prendre une variable sta-
tistique.
Série statistique : suite de valeurs prises par une variable X notées x1 , x2 , x3 , ...
Variable quantitative : ses modalités sont mesurables ou repérables.
Variable quantitative discrète : ses seules valeurs possible sont des nombres
isolée. (Nombre d’enfants, nombre d’ouvriers, nombre de pièces, ...).
Variable quantitative continue : ses valeurs possible sont en nombres infini
et a priori quelconques dans un intervalle. (Age, poids, diamètre d’une
pièce, température, vitesse,...).
Variable qualitative : ses modalités ne sont pas mesurables (profession, couleur,
numéro de telephone,...).
Variable qualitative nominale : ses modalités ne peuvent pas être ordon-
nées. (Couleur, profession, sexe, groupe sanguin,...).
Variable qualitative ordinale : ses modalités peuvent être ordonnées.(Chemises
classées par taille : XS, S, M, L, XL, XXL, XXXL).
Remarque 1.2. 1. Les caractères qualitatifs peuvent toujours être transformés en quan-
titatifs par codage. Exemple Masculin : 1, Féminin : 2. C’est ce qui se fait le plus géné-
ralement. Mais un tel codage est purement conventionnel et effectuer des opérations
algébriques sur ces valeurs numériques n’a pas de sens.
2. Certains caractères qualitatifs s’expriment à l’aide des nombres, mais ils n’ont pas de
sens quantitatif (Exemple : numéro de téléphone).
https://myfsth.wordpress.com -4-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
modalités xi x1 x2 x3 ... xk
effectifs ni n1 n2 n3 ... nk
effectifs cumulés N N − n1 N − n1 − n2 ... N − n1 − n2 + ... − nk−1
décroissants N i = N1 = N2 = N3 ... Nk = nk
La fréquence cumulée décroissante Fi :
N1
F1 = 1 = ,
N
N2
F 2 = 1 − f1 = ,
N
N3
F 3 = 1 − f1 − f2 = ,
N
..
.
Nk
Fk = 1 − f1 − f2 − ... − fk−1 = .
N
https://myfsth.wordpress.com -5-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
La série statistique (xi , ni )1≤i≤k ou (xi , fi )1≤i≤k est appelée distribution statistique dis-
crète.
Exemple 1.
Un quartier est composé d’une population de 50 ménages, et la variable X représente
le nombre de personnes par ménage. Les valeurs ordonnées de X sont :
1111122222222233333333333
3333444444444455555566688
Tableau statistique
Représentation graphique
https://myfsth.wordpress.com -6-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
https://myfsth.wordpress.com -7-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Courbe Cumulative
La courbe cumulative ou courbe des fréquences cumulées de la distribution (xi , fi )1≤i≤k
est la courbe représentative de la fonction F : R → [0, 1] définie par
0 si x < x1
Pi
F (x) = Fi = fj si xi ≤ x < xi+1
j=1
1 si x ≥ xk .
https://myfsth.wordpress.com -8-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
https://myfsth.wordpress.com -9-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Cas d’amplitudes inégales. Lorsque les classes sont d’amplitudes inégales, les effec-
tifs ou fréquences ne permettent pas d’apprécier la distribution du caractère (ainsi la
fréquence d’un intervalle "étroit" ne peut pas être directement comparée à celle d’un
intervalle dix fois plus large !).
On ramène toutes les classes à une largeur standard, en calculant par proportionna-
lité les effectifs corrigés ou bien les fréquences corrigées correspondantes.
Soit a l’amplitude standard (choisis librement). Si la classe numéro i a pour effectif
ni et une fréquence fi et une amplitude ai alors
ni
— L’effectif corrigé de la classe est n∗i = ×a
ai
https://myfsth.wordpress.com -10-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
fi ni n∗
— La fréquence corrigée de la classe est fi∗ = ×a= ×a= i.
ai ai N N
On définit la densité d’effectifs d’une classe d’amplitude ai et d’effectif ni par
ni
di = .
ai
En générale on se contente de calculer soit la densité d’effectifs soit les effectifs cor-
rigés et pas les deux.
Exemple. Considérons la série statistique définie par le tableau suivant :
Classes [100,110[ [110, 120[ [120, 125[ [125, 130[ [130, 140[ [140,160[
Effectifs 12 24 20 22 14 8
Les effectifs se rapportant à des classes d’amplitudes inégales ne sont pas directe-
ment comparable. On doit donc corriger ces effectifs
Classes Effectifs Amplitude densité effectifs Fréquence
ni ai di corrigé n∗i corrigée fi∗
[100, 110[ 12 10 1.2 12 0.12
[110, 120[ 24 10 2.4 24 0.24
[120, 125[ 20 5 4 40 0.4
[125, 130[ 22 5 4.4 44 0.44
[130, 140[ 14 10 1.4 14 0.14
[140,160[ 8 20 0.4 4 0.04
https://myfsth.wordpress.com -11-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
(avec F0 = 0).
https://myfsth.wordpress.com -12-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
MDMCCMCCCMCMVMVDCCMC
Tableau statistique
Diagramme en secteurs
Chaque modalité xi est représentée par un secteur dont l’aire est proportionnelle à
la fréquence :
αi◦ = 360◦ × fi .
Sd Sd Sd Sd P P P P P P P P P P P Se Se Su
Se Se Se Se Se Se Se Se Se Se Se Se Su Su Su
Su Su Su Su U U U U U U U U U U U U Su
https://myfsth.wordpress.com -13-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
https://myfsth.wordpress.com -14-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
La classe modale est [5.51, 5.71[ et pour déterminer le mode, on utilise la formule
suivante :
d1
M0 = ei−1 + ai ,
d1 + d2
où ai = ei − ei−1 est l’amplitude de la classe modale [ei−1 , ei [,
d1 = ni − ni−1 et d2 = ni − ni+1 ou bien d1 = fi − fi−1 et d2 = fi − fi+1 .
ni et fi sont l’effectif et la fréquence de la classe modale.
ni−1 et fi−1 sont l’effectif et la fréquence de la classe qui précède la classe modale.
ni+1 et fi+1 sont l’effectif et la fréquence de la classe qui suit la classe modale.
Le mode Mo est déterminé par l’intersection des droites représentés dans la figure
suivante.
On a ei−1 = 5.51 la borne inférieur de la classe modale [5.51, 5.71[ et son amplitude
est ai = 5.71 − 5.51 = 0.2.
d1 = 0.3 − 0.15 = 0.15 et d2 = 0.3 − 0.15 = 0.15. D’où
0.15
Mo = 5.51 + .0.2 = 5.51 + 0.1 = 5.61.
0.15 + 0.15
Exemple
https://myfsth.wordpress.com -15-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Classes Effectifs
[0, 5[ 50
[5, 10[ 150
[10, 20[ 200
[20, 30[ 40
[30, 50] 60
Les classes sont d’amplitude inégales. On commence d’abord par calculer les effectifs
corrigés ou calculer les densités. Attention la classe modale n’est pas [10, 20[ même
si elle a l’effectif maximale !
Classes Effectifs Effectifs corrigés
[0, 5[ 50 10
[5, 10[ 150 30
[10, 20[ 200 20
[20, 30[ 40 4
[30, 50] 60 3
La classe modale est la classe [5, 10[. On applique la formule et on obtient
30 − 10 100
Mo = 5 + .5 = 5 + ≃ 8.33.
(30 − 10) + (30 − 20) 30
La médiane est la valeur qui partage la série statistique supposée rangée par ordre
croissant, en deux groupes de même effectifs.
Dans le cas d’une variable quantitative discrète, la médiane s’obtient en ordonnant
les valeurs dans l’ordre croissant puis :
- si l’effectif N est impair, alors la médiane est la valeur de rang N2+1 ;
- si l’effectif N est pair, alors la médiane est la moyenne des deux valeurs de
rang N2 et N2 + 1.
Exemples.
1. On considère la série statistique
0 0 1 1 2 2 3.
0 0 1 1 2 2 3 4.
https://myfsth.wordpress.com -16-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Les Quartiles
On appelle quartiles d’une série statistique le triplet des nombres (Q1 , Q2 , Q3 ) qui
divise la série en 4 groupes de même effectif. C’est-à-dire chaque groupe représente
25% de la population totale.
Le premier quartile Q1 est la plus petite valeur de la variable pour laquelle au moins
un quart des données sont inférieures ou égales à Q1 .
Le troisième quartile Q3 est la plus petite valeur de la variable pour laquelle au
moins trois quarts des données sont inférieures ou égales à Q3 .
Évidement le deuxième quartile Q2 n’est autre que la médiane. Q2 = M e.
Dans le cas d’une variable quantitative discrète, les quartiles s’obtiennent en ordon-
nant les valeurs dans l’ordre croissant puis :
N
- si l’effectif total N est multiple de 4 alors Q1 est la valeur de rang et Q3 est
4
3N
la valeur de rang ;
4
- si l’effectif total N n’est pas multiple de 4 alors Q1 est la valeur de rang immé-
N
diatement supérieur à et Q3 est la valeur de rang immédiatement supérieur
4
3N
à .
4
Remarque 1.4. D’une manière analogue, on appelle déciles d’une série statistique un 9-
uplet (D1 , D2 , ..., D9 ) qui divise la série en dix groupes de même effectifs. C’est-à-dire chaque
groupe représente 10% de la population totale. De plus D5 = Me .
https://myfsth.wordpress.com -17-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Ainsi
- si l’effectif total N est multiple de 10 alors D1 , D2 , ..., D8 , D9 sont les valeurs
N 2N 8N 9N
de rang , , ..., , respectivement.
10 10 10 10
- si l’effectif total N n’est pas multiple de 10 alors D1 , D2 , ..., D8 , D9 sont les va-
N 2N 8N 9N
leurs de rang immédiatement supérieur à , , ..., , respectivement.
10 10 10 10
Exemple. Une étude sur le nombre d’employés dans les commerces du centre d’une
ville a donné les résultats suivants :
Nombre d’employés 1 2 3 4 5 6 7 8
Effectif 11 18 20 24 16 14 11 6
Durée de vie (100h) [12 , 13[ [13 , 14[ [14, 15[ [15 , 16[ [16 , 17[
Effectifs 28 46 65 32 29
Effectifs cumulés croissants 28 74 139 171 200
Q1 − 13 50 − 28 11 310
= ⇐⇒ Q1 = 13 + = ≃ 13.48.
14 − 13 74 − 28 23 23
Calcul de Q2 = Me : On a 2N 4
= 100, la plus petite valeur des effectif cumulés su-
périeur ou égale à 100 est 139. Cette valeur correspond à la classe [14, 15[. Puis par
interpolation linéaire, on obtient
Q2 − 14 100 − 74 26 72
= ⇐⇒ Q2 = 14 + = = 14.4.
15 − 14 139 − 74 65 5
https://myfsth.wordpress.com -18-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Calcul de Q3 : On a 3N4
= 150, la plus petite valeur des effectif cumulés supérieur ou
égale à 150 est 171. Cette valeur correspond à la classe [15, 16[. Puis par interpolation
linéaire, on obtient
Q3 − 15 150 − 139 11 490
= ⇐⇒ Q3 = 15 + = ≃ 15.34.
16 − 15 171 − 139 32 32
Calcul de D3 : On a 3N10
= 60, la plus petite valeur des effectif cumulés supérieur ou
égale à 60 est 74. Cette valeur correspond à la classe [13, 14[. Puis par interpolation
linéaire, on obtient
D3 − 13 60 − 28 16 315
= ⇐⇒ D3 = 13 + = ≃ 13.70.
14 − 13 74 − 28 23 23
Calcul de D9 : On a 9N10
= 180, la plus petite valeur des effectif cumulés supérieur ou
égale à 180 est 200. Cette valeur correspond à la classe [16, 17[. Puis par interpolation
linéaire, on obtient
D9 − 16 180 − 171 4 473
= ⇐⇒ D9 = 16 + = ≃ 16.31.
17 − 16 200 − 171 23 29
La moyenne arithmétique
La moyenne arithmétique x d’une variable quantitative discrète X est la somme pon-
dérée des valeurs possibles par les fréquences :
k k
X 1 X
x= f i xi = n i xi ,
i=1
N i=1
c’est-à-dire encore la somme des observations divisée par l’effectif total de la popu-
lation.
Remarque 1.5. Il existe d’autres moyennes comme la moyenne géométrique, la moyenne
harmonique, la moyenne interquartile ou les moyennes tronquées. Elles sont moins utilisées
car elles sont généralement réservées à des contextes particuliers.
Exemple. Le nombres d’enfants de 20 familles sont les suivants
1 0 2 1 3 2 2 1 0 2 2 2 4 0 1 2 1 2 2 3.
Remarque 1.6. Dans le cas d’une variable quantitative continue X, on convient de calculer
la moyenne de la distribution ([ei , ei+1 [, fi ), 1 ≤ i ≤ p − 1
p−1 p−1
X 1 X
x= f i ci = ni .ci .
i=1
N i=1
ei + ei+1
où ci = est le centre de la classe [ei , ei+1 [.
2
Exemple
la moyenne est
e = xmax − xmin ,
où xmax (resp. xmin ) est la plus grand (res. plus petite) valeur.
Ce paramètre n’est pas défini exactement pour les distributions groupées, les valeurs
extrêmes n’étant plus connues avec exactitude après le groupement en classes.
https://myfsth.wordpress.com -20-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Diagramme en boîte
On construit un diagramme en boîte de la façon suivante :
- les valeurs du caractère sont représentées sur un axe (vertical ou horizontal) ;
- on place sur cet axe, le minimum, le maximum, les quartiles et la médiane de
la série statistique ;
- on construit alors un rectangle parallèlement à l’axe, dont la longueur est l’in-
terquartile et la largeur arbitraire.
Exemple. On donne les notes obtenues à un devoir dans une classe de 27 étudiants :
Notes 2 3 4 6 7 8 9 10 11 12 14 15 16 18 20
Effectifs 2 1 2 1 3 1 2 2 3 2 2 1 1 1 3
Q1 = 7, M e = 10 et Q3 = 14. L’intervalle interquartile est [7,14]. Cela signifie qu’au
moins la moitié des notes sont situées entre 7 et 14.
min Q1 Me Q3 max
0 2 4 6 8 10 12 14 16 18 20
50% 50%
https://myfsth.wordpress.com -21-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
2. Dans le cas d’une variable quantitative continue, la variance (ainsi l’écart type) est définie
de la même manière avec les centres des classes jouent le rôle des valeurs xi .
2+3+4+4+5+6+7+9
x= = 5.
8
22 + 32 + 42 + 42 + 52 + 62 + 72 + 92
V (X) = − 52 = 4.5.
8
Théorème 1.1. Changement d’origine et d’unité) Si X et Y sont deux variables en corres-
pondance par le changement d’origine b (constante) et le changement d’unité a (constante) :
Y = aX + b, alors
Corollaire 1.1. — Si on fait augmenter chaque modalité d’une série de r%, alors la
r
moyenne de cette série se trouve multipliée par (1 + ).
100
— Si on fait diminuer chaque modalité d’une série de r%, alors la moyenne de cette série
r
se trouve multipliée par (1 − ).
100
Exemple. On suppose que la moyenne des notes d’un groupe d’étudiants est x = 10.
Si on augmente chaque note de 15%, cela revient à multiplier chaque note par 1.15.
Donc la moyenne devient y = 1.15x = 11.5.
https://myfsth.wordpress.com -22-
Chapitre 2
23
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
https://myfsth.wordpress.com -24-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
https://myfsth.wordpress.com -25-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
X : 1 1 2 2 2 3 4 5 5 5 6 7 8 8 9 10
Y :4 5 5 3 5 3 4 4 4 6 6 5 9 8 8 7
Remarque 2.1. Dans le cas des données groupées dans un tableau de contingence, en termes
d’effectifs (ou fréquences) on peut écrire
k l k l
1 XX 1 XX
Cov(X, Y ) = nij (xi − x)(yj − y) = nij xi yj − x y,
n i=1 j=1 n i=1 j=1
k l
1 1
P P
où x = n
ni• xi (moyenne marginale de X) et y = n
n•j yj (moyenne marginale de Y )
i=1 j=1
Proposition 2.2.
1) Cov(X, Y ) = Cov(Y, X).
2) Cov(X, X) = V (X).
3) V (X + Y ) = V (X) + V (Y ) + 2Cov(X, Y ).
4) Cov(aX + b, Y ) = aCov(X, Y ), a, b ∈ R.
5) |Cov(X, Y )| ≤ σ(X)σ(Y ).
https://myfsth.wordpress.com -26-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Cov(X, Y )
r(X, Y ) = .
σ(X)σ(Y )
Remarque 2.2.
1. −1 ≤ r(X, Y ) ≤ 1.
2. Si r(X, Y ) = ±1, les points du nuage sont alignées, c’est à dire, il y a une corrélation
linéaire parfaite entre X et Y :
Y = aX + b, a, b ∈ R.
Remarque 2.3. Il convient de prêter attention toute particulière aux unités choisies pour
construire le nuage de points. En effet une unité sur l’un et/ou l’autre des axes écrase ce
nuage et peut laisser croire à un alignement qui n’a pas de sens statistique. Il faut donc faire
en sorte que celui-ci remplisse au mieux la figure quite pour cela à effectuer sur l’un et/ou
l’autre des axes un changement d’origine et/ou d’unité.
Droite de Mayer
L’idée la plus simple consiste à partager l’ensemble des points (xi , yi ) en deux sous-
ensembles E1 et E2 ayant à peu près le même nombre de points. On détermine G1 le
centre de gravité (le point moyen) de E1 et G2 le centre de gravité de E2 . La droite
de Mayer associée au nuage de point est la droite passant par les ponts G1 et G2 .
Exemple Le tableau présente l’évolution du budget publicitaire X et du chiffre d’af-
faire Y d’une société sur les 6 dernière années.
Budget publicitaire (en 104 DH) 8 10 12 14 16 18
Chiffre d’affaire (en 104 DH) 40 55 55 70 75 95
Sot G1 (x1 , y1 ) le point moyen associé au trois premier points du nuages et G2 (x2 , y2 )
le point moyen associé au trois derniers.
8 + 10 + 12 40 + 55 + 55
x1 = = 10 et y1 = = 50.
3 3
14 + 16 + 18 70 + 75 + 95
x2 = = 16 et y2 = = 80.
3 3
Donc G1 (10, 50) et G2 (16, 80). D’où la droite d’ajustement de Mayer (G1 , G2 ).
https://myfsth.wordpress.com -27-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
En supposant que cette evolution reste la même on peut par exemple estimer le
chiffre d’affaire à prévoir pour un budget de 220000 DH. Pour cela soit on utilise
le graphe ou bien l’equation de la droite de Mayer y = 5x. Ainsi pour x = 22, on
trouve y = 110, ce qui veut dire que pour un budget de 220000 DH, le chiffre d’affaire
prévisionnel est 1100000 DH.
On peut aussi estimer le budget publicitaire qu’il faudrait prévoir pour obtenir un
chiffre d’affaire de 1000000 DH. On a pour y = 100, x = 20. Ceci veut dire que pour
un chiffre d’affaire de 1000000 DH, le budget prévisionnel est 200000 DH.
Cette droite, dite droite de régression linéaire, est généralement déterminer par
la méthode des moindres carrés, c’est à dire de manière à rendre minimum la somme
https://myfsth.wordpress.com -28-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
des carrés des distances (comptées parallèlement à (oy)) entre cette droite et chaque
point du nuage.
Elle consiste à minimiser la fonction à deux variables
n
X n
X
φ(a, b) = Mi Hi2 = (yi − axi − b)2 .
i=1 i=1
Le minimum (â, b̂) peut donc être déterminer en annulant les dérivées partielles de
φ. On trouve ainsi (
a = Cov(X,Y
b V (X)
)
bb = y − ba x.
X(cm) 192 165 186 196 171 182 187 176 164 182
Y (Kg) 97 63 70 125 64 75 83 79 50 85
x = 180.1, y = 79.1,
σ(X) = 10.35, σ(Y ) = 19.77,
Cov(X, Y ) = 176.89
r(X, Y ) = 0.8643.
https://myfsth.wordpress.com -29-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
y = 1, 65x − 218, 39
Alors il existe de même une unique droite rendant minimale la somme φ′ (a, b), cette droite
est appelée droite de regression de x en y ou encore droite des moindres carrés de x en y sous
la forme x = αy + β avec (
αb = Cov(X,Y
V (Y )
)
βb = x − αb y.
Il est bon de noter que les deux droites de regression passent par le point moyen G(x, y) et
que le produit des coefficients directeurs b b des droites de regression est égal à r(X, Y )2 .
a et α
Exemple. La statistique suivante indique pour les pays concernés les taux de chô-
mage X et le taux de d’inflation Y correspondant à l’année 1977 exprimés en pour-
centage.
https://myfsth.wordpress.com -30-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Pays B D F I L NL
Chômage 6.5 4.5 4.9 7.2 0.6 4.5
Inflation 7.1 3.9 9.5 18.4 6.7 6.7
28.2 52.3
x= = 4.7, y = ≃ 8.7167
6 6
2
2 158.96 28.2 1321
V ar(X) = σ(X) = − = ≃ 4.4033,
6 6 300
2
2 584.21 52.3 76871
V ar(Y ) = σ(Y ) = − = ≃ 21.35305,
6 6 3600
276.9 28.2 52.3 3049
Cov(X, Y ) = − . = =≃ 5.0816
6 6 6 600
Soit y = ax + b l’équation de la droite de regression de y en x. On a :
Cov(X, Y ) 31.09
a= = ≃ 1.1768, b = y − ax ≃ 3.1859.
V ar(X) 26.42
Cov(X, Y ) 31.09
α= = ≃ 0.2423, β = x − αy ≃ 2.5882.
V ar(Y ) 128.32
Cov(X, Y ) 31.09
r(X, Y ) = =√ ≃ 0.5339.
σ(X)σ(Y ) 26.42 × 128.32
Ce coefficient de corrélation est donc médiocre. Attention, il ne faut pas en conclure
a priori qu’il n’y a pas de relation entre les phénomènes de chômage et d’inflation.
En effet, la relation peut être d’une autre nature.
https://myfsth.wordpress.com -31-
Chapitre 3
Dénombrement et espace de
probabilités
3.1 Dénombrement
3.1.1 Ensembles finis
Définition 3.1. On dit qu’un ensemble E ̸= ∅ est fini s’il existe n ∈ N∗ et une bijection de
{1, 2, ..., n} dans E. L’entier n est appelé cardinal de E et on note CardE = n. On convient
Card∅ = 0.
Proposition 3.3. Soit une famille (Ai )1≤i≤n formant une partition d’un ensemble
! Ω c’est-à-
n
[ [n Xn
dire Ai = Ω et Ai ∩ Aj = ∅ pour tout i ̸= j. Alors Card Ai = CardAi
i=1 i=1 i=1
Proposition 3.4. Soit (Ei )1≤i≤n une famille d’ensembles finis. Alors
Exemple. On lance une pièce de monnaie trois fois successive. Un résultat est 3-uplet
de E = {P, F }, donc le nombre de résultats est 23 .
32
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
n!
Akn = n(n − 1)...(n − k + 1) = .
(n − k)!
Ak
n n!
= Cnk = = n.
k k!(n − k)! k!
Remarque 3.2. On a
Cnk = Cn−1
k−1 k
+ Cn−1 pour tout 1 ≤ k ≤ n.
11
12 1
13 3 1
14 6 4 1
15 10 10 5 1
..
.
Applications
On considère une urne contentant n boules. On tire au hasard un nombre k de boules
de cette urne.
1) Tirage avec remise
Le nombre de tirages successifs avec remise de k boules parmi n est nk .
2) Tirage sans remise
Le nombre de tirages successifs sans remise de k boules parmi n est Akn .
3) Tirage simultané
Le nombre de tirages simultanés de k boules parmi n est Cnk .
https://myfsth.wordpress.com -33-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
les résultats.
Un événement est une assertion, dont on peut dire si elle est vérifiée ou non une
fois le résultat de l’expérience connu.
Ω : événement certain.
∅ : événement impossible
{w}, où w ∈ Ω, événement élémentaire.
Exemple. Jet d’un dé à six faces numérotées : Ω = {1, 2, 3, 4, 5, 6}.
A : obtenir un nombre paire. A = {2, 4, 6}.
B : obtenir un nombre inférieur ou égale à 2. B = {1, 2}.
Exemple. On lance une pièce jusqu’a obtenir pile. Le nombre de jet peut être infini.
Définition 3.5. On appelle ensemble des événements, toute famille C de parties de Ω telle
que :
i) Ω ∈ C;
ii) ∀A ∈ C, A = A∁ ∈ C (événement contraire de A) ; S
iii) Pour toute famille (Ai )i∈I (I fini ou dénombrable) d’éléments de C, Ai ∈ C.
i∈I
C est appelé aussi tribu d’événements ou σ−algèbre et le couple (Ω, C) est appelé espace pro-
babilisable.
Définition 3.6. Un système complet d’événements est une famille (Ai )i∈I formant une par-
tition de Ω : [
Ai = Ω et Ai ∩ Aj = ∅ ∀i ̸= j.
i∈I
https://myfsth.wordpress.com -34-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Définition 3.7. On appelle probabilité sur (Ω, C) une application P : C → [0, 1] telle que
i) P (Ω) = 1;
ii) Pour toute famille (Ai )i∈I (I fini ou dénombrable) d’événements deux à deux incom-
patibles, on a !
[ X
P Ai = P (Ai ).
i∈I i∈I
Proposition 3.8.
1) P (∅) = 0.
2) P (A) = 1 − P (A).
3) Si A ⊂ B, alors P (A) ≤ P (B).
∪ B)= P (A) + P (B) − P (A ∩ B).
4) P (A
S P
5) P Ai ≤ P (Ai ).
i∈I i∈I
Remarque 3.3.
Nous utilisons la formule des probabilités totales très souvent dans le cas où le système complet
d’événements se réduit deux éléments {B, B}. Celle-ci s’écrit alors :
P (A) = P (A ∩ B) + P (A ∩ B).
https://myfsth.wordpress.com -35-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
P (A ∩ B)
P (A/B) = , ∀A ∈ C.
P (B)
Cette application notée aussi PB définie une probabilité sur le même espace probabilisé.
Exemple. On lance deux dés non pipés.
A : la somme des deux chiffres est inférieur ou égale à 5.
B : les deux chiffres sont pairs.
Calcul de P (A/B)
On a B = {(2, 2), (2, 4), (2, 6), (4, 2), (4, 4), (4, 6), (6, 2), (6, 4), (6, 6)} et A∩B = {(2, 2)},
donc
1 9 1
P (A ∩ B) = , P (B) = , P (A/B) = .
36 36 9
Remarque 3.4. Soit un S un événement de probabilité non nulle.
L’application P (./S) = PS vérifie toutes les propriétés d’une probabilité. On a par exemple :
— PS (Ω) = 1 et PS (∅) = 0.
— PS (A) = 1 − PS (A).
— PS (A ∪ B) = PS (A) + PS (B) − PS (A ∩ B).
https://myfsth.wordpress.com -36-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Exemple. 85% d’une population sont vaccinés contre une maladie. On a constaté que
2% des individus vaccinés n’ont pas été immunisés contre cette maladie et ont tom-
bés malades.
Quelle est la probabilité qu’un individu soit vacciné et malade ?
Soit V l’événement "un individu vacciné" et M l’événement " un individu est ma-
lade".
85 2
La probabilité cherchée est P (V ∩ M ) = P (V ).P (M/V ) = . = 0.017.
100 100
Propriété 3.2. (Généralisation de la formule des probabilités composées)
Soient n événement A1 , A2 , ..., An d’un espace probabilisé vérifiant P (A1 ∩A2 ∩...∩An ) > 0.
On a
P (A1 ∩ A2 ∩ ... ∩ An ) = P (A1 ).P (A2 /A1 ).P (A3 /A1 ∩ A2 )... ∩ P (An /A1 ∩ A2 ∩ ... ∩ An−1 )
Exemple. Dans une urne qui contient deux boules rouges et trois noires, quatre per-
sonnes A, B, C et D tirent successivement (dans cet ordre) une boule sans la re-
mettre ; la première qui tire une rouge gagne. On suppose que toutes les boules ont
la même probabilité d’être tirées.
Calculons la probabilité de gain de chaque personne.
Notons pour i = 1, 2, 3, 4, l’événement Ri : "tirer une boule rouge au iième tirage",
et pour i = 1, 2, 3, l’événement Ni : "tirer une boule noire au iième tirage".
2
P (A) = P (R1 ) = .
5
3 2 3
P (B) = P (N1 ∩ R2 ) = P (N1 ).P (R2 /N1 ) = . = .
5 4 10
3 2 2 1
P (C) = P (N1 ∩ N2 ∩ R3 ) = P (N1 ).P (N2 /N1 ).P (R3 /N1 ∩ N2 ) = . . = .
5 4 3 5
P (D) = P (N1 ∩ N2 ∩ N3 ∩ R4 ) = P (N1 ).P (N2 /N1 ).P (N3 /N1 ∩ N2 ).P (R4 /N1 ∩ N2 ∩ N3 )
3 2 1 2 1
P (D) = . . . = .
5 4 3 2 10
Théorème 3.2. (Théorème des probabilités totales 2ième version)
Soit (Bi )i∈I Un système complet d’événements. Alors, pour tout événement A,
X
P (A) = P (Bi ).P (A/Bi ).
i∈I
Exemple. On choisit un dé au hasard parmi un lot de 200 dés dont on sait que 50
1
sont pipés. Pour un dé pipé, la probabilité d’obtenir 6 est . On lance le dé choisi et
2
on a obtenu 6. Quelle est la probabilité que ce dé soit pipé ?
Soit B l’événement "Le dé choisit est pipé" et A l’événement "le dé lancé donne 6".
La probabilité cherchée est P (B/A).
https://myfsth.wordpress.com -37-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
https://myfsth.wordpress.com -38-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Définition 3.10. Les événements A1 , A2 , ..., An sont dits mutuellement indépendants si,
pour tout I ⊂ {1, 2, ..., n}, !
\ Y
P Ai = P (Ai ).
i∈I i∈I
P (A/B)P (B)
P (B/A) = .
P (A)
P (A ∩ D)
P (A/D) =
P (D)
P (A).P (D/A)
P (A/D) =
P (A).P (D/A) + P (B).P (D/B) + P (C).P (D/C)
0.50 × 0.03 15
= =
0.50 × 0.03 + 0.30 × 0.04 + 0.20 × 0.05 37
P (A/D) ≃ 0.4054.
https://myfsth.wordpress.com -39-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
https://myfsth.wordpress.com -40-
Chapitre 4
4.1 Généralités
4.1.1 Variable aléatoire discrète
Définition 4.1. Soit (Ω, C, P ) un espace probabilisé. On appelle variable aléatoire (v. a.)
réelle discrète toute fonction X : Ω → R telle que
i) X(Ω) = {xi : i ∈ I} avec I est fini ou dénombrable.
ii) Pour tout xi ∈ X(Ω), on a
[X = xi ] := X −1 (xi ) = {w ∈ Ω : X(w) = xi } ∈ C,
Remarque 4.1. L’univers des réalisations X(Ω) est aussi appelé support de la loi de pro-
babilité de X.
La loi de probabilité d’une variable aléatoire X est la donné de la liste des probabilités
P (X = xi ) pour toutes les réalisations xi ∈ X(Ω).
Si X ne prends qu’un petit nombre de valeurs, cette distribution (ou loi de probabilité) est
généralement présentée dans un tableau.
Valeurs de X x1 x2 ... xn
pi = P (X = xi ) p1 p2 ... pn
Définition 4.2. La fonction de masse associée à la loi de probabilité de X est la fonction notée
fX qui à chaque réalisation xi ∈ X(Ω) fait correspondre la probabilité P (X = xi ) :
41
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Exemple. On lance deux fois une pièce de monnaie régulière. L’ensemble des résul-
tats possibles est
La loi de probabilité de X :
xi 0 1 2
pi = P (X = xi ) 1/4 1/2 1/4
La fonction de masse fX :
où [X ≤ x] = {w ∈ Ω : X(w) ≤ x}.
Remarque 4.2. La fonction de répartition F notée aussi FX , contrairement à la fonction
de masse fX , est définie pour toute valeur réelle x et pas uniquement pour les valeurs des
réalisations appartenant à X(Ω). Par exemple, si le support de la variable aléatoire X est
X(Ω) = {0, 1, 2}, on peut calculer FX (1.59) = P (X ≤ 1.59), FX (5) = P (X ≤ 5) ou même
https://myfsth.wordpress.com -42-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
La quantité P (X ≤ x) est appelée probabilité cumulée car elle correspond au cumul c’est-à-
dire à la somme de toutes les probabilités associées à des réalisations xi ∈ X(Ω) inférieur ou
égale à x. Ainsi
Exemple. Soit X la variable aléatoire dont la loi de probabilité est donnée par le
tableau suivant
xi −4 −2 1 5
pi = P (X = xi ) 0.1 0.3 0.5 0.1
https://myfsth.wordpress.com -43-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
4.1.3 Quantiles
Nous avons vu que la fonction de répartition est une fonction qui à toute valeur
x ∈ R associe la probabilité cumulative FX (x) = P (X ≤ x). Il est possible "d’inver-
ser" cette fonction de répartition à fin de déterminer la valeur de x qui correspond à
une certaine probabilité cumulative α = P (X ≤ x) avec α ∈ [0, 1]. On parle alors de
la fonction de répartition inverse ou de quantile d’ordre α.
Définition 4.4. Le quantile d’ordre α de la loi de probabilité de X, notée FX−1 (α) ou Qα est
la plus petite réalisation appartenant à X(Ω) associée à une probabilité cumulée supérieure
ou égale à α.
FX (Qα ) = P (X ≤ Qα ) ≥ α, ∀α ∈ [0, 1], ou encore
FX (FX−1 (α)) = P (X ≤ FX−1 (α)) ≥ α, ∀α ∈ [0, 1].
Interprétation d’un quantile est la suivante :
Si le quantile d’ordre α = 0.05 est égale à Q0.05 = FX−1 (0.05) = 2, cela signifie qu’il y
a 5% de chances que les réalisations de la variable aléatoire discrète X soit inférieur
ou égale à 2.
Exemple. Reprenons l’exemple du lancer d’une pièce de monnaie régulière deux fois.
Soit X la v. a. représentant le nombre de faces obtenues. Alors le support de X est
X(Ω) = {0, 1, 2} et la loi de probabilité de X est donnée par le tableau suivant :
xi 0 1 2
pi = P (X = xi ) 1/4 1/2 1/4
La fonction de répartition de X est représentée par
https://myfsth.wordpress.com -44-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Remarque 4.3. Le quantile d’ordre α = 0.5 de la loi de probabilité d’une v.a. X est appelé
la médiane de X et il est noté
Me = Q0.5 = FX−1 (0.5)
https://myfsth.wordpress.com -45-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Proposition 4.3. Soit X une v. a. réelle discrète admettant une variance, alors
Pour tout (a, b) ∈ R2 V (aX + b) = a2 V (X).
Exemple. Une urne contient 3 boules rouges et 4 boules noires. On tire successive-
ment avec remise 2 boule de l’urne.
Soit Ω = {R1 , R2 , R3 , N1 , N2 , N3 , N4 }2 et P probabilité uniforme. On mise au départ
10 Dh et on gagne 8 Dh par boule rouge obtenue.
Soit X la v. a. prenant pour valeur le gain final.
Loi de X :
xi -10 -2 6
P (X = xi ) 16
49
24
49
9
49
Espérance de X :
16 24 9 −22
E(X) = (−10) × + (−2) × +6× = .
49 49 49 7
Variance de X :
2
16
2 24 9 −22 1536
V (X) = (−10) × + (−2)2 × + 62 × − = ≃ 31.35.
49 49 49 7 49
Il revient au même de dire que pour tout (x, y) ∈ X(Ω) × Y (Ω) les événements [X = x] et
[Y = y] sont indépendants.
https://myfsth.wordpress.com -46-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Exemple .
On lance deux fois un dé équilibré numérotés de 1 à 6. On note X la v.a.d qui repré-
sente le numéro obtenu lors du premier lancer et Y la v.a.d qui représente le numéro
obtenu lors du deuxième lancer.
On a X(Ω) = Y (Ω) = {1, 2, 3, 4, 5, 6} et on a pour tout (x, y) ∈ X(Ω) × Y (Ω),
1 1 1 1
P [(X = x) ∩ (Y = y)] = , et P (X = x).P (Y = y) = × = .
36 6 6 36
Donc P [(X = x) ∩ (Y = y)] = P (X = x).P (Y = y). D’où X et Y sont indépendants.
Plus généralement on la définition suivante :
Définition 4.9. Soit X1 , X2 , ... et Xn des variables aléatoires discrètes définies sur (Ω, C, P ).
On dit que les v.a.d X1 , X2 , ... et Xn sont indépendantes si ∀x1 ∈ X1 (Ω), ∀x2 ∈ X2 (Ω),...
et ∀xn ∈ Xn
Il revient au même de dire que pour tout (x1 , x2 , ..., xn ) ∈ X1 (Ω) × X2 (Ω) × ... × Xn (Ω) les
événements (X1 = x1 ), (X2 = x2 ),...(Xn = xn ) sont (mutuellement) indépendants.
Situation concrète.
On choisit au hasard (c-à-d avec équiprobabilité) un objet parmi n objets numérotés
de 1 à n et on appelle X la variable aléatoire donnant le numéro de l’objet choisit.
n+1 n2 − 1
E(X) = et V (X) = .
2 12
Exemple. On lance un dé non pipé numéroté de 1 à 6 et on considère la variable
aléatoire X donnant le numéro de la face obtenue.
1
On a X(Ω) = {1, 2, 3, 4, 5, 6} et ∀k ∈ X(Ω), P (X = k) = .
6
Donc X suit une loi uniforme discrète sur [[1, 6]] et on écrit X ,→ U6 .
6+1 62 − 1 35
On a E(X) = = 3.5 et V (X) = = ≃ 2.9.
2 12 12
On peut définir une loi uniforme discrète sur un ensemble non vide quelconque de
R.
https://myfsth.wordpress.com -47-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Remarque 4.6. Soit {x1 , ..., xn } ⊂ R un ensemble de n éléments. on dit qu’une v.a.r X :
Ω −→ R suit une loi uniforme discrète sur {x1 , ..., xn } si
• X(Ω) = {x1 , ..., xn }.
1 1
• ∀k ∈ [[1, n]], P (X = xk ) = = .
n cardX(Ω)
2
x21 + ... + x2n
x1 + ... + xn x1 + ... + xn
Dans ce cas E(X) = et V (X) = − .
n n n
Situation concrète.
Une variable aléatoire de Bernouli illustre généralement toute experience aléatoire
n’ayant que deux issues possibles : le succès ou l’échec, effectuée une seule fois. Une
telle expérience est alors appelée épreuve de Bernoulli. On affecte alors 1 à la variable
en cas de succès et 0 en cas d’échec.
Dans une expérience aléatoire où on s’interesse à la réalisation d’un événement A
donné. La v.a X égale à 1 si A est réalisé et égale à 0 sinon est une variable aléatoire
de Bernouli.
Lancer une pièce où la probabilité d’amener pile est p ∈]0, 1[. Le fait d’amener pile
étant considéré comme un succès. X : le nombre de pile obtenu suit une loi de Ber-
nouli.
Effectuer un tirage d’une boule dans une urne contenant une proportion p de boules
blanches. X : le nombre de boules blanches obtenues suit une loi de Bernouli.
Situation concrète.
Si on effectue une épreuve de Bernouli de paramètre p. Elle n’a donc que deux is-
sues : le succès avec une probabilité p et l’échec avec une probabilité 1−p. Si on répète n fois
cette épreuve et si les n épreuves sont indépendantes c-à-d la probabilité de succès p
est la même à chaque épreuve. Alors la variable X donnant le nombre de succès au
cour de ces n épreuve suit une loi Binomiale de paramètres n et p.
Une v.a X qui suit une loi binomiale de paramètres n et p peut être vue comme une
https://myfsth.wordpress.com -48-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Remarque 4.7. le mot binomial vient du fait que lorsqu’on somme toutes ces probabilités,
on retrouve le développement du binôme de Newton,
n
X
Cnk pk (1 − p)n−k = (p + 1 − p)n = 1.
k=0
X(Ω) = N∗ et ∀k ∈ N∗ , P (X = k) = (1 − p)k−1 p.
Situation concrète.
On effectue une épreuve de Bernoulli. Elle n’a donc que deux issues : le succès avec
une probabilité p ou l’échec avec une probabilité 1 − p. Puis on répète l’épreuve
jusqu’à l’apparition du premier succès de sorte que toutes les épreuves sont indépendantes
entre elles. Alors dans cette situation, X la variable aléatoire égale au rang de l’apparition
du premier succès suit une loi géométrique de paramètre p. On dit que X est le temps
d’attente du premier succès.
Remarque 4.8. On est donc dans les même hypothèses que pour la loi binomiale, mais le
nombre d’épreuves n’est pas fixé à l’avance. on s’arrête au premier succès.
https://myfsth.wordpress.com -49-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
1 1−p
Proposition 4.7. Si X ,→ G(p) alors E(X) = et V (X) = .
p p2
Remarque 4.9. Le mot géométrique vient du fait que lorsqu’on somme toutes ces probabilités,
on obtient une série géométrique.
+∞
X p
(1 − p)k−1 p = = 1.
k=1
1 − (1 − p)
Exemple.
On lance une pièce régulière jusqu’à obtenir pour la première fois face. Soit X la
variable aléatoire égale au nombre de lancers nécessaires pour obtenir face.
Calcul de la probabilité pour obtient face au bout de 5 lancers.
Lancer une pièce une fois est une épreuve de Bernouli. La probabilité d’obtenir face
1
(le succès) est p = . On répète cette expérience jusqu’à obtenir le premier succès.
2
1
Donc X suit une loi géométrique de paramètre p = .
2
La probabilité cherchée est
5−1 5
1 1 1 1
P (X = 5) = 1 − = = .
2 2 2 32
1
Calcul de E(X) : E(X) = = 2.
p
https://myfsth.wordpress.com -50-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
En pratique si N > 10n, alors on peut approcher la loi hypergéométrique par la loi binomiale.
https://myfsth.wordpress.com -51-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
P (X ≤ 3) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3)
50 51 52 53
= e0 + e−5 . + e−5 . + e−5 .
0! 1! 2! 3!
P (X ≤ 3) ≃ 0.265
P (X ≥ 1) = 1 − P (X < 1) = 1 − P (X = 0)
50
= 1 − e−5 .
0!
P (X ≥ 1) ≃ 0.993
Proposition 4.11. Soit une v.a. X ,→ B(n, p). On pose np = λ. On suppose que λ est une
constante positive fixée.
λk
lim P (X = k) = e−λ .
n→+∞ k!
On en déduit qu’une loi binomiale B(n, p) peut être approchée par une loi de Poisson P(λ)
lorsque n est suffisamment grand et p petit, avec λ = np.
En pratique, On peut estimer une bonne approximation avec des valeurs de l’ordre de :
Exemple. Suite à une vaccination contre le paludisme, dans une population à risque,
on estime à 2%, compte tenu du délai d’immunisation, la proportion de personne
qui seront pourtant atteintes de la maladie.
Quelle est la probabilité de constater, lors d’un contrôle dans un petit village de 100
habitants tous recrement vaccinés, plus d’une personne malade ? (on supposera l’in-
dépendance des éventualités).
Compte tenu des hypothèses, la v.a X qui compte le nombre de malade suit une loi
https://myfsth.wordpress.com -52-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
P (X > 1) = 1 − P (X ≤ 1) = 1 − P (X = 0) − P (X = 1)
20 21
= 1 − e−2 − e−2
0! 1!
P (X > 1) = 0.5939..
https://myfsth.wordpress.com -53-
Chapitre 5
5.1 Généralités
5.1.1 Variable aléatoires réelles et densité de probabilité
Définition 5.1. Soit (Ω, C, P ) un espace probabilisé. On appelle variable aléatoire réelle toute
fonction X : Ω → R telle que
Cela exprime que l’image réciproque d’un intervalle quelconque de R est un événement.
En d’autre terme, une variable aléatoire est dite réelle si elle peut prendre toutes les valeurs
d’un intervalle de R.
On appelle loi de probabilité de X la donné de PX :
PX (I) = P (X ∈ I) = P (X −1 (I)), ∀I ∈ C.
Définition 5.3. Soit f une densité de probabilité. On dit qu’une variable aléatoire X est de
densité de probabilité f si pour tout a, b ∈ R tels que a ≤ b, on a
Z b
P (a ≤ X ≤ b) = f (x)dx.
a
54
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Ra
2. P (X < a) = P (X ≤ a) = −∞
f (x)dx.
R +∞
3. P (X > a) = P (X ≥ a) = a
f (x)dx.
4. ∀a, b ∈ R, tels que a ≤ b, on a
Z b
P (a ≤ X ≤ b) = P (a < X ≤ b) = P (a ≤ X < b) = P (a < X < b) = f (x)dx.
a
5.1.3 Quantiles
Tout comme dans le cas des variables discrètes, il est possible "d’inverser" la fonc-
tion de répartition à fin de determiner la valeur de x ∈ R qui correspond à une cer-
taine probabilité cumulée α = P (X ≤ x) avec α ∈ [0, 1]. On obtient alors la fonction
de répartition inverse ou le quantile d’ordre α. La définition du quantile est légère-
ment différente de celle présentée dans le cadre des variables aléatoires discrètes.
Définition 5.5. Soit X une variable aléatoire réelle, le quantile d’ordre α de la loi de proba-
bilité de X notée Qα ou FX−1 (α), est la réalisation appartenant à X(Ω) ⊆ R correspondant à
une probabilité cumulée égale à α.
https://myfsth.wordpress.com -55-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
On a f (x) ≥ 0, ∀x ∈ R.
fZ est continue sauf
Z 1 en x = 0 et en x = 1.
+∞ √ 1
f (x)dx = f (x)dx = x 0 = 1.
−∞ 0
Donc f est une densité de probabilité.
Rx
Si x ≤ 0 alors F (x) = −∞ 0 dt = 0.
R0 Rx 1 √ x √
Si 0 < x ≤ 1 alors F (x) = −∞ 0 dt + 0 2√ t
dt = t 0 = x.
R0 R1 1 Rx
Si x > 1 alors F (x) = −∞ 0 dt + 0 2√t dt + 1 0 dt = 1.
1 1 1
la médiane de X est Me = , car F = .
4 4 2
Exemple. (Détermination de la densité de la v.a. g(X))
Soit X une v.a. continue de densité f définie par
1, si 0 < x < 1,
f (x) =
0, sinon
https://myfsth.wordpress.com -56-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Remarque 5.1. Même si la fonction g n’est pas bijective, on peut parfois determiner la densité
Y = g(X) par dérivation de P (Y ≤ y) = P (g(X) ≤ y). Prenons l’exemple de g(x) = x2 .
Soit y ∈ R. FY (y) = P (Y ≤ y) = P (X 2 ≤ y).
Si y < 0 alors P (X 2 ≤ y) = 0 et donc fY (y) = 0.
√ √ √ √
Si y ≥ 0 alors FY (y) = P (X 2 ≤ y) = P (− y ≤ X ≤ y) = FX ( y) − FX (− y).
1 √ 1 √
En dérivant on obtient fY (y) = √ fX ( y) + √ fX (− y).
2 y 2 y
2
Finalement la densité de la v.a Y = X est donnée par
1 √ √
√
2 y
f X ( y) + f X (− y) , si y ≥ 0,
fY (y) =
0, sinon.
V (X) = E (X − E(X))2 .
https://myfsth.wordpress.com -57-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
https://myfsth.wordpress.com -58-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
https://myfsth.wordpress.com -59-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
On note X ,→ E(θ).
α = F (x) ⇐⇒ α = 1 − e−θx
⇐⇒ e−θx = 1 − α
ln(1 − α)
⇐⇒ F −1 (α) = x = −
θ
https://myfsth.wordpress.com -60-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
ln(1 − α)
le quantile d’ordre α est donc égale à F −1 (α) = − .
θ
Ainsi le quantile d’ordre α = 5% est égale à 0.0256 puisque
ln(1 − 0.05)
F −1 (0.05) = − = 0.0256.
2
Le quantile Q0.05 = 0.0256 s’interprète de la façon suivante : il y a 5% de chances que
les réalisations de la variable aléatoire X soient égale au seuil F −1 (0.05) = 0.0256,
c’est-à-dire
P (X ≤ 0.0256) = 0.05 = 5%.
Remarque 5.3. Pour toutes les lois de probabilités pour lesquelles il n’existe pas d’expression
analytique de la fonction de répartition, il n’existe pas non plus d’expression analytique des
quantiles. Ceux-ci sont alors approximés par des méthodes numériques.
En effet :
P ((X < t) ∩ (X > s)) P (s < X < t)
P (X < t|X > s) = =
P (X > s) 1 − P (X ≤ s)
F (t) − F (s) (1 − e ) − (1 − eθs )
θt
= =
1 − F (s) 1 − (1 − eθs )
eθs − eθt
= = 1 − eθ(t−s)
eθs
= F (t − s)
P (X < t|X > s) = P (X < t − s).
https://myfsth.wordpress.com -61-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Définition 5.12. On dit qu’une v. a. X suit la loi normale centrée réduite si elle a pour
densité f définie par
1 x2
∀x ∈ R, f (x) = √ e− 2 .
2π
On note X ,→ N (0, 1).
Remarque 5.4. Pour tout x ∈ R, la fonction de répartition de X ,→ N (0, 1) est donnée par
Z x
1 t2
Φ(x) = P (X ≤ x) = √ e− 2 dt.
2π −∞
https://myfsth.wordpress.com -62-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
x2
On ne connaît pas une expression explicite de la primitive de la fonction x −→ e− 2 . Donc
on a pas d’expression explicite de la fonction de répartition d’un v.a. suivant une loi normale
réduite. On la notera Φ.
Pour calculer Φ(x), on utilisera une calculatrice ou une table dite de la loi normale qui donne
des valeurs approché des probabilités.
Propriétés 5.2. Si X ,→ N (0, 1), alors ∀a, b ∈ R, tel que a ≤ b
1. P (X ∈ I) = Φ(b) − Φ(a), où I = [a, b], [a, b[, ]a, b] ou ]a, b[.
2. P (X ≤ a) = P (X < a) = Φ(a) et P (X ≥ a) = P (X > a) = 1 − Φ(a).
1
3. ∀x ∈ R, Φ(−x) = 1 − Φ(x). En particulier Φ(0) = .
2
Proposition 5.9. Si X ,→ N (0, 1), alors E(X) = 0 et V (X) = 1.
Théorème 5.2. Soit X une variable aléatoire qui suit une loi normale réduite. Pour tout réel
α ∈]0, 1[, il existe un unique réel strictement positif uα tel que
P (−uα ≤ X ≤ uα ) = 1 − α.
Preuve. On cherche un réel x strictement positif tel que P (−x ≤ X ≤ x) = 1 − α.
P (−x ≤ X ≤ x) 1−α
=
Φ(x) − Φ(−x) 1−α
=
Φ(x) − (1 − Φ(x)) 1−α
=
2Φ(x) − 1 1−α
=
2Φ(x) 2−α
=
α
Φ(x) = 1 − .
2
On sait que la fonction Φ est continue et strictement croissante sur ]0, +∞[. De plus
1
lim Φ(x) = Φ(0) = et lim Φ(x) = 1,
x−→0 2 x−→+∞
1 α
et 0 < α < 1 ⇐⇒ < 1 − < 1.
2 2
Donc d’après le théorème des valeurs intermédiaires, il existe un unique x = uα
strictement positif tel que Φ(uα ) = 1 − α2 . D’où le résultat.
α
Remarques 5.2. 1. P (−uα ≤ X ≤ uα ) = 1 − α ⇐⇒ P (X ≤ uα ) = 1 − .
2
2. Il est bon de retenir les valeurs de u0.01 = 2.58 et u0.05 = 1.96. Ainsi on obtient
P (−2.58 ≤ X ≤ 2.58) = P (−u0.01 ≤ X ≤ u0.01 ) = 1 − 0.01 = 0.99
P (−1.96 ≤ X ≤ 1.96) = P (−u0.05 ≤ X ≤ u0.05 ) = 1 − 0.05 = 0.95
Définition 5.13. Soient µ ∈ R et σ > 0. On dit qu’une v. a. X suit la loi normale de
paramètres µ et σ si elle a pour densité g définie par
1 (x−µ)2
∀x ∈ R, g(x) = √ e− 2σ2 .
σ 2π
On note X ,→ N (µ, σ).
https://myfsth.wordpress.com -63-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
1 x−µ
Remarque 5.5. ∀x ∈ R, g(x) = f , où f est la densité d’une loi normale centrée
σ σ
réduite.
Proposition 5.10. Si X ,→ N (µ, σ), alors E(X) = µ et V (X) = σ 2 .
Proposition 5.11. Si X suit la loi normale N (µ, σ) alors pour tout a, b ∈ R avec a ̸= b, la
variable aléatoire Y = aX + b suit la loi normale N (aµ + b, |a|σ).
En particulier on a
X −µ
X ,→ N (µ, σ) ⇔ Z = ,→ N (0, 1).
σ
Remarque 5.6. On constate que plus l’écart-type σ est grand, plus la courbe s’étale autour
de la moyenne et plus le maximum est petit, en accord avec la signification de l’écart-type.
Utilisation de la table de la loi normale.
Considérons un extrait de la table de la loi centrée réduite.
z 0.05 0.06 0.07 0.08
0.9 0.8289 0.8315 0.8340 0.8365
1 0.8531 0.8554 0.8577 0.8599
1.1 0.9749 0.9770 0.8790 0.8810
1.2 0.8944 0.8962 0.8980 0.8997
1.3 0.9115 0.9131 0.9147 0.9162
https://myfsth.wordpress.com -64-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
0.854 − 0.8531
x = 1.05 + × (1.06 − 1.05)
0.8554 − 0.8531
x = 1.053913
Donc −z = 1.054 et par suite z = −1.054.
Déterminer les quartiles de Z
Par symétrie, Q0.25 = −Q0.75 et Q0.50 = Me = 0.
Cherchons Q0.75 tel que Φ(Q0.75 ) = P (Z ≤ Q0.75 ) = 0.75.
D’après la table statistique de la loi normale standard, on lit les valeurs
Φ(0.67) = 0.7486 et Φ(0.68) = 0.7517.
Donc Par le tableau d’interpolation linéaire, on obtient
0.67 Q0.75 0.68
0.7486 0.75 0.7517
0.75 − 0.7486
Q0.75 = 0.67 + × (0.68 − 0.67)
0.7517 − 0.7486
Q0.75 = 0.6745
https://myfsth.wordpress.com -65-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Donc le premier quartile Q0.25 = −0.6745 et le troisième quartile est Q0.75 = 0.6745.
Interpretation : 25% des valeurs de Z sont inférieures à −0.6745 et 75% des valeurs
de Z sont inférieures à 0.6745.
Déterminer le neuvième décile de Z
Le neuvième décile est le quantile d’ordre α = 0.9.
On va donc chercher Q0.9 tel que Φ(Q0.9 ) = P (Z ≤ Q0.9 ) = 0.9.
D’après la table de la loi normale centré réduite, on lit les valeurs
Φ(1.28) = 0.8997 et Φ(1.29) = 0.9015.
Donc Par le tableau d’interpolation linéaire, on obtient
1.28 Q0.9 1.29
0.8987 0.9 0.9015
0.9 − 0.8997
Q0.9 = 1.28 + × (1.29 − 1.28)
0.9015 − 0.8997
Q0.9 = 1.28166
Donc le neuvième décile est Q0.9 = 1.28166.
Par symétrie, on déduit aussi le premier décile Q0.1 = −Q0.9 = −1.28166.
Interpretation : 90% des valeurs de Z sont inférieures à 1.28166 et 10% des valeurs de
Z sont inférieures à −1.28166.
X − 15
Soit une variable aléatoire X ,→ N (15, 2). On pose Z = , alors Z ,→ N (0, 1).
2
Calcul de P (X < 16) :
X − 15 16 − 15 1
P (X < 16) = P < =P Z< = Φ(0.5)
2 2 2
P (X < 16) = 0.6915.
Calcul de P (X > 17) :
X − 15 17 − 15
P (X > 17) = P > = P (Z > 1) = 1 − Φ(1) = 1 − 0.8413
2 2
P (X > 17) = 0.1587.
Calcul de P (13 ≤ X ≤ 17) :
13 − 15 X − 15 17 − 15
P (13 ≤ X ≤ 17) = P ≤ ≤ = P (−1 ≤ X ≤ 1)
2 2 2
= Φ(1) − Φ(−1) = 2Φ(1) − 1
P (13 ≤ X ≤ 17) = 0.6826
Exercice.
Soit X une variable aléatoire qui suit une loi normale centrée réduite.
Déterminer l’intervalle I centré en 0 tel que P (X ∈ I) = 0.8.
(On donnera les bornes de l’intervalle avec une précision de 10−2 ).
On a 1 − α = 0.8 ⇐⇒ α = 0.2.
On doit donc avoir Φ(uα ) = 1 − α2 = 0.9.
C’est-à-dire uα = Φ−1 (0.9).
On trouve à l’aide de la table uα ≃ 1.28. Donc I = [−1.28; 1.28].
https://myfsth.wordpress.com -66-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Exemple. Dans un pays, la taille en centimètres des femmes adulte peut être modé-
lisée par une variable aléatoire X suivant la loi normale d’espérance µ1 = 165 cm et
d’écart-type σ = 6 cm.
Quelle est la probabilité qu’une femme choisie au hasard dans ce pays mesure entre
153 mètre et 177 mètre ?
La probabilité cherchée est P (156 ≤ X ≤ 177).
Remarque 5.7. Pour n assez grand pet p ni trop voisin de 0 ou de 1, la loi binomiale B(n, p)
est proche de la loi normale N (np, np(1 − p).
En pratique, on pourra faire l’approximation d’une loi binomiale par une loi normale si on a
les conditions suivantes : n ≥ 30, np ≥ 5, et np(1 − p) ≥ 5.
https://myfsth.wordpress.com -67-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Cette approximation est importante car les probabilités relatives à la loi binomiale sont diffi-
ciles à calculer quand n est grand. Pour améliorer l’approximation, on effectue une "correction
de continuité" qui permet de lier loi discrète et loi continue de la manière suivante :
https://myfsth.wordpress.com -68-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
https://myfsth.wordpress.com -69-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Calcul de P (X = 30) :
https://myfsth.wordpress.com -70-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Corollaire 5.1. Soient Y1 , ..., Yn , n variables aléatoires réelles continues et définies sur le
même espace probabilisé, indépendantes et suivant la même loi normale N (µ, σ) alors la
n
1X σ
moyenne Y = Yi est une variable aléatoire qui suit la loi normale N µ, √ .
n i=1 n
Yi
Xi = , pout tout i ∈ [[1, n]].
n
Exemple. Soient X1 , X2 et X3 trois variables aléatoires indépendantes de loi normale
tells que E(X1 ) = 30, V (X1 ) = 10, E(X2 ) = 20 et V (X2 ) = 14, E(X3 ) = 50 et
V (X3 ) = 25. On pose X = X1 + X2 + X3 .
Déterminer la loi de X.
X est la somme de 3 v.a.r indépendantes suivant une loi normale, dont X suit une
loi normale N (µ, σ) de paramètres
µ = E(X)
= E(X1 ) + E(X2 ) + E(X3 )
= 30 + 20 + 50
µ = 100
p
σ = V (X)
p
= V (X1 ) + V (X2 ) + V (X3 )
√
= 10 + 14 + 25
σ = 7
https://myfsth.wordpress.com -72-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Proposition 5.13. Si X et Y sont deux v.a.r. indépendantes qui suivent la loi normale
X
N (0, 1) alors la variable aléatoire suit la loi de Cauchy CA(0, 1).
Y
Proposition 5.14. Pour tout x ∈ R, la fonction de répartition de X ,→ CA(x0 , α) est donnée
par
1 1 x − x0
F (x) = + arctan .
2 π α
https://myfsth.wordpress.com -73-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
E(X)
∀δ > 0, P (X ≥ δ) ≤ .
δ
Remarque 5.9. Par intuition, l’inégalité de Markov formalise le fait qu’une variable aléatoire
positive a peu de chances de prendre de grande valeurs.
Si on pose δ = αE(X) alors l’inégalité de Markov devient
1
∀α > 0, P (X ≥ αE(X)) ≤ .
α
Théorème 5.5. (Inégalité de Bienaymé-Tchebychev)
Soit X une variable aléatoire telle que E(X) et V (X) existent. Alors,
V (X)
∀δ > 0, P (|X − E(X)| ≥ δ) ≤ .
δ2
Remarque 5.10. Soit X un variable aléatoire. On note son espérance E(X) = µ et sa
variance V (X) = σ 2 .
Cette inégalité est dite inégalité de concentration. Elle donne un intervalle de fluctuation
σ2
]µ − δ, µ + δ[ pour X de niveau 1 − 2 avec δ > 0. En effet
δ
σ2
P (X ∈]µ − δ, µ + δ[) = P (|X − µ| < δ) = 1 − P (|X − µ| ≥ δ) ≥ 1 − 2 .
δ
Si on applique l’inégalité précédente pour δ = 2σ et δ = 3σ on obtient
σ2 3
P (X ∈]µ − 2σ, µ + 2σ[) = P (|X − µ| < 2σ) = 1 − P (|X − µ| ≥ 2σ) ≥ 1 − 2
=
4σ 4
σ2 8
P (X ∈]µ − 3σ, µ + 3σ[) = P (|X − µ| < 3σ) = 1 − P (|X − µ| ≥ 3σ) ≥ 1 − 2 = .
9σ 9
Ces propriétés sont encore une illustration du fait que l’écart-type mesure la dispersion de la
variable aléatoire autour de sa moyenne.
Exemple. Soit X une v.a telle que E(X) = 4 et σ = 2. Donnons une limite de la
probabilité que X soit comprise strictement entre 0 et 8.
3
P (0 < X < 8) = P (−4 < X − 4 < 4) = P (|X − 4| < 4) = P (|X − µ| < 2σ) ≥ .
4
On a au moins 75% de chances pour que les valeurs de la variable aléatoire X soient
comprise strictement entre 0 et 8.
https://myfsth.wordpress.com -74-
Chapitre 6
Exemple. Une urne contient 4 boules blanches, 2 boules noires et 4 boules rouges. On
tire simultanément 3 boules au hasard. Soient X la variable prenant pour valeur le
nombre de boules blanches obtenus, et Y la variable prenant pour valeur le nombre
de boules noires obtenus.
Déterminer la loi conjointe du couple (X, Y ) et les lois marginale de Xet Y.
3
On a cardΩ = C10 = 120, X(Ω) = {0, 1, 2, 3} et Y (Ω) = {0, 1, 2}, et P la probabilité
uniforme.
75
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
X \Y 0 1 2 pi•
0 1/30 3/30 1/30 5/30
1 6/30 8/30 1/30 15/30
2 6/30 3/30 0 9/30
3 1/30 0 0 1/30
p•j 14/30 14/30 2/30 1
On remarque par exemple que (xi , yj ) = (3, 1) ∈
/ (X, Y )(Ω). En pratique, on pose
pij = 0.
https://myfsth.wordpress.com -76-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
6.1.5 Indépendance
Définition 6.5. On dit que X et Y sont indépendantes si
∀(i, j) ∈ I × J, P ((X = xi ) ∩ (Y = yj )) = P (X = xi )P (Y = yj ),
ou encore
∀(i, j) ∈ I × J, pij = pi• × p•j .
Proposition 6.1. Si X et Y sont indépendantes, admettant une espérance, alors la v. a. XY
admet une espérance, et
E(XY ) = E(X)E(Y ).
Proposition 6.2. Si X et Y sont indépendantes, alors toute fonction de X est indépendante
de toute fonction de Y .
Exemple. Reprenons l’exemple précédent
X \Y 0 1 2 pi•
0 1/30 3/30 1/30 5/30
1 6/30 8/30 1/30 15/30
2 6/30 3/30 0 9/30
3 1/30 0 0 1/30
p•j 14/30 14/30 2/30 1
1
On a par exemple p42 = 0 et p4• × p•2 = 30 × 14
30
.
Donc p42 ̸= p4• × p•2 et par suite X et Y ne sont pas indépendantes.
Exercice Soit (X, Y ) un couple de v. a. discrètes dont la loi est donnée par le tableau
suivant
X \Y 1 2 3 4
1 0.08 0.04 0.16 0.12
2 0.04 0.02 0.08 0.06
3 0.08 0.04 0.16 0.12
1. Déterminer les lois marginales du couple (X, Y ) et préciser si X et Y sont
indépendantes.
2. Vérifier que E(XY ) = E(X)E(Y ).
Corrigé 1) Les lois marginales du couple (X, Y ) sont données par le tableau :
X \Y 1 2 3 4 pi.
1 0.08 0.04 0.16 0.12 0.4
2 0.04 0.02 0.08 0.06 0.2
3 0.08 0.04 0.16 0.12 0.4
p.j 0.2 0.1 0.4 0.3 1
https://myfsth.wordpress.com -77-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
On remarque que toutes les probabilités des couples (xi , yj ) s’obtiennent en faisant
le produit des probabilités marginales
4
X 4
X
E(Y ) = yj p•j = 1 × 0.2 + 2 × 0.1 + 3.4 + 4 × 0.3
j=1 j=1
= 0.2 + 0.2 + 1.2 + 1.2
E(Y ) = 2.8
3 X
X 4
E(XY ) = xi yj pij
i=1 j=1
= 1 × 1 × 0.08 + 1 × 2 × 0.04 + 1 × 3 × 0.16 + 1 × 4 × 0.12
+ 2 × 1 × 0.04 + 2 × 2 × 0.02 + 2 × 3 × 0.08 + 2 × 4 × 0.06
+ 3 × 1 × 0.08 + 3 × 2 × 0.04 + 3 × 3 × 0.16 + 3 × 4 × 0.12
= 0.08 + 0.08 + 0.48 + 0.48 + 0.08 + 0.08 + 0.48 + 0.48 + 0.24 + 0.24 + 1.44 + 1.44
E(XY ) = 5.6
Remarque 6.3. La valeur FX,Y (x, y) représente la probabilité de la zone hachurée indiquée
dans la figure
https://myfsth.wordpress.com -78-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Remarque 6.4. Si FX,Y est deux fois derivable par rapport aux deux variables, alors la loi
du couple (X, Y ) est dite absolument continue de densité f définie par
∂ 2 FX,Y
f (x, y) = .
∂x∂y
La fonction de répartition se calcule alors par double intégration
Z x Z y
F (X, Y )(x, y) = f (u, v)dudv.
−∞ −∞
Définition 6.7. Un couple de variables aléatoire (X, Y ) admet une densité s’il existe une
fonction f : R2 → R positive, dont l’intégrale sur R2 existe et vaut 1, et telle que
Z a Z b
2
∀(a, b) ∈ R , P ((X ≤ a) ∩ (Y ≤ b)) = f (x, y)dxdy.
−∞ −∞
est positive et
ZZ Z +∞ Z +∞
−x
f (x, y)dxdy = e dx e−y dy = 1.
R2 0 0
https://myfsth.wordpress.com -79-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
1 − x2 +y2
f (x, y) = e 2
2π
X a pour densité :
Z +∞ Z +∞
1 − x2 +y2 1 x2 1 y2 1 x2
fX (x) = e 2 dy = √ e− 2 √ e− 2 dy = √ e− 2 .
−∞ 2π 2π 2π 2π
| −∞ {z }
=1
Théorème 6.2. Théorème de transfert Soit (X, Y ) un couple de densité f et ϕ une fonction
de R2 dans R telle que |ϕ|f soit intégrable sur R2 . Alors, ϕ(X, Y ) possède une espérance, et
on a ZZ
E (ϕ(X, Y )) = ϕ(x, y)f (x, y)dxdy.
R2
6.2.3 Indépendance
Définition 6.8. On dit que X et Y sont indépendantes si
https://myfsth.wordpress.com -80-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
https://myfsth.wordpress.com -81-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
L’espérance de Y .
Z +∞ Z +∞
E(Y ) = yfY (y)dy = 2ye−2y dy
−∞ 0
Z +∞ +∞
+∞ 1 −2y
= −ye−2y 0 + −2y
e dy = 0 + − e
0 2 0
1
E(Y ) = .
2
Dans le cas particulier où h(X, Y ) = (X −E(X))(Y −E(Y )), ceci définie la covariance
de X et Y .
Cov(X, Y ) = E (X − E(X))(Y − E(Y )) ,
Définition 6.9. On appelle covariance de X et Y le réel, s’il existe
Cov(X, Y ) = E (X − E(X))(Y − E(Y )) ,
Proposition 6.5.
1) Cov(X, Y ) = E(XY ) − E(X)E(Y ).
2) Cov(X, Y ) = Cov(Y, X).
3) Cov(X + Y, Z) = Cov(X, Y ) + Cov(X, Z).
4) Cov(aX + b, Y ) = aCov(X, Y ), ∀(a, b) ∈ R2 .
5) V (X + Y ) = V (X) + V (Y ) + 2Cov(X, Y ).
6) |Cov(X, Y )| ≤ σ(X)σ(Y ).
7) Si X et Y sont indépendantes, alors Cov(X, Y ) = 0.
Remarque 6.5. Si X et Y sont deux variables aléatoires indépendantes, alors
Z Z Z Z
E(XY ) = xyf (x, y)dx dy = xyfX (x)fY (y)dx dy
R2 R 2
Z Z
= xfX (x)dx yfY (y)dy
R R
E(XY ) = E(X)E(Y ).
Par consequent Cov(X, Y ) = E(XY ) − E(X)E(Y ) = 0.
Attention : la réciproque est généralement fausse, c-à-d si deux variables aléatoires ont une
covariance nulle, elles ne sont pas forcement indépendantes.
Définition 6.10. On appelle coefficient de corrélation linéaire de X et Y le réel, s’il existe
Cov(X, Y )
r(X, Y ) = .
σ(X)σ(Y )
On a alors
|r(X, Y )| ≤ 1.
https://myfsth.wordpress.com -82-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
https://myfsth.wordpress.com -83-
MIP/FSTH Statistiques Descriptives et Probabilités 2020-2021
Z Z Z R Z R Z R Z R
1 1
E(XY ) = f (x, y)dx dy = 2
xydx dy = xdx ydy = 0.
R2 −R −R πR πR2 −R −R
Donc Cov(X, Y ) = 0.
Remarquer qu’on a un exemple de variables aléatoires dont la covariance est nulle,
pourtant elles ne sont pas indépendantes.
https://myfsth.wordpress.com -84-