M147 - Cours (Alternatif 2) PDF

STATISTIQUE ET PROBABILITÉS
PARCOURS MIP : MODULE M147
Prof. AZIZA BELMAATI
A.U. : 2019-2020
Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 1 / 105

Partie I
Statistique

Introduction
Plan
1 Introduction
2 Statistique descriptive à une dimension
3 Statistique descriptive à deux dimensions

Introduction
Définition
Statistique
Statistiques

Introduction
Définition
Statistique
Statistiques
- Une discipline scientifique.

Introduction
Définition
Statistique
Statistiques
- L’ensemble des méthodes

permettant de recueillir, de
classer, de présenter et
d’analyser les informations
relatives à des phénomènes
que l’on cherche à expliquer
pour en tirer des conclusions,
faire des prévisions et prendre
des décisions judicieuses.

Introduction
Définition
Statistique
Statistiques
- Un ensemble de données
- L’ensemble des méthodes chiffrées contenant des
permettant de recueillir, de informations sur un
classer, de présenter et phénomène précis.
d’analyser les informations
relatives à des phénomènes
que l’on cherche à expliquer -Les résultats calculés à partir
pour en tirer des conclusions, des données.
faire des prévisions et prendre
des décisions judicieuses.

Introduction
Exemples
1 Etudier le réchauffement de la planète.
2 Eudier l’efficacilé d’un vaccin à stopper la progression d’un virus.
3 Etudier la relation entre le cancer du poumon et la fumée de la cigarette.
4 Améliorer la durée de vie d’une lampe électrique.

Introduction
Exemple
Par exemple, si on fait de la santé publique, on peut s’intéresser aux troubles

psychiatriques que présentent les détenus incarcérés. Pour ce faire, on va
réaliser une étude à l’aide de questionnaires, où l’on va renseigner
l’âge des détenus,
leur profession,
leur nombre d’enfants,
l’existence d’une personnalité pathologique,
d’une dépression,
d’une schizophrénie,
etc.....

Introduction
Exemple

leur profession,
etc.....

Introduction
Exemple

leur profession,
etc.....

Introduction
Exemple

leur profession,
etc.....

Introduction
Exemple

leur profession,
etc.....

Introduction
Exemple

leur profession,
etc.....

Introduction
Exemple

leur profession,
etc.....

Introduction
Exemple

leur profession,
etc.....

Introduction
Exemple : Étude santé mentale en prison
L’étude a été réalisée pendant les années 2003 et 2004.

Certain nombre d’établissements carcéraux ont été tirés au sort parmi les
maisons d’arrêts, les centres de détention et les maisons centrales en
France.
Dans un second temps, 799 hommes détenus ont été tirés au sort parmi
ces établissements.
Chacun des détenu a été interrogé par deux enquêteurs l’un
psychologue et l’autre psychiatre.
retour

Introduction

France.
retour

Introduction

France.
retour

Introduction

France.
retour

Introduction
Etapes d’une étude statistique
1 Collecte des données : recueillir les informations adéquates mais

partielles sur le phénomène qui serviront de base à l’étude.
2 Analyse statistique :
1 Statistique descriptive : techniques permettant de dépouiller les données

recueillies, de les mettre sous forme de tableaux, graphiques. . .et d’engager
les caractéristiques essentielles (moyenne, proportion. . .)
2 Statistique inférentielle : tirer des conclusions sur tout le phénomène à partir

de données partielles.

Introduction




Introduction




Introduction




Introduction
Vocabulaire
Population : Ensemble complet des personnes ou objets sur lesquels on

veut effectuer l’étude.
Individu : Chacun des éléments de la population.
Echantillon : Groupe restreint d’individus prélevés dans la population

définie au préalable.
Taille d’un échantillon : Le nombre de ses individus.
Caractère : Caractéristique relative à chacun des individus de la

population et sur laquelle on veut faire porter l’étude. Il est soit observé
soit mesuré.
Modalité : Les différents aspects ou valeurs que peut prendre un

caractère.

Introduction
Vocabulaire



soit mesuré.

caractère.

Introduction
Vocabulaire



soit mesuré.

caractère.

Introduction
Vocabulaire



soit mesuré.

caractère.

Introduction
Vocabulaire



soit mesuré.

caractère.

Introduction
Vocabulaire



soit mesuré.

caractère.

Introduction
Vocabulaire
On distingue deux types de caractères :
Caractère quantitatif : Dont les modalités sont mesurables. Il est souvent

appelé variable statistique.
1 Variable statistique discrète : C’est une variable numérique discontinue dont
les modalités sont les résultats d’un dénombrement.
2 Variable statistique continue : Pour laquelle toutes les modalités sont a priori
différentes. Généralement, on est amené à regrouper les données en
classes.
Caractère qualitatif : Dont les modalités sont des qualités réparties en
classes, elles n’ont pas de valeurs numériques.
1 Caractère qualitatif ordinal : Dont les modalités peuvent être ordonnées
selon une certaine hiérarchie.
2 Caractère qualitatif nominal : Pour lequel les modalités ne peuvent pas être
hiérarchisées : elles sont nommées mais pas ordonnées.

Introduction
Vocabulaire

classes.

Introduction
Vocabulaire

classes.

Introduction
Vocabulaire

classes.

Introduction
Vocabulaire

classes.

Introduction
Vocabulaire

classes.

Statistique descriptive à une dimension
Plan
1 Introduction

I- Organisation des données
II- Réduction des données

Chapitre I

Statistique descriptive à une dimension I- Organisation des données
Organisation des données
1 Tableau statistique
2
Représentation graphique

Tableau Statistique
TABLE – Les statistiques des détenus vis à vis leur profession

Profession Effectifs Fréquences
ni fi
agriculteur 6 0,008
artisan 90 0,113
autre 31 0,039
cadre 24 0,030
employé 135 0,169
ouvrier 227 0,284
prof.intermédiaire 58 0,073
sans emploi 222 0,278
Total 773 1

Tableau Statistique
TABLE – Les statistiques des détenus vis à vis le nombre d’enfants
Nombre Effectifs Fréquences Eff. cumulés Fq. cumulées
d’enfants ni fi (en %) Ni Fi (en %)
0 214 27,7 214 27,7
1 220 28,5 434 51,1
2 125 16,2 559 72,3
3 101 13,1 660 85,4
4 55 7,1 715 92,5
5 31 4 746 96,5
6 7 0,9 753 97,4
7 7 0,9 760 98,3
8 7 0,9 767 99,2
9 2 2,6 769 99,5
10 2 2,6 771 99,7
11 1 1,3 772 99,8
12 0 0 772 99,8
13 1 1,3 773 100
Total 773 100

Tableau Statistique
TABLE – Les statistiques des détenus vis à vis leur âge
age Effectifs Fréquences Fréquences cumulées

ni fi Fi
[19, 29[ 212 0,266 0,266
[29, 39[ 214 0,269 0,535
[39, 49[ 185 0,232 0,767
[49, 59[ 115 0,144 0,911
[59, 69[ 49 0,061 0,972
[69, 79[ 18 0,023 0,995
[79, 89[ 4 0,005 1
Total 797 1

Représentations graphiques

Cas de caractère qualitatif

Diagramme en tuyaux d’orgue (ou à rectangle)
On représente chaque modalité par un rectangle de base constante, et de

hauteur égale à la fréquence (ou à l’effectif) de la modalité.
Exemple : Détenus vis à vis leur profession.

200
150
100
50
0
tre
e
an
r
e
r
ur
oi
ie
te
dr
oy
pl
te
au
tis
vr
.in
ca
pl
em
ul
ou
ar
of
em
ric
pr
ns
ag
sa


Diagramme circulaire (ou sectoriel)
Chaque modalité est représentée par un secteur dont l’angle est proportionnel
à l’effectif. La totalité de la circonférence (360◦ ) correspond à l’effectif total.

Profession Effectifs Fréquences Angle (en degré)
ni fi αi = 360 × fi
agriculteur 6 0,008 2,7
artisan 90 0,113 40,55
autre 31 0,039 13,97
cadre 24 0,030 10,81
employé 135 0,169 60,83
ouvrier 227 0,284 102,28
prof.intermédiaire 58 0,073 26,13
sans emploi 222 0,278 100,03
Total 773 1


Diagramme circulaire (ou sectoriel)
Chaque modalité est représentée par un secteur dont l’angle est proportionnel
à l’effectif. La totalité de la circonférence (360◦ ) correspond à l’effectif total.
employe
cadre
autre
artisan
agriculteur
ouvrier
sans emploi
prof.inter

Cas d’une v.s.d

Diagramme en bâtons
Chaque modalité du caractère est représentée par un trait vertical dont la

hauteur est proportionnelle à l’effectif correspondant.
Exemple : Détenus selon le nombre d’enfants.
250
200
150
Effectifs
100
50
0
0 1 2 3 4 5 6 7 8 9 10 11 13
Modalités

Cas d’une v.s.d

Polygone des fréquences
Le polygone des fréquences est construit en joignant par des segments de

droites les sommets des bâtons du diagramme en bâtons.
Exemple : Détenus selon le nombre d’enfants. d’une localité.

250
200
150
Effectifs
100
50
0
0 1 2 3 4 5 6 7 8 9 10 11 13
Modalités

Cas d’une v.s.d

Courbe cumulative
Définition 1
A partir des effectifs cumulés Ni , on définit la fonction de répartition des
effectifs, notée G(x), définie de IR dans [0, N], par :
G(x) est égale au nombre des individus de la population pour lesquels la
valeur du caractère est inférieure ou égale à x (G(x) = effectif cumulé de x).
Définition 2
A partir des fréquences cumulées Fi , on définit la fonction de répartition des
fréquences, notée F (x), définie de IR dans [0, 1], par :
F (x) est égale à la proportion des individus de la population pour lesquels la
valeur du caractère est inférieure ou égale à x. (F (x) = fréquence cumulé de
x)

Cas d’une v.s.d

Courbe cumulative
Définition 1
A partir des effectifs cumulés Ni , on définit la fonction de répartition des
effectifs, notée G(x), définie de IR dans [0, N], par :
G(x) est égale au nombre des individus de la population pour lesquels la
valeur du caractère est inférieure ou égale à x (G(x) = effectif cumulé de x).
Définition 2
A partir des fréquences cumulées Fi , on définit la fonction de répartition des
fréquences, notée F (x), définie de IR dans [0, 1], par :
F (x) est égale à la proportion des individus de la population pour lesquels la
valeur du caractère est inférieure ou égale à x. (F (x) = fréquence cumulé de
x)

Cas d’une v.s.d

Courbe cumulative
D’où la fonction de répatition de effectifs est donnée par :

G(x) = 0 si x < x1
G(x) = Ni si xi ≤ x < xi+1 1 ≤ i ≤ k − 1
G(x) = N si x ≥ xk
Et la fonction de répartition des fréquences est donnée par :

F (x) = 0 si x < x1
F (x) = Fi = F (xi ) si xi ≤ x < xi+1
F (x) = Fk = F (xk ) = 1 si x ≥ xk
G(x)
on a : F (x) = N

Cas d’une v.s.d

Courbe cumulative
D’où la fonction de répatition de effectifs est donnée par :

G(x) = 0 si x < x1
G(x) = Ni si xi ≤ x < xi+1 1 ≤ i ≤ k − 1
G(x) = N si x ≥ xk

F (x) = 0 si x < x1
F (x) = Fi = F (xi ) si xi ≤ x < xi+1
F (x) = Fk = F (xk ) = 1 si x ≥ xk
G(x)
on a : F (x) = N

Courbe cumulative pour une v.s.d
Courbe des fréquences cumulées
1.0
0.8
Fréquences cumulées
0.6
0.4
0.2
0.0
0 5 10
Nombre d'enfants

Cas d’une v.s.c

Histogramme
Pour construire l’histogramme, on associe à chaque classe un rectangle dont

la base est égale à l’amplitude de la classe et dont la hauteur hi est telle que
sa surface Si soit proportionnelle à la fréquence (ou à l’effectif de la classe).
Si = ai ∗ hi = c ∗ fi (ou c ∗ ni )
hi est appelée la fréquence corrigée (ou effectifs corrigés) de la i ieme classe.
Pour le choix de la constante c on distingue 3 cas :

1 Cas d’amplitudes égales.
2 Cas d’amplitudes différentes et on ne veut construire que l’histogramme.
3 Cas d’amplitudes différentes et on veut construire l’histogramme et le
polygone des fréquences.

er
1 cas
Histogramme
age Effectifs Fréquences Amplitude

ni = hi fi ai
[19, 29[ 212 0,266 10
[29, 39[ 214 0,269 10
[39, 49[ 185 0,232 10
[49, 59[ 115 0,144 10
[59, 69[ 49 0,061 10
[69, 79[ 18 0,023 10
[79, 89[ 4 0,005 10
Total 797 1

er
1 cas
Histogramme
Les amplitudes des classes sont toutes égales à ai alors on prend (c = ai ) et

on a hi = ni (ou fi ) pour tout i
250
200
150
Effectifs
100
50
0
9 19 29 39 49 59 69 79 89 99
Pr. A. BELMAATI age

MODULE M147 A.U. : 2019-2020 26 / 105
er
1 cas
Polygone des fréquences
Le polygone des fréquences est représenté en joignant les milieux des côtés
supérieurs des rectangles dans un histogramme. C’est une ligne brisée dont
les extrémités rejoignent l’axe des abscisses.
250
200
150
Effectifs
100
50
0

eme
2 cas
Histogramme seulement
On choisit parmi les ai une amplitude de référence que l’on note ar et on

prend (c = ar ), d’où on a
ar
hi = ∗ ni
ai
age Effectifs Fréquences Amplitude hi = 10

ai
∗ ni
ni fi ai (ar = 10)
[15, 25[ 114 0,143 10 114
[25, 45[ 435 0,546 20 217,5
[45, 65[ 211 0,265 20 105,5
[65, 75[ 30 0,038 10 30
[75, 85[ 7 0,009 10 7
Total 797 1

eme
2 cas
Histogramme seulement
On choisit parmi les ai une amplitude de référence que l’on note ar et on

prend (c = ar ), d’où on a
ar
hi = ∗ ni
ai
250
200
150
Effectifs
100
50
0
5 15 25 45 65 75 85 95
age

eme
3 cas
Histogramme et polygone des fréquences
On choisit parmi les ai une amplitude de référence que l’on note

ar = p.g.c.d(ai ) et on prend (c = ar ), d’où on a
ar
hi = ∗ ni
ai
Faux
250
250
200
200
150
150
Effectifs
Effectifs
100
100
50
50
0
5 25 45 65 85
Pr. A. BELMAATI age MODULE M147 age A.U. : 2019-2020 29 / 105

Courbe cumulative
Comme pour le cas discret, on définit pour un caractère continu une fonction
de répartition à partir des effectifs cumulés ou à partir des fréquences
cumulées.
Par définition, on a :
Ni = G(xi+1 ), pour 1≤i ≤k
Fi = F (xi+1 ), pour 1≤i ≤k
G(x1 ) = F (x1 ) = 0
avec Ni (resp. Fi ) est l’effectif cumulé (resp. la fréquence cumulée) de la

classe [xi ; xi+1 [.

Courbe cumulative
La fonction de répartition des effectifs G(x) et la fonction de répartition des

fréquences F (x) sont définies par :
G(x) = 0 si x ≤ x1
G(x )−G(x )
G(x) = G(xi ) + (x − xi ) xi+1 −x i si xi ≤ x ≤ xi+1 1 ≤ i ≤ k
i+1 i
G(x) = N si x ≥ xk+1

F (x) = 0 si x ≤ x1
F (x )−F (x )
F (x) = F (xi ) + (x − xi ) xi+1 −x i si xi ≤ x ≤ xi+1 1 ≤ i ≤ k
i+1 i
F (x) = 1 si x ≥ xk +1

Courbe cumulative
La fonction de répartition des effectifs G(x) et la fonction de répartition des

fréquences F (x) sont définies par :
G(x) = 0 si x ≤ x1
G(x )−G(x )
G(x) = G(xi ) + (x − xi ) xi+1 −x i si xi ≤ x ≤ xi+1 1 ≤ i ≤ k
i+1 i
G(x) = N si x ≥ xk+1

F (x) = 0 si x ≤ x1
F (x )−F (x )
F (x) = F (xi ) + (x − xi ) xi+1 −x i si xi ≤ x ≤ xi+1 1 ≤ i ≤ k
i+1 i
F (x) = 1 si x ≥ xk +1

Courbe cumulative
Dans le cas d’une v.s.c, la courbe cumulative (ou la courbe des fréquences
cumulées) est la représentation graphique de la fonction de répartition, notée
F (x),
age Effectifs Effectifs cumulés

ni Ni
[15, 25[ 114 114
[25, 45[ 435 549
[45, 65[ 211 760
[65, 75[ 30 790
[75, 85[ 7 797
Total 797

Courbe cumulative
Dans le cas d’une v.s.c, la courbe cumulative (ou la courbe des fréquences
cumulées) est la représentation graphique de la fonction de répartition, notée
F (x),
800
600
Effectifs cumulés
400
200
0
5 15 25 45 65 75 85 95
age
Statistique descriptive à une dimension II- Réduction des données
Réduction des données
1 Les paramètres de position ou de tendance centrale sont :
−− Le mode
−− La médiane
−− Les quantile
−− La moyenne
2 Les paramètres de dispersion sont :
−− L’étendue.
−− L’écart inter-quantile.
−− La variance, l’écart-type.
−− Le coefficient de variation.
−− La boite à moustache (boxplot).

Paramètres de tendance centrale

Le mode
Définition
Le mode, noté M0 , est la modalité du caractère de plus grand effectif (ou la
plus grande valeur de la fréquence). C’est la modalité la plus fréquente.

Le mode
Détermination pratique : Cas d’un caractère qualitatif
Exemple : Les statistiques des détenus vis à vis leur profession

Le mode noté M0 =”ouvrier”
Profession Effectifs Fréquences

ni fi
agriculteur 6 0,008
artisan 90 0,113
autre 31 0,039
cadre 24 0,030
employé 135 0,169
ouvrier 227 0,284
prof.intermédiaire 58 0,073
sans emploi 222 0,278
Total 773 1

Le mode
Détermination pratique : Cas d’un caractère qualitatif
Exemple : Les statistiques des détenus vis à vis leur profession

Le mode noté M0 =”ouvrier”
200
150
100
50
0
tre
e
an
r
e
r
ur
oi
ie
te
dr
oy
pl
te
au
tis
vr
.in
ca
pl
em
ul
ou
ar
of
em
ric
pr
ns
ag
sa

Le mode
Détermination pratique : Cas de v.s.d
Les statistiques des détenus vis à vis le nombre d’enfants : le mode est
M0 = 1.
0 214 27,7 214 27,7
1 220 28,5 434 51,1
2 125 16,2 559 72,3
3 101 13,1 660 85,4
4 55 7,1 715 92,5
5 31 4 746 96,5
6 7 0,9 753 97,4
7 7 0,9 760 98,3
8 7 0,9 767 99,2
9 2 2,6 769 99,5
10 2 2,6 771 99,7
11 1 1,3 772 99,8
12 0 0 772 99,8
13 1 1,3 773 100

Le mode
Les statistiques des détenus vis à vis le nombre d’enfants : le mode est
M0 = 1.
250
200
150
Effectifs
100
50
0
0 1 2 3 4 5 6 7 8 9 10 11 13
Modalités

Le mode
Détermination pratique : Cas de v.s.c
On détermine d’abord la classe modale à partir de l’histogramme : la classe

qui correspond à la plus grande fréquence corrigée (ou plus grand effectif
corrigé). Puis, à l’intérieur de cette classe on détermine une valeur approchée
du mode soit par :
1 La méthode graphique.
2 La méthode algébrique (d’interpolation)
∆1
M0 = xi + ai ∗
∆1 + ∆ 2
avec ∆1 = hi − hi−1 et ∆2 = hi − hi+1

Le mode
Exemple : Les statistiques des détenus vis à vis leur âge.

age Effectifs Fréquences Amplitude hi = 10
ai
∗ ni
ni fi ai (ar = 10)
[15, 25[ 114 0,143 10 114
[25, 45[ 435 0,546 20 217,5
[45, 65[ 211 0,265 20 105,5
[65, 75[ 30 0,038 10 30
[75, 85[ 7 0,009 10 7
Total 797 1
La classe modale est [25, 45[, d’où
M0 = 25 + 20 ∗ (217.5 − 114)/(2 ∗ 217.5 − 105.5 − 114) = 34.61 ans

Le mode
250
200
150
Effectifs
100
50
0
5 15 25 45 65 75 85 95
age

La moyenne
Définition
La moyenne arithmétique d’une distribution statistique (xi , ni )1≤i≤n que l’on
note X̄ , est la modalité donnée par :
k k
1X X
X̄ = ni xi = fi xi
n
i=1 i=1
Les xi sont les modalités dans le cas d’une v.s.d et les centres des classes
dans le cas d’une v.s.c.
N.B
Ne jamais exprimer les fi en pourcentage pour calculer X̄ .

La moyenne
TABLE – Les statistiques des détenus vis à vis le nombre d’enfants

Nombre Effectifs Fréquences
ni ∗ xi fi ∗ xi
d’enfants (xi ) ni fi (en %)
0 214 0.28 0 0
1 220 0.28 220 0.28
2 125 0.16 250 0.32
3 101 0.13 303 0.39
4 55 0.07 220 0.28
5 31 0.04 155 0.20
6 7 0.01 42 0.05
7 7 0.01 49 0.06
8 7 0.01 56 0.07
9 2 0.003 18 0.02
10 2 0.003 20 0.03
11 1 0.001 11 0.01
12 0 0 0 0
13 1 0.001 13 0.02
Total 773 1 1375 1.76

La moyenne

age Effectifs Fréquences
ci ni ∗ ci fi ∗ ci
ni fi
[15, 25[ 114 0,143 20 2280 2.86
[25, 45[ 435 0,546 35 15225 19.10
[45, 65[ 211 0,265 55 11605 14.56
[65, 75[ 30 0,038 70 2100 2.63
[75, 85[ 7 0,009 80 560 0.70
Total 797 1 31770 39.86

Propriétés de la moyenne arithmétique

1 Si X est une v.s.(variable statistique) constante c.à.d chaque individu
dans la population admet la même modalité a, alors X̄ = a
2 Si X est une v.s. de moyenne X̄ , et a et b deux réels, alors la moyenne
de la v.s. Y = aX + b est :
Ȳ = aX̄ + b
3 Si une population P de taille n est composée de m sous-populations
P1 , P2 , . . . , Pm , de tailles respectives n1 , n2 , . . . , nm et de moyennes
respectives x̄1 , x̄2 , . . . , x̄m . Alors la moyenne x̄ de P est donnée par :
m
1X
x̄ = ni x̄i
n
i=1
Exemple
Soit P une population composée de deux sous-populations P1 et P2 de
moyennes et effectifs respectifs (X̄1 = 5.5 ; n1 = 10) et (X̄2 = 8.3 ; n2 = 14).
Alors la moyenne de la population est :
1
X̄ = (10 ∗ 5.5 + 14 ∗ 8.3) = 7.13
10 + 14

Ȳ = aX̄ + b
m
1X
x̄ = ni x̄i
n
i=1
Exemple
1
X̄ = (10 ∗ 5.5 + 14 ∗ 8.3) = 7.13
10 + 14

Ȳ = aX̄ + b
m
1X
x̄ = ni x̄i
n
i=1
Exemple
1
X̄ = (10 ∗ 5.5 + 14 ∗ 8.3) = 7.13
10 + 14

Ȳ = aX̄ + b
m
1X
x̄ = ni x̄i
n
i=1
Exemple
1
X̄ = (10 ∗ 5.5 + 14 ∗ 8.3) = 7.13
10 + 14

Ȳ = aX̄ + b
m
1X
x̄ = ni x̄i
n
i=1
Exemple
1
X̄ = (10 ∗ 5.5 + 14 ∗ 8.3) = 7.13
10 + 14
La médiane
Définition
On appelle médiane la modalité, notée Me , qui partage la population en deux
sous populations de même effectif : le nombre d’observations inférieures à Me
est égal au nombre d’observations supérieures à Me .
Remarque
Cette définition n’a de sens que si les modalités sont toutes ordonnées par
ordre croissant.

La médiane
Définition
On appelle médiane la modalité, notée Me , qui partage la population en deux
sous populations de même effectif : le nombre d’observations inférieures à Me
est égal au nombre d’observations supérieures à Me .
Remarque
Cette définition n’a de sens que si les modalités sont toutes ordonnées par
ordre croissant.

La médiane
Soient x1 , x2 , . . . , xn la série brute d’une v.s.d et x(1) , x(2) , . . . , x(n) la série

ordonnée (ordre croissant) correspondante.
On distingue deux cas selon la parité de n :
n+1
1 Si n est impair, la médiane est la modalité de rang 2 , soit :
Me = x n+1
2
2 Si n est pair, on dit qu’on a un intervalle médian [x n2 , x n2 +1 ], et on prend

pour médiane le centre de cet intervalle, soit :
x n2 + x n2 +1
Me =
2

La médiane
Soient x1 , x2 , . . . , xn la série brute d’une v.s.d et x(1) , x(2) , . . . , x(n) la série

ordonnée (ordre croissant) correspondante.
On distingue deux cas selon la parité de n :
n+1
1 Si n est impair, la médiane est la modalité de rang 2 , soit :
Me = x n+1
2
2 Si n est pair, on dit qu’on a un intervalle médian [x n2 , x n2 +1 ], et on prend

pour médiane le centre de cet intervalle, soit :
x n2 + x n2 +1
Me =
2

La médiane
Détermination pratique : Cas de v.s.d : Exemples
Exemple1 : On considère le nombre de voiture louées par jour par un garage

pendant une semaine.
Série brute : 3, 2, 2, 3, 5, 6, 5.
Série ordonnée : 2, 2, 3, 3, 5, 5, 6.
| {z } | {z }
Me = x 7+1 = 3
2
Exemple2 : On considère les notes sur 20 de 8 étudiants.

La série brute : 9, 13, 11, 15, 9, 8, 12, 10.
La série ordonnée : 8, 9, 9, 10, 11, 12, 13, 15.
| {z } | {z }
Alors, on a un intervalle médian [x 8 , x 8 +1 ].
2 2
10 + 11
Me = = 10.5
2

La médiane
Exemple1 : On considère le nombre de voiture louées par jour par un garage

pendant une semaine.
Série brute : 3, 2, 2, 3, 5, 6, 5.
Série ordonnée : 2, 2, 3, 3, 5, 5, 6.
| {z } | {z }
Me = x 7+1 = 3
2
Exemple2 : On considère les notes sur 20 de 8 étudiants.

La série brute : 9, 13, 11, 15, 9, 8, 12, 10.
La série ordonnée : 8, 9, 9, 10, 11, 12, 13, 15.
| {z } | {z }
Alors, on a un intervalle médian [x 8 , x 8 +1 ].
2 2
10 + 11
Me = = 10.5
2

La médiane
Exemple3 :
0 214 27,7 214 27,7
1 220 28,5 434 51,1
2 125 16,2 559 72,3
3 101 13,1 660 85,4
4 55 7,1 715 92,5
5 31 4 746 96,5
6 7 0,9 753 97,4
7 7 0,9 760 98,3
8 7 0,9 767 99,2
9 2 2,6 769 99,5
10 2 2,6 771 99,7
11 1 1,3 772 99,8
12 0 0 772 99,8
13 1 1,3 773 100

La médiane
La médiane est unique, c’est la valeur qui correspond à la fréquence cumulée

0.5, c’est à dire (F (Me ) = 0.5).
Elle peut être déterminée par l’une des deux méthodes :
1 Méthode d’interpolation : On situe d’abord la médiane à l’intérieur d’une
classe [xi , xi+1 [, appelée classe médiane telle que :
Fi ≤ 0.5 < Fi+1 ⇔ xi ≤ Me < xi+1
puis on calcule la médiane Me par interpolation linéaire dans cette

classe. D’où :
0.5 − Fi
Me = xi + (ai )
Fi+1 − Fi
2 Méthode graphique : On trace la courbe cumulative et on détermine Me
comme l’abscisse du point de la courbe d’ordonnée 0.5 (ou 50%).

La médiane
La médiane est unique, c’est la valeur qui correspond à la fréquence cumulée

0.5, c’est à dire (F (Me ) = 0.5).
Fi ≤ 0.5 < Fi+1 ⇔ xi ≤ Me < xi+1

classe. D’où :
0.5 − Fi
Me = xi + (ai )
Fi+1 − Fi
comme l’abscisse du point de la courbe d’ordonnée 0.5 (ou 50%).

La médiane
La médiane est unique, c’est la valeur qui correspond à l’effectf cumulé N/2,
c’est à dire (G(Me ) = N/2).
Ni ≤ 0.5 < Ni+1 ⇔ xi ≤ Me < xi+1

classe. D’où :
N/2 − Ni
Me = xi + (ai )
Ni+1 − Ni
comme l’abscisse du point de la courbe d’ordonnée N/2.

La médiane
La médiane est unique, c’est la valeur qui correspond à l’effectf cumulé N/2,
c’est à dire (G(Me ) = N/2).
Ni ≤ 0.5 < Ni+1 ⇔ xi ≤ Me < xi+1

classe. D’où :
N/2 − Ni
Me = xi + (ai )
Ni+1 − Ni
comme l’abscisse du point de la courbe d’ordonnée N/2.

La médiane
Détermination pratique : Cas de v.s.c : Exemple

Ni
ni fi Fi
[19, 29[ 212 212 0,266 0,266
[29, 39[ 214 426 0,269 0,535
[39, 49[ 185 611 0,232 0,767
[49, 59[ 115 726 0,144 0,911
[59, 69[ 49 775 0,061 0,972
[69, 79[ 18 793 0,023 0,995
[79, 89[ 4 797 0,005 1
Total 797 1
La classe médiane est [29, 39[, d’où
Me = 29+10∗(0.5−0.27)/(0.54−0.27) = 29+10∗(398.5−212)/(426−212) = 37.

La médiane
Détermination pratique : Cas de v.s.c : Exemple
800
600
Effectifs cumulés
F(Me)
400
200
0
Me
9 19 29 39 49 59 69 79 89
Age

Les quantiles
Définition
Le quantile (ou fractile) d’ordre p (0 ≤ p ≤ 1), noté Zp , d’une série statistique
est la modalité déterminée telle que la proportion (resp. l’effectif) des individus
ayant une modalité inférieure ou égale à Zp soit égale à p (resp. Np). On écrit
F (Zp ) = p (resp. G(Zp ) = Np).
Remarque
La médiane est le quantile d’ordre p = 1/2 (resp. N/2).

Les quantiles
Quantiles particuliers
1 Quartile : avec, p = 1/4; p = 2/4; p = 3/4
on trouve les 3 quartiles respectifs, notés
Q1 = Z0.25 ; Q2 = Z0.5 = Me ; Q3 = Z0.75

2 Décile : avec, p = 1/10; p = 2/10; . . . , p = 9/10
on trouve les 9 déciles respectifs, notés
D1 = Z0.1 ; D2 = Z0.2 ; . . . ; D9 = Z0.9

3 Centile (ou percentile) : avec, p = 1/100; p = 2/100; . . . ; p = 99/100
on trouve les 99 centiles respectifs, notés
C1 = Z0.01 ; C2 = Z0.02 ; . . . ; C99 = Z0.99

Les quantiles
Q1 = Z0.25 ; Q2 = Z0.5 = Me ; Q3 = Z0.75

2 Décile : avec, p = 1/10; p = 2/10; . . . , p = 9/10
D1 = Z0.1 ; D2 = Z0.2 ; . . . ; D9 = Z0.9

C1 = Z0.01 ; C2 = Z0.02 ; . . . ; C99 = Z0.99

Les quantiles
Q1 = Z0.25 ; Q2 = Z0.5 = Me ; Q3 = Z0.75

2 Décile : avec, p = 1/10; p = 2/10; . . . , p = 9/10
D1 = Z0.1 ; D2 = Z0.2 ; . . . ; D9 = Z0.9

C1 = Z0.01 ; C2 = Z0.02 ; . . . ; C99 = Z0.99

Les quantiles
Détermination algébrique : Cas de v.s.d
Soit {(xi , ni )1≤i≤k } une distribution statistique discrète ordonnée : et soient

N1 , N2 , . . . , Nk les effectifs cumulés correspondants.
On distingue deux cas :
Le cas où p ∗ N 6= Ni ∀i = {1, . . . , k } : Dans ce cas, on considère que le
quantile d’ordre p est la modalité correspondante la plus petite valeur
d’effectif cumulé strictement supérieure à p ∗ N.
Le cas où il existe i = {1, . . . , k } tel que p ∗ N = Ni : Dans ce cas, on

considère qu’on a une classe médiane [xi , xi+1 ] et le quantile d’ordre p
est le centre de la classe médiane càd Zp = 12 (xi + xi+1 ).

Les quantiles
Soit {(xi , ni )1≤i≤k } une distribution statistique discrète ordonnée : et soient

N1 , N2 , . . . , Nk les effectifs cumulés correspondants.
On distingue deux cas :
Le cas où p ∗ N 6= Ni ∀i = {1, . . . , k } : Dans ce cas, on considère que le
quantile d’ordre p est la modalité correspondante la plus petite valeur
d’effectif cumulé strictement supérieure à p ∗ N.
Le cas où il existe i = {1, . . . , k } tel que p ∗ N = Ni : Dans ce cas, on

considère qu’on a une classe médiane [xi , xi+1 ] et le quantile d’ordre p
est le centre de la classe médiane càd Zp = 12 (xi + xi+1 ).

Les quantiles
Exemple3 :
0 214 27,7 214 27,7
1 220 28,5 434 51,1
2 125 16,2 559 72,3
3 101 13,1 660 85,4
4 55 7,1 715 92,5
5 31 4 746 96,5
6 7 0,9 753 97,4
7 7 0,9 760 98,3
8 7 0,9 767 99,2
9 2 2,6 769 99,5
10 2 2,6 771 99,7
11 1 1,3 772 99,8
12 0 0 772 99,8
13 1 1,3 773 100

Les quantiles
Détermination graphique : Cas de v.s.d
1.00
0.90
0.80
0.70
0.60
Frequence cumulee
0.50
0.40
0.30
0.20
0.10
0.00
Q1 Q2 Q3 D9 C99
D1
0 5 10

Les quantiles
1 Méthode d’interpolation : d’après le tableau statistique ou la courbe

cumulative, on détermine d’abord la classe [xi , xi+1 [ telle que :
Fi ≤ p < Fi+1 (resp. Ni ≤ np < Ni+1 ). Puis, par interpolation linéaire dans
[xi , xi+1 [, on calcule Zp tel que
p − Fi np − Ni
Zp = xi + (ai ) = xi + (ai )
Fi+1 − Fi Ni+1 − Ni
2 Méthode graphique : On trace la courbe cumulative, et on détermine Zp
comme l’abscisse du point de la courbe d’ordonnée F (Zp ) = p.

Les quantiles
Méthide d’interpolation : Cas de v.s.c : Exemple

ni fi Fi
[19, 29[ 212 0,266 0,266
[29, 39[ 214 0,269 0,535
[39, 49[ 185 0,232 0,767
[49, 59[ 115 0,144 0,911
[59, 69[ 49 0,061 0,972
[69, 79[ 18 0,023 0,995
[79, 89[ 4 0,005 1
Total 797 1
D1 ∈ [19, 29[, d’où D1 = 19 + 10 ∗ (0.1 − 0)/(0.26 − 0) = 22.85 Ans

Q1 ∈ [19, 29[, d’où Q1 = 19 + 10 ∗ (0.25 − 0)/(0.27 − 0) = 28.26 Ans
Q3 ∈ [39, 49[, d’où Q3 = 39 + 10 ∗ (0.75 − 0.54)/(0.77 − 0.54) = 48.13 Ans
D9 ∈ [49, 59[, d’où D9 = 49 + 10 ∗ (0.90 − 0.77)/(0.91 − 0.77) = 58.28 Ans

Les quantiles

ni fi Fi
[19, 29[ 212 0,266 0,266
[29, 39[ 214 0,269 0,535
[39, 49[ 185 0,232 0,767
[49, 59[ 115 0,144 0,911
[59, 69[ 49 0,061 0,972
[69, 79[ 18 0,023 0,995
[79, 89[ 4 0,005 1
Total 797 1
D1 ∈ [19, 29[, d’où D1 = 19 + 10 ∗ (0.1 − 0)/(0.26 − 0) = 22.85 Ans

Q1 ∈ [19, 29[, d’où Q1 = 19 + 10 ∗ (0.25 − 0)/(0.27 − 0) = 28.26 Ans
Q3 ∈ [39, 49[, d’où Q3 = 39 + 10 ∗ (0.75 − 0.54)/(0.77 − 0.54) = 48.13 Ans
D9 ∈ [49, 59[, d’où D9 = 49 + 10 ∗ (0.90 − 0.77)/(0.91 − 0.77) = 58.28 Ans

Les quantiles

ni fi Fi
[19, 29[ 212 0,266 0,266
[29, 39[ 214 0,269 0,535
[39, 49[ 185 0,232 0,767
[49, 59[ 115 0,144 0,911
[59, 69[ 49 0,061 0,972
[69, 79[ 18 0,023 0,995
[79, 89[ 4 0,005 1
Total 797 1
D1 ∈ [19, 29[, d’où D1 = 19 + 10 ∗ (0.1 − 0)/(0.26 − 0) = 22.85 Ans

Q1 ∈ [19, 29[, d’où Q1 = 19 + 10 ∗ (0.25 − 0)/(0.27 − 0) = 28.26 Ans
Q3 ∈ [39, 49[, d’où Q3 = 39 + 10 ∗ (0.75 − 0.54)/(0.77 − 0.54) = 48.13 Ans
D9 ∈ [49, 59[, d’où D9 = 49 + 10 ∗ (0.90 − 0.77)/(0.91 − 0.77) = 58.28 Ans

Les quantiles

ni fi Fi
[19, 29[ 212 0,266 0,266
[29, 39[ 214 0,269 0,535
[39, 49[ 185 0,232 0,767
[49, 59[ 115 0,144 0,911
[59, 69[ 49 0,061 0,972
[69, 79[ 18 0,023 0,995
[79, 89[ 4 0,005 1
Total 797 1
D1 ∈ [19, 29[, d’où D1 = 19 + 10 ∗ (0.1 − 0)/(0.26 − 0) = 22.85 Ans

Q1 ∈ [19, 29[, d’où Q1 = 19 + 10 ∗ (0.25 − 0)/(0.27 − 0) = 28.26 Ans
Q3 ∈ [39, 49[, d’où Q3 = 39 + 10 ∗ (0.75 − 0.54)/(0.77 − 0.54) = 48.13 Ans
D9 ∈ [49, 59[, d’où D9 = 49 + 10 ∗ (0.90 − 0.77)/(0.91 − 0.77) = 58.28 Ans

Les quantiles

ni fi Fi
[19, 29[ 212 0,266 0,266
[29, 39[ 214 0,269 0,535
[39, 49[ 185 0,232 0,767
[49, 59[ 115 0,144 0,911
[59, 69[ 49 0,061 0,972
[69, 79[ 18 0,023 0,995
[79, 89[ 4 0,005 1
Total 797 1
D1 ∈ [19, 29[, d’où D1 = 19 + 10 ∗ (0.1 − 0)/(0.26 − 0) = 22.85 Ans

Q1 ∈ [19, 29[, d’où Q1 = 19 + 10 ∗ (0.25 − 0)/(0.27 − 0) = 28.26 Ans
Q3 ∈ [39, 49[, d’où Q3 = 39 + 10 ∗ (0.75 − 0.54)/(0.77 − 0.54) = 48.13 Ans
D9 ∈ [49, 59[, d’où D9 = 49 + 10 ∗ (0.90 − 0.77)/(0.91 − 0.77) = 58.28 Ans

Les quantiles
Méthode graphique : Cas de v.s.c : Exemple
800
600
Effectifs cumulés
400
200
0
D1 Q1 Q3 D9
9 19 29 39 49 59 69 79 89
Age

Paramètres de dispersion

Paramètres de dispersion
Exemple introductif
On considère les notes obtenues sur 3 matières, A, B, C observées sur 6

individus.
indiv1 indiv2 indiv3 indiv4 indiv5 indiv6 Moyenne
A 12 10 7 11 11 9 10
B 20 0 0 20 0 20 10
C 10 10 10 10 10 10 10
La moyenne des 3 matières est la même mais la dispersion des notes des 6
individus est différente d’une matière à l’autre.

L’étendue
Définition
L’étendue est la différence entre la plus grande et la plus petite valeur de la
variable. pour une variable continue, l’étendue est la différence entre la borne
supérieure de la dernière classe et la borne inférieure de la première classe.
On note
e = xmax − xmin

L’étendue
Définition
L’étendue est la différence entre la plus grande et la plus petite valeur de la
variable. pour une variable continue, l’étendue est la différence entre la borne
supérieure de la dernière classe et la borne inférieure de la première classe.
On note
e = xmax − xmin
Exemple
indiv1 indiv2 indiv3 indiv4 indiv5 indiv6 Moyenne e
A 12 10 7 11 11 9 10 5
B 20 0 0 20 0 20 10 20
C 10 10 10 10 10 10 10 0
Ce paramètre présente un intérêt très limité parce qu’il est très sensible aux
valeurs extrêmes

L’écart inter-quantile.
L’écart inter-quantile est la différence entre le dernier et le premier quantile.

du coup, on définit :
1 L’écart inter-quartile, noté ∆Q est donné par Q3 − Q1
2 L’écart inter-décile, noté ∆D est donné par D9 − D1
3 L’écart inter-centile (ou percentile), noté ∆C est donné par C99 − C1







L’écart absolu moyen.
Définition
L’écart absolu moyen d’un caractère statistique X, noté Em (X ), est la
moyenne arithmétique des valeurs absolues des écarts à la moyenne :
k
1X
Em (X ) = ni |xi − X̄ |
n
i=1
les xi représentent les modalités dans le cas discret ou les centres des
classes dans le cas continu.

Variance et écart-type
Définition1
La variance d’une distribution statistique, X = (xi , ni )1≤i≤k , que l’on note
V (X ), est donnée par :
k k
1X X
V (X ) = ni (xi − X̄ )2 = fi (xi − X̄ )2
n
i=1 i=1
Pour une v.s.c les xi sont les centres des classes.
Définition2
p
L’écart-type, noté σ(X ) = V (X )
L’écart-type est donc la moyenne quadratique des écarts à la moyenne
arithmétique.

Définition1
La variance d’une distribution statistique, X = (xi , ni )1≤i≤k , que l’on note
V (X ), est donnée par :
k k
1X X
V (X ) = ni (xi − X̄ )2 = fi (xi − X̄ )2
n
i=1 i=1
Pour une v.s.c les xi sont les centres des classes.
Définition2
p
L’écart-type, noté σ(X ) = V (X )
L’écart-type est donc la moyenne quadratique des écarts à la moyenne
arithmétique.

xi ni fi fi ∗ xi ni ∗ xi2 fi ∗ xi2
0 214 0.28 0 0 0
1 220 0.28 0.28 220 0.28
2 125 0.16 0.32 500 0.65
3 101 0.13 0.39 909 1.18
4 55 0.07 0.28 880 1.14
5 31 0.04 0.20 775 1
6 7 0.01 0.05 252 0.33
7 7 0.01 0.06 343 0.44
8 7 0.01 0.07 448 0.58
9 2 0.003 0.02 162 0.21
10 2 0.003 0.03 200 0.26
11 1 0.001 0.01 121 0.16
12 0 0 0 0 0
13 1 0.001 0.02 169 0.22
Total 773 1 1.76 4979 6.44
2 2
V (X ) = p √ − (1.76) = 6.44 − (1.76) = 3.36
(4979/773)
σ(X ) = V (X ) = 3.36 = 1.83 Ans
0 214 0.28 0 0 0
1 220 0.28 0.28 220 0.28
2 125 0.16 0.32 500 0.65
3 101 0.13 0.39 909 1.18
4 55 0.07 0.28 880 1.14
5 31 0.04 0.20 775 1
6 7 0.01 0.05 252 0.33
7 7 0.01 0.06 343 0.44
8 7 0.01 0.07 448 0.58
9 2 0.003 0.02 162 0.21
10 2 0.003 0.03 200 0.26
11 1 0.001 0.01 121 0.16
12 0 0 0 0 0
13 1 0.001 0.02 169 0.22
Total 773 1 1.76 4979 6.44
2 2
V (X ) = p √ − (1.76) = 6.44 − (1.76) = 3.36
(4979/773)
σ(X ) = V (X ) = 3.36 = 1.83 Ans
0 214 0.28 0 0 0
1 220 0.28 0.28 220 0.28
2 125 0.16 0.32 500 0.65
3 101 0.13 0.39 909 1.18
4 55 0.07 0.28 880 1.14
5 31 0.04 0.20 775 1
6 7 0.01 0.05 252 0.33
7 7 0.01 0.06 343 0.44
8 7 0.01 0.07 448 0.58
9 2 0.003 0.02 162 0.21
10 2 0.003 0.03 200 0.26
11 1 0.001 0.01 121 0.16
12 0 0 0 0 0
13 1 0.001 0.02 169 0.22
Total 773 1 1.76 4979 6.44
2 2
V (X ) = p √ − (1.76) = 6.44 − (1.76) = 3.36
(4979/773)
σ(X ) = V (X ) = 3.36 = 1.83 Ans

ci fi ∗ ci fi ∗ ci2 ni ∗ ci2
ni fi
[15, 25[ 114 0,143 20 2.86 57.21 45600
[25, 45[ 435 0,546 35 19.10 668.6 532875
[45, 65[ 211 0,265 55 14.56 80.85 638275
[65, 75[ 30 0,038 70 2.63 184.44 147000
[75, 85[ 7 0,009 80 0.70 56.21 44800
Total 797 1 39.86 1767.31 1408550
V (X ) = (1408550/797) − (39.86)2 = 1767.31 − (39.86)2 = 178.34

d’où p √
σ(X ) = V (X ) = 178.34 = 13.35 Ans


ci fi ∗ ci fi ∗ ci2 ni ∗ ci2
ni fi
[15, 25[ 114 0,143 20 2.86 57.21 45600
[25, 45[ 435 0,546 35 19.10 668.6 532875
[45, 65[ 211 0,265 55 14.56 80.85 638275
[65, 75[ 30 0,038 70 2.63 184.44 147000
[75, 85[ 7 0,009 80 0.70 56.21 44800
Total 797 1 39.86 1767.31 1408550
V (X ) = (1408550/797) − (39.86)2 = 1767.31 − (39.86)2 = 178.34

d’où p √
σ(X ) = V (X ) = 178.34 = 13.35 Ans

Propriétés de la variance
1 La variance d’une série statistique X s’écrit :

k k
1X X
V (X ) = ( ni xi2 ) − X̄ 2 = ( fi xi2 ) − X̄ 2
n
i=1 i=1
2 Soient a et b deux nombres réels, on a :
V (X + b) = V (X ), V (aX + b) = a2 V (X )
3 Soit P une population de taille n, composée de m sous-population
P1 , P2 , . . . , Pm , de tailles respectives n1 , n2 , . . . , nm , de moyennes
respectives x̄1 , x̄2 , . . . , x̄m et de variances respectives V1 , V2 , . . . , Vm .
Alors la variance V de la population p est donnée par :
m m
1X 1X
V = ni Vi + ni (x̄i − x̄)2
n n
i=1 i=1
1
Pm
où x̄ = n i=1 ni x̄i est la moyenne de la population P.

k k
1X X
V (X ) = ( ni xi2 ) − X̄ 2 = ( fi xi2 ) − X̄ 2
n
i=1 i=1
V (X + b) = V (X ), V (aX + b) = a2 V (X )
m m
1X 1X
V = ni Vi + ni (x̄i − x̄)2
n n
i=1 i=1
1
Pm

k k
1X X
V (X ) = ( ni xi2 ) − X̄ 2 = ( fi xi2 ) − X̄ 2
n
i=1 i=1
V (X + b) = V (X ), V (aX + b) = a2 V (X )
m m
1X 1X
V = ni Vi + ni (x̄i − x̄)2
n n
i=1 i=1
1
Pm
Remarques
1 L’écart-type (ou La variance) est un indicateur de la dispersion d’une
série par rapport à sa moyenne.
2 La variance et l’écart-type tiennent compte de toutes les valeurs d’une
série statistique.
3 Si la variance (ou l’écart-type) est faible, cela signifie que les valeurs sont
assez concentrées autour de la moyenne.
4 Si la variance (ou l’écart-type) est élevé, cela veut dire au contraire que
les valeurs sont plus dispersées autour de la moyenne.
5 La variance (ou l’écart-type) est nulle si et seulement si toutes les valeurs
sont identiques et égales à la moyenne.

Remarques

Remarques

Remarques

Remarques

Coefficient de variation
Définition
Le coefficient de variation est un paramètre relatif de dispersion, utilisé
généralement pour comparer les dispersions de deux ou plusieurs séries
statistiques. On le note Cv et il est donné par :
σ(X )
Cv = (rapport sans unité)
X̄
Exemple :
Pour comparer entre la dispersion de nombre d’enfants chez les détenus et

leur âge, on a
Cve = 1.04 et Cva = 0.34
On dit, la variable nombre d’enfants est plus dispersée que l’autre.

Définition
σ(X )
X̄
Exemple :

leur âge, on a
Cve = 1.04 et Cva = 0.34

Définition
σ(X )
X̄
Exemple :

leur âge, on a
Cve = 1.04 et Cva = 0.34

Boı̂te à moustaches
Définition
Une boı̂te à moustaches est un récapitulatif graphique de la distribution d’un
échantillon, dont il indique la forme, la tendance centrale et la variabilité.
Il permet de comprendre la distribution statistique et de comparer un même
caractère au sein de deux ou plusieurs populations.

Méthode de construction
outliers
Q3+1.5*∆Q
age
Q3
Me
Q1
Q1−1.5*∆Q

Remarque
Généralement, les valeurs Q1 − 1.5 ∗ ∆Q et Q3 + 1.5 ∗ ∆Q ne coı̈ncident pas

avec les valeurs observées. on remplace, donc,
Q1 − 1.5 ∗ ∆Q par la plus petite valeur observée ≥ (Q1 − 1.5 ∗ ∆Q)
Q3 + 1.5 ∗ ∆Q par la plus grande valeur observée ≤ (Q3 + 1.5 ∗ ∆Q)
Exemple
Pour l’âge des détenus, on Q1 − 1.5 ∗ ∆Q = 28 − 1.5 ∗ 20 = −2 sera

remplacée par la plus petite valeur 19.
Q3 + 1.5 ∗ ∆Q = 48 + 1.5 ∗ 20 = 78, or 78 n’existe pas dans notre base de
données, il doit être remplacée par 77.

Remarque

Exemple


Remarque

Exemple


Remarque

Exemple


Interprétation
La médiane nous renseigne sur le milieu de la série.

La boı̂te nous renseigne sur la dispersion de la série. Il contient 50% de
l’ensemble des observations : 25% avant la médiane et 25% après.
La longueur des moustaches renseigne sur la dispersion des valeurs
situées au début de la série (correspondant à 25% des observations) ou
à la fin de celle-ci (les valeurs plus grandes correspondant aussi à 25%
des observations)
La boı̂te et les moustaches seront d’autant plus étendues que la
dispersion de la série statistique est grande.
Les valeurs situées à l’extérieur du diagramme sont appelées valeurs
aberrantes (anormales, extrêmes ou outliers).

Interprétation

des observations)

Interprétation

des observations)

Interprétation

des observations)

Interprétation

des observations)

Exemple de comparaison entre distribution
F IGURE – Comparaison entre la distribution des ouvriers détenus schizophrènes

versus ceux qui ne le sont pas
80
70
60
50
48 49
40
38
33
30
27 27
20
0 1

Exemple de comparaison entre distribution : Interprétation
On remarque une légère différence entre l’âge médian chez les non
schizophrènes (38) et celui des schizophrènes (33).
Il y a une symétrie d’âge par rapport à la médiane chez les non

schizophrènes. Par contre, les détenus âgés entre 33 et 49 sont les plus
atteints par la schizophrénie.
L’âge des détenus est plus dispersé chez les non schizophrènes.
On a trois âges aberrants chez les non schizophrènes.







Statistique descriptive à deux dimensions
Plan
1 Introduction

I- Tableau de contingence
Paramètres d’une série double
III- Ajustement linéaire

Chapitre II

Introduction
On considère l’étude simultanée de deux variables statistiques sur la même

population. On cherche à :
1 Étendre les notions de la statistique descriptive à une variable au cas
d’un couple de variables.
2 Déterminer la liaison qui peut exister entre elles.
3 Pouvoir expliquer les variations de l’une des variables en fonction de
l’autre.
On s’intéresse à deux variables X et Y . Chacune d’entre elles peut être, soit
quantitative, soit qualitative.
La série statistique est alors une suite de N couples des valeurs prises par les
deux variables sur chaque individu :
(x1 , y1 ), (x2 , y2 ), . . . , (xi , yi ), . . . , (xN , yN )

Remarques
1 Pour les caractères quantitatifs, on peut procéder à des regroupement en

classes pour l’un des caractères ou pour les deux caractères. On peut
ainsi, dé ?nir des séries doubles semi-continues (un seul caracère est
continu) ou continues (les deux caractères sont continus).
2 Le regroupement en classes correspond à une perte d’informations par
rapport aux données initiales. Le travail avec un tel regroupement impose
alors l’hypothèse de la répartition uniforme des données à l’intérieur de
chaque couple de classes.
3 Ainsi, à toute partie A = [a; b] × [c; d] ⊂ [xi ; xi+1 [×[yj ; yj+1 [ correspond un
effectif n(A) dé ?ni par :
(b − a)(d − c)
n(A) = nij ∗
(xi+1 − xi )(yj+1 − yj )
avec nij = effectif de la modalité ([xi ; xi+1 [, [yj ; yj+1 [) du couple (X , Y ).

Remarques

(b − a)(d − c)
n(A) = nij ∗
(xi+1 − xi )(yj+1 − yj )

Remarques

(b − a)(d − c)
n(A) = nij ∗
(xi+1 − xi )(yj+1 − yj )

Statistique descriptive à deux dimensions I- Tableau de contingence
Tableau de contingence
Définition
Les données statistiques relatives à deux variables X et Y , considérées
simultanément, sont présentées sous forme de distributions d’effectifs ou de
fréquences dans un tableau statistique, appelé tableau de contingence.
A partir de ce tableau, on peut déterminer :

1 La distribution conjointe.
2 Les distributions marginales.
3 Les distributions conditionnelles.

Tableau de contingence des effectifs conjoints et

marginaux
Y y1 y2 ... yj ... yp Total
X
x1 n11 n12 ... n1j ... n1p n1.
.. .. .. .. .. ..
. . . . . .
xi ni1 ni2 ... nij ... nip ni.
.. .. .. .. .. ..
. . . . . .
xk nk 1 nk2 ... nkj ... nkp nk .
Total n.1 n.2 ... n.j ... n.p N
nij l’effectif conjoint de xi et yj .
p
X
ni. = nij , i = 1, . . . , k l’effectif marginale de xi .
j=1
Xk
n.j = nij , j = 1, . . . , p l’effectif marginale de yj .
i=1
k Xp
X
N= nij L’effectif total.
i=1
Pr. j=1
A. BELMAATI MODULE M147 A.U. : 2019-2020 81 / 105
Exemple : Tableau de contingence des effectifs

conjoints et marginaux
Dans l’étude santé mentale en prison, on s’intéresse à une éventuelle relation

entre l’âge (la variable X) d’un détenu et son niveau de gravité (la variable Y).
Le tableau de contingence extrait à partir de la base de données est :
grav.cons 1 2 3 4 5 6 7 Marginale
age (age)
[19, 29[ 5 8 7 19 13 11 1 64
[29, 39] 10 6 9 14 16 6 2 63
[39, 49] 5 12 5 11 22 4 0 59
[49, 59] 1 7 1 6 8 3 1 27
[59, 69] 2 1 3 1 3 2 0 12
[69, 79] 0 0 0 1 1 0 0 2
Marginale
(grav.cons) 23 34 25 52 63 26 4 227

Tableau de contingence des fréquences conjointes et

marginales
Y y1 y2 ... yj ... yp Total
X
x1 f11 f12 ... f1j ... f1p f1.
.. .. .. .. .. ..
. . . . . .
xi fi1 fi2 ... fij ... fip fi.
.. .. .. .. .. ..
. . . . . .
xk fk 1 fk 2 ... fkj ... fkp fk.
Total f.1 f.2 ... f.j ... f.p 100%
nij
fij = N la proportion conjointe de xi et yj ensemble.
p
ni. X
fi. = = fij , i = 1, . . . , k la proportion marginale de xi .
N
j=1
k
n.j X
f.j = = fij , j = 1, . . . , p la proportion marginale de yj .
N
i=1
k p p
k X
X X X
fi. = f.j = fij = 100%.
i=1 j=1 i=1 j=1
Exemple : Tableau de contingence des fréquences

conjointes et marginales
H Y
H
1 2 3 4 5 6 7 ni.
X HH H
[19, 29[ 0.022 0.035 0.031 0.084 0.057 0.048 0.004 0.281
[29, 39] 0.044 0.026 0.040 0.062 0.070 0.026 0.009 0.277
[39, 49] 0.022 0.053 0.022 0.048 0.097 0.018 0 0.26
[49, 59] 0.004 0.031 0.004 0.026 0.035 0.013 0.004 0.0117
[59, 69] 0.009 0.004 0.013 0.004 0.013 0.009 0 0.052
[69, 79] 0 0 0 0.004 0.004 0 0 0.008
n.j 0.101 0.149 0.11 0.228 0.276 0.114 0.017 0.995

La distribution conditionnelle de X sachant Y = yj
Définition
On appelle distribution conditionnelle de X sachant Y = yj , la distribution de
X obtenue en restreignant les modalités de Y à l’observation yj . Elle
correspond aux effectifs nij du jème colonne dans le tableau de contingence.
On la note aussi : (xi |yj , nij )1≤i≤k .
La distribution conditionnelle de X sachant Y = yj peut être présentée avec

des fréquences conditionnelles. On la note : (xi |yj , fi|yj )1≤i≤k avec
nij fij
fi |yj = =
n.j f.j
fi|yj représente la proportion des individus ayant la modalité xi du caractère X

parmi les individus ayant la modalité yj du caractère Y .

Exemple : L’effectifs d’âge des détenus ayant le niveau de gravité 4

grav.cons 1 2 3 4 5 6 7
age
[19, 29[ 5 8 7 19 13 11 1 64
[29, 39] 10 6 9 14 16 6 2 63
[39, 49] 5 12 5 11 22 4 0 59
[49, 59] 1 7 1 6 8 3 1 27
[59, 69] 2 1 3 1 3 2 0 12
[69, 79] 0 0 0 1 1 0 0 2
23 34 25 52 63 26 4 227

Exemple : La fréquence d’âge des détenus ayant le niveau de gravité 4

grav.cons 1 2 3 4 5 6 7
age
[19, 29[ 5 8 7 19/52 13 11 1 64
[29, 39] 10 6 9 14/52 16 6 2 63
[39, 49] 5 12 5 11/52 22 4 0 59
[49, 59] 1 7 1 6/52 8 3 1 27
[59, 69] 2 1 3 1/52 3 2 0 12
[69, 79] 0 0 0 1/52 1 0 0 2
23 34 25 1 63 26 4 227

La distribution conditionnelle de Y sachant X = xi
Définition
On appelle distribution conditionnelle de Y sachant X = xi , la distribution de
Y obtenue en restreignant les modalités de X à l’observation xi . Elle
correspond aux effectifs nij du ième ligne dans le tableau de contingence. On
la note aussi : (yj |xi , nij )1≤j≤p .
La distribution conditionnelle de Y sachant X = xi peut être présentée avec

des fréquences conditionnelles. On la note : (yj |xi , fj|xi )1≤j≤p avec
nij fij
fj |xi = =
ni. fi.
fj|xi représente la proportion des individus ayant la modalité yj du caractère Y

parmi les individus ayant la modalité xi du caractère X .

Exemple : Le niveau de gravité chez les detenus âgés entre 39 et 49 en

effectifs
grav.cons 1 2 3 4 5 6 7
age
[19, 29[(24) 5 8 7 19 13 11 1 64
[29, 39](34) 10 6 9 14 16 6 2 63
[39, 49](44) 5 12 5 11 22 4 0 59
[49, 59](54) 1 7 1 6 8 3 1 27
[59, 69](64) 2 1 3 1 3 2 0 12
[69, 79](74) 0 0 0 1 1 0 0 2
23 34 25 52 63 26 4 227

Exemple : Le niveau de gravité chez les detenus âgés entre 39 et 49 en

fréquence
grav.cons 1 2 3 4 5 6 7
age
[19, 29[(24) 5 8 7 19 13 11 1 64
[29, 39](34) 10 6 9 14 16 6 2 63
[39, 49](44) 5/59 12/59 5/59 11/59 22/59 4/59 0/59 1
[49, 59](54) 1 7 1 6 8 3 1 27
[59, 69](64) 2 1 3 1 3 2 0 12
[69, 79](74) 0 0 0 1 1 0 0 2
23 34 25 52 63 26 4 227

Statistique descriptive à deux dimensions Paramètres d’une série double
Paramètres d’une série double
Introduction
On distingue deux types de paramètres :

1 Les paramètres qui concernent une seule variable.
2 Les paramètres qui décrivent les relations qui existent entre les deux
variables considérées simultanément, ils caractérisent la distribution
conjointe.

Paramètres des distributions partielles : Moyenne

La moyenne marginale de X est donnée par :
k k
1X X
X̄ = ni. xi = fi. xi
N
i=1 i=1
La moyenne conditionnelle de X sachant Y = yj est donnée par :

k k
1 X X
X̄j = nij xi = fi|yj xi
n.j
i=1 i=1
La moyenne marginale de Y est donnée par :

p p
1X X
Ȳ = n.j yj = f.j yj
N
j=1 j=1
La moyenne conditionnelle de Y sachant X = xi est donnée par :

p p
1 X X
Ȳi = nij yj = fj|xi yj
ni.
j=1 j=1

Paramètres des distributions partielles : Moyenne

Exemple
Moyennes Marginales des âges des détenus :
8648
X̄ = = 38.1
227
Moyennes Marginales de la gravité des détenus :
873
Ȳ = = 3.85
227
Moyennes conditionnelle de l’âge des détenus ayant le niveau de gravité 4 :
19 14 11 6 1 1 1878
X̄Y =4 = 24∗ +34∗ +44∗ +54∗ +64∗ +74∗ = = 36.11
52 52 52 52 52 52 52
Moyennes conditionnelle de la gravité des détenus âgés entre 39 et 49 ans :
222 5 12 5 11 22 4 0
Ȳ39≤X ≤49 = = 1∗ +2∗ +3∗ +4∗ +5∗ +6∗ +7∗ = 3.76
59 59 59 59 59 59 59 59

Paramètres des distributions partielles : Variance

La variance marginale de X est donnée par :
k k
1X 1 X
V (X ) = ni. (xi − X̄ )2 = ni. xi2 − (X̄ )2
N N
i=1 i=1
La variance conditionnelle de X sachant Y = yj est donnée par :

k k
1X X
Vj (X ) = nij (xi − X̄j )2 = fxi |yj (xi − X̄j )2
n.j
i=1 i=1
La variance marginale de Y est donnée par :

p p
1X 1 X
V (Y ) = n.j (yj − Ȳ )2 = n.j yj2 − (Ȳ )2
N N
j=1 j=1
La variance conditionnelle de Y sachant X = xi est donnée par :

p p
1X X
Vi (Y ) = nij (yj − Ȳi )2 = fyj |xi (yj − Ȳi )2
ni.
j=1 j=1

Paramètre de distribution conjointe : Covariance
Définition
La covariance entre deux variables statistiques X et Y , notée Cov (X , Y ), est
donnée par :
k p p
k X
1 XX X
Cov (X , Y ) = nij (xi − X̄ )(yj − Ȳ ) = fij (xi − X̄ )(yj − Ȳ )
N
i=1 j=1 i=1 j=1
On a aussi la formule développée :

k p p
k X
1 XX X
Cov (X , Y ) = nij xi yj − (X̄ Ȳ ) = fij xi yj − (X̄ Ȳ )
N
i=1 j=1 i=1 j=1

Propriétés
1 Si X = Y alors Cov (X , Y ) = V (X ) = V (Y )
2 |Cov (X , Y )| ≤ σ(X )σ(Y )
3 Si X 0 = aX + b et Y 0 = cY + d (a, b, c et d des constantes) alors :
Cov (X 0 , Y 0 ) = acCov (X , Y )
4 La covariance est positive ou négative selon que la relation entre les
variables est croissante ou décroissante, c’est à dire selon que les deux
variables varient dans le même sens ou en sens inverse.


Exemple : La covariance entre l’âge et la gravité des détenus
PP Y 1
PP P
2 3 4 5 6 7 ci j nij yj
X(ci ) P PP
[19, 29[(24) 5 8 7 19 13 11 1
[29, 39](34) 10 6 9 14 16 6 2
[39, 49](44) 5 12 5 11 22 4 0
[49, 59](54) 1 7 1 6 8 3 1
[59, 69](64) 2 1 3 1 3 2 0
[69, 79](74) 0 0 0 1 1 0 0
P
yj i nij ci
PP Y P
P PP 1 2 3 4 5 6 7 ci j nij yj
X(ci ) PP
[19, 29[(24) 5*1*24 8*2*24 7*3*24
[29, 39](34) 10*1*34 6*2*34 9*3*34
[39, 49](44) 5*1*44 12*2*44
[49, 59](54) 1*1*54 7*2*54
[59, 69](64) 2*1*64 1*2*64
[69, 79](74) 0*1*74 0*2*74
P
yj i nij ci


Exemple : La covariance entre l’âge et la gravité des détenus
HH Y P
1 2 3 4 5 6 7 ci j nij yj
X HH H
[19, 29[ 120 384 504 1824 1560 1584 168 6144
[29, 39] 340 408 918 1904 2720 1224 476 7990
[39, 49] 220 1056 660 1936 4840 1056 0 9768
[49, 59] 54 756 162 1296 2160 972 378 5778
[59, 69] 128 128 576 256 960 768 0 2816
[69, 79] 0 0 0 296 370 0 0 666
P
yj i nij ci 862 2732 2820 7512 12610 5604 1022 33162
La covariance entre l’âge et la gravité des détenus est :
33162
Cov (X , Y ) = − 38.1 × 8.85 = −192.1
227

Coefficient de corrélation linéaire
On mesure le degré de la liaison entre X et Y par le coefficient de corrélation.
Définition
Le coefficient de corrélation associé à X et Y , que l’on note r , est donné par :
Cov (X , Y )
r= (sans unité).
σ(X )σ(Y )

Cas particulier
Si la série double est donnée sous la forme (xi , yi )1≤i≤N , c’est-à-dire par un
tableau sous la forme :
Série X x1 x2 ... xi ... xN
Série Y y1 y2 ... yi ... yN
Alors on a un couple de variables sans pondération, dont les paramètres sont

donnés par :
N N
1 X 1 X
X̄ = xi ; Ȳ = yi
N N
i=1 i=1
N
1 X
Cov (X , Y ) = xi yi − X̄ Ȳ
N
i=1

Statistique descriptive à deux dimensions III- Ajustement linéaire
Ajustement linéaire
Démarche
1 représenter le nuage de points (xi , yi ).

2 Chercher s’il existe une courbe qui passera le plus proche possible parmi
tous les points du nuage des points.
3 mesurer le degré de liaison entre les deux variables.
⇓
Prévoir l’une des variables si on connaı̂t l’autre.

Ajustement linéaire : Définitions
La droite utilisée pour expliquer Y par X est appelée droite de régression

(ou d’ajustement) de Y en fonction de X .
On dit que X est la variable explicative ou indépendante ou exogène

alors que la variable Y est dite variable à expliquée ou dépendante ou
endogène.
L’équation (y = ax + b) de cette droite est déterminée par la méthode des

PN
moindres carrés, telle que i=1 (yi − axi − b)2 soit minimale. On a, en fait,
Cov (X , Y )
a= et b = Ȳ − aX̄
V (X )
La valeur de y calculée à l’aide de la droite d’ajustement est appelée

valeur ajustée et est notée ŷ .

Ajustement linéaire : Exemple

On mesure le poids Y et la taille X de 20 individus.
xi 155 162 157 170 164 162 169 170 178 173
yi 60 61 64 67 68 69 70 70 72 73
xi 180 175 173 175 179 175 180 185 189 187
yi 75 76 78 80 85 90 96 96 98 101
On commence par représenter le nuage de points : diagramme de régression.
Le nuage de points du poids en fonction de la taille Le nuage de points de la taille en fonction du poids
190
● ●
100
●
●
185
● ● ●
180
90
● ● ●
●
●
175
● ● ●
poids
● ●
taille
80
170
● ● ●
●
●
●
● 165
●
●
70
● ●
●
● ● ●
●
160
●
●
●
155
60
● ●
155 160 165 170 175 180 185 190 60 70 80 90 100
taille poids

Après, on détermine les équations des deux droites D et D 0 :

Equation de la droite D : y = ax + b avec
Cov (X , Y ) 105.84
a= = = 1.18
V (X ) 89.67
b = Ȳ − aX̄ = 77.45 − (1.18 × 172.9) = −126.57

D’où l’équation de D : y = 1.18x − 126.57
Equation de la droite D 0 : x = a0 y + b0 avec
Cov (X , Y ) 105.84
a0 = = = 0.65
V (Y ) 162.15
b = Ȳ − aX̄ = 172.9 − (0.65 × 77.45) = 122.56

D’où l’équation de D 0 : x = 0.65y + 122.56 ou y = 1.54x − 188.55


Puis, on trace sur le même graphique les droites de régression :
●
100
● ●
90
●
poids
80
●G ●
●
●
●
70
● ●
●
●
●
●
60
155 160 165 170 175 180 185 190
taille
Plus les droites sont proches l’une de l’autre, meilleur est l’ajustement linéaire.
Coefficient de corrélation linéaire
Propriétés
1 r a le même signe que a, a0 et Cov (X , Y ).
2 On a r 2 = aa0 .
3 0 ≤ r 2 ≤ 1, c’est-à-dire, −1 ≤ r ≤ 1.
4 Plus |r | est proche de 1 (resp. proche de 0) plus la liaison linéaire entre X
et Y est forte (resp. faible) et donc la qualité de la régression est bonne
(resp. mauvaise).
5 Si r = ±1 on dit qu’on a une liaison linéaire totale, donc tous les points
sont alignés : corrélation parfaite.
6 Si r = 0 aucune dépendance linéaire entre les deux variables :
corrélation nulle.
N.B : Une corrélation proche ou égale à 0 ne signifie pas nécessairement que
les deux variables sont indépendantes, cela signifie seulement qu’il n’y a pas
de dépendance linéaire.

STATISTIQUE ET PROBABILITÉS
PARCOURS MIP : MODULE M147
Prof. AZIZA BELMAATI
A.U. : 2019-2020

Partie II
Probabilités

Introduction
Plan
1 Introduction
2 Espace probabilisé
3 Dénombrement
4 Conditionnement et Indépendance
5 Variables aléatoires discrètes
6 Lois discrètes classiques
7 Couples de variables aléatoires discrètes
8 Variables aléatoires continues
9 LoisPr.continues
A. BELMAATI usuelles MODULE M147 A.U. : 2019-2020 2 / 92
Introduction
Définition
Théorie des probabilités

La théorie des probabilités fournit des modèles mathématiques permettant
l’étude d’expériences dont le résultat ne peut être prévu avec une totale
certitudes.
Exemples
Expérience Résultat observable
Lancer d’un dé

Introduction
Définition

certitudes.
Exemples
Lancer d’un dé Un entier k ∈ {1, . . . , 6}

Introduction
Définition

certitudes.
Exemples
Prélèvement de n objets en
sortie d’une chaı̂ne de production

Introduction
Définition

certitudes.
Exemples
Prélèvement de n objets en Nombre d’objets défectueux
sortie d’une chaı̂ne de production dans l’échantillon

Introduction
Définition

certitudes.
Exemples
Lancer d’une pièce de monnaie
jusqu’à la première obtention de pile

Introduction
Définition

certitudes.
Exemples
Lancer d’une pièce de monnaie Un entier k ∈ N : le temps
jusqu’à la première obtention de pile d’attente du premier succès

Introduction
Définition

certitudes.
Exemples
Mise en service d’une ampoule

Introduction
Définition

certitudes.
Exemples
Mise en service d’une ampoule Durée de vie T ∈ R

Introduction
Définition

certitudes.
Exemples
Relever l’état d’une case mémoire

Introduction
Définition

certitudes.
Exemples
Relever l’état d’une case mémoire k ∈ {0, 1}

Introduction
Notions de base
Expérience (ou épreuve) aléatoire :
Une expérience dont on ne peut pas
prévoir le résultat de façon certaine.
On la note E.

Introduction
Notions de base
On la note E.
Univers de E : Ensemble des résultat

possible de E, appelé aussi ensemble
fondamental, on le note Ω.

Introduction
Notions de base
On la note E.

Ensemble des parties de Ω :

Ensemble, noté P(Ω), constitué de
tous les sous-ensemble (parties) de Ω.

Introduction
Notions de base
On la note E.


Résultat possible de E : L’élément

ω ∈ Ω.

Introduction
Notions de base
On la note E.



ω ∈ Ω.
Événement : Un sous-ensemble de Ω.
{w}, est appelé événement
élémentaire de Ω.
Introduction
Notions de base
Une expérience dont on ne peut pas Exp1 : E = ”jet d’une pièce de
prévoir le résultat de façon certaine. monnaie”
On la note E. Ω = {P, F }.
P(Ω) = {∅; {P}; {F }; {P, F }}
Univers de E : Ensemble des résultat ω = P, est un résultat possible.
possible de E, appelé aussi ensemble A=”obtenir deux piles”=∅


ω ∈ Ω.
Introduction
Notions de base
P(Ω) = {∅; {P}; {F }; {P, F }}
Exp2 : E = ”jet de deux pièces de
Ensemble des parties de Ω : monnaie distinguables”.
Ensemble, noté P(Ω), constitué de Ω = {(P, P); (P, F ); (F , P); (F , F )}
tous les sous-ensemble (parties) de Ω. ω = (P, P), est un résultat possible.
A=”On obtient deux piles”={(P,P)}.
ω ∈ Ω.
Introduction
Notions de base
P(Ω) = {∅; {P}; {F }; {P, F }}
Exp2 : E = ”jet de deux pièces de
Ensemble des parties de Ω : monnaie distinguables”.
Ensemble, noté P(Ω), constitué de Ω = {(P, P); (P, F ); (F , P); (F , F )}
tous les sous-ensemble (parties) de Ω. ω = (P, P), est un résultat possible.
A=”On obtient deux piles”={(P,P)}.
ω ∈ Ω. Exp3 : E = ”lancer d’un dé régulier”
Ω = {1, 2, 3, 4, 5, 6} = [1, 6],
Événement : Un sous-ensemble de Ω. ω = 2, est un résultat possible.
{w}, est appelé événement A=”le lancer est pair”={2,4,6}.
Introduction
Correspondance entre événement et ensemble
Les opérations logiques sur les événements : ”et”, ”ou”, ”négation” se

traduisent par des opérations ensemblistes : intersection, réunion, passage
au complémentaire. Voici un tableau de correspondance entre les deux
langages.

Introduction
Notations Vocabulaire ensembliste Vocabulaire probabiliste

∅ ensemble vide événement impossible
Ω ensemble plein événement certain
ω élément de Ω événement élémentaire
A partie de Ω événement de Ω
ω est une des réalisations
ω∈A ω appartient à A
possibles de A
A⊂B A inclus dans B A implique B
A∪B réunion de A et B A ou B
A∩B intersection de A et B A et B
Ā complémentaire de A dans Ω événement contraire de A
A∩B =∅ A et B sont disjoints A et B sont incompatibles

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Introduction

possibles de A

Espace probabilisé
Plan
1 Introduction
3 Dénombrement
9 LoisPr.continues
Tribu d’événements
Définition
On appelle tribu d’événements, notée T , toute famille de parties de Ω (i.e.
T ⊂ P(Ω)) vérifiant les propriétés suivantes :
1 Ω∈T
2 ∀A ∈ T , Ā ∈ T
3 Pour toute suite (An )n∈N d’éléments de T , ∪∞
n=1 An ∈ T

Définition
1 Ω∈T
2 ∀A ∈ T , Ā ∈ T
n=1 An ∈ T

Définition
1 Ω∈T
2 ∀A ∈ T , Ā ∈ T
n=1 An ∈ T

Probabilité
Définition
Soit Ω un ensemble fondamental et T une tribu d’événements de Ω. On
appelle probabilité sur (Ω, T ) toute application IP de T dans [0, 1] vérifiant :
(i) IP(Ω) = 1
(ii) Pour tout ensemble dénombrable d’événements deux à deux disjoints
(incompatibles) :
∞
X
IP(∪∞
n=1 An ) = IP(An )
n=1
Le triplet (Ω, T , IP) s’appelle espace probabilisé.

Propriétés d’une Probabilité
Proposition
Soit IP une probabilité sur (Ω, T )
1 IP(∅) = 0
2 IP(A ∪ B) = IP(A) + IP(B) − IP(A ∩ B)
3 IP(Ā) = 1 − IP(A)
4 A ⊂ B ⇒ IP(B − A) = IP(B) − IP(A) et IP(A) ≤ IP(B)
B − A étant le complémentaire de A dans B.

Proposition
1 IP(∅) = 0
2 IP(A ∪ B) = IP(A) + IP(B) − IP(A ∩ B)
3 IP(Ā) = 1 − IP(A)

Proposition
1 IP(∅) = 0
2 IP(A ∪ B) = IP(A) + IP(B) − IP(A ∩ B)
3 IP(Ā) = 1 − IP(A)

Proposition
1 IP(∅) = 0
2 IP(A ∪ B) = IP(A) + IP(B) − IP(A ∩ B)
3 IP(Ā) = 1 − IP(A)

Probabilité sur Ω fini

Pour Ω fini ou dénombrable, on convient de choisir T = P(Ω)
Proposition
Soit Ω = {x1 , x2 , . . . , xn } un ensemble à n éléments. Alors toute probabilité IP
sur (Ω, P(Ω)) est entièrement déterminée par les valeurs
pi = IP({xi }), 1 ≤ i ≤ n vérifiant
pi ≥ 0 et p1 + p2 + · · · + pn = 1


Proposition
pi ≥ 0 et p1 + p2 + · · · + pn = 1
Si de plus, on a équiprobabilité (i.e. tous les événements élémentaires ont la

même probabilité d’être réalisés, on a
1 1
pi = = , ∀i ∈ {1, . . . , n}
CardΩ n


Proposition
pi ≥ 0 et p1 + p2 + · · · + pn = 1
Si de plus, on a équiprobabilité (i.e. tous les événements élémentaires ont la

même probabilité d’être réalisés, on a
1 1
pi = = , ∀i ∈ {1, . . . , n}
CardΩ n
Donc,
CardA
∀A ∈ P(Ω), IP(A) =
CardΩ

Exemple
On jette deux dés équilibrés de deux couleurs différentes et on note leurs

faces supérieures. Soit Ak l’événement ”la somme des deux dés est égale à
k”. Calculer la probabilité de l’événement Ak pour chaque valeur possible de
k.

Probabilité sur Ω infini dénombrable
Proposition
Soit (Ω, T ) un espace probabilisable avec Ω = {xi , i ∈ N} un ensemble infini
dénombrable (xi 6= xj , pour i 6= j) . Alors, il existe une probabilité IP sur (Ω, T )
telle que pi = IP({xi }), si et seulement si les nombres pi vérifient :
1 pi ≥ 0 pour tout i,
2 La série de terme général pi converge et sa somme est égale à 1.

Proposition

Proposition
Exemple
On considère E l’expérience aléatoire suivante : ”On joue à Pile ou Face

jusqu’à obtenir Pile”. Quels sont les résultats possibles de cette expérience ?
Soit l’application IP qui fait correspondre à chaque événement élémentaire
{wn } le nombre 21n . Montrer que l’on a défini une probabilité sur l’espace
(Ω, T ) associé à l’expérience aléatoire E

Dénombrement
Plan
1 Introduction
3 Dénombrement
9 LoisPr.continues
Dénombrement
Principe de multiplication
Principe
Lorsqu’un événement est la conjugaison de n étapes présentant
respectivement n1 , n2 , . . . , nn possibilités, le nombre total de possibilités
correspond au produit n1 × n2 × . . . × nn

Dénombrement
Application1
Une association de consommateurs note un produit selon 3 critères :
- Facilité d’utilisation (F) : Bonne (F1), Moyenne (F2), Mauvaise (F3).
- Prix (P) : Cher (P1), Pas cher (P2).
- Coût de maintenance (C) : Cher (C1), Moyen (C2), pas cher (C3).
Combien y a t-il de possibilités de classement pour un produit ?
Application2
On a un code à 4 caractères issus de la grille suivante :
1 2 3
4 5 6
7 8 9
A 0 B
Combien de codes peut-on former ?

Si le code est composé d’une lettre suivie de 3 chiffres. Combien y-a-t-il de
codes possibles ?
Dénombrement
Application1
Application2
1 2 3
4 5 6
7 8 9
A 0 B

codes possibles ?
Dénombrement
Application1
Application2
1 2 3
4 5 6
7 8 9
A 0 B

codes possibles ?
Dénombrement
Application1
Application2
1 2 3
4 5 6
7 8 9
A 0 B

codes possibles ?
Dénombrement
Application1
Application2
1 2 3
4 5 6
7 8 9
A 0 B

codes possibles ?
Dénombrement
Application1
Application2
1 2 3
4 5 6
7 8 9
A 0 B

codes possibles ?
Dénombrement
Application1
Application2
1 2 3
4 5 6
7 8 9
A 0 B

codes possibles ?
Dénombrement
Application1
Application2
1 2 3
4 5 6
7 8 9
A 0 B

codes possibles ?
Dénombrement
Application1
Application2
1 2 3
4 5 6
7 8 9
A 0 B

codes possibles ?
Dénombrement
Application1
Application2
1 2 3
4 5 6
7 8 9
A 0 B

codes possibles ?
Dénombrement
P-listes
Définition
Une p-liste est une collection de p objets pris successivement et avec remise
parmi n objets en tenant compte de l’ordre d’apparition.
Le nombre de listes à p éléments est np
Exemple
Une urne contient 8 boules numérotées de 1 à 8. On en tire successivement

5, en notant après chaque tirage le numéro obtenu puis en remettant la boule
tirée dans l’urne avant le tirage suivant. Combien y-t-il de possibilités ?

Dénombrement
P-listes
Définition
Exemple


Dénombrement
P-listes
Définition
Exemple


Dénombrement
Arrangements
Définition
Un arrangement est une collection de p objets pris successivement et sans
remise parmi n objets en tenant compte de l’ordre d’apparition.
Le nombre d’arrangements de p éléments distincts choisis parmi n est
n!
Apn = n.(n − 1).(n − 2). . . . .(n − p + 1) =
(n − p)!
Exemple
Après les prolongations d’un match de football, l’entraı̂neur doit choisir les 5
tireurs de penaltys parmi les onze joueurs et l’ordre de passage. Combien de
choix a-t-il ?

Dénombrement
Arrangements
Définition
Un arrangement est une collection de p objets pris successivement et sans
remise parmi n objets en tenant compte de l’ordre d’apparition.
Le nombre d’arrangements de p éléments distincts choisis parmi n est
n!
Apn = n.(n − 1).(n − 2). . . . .(n − p + 1) =
(n − p)!
Exemple
Après les prolongations d’un match de football, l’entraı̂neur doit choisir les 5
tireurs de penaltys parmi les onze joueurs et l’ordre de passage. Combien de
choix a-t-il ?

Dénombrement
Permutations
Définition
Tout classement ordonné de n éléments distincts est une permutation de ces
éléments.
Le nombre de permutations de n objets est n!
Exemple
on a 5 puces électroniques distincts mais interchangeables. De combien de

manières peut-on les aligner ?

Dénombrement
Permutations
Définition
éléments.
Exemple


Dénombrement
Permutations
Définition
éléments.
Exemple


Dénombrement
Permutations avec répétition
Définition
Le nombre de permutations que l’on peut constituer si certains des éléments
sont identiques est plus petit si tous les éléments sont distincts.
Lorsque seuls k éléments sont distincts (k ≤ n), chacun d’eux apparaissant
n1 , n2 , . . . , nk fois, avec n1 + n2 + · · · + nk = n et ni ≥ 1, on a :
n!
P¯n (n1 , n2 , . . . , nk ) =
n1 ! n2 ! . . . nk !
Exemple
Une urne contient 3 boules rouges identiques et 6 boules noires identiques.

De combien de façons peut-on choisir les 9 boules ?

Dénombrement
Définition
n!
P¯n (n1 , n2 , . . . , nk ) =
n1 ! n2 ! . . . nk !
Exemple


Dénombrement
Définition
n!
P¯n (n1 , n2 , . . . , nk ) =
n1 ! n2 ! . . . nk !
Exemple


Dénombrement
Définition
n!
P¯n (n1 , n2 , . . . , nk ) =
n1 ! n2 ! . . . nk !
Exemple


Dénombrement
Combinaisons
Définition
Une combinaison est collection de p objets pris simultanément parmi n, donc
sans tenir compte de l’ordre d’apparition.
Le nombre de combinaisons de p éléments choisis parmi n est :
n!
Cnp =
p!(n − p)!
Exemple
De combien de façons peut-on choisir 3 assistants de laboratoire parmi 20

pour assister dans une expérience ?

Dénombrement
Combinaisons
Définition
n!
Cnp =
p!(n − p)!
Exemple


Dénombrement
Combinaisons
Définition
n!
Cnp =
p!(n − p)!
Exemple


Dénombrement
Combinaisons
Propriétés
1 Cn0 = Cnn = 1
2 Cnp = Cnn−p (complémentaire)
3 Cnp = Cn−1
p p−1
+ Cn−1 (triangle de Pascal)
4 Apn = p!Cnp
Pn
5 (a + b)n = i=0 Cni ai bn−i (formule de binôme)
En raison de la dernière propriété, le nombre Cni s’appelle coefficient binomial.

Dénombrement
Combinaisons
Propriétés
1 Cn0 = Cnn = 1
3 Cnp = Cn−1
p p−1
4 Apn = p!Cnp
Pn

Dénombrement
Combinaisons
Propriétés
1 Cn0 = Cnn = 1
3 Cnp = Cn−1
p p−1
4 Apn = p!Cnp
Pn

Dénombrement
Combinaisons
Propriétés
1 Cn0 = Cnn = 1
3 Cnp = Cn−1
p p−1
4 Apn = p!Cnp
Pn

Dénombrement
Combinaisons
Propriétés
1 Cn0 = Cnn = 1
3 Cnp = Cn−1
p p−1
4 Apn = p!Cnp
Pn

Dénombrement
Combinaisons
Propriétés
1 Cn0 = Cnn = 1
3 Cnp = Cn−1
p p−1
4 Apn = p!Cnp
Pn

Dénombrement
Combinaisons
Propriétés
1 Cn0 = Cnn = 1
3 Cnp = Cn−1
p p−1
4 Apn = p!Cnp
Pn

Conditionnement et Indépendance
Plan
1 Introduction
3 Dénombrement
9 LoisPr.continues
Probabilité conditionnelle
Problème
Comment doit-on modifier la probabilité que l’on attribue à un événement

lorsque l’on dispose d’une information supplémentaire ?
Exemple
Une population est formée de 40% d’hommes et de 60% de femmes. On sait

que le pourcentage de fumeurs parmi les hommes est 50%, et parmi les
femmes, de 30%. Quelle est la probabilité qu’un homme choisi au hasard soit
fumeur ?

Problème

Exemple

fumeur ?

Problème

Exemple

fumeur ?

Définition
Soit (Ω, T , IP) un espace probabilisé, B un événement dont la probabilité est
non nulle. Soit A un événement, on appelle probabilité de A sachant B, et on
note IP(A|B), le nombre défini par
IP(A ∩ B)
IP(A|B) =
IP(B)
N. B : L’écriture A|B ne désigne pas un nouvel événement différent de A. Il

serait plus correct d’écrire IPB (A) que IP(A|B). Néanmoins,on conservera
cette dernière notation pour des raisons typographiques : IP(A|B1 ∩ B2 ∩ B3 )
est plus lisible que IPB1 ∩B2 ∩B3 (A)

Définition
Soit (Ω, T , IP) un espace probabilisé, B un événement dont la probabilité est
non nulle. Soit A un événement, on appelle probabilité de A sachant B, et on
note IP(A|B), le nombre défini par
IP(A ∩ B)
IP(A|B) =
IP(B)
N. B : L’écriture A|B ne désigne pas un nouvel événement différent de A. Il

serait plus correct d’écrire IPB (A) que IP(A|B). Néanmoins,on conservera
cette dernière notation pour des raisons typographiques : IP(A|B1 ∩ B2 ∩ B3 )
est plus lisible que IPB1 ∩B2 ∩B3 (A)

Proposition
L’application IPB : T → [0, 1], définie par
∀A ∈ T , IPB (A) = IP(A|B)
est une probabilité appelée probabilité conditionnelle de A sachant B.

Proposition
∀A ∈ T , IPB (A) = IP(A|B)
Remarque : Ce qui fait l’intérêt du concept de probabilité conditionnelle, c’est

qu’il est souvent plus facile d’attribuer directement une valeur à IP(A|B) en
tenant compte des conditions expérimentales (liées à l’information B) et d’en
déduire ensuite la valeur de IP(A ∩ B)

Proposition
∀A ∈ T , IPB (A) = IP(A|B)
Remarque : Ce qui fait l’intérêt du concept de probabilité conditionnelle, c’est

qu’il est souvent plus facile d’attribuer directement une valeur à IP(A|B) en
tenant compte des conditions expérimentales (liées à l’information B) et d’en
déduire ensuite la valeur de IP(A ∩ B)
Exemple
Une urne contient r boules rouges et v boules vertes. On en tire deux l’une
après l’autre, sans remise. Quelle est la probabilité d’obtenir deux boules
rouges ?
Corollaire
L’application IPB vérifie :
1 L’application IP(∅|B) = 0, et si A ⊃ B, IP(A|B) = 1.
2 Si les Ai sont deux à deux disjoints :
n
X
IP(∪ni=1 An |B) = IP(Ai |B)
i=1
3 Pour tout A ∈ T , IP(Ac |B) = 1 − IP(A|B).

4 Pour tout A, D ∈ T , si A ⊂ D, IP(A|B) ≤ IP(D|B).
5 Pour tout A, D ∈ T ,
IP(A ∪ D|B) = IP(A|B) + IP(D|B) − IP(A ∩ D|B)

Corollaire
n
X
i=1


Corollaire
n
X
i=1


Corollaire
n
X
i=1


Corollaire
n
X
i=1


Formule de probabilités composées
Proposition
Soient n événements A1 , . . . , An tels que IP(A1 ∩ A2 ∩ · · · ∩ An ) 6= 0. Alors :
IP(A1 ∩A2 ∩· · ·∩An ) = IP(A1 )IP(A2 |A1 )IP(A3 |A2 ∩A1 ) . . . IP(An |A1 ∩A2 ∩· · ·∩An−1 )
Exemple
Une urne contient initialement 7 boules noires et 3 boules blanches. On tire

successivement 3 boules : si on tire une noire, on l’enlève, si on tire une
blanche, on la retire, et on ajoute une noire à la place. Quelle est la probabilité
de tirer 3 blanches à la suite ?

Formule de probabilités composées
Proposition
Soient n événements A1 , . . . , An tels que IP(A1 ∩ A2 ∩ · · · ∩ An ) 6= 0. Alors :
IP(A1 ∩A2 ∩· · ·∩An ) = IP(A1 )IP(A2 |A1 )IP(A3 |A2 ∩A1 ) . . . IP(An |A1 ∩A2 ∩· · ·∩An−1 )
Exemple
Une urne contient initialement 7 boules noires et 3 boules blanches. On tire

successivement 3 boules : si on tire une noire, on l’enlève, si on tire une
blanche, on la retire, et on ajoute une noire à la place. Quelle est la probabilité
de tirer 3 blanches à la suite ?

Formule de probabilités totales
Définition
Un système complet d’événements (ou une partition) est une famille
d’événements (Ai )i∈I (I ⊂ N) qui sont incompatibles deux à deux et dont la
réunion est l’ensemble Ω, c’est-à-dire
Ai ∩ Aj 6= ∅, ∀i 6= j, et ti∈I Ai = Ω
Proposition
Soit (Ai )i∈I un système complet d’événements d’un espace probabilisé tels
que IP(Ai ) 6= 0, ∀i ∈ I. Alors, pour tout événement B on a :
X
IP(B) = IP(Ai )IP(B|Ai )
i∈I

Définition
Un système complet d’événements (ou une partition) est une famille
d’événements (Ai )i∈I (I ⊂ N) qui sont incompatibles deux à deux et dont la
réunion est l’ensemble Ω, c’est-à-dire
Ai ∩ Aj 6= ∅, ∀i 6= j, et ti∈I Ai = Ω
Proposition
Soit (Ai )i∈I un système complet d’événements d’un espace probabilisé tels
que IP(Ai ) 6= 0, ∀i ∈ I. Alors, pour tout événement B on a :
X
IP(B) = IP(Ai )IP(B|Ai )
i∈I

Exemple

femmes, de 30%. Si on choisi un individu au hasard,
1 Quelle est la probabilité de choisir un fumeur ?

Exemple

Formule de Bayes
Soit B un événement de probabilité non nulle. Si les événements
Ai , (1 ≤ i ≤ n) forment une partition de Ω et aucun IP(Ai ) n’est nul, on a tout
j = 1, . . . , n :
IP(B|Ai )P(Ai )
IP(Ai |B) = P .
i∈I IP(Ai )IP(B|Ai )

Exemple

2 Quelle est la probabilité qu’il soit un homme, sachant qu’il est fumeur ?
Formule de Bayes
Soit B un événement de probabilité non nulle. Si les événements
Ai , (1 ≤ i ≤ n) forment une partition de Ω et aucun IP(Ai ) n’est nul, on a tout
j = 1, . . . , n :
IP(B|Ai )P(Ai )
IP(Ai |B) = P .
i∈I IP(Ai )IP(B|Ai )

Indépendance d’événements
Définition
Deux événements A et B d’un espace probabilisé sont dits indépendants
lorsque :
IP(A ∩ B) = IP(A)IP(B)

Définition
lorsque :
Proposition
Si A et B sont des événements de probabilité non nulle, les trois égalités
suivantes sont équivalentes :
1 IP(A ∩ B) = IP(A)IP(B)
2 IP(A|B) = IP(A)
3 IP(B|A) = IP(B)

Définition
lorsque :
Proposition
2 IP(A|B) = IP(A)
3 IP(B|A) = IP(B)

Définition
lorsque :
Proposition
2 IP(A|B) = IP(A)
3 IP(B|A) = IP(B)

Exemple
On jette deux fois le même dé. Les événements

A =” obtention d’un chiffre pair au premier lancer”
B=”obtention du 1 au deuxième lancer”
sont indépendants.
Remarques
1 Si A est un événement tel que IP(A) = 0 ou IP(A) = 1, alors il est
indépendant de tout événement, y compris de lui même.
2 Deux événements incompatibles A et B avec IP(A) > 0 ou IP(B) > 0 ne
sont jamais indépendants.

Exemple

Remarques

Exemple

Remarques

Définition
Trois événements A, B, C sont dits mutuellement indépendants (ou
indépendants dans leur ensemble) lorsqu’ils vérifient les quatre conditions :
2 IP(B ∩ C) = IP(B)IP(C)
3 IP(C ∩ A) = IP(C)IP(A)
4 IP(A ∩ B ∩ C) = IP(A)IP(B)IP(C)

Définition

Définition

Définition

Définition

Variables aléatoires discrètes
Plan
1 Introduction
3 Dénombrement
9 LoisPr.continues
Chapitre II

Introduction
Exemple 1

faces supérieures. Soit Ak l’événement ”la somme des deux dés est égales à
k.
Somme 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
IP(Ak ) 36 36 36 36 36 36 36 36 36 36 36
Soit X la variable aléatoire désignant la somme des deux valeurs obtenues

par les deux dés. On a donc
{X ((1, 1)) = 2} = A2 ; {X ((1, 2)) = 3} = A3 ; {X ((2, 2)) = 4} = A4 ; . . .

Introduction
Exemple 1

k.
Somme 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
IP(Ak ) 36 36 36 36 36 36 36 36 36 36 36

{X ((1, 1)) = 2} = A2 ; {X ((1, 2)) = 3} = A3 ; {X ((2, 2)) = 4} = A4 ; . . .

Introduction
Exemple 1

k.
Somme 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
IP(Ak ) 36 36 36 36 36 36 36 36 36 36 36

{X ((1, 1)) = 2} = A2 ; {X ((1, 2)) = 3} = A3 ; {X ((2, 2)) = 4} = A4 ; . . .

Génératiltés
Définition 1
Soit (Ω, T , IP) un espace probabilisé. Une variable aléatoire réelle (en abrégé
v.a.) est une application X : Ω → R telle que pour tout intervalle I de R,
l’ensemble X −1 (I) = {ω ∈ Ω, X (ω) ∈ I} soit un événement de T auquel on
peut attribuer une probabilité IP.
L’ensemble de valeurs prise par la variable aléatoire X est noté X (Ω).
Si X (Ω) est au plus dénombrable, on dit que X est une variable aléatoire
discrète.

Génératiltés
Définition 1
Soit (Ω, T , IP) un espace probabilisé. Une variable aléatoire réelle (en abrégé
v.a.) est une application X : Ω → R telle que pour tout intervalle I de R,
l’ensemble X −1 (I) = {ω ∈ Ω, X (ω) ∈ I} soit un événement de T auquel on
peut attribuer une probabilité IP.
L’ensemble de valeurs prise par la variable aléatoire X est noté X (Ω).
Si X (Ω) est au plus dénombrable, on dit que X est une variable aléatoire
discrète.

Génératiltés
Définition 2
Soit X une variable aléatoire discrète sur (Ω, T , IP). On lui associe la fonction
d’ensemble IPX définie sur la famille de toutes les parties de R, en posant :
IPX ({X = xk }) = IP(Ak )
qu’on note pk , avec Ak ∈ T

et pour tout B ⊂ R :
X X
IPX (B) = IPX (X = xk ) = pk
xk ∈B xk ∈B
La fonction d’ensembles IPX ainsi définie est une probabilité sur la famille de
toute les parties de R. On l’appelle la loi de probabilité associée à la variable
aléatoire X .

Génératiltés
Exemple 2
On lance un dé. On s’intéresse au gain.

Supposons que :
si l’on obtient 1 ou 2, on gagne 2dh,
si l’on obtient 3 ou 4, on ne gagne rien,
si l’on obtient 5 ou 6, on perd 3dh.
Exemple 3
On lance 2 dés de deux couleurs différentes. Avec quelle probabilité le produit

des points obtenus est égal à 12 ?

Génératiltés
Exemple 2
On lance un dé. On s’intéresse au gain.

Supposons que :
si l’on obtient 1 ou 2, on gagne 2dh,
si l’on obtient 3 ou 4, on ne gagne rien,
si l’on obtient 5 ou 6, on perd 3dh.
Exemple 3
On lance 2 dés de deux couleurs différentes. Avec quelle probabilité le produit

des points obtenus est égal à 12 ?

Génératiltés
Remarques
1 Soient X et Y deux v.a. d’un espace probabilisé (Ω, T , IP) on a :
1 ∀ω ∈ Ω, (X + Y )(ω) = X (ω) + Y (ω)
2 ∀ω ∈ Ω, λ ∈ R, (λX )(ω) = λX (ω)
3 ∀ω ∈ Ω, (XY )(ω) = X (ω)Y (ω)
2 Si X est une v.a. d’un espace probabilisé (Ω, T , IP) et f une application
sur R, f (X ) est aussi une variable aléatoire définie sur Ω.
On a
∀ω ∈ Ω, f (X )(ω) = f (X (ω))

Génératiltés
Remarques
1 ∀ω ∈ Ω, (X + Y )(ω) = X (ω) + Y (ω)
2 ∀ω ∈ Ω, λ ∈ R, (λX )(ω) = λX (ω)
3 ∀ω ∈ Ω, (XY )(ω) = X (ω)Y (ω)
On a
∀ω ∈ Ω, f (X )(ω) = f (X (ω))

Génératiltés
Remarques
1 ∀ω ∈ Ω, (X + Y )(ω) = X (ω) + Y (ω)
2 ∀ω ∈ Ω, λ ∈ R, (λX )(ω) = λX (ω)
3 ∀ω ∈ Ω, (XY )(ω) = X (ω)Y (ω)
On a
∀ω ∈ Ω, f (X )(ω) = f (X (ω))

Génératiltés
Remarques
1 ∀ω ∈ Ω, (X + Y )(ω) = X (ω) + Y (ω)
2 ∀ω ∈ Ω, λ ∈ R, (λX )(ω) = λX (ω)
3 ∀ω ∈ Ω, (XY )(ω) = X (ω)Y (ω)
On a
∀ω ∈ Ω, f (X )(ω) = f (X (ω))

Génératiltés
Remarques
1 ∀ω ∈ Ω, (X + Y )(ω) = X (ω) + Y (ω)
2 ∀ω ∈ Ω, λ ∈ R, (λX )(ω) = λX (ω)
3 ∀ω ∈ Ω, (XY )(ω) = X (ω)Y (ω)
On a
∀ω ∈ Ω, f (X )(ω) = f (X (ω))

Fonction de répartition d’une v.a.d.
Définition
Soit X une v.a. d’un espace probabilisé (Ω, T , IP). On appelle fonction de
répartition de X , la fonction numérique FX définie sur R par :
∀x ∈ R, FX (x) = IP(X ≤ x)
Exemple 1

k.
Somme 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
IP(X = k ) 36 36 36 36 36 36 36 36 36 36 36

Définition
∀x ∈ R, FX (x) = IP(X ≤ x)
Exemple 1

k.
Somme 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
IP(X = k ) 36 36 36 36 36 36 36 36 36 36 36

Définition
∀x ∈ R, FX (x) = IP(X ≤ x)
Exemple 1

k.
Somme 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
IP(X = k ) 36 36 36 36 36 36 36 36 36 36 36

Théorème
Soit X une v.a. et soit FX sa fonction de répartition. Alors FX possède les
propriétés suivantes :
1 FX est une fonction croissante.
2 FX est continue à droite en tout point de R.
3 limx→−∞ FX (x) = 0 et limx→+∞ FX (x) = 1
Toute fonction F définie sur R à valeur dans [0, 1] vérifiant les 3 propriétés est
une fonction de répartition d’une v.a.
Proposition
Soit X une v.a. et soit FX sa fonction de répartition. Alors
1 ∀(a, b) ∈ R2 avec a < b, IP(a < X ≤ b) = FX (b) − FX (a)
2 ∀a ∈ R, IP(X = a) = FX (a) − limx→a− FX (x)

Théorème
Proposition

Théorème
Proposition

Théorème
Proposition

Théorème
Proposition

Théorème
Proposition

Théorème
Proposition

Espérance et moments d’une v.a.d.
Définition
Soit X une v.a.d.
P P
1 Si xk ∈X (Ω) |xk |IP(X = xk ) = xk ∈X (Ω) |xk |pk < ∞, le nombre réel
X
E(X ) = xk pk
xk ∈X (Ω)
(somme fini si X (Ω) est fini et somme d’une série convergente si X (Ω)
est dénombrable) est appelé espérance (ou moyenne) de X .
2 si E(X ) = 0 on dit que v.a. est centrée.
Pour r ∈ N, le nombre E(X r ) = xk ∈X (Ω) xkr pk , lorsqu’il existe, est appelé
P
3
moment d’ordre r de X .
Le nombre Var (X ) = xk ∈X (Ω) xk2 pk − E(X )2 , lorsqu’il existe, est appelé
P
4
p
variance de X et σX = (Var (X )) est l’écart-type.

Définition
Soit X une v.a.d.
P P
X
E(X ) = xk pk
xk ∈X (Ω)
P
3
P
4
p

Définition
Soit X une v.a.d.
P P
X
E(X ) = xk pk
xk ∈X (Ω)
P
3
P
4
p

Définition
Soit X une v.a.d.
P P
X
E(X ) = xk pk
xk ∈X (Ω)
P
3
P
4
p

Exemple 4
On lance trois fois une pièce régulière. Soit X la variable aléatoire qui note le
nombre de piles obtenus.
Calculer l’espérance et la variance de X .

Propriété
Soient X et Y deux variables aléatoires définies sur un même espace
probabilisé et a et b deux nombres réels, on a :
1 E(aX + b) = aE(X ) + b
2 V (aX + b) = a2 V (X )
3 E(X + Y ) = E(X ) + E(Y )
4 Si X et Y sont indépendantes alors :
E(XY ) = E(X )E(Y )
V (X + Y ) = V (X ) + V (Y )

Lois discrètes classiques
Plan
1 Introduction
3 Dénombrement
9 LoisPr.continues
Chapitre III

Loi uniforme discrète sur un ensemble fini
Définition
On dit qu’une v.a. suit une loi uniforme sur {1, . . . , n} si X (Ω) = {1, . . . , n} et
1
∀k ∈ {1, . . . , n} IP(X = k ) =
n
Proposition
Soit X une v.a. suivant une loi uniforme sur{1, . . . , n} alors
n+1 n2 − 1
E(X ) = et Var (X ) =
2 12

Loi uniforme discrète sur un ensemble fini
Définition
On dit qu’une v.a. suit une loi uniforme sur {1, . . . , n} si X (Ω) = {1, . . . , n} et
1
∀k ∈ {1, . . . , n} IP(X = k ) =
n
Proposition
Soit X une v.a. suivant une loi uniforme sur{1, . . . , n} alors
n+1 n2 − 1
E(X ) = et Var (X ) =
2 12

Loi de Bernoulli
Définition
La v.a. X suit la loi Bernoulli de paramètre p (p ∈ [0, 1]) si elle ne dépend que
de deux valeurs 0 et 1 c-à-d X (Ω) = {0, 1} avec
IP(X = 1) = p et IP(X = 0) = 1 − p = q
On notera X ∼ B(p)
Proposition
Soit X une v.a. suivant une loi de Bernoulli de paramètre p alors
E(X ) = p et Var (X ) = pq
Exemple
1 Lancer une pièce de monnaie.
2 Obtenir un 5 après avoir lancé un dé.
Loi de Bernoulli
Définition
IP(X = 1) = p et IP(X = 0) = 1 − p = q
Proposition
Exemple
Loi de Bernoulli
Définition
IP(X = 1) = p et IP(X = 0) = 1 − p = q
Proposition
Exemple
Loi de Bernoulli
Définition
IP(X = 1) = p et IP(X = 0) = 1 − p = q
Proposition
Exemple
Loi binomiale
Définition
Une v.a. X suit une loi binomiale de paramètres n (n ∈ N∗ ) et p (p ∈ [0, 1]) si
l’ensemble des valeurs possibles est X (Ω) = {0, 1, . . . , n} et
∀k ∈ {0, 1, . . . , n} IP(X = k ) = Cnk pk (1 − p)n−k
On note X ∼ B(n, p)
Proposition
Soit X une v.a. suivant une loi binomiale de paramètres n, p alors
E(X ) = np et Var (X ) = npq

Loi binomiale
Définition
Une v.a. X suit une loi binomiale de paramètres n (n ∈ N∗ ) et p (p ∈ [0, 1]) si
l’ensemble des valeurs possibles est X (Ω) = {0, 1, . . . , n} et
∀k ∈ {0, 1, . . . , n} IP(X = k ) = Cnk pk (1 − p)n−k
On note X ∼ B(n, p)
Proposition
Soit X une v.a. suivant une loi binomiale de paramètres n, p alors

Loi binomiale
Le modèle
On répète n fois, dans les mêmes conditions et indépendamment les uns des
autres, une expérience à deux issues (expérience de Bernoulli) dont la
probabilité de succès est égale à p. La variable aléatoire qui compte le
nombre de réalisations de succès est dite une variable binomiale de
paramètres n et p.
Exemples
1 On lance 10 fois un dé, quelle est la probabilité d’avoir 3 fois le chiffre 5 ?

2 On dispose d’un lot de 100 articles dont 5 sont défectueux. On tire au
hasard et avec remise 20 articles. Quelle est la moyenne des articles
sans défaut ?

Loi binomiale
Le modèle
Exemples

sans défaut ?

Loi binomiale
Le modèle
Exemples

sans défaut ?

Loi de Poisson
Définition
Une v.a. X suit une loi de Poisson de paramètres λ > 0, si l’ensemble des
valeurs possibles est X (Ω) = N et
λk
∀k ∈ N IP(X = k) = exp(−λ)
k!
On note X ∼ P(λ)
Proposition
Soit X une v.a. suivant une loi de Poisson de paramètres λ > 0 alors
E(X ) = Var (X ) = λ

Loi de Poisson
Définition
Une v.a. X suit une loi de Poisson de paramètres λ > 0, si l’ensemble des
valeurs possibles est X (Ω) = N et
λk
∀k ∈ N IP(X = k) = exp(−λ)
k!
On note X ∼ P(λ)
Proposition
Soit X une v.a. suivant une loi de Poisson de paramètres λ > 0 alors
E(X ) = Var (X ) = λ

Loi de Poisson
Le modèle
On répète, dans les mêmes conditions, indépendamment les uns des autres
et pendant une période donnée, une expérience à deux issues (expérience
de Bernoulli) dont la moyenne de succès pendant cette période est égale à λ.
La variable aléatoire qui compte le nombre de réalisations de succès durant
cette période est dite une variable de Poisson de paramètre λ.
Exemples
1 On admet que le nombre d’appels téléphoniques reçus par un standard,

durant une période de temps T (heures) suit une loi de Poisson de
paramètre λ = 10T . Donner la probabilité que le nombre d’appels reçus
dans une période de 6 min soit ≥ 4
2 On admet qu’on observe en moyenne une étoile filante toutes les 2
minutes. Quelle est la probabilité d’observer au moins 5 étoiles filantes
en 10 minutes ?

Loi de Poisson
Le modèle
Exemples

en 10 minutes ?

Loi de Poisson
Le modèle
Exemples

en 10 minutes ?

Approximation de la loi binomiale par la loi de Poisson
Proposition
λ
Posons pn = n alors pour k entier fixé, on a
λk
limn→∞ Cnk pnk (1 − pn )n−k = exp(−λ)
k!
Lorsque n devient grand (en général, dès que n ≥ 50, p < 0.1(On peut se
contenter de ces deux conditions pour approximer une loi binomiale par une
loi de Poisson.)), On peut approcher la loi binomiale de paramètres n et p par
une loi de Poisson de paramètre λ = np.

Loi géométrique
Définition
Une v.a. X suit une loi géométrique de paramètres p (0 < p < 1) si l’ensemble
des valeurs possibles est X (Ω) = N∗ et
∀k ∈ N IP(X = k ) = pq k−1
On note X ∼ G(p)
Proposition
Soit X une v.a. suivant une loi géométrique de paramètres p alors
1 q
E(X ) = et Var (X ) = 2
p p

Loi géométrique
Définition
Une v.a. X suit une loi géométrique de paramètres p (0 < p < 1) si l’ensemble
des valeurs possibles est X (Ω) = N∗ et
∀k ∈ N IP(X = k ) = pq k−1
On note X ∼ G(p)
Proposition
Soit X une v.a. suivant une loi géométrique de paramètres p alors
1 q
E(X ) = et Var (X ) = 2
p p

Loi géométrique
Le modèle
On répète, dans les mêmes conditions et indépendamment les uns des

probabilité de succès est égale à p. La variable aléatoire qui compte le rang
du premier succès est dite une variable géométrique de paramètre p.
Exemple
Une urne contient 5 boules blanches et 10 boules noires. On tire des boules
au hasard et avec remise jusqu’à ce qu’on obtienne la première boule
blanche (succès). Quelle est la probabilité que la première boule blanche soit
tirée après 4 tirages ?

Loi géométrique
Le modèle
On répète, dans les mêmes conditions et indépendamment les uns des

probabilité de succès est égale à p. La variable aléatoire qui compte le rang
du premier succès est dite une variable géométrique de paramètre p.
Exemple
Une urne contient 5 boules blanches et 10 boules noires. On tire des boules
au hasard et avec remise jusqu’à ce qu’on obtienne la première boule
blanche (succès). Quelle est la probabilité que la première boule blanche soit
tirée après 4 tirages ?

Loi Hypergémétrique
Définition
Une v.a. X suit une loi hypergéométrique de paramètres N1 , N2 , n si
l’ensemble des valeurs possibles est
X (Ω) = {max(0, n − N2 ), . . . , min(N1 , n)} et
CNk 1 CNn−k
∀k ∈ X (Ω) IP(X = k) = 2
CNn 1 +N2
On note X ∼ H(N1 , N2 , n)
Proposition
Soit X une v.a. suivant une loi hypergéométrique de paramètre N1 , N2 , n alors
N1 + N2 − n
N1 + N2 − 1
N1
où p = N1 +N2 et q = 1 − p

Définition
Une v.a. X suit une loi hypergéométrique de paramètres N1 , N2 , n si
l’ensemble des valeurs possibles est
X (Ω) = {max(0, n − N2 ), . . . , min(N1 , n)} et
CNk 1 CNn−k
∀k ∈ X (Ω) IP(X = k) = 2
CNn 1 +N2
On note X ∼ H(N1 , N2 , n)
Proposition
Soit X une v.a. suivant une loi hypergéométrique de paramètre N1 , N2 , n alors
N1 + N2 − n
N1 + N2 − 1
N1
où p = N1 +N2 et q = 1 − p

Le modèle
Soit une population contenant N1 + N2 individus, dont N1 individus possèdent

une caractéristique ” C ” et N2 individus ne possèdent pas la caractéristique ”
C ”. Nous procédons à n tirages sans remise. La variable aléatoire ”nombre
d’individus possédant la caractéristique ” C ” parmi les n individus extraits
simultanément et au hasard ” suit une loi hypergéométrique de paramètres
N1 , N2 , n.
Exemple
Un groupe est composé de 20 hommes et 10 femmes. on veut former une

équipe de 5 personnes. Quelle est la probabilité d’avoir 2 femmes dans cette
équipe ?

Le modèle
Soit une population contenant N1 + N2 individus, dont N1 individus possèdent

une caractéristique ” C ” et N2 individus ne possèdent pas la caractéristique ”
C ”. Nous procédons à n tirages sans remise. La variable aléatoire ”nombre
d’individus possédant la caractéristique ” C ” parmi les n individus extraits
simultanément et au hasard ” suit une loi hypergéométrique de paramètres
N1 , N2 , n.
Exemple
Un groupe est composé de 20 hommes et 10 femmes. on veut former une

équipe de 5 personnes. Quelle est la probabilité d’avoir 2 femmes dans cette
équipe ?

Couples de variables aléatoires discrètes
Plan
1 Introduction
3 Dénombrement
9 LoisPr.continues
Chapitre IV

Représentation sous forme d’un tableau
On représente la loi du couple sous forme d’un tableau :

XXX
XXX Y (Ω) y (valeurs prises par Y )
X (Ω) XXX
x (Valeurs prises par X ) P(X = x ∩ Y = y )
on obtient donc les lois des variables X (respectivement Y ) en additionnant

les lignes (respectivement les colonnes). On parle de lois marginales :
P
P(X = x) = P(X = x ∩ Y = y )
Py ∈Y (Ω)
P(Y = y ) = x∈X (Ω) P(X = x ∩ Y = y)

Représentation sous forme d’un tableau
On représente la loi du couple sous forme d’un tableau :

XXX
XXX Y (Ω) y (valeurs prises par Y )
X (Ω) XXX
x (Valeurs prises par X ) P(X = x ∩ Y = y )
on obtient donc les lois des variables X (respectivement Y ) en additionnant

les lignes (respectivement les colonnes). On parle de lois marginales :
P
P(X = x) = P(X = x ∩ Y = y )
Py ∈Y (Ω)
P(Y = y ) = x∈X (Ω) P(X = x ∩ Y = y)

propriétés
1 ∀x ∈ X (Ω), ∀y ∈ Y (Ω), P(X = x ∩ Y = y ) ∈ [0, 1].
P P P
x∈X (Ω),y ∈Y (Ω) P(X = x, Y = y) = y P(X = x, Y = y ) = 1
2
x
Théorème de transfert pour un couple de V.A.

Soit X et Y deux V.A. discrètes définies sur un même espace probabilisé et φ
une application dans R. On a :
X X
E(φ(X , Y )) = φ(x, y )P(X = x, Y = y )
x∈X (Ω) y ∈Y (Ω)

propriétés
1 ∀x ∈ X (Ω), ∀y ∈ Y (Ω), P(X = x ∩ Y = y ) ∈ [0, 1].
P P P
2
x

X X
E(φ(X , Y )) = φ(x, y )P(X = x, Y = y )
x∈X (Ω) y ∈Y (Ω)

propriétés
1 ∀x ∈ X (Ω), ∀y ∈ Y (Ω), P(X = x ∩ Y = y ) ∈ [0, 1].
P P P
2
x

X X
E(φ(X , Y )) = φ(x, y )P(X = x, Y = y )
x∈X (Ω) y ∈Y (Ω)

propriétés
1 ∀x ∈ X (Ω), ∀y ∈ Y (Ω), P(X = x ∩ Y = y ) ∈ [0, 1].
P P P
2
x

X X
E(φ(X , Y )) = φ(x, y )P(X = x, Y = y )
x∈X (Ω) y ∈Y (Ω)
Conséquence :
∀a ∈ R, ∀b ∈ R, E(aX + bY ) = aE(X ) + bE(Y )

Covariance et corrélation
On considère un couple (X , Y ) de variables aléatoires définies sur un même
espace probabilisé.
la covariance des variables X et Y est définie par :
cov (X , Y ) = E[X − E(X )(Y − E(Y ))] = E(XY ) − E(X )E(Y )
la corrélation entre les variables X et Y est définie par :
cov (X , Y )
ρ(X , Y ) =
σ(X )σ(Y )

Covariance et corrélation
On considère un couple (X , Y ) de variables aléatoires définies sur un même
espace probabilisé.
la covariance des variables X et Y est définie par :
cov (X , Y ) = E[X − E(X )(Y − E(Y ))] = E(XY ) − E(X )E(Y )
la corrélation entre les variables X et Y est définie par :
cov (X , Y )
ρ(X , Y ) =
σ(X )σ(Y )

Covariance et corrélation : Exemple
\Y 0 1 2
X \
1 1
0 0 0
2 2
1 1 1
1 0
4 4 2
1 1 1
1
4 2 4
On a : E(X ) = 1/2, E(Y)=1, et E(XY)=1/2. Donc Cov (X , Y ) = 0.

Remarques : Covariance et corrélation

1 Soit a et b deux nombres réels, on a
V (aX + bY ) = a2 V (X ) + b2 V (Y ) + 2abcov (X , Y )
V (aX − bY ) = a2 V (X ) + b2 V (Y ) − 2abcov (X , Y )
3 Soient a, b, c, d quatre nombres réels, on a
cov (aX ± b, cY ± d) = ac cov (X , Y )





Variables indépendantes
Soient X et Y deux variables définies sur le même espace probabilisé. On dit
que les variables X et Y sont indépendantes ssi ∀x ∈ X (Ω) et ∀y ∈ Y (Ω), les
évènements (X = x) et (Y = y ) sont indépendants.

Variables indépendantes
Soient X et Y deux variables définies sur le même espace probabilisé. On dit
que les variables X et Y sont indépendantes ssi ∀x ∈ X (Ω) et ∀y ∈ Y (Ω), les
évènements (X = x) et (Y = y ) sont indépendants.
Variables indépendantes et covariance

Si les deux variables X et Y sont indépendantes, alors
E(XY ) = E(X )E(Y )
On a donc cov (X , Y ) = 0
N.B La réciproque est fausse. (Voir exemple avant)


Somme de variables aléatoires discrètes
Soient X et Y 2 V.A. définies sur un même espace probabilisé. On pose
Z = X + Y , on a
Z (Ω) = {z = x + y |x ∈ X (Ω) et y ∈ Y (Ω)}
On peut écrire l’événement
(Z = z) = ∪x∈X (Ω),z−x∈Y (Ω) (X = x ∩ Y = z − x)
Tous ces événements étant incompatibles, on a
X
P(Z = z) = P(X = x ∩ Y = z − x)
x∈X (Ω),z−x∈Y (Ω)
X
P(Z = z) = P(Y = z − x|X = x)P(X = x)
Si X et Y sont indépendantes, on peut écrire

X
P(Z = z) = P(X = x)P(Y = z − x)


Somme de variables aléatoires discrètes
Soient X et Y 2 V.A. définies sur un même espace probabilisé. On pose
Z = X + Y , on a
Z (Ω) = {z = x + y |x ∈ X (Ω) et y ∈ Y (Ω)}
On peut écrire l’événement
(Z = z) = ∪x∈X (Ω),z−x∈Y (Ω) (X = x ∩ Y = z − x)
Tous ces événements étant incompatibles, on a
X
P(Z = z) = P(X = x ∩ Y = z − x)
X
P(Z = z) = P(Y = z − x|X = x)P(X = x)
Si X et Y sont indépendantes, on peut écrire

X
P(Z = z) = P(X = x)P(Y = z − x)

Exercice 8 (Série 4)
1) Soient X et Y deux variables aléatoires indépendantes. X suit une loi
binomiale de paramètres n1 et p, Y suit une loi binomiale de paramètres n2 et
p.
a) Déterminer la loi de probabilité de la somme S = X + Y .
b) Déterminer la loi de probabilité conditionnelle de X sachant que (S = n).
2) Soient X et Y deux variables aléatoires indépendantes suivant une loi de
Poisson de paramètres respectifs λ1 et λ2 .
a) Déterminer la loi de probabilité de S = X + Y .
b) Déterminer la loi de probabilité conditionnelle de X sachant que (S = n).

Variables aléatoires continues
Plan
1 Introduction
3 Dénombrement
9 LoisPr.continues
Chapitre V

Introduction
Définition
Soit X une variable aléatoire sur (Ω, T , IP). On dit que X est une variable
aléatoire continue, si X (Ω) est infini non dénombrable.
Exemples
1 X est la durée de vie en heure d’une ampoule électrique.
2 X est la température observée durant le mois de septembre.
3 X le taux de glucose dans le sang d’un malade.

Introduction
Définition
Exemples

Introduction
Définition
Exemples

Fonction de répartition et fonction densité d’une v.a.c.
Définition 1
Soit X une v.a.c. d’un espace probabilisé (Ω, T , IP). On appelle fonction de
∀x ∈ R, FX (x) = IP(X ≤ x)
Définition 2
Soit X une v.a.c. et FX sa Rfonction de répartition. On dit que X admet une
x
densité de probabilité f si −∞ f (t)dt existe et si l’on a
Z x
∀x ∈ R, FX (x) = f (t)dt
−∞

Définition 1
Soit X une v.a.c. d’un espace probabilisé (Ω, T , IP). On appelle fonction de
∀x ∈ R, FX (x) = IP(X ≤ x)
Définition 2
Soit X une v.a.c. et FX sa Rfonction de répartition. On dit que X admet une
x
densité de probabilité f si −∞ f (t)dt existe et si l’on a
Z x
∀x ∈ R, FX (x) = f (t)dt
−∞

Proposition
Soit X une v.a.c. et FX sa fonction de répartition et f sa fonction densité.
1 La fonction FX est continue et croissante sur R.
2 ∀a ∈ R, IP(X = a) = 0 et ∀(a, b) ∈ R2 on a
Z b
IP(a < X < b) = FX (b) − FX (a) = f (t)dt
a

4 FX est continûment dérivable sur tout intervalle de R sur lequel la dérivée
0
f est continue. Et en tout point x où f est continue, on a f (x) = FX (x).
Remarque
On a IP(a ≤ X ≤ b) = IP(a < X ≤ b) = IP(a ≤ X < b) = IP(a < X < b) peut
être réalisé par l’aire limitée par la courbe d’équation y = f (x) et les droites
d’équations y = 0, x = a, et x = b
Proposition
2 ∀a ∈ R, IP(X = a) = 0 et ∀(a, b) ∈ R2 on a
Z b
a

0
Remarque
Proposition
2 ∀a ∈ R, IP(X = a) = 0 et ∀(a, b) ∈ R2 on a
Z b
a

0
Remarque
Proposition
2 ∀a ∈ R, IP(X = a) = 0 et ∀(a, b) ∈ R2 on a
Z b
a

0
Remarque
Proposition
2 ∀a ∈ R, IP(X = a) = 0 et ∀(a, b) ∈ R2 on a
Z b
a

0
Remarque
Proposition
2 ∀a ∈ R, IP(X = a) = 0 et ∀(a, b) ∈ R2 on a
Z b
a

0
Remarque
Propriété de la fonction densité d’une v.a.c.

Proposition
On dit qu’une fonction f définie sur R est une densité de probabilité d’une
v.a.c. ssi
1 f (x) ≥ 0 ∀x ∈ R,
R +∞
2
−∞
f (t)dt = 1
Exemple
Soit X une v.a.c. dont la densité de probabilité f est donnée par :

ke−2x

si x ≥0
f (x) =
0 sinon
1 Déterminer k .
2 Déterminer la fonction de répartition F (x).
3 Calculer les probabilités des événements (X ≥ 2) et (0.5 ≤ X < 1.5)

Proposition
v.a.c. ssi
1 f (x) ≥ 0 ∀x ∈ R,
R +∞
2
−∞
f (t)dt = 1
Exemple

ke−2x

si x ≥0
f (x) =
0 sinon
1 Déterminer k .

Proposition
v.a.c. ssi
1 f (x) ≥ 0 ∀x ∈ R,
R +∞
2
−∞
f (t)dt = 1
Exemple

ke−2x

si x ≥0
f (x) =
0 sinon
1 Déterminer k .

Proposition
v.a.c. ssi
1 f (x) ≥ 0 ∀x ∈ R,
R +∞
2
−∞
f (t)dt = 1
Exemple

ke−2x

si x ≥0
f (x) =
0 sinon
1 Déterminer k .
Paramètres d’une v.a.c.

Définitions
Soit X une v.a.c. de densité f . On a
R +∞
1 E(X ) = −∞ tf (t)dt.
2 Si l’espérance existe, on a
Z +∞
V (X ) = (t − E(X ))2 f (t)dt
−∞
√
3 L’écart-type de X est σ(X ) = V (X ).
Proposition
Soit X une v.a.c. de densité f et soit
R +∞Φ une application continue ou continue
par morceaux sur R. Si l’intégrale −∞ |Φ(t)|f (t)dt existe, alors la v.a. Φ(X ) a
une espérance donnée par :
Z +∞
E(Φ(X )) = Φ(t)f (t)dt
−∞

Définitions
R +∞
1 E(X ) = −∞ tf (t)dt.
Z +∞
V (X ) = (t − E(X ))2 f (t)dt
−∞
√
Proposition
Z +∞
−∞

Définitions
R +∞
1 E(X ) = −∞ tf (t)dt.
Z +∞
V (X ) = (t − E(X ))2 f (t)dt
−∞
√
Proposition
Z +∞
−∞

Définitions
R +∞
1 E(X ) = −∞ tf (t)dt.
Z +∞
V (X ) = (t − E(X ))2 f (t)dt
−∞
√
Proposition
Z +∞
−∞

Définitions
R +∞
1 E(X ) = −∞ tf (t)dt.
Z +∞
V (X ) = (t − E(X ))2 f (t)dt
−∞
√
Proposition
Z +∞
−∞
Quelques propriétés
Exemple
2e−2x

si x ≥0
f (x) =
0 sinon
Calculer l’espérance et l’écart-type de X .

Lois continues usuelles
Plan
1 Introduction
3 Dénombrement
9 LoisPr.continues
Plan
1 Introduction
3 Dénombrement
9 LoisPr.continues
Chapitre VI
Lois continues usuelles

Loi uniforme
Définition
Une v.a. X est uniforme sur un intervalle [a, b] si, et seulement si sa densité
est donnée par 1
b−a si x ∈ [a, b]
fX (x) =
0 sinon
On note X ∼ U[a, b].
Proposition
Soit X ∼ U[a, b], alors

 0 si x <a
x−a
1 FX (x) = si x ∈ [a, b]
 b−a
1 si x ≥b
a+b
E(X ) = 2 .
2
(b−a)2
3 V (X ) = 12

Loi uniforme
Définition
est donnée par 1
fX (x) =
0 sinon
Proposition

 0 si x <a
x−a
1 FX (x) = si x ∈ [a, b]
 b−a
1 si x ≥b
a+b
E(X ) = 2 .
2
(b−a)2
3 V (X ) = 12

Loi uniforme
Définition
est donnée par 1
fX (x) =
0 sinon
Proposition

 0 si x <a
x−a
1 FX (x) = si x ∈ [a, b]
 b−a
1 si x ≥b
a+b
E(X ) = 2 .
2
(b−a)2
3 V (X ) = 12

Loi uniforme
Définition
est donnée par 1
fX (x) =
0 sinon
Proposition

 0 si x <a
x−a
1 FX (x) = si x ∈ [a, b]
 b−a
1 si x ≥b
a+b
E(X ) = 2 .
2
(b−a)2
3 V (X ) = 12

Loi exponentielle
Définition
Une v.a. suit une loi exponentielle de paramètre λ si, et seulement si sa
densité est donnée par
λe−λx

si x ≥0
fX (x) =
0 sinon
On note X ∼ E(λ).
Proposition
Soit X ∼ E(λ)
1 − λe−λx

si x ≥0
1 FX (x) =
0 sinon
2 E(X ) = λ1 .
1
3 V (X ) = λ2

Loi exponentielle
Définition
λe−λx

si x ≥0
fX (x) =
0 sinon
Proposition
Soit X ∼ E(λ)
1 − λe−λx

si x ≥0
1 FX (x) =
0 sinon
2 E(X ) = λ1 .
1
3 V (X ) = λ2

Loi exponentielle
Définition
λe−λx

si x ≥0
fX (x) =
0 sinon
Proposition
Soit X ∼ E(λ)
1 − λe−λx

si x ≥0
1 FX (x) =
0 sinon
2 E(X ) = λ1 .
1
3 V (X ) = λ2

Loi exponentielle
Définition
λe−λx

si x ≥0
fX (x) =
0 sinon
Proposition
Soit X ∼ E(λ)
1 − λe−λx

si x ≥0
1 FX (x) =
0 sinon
2 E(X ) = λ1 .
1
3 V (X ) = λ2

Loi normale
Définition 1
On dit qu’une v.a. X suit une loi normale de paramètres m et σ si, et
seulement si sa densité de probabilité est définie par :
1 (x − m)2
fX (x) = √ exp(− ), ∀x ∈ R
σ 2π 2σ 2
On note X ∼ N (m, σ).

N (0, 1) est appelée loi normale centrée réduite.
Définition 2
Soit X une v.a.c. de moyenne m et d’écart-type σ. On appelle variable
aléatoire centrée réduite associée à X , la variable aléatoire U donnée par :
X −m
U=
σ

Loi normale
Définition 1
1 (x − m)2
fX (x) = √ exp(− ), ∀x ∈ R
σ 2π 2σ 2

Définition 2
X −m
U=
σ

Loi normale
Définition 1
1 (x − m)2
fX (x) = √ exp(− ), ∀x ∈ R
σ 2π 2σ 2

Définition 2
X −m
U=
σ

Loi normale
Proposition
1 Si X ∼ N (m, σ) alors U ∼ N (0, 1).
2 E(X ) = m et E(U) = 0.
3 V (X ) = σ 2 et V (U) = 1.
4 La fonction de répartition associée à X est
Z x
1 (t − m)2
FX (x) = √ exp(− )dt
−∞ σ 2π 2σ 2
5 Les moments centrées d’ordre impair sont tous nuls.

6 Les moments centrées d’ordre pairs ont pour valeurs
µ2k = (2k)!
2k k!
σ 2k , k ≥ 1

Loi normale
Proposition
1 Si X ∼ N (m, σ) alors U ∼ N (0, 1).
2 E(X ) = m et E(U) = 0.
3 V (X ) = σ 2 et V (U) = 1.
Z x
1 (t − m)2
−∞ σ 2π 2σ 2

µ2k = (2k)!
2k k!
σ 2k , k ≥ 1

Loi normale
Proposition
1 Si X ∼ N (m, σ) alors U ∼ N (0, 1).
2 E(X ) = m et E(U) = 0.
3 V (X ) = σ 2 et V (U) = 1.
Z x
1 (t − m)2
−∞ σ 2π 2σ 2

µ2k = (2k)!
2k k!
σ 2k , k ≥ 1

Loi normale
Proposition
1 Si X ∼ N (m, σ) alors U ∼ N (0, 1).
2 E(X ) = m et E(U) = 0.
3 V (X ) = σ 2 et V (U) = 1.
Z x
1 (t − m)2
−∞ σ 2π 2σ 2

µ2k = (2k)!
2k k!
σ 2k , k ≥ 1

Loi normale
Proposition
1 Si X ∼ N (m, σ) alors U ∼ N (0, 1).
2 E(X ) = m et E(U) = 0.
3 V (X ) = σ 2 et V (U) = 1.
Z x
1 (t − m)2
−∞ σ 2π 2σ 2

µ2k = (2k)!
2k k!
σ 2k , k ≥ 1

Loi normale
Proposition
1 Si X ∼ N (m, σ) alors U ∼ N (0, 1).
2 E(X ) = m et E(U) = 0.
3 V (X ) = σ 2 et V (U) = 1.
Z x
1 (t − m)2
−∞ σ 2π 2σ 2

µ2k = (2k)!
2k k!
σ 2k , k ≥ 1

function(x) function(x)
list(z = )(x) list(x = )(x)
0.00 0.05
dnorm(z,0.10
9, 2)(x)
0.15 0.20 0.00 dnorm(x,
0.04 9, 4)(x)0.08
c(1, 6, 1, 29, 6, 29, 1, 1)(x) c(1, 6, 1, 29, 6, 29, 1, 1)(x)
−30
−30
Pr. A. BELMAATI
Loi normale
−20
−20
−10
−10
x
x
0
0
10
10
20
20
30
30
function(x) function(x)
list(t = )(x) list(y = )(x)
0.00 0.05
dnorm(t,
0.100, 2)(x)
0.15 0.20 0.00 dnorm(y,
0.04 0, 4)(x)0.08
c(1, 6, 1, 29, 6, 29, 1, 1)(x) c(1, 6, 1, 29, 6, 29, 1, 1)(x)
MODULE M147
−30
−30
−20
−20
−10
−10
x
x
0
0
10
10
20
20
30
30
A.U. : 2019-2020
84 / 92
Loi normale
Remarques
1 On peut toujours convertir une v.a. normale en une v.a. normale centrée
réduite.
2 La fonction de répartition d’une v.a. normale n’a pas d’expression
mathématique simple. Nous utilisons des tables numériques donnant les
valeurs de cette fonction dans le cas d’une v.a. centrée réduite.

Loi normale
Remarques
1 On peut toujours convertir une v.a. normale en une v.a. normale centrée
réduite.
2 La fonction de répartition d’une v.a. normale n’a pas d’expression
mathématique simple. Nous utilisons des tables numériques donnant les
valeurs de cette fonction dans le cas d’une v.a. centrée réduite.

Loi normale
On note ϕ(x) et φ(x), respectivement, la densité et la fonction de répartition

de U
Proposition
Si X ∼ N (m, σ) alors les valeurs de la densité f (x) et de la fonction de
répartition FX (x) se déduisent de celles de la loi normale centrée réduite à
l’aide des relations suivantes :
1 x −m
f (x) = ϕ( )
σ σ
x −m
FX (x) = φ( )
σ
On a ϕ(−x) = ϕ(x) et φ(−x) = 1 − φ(x).

Loi normale
On note ϕ(x) et φ(x), respectivement, la densité et la fonction de répartition

de U
Proposition
Si X ∼ N (m, σ) alors les valeurs de la densité f (x) et de la fonction de
répartition FX (x) se déduisent de celles de la loi normale centrée réduite à
l’aide des relations suivantes :
1 x −m
f (x) = ϕ( )
σ σ
x −m
FX (x) = φ( )
σ
On a ϕ(−x) = ϕ(x) et φ(−x) = 1 − φ(x).

Loi normale centrée réduite
Table de la loi normale centrée réduite.
Exemple
Soit x une variable suivant la loi normale N (3, 2), donc de moyenne 3 et
d’écart-type 2. On veut calculer les probabilités suivantes : P(X < 4),
P(X < −1), P(X > 1) ou les nombres ai tels que P(X < a1 ) = 0.75,
P(X > a2 ) = 0.85

Loi normale centrée réduite
Table de la loi normale centrée réduite.
Exemple
Soit x une variable suivant la loi normale N (3, 2), donc de moyenne 3 et
d’écart-type 2. On veut calculer les probabilités suivantes : P(X < 4),
P(X < −1), P(X > 1) ou les nombres ai tels que P(X < a1 ) = 0.75,
P(X > a2 ) = 0.85

Théorème central limite
Proposition
Si X1 et X2 sont deux variables aléatoires indépendantes de lois respectives
N (m1 , σ1 ) et N (m2 , σ2 ).
Alors la variable
q aléatoire S = X1 + X2 suit la loi normale
N (m1 + m2 , σ12 + σ22 ).
T.C.L.
Soit (Xn ), n ≥ 1, une suite de n variables aléatoires indépendantes, de même
é, d’espérance m et de variance σ 2 . on considère la variable
loi de probabilitP
n
aléatoire Yn = i=1 Xi .
Pour n assez
p grand, la variable aléatoire Yn converge vers la loi
N (nm, (n)σ).
On dit que Ynpsuit approximativement la loi normale, et on note
Yn ' N (nm, (n)σ).

Théorème central limite
Proposition
Si X1 et X2 sont deux variables aléatoires indépendantes de lois respectives
N (m1 , σ1 ) et N (m2 , σ2 ).
Alors la variable
q aléatoire S = X1 + X2 suit la loi normale
N (m1 + m2 , σ12 + σ22 ).
T.C.L.
Soit (Xn ), n ≥ 1, une suite de n variables aléatoires indépendantes, de même
é, d’espérance m et de variance σ 2 . on considère la variable
loi de probabilitP
n
aléatoire Yn = i=1 Xi .
Pour n assez
p grand, la variable aléatoire Yn converge vers la loi
N (nm, (n)σ).
On dit que Ynpsuit approximativement la loi normale, et on note
Yn ' N (nm, (n)σ).

Théorème central limite : Approximation par la loi

normale
Remarque : Correction de continuité
Il faut faire attention lorsqu’on approxime une loi d’une variable discrète avec
une loi normale qui est associée à une variable continue.
Pour surmenter cette difficulté, on utilise ce qu’on appelle la correction de
continuité qui consiste à associer à toute valeur entière k d’une variable
discrète X (binomiale ou de Poisson), l’intervalle [k − 0.5, k + 0.5] pour
approximer P(X = k) avec la loi normale. On pose donc :
P(X = k ) ' P(k − 0.5 ≤ X ≤ k + 0.5)

Théorème central limite : Approximation par la loi

normale
De même, pour tout événement associé à la variable discrète X , on associe

un événement avec une correction de continuité de la façon suivante :
Événement associé à X Événement avec correction

(X = k ) (k − 0.5 ≤ X ≤ k + 0.5)
(X ≥ k ) (X ≥ k − 0.5)
(X > k ) (X ≥ k + 0.5)
(X ≤ k ) (X ≤ k + 0.5)
(X < k ) (X ≤ k − 0.5)

Théorème central limite : Application 1

Approximation de la loi binomiale par la loi normale
Soit X ∼ B(n, p). Pour n suffisamment grand (n ≥ 30) et p et q pas trop

proche de 0 (np ≥ 5 et nq ≥ 5), la loi binomiale peut être approchée par la loi
√
normale N (np, npq)
N. B : L’approximation d’une loi binomiale par une loi normale peut se faire
aussi avec les conditions n ≥ 50, np ≥ 10 et nq ≥ 10
Exemple
Un contrôle de calibre, effectué depuis plusieurs mois sur le diamètre des

pièces usinées par une machine outil, indique que le pourcentage de pièces
défectueuses est égal à 8%. Un échantillon de 100 pièces est prélevé et le
diamètre des ces pièces est vérifié. Soit X la variable aléatoire indiquant le
nombre de pièces défectueuses dans l’échantillon. Calculer la probabilité
d’avoir au moins 10 pièces défectueuses. et la probabilité d’avoir exactement
10 pièces.

Approximation de la loi binomiale par la loi normale
Soit X ∼ B(n, p). Pour n suffisamment grand (n ≥ 30) et p et q pas trop

proche de 0 (np ≥ 5 et nq ≥ 5), la loi binomiale peut être approchée par la loi
√
normale N (np, npq)
N. B : L’approximation d’une loi binomiale par une loi normale peut se faire
aussi avec les conditions n ≥ 50, np ≥ 10 et nq ≥ 10
Exemple
Un contrôle de calibre, effectué depuis plusieurs mois sur le diamètre des

pièces usinées par une machine outil, indique que le pourcentage de pièces
défectueuses est égal à 8%. Un échantillon de 100 pièces est prélevé et le
diamètre des ces pièces est vérifié. Soit X la variable aléatoire indiquant le
nombre de pièces défectueuses dans l’échantillon. Calculer la probabilité
d’avoir au moins 10 pièces défectueuses. et la probabilité d’avoir exactement
10 pièces.
Approximation de la loi de Poisson par la loi normale
Soit X ∼ P(λ). Pour λ suffisamment grand √ (λ ≥ 20), la loi de Poisson peut

être approchée par la loi normale N (λ, λ)
Exemple
Une clinique traite en moyenne deux urgences par jour.

Quelle est la probabilité pour que la clinique traite plus de 70 urgences par
mois ?

Approximation de la loi de Poisson par la loi normale
Soit X ∼ P(λ). Pour λ suffisamment grand √ (λ ≥ 20), la loi de Poisson peut

être approchée par la loi normale N (λ, λ)
Exemple
Une clinique traite en moyenne deux urgences par jour.

Quelle est la probabilité pour que la clinique traite plus de 70 urgences par
mois ?

M147 - Cours (Alternatif 2) PDF

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

M147 - Cours (Alternatif 2) PDF

Transféré par

Droits d'auteur :

Formats disponibles

STATISTIQUE ET PROBABILITÉS

PARCOURS MIP : MODULE M147

Prof. AZIZA BELMAATI

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 1 / 105

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 1 / 105

2 Statistique descriptive à une dimension

3 Statistique descriptive à deux dimensions

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 2 / 105

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 3 / 105

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 3 / 105

- L’ensemble des méthodes

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 3 / 105

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 3 / 105

1 Etudier le réchauffement de la planète.

2 Eudier l’efficacilé d’un vaccin à stopper la progression d’un virus.

3 Etudier la relation entre le cancer du poumon et la fumée de la cigarette.

4 Améliorer la durée de vie d’une lampe électrique.

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 4 / 105

Par exemple, si on fait de la santé publique, on peut s’intéresser aux troubles

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 5 / 105

Par exemple, si on fait de la santé publique, on peut s’intéresser aux troubles

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 5 / 105

Par exemple, si on fait de la santé publique, on peut s’intéresser aux troubles

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 5 / 105

Par exemple, si on fait de la santé publique, on peut s’intéresser aux troubles

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 5 / 105

Par exemple, si on fait de la santé publique, on peut s’intéresser aux troubles

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 5 / 105

Par exemple, si on fait de la santé publique, on peut s’intéresser aux troubles

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 5 / 105

Par exemple, si on fait de la santé publique, on peut s’intéresser aux troubles

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 5 / 105

Par exemple, si on fait de la santé publique, on peut s’intéresser aux troubles

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 5 / 105

Exemple : Étude santé mentale en prison

L’étude a été réalisée pendant les années 2003 et 2004.

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 6 / 105

Exemple : Étude santé mentale en prison

L’étude a été réalisée pendant les années 2003 et 2004.

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 6 / 105

Exemple : Étude santé mentale en prison

L’étude a été réalisée pendant les années 2003 et 2004.

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 6 / 105

Exemple : Étude santé mentale en prison

L’étude a été réalisée pendant les années 2003 et 2004.

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 6 / 105

Etapes d’une étude statistique

1 Collecte des données : recueillir les informations adéquates mais

1 Statistique descriptive : techniques permettant de dépouiller les données

2 Statistique inférentielle : tirer des conclusions sur tout le phénomène à partir

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 7 / 105

Etapes d’une étude statistique

1 Collecte des données : recueillir les informations adéquates mais

1 Statistique descriptive : techniques permettant de dépouiller les données

2 Statistique inférentielle : tirer des conclusions sur tout le phénomène à partir

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 7 / 105

Etapes d’une étude statistique

1 Collecte des données : recueillir les informations adéquates mais

1 Statistique descriptive : techniques permettant de dépouiller les données

2 Statistique inférentielle : tirer des conclusions sur tout le phénomène à partir

Pr. A. BELMAATI MODULE M147 A.U. : 2019-2020 7 / 105

Etapes d’une étude statistique

1 Collecte des données : recueillir les informations adéquates mais