Vous êtes sur la page 1sur 64

Université de Douala

Faculté de Génie Industriel

Probabilités et Statistiques
Année académique 2017-2018

Dr.rer.nat. Patrick Njionou, S.


Ph.D. in Mathematics
iEARN Master Teacher, USA
pnjionou@aims-cameroon.org
Table des matières

1 Séries statistiques à une variable 1


1.1 Vocabulaire usuel de la statistique . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Séries statistiques à valeurs discrètes . . . . . . . . . . . . . . . . . . . . . 1
1.2.1 Variable discrète : tableau et représentation . . . . . . . . . . . . . 1
1.2.2 Caractéristiques de valeur centrale (ou de position) . . . . . . . . 1
1.2.3 Caractéristique de dispersion . . . . . . . . . . . . . . . . . . . . . 3
1.3 Séries statistiques à valeurs continues . . . . . . . . . . . . . . . . . . . . 4
1.3.1 Regroupement par classe . . . . . . . . . . . . . . . . . . . . . . . 4
1.3.2 Représentation graphique . . . . . . . . . . . . . . . . . . . . . . . 5
1.3.3 Effectifs et fréquence cumulés . . . . . . . . . . . . . . . . . . . . . 5
1.3.4 Valeurs caractéristiques . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2 Séries statistiques à deux variables 9


2.1 Tableaux à doubles entrées . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.1.1 Tableaux des effectifs . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.1.2 Répartitions marginales . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 Nuage de points associé à une série statistique . . . . . . . . . . . . . . . 10
2.3 Ajustement et corrélation linéaire . . . . . . . . . . . . . . . . . . . . . . . 11
2.3.1 But de l’ajustement linéaire . . . . . . . . . . . . . . . . . . . . . . 11
2.3.2 Ajustement linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

3 Rappels d’analyse combinatoire 15


3.1 Rappels sur les ensembles . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.1.1 Ensemble fini-Ensemble infini-Ensemble dénombrable . . . . . . 15
3.1.2 Propriétes des cardinaux . . . . . . . . . . . . . . . . . . . . . . . . 16
3.1.3 Réunion d’ensembles . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.1.4 Notion de produit cartésien d’ensembles . . . . . . . . . . . . . . 17
3.2 Analyse combinatoire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.2.1 Arrangement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.2.2 Permutations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2.3 Combinaison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2.4 Quelques formules usuelles de dénombrement . . . . . . . . . . . 20
3.2.5 Les différents modes de tirages . . . . . . . . . . . . . . . . . . . . 21
3.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

ii
Patrick Njionou,S.

4 Eléments de base de la théorie des probabilités 24


4.1 Espaces probabilisés, définition d’une probabilité . . . . . . . . . . . . . 24
4.1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4.1.2 Notion de probabilité . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.1.3 Propriétés liées aux opérations sur les événements . . . . . . . . . 27
4.2 Probabilités conditionnelles et Formules de Bayes . . . . . . . . . . . . . 29
4.2.1 Probabilités conditionnelles . . . . . . . . . . . . . . . . . . . . . . 29
4.2.2 Lois de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.3 Variables aléatoires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.3.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.3.2 Variable aléatoire discrète finie . . . . . . . . . . . . . . . . . . . . 32
4.3.3 Caractéristiques d’une variable aléatoire . . . . . . . . . . . . . . 34
4.4 Inégalité de Byenaymé Tchébichev . . . . . . . . . . . . . . . . . . . . . . 35
4.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

5 Lois de probabilité 40
5.1 Lois discrètes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5.1.1 Loi de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5.1.2 Loi binomiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5.1.3 Loi de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.2 Lois continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.2.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.2.2 Loi uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
5.2.3 Loi de Gauss ou loi normale . . . . . . . . . . . . . . . . . . . . . . 45
5.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

6 ... 49

7 Echantillonnage et estimation 50
7.1 Echantillonnage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
7.1.1 Etude de la moyenne d’un échantillon . . . . . . . . . . . . . . . . 50
7.1.2 Etude d’une proportion dans un échantillon . . . . . . . . . . . . 51
7.2 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
7.2.1 Estimation d’une moyenne . . . . . . . . . . . . . . . . . . . . . . 53
7.2.2 Estimation d’une proportion . . . . . . . . . . . . . . . . . . . . . 56
7.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

8 Test d’hypothèse 60

9 Fiabilité 61

Faculté de génie industriel iii Probabilités et Statistiques, 2019-2020


Chapitre 1

Séries statistiques à une variable

1.1 Vocabulaire usuel de la statistique


• Population-Echantillon : ensemble ou partie d’un ensemble d’individus ou d’unités
statistiques dont on observe un ou plusieurs caractères. Le nombre de ses éléments
est sa taille ou son effectif
• Modalité : valeur prise par le caractère pour un’individu de la population.
• Caractère qualitatif : caractère dont les modalités sont seulement repérables
(couleurs, forme, marque, sexe,. . .).
• Caractère quantitatif : caractère dont les modalités sont mesurables, les mesures
d’une variable statistique (poids, taille, longueur, âge,. . .).
• Variable discrète : variable dont l’ensemble de valeurs est discret (par exemple
entières). A chaque valeur correspond un effectif, la série est dite pondérée.
• Variable continue : variable qui peut prendre n’importe quelle valeur d’un in-
tervalle.
• Classe : intervalle partiel intervenant dans la partition de l’intervalle d’étude.
La largeur de la classe [ a, b[( respectivement [ a, b], ] a, b[, ] a, b]) est la différence
b − a.
a+b
Le centre de la classe est ( a, b) est le nombre (milieu de l’intervalle).
2
• Fréquence d’une valeur ou d’une classe dans une population : c’est le quotient
n
f i de l’effectif de cette classe ou de cette valeur par l’effectif total N : f i = i .
N

1.2 Séries statistiques à valeurs discrètes


1.2.1 Variable discrète : tableau et représentation
1.2.2 Caractéristiques de valeur centrale (ou de position)
Il arrive que l’on veuille résumer une série statistique par un seul nombre appelé
caractéristique de position qui donne une idée sur les valeurs prises par le caractère.
Les trois caractéristiques de position les plus utilisées sont : le mode, la médiane et la
moyenne.

a. Mode
Définition 1.1.

1
Patrick Njionou,S.

Le mode est la velaur (ou les valeurs) de la variable pour laquelle l’effectif est maximal.

Exemple 1.1. Une enquête effectuée à la demande d’un fabriquant de chaussures et


portant sur les pointures d’une population masculine a donnée les résultats suivants :

Pointure 39 40 41 42 43 44 45 46
Fréquence 5% 10% 13% 17% 20% 17% 13% 5%

Le mode de la série statistique ci-dessus est 43, ce que l’on peut exprimer en langage
courant en disant que la pointure la plus courante dans cette population est 43.

Remarque 1.1. Certaines séries statistiques peuvent avoir plusieurs modes.

b. Médiane
Définition 1.2 (Première définition).

Les valeurs de la variable étant rangées dans l’ordre croissant, la médiane est alors :
— la valeur de rang q + 1 si l’effectif de la population est n = 2q + 1
— la moyenne des valeurs de rangs q et q + 1 si l’effectif est n = 2q (effectif n pair).

Définition 1.3 (Deuxième définition).

On appelle médiane d’une série statistique d’effectif total N tout nombre réel M tel que
le nombre d’individus de modalités supérieure ou égale à M et le nombre d’individus de
M
modalité inférieure ou égale à M soient tous deux au moins égaus à .
2
Remarque 1.2. — Il existe d’autres définitions de la médiane. Toutes mettent en évidence
la notion intuitive de partage d’une population en deux groupes de même effectif.
— Une médiane n’est pas toujours une modalité de la série.
— Une médiane peut être un nombre réel unique ou tout nombre réel d’un intervalle
(fermé) de R.

Exemple 1.2. Pour la détermination pratique de la médiane (ou de l’intervalle médian),


on peut utiliser les diagrammes en bâtons des effectifs cumulés croissants et décroissants
(ou leur tableau).
Reprenons les données de l’exemple précédent.

Pointure 39 40 41 42 43 44 45 46
Effectif 5 10 13 17 20 17 13 5
Effectifs cumulés croissants 5 15 28 45 65 82 95 100
Effectifs cumulés croissants 100 95 85 72 55 35 13 5

L’effectif total est N = 100 et la moitié de l’effectif est donc 50. On voit alors que 43 est
la médiane puisqu’il y a 65 individus portant une chaussure de pointure inférieure ou
égale à 43 et 55 individus portant une chaussure de pointure supérieure ou égale à 43.

Faculté de génie industriel 2 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

c. Moyenne
C’est la moyenne arithmétique des n valeurs distinctes ou non de la variable. Si les
regroupements ont été effectués et si la variable prend p valeurs distinctes x1 , x2 , . . . , x p
alors :

Définition 1.4.
La moyenne de la série statistique est la moyenne pondérée :
p
n1 x1 + n2 x2 + · · · + n p x p 1
x̄ = = ∑ ni xi ( n1 + n2 + · · · + n p = n )
n1 + n2 + · · · + n p n i =1

Exemple 1.3. Reprenons les données de l’exemple précédent.

xi 39 40 41 42 43 44 45 46 Total
ni 5 10 13 17 20 17 13 5 100
xi ni 195 400 533 714 860 748 585 230 4265

On a alors
4265
x̄ = = 42.65.
100
La moyenne est la caractéristique la plus représentative. Elle dépend de toutes les
valeurs et de prête bien aux calculs théoriques. Elle possède, en outre, toutes les pro-
priétés des moyennes en particuliers :
— elle ne dépend ni de l’ordre, ni des regroupements des valeurs,
— on a des formules simples dans tout changement affine de variable. Si pour tout
i naturel : xi = aXi + b (a 6= 0), alors

x̄ = a X̄ + b.

1.2.3 Caractéristique de dispersion


Ce sont des valeurs qui caractérisent le plus ou moins grand étalement des termes
de la série.

a. Etendue
Définition 1.5.
L’étendue d’une série est la différence e = x p − x1 .

C’est une caractéristique qui est d’un calcul facile et peut donner un renseignement
utile (par exemple tir groupé ou dispersé).
Elle est par exemple e = 46 − 39 = 7 pour la série précédente.

Faculté de génie industriel 3 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

b. Ecart moyen ou écart moyen absolu


Définition 1.6.
L’écart moyen d’une série statistique est la moyenne des valeurs absolues des écarts à la
moyenne x̄.
p
1
em = ∑ ni | xi − x̄ |.
n i =1

Exemple 1.4. Reprenons les données de l’exemple 1.1


xi 39 40 41 42 43 44 45 46 Total
| xi − x̄ | 3.65 2.65 1.65 0.65 0.35 1.35 2.35 3.35 16
On a alors
16
em = = 0.16.
100

c. Variance, écart-type
Définition 1.7.

1. On appelle variance de la série le nombre réel


p p
1 1
V= ∑
n i =1
ni ( xi − x̄ )2 = ∑ ni xi2 − x̄2 .
n i =1

2. L’écart type σ est la racine carrée de la variance. σ = V.

Exemple 1.5. Reprenons les données de l’exemple 1.1


xi 39 40 41 42 43 44 45 46 Total
ni 5 10 13 17 20 17 13 5 100
xi n2i 7605 16000 21853 29988 36980 32912 26325 10580
Proposition 1.1.
Soit ( xi , ni )i une série statistique. Supposons que l’on ait xi = aXi + b, alors a, b constantes
réelles. Alors on a :
Vx = a2 VX et σx = aσX .

1.3 Séries statistiques à valeurs continues


1.3.1 Regroupement par classe
Définition 1.8.
Une variable est dite continue lorsqu’elle peut prendre ses n valeurs sur un intervalle de
R.

On regroupe alors généralement les valeurs par classes agjascentes. On prossède de


même dans le cas d’une série à variable discrète lorsque l’effectif n est important (très
grand). On dresse alors un tableau des effectifs faisant apparaı̂tre les centres de classes
(milieux des intervalles).

Faculté de génie industriel 4 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Classes [ X0 , X1 [ [ X1 , X2 [ ... [ Xi − 1 , Xi [ ... [ X p −1 , X p [


Centres de classes x1 x2 ... xi ... xp
Effectifs n1 n2 ... ni ... np

1.3.2 Représentation graphique


Histogramme
La représentation de la série des effectifs (ou des fréquences) s’effectue à l’aide d’un
histogramme. A chaque classe correspond un rectangle dont la largeur est la largeur
de la classe et dont l’aire est proportionnelle à l’effectif de la classe.
Si les largeurs de classes sont égales, la hauteur des rectangles est proportionnelle
aux effectifs. C’est pourquoi, lorsque les classes n’ont pas même largeur, l’on se
remène habituellement à ce cas par l’utilisation de sous-classes unitaires de même
largeur.

Polygone des effectifs (ou fréquences)


Il complète le tracé de l’histogramme et s’obtient en joignant les milieux des bases
supérieures des rectangles  unitaire de l’histogramme. On ajoute, pour compléter la
représentation, une classe unitaire d’effectif nul aux deux extrémités.

1.3.3 Effectifs et fréquence cumulés


L’effectif cumulé croissant arrêté à la classe [ Xi−1 , Xi [ est le nombre Ni = n1 + n2 +
· · · + ni des valeurs inférieures à Xi .
L’effectif cumulé décroissant arrêté à la classe [ Xi−1 , Xi [ est le nombre
Ni0 = ni + ni+1 + · · · + n p des valeurs supérieures (ou égales) à Xi−1 .

Exemple 1.6. Le relevé du nombre journélier d’interventions demandées à une entre-


prise de réparations à domicile pour les 60 jours ouvrable d’un trimestre est donné par
le tableau suivant :
Nombre d’interventions [15, 18[ [18; 21[ [21; 24[ [24; 27[ [27; 30[ [30; 33[
Effectifs (Nb. de jours) 1 5 16 24 12 2

1. Tracer l’histogramme et le polynone des effectifs.


2. Dresser le tableau des effectifs et des fréquences cumulés et tracer sur un même
graphique les polygones correspondants.

Résolution
1. L’histogramme et le polygonne des effectifs sont : (to be typed latter)
2. Le tableau des effectifs et des fréquences cumulés est dressé ci-dessous.

Nombre d’interventions [15, 18[ [18; 21[ [21; 24[ [24; 27[ [27; 30[ [30; 33[
Effectifs (Nb. de jours) 1 5 16 24 12 2
Effectifs cum. crois 1 6 22 46 58 60
Fréquences cum crois 0.02 0.10 0.37 0.77 0.97 1
Effectifs cum. decrois 60 59 54 38 14 2
Fréquences cum decrois 1 0.98 0.94 0.63 0.23 0.03

Faculté de génie industriel 5 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

1.3.4 Valeurs caractéristiques


a. Mode
Il existe une (ou plusieurs) classe modale d’effectif maximal, on prend comme mode le
centre de cette classe.

b. Médiane
Il existe une classe médiane, c’est elle qui contient la médiane, valeur de la variable
correspondant à 50% des effectifs cumulés (croissants ou décroissants). Elle s’obtient
graphiquement comme abscisse du point d’intersection des polygones des effectifs cu-
mulés.
La médiane Me se calcule par interpolation linéaire en supposant la répartition des ef-
fectifs uniforme à l’intérieur de la classe médiane.
Dans le cas de l’exemple 1.6, la classe médiane, correspondant à un effectif cumulé de
30 (moitié de l’effectif total) est [24; 27[. 
Me − 24 30 − 22

24 Me 27
On a les deux suites proportionnelles : d’où = soit
22 30 46 27 − 24 46 − 22
8
Me = 24 + 3. = 25.
24

c. Quartiles, déciles
— Le premier quartile Q1 est la valeur de la variable qui correspond à 25% des
effectifs cumulés croissants.
— Le troisième quartile Q3 est la valeur de la variable qui correspond à 75% des
effectifs cumulés croissants.
Ces caractéristiques se déterminent comme la médiane (égale à Q2 ) par interpolation
linéaire. On a ainsi
9 23
Q1 = 21 + 3. ≈ 22.69 et Q3 = 24 + 3. ≈ 26.88.
16 24
— La différence I = Q3 − Q1 (égale à 4.19) est l’intervalle interquartile, il est utilisé
comme caractéristique de dispersion.

d. Moyenne, variance, écart type


Ce sont les caractéristiques les plus importantes. Pour les calculer, on se ramène au
cas d’une série statistique à variable discrète en prenant pour valeurs les centres de
classe et en les pondérant par les effectifs de ces classes.
Définition 1.9 (Moyenne).

Soit ([ ai−1 , ai [)1≤i≤ p une série statistique. Soit xi le centre de la classe [ ai−1 , ai [, la moyenne
de cette série est le réel noté x̄ tel que :
!
p
1
x̄ = p ∑ ni xi .
∑ n i =1i
i =1

C’est en effet la moyenne de la série ( xi , ni )1≤i≤ p .

Faculté de génie industriel 6 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Définition 1.10 (Variance et écart type).

Soit ([ ai−1 , ai [)1≤i≤ p une série statistique. Soit xi le centre de la classe [ ai−1 , ai [.
1. On appelle variance de la série le nombre réel
p p
1 1
V = ∑ ni ( xi − x̄ )2 = ∑ ni xi2 − x̄2 .
n i =1 n i =1

2. L’écart type σ est la racine carrée de la variance. σ = V.
Les calculs se font exactement comme pour les caractères discrets.

1.4 Exercices
Exercice 1.1.
On a relevé la distance parcourue des 150 taxis d’une compagnie entre leur mise en circu-
lation et leur première panne. Les résultats de cette enquête sont résumés dans le tableau
ci-dessous, les distances étant exprimées en milliers de kilomètres.

Distance parcourue [0, 5[ [5, 7[ [7, 9[ [9, 15[


Effectif (ni ) 15 78 36 21

1. Déterminer la classe modale


2. Construire le tableau des effectifs cumulés croissants et décroissants, puis déduire
la médiane.
3. Calculer la moyenne.
4. Déterminer l’écart moyen, la variance et l’écart type.

Exercice 1.2.
Les moyennes des notes obtenues par 50 candidats au DEUG se répartissent comme suit.

Classe [0; 4[ [4; 8[ [8; 12[ [12; 16[ [16; 20[


Effectif 5 14 20 7 4

1. Déterminer la classe modale et la médiane de cette série statistique.


2. Déterminer la moyenne de cette série statistique.
3. Calculer la variance et l’écart type.
4. Quelle est le pourcentage d’étudiants dont la note appartient à l’intervalle ] x̄ − σ; x̄ +
σ [.

Exercice 1.3.

Faculté de génie industriel 7 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

On a mesuré la taille en centimètres de 40 individus et les résultats sont portés dans le


tableau suivant :
Classe [155; 160[ [160; 165[ [165; 170[ [170; 175[ [175; 180[ [180; 185[
Effectif 3 8 10 10 7 2

1. Calculer la moyenne de cette série.


2. Completer le tableau suivant :
Classe Centre de classe Effectif | xi − x̄ | ni | xi − x̄ | ni xi2
[155; 160[ 3
[160; 165[ 8
[165; 170[ 10
[170; 175[ 10
[175; 180[ 7
[180; 185[ 2
Total
3. Déterminer l’écart moyen et l’écart type de cette série.

Faculté de génie industriel 8 Probabilités et Statistiques, 2019-2020


Chapitre 2

Séries statistiques à deux variables

Introduction
L’étude d’une population peut porter sur plusieurs caractères. Dans le cas de deux
caractères quantitatifs il correspond à chaque unité statistique un couple de nombres
(taille et poids d’un individu), (hauteur et diamètre à la base d’un arbre), (nombre de
pièces et surface d’un appartement).

On peut s’intéresser seulement à un caractère quantitatif particulier d’une unité statis-


tique et noter son évolution dans le temps (date et température), (date et poids), (date
et production). A chaque relvé on obtient un couple de nombres dont l’un est la date
du relevé. La série obtenue est dite chronologique.

Dans les deux cas l’ensemble des couples obtenus constitue une série statistique double.

2.1 Tableaux à doubles entrées


Les couples de variables statistiques sont représentés sous forme de tableaux à deux
dimensions ou tableaux de contingence ou tableau de corréralation.

2.1.1 Tableaux des effectifs


XY y1 y2 ... yj ... yq total
x1 n11 n12 ... n1j ... n1q n1.
x2 n21 n22 ... n2j ... n2q n2.
.. .. .. .. ..
. . ... . . .
xi ni1 ni2 ... nij ... niq ni.
.. .. .. .. .. ..
. . . . . .
xp n p1 n p2 ... n pj ... n pq n p.
total n.1 n.2 ... n.j ... n.q n

Soit X et Y deux caractères à étudier. x prend p valeurs x1 , x2 ,. . .,x p et Y prend q valeurs


y1 , y2 ,. . .,yq . On obtient ainsi une série est une série statistique à deux caractères notées
( xi , y j , nij )1≤i≤ p, 1≤ j≤q .

9
Patrick Njionou,S.

On a
p q
∑ nij = n.j ∑ nij = ni.
i =1 j =1

2.1.2 Répartitions marginales


i) Selon le caractère X.
xi x1 x2 ... xi ... xp
ni n1. n2. ... ni. ... n p.
ii) Selon le caractère Y.
yj y1 y2 ... yj ... yq
nj n.1 n.2 ... n.j ... n.q
La répartition marginale permet d’étudier la population suivant un seul caractère.
Exemple 2.1. Lors d’une enquête auprès des élèves d’un lycée, on a étudié les caractères sui-
vants :
— nombre de livres lus au cours du dernier mois ;
— nombre de sorties au cinéma au cours du dernier mois.
Les résultats sont représentés dans le tabbleau suivant.

xi , y j 0 1 2 3 4 5 Total
0 35 30 50 25 12 0 152
1 34 58 44 47 10 19 212
2 72 65 57 30 12 7 243
3 24 32 26 25 16 6 129
4 5 21 20 11 7 0 64
Total 170 206 197 138 57 32 800

Les répartitions marginales :


1. Suivant le caractère X (nombre de livres lus)
xi 0 1 2 3 4
ni 152 212 243 129 64
2. Suivant le caractère Y (nombre de sorties au cinéma)
yj 0 1 2 3 4 5
nj 170 206 197 138 57 32

2.2 Nuage de points associé à une série statistique


Soit ( xi , y j , nij ) une série statistique double de caractères X et Y, X := { x1 ; x2 ; . . . ; x p }
et Y := {y1 ; y2 ; . . . ; yq }. Le plan est muni d’un repère orthogonal.
Définition 2.1.
On appelle nuage de points associé à la série ( xi , y j , nij )1≤i≤ p; 1≤ j≤q l’ensemble des points
Mi,j (yxi ) avec 1 ≤ i ≤ p; 1 ≤ j ≤ q.
j

On a deux représentations possibles du nuage de points associé à une série statis-


tique : la représentation par points pondérés et la représentation par tâches.

Faculté de génie industriel 10 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Définition 2.2 (Point moyen).


Soit ( xi , y j , nij )1≤i≤ p; 1≤ j≤q une série statistique double de caractères X et Y. On appelle
point moyen du nuage de points représentant cette série, le point de coordonnées ( x̄, ȳ) où
x̄ et ȳ désignent les moyennes respectives des séries marginales ( xi , ni ) et (y j , n j ) associées
à la série.

Exemple 2.2. Dans l’exemple 2.1, on a


0 × 152 + 212 + 2 × 243 + 3 × 129 + 4 × 64 1341
x̄ = = = 1, 6762
800 800
0 × 170 + 206 + 2 × 197 + 3 × 138 + 4 × 57 + 5 × 32 701
ȳ = = = 1, 7525
800 400
le point moyen du nuage est MG (1, 67; 1, 75).

2.3 Ajustement et corrélation linéaire


2.3.1 But de l’ajustement linéaire
2.3.2 Ajustement linéaire
Dans toute la suite, on considère une série statistique à deux caractères x et y telle
que l’effectif de chaque modalité est égal à 1. Un telle série sera notée ( xi , yi )1≤i≤ N où
N est l’effectif total de la série et ( xi , yi ) la modalité du ième individu.
Le nuage de points associé à cette série est alors l’ensemble des points Mi de coor-
données ( xi , yi ).
Remarque 2.1. Le cas ici considéré est un cas très particulier du cas général d’une série sta-
tistique à deux caractères. On a en effet p = q = n, nii = 1 et pour i 6= j, nij = 0.
Covariance d’une série double. Soit ( xi , yi ))1≤i≤ N une série statistique double de ca-
ractères X et Y d’effectif total N. On appelle covariance de ladite série et on note
cov( x, y) le nombre réel défini par :
N
1
cov( x, y) =
N ∑ (xi − x̄)(yi − ȳ).
i =1

Proposition 2.1.
Soit ( xi , yi ))1≤i≤ N une série statistique double de caractères X et Y d’effectif total N.On a :
N
1
cov( x, y) =
N ∑ xi yi − x̄ȳ.
i =1

Droite de regression de y en x. Soit ( xi , yi ))1≤i≤ N une série statistique double de ca-


ractères x et y telle que : V ( x ) 6= 0. La droite de regression de y en x passe par
cov( x,y)
le point moyen du nuage et à pour coefficient directeur V ( x) . Une équation de
cette droite est
cov( x, y)
y − ȳ = ( x − x̄ ).
V (x)

Faculté de génie industriel 11 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Droite de regression de x en y. Soit ( xi , yi ))1≤i≤ N une série statistique double de ca-


ractères x et y telle que : V (y) 6= 0. La droite de regression de x en y passe par
cov( x,y)
le point moyen du nuage et à pour coefficient directeur V (y) . Une équation de
cette droite est
cov( x, y)
x − x̄ = (y − ȳ).
V (x)
Remarque 2.2. Dans le cas général, soit ( xi , y j , nij )1≤i≤ p; 1≤ j≤q une série statistique double
de caractères X et Y. On appelle covariance de ladite série et on note cov( x, y) le nombre réel
défini par :
p q p q
1 1
cov( x, y) = ∑ ∑
n i =1 j =1
nij ( xi − x̄ )(y j − ȳ) = ∑ ∑ nij xi y j − x̄ ȳ.
n i =1 j =1

Définition 2.3.
Soit ( xi , yi ))1≤i≤ N une série statistique double de caractères x et y telle que : V ( x ) 6= 0 et
V (y) 6= 0. On appelle coefficient de corrélation linéaire de cette sérié le nombre réel noté
r et définit par
cov( x, y) cov( x, y)
r= p p = .
V ( x ) V (y) σx σy

Exemple 2.3. Le tableau suivant donne la tension artérielle moyenne y en fonction de


l’âge x d’une population.

Age ( xi ) 36 42 48 54 60 66
Tension (yi ) 11, 8 14 12, 6 15 15, 5 15, 1

1. Déterminer les coordonnées ( x̄, ȳ) du point moyen G du nuage.


2. Déterminer les variances V ( x ) et V (y) des caeractères respectifs x et y.
3. Déterminer la covariance cov( x, y) de la série ( xi , yi ).
4. Déterminer une équation de la droite de regression de y en x et une équation de
la droite de regression de x en y. Tracer ces deux droites.
5. Calculer le coefficient de correlation linéaire.
6. Une personne de 70 ans a une tension artérielle de 16, 2. Cela vous paraı̂t-il  nor-
mal  ?

Solution
1. On a :
36+42+48+54+60+66
— x̄ = 6 = 51
11,8+14+12,6+15+15,5+15,1
— ȳ = 6 = 14.
2. On regroupe toute les données dans un tableau, ce qui facilite les calculs :
Age ( xi ) 36 42 48 54 60 66 306
Tension (yi ) 11, 8 14 12, 6 15 15, 5 15, 1 84
xi2 1296 1764 2304 2916 3600 4356 16236
y2i 139, 24 196 158, 76 225 240, 25 228, 01 1187, 26
xi yi 424, 8 588 604, 8 810 930 996, 6 4354, 2

Faculté de génie industriel 12 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

16236 1187,26
On en déduit : V ( x ) = 6 − 512 = 105 ; V (y) = 6 − 142 = 1, 88.
4354,2
3. cov( x, y) = 6 − 51 × 14 = 11, 7.
4. Droite de regression de y en x : y = 11,7
105 ( x − 51) + 14,
11,7
droite de regression de x en y : x = 1,88 (y − 14) + 51.
5. Coefficient de corrélation linéaire : r = √ 11,7
√ = 0, 8327.
105 1,88
6. 16, 2 paraı̂t normal car en utilisant la droite de regression de y en x, on obtient
q’une personne de 70 ans doit avoir une tension arterielle de 16, 11714286.
Remarque 2.3. De façon générale, on pourra affirmer
— Si |r | = 1, alors il existe une relation linéaire entre X et Y .
— Si r = 0, il y a indépendance linéaire entre X et Y (mais il peut exister une autre forme
de dépendance).
— 0 < |r | < 1 traduit une dépendance linéaire d’autant plus forte que |r | est grand.
Quand le coefficient de corrélation est proche de 1 ou -1, les caractères sont dits ”for-
tement corrélés”. Il faut prendre garde à la confusion fréquente entre corrélation et
causalité. Que deux phénomènes soient corrélés n’implique en aucune façon que l’un
soit cause de l’autre. Très souvent, une forte corrélation indique que les deux caractères
dépendent d’un troisième, qui n’a pas été mesuré. Ce troisième caractère est appelé ”fac-
teur de confusion”. Qu’il existe une corrélation forte entre le rendement des impôts en
Angleterre et la criminalité au Japon, indique que les deux sont liés à l’augmentation
globale de la population. Le prix du blé et la population des rongeurs sont négativement
corrélés car les deux dépendent du niveau de la récolte de blé. Il arrive qu’une forte
corrélation traduise bien une vraie causalité, comme entre le nombre de cigarettes fumées
par jour et l’apparition d’un cancer du poumon. Mais ce n’est pas la statistique qui
démontre la causalité, elle permet seulement de la détecter. L’influence de la consomma-
tion de tabac sur l’apparition d’un cancer n’est scientifiquement démontrée que dans la
mesure où on a pu analyser les mécanismes physiologiques et biochimiques qui font que
les goudrons et la nicotine induisent des erreurs dans la reproduction du code génétique
des cellules.

2.4 Exercices
Exercice 2.1.
Le tableau suivant donne le poids y en kg d’un nourisson, x jours après sa naissance.

xi 5 7 10 14 18 22 26
yi 3,61 3,70 3,75 3,85 3,90 4,05 4,12

1. Déterminer les coordonnées ( x̄, ȳ) du point moyen G du nuage.


2. Déterminer les variances V ( x ) et V (y) des caeractères respectifs x et y.
3. Déterminer la covariance cov( x, y) de la série ( xi , yi ).
4. Déterminer une équation de la droite de regression de y en x et une équation de la
droite de regression de x en y.
5. Calculer le coefficient de correlation linéaire.
6. 35 jours après sa naissance, un enfant à un poids en kg de 4,34 . Cela vous paraı̂t-il
 normal  ?

Faculté de génie industriel 13 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Exercice 2.2.
Une bille tombe dans le vide de différentes hauteurs. En mesurant chaque fois le temps t
(en secondes) de la chute et la vitesse v (en mètres par seconde) de la bille en fin de chute,
on obtient le tableau ci dessous.
ti 0,20 0,28 0,35 0,40 0,45
vi 2 2,7 3,2 4 4,5

1. a. Calculer le coefficient de corrélation linéaire de cette série. Sa valeur justifie-t-


elle un ajustement linéaire ?
b. Déterminer une équation de la droite de regression de v en t.
2. Sachant que, dans une chute libre, la vitesse s’exprime en fonction du temps par
l’égalité v = gt, déterminer une estimation de l’accélération de la pesanteur g ;

Faculté de génie industriel 14 Probabilités et Statistiques, 2019-2020


Chapitre 3

Rappels d’analyse combinatoire

Ce chapitre n’est pas formellement au programme du BTS. Mais, nous avons esti-
mer qu’il était utile de l’introduire dans la mesure où le calcul des probabilités utilise
d’une certaine manière le dénombrement.

3.1 Rappels sur les ensembles


3.1.1 Ensemble fini-Ensemble infini-Ensemble dénombrable
Définition 3.1.
On dit qu’un ensemble E est fini s’il est vide, ou s’il contient un nombre fini d’élément. Si
E est non vide, et si n est le nombre d’éléments de E, on dit que n est le cardinal de E et
on note CardE = n.
Par convention on a Card∅ = 0.

Remarque 3.1. CardE = n si et seulement si les éléments de E peuvent être notés a1 , a2 , . . . an


où les ak sont deux à deux distincts.
Dénombrer un ensemble fini E c’est déterminer le nombre de ses éléments. On peut le faire
de plusiers façons, mais trois conditions doivent être réunies pour que le dénombrement soit
correct :
1. il ne faut compter que les éléments de E,
2. il ne faut pas en oublier,
3. il ne faut pas compter certains éléments plusieurs fois.
Nonobstant mais si par une méthode, chaque élément est comptés k fois, alors le cardinal de E
est le quotient par k du nombre obtenu par cette méthode.
Définition 3.2.
On dit qu’un ensemble E est infini dénombrable s’il existe une bijection de N dans E.

Exemple 3.1.
— N est dénombrable car f : n 7→ n est une bijection de N dans N.
— N∗ est dénombrable car f : n → n + 1 est une bijection de N dans N∗ .
— On démontre aussi que Q est dénombrable.
— On peut démontrer que R n’est pas dénombrable.

15
Patrick Njionou,S.

3.1.2 Propriétes des cardinaux


Définition 3.3.
Soit E et A deux ensembles. On dit que A est une partie de E si tout élément de A est un
élément de E. On note A ⊂ E. L’ensemble des parties de E est notée P( E).

Proposition 3.1.

Soit E un ensemble fini et A une partie de E, alors CardA ≤ CardE.


On a A = E ⇔ CardA = CardE.

Remarque 3.2. Etant donnés deux ensembles finis A et B, pour montrer que A = B on
peut :
— montrer que A ⊂ B et B ⊂ A,
— montrer que A ⊂ B et CardA = CardB.

Définition 3.4.
Deux ensembles E et F sont disjoints s’ils n’ont aucun élément en commun. On note E ∩
F = ∅.
Définition 3.5.
Des parties d’un ensemble de E forment une partition de E si :
— elles sont toutes non vides ;
— elles sont disjointes deux à deux ;
— leur réunion est égale à E.

Exemple 3.2. Soit l’ensemble E = { a; b; c; d; e; f ; g; h; i }.


— Les ensembles { a; b}, {c; d; i } et {e; f ; g; h} forment une partition de E.
— { a; b; c; d; f } et { a; f ; g; h; i } ne forment pas une partition de E.

Définition 3.6.
Soit E un ensemble non vide et A une partie de E. On appelle complémentaire de A dans
E et on note CEA (ou A ou Ac quand il n’y a pas d’ambiguité) l’ensemble des éléments de
E n’appartenant pas à A.
A = { x ∈ E, x ∈/ A }.
De la définition découle immédiatement la proposition suivante.

Proposition 3.2.

Soit E un ensemble non vide et A une partie de E, alors E = A ∪ A et A ∩ A = ∅. Si de


plus A est non vide et different de E, A et A forment une partition de E.

3.1.3 Réunion d’ensembles


Proposition 3.3.

Soit A et B deux ensembles finis et disjoints de cardinaux respectifs n et p, alors Card( A ∪


B) = Card( A) + Card( B) = n + p.

Faculté de génie industriel 16 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Proposition 3.4.
Soit A et B deux ensembles finis, alors

Card( A ∪ B) = Card( A) + Card( B) − Card( A ∩ B).

Démonstration. — Si A ou B est vide, alors l’égalité est évidente.


— Supposons A 6= ∅ et B 6= ∅. On a A = ( A ∩ B) ∪ ( A ∩ B) et les ensembles A ∩ B
et A ∩ B forment une partition de A donc Card( A) = Card( A ∩ B) + Card( A ∩
B). D’autre part, on a A ∪ B = B ∪ A ∩ B (on peut le voir sur un graphe) et B et
A ∩ B forment une partition de A ∪ B donc Card( A ∪ B) = Card( B) + Car ( A ∩
B). On en déduit que :
Card( A ∪ B) = Card( B) + Car ( A ∩ B)
= Card( B) + Card( A) − Card( A ∩ B).

Exemple 3.3. Dans une équipen d’étudiants d’une université du Cameroun, on dénombre
65 étudiants en Histoire et 55 étudiants en Economie. De plus, 20 d’entre eux étudient
à la fois l’histoire et l’économie. Combien y a t-il d’étudiants dans cette équipe ?
Soit A l’ensemble des étudiants qui étudient l’Histoire ; B l’ensemble des étudiants qui
étudient l’économie. On a Card( A) = 65, Card( B) = 55 et Card( A ∩ B) = 20.
Card( A ∪ B) = Card( A) + Carb( B) − Card( A ∩ B) = 65 + 55 − 20 = 100.

3.1.4 Notion de produit cartésien d’ensembles


Définition 3.7.
Soit A et B deux ensembles. On appelle produit cartésien de A par B et on note A × B(lire
 A croix B ) l’ensemble des couples ( a, b ) tels que a ∈ A et b ∈ B.

De façon générale, on appelle produit cartésien de n ensemble E1 , E2 ,. . .,En tout n−uplet


( a1 , a2 , . . . , an ) tels que pour tout i = 1..n, ai ∈ Ai . On note E1 × E2 × · · · × En .
Si E1 = E2 = · · · = En = E, alors on note E1 × E2 × · · · × En = E × E × · · · × E = En .
Proposition 3.5.
Soit A et B deux ensembles finis non vides, alors Card( A × B) = Card( A) × Card( B).
De façon générale, pour n ensembles finis tous non vides E1 , E2 ,. . .,En , on a :

Card( E1 × E2 × · · · × En ) = Card( E1 ) × Card( E2 ) × · · · × Card( En ).

Démonstration. Nous allons prouver le résultat général. Le premier s’obtenant en pre-


nant n = 2.
Un élément de E1 × E2 × · · · × En est un n−uplet de la forme ( a1 , a2 , . . . , an ) où chaque
ai ∈ Ei . Pour constituer un tel n−uplet, il faut choisir un élément dans A1 , et il y
a Card( A1 ) façon d’effectuer ce choix, à chaque choix d’un élement dans A1 , il y a
Card( A2 ) choix possible de l’élément dans A2 , il y a donc Card( A1 ) × Card( A2 ) façons
de choisir les 2 premiers éléments qu n−uplets, un raisonnement inductif conduit à
Card( E1 × E2 × · · · × En ) = Card( E1 ) × Card( E2 ) × · · · × Card( En ).

Faculté de génie industriel 17 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Corollaire 3.1.
Soit E et F deux ensembles finis tous non vides de cardinaux respectifs p et n. Alors le
nombre d’applications de E dans F est n p .
Démonstration. Rappelons qu’une application de E dans F est une correspondance de
E dans F telle que toute élément de E ait exactement une image dans F. Etant donné
un élément dans E, il y a exactement Card( F ) = n façons de choisir son image dans F.
Une application f : E → F est entièrement définie par les images des éléments de E. Il
p
y donc n | ×n× {z· · · × n} = n applications possibles.
pfois

Exemple 3.4. On veut ranger 5 objets dans 3 boı̂tes, chaque boôite pouvant contenir 0
ou plusiers objets. Combien y a-t-il de rangements possibles.
Un rangement est une application de l’ensemble des 5 objets dans l’ensemble des 3
boı̂tes. Il y a donc 35 = 243 rangements possibles.
Exemple 3.5. Au jeu de pile ou face, on lance successivement n fois une pièce de
monnaie parfaitement équilibrée, on note P pour pile et F pour face. Déterminer le
nombre de résultats possibles.
Un résultat est une application de n éléments de l’ensemble de départ à 2 éléments
dans l’ensemble d’arrivée à n éléments, il y a donc 2n résultats possibles.

3.2 Analyse combinatoire.


3.2.1 Arrangement
Définition 3.8.
— Soit E un ensemble non vide de cardinal n. Soit p un entier inférieur ou égal à p.
On appelle p−uplet de E tout élément de E p .
— Soit E un ensemble non vide da cardinal n et p un entier naturel tel que p ≤ n. On
appelle arrangement de p élément(s) de E tout p−uplet d’éléments de E deux-à-
deux distincts.
Comment déterminer le nombre d’arrangements de p éléments de E ?
On suppose Card( E) = n ≥ 2
1. Cas p = 2.
Il s’agit de déterminer le nombre de couples ( x1 , x2 ) d’éléments distincts de E.
Pour déterminer un tel couple, on peut d’abord choisir x1 et il y a n choix pos-
sibles. Une fois x1 fixé, il faut choisir x2 distinct de x1 donc parmi les n − 1
éléments restant, il y a donc n − 1 choix possibles. Pour chaque choix de x1 , il
y a n − 1 choix possibles de x2 , il y a donc n(n − 1) arrangements possibles de 2
éléments de E. On note A2n = n(n − 1).
2. Cas général 2 ≤ p ≤ n.
Il s’agit de déterminer le nombre de p−uplets ( x1 , x2 , . . . , x p ) d’éléments deux-
à-deux distincts de E. On choisit d’abord x1 , il y a n choix possible. Une fois x1
choisi, il y a n − 1 choix possibles pour x2 . x1 et x2 étant choisis, il faut choi-
sir x3 différent de x1 et de x2 , il y a donc n − 2 choix possibles pour x3 . x1 ,
x2 ,. . .,x p−1 étant choisis, il y a n − ( p − 1) = n − p + 1 choix possibles de x p .
Il y a au total n(n − 1)(n − 2) . . . (n − p + 1) arrangements possibles, on note
p
An = n(n − 1)(n − 2) . . . (n − p + 1).

Faculté de génie industriel 18 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Proposition 3.6.
p
Le nombre d’arrangements de p éléments d’un ensemble E à n éléments, noté An est tel
p
que An = n(n − 1)(n − 2) . . . (n − p + 1).

Exemple 3.6. Un urne contient 10 boules numérotées de 1 à 10. On tire successivement


et sans remise 2 boules de l’urne. Déterminer le nombre de tirages possibles de deux
boules dans l’urne.
Il y a dix façons de choisir la première boule, 9 façons de choisir la seconde, il y a
donc A210 = 10 × 9 = 90 tirages possibles.
Corollaire 3.2.
p
Soit n et p deux entiers naturels tels que 1 ≤ p ≤ n. Il y a exactement An applications
injectives d’un ensemble à p éléments dans un ensemble à n éléments.

Démonstration. Soit E = { a1 , a2 , ..., a p } et F deux ensembles tels que Card( E) = p et


Card( F ) = n. Une application injective f de E dans F est entièrement déterminée par
le p−uplet ( f ( a1 ), f ( a2 ), . . . , f ( a p )) formé d’éléments distincts de F. C’est donc un ar-
p
rangement de p éléments de cet ensemble. Il y a donc An applications.

3.2.2 Permutations
Définition 3.9.
Soit n ≥ 1 un entier naturel et E un ensemble de cardinal n. On appelle permutation
de E tout arrangement de n éléments de E. Le nombre de permutations de E est donc
Ann = n(n − 1)(n − 2) . . . 2 × 1.

Définition 3.10 (Notation factorielle).

Soit n ≥ 1 un entier naturel, on appelle factorielle de n et on note n! (lire  factorielle n )


l’entier naturel n! = n(n − 1) × 2 × 1.
On pose par convention 0! = 1.

Proposition 3.7.
p n!
Soit 0 ≤ p ≤ n deux entiers naturels, alors An = (n− p)!
.

3.2.3 Combinaison
Définition 3.11.
Soit n ≥ 1 un entier naturel, p ∈ N tel que 1 ≤ p ≤ n. On appelle combinaison de p
éléments d’un ensemble E de cardinal n, toute partie de E ayant p éléments.

Exemple 3.7. E = { x1 , x2 , x3 , x4 }. Les parties de E ayant 2 éléments sont { x1 , x2 },


{ x1 , x3 }, { x1 , x4 }, { x2 , x3 }, { x2 , x4 }, { x3 , x4 }. Il faut remarquer qu’il y en a 6. Il faut
aussi remarquer que { x1 , x2 } = { x2 , x1 }.
Comment déterminer le nombre de combinaisons de p éléments d’un ensemble à n
éléments ?

Faculté de génie industriel 19 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

1. si p > n, il n’y a aucune partie de E à p éléments ;


2. si p = 0, il y a une seule partie de E ayant 0 élément, ∅ ;
p
3. si 1 ≤ p ≤ n, soit { x1 , x2 , . . . , x p } une partie de E à p éléments. Notons par Cn le
nombre de parties de E à p éléments. Avec une partie à p éléments, on construit
p p
exactement p! arrangement de p éléments parmi n. Il vient donc que An = p!Cn .
p
p An n!
d’où Cn = n! = p!(n− p)!
.

Proposition 3.8.
p
p An n!
Le nombre de parties à p éléments d’un ensemble de cardinal n est Cn = n! = p!(n− p)!
.

Exemple 3.8. Une urne contient 15 boules indiscernables au toucher, trois boules sont
blanches et numérotées de 1 à 3, cinq boules sont rouges et numérotées de 1 à 5, sept
boules sont vertes et numérotées de 1 à 7. On tire successivement 3 boules de l’urne.
1. Combien y’ a t-il de tirage possibles ?
2. Combien y’ a t-il de tirage tricolores ?
3. Combien y’ a t-il de tirage unicolores ?

1. Le nombre de tirages possibles est le nombre de parties à 3 éléments d’un en-


3 = 15! = 15×14×13×12! = 15×14×13 = 5 × 7 × 13 =
semble à 15 éléments soit C15 3!12! 3!12! 2×3
455.
2. Avoir un tirage tricolore, c’est tirer une boule de chaque couleur, c’est choisir une
boule blanche parmi trois soit C31 , à chaque choix d’une boule blanche, il faut
choisir une boule rouge, il y a C51 choix possibles, à chaque choix d’une boule
blanche et d’une boule rouge, il y a C71 choix possibles d’une boule verte, il y a au
total C31 C51 C71 = 3 × 5 × 7 = 105 tirages possibles.
Ou encore, soit E1 l’ensemble des boules blanches, E2 l’ensemble des boules rouges
et E3 l’ensemble des boules vertes, un tirage tricolore est un élément de E1 × E2 ×
E3 , le nombre cherché est donc 3 × 5 × 7 = 105.
3. Le nombre de tirage unicolore est C33 + C53 + C73 = 46.

3.2.4 Quelques formules usuelles de dénombrement


p n− p
Formule 3.1. Cn = Cn .
p p p −1
Formule 3.2 (Formule de Pascal). Cn = Cn−1 + Cn−1 . Cette formule permet de construire
le triangle de Pascal.

Formule 3.3 (Binôme de Newtom). Soit a et b deux nombres réels et n un entier naturel
supérieur ou égal à 2. Alors on a :
n
∑ ak bn−k = Cn0 an + Cn1 an−1 b1 + Cn2 an−2 b2 + · · · + Cn an− p b p + · · · + Cnn−1 a1 bn−1 + Cnn bn .
p
( a + b)n =
k =0

Exemple 3.9. ( a + b)5 = C50 a5 + C51 a4 b + C52 a3 b2 + C53 a2 b3 + C54 ab4 + C55 b5 = a5 + 5a4 b +
10a3 b2 + 10a2 b3 + 5ab4 + b5 .

Faculté de génie industriel 20 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Si dans la formule du binôme de Newton, on remplace a et b par 1, on otient la


relation classique :
Cn0 + Cn1 + · · · + Cnn = 2n .
Si on note P( E) l’ensemble des parties de E, et si Card( E) = n, alors Card(P( E)) = 2n .
En effet, le cardinal de P( E) est le nombre de partie de E, c’est donc la sommes des
n
nombres des parties de E ayant p éléments, p = 0..n, c’est donc ∑ Cnk = 2n .
k =0

3.2.5 Les différents modes de tirages


Une urne contient n boules numérotées de 1 à n. On se propose de tirer k boules de
l’urne, 0 ≤ k ≤ n.

Tirage simultané
On tire k boules à la fois. Un tirage est donc une partie de k éléments d’un ensemble
à n éléments. Le nombre de tirage est Cnk .

Tirage succeessif sans remise


On tire k boule(s), l’une après l’autre. Une boule tirée n’est plus remise dans l’urne,
un tirage est un arrangement de k éléments parmi n. Il y a donc Akn tirages possibles.

Tirage successif avec remise


On tire une boule après l’autre, seulement chaque boule tirée est remise dans l’urne
avant le prochain tirage, une boule est susceptible d’être tirée plusieurs fois. Un tirage
est alors une application d’un ensemble à k éléments dans un ensemble à n éléments.
Le nombre de tirages possibles est nk .

Exemple 3.10. Une urne contient 10 boules nulérotée de 1 à 10. Quatre sont noires,
deux sont blanches et les autres sont vertes. On tire deux boules de l’urne. Déterminer
le nombre de tirages possibles dans chacun des modes de tirages précédents.

3.3 Exercices
Exercice 3.1.
Dans une entreprise, il y a 800 employés. 300 sont des hommes, 352 sont membres d’un
syndicat, 424 sont mariés, 188 sont des hommes syndiqués, 166 sont des hommes mariés,
208 sont syndiqués et mariés, 144 sont des hommes mariés syndiqués. Combien y-a-t-il
des femmes célibataires non syndiqués ?

Exercice 3.2.

Faculté de génie industriel 21 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Soit A l’ensemble des nombres à 7 chiffres ne comportant aucun ”1”. Déterminer les car-
dinaux des ensembles suivants :
1. A.
2. A1 , ensemble des nombres de A ayant 7 chiffres différents.
3. A2 , ensemble des nombres pairs de A.
4. A3 , ensemble des nombres de A dont les chiffres forment une suite strictement crois-
sante (dans l’ordre où ils sont écrits).

Exercice 3.3.
On tire simultanément 5 cartes d’un jeu de 32 cartes. Combien de tirages différents peut-
on obtenir :
1. sans imposer de contraintes sur les cartes ;
2. contenant 5 carreaux ou 5 piques ;
3. 2 carreaux et 3 piques ;
4. au moins un roi ;
5. au plus un roi ;
6. 2 rois et 3 piques

Exercice 3.4.
On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de phy-
sique et 3 livres de chimie. De combien de façons peut-on effectuer ce rangement :
1. si les livres doivent êtres groupés par matières ;
2. si seuls les livres de mathématiques doivent être groupés.

Exercice 3.5.
On dérise former un jury composé de 2 scientifiques et 3 littéraires. On peut choisir les
membres du jury parmi 5 scientifiques et 7 littéraires. De combien de façons peut-on
constituer le jury dans chacun des cas suivants :
1. N’importe quel scientifique et n’importe qu’el littéraire peut-être chois.
2. L’un des littéraires doit obligatoirement faire parti du jury.
3. Deux scientifiques ne s’entendent pas et ne veulent pas faire partie du même jury.
4. Même question si ce sont deux littéraires qui ne s’entendent pas.

Exercice 3.6.
On dispose de 10 billes que l’on veut placer sur une même rangée.
1. On suppose que les 10 billes sont de couleurs différentes. De combien de façons
peut-on les ranger ?
2. On suppose qu’il y a 5 billes rouges, 2 blanches et 3 vertes, et que l’on ne peut pas
discerner les billes de mêm e couleur.
a. De combien de façons peut-on les ranger ?
b. De combien de façons peut-on les ranger si l’on veut que les billes soient
groupées par couleurs ?
c. Même question mais seules les rouges doivent être groupées.

Faculté de génie industriel 22 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Exercice 3.7.
Combien y a-t-il de zéros à la fin de 100! ?
Exercice 3.8.
On appelle main tout ensemble de 13 cartes prises dans un jeu de 52 cartes.
1. Combien y a-t-il de mains différentes ?
2. Combien y a-t-il de mains différentes contenant :
a. au moins 1 pique ?
b. au plus 1 pique ?

Exercice 3.9.
Dans une classe, il y a autant de filles que de garçons. Tous les élèves étudient au moins
une langue. Parmi eux : 10 étudient l’espagnol ; 15 étudient l’allemand ; 20 étudient l’an-
glais ; 7 étudient l’espagnol et l’allemand, 8 étudient l’allemand et l’anglais, 9 étudient
l’anglais et l’espagnol ; quel est l’effectif de la classe ?.

Exercice 3.10.
Un championat sportif regroupe 20 équipes, chaque match oppose 2 équipes et chaque
équipe doit, pendant la saison, rencontrer chacune des 19 autres formations une fois sur
son propre terrain et une fois sur le terrain de l’adversaire. Combien de rencontres faut’il
organiser au total pour respecter ce règlement ?

2 match pos-
Solution. Un match est un choix de 2 équipes parmi les 20 ; donc on a C20
2 = A2 match.
sibles pour la phase allée. Il y a donc en tout 2C20 20

Exercice 3.11.
Des cambrioleurs se trouvent devant un coffre-fort qui ne peut s’ouvrir qu’avec un code
de 5 chiffres.
1. Quel est le nombre total de codes possibles ?
2. Combien y a-t-il de codes composés de 5 chiffres distincts ?
3. Calculer le nombre de codes composés de 2 chiffres différents dont un n’est utilisé
qu’une seule fois.

Exercice 3.12.
Un représentant doit au cours d’une tournée visiter 5 villes. Sachant que dans sa zone
d’action se trouvent 8 villes d’importance égale :
1. Combien peut-il choisir de groupes de 5 villes ?
2. Combien d’itinéraires différents peut-il envisager ?
3. En supposant qu’il ait déjà sélectionner les 5 villes, de combien de manières peut se
faire sa prospection ?

Exercice 3.13.
De combien de façons 4 personnes peuvent s’asseoir dans une voiture de 6 places ?

Faculté de génie industriel 23 Probabilités et Statistiques, 2019-2020


Chapitre 4

Eléments de base de la théorie des


probabilités

4.1 Espaces probabilisés, définition d’une probabilité


4.1.1 Introduction
Définition 4.1 (Expérience aléatoire).

Certaines expériences entrâinent des résultats éléatoires, c’est-à-dire qui dépendent du


hasard. On les appellent expériences aléatoires ou épreuves aléatoires.

Exemple 4.1.
Expérience 1. On jette un dé cubique dont les faces sont numérotées de 1 à 6, et on lit le
numéro apparu sur la face supérieure.
Expérience 2. On jette deux fois de suite un dé cubique et on note les numéros obtenus.
Exemple 4.2. On lance une pièce de monnaie et on s’intéresse au côté apparu quand la
pièce est tombée et est stable. Il y a deux possibilités d’apparition :  Face et  Pile .
L’expérience de la pièce est une expérience aléatoire. L’ensemble des résultats possible
est noté { pile, f ace}.
Définition 4.2 (Univers des possibles).

On appelle univers des possibles d’une expérience aléatoire l’ensemble de tous les
résultats possibles de cette expérience. On le note en général Ω.

Exemple 4.3. Dans l’exemple précédant, Ω = { pile, f ace}.


Définition 4.3 (Evénements).
Etant donnée une expérience aléatoire, un événement est une partie de l’univers des pos-
sibles Ω.
Exemple 4.4. On lance un dé cubique dont les faces sont numérotées de 1 à 6, on
s’intéresse au numéro sur la face supérieure lorsqu’il est retombé. On a :

Ω = {1; 2; 3; 4; 5; 6}.

Soit A l’événement  la face supérieure du dé porte un multiple de 3 , on a A =


{3; 6} ⊂ Ω.

24
Patrick Njionou,S.

Définition 4.4 (Evénement élémentaire).

On appelle événement élémentaire d’une expérience aléatoire tout singleton de l’univers


des possibles.

Exemple 4.5. Ω = {1; 2; 3; 4; 5; 6}, les événements élémentaires sont {1}, {2}, {3}, {4},
{5}, {6}.
Proposition 4.1.

Tout ensemble non vide de l’univers des possibles d’une expérience aléatoire est réunion
des événements élémentaires.
Définition 4.5 (Evénement impossible).

L’événement impossible d’un univers Ω est la partie vide de Ω notée ∅.

Définition 4.6 (Evénement certain).

L’événement certain d’un univers Ω est la partie pleine de Ω = Ω.

Exemple 4.6. Dans l’exemple du lancé de dé, on va considérer les événements :


— A :  le chiffre apparut sur la face supérieure du dé est strictement supérieur à
6
— B :  le chiffre apparut sur la face supérieure du dé est un nombre entier 
On a A = ∅ et B = {1; 2; 3; 4; 5; 6}. A est l’événement impossible et B est l’événement
certain.
Définition 4.7 (Evénement ”A et B”, ”A ou B”).

Soient A et B deux événement d’un univers Ω.


1. L’événement ”A et B sont réalisés” est l’intersection A ∩ B des deux événements A
et B.
2. Lévénement ”A ou B est réalisé” est la réunion des deux événements A et B, A ∪ B.

Exemple 4.7. On lance un dé cubique et on considère les événements suivants :


1. A :  le chiffre apparut sur la face supérieure du dé est un multiple de 3 
2. B :  le chiffre apparut sur la face supérieure du dé est un nombre pair 
3. C :  le chiffre apparut sur la face supérieure du dé est un multiple pair de 3 
4. D :  le chiffre apparut sur la face supérieure du dé est un multiple de 3 ou un
nombre pair 
On a A = {3; 6}, B = {2; 4; 6}, C = {6}, D = {2; 3; 4; 6} et C = A ∩ B, D = A ∪ B.
Définition 4.8 (Evénements incompatibles).

Deux événements A et B d’un univers Ω sont dits incompatibles lorsque l’événement


A ∩ B est impossible.

Exemple 4.8. On dispose d’une pièce de monnaie parfaitement équilibrée, on la lance


7 fois de suite et on note chaque fois le côté apparu.
— A :  il apparait trois fois face au cours des 7 lancés 
—  il apparait trois quatre face au cours des 7 lancés 

Faculté de génie industriel 25 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Les événements A et B sont incompatibles.


Définition 4.9 (Evénements contraires).
A est un événement d’un univers Ω. On appelle événement contraire de A l’ensembles
des événements élémentaires de Ω qui ne sont pas dans A. On le note
A
Ā = {ω ∈ Ω, ω ∈
/ A} = CΩ .

Remarque 4.1. Les événements A et Ā sont incompatibles, l’événement A ∩ Ā est impossible


et l’événement A ∪ Ā est certain.

4.1.2 Notion de probabilité


Considérons le lancé d’une pièce de monnaie parfaitement symétrique. Il y a autant
de chance d’apparition du côté ”Pile” que du côté ”Face”. On dit que l’événement
élémentaire ”face” a une chance sur 2 d’apparition. On exprime cela en associant à
l’événement ”face” le nombre 1/2 et on dit que 1/2 est la probabilité de l’événement
{ f ace} qu’on note P({ f ace}) = 1/2.
Définition 4.10.
Soit Ω un univers fini de cardinal n ≥ 1. On peut écrire Ω = {ω1 , ω2 , ω3 , . . . , ωn }. A
chaque événement élémentaire {ωi }, on associe P : {ωi } 7→ P({ωi }) vérifiant :
1. P({ωi }) ≥ 0, ∀i ∈ {1, 2, . . . , n}
n
2. ∑ P({ωi }) = 1.
i =1
3. P(∅) = 0.
P({ωi }) représente la probabilité de l’événement élémentaire {ωi } et P est une probabilité
sur Ω.
Définition 4.11 (Probabilité d’un événement quelconque).

Soit Ω un univers fini de cardinal n ≥ 1. A une partie non vide de Ω et cardA = p,


1 ≤ p ≤ n. Si on pose A = { a1 , a2 , . . . , an }, alors on définit la probabilité de A comme
p
P( A) = ∑ P( ai ), où P( ai ) est la probabilité de l’événement élémentaire ai .
i =1

Exemple 4.9. Ω = { a, b, c, d, e}. P({ a}) = 2P({b}) = 2P({c}) = 4P({d}) = 4P({d}).


Calculer les probabilités de chacun des événements suivants : A = { a, b}, B = {c, e},
C = {b, c, d}.
1
On sait que : P( a) + P(b) + P(c) + P(d) + P(e) = 1, d’où 10P(e) = 1 et P(e) = 10 . On
1 1 2
en déduit P(d) = 10 , P(c) = P(b) = 5 et P( a) = 5 .
On a ensuite :
P( A) = P( a) + P(b) = 35 , P( B) = P(c) + P(e) = 10
3
, P(C ) = P(b) + P(c) + P(d) = 21 .
Définition 4.12 (Probabilité uniforme).
Soit Ω une univers fini non vide de cardinal n ≥ 1. On dit que la probabilité sur Ω est
uniforme si les événements élémentaires de Ω ont la même probabilité n1 . On dit aussi
qu’il y a équiprobabilité sur Ω.

Faculté de génie industriel 26 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Exemple 4.10.
— Ω = { P, F }, P({ F }) = P({ P}) = 12
— Ω = {1; 2; 3; 4; 5; 6}, P({1}) = P({2}) = P({3}) = P({4}) = P({5}) =
P({6}) = 16 .
Théorème 4.1.
Soit Ω une univers fini non vide, A une partie de Ω, si la probabilité est uniforme sur Ω,
alors on a :
card( A)
P( A) = .
card(Ω)

4.1.3 Propriétés liées aux opérations sur les événements


Réunion d’événements incompatibles
Proposition 4.2.

Si A ∩ B = ∅, alors P( A ∪ B) = P( A) + P( B).

Démonstration. Si A ∩ B = ∅, alors card( A ∪ B) = card( A) + card( B), d’où

card( A ∪ B) card( A) card( B)


P( A ∪ B) = = + = P ( A ) + P ( B ).
card(Ω) card(Ω) card(Ω)

Corollaire 4.1.
Soit A1 , A2 ,. . .,An n événements deux-à-deux incompatibles. Alors :

P ( A1 ∪ A2 ∪ · · · ∪ A n ) = P ( A1 ) + P ( A2 ) + · · · + P ( A n ).

Probabilité d’événements contraires


Proposition 4.3.

Soit A ⊂ Ω, A 6= ∅. Alors P( A) = 1 − P( Ā).

Démonstration. Evidente.

Réunion d’événement quelconques


Proposition 4.4.

Soit Ω un univers non vide, A et B deux parties de Ω telles que A ∩ B 6= ∅. Alors :

P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A ∩ B ).

Exemple 4.11. Une urne contient 6 boules indiscernables au toucher, numérotées de 1 à 6. On


tire au hasard une boule de l’urne et on note son numéro.
1. Quelle est la probabilité d’avoir un chiffre pair.

Faculté de génie industriel 27 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

2. Quelle est la probabilité d’avoir un chiffre plus grand que 4.

Solution Ω = {1, 2, 3, 4, 5, 6}
3
1. A = {2, 4, 6}, cardA = 3 donc P( A) = 6 = 12 .
2
2. B = {5, 6}, cardB = 2 donc P( B) = 6 = 13 .
Exemple 4.12. On tire au hasard une carte d’un jeu de 32 cartes comprenant quatre ”cou-
leurs” : les piques, les treffles, les carreaux et les coeurs. Chaque ”couleur” est composée de huit
cartes de la façon suivante : Un as, un roi, une dame, un valet, un 10, un 9, un 8 et un 7. Quelle
est la probabilité de tirer un treffle ? un as ? la dame de coeur ? une carte rouge ? (le pique et le
treffle sont noirs, le carreau et le coeur sont rouges).

Solution cardΩ = 32, cardR = 16 R = rouge, cardN = 16, N = noire, cardC = 8, C =


carreau, cardT = 8, T = treffle.
8
— P( T ) = 32 = 14 ,
4
— cardA = 4 (A=as) donc P( A) = 32 = 18 ,
1
— cardDc = 1 (Dc =damme de coeur) donc P( Dc ) = 32 ,
16 1
— P( R) = 32 = 2 .

Exemple 4.13 (Tirage simultané). Un sac contient dix boules indiscernables au touché dont
6 rouges et 4 noires. On tire simultanément au hasard 3 boules du sac et on note leur couleur.
Calculer la probabilité de chacun des événements suivants :
— A :  les trois boules contiennent au moins un rouge 
— B :  les trois boules contiennent au plus un rouge 

Solution On a cardΩ = C10 3 = 10! = 120.


3!7!
116 29
— cardA = C61 C42 + C62 C41 + C63 C40 = 116 donc P( A) = 120 = 30 .
40
— cardB = C43 C60 + C42 C61 = 40 donc P( B) = 120 = 31 .
Exemple 4.14 (Tirage successif avec remise). Un sac contient 8 boules indiscernables au
touché dont 5 rouges et 3 noires. On tire au hasard une boule du sac, on note sa couleur, on la
remet dans le sac. Puis, on tire au hasard une deuxième boule et on note sa couleur. Calculer la
probabilité des événements suivants :
1. A :  les deux boules tirées sont de couleurs différentes 
2. B :  les deux boules tirées sont de la même couleur .

SolutionSoit Ω l’univers des possibles. cardΩ = 82 = 64.


— cardA = 51 31 + 31 51 = 30, P( A) = 30 15
64 = 32 .
— carB = 52 + 32 = 34. P( B) = 1732 .

Exemple 4.15 (Tirage successif sans remise). Un sac contient 8 boules indiscernables au
touché dont 5 rouges et 3 noires. On tire au hasard une boule du sac, on note sa couleur, on ne
la remet pas dans le sac et on tire au hasard une deuxième boule et on note sa couleur. Calculer
la probabilité des événements suivants :

Solution cardΩ = A28 = 56.


— cardA = 2A15 A13 = 30, P( A) = 15
28 .
2 2 13
— cardB = A5 + A3 = 26, P( B) = 28 .

Faculté de génie industriel 28 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

4.2 Probabilités conditionnelles et Formules de Bayes


4.2.1 Probabilités conditionnelles
On lance une fois un dé cubique parfait dont les faces sont numérotées de 1 à 6.
Soit A l’événement :  on obtient un nombre inférieur ou égal à 5 et B l’événement :
 on obtient un nombre supérieur ou égal à 3 

Supposons que l’on sache que l’événement A est réalisé.


Le résultat du lancé est donc un élément ω de {1, 2, 3, 4, 5} et il y a 5 cas possibles.
B est réalisé si et seulement si ω ∈ {3, 4, 5}. Il y a donc 3 cas favorables pour que B soit
réalisé.
3
La probabilité que B soit réaliré sachant que A l’est est .
5
5 3 3 P( A ∩ B)
D’autre part, P( A) = et P( A ∩ B) = , donc = .
6 6 5 P( A)
Définition 4.13 (Probabilité conditionnelle).
Soit Ω l’univers des possibles d’une expérience aléatoire, B un événement de Ω tel que
P( B) 6= 0. P étant la probabilité définie sur Ω. On appelle probabilité conditionnelle re-
lative à B l’application PB définie sur l’ensemble des parties de Ω P(Ω) et à valeur dans
[0, 1] par :
P( A ∩ B)
∀ A ⊂ Ω, PB ( A) = .
P( B)
PB ( A) se note aussi P( A/B) : probabilité de A sachant que B est réalisé.
Exemple 4.16. Une classe de Tle est constituée de 45 élèves dont 9 filles et 45 garçons. On
demande des volontaires pour former une équipe de football mixte. On obtient 3 filles et 30
garçons.
1. Parmi les 45 élèves, on choisit un ou une au hasard. Calculer la probabilité de chacun des
événements suivants :
— F :  l’élève choisie est une fille 
— G :  l’élève choisi est un garçon 
— V :  l’élève choisi(e) est un ou une volontaire 
— N :  l’élève choisi(e) est un ou une non volotaire 
— H :  l’élève choisie est une fille volontaire 
2. Parmi les élèves, on choisit une fille au hasard. Calculer la probabilité de l’événement  la
fille choisie est une volontaire .
Solution
1. cardΩ = 45
1
— cardF = 9, P( F ) = .
5
4
— cardG = 36, P( G ) = .
5
11
— cardV = 33, P(V ) = .
15
4
— cardN = 12, P( N ) = .
15
1
— card( H ) = 3, P( H ) = .
15
1 P (V ∩ F ) P( H ) 1
2. P( Q) = ; ou encore P( Q) = = = .
3 P( F ) P( F ) 3

Faculté de génie industriel 29 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

4.2.2 Lois de Bayes


Définition 4.14 (Système complet d’événements).
Soit A1 , A2 ,. . .,An une famille de parties d’un ensemble Ω. Les Ai forment un système
complet d’événements de Ω si :
n
Ai = Ω ;
S

i =1
— pour tout (i, j) ∈ {1, 2, . . . , n}2 tel que i 6= j, Ai ∩ A j = ∅.

Théorème 4.2 (Formule des probabilités totales).


Soit ( Ai )i=1,...,n un système complet d’événements de probabilités non nulles. Pour tout
événement B, on a :
n n
P( B) = ∑ P( Ai ∩ B) = ∑ P( Ai ) P( B/Ai ).
i =1 i =1

 
n n
Démonstration. On a B = Ω ∩ B = ∩B = ( Ai ∩ B). Comme les Ai sont
S S
Ai
i =1 i =1
n
deux à deux disjoints, il en est de même des Ai ∩ B d’où P( B) = ∑ P( Ai ∩ B). De plus,
i =1
d’après la formule des probabilités conditionnelles, on a P( Ai ∩ B) = P( Ai ) × P( B/Ai )
n
d’où P( B) = ∑ P( Ai ) P( B/Ai ).
i =1

Exemple 4.17. On dispose de deux urnes U1 contenant r1 boules rouges et n1 boules noires et
U2 contenant r2 boules rouges et n2 boules noires. On tire une boule de U1 que l’on met dans
U2 et on tire une boule de U2 .
1. Quelle est la probabilité que la boule tirée de U2 soit noire ?
2. Sachant qu’on a tiré une boule noire de U2 , quelle est la probabilité que l’on ait tiré une
boule rouge de U1 ?
Solution
1. On note Ni l’événement tirer une boule noire de l’urne i et Ri l’événement tirer
une boule rouge de l’urne i, i = 1, 2. On a donc : tirer une boule noire de U2 c’est
tirer une boule noire de U1 et une boule noire de U2 ou tirer une boule rouge
de U1 et tirer une boule noire de U2 . De façon symbolique on a N2 = ( N2 ∩
N1 ) ∪ ( R1 ∩ N2 ) Donc P( N2 ) = P( N2 ∩ N1 ) + P( R1 ∩ N2 ) = P( N1 ) P( N2 /N1 ) +
P( R1 ) P( N2 /R1 )
n1 n2 + 1 r1 n2 n1 ( n2 + 1) + n2 r1
= + =
n1 + r1 n2 + r2 + 1 n1 + r1 n2 + r1 + 1 (n1 + r1 )(n2 + r2 + 1)
2. Il s’agit ici de calculer
r1 n2
P( R1 ∩ N2 ) P( R1 ) P( N2 /R1 ) n1 + r1 n2 + r2 + 1
P( R1 /N2 ) = = =
P( N2 ) P( N2 ) n1 ( n2 + 1) + n2 r1
(n1 + r1 )(n2 + r2 + 1)
r1 n2
d’où P( R1 /N2 ) =
n1 ( n2 + 1) + n2 r1

Faculté de génie industriel 30 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Théorème 4.3 (Formule de Bayes).

Soit ( Ai )i=1,...,n un système complet d’événements de probabilités non nulles, et B un


événement de probabilité non nulle. Pour tout j ∈ {1, 2, . . . , n}, on a :

P( A j ) P( B/A j )
P( A j /B) = n .
∑ P( Ai ) P( B/Ai )
i =1

P( A j ∩ B)
Démonstration. On a P( A j /B) = et en utilisant le théorème des probabilités
P( B)
totales, on obtient le résultat.
Exemple 4.18. Un lot de 100 dés contient 25 dés pipés tels que la probabilité d’apparition de
1
6 soit . On prend un dé au hasard, on le jette, on obtient 6. Quelle est la probabilité que le dé
2
soit pipé ?
Solution
On prend au hasard un dé et on le jette. Soit D l’événement :  le dé est pipé et S
l’événement :  on obtient 6 .
25 1 1
L’énoncé donne P( D ) = = et P(S/D ) = .
100 4 2
P( D ) P(S/D )
P( D/S) = , d’après la formule de Bayes pour le système
P( D ) P(S/D ) + P( D ) P(S/D )
1 3
complet d’événements { D, D }. On a par ailleurs P( D ) = 1 − P( D ) = 1 − = et
4 4
1
P(S/D ) = . Donc
6
1 1
× 1
P( D/S) = 4 2 = .
1 1 1 3 2
× + ×
4 2 6 4

4.3 Variables aléatoires


4.3.1 Généralités
Définition 4.15.
On appelle variable aléatoire réelle sur un univers Ω, toute application X : Ω → R,
ωi 7 → X ( ωi ) = x i .

Exemple 4.19. On lance deux fois de suite un décubique et on s’intéresse aux chiffres apparu
sur la face supérieure du dé. L’univers des possibles est Ω = {(i, j), 1 ≤ i ≤ 6, 1 ≤ j ≤ 6}.
On définit alors l’application X : Ω → R telle que X (i, j) = i + j. Par exemple
X (1, 2) = 1 + 2 = 3. X est une variable aléatoire sur Ω.
Vocabulaire
— On note x1 < x2 < · · · < xn les valeurs prises par X sur Ω et X (Ω) =
{ x1 , x2 , . . . x n }
— [ X = xi ] est l’événement  X prend la valeur xi .

Faculté de génie industriel 31 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

— [ X < xi ] est l’événement  X prend une valeur strictement inférieure à xi 


— [ a ≤ X ≤ b] = {ω ∈ Ω, a ≤ X (Ω) ≤ b}.

Exemple 4.20. Dans l’exemple ci-dessus, on a :


— [ X = 2] = {(1, 1)}, [ X = 4] = {(1, 3), (2, 2), (3, 1)}.
— [ X < 5] = {(1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (3, 1)}
— [ X < 13] = Ω.

Définition 4.16 (Fonction de répartition).

Soit X une variable aléatoire définie sur un univers Ω muni d’une probalite P. On appelle
fonction de répartition de X l’application :

F : R → [0, 1]
x 7→ P[ X ≤ x ]

On distingue trois types de variables aléatoire, suivant la nature de X (Ω) :


1. X (Ω) est un sous ensemble fini de R. On dit que X est une V.A.R discrète finie ;
2. X (Ω) est un sous-ensemble dénombrable de R. On dit que X est une V.A.R
discrète infinie
Par exemple, on lance un dé cubique jusqu’à ce que l’on obtienne un 6. Soit X
le nombre de lancers effectués. X est une V.A.R discrète infinie car X (Ω) = N∗ .
(La probabilité de ne jamais obtenir de 6 est nulle, mais cet événement n’est pas
impossible !)
3. X (Ω) est une réunion d’intervalle de R non réduits à un point, et F, la fonction
de répartition de X, peut s’écrire sous la forme :
Z x
F(x) = f (t)dt,
−∞

où f est une fonction à valeurs réelle, positive, ayant un nombre fini de points
R +∞
de discontinuité et telle que −∞ f (t)dt = 1. On dit alors que X est une V.A.R à
densité.
Nous étudions dans ce cours les variables aléatoires discrètes finies.

4.3.2 Variable aléatoire discrète finie


Définition 4.17 (Loi de probabilité).

Soit P une probabilité définie sur un univers Ω. On appelle loi de probabilité d’une va-
riable aléatoire X sur Ω l’application :

PX : X (Ω) → [0, 1]
xi 7→ PX ( xi ) = Pi = P[ X = xi ]

Dans la pratique, on définit cette loi par un tableau de la façon suivante :

xi x1 x2 ... xp ... xn
Pi P1 P2 ... Pp ... Pn

Faculté de génie industriel 32 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Exemple 4.21. On lance deux dés tétraédriques différentiables dont les faces sont numérotées
de 1 à 4. La variable aléatoire X étant la sommes des nombres obtenus. Définir la loi de proba-
bilité de X.

Solution On commence par déterminer l’univers des possibles Ω.

Ω=
{(1, 1), (1, 2), (1, 3), (1, 4), (2, 1), (2, 2), (2, 3), (2, 4), (3, 1), (3, 2), (3, 3), (3, 4), (4, 1), (4, 2), (4, 3), (4, 4).}

On a cardΩ = 16 et X (Ω) = {2, 3, 4, 5, 6, 7, 8}. On construit un tabeau de la forme


ci-dessous pour voir très rapidement les probabilités de chaque événement.

+ 1 2 3 4
1 2 3 4 5
2 3 4 5 6
3 4 5 6 7
4 5 6 7 8

On définit alors la loi de probabilité PX de la façon suivante :

1 2 3 4 3 2 1
PX (2) = , PX (3) = , PX (4) = , PX (5) = , PX (6) = , PX (7) = , PX (8) = .
16 16 16 16 16 16 16
On résume ce résultat dans le tableau suivant :
xi 2 3 4 5 6 7 8
1 2 3 4 3 2 1
Pi 16 16 16 16 16 16 16

Définition 4.18 (Fonction de répartition).

Soit X une variable aléatoire définie sur un univers Ω muni d’une probalite P. On appelle
fonction de répartition de X l’application :

F : R → [0, 1]
x 7→ P[ X ≤ x ]

La fonction de répartition F a les propriétés suivantes :

Proposition 4.5.

— Si x < x1 , F ( x ) = P[ X ≤ x ] = P(∅) = 0.
— Si x1 ≤ x ≤ x2 , F ( x ) = P[ X = x1 ] = P1 .
— Si x2 ≤ x ≤ x3 , F ( x ) = P[ X = x1 ] + P[ X = x2 ] = P1 + P2 .

Exemple 4.22. On reprend l’exemple ci-dessus :

xi 2 3 4 5 6 7 8
1 2 3 4 3 2 1
Pi 16 16 16 16 16 16 16

On définit alors la fonction de répartition de la façon suivante :

Faculté de génie industriel 33 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Pour 0<x<2 F(x) = 0


1
Pour 2<x<3 F ( x ) = 16
2
Pour 3<x<4 F ( x ) = 16
6
Pour 4<x<5 F ( x ) = 16
Pour 5<x<6 F ( x ) = 10
16
Pour 6<x<7 F ( x ) = 13
16
Pour 7<x<8 F ( x ) = 15
16
Pour 8<x F ( x ) = 1.

On la représente graphiquement par un diagramme cumulatif.

4.3.3 Caractéristiques d’une variable aléatoire


Définition 4.19 (Espérence mathématique).

Soit X une variable aléatoire prenant les valeurs { x1 , x2 , . . . , xn } avec les probabilités P1 ,
P2 ,. . .,Pn . On appelle espérence mathématique de X le nombre réel noté E( X ) et défini par
n
E( X ) = ∑ Pi xi .
i =1

Exemple 4.23. Si on reconsidère l’exemple précédent, on a

xi 2 3 4 5 6 7 8
1 2 3 4 3 2 1
Pi 16 16 16 16 16 16 16
2 6 12 20 18 14 8
Pi xi 16 16 16 16 16 16 16
n
80
E( X ) = ∑ Pi xi = 16 = 5.
i =1

Définition 4.20 (Variance et écart type).

Soit X une variance aléatoire prenant les valeurs { x1 , x2 , . . . , xn } avec les probabilités P1 ,
P2 ,. . .,Pn .
1. On appelle variance de X le réel noté V ( X ) et défini par
n
V (X) = ∑ Pi (xi − E(X ))2
i =1
p
2. On appelle écart type de X et on note σ la racine carrée de la variance. σ = V ( X ).

5 10
Exemple 4.24. Vérifier que dans l’exemple précédant, V ( x ) = 2 et σ = 2 .

Proposition 4.6.

Soit X une v a r sur Ω. Alors V ( X ) = E( X 2 ) − [ E( X )]2 .

Faculté de génie industriel 34 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Démonstration. On a en effet :
n
V (X) = ∑ Pi (xi − E(X ))2
i =1
n
= ∑ Pi (xi2 − 2xi [E(X )] + [E(X )]2 )
i =1
n n n
= ∑ Pi xi2 − 2[E(X )] ∑ Pi xi + [E(X )]2 ∑ Pi
i =1 i =1 i =1
= E( X ) − 2E( X ) + E( X ) = E( X ) − [ E( X )]2
2 2 2 2

Définition 4.21 (Moments).

Soit X une variable aléatoire prenant les valeurs { x1 , x2 , . . . , xn } avec les probabilités P1 ,
P2 ,. . .,Pn et k un réel strictement positif. On appelle moment d’ordre k de X le nombre réel
noté Mk ( X ) et défini par
n
Mk ( X ) = ∑ Pi xik .
i =1

M1 ( X ) = E( X ), V ( X ) = M2 ( X ) − ( M1 ( X ))2 .

Définition 4.22 (Variable aléatoire centrée réduite).

Soit X une variable aléatoire réelle.


1. Si σ( X ) = 1, on dit que X est une V.A.R réduite.
X − E( X )
2. Si σ( X ) 6= 0, Y = est appelée V.A.R centrée réduite associée à X.
σ(X )

Proposition 4.7.

Soit X une V.A.R, a et b deux nombres réels. Alors :


1. E( aX + b) = aE( X ) + b ;
2. V ( aX + b) = a2 V ( X ) ;
3. σ( aX + b) = | a|σ( X ).

4.4 Inégalité de Byenaymé Tchébichev


Proposition 4.8 (Inégalité de Markov).

Soit X une variable aléatoire d’espérance mathématique E( X ). Alors

E(| X |)
∀ a > 0, P(| X | ≥ a) ≤ .
a

Proposition 4.9 (Inégalité de Byenaymé Tchébichev).

Faculté de génie industriel 35 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Soit X une variable aléatoire d’espérance mathématique E( X ). Alors

V (X)
∀ a > 0, P(| X − E( X )| ≥ a) ≤ .
a2

4.5 Exercices
Exercice 4.1.
Une urne contient 9 boules numérotées de 1 à 9. On tire 2 boules. Déterminer la probabilité
d’obtenir 2 boules portant des numéros de même partité dans les cas suivants :
1. On tire les deux boules simultanément.
2. On tire une boule, on ne la remet pas et on tire la deuxième boule.
3. On tire une boule, on la remet avant de tirer la deuxième boule.

Exercice 4.2.
On jette 3 fois un dé de 6 faces, et on note a, b et c les résultats successifs obtenus. On note
Q( x ) = ax2 + bx + c. Déterminer le probabilité pour que :
1. Q ait deux racines réelles distnctes.
2. Q ait une racine réelle double.
3. Q n’ait pas de racines réelles.

Exercice 4.3.
On organise un tirage au sort entre n équipes de basket-ball de première division et n
équipes de deuxième division(chaque équipe joue un match et un seul).
1. Calculer la probabilité pn que tous les matchs opposent une équipe de première
division à une équipe de deuxième division.
2. Calculer la probabilité qn que tous les matchs opposent deux équipes de la même
division.
22n−1 n ≤ 22n .
3. Montrer que n ≤ C2n
4. En déduire lim pn et lim qn .
n→+∞ n→+∞

Exercice 4.4.
Le gérant d’un magasin d’informatique a reçu un lot de boı̂tes de CD-ROM, 5% des boı̂tes
sont abimés. Le gérant estime que :
— 60% des boı̂tes abimées contiennent au moins un CD-ROM défectueux.
— 98% des boı̂tes non abimées ne contiennent aucun CD-ROM défectueux.
Un client achète une boı̂te du lot. On désigne par A l’évènement : ”la boı̂te est abimée” et
par B l’évènement la boı̂te achtée contient au moins une disquette défectueuse”.
1. Donner les probabilités : P( A), P( Ac ), P( D | A), P( D | Ac ), P( D c | A) et P( D c | Ac ).
2. Le client constate qu’un CD-ROM acheté est déffectueux. Quelle est la probabilité
pour qu’il ait acheté une boı̂te abimée ?

Faculté de génie industriel 36 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Exercice 4.5.
Un questionnaire à choix multiples propose m réponses pour chaque question. Soit p la
probabilité qu’un étudiant connaisse la bonne réponse à une question donnée. S’il ignore
la réponse, il choisit au hasard l’une des réponses proposées. Quelle est pour le correcteur
la probabilité qu’un étudiant connaisse vraiment la bonne réponse lorsqu’il l’a donnée ?
Exercice 4.6.
Un lot de 100 dé contients 25 dés pipés tels que la probabilité d’apparition d’un six soit
1
de . On choisit un dé au hasard, on le jette, et on obtient un 6. Quelle est la probabilité
2
que le dé soit pipé ?
Exercice 4.7.
Une usine fabrique des pièces, avec une proportion de 0, 05 de pièces défectueuses. Le
contrôle des fabrications est tel que :
— si la pièce est bonne, elle est acceptée avec la probabilité 0, 96 ;
— si la pièce est mauvaise, est est refusée avec la probabilité de 0, 98.
On choisit une pièce au hasard et on contrôle. Quelle est la probabilité :
1. qu’il y ait une erreur de contrôle ?
2. qu’une pièce acceptée soit mauvaise ?

Exercice 4.8.
On suppose qu’on a un espace probabilisé tel que l’univers Ω est un ensemble fini de
cardinal un nombre premier p, et que le modèle choisi soit celui de l’équiprobabilité.
Montrer que deux événements A et B non triviaux ne peuvent pas être indépendants.
Exercice 4.9.
Vous êtes directeur de cabinet du ministre de la santé. Une maladie est présente dans la
population, dans la proportion d’une personne malade sur 10000. Un responsable d’un
grand laboratoire pharmaceutique vient vous vanter son nouveau test de dépistage : si
une personne est malade, le test est positif à 99%. Si une personne n’est pas malade, le
test est positif à 0, 1%. Autorisez-vous la commercialisation de ce test ?
Exercice 4.10.
Vous jouez à pile ou face avec un autre joueur. Il parie sur pile, lance la pièce, et obtient
pile. Quelle est la probabilité pour quil soit un tricheur ?
Exercice 4.11.
On considère un dé cubique truqué, de sorte que la probabilité d’obtenir la face numérotée
k est proportionnelle à k (on suppose que les faces sont numérotées de 1 à 6). Soit X la
variable aléatoire associée au lncer de ce dé.
1. Déterminer la loi de X et calculer son espérance.
1
2. On pose Y = . Déterminer la loi de Y et calculer son espérance.
X
Exercice 4.12.
Une urne contient 4 boules blanches et 4 boules noires. Toutes ont même probabilité d’être
tirées. On tire simultanément 5 boules de l’urne et on désigne par X la variable aléatoire
égale au nombre de boules blanches obtenues. Déterminer la loi de probabilité de X.

Faculté de génie industriel 37 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Exercice 4.13.
Une urne contient 5 boules numérotées 1, 2, 3, 3, 4. On tire deux boules simultanément et
on fait la somme X des nombres inscrits sur les boules tirées.
1. Déterminer la loi de probabilité de X.
2. Calculer l’espérance mathématique E( X ), la variance V ( X ), l’écart type σ ( X ).

Exercice 4.14.
On lance simultanément deux dés, tous les tirages étant équiprobables, et on note la
différence X des nombres portés sur les faces supérieures des dés. On fait la différence
dans le sens où elle est possible avec des nombres entiers naturels. Déterminer la loi de
probabilité de X, qui son espérance mathématique.

Exercice 4.15.
On rappelle que la probabilité d’un évènement A sachant que l’évènement B est réalisé se note
p B ( A ).
Une urne contient au départ 30 boules blanches et 10 boules noires indiscernables au
toucher.
On tire au hasard une boule de l’urne :
• si la boule tirée est blanche, on la remet dans l’urne et on ajoute n boules blanches
supplémentaires.
• si la boule tirée est noire, on la remet dans l’urne et on ajoute n boules noires
supplémentaires.
On tire ensuite au hasard une seconde boule de l’urne.
On note :
• B1 l’évènement :  on obtient une boule blanche au premier tirage 
• B2 l’évènement :  on obtient une boule blanche au second tirage 
• A l’évènement :  les deux boules tirées sont de couleurs différentes .
1. Dans cette question, on prend n = 10.
3
a. Calculer la probabilité p ( B1 ∩ B2 ) et montrer que p ( B2 ) = .
4
b. Calculer p B2 ( B1 ).
3
c. Montrer que p( A) = .
10
2. On prend toujours n = 10.
Huit joueurs réalisent l’épreuve décrite précédemment de manière identique et
indépendante.
On appelle X la variable aléatoire qui prend pour valeur le nombre de réalisations
de l’évènement A.
a. Déterminer p( X = 3). (On donnera la réponse à 10−2 près).
b. Déterminer l’espérance mathématique de la variable aléatoire X.
3. Dans cette question n est un entier supérieur ou égal à 1.
1
Existe-t-il une valeur de n pour laquelle p( A) = .
4

Exercice 4.16.

Faculté de génie industriel 38 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Dans une kermesse un organisateur de jeux dispose de 2 roues de 20 cases chacune.


La roue A comporte 18 cases noires et 2 cases rouges.
La roue B comporte 16 cases noires et 4 cases rouges.
Lors du lancer d’une roue toutes les cases ont la même probabilité d’être obtenues.
La règle du jeu est la suivante :
• Le joueur mise 1F et lance la roue A.
• S’il obtient une case rouge, alors il lance la roue B, note la couleur de la case obtenue
et la partie s’arrête.
• S’il obtient une case noire, alors il relance la roue A, note la couleur de la case
obtenue et la partie s’arrête.
1. Traduire l’énoncé à l’aide d’un arbre pondéré.
2. Soient E et F les évènements :
E :  à l’issue de la partie, les 2 cases obtenues sont rouges 
F :  à l’issue de la partie, une seule des deux cases est rouge .
Montrer que p(E) = 0, 02 et p(F) = 0, 17.
3. Si les 2 cases obtenues sont rouges le joueur reçoit 10F ; si une seule des cases est
rouge le joueur reçoit 2F ; sinon il ne reçoit rien.
X désigne la variable aléatoire égale au gain algébrique en euros du joueur (rappel
le joueur mise 1F).
a. Déterminer la loi de probabilité de X.
b. Calculer l’espérance mathématique de X et en donner une interprétation.
4. Le joueur décide de jouer n parties consécutives et indépendantes (n désigne un
entier naturel supérieur ou égal à 2)
a. Démontrer que la probabilité pn qu’il lance au moins une fois la roue B est telle
que pn = 1 − (0, 9)n .
b. Justifier que la suite de terme général pn est convergente et préciser sa limite.
c. Quelle est la plus petite valeur de l’entier n pour laquelle pn > 0, 9 ?

Faculté de génie industriel 39 Probabilités et Statistiques, 2019-2020


Chapitre 5

Lois de probabilité

5.1 Lois discrètes


5.1.1 Loi de Bernoulli
Shéma théorique
On considère une épreuve aléatoire  e  et un événement A lié à  e  de probabilité
p. On effectue une fois  e .
X = 1 si A est réalisé
Soit X la V.A.R définie par .
X = 0 si A n’est pas réalisé
On dit que X est la variable indicatrice de l’événement A.
La loi de X

k 0 1
P( X = k) 1− p p
Définition 5.1.
Soit p ∈ [0, 1]. On dit qu’une V.A.R suit la loi de Bernoulli de paramètre p, (notée B(1, p)),
lorsque X prend les valeur 0 et 1 avec les probabilités P( X = 0) = 1 − p et P( X = 1) = p.

Proposition 5.1.

Si X suit une loi de paramètre p, alors

E( X ) = p, V ( X ) = p (1 − p ).

Démonstration. — E( X ) = 0.P( X = 0) + 1.P( X = 1) = p.


— E( X ) = 1 .P( X = 1) = p d’où V ( X ) = E( X 2 ) − [ E( X )]2 = p − p2 = p(1 − p).
2 2

5.1.2 Loi binomiale


Schéma théorique
On considère une variable aléatoire  e  et un événement A lié à  e  de probabilité
p. On effectue n fois  e  dans les conditions identiques (p est constant et les épreuves
sont indépendantes).
Soit X le nombre de réalisations de A au cours des n épreuves.

40
Patrick Njionou,S.

La loi de X
X prend les valeurs 0, 1,. . .,n. Notons pk = P( X = k). A la suite d’une épreuve, un
résultat est un élément de { A, A}. A la suite de n épreuves, un résultat est un n−uplet
de l’ensemble { A, A} (c’est une partie à n éléments formée des événements A et A). Le
nombre de ces parties ayant exactement k succes et n − k échecs est Cnk . Les n épreuves
étant indépendantes, la probabilité d’un résultat est le produit des probabilités des
évévenents élémentaires la constituant : comme on a k succes et n − k échecs, alors la
probabilité d’obtenir une partie ayant k succes est pk qn−k , avec q = 1 − q. On en déduit
que pk = Cnk pk qn−k .
Définition 5.2.
Soit p ∈ [0, 1]. On dit qu’une V.A.R suit la loi Binomiale de taille n et de paramètre p,
(notée B(n, p)) lorsque X prend les valeurs 0, 1,. . .,n avec les probabilités pk = Cnk pk qn−k .
p est appelée probabilité du succes et q = 1 − p la probabilité de l’échec.

Exemple 5.1. On lance trois fois de suite une pièce bien équilibrée. Quelle est la probabilité
d’obtenir
1. une fois face ?
2. au moins une fois face ?
1
Solution La probabilité du succes p = 2 = q.
1. P1 = C31 21 212 = 38 .
2. Avoir au moins une fois face c’est avoir une fois face ou deux fois face ou trois
fois face. D’où :
P = C31 12 212 + C32 212 21 + C33 213 210 = 78 .
On pouvait aussi remarquer que les événements obtenir au moins une fois face
et n’obtenir aucune fois face sont incompatible, auquel cas, P = 1 − P0 = 1 −
C30 210 213 = 78 .
Théorème 5.1.
Si X suit la loi binomiale B(n, p), alors :

E( X ) = np, V ( X ) = np(1 − p).

Démonstration. .
Soit X une loi binomiale de paramètre n et p, on sait que Pk = Cnk pk (1 − p)n−k .
n n
On se propose de simplifier la somme E( X ) = ∑ Pk xk = ∑ Cnk pk (1 − p)n−k xk . Comme
k =1 k =1
n
pour tout k, xk = k, on a E( X ) = ∑ kCnk pk (1 − p )n−k . On considère alors la fonc-
k =1
tion f (t) = ( pt + q)n avec q = 1 − p. Par la formule du binôme de Newton, on a
n
f (t) = ∑ Cnk ( pt)k qn−k . En dédivant membre à membre cette expression on a
k =0
n
np( pt + q) n −1
= ∑ kCnk pk tk−1 qn−k
k =1

Choisissant t = 1, on obtient E( X ) = np.


On veut à présent établir que V ( X ) = npq.

Faculté de génie industriel 41 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

n
On a montrer que V ( X ) = E( X 2 ) − [ E( X )]2 donc V ( X ) = ∑ k2 Cnk pk (1 − p)n−k −
k =1
[ E( X )]2 .
On a (t f 0 (t))0 = f 0 (t) + t f 00 (t), c’est-à-dire
n
np( pt + q) n −1 2
+ n(n − 1) p t( pt + q) n −2
= ∑ k2 Cnk pk tk−1 qn−k .
k =1

Pour t = 1, on a np + n(n − 1) p2 = V ( X ) + (np)2 d’où V ( X ) = np − np2 = np(1 −


p ).

5.1.3 Loi de Poisson


Définition 5.3.
Soit λ > 0. On dit qu’une V.A.R X suit une loi de Poisson de paramètre λ (notée P(λ))
e−λ λn
lorsque X prend les valeurs entières : n ∈ N avec les probabilités : P( X = n) = .
n!

e−λ λn +∞ e−λ λn
Remarque 5.1. Pour tout n ∈ N, > 0 car λ > 0, et ∑ = e−λ eλ = 1. On
n! n =0 n!
définit bien une loi de probabilité.

Proposition 5.2.

Si X suit une loi de Poisson P(λ), alors

E( X ) = λ et V ( X ) = λ.

Démonstration. .
1. On a
+∞ ∞
λ n −1
E( X ) = ∑ nP( X = n) = ∑ λe−λ
( n − 1) !
= λ.
n =0 n =1

2. On vérifie que :
+∞ +∞
E( X 2 ) = ∑ n2 P ( X = n ) = ∑ n2 P(X = n) + P(X = 1) = λ2 + λ.
n =0 n =2

On déduit que V ( X ) = E( X 2 ) − [ E( X )]2 = λ2 + λ − λ2 = λ.

5.2 Lois continues


5.2.1 Généralités
Définition 5.4.

Faculté de génie industriel 42 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

On dit qu’un V.A.R X admet une densité f lorsque sa fonction de répartition F peut
s’écrire sous la forme Z x
F(x) = f (t)dt
−∞
où f est une fonction à valeurs réelles positives ayant un nombre fini de points de discon-
Z +∞
tinuité et telle que f (t)dt = 1.
−∞
On dit alors que X est une V.A.R à densité.
Théorème 5.2.
Une fonction f definie sur R est une densité de probabilité si et seulement si
— f est continue sur R sauf éventuellement en un nombre fini de points ;
— f ( x ) ≥ 0 pour tout x ∈ R ;
Z +∞
— f ( x )dx = 1.
−∞

1
Exemple 5.2. On montre que la fonction h définie sur R par h( x ) = est telle que
√ 1 + x4 √
Z +∞
π 2 2
h( x )dx = . On définit la fonction f pour tout x ∈ R par f ( x ) = h( x ). On
−∞ 2 π
vérifie alors que :
— f est continue sur R ;
— f ( x ) ≥ 0 pour tout
Z +∞ √x Z∈ R ; √ √
π 2 +∞ π 2 2
— f ( x )dx = g( x )dx = = 1.
−∞ 2 −∞ 2 π
donc f est une densité de probabilité.
Proposition 5.3.
Soit X une V.A.R admettant une densité f et une fonction de répartition F
1. Pour tout a ∈ R, P( X = a) = 0.
2. Pour tout a et b réels tels que a ≤ b
Z b
P( a < X < b) = P( a ≤ X < b) = P( a < X ≤ b) = P( a ≤ X ≤ b) = f (t)dt.
a

3. Pour tous a et b réels : Z a


— P( X < a) = P( X ≤ a) = f (t)dt ;
Z−+∞∞
— P( X > b) = P( X ≥ b) = f (t)dt.
b
 
Démonstration. 1. Pour tout a ∈ R, et tout n ∈ N∗ , 0 ≤ P( X = a) ≤ P a − n1 < X ≤ a .
     
1 1 1
Or P a − n < X ≤ a = F ( a ) − F a − et lim F a − = F ( a) car F est
 n n→∞  n

continue sur R donc en a. Ainsi lim P a − n1 < X ≤ a = 0 et donc P( X = a) =


n→∞
0.
2. Découle du fait que P( X = a) = P( X = b) = 0.
3. Découle du fait que P( X > b) = 1 − P( X ≤ b) et P( X < a) = P( X ≤ a).

Faculté de génie industriel 43 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Définition 5.5 (Espérence mathématique).


Z +∞
Soit X une V.A.R de densité f . Si l’intégrale x f ( x )dx converge, on dit que X admet
Z +∞ −∞

une espérence mathématique E( X ) = x f ( x )dx.


−∞
E( X ) est appelé moment d’ordre 1 de X ou encore la moyenne de X.

2 1
Exemple 5.3. Soit une V.A.R X dont la fonction de densité est f ( x ) = , alors
π 1 + x4
E( X ) = 0 car x f ( x ) est impaire.

Définition 5.6.
Si E( X ) = 0, on dit que X est une V.A.R centrée.
Si X admet une espérence mathématique, alors X − E( X ) est appelée V.A.R centrée as-
sociée à X.
Proposition 5.4.
Z +∞
Soit X une V.A.R de densité f . Si l’intégrale x2 f ( x )dx converge, la V.A.R X 2 admet
−∞
une espérance mathématique et
Z +∞
E( X 2 ) = x2 f ( x )dx.
−∞

Définition 5.7.

Soit X une V.A.R telle que E( X 2 ) existe.


— On appelle moment d’ordre 2 de X, le nombre réel E( X 2 ), noté m2 ( X ).
— Si X admet une espérence mathématique, on appelle variance de X le nombre réel
V ( X ) = E[( X − E( X ))2 ].
— Sip on admet une variance, on appelle écart type de X le nombre réel σ( X ) =
V ( X ).

Proposition 5.5.

Soit X une V.A.R de densité f , admettant une espérance mathématique E( X ). V ( X ) existe


Z +∞
si et seulement si [ X − E( X )]2 f ( x )dx converge.
−Z∞
+∞
On a alors V ( X ) = [ X − E( X )]2 f ( x )dx.
−∞

Théorème 5.3.
Soit X une V.A.R de densité f , admettant une espérance mathématique E( X ). V ( X ) existe
si et seulement si E( X 2 ) existe. On a alors :

V ( X ) = E( X 2 ) − [ E( X )]2 .

Proposition 5.6.

Faculté de génie industriel 44 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Soit X une V.A.R à densité, admettant une variance, et soit a et b deux nombres réels,
(a 6= 0).
La V.A.R aX + b admet une variance et

V ( aX + b) = a2 V ( X ), σ ( aX + b) = | a|σ( X ).

Définition 5.8.
Soit X une V.A.R admettant une variance.
Si σ( X ) = 1, on dit que X est une V.A.R réduite.
X − E( X )
Si X admet une espérance mathématique et un écart type non nul, est appelée
σ(X )
V.A.R centrée réduite associée à X.

5.2.2 Loi uniforme


Définition 5.9.
Une V.A.R suit la loi uniforme sur [ a, b] (notée U([ a, b])) lorsque X admet pour densité la
f ( x ) = b−1 a si x ∈ [ a, b]

fonction f définie par
f ( x ) = 0 sinon

La définition est la même sur chacun des intervalles ] a, b[, [ a, b[ et ] a, b].


Proposition 5.7.
Si X suit la loi uniforme sur [ a, b], alors X admet une espérance mathématique

a+b
E( x ) = .
2

Démonstration. On a en effet :
Z +∞ Z b  2 b
x 1 x b+a
s f (x) = = = .
−∞ a b−a b−a 2 a 2

5.2.3 Loi de Gauss ou loi normale


Définition 5.10.
Une loi X suit la loi normale centrée réduite noté N(0, 1) lorsque X admet pour densité la
1 − k2
fonction ϕ définie par ϕ( x ) = e 2.

Il est bon de remarquer que ϕ est bien une densité de probabilité.


Proposition 5.8.
Si X suit la loi normale N(0, 1), alors X admet une espérance mathématique et une va-
riance :
E( X ) = 0, V ( X ) = 1.

Faculté de génie industriel 45 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Proposition 5.9.

Si Φ est la fonction de répartition de la loi N(0, 1), on a : Φ(− x ) = 1 − Φ( x ) pour tout


x∈R
Démonstration. On a pour tout x ∈ R,
Z −x Z x
1 t2 1 u2
Φ(− x ) = √ e− 2 dt = − √ e− 2 du
2π −∞ 2π +∞

donc Z +∞ Z x
1 2
− t2 1 t2
Φ(− x ) = √ e dt − √ e− 2 dt = 1 − Φ( x ).
2π −∞ 2π −∞

Définition 5.11.
Une V.A.R X suit la loi normale (ou de Laplace-Gauss) de paramètres m et σ(σ > 0) noté
X(m, σ ) lorsque X admet pour densité la fonction f définie par

1 1 x −m 2
f ( x ) = √ e− 2 ( σ ) .
σ 2π

Proposition 5.10.

Soit X une V.A.R


X−m
X suit la loi normale N(m, σ ) si et seulement si X ∗ = sui la loi normale N(0, 1).
σ
Proposition 5.11.

Si X sui la loi normale N(m, σ), X admet une espérance mathématique et une variance

E( X ) = m, V ( X ) = σ2 .

5.3 Exercices
Exercice 5.1.
On considère une pièce de monnaie truquée de telle sorte que la probabilité d’obtenir pile
soit 0, 3.
On lance 10 fois la pièce. Quelle est la probabilité d’obtenir 3 fois pile ?

Exercice 5.2.
A et B sont deux avions ayant respectivement 4 et 2 moteurs. Chaque moteur a la proba-
bilité p de tomber en panne et les moteurs sont indépendants les uns des autres. Chaque
avion arrive à destination si moins de la moitié de ses moteurs tombent en panne. Quel
avion choisissez-vous ?
Exercice 5.3.

Faculté de génie industriel 46 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Le gérant d’un magasin de matériel informatique a acheté un très grand stock de boı̂te
49
de disquettes. Chaque boı̂te a la probabilité de contenir au moins une disquette
1000
défectueuse. Un client achète en une seule fois n boı̂tes de disquettes. S’il constate qu’une
disquette est défectueuse, il rapporte la boı̂te qui la contenait au magasin. Comment choi-
sir n pour qu’en moyenne il ait au plus une boı̂te à rapporter.

Exercice 5.4.
Le service de dépannage d’un grand magasin dispose d’équipes intervenant sur appel
de la clientèle. Pour des causes diverses les interventions ont lieu parfois avec retard.
On admet que les appels se produisent indépendamment les uns des autres et que, pour
chaque appel, la probabilité d’un retard est 0, 25. Un client appelle le service à quatre
reprises. On désigne par X la variable aléatoire prenant pour valeurs me nombre de fois
où ce client a dû subir un retard.
1. Déterminer la loi de probabilité de X, l’espérance et la variance de X.
2. Calculer la probabilité de l’événement : le client a subi au moins un retard.

Exercice 5.5.

Soit f la fonction définie sur R par f ( x ) = 21 e| x| .


1. Montrer que f est une densité de probabilité.
2. Soit X une V.A.R de densité f .
a. Déterminer la fonction de répartition F de X.
b. Montrer que X admet une espérance mathématique ; la déterminer.

Exercice 5.6.
Soit X une variable aléatoire de la loi uniforme sur [ a, b]. Montrer que X admet une va-
riance et calculer V ( X ).

Exercice 5.7.
La nuit, dans la savane, un lion se rend à la rivière pour boire et y reste un quart d’heure.
Après de nombreuses observations, on estime que l’instant T d’arrivée du lion à la rivière
se situe entre 0 heure et 2 heures. T, exprimée en heures, est une variable aléatoire réelle
dont une densité de probabilité est la fonction f définie par :

 0 si t ∈] − ∞, 0[

3
f (t) = t(2 − t) si t ∈ [0, 2] .
 4
0 si t ∈]2; +∞[

1. Vérifier que f est une densité de probabilité.


2. Un observateur se présente à la rivière à 0h30min et y reste un quart d’heure. Quelle
est la probabilité pour qu’il apperçoive le lion ?

Exercice 5.8.

Faculté de génie industriel 47 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Dans cet exercice, [ x ] désigne la partie entière du nombre réel x.


1. Soit p ∈]0, 1[ et f , la fonction numérique d’une variable réelle définie par f ( x ) =
[ x + p]. Etudier les variations de f et tracer sa courbe représentative dans un repère
orthonormé.
2. Soit U, une variable aléatoire suivant la loi uniforme sur [0, 1[, X = [U + p], où
p ∈]0, 1[. Déterminer la loi, l’espérance et la variance de X.

Exercice 5.9.
Soit quatre lancés successifs de deux dés. X étant le nombre de doubles obtenus au cours
des quatres lancés. Déterminer sa loi de probabilité, son espérance mathématique et son
écart type.

Faculté de génie industriel 48 Probabilités et Statistiques, 2019-2020


Chapitre 6

...

49
Chapitre 7

Echantillonnage et estimation

7.1 Echantillonnage
L’objectif de cette partie est de répondre à la problématique suivante : comment, à
partir d’informations (couple,moyenne-écart type ou proportion) connues sur une population,
peut-on prévoir celles d’un échantillon ?
Nous distinguons deux cas : celui où l’on étudie une moyenne dans un échantillon
et celui où l’on étudie une proportion dans un échantillon.

7.1.1 Etude de la moyenne d’un échantillon


On dispose d’une population sur laquelle est définie une variable aléatoire X dont
on connaı̂t l’espérance (ou la moyenne) µ et l’écart-type σ. On s’intéresse aux échantillons
de taille n. Auront-ils tous la même moyenne ? Non, certains peuvent être constitués
d’éléments atypiques et avoir une moyenne très différente de celle de la population
(surtout si l’échantillon est de très petite taille).
Notons X̄ la variable aléatoire qui à chaque échantillon de taille n, associe sa moyenne
(X̄ s’appelle encore la distribution des moyennes des échantillons). Que peut-on dire
de cette variable aléatoire X̄ ?

Théorème 7.1 (Théorème Central Limite (version faible)).

 N(µ, σ) sur le population, alors la variable


Si la variable aléatoire X suit une loinormale
X̄ suit également une loi normale N µ, √σn .

Théorème 7.2 (Théorème Central Limite (version forte)).

Si la variable aléatoire X suit une loi quelconque sur le population, avec E( X ) = µ et


n ≥
σ( X ) = σ et si 30, alors la variable aléatoire X̄ suit approximativement une loi nor-
male X̄ ,→ N µ, √σn .

Ce théorème est dû aux mathématiciens De Moivre et Laplace.


Il ne faut pas confondre l’écart-type √σn de la variable X̄ (qui est définie sur l’en-
semble des échantillons possibles de taille n) avec l’écart-type d’un échantillon prélevé.
L’écart-type de l’échantillon prélevé n’intervien pas dans nos calculs dans cette partie.
Pour éviter cette confusion, √σn sera parfois apprlée ”erreur type”.

50
Patrick Njionou,S.

Exemple 7.1. Les statistiques des notes obtenues en mathématiques au BAC STI en France
pour l’année 2006 sont :

Moyenne nationale : µ = 10, 44


Ecart-type : σ = 1, 46

Une classe de BTS comporte 35 élève en 2006/2007 issus d’un BAC STI en 2006. Calculer la
probabilité que la moyenne de cette classe soit supéririeure à 10.

Ici, nous ne connaissons pas la loi de la population, mais l’effectif n de l’échantillon


est supérieur à 30. Nous allons donc pouvoir utiliser le version forte du théorème cen-
tral limite. Notons X̄ la variable aléatoire qui, à tout échantillon de taille n = 35, fait
correspondre sa moyenne. Alors on a :
   
σ 1, 46
X̄ ,→ N µ, √ = N 10, 44; √ .
35 35
Nous obtenons alors par centrage et réduction :
 
X̄ − 10, 44 10 − 10, 44 
P( X̄ ≥ 10) = P  1,46
≥ 1,46
√ √
35 35
= P( T ≥ −1, 78) = P( T ≤ 1, 78)
= Π(1, 78)

Par lecture directe de la table de la loi normale centrée-réduite, on a Π(1, 78) = 0, 9625.
Il y a environ 96% de chance que, dans cette classe de BTS, la moyenne des notes au
baccalauréat de Mathématiques soit supérieure à 10.

7.1.2 Etude d’une proportion dans un échantillon


Cette fois-ci, on dispose d’une population sur laquelle on étudie un caractère (ou
attribut) A dont on connaı̂t la proportion p dans la population. On s’intéresse aus
échantillons de taille n. La population du caractère A dans l’échantillon sera-t-elle tou-
jours la même ? Evidemment non, cette proportion varie en fonction de l’échantillon
choisi. notons F la variable aléatoire qui à chaque échantillon de taille n, associe sa pro-
portion du caractère A (F s’appelle distribution des fréquences des échantillons). Que
peut-on dire de la variable aléatoire F ?

Théorème 7.3.
Soit une population sur laquelle on étudie un caractère A répendu avec une fréquence p.
On prélève, au haserd, un échantillon (tirage avec remise ou assimilé) de taille n avec n ≥ 30.
On note F la fréquence du caractère A dans l’échantillon. Alors la variable aléatoire F suit
approximativement une loi normale :
r !
p (1 − p )
F ,→ N p, .
n

Faculté de génie industriel 51 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Démonstration. Pour tout i compris entre 1 et n, notons Xi la variable aléatoire définie


par : 
1 si le i-ème élément de l’échantillon possède l’attribut A
Xi = .
0 sinon
La variable Xi suit une loi de Bernoulli de paramètre p.
La variable X = X1 + X2 + · · · + p Xn est donc binomiale de paramètre n et p. En
conséquence, E( X ) = np et σ( X ) = np(1 − p).
La variable aléatoire F = Xn correspond ainsi à la fréquence de l’attribut A dans l’échantillon.
D’après les propriétes de l’espérance et de l’écart type, on a :
E( X ) σ(X ) p (1 − p )
E( F ) = = p; σ( F) = = .
n n n

Exemple 7.2. Une élection a lieu et un candidat a eu 40% de voix. On prélève un échantillon
de 100 bulletins de vote.
Quelle est la probabilité que dans l’échantillon, le candidat ait entre 35% et 45% de voix ?
Ici, nous avons n = 100 et p = 0, 4. La variable aléatoire F correspond à la fréquence
des votes pour le candidat dans l’échantillon vérifé donc :
r !  √
0, 4(1 − 0, 4)

0, 24
F ,→ N 0, 4; = 0, 4; .
100 10

F − 0, 4
Posons T = √ , alors T ,→ N(0, 1). Nous obtenons alors par centrage et réduction
0,24
10

P(0, 35 ≤ F ≤ 0, 45) = P(−1, 02 ≤ T ≤ 1, 02) = 2Π(1, 02) − 1.


Par lecture directe de la table de la loi normale centrée-réduite, Π(1, 02) = 0, 8461.
D’où P(0, 35 ≤ F ≤ 0, 45) = 0, 6922.
Il y a donc environ 69% de chance que, dans chaque échantillon de taille n = 100, le
candidat ait entre 35% et 45% de voix.

En analysant l’exercice ci-dessus, on constate que l’on dispose des informations sur
la population (ici, l’ensemble des votes) parce que l’élection a déjà lieu. On en déduit
des informations sur l’échantillon. Mais, dans la pratique, c’est souvent le phénomène
réciproque que nous étudierons : les élections n’ont pas encore eu lieu et on vou-
drait retrouver les informations sur la population grâce à un sondage réalisé sur un
échantillon. D’où la section suivante sur l’estimation.

7.2 Estimation
L’objectif de cette section est de répondre à la problématique suivante : Comment, à
partir d’informations (couple moyenne/ecart-type ou proportion) calculées sur un échantillon,
retrouver ou plutôt estimer celles d’une population entière ? L’estimation est le problème
réciproque de l’échantillonnage.
Nous distinguerons deux cas : celui où l’on cherche à estimer la moyenne µ d’une
variable aléatoire définie sur une population et celui où l’on cherche à estimer la pro-
portion d’individus p ayant tel caractère dans la population.

Faculté de génie industriel 52 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

7.2.1 Estimation d’une moyenne


Estimation ponctuelle
On considère une variable aléatoire X sur une population de moyenne (ou espérance)
µ inconnue et d’écart-type σ inconnu (ou connu). On suppose que l’on a prélevé un
échantillon de taille n (tirage avec remise ou assimilé) sur lequel on a calculé la moyenne
µe et l’écart-type σe .

Proposition 7.1.

Une estimation ponctuelle µ̂ de la moyenne µ de la population est

µ̂ = µe .

Une estimation ponctuelle σ̂ de l’écart-type σ de la population est


n
σ̂ = σe .
n−1
r
n
Le coefficient s’appelle correction de biais. Lorsque la taille n de l’échantillon est
n−1

assez grand (en pratique n ≥ 30), ce coefficient est très voisin de 1, si bien que dans ce
cas, on peut estimer σ̂ ' σe .

Exemple 7.3. Un institut supérieur privé comporte 1500 étudiants. On mesure la taille de 20
d’entre eux. La moyenne µe et l’écart type σe calculés à partir de cet échantillon sont :

µe = 176cm σe = 6cm.

Nous povons donc estimer les paramètres de la population :


r
20
µ̂ = 176cm σ̂ = × 6 ' 6, 16cm.
19
Remarque 7.1. Nous n’avons fait qu’une estimation. Il est bien sûr impossible de retrouver
les vraies caractéristiques µ et σ de la population.

L’estimation ponctuelle permet surtout de disposer d’une valeur de référence pour


poursuivre, affiner les calculs. On souhaiterait notamment pouvoir faire une estimation
par intervalle, en contrôlant le risque pris.

Estimation par intervalle de confiance.


La situation ici est la même que ci-dessus. Sauf que nous allons raisonner en deux
temps, une phase à priori (ou prévisionnelle) dans laquelle on suppose que l’échantillon
n’est pas encore prélevé et une phase a postériori dans laquelle on suppose connue le
moyenne µe et l’écart type σe de l’échantillon et donc la moyenne estimée µ̂ et l’écart
type estimé σ̂ de la population.
Phase a priori : mise en place du modèle prévisionnel.

Faculté de génie industriel 53 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Nous avons vu, dans la théorie sur l’échantillonnage que si X̄ est la variable aléatoire
correspondant à la moyenne d’un échantillon de taille n pris au hasard, alors le Théorème
Central Limite permet d’affirmer que X̄ suit approximativement une loi normale :
 
σ
X̄ ,→ N µ; √ .
n
Nous allons chercher un intervalle qui contient µ avec une confiance arbitraire de 95%
(cela pourrait être aussi 99% ou un autre coefficient de confiance). Nous cherchons
donc un rayon r tel que

P( X̄ − r ≤ µ ≤ X̄ + r ) = 0, 95.

Cette disposition des inégalités n’est pas pratique mais il y a une correspondance re-
marquable entre deux événements qui va faciliter les calculs :

X̄ − r ≤ µ ≤ X̄ + r.

En retranchant X̄ et µ dans chaque memebre, on obtient :

−r − µ ≤ − X̄ ≤ r − µ ⇔ µ − r ≤ X̄ ≤ µ + r.
On est alors ramené à calculer

P(µ − r ≤ X̄ ≤ µ + r ) = 0, 95.

X̄ − µ n
On sait qu la variable T = σ = ( X̄ − µ) suit une loi normale centrée réduite

n
n
N(0, 1). On obtient alors par centrage et réduction :
!
µ−r−µ X̄ − µ µ+r−µ
P σ ≤ σ ≤ σ = 0, 95,
√ √ √
n n n

soit après simplification


 √ √   √ 
r n r n r n
P − ≤T≤ = 2Π − 1 = 0, 95.
σ σ σ
Ainsi, on a : √
r n
Π(t) = 0, 975 oùt = .
σ
Nous cherchons donc, par lecture graphique inverse de la table de la loi normale
centrée réduit une borne t telle que Π(t) = 0, 975. La borne t = 1, 96 convient, elle
dépend du coefficient de confiance choisi. Avec un coefficient de confiance de 99%,
nous aurions obtenu  √ 
r n
2Π − 1 = 0, 99
σ
soit Π(t) = 0, 995 et donc t = 2, 575.
Par la suite, nous noterons t le réel tel que 2Π√(t) − 1 = C où C est le degré de
confiance choisi. Ainsi, le réel recherché est tel que r σ n = t donc le rayon de l’intervalle
cherché est
σ
r = t√ .
n

Faculté de génie industriel 54 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Phase a posteriori : utilisation des valeurs estimées ponctuellement


Nous supposons maintenant que l’échantillons a été tiré, nous obtenons dons une
représentation µe de la variable aléatoire X̄. Nous pouvons affirmer que l’intervalle
obtenu pour cet échantillon
 
σ σ
µe − t √ ; µe + t √
n n

fait partie d’une famille dans laquelle 95% contiennent la vraie moyenne µ de la po-
pulation. On l’appelle intervalle de confiance à 95% (ou autre selon le coefficient de
confiance décidé préalablement).
Pour calculer les bornes de cet intervalle, deux cas de figures se présentent selon
que nous connaissons ou pas l’écart type de la population. S’il est connu, il n’y a rien à
faire :  
σ σ
IC = µe − t √ ; µe + t √ .
n n
Si l’écart type de
q la population n’est pas connu, on le remplace par son estimation
n
ponctuelle σ̂ = n− 1 σe . Dans ce cas, nous obtenons
r
n σe σ
r=t √ = t√ e
n−1 n n−1
Nous pouvons donc estimer une confiance de 95% (ou 99% selon le cas) que la moyenne
µ de la population appartient à l’intervalle :
 
σe σe
IC = µe − t √ ; µe + t √ .
n−1 n−1
Remarque 7.2. 1. L’intervalle de confiance est centré en la valeur µ car c’est la seule valeur
de référence que nous disposons.
2. Le centre de l’intervalle de confiance (à savoir µe ) dépend de l’échantillon choisi (puisque
µe en dépend). Son rayon en dépend aussi lorsqu’on ne connaı̂t pas l’écart type de la
population.
3. Le vraie valeur µ de la moyenne de la population peut ne pas appartenir à l’intervalle de
confiance.
4. Le rayon de l’intervalle de confiance (à savoir la quantité r = t √σn ) dépend du degré de
confiance C choisi. Plus le degré de confiance C est proche de 100%, plus la borne t sera
élevée et donc le rayon grand.

Exemple 7.4. Une université comporte 1500 étudiants. On mesure la taille de 20 d’entre eux.
La moyenne µe et l’écart type σe calculés à partir de cet échantillon sont : µe = 176cm et
σe = 6cm.

Nous avons déjà estimé ponctuellement les paramètres de la population :

µ̂ = 176cm σ̂ ' 6, 16cm.

Déterminons maintenant une estimation de µ par intervalle de confiance à 95% (ou au


risque de 5%).

Faculté de génie industriel 55 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Notons X̄ la variable aléatoire correspondant à la moyenne d’un échantillon de taille


20 pris au hasard. Nous savons que :
   
σ σ
X̄ ,→ N µ; √ = N µ; √ .
n 20
On calcule le rayon r tel que P(µr ≤ X̄ ≤ µ + r ) = 0, 95.
On pose T = X̄√σ−r , ainsi, T suit la loi normale centrée-réduite N (0, 1). Nous avons
20
donc :
√ √ ! √ ! √
r 20 r 20 r 20 r 20
P − ≤T≤ = 0, 95 ⇔ 2Π − 1 = 0, 95 ⇔ Π(t) = 0, 975 t = .
σ σ σ σ

Nous cherchons donc, par lecture inverse de la table de la loi normale centrée réduite
une borne t telle que Π(t) = 0, 975. La borne√t = 1, 96 convient.
r 20 1, 96σ
Ainsi, notre réel r recherché est tel que = 1, 96 soit r = √ . Mais une fois
σ 20
l’échantillon tiré, nous avons obtenu un écart type estimé σ̂ ' 6, 16cm. D’où
r ' 2, 7.
La réalisation de l’intervalle de confiance à 95% sur cet échantillon est
IC = [176 − 2, 7; 176 + 2, 7] = [173, 3; 178, 7].
Nous pouvons donc estimer, avec une confiance de 95% que la taille moyenne de la
population est comprise entre 173, 3cm et 178, 7cm.

7.2.2 Estimation d’une proportion


Estimation ponctuelle
On considère un caractère (ou attribut) A sur une population dont la proportion p
est inconnue. On suppose que l’on prélève un échantillon de taille n (tirage avec remise
ou assimilé) sur lequel on a calculé la proportion pe d’individus ayant le caractère A.
Notons F la variable aléatoire correspondant à la proportion du caractère A dans un
échantillon de taille n pris au hasard. On rappelle qu’alors F suit approximativement
une loi normale : r
p (1 − p )
F ,→ N( p; σp ) où σp = .
n
Définition 7.1.
Une estimation ponctuelle p̂ de la proportion p de l’attribut A dans la population est

p̂ = pe .

Une estimation ponctuelle σ̂p de l’écart type σp est selon le cas :


 q q q
p e (1− p e )
 n
= pe (n1−−1pe ) si n ≤ 30
 q n −1 n


p e (1− p e ) .
 n si n > 30
 q
1


4n si statisticien pessimiste

Faculté de génie industriel 56 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Exemple 7.5. A quelques jours d’une élection, un candidat fait effectuer un sondage. Sur les
150 parsonnes interrogées, 45 se disent prêtes à voter pour lui aux prochaines élections.
La proportion d’individus prête à voter pour ce candidat dans léchantillon est ici
45
de pe = = 0, 3.
150
On estime donc qu’il en est de même dans la population (comment pourrait-on
faire autrement ?).
Quand à l’indication σp , on peut ici l’estimer par :
r r
p e (1 − p e ) 0, 3 × 0, 7
σˆp = = ' 0, 037.
n 150
On voudrait aller plus loin et, au lieu d’une simple proportion, calculer un intervalle
contenant, avec une confiance arbitraire fixée au départ, la proportion d’individus
prêtes à voter pour ce candidat.

Estimation par intervalle de confiance


Nous avons vu, dans la théorie de l’échantillonnage, que si F est la variable aléatoire
correspondant à la proportion d’un caractère dans un échantillon de taille n pris au
hasard, alors F suit approximativement une loi normale :
r
p (1 − p )
F ,→ N( p, σp ) où σp =
n
Nous avons déjà remarqué que le fait que p soit inconnu n’est pas génant dans
les calculs
r à priori. Le problème ici, c’est que nous ne connaissons pas l’écart type
p (1 − p )
σp = . Nous le remplaçons, dans la phase a postériori par son estimation
n q q
p e (1− p e ) p e (1− p e )
ponctuelle (qui est σp = n −1 r , en général ou σp = n si le correctueur de
1
biais n’est pas proposé ou encore si nous voulons une hypothèse pessimiste.)
4n
Cherchons l’intervalle qui contient p avec une confiance de 90% (cela pourrait être
un autre coefficient de confiance). Nous cherchons donc un rayon r tel que :

P( F − r ≤ p ≤ F + r ) = 0, 90.

Nous avons déjà vu que cette probabilité pouvait s’écrire da manière plus pratique :

P( p − r ≤ F ≤ p + r ) = 0, 90.
F−p
On sait que la variable aléatoire T = suit la loi normale centrée réduite N(0, 1).
σp
Nous obtenons donc, par centrage et réduction :

p−r+ p F−p p+r− p


   
r r
P ≤ ≤ =P − ≤T≤ .
σp σp σp σp σp

Après simplification, on voit qu’on cherche t tel que Π(t) = 0, 95 avec t = σrp . Par
lecture inverse de la table de la loi normale centrée réduite, t = 1, 645. Ce qui nous
permet de calculer r par la formule r = tσp .

Faculté de génie industriel 57 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

Supposons maintenant l’échantillon prélevé. Nous avons donc une estimation ponc-
tuelle de p et σp . Ainsi, la réalisation de l’intervalle de confiance dans l’échantillon est :
 s s 
p e (1 − p e ) p e (1 − p e ) 
IC =  pe − t ; pe + t .
n−1 n−1

Remarque 7.3. On ne retiendra pas cette formule. Dans la pratique, on refait les calculs.

Remarque 7.4. — Si on effectue pas la correction de biais, l’intervalle de confiance est :


" r r #
p e (1 − p e ) p e (1 − p e )
IC = pe − t ; pe + t .
n n

— On peut également de placer dans une hypothèse pessimiste en choisissant un écart type
maximal. Nous savons que la parabole d’équation y = x (1 − x ) admat un maximum
1 1
égal a en .
4 2 r
1
Aini, l’écart type maximal est . Il a, de plus l’avantage d’être indépendant de p.
4n
Dans ce cas, la réalisation de l’intervalle de confiance dans l’échantillon est :
" r r #
1 1
IC = pe − t ; pe + t .
4n 4n

Exemple 7.6. A quelques jours d’une élection, un candidat fait faire un sondage. Sur les 150
personnes interrogées, 45 se disent prêtes à voter pour lui aux prochaines élections.

La proportion d’individus prête à voter pour ce candidat dans l’échantillon est ici
45
de pe = 150 = 0, 3.
On a déjà estimé ponctuellement : p̂ = pe = 0, 3 et σˆp ' 0, 037.
Déterminons maintenant une estimation de p par intervalle de confiance à 80%.
Notons F la variable aléatoire correspondant à la proportion d’individus prêts à
voter pour ce candidat dans un échantillon de taille 150 pris au hasard. Nous avons vu
qu’approximativement :
r
p (1 − p )
F ,→ N( p, σp ) où σp =
n
 
r r
On cherche alors un rayon r tel que Π = 0, 9, d’où = 1, 28, donc r = 1, 28σp .
σp σp
Supposons maintenant l’échantillon prélevé. Une estimation ponctuelle de σp est
σˆp ' 0, 037, d’où r ' 0, 047.
La réalisation de l’intervalle de confiance dans cet échantillon est alors

IC = [0, 3 − 0, 047; 0, 3 + 0, 047] = [0, 253; 0, 347].

Nous pouvons estimer, avec une confiance de 90%, que la proportion d’individus dans
la population prêts à voter pour le candidat en question est comprise entre 25, 3% et
34, 7%.

Faculté de génie industriel 58 Probabilités et Statistiques, 2019-2020


Patrick Njionou,S.

7.3 Exercices
Exercice 7.1.
Une usine fabrique des câbles. Un câble est considéré comme conforme si sa réristance à
la rupture est supérieure à 3 tonnes. L’ingénieur responsable de la production voudrait
connaı̂tre, en moyenne, la résistance à la rupture des câbles fabriqués.
Il n’est bien sûr, pas question de faire le test sur toute la production (ce qui prendrait trop
de temps !). Un technicien prélève donc un échantillon de 100 câbles dans la production.
Notons X̄ la variable aléatoire correspondant à la force exercée sur le câble pour le rompre.
Le technicien obtient les résultats suivants :

E( X̄ ) = 3, 5 tonnes
σ ( X̄ ) = 0, 4 tonnes
proportion de câbles dont la résistance est supérieure à 3 tonnes : pe = 0, 85.

1. a. Donner une estimation ponctuelle de la moyenne µ et de l’écart type σ de la


variable aléatoire X dans la production.
b. Déterminer une estimation par intervalle de confiance à 95% de la moyenne m
de X.
2. a. Donner une estimation ponctuelle de la proportion p de câbles conformes dans
la production
b. Déterminer une estimation par intervalle de confiance à 90% de cette propor-
tion.

Faculté de génie industriel 59 Probabilités et Statistiques, 2019-2020


Chapitre 8

Test d’hypothèse

60
Chapitre 9

Fiabilité

61

Vous aimerez peut-être aussi