Vous êtes sur la page 1sur 45

Probabilités - Échantillonnage

A. Fredet
J.-M. Gourdon

Table des matières


I Probabilités 2
1 Définitions 2

2 Combinaisons, Arrangements 3

3 Probabilités liant deux événements 6

4 Probabilités et statistiques 8

5 Variable aléatoire 9

6 Lois binomiales 13

7 Lois de Poisson 14

8 Lois normales 15

9 Solutions des exercices 20

II Échantillonnage 30
1 Échantillons 30

2 Estimation 30

3 Test d’ajustement 33

4 Comparaison d’échantillons 37

5 Solutions des exercices 40

III Tableur 45

1
Probabilités 1 DÉFINITIONS

Première partie
Probabilités
1 Définitions
La probabilité a priori, subjective, d’un évènement est un nombre qui caractérise la croyance que
l’on a que cet évènement sera réalisé avec plus ou moins de certitude avant l’exécution de l’expérience :
l’évènement sera réalisé (probabilité 1) et l’évènement ne sera pas réalisé (probabilité 0).
Définition 1.1 Une épreuve est dite aléatoire si répétée dans des conditions identiques, elle donne
des résultats variables.
Des évènements sont équiprobables s’ils ont la même probabilité d’être réalisés. Dans ce cas, la proba-
nombre de cas favorables
bilité d’un événement A est .
nombre de cas possibles
Définition 1.2 L’ensemble de toutes les éventualités d’une expérience aléatoire s’appelle l’univers. En
général, on le note Ω.
Exemple 1.1 On lance un dé non truqué à six faces numérotées de 1 à 6 et on note le nombre figurant
sur la face supérieure du dé. Lancer ce dé et noter le nombre figurant sur une des faces est une expérience
dont on ne peut pas prévoir le résultat compris dans l’ensemble {1, 2, · · · , 6}. Les éventualités sont 1,
2, 3, 4, 5 et 6 et Ω = {1, 2, 3, 4, 5, 6}.
Si le dé est non truqué, chaque face a la même probabilité de sortir, nous avons donc des évenements
équiprobables.
Par exemple, on peut considérer l’événement A = obtenir un nombre pair . On a A = {2; 4; 6} et la
probabilité que A se produise est 36 = 12 .
Définition 1.3 Un événement est dit impossible s’il ne se réalise jamais.
Un événement est dit certain s’il se réalise toujours.
Un événement est dit élémentaire s’il se réduit à une seule éventualité.
Proposition 1.1 Soient E, E1 , E2 des événements.
1. p(E) ≥ 0 pour tout événement E.
2. p(Ω) = 1 donc l’événement est certain
3. p(∅) = 0 donc l’événement est impossible
p(E1 ∪ E2 ) = p(E1 ou E2 ) = p(E1 ) + p(E2 ),
4. Si E1 ∩ E2 = ∅ alors E1 et E2 sont incompatibles et
p(E1 ∩ E2 ) = p(E1 et E2 ) = 0
On en déduit les conséquences suivantes :
1. Si Ē est l’événement contraire de E alors p(Ē) = 1 − p(E).
En effet Ē ∪ E = Ω et Ē ∩ E = ∅ donc p(Ē ∪ E) = p(Ē) + p(E) = 1.
2. Pour tout événement E, 0 ≤ p(E) ≤ 1.
En effet, pour tout E, p(E) ≥ 0 et donc p(Ē) = 1 − p(E) ≥ 0 ce qui nous amène à p(E) ≤ 1.
Exercice 1.1 On joue avec un dé à six faces non truqué. On effectue un lancer, et on considère les
deux événements suivants : E1 =le nombre est 3 ou 4 et E2 =le nombre est pair. Calculer p(E1 ), p(E2 ),
p(E1 ∩ E2 ) et p(E1 ∪ E2 ).
Exercice 1.2 On joue avec deux dés à six faces non truqués. On lance les deux dés et on effectue
la somme des nombres obtenus. On considère les événements suivants : E1 =la somme est 5, E2 =la
somme est 7 et E3 =la somme est paire. Calculer p(E1 ), p(E2 ), p(E3 ), p(E1 ∩E2 ), p(E1 ∩E3 ), p(E2 ∩E3 )
et p(E1 ∪ E2 ), p(E1 ∪ E3 ) et p(E2 ∪ E3 ).

2 A. Fredet & J.-M. Gourdon


Probabilités 2 COMBINAISONS, ARRANGEMENTS

La probabilité de réalisation d’un événement peut être considérée comme le rapport du nombre de cas
favorables sur le nombre de cas possibles. Le calcul d’une probabilité peut donc souvent se ramener à
un problème de dénombrement.

2 Combinaisons, Arrangements
Définition 2.1 Soit E un ensemble non vide de n éléments. Une permutation de E est une liste
ordonnée des n éléments de E.

Exemple 2.1 Si E = {a, b, c, d, e} alors (a, b, d, c) et (a, c, d, b) sont deux permutations de E.

Proposition 2.1 Le nombre de permutations d’un ensemble de n éléments, n ≥ 1, est égal à

n! = n × (n − 1) × (n − 1) × · · · × 2 × 1

Définition 2.2 Une liste sans répétition de p éléments de E est une liste ordonnée de p éléments de
E deux à deux distincts

Exercice 2.1 Une urne contient dix boules sur lesquelles ont été marquées les dix lettres de l’alphabet
de A à J. On tire successivement quatre boules sans remise et l’on inscrit dans l’ordre les lettres portées
par les boules tirées. Combien de mots de quatre lettres (ayant un sens ou non) peut-on former ?

Exercice 2.2 Combien de mots de trois lettres peut-on former en utilisant les lettres du mot PARIS
et uniquement celles-là ?

Proposition 2.2 Si un ensemble E contient n éléments, n ≥ 1, alors


n!
– il y a n × (n − 1) × · · · × (n − (p − 1)) = (n−p)! listes sans répétition de p éléments.
p
– il y a n liste avec répétition de p éléments.

Exercice 2.3 Lors d’une course de chevaux, il y a 8 partants. Combien de possibilités y-a-t-il pour le
tiercé final ? Pour le quarté ?

Exercice 2.4 Combien de nombres de 4 chiffres puis-je écrire en utilisant uniquement les chiffres
3,6,7 ?

Exercice 2.5 Un facteur (employé de la poste) entre dans un immeuble avec 23 lettres qu’il va déposer
dans les boites, au nombre de 40. Sachant qu’une boite peut évidemment recevoir plusieurs lettres, de
combien de façon différentes les 23 lettres peuvent-elles être déposées dans les 40 boites ?

Nous pouvons également chercher à sélectionner k objets parmi n objets discernables, sans tenir compte
de l’ordre. Ces k objets peuvent être représentés par une partie à k éléments d’un ensemble à n éléments.

Définition 2.3 Soit E un ensemble de n éléments et p un entier tel que 0 ≤ p ≤ n. Une combinaison
de p éléments de E est un sous-ensemble de E qui contient p éléments.  
n
Le nombre de combinaisons de p éléments d’un ensemble de n éléments est noté ou Cnp .
p

Proposition 2.3
n! n × (n − 1) × · · · × (n − p + 1)
Cnp = =
(n − p)!p! p!

3 A. Fredet & J.-M. Gourdon


Probabilités 2 COMBINAISONS, ARRANGEMENTS

Exercice 2.6 Un facteur (employé de la poste) entre dans un immeuble avec 23 lettres qu’il va déposer
dans les boites, au nombre de 40. En supposant qu’une boite ne peut pas recevoir plusieurs lettres, de
combien de façon différentes les 23 lettres peuvent-elles être déposées dans les 40 boites ?

Exercice 2.7 On appelle main toute combinaison de cinq cartes. Combien y a-t-il de mains de cinq
cartes dans un jeu de 32 cartes ?

Exercice 2.8 On appelle main toute combinaison de cinq cartes. Dans un jeu de 32 cartes, combien
y a-t-il de mains de cinq cartes contenant exactement 2 coeurs ?

Exercice 2.9 On appelle main toute combinaison de cinq cartes. Dans un jeu de 32 cartes, combien
y a-t-il de mains de cinq cartes contenant au moins un roi ?

Exercice 2.10 Lors d’un tirage du loto de 4 numéros avec 10 boules, combien y-a-t-il de grilles pos-
sibles ?

Proposition 2.4 On a et p−1 p


Cnp = Cnn−p Cn−1 + Cn−1 = Cnp

Démo :
1. Choisir les p éléments que l’on veut dans un ensemble de n éléments revient exactement à choisir
les n − p éléments que l’on ne veut pas, d’où le résultat.
Mathématiquement, on a
n! n!
Cnn−p = = = Cnp
(n − p)![n − (n − p)]! (n − p)!p!

2. Soit E une ensemble de n élément. Soit A l’un de ces éléments. Pour choisir p éléments de E, je
p−1
peux soit prendre A et en choisir p−1 autres parmi les n−1 restants (j’ai alors Cn−1 possibilités),
p
soit laisser A et en prendre p autres parmi les n − 1 restants (j’ai alors Cn−1 possibilités). D’où
le résultat.
Mathématiquement, on a

p−1 p (n − 1)! (n − 1)!


Cn−1 + Cn−1 = +
(p − 1)!(n − p)! p!(n − p − 1)!
p(n − 1)! (n − p)(n − 1)! (p + n − p)(n − 1)!
= + =
p!(n − p)! p!(n − p)! p!(n − p)!
n!
= = Cnp
p!(n − p)!

Proposition 2.5 (Formule du binôme) Soient a et b deux réels et n un entier. Alors


n
X
(a + b)n = Cni ai bn−i
i=0

Démo :
Par itération sur n :
– Si n = 0, alors (a + b)n = (a + b)0 = 1 = Cn0
– Si n = 1 alors (a + b)1 = a + b = C10 a1 b0 + C11 a0 b1
– Si n = 2 alors (a + b)2 = a2 + 2ab + b2 = C20 a2 b0 + C21 a1 b1 + C22 a0 b2

4 A. Fredet & J.-M. Gourdon


Probabilités 2 COMBINAISONS, ARRANGEMENTS

– Si n = 3 alors
(a + b)3 = a3 + 3ab2 + 3a2 b + b3
= C30 a3 + C31 a2 b1 + C32 a1 b2 + C33 b3
– On suppose maintenant que la formule est vraie pour (a + b)n−1 et donc que (a + b)n−1 =
Pn−1 p i (n−1)−i
i=0 Cn−1 a b . On a

(a + b)n = (a + b)n−1 × (a + b)
n−1
!
X
i
= Cn−1 ai b(n−1)−i × (a + b)
i=0
n−1
X n−1
X
i
= Cn−1 ai+1 b(n−1)−i + i
Cn−1 ai b(n−1)−i+1
i=0 i=0
n−1
X n−1
X
i
= Cn−1 ai+1 bn−(1+i) + i
Cn−1 ai bn−i
i=0 i=0
n
X n−1
X
j−1 j n−j i
= Cn−1 a b + Cn−1 ai bn−i
j=1 i=0
n−1
X n−1
X
j−1 j n−j
= Cn−1 a b +Cn−1 n 0
n−1 a b +
i
Cn−1 ai bn−i + C0n−1 a0 bn
j=1 i=1
n−1
X
i−1 i
 j n−j
= Cn−1 + Cn−1 a b + an + bn
i=1
n−1
X n
X
= Cni ai bn−i + an + bn = Cni ai bn−i
i=1 i=0

d’où le résultat 2
Triangle de Pascal
Pour calculer les coefficients du binôme, on utilise le triangle de Pascal : Le principe est le suivant :

∗ + ∗
=↓

n=0 1
+
n=1 1 → 1 (a + b) = a + b
↓=
+
n=2 1 2 → 1 (a + b)2 = a2 + 2ab + b2
↓=
+
n=3 1 → 3 3 1 (a + b)3 = a3 + 3a2 b + 3ab2 + b3
↓=
+ +
n=4 1 4 → 6 4 → 1 (a + b)4 = a4 + 4a3 b + 6a2 b2 + 4ab3 + b4
↓= ↓=
n=5 1 5 10 10 5 1 (a + b)5 = a5 + 5a4 b + 10a3 b2 + 10a2 b3 + 5ab4 + b5
..
.

5 A. Fredet & J.-M. Gourdon


Probabilités 3 PROBABILITÉS LIANT DEUX ÉVÉNEMENTS

3 Probabilités liant deux événements


On s’intéresse parfois à une probabilité portant sur deux événements, qu’ils soient indépendants ou
non.
Définition 3.1 Soient A et B deux événements.
La probabilité que A ET B soient réalisés est p(A ∩ B).
La probabilité que A OU B soient réalisés est p(A ∪ B).

Proposition 3.1 Soient A et B deux événements. On a p(A ∪ B) = p(A) + p(B) − p(A ∩ B).

Démo :
1. Si A∪B = ∅ alors A et B sont incompatibles donc p(A∪B) = p(A)+p(B) et p(A∩B) = p(∅) = 0
2. Si A ∩ B 6= ∅ alors A ∪ B = (A ∩ B) ∪ (Ā ∩ B) ∪ (A ∪ B̄) d’après le tableau suivant :

A Ā

B A∩B Ā ∩ B

B̄ A ∩ B̄ Ā ∩ B̄

Donc p(A ∪ B) = p(A ∩ B) + p(Ā ∩ B) + p(A ∪ B̄) car (A ∩ B) ∩ (Ā ∩ B) ∩ (A ∪ B̄) = ∅. Or


p(A) = p(A ∩ B) + p(A ∪ B̄) car (A ∩ B) ∩ (A ∪ B̄) = ∅ et (A ∩ B) ∪ (A ∪ B̄) = A. De même
p(B) = p(A ∩ B) + p(Ā ∪ B) d’où p(A ∪ B) = p(A) + p(B) − p(A ∩ B).

Exercice 3.1 Dans un jeu de 32 cartes, on tire une carte. Quelle est la probabilité d’avoir soit un roi,
soit un trèfle ?

Exercice 3.2 Considérons un jeu de 32 cartes. Soit A l’événement tirer deux coeurs et B l’événement
tirer deux figures. Quelles sont les probabilités de A, B, A ∪ B et A ∩ B ?

Exercice 3.3 Deux candidats A et B passent, dans deux centres différents, un examen avec des pro-
babilités de réussites estimées respectivement à 43 et 23 . Calculer la probabilité
1. que les 2 candidats soient reçus ?
4. qu’un seul des deux candidats réussise ?
2. que les 2 candidats échouent ?
5. qu’au moins 1 des candidats soit reçu ?
3. que le candidat A soit seul reçu ?
Exercice 3.4 On dispose de deux urnes, désignées respectivement par les lettres A et B. L’urne A
contient 5 boules bleues et 4 boules rouges. L’urne B contient 6 boules bleues et 5 boules rouges. On
tire une boule dans chaque urne. Quelle est la probabilité
1. de tirer deux boules rouges ? 3. de tirer deux boules de même couleur ?
2. de tirer deux boules bleues ? 4. de tirer deux boules de couleurs différentes ?
Exercice 3.5 On considère 3 dés différents, identifiés par leur couleur. Le joueur A gagne la partie si
le total des points est 11, le joueur B gagne si le total des points est 12. L’un des joueurs a-t-il plus de
chance de gagner ?

6 A. Fredet & J.-M. Gourdon


Probabilités 3 PROBABILITÉS LIANT DEUX ÉVÉNEMENTS

Exercice 3.6 Un concours de tir met aux prises deux équipes de deux joueurs. Chaque joueur de
l’équipe peut marquer 0,1 ou 2 points avec les probabilités suivantes :

équipe jaune équipe verte


0 1 2 0 1 2
joueur A 0, 4 0, 4 0, 2 joueur C 0, 3 0, 5 0, 2
joueur B 0, 3 0, 4 0, 3 joueur D 0, 5 0, 3 0, 2

Les résultats des différents joueurs et des différentes équipes sont indépendants entre eux. Soit X la
variable aléatoire égale au nombre de points marqués par l’équipe jaune et Y la variable aléatoire égale
au nombre de points marqués par l’équipe verte.
1. Déterminer les distributions de probabilité de chacune des variables aléatoires X et Y .
2. Calculer la probabilité de l’événement “il y a match nul”.

Définition 3.2 Soient A et B sont deux événements associés à un univers tels que p(A) 6= 0 ; La
probabilité de l’événement B sachant que A est réalisé est :

p(A ∩ B)
pA (B) = p(B/A) =
p(A)

Proposition 3.2 On a

p(A ∪ B) = p(A) × p(B/A) = p(B) × p(A/B).

Définition 3.3 Deux événements sont indépendants si p(A/B) = p(A) ou p(B/A) = p(B), soit encore
si p(A ∪ B) = p(A)p(B).
Deux événements sont incompatibles si A∩B = ∅ et dans ce cas, p(A∩B) = 0 d’où pA (B) = pB (A) = 0

Proposition 3.3 Si A est inclus dans B alors p(A ∩ B) = p(A) et pB (A) = 1.

Exercice 3.7 Une urne contient 15 boules numérotées de 1 à 15. On tire une boule au hasard. On sait
que le numéro tiré est impair. Quelle est la probabilité que ce numéro soit aussi multiple de 3 ?

Exercice 3.8 À la fin de leur montage, on soumet des ampoules électriques à des tests de conformité
qui ne sont pas fiables à 100%. Si une ampoule est conforme, on le dit dans 96 % des cas (et donc dans
4 % des cas, une ampoule bonne est jetée). Si une ampoule est défectueuse, le test le détecte dans 94%
des cas (et donc dans 6% des cas, on garde l’ampoule). On remarque que en moyenne 8% des ampoules
sont défectueuses. On cherche à estimer la fiabilité du test :
1. Sachant que le test est positif, quelle est la probabilité que l’ampoule soit effectivement conforme ?
2. Sachant que le test est négatif, quelle est la probabilité que l’ampoule soit effectivement défectueuse ?

Exercice 3.9 Deux ateliers fabriquent les mêmes pièces. La cadence du premier atelier est le double
de celle du deuxième. Il y a 3% de pièces défectueuses dans l’atelier 1 et 4% dans l’atelier 2. On prélève
une pièce au hasard. Calculer la probabilité des événements suivants :
1. La pièce provient de l’atelier 1,
2. La pièce est defectueuse,
3. La pièce provient de l’atelier 1, sachant qu’elle est défectueuse.

7 A. Fredet & J.-M. Gourdon


Probabilités 4 PROBABILITÉS ET STATISTIQUES

Exercice 3.10 Dans une population donnée, 15 % des individus ont la maladie Ma . Parmi eux, 20%
ont une maladie Mb . Parmi les personnes non atteintes par Ma , 4% ont la maladie Mb . On considère
un individu. Calculer la probabilité des événements suivants :
1. Il a la maladie Ma
5. Il n’a pas la maladie Ma mais il a la maladie Mb
2. Il a la maladie Mb sachant qu’il a Ma
6. Il a la maladie Mb
3. Il a la maladie Mb sachant qu’il n’a pas Ma
7. Il a la maladie Ma sachant qu’il a Mb
4. Il a la maladie Ma et la maladie Mb
Exercice 3.11 Trois étudiants A, B et C passent un examen le même jour. Les trois examens sont
différents et se passe dans des lieux différents. Les probabilités de succès sont estimées à 0,7 pour A,
0,4 pour B et 0,6 pour C. Calculer la probabilité
1. que les 3 soient reçus
5. que B soit le seul à échouer
2. que les trois échouent
6. qu’exactement deux soient reçus
3. que A seulement soit reçu
7. qu’au moins un soit reçu
4. qu’un seul réussise
Exercice 3.12 Une urne contient x boules dont 3 sont blanches, les autres étant rouges.
1. À l’occasion d’un tirage sans remise de deux boules, la probabilité d’obtenir une boule blanche
puis une boule rouge est 14 . Calculer le nombre de boules dans l’urne.
2. Même question si le tirage est effectué avec remise

4 Probabilités et statistiques
De nombreux problèmes peuvent être regardés sous un aspect statistique et sous un aspect proba-
biliste :
Exemple 4.1 Une population est composé de 47% d’hommes et de 53% de femmes. On suppose que
24 % des hommes et que 34 % des femmes ont les yeux verts. Les hommes aux yeux verts représentent
24 47 1128
24 % de 47 % de la population, soit 100 × 100 = 10000 = 0, 1128 = 11, 28%. On peut remplir le tableau
suivant :
homme femme
yeux verts 0, 47 × 0, 24 = 0, 1128 0, 53 × 0, 34 = 0, 1802 0, 2930
yeux pas verts 0, 47 × 0, 76 = 0, 3572 0, 53 × 0, 66 = 0, 3498 0, 707
0, 47 0, 53 1

On choisit une personne au hasard.


1. la probabilité qu’elle ait les yeux verts est p(yeux verts) = 0, 293
2. la probabilité qu’elle ait les yeux verts sachant que c’est un homme est

p( homme aux yeux verts) 0, 1128


p( yeux verts / homme ) = = = 0, 24
p(homme) 0, 47

3. la probabilité qu’elle soit une femme sachant qu’elle n’a pas les yeux verts est

p( femme aux yeux pas verts) 0, 3498


p( femme / pas yeux verts ) = = ≈ 0, 4947
p(pas yeux verts) 0, 707

8 A. Fredet & J.-M. Gourdon


Probabilités 5 VARIABLE ALÉATOIRE

Jouons à pile ou face, un grand nombre de fois, avec une pièce non truquée. Pile et face ont la même
probabilité, égale à 1/2, d’apparaı̂tre à chaque lancer. Comptabilisons les résultats au fur et à mesure
et supposons que, à une étape, le nombre de tirages sur face soit supérieur de 100 à celui des pile :
le nombre de pile a-t-il ensuite tendance à rattraper le nombre de face ? Ceux qui jouent à pile ou
face sans en connaı̂tre les arcanes mathématiques évoquent parfois une loi des moyennes fondée sur
l’intuition que les nombres de pile et de face obtenus avec une pièce non truquée devraient devenir peu
différents après un grand nombre de lancers. Pourtant les pièces n’ont pas de mémoire : la probabilité
d’obtenir pile ou face lors d’un lancer est toujours 1/2. Ne devrait-on pas penser plutôt que les totaux
n’ont pas de raison de devenir égaux ?
Les mêmes questions se posent dans des contextes variés. Si un accident d’avion se produit en
moyenne tous les quatre mois et si trois mois se sont passés sans accident, un accident est-il imminent ?
Dans tous les cas de ce type, la réponse est non : les processus aléatoires ou, plus exactement, les
modèles mathématiques de ces processus n’ont pas de mémoire.
Il n’existe pas de loi des moyennes : les probabilités des événements futurs ne dépendent pas des
résultats passés.

5 Variable aléatoire
Définition 5.1 Soient une épreuve donnée, Ω l’univers associé à cette épreuve et p une probabilité
définie sur Ω. On appelle variable aléatoire toute fonction X de Ω dans R qui, à tout élément de Ω,
fait correspondre un nombre réel x.
On notera X(Ω) l’ensemble des valeurs prises par la v.a. X.
Une variable aléatoire est caractérisée par l’ensemble des valeurs qu’elle peut prendre et par l’expres-
sion mathématique de la probabilité de ces valeurs. Cette expression s’appelle la loi de probabilité (ou
distribution de probabilité) de la variable aléatoire.

Il existe plusieurs types de valeurs que peut prendre une variable aléatoire :

Variable aléatoire discrète


Définition 5.2 Une variable aléatoire est discrète si elle ne prend que des valeurs discontinues dans un
intervalle donné (borné ou non borné). L’ensemble des nombres entiers est discret. En règle générale,
toutes les variables qui résultent d’un dénombrement ou d’une numération sont discrètes.

Exemples :
– le nombre de petits par portée pour une espèce animale donnée (chat, marmotte, etc.),
– le nombre de bactéries dans 100 ml de préparation,
– le nombre de mutations dans une séquence d’ADN de 10 kb,
sont des variables aléatoires discrètes.

La loi de probabilité d’une variable aléatoire discrète est entièrement déterminée par les probabilités
pi des évènements {X = xi }, xi parcourant l’univers image Ω. La loi de probabilité est donnée par les
(xi , pi )i .

Exercice 5.1 Une urne contient quatre boules numérotées 10, 20, 30 et 40. On effectue trois tirages
successifs avec remise, c’est-à-dire qu’après chaque tirage on replace la boule tirée dans l’urne. Le
résultat d’une expérience peut alors être représenté par un triplet, une liste ordonnée de trois éléments
de l’ensemble E = {10, 20, 30, 40}.
1. Combien y a-t-il de résultats possibles ?
2. Quelle est la probabilité d’obtenir les cas suivants :

9 A. Fredet & J.-M. Gourdon


Probabilités 5 VARIABLE ALÉATOIRE

(a) La première boule tirée porte le numéro 10, la deuxième le numéro 40, la troisième le numéro
20 ?
(b) La première boule tirée porte le numéro 30 et la deuxième le numéro 20 ?
(c) La deuxième boule porte le numéro 20 ?

Exercice 5.2 Une urne contient quatre boules numérotées 10, 20, 30 et 40. On effectue trois tirages
successifs sans remise, c’est-à-dire qu’après chaque tirage on ne replace pas la boule tirée dans l’urne. Le
résultat d’une expérience peut alors être représenté par un triplet, une liste ordonnée de trois éléments
de l’ensemble E = {10, 20, 30, 40} mais cette fois les éléments du triplet sont 2 à 2 distincts.
1. Combien y a-t-il de résultats possibles ?
2. Quelle est la probabilité d’obtenir les cas suivants :
(a) La première boule tirée porte le numéro 10, la deuxième le numéro 40, la troisième le numéro
20 ?
(b) La première boule tirée porte le numéro 30 et la deuxième le numéro 20 ?
(c) La deuxième boule porte le numéro 20 ?

Exercice 5.3 Une urne contient quatre boules numérotées 10, 20, 30 et 40. On tire simultanément
trois boules de l’urne. Le résultat d’une expérience peut alors être représenté par une partie à trois
éléments de l’ensemble E = {10, 20, 30, 40}.
1. Combien y a-t-il de résultats possibles ?
2. Quelle est la probabilité d’avoir un résultat dans lequel figure le nombre 20 ?
3. Quelle est la probabilité d’avoir un résultat dans lequel figurent les nombres 30 et 40 ?

Définition 5.3 Étant donnée une v.a. discrète X prenant les valeurs x1 , x2 , · · · , xn avec les probabilités
respectives p1 , p2 , · · · , pn .
L’espérance mathématique de X est le nombre réel noté E(X) défini par :

E(X) = x1 p1 + x2 p2 + · · · + xn pn .

La variance de la v.a. X est le nombre réel noté V(X) et défini par :

V (X) = E(X 2 ) − [E(X)]2 .

L’écart type d’une v.a. X est le réel positif noté s(X) et défini par :
p
σ(X) = V (X).

Exercice 5.4 On joue avec deux dés à quatre faces. Sur le premier dé, les faces portent les numéros
1, 2, 3 et 3. Sur le deuxième dé, les faces portent les numéros 1, 2, 2 et 2. Deux règles du jeu sont
possibles :
1. La partie coûte 1 euro. On lance les deux dés.
(a) Si la somme est 2, on gagne 6 euros
(b) Si la somme est 3 ou 4, on gagne 2 euros
(c) Si la somme est 5, on ne gagne rien
2. La partie coûte 10 euros. On lance les deux dés.
(a) Si la somme est 2, on gagne 60 euros
(b) Si la somme est 3 ou 4, on gagne 12 euros

10 A. Fredet & J.-M. Gourdon


Probabilités 5 VARIABLE ALÉATOIRE

(c) Si la somme est 5, on ne gagne rien


En étudiant l’espérance et l’écart-type de chacun de ces jeux, trouver lequel est le plus intéressant.

Exercice 5.5 Un automibiliste rencontre sur son trajet 5 feux de circulation tricolores. Pour chacun
de ces feux, le rouge dure 15 secondes, l’orange 5 secondes et le vert 40 secondes. Les 5 feux ne sont
pas synchronisés et l’on suppose que les aléa de la circulation sont tels que l’état d’un feu devant lequel
se présente l’automobile ne dépend pas de l’état des autres feux rencontrés.
1. L’automibile se présente devant un feux. Quelle est la probabilité que ce feu soit vert ?
2. Quelle est la probabilité que sur son trajet, l’automobile rencontre exactement 3 feux verts sur
les 5 feux rencontrés ?
3. Soit X la variable aléatoire correspondant au nombre de feux verts rencontrés sur le trajet. Quelle
est sa loi de probabilité et son espérance E(X) ?

Variable aléatoire continue


Définition 5.4 Une variable aléatoire est continue si elle peut prendre toutes les valeurs dans un
intervalle donné (borné ou non borné). En règle générale, toutes les variables qui résultent d’une mesure
sont de type continu.

Exemples :
– le masse corporelle des individus pour une espèce animale donnée,
– le taux de glucose dans le sang,
sont des variables aléatoires continues.

Dans le cas d’une variable aléatoire continue, la loi de probabilité f (x) associe une probabilité à chaque
ensemble de valeurs définies dans un intervalle donné. En effet, pour une variable aléatoire continue,
la probabilité associée à l’évènement X = a est nulle, car il est impossible d’observer exactement cette
valeur. On considère alors la probabilité P (x1 ≤ X ≤ x2 ) que la variable aléatoire X prenne des valeurs
comprises dans un intervalle [x1 , x2 ].
Si cette loi prend des valeurs comprises entre [a, b], la somme des probabilités attachées aux valeurs
possibles de la variable aléatoire est égale à 1.
Elle est representée par la surface sous la courbe y = f (x), ce qui revient à considérer des intégrales :
Rb
a
f (x) dx = 1. Si on s’intéresse aux valeurs comprises dans un intervalle [c, d], on a et donc p(c ≤ X ≤
Rd
d) = c f (x) dx.

Définition 5.5 Étant donnée une v.a. continue X, de densité de probabilité f (x) prenant des valeurs
comprises dans l’intervalle [a, b] L’espérance mathématique de X est le nombre réel noté E(X) défini

11 A. Fredet & J.-M. Gourdon


Probabilités 5 VARIABLE ALÉATOIRE

par :
Z b
E(X) = xf (x) dx.
a
La variance de la v.a. X est le nombre réel noté V(X) et défini par :
Z b Z b
2 2
V (X) = [x − E(X)] f (x) dx = x2 f (x) dx − [E(X)] .
a a

L’écart type de cette v.a. X est le réel positif noté σ(X) et défini par :
p
σ(X) = V (X).
Exemple 5.1 On considère une variable aléatoire pouvant prendre toutes les valeurs comprises dans
l’intervalle [0, 2] et soit f (x) = x2 sa densité de probabilité.
On peut vérifier que la somme des probabilités est égale à 1 :
Z 2  2 2
x x
dx = =1
0 2 4 0
Son espérance mathématique est
Z 2  3 2
x x 4
E(x) = x dx = =
0 2 6 0 3
et sa variance est
2 2  2  4 2  2
x3
Z Z
4 x 4 x 4 2
V (x) = (x − )2 dx = dx − = − =
0 3 2 0 2 3 8 0 3 0 9
q
2
d’où l’écart-type σ = 9 ≈ 0, 471

Exercice 5.6 Soit X une variable aléatoire continue ayant pour densité de probabilité f définie par
– f (x) = 0 pour x ∈] − ∞; 0[∪]2; +∞[
– f (x) = x pour x ∈ [0; 1]
– f (x) = −x + 2 pour [1; 2]
1. Vérifier que f est une densité de probabilité
2. Calculer l’espérance et l’écart-type de X
3. Calculer p(0, 5 < X < 1, 32)
Exercice 5.7 Soit X une variable aléatoire continue ayant pour densité de probabilité f définie par
– f (x) = 0 pour x ∈] − ∞; −2[∪]4; +∞[
– f (x) = k(4 − x) pour x ∈ [−2; 4]
1. Calculer k pour que f soit une densité de probabilité
2. Calculer l’espérance et l’écart-type de X
3. Calculer p(−1 < X < 2) et p(X ≥ 3)
Définition 5.6 Soit X une variable aléatoire réelle.
– Si E(X) = 0, X est dite centrée.
– Si E(X) 6= 0 alors X − E(X) est appelée variable aléatoire centrée associée à X.
– Si σ(X) = 1 alors X est dite réduite
– Si σ(X) 6= 1 et E(X) 6= 0 alors X−E(X)
σ(X) est appelée variable aléatoire centrée réduite associée à
X

12 A. Fredet & J.-M. Gourdon


Probabilités 6 LOIS BINOMIALES

6 Lois binomiales
En probabilité, une épreuve de Bernoulli de paramètre p (réel compris entre 0 et 1) est une
expérience aléatoire (c’est-à-dire soumise au hasard) comportant deux issues : le succès ou l’échec.
Sur cet univers succès, échec, on peut définir une variable aléatoire X prenant la valeur 1 en cas de
succès et 0 en cas d’échec. Cette variable aléatoire suit une loi de Bernoulli ou loi binomiale :
Définition 6.1 Etant donnée une épreuve définie sur un univers Ω. A l’issue de l’épreuve, on a deux
possibilités : soit succés S (p(S) = p avec 0 ≤ p ≤ 1) ; soit échec E (p(E) = q = 1 − p). On répète
n fois l’épreuve. On a une suite de n épreuves indépendantes. Soit X la v.a. définie sur Ωn qui prend
pour valeur le nombre de réalisations de S. La proba qque X = k (qu’il y ait k succès) est

p(X = k) = Cnk pk (1 − p)n−k avec k entier

X suit une loi binômiale B(n, p) de paramètres n et p.

C’est une loi qui est souvent représentée sous la forme d’un arbre. On compte alors le nombre de
branches ayant k succès (cela correspon à Cnk ) , et on le multiplie par la probabilité qu’une branche se
produise (cela correspond à pk (1 − p)n−k ).
Exemple 6.1 Quelle est la loi de probabilité définissant le nombre de garçons dans une famille de 4
enfants ?

x 0 1 2 3 4
1 4 1 1 4 4 1 4 6 1 4 4 1 4 1
    
p C40 2 = 16 C41 2 = 16 C42 2 = 16 C43 2 = 16 C44 2 = 16

Proposition 6.1 Si X suit une loi binômiale B(n, p) de paramètres n et p, alors


E(X) = np V (X) = npq = np(1 − p)

Exercice 6.1 Une entreprise a effectué une enquète sur ses salariés. Elle a calculé que 6% des individus
sont retardataires. Sur 100 personnes, quelle est la probabilité de n’en avoir aucune en retard ?

Exercice 6.2 Une urne contient des boules blanches et des boules noires. La proportion de blanches
est p. Les tirages se font avec remise ainsi la proportion de boules blanches ne changent jamais. Soit X
l’événement obtenir une boule blanche. Quelles sont l’espérance et la variance de cette variable ?

Exercice 6.3 On lance 10 fois un dé. Quelle est la probabilité d’avoir 4 fois le 1 ?

Exercice 6.4 Un camp d’adolescents propose des stages d’activités nautiques pour débutants avec au
choix : Planche à voile , plongée ou ski nautique. Lors d’un stage donné, ce camp accueille vingt jeunes
don sept seront initiés à la planche à voile, huit à la plongée et cinq au ski nautique. Chaque stagiaire
ne pratique qu’une seule des trois activités.
1. On forme un groupe de 3 stagiaires choisis au hasard parmi les vingt.
(a) Combien de groupes est-il possible de former ?
(b) Déterminez la probabilité de chacun des événements suivants :
A : les trois stagiaires pratiquent des activités différentes
B : Les trois stagiaires pratiquent la même activité
C : Au moins l’un des trois stagiaires pratique le ski nautique.
2. Parmi les trois stagiaires, un seul se prénomme Christian. Chaque jour, on choisit un groupe de
trois stagiaires chargé du service au repas de midi.

13 A. Fredet & J.-M. Gourdon


Probabilités 7 LOIS DE POISSON

(a) Montrez que la probabilité que Christian soit choisi un jour donné pour le service de midi
est égale à 0,15.
(b) La durée du stage est de cinq jours. Quelle est la probabilité de ne jamais choisir Christian
pour le service de midi pendant le séjour ?
(c) Quelle est la probabilité de le choisir exactement une fois ?
(d) Montrez que la probabilité de choisir Christian au moins deux fois est inférieur à 0,2 .

La somme des probabilité fait 1 :


Théoreme 6.1 On a
n
X
p(X = k) = 1
k=0

Démo :

n
X n
X
p(X = k) = Cnx px q n−x = (p + q)n = 1
k=0 k=0

7 Lois de Poisson
Cette loi intervient dans des processus aléatoires dont les éventualités sont faiblement probables et
survenant indépendamment les unes des autres : cas des phénomènes accidentels, d’anomalies diverses,
des problèmes d’encombrement (“files d’attente”), des ruptures de stocks, etc.
Définition 7.1 On dit que la variable aléatoire X suit une loi de Poisson de paramètre m si

mk −m
P (X = k) = e
k!
m
Remarque 7.1 Dans ce cas, P (X = k + 1) = k+1 P (X = k).

une loi de Poisson peut être représentée par un diagramme en bâtons. Ci-dessous sont représentés les
diagrammes en bâtons des lois de Poisson de paramètres 1, 2 et 5 :

Exercice 7.1 Dans un atelier, le nombre d’accidents au cours d’une année suit une loi de Poisson de
paramètre 5. Calculer la probabilité des événements suivants :
1. Il n’y a pas d’accidents au cours d’une année
2. Il y a exactement 4 accidents au cours de l’année
3. Il y a plus de 6 accidents au cours de l’année

14 A. Fredet & J.-M. Gourdon


Probabilités 8 LOIS NORMALES

Proposition 7.1 Si X suit une loi de Poisson de paramètre m alors E(X) = V (X) = m.
La loi de Poisson décrit bien la loi binomiale pour n tendant vers l’infini et q tendant vers zéro, avec
le produit nq tendant vers une constante. Elle modélise donc les expériences de Bernoulli avec une
très faible probabilité de succès, mais avec un grand nombre d’essais, du même ordre de grandeur que
l’inverse de la probabilité de succès.
Proposition 7.2 On peut approcher une loi binomiale B(n, p) par la loi de Poisson P(np) avec un
bon pourcentage de réussite si n ≥ 30, p ≤ 0, 1 et np < 15.
Exercice 7.2 Suite à une vaccination contre le paludisme, dans une population à risque, on estime à
2%, compte tenu du délai d’immunisation, la proportion de personnes qui seront pourtant atteintes de
la maladie. En utilisant la loi binomiale puis la loi de Poisson, quelle est la probabilité de constater,
lors d’un contrôle dans un petit village de 100 habitants tous récemment vaccinés, plus d’une personne
malade ? (on supposera l’indépendance des éventualités).
Exercice 7.3 Une entreprise possède un parc de 200 machines fonctionnant sans arrêt pendant les
heures de travail. On a observé que la probabilité pour chaque machine de tomber en panne au cours
d’une journée est p = 1/1000.
1. Calculer la probabilité pour une machine déterminée de tomber en panne au moins une fois au
cours des 25 jours ouvrables
2. Calculer la probabilité pour une machine déterminée de tomber en panne plus d’une fois au cours
des 25 jours ouvrables
3. En approximant par une loi de Poisson, calculer la probabilité qu’au cours des 25 jours ouvrables
4 machines au plus tombent en panne puis qu’on observe au moins 6 pannes.
Plutôt que de refaire les calculs à chaque fois, on peut utiliser des tables de Poisson qui, connaissant
le paramètre m et la valeur k donne directement P (X = k) et P (X ≤ k).

8 Lois normales
La loi normale (ou de Laplace-Gauss) est la loi de certains phénomènes continus qui fluctuent autour
d’une valeur moyenne m, de manière aléatoire, résultante d’un grand nombre de causes algébriquement
additives et indépendantes. La dispersion des valeurs observées d’un même caractère gaussien est
représentée par un écart type σ.
Définition 8.1 On parle de loi normale ou loi de Gauss lorsque l’on a affaire à une variable aléatoire
continue dépendant d’un grand nombre de causes indépendantes dont les effets s’additionnent et dont
aucune n’est prépondérante.
Les lois normales sont représentées par des courbes en cloche :

15 A. Fredet & J.-M. Gourdon


Probabilités 8 LOIS NORMALES

Exemple 8.1 On fabrique des pièces dont les dimensions dépendent du réglage de l’appareil de fabrica-
tion, des vibrations auxquelles il est soumis, de l’homogénéité de la matière première, de la température,
de l’humidité, ...
Une variable aléatoire continue X est distribuée selon une loi normale si sa densité de probabilité est

1 −(x−m) 2
m est la moyenne de X
f (x) = √ e 2σ 2
où
2π σ est l’écart-type de X
La loi de probabilité dépend donc de deux paramètres m et σ et on l’écrit N(m,σ).
On effectue généralement le changement de variable T = X−mσ . La loi de distribution de t est alors
1 T2
f (T ) = √ e− 2

Cette loi est notée N(0,1) et dite normale, centrée, réduite.
R +∞ T 2 √ R +∞
Remarque 8.1 On admettra pour la suite que −∞ e− 2 dT = 2π et donc que −inf ty f (T ) dT = 1.
Proposition 8.1 L’espérance mathématique d’une variable aléatoire distribuée selon la loi N(0,1) est
0. La médiane et la valeur modale sont égales à l’espèrance mathématiques c’est-à-dire sont égales à 0.
Pour une loi N(m,σ), l’espérance mathématique, la médiane et le mode sont égaux à m et l’écart-type
est σ.
X−m
Si X suit une loi N(m,σ), on pose T = σ . T suit alors une loi N(0,1). On a
E(X) = E(σT + m) = σE(T ) + m = m
V (X) = V (σT + m) = V (σT ) = σ 2 V (T ) = σ 2
p
σ(X) = V (X) = σ
Proposition 8.2 Si on considère une loi N(0,1) alors
p(−1, 96 < t < 1, 96) = 0, 95
p(−2, 58 < t < 2, 58) = 0, 99
R t 0 − t2
De manière plus générale, p(t < t0 ) = √12π −∞ e 2 dt.
RT
On pose −∞ f (t)dt = Φ(T ). Plutôt que d’effectuer les calculs à chaque fois, on utilise la table suivante :
Table de Gauss
T ,0 ,1 ,2 ,3 ,4 ,5 ,6 ,7 ,8 ,9
0 0, 5 0, 5398 0, 5793 0, 6179 0, 6554 0, 6915 0, 7257 0, 7580 0, 7881 0, 8159
1 0, 8413 0, 8643 0, 8849 0, 9032 0, 9192 0, 9332 0, 9452 0, 9554 0, 9641 0, 9713
2 0, 9772 0, 9821 0, 9861 0, 9893 0, 9918 0, 9938 0, 9953 0, 9965 0, 9974 0, 9981
3 0, 9987 0, 9990 0, 9993 0, 9995 0, 9997
Explications
Pour trouver la valeur correspondant à T = 1, 3, on se place sur la deuxième ligne (correspondant à 1)
R 1,3
et sur la quatrième colonne (correspondant à , 3) et on lit : P (T ≤ 1, 3) = 0, 9032. Donc −∞ f (t)dt =
0, 9032. Ce tableau n’est utilisable que pour des valeurs de T positives et des probabilité de type
inférieure ou égale à. Les règles suivantes permettent de résoudre tous les problèmes rencontrés :
Rα R +∞ R +∞ Rα
1. −∞ f (t)dt+ α f (t)dt = 1 donc α f (t)dt = 1− −∞ f (t)dt, c’est--̀dire P (T > α) = 1−P (T ≤
α) = 1 − Φ(α)
2. Si α < 0 alors Φ(α) = 1 − Φ(α).
On aura parfois besoin d’une table de Gauss plus complète :

16 A. Fredet & J.-M. Gourdon


Probabilités 8 LOIS NORMALES

17 A. Fredet & J.-M. Gourdon


Probabilités 8 LOIS NORMALES

18 A. Fredet & J.-M. Gourdon


Probabilités 8 LOIS NORMALES

Exercice 8.1 Sachant que la répartition des quotients intellectuels (QI), rapport entre l’âge mental
et l’âge réel, d’une personne est une loi normale de moyenne 0,90 et d’écart-type 0,40,
1. Calculer la probabilité à 0,0001 près, qu’une personne prise au hasard
(a) ait un QI inférieur à 1 (c) ait un QI supérieur à 1,4
(b) ait un QI inférieur à 0,1 (d) ait un QI compris entre 0,8 et 1,3
2. En déduire le nombre de personnes dans un village de 1000 habitants
(a) ayant un QI inférieur à 1 (c) ayant un QI supérieur à 1,4
(b) ayant un QI inférieur à 0,1 (d) ayant un QI compris entre 0,8 et 1,3

Exercice 8.2 On estime que le temps nécessaire à un étudiant pour terminer une épreuve d’examen
est une variable normale de moyenne 90 minutes et d’écart-type 15 minutes. 240 candidats se présentent
à cet examen
1. Combien d’étudiants N termineront l’épreuve en moins de deux heures ?
2. Quelle devrait être la durée D de l’épreuve si l’on souhaite que 200 étudiants puissent terminer
l’épreuve ?

Exercice 8.3 Une entreprise fabrique, en grande quantité, des tiges métalliques cylindriques pour
l’industrie. Leur longueur et leur diamètre sont exprimés en millimètres. Une tige de ce type est
considérée comme conforme pour la longueur lorsque celle-ci appartient à l’intervalle [99,45 ; 100,55].
On note X la variable aléatoire qui, à chaque tige prélevée au hasard dans la production, associe sa
longueur. On suppose que X suit une loi normale de moyenne 100 et d’écart-type 0,25.
1. Calculer la probabilité qu’une tige prélevée au hasard dans la production soit conforme pour la
longueur.
2. Déterminer le nombre réel h positif tel que : P (100 − h < X < 100 + h) = 0, 95.

19 A. Fredet & J.-M. Gourdon


Probabilités 9 SOLUTIONS DES EXERCICES

9 Solutions des exercices


Solution 1.1 On a
2 1 3 1
p(E1 ) = = p(E2 ) = =
6 3 6 2

1
p(E1 ∩ E2 ) = p((avoir 3 ou 4) ET (avoir un nombre pair)) = p(avoir un 4) =
6
1 1 1 4 2
p(E1 ∪ E2 ) = p(E1 ) + p(E2 ) − p(E1 ∩ E2 ) = + − = =
2 3 6 6 3
4 2
= p((avoir 3 ou 4) ou (avoir un nombre pair)) = p(avoir 2,3,4 ou 6) = =
6 3
Solution 1.2 On considère le tableau suivant, nous donnant la somme des deux nombres :

dé 2
\ 1 2 3 4 5 6
dé 1
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
5 7
De ce tableau, on déduit que p(E1 ) = 36 , p(E2 ) = 36 et p(E3 ) = 18 1
36 = 2 .
Les événements E1 , E2 et E3 sont incompatibles (on ne peut pas avoir simultanément une somme de
5 et une somme de 7, ni une somme de 5 ou 7 et une somme paire). On a donc
p(E1 ∩ E2 ) = 0 p(E1 ∩ E3 ) = 0 p(E2 ∩ E3 ) = 0

5 7 12 1
p(E1 ∪ E2 ) = p(E1 ) + p(E2 ) = + = =
36 36 36 3
5 1 23
p(E1 ∪ E3 ) = p(E1 ) + p(E3 ) = + =
36 2 36
7 1 25
p(E2 ∪ E3 ) = p(E2 ) + p(E3 ) = + =
36 2 36
Solution 2.1 On peut former 10 × 9 × 8 × 7 = 5 040 mots différents.

Solution 2.2 Il n’est pas interdit que les lettres puissent se répéter donc il y a 53 = 125 mots possibles.

Solution 2.3 Pour le tiercé, il y a 8 × 7 × 6 = 336 possibilités. Pour le tiercé, il y a 8 × 7 × 6 × 5 = 1680


possibilités.

Solution 2.4 Pour chaque chiffres du nombre, j’ai 3 possibilités. Il y a donc 3 × 3 × 3 × 3 = 34 = 81


possibilités.

Solution 2.5 Il y a 4023 possibilités.


23 40! 40!
Solution 2.6 Il y a C40 = 23!(40−23)! = 23!17! = 88 732 378 800 possibilités.

5 32×31×30×29×28
Solution 2.7 Il y a C32 = 5×4×3×2×1 = 201 376 possibilités.

20 A. Fredet & J.-M. Gourdon


Probabilités 9 SOLUTIONS DES EXERCICES

Solution 2.8 Il faut choisir 2 coeurs parmi 8, puis 3 cartes parmi les 24 restantes : il y a donc C82 ×C24
3
=
56 672 possibilités.

Solution 2.9 Il est plus simple de calculer le nombre de mains de 5 cartes ne contenant aucun roi,
5
cela revient à prendre 5 cartes parmi les 28 restantes : il y a C28 possibilités. Le nombre total de
5
mains de cinq cartes est C32 et donc le nombre de mains de cinq cartes contenant au moins un roi est
5 5
C32 − C28 = 103 096.
On peut également calculer directement le nombre de mains de cinq cartes contenant au moins un roi :
– nombre de mains de cinq cartes contenant exactement un roi : C41 × C28 4
= 81 900
2 3
– nombre de mains de cinq cartes contenant exactement deux rois : C4 × C28 = 19 656
3 2
– nombre de mains de cinq cartes contenant exactement trois rois : C4 × C28 = 1 512
– nombre de mains de cinq cartes contenant exactement quatre rois : C44 × C28 1
= 28
donc le nombre de mains de cinq cartes contenant au moins un roi est 81900+19656+1512+28 = 103 096
4 10!
Solution 2.10 Il y a C10 = 6!4! = 420 grilles possibles.
4 8 1 11
Solution 3.1 p = 32 + 32 − 32 = 32

C82 28
Solution 3.2 1. Il y a 8 coeurs dans le jeu donc p(A) = 2
C32
= 496 ≈ 0, 05645
2
C12 66
2. Il y a 12 figures dans le jeu donc p(B) = 2
C32
= 496 ≈ 0, 13307
C32 3
3. p(A ∩ B) = p(deux figures à coeur) donc p(A ∩ B) = 2
C32
= 496 ≈ 0, 00605.
91
4. p(A ∪ B) = p(A) + p(B) − p(A ∩ B) = 496 ≈ 0, 18347

Solution 3.3 Soit A l’événement “le candidat A réussit” et B l’événement “le candidat B réussit”.
Calculer la probabilité
3 2 1
1. que les 2 candidats soient reçus = p(A ∩ B) = P (A) × p(B) = 4 × 3 = 2
2. que les 2 candidats échouent = p(Ā ∩ B̄) = p(Ā) × p(B̄) = 41 × 13 = 12
1

3. que le candidat A soit seul reçu = p(A ∩ B̄) = p(A) × p(B̄) = 43 × 13 = 1


4
4. qu’un seul des deux candidats réussise = p(A ∩ B̄) + p(Ā ∩ B) = p(A) × p(B̄) + p(Ā) × p(B) =
1 2 5
4 + 12 = 12
1 11
5. qu’au moins 1 des candidats soit reçu = 1 − p(Ā ∩ B̄) = 1 − 12 = 12

Solution 3.4 Soient RA l’événement tirer une boule rouge dans l’urne A, BA l’événement tirer une
boule bleue dans l’urne A, RB l’événement tirer une boule rouge dans l’urne B, BB l’événement tirer
une boule bleue dans l’urne B. On a
4 5 20
1. Probabilité de tirer deux boules rouges = p(RA ∩ RB ) = 9 × 11 = 99
5 6 30
2. Probabilité de tirer deux boules bleues = p(BA ∩ BB ) = 9 × 11 = 99
3. Probabilité de tirer deux boules de même couleur = p(RA ∩RB )+p(BA ∩BB ) = 94 × 11
5
+ 95 × 11
6
= 50
99
4. Probabilité de tirer deux boules de couleurs différentes : on peut le faire par le calcul direct :
= p(BA ∩ RB ) + p(RA ∩ BB ) = 95 × 11 5
+ 49 × 11
6 49
= 99 On peut également le faire en remarquant
que cet événement est l’opposé de l’événement précédent et en déduire que la probabilité est
1 − (p(RA ∩ RB ) + p(BA ∩ BB )) = 49 99

21 A. Fredet & J.-M. Gourdon


Probabilités 9 SOLUTIONS DES EXERCICES

Solution 3.5 Calculons le nombre de possibilités pour obtenir 11 et 12 :

total 11 nbr de cas total 12 nbr de cas


1−5−5 C32 = 3 1−5−6 6
1−4−6 6 2−5−5 3
2−4−5 6 2−4−6 6
2−3−6 6 3−3−6 3
3−4−4 3 3−4−5 6
3−3−5 3 4−4−4 1
27 25

Le nombre 11 peut donc être obtenu de 27 façons différentes, contre 25 pour le nombre 12. Le joueur
A est donc avantagé.

Solution 3.6 X(Ω) = {0; 1; 2; 3; 4} et Y (Ω) = {0; 1; 2; 3; 4}. Soient


– Ai l’événement “le joueur A marque i points” avec i ∈ {0; 1; 2}
– Bi l’événement “le joueur B marque i points” avec i ∈ {0; 1; 2}
– Ci l’événement “le joueur C marque i points” avec i ∈ {0; 1; 2}
– Di l’événement “le joueur D marque i points” avec i ∈ {0; 1; 2} P
P résultats des joueurs sont indépendants entre eux donc p(X = k) =
Les i+j=k p(Ai ∩ Bj ) =
i+j=k p(A i ) × p(B j ). On a
– P (X = 0) = 0, 4 × 0, 3 = 0, 12
– P (X = 1) = p(A1 ) × p(B0 ) + p(A0 ) × p(B1 ) = 0, 4 × 0, 3 + 0, 4 × 0, 4 = 0, 28
– P (X = 2) = p(A2 )×p(B0 )+p(A1 )×p(B1 )+p(A0 )×p(B2 ) = 0, 2×0, 3+0, 4×0, 4+0, 4×0, 3 = 0, 34
– P (X = 3) = p(A2 ) × p(B1 ) + p(A1 ) × p(B2 ) = 0, 2 × 0, 4 + 0, 4 × 0, 3 = 0, 2
– P (X = 4) = p(A2 ) × p(B2 ) = 0, 2 × 0, 3 = 0, 06
et donc
xi 0 1 2 3 4
p(X = xi ) 0, 12 0, 28 0, 34 0, 2 0, 06

et
yi 0 1 2 3 4
p(Y = yi ) 0, 15 0, 34 0, 31 0, 16 0, 04

Soit p(N ) la probabilité que le match soit nul. On a

p(N ) = p((X = 0) ∩ (Y = 0)) + p((X = 1) ∩ (Y = 1)) + p((X = 2) ∩ (Y = 2))


+p((X = 3) ∩ (Y = 3)) + p((X = 4) ∩ (Y = 4))
= p(X = 0) × p(Y = 0) + p(X = 1) × p(Y = 1) + p(X = 2) × p(Y = 2)
+p(X = 3) × p(Y = 3) + p(X = 4) × p(Y = 4)
= 0, 12 × 0, 15 + 0, 28 × 0, 34 + 0, 34 × 0, 31 + 0, 2 × 0, 16 + 0, 06 × 0, 04
= 0, 253

Solution 3.7 – raisonnement direct :


{1, 3, 5, 7, 9, 11, 13, 15} sont les numéro impairs, {3, 9, 15} sont les multiples de 3 parmi les impairs
donc le nombre de cas favorables est 3 et le nombre de cas possibles est 8 : p = 83
– Avec la formule :
Soit A l’événement la boule a un numéro impair et B l’événement la boule a un numéro multiple
de 3. On a pA (B) = p(A∩B) 3/15
p(A) = 8/15 = 8 .
3

22 A. Fredet & J.-M. Gourdon


Probabilités 9 SOLUTIONS DES EXERCICES

Solution 3.8 Soit T l’événement le test est positif (et donc T̄ l’événement le test est négatif) et soit
C l’événement l’ampoule est conforme (et donc C̄ l’événement l’ampoule est non conforme). On a
p(C) = 0, 92 et p(C̄) = 0, 08, et le tableau suivant

T T̄
C 0, 92 × 0, 96 = 0, 8832 0, 92 × 0, 04 = 0, 0368 0, 92
C̄ 0, 08 × 0, 06 = 0, 0048 0, 08 × 0, 94 = 0, 0752 0, 08
0, 888 0, 112 1
p(T ∩C) 0,8832 p(T̄ ∩C̄)
p(T ) = 0, 888 et p(T̄ ) = 0, 112. On en déduit que pT (C) = p(T ) = 0,888 = 0, 99 et pT̄ C̄ = p(T̄ )
=
0,0752
0,112 = 0, 67.

Solution 3.9 Soit A1 l’événement la pièce provient de l’atelier 1 et A2 l’événement elle provient de
l’atelier 2. Soit B l’événement la pièce est defectueuse.
1. La pièce provient de l’atelier 1 :
La cadence du 1 étant le double de celle de l’atelier 2, il fabrique deux fois plus de pièces donc
p(A1 ) = 23
2. La pièce est défectueuse : p(B) = p(B ∩ A1 ) + p(B ∩ A2 ) = PA1 (B) × p(A1 ) + PA2 (B) × p(A2 ) =
0, 03 × 23 + 0, 04 × 13 = 0, 02 + 0, 013 = 0, 033. 3,3 % des pièces sont défectueuses.
p(B∩A1 ) 0,02
3. La pièce provient de l’atelier 1, sachant qu’elle est défectueuse : pB (A1 ) = p(B) = 0,033 =
0, 6%.

Solution 3.10 Soit A l’événement il a la maladie Ma et B l’événement il a la maladie Mb . On a le


tableau suivant :
A Ā
B 0, 15 × 0, 2 = 0, 03 0, 85 × 0, 04 = 0, 034 0, 064
B̄ 0, 15 × 0, 8 = 0, 12 0, 85 × 0, 96 = 0, 816 0, 936
0, 15 0, 85 1

On cherche
1. Il a la maladie Ma : p(A) = 0, 15
p(A∩B) 0,03
2. Il a la maladie Mb sachant qu’il a Ma : pA (B) = p(A) = 0,15 = 0, 2 (on retrouve les 20 % de
l’énoncé, ce qui est bon signe ...)
3. Il a la maladie Mb sachant qu’il n’a pas Ma : pĀ (B) = p(p(
Ā∩B)
Ā)
= 0,034
0,85 = 0, 04 (on retrouve les 4
% de l’énoncé)
4. Il a la maladie Ma et la maladie Mb : p(A ∪ B) = 0, 03
5. Il n’a pas la maladie Ma mais il a la maladie Mb : p(Ā ∪ B) = 0, 034
6. Il a la maladie Mb : p(B) = 0, 064
0,03
7. Il a la maladie Ma sachant qu’il a Mb : pB (A) = 0,064 = 0, 46875

Solution 3.11 Les trois événements sont indépendants. On a donc


1. que les 3 soient reçus = p(A ∩ B ∩ C) = p(A) × p(B) × p(C) = 0, 7 × 0, 4 × 0, 6 = 0, 168
2. que les trois échouent = p(Ā ∩ B̄ ∩ C̄) = 0, 3 × 0, 6 × 0, 4 = 0, 072
3. que A seulement soit reçu = p(A ∩ B̄ ∩ C̄) = 0, 7 × 0, 6 × 0, 4 = 0, 168
4. qu’un seul réussise = p(A ∩ B̄ ∩ C̄) + p(Ā ∩ B ∩ C̄) + p(Ā ∩ B̄ ∩ C) = 0, 7 × 0, 6 × 0, 4 + 0, 3 ×
0, 4 × 0, 4 + 0, 3 × 0, 6 × 0, 6 = 0, 324

23 A. Fredet & J.-M. Gourdon


Probabilités 9 SOLUTIONS DES EXERCICES

5. que B soit le seul à échouer = p(A ∩ B̄ ∩ C) = 0, 7 × 0, 6 × 0, 6 = 0, 252


6. qu’exactement deux soient reçus = p(A ∩ B ∩ C̄) + p(A ∩ B̄ ∩ C) + p(Ā ∩ B ∩ C) = 0, 7 × 0, 4 ×
0, 4 + 0, 7 × 0, 6 × 0, 6 + 0, 3 × 0, 4 × 0, 6 = 0, 436
7. qu’au moins un soit reçu = 1 − p(Ā ∩ B̄ ∩ C̄) = 1 − 0, 072 = 0, 928

Solution 3.12 1. P (B ∩ R) = p(B) × p(B/R) = x3 × x − 3x − 1 = 41 On se ramène donc à résoudre


2
x − 13x + 36 = 0 dont les racines sont 4 et 9. Il y a soit 4, soit 9 boules dans l’urne.
2. p(B ∩ R) = p(B) × p(R) = x3 × x−3 1 2
x = 4 . On se ramèn donc à résoudre x − 12x + 36 = 0 qui n’a
qu’une racine : x = 6. Il y a donc 6 boules dans l’urne.

Solution 5.1 1. nombres de résultats possibles : 43 = 64


2. Quelle est la probabilité d’obtenir les cas suivants :
(a) La première boule tirée porte le numéro 10, la deuxième le numéro 40, la troisième le numéro
1
20 : il n’y a qu’un cas possible donc une probabilité de 64
(b) La première boule tirée porte le numéro 30 et la deuxième le numéro 20 : il y a 4 choix pour
4 1
la troisième boule, donc 4 cas possibles, d’où une probabilité de 64 = 16
(c) La deuxième boule porte le numéro 20 : il y a 4 choix pour la 1ère boule et 4 pour la 3ème
d’où 4 × 4 = 16 cas possibles et une probabilité de 16 1
64 = 4

Solution 5.2 1. nombres de résultats possibles : 4 × 3 × 2 = 24


2. Quelle est la probabilité d’obtenir les cas suivants :
(a) La première boule tirée porte le numéro 10, la deuxième le numéro 40, la troisième le numéro
1
20 : il n’y a qu’un cas favorable donc une probabilité de 24
(b) La première boule tirée porte le numéro 30 et la deuxième le numéro 20 : il y a 2 possibilités
2 1
pour la troisième boule d’où une probabilité de 24 = 12
(c) La deuxième boule porte le numéro 20 : il y a 3 choix pour la 1ère boule (10, 30 ou 40) et 2
pour la 3ème boule, soit une probabilité de 3×2 1
24 = 4 .

Solution 5.3 1. nombre de résultats possibles : C43 = 4


3
2. Quelle est la probabilité d’avoir un résultat dans lequel figure le nombre 20 : 4
1
3. Quelle est la probabilité d’avoir un résultat dans lequel figurent les nombres 30 et 40 : 2

Solution 5.4 Regardons quelles sont les probabilités d’apparition de ces valeurs :

dé 1
1 2 3 3
dé 2
1 2 3 4 4
2 3 4 5 5
2 3 4 5 5
2 3 4 5 5

Si on appelle X la variable aléatoire somme des deux dés, on a donc

xi 2 3 4 5
1 4 5 6
P (X = xi ) 16 16 16 16

On s’intéresse d’abord à l’espérance :

24 A. Fredet & J.-M. Gourdon


Probabilités 9 SOLUTIONS DES EXERCICES

1. Partie 1 : les gains possibles sont 5, 1 et −1 euros. On note Z1 la variable aléatoire gain du joueur.
On a le tableau suivant
xi 5 1 −1
1 9 6
p(Z1 = xi ) 16 16 16

1 9 6
L’espérance de cette variable aléatoire est donc E(Z1 ) = 5 × 16 +1× 16 + (−1) × 16 = 0, 5.
2. Partie 2 : les gains possibles sont 50, 2 et −10 euros. On note Z2 la variable aléatoire gain du
joueur. On a le tableau suivant

xi 50 2 −10
1 9 6
p(Z1 = xi ) 16 16 16

1 9 6
L’espérance de cette variable aléatoire est donc E(Z1 ) = 50 × 16 +2× 16 + (−10) × 16 = 0, 5.
On observe que les espérances sont égales, mais le risque est aussi lié à l’écart existant entre l’espérance
de la variable aléatoire et les valeurs prises par cette variable. On s’intéresse maintenant à l’écart-type :
1 9 6
V (Z1 ) 52 ×
= + 12 × + (−1)2 × − (0, 5)2 = 2, 25
p 16 16 16
σ(Z1 ) = V (Z1 ) = 1, 5
1 9 6
V (Z2 ) = 502 × + 22 × + (−10)2 × − (0, 5)2 = 195, 75
p 16 16 16
σ(Z2 ) = V (Z2 ) ≈ 14

L’écart-type est plus grand dans le deuxième cas, ce qui signifie que les valeurs de gains sont plus
espacées pour le deuxième jeu. À chacun de choisir le jeu suivant son gout du risque ...

Solution 5.5 Soit V l’événement “le feu est vert” et V̄ l’événement “le feu n’est pas vert” (ie le feu est
orange ou rouge).
40 2
1. p(V ) = 60 = 3
80
2. p(V3 ) = C53 p(V )3 p(V̄ )2 = 243
3. La loi de probabilité est :

x 0 1 2 3 4 5
1 10 40 80 80 32
p(X = x) 243 243 243 243 243 243

et donc
5
X 1 10 40 80 80 32 10
E(X) = xp(X = x) = 0 × +1× +2× +3× +4× +5× =
i=0
243 243 243 243 243 243 3

Solution 5.6 1. Pour tout x ∈ R, f (x) ≥ 0 et de plus,


+∞ 1 2 1 2
x2 −x2
Z Z Z  
f (x) dx = x dx + (−x + 2) dx = + + 2x =1
−∞ 0 1 2 0 2 1

2.
Z +∞ Z 1 Z 2  1  2
1 3 1
E(X) = xf (x) dx = x2 dx + x(−x + 2) dx = x + − x3 + x2 = 1
−∞ 0 1 3 0 3 1

25 A. Fredet & J.-M. Gourdon


Probabilités 9 SOLUTIONS DES EXERCICES

et
Z +∞ Z 1 Z 2
E(X 2 ) = x2 f (x) dx = x3 dx + x2 (−x + 2) dx
−∞ 0 1
 1
 2
1 4 1 4 2 7
= x + − x + x32 =
4 0 4 3 1 6
2 2 1
V (X) = E(X ) − E(X) =
p 6
σ(X) = V (X) ≈ 0, 408

3.
Z 1,32 Z 1 Z 1,3
p(0, 5 < X < 1, 32) = f (x) dx = x dx + (−x + 2) dx = 0, 63
0,5 0,5 1
R +∞ 1
Solution 5.7 1. f (x) dx = 18k donc il faut que k =
−∞ 18

2. E(X) = 0 et V (X) = 2 donc σ(X) = 2
7 1
3. p(−1 < X < 2) = 12 et p(X ≥ 3) = 36

Solution 6.1 Soit X le nombre de personne en retard. X suit la loi B(100 ;0,06) d’où p(X = 0) =
0
C100 0, 060 0, 94100 = 0, 002.

Solution 6.2 On effectue un seul tirage donc n = 1.

x p(x)
0 (echec) q =1−p
1 (succès) p

donc E(X) = 0 × q + 1 × p = p et V (X) = pq

Solution 6.3
x p
1
oui 1 6
5
non 0 6

1 4 5 6
4 4 6 4
 
La probabilité d’avoir 4 réussites est C10 p q = C10 6 6 = 0, 0542 = 5, 42%.

Solution 6.4 1. Il y a 20 stagiaires. On veut en choisir 3. Cela revient à chosir 3 éléments parmi
20. C’est donc le nombre de combinaisons de 3 éléments parmi 20. Le nombre de choix possibles
3 20!
pour les groupes de 3 est donc : C20 = 3!×17! = 1140.
2. A est l’événement les 3 stagiaires pratiquent des activités différentes.
Comme on suppose qu’il y a équiprobabilité des choix des stagiaires, on a : P (A) = Card(A)
1140 .
Si on appelle V l’ensemble des stagiaires qui seront initiés à la planche à voile, P l’ensemble
des stagiares qui seront initiés à la plongée et S l’ensemble des stagiaires qui seront initiés au
ski nautique, un événement élémentaire appartient à A si et seulement il contient exactement
1 élément de V , 1 élément de P et 1 élément de S. Comme Card(V ) = 7 , Card(P ) = 8 et
280
Card(S) = 5, on obtient : Card(A) = 7 × 8 × 5 = 280. Donc P (A) = 1140 .
L’évément B les 3 stagiaires pratiquent la même activité correspond à choisir 3 stagiaires parmi
V ou P ou S. Comme Card(V) = 7, le nombre de choix de 3 éléments de V est le nombre de

26 A. Fredet & J.-M. Gourdon


Probabilités 9 SOLUTIONS DES EXERCICES

combinaisons de 3 éléments parmi 7. De même, le nombre de choix de 3 éléments de P est le


nombre de combinaisons de 3 éléments parmi 8 et le nombre de choix de 3éléments de S est le
nombre de combinaisons de 3 éléments parmi 5. Donc , on a : card(B) = C73 + C83 + C53 = 101.
101
D’où p(B) = 1140 .
L’événement C est au moins un des trois stagiaires pratique le ski nautique. L’événement contraire
de C est aucun des trois stagiaires ne pratique le ski nautique. Il correspond au choix de 3 stagiaires
3
parmi les 15 qui ne font pas de ski nautique. Son cardinal est alors : card(C) = C15 = 455. Donc
685
card(C) = 1140 − 455 = 685 et p(C) = 1140 .
3. On sait qu’il y a chaque jour 1140 choix possibles de 3 stagiaires parmi les 20. Choisir un groupe
de 3 avec Christian revient à choisir Christian et 2 stagiaires parmi les 19 qui ne sont pas
Christian. Il y a 171 choix possibles de deux autres stagiaires. C’est le nombre de combinaisons
de 2 éléments parmi 19. Parmi les 1140 groupes possibles de 3 stagiaires, il y a donc exactement
175 groupes qui contiennent Christian. La probabilité que Christian soit choisi un jour donné est
171
donc : 1140 = 0, 15.
Si on appelle X la variable aléatoire égale au nombre de fois que Christian est choisi durant le
séjour de 5 jours, X suit une loi binomiale de paramètre (n = 5 , p = 0,15 ). Donc, pour tout k
entier, on a :
p(X = k) = C5k (0, 15)k × (0, 85)5−k
En particulier, la probabilité de ne jamais choisir Christian durant le séjour est :

p(X = 0) = C50 (0, 15)0 × (0, 85)5 = (0, 85)5 ≈ 0, 4437

La probabilité de choisir exactement une fois Christian est :

p(X = 1) = C51 (0, 15)1 × (0, 85)4 = 5 × (0, 15) × (0, 85)4 ≈ 0, 3915

La probabilité de choisir au moins 2 fois Christian est : P (X ≥ 2). Or P (X ≥ 2) = 1 − P (X =


0) − P (X = 1). Les calculs précédents montrent bien alors que cette probabilité est inférieure à
0,2.

Solution 7.1 1. P (X = 0) = e−5 ≈ 0, 0067


54 −5
2. P (X = 4) = 4! e ≈ 0, 1755
3. P (X > 6) = 1 − P (X ≤ 6) ≈ 1 − 0, 7622 ≈ 0, 2378

Solution 7.2 Compte tenu des hypothèses, le nombre de malades est ici régi par une loi binomiale de
paramètres n = 100 et p = 0,02. On a np = 2 et les conditions d’approximation par une loi de Poisson
sont réalisées. Soit m la probabilité cherchée.
En utlisant la loi binomiale, on a 1 − m = (0, 98)100 + 2 × (0, 98)99 ≈ 0, 403. Soit m ≈ 0, 597.
k
En utilisant la loi de Poisson, on a P rob(X = k) = e−2 × 2k! , donc 1 − m ≈ P rob(X = 0) + P rob(X =
1) = 0, 406 , soit m ≈ 0, 594. L’approximation est donc ici excellente.

Solution 7.3 Soit X la variable aléatoire associée au nombre de pannes durant 25 jours ouvrables. Ces
25 épreuves sont identiques et indépendantes donc X suit une loi binomiale B(25 ;1/1000).
1. Calculer la probabilité pour une machine déterminé de tomber en panne au moins une fois au
cours des 25 jours ouvrables : p(X ≥ 1) = 1 − p(X = 0) = 1 − 0, 99925 ≈ 0, 0247
2. Calculer la probabilité pour une machine déterminé de tomber en panne plus d’une fois au cours
des 25 jours ouvrables : p(X > 1) = 1 − ((p(X = 0) + p(X = 1)) = 1 − (0, 99925 + 25 × 0, 001 ×
0, 99924 ) ≈ 0, 0003

27 A. Fredet & J.-M. Gourdon


Probabilités 9 SOLUTIONS DES EXERCICES

3. Soit Y la variable aléatoire associée au nombre de pannes pour 200 machines en 25 jours. Y suit
la loi binomiale B(5000 ;0,001). On l’approche la loi binomiale par la loi de Poisson de même
moyenne np = 5000 × 0, 001 = 5 (on a bien n ≥ 30; p ≤ 0, 1 et np < 15). On en déduit

p(Y ≤ 4) = p(Y = 0) + p(Y = 1) + p(Y = 2) + p(Y = 3) + p(Y = 4)


52 53 54
 
5
= e−5 1 + + + + ≈ 0, 4405
1! 2! 3! 4!
52 53 54 55
 
5
P (Y < 6) = P (Y ≤ 5) = e−5 1 + + + + + ≈ 0, 6160
1! 2! 3! 4! 5!

Solution 8.1 La variable aléatoire suit une loi normale de moyenne m = 9 et d’écart-type σ = 0, 4. On
pose T = Q−0,9
0,4 . T suit une loi normale centrée réduite N(0,1).
1. Calculer la probabilité à 0,0001 près, qu’une personne prise au hasard
(a) ait un QI inférieur à 1 : Q < 1 ⇔ T < 0, 25 et p(T < 0, 25) ≈ 0, 5987
(b) ait un QI inférieur à 0,1 : Q < 0, 1 ⇔ T < −2 et p(T < −2) ≈ 0, 0228
(c) ait un QI supérieur à 1,4 : Q > 1, 4 ⇔ T > 1, 25 et p(T > 1, 25) ≈ 0, 1056
(d) ait un QI compris entre 0,8 et 1,3 : 0, 8 ≤ Q ≤ 1, 3 ⇔ −0, 25 ≤ T ≤ 1 et p(−0, 25 ≤ T ≤
1) ≈ 0, 4400.
2. En déduire le nombre e personnes dans un village de 1000 habitants
(a) ayant un QI inférieur à 1 : ≈ 599
(b) ayant un QI inférieur à 0,1 : ≈ 23
(c) ayant un QI supérieur à 1,4 : ≈ 106
(d) ayant un QI compris entre 0,8 et 1,3 : ≈ 440

Solution 8.2 Le temps nécessaire à un étudiant pour terminer une épreuve d’examen est une variable
aléatoire X normale, de moyenne 90mn et d’écart-type 15mn. On pose T = X−90 15 . T suit une loi
normale centrée réduite N(0,1).
1. Combien d’étudiants N termineront l’épreuve en moins de deux heures : X ≤ 120 ⇔ T ≤ 2 et
p(X ≤ 12) = p(T ≤ 2) ≈ 0, 9772. Il y a aura donc N = 240 × 0, 9772 ≈ 235 étudiants à finir en
deux heures.
2. Quelle devrait être la durée D de lépreuve si l’on souhaite que 200 étudiants puissent terminer
l’épreuve ?
On veut p(X ≤ D) = 200 240 ≈ 0, 8333. D’après la table, on en déduit que T doit être 0,97 ce qui
nous amène à D ≈ 104, 55.

Solution 8.3 1. On a
99, 45 − 100 100, 55 − 100
P (99, 45 ≤ X ≤ 100, 55) = P( ≤T ≤ ) = P (−2, 2 ≤ T ≤ 2, 2)
0, 25 0, 25
= P (T ≤ 2, 2) − P (T ≤ −2, 2) = P (T ≤ 2, 2) − (1 − P (T ≤ 2, 2))
= 0, 9861 − (1 − 0, 9861) = 0, 9722

28 A. Fredet & J.-M. Gourdon


Probabilités 9 SOLUTIONS DES EXERCICES

2. On cherche h tel que


−h h
P (100 − h ≤ X ≤ 100 + h) = P( ≤T ≤ ) = 0, 95
0, 25 0, 25
h −h h h
= P (T ≤ ) − P (T ≤ ) = P (T ≤ ) − (1 − P (T ≤ ))
0, 25 0, 25 0, 25 0, 25
h
= 2P (T ≤ )−1
0, 25
h 0, 95 + 1
P (T ≤ ) = = 0, 975
0, 25 2
h
≈ 1, 9 ⇒ h ≈ 0, 475
0, 25

29 A. Fredet & J.-M. Gourdon


Échantillonnage et estimation 2 ESTIMATION

Deuxième partie
Échantillonnage
Généralement, nous obtenons les résultats statistiques par expérience. Trois problèmes se posent
alors :
1. Quelle confiance pouvons-nous avoir dans les valeurs statistiques considérées ?
2. Quelle est la loi de probabilité régissant ces résultats ?
3. Pouvons-nous déterminer si deux ensembles de mesures différents sont régis par la même loi ?
Nous allons nous intéresser à ces problèmes. Nous ne nous intéresserons qu’à des échantillons de taille
significative (ayant un effectif supérieur à 30).

1 Échantillons
Proposition 1.1 Considérons une population ayant une certaine propriété avec une moyenne m et un
écart-type σ. Soit X la variable aléatoire qui à tout échantillon aléatoire prélevé avec remise et d’effectif
n fixé, associe la moyenne de cet échantillon. Pour n suffisamment grand, X suit approximativement
la loi normale N (m, √σn ).

Exercice 1.1 Une machine fabrique des disques pleins en grande quantité. La variable aléatoire qui,
à chaque disque tiré au hasard, associe son diamètre suit la loi normale N (12, 8; 2, 1) (la moyenne vaut
12,8mm et l’écart-type vaut 2,1mm).
1. Quelle loi suit la variable aléatoire X qui, à tout échantillon aléatoire non es=xhaustif de taille
n = 49, associe la moyenne des diamètres des disques de cet échantillon ?
2. Déterminez un intervalle centré en 12,8 tel que la variable aléatoire prenne ses valeurs dans cet
intervalle avec la probabilité 0,95
3. Déterminez la taille que doit avoir un échantillon pour que la moyenne des diamètres des disques
prélevés ne s’écarte pas de 12,8 de plus de 0,2mm avec une probabilité de 0,95.

2 Estimation
C’est le problème inverse de l’échantillonnage : connaissant des renseignements sur un ou plusieurs
échantillons, on cherche à en déduire des informations sur la population totale.
Par exemple, à chaque élection, on nous assène que tel candidat fera 23,4% des voix. Puis, le lendemain,
seulement 19,6%. Pourquoi cet écart ? En fait, les nombres 23,4 et 19,6 n’ont aucun sens s’ils sont donnés
seuls. Evidemment, lorsqu’on interroge une partie de la population française, il est impossible de savoir
ce que pense exactement toute la population. On n’en obtient qu’une estimation. Et la précision de
l’estimation varie en fonction du nombre de personnes interrogées.
Lorsque qu’un sondage réalisé auprès de n personnes donne comme résultat p% d’intention de vote,
on peut trouver un intervalle [a, b], contenant p, tel que, avec un risque d’erreur inférieur à 5% par
exemple, le pourcentage réel d’intention de vote est compris entre a et b.

Exemple 2.1 Pour le second tour d’une élection présidentielle, un sondage crédite le candidat A de
53%. Est-on sûr pour autant qu’il va gagner ?
Les intervalles de confiance, avec un risque d’erreur de 5%, dépendent bien entendu du nombre n de
personnes interrogées.
Prenons l’exemple d’un institut de sondage qui, avant le second tour d’une élection présidentielle,

30 A. Fredet & J.-M. Gourdon - 2008 - 2009


Échantillonnage et estimation 2 ESTIMATION

interroge n électeurs. Parmi eux, 53% déclarent qu’ils vont voter pour le candidat A. Peut-il garantir
pour autant la victoire du candidat A avec un risque d’erreur inférieur ou égal à 5%. Il faut pour cela
que [50, 100] soit un intervalle de confiance pour l’estimation du paramètre Pourcentage de personnes
qui vont voter A. Ceci dépend bien sûr de la taille de l’échantillon interrogé. Plus n est grand, meilleure
est l’estimation.

Intervalle de confiance
L’intervalle de confiance est une forme de mesure de la confiance que l’on peut accorder à une
hypothèse concernant une valeur numérique mesurée, au vu de résultats de mesures de cette valeur.
Par définition, l’intervalle de confiance I(α) (au niveau de confiance α) relatif à une mesure M
constatée, est l’intervalle dans lequel, pour toute valeur p ∈ I(α), P (M = p) > α.
Plus le seuil de confiance est élevé, plus l’intervalle sera grand.

α = 0, 99
99 chances sur 100 que la valeur du paramètre re-
cherché se trouve dans l’intervalle de confiance mais
la précision autour de la valeur prédite est faible.

α = 0, 95
95 chances sur 100 que la valeur du paramètre re-
cherché se trouve dans l’intervalle de confiance et la
précision autour de la valeur prédite est correcte.

α = 0, 90
90 chances sur 100 que la valeur du paramètre re-
cherché se trouve dans l’intervalle de confiance mais
la précision autour de la valeur prédite est élevée.

Si on considère un niveau de confiance α, on commence par trouver tα tel que P (X ≤ tα ) = 1+α 2 . Soient
m et σ la moyenne et l’écart-type de la population globale, et soient me la moyenne de l’échantillon, σe
son écart-type et n l’effectif de l’échantillon. Le chapitre précédent nous dit que me suit la loi normale
N (m, √σn ).
Cela signifie que P (me − tα × √σn < m < me + tα × √σn ) = α. Cela implique donc que la moyenne m
appartient à l’intervalle [me − tα × √σn ; me + tα × √σn ] avec une probabilité de α.
σe σe
Définition 2.1 L’intervalle [me + tα × √ n
, me + tα × √ n
] est appellé intervalle de confiance pour la
moyenne m au niveau de confiance α. C’est à dire qu’il contient la vraie moyenne m avec une probabilite
de α.

Exemple 2.2 Supposons que le poids moyen trouve dans un échantillon de taille n = 100 prélevé
aléatoirement soit me = 10, 6.
Nous supposerons que σ est connu et vaut σ = 3. Sinon, comme on suppose que l’échantillon est
suffisamment grand, il est acceptable de remplacer σ par l’écart-type σe de l’échantillon L’intervalle de

31 A. Fredet & J.-M. Gourdon - 2008 - 2009


Échantillonnage et estimation 2 ESTIMATION

confiance est [me + 1, 96 √σ100


e
, me + 1, 96 √σ100
e
] = [10, 012; 11, 188]. On peut donc dire que l’estimation
de m est 10, 6 ± 0, 588 avec un niveau de confiance de 95%.
Pour réduire l’amplitude de l’intervalle, il faut augmenter l’effectif de l’échantillon.
Remarque 2.1 Si α = 95% alors tα = 1, 96, si α = 99% alors tα = 2, 58.
Le calcul de l’intervalle de confiance dépend de la loi observée.
Proposition 2.1 Supposons que l’on considère un échantillon de n personnes, et que l’on cherche à
déterminer les paramètres n et p d’une loi binomiale. Supposons que ne et pe soient les paramètres de
l’échantillon. L’intervalle est donné par
r r
pe (1 − pe ) pe (1 − pe )
[pe − tα × , pe + tα × ]
n n
Exercice 2.1 Un test de fonctionnement d’un lot de 1000 ampoules donne 490 ampoules hors-service.
On souhaite déterminer la probabilité p qu’une ampoule a d’être en panne, ainsi qu’un intervalle de
confiance 95%.
Dans le cas d’une loi binomiale, pe est souvent inconnu. On le remplace alors par une valeur approxi-
mative (on verra au chapitre suivant comment trouver une telle valeur), ou par 12 qui nous donne un
intervalle d’amplitude fixée.
Exercice 2.2 On désire estimer la proportion p de personnes qui se déclarent favorables un certain
projet dans une population de taille importante.
1. Si lon a aucune idée idée a priori sur cette proportion, déterminez le nombre de personnes à
interroger avec un niveau de confiance de 99%, si l’erreur d’estimation est fixée 2% (cela signifie
que l’intervalle a une amplitude maximim de 0,02).
2. Finalement, on n’a interrogé finalement que 1000 personnes et on a trouvé une proportion de
53% des personnes pour le projet dans l’échantillon. Proposez un intervalle de confiance pour p
au niveau de confiance de 99%
Proposition 2.2 Si on considère un échantillon de n personnes, et que c’est une loi normale de
moyenne m, et si l’on cherche un niveau de confiance de α alors on commence par trouver tα tel que
P (X ≤ tα ) = 1+α
2 . L’intervalle est donné par
tα .m tα .m
[p − √ , p + √ ]
n n
Exemple 2.3 Reprenons l’exemple des élections présidentielles. La moyenne d’un échantillon étant
inconnu, on va supposer que m = 50% (50% des personnes vont voter pour ce candidat).
Soit α = 0, 95 dans ]0, 1[ le niveau de confiance que l’on souhaite. On cherche tα tel que P (X ≤ tα )) =
1+0,95
2 = 0, 975. On trouve tα = 1, 96. Un intervalle de confiance est donné par
1, 96 × 50 1, 96 × 50
I = [53 − √ , 53 + √ ]
n 2 n
Cela nous donne des intervzalles en fonction de n :
n = 100 [43, 2; 62, 8]
n = 1000 [49, 9; 56, 1]
n = 10000 [52; 54]

La première ligne signifie qu’au terme d’un sondage de 100 personnes, on peut affirmer avec un risque
d’erreur inférieur ou égal à 5% que le candidat A fera entre 43,2% et 63,8% des voix.

32 A. Fredet & J.-M. Gourdon - 2008 - 2009


Échantillonnage et estimation 3 TEST D’AJUSTEMENT

Estimation de la moyenne
Soient m et σ la moyenne et l’écart-type de la population globale. Soient me la moyenne de
l’échantillon, σe son écart-type et n l’effectif de l’échantillon. Deux cas peuvent se présenter :
1. m est inconnue, σ, me et n sont connus :
Dans ce cas, l’intervalle de confiance de la moyenne m de la population avec le coefficent de
confiance α est
tα .σ tα .σ
[me − √ , me + √ ]
n n
2. m et σ sont inconnus, me , σe et n sont connus :
Dans ce cas, l’intervalle de confiance de la moyenne m de la population avec le coefficient de
confiance α est
tα .σe tα .σe
[me − √ , me + √ ]
n−1 n−1
Exemple 2.4 Dans une population P de grand effectif, on prélève de manière non exhaustive, un
échantillon de 100 personnes dont on note la masse en kg :

masse 62 64 68 10 74
ef f ectif 5 18 42 27 8

La moyenne et l’écart-type de cet échantillon sont me = 68kg et σe = 3kg.


L’intervalle de confiance de la moyenne m des masses des personnes de P au coefficient de confiance
95% est
3 3
m ∈ [68 − 1, 96 × √ ; 68 + 1, 96 × √ ] = [67, 4; 68, 6]
100 − 1 100 − 1
Exercice 2.3 Dans une station service, on suppose que le montant des chèques essence suit une loi
normale de paramètres m et s. On considère un échantillon de taille n = 50 et on obtient une moyenne
de 130 =Cet un écart-type de 28 =C. Donner une estimation de m par un intervalle de confiance au
niveau de confiance 95%.

3 Test d’ajustement
Nous cherchons maintenant à déterminer si des valeurs statistiques suivent une loi de probabilité.

Choix d’un modèle


Soit une distribution statistique d’effectifs ni . On cherche à savoir quelle loi régit cette série.
Exemple 3.1 On cherche à déterminer si un dé à 6 faces est non truqué. Pour cela, on effectue 600
lancers. On obtient les résultats suivants :
face 1 2 3 4 5 6
nombre d’apparitions ni 96 95 109 98 106 96

Le dé est-il truqué ?

Pour cela, on définit un modèle (équirépartition, binomial, Poisson, normal,...) P


dont les probabilités
pour les événements xi sont pi , avec des effectifs théoriques Ni = N × pi où N = i ni . On émet donc
une hypothèse sur la loi régissant cette série.

33 A. Fredet & J.-M. Gourdon - 2008 - 2009


Échantillonnage et estimation 3 TEST D’AJUSTEMENT

Exemple 3.2 Si on reprend l’exemple précédent du dé à 6 faces. En 600 lancers, on devrait avoir les
résultats suivants :
face 1 2 3 4 5 6
nombre d’apparitions théoriques Ni 100 100 100 100 100 100

Comparaison entre la théorie et la pratique


On s’intéresse à l’écart entre la théorie et la pratique : Ni − ni . Un grand écart étant plus important
qu’un petit,on prend le carré de ces écarts :(Ni − ni )2 . Et enfin, obtenir 95 alors qu’on attend 100,
ce n’est pas la même chose qu’obtenir 5 lorsqu’on attend 10. Il faut donc regarder l’écart relatif. On
calcule
X (ni − Ni )2
χ2cal =
i
Ni

Exemple 3.3 Si on reprend l’exemple précédent du dé à 6 faces. En 600 lancers, on devrait avoir les
résultats suivants :
face 1 2 3 4 5 6
nombre d’apparitions ni 96 95 109 98 106 96
nombre d’apparitions théoriques Ni 100 100 100 100 100 100
(Ni −ni )2
Ni 0, 16 0, 25 0, 81 0, 04 0, 36 0, 16

Donc χ2cal = 1, 78.

Seuil de confiance
On remarque que si χ2cal = 0 alors pour chaque classe ni = Ni et donc la variable suivrait exactement
la loi retenue comme modèle.
Plus la valeur numérique obtenue pour le χ2cal sera élevée, plus l’ajustement effectué sera discutable.
Il faut donc se fixer une mesure χ2T à ne pas dépasser. Cette mesure ne peut pas être trop basse, sinon
toutes les hypothèses seraient rejetées (si on reprend l’exemple, même un dé parfait non truqué ne
tombera pas exactement 100 fois sur chaque face).
La valeur limite dépend de la marge d’erreur que l’on accepte. Si l’on se fixe comme valeur limite 0, on
peut raisonnablement penser que 100% des hypothèses exactes seront rejetées. Si l’on se fixe comme
valeur limite 2, on peut penser que 80% des hypoths̀es exactes seront rejetées, et ainsi de suite... Plus
la valeur limite sera grande, plus le pourcentage d’hypothèses exactes et rejetées sera faible (mais plus
le nombre d’hypothèses fausses et acceptées sera grand). Cette valeur limite χ2T dépend donc de la
probabilité que l’on accepte de voir la mesure de χ2cal la dépasser alors que l’hypothèse est exacte.
Cette probabilité s’appelle le seuil de confiance. Il est généralement fixé à 5 %.

Degré de liberté
La valeur limite χ2T dépend également du nombre de classes considérées. Si on reprend l’exemple
du dé, le χ2cal obtenu avec un dé à 12 faces sera surement plus grand que le χ2cal obtenu avec un dé
(Ni −ni )2
à 6 faces. En effet, on ajoutera 12 valeurs positives Ni au lieu de 6... Cela s’appelle le degré de
liberté.
Exemple 3.4 Dans notre cas, le degré de liberté est 5 (on peut choisir 5 valeurs de lancers, la sixième
est déterminée automatiquement car la somme doit faire 600).

34 A. Fredet & J.-M. Gourdon - 2008 - 2009


Échantillonnage et estimation 3 TEST D’AJUSTEMENT

Plus généralement, le degré de liberté est égal à la différence entre :


– le nombre de valeurs que l’on considère
– le nombre de relations qui unissent ces nombres
Soit r le nombre de classes (toutes possédant au moins 5 unités). Le degré de liberté ν est

 1 si la loi est binomiale
ν =r− 2 si la loi est de Poisson
3 si la loi est normale

Décision finale
Cette valeur de χ2cal est donc comparée à un χ2 , dit χ2 théorique (noté χ2T ), fonction du modèle et
du nombre de données, lu dans la table suivante :

/p (seuil de confiance)
0, 90 0, 50 0, 10 0, 05 0, 02 0, 01 0, 001
ν (degré de liberté)
1 0, 016 0, 455 2, 706 3, 841 5, 412 6, 635 10, 827
2 0, 211 1, 386 4, 605 5, 991 7, 824 9, 210 13, 815
3 0, 584 2, 366 6, 251 7, 815 9, 837 11, 345 16, 266
4 1, 064 3, 357 7, 779 9, 488 11, 668 13, 277 18, 467
5 1, 610 4, 351 9, 236 11, 070 13, 388 15, 086 20, 515
6 2, 204 5, 348 10, 645 12, 592 15, 033 16, 812 22, 457
7 2, 833 6, 346 12, 017 14, 067 16, 622 18, 475 24, 322
8 3, 490 7, 344 13, 362 15, 507 18, 168 20, 090 26, 125
9 4, 168 8, 343 14, 684 16, 919 19, 679 21, 666 27, 877

En conséquence, si χ2cal < χ2T on adopte le modèle et sinon on rejette le modèle.

Exemple 3.5 Dans notre cas, avec un degré de liberté de 5 et un seuil de confiance de 5%, le χ2T vaut
11, 07. Notre χ2cal est inférieure à χ2T donc le dé n’est pas truqué.

Exercice 3.1 Un correcteur rend ses 100 copies au secrétariat d’un concours de recrutement de pro-
fesseurs. Par souci d’équité, la consigne est de noter les copies de manière telle que la distribution des
notes soit normale avec une moyenne de 10 et un écart-type de 4. Le secrétariat établit la distribution
suivante :
Intervalles Moins de 4 De 4 à 8 De 8 à 12 De 12 à 16 De 16 à 20
Effectifs 8 25 45 10 12

La moyenne est 9,7 et l’écart-type est 4,3. Au vu de ces résultats le responsable du concours convoque
le correcteur pour qu’il modifie ses notes qui seraient trop nombreuses entre 4 et 8. Le correcteur fait
valoir que la moyenne et l’écart-type sont approximativement ceux demandés et que les variations liées
à la répartition des copies en paquets de 100 expliquent sans doute la légère différence entre son paquet
et la distribution demandée. Le correcteur a-t-il raison de refuser de revoir ses notes ?

Conditions d’utilisation du χ2
Certaines conditions sont nécessaires pour appliquer cette méthode : il faut notamment que chaque
classe ait un effectif d’au moins 5 (sinon les effectifs sont trop petites pour être significatifs). Si ce n’est
pas le cas, on regroupera certaines classes :

35 A. Fredet & J.-M. Gourdon - 2008 - 2009


Échantillonnage et estimation 3 TEST D’AJUSTEMENT

Exemple 3.6 Un vendeur de voiture a noté le nombre de véhicules vendus durant une année (200
jours de travcail)

xi nombre de véhicules 0 1 2 3 4
ni nombre de jours 76 72 34 12 6

On calcule la moyenne : x̄ = 1 et la variance V (X) = 1, 06 qui est proche de 1. On peut donc penser
qu’une loi de Poisson de paramètre 1 peut approcher cette variable. On va utiliser le test du χ2 pour
vérifier cette hypothèse. Dans ce cas,
λ 1
p(X = i) = e−λ = e−1
i! i!

xi 0 1 2 3 4 5 et plus
ni 76 72 34 12 6 0 200
p(X = i) 0, 368 0, 368 0, 184 0, 061 0, 015 0, 004 1
Ni = N × p(X = i) 73, 6 73, 6 36, 8 12, 2 3 0, 8 200
P
La classe 5 et plus est envisagée pour que p(X = i) = 1. On ne veut considérer que des classes
d’effectifs plus grand que 5, il faut donc regrouper les 3 dernières :

xi 0 1 2 3 et plus total
ni 76 72 34 18 200
Ni = N × p(X = i) 73, 6 73, 6 36, 8 16 200
2
On a χ2 = i=1 (ni −N
P4 i)
Ni ≈ 0, 576. Dans la table, avec un degré de liberté de 2 et un seuil de 0,05, on
lit que χT = 5, 991. On a donc χ2cal < χ2T et donc on accepte le modèle.
2

Exemple 3.7 Une entreprise d’exploitation minière utilise une grande quantité de moteur qu’elle sou-
met à des conditions de travail difficile. Pour un type de moteur et un mode d’utilisation déterminés,
la durée de vie d’un moteur peut être considérée comme une variable aléatoire. Pour déterminer la loi
de probabilité, on dispose d’un échantillon de 50 durée de vie de moteurs :

durée de vie
nombres d’observations
(en semestres)
0 à 8 0
8 à 9 2
9 à 10 5
10 à 10, 5 7
10, 5 à 11 11
11 à 11, 5 11
11, 5 à 12 6
12 à 13 7
13 à 14 1
50

36 A. Fredet & J.-M. Gourdon - 2008 - 2009


Échantillonnage et estimation 4 COMPARAISON D’ÉCHANTILLONS

On considère donc le tableau suivant :


durée (ni −Ni )2
effectifs réels ni effectifs théoriques Ni Ni
(en semestres)
  
8 à 9 2 1, 3
8 à 10 7 8, 45 0, 2488
9 à 10 5 7, 15
10 à 10, 5 7 7, 405 0, 0221
10, 5 à 11 11 9, 14 0, 3785
11 à 11, 5 11 9, 12 0, 3875
11, 5 
à 12 6 7, 355
 0, 2496
12 à 13 7 7, 055
12 à 14 9 8, 325 0, 0127
13 à 14 1 1, 27
2
χcal = 1, 2992

Il y a 6 classes, et on va chercher à savoir si cette variable suit une loi normale donc le degré de liberté
ν = 6 − 3 = 3. Si on s’intéresse à une probabilité de 5%, on lit que χ2T = 7, 815, nombre limite cherché.
On a χ2cal < χ2T donc on adopte ce modèle.

Exercice 3.2 On considère le nombre de pièces défectueuses sur un lot de 100 pièces. En définissant
X comme étant le nombre de pièces défectueuses par lot de 100 pièces, on obtient le tableau suivant :

X 0 1 2 3 4 5 6 7 8 9
ni 2 7 14 21 19 17 11 5 4 0 100 lots

Vérifier si cette production obéit à une loi binomiale B(100; 0, 04) ? à une loi B(100; 0, 03) ? à une loi
B(100; 0, 0392) ? une loi de Poisson de paramètre 4 ?

Exercice 3.3 On veut vérifier une machine ambaleuse de sacs de ciment ayant au moins un poids de
50kgs. On pèse 500 sacs et on obtient

poids nombre de sacs


< 45 35
45 − 47 53
47 − 49 76
49 − 51 100
51 − 53 88
53 − 55 78
55 − 57 42
> 57 28
500

Vérifier que l’emballage des sacs suit une loi normale dont on précisera la moyenne et l’écart-type (on
prendra 44 comme poids moyen des sacs de moins de 45 kg et 58 comme poids moyen des sacs de plus
de 57 kilos).

4 Comparaison d’échantillons
Supposons que l’on souhaite comparer un échantillon A à un échantillon B afin de savoir s’ils suivent
la même loi. Le problème dans ce cas, c’est que l’on manque de référence : il ne serait pas logique de
prendre l’échantillon A comme référence, pas plus qu’il ne serait logique de prendre l’échantillon B.
Il faut donc adopter une estimation, la meilleure possible des proportions qui nous intéressent. Si l’on

37 A. Fredet & J.-M. Gourdon - 2008 - 2009


Échantillonnage et estimation 4 COMPARAISON D’ÉCHANTILLONS

suppose que les deux échantillons proviennent de la même population et suivent la même loi, il parait
judicieux d’utiliser toutes les informations dont nous disposons et de réunir ces populations. Cela nous
fournira une référence. On construit ainsi l’hypothèse nulle qui, dans ce cas, ne dépend ni d’une loi
de probabilité, ni d’une distribution de référence, les proportions des différentes cat’egories étant donc
conservées d’une ligne à l’autre. On calculera ainsi les effectifs théoriques correspondant aux critères
pour les populations A et B, et l’on pourra alors utiliser le test du χ2 .

Exemple 4.1

A B total
25 35 60
95 65 160
total 120 100 220

On calcule le tableau des effectifs théoriques :

A B total
60
220× 120 = 32, 7 60 − 32, 7 = 27, 3 60
120 − 32, 7 = 87, 3 100 − 27, 3 = 72, 7 160
total 120 100 220

On a donc
(25 − 32, 7)2 (35 − 27, 3)2 (95 − 87, 3)2 (65 − 72, 7)2
χ2cal = + + + = 5, 48
32, 7 27, 3 87, 3 72, 7
On a calculé une seule fréquence de référence, il n’y a donc qu’un seul degré de liberté. La valeur du
χ2cal est de 5,48. Dans la table, avec un seuil e confiance de 5 %, le χ2T vaut 3,841 et avec un seuil
de confiance de 1 % le χ2T vaut 6,635. Les deux groupes se ressemblent donc significativement si on
considère un seuil de confiance de 5 % mais pas si on considère un seuil de confiance de 1 %.

Exercice 4.1 On a étudié sur deux échantillons la répartition des quatre groupes sanguins : O, A, B,
AB. Les résultats obtenus sont reportés dans un tableau suivant, à deux lignes et quatre colonnes :

Groupe O A B AB Total
1 er échantillon 121 120 79 33 353
2 ème échantillon 118 95 121 30 364
Total 239 215 200 63 717

Ces deux échantillons proviennent-ils de la même population ?

Exercice 4.2 Pour l’élection présidentielle, deux candidats sont en présence, S. R. et N. S. (pour ne
pas les nommer). Dans un village du Nord de la France, il y a 500 électeurs, dont 100 sont retraités,
50 sont chômeurs, et 350 sont actifs. Les résultats des élections sont (après décompte manuel) :

S.R. N.S. Blancs


Rentiers 35 10 5
Actif s 90 210 50
Retraités 70 23 7

Dans ce village, l’opinion dépend-elle de l’appartenance à un groupe social ?

38 A. Fredet & J.-M. Gourdon - 2008 - 2009


Échantillonnage et estimation 4 COMPARAISON D’ÉCHANTILLONS

Exercice 4.3 Une étude a été menée sur les facteurs pouvant influer sur le port de la ceinture de
sécurité par les conducteurs et les passagers de voitures de tourisme et de véhicules utilitaires. On
s’intéresse tout d’abord à l’effet du type d’occupation du véhicule (conducteur seul, conducteur +
passagers avant, conducteur + passagers arrière, conducteur + passagers avant et arrière) sur le port
de la ceinture par le conducteur. On dispose de 8374 observations concernant cette partie de l’étude.
Les données sont les suivantes :
Port ceinture non port de ceinture
Seul 2825 3468
Cond. + pass. avant 729 815
Cond. + pass. arrière 80 113
Cond. + pass. av. et arr. 168 176

Y-a-t-il un lien entre les deux variables Type d’occupation et Port de la ceinture ?

39 A. Fredet & J.-M. Gourdon - 2008 - 2009


Échantillonnage et estimation 5 SOLUTIONS DES EXERCICES

5 Solutions des exercices


Solution 1.1 1. X suit une loi normale N (12, 8; √2,1
49
) = N (12, 8; 0, 3).
2. On cherche tα tel que P (X ≤ tα )) = 1+0,95 2 = 0, 975. On trouve tα = 1, 96. L’intervalle est donc
[12, 8 − 1, 96 × 2, 1; 12, 8 + 1, 96 × 2, 1] = [8, 684; 16, 916].
2,1 2,1 2
3. On cherche n tel que 1, 96 × √
n
≤ 0, 2. Il faut que n ≥ (1, 96 × 0,2 ) donc que n ≥ 424.
q
490 0,49×0,51)
Solution 2.1 On a pe = 1000 et tα = 1, 96. On considère l’intervalle [0, 49 − 1, 96 × 1000 , 0, 49 +
q
0,49×0,51)
1, 96 × 1000 ] = [0, 46; 0, 52]

1 1 1
Solution 2.2 L’amplitude de l’intervalle est tα × √
2 n
= 2, 58 × √
2 n
. On veut 2, 58 × √
2 n
≤ 0, 04, ce
2,58 2
qui implique que n ≥ ( 2×0,02 c’est à dire n ≥ 4161. Il faudrait donc interroger 4160 personnes.
) ,
q q
p ∈ [0, 53 − 2, 58 × 0,53×0,47
1000 ; 0, 53 + 2, 58 × 0,53×0,47
1000 ] = [0, 49; 0, 57]

Solution 2.3 m ∈ [130 − 1, 96 × √ 28 ; 130 + 1, 96 × √ 28 ] = [122, 16; 137, 84]


50−1 50−1

Solution 3.1 On calcule les effectifs de la distribution theorique obtenue en appliquant la loi normale
de moyenne donnee m et d’écart-type σ (dans l’exemple m = 10 et σ = 4). Par exemple, pour trouver
l’effectif de la classe De 8 à 12, on calcule la probabilité qu’une note soit comprise entre 8 et 12 :

P (8 ≤ X ≤ 12) = P (X ≤ 12) − P (X ≤ 8)
12 − 10 8 − 10
= P (T ≤ ) − P (T ≤ ) = P (T ≤ 0, 5) − P (T ≤ −0, 5)
4 4
= P (T ≤ 0, 5) − (1 − P (T ≤ 0, 5))
= 0, 6915 − (1 − 0, 6915) = 0, 383

Il y a 100 copies, donc il devrait y avoir 100× = 38, 3. En procédant ainsi, on complète donc le tableau
suivant :
Intervalles Moins de 4 De 4 à 8 De 8 à 12 De 12 à 16 De 16 à 20
Effectifs théoriquesNi 7, 3 24, 17 38, 29 24, 17 6, 06
Effectifs réels ni 8 25 45 10 12
(Ni −ni )2
Ni 0, 07 0, 03 1, 17 8, 31 5, 82 15, 4

Le degré de liberté est ν = 5 − 3 = 2 donc χ2T = 5, 991. On a χ2calc > χ2T donc on rejette le modèle et on
considère que les notes ne suivent pas une loi normale de moyenne 10 et d’écart-type 4. Le professeur
devrait revoir ses notes.
À titre anecdotique, on peut remarquer que l’écart entre la théorie et la pratique est plus grand sur
l’intervalle entre 16 et 20 que sur l’intervalle moins de 4.

40 A. Fredet & J.-M. Gourdon - 2008 - 2009


Échantillonnage et estimation 5 SOLUTIONS DES EXERCICES

Solution 3.2
X ni B(100; 0, 04)
(ni −Ni )2
Ni = 100Cx100 px (1− p)100−x Ni
  
0 2 1, 69
0 à 1 9 8, 72 0, 01
1 7 7, 03
2 14 14, 5 0, 02
3 21 19, 73 0, 08
4 19 19, 94 0, 04
5 17 15, 95 0, 07
6 11 10,52 0, 02
7  5  5, 89 
8 7 à 9 4 9 2, 85 10, 64 0, 25
9 0 1, 90
  
100 lots 100 χ2cal = 0, 49

Le tableau comporte maintenant 7 lignes, et on teste une loi binomiale donc ν = 7 − 1 = 6 donc
χ2T = 12, 592. On a χ2calc < χ2T donc ce modèle est bon.

X ni B(100; 0, 03)
(ni −Ni )2
Ni = 100Cx100 px (1
− p)100−x Ni
  
0 2 4, 76
0 à 1 9 19, 46 5, 62
1 7 14, 7
2 14 22, 52 3, 22
3 21 22, 75 0, 13
4 19 17, 06 0, 22
5 17 10, 13 4, 66
6 11 4, 96
 7, 35
7  5  2, 06 
8 7 à 9 4 9 0, 74 3, 12 11, 08
9 0 0, 32
  
100 lots 100 χ2cal = 32, 28

On a χ2cal > χ2T = 12, 592 donc on rejette le modèle.

X ni B(100; 0, 0392)
(ni −Ni )2
Ni = 100Cx100 px (1 − p)100−x Ni
  
0 2 1, 83
0 à 1 9 9, 31 0, 01
1 7 7, 48
3 21 20, 14 0, 04
4 19 19, 92 0, 04
5 17 15, 6 0, 12
6 11 10,08 0, 08
7  5  5, 52 
8 7 à 9 4 9 2, 62 9, 84 0, 07
9 0 1, 7
  
100 lots 100 χ2cal = 0, 36

41 A. Fredet & J.-M. Gourdon - 2008 - 2009


Échantillonnage et estimation 5 SOLUTIONS DES EXERCICES

Ce modèle est très bon.


X ni P (4)
x (ni −Ni )2
Ni = 100 × e−4 4x! Ni
  
0 2 1, 83
0 à 1 9 9, 16 0
1 7 7, 33
2 14 14, 65 0, 03
3 21 19, 54 0, 11
4 19 19, 54 0, 01
5 17 15, 63 0, 12
6 11 10,42 0, 03
7  5  5, 95 
8 7 à 9 4 9 2, 98 11, 06 0, 39
9 0 2, 13
  
100 lots 100 χ2cal = 0, 69
Le tableau comporte maintenant 7 lignes, et on teste une loi de Poisson donc ν = 7 − 2 = 5 donc
χ2T = 11, 07. Là encore, le modèle est bon.
Solution 3.3
ni (xi −m)2
poids ni = nombre de sacs xi = centre de classe ni xi 500
< 45 35 44 1540 3, 2178
45 − 47 53 46 2438 2, 4219
47 − 49 76 48 3648 1, 1247
49 − 51 100 50 5000 0, 1217
51 − 53 88 52 4576 0, 262
53 − 55 78 54 4212 1, 6175
55 − 57 42 56 2352 2, 2889
> 57 28 58 1624 2, 9191
total 500 25390 13, 9736

la moyenne est de 25390
500 = 50, 78 kilos et l’écart-type est 13, 9736 ≈ 3, 74. On peut donc penser que
les poids suivent une loi normale N (50, 78; 3, 74).
xi −m
poids nombre de sacs σ Π(t1 ) Π(t2 ) Ni = 500(Π(t2 ) − Π(t1 ))
(t1 < ∗ < t2 )
< 45 35 < −1, 54 0 0, 06178 30, 89
45 < ∗ < 47 53 −1, 54 < ∗ < −1, 01 0, 06178 0, 15625 47, 235
47 < ∗ < 49 76 −1, 01 < ∗ − 0, 48 0, 15625 0, 31561 79, 68
49 < ∗ < 51 100 −0, 48 < ∗ < 0, 06 0, 31561 0, 52392 104, 155
51 < ∗ < 53 88 0, 06 < ∗ < 0, 6 0, 52392 0, 72575 100, 915
53 < ∗ < 55 78 0, 6 < ∗ < 1, 13 0, 72575 0, 87076 72, 505
55 < ∗ < 57 42 1, 13 < ∗ < 1, 66 0, 87076 0, 95154 40, 39
> 57 28 > 1, 66 0, 95154 1 24, 23
500 500
donc
(35 − 30, 89)2 (53 − 47, 235)2 (76 − 79, 68)2 (100 − 104, 155)2
χ2cal = + + +
30, 89 47, 235 79, 68 104, 55
2 2 2
(88 − 100, 915) (78 − 72, 505) (42 − 40, 39) (28 − 24, 23)2
+ + + +
100, 915 72, 505 40, 39 24, 23
≈ 4, 306

42 A. Fredet & J.-M. Gourdon - 2008 - 2009


Échantillonnage et estimation 5 SOLUTIONS DES EXERCICES

On regarde le tableau du χ2T avec ν = 8 − 3 = 5. On a χT = 11, 07 et donc χ2cal < χ2T et on accepte le
modèle.
Solution 4.1 On utilise le tableau des effectifs théoriques suivants :
Groupe O A B AB Total
population globale 239 215 200 63
717 717 717 717
1 er échantillon 353 × 239 ≈ 117, 7 353 × 215 ≈ 105, 9 353 × 63 ≈ 98, 5 353 − (117, 7 + 105, 9 + 98, 5) = 31, 1 353
717 717 717
2 ème échantillon 239 − 117, 7 ≈ 121, 3 215 − 105, 9 ≈ 109, 1 200 − 98, 5 ≈ 101, 5 364 − (121, 3 + 109, 1 + 101, 5) = 32, 1 364
Total 239 215 200 63 717

on peut alors calculer

(121 − 117, 7)2 (120 − 105, 9)2 (79 − 98, 5)2 (33 − 31, 1)2
χ2cal = + + +
117, 7 105, 9 98, 5 31, 1
118 − 121, 3)2 (95 − 109, 1)2 (121 − 101, 5)2 (30 − 32, 1)2
+ + + +
121, 3 109, 1 101, 5 32, 1
≈ 11, 74

On a calculé trois fréquences théoriques, le degré de liberté est donc 3. Avec un seuil de confiance de 5
%, le χ2T est de 7,815 donc χ2cal > χ2T et on rejette l’hypothèse. Cela signifie que les deux échantillons
ne proviennent pas de la même population.

Solution 4.2 On complète le tableau précédent :

S.R. N.S. Blancs


Rentiers 35 10 5 50
Actif s 90 210 50 350
Retraités 70 23 7 100
195 243 62 500

On en déduit la répartition théorique dans le cas où les votes sont indépendants :

S.R. N.S. Blancs


195×50 243×50
Rentiers 500 = 19, 5 500 = 24, 3 50 − (19, 5 + 24, 3) = 6, 2
195×350 243×350
Actif s 500 = 136, 5 500 = 170, 1 350 − (136, 5 + 170, 1) = 43, 4
195×100 243×100
Retraités 500 = 39 500 = 48, 6 100 − (39 + 48, 6) = 12, 4

On a donc
(19, 5 − 35)2 (24, 3 − 10)2 (12, 4 − 7)2
χ2calc = + + ··· + = 87, 649
19, 5 24, 3 12, 4

On a (3 − 1) × (3 − 1) = 4 degrés de liberté. Pour un test au niveau 5%, on lit par conséquent dans
la table une borne de rejet égale à χ2T = 9, 488. La valeur observée étant supérieure à χ2T , on rejette
l’hypothèse donc on conclut que le groupe social influe sur l’opinion.

Solution 4.3 On complète le tableau précédent :

Port ceinture non port de ceinture


Seul 2825 3468 6293
Cond. + pass. avant 729 815 1544
Cond. + pass. arrière 80 113 193
Cond. + pass. av. et arr. 168 176 344
3802 4572 8374

43 A. Fredet & J.-M. Gourdon - 2008 - 2009


Échantillonnage et estimation 5 SOLUTIONS DES EXERCICES

On en déduit la répartition théorique dans le cas où il n’y aurait pas de lien :

Port ceinture non port de ceinture


Seul 2 6293×3802
8374 ≈ 2857, 18 6293 − 2857, 18 ≈ 3435, 82 6293
1544×3802
Cond. + pass. avant 8374 ≈ 701, 01 1544 − 701, 01 ≈ 842, 99 1544
193×3802
Cond. + pass. arrière 8374 ≈ 87, 63 193 − 87, 63 ≈ 105, 37 193
Cond. + pass. av. et arr. 3802 − (2857, 18 + 701, 01 + 87, 63) ≈ 156, 18 344 − 156, 18 ≈ 187, 82 344
3802 4572 8374

On a donc
(2857, 18 − 2825)2 (3435, 82 − 3468)2 (187, 82 − 176)2
χ2calc = + + ··· + ≈ 5, 56
2857, 18 3435, 82 187, 82

On a (4 − 1) × (2 − 1) = 3 degrés de liberté. Pour un test au niveau 5%, on lit par conséquent dans
la table une borne de rejet égale à χ2T = 7, 815. La valeur observée étant supérieure à χ2T , on accepte
l’hypothèse donc on conclut que le type de remplissage de la voiture n’influe pas sur le port de la
ceinture.

44 A. Fredet & J.-M. Gourdon - 2008 - 2009


Échantillonnage et estimation

Troisième partie
Tableur
Un tableur peut être d’une grande aide dans le calcul de statistiques et de probabilités, notamment
avec les fonctions suivantes :

Statistiques à une variable


MODE() MEDIANE() MOYENNE()
VARIANCE()
MAX() QUARTILE() MOYENNE.GEOMETRIQUE()
ECARTYPE()
MIN() CENTILE() MOYENNE.HARMONIQUE()

Graphiques
Graphiques
Courbe de tendance

Régression linéaire
DROITEREG
COEFFICIENT.CORRELATION
INDEX(DROITEREG())
ORDONNEE.ORIGINE

Combinatoire
COMBIN()
PERMUTATION()

Probabilités
LOI.BINOMIALE() LOI.POISSON() LOI.NORMALE()

Intervalle de confiance
INTERVALLE.CONFIANCE()

Test d’ajustement
TEST.KHIDEUX() LOI.KHIDEUX() KHIDEUX.INVERSE()

45 A. Fredet & J.-M. Gourdon - 2008 - 2009

Vous aimerez peut-être aussi