Probabilite Echantillonage

Probabilités - Échantillonnage
A. Fredet
J.-M. Gourdon
Table des matières

I Probabilités 2
1 Définitions 2
2 Combinaisons, Arrangements 3
3 Probabilités liant deux événements 6
4 Probabilités et statistiques 8
5 Variable aléatoire 9
6 Lois binomiales 13
7 Lois de Poisson 14
8 Lois normales 15
9 Solutions des exercices 20
II Échantillonnage 30
1 Échantillons 30
2 Estimation 30
3 Test d’ajustement 33
4 Comparaison d’échantillons 37
5 Solutions des exercices 40
III Tableur 45
1
Probabilités 1 DÉFINITIONS
Première partie
Probabilités
1 Définitions
La probabilité a priori, subjective, d’un évènement est un nombre qui caractérise la croyance que
l’on a que cet évènement sera réalisé avec plus ou moins de certitude avant l’exécution de l’expérience :
l’évènement sera réalisé (probabilité 1) et l’évènement ne sera pas réalisé (probabilité 0).
Définition 1.1 Une épreuve est dite aléatoire si répétée dans des conditions identiques, elle donne
des résultats variables.
Des évènements sont équiprobables s’ils ont la même probabilité d’être réalisés. Dans ce cas, la proba-
nombre de cas favorables
bilité d’un événement A est .
nombre de cas possibles
Définition 1.2 L’ensemble de toutes les éventualités d’une expérience aléatoire s’appelle l’univers. En
général, on le note Ω.
Exemple 1.1 On lance un dé non truqué à six faces numérotées de 1 à 6 et on note le nombre figurant
sur la face supérieure du dé. Lancer ce dé et noter le nombre figurant sur une des faces est une expérience
dont on ne peut pas prévoir le résultat compris dans l’ensemble {1, 2, · · · , 6}. Les éventualités sont 1,
2, 3, 4, 5 et 6 et Ω = {1, 2, 3, 4, 5, 6}.
Si le dé est non truqué, chaque face a la même probabilité de sortir, nous avons donc des évenements
équiprobables.
Par exemple, on peut considérer l’événement A = obtenir un nombre pair . On a A = {2; 4; 6} et la
probabilité que A se produise est 36 = 12 .
Définition 1.3 Un événement est dit impossible s’il ne se réalise jamais.
Un événement est dit certain s’il se réalise toujours.
Un événement est dit élémentaire s’il se réduit à une seule éventualité.
Proposition 1.1 Soient E, E1 , E2 des événements.
1. p(E) ≥ 0 pour tout événement E.
2. p(Ω) = 1 donc l’événement est certain
3. p(∅) = 0 donc l’événement est impossible
p(E1 ∪ E2 ) = p(E1 ou E2 ) = p(E1 ) + p(E2 ),
4. Si E1 ∩ E2 = ∅ alors E1 et E2 sont incompatibles et
p(E1 ∩ E2 ) = p(E1 et E2 ) = 0
On en déduit les conséquences suivantes :
1. Si Ē est l’événement contraire de E alors p(Ē) = 1 − p(E).
En effet Ē ∪ E = Ω et Ē ∩ E = ∅ donc p(Ē ∪ E) = p(Ē) + p(E) = 1.
2. Pour tout événement E, 0 ≤ p(E) ≤ 1.
En effet, pour tout E, p(E) ≥ 0 et donc p(Ē) = 1 − p(E) ≥ 0 ce qui nous amène à p(E) ≤ 1.
Exercice 1.1 On joue avec un dé à six faces non truqué. On effectue un lancer, et on considère les
deux événements suivants : E1 =le nombre est 3 ou 4 et E2 =le nombre est pair. Calculer p(E1 ), p(E2 ),
p(E1 ∩ E2 ) et p(E1 ∪ E2 ).
Exercice 1.2 On joue avec deux dés à six faces non truqués. On lance les deux dés et on effectue
la somme des nombres obtenus. On considère les événements suivants : E1 =la somme est 5, E2 =la
somme est 7 et E3 =la somme est paire. Calculer p(E1 ), p(E2 ), p(E3 ), p(E1 ∩E2 ), p(E1 ∩E3 ), p(E2 ∩E3 )
et p(E1 ∪ E2 ), p(E1 ∪ E3 ) et p(E2 ∪ E3 ).
2 A. Fredet & J.-M. Gourdon

Probabilités 2 COMBINAISONS, ARRANGEMENTS
La probabilité de réalisation d’un événement peut être considérée comme le rapport du nombre de cas
favorables sur le nombre de cas possibles. Le calcul d’une probabilité peut donc souvent se ramener à
un problème de dénombrement.
2 Combinaisons, Arrangements
Définition 2.1 Soit E un ensemble non vide de n éléments. Une permutation de E est une liste
ordonnée des n éléments de E.
Exemple 2.1 Si E = {a, b, c, d, e} alors (a, b, d, c) et (a, c, d, b) sont deux permutations de E.
Proposition 2.1 Le nombre de permutations d’un ensemble de n éléments, n ≥ 1, est égal à
n! = n × (n − 1) × (n − 1) × · · · × 2 × 1
Définition 2.2 Une liste sans répétition de p éléments de E est une liste ordonnée de p éléments de
E deux à deux distincts
Exercice 2.1 Une urne contient dix boules sur lesquelles ont été marquées les dix lettres de l’alphabet
de A à J. On tire successivement quatre boules sans remise et l’on inscrit dans l’ordre les lettres portées
par les boules tirées. Combien de mots de quatre lettres (ayant un sens ou non) peut-on former ?
Exercice 2.2 Combien de mots de trois lettres peut-on former en utilisant les lettres du mot PARIS
et uniquement celles-là ?
Proposition 2.2 Si un ensemble E contient n éléments, n ≥ 1, alors

n!
– il y a n × (n − 1) × · · · × (n − (p − 1)) = (n−p)! listes sans répétition de p éléments.
p
– il y a n liste avec répétition de p éléments.
Exercice 2.3 Lors d’une course de chevaux, il y a 8 partants. Combien de possibilités y-a-t-il pour le
tiercé final ? Pour le quarté ?
Exercice 2.4 Combien de nombres de 4 chiffres puis-je écrire en utilisant uniquement les chiffres
3,6,7 ?
Exercice 2.5 Un facteur (employé de la poste) entre dans un immeuble avec 23 lettres qu’il va déposer
dans les boites, au nombre de 40. Sachant qu’une boite peut évidemment recevoir plusieurs lettres, de
combien de façon différentes les 23 lettres peuvent-elles être déposées dans les 40 boites ?
Nous pouvons également chercher à sélectionner k objets parmi n objets discernables, sans tenir compte
de l’ordre. Ces k objets peuvent être représentés par une partie à k éléments d’un ensemble à n éléments.
Définition 2.3 Soit E un ensemble de n éléments et p un entier tel que 0 ≤ p ≤ n. Une combinaison
de p éléments de E est un sous-ensemble de E qui contient p éléments.
n
Le nombre de combinaisons de p éléments d’un ensemble de n éléments est noté ou Cnp .
p
Proposition 2.3
n! n × (n − 1) × · · · × (n − p + 1)
Cnp = =
(n − p)!p! p!

Exercice 2.6 Un facteur (employé de la poste) entre dans un immeuble avec 23 lettres qu’il va déposer
dans les boites, au nombre de 40. En supposant qu’une boite ne peut pas recevoir plusieurs lettres, de
combien de façon différentes les 23 lettres peuvent-elles être déposées dans les 40 boites ?
Exercice 2.7 On appelle main toute combinaison de cinq cartes. Combien y a-t-il de mains de cinq
cartes dans un jeu de 32 cartes ?
Exercice 2.8 On appelle main toute combinaison de cinq cartes. Dans un jeu de 32 cartes, combien
y a-t-il de mains de cinq cartes contenant exactement 2 coeurs ?
Exercice 2.9 On appelle main toute combinaison de cinq cartes. Dans un jeu de 32 cartes, combien
y a-t-il de mains de cinq cartes contenant au moins un roi ?
Exercice 2.10 Lors d’un tirage du loto de 4 numéros avec 10 boules, combien y-a-t-il de grilles pos-
sibles ?
Proposition 2.4 On a et p−1 p

Cnp = Cnn−p Cn−1 + Cn−1 = Cnp
Démo :
1. Choisir les p éléments que l’on veut dans un ensemble de n éléments revient exactement à choisir
les n − p éléments que l’on ne veut pas, d’où le résultat.
Mathématiquement, on a
n! n!
Cnn−p = = = Cnp
(n − p)![n − (n − p)]! (n − p)!p!
2. Soit E une ensemble de n élément. Soit A l’un de ces éléments. Pour choisir p éléments de E, je
p−1
peux soit prendre A et en choisir p−1 autres parmi les n−1 restants (j’ai alors Cn−1 possibilités),
p
soit laisser A et en prendre p autres parmi les n − 1 restants (j’ai alors Cn−1 possibilités). D’où
le résultat.
Mathématiquement, on a
p−1 p (n − 1)! (n − 1)!

Cn−1 + Cn−1 = +
(p − 1)!(n − p)! p!(n − p − 1)!
p(n − 1)! (n − p)(n − 1)! (p + n − p)(n − 1)!
= + =
p!(n − p)! p!(n − p)! p!(n − p)!
n!
= = Cnp
p!(n − p)!
Proposition 2.5 (Formule du binôme) Soient a et b deux réels et n un entier. Alors

n
X
(a + b)n = Cni ai bn−i
i=0
Démo :
Par itération sur n :
– Si n = 0, alors (a + b)n = (a + b)0 = 1 = Cn0
– Si n = 1 alors (a + b)1 = a + b = C10 a1 b0 + C11 a0 b1
– Si n = 2 alors (a + b)2 = a2 + 2ab + b2 = C20 a2 b0 + C21 a1 b1 + C22 a0 b2

– Si n = 3 alors
(a + b)3 = a3 + 3ab2 + 3a2 b + b3
= C30 a3 + C31 a2 b1 + C32 a1 b2 + C33 b3
– On suppose maintenant que la formule est vraie pour (a + b)n−1 et donc que (a + b)n−1 =
Pn−1 p i (n−1)−i
i=0 Cn−1 a b . On a
(a + b)n = (a + b)n−1 × (a + b)
n−1
!
X
i
= Cn−1 ai b(n−1)−i × (a + b)
i=0
n−1
X n−1
X
i
= Cn−1 ai+1 b(n−1)−i + i
Cn−1 ai b(n−1)−i+1
i=0 i=0
n−1
X n−1
X
i
= Cn−1 ai+1 bn−(1+i) + i
Cn−1 ai bn−i
i=0 i=0
n
X n−1
X
j−1 j n−j i
= Cn−1 a b + Cn−1 ai bn−i
j=1 i=0
n−1
X n−1
X
j−1 j n−j
= Cn−1 a b +Cn−1 n 0
n−1 a b +
i
Cn−1 ai bn−i + C0n−1 a0 bn
j=1 i=1
n−1
X
i−1 i
j n−j
= Cn−1 + Cn−1 a b + an + bn
i=1
n−1
X n
X
= Cni ai bn−i + an + bn = Cni ai bn−i
i=1 i=0
d’où le résultat 2
Triangle de Pascal
Pour calculer les coefficients du binôme, on utilise le triangle de Pascal : Le principe est le suivant :
→
∗ + ∗
=↓
∗
n=0 1
+
n=1 1 → 1 (a + b) = a + b
↓=
+
n=2 1 2 → 1 (a + b)2 = a2 + 2ab + b2
↓=
+
n=3 1 → 3 3 1 (a + b)3 = a3 + 3a2 b + 3ab2 + b3
↓=
+ +
n=4 1 4 → 6 4 → 1 (a + b)4 = a4 + 4a3 b + 6a2 b2 + 4ab3 + b4
↓= ↓=
n=5 1 5 10 10 5 1 (a + b)5 = a5 + 5a4 b + 10a3 b2 + 10a2 b3 + 5ab4 + b5
..
.

Probabilités 3 PROBABILITÉS LIANT DEUX ÉVÉNEMENTS
3 Probabilités liant deux événements

On s’intéresse parfois à une probabilité portant sur deux événements, qu’ils soient indépendants ou
non.
Définition 3.1 Soient A et B deux événements.
La probabilité que A ET B soient réalisés est p(A ∩ B).
La probabilité que A OU B soient réalisés est p(A ∪ B).
Proposition 3.1 Soient A et B deux événements. On a p(A ∪ B) = p(A) + p(B) − p(A ∩ B).
Démo :
1. Si A∪B = ∅ alors A et B sont incompatibles donc p(A∪B) = p(A)+p(B) et p(A∩B) = p(∅) = 0
2. Si A ∩ B 6= ∅ alors A ∪ B = (A ∩ B) ∪ (Ā ∩ B) ∪ (A ∪ B̄) d’après le tableau suivant :
A Ā
B A∩B Ā ∩ B
B̄ A ∩ B̄ Ā ∩ B̄
Donc p(A ∪ B) = p(A ∩ B) + p(Ā ∩ B) + p(A ∪ B̄) car (A ∩ B) ∩ (Ā ∩ B) ∩ (A ∪ B̄) = ∅. Or

p(A) = p(A ∩ B) + p(A ∪ B̄) car (A ∩ B) ∩ (A ∪ B̄) = ∅ et (A ∩ B) ∪ (A ∪ B̄) = A. De même
p(B) = p(A ∩ B) + p(Ā ∪ B) d’où p(A ∪ B) = p(A) + p(B) − p(A ∩ B).
Exercice 3.1 Dans un jeu de 32 cartes, on tire une carte. Quelle est la probabilité d’avoir soit un roi,
soit un trèfle ?
Exercice 3.2 Considérons un jeu de 32 cartes. Soit A l’événement tirer deux coeurs et B l’événement
tirer deux figures. Quelles sont les probabilités de A, B, A ∪ B et A ∩ B ?
Exercice 3.3 Deux candidats A et B passent, dans deux centres différents, un examen avec des pro-
babilités de réussites estimées respectivement à 43 et 23 . Calculer la probabilité
1. que les 2 candidats soient reçus ?
4. qu’un seul des deux candidats réussise ?
2. que les 2 candidats échouent ?
5. qu’au moins 1 des candidats soit reçu ?
3. que le candidat A soit seul reçu ?
Exercice 3.4 On dispose de deux urnes, désignées respectivement par les lettres A et B. L’urne A
contient 5 boules bleues et 4 boules rouges. L’urne B contient 6 boules bleues et 5 boules rouges. On
tire une boule dans chaque urne. Quelle est la probabilité
1. de tirer deux boules rouges ? 3. de tirer deux boules de même couleur ?
2. de tirer deux boules bleues ? 4. de tirer deux boules de couleurs différentes ?
Exercice 3.5 On considère 3 dés différents, identifiés par leur couleur. Le joueur A gagne la partie si
le total des points est 11, le joueur B gagne si le total des points est 12. L’un des joueurs a-t-il plus de
chance de gagner ?

Probabilités 3 PROBABILITÉS LIANT DEUX ÉVÉNEMENTS
Exercice 3.6 Un concours de tir met aux prises deux équipes de deux joueurs. Chaque joueur de
l’équipe peut marquer 0,1 ou 2 points avec les probabilités suivantes :
équipe jaune équipe verte

0 1 2 0 1 2
joueur A 0, 4 0, 4 0, 2 joueur C 0, 3 0, 5 0, 2
joueur B 0, 3 0, 4 0, 3 joueur D 0, 5 0, 3 0, 2
Les résultats des différents joueurs et des différentes équipes sont indépendants entre eux. Soit X la
variable aléatoire égale au nombre de points marqués par l’équipe jaune et Y la variable aléatoire égale
au nombre de points marqués par l’équipe verte.
1. Déterminer les distributions de probabilité de chacune des variables aléatoires X et Y .
2. Calculer la probabilité de l’événement “il y a match nul”.
Définition 3.2 Soient A et B sont deux événements associés à un univers tels que p(A) 6= 0 ; La
probabilité de l’événement B sachant que A est réalisé est :
p(A ∩ B)
pA (B) = p(B/A) =
p(A)
Proposition 3.2 On a
p(A ∪ B) = p(A) × p(B/A) = p(B) × p(A/B).
Définition 3.3 Deux événements sont indépendants si p(A/B) = p(A) ou p(B/A) = p(B), soit encore
si p(A ∪ B) = p(A)p(B).
Deux événements sont incompatibles si A∩B = ∅ et dans ce cas, p(A∩B) = 0 d’où pA (B) = pB (A) = 0
Proposition 3.3 Si A est inclus dans B alors p(A ∩ B) = p(A) et pB (A) = 1.
Exercice 3.7 Une urne contient 15 boules numérotées de 1 à 15. On tire une boule au hasard. On sait
que le numéro tiré est impair. Quelle est la probabilité que ce numéro soit aussi multiple de 3 ?
Exercice 3.8 À la fin de leur montage, on soumet des ampoules électriques à des tests de conformité
qui ne sont pas fiables à 100%. Si une ampoule est conforme, on le dit dans 96 % des cas (et donc dans
4 % des cas, une ampoule bonne est jetée). Si une ampoule est défectueuse, le test le détecte dans 94%
des cas (et donc dans 6% des cas, on garde l’ampoule). On remarque que en moyenne 8% des ampoules
sont défectueuses. On cherche à estimer la fiabilité du test :
1. Sachant que le test est positif, quelle est la probabilité que l’ampoule soit effectivement conforme ?
2. Sachant que le test est négatif, quelle est la probabilité que l’ampoule soit effectivement défectueuse ?
Exercice 3.9 Deux ateliers fabriquent les mêmes pièces. La cadence du premier atelier est le double
de celle du deuxième. Il y a 3% de pièces défectueuses dans l’atelier 1 et 4% dans l’atelier 2. On prélève
une pièce au hasard. Calculer la probabilité des événements suivants :
1. La pièce provient de l’atelier 1,
2. La pièce est defectueuse,
3. La pièce provient de l’atelier 1, sachant qu’elle est défectueuse.

Probabilités 4 PROBABILITÉS ET STATISTIQUES
Exercice 3.10 Dans une population donnée, 15 % des individus ont la maladie Ma . Parmi eux, 20%
ont une maladie Mb . Parmi les personnes non atteintes par Ma , 4% ont la maladie Mb . On considère
un individu. Calculer la probabilité des événements suivants :
1. Il a la maladie Ma
5. Il n’a pas la maladie Ma mais il a la maladie Mb
2. Il a la maladie Mb sachant qu’il a Ma
6. Il a la maladie Mb
3. Il a la maladie Mb sachant qu’il n’a pas Ma
7. Il a la maladie Ma sachant qu’il a Mb
4. Il a la maladie Ma et la maladie Mb
Exercice 3.11 Trois étudiants A, B et C passent un examen le même jour. Les trois examens sont
différents et se passe dans des lieux différents. Les probabilités de succès sont estimées à 0,7 pour A,
0,4 pour B et 0,6 pour C. Calculer la probabilité
1. que les 3 soient reçus
5. que B soit le seul à échouer
2. que les trois échouent
6. qu’exactement deux soient reçus
3. que A seulement soit reçu
7. qu’au moins un soit reçu
4. qu’un seul réussise
Exercice 3.12 Une urne contient x boules dont 3 sont blanches, les autres étant rouges.
1. À l’occasion d’un tirage sans remise de deux boules, la probabilité d’obtenir une boule blanche
puis une boule rouge est 14 . Calculer le nombre de boules dans l’urne.
2. Même question si le tirage est effectué avec remise
4 Probabilités et statistiques
De nombreux problèmes peuvent être regardés sous un aspect statistique et sous un aspect proba-
biliste :
Exemple 4.1 Une population est composé de 47% d’hommes et de 53% de femmes. On suppose que
24 % des hommes et que 34 % des femmes ont les yeux verts. Les hommes aux yeux verts représentent
24 47 1128
24 % de 47 % de la population, soit 100 × 100 = 10000 = 0, 1128 = 11, 28%. On peut remplir le tableau
suivant :
homme femme
yeux verts 0, 47 × 0, 24 = 0, 1128 0, 53 × 0, 34 = 0, 1802 0, 2930
yeux pas verts 0, 47 × 0, 76 = 0, 3572 0, 53 × 0, 66 = 0, 3498 0, 707
0, 47 0, 53 1
On choisit une personne au hasard.

1. la probabilité qu’elle ait les yeux verts est p(yeux verts) = 0, 293
2. la probabilité qu’elle ait les yeux verts sachant que c’est un homme est
p( homme aux yeux verts) 0, 1128

p( yeux verts / homme ) = = = 0, 24
p(homme) 0, 47
3. la probabilité qu’elle soit une femme sachant qu’elle n’a pas les yeux verts est
p( femme aux yeux pas verts) 0, 3498

p( femme / pas yeux verts ) = = ≈ 0, 4947
p(pas yeux verts) 0, 707

Probabilités 5 VARIABLE ALÉATOIRE
Jouons à pile ou face, un grand nombre de fois, avec une pièce non truquée. Pile et face ont la même
probabilité, égale à 1/2, d’apparaı̂tre à chaque lancer. Comptabilisons les résultats au fur et à mesure
et supposons que, à une étape, le nombre de tirages sur face soit supérieur de 100 à celui des pile :
le nombre de pile a-t-il ensuite tendance à rattraper le nombre de face ? Ceux qui jouent à pile ou
face sans en connaı̂tre les arcanes mathématiques évoquent parfois une loi des moyennes fondée sur
l’intuition que les nombres de pile et de face obtenus avec une pièce non truquée devraient devenir peu
différents après un grand nombre de lancers. Pourtant les pièces n’ont pas de mémoire : la probabilité
d’obtenir pile ou face lors d’un lancer est toujours 1/2. Ne devrait-on pas penser plutôt que les totaux
n’ont pas de raison de devenir égaux ?
Les mêmes questions se posent dans des contextes variés. Si un accident d’avion se produit en
moyenne tous les quatre mois et si trois mois se sont passés sans accident, un accident est-il imminent ?
Dans tous les cas de ce type, la réponse est non : les processus aléatoires ou, plus exactement, les
modèles mathématiques de ces processus n’ont pas de mémoire.
Il n’existe pas de loi des moyennes : les probabilités des événements futurs ne dépendent pas des
résultats passés.
5 Variable aléatoire
Définition 5.1 Soient une épreuve donnée, Ω l’univers associé à cette épreuve et p une probabilité
définie sur Ω. On appelle variable aléatoire toute fonction X de Ω dans R qui, à tout élément de Ω,
fait correspondre un nombre réel x.
On notera X(Ω) l’ensemble des valeurs prises par la v.a. X.
Une variable aléatoire est caractérisée par l’ensemble des valeurs qu’elle peut prendre et par l’expres-
sion mathématique de la probabilité de ces valeurs. Cette expression s’appelle la loi de probabilité (ou
distribution de probabilité) de la variable aléatoire.
Il existe plusieurs types de valeurs que peut prendre une variable aléatoire :
Variable aléatoire discrète

Définition 5.2 Une variable aléatoire est discrète si elle ne prend que des valeurs discontinues dans un
intervalle donné (borné ou non borné). L’ensemble des nombres entiers est discret. En règle générale,
toutes les variables qui résultent d’un dénombrement ou d’une numération sont discrètes.
Exemples :
– le nombre de petits par portée pour une espèce animale donnée (chat, marmotte, etc.),
– le nombre de bactéries dans 100 ml de préparation,
– le nombre de mutations dans une séquence d’ADN de 10 kb,
sont des variables aléatoires discrètes.
La loi de probabilité d’une variable aléatoire discrète est entièrement déterminée par les probabilités
pi des évènements {X = xi }, xi parcourant l’univers image Ω. La loi de probabilité est donnée par les
(xi , pi )i .
Exercice 5.1 Une urne contient quatre boules numérotées 10, 20, 30 et 40. On effectue trois tirages
successifs avec remise, c’est-à-dire qu’après chaque tirage on replace la boule tirée dans l’urne. Le
résultat d’une expérience peut alors être représenté par un triplet, une liste ordonnée de trois éléments
de l’ensemble E = {10, 20, 30, 40}.
1. Combien y a-t-il de résultats possibles ?
2. Quelle est la probabilité d’obtenir les cas suivants :

(a) La première boule tirée porte le numéro 10, la deuxième le numéro 40, la troisième le numéro
20 ?
(b) La première boule tirée porte le numéro 30 et la deuxième le numéro 20 ?
(c) La deuxième boule porte le numéro 20 ?
Exercice 5.2 Une urne contient quatre boules numérotées 10, 20, 30 et 40. On effectue trois tirages
successifs sans remise, c’est-à-dire qu’après chaque tirage on ne replace pas la boule tirée dans l’urne. Le
résultat d’une expérience peut alors être représenté par un triplet, une liste ordonnée de trois éléments
de l’ensemble E = {10, 20, 30, 40} mais cette fois les éléments du triplet sont 2 à 2 distincts.
20 ?
(b) La première boule tirée porte le numéro 30 et la deuxième le numéro 20 ?
(c) La deuxième boule porte le numéro 20 ?
Exercice 5.3 Une urne contient quatre boules numérotées 10, 20, 30 et 40. On tire simultanément
trois boules de l’urne. Le résultat d’une expérience peut alors être représenté par une partie à trois
éléments de l’ensemble E = {10, 20, 30, 40}.
2. Quelle est la probabilité d’avoir un résultat dans lequel figure le nombre 20 ?
3. Quelle est la probabilité d’avoir un résultat dans lequel figurent les nombres 30 et 40 ?
Définition 5.3 Étant donnée une v.a. discrète X prenant les valeurs x1 , x2 , · · · , xn avec les probabilités
respectives p1 , p2 , · · · , pn .
L’espérance mathématique de X est le nombre réel noté E(X) défini par :
E(X) = x1 p1 + x2 p2 + · · · + xn pn .
La variance de la v.a. X est le nombre réel noté V(X) et défini par :
V (X) = E(X 2 ) − [E(X)]2 .
L’écart type d’une v.a. X est le réel positif noté s(X) et défini par :
p
σ(X) = V (X).
Exercice 5.4 On joue avec deux dés à quatre faces. Sur le premier dé, les faces portent les numéros
1, 2, 3 et 3. Sur le deuxième dé, les faces portent les numéros 1, 2, 2 et 2. Deux règles du jeu sont
possibles :
1. La partie coûte 1 euro. On lance les deux dés.
(a) Si la somme est 2, on gagne 6 euros
(b) Si la somme est 3 ou 4, on gagne 2 euros
(c) Si la somme est 5, on ne gagne rien
2. La partie coûte 10 euros. On lance les deux dés.
(a) Si la somme est 2, on gagne 60 euros
(b) Si la somme est 3 ou 4, on gagne 12 euros

(c) Si la somme est 5, on ne gagne rien

En étudiant l’espérance et l’écart-type de chacun de ces jeux, trouver lequel est le plus intéressant.
Exercice 5.5 Un automibiliste rencontre sur son trajet 5 feux de circulation tricolores. Pour chacun
de ces feux, le rouge dure 15 secondes, l’orange 5 secondes et le vert 40 secondes. Les 5 feux ne sont
pas synchronisés et l’on suppose que les aléa de la circulation sont tels que l’état d’un feu devant lequel
se présente l’automobile ne dépend pas de l’état des autres feux rencontrés.
1. L’automibile se présente devant un feux. Quelle est la probabilité que ce feu soit vert ?
2. Quelle est la probabilité que sur son trajet, l’automobile rencontre exactement 3 feux verts sur
les 5 feux rencontrés ?
3. Soit X la variable aléatoire correspondant au nombre de feux verts rencontrés sur le trajet. Quelle
est sa loi de probabilité et son espérance E(X) ?
Variable aléatoire continue

Définition 5.4 Une variable aléatoire est continue si elle peut prendre toutes les valeurs dans un
intervalle donné (borné ou non borné). En règle générale, toutes les variables qui résultent d’une mesure
sont de type continu.
Exemples :
– le masse corporelle des individus pour une espèce animale donnée,
– le taux de glucose dans le sang,
sont des variables aléatoires continues.
Dans le cas d’une variable aléatoire continue, la loi de probabilité f (x) associe une probabilité à chaque
ensemble de valeurs définies dans un intervalle donné. En effet, pour une variable aléatoire continue,
la probabilité associée à l’évènement X = a est nulle, car il est impossible d’observer exactement cette
valeur. On considère alors la probabilité P (x1 ≤ X ≤ x2 ) que la variable aléatoire X prenne des valeurs
comprises dans un intervalle [x1 , x2 ].
Si cette loi prend des valeurs comprises entre [a, b], la somme des probabilités attachées aux valeurs
possibles de la variable aléatoire est égale à 1.
Elle est representée par la surface sous la courbe y = f (x), ce qui revient à considérer des intégrales :
Rb
a
f (x) dx = 1. Si on s’intéresse aux valeurs comprises dans un intervalle [c, d], on a et donc p(c ≤ X ≤
Rd
d) = c f (x) dx.
Définition 5.5 Étant donnée une v.a. continue X, de densité de probabilité f (x) prenant des valeurs
comprises dans l’intervalle [a, b] L’espérance mathématique de X est le nombre réel noté E(X) défini

par :
Z b
E(X) = xf (x) dx.
a
La variance de la v.a. X est le nombre réel noté V(X) et défini par :
Z b Z b
2 2
V (X) = [x − E(X)] f (x) dx = x2 f (x) dx − [E(X)] .
a a
L’écart type de cette v.a. X est le réel positif noté σ(X) et défini par :
p
σ(X) = V (X).
Exemple 5.1 On considère une variable aléatoire pouvant prendre toutes les valeurs comprises dans
l’intervalle [0, 2] et soit f (x) = x2 sa densité de probabilité.
On peut vérifier que la somme des probabilités est égale à 1 :
Z 2 2 2
x x
dx = =1
0 2 4 0
Son espérance mathématique est
Z 2 3 2
x x 4
E(x) = x dx = =
0 2 6 0 3
et sa variance est
2 2 2 4 2 2
x3
Z Z
4 x 4 x 4 2
V (x) = (x − )2 dx = dx − = − =
0 3 2 0 2 3 8 0 3 0 9
q
2
d’où l’écart-type σ = 9 ≈ 0, 471
Exercice 5.6 Soit X une variable aléatoire continue ayant pour densité de probabilité f définie par
– f (x) = 0 pour x ∈] − ∞; 0[∪]2; +∞[
– f (x) = x pour x ∈ [0; 1]
– f (x) = −x + 2 pour [1; 2]
1. Vérifier que f est une densité de probabilité
2. Calculer l’espérance et l’écart-type de X
3. Calculer p(0, 5 < X < 1, 32)
Exercice 5.7 Soit X une variable aléatoire continue ayant pour densité de probabilité f définie par
– f (x) = 0 pour x ∈] − ∞; −2[∪]4; +∞[
– f (x) = k(4 − x) pour x ∈ [−2; 4]
1. Calculer k pour que f soit une densité de probabilité
2. Calculer l’espérance et l’écart-type de X
3. Calculer p(−1 < X < 2) et p(X ≥ 3)
Définition 5.6 Soit X une variable aléatoire réelle.
– Si E(X) = 0, X est dite centrée.
– Si E(X) 6= 0 alors X − E(X) est appelée variable aléatoire centrée associée à X.
– Si σ(X) = 1 alors X est dite réduite
– Si σ(X) 6= 1 et E(X) 6= 0 alors X−E(X)
σ(X) est appelée variable aléatoire centrée réduite associée à
X

Probabilités 6 LOIS BINOMIALES
6 Lois binomiales
En probabilité, une épreuve de Bernoulli de paramètre p (réel compris entre 0 et 1) est une
expérience aléatoire (c’est-à-dire soumise au hasard) comportant deux issues : le succès ou l’échec.
Sur cet univers succès, échec, on peut définir une variable aléatoire X prenant la valeur 1 en cas de
succès et 0 en cas d’échec. Cette variable aléatoire suit une loi de Bernoulli ou loi binomiale :
Définition 6.1 Etant donnée une épreuve définie sur un univers Ω. A l’issue de l’épreuve, on a deux
possibilités : soit succés S (p(S) = p avec 0 ≤ p ≤ 1) ; soit échec E (p(E) = q = 1 − p). On répète
n fois l’épreuve. On a une suite de n épreuves indépendantes. Soit X la v.a. définie sur Ωn qui prend
pour valeur le nombre de réalisations de S. La proba qque X = k (qu’il y ait k succès) est
p(X = k) = Cnk pk (1 − p)n−k avec k entier
X suit une loi binômiale B(n, p) de paramètres n et p.
C’est une loi qui est souvent représentée sous la forme d’un arbre. On compte alors le nombre de
branches ayant k succès (cela correspon à Cnk ) , et on le multiplie par la probabilité qu’une branche se
produise (cela correspond à pk (1 − p)n−k ).
Exemple 6.1 Quelle est la loi de probabilité définissant le nombre de garçons dans une famille de 4
enfants ?
x 0 1 2 3 4
1 4 1 1 4 4 1 4 6 1 4 4 1 4 1

p C40 2 = 16 C41 2 = 16 C42 2 = 16 C43 2 = 16 C44 2 = 16
Proposition 6.1 Si X suit une loi binômiale B(n, p) de paramètres n et p, alors

E(X) = np V (X) = npq = np(1 − p)
Exercice 6.1 Une entreprise a effectué une enquète sur ses salariés. Elle a calculé que 6% des individus
sont retardataires. Sur 100 personnes, quelle est la probabilité de n’en avoir aucune en retard ?
Exercice 6.2 Une urne contient des boules blanches et des boules noires. La proportion de blanches
est p. Les tirages se font avec remise ainsi la proportion de boules blanches ne changent jamais. Soit X
l’événement obtenir une boule blanche. Quelles sont l’espérance et la variance de cette variable ?
Exercice 6.3 On lance 10 fois un dé. Quelle est la probabilité d’avoir 4 fois le 1 ?
Exercice 6.4 Un camp d’adolescents propose des stages d’activités nautiques pour débutants avec au
choix : Planche à voile , plongée ou ski nautique. Lors d’un stage donné, ce camp accueille vingt jeunes
don sept seront initiés à la planche à voile, huit à la plongée et cinq au ski nautique. Chaque stagiaire
ne pratique qu’une seule des trois activités.
1. On forme un groupe de 3 stagiaires choisis au hasard parmi les vingt.
(a) Combien de groupes est-il possible de former ?
(b) Déterminez la probabilité de chacun des événements suivants :
A : les trois stagiaires pratiquent des activités différentes
B : Les trois stagiaires pratiquent la même activité
C : Au moins l’un des trois stagiaires pratique le ski nautique.
2. Parmi les trois stagiaires, un seul se prénomme Christian. Chaque jour, on choisit un groupe de
trois stagiaires chargé du service au repas de midi.

Probabilités 7 LOIS DE POISSON
(a) Montrez que la probabilité que Christian soit choisi un jour donné pour le service de midi
est égale à 0,15.
(b) La durée du stage est de cinq jours. Quelle est la probabilité de ne jamais choisir Christian
pour le service de midi pendant le séjour ?
(c) Quelle est la probabilité de le choisir exactement une fois ?
(d) Montrez que la probabilité de choisir Christian au moins deux fois est inférieur à 0,2 .
La somme des probabilité fait 1 :

Théoreme 6.1 On a
n
X
p(X = k) = 1
k=0
Démo :
n
X n
X
p(X = k) = Cnx px q n−x = (p + q)n = 1
k=0 k=0
7 Lois de Poisson
Cette loi intervient dans des processus aléatoires dont les éventualités sont faiblement probables et
survenant indépendamment les unes des autres : cas des phénomènes accidentels, d’anomalies diverses,
des problèmes d’encombrement (“files d’attente”), des ruptures de stocks, etc.
Définition 7.1 On dit que la variable aléatoire X suit une loi de Poisson de paramètre m si
mk −m
P (X = k) = e
k!
m
Remarque 7.1 Dans ce cas, P (X = k + 1) = k+1 P (X = k).
une loi de Poisson peut être représentée par un diagramme en bâtons. Ci-dessous sont représentés les
diagrammes en bâtons des lois de Poisson de paramètres 1, 2 et 5 :
Exercice 7.1 Dans un atelier, le nombre d’accidents au cours d’une année suit une loi de Poisson de
paramètre 5. Calculer la probabilité des événements suivants :
1. Il n’y a pas d’accidents au cours d’une année
2. Il y a exactement 4 accidents au cours de l’année
3. Il y a plus de 6 accidents au cours de l’année

Probabilités 8 LOIS NORMALES
Proposition 7.1 Si X suit une loi de Poisson de paramètre m alors E(X) = V (X) = m.
La loi de Poisson décrit bien la loi binomiale pour n tendant vers l’infini et q tendant vers zéro, avec
le produit nq tendant vers une constante. Elle modélise donc les expériences de Bernoulli avec une
très faible probabilité de succès, mais avec un grand nombre d’essais, du même ordre de grandeur que
l’inverse de la probabilité de succès.
Proposition 7.2 On peut approcher une loi binomiale B(n, p) par la loi de Poisson P(np) avec un
bon pourcentage de réussite si n ≥ 30, p ≤ 0, 1 et np < 15.
Exercice 7.2 Suite à une vaccination contre le paludisme, dans une population à risque, on estime à
2%, compte tenu du délai d’immunisation, la proportion de personnes qui seront pourtant atteintes de
la maladie. En utilisant la loi binomiale puis la loi de Poisson, quelle est la probabilité de constater,
lors d’un contrôle dans un petit village de 100 habitants tous récemment vaccinés, plus d’une personne
malade ? (on supposera l’indépendance des éventualités).
Exercice 7.3 Une entreprise possède un parc de 200 machines fonctionnant sans arrêt pendant les
heures de travail. On a observé que la probabilité pour chaque machine de tomber en panne au cours
d’une journée est p = 1/1000.
1. Calculer la probabilité pour une machine déterminée de tomber en panne au moins une fois au
cours des 25 jours ouvrables
2. Calculer la probabilité pour une machine déterminée de tomber en panne plus d’une fois au cours
des 25 jours ouvrables
3. En approximant par une loi de Poisson, calculer la probabilité qu’au cours des 25 jours ouvrables
4 machines au plus tombent en panne puis qu’on observe au moins 6 pannes.
Plutôt que de refaire les calculs à chaque fois, on peut utiliser des tables de Poisson qui, connaissant
le paramètre m et la valeur k donne directement P (X = k) et P (X ≤ k).
8 Lois normales
La loi normale (ou de Laplace-Gauss) est la loi de certains phénomènes continus qui fluctuent autour
d’une valeur moyenne m, de manière aléatoire, résultante d’un grand nombre de causes algébriquement
additives et indépendantes. La dispersion des valeurs observées d’un même caractère gaussien est
représentée par un écart type σ.
Définition 8.1 On parle de loi normale ou loi de Gauss lorsque l’on a affaire à une variable aléatoire
continue dépendant d’un grand nombre de causes indépendantes dont les effets s’additionnent et dont
aucune n’est prépondérante.
Les lois normales sont représentées par des courbes en cloche :

Exemple 8.1 On fabrique des pièces dont les dimensions dépendent du réglage de l’appareil de fabrica-
tion, des vibrations auxquelles il est soumis, de l’homogénéité de la matière première, de la température,
de l’humidité, ...
Une variable aléatoire continue X est distribuée selon une loi normale si sa densité de probabilité est

1 −(x−m) 2
m est la moyenne de X
f (x) = √ e 2σ 2
où
2π σ est l’écart-type de X
La loi de probabilité dépend donc de deux paramètres m et σ et on l’écrit N(m,σ).
On effectue généralement le changement de variable T = X−mσ . La loi de distribution de t est alors
1 T2
f (T ) = √ e− 2
2π
Cette loi est notée N(0,1) et dite normale, centrée, réduite.
R +∞ T 2 √ R +∞
Remarque 8.1 On admettra pour la suite que −∞ e− 2 dT = 2π et donc que −inf ty f (T ) dT = 1.
Proposition 8.1 L’espérance mathématique d’une variable aléatoire distribuée selon la loi N(0,1) est
0. La médiane et la valeur modale sont égales à l’espèrance mathématiques c’est-à-dire sont égales à 0.
Pour une loi N(m,σ), l’espérance mathématique, la médiane et le mode sont égaux à m et l’écart-type
est σ.
X−m
Si X suit une loi N(m,σ), on pose T = σ . T suit alors une loi N(0,1). On a
E(X) = E(σT + m) = σE(T ) + m = m
V (X) = V (σT + m) = V (σT ) = σ 2 V (T ) = σ 2
p
σ(X) = V (X) = σ
Proposition 8.2 Si on considère une loi N(0,1) alors
p(−1, 96 < t < 1, 96) = 0, 95
p(−2, 58 < t < 2, 58) = 0, 99
R t 0 − t2
De manière plus générale, p(t < t0 ) = √12π −∞ e 2 dt.
RT
On pose −∞ f (t)dt = Φ(T ). Plutôt que d’effectuer les calculs à chaque fois, on utilise la table suivante :
Table de Gauss
T ,0 ,1 ,2 ,3 ,4 ,5 ,6 ,7 ,8 ,9
0 0, 5 0, 5398 0, 5793 0, 6179 0, 6554 0, 6915 0, 7257 0, 7580 0, 7881 0, 8159
1 0, 8413 0, 8643 0, 8849 0, 9032 0, 9192 0, 9332 0, 9452 0, 9554 0, 9641 0, 9713
2 0, 9772 0, 9821 0, 9861 0, 9893 0, 9918 0, 9938 0, 9953 0, 9965 0, 9974 0, 9981
3 0, 9987 0, 9990 0, 9993 0, 9995 0, 9997
Explications
Pour trouver la valeur correspondant à T = 1, 3, on se place sur la deuxième ligne (correspondant à 1)
R 1,3
et sur la quatrième colonne (correspondant à , 3) et on lit : P (T ≤ 1, 3) = 0, 9032. Donc −∞ f (t)dt =
0, 9032. Ce tableau n’est utilisable que pour des valeurs de T positives et des probabilité de type
inférieure ou égale à. Les règles suivantes permettent de résoudre tous les problèmes rencontrés :
Rα R +∞ R +∞ Rα
1. −∞ f (t)dt+ α f (t)dt = 1 donc α f (t)dt = 1− −∞ f (t)dt, c’est--̀dire P (T > α) = 1−P (T ≤
α) = 1 − Φ(α)
2. Si α < 0 alors Φ(α) = 1 − Φ(α).
On aura parfois besoin d’une table de Gauss plus complète :



Exercice 8.1 Sachant que la répartition des quotients intellectuels (QI), rapport entre l’âge mental
et l’âge réel, d’une personne est une loi normale de moyenne 0,90 et d’écart-type 0,40,
1. Calculer la probabilité à 0,0001 près, qu’une personne prise au hasard
(a) ait un QI inférieur à 1 (c) ait un QI supérieur à 1,4
(b) ait un QI inférieur à 0,1 (d) ait un QI compris entre 0,8 et 1,3
2. En déduire le nombre de personnes dans un village de 1000 habitants
(a) ayant un QI inférieur à 1 (c) ayant un QI supérieur à 1,4
(b) ayant un QI inférieur à 0,1 (d) ayant un QI compris entre 0,8 et 1,3
Exercice 8.2 On estime que le temps nécessaire à un étudiant pour terminer une épreuve d’examen
est une variable normale de moyenne 90 minutes et d’écart-type 15 minutes. 240 candidats se présentent
à cet examen
1. Combien d’étudiants N termineront l’épreuve en moins de deux heures ?
2. Quelle devrait être la durée D de l’épreuve si l’on souhaite que 200 étudiants puissent terminer
l’épreuve ?
Exercice 8.3 Une entreprise fabrique, en grande quantité, des tiges métalliques cylindriques pour
l’industrie. Leur longueur et leur diamètre sont exprimés en millimètres. Une tige de ce type est
considérée comme conforme pour la longueur lorsque celle-ci appartient à l’intervalle [99,45 ; 100,55].
On note X la variable aléatoire qui, à chaque tige prélevée au hasard dans la production, associe sa
longueur. On suppose que X suit une loi normale de moyenne 100 et d’écart-type 0,25.
1. Calculer la probabilité qu’une tige prélevée au hasard dans la production soit conforme pour la
longueur.
2. Déterminer le nombre réel h positif tel que : P (100 − h < X < 100 + h) = 0, 95.

Probabilités 9 SOLUTIONS DES EXERCICES
9 Solutions des exercices

Solution 1.1 On a
2 1 3 1
p(E1 ) = = p(E2 ) = =
6 3 6 2
1
p(E1 ∩ E2 ) = p((avoir 3 ou 4) ET (avoir un nombre pair)) = p(avoir un 4) =
6
1 1 1 4 2
p(E1 ∪ E2 ) = p(E1 ) + p(E2 ) − p(E1 ∩ E2 ) = + − = =
2 3 6 6 3
4 2
= p((avoir 3 ou 4) ou (avoir un nombre pair)) = p(avoir 2,3,4 ou 6) = =
6 3
Solution 1.2 On considère le tableau suivant, nous donnant la somme des deux nombres :
dé 2
\ 1 2 3 4 5 6
dé 1
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
5 7
De ce tableau, on déduit que p(E1 ) = 36 , p(E2 ) = 36 et p(E3 ) = 18 1
36 = 2 .
Les événements E1 , E2 et E3 sont incompatibles (on ne peut pas avoir simultanément une somme de
5 et une somme de 7, ni une somme de 5 ou 7 et une somme paire). On a donc
p(E1 ∩ E2 ) = 0 p(E1 ∩ E3 ) = 0 p(E2 ∩ E3 ) = 0
5 7 12 1
p(E1 ∪ E2 ) = p(E1 ) + p(E2 ) = + = =
36 36 36 3
5 1 23
p(E1 ∪ E3 ) = p(E1 ) + p(E3 ) = + =
36 2 36
7 1 25
p(E2 ∪ E3 ) = p(E2 ) + p(E3 ) = + =
36 2 36
Solution 2.1 On peut former 10 × 9 × 8 × 7 = 5 040 mots différents.
Solution 2.2 Il n’est pas interdit que les lettres puissent se répéter donc il y a 53 = 125 mots possibles.
Solution 2.3 Pour le tiercé, il y a 8 × 7 × 6 = 336 possibilités. Pour le tiercé, il y a 8 × 7 × 6 × 5 = 1680

possibilités.
Solution 2.4 Pour chaque chiffres du nombre, j’ai 3 possibilités. Il y a donc 3 × 3 × 3 × 3 = 34 = 81

possibilités.
Solution 2.5 Il y a 4023 possibilités.

23 40! 40!
Solution 2.6 Il y a C40 = 23!(40−23)! = 23!17! = 88 732 378 800 possibilités.
5 32×31×30×29×28
Solution 2.7 Il y a C32 = 5×4×3×2×1 = 201 376 possibilités.

Solution 2.8 Il faut choisir 2 coeurs parmi 8, puis 3 cartes parmi les 24 restantes : il y a donc C82 ×C24
3
=
56 672 possibilités.
Solution 2.9 Il est plus simple de calculer le nombre de mains de 5 cartes ne contenant aucun roi,
5
cela revient à prendre 5 cartes parmi les 28 restantes : il y a C28 possibilités. Le nombre total de
5
mains de cinq cartes est C32 et donc le nombre de mains de cinq cartes contenant au moins un roi est
5 5
C32 − C28 = 103 096.
On peut également calculer directement le nombre de mains de cinq cartes contenant au moins un roi :
– nombre de mains de cinq cartes contenant exactement un roi : C41 × C28 4
= 81 900
2 3
– nombre de mains de cinq cartes contenant exactement deux rois : C4 × C28 = 19 656
3 2
– nombre de mains de cinq cartes contenant exactement trois rois : C4 × C28 = 1 512
– nombre de mains de cinq cartes contenant exactement quatre rois : C44 × C28 1
= 28
donc le nombre de mains de cinq cartes contenant au moins un roi est 81900+19656+1512+28 = 103 096
4 10!
Solution 2.10 Il y a C10 = 6!4! = 420 grilles possibles.
4 8 1 11
Solution 3.1 p = 32 + 32 − 32 = 32
C82 28
Solution 3.2 1. Il y a 8 coeurs dans le jeu donc p(A) = 2
C32
= 496 ≈ 0, 05645
2
C12 66
2. Il y a 12 figures dans le jeu donc p(B) = 2
C32
= 496 ≈ 0, 13307
C32 3
3. p(A ∩ B) = p(deux figures à coeur) donc p(A ∩ B) = 2
C32
= 496 ≈ 0, 00605.
91
4. p(A ∪ B) = p(A) + p(B) − p(A ∩ B) = 496 ≈ 0, 18347
Solution 3.3 Soit A l’événement “le candidat A réussit” et B l’événement “le candidat B réussit”.
Calculer la probabilité
3 2 1
1. que les 2 candidats soient reçus = p(A ∩ B) = P (A) × p(B) = 4 × 3 = 2
2. que les 2 candidats échouent = p(Ā ∩ B̄) = p(Ā) × p(B̄) = 41 × 13 = 12
1
3. que le candidat A soit seul reçu = p(A ∩ B̄) = p(A) × p(B̄) = 43 × 13 = 1

4
4. qu’un seul des deux candidats réussise = p(A ∩ B̄) + p(Ā ∩ B) = p(A) × p(B̄) + p(Ā) × p(B) =
1 2 5
4 + 12 = 12
1 11
5. qu’au moins 1 des candidats soit reçu = 1 − p(Ā ∩ B̄) = 1 − 12 = 12
Solution 3.4 Soient RA l’événement tirer une boule rouge dans l’urne A, BA l’événement tirer une
boule bleue dans l’urne A, RB l’événement tirer une boule rouge dans l’urne B, BB l’événement tirer
une boule bleue dans l’urne B. On a
4 5 20
1. Probabilité de tirer deux boules rouges = p(RA ∩ RB ) = 9 × 11 = 99
5 6 30
2. Probabilité de tirer deux boules bleues = p(BA ∩ BB ) = 9 × 11 = 99
3. Probabilité de tirer deux boules de même couleur = p(RA ∩RB )+p(BA ∩BB ) = 94 × 11
5
+ 95 × 11
6
= 50
99
4. Probabilité de tirer deux boules de couleurs différentes : on peut le faire par le calcul direct :
= p(BA ∩ RB ) + p(RA ∩ BB ) = 95 × 11 5
+ 49 × 11
6 49
= 99 On peut également le faire en remarquant
que cet événement est l’opposé de l’événement précédent et en déduire que la probabilité est
1 − (p(RA ∩ RB ) + p(BA ∩ BB )) = 49 99

Solution 3.5 Calculons le nombre de possibilités pour obtenir 11 et 12 :
total 11 nbr de cas total 12 nbr de cas

1−5−5 C32 = 3 1−5−6 6
1−4−6 6 2−5−5 3
2−4−5 6 2−4−6 6
2−3−6 6 3−3−6 3
3−4−4 3 3−4−5 6
3−3−5 3 4−4−4 1
27 25
Le nombre 11 peut donc être obtenu de 27 façons différentes, contre 25 pour le nombre 12. Le joueur
A est donc avantagé.
Solution 3.6 X(Ω) = {0; 1; 2; 3; 4} et Y (Ω) = {0; 1; 2; 3; 4}. Soient

– Ai l’événement “le joueur A marque i points” avec i ∈ {0; 1; 2}
– Bi l’événement “le joueur B marque i points” avec i ∈ {0; 1; 2}
– Ci l’événement “le joueur C marque i points” avec i ∈ {0; 1; 2}
– Di l’événement “le joueur D marque i points” avec i ∈ {0; 1; 2} P
P résultats des joueurs sont indépendants entre eux donc p(X = k) =
Les i+j=k p(Ai ∩ Bj ) =
i+j=k p(A i ) × p(B j ). On a
– P (X = 0) = 0, 4 × 0, 3 = 0, 12
– P (X = 1) = p(A1 ) × p(B0 ) + p(A0 ) × p(B1 ) = 0, 4 × 0, 3 + 0, 4 × 0, 4 = 0, 28
– P (X = 2) = p(A2 )×p(B0 )+p(A1 )×p(B1 )+p(A0 )×p(B2 ) = 0, 2×0, 3+0, 4×0, 4+0, 4×0, 3 = 0, 34
– P (X = 3) = p(A2 ) × p(B1 ) + p(A1 ) × p(B2 ) = 0, 2 × 0, 4 + 0, 4 × 0, 3 = 0, 2
– P (X = 4) = p(A2 ) × p(B2 ) = 0, 2 × 0, 3 = 0, 06
et donc
xi 0 1 2 3 4
p(X = xi ) 0, 12 0, 28 0, 34 0, 2 0, 06
et
yi 0 1 2 3 4
p(Y = yi ) 0, 15 0, 34 0, 31 0, 16 0, 04
Soit p(N ) la probabilité que le match soit nul. On a
p(N ) = p((X = 0) ∩ (Y = 0)) + p((X = 1) ∩ (Y = 1)) + p((X = 2) ∩ (Y = 2))

+p((X = 3) ∩ (Y = 3)) + p((X = 4) ∩ (Y = 4))
= p(X = 0) × p(Y = 0) + p(X = 1) × p(Y = 1) + p(X = 2) × p(Y = 2)
+p(X = 3) × p(Y = 3) + p(X = 4) × p(Y = 4)
= 0, 12 × 0, 15 + 0, 28 × 0, 34 + 0, 34 × 0, 31 + 0, 2 × 0, 16 + 0, 06 × 0, 04
= 0, 253
Solution 3.7 – raisonnement direct :

{1, 3, 5, 7, 9, 11, 13, 15} sont les numéro impairs, {3, 9, 15} sont les multiples de 3 parmi les impairs
donc le nombre de cas favorables est 3 et le nombre de cas possibles est 8 : p = 83
– Avec la formule :
Soit A l’événement la boule a un numéro impair et B l’événement la boule a un numéro multiple
de 3. On a pA (B) = p(A∩B) 3/15
p(A) = 8/15 = 8 .
3

Solution 3.8 Soit T l’événement le test est positif (et donc T̄ l’événement le test est négatif) et soit
C l’événement l’ampoule est conforme (et donc C̄ l’événement l’ampoule est non conforme). On a
p(C) = 0, 92 et p(C̄) = 0, 08, et le tableau suivant
T T̄
C 0, 92 × 0, 96 = 0, 8832 0, 92 × 0, 04 = 0, 0368 0, 92
C̄ 0, 08 × 0, 06 = 0, 0048 0, 08 × 0, 94 = 0, 0752 0, 08
0, 888 0, 112 1
p(T ∩C) 0,8832 p(T̄ ∩C̄)
p(T ) = 0, 888 et p(T̄ ) = 0, 112. On en déduit que pT (C) = p(T ) = 0,888 = 0, 99 et pT̄ C̄ = p(T̄ )
=
0,0752
0,112 = 0, 67.
Solution 3.9 Soit A1 l’événement la pièce provient de l’atelier 1 et A2 l’événement elle provient de
l’atelier 2. Soit B l’événement la pièce est defectueuse.
1. La pièce provient de l’atelier 1 :
La cadence du 1 étant le double de celle de l’atelier 2, il fabrique deux fois plus de pièces donc
p(A1 ) = 23
2. La pièce est défectueuse : p(B) = p(B ∩ A1 ) + p(B ∩ A2 ) = PA1 (B) × p(A1 ) + PA2 (B) × p(A2 ) =
0, 03 × 23 + 0, 04 × 13 = 0, 02 + 0, 013 = 0, 033. 3,3 % des pièces sont défectueuses.
p(B∩A1 ) 0,02
3. La pièce provient de l’atelier 1, sachant qu’elle est défectueuse : pB (A1 ) = p(B) = 0,033 =
0, 6%.
Solution 3.10 Soit A l’événement il a la maladie Ma et B l’événement il a la maladie Mb . On a le

tableau suivant :
A Ā
B 0, 15 × 0, 2 = 0, 03 0, 85 × 0, 04 = 0, 034 0, 064
B̄ 0, 15 × 0, 8 = 0, 12 0, 85 × 0, 96 = 0, 816 0, 936
0, 15 0, 85 1
On cherche
1. Il a la maladie Ma : p(A) = 0, 15
p(A∩B) 0,03
2. Il a la maladie Mb sachant qu’il a Ma : pA (B) = p(A) = 0,15 = 0, 2 (on retrouve les 20 % de
l’énoncé, ce qui est bon signe ...)
3. Il a la maladie Mb sachant qu’il n’a pas Ma : pĀ (B) = p(p(
Ā∩B)
Ā)
= 0,034
0,85 = 0, 04 (on retrouve les 4
% de l’énoncé)
4. Il a la maladie Ma et la maladie Mb : p(A ∪ B) = 0, 03
5. Il n’a pas la maladie Ma mais il a la maladie Mb : p(Ā ∪ B) = 0, 034
6. Il a la maladie Mb : p(B) = 0, 064
0,03
7. Il a la maladie Ma sachant qu’il a Mb : pB (A) = 0,064 = 0, 46875
Solution 3.11 Les trois événements sont indépendants. On a donc

1. que les 3 soient reçus = p(A ∩ B ∩ C) = p(A) × p(B) × p(C) = 0, 7 × 0, 4 × 0, 6 = 0, 168
2. que les trois échouent = p(Ā ∩ B̄ ∩ C̄) = 0, 3 × 0, 6 × 0, 4 = 0, 072
3. que A seulement soit reçu = p(A ∩ B̄ ∩ C̄) = 0, 7 × 0, 6 × 0, 4 = 0, 168
4. qu’un seul réussise = p(A ∩ B̄ ∩ C̄) + p(Ā ∩ B ∩ C̄) + p(Ā ∩ B̄ ∩ C) = 0, 7 × 0, 6 × 0, 4 + 0, 3 ×
0, 4 × 0, 4 + 0, 3 × 0, 6 × 0, 6 = 0, 324

5. que B soit le seul à échouer = p(A ∩ B̄ ∩ C) = 0, 7 × 0, 6 × 0, 6 = 0, 252

6. qu’exactement deux soient reçus = p(A ∩ B ∩ C̄) + p(A ∩ B̄ ∩ C) + p(Ā ∩ B ∩ C) = 0, 7 × 0, 4 ×
0, 4 + 0, 7 × 0, 6 × 0, 6 + 0, 3 × 0, 4 × 0, 6 = 0, 436
7. qu’au moins un soit reçu = 1 − p(Ā ∩ B̄ ∩ C̄) = 1 − 0, 072 = 0, 928
Solution 3.12 1. P (B ∩ R) = p(B) × p(B/R) = x3 × x − 3x − 1 = 41 On se ramène donc à résoudre

2
x − 13x + 36 = 0 dont les racines sont 4 et 9. Il y a soit 4, soit 9 boules dans l’urne.
2. p(B ∩ R) = p(B) × p(R) = x3 × x−3 1 2
x = 4 . On se ramèn donc à résoudre x − 12x + 36 = 0 qui n’a
qu’une racine : x = 6. Il y a donc 6 boules dans l’urne.
Solution 5.1 1. nombres de résultats possibles : 43 = 64

1
20 : il n’y a qu’un cas possible donc une probabilité de 64
(b) La première boule tirée porte le numéro 30 et la deuxième le numéro 20 : il y a 4 choix pour
4 1
la troisième boule, donc 4 cas possibles, d’où une probabilité de 64 = 16
(c) La deuxième boule porte le numéro 20 : il y a 4 choix pour la 1ère boule et 4 pour la 3ème
d’où 4 × 4 = 16 cas possibles et une probabilité de 16 1
64 = 4
Solution 5.2 1. nombres de résultats possibles : 4 × 3 × 2 = 24

1
20 : il n’y a qu’un cas favorable donc une probabilité de 24
(b) La première boule tirée porte le numéro 30 et la deuxième le numéro 20 : il y a 2 possibilités
2 1
pour la troisième boule d’où une probabilité de 24 = 12
(c) La deuxième boule porte le numéro 20 : il y a 3 choix pour la 1ère boule (10, 30 ou 40) et 2
pour la 3ème boule, soit une probabilité de 3×2 1
24 = 4 .
Solution 5.3 1. nombre de résultats possibles : C43 = 4

3
2. Quelle est la probabilité d’avoir un résultat dans lequel figure le nombre 20 : 4
1
3. Quelle est la probabilité d’avoir un résultat dans lequel figurent les nombres 30 et 40 : 2
Solution 5.4 Regardons quelles sont les probabilités d’apparition de ces valeurs :
dé 1
1 2 3 3
dé 2
1 2 3 4 4
2 3 4 5 5
2 3 4 5 5
2 3 4 5 5
Si on appelle X la variable aléatoire somme des deux dés, on a donc
xi 2 3 4 5
1 4 5 6
P (X = xi ) 16 16 16 16
On s’intéresse d’abord à l’espérance :

1. Partie 1 : les gains possibles sont 5, 1 et −1 euros. On note Z1 la variable aléatoire gain du joueur.
On a le tableau suivant
xi 5 1 −1
1 9 6
p(Z1 = xi ) 16 16 16
1 9 6
L’espérance de cette variable aléatoire est donc E(Z1 ) = 5 × 16 +1× 16 + (−1) × 16 = 0, 5.
2. Partie 2 : les gains possibles sont 50, 2 et −10 euros. On note Z2 la variable aléatoire gain du
joueur. On a le tableau suivant
xi 50 2 −10
1 9 6
p(Z1 = xi ) 16 16 16
1 9 6
L’espérance de cette variable aléatoire est donc E(Z1 ) = 50 × 16 +2× 16 + (−10) × 16 = 0, 5.
On observe que les espérances sont égales, mais le risque est aussi lié à l’écart existant entre l’espérance
de la variable aléatoire et les valeurs prises par cette variable. On s’intéresse maintenant à l’écart-type :
1 9 6
V (Z1 ) 52 ×
= + 12 × + (−1)2 × − (0, 5)2 = 2, 25
p 16 16 16
σ(Z1 ) = V (Z1 ) = 1, 5
1 9 6
V (Z2 ) = 502 × + 22 × + (−10)2 × − (0, 5)2 = 195, 75
p 16 16 16
σ(Z2 ) = V (Z2 ) ≈ 14
L’écart-type est plus grand dans le deuxième cas, ce qui signifie que les valeurs de gains sont plus
espacées pour le deuxième jeu. À chacun de choisir le jeu suivant son gout du risque ...
Solution 5.5 Soit V l’événement “le feu est vert” et V̄ l’événement “le feu n’est pas vert” (ie le feu est
orange ou rouge).
40 2
1. p(V ) = 60 = 3
80
2. p(V3 ) = C53 p(V )3 p(V̄ )2 = 243
3. La loi de probabilité est :
x 0 1 2 3 4 5
1 10 40 80 80 32
p(X = x) 243 243 243 243 243 243
et donc
5
X 1 10 40 80 80 32 10
E(X) = xp(X = x) = 0 × +1× +2× +3× +4× +5× =
i=0
243 243 243 243 243 243 3
Solution 5.6 1. Pour tout x ∈ R, f (x) ≥ 0 et de plus,

+∞ 1 2 1 2
x2 −x2
Z Z Z
f (x) dx = x dx + (−x + 2) dx = + + 2x =1
−∞ 0 1 2 0 2 1
2.
Z +∞ Z 1 Z 2 1 2
1 3 1
E(X) = xf (x) dx = x2 dx + x(−x + 2) dx = x + − x3 + x2 = 1
−∞ 0 1 3 0 3 1

et
Z +∞ Z 1 Z 2
E(X 2 ) = x2 f (x) dx = x3 dx + x2 (−x + 2) dx
−∞ 0 1
1
2
1 4 1 4 2 7
= x + − x + x32 =
4 0 4 3 1 6
2 2 1
V (X) = E(X ) − E(X) =
p 6
σ(X) = V (X) ≈ 0, 408
3.
Z 1,32 Z 1 Z 1,3
p(0, 5 < X < 1, 32) = f (x) dx = x dx + (−x + 2) dx = 0, 63
0,5 0,5 1
R +∞ 1
Solution 5.7 1. f (x) dx = 18k donc il faut que k =
−∞ 18
√
2. E(X) = 0 et V (X) = 2 donc σ(X) = 2
7 1
3. p(−1 < X < 2) = 12 et p(X ≥ 3) = 36
Solution 6.1 Soit X le nombre de personne en retard. X suit la loi B(100 ;0,06) d’où p(X = 0) =
0
C100 0, 060 0, 94100 = 0, 002.
Solution 6.2 On effectue un seul tirage donc n = 1.
x p(x)
0 (echec) q =1−p
1 (succès) p
donc E(X) = 0 × q + 1 × p = p et V (X) = pq
Solution 6.3
x p
1
oui 1 6
5
non 0 6
1 4 5 6
4 4 6 4

La probabilité d’avoir 4 réussites est C10 p q = C10 6 6 = 0, 0542 = 5, 42%.
Solution 6.4 1. Il y a 20 stagiaires. On veut en choisir 3. Cela revient à chosir 3 éléments parmi
20. C’est donc le nombre de combinaisons de 3 éléments parmi 20. Le nombre de choix possibles
3 20!
pour les groupes de 3 est donc : C20 = 3!×17! = 1140.
2. A est l’événement les 3 stagiaires pratiquent des activités différentes.
Comme on suppose qu’il y a équiprobabilité des choix des stagiaires, on a : P (A) = Card(A)
1140 .
Si on appelle V l’ensemble des stagiaires qui seront initiés à la planche à voile, P l’ensemble
des stagiares qui seront initiés à la plongée et S l’ensemble des stagiaires qui seront initiés au
ski nautique, un événement élémentaire appartient à A si et seulement il contient exactement
1 élément de V , 1 élément de P et 1 élément de S. Comme Card(V ) = 7 , Card(P ) = 8 et
280
Card(S) = 5, on obtient : Card(A) = 7 × 8 × 5 = 280. Donc P (A) = 1140 .
L’évément B les 3 stagiaires pratiquent la même activité correspond à choisir 3 stagiaires parmi
V ou P ou S. Comme Card(V) = 7, le nombre de choix de 3 éléments de V est le nombre de

combinaisons de 3 éléments parmi 7. De même, le nombre de choix de 3 éléments de P est le

nombre de combinaisons de 3 éléments parmi 8 et le nombre de choix de 3éléments de S est le
nombre de combinaisons de 3 éléments parmi 5. Donc , on a : card(B) = C73 + C83 + C53 = 101.
101
D’où p(B) = 1140 .
L’événement C est au moins un des trois stagiaires pratique le ski nautique. L’événement contraire
de C est aucun des trois stagiaires ne pratique le ski nautique. Il correspond au choix de 3 stagiaires
3
parmi les 15 qui ne font pas de ski nautique. Son cardinal est alors : card(C) = C15 = 455. Donc
685
card(C) = 1140 − 455 = 685 et p(C) = 1140 .
3. On sait qu’il y a chaque jour 1140 choix possibles de 3 stagiaires parmi les 20. Choisir un groupe
de 3 avec Christian revient à choisir Christian et 2 stagiaires parmi les 19 qui ne sont pas
Christian. Il y a 171 choix possibles de deux autres stagiaires. C’est le nombre de combinaisons
de 2 éléments parmi 19. Parmi les 1140 groupes possibles de 3 stagiaires, il y a donc exactement
175 groupes qui contiennent Christian. La probabilité que Christian soit choisi un jour donné est
171
donc : 1140 = 0, 15.
Si on appelle X la variable aléatoire égale au nombre de fois que Christian est choisi durant le
séjour de 5 jours, X suit une loi binomiale de paramètre (n = 5 , p = 0,15 ). Donc, pour tout k
entier, on a :
p(X = k) = C5k (0, 15)k × (0, 85)5−k
En particulier, la probabilité de ne jamais choisir Christian durant le séjour est :
p(X = 0) = C50 (0, 15)0 × (0, 85)5 = (0, 85)5 ≈ 0, 4437
La probabilité de choisir exactement une fois Christian est :
p(X = 1) = C51 (0, 15)1 × (0, 85)4 = 5 × (0, 15) × (0, 85)4 ≈ 0, 3915
La probabilité de choisir au moins 2 fois Christian est : P (X ≥ 2). Or P (X ≥ 2) = 1 − P (X =

0) − P (X = 1). Les calculs précédents montrent bien alors que cette probabilité est inférieure à
0,2.
Solution 7.1 1. P (X = 0) = e−5 ≈ 0, 0067

54 −5
2. P (X = 4) = 4! e ≈ 0, 1755
3. P (X > 6) = 1 − P (X ≤ 6) ≈ 1 − 0, 7622 ≈ 0, 2378
Solution 7.2 Compte tenu des hypothèses, le nombre de malades est ici régi par une loi binomiale de
paramètres n = 100 et p = 0,02. On a np = 2 et les conditions d’approximation par une loi de Poisson
sont réalisées. Soit m la probabilité cherchée.
En utlisant la loi binomiale, on a 1 − m = (0, 98)100 + 2 × (0, 98)99 ≈ 0, 403. Soit m ≈ 0, 597.
k
En utilisant la loi de Poisson, on a P rob(X = k) = e−2 × 2k! , donc 1 − m ≈ P rob(X = 0) + P rob(X =
1) = 0, 406 , soit m ≈ 0, 594. L’approximation est donc ici excellente.
Solution 7.3 Soit X la variable aléatoire associée au nombre de pannes durant 25 jours ouvrables. Ces
25 épreuves sont identiques et indépendantes donc X suit une loi binomiale B(25 ;1/1000).
1. Calculer la probabilité pour une machine déterminé de tomber en panne au moins une fois au
cours des 25 jours ouvrables : p(X ≥ 1) = 1 − p(X = 0) = 1 − 0, 99925 ≈ 0, 0247
2. Calculer la probabilité pour une machine déterminé de tomber en panne plus d’une fois au cours
des 25 jours ouvrables : p(X > 1) = 1 − ((p(X = 0) + p(X = 1)) = 1 − (0, 99925 + 25 × 0, 001 ×
0, 99924 ) ≈ 0, 0003

3. Soit Y la variable aléatoire associée au nombre de pannes pour 200 machines en 25 jours. Y suit
la loi binomiale B(5000 ;0,001). On l’approche la loi binomiale par la loi de Poisson de même
moyenne np = 5000 × 0, 001 = 5 (on a bien n ≥ 30; p ≤ 0, 1 et np < 15). On en déduit
p(Y ≤ 4) = p(Y = 0) + p(Y = 1) + p(Y = 2) + p(Y = 3) + p(Y = 4)

52 53 54

5
= e−5 1 + + + + ≈ 0, 4405
1! 2! 3! 4!
52 53 54 55

5
P (Y < 6) = P (Y ≤ 5) = e−5 1 + + + + + ≈ 0, 6160
1! 2! 3! 4! 5!
Solution 8.1 La variable aléatoire suit une loi normale de moyenne m = 9 et d’écart-type σ = 0, 4. On
pose T = Q−0,9
0,4 . T suit une loi normale centrée réduite N(0,1).
1. Calculer la probabilité à 0,0001 près, qu’une personne prise au hasard
(a) ait un QI inférieur à 1 : Q < 1 ⇔ T < 0, 25 et p(T < 0, 25) ≈ 0, 5987
(b) ait un QI inférieur à 0,1 : Q < 0, 1 ⇔ T < −2 et p(T < −2) ≈ 0, 0228
(c) ait un QI supérieur à 1,4 : Q > 1, 4 ⇔ T > 1, 25 et p(T > 1, 25) ≈ 0, 1056
(d) ait un QI compris entre 0,8 et 1,3 : 0, 8 ≤ Q ≤ 1, 3 ⇔ −0, 25 ≤ T ≤ 1 et p(−0, 25 ≤ T ≤
1) ≈ 0, 4400.
2. En déduire le nombre e personnes dans un village de 1000 habitants
(a) ayant un QI inférieur à 1 : ≈ 599
(b) ayant un QI inférieur à 0,1 : ≈ 23
(c) ayant un QI supérieur à 1,4 : ≈ 106
(d) ayant un QI compris entre 0,8 et 1,3 : ≈ 440
Solution 8.2 Le temps nécessaire à un étudiant pour terminer une épreuve d’examen est une variable
aléatoire X normale, de moyenne 90mn et d’écart-type 15mn. On pose T = X−90 15 . T suit une loi
normale centrée réduite N(0,1).
1. Combien d’étudiants N termineront l’épreuve en moins de deux heures : X ≤ 120 ⇔ T ≤ 2 et
p(X ≤ 12) = p(T ≤ 2) ≈ 0, 9772. Il y a aura donc N = 240 × 0, 9772 ≈ 235 étudiants à finir en
deux heures.
2. Quelle devrait être la durée D de lépreuve si l’on souhaite que 200 étudiants puissent terminer
l’épreuve ?
On veut p(X ≤ D) = 200 240 ≈ 0, 8333. D’après la table, on en déduit que T doit être 0,97 ce qui
nous amène à D ≈ 104, 55.
Solution 8.3 1. On a
99, 45 − 100 100, 55 − 100
P (99, 45 ≤ X ≤ 100, 55) = P( ≤T ≤ ) = P (−2, 2 ≤ T ≤ 2, 2)
0, 25 0, 25
= P (T ≤ 2, 2) − P (T ≤ −2, 2) = P (T ≤ 2, 2) − (1 − P (T ≤ 2, 2))
= 0, 9861 − (1 − 0, 9861) = 0, 9722

2. On cherche h tel que

−h h
P (100 − h ≤ X ≤ 100 + h) = P( ≤T ≤ ) = 0, 95
0, 25 0, 25
h −h h h
= P (T ≤ ) − P (T ≤ ) = P (T ≤ ) − (1 − P (T ≤ ))
0, 25 0, 25 0, 25 0, 25
h
= 2P (T ≤ )−1
0, 25
h 0, 95 + 1
P (T ≤ ) = = 0, 975
0, 25 2
h
≈ 1, 9 ⇒ h ≈ 0, 475
0, 25

Échantillonnage et estimation 2 ESTIMATION
Deuxième partie
Échantillonnage
Généralement, nous obtenons les résultats statistiques par expérience. Trois problèmes se posent
alors :
1. Quelle confiance pouvons-nous avoir dans les valeurs statistiques considérées ?
2. Quelle est la loi de probabilité régissant ces résultats ?
3. Pouvons-nous déterminer si deux ensembles de mesures différents sont régis par la même loi ?
Nous allons nous intéresser à ces problèmes. Nous ne nous intéresserons qu’à des échantillons de taille
significative (ayant un effectif supérieur à 30).
1 Échantillons
Proposition 1.1 Considérons une population ayant une certaine propriété avec une moyenne m et un
écart-type σ. Soit X la variable aléatoire qui à tout échantillon aléatoire prélevé avec remise et d’effectif
n fixé, associe la moyenne de cet échantillon. Pour n suffisamment grand, X suit approximativement
la loi normale N (m, √σn ).
Exercice 1.1 Une machine fabrique des disques pleins en grande quantité. La variable aléatoire qui,
à chaque disque tiré au hasard, associe son diamètre suit la loi normale N (12, 8; 2, 1) (la moyenne vaut
12,8mm et l’écart-type vaut 2,1mm).
1. Quelle loi suit la variable aléatoire X qui, à tout échantillon aléatoire non es=xhaustif de taille
n = 49, associe la moyenne des diamètres des disques de cet échantillon ?
2. Déterminez un intervalle centré en 12,8 tel que la variable aléatoire prenne ses valeurs dans cet
intervalle avec la probabilité 0,95
3. Déterminez la taille que doit avoir un échantillon pour que la moyenne des diamètres des disques
prélevés ne s’écarte pas de 12,8 de plus de 0,2mm avec une probabilité de 0,95.
2 Estimation
C’est le problème inverse de l’échantillonnage : connaissant des renseignements sur un ou plusieurs
échantillons, on cherche à en déduire des informations sur la population totale.
Par exemple, à chaque élection, on nous assène que tel candidat fera 23,4% des voix. Puis, le lendemain,
seulement 19,6%. Pourquoi cet écart ? En fait, les nombres 23,4 et 19,6 n’ont aucun sens s’ils sont donnés
seuls. Evidemment, lorsqu’on interroge une partie de la population française, il est impossible de savoir
ce que pense exactement toute la population. On n’en obtient qu’une estimation. Et la précision de
l’estimation varie en fonction du nombre de personnes interrogées.
Lorsque qu’un sondage réalisé auprès de n personnes donne comme résultat p% d’intention de vote,
on peut trouver un intervalle [a, b], contenant p, tel que, avec un risque d’erreur inférieur à 5% par
exemple, le pourcentage réel d’intention de vote est compris entre a et b.
Exemple 2.1 Pour le second tour d’une élection présidentielle, un sondage crédite le candidat A de
53%. Est-on sûr pour autant qu’il va gagner ?
Les intervalles de confiance, avec un risque d’erreur de 5%, dépendent bien entendu du nombre n de
personnes interrogées.
Prenons l’exemple d’un institut de sondage qui, avant le second tour d’une élection présidentielle,
30 A. Fredet & J.-M. Gourdon - 2008 - 2009

interroge n électeurs. Parmi eux, 53% déclarent qu’ils vont voter pour le candidat A. Peut-il garantir
pour autant la victoire du candidat A avec un risque d’erreur inférieur ou égal à 5%. Il faut pour cela
que [50, 100] soit un intervalle de confiance pour l’estimation du paramètre Pourcentage de personnes
qui vont voter A. Ceci dépend bien sûr de la taille de l’échantillon interrogé. Plus n est grand, meilleure
est l’estimation.
Intervalle de confiance
L’intervalle de confiance est une forme de mesure de la confiance que l’on peut accorder à une
hypothèse concernant une valeur numérique mesurée, au vu de résultats de mesures de cette valeur.
Par définition, l’intervalle de confiance I(α) (au niveau de confiance α) relatif à une mesure M
constatée, est l’intervalle dans lequel, pour toute valeur p ∈ I(α), P (M = p) > α.
Plus le seuil de confiance est élevé, plus l’intervalle sera grand.
α = 0, 99
99 chances sur 100 que la valeur du paramètre re-
cherché se trouve dans l’intervalle de confiance mais
la précision autour de la valeur prédite est faible.
α = 0, 95
cherché se trouve dans l’intervalle de confiance et la
précision autour de la valeur prédite est correcte.
α = 0, 90
cherché se trouve dans l’intervalle de confiance mais
la précision autour de la valeur prédite est élevée.
Si on considère un niveau de confiance α, on commence par trouver tα tel que P (X ≤ tα ) = 1+α 2 . Soient
m et σ la moyenne et l’écart-type de la population globale, et soient me la moyenne de l’échantillon, σe
son écart-type et n l’effectif de l’échantillon. Le chapitre précédent nous dit que me suit la loi normale
N (m, √σn ).
Cela signifie que P (me − tα × √σn < m < me + tα × √σn ) = α. Cela implique donc que la moyenne m
appartient à l’intervalle [me − tα × √σn ; me + tα × √σn ] avec une probabilité de α.
σe σe
Définition 2.1 L’intervalle [me + tα × √ n
, me + tα × √ n
] est appellé intervalle de confiance pour la
moyenne m au niveau de confiance α. C’est à dire qu’il contient la vraie moyenne m avec une probabilite
de α.
Exemple 2.2 Supposons que le poids moyen trouve dans un échantillon de taille n = 100 prélevé
aléatoirement soit me = 10, 6.
Nous supposerons que σ est connu et vaut σ = 3. Sinon, comme on suppose que l’échantillon est
suffisamment grand, il est acceptable de remplacer σ par l’écart-type σe de l’échantillon L’intervalle de

confiance est [me + 1, 96 √σ100

e
, me + 1, 96 √σ100
e
] = [10, 012; 11, 188]. On peut donc dire que l’estimation
de m est 10, 6 ± 0, 588 avec un niveau de confiance de 95%.
Pour réduire l’amplitude de l’intervalle, il faut augmenter l’effectif de l’échantillon.
Remarque 2.1 Si α = 95% alors tα = 1, 96, si α = 99% alors tα = 2, 58.
Le calcul de l’intervalle de confiance dépend de la loi observée.
Proposition 2.1 Supposons que l’on considère un échantillon de n personnes, et que l’on cherche à
déterminer les paramètres n et p d’une loi binomiale. Supposons que ne et pe soient les paramètres de
l’échantillon. L’intervalle est donné par
r r
pe (1 − pe ) pe (1 − pe )
[pe − tα × , pe + tα × ]
n n
Exercice 2.1 Un test de fonctionnement d’un lot de 1000 ampoules donne 490 ampoules hors-service.
On souhaite déterminer la probabilité p qu’une ampoule a d’être en panne, ainsi qu’un intervalle de
confiance 95%.
Dans le cas d’une loi binomiale, pe est souvent inconnu. On le remplace alors par une valeur approxi-
mative (on verra au chapitre suivant comment trouver une telle valeur), ou par 12 qui nous donne un
intervalle d’amplitude fixée.
Exercice 2.2 On désire estimer la proportion p de personnes qui se déclarent favorables un certain
projet dans une population de taille importante.
1. Si lon a aucune idée idée a priori sur cette proportion, déterminez le nombre de personnes à
interroger avec un niveau de confiance de 99%, si l’erreur d’estimation est fixée 2% (cela signifie
que l’intervalle a une amplitude maximim de 0,02).
2. Finalement, on n’a interrogé finalement que 1000 personnes et on a trouvé une proportion de
53% des personnes pour le projet dans l’échantillon. Proposez un intervalle de confiance pour p
au niveau de confiance de 99%
Proposition 2.2 Si on considère un échantillon de n personnes, et que c’est une loi normale de
moyenne m, et si l’on cherche un niveau de confiance de α alors on commence par trouver tα tel que
P (X ≤ tα ) = 1+α
2 . L’intervalle est donné par
tα .m tα .m
[p − √ , p + √ ]
n n
Exemple 2.3 Reprenons l’exemple des élections présidentielles. La moyenne d’un échantillon étant
inconnu, on va supposer que m = 50% (50% des personnes vont voter pour ce candidat).
Soit α = 0, 95 dans ]0, 1[ le niveau de confiance que l’on souhaite. On cherche tα tel que P (X ≤ tα )) =
1+0,95
2 = 0, 975. On trouve tα = 1, 96. Un intervalle de confiance est donné par
1, 96 × 50 1, 96 × 50
I = [53 − √ , 53 + √ ]
n 2 n
Cela nous donne des intervzalles en fonction de n :
n = 100 [43, 2; 62, 8]
n = 1000 [49, 9; 56, 1]
n = 10000 [52; 54]
La première ligne signifie qu’au terme d’un sondage de 100 personnes, on peut affirmer avec un risque
d’erreur inférieur ou égal à 5% que le candidat A fera entre 43,2% et 63,8% des voix.

Échantillonnage et estimation 3 TEST D’AJUSTEMENT
Estimation de la moyenne
Soient m et σ la moyenne et l’écart-type de la population globale. Soient me la moyenne de
l’échantillon, σe son écart-type et n l’effectif de l’échantillon. Deux cas peuvent se présenter :
1. m est inconnue, σ, me et n sont connus :
Dans ce cas, l’intervalle de confiance de la moyenne m de la population avec le coefficent de
confiance α est
tα .σ tα .σ
[me − √ , me + √ ]
n n
2. m et σ sont inconnus, me , σe et n sont connus :
Dans ce cas, l’intervalle de confiance de la moyenne m de la population avec le coefficient de
confiance α est
tα .σe tα .σe
[me − √ , me + √ ]
n−1 n−1
Exemple 2.4 Dans une population P de grand effectif, on prélève de manière non exhaustive, un
échantillon de 100 personnes dont on note la masse en kg :
masse 62 64 68 10 74
ef f ectif 5 18 42 27 8
La moyenne et l’écart-type de cet échantillon sont me = 68kg et σe = 3kg.

L’intervalle de confiance de la moyenne m des masses des personnes de P au coefficient de confiance
95% est
3 3
m ∈ [68 − 1, 96 × √ ; 68 + 1, 96 × √ ] = [67, 4; 68, 6]
100 − 1 100 − 1
Exercice 2.3 Dans une station service, on suppose que le montant des chèques essence suit une loi
normale de paramètres m et s. On considère un échantillon de taille n = 50 et on obtient une moyenne
de 130 =Cet un écart-type de 28 =C. Donner une estimation de m par un intervalle de confiance au
niveau de confiance 95%.
3 Test d’ajustement
Nous cherchons maintenant à déterminer si des valeurs statistiques suivent une loi de probabilité.
Choix d’un modèle

Soit une distribution statistique d’effectifs ni . On cherche à savoir quelle loi régit cette série.
Exemple 3.1 On cherche à déterminer si un dé à 6 faces est non truqué. Pour cela, on effectue 600
lancers. On obtient les résultats suivants :
face 1 2 3 4 5 6
nombre d’apparitions ni 96 95 109 98 106 96
Le dé est-il truqué ?
Pour cela, on définit un modèle (équirépartition, binomial, Poisson, normal,...) P

dont les probabilités
pour les événements xi sont pi , avec des effectifs théoriques Ni = N × pi où N = i ni . On émet donc
une hypothèse sur la loi régissant cette série.

Exemple 3.2 Si on reprend l’exemple précédent du dé à 6 faces. En 600 lancers, on devrait avoir les
résultats suivants :
face 1 2 3 4 5 6
nombre d’apparitions théoriques Ni 100 100 100 100 100 100
Comparaison entre la théorie et la pratique

On s’intéresse à l’écart entre la théorie et la pratique : Ni − ni . Un grand écart étant plus important
qu’un petit,on prend le carré de ces écarts :(Ni − ni )2 . Et enfin, obtenir 95 alors qu’on attend 100,
ce n’est pas la même chose qu’obtenir 5 lorsqu’on attend 10. Il faut donc regarder l’écart relatif. On
calcule
X (ni − Ni )2
χ2cal =
i
Ni
Exemple 3.3 Si on reprend l’exemple précédent du dé à 6 faces. En 600 lancers, on devrait avoir les
résultats suivants :
face 1 2 3 4 5 6
nombre d’apparitions ni 96 95 109 98 106 96
nombre d’apparitions théoriques Ni 100 100 100 100 100 100
(Ni −ni )2
Ni 0, 16 0, 25 0, 81 0, 04 0, 36 0, 16
Donc χ2cal = 1, 78.
Seuil de confiance
On remarque que si χ2cal = 0 alors pour chaque classe ni = Ni et donc la variable suivrait exactement
la loi retenue comme modèle.
Plus la valeur numérique obtenue pour le χ2cal sera élevée, plus l’ajustement effectué sera discutable.
Il faut donc se fixer une mesure χ2T à ne pas dépasser. Cette mesure ne peut pas être trop basse, sinon
toutes les hypothèses seraient rejetées (si on reprend l’exemple, même un dé parfait non truqué ne
tombera pas exactement 100 fois sur chaque face).
La valeur limite dépend de la marge d’erreur que l’on accepte. Si l’on se fixe comme valeur limite 0, on
peut raisonnablement penser que 100% des hypothèses exactes seront rejetées. Si l’on se fixe comme
valeur limite 2, on peut penser que 80% des hypoths̀es exactes seront rejetées, et ainsi de suite... Plus
la valeur limite sera grande, plus le pourcentage d’hypothèses exactes et rejetées sera faible (mais plus
le nombre d’hypothèses fausses et acceptées sera grand). Cette valeur limite χ2T dépend donc de la
probabilité que l’on accepte de voir la mesure de χ2cal la dépasser alors que l’hypothèse est exacte.
Cette probabilité s’appelle le seuil de confiance. Il est généralement fixé à 5 %.
Degré de liberté
La valeur limite χ2T dépend également du nombre de classes considérées. Si on reprend l’exemple
du dé, le χ2cal obtenu avec un dé à 12 faces sera surement plus grand que le χ2cal obtenu avec un dé
(Ni −ni )2
à 6 faces. En effet, on ajoutera 12 valeurs positives Ni au lieu de 6... Cela s’appelle le degré de
liberté.
Exemple 3.4 Dans notre cas, le degré de liberté est 5 (on peut choisir 5 valeurs de lancers, la sixième
est déterminée automatiquement car la somme doit faire 600).

Plus généralement, le degré de liberté est égal à la différence entre :

– le nombre de valeurs que l’on considère
– le nombre de relations qui unissent ces nombres
Soit r le nombre de classes (toutes possédant au moins 5 unités). Le degré de liberté ν est

 1 si la loi est binomiale
ν =r− 2 si la loi est de Poisson
3 si la loi est normale

Décision finale
Cette valeur de χ2cal est donc comparée à un χ2 , dit χ2 théorique (noté χ2T ), fonction du modèle et
du nombre de données, lu dans la table suivante :
/p (seuil de confiance)
0, 90 0, 50 0, 10 0, 05 0, 02 0, 01 0, 001
ν (degré de liberté)
1 0, 016 0, 455 2, 706 3, 841 5, 412 6, 635 10, 827
2 0, 211 1, 386 4, 605 5, 991 7, 824 9, 210 13, 815
3 0, 584 2, 366 6, 251 7, 815 9, 837 11, 345 16, 266
4 1, 064 3, 357 7, 779 9, 488 11, 668 13, 277 18, 467
5 1, 610 4, 351 9, 236 11, 070 13, 388 15, 086 20, 515
6 2, 204 5, 348 10, 645 12, 592 15, 033 16, 812 22, 457
7 2, 833 6, 346 12, 017 14, 067 16, 622 18, 475 24, 322
8 3, 490 7, 344 13, 362 15, 507 18, 168 20, 090 26, 125
9 4, 168 8, 343 14, 684 16, 919 19, 679 21, 666 27, 877
En conséquence, si χ2cal < χ2T on adopte le modèle et sinon on rejette le modèle.
Exemple 3.5 Dans notre cas, avec un degré de liberté de 5 et un seuil de confiance de 5%, le χ2T vaut
11, 07. Notre χ2cal est inférieure à χ2T donc le dé n’est pas truqué.
Exercice 3.1 Un correcteur rend ses 100 copies au secrétariat d’un concours de recrutement de pro-
fesseurs. Par souci d’équité, la consigne est de noter les copies de manière telle que la distribution des
notes soit normale avec une moyenne de 10 et un écart-type de 4. Le secrétariat établit la distribution
suivante :
Intervalles Moins de 4 De 4 à 8 De 8 à 12 De 12 à 16 De 16 à 20
Effectifs 8 25 45 10 12
La moyenne est 9,7 et l’écart-type est 4,3. Au vu de ces résultats le responsable du concours convoque
le correcteur pour qu’il modifie ses notes qui seraient trop nombreuses entre 4 et 8. Le correcteur fait
valoir que la moyenne et l’écart-type sont approximativement ceux demandés et que les variations liées
à la répartition des copies en paquets de 100 expliquent sans doute la légère différence entre son paquet
et la distribution demandée. Le correcteur a-t-il raison de refuser de revoir ses notes ?
Conditions d’utilisation du χ2
Certaines conditions sont nécessaires pour appliquer cette méthode : il faut notamment que chaque
classe ait un effectif d’au moins 5 (sinon les effectifs sont trop petites pour être significatifs). Si ce n’est
pas le cas, on regroupera certaines classes :

Exemple 3.6 Un vendeur de voiture a noté le nombre de véhicules vendus durant une année (200
jours de travcail)
xi nombre de véhicules 0 1 2 3 4
ni nombre de jours 76 72 34 12 6
On calcule la moyenne : x̄ = 1 et la variance V (X) = 1, 06 qui est proche de 1. On peut donc penser
qu’une loi de Poisson de paramètre 1 peut approcher cette variable. On va utiliser le test du χ2 pour
vérifier cette hypothèse. Dans ce cas,
λ 1
p(X = i) = e−λ = e−1
i! i!
xi 0 1 2 3 4 5 et plus
ni 76 72 34 12 6 0 200
p(X = i) 0, 368 0, 368 0, 184 0, 061 0, 015 0, 004 1
Ni = N × p(X = i) 73, 6 73, 6 36, 8 12, 2 3 0, 8 200
P
La classe 5 et plus est envisagée pour que p(X = i) = 1. On ne veut considérer que des classes
d’effectifs plus grand que 5, il faut donc regrouper les 3 dernières :
xi 0 1 2 3 et plus total
ni 76 72 34 18 200
Ni = N × p(X = i) 73, 6 73, 6 36, 8 16 200
2
On a χ2 = i=1 (ni −N
P4 i)
Ni ≈ 0, 576. Dans la table, avec un degré de liberté de 2 et un seuil de 0,05, on
lit que χT = 5, 991. On a donc χ2cal < χ2T et donc on accepte le modèle.
2
Exemple 3.7 Une entreprise d’exploitation minière utilise une grande quantité de moteur qu’elle sou-
met à des conditions de travail difficile. Pour un type de moteur et un mode d’utilisation déterminés,
la durée de vie d’un moteur peut être considérée comme une variable aléatoire. Pour déterminer la loi
de probabilité, on dispose d’un échantillon de 50 durée de vie de moteurs :
durée de vie
nombres d’observations
(en semestres)
0 à 8 0
8 à 9 2
9 à 10 5
10 à 10, 5 7
10, 5 à 11 11
11 à 11, 5 11
11, 5 à 12 6
12 à 13 7
13 à 14 1
50

Échantillonnage et estimation 4 COMPARAISON D’ÉCHANTILLONS
On considère donc le tableau suivant :

durée (ni −Ni )2
effectifs réels ni effectifs théoriques Ni Ni
(en semestres)

8 à 9 2 1, 3
8 à 10 7 8, 45 0, 2488
9 à 10 5 7, 15
10 à 10, 5 7 7, 405 0, 0221
10, 5 à 11 11 9, 14 0, 3785
11 à 11, 5 11 9, 12 0, 3875
11, 5
à 12 6 7, 355
0, 2496
12 à 13 7 7, 055
12 à 14 9 8, 325 0, 0127
13 à 14 1 1, 27
2
χcal = 1, 2992
Il y a 6 classes, et on va chercher à savoir si cette variable suit une loi normale donc le degré de liberté
ν = 6 − 3 = 3. Si on s’intéresse à une probabilité de 5%, on lit que χ2T = 7, 815, nombre limite cherché.
On a χ2cal < χ2T donc on adopte ce modèle.
Exercice 3.2 On considère le nombre de pièces défectueuses sur un lot de 100 pièces. En définissant
X comme étant le nombre de pièces défectueuses par lot de 100 pièces, on obtient le tableau suivant :
X 0 1 2 3 4 5 6 7 8 9
ni 2 7 14 21 19 17 11 5 4 0 100 lots
Vérifier si cette production obéit à une loi binomiale B(100; 0, 04) ? à une loi B(100; 0, 03) ? à une loi
B(100; 0, 0392) ? une loi de Poisson de paramètre 4 ?
Exercice 3.3 On veut vérifier une machine ambaleuse de sacs de ciment ayant au moins un poids de
50kgs. On pèse 500 sacs et on obtient
poids nombre de sacs

< 45 35
45 − 47 53
47 − 49 76
49 − 51 100
51 − 53 88
53 − 55 78
55 − 57 42
> 57 28
500
Vérifier que l’emballage des sacs suit une loi normale dont on précisera la moyenne et l’écart-type (on
prendra 44 comme poids moyen des sacs de moins de 45 kg et 58 comme poids moyen des sacs de plus
de 57 kilos).
4 Comparaison d’échantillons
Supposons que l’on souhaite comparer un échantillon A à un échantillon B afin de savoir s’ils suivent
la même loi. Le problème dans ce cas, c’est que l’on manque de référence : il ne serait pas logique de
prendre l’échantillon A comme référence, pas plus qu’il ne serait logique de prendre l’échantillon B.
Il faut donc adopter une estimation, la meilleure possible des proportions qui nous intéressent. Si l’on

suppose que les deux échantillons proviennent de la même population et suivent la même loi, il parait
judicieux d’utiliser toutes les informations dont nous disposons et de réunir ces populations. Cela nous
fournira une référence. On construit ainsi l’hypothèse nulle qui, dans ce cas, ne dépend ni d’une loi
de probabilité, ni d’une distribution de référence, les proportions des différentes cat’egories étant donc
conservées d’une ligne à l’autre. On calculera ainsi les effectifs théoriques correspondant aux critères
pour les populations A et B, et l’on pourra alors utiliser le test du χ2 .
Exemple 4.1
A B total
25 35 60
95 65 160
total 120 100 220
On calcule le tableau des effectifs théoriques :
A B total
60
220× 120 = 32, 7 60 − 32, 7 = 27, 3 60
120 − 32, 7 = 87, 3 100 − 27, 3 = 72, 7 160
total 120 100 220
On a donc
(25 − 32, 7)2 (35 − 27, 3)2 (95 − 87, 3)2 (65 − 72, 7)2
χ2cal = + + + = 5, 48
32, 7 27, 3 87, 3 72, 7
On a calculé une seule fréquence de référence, il n’y a donc qu’un seul degré de liberté. La valeur du
χ2cal est de 5,48. Dans la table, avec un seuil e confiance de 5 %, le χ2T vaut 3,841 et avec un seuil
de confiance de 1 % le χ2T vaut 6,635. Les deux groupes se ressemblent donc significativement si on
considère un seuil de confiance de 5 % mais pas si on considère un seuil de confiance de 1 %.
Exercice 4.1 On a étudié sur deux échantillons la répartition des quatre groupes sanguins : O, A, B,
AB. Les résultats obtenus sont reportés dans un tableau suivant, à deux lignes et quatre colonnes :
Groupe O A B AB Total
1 er échantillon 121 120 79 33 353
2 ème échantillon 118 95 121 30 364
Total 239 215 200 63 717
Ces deux échantillons proviennent-ils de la même population ?
Exercice 4.2 Pour l’élection présidentielle, deux candidats sont en présence, S. R. et N. S. (pour ne
pas les nommer). Dans un village du Nord de la France, il y a 500 électeurs, dont 100 sont retraités,
50 sont chômeurs, et 350 sont actifs. Les résultats des élections sont (après décompte manuel) :
S.R. N.S. Blancs

Rentiers 35 10 5
Actif s 90 210 50
Retraités 70 23 7
Dans ce village, l’opinion dépend-elle de l’appartenance à un groupe social ?

Exercice 4.3 Une étude a été menée sur les facteurs pouvant influer sur le port de la ceinture de
sécurité par les conducteurs et les passagers de voitures de tourisme et de véhicules utilitaires. On
s’intéresse tout d’abord à l’effet du type d’occupation du véhicule (conducteur seul, conducteur +
passagers avant, conducteur + passagers arrière, conducteur + passagers avant et arrière) sur le port
de la ceinture par le conducteur. On dispose de 8374 observations concernant cette partie de l’étude.
Les données sont les suivantes :
Port ceinture non port de ceinture
Seul 2825 3468
Cond. + pass. avant 729 815
Cond. + pass. arrière 80 113
Cond. + pass. av. et arr. 168 176
Y-a-t-il un lien entre les deux variables Type d’occupation et Port de la ceinture ?

Échantillonnage et estimation 5 SOLUTIONS DES EXERCICES
5 Solutions des exercices

Solution 1.1 1. X suit une loi normale N (12, 8; √2,1
49
) = N (12, 8; 0, 3).
2. On cherche tα tel que P (X ≤ tα )) = 1+0,95 2 = 0, 975. On trouve tα = 1, 96. L’intervalle est donc
[12, 8 − 1, 96 × 2, 1; 12, 8 + 1, 96 × 2, 1] = [8, 684; 16, 916].
2,1 2,1 2
3. On cherche n tel que 1, 96 × √
n
≤ 0, 2. Il faut que n ≥ (1, 96 × 0,2 ) donc que n ≥ 424.
q
490 0,49×0,51)
Solution 2.1 On a pe = 1000 et tα = 1, 96. On considère l’intervalle [0, 49 − 1, 96 × 1000 , 0, 49 +
q
0,49×0,51)
1, 96 × 1000 ] = [0, 46; 0, 52]
1 1 1
Solution 2.2 L’amplitude de l’intervalle est tα × √
2 n
= 2, 58 × √
2 n
. On veut 2, 58 × √
2 n
≤ 0, 04, ce
2,58 2
qui implique que n ≥ ( 2×0,02 c’est à dire n ≥ 4161. Il faudrait donc interroger 4160 personnes.
) ,
q q
p ∈ [0, 53 − 2, 58 × 0,53×0,47
1000 ; 0, 53 + 2, 58 × 0,53×0,47
1000 ] = [0, 49; 0, 57]
Solution 2.3 m ∈ [130 − 1, 96 × √ 28 ; 130 + 1, 96 × √ 28 ] = [122, 16; 137, 84]

50−1 50−1
Solution 3.1 On calcule les effectifs de la distribution theorique obtenue en appliquant la loi normale
de moyenne donnee m et d’écart-type σ (dans l’exemple m = 10 et σ = 4). Par exemple, pour trouver
l’effectif de la classe De 8 à 12, on calcule la probabilité qu’une note soit comprise entre 8 et 12 :
P (8 ≤ X ≤ 12) = P (X ≤ 12) − P (X ≤ 8)
12 − 10 8 − 10
= P (T ≤ ) − P (T ≤ ) = P (T ≤ 0, 5) − P (T ≤ −0, 5)
4 4
= P (T ≤ 0, 5) − (1 − P (T ≤ 0, 5))
= 0, 6915 − (1 − 0, 6915) = 0, 383
Il y a 100 copies, donc il devrait y avoir 100× = 38, 3. En procédant ainsi, on complète donc le tableau
suivant :
Intervalles Moins de 4 De 4 à 8 De 8 à 12 De 12 à 16 De 16 à 20
Effectifs théoriquesNi 7, 3 24, 17 38, 29 24, 17 6, 06
Effectifs réels ni 8 25 45 10 12
(Ni −ni )2
Ni 0, 07 0, 03 1, 17 8, 31 5, 82 15, 4
Le degré de liberté est ν = 5 − 3 = 2 donc χ2T = 5, 991. On a χ2calc > χ2T donc on rejette le modèle et on
considère que les notes ne suivent pas une loi normale de moyenne 10 et d’écart-type 4. Le professeur
devrait revoir ses notes.
À titre anecdotique, on peut remarquer que l’écart entre la théorie et la pratique est plus grand sur
l’intervalle entre 16 et 20 que sur l’intervalle moins de 4.

Solution 3.2
X ni B(100; 0, 04)
(ni −Ni )2
Ni = 100Cx100 px (1− p)100−x Ni

0 2 1, 69
0 à 1 9 8, 72 0, 01
1 7 7, 03
2 14 14, 5 0, 02
3 21 19, 73 0, 08
4 19 19, 94 0, 04
5 17 15, 95 0, 07
6 11 10,52 0, 02
7  5  5, 89 
8 7 à 9 4 9 2, 85 10, 64 0, 25
9 0 1, 90
  
100 lots 100 χ2cal = 0, 49
Le tableau comporte maintenant 7 lignes, et on teste une loi binomiale donc ν = 7 − 1 = 6 donc
χ2T = 12, 592. On a χ2calc < χ2T donc ce modèle est bon.
X ni B(100; 0, 03)
(ni −Ni )2
Ni = 100Cx100 px (1
− p)100−x Ni

0 2 4, 76
0 à 1 9 19, 46 5, 62
1 7 14, 7
2 14 22, 52 3, 22
3 21 22, 75 0, 13
4 19 17, 06 0, 22
5 17 10, 13 4, 66
6 11 4, 96
 7, 35
7  5  2, 06 
8 7 à 9 4 9 0, 74 3, 12 11, 08
9 0 0, 32
  
100 lots 100 χ2cal = 32, 28
On a χ2cal > χ2T = 12, 592 donc on rejette le modèle.
X ni B(100; 0, 0392)
(ni −Ni )2
Ni = 100Cx100 px (1 − p)100−x Ni

0 2 1, 83
0 à 1 9 9, 31 0, 01
1 7 7, 48
3 21 20, 14 0, 04
4 19 19, 92 0, 04
5 17 15, 6 0, 12
6 11 10,08 0, 08
7  5  5, 52 
8 7 à 9 4 9 2, 62 9, 84 0, 07
9 0 1, 7
  
100 lots 100 χ2cal = 0, 36

Ce modèle est très bon.

X ni P (4)
x (ni −Ni )2
Ni = 100 × e−4 4x! Ni

0 2 1, 83
0 à 1 9 9, 16 0
1 7 7, 33
2 14 14, 65 0, 03
3 21 19, 54 0, 11
4 19 19, 54 0, 01
5 17 15, 63 0, 12
6 11 10,42 0, 03
7  5  5, 95 
8 7 à 9 4 9 2, 98 11, 06 0, 39
9 0 2, 13
  
100 lots 100 χ2cal = 0, 69
Le tableau comporte maintenant 7 lignes, et on teste une loi de Poisson donc ν = 7 − 2 = 5 donc
χ2T = 11, 07. Là encore, le modèle est bon.
Solution 3.3
ni (xi −m)2
poids ni = nombre de sacs xi = centre de classe ni xi 500
< 45 35 44 1540 3, 2178
45 − 47 53 46 2438 2, 4219
47 − 49 76 48 3648 1, 1247
49 − 51 100 50 5000 0, 1217
51 − 53 88 52 4576 0, 262
53 − 55 78 54 4212 1, 6175
55 − 57 42 56 2352 2, 2889
> 57 28 58 1624 2, 9191
total 500 25390 13, 9736
√
la moyenne est de 25390
500 = 50, 78 kilos et l’écart-type est 13, 9736 ≈ 3, 74. On peut donc penser que
les poids suivent une loi normale N (50, 78; 3, 74).
xi −m
poids nombre de sacs σ Π(t1 ) Π(t2 ) Ni = 500(Π(t2 ) − Π(t1 ))
(t1 < ∗ < t2 )
< 45 35 < −1, 54 0 0, 06178 30, 89
45 < ∗ < 47 53 −1, 54 < ∗ < −1, 01 0, 06178 0, 15625 47, 235
47 < ∗ < 49 76 −1, 01 < ∗ − 0, 48 0, 15625 0, 31561 79, 68
49 < ∗ < 51 100 −0, 48 < ∗ < 0, 06 0, 31561 0, 52392 104, 155
51 < ∗ < 53 88 0, 06 < ∗ < 0, 6 0, 52392 0, 72575 100, 915
53 < ∗ < 55 78 0, 6 < ∗ < 1, 13 0, 72575 0, 87076 72, 505
55 < ∗ < 57 42 1, 13 < ∗ < 1, 66 0, 87076 0, 95154 40, 39
> 57 28 > 1, 66 0, 95154 1 24, 23
500 500
donc
(35 − 30, 89)2 (53 − 47, 235)2 (76 − 79, 68)2 (100 − 104, 155)2
χ2cal = + + +
30, 89 47, 235 79, 68 104, 55
2 2 2
(88 − 100, 915) (78 − 72, 505) (42 − 40, 39) (28 − 24, 23)2
+ + + +
100, 915 72, 505 40, 39 24, 23
≈ 4, 306

On regarde le tableau du χ2T avec ν = 8 − 3 = 5. On a χT = 11, 07 et donc χ2cal < χ2T et on accepte le
modèle.
Solution 4.1 On utilise le tableau des effectifs théoriques suivants :
Groupe O A B AB Total
population globale 239 215 200 63
717 717 717 717
1 er échantillon 353 × 239 ≈ 117, 7 353 × 215 ≈ 105, 9 353 × 63 ≈ 98, 5 353 − (117, 7 + 105, 9 + 98, 5) = 31, 1 353
717 717 717
2 ème échantillon 239 − 117, 7 ≈ 121, 3 215 − 105, 9 ≈ 109, 1 200 − 98, 5 ≈ 101, 5 364 − (121, 3 + 109, 1 + 101, 5) = 32, 1 364
Total 239 215 200 63 717
on peut alors calculer
(121 − 117, 7)2 (120 − 105, 9)2 (79 − 98, 5)2 (33 − 31, 1)2
χ2cal = + + +
117, 7 105, 9 98, 5 31, 1
118 − 121, 3)2 (95 − 109, 1)2 (121 − 101, 5)2 (30 − 32, 1)2
+ + + +
121, 3 109, 1 101, 5 32, 1
≈ 11, 74
On a calculé trois fréquences théoriques, le degré de liberté est donc 3. Avec un seuil de confiance de 5
%, le χ2T est de 7,815 donc χ2cal > χ2T et on rejette l’hypothèse. Cela signifie que les deux échantillons
ne proviennent pas de la même population.
Solution 4.2 On complète le tableau précédent :
S.R. N.S. Blancs

Rentiers 35 10 5 50
Actif s 90 210 50 350
Retraités 70 23 7 100
195 243 62 500
On en déduit la répartition théorique dans le cas où les votes sont indépendants :
S.R. N.S. Blancs

195×50 243×50
Rentiers 500 = 19, 5 500 = 24, 3 50 − (19, 5 + 24, 3) = 6, 2
195×350 243×350
Actif s 500 = 136, 5 500 = 170, 1 350 − (136, 5 + 170, 1) = 43, 4
195×100 243×100
Retraités 500 = 39 500 = 48, 6 100 − (39 + 48, 6) = 12, 4
On a donc
(19, 5 − 35)2 (24, 3 − 10)2 (12, 4 − 7)2
χ2calc = + + ··· + = 87, 649
19, 5 24, 3 12, 4
On a (3 − 1) × (3 − 1) = 4 degrés de liberté. Pour un test au niveau 5%, on lit par conséquent dans
la table une borne de rejet égale à χ2T = 9, 488. La valeur observée étant supérieure à χ2T , on rejette
l’hypothèse donc on conclut que le groupe social influe sur l’opinion.
Solution 4.3 On complète le tableau précédent :

Seul 2825 3468 6293
Cond. + pass. avant 729 815 1544
Cond. + pass. arrière 80 113 193
Cond. + pass. av. et arr. 168 176 344
3802 4572 8374

On en déduit la répartition théorique dans le cas où il n’y aurait pas de lien :

Seul 2 6293×3802
8374 ≈ 2857, 18 6293 − 2857, 18 ≈ 3435, 82 6293
1544×3802
Cond. + pass. avant 8374 ≈ 701, 01 1544 − 701, 01 ≈ 842, 99 1544
193×3802
Cond. + pass. arrière 8374 ≈ 87, 63 193 − 87, 63 ≈ 105, 37 193
Cond. + pass. av. et arr. 3802 − (2857, 18 + 701, 01 + 87, 63) ≈ 156, 18 344 − 156, 18 ≈ 187, 82 344
3802 4572 8374
On a donc
(2857, 18 − 2825)2 (3435, 82 − 3468)2 (187, 82 − 176)2
χ2calc = + + ··· + ≈ 5, 56
2857, 18 3435, 82 187, 82
On a (4 − 1) × (2 − 1) = 3 degrés de liberté. Pour un test au niveau 5%, on lit par conséquent dans
la table une borne de rejet égale à χ2T = 7, 815. La valeur observée étant supérieure à χ2T , on accepte
l’hypothèse donc on conclut que le type de remplissage de la voiture n’influe pas sur le port de la
ceinture.

Échantillonnage et estimation
Troisième partie
Tableur
Un tableur peut être d’une grande aide dans le calcul de statistiques et de probabilités, notamment
avec les fonctions suivantes :
Statistiques à une variable

MODE() MEDIANE() MOYENNE()
VARIANCE()
MAX() QUARTILE() MOYENNE.GEOMETRIQUE()
ECARTYPE()
MIN() CENTILE() MOYENNE.HARMONIQUE()
Graphiques
Graphiques
Courbe de tendance
Régression linéaire
DROITEREG
COEFFICIENT.CORRELATION
INDEX(DROITEREG())
ORDONNEE.ORIGINE
Combinatoire
COMBIN()
PERMUTATION()
Probabilités
LOI.BINOMIALE() LOI.POISSON() LOI.NORMALE()
Intervalle de confiance
INTERVALLE.CONFIANCE()
Test d’ajustement
TEST.KHIDEUX() LOI.KHIDEUX() KHIDEUX.INVERSE()

Probabilite Echantillonage

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Probabilite Echantillonage

Transféré par

Droits d'auteur :

Formats disponibles

Probabilités - Échantillonnage

Table des matières

3 Probabilités liant deux événements 6

9 Solutions des exercices 20

5 Solutions des exercices 40

2 A. Fredet & J.-M. Gourdon

Exemple 2.1 Si E = {a, b, c, d, e} alors (a, b, d, c) et (a, c, d, b) sont deux permutations de E.

Proposition 2.1 Le nombre de permutations d’un ensemble de n éléments, n ≥ 1, est égal à

Proposition 2.2 Si un ensemble E contient n éléments, n ≥ 1, alors

3 A. Fredet & J.-M. Gourdon

Proposition 2.4 On a et p−1 p

p−1 p (n − 1)! (n − 1)!

Proposition 2.5 (Formule du binôme) Soient a et b deux réels et n un entier. Alors

4 A. Fredet & J.-M. Gourdon

5 A. Fredet & J.-M. Gourdon

3 Probabilités liant deux événements

Donc p(A ∪ B) = p(A ∩ B) + p(Ā ∩ B) + p(A ∪ B̄) car (A ∩ B) ∩ (Ā ∩ B) ∩ (A ∪ B̄) = ∅. Or

6 A. Fredet & J.-M. Gourdon

équipe jaune équipe verte

p(A ∪ B) = p(A) × p(B/A) = p(B) × p(A/B).

Proposition 3.3 Si A est inclus dans B alors p(A ∩ B) = p(A) et pB (A) = 1.

7 A. Fredet & J.-M. Gourdon

On choisit une personne au hasard.

p( homme aux yeux verts) 0, 1128

p( femme aux yeux pas verts) 0, 3498

8 A. Fredet & J.-M. Gourdon

Variable aléatoire discrète

9 A. Fredet & J.-M. Gourdon

La variance de la v.a. X est le nombre réel noté V(X) et défini par :

V (X) = E(X 2 ) − [E(X)]2 .

10 A. Fredet & J.-M. Gourdon

(c) Si la somme est 5, on ne gagne rien

Variable aléatoire continue

11 A. Fredet & J.-M. Gourdon

12 A. Fredet & J.-M. Gourdon

p(X = k) = Cnk pk (1 − p)n−k avec k entier

X suit une loi binômiale B(n, p) de paramètres n et p.

Proposition 6.1 Si X suit une loi binômiale B(n, p) de paramètres n et p, alors

13 A. Fredet & J.-M. Gourdon

La somme des probabilité fait 1 :

14 A. Fredet & J.-M. Gourdon

15 A. Fredet & J.-M. Gourdon

16 A. Fredet & J.-M. Gourdon

17 A. Fredet & J.-M. Gourdon

18 A. Fredet & J.-M. Gourdon

19 A. Fredet & J.-M. Gourdon

9 Solutions des exercices

Solution 2.3 Pour le tiercé, il y a 8 × 7 × 6 = 336 possibilités. Pour le tiercé, il y a 8 × 7 × 6 × 5 = 1680

Solution 2.4 Pour chaque chiffres du nombre, j’ai 3 possibilités. Il y a donc 3 × 3 × 3 × 3 = 34 = 81

Solution 2.5 Il y a 4023 possibilités.

20 A. Fredet & J.-M. Gourdon

3. que le candidat A soit seul reçu = p(A ∩ B̄) = p(A) × p(B̄) = 43 × 13 = 1

21 A. Fredet & J.-M. Gourdon

Solution 3.5 Calculons le nombre de possibilités pour obtenir 11 et 12 :

total 11 nbr de cas total 12 nbr de cas

Solution 3.6 X(Ω) = {0; 1; 2; 3; 4} et Y (Ω) = {0; 1; 2; 3; 4}. Soient

Soit p(N ) la probabilité que le match soit nul. On a

p(N ) = p((X = 0) ∩ (Y = 0)) + p((X = 1) ∩ (Y = 1)) + p((X = 2) ∩ (Y = 2))

Solution 3.7 – raisonnement direct :

22 A. Fredet & J.-M. Gourdon

Solution 3.10 Soit A l’événement il a la maladie Ma et B l’événement il a la maladie Mb . On a le

Solution 3.11 Les trois événements sont indépendants. On a donc

23 A. Fredet & J.-M. Gourdon