Vous êtes sur la page 1sur 37

Calcul des probabilités

Aperçu historique

C’est au dix-septième siècle, avec l’étude de certains jeux de hasard, que le calcul des probabilités com-
mença à se développer. Les grands mathématiciens et éminents savants qui ont contribué à son essor,
tels Blaise Pascal (1623-1662), Pierre de Fermat (1601-1665), Christian Huygens (1629-1695) et plus tard
Jacques Bernoulli (1654-1705), Abraham de Moivre (1667-1754), Pierre-Simon de Laplace (1749-1827)
et Carl-Friedrich Gauss (1777-1855), ont très tôt senti l’intérêt du calcul des probabilités pour l’étude
de toutes les lois (physiques notamment) régissant les événements aléatoires. Aujourd’hui, le calcul des
probabilités est très proche d’autres branches mathématiques de pointe. Sa connaissance (comme celle
de sa discipline soeur : la statistique) est devenue fondamentale dans de très nombreuses disciplines, qu’il
s’agisse de la physique, de la chimie, de la biologie, de la médecine, de la psychologie, de la sociologie, de
l’économie, des sciences politiques, de l’éducation, de la recherche opérationnelle et de tous les domaines
de la technique.

Introduction

Nous allons introduire la notion de probabilité au travers de quelques exemples simples.

Exemple 1 Lorsqu’on lance une pièce de monnaie, il y a 1 chance sur 2 qu’elle tombe sur le côté pile,
respectivement face.

Si on jette un dé bien équilibré, il y a 1 chance sur 6 qu’il tombe sur la face 3. Le résultat est diffé-
rent pour les occurrences suivantes.

Obtenir Chances que tel soit le cas


... un résultat pair 3 chances sur 6
... un résultat strictement supérieur à 4 2 chances sur 6
... inférieur ou égal à 3 3 chances sur 6

Exemple 2 Lorsqu’on lance simultanément deux dés, il y a en fait, 36 = 62 issues possibles.

1
On peut alors aisément déterminer les chances que se produisent les événements suivants.

Obtenir Chances que tel soit le cas


... une somme supérieure ou égale à 8 15 chances sur 36
... une seule fois la face 6 10 chances sur 36
... au moins une fois 5 11 chances sur 36
... les deux mêmes faces 6 chances sur 36

Définitions

Un événement aléatoire 1 est un événement dont la réalisation ou la non-réalisation dépend du hasard.


Dans chacun des exemples précédents, on est en présence d’un certain nombre de possibilités ou de configu-
rations possibles, dont on admet qu’elles ont les mêmes chances de se réaliser. On dit que ces cas possibles
sont d’égale vraisemblance. Ces cas possibles s’excluent mutuellement (deux d’entre eux ne peuvent pas
se produire simultanément) : on dit qu’ils sont incompatibles.

Les cas limites sont aussi considérés comme des événements ; ainsi, l’événement certain ⌦ qui est tou-
jours réalisé et l’événement impossible ; qui ne peut jamais l’être. Dans le cas du lancer d’un dé, ⌦ est
l’événement : « on obtient un nombre entier ». L’événement « on obtient 7 » est impossible.

Définition de Laplace

Pour calculer la probabilité P (A) d’un événement aléatoire A, on dénombre le nombre n(A) de cas, parmi
les N cas possibles (d’égale vraisemblance), pour lesquels l’événement A est réalisé. On dit que n(A)
est le nombre de cas favorables à l’événement A. Par définition 2 , on pose alors

nombre de cas favorables à A n(A)


P (A) = = .
nombre de cas possibles N

On dira que deux événements A et B sont équiprobables s’ils ont la même probabilité. Dans la définition
de Laplace, on considère donc que tous les cas possibles sont des événements équiprobables.
1. alea signifie dé en latin.
2. Cette définition est due au Marquis Pierre Simon de Laplace : astronome, mathématicien et physicien français
(1749-1827).

2
Remarque Bien qu’il existe une définition axiomatique plus générale de la notion de probabilité, les
résultats principaux peuvent être obtenus à partir de la définition précédente.

Exemple Un sac contient 12 jetons numérotés de 1 à 12. On tire, un à un, deux jetons, sans remettre le
premier jeton après tirage. On cherche alors à calculer la probabilité de l’événement A = « obtenir deux
numéros pairs ». Il y a
N = 12 · 11 = 132
cas possibles. Le nombre de cas favorables est, quant à lui, n(A) = 6·5 = 30 . La probabilité de l’événement
A est donc
n(A) 30 5 ⇠
P (A) = = = = 22,73%
N 132 22

Notons que, dans le cas où l’expérience aurait consisté à tirer les jetons en remettant le premier dans
l’urne, alors on aurait eu N = 12 · 12 = 144 , n(A) = 6 · 6 = 36 et donc

36 1
P (A) = = = 25%
144 4

Analyse combinatoire - Dénombrement


Pour appliquer la définition de Laplace, il faut être en mesure de déterminer les nombres n(A) et N , donc
de dénombrer (compter) les cas favorables et les cas possibles. Les techniques qui permettent d’y parvenir
sont appelées techniques de dénombrement .

Les arbres
Cette technique est indiquée dans les cas où on tient compte de l’ordre dans lequel se produisent les
événements.

Exemple On se demande combien de mots différents de trois lettres il est possible de composer avec
un A, un B et un C.

En représentant l’arbre correspondant, on obtient non seulement le nombre de mots, à savoir 6 = 3 · 2 · 1 ,


mais encore tous les mots possibles.

Avec 4 lettres (A, B, C et D) le nombre de mots composables est 4 · 3 · 2 · 1 = 24. Avec 5 lettres différentes,
on en compose 5 · 4 · 3 · 2 · 1 = 120.

La fonction factorielle

Si n 2 N est un entier naturel quelconque, alors on définit l’entier appelé n factorielle et noté n! comme
suit
n! = n · (n 1) · · · 2 · 1, 0! = 1

3
Jeux de mots
Exemple 1 On se demande combien de mots de 5 lettres on peut former avec les 26 lettres de l’alphabet
choisies avec et sans remise.

Si l’on procède avec remise et qu’on n’exige pas que les lettres soient toutes distinctes, alors le nombre
de mots est égal à 265 = 11881376 . Si on procède sans remise , ce qui signifie que les lettres sont toutes
distinctes, alors 26 lettres peuvent être placées en première position. Ce choix étant fait, 25 lettres peuvent
être placées en deuxième position, puis 24 en troisième, 23 en quatrième et 22 en dernière position. Le
nombre de mots possibles est donc égal à
26!
26 · 25 · 24 · 23 · 22 = = 7893600.
21!

Exemple 2 On se pose maintenant la question suivante : combien de mots différents peut-on écrire avec
toutes les lettres des mots LUNE, PAPE, LILLE, ALLELE, MISSISSIPPI.

Pour le mot LUNE , le cas est clair : il y a 4! = 24 mots différents puisque les 4 lettres sont dis-
tinctes.

Pour le mot PAPE , la situation est plus complexe puisque deux lettres sont identiques. Supposons
que les deux P soient de couleurs différentes. Il y a alors 4! mots colorés différents. Notons qu’un groupe
de 2 = 2! mots colorés conduit au même mot unicolore puisqu’il y a 2 façons de placer les P sans changer
4!
le «sens» du mot. On peut donc composer = 12 mots différents.
2!

Pour le mot LILLE , un groupe de 3! = 6 mots colorés donnera lieu au même mot. En effet, la position
des L étant fixée, 3 L peuvent être placés en première position, puis 2 en deuxième et 1 en dernière. Les
5!
5! = 120 mots colorés conduisent donc à = 20 mots différents.
3!
Comme le mot ALLELE compte 3 L et 2 E, le nombre de mots de 6 lettres qu’on peut composer

4
6!
sera donc = 60.
3! · 2!
11!
Avec les lettres du mot MISSISSIPPI (4 S, 4 I et 2 P), on peut donc composer = 34650
4! · 4! · 2!
mots différents.

Coefficients binomiaux et triangle de Pascal


Définition fondamentale On appelle coefficient binomial , et on note nk , le nombre de sous-ensembles
à k éléments que l’on peut former avec les éléments d’un ensemble qui en contient n. Autrement dit
✓ ◆
n
k
est le nombre de façons de choisir un lot de k objets parmi n objets différents .

n
Notation Le coefficient binomial k est parfois aussi noté Cnk .

Exemples Avec cette définition, il est possible de déterminer les valeurs de quelques coefficients bino-
miaux simples, tels par exemple
✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆
2 4 3 4 72 n 2 5
= 2, = 4, = 3, = 6, = 72, = n, = 0, = 1.
1 1 2 2 1 1 4 0

Exemple Combien de menus différents peut-on composer avec les 5 aliments : viande (V), légumes (L),
pâtes (P), riz (R), fruits (F).

Aliments Nombre Menus

5
0 0 =1 l’assiette vide

5
1 1 =5 V, L, P, R, F

5
2 2 = 10 VL, VP, VR, VF, LP, LR, LF, PR, PF, RF

5
3 3 = 10 PRF, LRF, LPF, LPR, VRF, VPF, VPR, VLF, VLR, VLP

5
4 4 =5 VLPR, VLPF, VLRF, VPRF, LRPF

5
5 5 =1 VLPRF

On constate que ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆
5 5 5 5 5 5
= = =
2 3 1 4 0 5

Propriété 1 Pour tous les n, k 2 N, la relation suivante est vérifiée


✓ ◆ ✓ ◆
n n
=
k n k

5
Preuve A tout choix de k objets parmi n, correspond un choix de n k objets parmi n.

Exemples On a ainsi

✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆
7 7 13 13 194 194 1000 1000
= , = , = , = = 1000
4 3 11 2 17 177 999 1

Propriété 2 On a la relation suivante

✓ ◆ ✓ ◆ ✓ ◆
n n 1 n 1
= + .
k k 1 k

Exemple Ainsi, par exemple

✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆
12 11 11 10 9 9
= + = +
7 7 6 3 3 2

12 11 11
Preuve Nous allons établir que 7 = 7 + 6 , en racontant une histoire. Supposons que le chat
Tom doive choisir 7 souris parmi 12 souris. De son point de vue, il a 12 7 choix. La souris Jerry, qui fait
partie du lot, se pose une question existentielle. Combien de choix (heureux) du chat l’épargneront et
combien de choix (malheureux) lui coûteront la vie. Il y a évidemment 11 7 choix heureux (le chat choisit
7 souris parmi les 11 amies de Jerry) et 11
6 choix malheureux (le chat choisit Jerry et 6 souris parmi les
11 amies). Ainsi

Choix du chat = Choix heureux + Choix malheureux

✓ ◆ ✓ ◆ ✓ ◆
12 11 11
= + .
7 7 6

6
Le triangle de Pascal

Grâce à l’identité précédente, il est possible de construire, de proche en proche, un tableau de nombres
contenant les coefficients binomiaux. On appelle ce tableau triangle de Pascal 3

3. Blaise Pascal, savant, penseur et écrivain français, (Clermont-Ferrand 1623 - Paris 1662).

7
Triangle de Pascal et identités remarquables

À l’école obligatoire, on enseigne les identités remarquables

(A + B)2 = A2 + 2AB + B 2 (A + B)3 = A3 + 3A2 B + 3AB 2 + B 3

En fait il existe une telle identité pour tout binôme (A + B)n , dont le développement fait intervenir les
coefficients binomiaux .

Propriété 3 Calcul direct des coefficients binomiaux


✓ ◆
n n!
=
k k! · (n k)!

Preuve Nous allons établir, par exemple, que


✓ ◆
7 7!
=
3 3! · 4!

en répondant de deux manières à la question suivante : « combien de mots de 3 lettres différentes peut-on
composer avec les 7 lettres S, S, S, E, E, E, E » ?
1. Il y a 3 S et 4 E. Le nombre de mots différents est donc égal à
7!
3! · 4!
2. Le nombre de mots est égal au nombre de façons de choisir 3 emplacements où poser les S parmi
les 7 places formant le mot
S S S
Il y a ✓ ◆
7
3
tels choix.
En comparant les deux résultats, on obtient bien la relation
✓ ◆
7 7!
=
3 3! · 4!

8
Exemples Avec cette formule, on peut calculer directement, par exemple
✓ ◆ ✓ ◆
42 42! 100 100! 100 · 99 · 98 · 97! 100 · 99 · 98
= = 5245786, = = = = 161700
6 6! · 36! 3 3! · 97! 6 · 97! 6
Notons encore, par exemple, que ✓ ◆
7 7! 1
=1= =
0 0! · 7! 0!
ce qui justifie que 0! = 1.

Exercices-types résolus
Quarté Dix chevaux participent à une course soumise à des paris consistant à deviner l’ordre des quatre
premiers arrivés. Quelle est la probabilité de deviner le quarté dans le désordre ?

Solution Le nombre de cas possibles est


10!
N = 10 · 9 · 8 · 7 = = 5040
6!
1. 2. 3. 4.
7 5 1 2

Le nombre de cas favorables (dans lesquels on a les 4 bons chevaux) est donné par n = 4! 1 = 23 (on
exclut le cas du quarté dans l’ordre). La probabilité cherchée vaut donc
23 ⇠
p= = 0,456%
5040

Loterie à numéros Cette loterie consiste à deviner les 6 numéros qui seront extraits d’une urne conte-
nant 42 numéros. Déterminer la probabilité de deviner 2 numéros gagnants exactement.

Solution L’ordre dans lequel sortent les numéros n’ayant ici aucune importance, le nombre de cas
possibles est donc ✓ ◆
42
N= = 5245786
6
Un cas favorable comporte 2 bons numéros parmi 6 ( 62 = 15 choix) et 4 mauvais numéros parmi 36
( 36
4 = 58905 choix). Le nombre de cas favorables est donc
✓ ◆ ✓ ◆
6 36
n= · = 15 · 58905 = 883575
2 4

9
Ainsi, la probabilité demandée vaut
883575 ⇠
p= = 16,84%
5245786
Plus généralement, on peut calculer les probabilités de deviner 0, 1, ... , 6 numéros gagnants.

Le nombre n(k) de cas favorables à l’événement « jouer k numéros gagnants » est donné par
✓ ◆ ✓ ◆
6 36
·
k 6 k
et la probabilité correspondante est donc
6 36
k · 6 k
P (k) = 42
6

On en déduit le tableau ci-dessous.


Numéros Cas Probabilités
gagnants favorables en %
k n(k) P (k)
6 1 0,00001906
5 216 0,004118
4 9450 0,1801
3 142800 2,722
2 883575 16,844
1 2261952 43,119
0 1947792 37,131
Sommes 5245786 100,000

Il est donc plus facile d’obtenir un numéro gagnant qu’aucun !

À retenir : les loteries sont un impôt prélevé sur l’ignorance des statistiques !

Questionnaire à choix multiples Un questionnaire à choix multiples (QCM) contient 10 questions,


chacune assortie de 3 réponses, dont une seule est correcte. Un étudiant répond de manière totalement
aléatoire à ce questionnaire. Calculer la probabilité qu’il donne exactement 4 réponses correctes.

A B C
1. Oderint dum metuant x
2. Summum jus summa injuria x
.. ..
. .
10. Repetitio est mater studiorum x

Solution Comme il y a 3 réponses pour chacune des 10 questions, le nombre de cas possibles est

N = 310 = 59049

Un cas favorable comporte 4 questions avec une réponse correcte ( 104 = 210 choix) et 6 questions avec
une réponse erronée. Comme il y a 2 façons de se tromper pour chacune d’elles, le nombre de cas favorables
est donc ✓ ◆
10
n= · 26 = 13440
4
13440 ⇠
D’où la probabilité cherchée p = = 22,76% .
59049

10
De ce qui précède, on conclut que le nombre de façons de répondre correctement à k questions est donné
par ✓ ◆
10
n(k) = · 210 k
k
Ce qui conduit à la probabilité correspondante

10
k · 210 k
P (k) =
310

D’où le tableau ci-dessous.


Réponses Cas Probabilités
correctes favorables en %
k n(k) P (k)
10 1 0,002
9 20 0,034
8 180 0,305
7 960 1,626
6 3360 5,690
5 8064 13,656
4 13440 22,761
3 15360 26,012
2 11520 19,509
1 5120 8,671
0 1024 1,734
Sommes 59049 100,000

On constate qu’il est très difficile d’obtenir 0 point à un QCM !

Le problème des anniversaires Calculer la probabilité que, parmi 4 personnes présentes dans une
salle, au moins deux d’entre elles aient leur anniversaire le même jour de l’année. (Pour simplifier, on
considère que ces personnes sont toutes nées une année non bissextile). À partir de combien d’individus,
cette probabilité est-elle supérieure à 50% ?

Solution Comme il y a 365 dates de naissances possibles pour chacune des 4 personnes, le nombre de
cas possibles est N = 3654 . Un cas est défavorable quand les 4 personnes sont nées à des dates différentes ;
il y a donc
365! 365!
d(4) = 365 · 364 · 363 · 362 = =
361! (365 4)!
tels cas. Le nombre de cas favorables est donc
365!
n(4) = 3654
(365 4)!

et la probabilité cherchée est égale à

365!
3654
(365 4)! 365!
P (4) = =1 = 1,636%
3654 (365 4)! · 3654

On généralise facilement pour trouver

365!
P (k) = 1
(365 k)! · 365k

11
D’où le tableau ci-dessous :
Nombre de Probabilités
personnes en %
k P (k)
2 0,274
5 2,714
10 11,695
15 25,290
20 41,144
22 45,570
23 50,730
40 89,123
50 97,037

A partir de 23 personnes, cette probabilité dépasse 50%.

La loi d’addition

On tire au hasard un billet de loterie parmi 40 billets numérotés de 1 à 40 et on considère les événements
suivants : A = « obtenir un multiple de 3 » et B = « obtenir un multiple de 4 ». Les probabilités de ces
deux événements sont alors données par

n(A) 13 n(B) 10 1
P (A) = = et P (B) = = =
N 40 N 40 4

À partir des événements A et B, on définit deux nouveaux événements :

A ou B = « obtenir un numéro qui soit multiple de 3 ou multiple de 4 »,


A et B = « obtenir un numéro qui soit à la fois multiple de 3 et multiple de 4 ».
Par dénombrement des cas favorables, on déduit alors que

n(A ou B) 20 1 n(A et B) 3
P (A ou B) = = = et P ( A et B ) = =
N 40 2 N 40

En observant un diagramme de Venn représentant l’ensemble des cas possibles, on constate qu’en addi-
tionnant les cas favorables n(A) + n(B), on compterait deux fois les cas qui sont favorables, à la fois, aux
événements A et B. En fait, on a n(A ou B) = n(A) + n(B) n(A et B) . En divisant l’égalité précédente
par N , on obtient ladite loi d’addition

P (A ou B) = P (A) + P (B) P (A et B)

Il s’agit là d’une loi générale du calcul des probabilités.

12
Probabilité conditionnelle
Parmi 4 jetons, numérotés de 1 à 4, on en tire successivement 2 sans remettre le premier jeton. Soient les
événements :

A=« le second numéro tiré est pair » et B= « on tire le numéro 1 en premier ».

En énumérant les cas possibles {(1; 2), (1; 3), (1; 4), (2; 1), (2; 3), (2; 4), (3; 1), (3; 2), (3; 4), (4; 1), (4; 2), (4; 3)},
on déduit les probabilités
6 1 3 1 2 1
P (A) = = P (B) = = P (A et B) = =
12 2 12 4 12 6
Supposons maintenant que l’événement B soit réalisé, c’est-à-dire qu’on a déjà tiré le premier jeton et
qu’il porte le numéro 1. Calculons alors la probabilité que, B étant réalisé, l’événement A se produise. On
a alors les cas possibles restants : (1; 2), (1; 3) et (1; 4) et les cas favorables restants : (1; 2) et (1; 4).

Définition On définit la probabilité conditionnelle , notée P (A|B) , comme étant la probabilité que
l’événement A se réalise sachant que B est déjà réalisé .

Dans notre exemple, on a ainsi


2
P (A|B) =
3

Remarque P (A|B) n’est pas la probabilité d’un nouvel événement qui s’appelerait «A|B» mais c’est
plutôt «la probabilité» de A lorsque l’on prend, comme ensemble de référence, l’ensemble des seuls cas
favorables à B.

En représentant la situation dans un diagramme de Venn, on observe que

n(A et B) n(A et B)/N P (A et B)


P (A|B) = = = .
n(B) n(B)/N P (B)

Cette expression est appelée formule de la probabilité conditionnelle

P (A et B)
P (A|B) =
P (B)

Exemple On lance deux dés. Quelle est la probabilité que la somme soit impaire si le produit est pair ?
On considère les événements :

A = la somme est impaire B = le produit est pair

13
On a alors
2
P (A et B) 4 2
P (A|B) = = 3 = 3
P (B) 4

Dés pp pi ip ii
Somme p i i p
Produit p p p i
On note que P (B|A) = 1, ce qui prouve que P (A|B) 6= P (B|A).

Inversion de la condition Quel est donc le lien entre les probabiiltés P (A|B) et P (B|A) ?

Des formules
P (A et B) P (B et A)
P (A|B) = et P (B|A) =
P (B) P (A)
on tire
P (A et B) = P (A|B) · P (B) = P (B|A) · P (A)
et donc
P (A|B) · P (B)
P (B|A) =
P (A)

Exemple Le personnel d’une entreprise est composée de 60% de dames et de 40% d’hommes. Il ressort
d’une enquête que 35% des femmes fument contre 25% des hommes. On choisit une personne de cette
société au hasard et on constate qu’elle fume. Quelle est la probabilité qu’il s’agisse d’un homme ?

On a ici P (D) = 0,6, P (H) = 0,4, P (F |D) = 0,35 et P (F |H) = 0,25. On alors
P (F |H) · P (H) 0,25 · 0,4
P (H|F ) = = = 32,26%
P (F ) 0,25 · 0,4 + 0,35 · 0,6
On obtient ce résultat plus simplement en complétant le tableau ci-dessous avec les données, par calculs,
soustractions ou additions.
% D H

F 21 10 31

NF 39 30 69

60 40 100

On a en effet
P (D et F ) = 35% de 60% = 21%

P (H et F ) = 25% de 40% = 10%


On retrouve donc bien
10
P (H|F ) = = 32,26%
31

Exercice-type Un test pour le dépistage d’une maladie donne un résultat positif pour un individu
malade avec une probabilité de 90% (indice de sensibilité) et un résultat négatif pour un individu sain
avec une probabilité de 95% (indice de spécificité) .

Calculer la probabilité qu’un individu soit malade si son test est positif, sachant que la fréquence de
la maladie dans la population vaut 2/1000 (taux de prévalence).

14
Solution Notons +, respectivement - le fait que le test soit positif, respectivement négatif. De même M et
S le fait que le patient est malade respectivement sain. Les données se traduisent de la manière suivante.

Indice de sensibilité : P (+|M ) = 90% =) P ( |M ) = 10% faux négatif


Indice de spécificité : P ( |S) = 95% =) P (+|S) = 5% faux positif
Indice de prévalence : P (M ) = 0,2% =) P (S) = 99,8%

On complète alors le tableau ci-dessous avec les données, par calculs, soustractions ou additions.
P (+ et M ) = P (+|M ) · P (M ) = 90% de 0,2% = 0,18%

P( et M ) = P (+|M ) · P (M ) = 0,2% 0,18% = 0,02%

P( et S) = P ( |S) · P (S) = 95% de 99,8% = 94,81%

% M S

+ 0,18 4,99 5,17

0,02 94,81 94,83

0,2 99,8 100

À la lecture du tableau, on déduit la valeur prédictive positive (VPP) du test , à savoir

P (M et +) 0,18%
P (M |+) = = = 0,0348 = 3,48%
P (+) 5,17%
Si son test est positif, il n’y a donc que 3,48% de risque qu’un patient soit effectivement malade. Cette
valeur prédictive VPP est faible et s’explique par la relative faiblesse des indices de sensibilité et de spé-
cificité par rapport au taux de prévalence. En d’autres termes, on ne part pas à la chasse aux papillons
avec des gants de boxe.

On appelle valeur prédictive négative (VPN) du test la probabilité pour un patient d’être sain si son
test est négatif. Dans notre exemple
94,81%
P (S| ) = = 99,979%
94,83%
C’est là une information insignifiante puisque la probabilité pour n’importe quel patient d’être malade a
priori est de 99,8%.

On appelle rendement diagnostique , la donnée des valeurs prédictives VPP et VPN.

Exercice-type On dispose d’un vaccin contre une maladie contagieuse. Dans la population, une per-
sonne sur cinq est vaccinée. Chez les malades, on compte 1 personne vaccinée contre 5 non vaccinées. On
sait qu’une personne vaccinée sur 11 tombe malade. Le vaccin est-il efficace ?

Solution Notons M , S, V , V̄ le fait qu’une personne soit malade, respectivement saine, vaccinée ou non
vaccinée. En termes de probabilités, les données se traduisent comme suit.
1 4 1
P (V ) = P (V̄ ) = P (M |V ) = P (M et V̄ ) = 5 · P (M et V )
5 5 11

15
On en déduit le tableau ci-dessous
p M S

1 2 1
V 55 11 5

1 39 4
V̄ 11 55 5

6 49
55 55 1

1 1 1
P (M et V ) = P (V ) · P (M |V ) = · =
5 11 55
1 1
P (M et V̄ ) = 5 · =
55 11
Il s’ensuit
1
P (M et V̄ ) 11 5
P (M |V̄ ) = = 4 =
P (V̄ ) 5
44

En conclusion
1 ⇠
P (M |V ) = = 9,09%
11
5 ⇠
P (M |V̄ ) = = 11,36%
44
On considère qu’un vaccin est efficace quand il protège significativement de la maladie, autrement dit si
P (M |V ) est très inférieure à P (M |V̄ ). Ce qui n’est pas le cas ici !

Efficacité vaccinale

Comme mentionné plus haut, on considère qu’un vaccin est efficace s’il réduit notablement le risque de
développer la maladie pour une personne vaccinée comparativement à une personne qui ne l’est pas.
Autrement dit, si
P (M |V ) << P (M |V̄ )

Les probabilités figurant dans l’inégalité ci-dessus sont appelées taux d’attaque , respectivement chez les
vaccinés pour P (M |V ), et chez les non vaccinés pour P (M |V̄ ). Elles correspondent à la proportion d’indi-
vidus ayant été infectée au cours de l’épidémie au sein de chacune des populations vaccinée et non vaccinée.

L’ efficacité vaccinale EV est alors définie comme suit :

P (M |V̄ ) P (M |V ) P (M |V )
EV = =1
P (M |V̄ ) P (M |V̄ )

Exemple Dans l’exemple traité ci-dessus, comme P (M |V̄ ) = 11,36% et P (M |V ) = 9,09%, l’efficacité
vaccinale est égale à
11,36% 9,09% 11,36% 1
EV = =1 = ⇠ = 20%
11,36% 9,09% 5

Cela signifie que le vaccin réduit de 20% le risque de tomber malade.

16
La notion d’indépendance

On a vu que
P (A et B) = P (A|B) · P (B) = P (B|A) · P (A)

On demande quelles conditions A et B doivent remplir si l’on veut que

P (A et B) = P (A) · P (B)

Il faut alors que

P (A|B) = P (A) La réalisation de B n’influence pas celle de A.


et
P (B|A) = P (B) La réalisation de A n’influence pas celle de B.

On pose alors la définition suivante

A et B sont indépendants si et seulement si P (A et B) = P (A) · P (B)

Variables aléatoires

Une variable aléatoire est une «règle» permettant de représenter les résultats d’une expérience aléa-
toire par une valeur numérique (c’est-à-dire un nombre ). Plus précisément, une variable aléatoire est une
fonction

X : ⌦ ! R, ! 7 ! X(!) qui, à tout événement ! 2 ⌦, fait correspondre un nombre X(!). L’en-


semble des résultats pour lesquels X(!) = a est un événement que l’on note {X = a}.

On dit qu’une variable aléatoire est discrète lorsque les valeurs qu’elle peut prendre sont en nombre
fini (ou en nombre infini dénombrable). Dans le cas contraire, la variable aléatoire est dite continue .

Si, à chacune des valeurs possibles de la variable aléatoire, on associe la probabilité de l’événement cor-
respondant, on obtient la loi de probabilité (ou distribution de probabilité) de X.

Exemple 1 On lance deux fois une pièce de monnaie. Si on définit la variable aléatoire X par le nombre
de faces obtenues, alors on obtient la loi de probabilité suivante.

Événement Variable aléatoire Probabilité


élémentaire X P ({X})
PP 0 1/4
PF ou FP 1 1/2
FF 2 1/4

Exemple 2 On jette deux dés et on définit la variable aléatoire X = somme des résultats des deux dés.
On a alors le tableau suivant.

17
Variable aléatoire Probabilité
X P ({X})
2 1/36
3 1/18
4 1/12
5 1/9
6 5/36
7 1/6
8 5/36
9 1/9
10 1/12
11 1/18
12 1/36

Espérance mathématique et variance


Espérance mathématique

Soit X une variable aléatoire discrète prenant les n valeurs x1 , . . . , xn avec les probabilités respectives
p1 , . . ., pn . On appelle espérance mathématique E(X) de la variable aléatoire X, la moyenne des xi
pondérée par les pi

n
X
E(X) = x1 · p1 + x2 · p2 + · · · + xn · pn = x i · pi
i=1

Exemple 1 Une urne contient 50 boules : 49 blanches et 1 noire. On tire au hasard une boule. On gagne
100 francs si elle est noire et 20 francs si elle est blanche.

X P (X)
100 1/50
20 49/50

On se demande quel est le gain moyen d’un tel jeu.

Il serait absurde d’affirmer que le gain moyen consiste en la moyenne arithmétique des gains, à savoir
100+20
2 = 60. En effet, les chances de gagner 100 francs sont beaucoup plus faibles que celles de gagner 20
francs. En fait, la moyenne des gains correspond au montant que l’on peut espérer gagner. On gagne 100
francs avec la probabilité de 50
1
et 20 francs avec la probabilité de 49
50 . Ainsi, le gain moyen est la moyenne

18
des gains (100 et 20) pondérés par les probabilités respectives (0,02 et 0,98) ; c’est à dire l’espérance
mathématique
1 49
E(X) = 100 · + 20 · = 21,6 .
50 50

Exemple 2 Dans l’exemple du jet des deux pièces de monnaie, l’espérance mathématique du nombre
de faces obtenues est donc
1 1 1
E(X) = 0 · + 1 · + 2 · = 1 .
4 2 4

Exemple 3 Dans l’exemple du jet des deux dés avec la variable aléatoire X égale à la somme des
résultats, l’espérance mathématique de X est égale à
1 1 1 1 5 1 5 1 1 1 1
E(X) = 2 · +3· +4· +5· +6· +7· +8· + 9 · + 10 · + 11 · + 12 · = 7.
36 18 12 9 36 6 36 9 12 18 36

Interprétation physique de l’espérance mathématique

Si l’on considère que des poids pi sont situés sur une droite aux points d’abscisses xi , (i = 1, . . . , n), alors
le nombre E(X) est l’abscisse du centre de gravité des poids.

La variance théorique et l’écart-type

On définit la variance théorique V ar(X) de la variable aléatoire X par la variance pondérée des xi (par
rapport à l’espérance)
Xn
⇥ ⇤2
V ar(X) = xi E(X) · pi .
i=1

On définit l’écart-type s(X) de la variable par


p
s(X) = V ar(X).

Exemple 1 Pour l’exemple des dés (avec espérance mathématique 7), on obtient
1 1 1 35 ⇠
V ar(X) = · (2 7)2 + · (3 7)2 + · · · + · (12 7)2 = = 5,83
36 18 36 6

Exemple 2 Pour le jeu du tirage d’une boule espérance mathématique 21,6), on obtient
1 49
V ar(X) = · (100 21,6)2 + · (20 21,6)2 ⇠
= 125,4
50 50

19
La loi binomiale
Considérons les problèmes suivants :

(1) : On lance une pièce de monnaie 20 fois et on cherche la probabilité d’obtenir 7 fois « Pile » exactement
dans n’importe quel ordre.
(2) : On jette 15 fois un dé et on cherche la probabilité d’obtenir exactement 6 fois la face « 3 » dans
n’importe quel ordre.
(3) : Un tireur touche sa cible avec la probabilité 90%. Quelle est la probabilité qu’il atteigne la cible
exactement 11 fois en tirant 17 coups ?
(4) : On soigne 20 patients avec un traitement qui se révèle efficace dans 70% des cas. Quelle est la
probabilité que 12 patients traités guérissent ?
(5) : Un étudiant répond au hasard à un QCM comprenant 25 questions. Pour chacune d’elles, 4 ré-
ponses sont proposées dont une seule est correcte. Quelle est la probabilité que l’étudiant réponde
correctement à 6 questions ?
(6) : Quelle est la probabilité qu’une famille de 7 enfants compte exactement 2 garçons ?
(7) : Quelle est la probabilité de deviner les résultats de 8 matches d’une journée de championnat au
cours de laquelle se déroulent 13 parties.

Solution de (3)

Un tireur touche sa cible avec la probabilité 90%. Quelle est la probabilité qu’il atteigne la cible exacte-
ment 11 fois en tirant 17 coups ?

Posons

S = succès = « cible atteinte »


E = échec = « cible manquée »

On a
P (S) = 0,9 et P (E) = 0,1 = 1 0,9
La probabilité d’obtenir 11 succès suivis de 17 11 = 6 échecs

SSSSSSSSSSS
| {z } EEEEEE
| {z }
11 17 11

est donnée par


0,911 · 0,117 11

Il s’agit là d’un cas favorable. Les autres cas sont, par exemple

EESSSSSESSSSSEEES de probabilité 0,12 · 0,95 · 0,1 · 0,95 · 0,13 · 0,9


ESSSSSESSEEEESSSS de probabilité 0,1 · 0,95 · 0,1 · 0,92 · 0,14 · 0,94
.. .. ..
. . .
EEEEEESSSSSSSSSSS de probabilité 0,16 · 0,911

Ils ont tous pour probabilité


0,911 · 0,117 11

On applique ici l’indépendance des issues, ainsi, par exemple

P (S et S) = P (S) · P (S) P (S et E et S) = P (S) · P (E) · P (S)

20
Le nombre de tels cas favorables est le nombre de mots qu’on peut écrire avec 11 lettres S et 17 11
lettres E (problème "MISSISSIPPI"), c’est-à-dire
✓ ◆
17! 17
=
11! · (17 11)! 11
Comme
P (11) = Nombre de cas favorables ⇥ Probabilité d’un cas favorable
la probabilité de toucher la cible exactement 11 fois est égale à
✓ ◆
17
P (11) = · 0,911 · 0,117 11 ⇠
= 0,38%
11
Notons k = 11, p = 0,9, 1 p = 0,1 et n = 17. On a donc obtenu
✓ ◆
n
P (k) = · pk · (1 p)n k
k

Il s’agit de la loi binomiale qui donne la probabilité d’obtenir exactement k succès en répétant n fois la
même expérience à deux issues succès et échec de probabilités respectives p et 1 p.

Solutions de (1), ... , (7)


Dans chacune de ces situations, on répète un certain nombre de fois, de manière indépendante , la même
expérience débouchant sur deux issues : succès et échec, de probabilités complémentaires
P (succès) = p et P (échec) = 1 p
La loi binomiale s’applique donc.
(1) : On lance une pièce de monnaie 20 fois et on cherche la probabilité d’obtenir 7 fois « Pile » exactement
dans n’importe quel ordre.
✓ ◆ ✓ ◆7 ✓ ◆13
20 1 1 ⇠
P (7) = · · = 7,39%
7 2 2
(2) : On jette 15 fois un dé et on cherche la probabilité d’obtenir exactement 6 fois la face « 3 » dans
n’importe quel ordre.
✓ ◆ ✓ ◆6 ✓ ◆9
15 1 5 ⇠
P (6) = · · = 2,08%
6 6 6
(4) : On soigne 20 patients avec un traitement qui se révèle efficace dans 70% des cas. Quelle est la
probabilité que 12 patients traités guérissent ?
✓ ◆
20
P (12) = · 0,712 · 0,38 ⇠
= 11,44%
12
(5) : Un étudiant répond au hasard à un QCM comprenant 25 questions. Pour chacune d’elles, 4 ré-
ponses sont proposées dont une seule est correcte. Quelle est la probabilité que l’étudiant réponde
correctement à 6 questions ?
✓ ◆ ✓ ◆6 ✓ ◆19
25 1 3 ⇠
P (6) = · · = 18,28%
6 4 4
(6) : Quelle est la probabilité qu’une famille de 7 enfants compte exactement 2 garçons ?
✓ ◆ ✓ ◆2 ✓ ◆5
7 1 1 ⇠
P (2) = · · = 16,41%
2 2 2
(7) : Quelle est la probabilité de deviner les résultats de 8 matches d’une journée de championnat au
cours de laquelle se déroulent 13 parties.
✓ ◆ ✓ ◆8 ✓ ◆5
13 1 2 ⇠
P (8) = · · = 2,58%
8 3 3

21
Espérance et variance

On lance un dé n = 600 fois. On peut espérer obtenir 100 fois la face «1».

1
100 = 600 ·
6
On lance une pièce de monnaie n = 1000 fois. On peut espérer obtenir 500 fois la face «Pile».

1
500 = 1000 ·
2

En d’autres termes, l’espérance mathématique de la loi binomiale est égale

E(X) = n · p

On se trouve dans la situation où le sens commun permet d’évaluer une expression relativement compliquée
puisque
X n n
X ✓ ◆
n
E(X) = k · P (k) = k· · pk · (1 p)n k = n · p
k
i=0 i=0

On peut également démontrer que la variance de la loi binomiale est donnée par

V (X) = n · p · (1 p)

Rappel sur le nombre d’Euler

Le nombre d’Euler e peut être défini par la limite


✓ ◆n
1
e = lim 1+ = 2, 71828182845904523536 . . .
n!1 n

On peut démontrer facilement que, pour tout x


⇣ x ⌘n
lim 1 + = ex
n!1 n

22
La loi de Poisson

Au cours d’une longue période d’observation, une maternité a enregistré 6 naissances par jour. On se
demande quelle est alors la probabilité que, demain, elle enregistre 10 naissances exactement.

Proposition de solution On divise la journée en n = 24 heures. Comme il y a 6 naissances (cas


favorables) et 24 heures (possibles), la probabilité d’une naissance durant une heure particulière est égale
à p = 24
6
. La loi binomiale donne ainsi une première approximation

1 heure

24 heures

✓ ◆ ✓ ◆10 ✓ ◆24 10
24 6 6 ⇠
P (10) = · · 1 = 3,33%
10 24 24

Mais une journée est faite de n = 24 · 60 = 1440 minutes, ce qui conduit à la relation

✓ ◆ ✓ ◆ ✓ ◆1440
1440 6 10 6 10

P (10) = · · 1 = 4,121%
10 1440 1440

Plus précisément encore, une journée est composée de n = 24 · 60 · 60 = 86400 secondes, d’où la probabilité

✓ ◆ ✓ ◆10 ✓ ◆86400 10
86400 6 6 ⇠
P (10) = · · 1 = 4,1302%
10 86400 86400

Il s’agit donc de diviser la journée en un nombre n très grand d’instants de durée 24


n infinitésimale et de
calculer la probabilité suivante avec = 6 et k = 10

Intervalle de longueur 24
n

6 = λ = probabilite de la realisation
n n de succes dans chaque intervalle
de longueur 24
n

Intervalle de temps unitaire T=24

23
✓ ◆ ✓ ◆k ✓ ◆n k
n
P (k) = · · 1
k n n
✓ ◆ k
✓ ◆n ✓ ◆ k
n
= · · 1 · 1
k nk n n

k
✓ ◆n ✓ ◆ k
n · (n 1) · (n 2) · · · (n k + 1) · (n k) · · · 2 · 1
= · · 1 · 1
k! · (n k)! nk n n

k
✓ ◆ k ✓ ◆n
n · (n 1) · (n 2) · · · (n k + 1)
= · · 1 · 1
nk k! n n
✓ ◆ k k
✓ ◆n
n · (n 1) · (n 2) · · · (n k + 1)
= · 1 · · 1
n · n · n···n n k! n
✓ ◆ k k
✓ ◆n
n n 1 n 2 n k+1
= · · ··· · 1 · · 1
n n n n n k! n
✓◆ ✓ ◆ ✓ ◆ ✓ ◆ k k ✓ ◆n
2 1 k 1
= 1· 1 · 1 ··· 1 · 1 · · 1
n n n n k! n
| {z } | {z } | {z } | {z } | {z }
'1 '1 '1 '1 'e

Comme n est très grand (n ' 1), ' 0 et donc tous les termes rouges sont infiniment proches de 1. En
1
n
outre, la définition du nombre d’Euler
✓ ◆
1 n
e = lim 1 +
n!1 n
a pour conséquences que
⇣ ✓ ◆n
x ⌘n
e = lim 1+ = ex et donc lim 1 =e
n!1 n n!1 n
En conclusion, la probabilité cherchée s’écrit
k
P (k) = ·e
k!

Il s’agit de la loi de Poisson de paramètre .

En reprenant l’exemple de la question posée, on obtient


610 6 ⇠
P (10) = ·e = 4,1303%
10!
La probabilité de 4 naissances est alors
64 6 ⇠
P (4) = ·e = 13,3853%
4!

Remarque On a donc établi la loi de Poisson comme limite de la loi binomiale.

Exemple Dans une région française, le nombre moyen de nouveaux cas de cancer de la thyroïde est de
15 chaque année chez les hommes. Quelle est la probabilité d’observer 11 nouveaux cas l’année prochaine ?

On applique ici une loi de Poisson de paramètre = 15


15k 15
P (k) = ·e
k!

24
Ainsi, la probabilité demandée est égale à

1511 15 ⇠
P (11) = ·e = 6,63%
11!

Approximation de la loi binomiale par la loi de Poisson

Bien que la loi de Poisson ait, comme on l’a vu, un intérêt intrinsèque, elle permet aussi d’obtenir une
bonne approximation de la loi binomiale dans le cas d’événements rares. En pratique, on dira qu’un
événement de probabilité p est rare si le nombre d’expériences n et la probabilité p vérifient les conditions
suivantes : n 50 et np  5

Exemple 1 Une urne contient 10 boules : 1 noire et 9 blanches. On tire successivement n = 50 boules
avec remise et on considère la variable aléatoire X = nombre de boules noires extraites. On sait que X
suit une loi binomiale de paramètres n = 50 et p = 10
1
. Ainsi

✓ ◆
50
P (k) = · 0,1k · 0,950 k
k

On approche alors la loi binomiale par une loi de Poisson de paramètre

1
= np = 50 · =5
10

égal à l’espérance mathématique de la loi binomiale. Autrement dit

5k
P (k) ⇠
= ·e 5
.
k!

Le tableau comparatif ci-dessous permet d’apprécier l’approximation choisie qui, en outre, simplifie nota-
blement les calculs. Les différentes probabilités sont données en %.

k succès Loi binomiale Loi de Poisson


0 0,52 0,67
1 2,86 3,37
2 7,79 8,42
3 13,86 14,04
4 18,09 17,55
5 18,49 17,55
6 15,41 14,62
7 10,76 10,44
8 6,43 6,53
9 3,33 3,63
10 1,52 1,81

25
20

18

16

14

12
Binomiale
10
Poisson
Probabilités
8

0
0 1 2 3 4 5 6 7 8 9 10
k=nombre de succès

Exemple 2 Sachant que la fréquence annuelle de la trichinellose (une maladie parasitaire) est de 10 cas
pour 50 millions d’habitants, quelle est la probabilité d’observer 3 cas de personnes atteintes par cette
maladie dans une région de 10 millions d’habitants ?
10 1
Ici on a affaire à une loi binomiale dont les paramètres n = 100 0000 000 et p = 0 0
= 0
50 000 000 5 0000 000
sont connus. La probabilité cherchée est donc égale à
✓ ◆ ✓ ◆3 ✓ ◆90 9990 997
100 0000 000 1 1
P (3) = · · 1
3 50 0000 000 5 0000 000
0

Ici, il est indiqué d’utiliser une approximation avec une loi de Poisson dont le paramètre est l’espérance
mathématique
1
= n · p = 100 0000 000 · 0 =2
5 0000 000
Ainsi
23 2 ⇠
P (3) = ·e = 18,0447%
3!
Notons que le résultat obtenu par la loi de Poisson, à savoir 18,04470443% est très proche du résultat
exact donné par la loi binomiale : 18,04472248%

La loi normale
De toutes les lois usuelles, la loi normale est la plus fréquemment rencontrée. Lorsqu’une grandeur, qui
se reproduit, est soumise à l’influence d’un grand nombre de facteurs de variations indépendants les
uns des autres, chacun exerçant des actions individuelles de faible intensité dont les effets tendent à se
compenser, on peut établir que la distribution des valeurs de cette grandeur suit une loi de Laplace-Gauss
dite loi normale .

Introduction empirique

En 2001, les hommes français avaient une taille moyenne de 174 cm avec un écart-type de 7 cm. Si l’on
représente l’histogramme des fréquences associé à une répartition en classes de taille de largeur 5 cm,
on obtient une figure comportant 10 fois moins de rectangles verticaux que dans le cas où l’on divise la
population en classes de largeur 0,5 cm.

26
0.1 0.1

174 174

Les frontières supérieures des histogrammes correspondants sont des courbes en escalier qui, à mesure
que la largeur des classes est réduite et que leur nombre croît, se rapprochent d’une courbe lisse ayant la
forme d’une cloche appelée courbe gaussienne ou cloche de Gauss . L’équation cartésienne y = f (x) de
cette courbe est connue. Elle s’exprime en fonction de la moyenne µ (ici µ = 174) et de l’écart-type (ici
= 7) de la population. En clair, on a
" ✓ ◆2 #
1 1
( x µ 2
) = 1 1 x 174
f (x) = p ·e 2 p · exp
· 2⇡ 7· 2⇡ 2 7

174

180 190

Remarques et définitions

Cette courbe a les propriétés remarquables suivantes :


— Elle est symétrique par rapport à l’axe vertical x = µ = 174. Ce qui indique que la moyenne est
aussi la médiane de la population.
— L’aire de la surface comprise entre l’axe horizontal et la courbe est égale à 1 . En effet, elle est
la même que celle de l’histogramme composé des rectangles représentant les fréquences de chaque
classe. La somme des aires est donc la somme de toutes les fréquences, c’est-à-dire 100% = 1.
— Le pourcentage P (A  X  B) d’individus dont la taille X est comprise entre deux bornes A et B
(180 et 190, par exemple) est égale à l’aire sous la courbe entre les verticales x = A et x = B . Il

27
est clair que P (A  X  B) est aussi la probabilité qu’un individu choisi au hasard ait une taille X
comprise entre A et B. On dit alors que la variable aléatoire X suit une loi normale de paramètres
µ et , ce qu’on note X ⇠ N (µ; ).
— Dans le cas particulier où µ = 0 et = 1, la variable aléatoire X ⇠ N (0; 1) suit une loi dite
normale centrée réduite . La courbe correspondante est une cloche symétrique par rapport à l’axe
verticale x = 0.

La loi normale centrée réduite

En tant qu’aire, la probabilité à déterminer n’est autre que l’intégrale définie

Z B Z 190
P (A  X  B) = f (x)dx = f (x)dx
A 180

laquelle ne se laisse pas calculer analytiquement dans la mesure où la fonction f (x) n’admet pas
de primitive explicite . Autrement dit, le calcul direct de cette probabilité s’avère très complexe et re-
quiert une approximation numérique.

On peut toutefois facilement démontrer que l’aire P (A  X  B) sous la courbe entre les bornes A et B
est égale à l’aire d’une autre surface située entre deux nouvelles bornes a et b sous la courbe normale
centrée réduite d’équation
1 1 2
y = c(x) = p · e 2 x
2⇡

01

174 0

0.86 2.29
180 190

Autrement dit
Z 190 Z 2,29
P (180 < X < 190) = f (x)dx = c(x)dx
180 0,86

les nouvelles bornes étant définies par les formules de conversion

A µ 180 174 ⇠ B µ 190 174 ⇠


a= = = 0,86 b= = = 2,29
7 7

La fonction c(x) ne possédant pas de primitive explicite, il faut déterminer la valeur de l’intégrale à l’aide
d’une table (cf. annexe) qui fournit les aires (z) sous cette courbe à gauche des bornes supérieures z.

28
01

0,86 2,29

Ainsi Z 2,29
c(x)dx = (2,29) (0,86)
0,86

On y trouve (2,29) = 0,9890 et (0,86) = 0,8051 . Ainsi, le pourcentage d’hommes dont la taille est
comprise entre 180 et 190 cm est donnée par

P (180  X  190) = (2,29) (0,86) = 0,9890 0,8051 = 0,1839 = 18,39%

Autre exemple Déterminons maintenant le pourcentage d’hommes dont la taille est inférieure à 170
cm, c’est-à-dire la probabilité, pour la variable aléatoire taille X, d’être inférieure à B = 170. La
nouvelle borne obtenue après conversion en unités centrées réduites est donc
B µ 170 174
b= = = 0,57
7

29
Il s’agit alors de calculer ( 0,57). Or, la table ne donne pas les valeurs de (z) pour z < 0. Celles-ci
s’obtiennent en exploitant la symétrie de la cloche de Gauss.

01

Il est clair en effet que


( z) = 1 (z)
On en déduit que
P (X  170) = ( 0,57) = 1 (0,57) = 1 0,7157 = 0,2843 = 28,43%
De la même manière, on obtient les proportions suivantes.
a) Individus dont la taille est supérieure à A = 185 cm.

La nouvelle borne est


185 174 ⇠
a= = 1,57
7

On en déduit
P (X > 185) = 1 (1,57) = 1 0,9418 = 5,82%
b) Individus dont la taille est supérieure à A = 168 cm.

La nouvelle borne est


168 174 ⇠
a= = 0,86
7

On en déduit
P (X > 168) = 1 ( 0,86) = 1 [1 (0,86] = (0,86) = 80,51%

c) Individus dont la taille est comprise entre A = 167 cm et B = 182 cm

Les nouvelles bornes sont


167 174 182 174 ⇠
a= = 1 b= = 1,14
7 7

30
On en déduit
P (167 < X < 182) = (1,14) ( 1)

= (1,14) [1 (1)]

= (1,14) + (1) 1

= 0,8729 + 0,8413 1

= 71,42%

Remarque Comme déjà mentionné plus haut dans ce cours, pour une variable aléatoire X suivant une
loi normale N (µ, ), on a

— P (µ  X  µ+ ) ⇠ = 0,6827 ; ce qui signifie que 68,27% des réalisations de X seront comprises


entre la moyenne plus ou moins 1 écart-type ;
— P (µ 2  X  µ + 2 ) ⇠ = 0,9545 ; ce qui signifie que 95,45% des réalisations de X seront
comprises entre la moyenne plus ou moins 2 écarts-types ;
— P (µ 3  X  µ + 3 ) ⇠ = 0,9973 ; ce qui signifie que 99,73% des réalisations de X seront
comprises entre la moyenne plus ou moins 3 écarts-types.

31
Application : réchauffement climatique
Selon un rapport de l’ONU basé sur les projections du Giec, le monde se dirige actuellement vers une hausse
"dramatique" des températures de +2,7 C d’ici à la fin du siècle. Un réchauffement causé par l’homme et
ses activités industrielles (notamment ses émissions d’énergies fossiles). Lorsque ces combustibles fossiles
brûlent, ils libèrent des gaz à effet de serre, principalement du dioxyde de carbone (CO2). Ces gaz piègent
la chaleur du Soleil et font monter la température globale de la planète.

Le graphique ci-dessus a pour axe horizontal les années d’observation et, pour axe vertical, l’écart entre
les températures annuelles et la température moyenne sur la période de référence 1951-1980. Dix-neuf des
années les plus chaudes sont advenues depuis 2000, à l’exception de 1998, qui a été favorisée par un très
fort El Niño. L’année 2020 est, à égalité avec 2016, l’année la plus chaude jamais enregistrée depuis le
début des relevés en 1880 (source : NASA/GISS). La courbe rouge représente la moyenne mobile sur cinq
ans de la série chronologique (courbe noire) donnant la variation moyenne des températures à la surface
du globe.

Le sommet COP26
Le 31 octobre 2021 s’est ouverte la COP26 à Glasgow. Les dirigeants de la planète avaient jusqu’au 12
novembre 2021 pour tomber d’accord sur une déclaration finale ambitieuse qui nous rapprocherait des
objectifs de l’Accord de Paris : limiter le réchauffement à +1,5 C d’ici à la fin du siècle. Cet événement
qui rassemble plus de 190 pays chaque année a pour but de définir des objectifs et des actions communes
afin de contenir le réchauffement climatique.

(Source : "Le Temps", 1.11.2021)

32
Les phénomènes météorologiques extrêmes liés au changement climatique - y compris les vagues de cha-
leur, les inondations et les incendies de forêt - s’intensifient. La dernière décennie a été la plus chaude
jamais enregistrée, et les gouvernements conviennent qu’une action collective urgente est nécessaire. Le
monde est maintenant environ 1,2 C plus chaud qu’il ne l’était au 19ème siècle et la quantité de CO2
dans l’atmosphère a augmenté de 50%.

Les effets d’une variation de température

Supposons qu’en un endroit du globe, sur une période donnée, la température ait pour moyenne µ = 25 et
pour écart-type = 3 . Si on appelle «jour chaud», une journée durant laquelle la température moyenne
excède 30 , alors la fréquence de tels jours est égale à

✓ ◆
30 25 ⇠
P (T > 30) = 1 = 4,78%
3

Si la température moyenne augmente de seulement 1,5 (et donc µ = 26,5) la fréquence des jours chauds
passe alors à
✓ ◆
30 26,5 ⇠
P (T > 30) = 1 = 12,17%
3

et est donc presque triplée ! Avec la hausse dramatique annoncée de 2,7 , si rien n’est entrepris, cette
fréquence se trouve quintuplée

✓ ◆
30 27,7 ⇠
P (T > 30) = 1 = 22,16%
3

33
Quant aux «jours froids» pour lesquels la température moyenne est inférieure à 20 , leur fréquence est la
suivante : ✓ ◆
20 µ
P (T < 20) =
3

µ P (T < 20)
25 4,78%
26,5 1,51%
27,7 0,513%

34
Approximation d’une loi binomiale par la loi normale
Dans un cabinet médical, on teste l’allergie de n = 30 patients à une certaine substance qui provoque une
réaction avec une probabilité p = 30%.

Comme on l’a vu, la probabilité que k patients exactement développent l’allergie est donnée par la loi
binomiale ✓ ◆ ✓ ◆k ✓ ◆30 k
30 3 7
P (k) =
k 10 10
Cette probabilité peut être représentée dans un histogramme par un rectangle, centré en k, de base 1 et
de hauteur, donc d’aire, P (k)

La loi de probabilité est alors représentée par un histogramme formé de 31 rectangles verticaux d’aires
P (0), P (1), P (2), ... P (30)

0.15

0.125

0.1

0.075

0.05

0.025

5 10 15 20

Supposons qu’on cherche la probabilité que, sur 30 patients testés, le nombre de patients allergiques soit
compris entre 6 et 12 ; autrement dit
P (6) + P (7) + P (8) + P (9) + P (10) + P (11) + P (12)
En fait, la probabilité demandée correspond géométriquement à la somme des aires de 7 rectangles dont
les bases (de longueur 1) sont centrées en 6, 7, . . . , 12.

Cette aire totale est très voisine de l’aire comprise sous une cloche de Gauss y = f (x) entre les bornes
A = 5,5 et B = 12,5 .

35
Or, il se trouve que cette fonction est connue
" ✓ ◆2 #
1 1 x m
f (x) = p · exp
s· 2⇡ 2 s

Dans son expression, les paramètres m et s désignent l’espérance mathématique

m = n · p = 30 · 0,3 = 9

et l’écart-type
p p
s= n · p · (1 p) = 30 · 0,3 · 0,7 = 2,51

de la loi binomiale.

L’aire considérée est donc aussi égale à celle sous la courbe normale centrée réduite

entre les nouvelles bornes

A 0,5 m 6 0,5 9
a = = = -1,39
s 2,51

B + 0,5 m 12 + 0,5 9
b = = = 1,39
s 2,51

36
Il s’ensuit que
P (6) + P (7) + · · · + P (12) = (1,39) ( 1,39)

= (1,39) [1 (1,39)]

= 2 · (1,39) 1

= 2 · 0,9177 1

= 83,54%
À titre de comparaison, la valeur exacte, calculée avec la loi binomiale, est égale à 83,89% . L’approximation
est assez grossière parce que n = 30 seulement.

Remarque La loi normale donne une bonne approximation de la loi binomiales aux conditions suivantes

n > 30 n·p 5 n · (1 p) 5

Application
Une opération chirurgicale conduit à des complications dans 0,7% des cas. Calculer la probabilité que,
sur 800 patients opérés, on constate entre 5 et 10 complications.

On pose n = 800, p = 0,007 et on calcule, l’espérance mathématique

m = n · p = 800 · 0,007 = 5,6

et l’écart-type
p p
s= n · p · (1 p) = 800 · 0,007 · 0,993 = 2,358
Les nouvelles bornes sont alors
5 0,5 5,6
a = = 0,47
2,358

10+0,5 5,6
b = = 2,08
2,358
On en conclut que
P (5  X  10) = (2,08) ( 0,47)

= (2,08) [1 (0,47)]

= (2,08) + (0,47) 1

= 0,9812 + 0,6808 1

= 66,20%

37

Vous aimerez peut-être aussi