Académique Documents
Professionnel Documents
Culture Documents
Aperçu historique
C’est au dix-septième siècle, avec l’étude de certains jeux de hasard, que le calcul des probabilités com-
mença à se développer. Les grands mathématiciens et éminents savants qui ont contribué à son essor,
tels Blaise Pascal (1623-1662), Pierre de Fermat (1601-1665), Christian Huygens (1629-1695) et plus tard
Jacques Bernoulli (1654-1705), Abraham de Moivre (1667-1754), Pierre-Simon de Laplace (1749-1827)
et Carl-Friedrich Gauss (1777-1855), ont très tôt senti l’intérêt du calcul des probabilités pour l’étude
de toutes les lois (physiques notamment) régissant les événements aléatoires. Aujourd’hui, le calcul des
probabilités est très proche d’autres branches mathématiques de pointe. Sa connaissance (comme celle
de sa discipline soeur : la statistique) est devenue fondamentale dans de très nombreuses disciplines, qu’il
s’agisse de la physique, de la chimie, de la biologie, de la médecine, de la psychologie, de la sociologie, de
l’économie, des sciences politiques, de l’éducation, de la recherche opérationnelle et de tous les domaines
de la technique.
Introduction
Exemple 1 Lorsqu’on lance une pièce de monnaie, il y a 1 chance sur 2 qu’elle tombe sur le côté pile,
respectivement face.
Si on jette un dé bien équilibré, il y a 1 chance sur 6 qu’il tombe sur la face 3. Le résultat est diffé-
rent pour les occurrences suivantes.
1
On peut alors aisément déterminer les chances que se produisent les événements suivants.
Définitions
Les cas limites sont aussi considérés comme des événements ; ainsi, l’événement certain ⌦ qui est tou-
jours réalisé et l’événement impossible ; qui ne peut jamais l’être. Dans le cas du lancer d’un dé, ⌦ est
l’événement : « on obtient un nombre entier ». L’événement « on obtient 7 » est impossible.
Définition de Laplace
Pour calculer la probabilité P (A) d’un événement aléatoire A, on dénombre le nombre n(A) de cas, parmi
les N cas possibles (d’égale vraisemblance), pour lesquels l’événement A est réalisé. On dit que n(A)
est le nombre de cas favorables à l’événement A. Par définition 2 , on pose alors
On dira que deux événements A et B sont équiprobables s’ils ont la même probabilité. Dans la définition
de Laplace, on considère donc que tous les cas possibles sont des événements équiprobables.
1. alea signifie dé en latin.
2. Cette définition est due au Marquis Pierre Simon de Laplace : astronome, mathématicien et physicien français
(1749-1827).
2
Remarque Bien qu’il existe une définition axiomatique plus générale de la notion de probabilité, les
résultats principaux peuvent être obtenus à partir de la définition précédente.
Exemple Un sac contient 12 jetons numérotés de 1 à 12. On tire, un à un, deux jetons, sans remettre le
premier jeton après tirage. On cherche alors à calculer la probabilité de l’événement A = « obtenir deux
numéros pairs ». Il y a
N = 12 · 11 = 132
cas possibles. Le nombre de cas favorables est, quant à lui, n(A) = 6·5 = 30 . La probabilité de l’événement
A est donc
n(A) 30 5 ⇠
P (A) = = = = 22,73%
N 132 22
Notons que, dans le cas où l’expérience aurait consisté à tirer les jetons en remettant le premier dans
l’urne, alors on aurait eu N = 12 · 12 = 144 , n(A) = 6 · 6 = 36 et donc
36 1
P (A) = = = 25%
144 4
Les arbres
Cette technique est indiquée dans les cas où on tient compte de l’ordre dans lequel se produisent les
événements.
Exemple On se demande combien de mots différents de trois lettres il est possible de composer avec
un A, un B et un C.
Avec 4 lettres (A, B, C et D) le nombre de mots composables est 4 · 3 · 2 · 1 = 24. Avec 5 lettres différentes,
on en compose 5 · 4 · 3 · 2 · 1 = 120.
La fonction factorielle
Si n 2 N est un entier naturel quelconque, alors on définit l’entier appelé n factorielle et noté n! comme
suit
n! = n · (n 1) · · · 2 · 1, 0! = 1
3
Jeux de mots
Exemple 1 On se demande combien de mots de 5 lettres on peut former avec les 26 lettres de l’alphabet
choisies avec et sans remise.
Si l’on procède avec remise et qu’on n’exige pas que les lettres soient toutes distinctes, alors le nombre
de mots est égal à 265 = 11881376 . Si on procède sans remise , ce qui signifie que les lettres sont toutes
distinctes, alors 26 lettres peuvent être placées en première position. Ce choix étant fait, 25 lettres peuvent
être placées en deuxième position, puis 24 en troisième, 23 en quatrième et 22 en dernière position. Le
nombre de mots possibles est donc égal à
26!
26 · 25 · 24 · 23 · 22 = = 7893600.
21!
Exemple 2 On se pose maintenant la question suivante : combien de mots différents peut-on écrire avec
toutes les lettres des mots LUNE, PAPE, LILLE, ALLELE, MISSISSIPPI.
Pour le mot LUNE , le cas est clair : il y a 4! = 24 mots différents puisque les 4 lettres sont dis-
tinctes.
Pour le mot PAPE , la situation est plus complexe puisque deux lettres sont identiques. Supposons
que les deux P soient de couleurs différentes. Il y a alors 4! mots colorés différents. Notons qu’un groupe
de 2 = 2! mots colorés conduit au même mot unicolore puisqu’il y a 2 façons de placer les P sans changer
4!
le «sens» du mot. On peut donc composer = 12 mots différents.
2!
Pour le mot LILLE , un groupe de 3! = 6 mots colorés donnera lieu au même mot. En effet, la position
des L étant fixée, 3 L peuvent être placés en première position, puis 2 en deuxième et 1 en dernière. Les
5!
5! = 120 mots colorés conduisent donc à = 20 mots différents.
3!
Comme le mot ALLELE compte 3 L et 2 E, le nombre de mots de 6 lettres qu’on peut composer
4
6!
sera donc = 60.
3! · 2!
11!
Avec les lettres du mot MISSISSIPPI (4 S, 4 I et 2 P), on peut donc composer = 34650
4! · 4! · 2!
mots différents.
n
Notation Le coefficient binomial k est parfois aussi noté Cnk .
Exemples Avec cette définition, il est possible de déterminer les valeurs de quelques coefficients bino-
miaux simples, tels par exemple
✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆
2 4 3 4 72 n 2 5
= 2, = 4, = 3, = 6, = 72, = n, = 0, = 1.
1 1 2 2 1 1 4 0
Exemple Combien de menus différents peut-on composer avec les 5 aliments : viande (V), légumes (L),
pâtes (P), riz (R), fruits (F).
5
0 0 =1 l’assiette vide
5
1 1 =5 V, L, P, R, F
5
2 2 = 10 VL, VP, VR, VF, LP, LR, LF, PR, PF, RF
5
3 3 = 10 PRF, LRF, LPF, LPR, VRF, VPF, VPR, VLF, VLR, VLP
5
4 4 =5 VLPR, VLPF, VLRF, VPRF, LRPF
5
5 5 =1 VLPRF
On constate que ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆
5 5 5 5 5 5
= = =
2 3 1 4 0 5
5
Preuve A tout choix de k objets parmi n, correspond un choix de n k objets parmi n.
Exemples On a ainsi
✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆
7 7 13 13 194 194 1000 1000
= , = , = , = = 1000
4 3 11 2 17 177 999 1
✓ ◆ ✓ ◆ ✓ ◆
n n 1 n 1
= + .
k k 1 k
✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆
12 11 11 10 9 9
= + = +
7 7 6 3 3 2
12 11 11
Preuve Nous allons établir que 7 = 7 + 6 , en racontant une histoire. Supposons que le chat
Tom doive choisir 7 souris parmi 12 souris. De son point de vue, il a 12 7 choix. La souris Jerry, qui fait
partie du lot, se pose une question existentielle. Combien de choix (heureux) du chat l’épargneront et
combien de choix (malheureux) lui coûteront la vie. Il y a évidemment 11 7 choix heureux (le chat choisit
7 souris parmi les 11 amies de Jerry) et 11
6 choix malheureux (le chat choisit Jerry et 6 souris parmi les
11 amies). Ainsi
✓ ◆ ✓ ◆ ✓ ◆
12 11 11
= + .
7 7 6
6
Le triangle de Pascal
Grâce à l’identité précédente, il est possible de construire, de proche en proche, un tableau de nombres
contenant les coefficients binomiaux. On appelle ce tableau triangle de Pascal 3
3. Blaise Pascal, savant, penseur et écrivain français, (Clermont-Ferrand 1623 - Paris 1662).
7
Triangle de Pascal et identités remarquables
En fait il existe une telle identité pour tout binôme (A + B)n , dont le développement fait intervenir les
coefficients binomiaux .
en répondant de deux manières à la question suivante : « combien de mots de 3 lettres différentes peut-on
composer avec les 7 lettres S, S, S, E, E, E, E » ?
1. Il y a 3 S et 4 E. Le nombre de mots différents est donc égal à
7!
3! · 4!
2. Le nombre de mots est égal au nombre de façons de choisir 3 emplacements où poser les S parmi
les 7 places formant le mot
S S S
Il y a ✓ ◆
7
3
tels choix.
En comparant les deux résultats, on obtient bien la relation
✓ ◆
7 7!
=
3 3! · 4!
8
Exemples Avec cette formule, on peut calculer directement, par exemple
✓ ◆ ✓ ◆
42 42! 100 100! 100 · 99 · 98 · 97! 100 · 99 · 98
= = 5245786, = = = = 161700
6 6! · 36! 3 3! · 97! 6 · 97! 6
Notons encore, par exemple, que ✓ ◆
7 7! 1
=1= =
0 0! · 7! 0!
ce qui justifie que 0! = 1.
Exercices-types résolus
Quarté Dix chevaux participent à une course soumise à des paris consistant à deviner l’ordre des quatre
premiers arrivés. Quelle est la probabilité de deviner le quarté dans le désordre ?
Le nombre de cas favorables (dans lesquels on a les 4 bons chevaux) est donné par n = 4! 1 = 23 (on
exclut le cas du quarté dans l’ordre). La probabilité cherchée vaut donc
23 ⇠
p= = 0,456%
5040
Loterie à numéros Cette loterie consiste à deviner les 6 numéros qui seront extraits d’une urne conte-
nant 42 numéros. Déterminer la probabilité de deviner 2 numéros gagnants exactement.
Solution L’ordre dans lequel sortent les numéros n’ayant ici aucune importance, le nombre de cas
possibles est donc ✓ ◆
42
N= = 5245786
6
Un cas favorable comporte 2 bons numéros parmi 6 ( 62 = 15 choix) et 4 mauvais numéros parmi 36
( 36
4 = 58905 choix). Le nombre de cas favorables est donc
✓ ◆ ✓ ◆
6 36
n= · = 15 · 58905 = 883575
2 4
9
Ainsi, la probabilité demandée vaut
883575 ⇠
p= = 16,84%
5245786
Plus généralement, on peut calculer les probabilités de deviner 0, 1, ... , 6 numéros gagnants.
Le nombre n(k) de cas favorables à l’événement « jouer k numéros gagnants » est donné par
✓ ◆ ✓ ◆
6 36
·
k 6 k
et la probabilité correspondante est donc
6 36
k · 6 k
P (k) = 42
6
À retenir : les loteries sont un impôt prélevé sur l’ignorance des statistiques !
A B C
1. Oderint dum metuant x
2. Summum jus summa injuria x
.. ..
. .
10. Repetitio est mater studiorum x
Solution Comme il y a 3 réponses pour chacune des 10 questions, le nombre de cas possibles est
N = 310 = 59049
Un cas favorable comporte 4 questions avec une réponse correcte ( 104 = 210 choix) et 6 questions avec
une réponse erronée. Comme il y a 2 façons de se tromper pour chacune d’elles, le nombre de cas favorables
est donc ✓ ◆
10
n= · 26 = 13440
4
13440 ⇠
D’où la probabilité cherchée p = = 22,76% .
59049
10
De ce qui précède, on conclut que le nombre de façons de répondre correctement à k questions est donné
par ✓ ◆
10
n(k) = · 210 k
k
Ce qui conduit à la probabilité correspondante
10
k · 210 k
P (k) =
310
Le problème des anniversaires Calculer la probabilité que, parmi 4 personnes présentes dans une
salle, au moins deux d’entre elles aient leur anniversaire le même jour de l’année. (Pour simplifier, on
considère que ces personnes sont toutes nées une année non bissextile). À partir de combien d’individus,
cette probabilité est-elle supérieure à 50% ?
Solution Comme il y a 365 dates de naissances possibles pour chacune des 4 personnes, le nombre de
cas possibles est N = 3654 . Un cas est défavorable quand les 4 personnes sont nées à des dates différentes ;
il y a donc
365! 365!
d(4) = 365 · 364 · 363 · 362 = =
361! (365 4)!
tels cas. Le nombre de cas favorables est donc
365!
n(4) = 3654
(365 4)!
365!
3654
(365 4)! 365!
P (4) = =1 = 1,636%
3654 (365 4)! · 3654
365!
P (k) = 1
(365 k)! · 365k
11
D’où le tableau ci-dessous :
Nombre de Probabilités
personnes en %
k P (k)
2 0,274
5 2,714
10 11,695
15 25,290
20 41,144
22 45,570
23 50,730
40 89,123
50 97,037
La loi d’addition
On tire au hasard un billet de loterie parmi 40 billets numérotés de 1 à 40 et on considère les événements
suivants : A = « obtenir un multiple de 3 » et B = « obtenir un multiple de 4 ». Les probabilités de ces
deux événements sont alors données par
n(A) 13 n(B) 10 1
P (A) = = et P (B) = = =
N 40 N 40 4
n(A ou B) 20 1 n(A et B) 3
P (A ou B) = = = et P ( A et B ) = =
N 40 2 N 40
En observant un diagramme de Venn représentant l’ensemble des cas possibles, on constate qu’en addi-
tionnant les cas favorables n(A) + n(B), on compterait deux fois les cas qui sont favorables, à la fois, aux
événements A et B. En fait, on a n(A ou B) = n(A) + n(B) n(A et B) . En divisant l’égalité précédente
par N , on obtient ladite loi d’addition
P (A ou B) = P (A) + P (B) P (A et B)
12
Probabilité conditionnelle
Parmi 4 jetons, numérotés de 1 à 4, on en tire successivement 2 sans remettre le premier jeton. Soient les
événements :
En énumérant les cas possibles {(1; 2), (1; 3), (1; 4), (2; 1), (2; 3), (2; 4), (3; 1), (3; 2), (3; 4), (4; 1), (4; 2), (4; 3)},
on déduit les probabilités
6 1 3 1 2 1
P (A) = = P (B) = = P (A et B) = =
12 2 12 4 12 6
Supposons maintenant que l’événement B soit réalisé, c’est-à-dire qu’on a déjà tiré le premier jeton et
qu’il porte le numéro 1. Calculons alors la probabilité que, B étant réalisé, l’événement A se produise. On
a alors les cas possibles restants : (1; 2), (1; 3) et (1; 4) et les cas favorables restants : (1; 2) et (1; 4).
Définition On définit la probabilité conditionnelle , notée P (A|B) , comme étant la probabilité que
l’événement A se réalise sachant que B est déjà réalisé .
Remarque P (A|B) n’est pas la probabilité d’un nouvel événement qui s’appelerait «A|B» mais c’est
plutôt «la probabilité» de A lorsque l’on prend, comme ensemble de référence, l’ensemble des seuls cas
favorables à B.
P (A et B)
P (A|B) =
P (B)
Exemple On lance deux dés. Quelle est la probabilité que la somme soit impaire si le produit est pair ?
On considère les événements :
13
On a alors
2
P (A et B) 4 2
P (A|B) = = 3 = 3
P (B) 4
Dés pp pi ip ii
Somme p i i p
Produit p p p i
On note que P (B|A) = 1, ce qui prouve que P (A|B) 6= P (B|A).
Inversion de la condition Quel est donc le lien entre les probabiiltés P (A|B) et P (B|A) ?
Des formules
P (A et B) P (B et A)
P (A|B) = et P (B|A) =
P (B) P (A)
on tire
P (A et B) = P (A|B) · P (B) = P (B|A) · P (A)
et donc
P (A|B) · P (B)
P (B|A) =
P (A)
Exemple Le personnel d’une entreprise est composée de 60% de dames et de 40% d’hommes. Il ressort
d’une enquête que 35% des femmes fument contre 25% des hommes. On choisit une personne de cette
société au hasard et on constate qu’elle fume. Quelle est la probabilité qu’il s’agisse d’un homme ?
On a ici P (D) = 0,6, P (H) = 0,4, P (F |D) = 0,35 et P (F |H) = 0,25. On alors
P (F |H) · P (H) 0,25 · 0,4
P (H|F ) = = = 32,26%
P (F ) 0,25 · 0,4 + 0,35 · 0,6
On obtient ce résultat plus simplement en complétant le tableau ci-dessous avec les données, par calculs,
soustractions ou additions.
% D H
F 21 10 31
NF 39 30 69
60 40 100
On a en effet
P (D et F ) = 35% de 60% = 21%
Exercice-type Un test pour le dépistage d’une maladie donne un résultat positif pour un individu
malade avec une probabilité de 90% (indice de sensibilité) et un résultat négatif pour un individu sain
avec une probabilité de 95% (indice de spécificité) .
Calculer la probabilité qu’un individu soit malade si son test est positif, sachant que la fréquence de
la maladie dans la population vaut 2/1000 (taux de prévalence).
14
Solution Notons +, respectivement - le fait que le test soit positif, respectivement négatif. De même M et
S le fait que le patient est malade respectivement sain. Les données se traduisent de la manière suivante.
On complète alors le tableau ci-dessous avec les données, par calculs, soustractions ou additions.
P (+ et M ) = P (+|M ) · P (M ) = 90% de 0,2% = 0,18%
% M S
P (M et +) 0,18%
P (M |+) = = = 0,0348 = 3,48%
P (+) 5,17%
Si son test est positif, il n’y a donc que 3,48% de risque qu’un patient soit effectivement malade. Cette
valeur prédictive VPP est faible et s’explique par la relative faiblesse des indices de sensibilité et de spé-
cificité par rapport au taux de prévalence. En d’autres termes, on ne part pas à la chasse aux papillons
avec des gants de boxe.
On appelle valeur prédictive négative (VPN) du test la probabilité pour un patient d’être sain si son
test est négatif. Dans notre exemple
94,81%
P (S| ) = = 99,979%
94,83%
C’est là une information insignifiante puisque la probabilité pour n’importe quel patient d’être malade a
priori est de 99,8%.
Exercice-type On dispose d’un vaccin contre une maladie contagieuse. Dans la population, une per-
sonne sur cinq est vaccinée. Chez les malades, on compte 1 personne vaccinée contre 5 non vaccinées. On
sait qu’une personne vaccinée sur 11 tombe malade. Le vaccin est-il efficace ?
Solution Notons M , S, V , V̄ le fait qu’une personne soit malade, respectivement saine, vaccinée ou non
vaccinée. En termes de probabilités, les données se traduisent comme suit.
1 4 1
P (V ) = P (V̄ ) = P (M |V ) = P (M et V̄ ) = 5 · P (M et V )
5 5 11
15
On en déduit le tableau ci-dessous
p M S
1 2 1
V 55 11 5
1 39 4
V̄ 11 55 5
6 49
55 55 1
1 1 1
P (M et V ) = P (V ) · P (M |V ) = · =
5 11 55
1 1
P (M et V̄ ) = 5 · =
55 11
Il s’ensuit
1
P (M et V̄ ) 11 5
P (M |V̄ ) = = 4 =
P (V̄ ) 5
44
En conclusion
1 ⇠
P (M |V ) = = 9,09%
11
5 ⇠
P (M |V̄ ) = = 11,36%
44
On considère qu’un vaccin est efficace quand il protège significativement de la maladie, autrement dit si
P (M |V ) est très inférieure à P (M |V̄ ). Ce qui n’est pas le cas ici !
Efficacité vaccinale
Comme mentionné plus haut, on considère qu’un vaccin est efficace s’il réduit notablement le risque de
développer la maladie pour une personne vaccinée comparativement à une personne qui ne l’est pas.
Autrement dit, si
P (M |V ) << P (M |V̄ )
Les probabilités figurant dans l’inégalité ci-dessus sont appelées taux d’attaque , respectivement chez les
vaccinés pour P (M |V ), et chez les non vaccinés pour P (M |V̄ ). Elles correspondent à la proportion d’indi-
vidus ayant été infectée au cours de l’épidémie au sein de chacune des populations vaccinée et non vaccinée.
P (M |V̄ ) P (M |V ) P (M |V )
EV = =1
P (M |V̄ ) P (M |V̄ )
Exemple Dans l’exemple traité ci-dessus, comme P (M |V̄ ) = 11,36% et P (M |V ) = 9,09%, l’efficacité
vaccinale est égale à
11,36% 9,09% 11,36% 1
EV = =1 = ⇠ = 20%
11,36% 9,09% 5
16
La notion d’indépendance
On a vu que
P (A et B) = P (A|B) · P (B) = P (B|A) · P (A)
P (A et B) = P (A) · P (B)
Variables aléatoires
Une variable aléatoire est une «règle» permettant de représenter les résultats d’une expérience aléa-
toire par une valeur numérique (c’est-à-dire un nombre ). Plus précisément, une variable aléatoire est une
fonction
On dit qu’une variable aléatoire est discrète lorsque les valeurs qu’elle peut prendre sont en nombre
fini (ou en nombre infini dénombrable). Dans le cas contraire, la variable aléatoire est dite continue .
Si, à chacune des valeurs possibles de la variable aléatoire, on associe la probabilité de l’événement cor-
respondant, on obtient la loi de probabilité (ou distribution de probabilité) de X.
Exemple 1 On lance deux fois une pièce de monnaie. Si on définit la variable aléatoire X par le nombre
de faces obtenues, alors on obtient la loi de probabilité suivante.
Exemple 2 On jette deux dés et on définit la variable aléatoire X = somme des résultats des deux dés.
On a alors le tableau suivant.
17
Variable aléatoire Probabilité
X P ({X})
2 1/36
3 1/18
4 1/12
5 1/9
6 5/36
7 1/6
8 5/36
9 1/9
10 1/12
11 1/18
12 1/36
Soit X une variable aléatoire discrète prenant les n valeurs x1 , . . . , xn avec les probabilités respectives
p1 , . . ., pn . On appelle espérance mathématique E(X) de la variable aléatoire X, la moyenne des xi
pondérée par les pi
n
X
E(X) = x1 · p1 + x2 · p2 + · · · + xn · pn = x i · pi
i=1
Exemple 1 Une urne contient 50 boules : 49 blanches et 1 noire. On tire au hasard une boule. On gagne
100 francs si elle est noire et 20 francs si elle est blanche.
X P (X)
100 1/50
20 49/50
Il serait absurde d’affirmer que le gain moyen consiste en la moyenne arithmétique des gains, à savoir
100+20
2 = 60. En effet, les chances de gagner 100 francs sont beaucoup plus faibles que celles de gagner 20
francs. En fait, la moyenne des gains correspond au montant que l’on peut espérer gagner. On gagne 100
francs avec la probabilité de 50
1
et 20 francs avec la probabilité de 49
50 . Ainsi, le gain moyen est la moyenne
18
des gains (100 et 20) pondérés par les probabilités respectives (0,02 et 0,98) ; c’est à dire l’espérance
mathématique
1 49
E(X) = 100 · + 20 · = 21,6 .
50 50
Exemple 2 Dans l’exemple du jet des deux pièces de monnaie, l’espérance mathématique du nombre
de faces obtenues est donc
1 1 1
E(X) = 0 · + 1 · + 2 · = 1 .
4 2 4
Exemple 3 Dans l’exemple du jet des deux dés avec la variable aléatoire X égale à la somme des
résultats, l’espérance mathématique de X est égale à
1 1 1 1 5 1 5 1 1 1 1
E(X) = 2 · +3· +4· +5· +6· +7· +8· + 9 · + 10 · + 11 · + 12 · = 7.
36 18 12 9 36 6 36 9 12 18 36
Si l’on considère que des poids pi sont situés sur une droite aux points d’abscisses xi , (i = 1, . . . , n), alors
le nombre E(X) est l’abscisse du centre de gravité des poids.
On définit la variance théorique V ar(X) de la variable aléatoire X par la variance pondérée des xi (par
rapport à l’espérance)
Xn
⇥ ⇤2
V ar(X) = xi E(X) · pi .
i=1
Exemple 1 Pour l’exemple des dés (avec espérance mathématique 7), on obtient
1 1 1 35 ⇠
V ar(X) = · (2 7)2 + · (3 7)2 + · · · + · (12 7)2 = = 5,83
36 18 36 6
Exemple 2 Pour le jeu du tirage d’une boule espérance mathématique 21,6), on obtient
1 49
V ar(X) = · (100 21,6)2 + · (20 21,6)2 ⇠
= 125,4
50 50
19
La loi binomiale
Considérons les problèmes suivants :
(1) : On lance une pièce de monnaie 20 fois et on cherche la probabilité d’obtenir 7 fois « Pile » exactement
dans n’importe quel ordre.
(2) : On jette 15 fois un dé et on cherche la probabilité d’obtenir exactement 6 fois la face « 3 » dans
n’importe quel ordre.
(3) : Un tireur touche sa cible avec la probabilité 90%. Quelle est la probabilité qu’il atteigne la cible
exactement 11 fois en tirant 17 coups ?
(4) : On soigne 20 patients avec un traitement qui se révèle efficace dans 70% des cas. Quelle est la
probabilité que 12 patients traités guérissent ?
(5) : Un étudiant répond au hasard à un QCM comprenant 25 questions. Pour chacune d’elles, 4 ré-
ponses sont proposées dont une seule est correcte. Quelle est la probabilité que l’étudiant réponde
correctement à 6 questions ?
(6) : Quelle est la probabilité qu’une famille de 7 enfants compte exactement 2 garçons ?
(7) : Quelle est la probabilité de deviner les résultats de 8 matches d’une journée de championnat au
cours de laquelle se déroulent 13 parties.
Solution de (3)
Un tireur touche sa cible avec la probabilité 90%. Quelle est la probabilité qu’il atteigne la cible exacte-
ment 11 fois en tirant 17 coups ?
Posons
On a
P (S) = 0,9 et P (E) = 0,1 = 1 0,9
La probabilité d’obtenir 11 succès suivis de 17 11 = 6 échecs
SSSSSSSSSSS
| {z } EEEEEE
| {z }
11 17 11
Il s’agit là d’un cas favorable. Les autres cas sont, par exemple
20
Le nombre de tels cas favorables est le nombre de mots qu’on peut écrire avec 11 lettres S et 17 11
lettres E (problème "MISSISSIPPI"), c’est-à-dire
✓ ◆
17! 17
=
11! · (17 11)! 11
Comme
P (11) = Nombre de cas favorables ⇥ Probabilité d’un cas favorable
la probabilité de toucher la cible exactement 11 fois est égale à
✓ ◆
17
P (11) = · 0,911 · 0,117 11 ⇠
= 0,38%
11
Notons k = 11, p = 0,9, 1 p = 0,1 et n = 17. On a donc obtenu
✓ ◆
n
P (k) = · pk · (1 p)n k
k
Il s’agit de la loi binomiale qui donne la probabilité d’obtenir exactement k succès en répétant n fois la
même expérience à deux issues succès et échec de probabilités respectives p et 1 p.
21
Espérance et variance
On lance un dé n = 600 fois. On peut espérer obtenir 100 fois la face «1».
1
100 = 600 ·
6
On lance une pièce de monnaie n = 1000 fois. On peut espérer obtenir 500 fois la face «Pile».
1
500 = 1000 ·
2
E(X) = n · p
On se trouve dans la situation où le sens commun permet d’évaluer une expression relativement compliquée
puisque
X n n
X ✓ ◆
n
E(X) = k · P (k) = k· · pk · (1 p)n k = n · p
k
i=0 i=0
On peut également démontrer que la variance de la loi binomiale est donnée par
V (X) = n · p · (1 p)
22
La loi de Poisson
Au cours d’une longue période d’observation, une maternité a enregistré 6 naissances par jour. On se
demande quelle est alors la probabilité que, demain, elle enregistre 10 naissances exactement.
1 heure
24 heures
✓ ◆ ✓ ◆10 ✓ ◆24 10
24 6 6 ⇠
P (10) = · · 1 = 3,33%
10 24 24
Mais une journée est faite de n = 24 · 60 = 1440 minutes, ce qui conduit à la relation
✓ ◆ ✓ ◆ ✓ ◆1440
1440 6 10 6 10
⇠
P (10) = · · 1 = 4,121%
10 1440 1440
Plus précisément encore, une journée est composée de n = 24 · 60 · 60 = 86400 secondes, d’où la probabilité
✓ ◆ ✓ ◆10 ✓ ◆86400 10
86400 6 6 ⇠
P (10) = · · 1 = 4,1302%
10 86400 86400
Intervalle de longueur 24
n
6 = λ = probabilite de la realisation
n n de succes dans chaque intervalle
de longueur 24
n
23
✓ ◆ ✓ ◆k ✓ ◆n k
n
P (k) = · · 1
k n n
✓ ◆ k
✓ ◆n ✓ ◆ k
n
= · · 1 · 1
k nk n n
k
✓ ◆n ✓ ◆ k
n · (n 1) · (n 2) · · · (n k + 1) · (n k) · · · 2 · 1
= · · 1 · 1
k! · (n k)! nk n n
k
✓ ◆ k ✓ ◆n
n · (n 1) · (n 2) · · · (n k + 1)
= · · 1 · 1
nk k! n n
✓ ◆ k k
✓ ◆n
n · (n 1) · (n 2) · · · (n k + 1)
= · 1 · · 1
n · n · n···n n k! n
✓ ◆ k k
✓ ◆n
n n 1 n 2 n k+1
= · · ··· · 1 · · 1
n n n n n k! n
✓◆ ✓ ◆ ✓ ◆ ✓ ◆ k k ✓ ◆n
2 1 k 1
= 1· 1 · 1 ··· 1 · 1 · · 1
n n n n k! n
| {z } | {z } | {z } | {z } | {z }
'1 '1 '1 '1 'e
Comme n est très grand (n ' 1), ' 0 et donc tous les termes rouges sont infiniment proches de 1. En
1
n
outre, la définition du nombre d’Euler
✓ ◆
1 n
e = lim 1 +
n!1 n
a pour conséquences que
⇣ ✓ ◆n
x ⌘n
e = lim 1+ = ex et donc lim 1 =e
n!1 n n!1 n
En conclusion, la probabilité cherchée s’écrit
k
P (k) = ·e
k!
Exemple Dans une région française, le nombre moyen de nouveaux cas de cancer de la thyroïde est de
15 chaque année chez les hommes. Quelle est la probabilité d’observer 11 nouveaux cas l’année prochaine ?
24
Ainsi, la probabilité demandée est égale à
1511 15 ⇠
P (11) = ·e = 6,63%
11!
Bien que la loi de Poisson ait, comme on l’a vu, un intérêt intrinsèque, elle permet aussi d’obtenir une
bonne approximation de la loi binomiale dans le cas d’événements rares. En pratique, on dira qu’un
événement de probabilité p est rare si le nombre d’expériences n et la probabilité p vérifient les conditions
suivantes : n 50 et np 5
Exemple 1 Une urne contient 10 boules : 1 noire et 9 blanches. On tire successivement n = 50 boules
avec remise et on considère la variable aléatoire X = nombre de boules noires extraites. On sait que X
suit une loi binomiale de paramètres n = 50 et p = 10
1
. Ainsi
✓ ◆
50
P (k) = · 0,1k · 0,950 k
k
1
= np = 50 · =5
10
5k
P (k) ⇠
= ·e 5
.
k!
Le tableau comparatif ci-dessous permet d’apprécier l’approximation choisie qui, en outre, simplifie nota-
blement les calculs. Les différentes probabilités sont données en %.
25
20
18
16
14
12
Binomiale
10
Poisson
Probabilités
8
0
0 1 2 3 4 5 6 7 8 9 10
k=nombre de succès
Exemple 2 Sachant que la fréquence annuelle de la trichinellose (une maladie parasitaire) est de 10 cas
pour 50 millions d’habitants, quelle est la probabilité d’observer 3 cas de personnes atteintes par cette
maladie dans une région de 10 millions d’habitants ?
10 1
Ici on a affaire à une loi binomiale dont les paramètres n = 100 0000 000 et p = 0 0
= 0
50 000 000 5 0000 000
sont connus. La probabilité cherchée est donc égale à
✓ ◆ ✓ ◆3 ✓ ◆90 9990 997
100 0000 000 1 1
P (3) = · · 1
3 50 0000 000 5 0000 000
0
Ici, il est indiqué d’utiliser une approximation avec une loi de Poisson dont le paramètre est l’espérance
mathématique
1
= n · p = 100 0000 000 · 0 =2
5 0000 000
Ainsi
23 2 ⇠
P (3) = ·e = 18,0447%
3!
Notons que le résultat obtenu par la loi de Poisson, à savoir 18,04470443% est très proche du résultat
exact donné par la loi binomiale : 18,04472248%
La loi normale
De toutes les lois usuelles, la loi normale est la plus fréquemment rencontrée. Lorsqu’une grandeur, qui
se reproduit, est soumise à l’influence d’un grand nombre de facteurs de variations indépendants les
uns des autres, chacun exerçant des actions individuelles de faible intensité dont les effets tendent à se
compenser, on peut établir que la distribution des valeurs de cette grandeur suit une loi de Laplace-Gauss
dite loi normale .
Introduction empirique
En 2001, les hommes français avaient une taille moyenne de 174 cm avec un écart-type de 7 cm. Si l’on
représente l’histogramme des fréquences associé à une répartition en classes de taille de largeur 5 cm,
on obtient une figure comportant 10 fois moins de rectangles verticaux que dans le cas où l’on divise la
population en classes de largeur 0,5 cm.
26
0.1 0.1
174 174
Les frontières supérieures des histogrammes correspondants sont des courbes en escalier qui, à mesure
que la largeur des classes est réduite et que leur nombre croît, se rapprochent d’une courbe lisse ayant la
forme d’une cloche appelée courbe gaussienne ou cloche de Gauss . L’équation cartésienne y = f (x) de
cette courbe est connue. Elle s’exprime en fonction de la moyenne µ (ici µ = 174) et de l’écart-type (ici
= 7) de la population. En clair, on a
" ✓ ◆2 #
1 1
( x µ 2
) = 1 1 x 174
f (x) = p ·e 2 p · exp
· 2⇡ 7· 2⇡ 2 7
174
180 190
Remarques et définitions
27
est clair que P (A X B) est aussi la probabilité qu’un individu choisi au hasard ait une taille X
comprise entre A et B. On dit alors que la variable aléatoire X suit une loi normale de paramètres
µ et , ce qu’on note X ⇠ N (µ; ).
— Dans le cas particulier où µ = 0 et = 1, la variable aléatoire X ⇠ N (0; 1) suit une loi dite
normale centrée réduite . La courbe correspondante est une cloche symétrique par rapport à l’axe
verticale x = 0.
Z B Z 190
P (A X B) = f (x)dx = f (x)dx
A 180
laquelle ne se laisse pas calculer analytiquement dans la mesure où la fonction f (x) n’admet pas
de primitive explicite . Autrement dit, le calcul direct de cette probabilité s’avère très complexe et re-
quiert une approximation numérique.
On peut toutefois facilement démontrer que l’aire P (A X B) sous la courbe entre les bornes A et B
est égale à l’aire d’une autre surface située entre deux nouvelles bornes a et b sous la courbe normale
centrée réduite d’équation
1 1 2
y = c(x) = p · e 2 x
2⇡
01
174 0
0.86 2.29
180 190
Autrement dit
Z 190 Z 2,29
P (180 < X < 190) = f (x)dx = c(x)dx
180 0,86
La fonction c(x) ne possédant pas de primitive explicite, il faut déterminer la valeur de l’intégrale à l’aide
d’une table (cf. annexe) qui fournit les aires (z) sous cette courbe à gauche des bornes supérieures z.
28
01
0,86 2,29
Ainsi Z 2,29
c(x)dx = (2,29) (0,86)
0,86
On y trouve (2,29) = 0,9890 et (0,86) = 0,8051 . Ainsi, le pourcentage d’hommes dont la taille est
comprise entre 180 et 190 cm est donnée par
Autre exemple Déterminons maintenant le pourcentage d’hommes dont la taille est inférieure à 170
cm, c’est-à-dire la probabilité, pour la variable aléatoire taille X, d’être inférieure à B = 170. La
nouvelle borne obtenue après conversion en unités centrées réduites est donc
B µ 170 174
b= = = 0,57
7
29
Il s’agit alors de calculer ( 0,57). Or, la table ne donne pas les valeurs de (z) pour z < 0. Celles-ci
s’obtiennent en exploitant la symétrie de la cloche de Gauss.
01
On en déduit
P (X > 185) = 1 (1,57) = 1 0,9418 = 5,82%
b) Individus dont la taille est supérieure à A = 168 cm.
On en déduit
P (X > 168) = 1 ( 0,86) = 1 [1 (0,86] = (0,86) = 80,51%
30
On en déduit
P (167 < X < 182) = (1,14) ( 1)
= (1,14) [1 (1)]
= (1,14) + (1) 1
= 0,8729 + 0,8413 1
= 71,42%
Remarque Comme déjà mentionné plus haut dans ce cours, pour une variable aléatoire X suivant une
loi normale N (µ, ), on a
31
Application : réchauffement climatique
Selon un rapport de l’ONU basé sur les projections du Giec, le monde se dirige actuellement vers une hausse
"dramatique" des températures de +2,7 C d’ici à la fin du siècle. Un réchauffement causé par l’homme et
ses activités industrielles (notamment ses émissions d’énergies fossiles). Lorsque ces combustibles fossiles
brûlent, ils libèrent des gaz à effet de serre, principalement du dioxyde de carbone (CO2). Ces gaz piègent
la chaleur du Soleil et font monter la température globale de la planète.
Le graphique ci-dessus a pour axe horizontal les années d’observation et, pour axe vertical, l’écart entre
les températures annuelles et la température moyenne sur la période de référence 1951-1980. Dix-neuf des
années les plus chaudes sont advenues depuis 2000, à l’exception de 1998, qui a été favorisée par un très
fort El Niño. L’année 2020 est, à égalité avec 2016, l’année la plus chaude jamais enregistrée depuis le
début des relevés en 1880 (source : NASA/GISS). La courbe rouge représente la moyenne mobile sur cinq
ans de la série chronologique (courbe noire) donnant la variation moyenne des températures à la surface
du globe.
Le sommet COP26
Le 31 octobre 2021 s’est ouverte la COP26 à Glasgow. Les dirigeants de la planète avaient jusqu’au 12
novembre 2021 pour tomber d’accord sur une déclaration finale ambitieuse qui nous rapprocherait des
objectifs de l’Accord de Paris : limiter le réchauffement à +1,5 C d’ici à la fin du siècle. Cet événement
qui rassemble plus de 190 pays chaque année a pour but de définir des objectifs et des actions communes
afin de contenir le réchauffement climatique.
32
Les phénomènes météorologiques extrêmes liés au changement climatique - y compris les vagues de cha-
leur, les inondations et les incendies de forêt - s’intensifient. La dernière décennie a été la plus chaude
jamais enregistrée, et les gouvernements conviennent qu’une action collective urgente est nécessaire. Le
monde est maintenant environ 1,2 C plus chaud qu’il ne l’était au 19ème siècle et la quantité de CO2
dans l’atmosphère a augmenté de 50%.
Supposons qu’en un endroit du globe, sur une période donnée, la température ait pour moyenne µ = 25 et
pour écart-type = 3 . Si on appelle «jour chaud», une journée durant laquelle la température moyenne
excède 30 , alors la fréquence de tels jours est égale à
✓ ◆
30 25 ⇠
P (T > 30) = 1 = 4,78%
3
Si la température moyenne augmente de seulement 1,5 (et donc µ = 26,5) la fréquence des jours chauds
passe alors à
✓ ◆
30 26,5 ⇠
P (T > 30) = 1 = 12,17%
3
et est donc presque triplée ! Avec la hausse dramatique annoncée de 2,7 , si rien n’est entrepris, cette
fréquence se trouve quintuplée
✓ ◆
30 27,7 ⇠
P (T > 30) = 1 = 22,16%
3
33
Quant aux «jours froids» pour lesquels la température moyenne est inférieure à 20 , leur fréquence est la
suivante : ✓ ◆
20 µ
P (T < 20) =
3
µ P (T < 20)
25 4,78%
26,5 1,51%
27,7 0,513%
34
Approximation d’une loi binomiale par la loi normale
Dans un cabinet médical, on teste l’allergie de n = 30 patients à une certaine substance qui provoque une
réaction avec une probabilité p = 30%.
Comme on l’a vu, la probabilité que k patients exactement développent l’allergie est donnée par la loi
binomiale ✓ ◆ ✓ ◆k ✓ ◆30 k
30 3 7
P (k) =
k 10 10
Cette probabilité peut être représentée dans un histogramme par un rectangle, centré en k, de base 1 et
de hauteur, donc d’aire, P (k)
La loi de probabilité est alors représentée par un histogramme formé de 31 rectangles verticaux d’aires
P (0), P (1), P (2), ... P (30)
0.15
0.125
0.1
0.075
0.05
0.025
5 10 15 20
Supposons qu’on cherche la probabilité que, sur 30 patients testés, le nombre de patients allergiques soit
compris entre 6 et 12 ; autrement dit
P (6) + P (7) + P (8) + P (9) + P (10) + P (11) + P (12)
En fait, la probabilité demandée correspond géométriquement à la somme des aires de 7 rectangles dont
les bases (de longueur 1) sont centrées en 6, 7, . . . , 12.
Cette aire totale est très voisine de l’aire comprise sous une cloche de Gauss y = f (x) entre les bornes
A = 5,5 et B = 12,5 .
35
Or, il se trouve que cette fonction est connue
" ✓ ◆2 #
1 1 x m
f (x) = p · exp
s· 2⇡ 2 s
m = n · p = 30 · 0,3 = 9
et l’écart-type
p p
s= n · p · (1 p) = 30 · 0,3 · 0,7 = 2,51
de la loi binomiale.
L’aire considérée est donc aussi égale à celle sous la courbe normale centrée réduite
A 0,5 m 6 0,5 9
a = = = -1,39
s 2,51
B + 0,5 m 12 + 0,5 9
b = = = 1,39
s 2,51
36
Il s’ensuit que
P (6) + P (7) + · · · + P (12) = (1,39) ( 1,39)
= (1,39) [1 (1,39)]
= 2 · (1,39) 1
= 2 · 0,9177 1
= 83,54%
À titre de comparaison, la valeur exacte, calculée avec la loi binomiale, est égale à 83,89% . L’approximation
est assez grossière parce que n = 30 seulement.
Remarque La loi normale donne une bonne approximation de la loi binomiales aux conditions suivantes
n > 30 n·p 5 n · (1 p) 5
Application
Une opération chirurgicale conduit à des complications dans 0,7% des cas. Calculer la probabilité que,
sur 800 patients opérés, on constate entre 5 et 10 complications.
et l’écart-type
p p
s= n · p · (1 p) = 800 · 0,007 · 0,993 = 2,358
Les nouvelles bornes sont alors
5 0,5 5,6
a = = 0,47
2,358
10+0,5 5,6
b = = 2,08
2,358
On en conclut que
P (5 X 10) = (2,08) ( 0,47)
= (2,08) [1 (0,47)]
= (2,08) + (0,47) 1
= 0,9812 + 0,6808 1
= 66,20%
37