Vous êtes sur la page 1sur 63

P OLYCOPIÉ

P ROBABILITÉS & S TATISTIQUES


F ILIÈRE : BCG S3
M ODULE : M 233

M. M OUMNI
D ÉPARTEMENT DE M ATHÉMATIQUES
FACULTÉ DES S CIENCES ET T ECHNIQUES
E RRACHIDIA

A NNÉE UNIVERSITAIRE 2020/2021


Table des matières

1 Dénombrement 7
1.1 Notions sur les ensembles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.1 Ensemble fini - Ensemble infini dénombrable . . . . . . . . . . . . . . . . . . . 7
1.1.2 Propriétés des cardinaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2 p-listes d’un ensemble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.1 p-listes d’un ensemble à n éléments . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.2 Représentation sous forme d’un arbre pour dénombrer des choix ordonnés . . . . 9
1.2.3 p-listes d’éléments distincts de E . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3 Parties d’un ensemble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.1 Combinaisons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.2 Dénombrement de P(E) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4 Conclusion du chapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2 Introduction aux probabilités 15


2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2 Notions de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3 Opérations sur les événements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4 Probabilité sur un univers fini - Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.5 Probabilités conditionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.6 Probabilités totales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.7 Théorème (ou formule) de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.8 Évènements indépendants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3 Variables aléatoires 21
3.1 Variables aléatoires discrètes finies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.1.1 Espérance, variance et écart-type . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.1.2 Couple de variables aléatoires discrètes . . . . . . . . . . . . . . . . . . . . . . 26
3.1.3 Covariance et moments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.1.4 Indépendance de deux variables aléatoires . . . . . . . . . . . . . . . . . . . . . 28
3.1.5 Exemples d’application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 3/63


3.1.6 Exemples de variables aléatoires discrètes finies . . . . . . . . . . . . . . . . . . 33
3.2 Variables aléatoires discrètes infinies . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.3 Variables aléatoires continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.3.1 Propriétés fondamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3.2 Espérance, variance et écart-type . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3.3 Exemples de variable aléatoire continue . . . . . . . . . . . . . . . . . . . . . . 37
3.4 Approximation d’une loi binômiale par une loi de Poisson . . . . . . . . . . . . . . . . 40
3.5 Approximation d’une loi binômiale par une loi normale . . . . . . . . . . . . . . . . . . 41
3.6 Approximation d’une loi de Poisson par une loi normale . . . . . . . . . . . . . . . . . 43
3.7 Récapitulatif des approximations successives . . . . . . . . . . . . . . . . . . . . . . . 43

4 Statistiques : Séries à une variable 45


4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2 Méthode de représentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2.1 Terminologie de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2.2 Fréquence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.2.3 Fonction cumulative . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.2.4 Graphiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.3 Caractéristiques de position . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.3.1 Mode. Moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.3.2 Médiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.3.3 Quartiles, déciles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.4 Caractéristiques de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.4.1 L’étendue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.4.2 La variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.4.3 L’écart-type . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

5 Statistiques doubles 55
5.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.1.1 Données non groupées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.1.2 Données groupées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
5.2 Tableaux de calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
5.2.1 Données non groupées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
5.2.2 Données groupées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.3 Ajustement - Méthode des moindres carrés . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.3.1 Première droite des moindres carrés . . . . . . . . . . . . . . . . . . . . . . . . 59
5.3.2 Deuxième droite des moindres carrés . . . . . . . . . . . . . . . . . . . . . . . 59
5.3.3 Ajustement et corrélation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.4 Exemple d’application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 4/63


Annexe 62

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 5/63


M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 6/63
Chapitre 1

Dénombrement

1.1 Notions sur les ensembles

1.1.1 Ensemble fini - Ensemble infini dénombrable


Définition 1.1 Soient E et F deux ensembles non vides. E est équipotent à F si et seulement si il existe
une bijection de E sur F.

Exemple 1.1 N est équipotent à N∗ car l’application f : N → N∗ défini par f (n) = n + 1 est une
bijection.

Définition 1.2 Soit E un ensemble non vide. E est dit fini si et seulement si il existe un entier naturel
unique non nul n tel que E est équipotent à J1, nK.

Convention. ∅ est un ensemble fini.

Définition 1.3 Soit E un ensemble fini non vide. Soit n l’unique entier naturel non nul tel que E est
équipoten [1, nK. L’entier n s’appelle le cardinal de E (ou plus simplement le nombre d’éléments de E
). Il se note card(E).

Convention. Le cardinal de l’ensemble vide est 0 ou encore card(∅) = 0.

Remarque 1.1 Deux ensembles finis équipotents ont le même cardinal.

Proposition 1.1 Soit E un ensemble. Card E = n si et seulement si les éléments de E peuvent être notés
e1 , e2 , . . . , en , où les ek sont deux à deux distincts.

Dénombrer un ensemble fini non vide E, c’est déterminer le cardinal de E, c’est-à-dire le nombre de
ses éléments.

Définition 1.4 On dit que l’ensemble E est infini dénombrable s’il est équipotent à N. Les éléments de
E peuvent être notés e0 , e1 , . . . , en , . . . où les ek sont deux à deux distincts.

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 7/63


Exemple 1.2 N est infini dénombrable.
N∗ est infini dénombrable : bijection N → N∗ , n 7→ n + 1.
Z est infini dénombrable.
R n’est pas infini dénombrable. De même, un intervalle [a, b] n’est pas infini dénombrable.

1.1.2 Propriétés des cardinaux


Proposition 1.2 Soit E un ensemble fini. Toute partie A de E est finie et Card A ≤ Card E.
Si A est une partie de E, A = E ⇔ Card A = Card E.

Proposition 1.3 Soit A et B deux parties d’un ensemble fini E.


(1) Si A et B sont disjointes, Card (A ∪ B) = Card A + Card B.
(2) Card (A \ B) = Card (A) − Card (A ∩ B).
(3) Card A = Card E − Card A (A désigne le complémentaire de A dans E).
(4) Card (A ∪ B) = Card A + Card B − Card (A ∩ B)

Proposition 1.4 Soit E et F deux ensembles finis. Alors E × F est fini et

Card (E × F ) = (Card E) · (Card F )

On rappelle que E × F = {(e, f )/e ∈ E et f ∈ F }.

Une généralisation du résultat précédent est donnée par


Qn
Proposition 1.5 Soient n > 2 puis E1 , . . . , En , n ensembles finis non vides. Alors i=1 Ei est fini et (
n n
!
Y Y
card Ei = card (Ei )
i=1 i=1

En particulier, si E est un ensemble fini et n un entier naturel non nul, En est fini et

card (En ) = (card(E))n

Exemple 1.3 E = {1, 2, 5, 10, 3}, Card E = 5.


F = {8, 9}, Card F = 2, Card (F × F ) = Card {(8, 8), (8, 9), (9, 8), (9, 9)} = 4 = Card F × Card F.

1.2 p-listes d’un ensemble

1.2.1 p-listes d’un ensemble à n éléments


Définition 1.5 On appelle p-liste ou p-uplet d’un ensemble E à n éléments, tout élément de E p , c’est-
à-dire toute suite de p éléments de E.

Remarque 1.2

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 8/63


• L’ordre des éléments de la p-liste est important.
Deux p-listes contenant les mêmes éléments dans des ordres différents sont différentes.
Autrement dit : Deux p-listes sont identiques si et seulement si elles sont constituées des mêmes
éléments aux mêmes places. Par exemple : (1, 2, 4) et (4, 2, 1) sont deux triplets distincts.
• Une p-liste peut contenir plusieurs fois le même élément.
• Une p-liste est aussi appelée p-uplet.

Exemple 1.4 Soit E = {1, 2, 3, 4, 5}.


(1, 2, 2) et (5, 3, 4) sont des 3-listes d’éléments de E.
(5, 3, 4) et (3, 5, 4) sont des 3-listes différentes.

Théorème 1.1 Il y a np p-listes d’un ensemble à n éléments.

Démonstration 1.1 Cela vient du fait que Card(E p ) = (Card(E))p .

Exemple 1.5 Combien de numéros de téléphones longs de 9 chiffres peut-on faire avec les chiffres de 0
à 9?

Réponse. Chaque numéro de téléphone est une p-liste de 9 chiffres pris parmi 10 chiffres (il faut faire
attention au fait qu’il y a 10 chiffres, et non pas 9, de 0 à 9). Est-ce que l’ordre compte lors de la
composition d’un numéro ? Oui. Peut-on retrouver plusieurs fois le même chiffre dans la composition
d’un numéro ? Oui, il faut alors calculer le nombre de p-listes. On doit “prendre" 9 chiffres parmi 10
chiffres, d’où n = 10 et p = 9. Donc le nombre de numéros de téléphone est de 109 .

Remarque 1.3 On utilise les p-listes en cas de choix successifs de p éléments d’un ensemble, avec
éventuelles répétitions.

1.2.2 Représentation sous forme d’un arbre pour dénombrer des


choix ordonnés
Exemple 1.6 Le code secret d’une carte bancaire est composé de 3 lettres. Dans un premier temps, on ne
s’intéresse qu’aux codes composés des lettres a et b. Pour visualiser et dénombrer tous ces codes, nous
allons utiliser l’arbre suivant :

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 9/63


Nombre de codes possible = nombre de chemins de cet arbre.
2 × 2 × 2 = 23 = 8 codes différents dont les 3 lettre appartiennent à l’ensemble E.
Dans un second temps, on s’intéresse à tous les codes composés de 4 chiffres de l’ensemble {0, 1, . . . , 9},
noté E.
Nombre de codes possibles 10 × 10 × 10 × 10 = 104 = 10000.

1.2.3 p-listes d’éléments distincts de E


Définition 1.6 Soit E un ensemble et soit p ∈ N∗ . On appelle p-arrangement de E ou arrangement de
p éléments de E toute suite de p éléments distincts de E. Si E contient n éléments, on note Apn le nombre
d’arrangement à p éléments d’un ensemble à n éléments.

Remarque 1.4

Si p > n, il ne peut pas y avoir de p -arrangements dans l’ensemble E . On a alors Apn = 0 .

Théorème 1.2 Soit E un ensemble fini de cardinal n. Soit p 6 n. Alors le nombre de p -arrangements
Apn de l’ensemble E est égal ȧ
n!
Apn = n(n − 1)(n − 2) · · · (n − p + 1)] =
(n − p)!

où on a noté n! = n × (n − 1) × (n − 2) × · · · × 2 × 1, appelé factorielle n.

Démonstration 1.2 Pour dénombrer les p -uplets (x1 , . . . , xp ) de E p dont les éléments sont distincts
deux à deux, :
— on commence par choisir x1 parmi les n éléments de E
— puis on choisit x2 parmi les n − 1 éléments de E distincts de x1
— puis on choisit x3 parmi les n − 2 éléments de E distincts de x1 et x2
— ...
— puis on choisit xp parmi les n − p + 1 éléments de E distincts de x1 , x2 , . . . , xp−1 .
Il y a donc bien n(n − 1)(n − 2) · · · (n − p + 1)p -arrangements de E.

Remarque 1.5 On utilise les arrangements en cas de choix succesifs de p éléments pris parmi n, sans
répétition

Exemple 1.7 A l’occasion d’une compétition sportive groupant 18 athlètes, on attribue une médaille
d’or, une d’argent, une de bronze. Combien y-a-t-il de distributions possibles ?

Réponse. Un tel podium est un arrangement de 3 athlètes choisis parmi l’ensemble de 18 athlètes (l’ordre
compte et il ne peut pas y avoir de répétition, un athlète ne pouvant remporter deux médailles simultané-
ment). Il existe donc
18! 18!
A318 = = = 18 × 17 × 16 = 4896 podiums différents.
(18 − 3)! 15!

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 10/63


Exemple 1.8 Un ordinateur doit décoder un mot de passe de 7 caractères distincts parmi un catalogue
de 12 caractères disponibles. Combien y a-t-il de possibilités ?

Réponse. Soit E l’ensemble des caractères disponibles. Une possibilité revient à choisir, dans un ordre
précis, 7 caractères parmi 12. Compte tenu de la notion d’ordre, une possibilité correspond donc à un
arrangement de 7 éléments parmi 12. Le nombre de possibilités est donné par
12!
A712 = = 12 × 11 × 10 × 9 × 8 × 7 × 6 = 3991680.
(12 − 7)!
L’ordinateur doit donc tester au maximum 3991680 possibilités pour décoder le mot de passe.

Définition 1.7 Soit E un ensemble à n éléments. Un n-arrangement de E est appelé une permutation
de E. Une permutation est donc un n-uplet constitué, dans un certain ordre, des n éléments de E.

Théorème 1.3 Soit E un ensemble à n éléments. Alors il y a n! permutations de E. Autrement dit, il y a


n! façons de ranger n éléments distincts dans tous les ordres possibles.

Remarque 1.6 On utilise les permutations dans les cas où on veut ordonner tous les éléments d’un
ensemble sans répétition.

1.3 Parties d’un ensemble

1.3.1 Combinaisons
Définition 1.8 Soit E un ensemble fini à n éléments. On appelle combinaison de p éléments de E,
toute partie à p éléments de E.

Remarque 1.7 Les éléments d’une combinaison de p éléments de E sont deux à deux distincts, donc
0 ≤ p ≤ Card E.
L’ordre des éléments d’une combinaison n’a pas d’importance.

Exemple 1.9 E = {1, 2, 3, 4, 5}


F = {1, 2, 3} est une combinaison de 3 éléments de E.
G = {1, 2, 3} = {2, 3, 1}
H = {1, 2, 2} n’est pas une combinaison de 3 éléments de E (ni de 2 éléments de E).

Théorème 1.4 Soit E un ensemble à n éléments. On note Cnp le nombre de combinaisons de p éléments
de E. On a
Apn n!
Cnp = = .
p! p!(n − p)!
Démonstration 1.3 Il suffit de montrer que : Apn = p!Cnp . Deux p-arrangements d’éléments de E =
{x1 , x2 , . . . , xn } ont le même support si ils sont formés des mêmes elements mais pas nécessairement
dans le même ordre. On peut alors ranger tous les p-arrangements en catégories en mettant ensemble
tous ceux qui ont le même support. On remarque alors que le nombre de catégories est Cnp et que chaque
catégorie comporte p! arrangements.

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 11/63


Remarque 1.8 On retiendra que l’on utilise les combinaisons dans les problèmes de choix simultanés
de p éléments choisis parmi n, sans considération d’ordre et sans répétition

Proposition 1.6 Pour n ∈ N et p ∈ {0, · · · , n}


Cnp = Cnn−p
Cn0 = Cnn = 1
Pour n ∈ N∗ et p ∈ {1, · · · , n − 1} Cn1 = Cnn−1 = n
Cnp = Cn−1
p−1 p
+ Cn−1
Cnp = np Cn−1
p−1

Formule du binôme : pour (a, b) ∈ C2 et n ∈ N


n
X n
X
n
(a + b) = Cnp ap bn−p = Cnp an−p bp
p=0 p=0

Remarque 1.9 La relation Cnp = Cn−1


p−1 p
+ Cn−1 permet d’écrire le triangle de Pascal. Ce triangle fournit
la valeur des Cnp pour les petites valeurs de n.

n=0: 1

n=1: 1 1

n=2: 1 2 1

n=3: 1 3 3 1

n=4: 1 4 6 4 1

1.3.2 Dénombrement de P(E)


On note P(E) l’ensemble des parties de E.

Théorème 1.5 Si Card E = n alors Card P(E) = 2n .

Démonstration 1.4 Notons pour tout k ∈ J0, nK, Ek l’ensemble des parties de E à k éléments. Alors, la
famille (E0 , E1 , . . . , En ) est une partition de P(E). De plus, on sait que pour tout k ∈ J0, nK, Card (Ek ) =
Cnp . Ainsi Card(P(E)) = nk=0 Card (Ek ) = nk=0 Cnp = nk=0 Cnp 1k 1n−k = (1 + 1)n = 2n .
P P P

1.4 Conclusion du chapitre


Si on veut dénombrer un ensemble fini E
1. On peut reconnaître des p-listes, des arrangements, des combinaisons, des permutations...
2. On peut scinder E en plusieurs parties disjointes.
3. On peut dénombrer le complémentaire.

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 12/63


4. On peut détailler les étapes qui permettraient de décrire tous les éléments de E, en comptant le
nombre de choix possibles à chaque étape.

Exemple 1.10 Soit A l’ensemble des nombres à 6 chiffres ne comportant aucun 0. Déterminer les car-
dinaux des ensembles suivants :
1. A,
2. A1 , ensemble des nombres de A ayant 6 chiffres différents,
3. A2 , ensemble des nombres pairs de A,
4. A3 , ensemble des nombres de A dont les chiffres forment une suite strictement croissante (dans
l’ordre où ils sont écrits).

Réponse.
1. Un élément de A est une 6-liste d’éléments de E = {1, 2, 3, 4, 5, 6, 7, 8, 9}. On a Card E = 9
donc Card A = 96 .
9!
2. Un élément de A1 est un arrangement de 6 éléments de E, donc Card A1 = A69 = .
3!
3. Un élément de A est pair si et seulement si son chiffre des unités est 2, 4, 6 ou 8. Il y a 4 façons
de choisir un tel chiffre pair pour chacune d’elles, 95 façons de choisir la 5-liste des 5 premiers
chiffres donc Card A2 = 4 × 95 .
4. Il y a C96 façons de choisir les 6 chiffres d’un nombre de A3 , puis pour chacune d’elles, 1 façon
de les écrire dans l’ordre croissant, donc Card A3 = C96 .

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 13/63


M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 14/63
Chapitre 2

Introduction aux probabilités

2.1 Introduction

Le but de la théorie des probabilités est de fournir un modèle mathématique dans lequel on puisse parler
sans ambiguïté de “la probabilité qu’un événement A donné se réalise” lors du déroulement de l’expé-
rience E à résultat aléatoire ou de “la probabilité qu’une variable X dont la valeur dépend du résultat de
E prenne sa valeur dans un domaine donné”.

2.2 Notions de base

Définition 2.1 On note Ω l’ensemble de toutes les éventualités, ou résultats possibles d’une expérience
aléatoire E. On l’appelle univers ou ensemble fondamental.

Définition 2.2 Un événement A est un ensemble d’éventualités possédant la même propriété. Il est donc
représenté par un sous-ensemble A de Ω. Si le résultat d’une expérience est un élément de A, on dit que
l’événement A a été réalisé.

Exemple 2.1 Soit E qui consiste à jeter un dé à 6 faces, alors Ω est l’ensemble de toutes les issues
possibles : Ω = {1, 2, 3, 4, 5, 6}; “le résultat est 1 ou 2” et “le chiffre est un nombre pair” sont des
événements.

Définitions élémentaires

• L’ensemble vide ∅ est appelé événement impossible, puisqu’aucun élément de ∅ ne peut être
réalisé.
• L’ensemble des cas possibles Ω est appelé événement certain.
• Un événement ne comportant qu’un seul résultat possible est appelé événement élémentaire.
• L’événement A complémentaire de A dans Ω, est appelé événement contraire de A.
Étant donnés deux événements A et B, on définit :

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 15/63


• A ∩ B la conjonction des événements A et B, réalisé si A et B sont tous les deux réalisés.
Si A ∩ B = ∅, on dit que les événements A et B sont incompatibles ou mutuellement exclusifs.
• A ∪ B, réalisé si A, ou B, ou (A et B) sont réalisés.
• A\B, réalisé si A est réalisé, mais pas B.

Exemple 2.2 Lancer d’un dé à 6 faces.


1. Soit les événements E : “obtenir un 3” et F : “obtenir un nombre pair”. Alors E = {3} et
F = {2, 4, 6}. E et F sont incompatibles car E ∩ F = ∅.
2. Soit maintenant les événements E : “obtenir un nombre inférieur ou égal à 3” et F : “obtenir un
nombre pair”. Alors E = {1, 2, 3}, F = {2, 4, 6} et E ∩ F = {2} =
6 ∅.

2.3 Opérations sur les événements


Soient trois événements A, B et C.
• A=A
• A ∪ (B ∪ C) = (A ∪ B) ∪ C = A ∪ B ∪ C
• A ∩ (B ∩ C) = (A ∩ B) ∩ C = A ∩ B ∩ C
• A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
• A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
• A∪B =A∩B
• A∩B =A∪B

2.4 Probabilité sur un univers fini - Propriétés


Soit Ω un univers fini. On note P(Ω) l’ensemble des événements de Ω.

Définition 2.3 On appelle probabilité sur l’univers Ω, une application P de P(Ω) sur [0, 1] telle que
1. P (Ω) = 1
2. Pour toute suite {An }n≥1 d’événements de Ω deux à deux incompatibles (i.e ; 2 à 2 disjoints :
Ai ∩ Aj = ∅ si i 6= j), alors
[ X
P( An ) = P (An )
n≥1 n≥1

Définition 2.4 Le triplet (Ω, P(Ω), P ) s’appelle espace probabilisé fini.

Conséquences
• ∀A de Ω, 0 ≤ P (A) ≤ 1
• Si A ∩ B = ∅, alors P (A ∪ B) = P (A) + P (B)
n
[
• Si A1 , A2 , · · · , An sont des événements élémentaires et Ai = Ω, alors
i=1

P (A1 ) + P (A2 ) + · · · + P (An ) = 1

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 16/63


1
Si tous les événements élémentaires sont équiprobables, c’est-à-dire, si P (Ak ) = pour k =
n
1, 2, · · · , n alors, si A est constitué de m événements de ce type
m Card A
P (A) = =
n Card Ω
On dit que P est la loi uniforme sur Ω.
Lorsque l’espace fondamental Ω est fini ou dénombrable, définir la probabilité P sur les événements Ω
équivaut à se donner la famille {pω }ω∈Ω des probabilités individuelles, i.e. pω = P ({ω}), ω ∈ Ω. Soit
A ⊂ Ω, alors
X
P (A) = pω .
ω∈A

Propriétés élémentaires :
• P (A ∪ B) = P (A) + P (B) − P (A ∩ B).
En effet, A ∪ B = (A\B) ∪ B implique que P (A ∪ B) = P (A\B) + P (B), et A = (A\B) ∪
(A ∩ B) implique que P (A) = P (A\B) + P (A ∩ B).
• P (A) = 1 − P (A).
En effet, Ω = A ∪ A implique P (Ω) = P (A) + P (A) = 1.
• P (∅) = 0.
• Si A ⊂ B, alors P (A) ≤ P (B) (P est une fonction croissante)
• Si A ⊂ B, alors P (B\A) = P (B) − P (A).

2.5 Probabilités conditionnelles


Exemple 2.3 Composition d’une famille composée de 2 enfants

Ω = {(G, G), (G, F ), (F, G), (F, F )}


| {z } | {z } | {z } | {z }
1/4 1/4 1/4 1/4

4 éventualités supposées équiprobables.


A :“La famille a 2 garçons” . P (A) = 1/4.
B :“La famille a au moins un garçon” . P (B) = 3/4.
Supposons que l’on sache que l’événement B est réalisé, que devient la probabilité de A ?

Définition 2.5 (probabilité conditionnelle) Soient A et B deux événements tels que P (B) 6= 0. La
probabilité conditionnelle de A sachant B est

P (A ∩ B)
P (A/B) = .
P (B)
On peut écrire également
P (A ∩ B)
P (B/A) = .
P (A)

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 17/63


On en déduit la formule dite des probabilités composées

P (A ∩ B) = P (B)P (A/B) = P (A)P (B/A).

Exercice : Répondre à la question de l’exemple 2.3.

2.6 Probabilités totales


Définition 2.6 (système complet d’événements) {An }n≥1 forme un système complet d’événements lorsque
{An }n≥1 forme une partition de Ω, i.e. :
• ∀n ≥ 1, An 6= ∅
• ∀i, j ≥ 1, i 6= j, Ai ∩ Aj = ∅
[
• An = Ω
n≥1

Théorème 2.1 (formule des probabilités totales) Soit {An }n≥1 un système complet d’événements. Alors,
quelque soit l’événement B, on a
X
P (B) = P (An )P (B/An )
n≥1

Exemple 2.4 Soit A un événement, B et B deux événements complémentaires. En appliquant la formule


des probabilités totales, on obtient

P (A) = P (B)P (A/B) + P (B)P (A/B)

Exemple 2.5 Le gérant d’un magasin de matériel informatique a acheté un stock de boîte de disquettes.
5% des boîtes sont abîmées. Le gérant estime que
• 60% des boîtes abîmées contiennent au moins une disquette défectueuse,
• 98% des boîtes en bon état ne contiennent aucune disquette défectueuse,
• les états des diverses boîtes sont indépendants les uns les autres.
Un client achète une des boîtes du lot.
On désigne par A l’événement :“la boîte achetée est abîmée" et par D l’événement :“la boîte achetée
contient au moins une disquette défectueuse".
1. Donner les probabilités P (A), P (A), P (D/A), P (D/A), P (D/A) et P (D/A).
Calculer la probabilité de l’événement D.
2. Le client constate qu’une des disquettes est défectueuse. Quelle est la probabilité qu’il ait acheté
une boîte abîmée.
Réponse.
1. P (A) = 0.05; P (A) = 0.95; P (D/A) = 0.6; P (D/A) = 0.02; P (D/A) = 0.4; P (D/A) =
0.98. L’ensemble {A, A} est un système complet d’événements. On a D = (D ∩ A) ∪ (D ∩ A)
donc P (D) = P (D/A)P (A) + P (D/A)P (A) = 0.6 × 0.05 + 0.02 × 0.95 = 0.049.
P (A∩D) P (D/A)P (A)
2. P (A/D) = P (D) = P (D) = 39 .

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 18/63


2.7 Théorème (ou formule) de Bayes
Théorème 2.2 Soit {An }n≥1 un système complet d’événements, et B un événement tel que P (B) 6= 0.
On a, pour tout i :

P (Ai ∩ B) P (Ai )P (B/Ai ) P (Ai )P (B/Ai )


P (Ai /B) = = =X
P (B) P (B) P (An )P (B/An )
n≥1

Exemple 2.6 Pour se rendre à la faculté, un étudiant a le choix entre quatre itinéraires : A, B, C, D.
1 1 1
La probabilité qu’il a de choisir A (resp. B,C) est (resp. , ).
3 4 12
1 1 1
La probabilité d’arriver en retard en empruntant A (resp. B,C) est (resp. , ). En empruntant D, il
20 10 5
n’est jamais en retard.
1. Quelle est la probabilité que l’étudiant choisisse l’itinéraire D ?
2. L’étudiant arrive en retard. Quelle est la probabilité qu’il ait emprunté l’itinéraire C ?
Réponse.
1
1. P (D) = 1 − P (A) − P (B) − P (C) = 3 car {A, B, C, D} constitue un système complet
d’évenements.
2. Soit R :“l’étudiant arrive en retatrd". On a P (R/A) = 1/20; P (R/B) = 1/10; P (R/C) = 1/5
et P (R/D) = 0. On cherche P (C/R). On a

P (C)P (R/C) 2
P (C/R) = = .
P (A)P (R/A) + P (B)P (R/B) + P (C)P (R/C) + P (D)P (R/D) 7

2.8 Évènements indépendants


Étant donnés deux événements A et B (avec P (B) > 0), la probabilité conditionnelle P (A/B) apparaît
comme une évaluation de “voir A se réaliser” compte tenu de l’information “B est quant à lui réalisé”
. Si, au sens du langage courant, on considère que A et B sont “indépendants”, on est raisonnablement
amené à souhaiter que P (A/B) = P (A). Mais alors, c’est que

P (A ∩ B) = P (A)P (B)

Définition 2.7 Deux événements A et B sont dits indépendants si

P (A ∩ B) = P (A)P (B)

Conséquences
• Si A et B sont indépendants, il en est de même de A et B ; de A et B ; de A et B.
• Tout événement A est indépendant de l’événement certain Ω et de l’événement impossible ∅.

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 19/63


• En général, on a P (A/B) 6= P (A) ce qui signifie que “A dépend de B” .

Définition 2.8 Soit une suite (finie ou non) d’événements (An )n∈N . Ces événements sont globalement
indépendants si pour toute famille finie {Ai }i∈I extraite de la suite An on
\  Y
P Ai = P (Ai )
i∈I i∈I

Exemple 2.7 On lance deux pièces de monnaie et on considère les événements


A :“la première pièce donne face” .
B :“la deuxième pièce donne pile” .
C :“les 2 pièces donnent le même résultat” .
1. Les événements A, B, C sont-ils indépendants 2 à 2 ?
2. L’événement C est-il indépendant de A ∩ B ?
3. Les événements A, B, C sont-ils globalement indépendants ?
Réponse.
1. Ω = {(P, P); (P, F); (F, P); (F, F)}. P (A) = 2/4; P (B) = 2/4. C = {(P, P); (F, F)} donc
P (C) = 2/4. P (A ∩ B) = 1/4 = 1/2 × 1/2.
2. P (A ∩ B ∩ C) = 0 6= 1/4 × 1/2 donc C dépend de A ∩ B.
1
3. Il suffit de remarquer que P (A ∩ B ∩ C) = 0 6= = P (A)P (B)P (C) pour déduire que les
8
événements A, B et C ne sont pas globalement indépendants.

Exemple 2.8 Deux opérateurs de saisie, A et B, entrent respectivement 100 et 200 tableaux sur un
support informatique. Les tableaux de A comportent des fautes dans 5.5% des cas et ceux de B dans
6.7% des cas. On prend un tableau au hasard, il comporte des fautes. Quelle est la probabilité pour que
A se soit occupé de ce tableau ?
Réponse. Soient les événements
TA :“le tableau est entré par A”.
TB = TA :“le tableau est entré par B”.
F :“le tableau comporte des fautes”.
D’après le théorème de Bayes :
1
P (TA )P (F/TA ) × 0.052
P (TA /F ) = = 3
P (TA )P (F/TA ) + P (TB )P (F/TB ) 1 2
× 0.052 + × 0.067
3 3
= 0.279

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 20/63


Chapitre 3

Variables aléatoires

Souvent, lors d’une expérience aléatoire, on ne s’intéresse pas à l’issue ω de cette épreuve, mais à
une fonction de cette réalisation (notée X(ω)) de cette issue, donnant une valeur numérique...

Définition 3.1 (variable aléatoire) Soit un espace probabilisé (Ω, P(Ω), P ) associé à une expérience
aléatoire. On appelle variable aléatoire réelle (v.a.r), une application X, de Ω dans R ayant la propriété
suivante : Pour tout intervalle I de R, l’ensemble X −1 (I) = {ω ∈ Ω : X(ω) ∈ I} est un événement de
Ω.

Exemple 3.1 Supposons que nous lancions deux fois une pièce de monnaie. L’univers est Ω = {FF, PF,
FP, PP}. Soit alors X le nombre de faces possibles. A chaque point de l’univers, nous pouvons associer
une valeur de X. X est une variable aléatoire.

échantillon FF FP PF PP
valeurs 2 1 1 0

Définition 3.2 Soit un espace probabilisé (Ω, P(Ω), P ) associé à une expérience aléatoire, et soit X
une v.a.r. On appelle loi de probabilite de X, notée PX , l’application qui à toute partie A de R associe

PX (A) = P (X −1 (A)) = P ({ω ∈ Ω : X(ω) ∈ A})

Définition 3.3 (fonction de répartition) On appelle fonction de répartition de la v.a. X l’application

FX : R → [0, 1]
x 7→ FX (x) = P (X ≤ x)

Propriétés
1. FX est croissante et,
lim FX (x) = 0, et lim FX (x) = 1
x→−∞ x→+∞

2. Si a < b,
P (a < X ≤ b) = FX (b) − FX (a).

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 21/63


Différents types de variables aléatoires

On distingue trois types de variables aléatoires suivant la nature de X(Ω).

1. X(Ω) est un sous-ensemble fini de R. On dit alors que X est une variable aléatoire discrète
finie (Section 3.1).
Par exemple : Une urne contient une boule noire et une boule blanche. On tire avec remise deux
boules de cette urne, et on note X le nombre de boules blanches obtenues. X est une variable
aléatoire définie sur Ω = {(b, b), (b, n), (n, b), (n, n)}. X(Ω) = {0, 1, 2}.

2. X(Ω) est un sous-ensemble infini dénombrable de R. On dit que X est une variable aléatoire
discrète infinie (Section 3.2).
Par exemple : On lance un dé cubique jusqu’à ce que l’on obtienne un 6. Soit X le nombre de
lancers effectués. X est une v.a. discrète infinie car X(Ω) = N∗ . (la probabilité de ne jamais
obtenir un 6 est nulle, mais cet événement n’est pas impossible !)

3. X(Ω) est une réunion d’intervalles de R non réduits à un point, et F , fonction de répartition de
X, peut s’écrire sous la forme Z x
F (x) = f (t)dt,
−∞

où f est une fonction à valeurs réelles, positives, ayant un nombre fini de points de discontinuité
R +∞
et telle que −∞ f (t)dt = 1. On dit alors que X est une variable aléatoire continue (Section
3.3).

3.1 Variables aléatoires discrètes finies

Définition 3.4 Une v.a.r. X a valeurs dans un ensemble X = {x1 , x2 , x3 , . . . , xn } fini est appelée v.a.r.
discrète finie. Dans ce cas, la loi de X est déterminée par l’ensemble des probabilités :

PX (x) = P(X = x) = f (x), x∈X

Ainsi, pour toute partie A de X , on a alors :


X X
PX (A) = P(X ∈ A) = P(X = x) et PX (X ) = P(X = x) = 1
x∈A x∈X

Exemple 3.2 On s’intéresse à la distribution de probabilités des garçons et des filles dans des familles
de 3 enfants en supposant que les probabilités à la naissance sont égales.
Soit G :“un garçon est né dans la famille” et F :“une fille est née dans la famille”. On a P (F ) = P (G) =
1/2, les probabilités à la naissance sont égales.
On s’intéresse aux familles de 3 enfants. On peut donc avoir les événements (incompatibles) suivants :

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 22/63


• 3 garçons : (GGG) et P (GGG) = (P (G))3 = 81 . En effet : le fait d’avoir un deuxième garçon
est indépendant du fait d’avoir eu un premier garçon. Il s’agit donc d’événements indépendants
2 à 2 et dans leur ensemble, on généralise P (A ∩ B) = P (A)P (B). Ici (GGG) = (G ∩ G ∩ G).
• 2 garçons et 1 fille : GGF ou GF G ou F GG. Ces événements sont incompatibles, on obtient

P ((GGF ) ∪ (GF G) ∪ (F GG)) = P (GGF ) + P (GF G) + P (F GG)

= P (G)P (G)P (F ) + P (G)P (F )P (G) + P (F )P (G)P (G)


1 1 1
= + +
8 8 8
3
=
8
1
• 3 filles : F F F . On a P (F F F ) =
8
Supposons que l’on s’intéresse au nombre de garçons dans ces familles de 3 enfants.
1
3 garçons avec p =
8
3
2 garçons avec p =
8
3
1 garçon avec p =
8
1
ou pas de garçons avec p =
8
Notons ces résultats dans un tableau : xi dénotent les nombres 0,1,2,3 (garçons) et pi les probabilités
respectives.

xi 0 1 2 3
1 3 3 1
pi
8 8 8 8
Ce tableau représente la loi de probabilité de la variable aléatoire X.

Définition 3.5 (fonction de probabilité) On définit la fonction de probabilité ou densité discrète f (xk )
telle que
1. f (xk ) ≥ 0 ;
X
2. f (xk ) = 1 où la somme est prise sur toutes les valeurs possibles de X.
xk ∈X

Exemple 3.3 Reprenons l’exemple 3.1. En supposant que la pièce n’est pas truquée
1
P (FF) = P (FP) = P (PF) = P (PP) =
4
On écrit
1
P (X = 0) = P (PP) =
4
1 1 1
P (X = 1) = P (PF ∪ FP) = P (PF) + P (FP) = + =
4 4 2
1
P (X = 2) = P (FF) =
4

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 23/63


Remarque 3.1 La fonction de répartition d’une v.a. discrète X se déduit de la fonction de probabilité,
en remarquant que
X
FX (x) = P (X ≤ x) = P (X = xk ).
xk ≤x

Exemple 3.4 On reprend l’exemple 3.2. On représente la fonction de répartition F (x) = P (X ≤ x) par
un tableau

x −∞ 0 1 2 3 +∞
1 1 4 4 7 7
F (x) 0 1 1
8 8 8 8 8 8
En effet :
1 1 1
Pour x = − , on a F (− ) = P (X ≤ − ) = 0.
2 2 2
1
Pour x = 0, on a F (0) = P (X ≤ 0) = P (X = 0) = . On fait de même pour les autres valeurs de x.
8
Graphiquement, on obtient une courbe en escalier.

Remarque 3.2 Soit X une v.a. qui prend des valeurs entières positives. Dans les exercices, on est parfois
amené à utiliser les astuces suivantes

P (X = k) = P (X ≥ k) − P (X ≥ k + 1)
= P (X > k − 1) − P (X > k)
= P (X ≤ k) − P (X ≤ k − 1)
= P (X < k + 1) − P (X < k)
k
X +∞
X
P (X ≤ k) = P (X = i), P (X ≥ k) = P (X = i)
i=0 i=k

3.1.1 Espérance, variance et écart-type


Définition 3.6 (espérance) Soit X une variable aléatoire prenant les valeurs xi , 1 ≤ i ≤ r. On appelle
espérance de X (ou moyenne) la quantité
r
X
E(X) = xi pi
i=1

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 24/63


Exemple 3.5 Reprenons l’exemple fille-garçon (exemple 3.2) :

1 3 3 1 3
E(X) = 0 × +1× +2× +3× = .
8 8 8 8 2

Remarque 3.3 Si on pose Z = X − E(X) alors E(Z) = 0. On dit que Z est une variable aléatoire
centrée.

Propriétés X et Y deux variables aléatoires définies sur (Ω, P(Ω), P ), λ ∈ R.

E(X + Y ) = E(X) + E(Y )


E(λX) = λE(X)
E(X + λ) = E(X) + λ.

Définition 3.7 (variance) Soit X une variable aléatoire prenant les valeurs xi , 1 ≤ i ≤ r. On appelle
variance de X (et on note V (X) ou bien σ 2 (X)) la quantité
r
X
V (X) = pi x2i − (E(X))2
i=1

ou bien
r
X
V (X) = pi (xi − E(X))2
i=1

Exemple 3.6 Reprenons l’exemple fille-garçon (exemple 3.2) :

3 3 1 3 3
V (X) = 0 + 12 . + 22 . + 32 . − ( )2 =
8 8 8 2 4

Définition 3.8 (écart-type) Soit X une variable aléatoire prenant les valeurs xi , 1 ≤ i ≤ r. On appelle
écart-type de X et on note σ(X) la racine carrée de la variance.

Propriétés
V (X + k) = V (X)
V (kX) = k 2 V (X)
σ(X + k) = σ(X)
σ(kX) = |k|σ(X)

La variance (ou écart type) est une mesure de dispersion (ou de distribution) des valeurs de la v.a. autour
de la moyenne µ = E(X). Par exemple la répartition des notes d’une classe. Dans ce cas, plus l’écart-
type est faible, plus la classe est homogène. À l’inverse, on peut souhaiter avoir un écart type le plus
large possible pour éviter que les notes soient trop resserrées (exemple classique du professeur qui note
de 8 à 13).
Dans le cas d’une notation de 0 à 20, l’écart type minimum est 0 (si tous les élèves/étudiants ont la même
note), et jusqu’à environ 10 si la moitié a 0/20 et l’autre moitié 20/20.

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 25/63


3.1.2 Couple de variables aléatoires discrètes
Définition 3.9 Soient X et Y deux variables aléatoires définies sur le même espace de probabilité. Sup-
posons que X(Ω) = {x1 , · · · , xr } et Y (Ω) = {y1 , · · · , ys }. On définit la loi conjointe du couple (X, Y )
par l’application q
q : X(Ω) × Y (Ω) −→ [0, 1]
(xi , yj ) 7−→ pij

pij = P ({X = xi } ∩ {Y = yj }), 1 ≤ i ≤ r; 1 ≤ j ≤ s

On représente la loi conjointe sous forme d’un tableau à double entrée.


HH
Y
HH
y1 y2 ··· yj ··· ys
X H
HH

x1 p11 p12 ··· p1j ··· p1s p1.


x2 p21 p2s p2.
..
.
xi pij pi.
..
.
xr pr1 prs pr.
p.1 p.2 ··· p.j ··· p.s
avec
s
X
p1. = p1j = p11 + p12 + · · · + p1s
j=1

On additionne tous les nombres de la première ligne p1. = P (X = x1 ).


D’une façon générale
s
X
pi. = pij = pi1 + pi2 + · · · + pis = P (X = xi )
j=1

De même
r
X
p.j = pij = p1j + p2j + · · · + prj = P (Y = yj )
i=1
Les nombres p.1 , p.2 , · · · , p.j , · · · , p.s définissent la loi marginale ou plus simplement la loi de Y .
Les nombres p1. , p2. , · · · , pi. , · · · , pr. définissent la loi marginale de X.
Propriété
X et Y sont indépendants si et seulement si

pij = pi. × p.j , ∀i ∈ {1, · · · , r}, ∀j ∈ {1, · · · , s}

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 26/63


Exemple 3.7 Soit une urne contenant 6 boules blanches et 4 boules noires. On effectue deux tirages
successifs sans remise. On définit la v.a. X par

X = 0 si la première boule tirée est noire (N1 )


X = 1 si la première boule tirée est blanche (B1 )

Donc X concerne le premier tirage.


De même, on définit la v.a. Y par

Y = 0 si la deuxième boule tirée est noire (N2 )


Y = 1 si la deuxième boule tirée est blanche (B2 )

Définir la loi conjointe du couple (X, Y ).


Réponse. Il faut calculer
4 3 12
P (X = 0, Y = 0) = P (X = 0)P (Y = 0/X = 0) = × =
10 9 90
4 6 24
P (X = 0, Y = 1) = P (X = 0)P (Y = 1/X = 0) = × =
10 9 90
6 4 24
P (X = 1, Y = 0) = P (X = 1)P (Y = 0/X = 1) = × =
10 9 90
6 5 30
P (X = 1, Y = 1) = × =
10 9 90
En général, on représente ces résultats dans un tableau à double entrée
HH
Y
H
HH 0 1
X H
H
0 12/90 24/90 36/90
1 24/90 30/90 54/90
36/90 54/90 1

Remarquons que la somme des probabilités doit être égale à 1.


Définissons maintenant les lois marginales de X et de Y :
36 2 54 3
P (X = 0) = = , P (X = 1) = =
90 5 90 5
36 2 54 3
P (Y = 0) = = , P (Y = 1) = = .
90 5 90 5
Puisqu’il n’y a pas de remise dans l’urne de la première boule tirée, les événements (les 2 tirages) sont
dépendants. Vérifions-le :

P (X = 0, Y = 1) 6= P (X = 0)P (Y = 1)

24 36 54
car 6= ×
90 90 90

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 27/63


3.1.3 Covariance et moments
Définition 3.10 (covariance de 2 v.a.) Soient X et Y définies sur (Ω, P(Ω), P ). On appelle covariance
de (X, Y ) et on note cov(X, Y ) la quantité

cov(X, Y ) = E(XY ) − E(X)E(Y )


r X
X s
E(XY ) = xi yj pij .
i=1 j=1

Définition 3.11 (moments d’une v.a.) Soit X définie sur (Ω, P(Ω), P ). On appelle moment centré
d’ordre k de X la quantité
r
X
µk = E(X − E(X))k = pi (xi − E(X))k
i=1

La variance est le moment centré d’ordre 2.


Xk
La quantité mk = pi xki est appelé moment d’ordre k.
i=1

3.1.4 Indépendance de deux variables aléatoires


• Si X et Y deux v.a. définies sur le même espace de probabilité, sont indépendantes, alors E(XY ) =
E(X)E(Y ).
• Si X et Y sont indépendantes, alors V (X + Y ) = V (X) + V (Y ).
• Si X et Y sont indépendantes, alors cov(X, Y ) = 0.

3.1.5 Exemples d’application


Exemple 3.8 On lance deux fois de suite une pièce de monnaie non truquée. On s’intéresse au côté
visible : P ou F.
1. Donner l’ensemble Ω.
2. Soit X la v.a. correspondant au nombre de “faces” . Déterminer la loi de probabilité de X.
3. Déterminer la fonction de répartition et la représenter graphiquement.
4. Calculer l’espérance et la variance de la v.a. X.
Réponse.
1. Ω = {FF, FP, PF, PP}.
2. La v.a. X prend les valeurs 0, 1, ou 2.

xi 0 1 2
1 1 1
pi
4 2 4

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 28/63


3. F (x) = P (X ≤ x)

x −∞ 0 1 2 +∞
1 1 3 3
F (x) 0 1 1
4 4 4 4
Exemple 3.9 On lance deux dés non pipés à 6 faces. Soit S la somme des chiffres marqués sur la face
supérieure. On décide le jeu suivant :

Si 2 ≤ S ≤ 4, on marque 10 points.
Si 4 < S ≤ 8, on marque 5 points.
Si 8 < S < 10, on marque 2 points.
Si 10 ≤ S ≤ 12, on marque 1 point.
Soit X la v.a., prenant pour valeurs les nombres de points marqués.
1. Définir la loi de probabilité de X par un tableau.
2. Définir sa fonction de répartition par un tableau et la représenter graphiquement.
3. Calculer l’espérance de X.

Réponse. Soit Ω l’univers : Card Ω = 36. Notons dans un tableau à double entrée les valeurs possibles
de S :
HH
H Dé 1
H 1 2 3 4 5 6
Dé 2 HHH
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
A l’intersection ligne-colonne, on note la somme S des points marqués.
1. La v.a. X prend les valeurs 1, 2, 5 ou 10.

xi 1 2 5 10
6 4 20 6
pi
36 36 36 36
Exemple de calcul. p1 = P (X = 1). On compte le nombre de fois où S prend les valeurs
10, 11, 12.
2. F (x) = P (X ≤ x)

x −∞ 1 2 5 10 +∞
6 6 10 10 30 30
F (x) 0 1 1
36 36 36 36 36 36

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 29/63


3. Espérance de X :
6 4 20 6
E(X) = 1 × +2× +5× + 10 × ' 4.8
36 36 36 36
Cela signifie que l’on a l’espérance de gagner 4.8 points par partie.

Exemple 3.10 Soit X la v.a. correspondant au nombre de “piles” obtenus en lançant 3 pièces de monnaie
non truquées.
X
1. Quelle est la loi de probabilité de la v.a. Y = ?
3
2. Calculer l’écart type de Y .

Réponse. Déterminons Ω, l’ensemble des résultats possibles. On peut utiliser un arbre de choix.

Ω = {FFF, FFP, FPF, FPP, PFF, PFP, PPF, PPP}

Donc X peut prendre les valeurs 0, 1, 2, 3.


X
1. Si X est une v.a., Y = est une v.a.
3
xi 0 1 2 3

xi 1 2
yi = 0 1
3 3 3
1 3 3 1
pi
8 8 8 8
1 2 1
p i yi 0
8 8 8
1 4 3
pi yi2 0
24 24 24
On a
1 1 3 2 3 1
P (Y = 0) = ; P (Y = ) = ; P (Y = ) = ; P (Y = 1) = .
8 3 8 3 8 8
4 4
X X 4 1
pi yi2 − (E(Y ))2 ; E(Y ) =
p
2. σ(Y ) = V (Y ) ; V (Y ) = p i yi = = .
8 2
i=1 i=1
r √
8 1 1 1 3
V (Y ) = − ( )2 = ; σ(Y ) = = .
24 2 12 12 6
X E(X) X 1
Remarque. E( )= ; σ( ) = σ(X).
3 3 3 3
Exemple 3.11 Une urne contient 3 boules blanches et 4 boules rouges. On tire successivement 2 boules
de cette urne, dans un premier cas, avec remise, dans un second cas, sans remise.
Soit X la v.a. prenant la valeur 1 si la 1ère boule tirée est blanche, 0 sinon.
Soit Y la v.a. prenant la valeur 1 si la 2ème boule tirée est blanche, 0 sinon.

1. Donner, sous forme de tableau, la loi du couple (X, Y ).


2. Calculer les lois marginales. Remarques.

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 30/63


Réponse.

Avec remise Sans remise

HH HH
Y Y
HH
0 1 HH
0 1
X H
HH X H
HH
16 12 28 4 2 2 4
0 = 0
49 49 49 7 7 7 7
12 9 21 3 2 1 3
1 = 1
49 49 49 7 7 7 7
4 3 4 3
1 1
7 7 7 7
Dans le cas avec remise, on a
4 3
P (X = 0) = ; P (X = 1) =
7 7
4 3
P (Y = 0) = ; P (Y = 1) =
7 7
Les événements sont indépendants.

Dans le cas sans remise, on constate que les lois marginales sont les mêmes dans les deux cas, alors que
les lois conjointes sont différentes. On conclut que la donnée des lois marginales est insuffisante pour
reconstituer la loi conjointe. Les événements sont dépendants.

Exemple 3.12 Soit X et Y deux v.a réelles telles que Y = X 2 et que la loi de X est donnée par le
tableau
xi −2 −1 0 1 2
1 1 1 1 1
pi
6 4 6 4 6
1. Donner la loi conjointe de X et Y .
2. Déterminer la loi de Y .
3. X et Y sont-elles indépendantes ?
4. Calculer cov(X, Y ). Conclusion ?

Réponse.
1. On a
H
HH X
H −2 −1 0 1 2
Y HH
H
1
0 0 0 0 0
6
1 1
1 0 0 0
4 4
1 1
4 0 0 0
6 6

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 31/63


P ({X = i} ∩ {Y = j}) = 0 si j 6= i2
P ({X = i} ∩ {Y = i2 }) = P ({X = i})

2. La loi de Y est la loi marginale de Y dans le couple (X, Y ).

Y (Ω) = {0, 1, 4}
1
P ({Y = 0}) = P ({X = 0}) =
6
1
P ({Y = 1}) = P ({X = −1}) + P ({X = 1}) =
2
1
P ({Y = 4}) = P ({X = −2}) + P ({X = 2}) =
3

On résume dans le tableau suivant

yk 0 1 4
1 1 1
P ({Y = yk })
6 2 3
3. X et Y ne sont pas indépendants car

P ({X = 0} ∩ {Y = 1}) = 0 6= P ({X = 0})P ({Y = 1}).

4. On a cov(X, Y ) = E(XY ) − E(X)E(Y ). Le tableau suivant aide à calculer la covariance.

HH
X
H
HH −2 −1 0 1 2
Y H
H
0 0 0 0 0
1
0 0 0 0 0
6

−2 −1 0 1 2
1 1
1 0 0 0
4 4

−8 −4 0 4 8
1 1
4 0 0 0
6 6

On a
X 1 1 8 8
E(XY ) = xi yj P [{X = xi } ∩ {Y = yj }] = − + − + = 0,
4 4 6 6
i,j

et comme E(X) = 0 alors cov(X, Y ) = 0.

Conclusion. Deux variables dont la covariance est nulle ne sont pas nécessairement indépendantes.

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 32/63


3.1.6 Exemples de variables aléatoires discrètes finies

Loi de Bernoulli
Définition 3.12 On dit qu’une variable aléatoire X suit une loi de Bernoulli de paramètre p si

X(Ω) = {0, 1}, P (X = 1) = p, P (X = 0) = 1 − p = q.

On note X ,→ B(p).

Exemple 3.13 Une urne contient deux boules rouges et trois boules vertes. On tire une boule de l’urne.
La variable aléatoire X = nombre de boules rouges tirées est une variable de Bernoulli. On a

P (X = 1) = 2/5 = p et P (X = 0) = 3/5 = q.

Situations : Plus généralement, on utilisera une variable de Bernoulli lorsqu’on effectue une épreuve qui
n’a que deux issues : le succès ou l’échec. Une telle expérience est alors appelée épreuve de Bernoulli.
On affecte alors 1 à la variable en cas de succès et 0 en cas d’échec.

P (X = k) = pk q 1−k , ∀k ∈ [[0, 1]].

Loi binômiale
Définition 3.13 Effectuons maintenant n épreuves successives de Bernoulli (chacune donnant lieu à
2 éventualités, l’une appelée succès, avec la probabilité p, l’autre appelée échec, avec la probabilité
q = 1 − p).
Soit X la v.a. correspondant au nombre de succès réalisés parmi les n épreuves. On démontre que

∀k ∈ {0, 1, · · · , n}, P (X = k) = Cnk pk (1 − p)n−k

On dit que X suit une loi binômiale de paramètres n et p.

Notation : La loi binômiale est notée B(n, p). On écrit X ,→ B(n, p) pour dire “X suit la loi B(n, p)” .
Situations : La loi binômiale s’applique dans le cas de :
• n répétitions avec n essais identiques, chacun donnant lieu à 2 éventualités.
• examen de n individus atteints ou non d’une maladie.
• nombre de moteurs en panne dans un lot de n moteurs, etc.
Propriétés On démontre que

• E(X) = np; V (X) = npq; σ(X) = npq.
• Soit X1 et X2 deux v.a. indépendantes telles que X1 ,→ B(n1 , p) et X2 ,→ B(n2 , p) alors
X1 + X2 ,→ B(n1 + n2 , p).

Exemple 3.14 On lance un dé à 6 faces non pipé. On s’intéresse au fait suivant : “obtenir 6”. On consi-
1 5
dère ce fait comme succès, avec la probabilité , l’échec étant “obtenir 1,2,3,4 ou 5” , donc q = .
6 6
On lance 10 fois ce dé. Soit X la v.a. correspondant au nombre de succès.

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 33/63


1. Calculer P (X = 5).
2. Calculer la probabilité d’obtenir au moins une fois le 6, au cours des 10 lancers.
Réponse. L’expérience aléatoire de l’exemple permet de dire que X ,→ B(10, 16 ).
5 ( 1 )5 ( 5 )5 .
1. P (X = 5) = C10 6 6
0 ( 1 )0 ( 5 )10 = ( 5 )10 . L’événement {X = 0} est le contraire de {X ≥ 1}. On a
2. P (X = 0) = C10 6 6 6
donc
5
P (X ≥ 1) = 1 − ( )10 ' 0.84.
6
Remarque 3.4
• Cette loi porte le nom de binômiale car elle fait intervenir les Cnk coefficients du développement
du binôme (a + b)n .
• Les valeurs P (X = k) sont tabulées, pour certaines valeurs de n(k ≤ n).

3.2 Variables aléatoires discrètes infinies


On généralise les notions vues précédemment au cas où les v.a. prennent une infinité dénombrable de
valeurs. Toutes les sommes rencontrées précédemment sont remplacées par des sommes de séries numé-
riques, dans le cas où ces séries sont convergentes.

Exemple d’une v.a. dénombrable : loi de Poisson


Définition 3.14 Soit X une v.a. à valeurs dans N. X suit une loi de Poisson de paramètre λ(λ > 0) si
et seulement si
λk
P (X = k) = e−λ , k ∈ N.
k!
Remarque 3.5 X(Ω) = N.

Notation : X ,→ P(λ).

Conséquences de la définition
+∞ +∞
X X λk
• P (X = k) = 1 donc e−λ =1
k!
k=0 k=0
X p
• F (p) = P (X ≤ p) = P (X = k) (fonction de répartition)
k=0 √
Propriétés : E(X) = λ; V (X) = λ; σ(X) = λ.
Situations : C’est la loi des petites probabilités ou loi des événements rares (c’est-à-dire des événements
avec une probabilité faible) et sans mémoire, dans un intervalle de temps donné par exemple :
— Le nombre d’atomes désintégrés par unité de temps
— Le nombre de chèques émis sans provision
— Le nombre de fautes d’impression dans les pages d’un livre
— Le nombre de personnes atteintes d’une maladie

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 34/63


— Le nombre d’accidents sur une portion de route
— Le nombre d’accidents annuels provoqués par un automobiliste assuré
— Le nombre de décès par suicide
— Le nombre de déchets dans une fabrication

Remarque 3.6 Les valeurs de P (X = k) sont tabulées pour certaines valeurs λ.

Exemple 3.15 Pour une femme ayant eu entre 50 et 52 ans en l’an 2000, le nombre d’enfants, noté X,
suit une loi de Poisson de paramètre inconnu λ. Un échantillon de 1000 de ces femmes donne 135 sans
enfant.
1. Donner une estimation de λ.
2. Estimer la proportion de ces femmes ayant plus de trois enfants.

Réponse.
1. Si on admet que l’échantillon est représentatif de la population, on a P (X = 0) = e−λ ' 0.135
ce qui donne λ = − ln(0.135) ' 2.
λ2 λ3
2. P (X > 3) = 1 − P (X ≤ 3) = 1 − e−λ (1 + λ + 2 + 6 ) ' 0.145.
Conclusion. Parmi les femmes qui ont eu entre 50 et 52 ans en l’an 2000, il y en a donc environ
145 sur 1000 qui ont plus de 3 enfants.

3.3 Variables aléatoires continues


Dans les deux sections précédentes, on a traité des v.a. définies sur un espace probabilisé dénom-
brable fini ou dénombrable infini. Une v.a. qui peut prendre un nombre dénombrable fini ou dénombrable
infini de valeurs est dite v.a. discrète. Si elle prend un nombre infini de valeurs, non dénombrable, elle
est dite continue.

Définition 3.15 (densité de probabilité) Soit f une fonction réelle. On dit que f est une densité de
probabilité si et seulement si
• f est continue sur R privé éventuellement d’un nombre fini de points
• Z
∀x ∈ R, f (x) ≥ 0
+∞
• f (x) dx = 1
−∞

Exemple 3.16 On considère la fonction f définie sur R par



π
 cos x si x ∈ [0, ]


2
f (x) =

 0 sinon .

• f est continue sur R sauf au point 0.


• f (x) ≥ 0, ∀x ∈ R.

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 35/63


Z +∞
• f (x)dx = 1
−∞
f est donc une densité de probabilité.

Définition 3.16 (variable aléatoire continue) On dit que X est une v.a. continue s’il existe une fonction
densité de probabilité f telle que la fonction de répartition de X soit définie pour tout x réel par
Z x
P (X ≤ x) = F (x) = f (x) dx
−∞

Définition 3.17 (fonction de répartition) La fonction F est dite fonction de répartition de la v.a. X.

Rx
Exemple 3.17 Reprenons l’exemple précédent. Par définition, on a ∀x ∈ R, F (x) = −∞ f (t) dt donc

∀x ∈] − ∞, 0], F (x) = 0.
Z 0 Z x
π
∀x ∈]0, ], F (x) = 0 dt + cos t dt = sin x.
2 −∞ 0
Z 0 Z π Z x
π 2
∀x ∈] , +∞], F (x) = 0 dt + cos t dt + 0 dt = 1.
2 −∞ 0 π
2

3.3.1 Propriétés fondamentales


• On a toujours P (a < X ≤ b) = F (b) − F (a), donc
Z b Z a
P (a < X ≤ b) = F (b) − F (a) = f (t) dt − f (t) dt
−∞ −∞

Z b
P (a < X ≤ b) = f (t) dt
a

• Supposons b fixé et faisons tendre a vers b dans l’expression précédente. On obtient


Z b
lim P (a < X ≤ b) = P (X = b) = f (t) dt = 0
a→b b

donc

∀b ∈ R, P (X = b) = 0.

Cela justifie les égalités suivantes

P (a < X < b) = P (a < X ≤ b) = P (a ≤ X < b) = P (a ≤ X ≤ b)

Donc on écrira indifféremment P (X ≤ a) ou P (X < a), ces deux quantités étant égales.

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 36/63


3.3.2 Espérance, variance et écart-type
Dans le cas d’une v.a. X continue ayant une densité f , on a par définition
Z +∞
Espérance : E(X) = xf (x) dx
−∞ Z +∞
Variance : V (X) = E[(X − E(X))2 ] = (x − E(X))2 f (x) dx
−∞

ou encore V (X) = E(X 2 ) − (E(X))2


p
Ecart-type : σ(X) = V (X)

Exemple 3.18 On reprend l’exemple 3.16. Soit X une variable aléatoire admettant f comme densité.
On a
π
Z +∞ Z
2
E(X) = xf (x) dx = x cos x dx
−∞ 0

Par suite E(X) existe et en intégrant par parties, on trouve

π
E(X) = − 1.
2

3.3.3 Exemples de variable aléatoire continue

Loi uniforme

Définition 3.18 Une v.a. continue X est dite uniforme sur un intervalle [a, b](a < b) de R si elle admet
une densité de probabilité f définie par




 0 si x < a
1

f (x) = si a ≤ x ≤ b

 b − a

 0 si x > b

On note X ,→ U([a, b]). On lit X suit une loi uniforme sur l’intervalle [a, b].

Proposition 3.1 On a
a+b (b − a)2
E(X) = et V (X) =
2 12

Loi exponentielle

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 37/63


Définition 3.19 Une v.a. continue X suit une loi exponentielle de paramètre λ si sa densité de proba-
bilité f est définie sur R par

 0 si x < 0
f (x) =
 λe−λx si x ≥ 0

Proposition 3.2 On montre


1 1
E(X) = et V (X) = 2
λ λ

Loi normale

Définition 3.20 La loi normale (ou de Laplace-Gauss), de moyenne m, de variance σ 2 , est définie sur R
par une fonction f (x), appelée fonction densité de probabilité

(x − m)2
1 −
m ∈ R, σ ∈ R∗+ , f (x) = √ e 2σ 2
σ 2π

Sa fonction de répartition est donnée par

Z a
(x − m)2
1 −
P (X ≤ a) = F (a) = √ e 2σ 2 dx
−∞ σ 2π

La loi normale de moyenne m et de variance σ 2 est notée N (m, σ 2 ).

Remarque 3.7 La courbe représentative de la distribution d’une loi N µ, σ 2 est une courbe en cloche


qui admet la droite d’équation x = µ comme axe de symétrie. Elle est plus ou moins " étirée selon les
valeurs de σ

Exemple 3.19 Le dessin suivant représente la courbe de la loi X ,→ N (0, 0.4).

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 38/63


Représenter sur ce dessin P (−0.56 ≤ X ≤ 1.35), P (1.35 ≤ X), P (−0.56 ≥ X) et P (X ≤
−0.56 ou X ≥ 1.35).
Réponse.

Loi normale centrée réduite


Par un changement de variable, on peut transformer une loi normale en une loi normale centrée réduite,
x2
1 −
c’est à dire d’espérance nulle et de variance 1. La fonction densité est alors ϕ(x) = √ e 2 . On la

note N (0, 1).
Sa fonction de répartition, notée φ, est telle que
Z u
φ(u) = ϕ(x) dx
−∞

L’avantage de la loi normale centrée réduite est qu’elle est tabulée.


Propriétés de la loi N (0, 1) :
• E(X) = 0, σ(x) = 1

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 39/63


• Représentation graphique de ϕ(x)
L’axe des ordonnées est axe de symétrie : ϕ est une fonction paire

ϕ(−u) = ϕ(u)

Soit u > 0. Calcul de φ(−u) : les deux parties hachurées sont égales

φ(−u) = 1 − φ(u)

• Changement de variable : on peut passer d’une loi N (m, σ 2 ) à une loi N (0, 1) par le changement
X −m
de variable T =
σ
X ,→ N (m, σ 2 ) ⇔ T ,→ N (0, 1)

Exemple 3.20 On s’intéresse au poids moyen d’un nouveau-né. On suppose que ce poids suit une loi
normale de moyenne 3.1 kg et d’écart-type 0.5 kg.

1. Quelle est la probabilité qu’un nouveau-né pèse plus de 4 kg ?

2. Quelle est la probabilité qu’il pèse moins de 3 kg ?

3. Quelle est la probabilité que son poids soit compris entre 2.9 kg et 3.5 kg ?

Réponse. Le poids suit la loi normale N (m, σ 2 ) avec m = 3.1 et σ = 0.5.


X−m
1. P (X > 4) = 1 − P (X ≤ 4). On effectue le changement de variable T = σ alors T ,→
4−3.1
N (0, 1). Si X = 4 alors T = σ = 1.8. On a 1 − P (T ≤ 1.8) = 1 − 0.9641 = 0.0359 donc
P (X > 4) = 0.036.

2. P (X ≤ 3) = P (T ≤ −0.2) = 1 − P (T < 0.2) = 1 − 0.5793 = 0.4207.

3. On a

P (2.9 ≤ X ≤ 3.5) = P (X ≤ 3.5) − P (X ≤ 2.9)


3.5 − 3.1 2.9 − 3.1
= P (T ≤ ) − P (T ≤ )
0.5 0.5
= P (T ≤ 0.8) − P (T ≤ −0.4)
= P (T ≤ 0.8) − (1 − P (T ≤ 0.4))
= P (T ≤ 0.8) + P (T ≤ 0.4) − 1
= 0.7881 + 0.6554 − 1 = 0.4435.

3.4 Approximation d’une loi binômiale par une loi de Poisson

Exemple 3.21 Dans une chaîne de fabrication, 2% des objets sont défectueux. On prélève une pièce,
on l’examine, et on la replace dans la chaîne. On répète 100 fois cette expérience. Considérons comme
“succès” : la pièce est défectueuse donc p = 0.02. Considérons comme “échec” : la pièce n’est pas
défectueuse donc q = 1 − p = 0.98.

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 40/63


Soit X : “le nombre de pièces défectueuses relevées parmi 100 essais”. Alors X ,→ B(100; 0.02). Par
5 (0.02)5 (0.98)5 . Les calculs sont longs et fastidieux ! !
exemple : P (X = 5) = C100
La loi de Poisson donne une bonne approximation de ce résultat avec λ = np. Ici λ = 2.
25
Donc P (X = 5) ' e−2 . Calcul plus rapide et tabulé.
5!
D’une façon générale
λk
Pour n assez grand et p voisin de 0, si X ,→ B(n; p) alors P (X = k) ' e−λ avec λ = np.
k!
1
Cette approximation peut être appliquée pour n ≥ 0 et np < 5 ou n ≥ 20 et p < par exemple.
30
Elle est d’autant meilleure que n est grand et p proche de 0.

Remarque 3.8 On peut utiliser cette approximation pour p voisin de 1 car alors q ' 0, on considère
λ0 = nq.

Exemple 3.22 On suppose qu’une urne contient 1 boule blanche et 99 boules noires. On effectue n
tirages successifs d’une boule avec remise. Déterminer n pour que la probabilité de tirer au moins une
fois la boule blanche soit supérieure ou égale à 0.95.

Réponse. Soit X la v.a. du nombre de fois où on tire la boule blanche au cours de n tirages. X ,→
B(n; 0.01) alors
P (X ≥ 1) = 1 − P (X = 0) = 1 − (0.99)n .
ln(0.05)
Si on veut que P (X ≥ 1) ≥ 0.95, il faut (0.99)n ≤ 0.05 ce qui veut dire que n ≥ ln(0.99) c’est-à-dire
n ≥ 298.1 or n est entier alors n ≥ 299. Il faut donc effectuer 299 tirages au moins pour être sûr, à 95%,
d’avoir au moins une boule blanche.
Remarque. Calcul approché. On a n est grand et p faible. On essaye d’approcher X par une loi de Poisson
n
n
de paramètre np = 100 . On a P (X ≥ 1) = 1 − P (X = 0) = 1 − e 100 . Pour avoir P (X ≥ 1) ≥ 0.95, il
n
faut que e− 100 ≤ 0.05 c’est-à-dire n ≥ −100 ln(0.05) ' 299.6. On conclut que n ≥ 300.

3.5 Approximation d’une loi binômiale par une loi normale


Exemple 3.23 On lance 500 fois une pièce de monnaie non truquée. Soit X le nombre de “faces” ob-
1 100 ( 1 )100 ( 1 )400 . Les calculs sont à
tenues. Alors X ,→ B(500, ). Par exemple P (X = 100) = C500
2 2 2
nouveau longs et fastidieux ! !

L’approximation de Poisson n’est pas valable car n est grand mais ni p, ni q ne sont proches de 0.
Les calculs et les méthodes expérimentales ont prouvé que l’on pouvait approcher P (X = k) par f (k), f
étant la fonction de Gauss
(x − m)2
1 −
f (x) = √ e 2σ 2
σ 2π
2 2
avec σ = npq et m = np, ou σ = 125 et m = 250. Alors
(k − 250)2
1 −
P (X = k) ' √ √ e 2σ 2
125 2π

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 41/63


(−150)2
1 − 1
Si k = 100, P (X = 100) ' √ √ e 2 × 125 = √ √ e−90
125 2π 125 2π
P (X = 100) = ε, nombre très proche de 0.
Une autre méthode est celle d’encadrer la valeur proposée et de se ramener au calcul d’une fonction de
répartition 100 ∈ [99.5; 100.5].
P (X = 100) ' P (99.5 ≤ X ≤ 100.5) que l’on calcule par changement de variables et l’utilisation de
la loi N (0, 1).

Remarque 3.9 Le résultat est conforme à la propriété des variables aléatoires continues : Si X est une
v.a. continue, P (X = a) = 0. On peut aussi répondre à la question : quelle est la probabilité d’obtenir
X − 250
entre 230 et 270 “faces”. On doit alors déterminer P (230 ≤ X ≤ 270). Soit T = √ .
125
On a

P (230 ≤ X ≤ 270) = P (X ≤ 270) − P (X < 230)


20 20
= P (T ≤ √ ) − P (T < − √ )
125 125
20
= 2P (T ≤ √ ) − 1 = 2P (T ≤ 1.79) − 1
125
= 2 × 0.9633 − 1
' 0.9266.

Dans la pratique, la fonction de Laplace-Gauss donne une bonne approximation de la loi binômiale si
0.2 < p < 0.8 et n ≥ 20. Si np et nq sont supérieurs à 10, cette approximation est très bonne.

Exemple 3.24 On lance 200 fois une pièce non truquée.


1. Déterminer la probabilité pour que X, le nombre de “faces”, soit compris entre 80 et 120.
2. Déterminer la probabilité pour que X soit exactement 100.

Réponse.

1. Il s’agit d’une loi binômiale B(200, 21 ) ∼ N (np, npq), m = 100, σ 2 = 50, σ = 5 2.
20 20
P (80 ≤ X ≤ 120) = P (− √ ≤ T ≤ √ ) avec T ,→ N (0, 1)
5 2 5 2
√ √ √ √
= P (−2 2 ≤ T ≤ 2 2) = P (T ≤ 2 2) − P (T ≤ −2 2)
√ √ √
= P (T ≤ 2 2) − (1 − P (T ≤ 2 2)) = P (T ≤ 2 2) − 1
= 2 × 0.9976 − 1 ' 0.9952.

2. On cherche P (X = 100). Il y a deux méthodes.


Première méthode. On considère 99.5 ≤ 100 ≤ 100.5 et on approche P (X = 100) par P (99.5 ≤
X ≤ 100.5).
0.5 0.5
P (X = 100) ' P (T ≤ √ ) − P (T ≤ − √ ) avec T ,→ N (0, 1)
5 2 5 2
0.5
= 2P (T ≤ √ ) − 1 = 2 × 0.5279 − 1 ' 0.0558.
5 2

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 42/63


(x−m)2 (x−100)2
Deuxième méthode. Soit f la fonction densité f (x) = √1 e− 2σ 2 . Ici f (x) = √ 1√ e− 100 .
σ 2π 5 2 2π
Alors P (X = k) ' f (k) donc P (X = 100) ' √ 1√ c’est-à-dire
5 2 2π

P (X = 100) ' 0.0564.

On remarque que les résultats diffèrent très peu.

3.6 Approximation d’une loi de Poisson par une loi normale


De même, on démontre que si λ > 20, P(λ) peut être approchée par la loi normale N (λ, λ).

3.7 Récapitulatif des approximations successives

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 43/63


M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 44/63
Chapitre 4

Statistiques : Séries à une variable

4.1 Introduction

La statistique est l’étude de la collecte de données, leur analyse, leur traitement, l’interprétation des
résultats et leur présentation afin de rendre les données compréhensibles par tous. C’est à la fois une
science, une méthode et un ensemble de techniques.
L’analyse des données est utilisée pour d’écrire les phénomènes étudiés, faire des prévisions et
prendre des décisions à leur sujet. En cela, la statistique est un outil essentiel pour la compréhension
et la gestion des phénomènes complexes.
Les données étudiées peuvent être de toute nature, ce qui rend la statistique utile dans tous les champs
disciplinaires et explique pourquoi elle est enseignée dans toutes les filières universitaires, de l’économie
à la biologie en passant par la psychologie et bien sur les sciences de l’ingénieur. Le double but de la
statistique est :
• La présentation des données statistiques sous forme de tableaux ou de graphiques, diagrammes
en bâtons, histogrammes, courbe cumulative.
• L’analyse de ces données qui consiste à résumer un tableau à l’aide d’un petit nombre de valeurs
caractéristiques.
— les valeurs caractéristiques de position : mode, médiane, moyenne
— les valeurs caractéristiques de dispersion : variance, écart-type

4.2 Méthode de représentation

4.2.1 Terminologie de base


Tout ensemble P étudié en statistique s’appelle population. Les éléments sont appelés individus. Un
sous-ensemble de P est un échantillon.
Le caractère (ou variable) d’une série statistique est une propriété étudiée sur chaque individu :
— Lorsque le caractère ne prend que des valeurs (ou modalités) numériques, il est quantitatif :

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 45/63


• discrète : si elle ne prend que des valeurs isolées (nombre d’enfants d’une famille ; nombre
de pièces d’un appartement, . . . ).
• continue : si elle prend toutes les valeurs d’un intervalle (poids d’un individu, taille d’un
individu, . . . ).
— Sinon, on dit qu’il est qualitatif (couleur des yeux, · · · ) : les modalités ne sont pas des nombres.
Le tableau ci-dessous donne un aperçu général des notions introduites dans ce chapitre.

Dans tout la suite de ce chapitre, on considèrera les 2 séries statistiques suivantes :


• Série A : Notes obtenues à un contrôle dans une classe de 30 élèves :

2−3−3−4−5−6−6−7−7−7−8−8−8−8−8−9−9−9−9−9−9−10−10−11−11−11−13−13−15−16

• Série B : Salaires en euros des employés d’une entreprise :


Salaires [900; 1200] [1200; 1400] [1400; 1600] [1600; 1800] [1800; 2000] [2000; 2400] TOTAL
Effectif 30 30 60 80 40 40 280

4.2.2 Fréquence
Définition 4.1 On considère une série statistique X à caractère quantitatif, dont les p valeurs sont
données par x1 , x2 , . . . , xp d’effectifs associés n1 , n2 , . . . , np avec n1 + n2 + . . . + np = N

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 46/63


— A chaque valeur (ou classe) est associée une fréquence fi : c’est la proportion d’individus asso-
ciés à cette valeur.
ni
— fi = N est un nombre compris entre 0 et 1, que l’on peut écrire sous forme de pourcentage.
— L’ensemble des fréquences de toutes les valeurs du caractère s’appelle la distribution des fré-
quences de la série statistique.

Exemple 4.1 On peut représenter la série A par un tableau d’effectifs, et le compléter par la distribution
des fréquences :
Notes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Eff. 0 1 2 1 1 2 3 5 6 2 3 0 2 0 1 1 0 0 0
Fréq. en % 0 3 7 3 3 7 10 17 20 7 10 0 7 0 3 3 0 0 0

Remarque 4.1 On peut vérifier que la somme des fréquences est égale à 1 (ou à 100 si on les exprime
en pourcentages).

On peut aussi faire un regroupement par classe, ce qui rend l’étude moins précise, mais qui permet
d’avoir une vision plus globale.

Exemple 4.2 Toujours pour la série A, si on regroupe les données par classes d’amplitude 5 points, on
obtient :

Notes [0; 5[ [5; 10[ [10; 15[ [15; 20[ total


Effectif 4 17 7 2 30
Fréquence 0,13 0,57 0,23 0,07 1

4.2.3 Fonction cumulative


Soit une série statistique à caractère quantitatif, les k valeurs ou les k classes représentées par leur centres
ci = xi sont données dans l’ordre croissant :

x1 < x2 < x3 < . . . < xi < . . . < xk .

Si ni est l’effectif de la valeur ou de la classe xi , on appelle fréquence cumulée croissante


X n1 + n2 + · · · + nj effectif cumulé croissant
fj = f1 + f2 + . . . + fj = =
n effectif total
j≤i

De même, on définit la fréquence cumulée décroissante par


X ni + ni+1 + · · · + nk effectif cumulé décroissant
fj = fi + fi+1 + . . . + fk = =
n effectif total
j≥i

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 47/63


• Dans le cas où la variable statistique est discrète, on appelle fonction cumulative ou fonction de
répartition la fonction F définie sur R par

X
F (t) = fj
j≤t

c’est-à-dire la somme des fréquences des modalités inférieures à t.


F est une fonction en escalier, croissante, nulle sur ] − ∞, x1 [ et égale à 1 sur ]x1 , +∞[.
• Dans le cas d’une variable statistique continue, on appelle fonction cumulative la fonction dont
le graphique est la ligne polygonale obtenue en joignant par des segments de droite successive-
ment les points de coordonnées (x1 , 0), (xi , f1 + f2 + . . . fi−1 ). Les réels xi étant les centres des
diverses classes.

4.2.4 Graphiques

Lorsque le caractère étudié est quantitatif et discret, on peut représenter la série statistique étudié
par un diagramme en bâtons : la hauteur de chaque bâton est alors proportionnelle à l’effectif (ou à la
fréquence) associé à chaque valeur.

Exemple 4.3 Voici le diagramme en bâtons représentant la série des notes de la série A :

Lorsque le caractère étudié est quantitatif et continu, et lorsque les modalités sont regroupées en classes,
on peut représenter la série par un histogramme : l’aire de chaque rectangle est alors proportionnelle à
l’effectif (ou à la fréquence) associée à chaque classe. Lorsque les classes ont la même amplitude, c’est
la hauteur qui est proportionnelle à l’effectif.

Exemple 4.4 Pour la série B, on obtient par exemple I’histogramme suivant :

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 48/63


4.3 Caractéristiques de position

4.3.1 Mode. Moyenne


Définition 4.2 Le mode ou La dominante est la valeur du caractère correspondant à l’effectif le plus
grand. Lorsqu’il s’agit de classe on dit classe modale.

Définition 4.3 Soit une série statistique à caractère quantitatif, dont les p valeurs sont données par
x1 , x2 , . . . , xp d’effectifs associés n1 , n2 , . . . , np avec n1 + n2 + . . . + np = N. La moyenne de cette
série est le nombre noté x̄ ou bien E(x) qui vaut
p
n1 x1 + n2 x2 + . . . + np xp 1 X
x̄ = = ni xi
n1 + n2 + . . . + np N
i=1

Remarque 4.2 Lorsque la série est regroupée en classes, on calcule la moyenne en prenant pour valeurs
xi le centre de chaque classe ; ce centre est obtenu en faisant la moyenne des deux extrémités de la classe.

254
Exemple 4.5 Dans la série A, la moyenne du contrôle est égale à m̄ = 30 ≈ 8, 47. Dans la série B,
460500
une estimation du salaire moyen est donné par : S̄ = 280 ≈ 1644, 64.

Remarque 4.3 On peut aussi calculer une moyenne à partir de la distribution de fréquences :
p
X
x̄ = f1 x1 + f2 x2 + · · · + fp xp = fi xi
i=1

Propriétés

E(X + b) = E(X) + b changement en translation

E(aX) = aE(X) changement en dilatation

E(aX + b) = aE(X) + b changement d’origine et d’échelle

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 49/63


Calcul pratique
Afin d’avoir un calcul plus simple de X ou E(X) on effectue souvent un changement d’origine et
d’échelle en appelant x0 la nouvelle origine et h l’échelle. On a xi = x0 + hui d’où

X = x0 + hu

4.3.2 Médiane
Définition 4.4 Soit une série statistique ordonnée dont les n valeurs sont x1 6 x2 6 x3 6 · · · 6 xn .
La médiane est un nombre M qui permet de diviser cette série en deux sous-groupes de même effectif.
— Si n est impair, M est la valeur de cette série qui est située au milieu, à savoir la valeur dont le
n+1
rang est 2 , notée x n+1 .
2
— Si n est pair, n est le centre l’intervalle médian, qui est l’intervalle formé par les deux nombres
situés « au milieu ” de la série, à savoir x n2 et x n2 + 1.

Exemple 4.6 • La médiane de la série 2 − 5 − 6 − 8 − 9 − 9 − 10 est 8 .


• La médiane de la série ´2 − 5 − 6 − 8 − 9 − 9” est 7 .
• La médiane de la série ”2 − 5 − 6 − 6 − 9 − 10” est 6 .

Exemple 4.7 On souhaite calculer la médiane de la série A.


• Pour cela, on commence par remplir le tableau des effectifs cumulés croissants :

Notes 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19
Eff. 0 1 2 1 1 2 3 5 6 2 3 0 2 0 1 1 0 0 0
ECC. 0 1 3 4 5 7 10 15 21 23 26 26 28 28 29 30 30 30 30
• Ensuite, l’effectif étant de 30, on chosit la moyenne entre la 15i ème et la 16i ème note. On obtient
8+9
M ed = 2 = 8, 5
• Ce qui signifie que la moitié des notes est inférieure ou égale à 8, 5, et que l’autre moitié des
notes est supérieure ou égale à 8, 5.

Dans le cas de répartition par classes, la médiane peut être évaluée soit graphiquement, soit par interpo-
lation affine à l’aide d’un polygône des effectifs cumulés.

Exemple 4.8 On choisit la répartition par classes de la série A :


— On commence par créer le tableau des fréquences cumulées croissantes : (On en profite aussi
pour indiquer les fréquences cumulées décroissantes).

Notes [0; 5[ [5; 10[ [10; 15[ [15; 20[


Fréq. en % 13 57 23 7
F.c.c. 13 70 93 100
F.c.d. 100 87 30 7

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 50/63


— Puis on place les points correpondants aux extrémités de chaque classe sur un graphique :

On détermine le point du polygône d’ordonnée 50% et on trouver eniron 8, 2.


— Pour trouver la médiane, on peut aussi tracer le polygône des fréquences cumulées décroissantes
et lire l’abscisse du point d’intersection des deux polygônes. On trouve aussi 8, 2.
— On peut alors procéder à une interpolation linéaire d’après le théoème de Thalès :

M −5 50−13 M −5 37 37 470
10−5 = 70−13 ⇐⇒ 5 = 57 ⇐⇒ M = 5 × 57 +5= 57 ≈ 8, 25

4.3.3 Quartiles, déciles .


Définition 4.5 Soit une série statistique.
• On appelle quartiles de la série un triplet de réels (Q1 ; Q2 ; Q3 ) qui sépare la série en quatre
groupes de même effectif.
• On appelle déciles de la série un 9 -uplet de réels (D1 ; D2 ; . . . ; D9 ) qui sépare la série en dix
groupes de même effectif.

Remarque 4.4 Par définition, si X est une série statistique, Q2 = D5 = Med(X).


Le calcul des valeurs des quartiles ou des déciles se fait en général à partir des graphiques des effectifs
(ou fréquences) cumulés croissants, par interpolation linéaire.

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 51/63


4.4 Caractéristiques de dispersion

4.4.1 L’étendue
Il s’agit de la première mesure de la dispersion d’une série statistique. Son principal mérite a long-
temps été d’exister, et de fournir une information sur la dispersion très simple à obtenir.

Définition 4.6 Soit X une série statistique discrète. On appelle étendue de la série le réel, défini par

Etd(X) = max(X) − min(X)

Exemple 4.9 L’étendue de la série A est de 16 − 2 = 14.

4.4.2 La variance
Définition 4.7 La variance d’une série statistique est le nombre noté V (x) obtenu comme moyenne des
carrés des écarts constatés par rapport à la moyenne de la sírie :
p
n1 (x1 − x̄)2 + n2 (x2 − x̄)2 + . . . + np (xp − x̄)2 1 X
V (X) = = ni (xi − x̄)2
n1 + n2 + . . . + np N
i=1

Exemple 4.10 La variance de la série B vaut :

30(1050 − 1645)2 + 30(1300 − 1645)2 + . . . + 40(2200 − 1645)2


V (X) = ≈ 109346
280

4.4.3 L’écart-type
Définition 4.8
p
σ(X) = V (X)

Exemple 4.11 L’écart-type de la série B vaut : σ(X) = 109561 = 331.

Proposition 4.1 La variance et l’écart-type présentent les propriétís suivantes :


— La variance et l’écart-type sont des nombres positifs ou nuls,
— Une variance nulle ou un écart-type nul signifient que toutes les valeurs de la série son égales à
sa moyenne,
— Plus la variance (ou l’icart-type) d’une série est grande, plus cette série est dispersée

Proposition 4.2

V (X + b) = V (X) changement en translation

V (aX) = a2 V (X) changement en dilatation

V (aX + b) = a2 V (X) changement d’origine et d’échelle

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 52/63


Calcul pratique
On utilise souvent
i=n
1X
V (X) = ni x2i − x2
n
i=1

Un changement d’origine et d’échelle xi = x0 + hui conduit à

V (X) = h2 V (U ).

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 53/63


M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 54/63
Chapitre 5

Statistiques doubles

Soit une population Ω d’effectif total N et dont chaque élément présente deux caractères X et Y .

5.1 Définition

On appelle série statistique double de Ω pour les caractères X et Y l’application qui à chaque élément
de Ω associe le couple (xi , yj ) où xi sont les valeurs du caractère X et yj les valeurs du caractère Y .
Les résultats de cette observation peuvent être présentées sous deux formes

5.1.1 Données non groupées

Individu 1 2 3 ··· N
Valeur de X x1 x2 x3 ··· xN
Valeur de Y y1 y2 y3 ··· yN

Ce tableau est représenté graphiquement par

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 55/63


5.1.2 Données groupées

x1 , x2 , x3 , . . . xr
Les modalités de X et Y étant respectivement
y1 , y2 , y3 , . . . ys
nij est l’effectif des individus présentant simultanément les modalités xi et yj .
HH
Y
H
HH y1 y2 ys Totaux
X H
H
x1 n11 n12 n1s n1.
x2 n21 n22 n2s n2.

xr nr1 nr2 nrs nr.


Totaux n.1 n.2 n.s N

Pour la représentation graphique, le nuage est constitué de petits disques de surfaces proportionnelles
aux effectifs.

5.2 Tableaux de calcul

5.2.1 Données non groupées

xi yi x2i yi2 x i yi
x1 y1 x21 y12 x 1 y1
x2 y2 x22 y22 x 2 y2
.. ..
. . x2N 2
yN x N yN
N
X N
X N
X N
X N
X
xi yi x2i yi2 x i yi
i=1 i=1 i=1 i=1 i=1

Calculs :
Moyennes :
N N
1 X 1 X
x= xi ; y = yi
N N
i=1 i=1

Variances :
N
1 X 2 p
V (X) = xi − x2 ; σ(X) = V (X)
N
i=1
N
1 X 2 p
V (Y ) = yi − y 2 ; σ(Y ) = V (Y )
N
i=1

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 56/63


Covariance :
N
1 X
σXY = cov(X, Y ) = (xi − x)(yi − y)( par définition)
N
i=1

N
1 X
σXY = cov(X, Y ) = xi yi − x y( pour le calcul)
N
i=1

Coefficient de corrélation linéaire : On appelle coefficient de corrélation linéaire du couple (X, Y )


le nombre réel
cov(X, Y )
ρ(X, Y ) =
σ(X)σ(Y )

Propriétés :

aa0
|ρ(X, Y )| ≤ 1; ρ(aX + b, a0 Y + b0 ) = ρ(X, Y )
|aa0 |
La corrélation est forte lorsque 0.87 ≤ ρ ≤ 1.

5.2.2 Données groupées


H s s
HH Y X X
y1 y2 ys ni. ni. xi ni. x2i nij yj xi nij yj
X H
HH j=1 j=1

x1 n11 n12 n1s n1.


x2 n21 n22 n2s n2.

xr nr1 nr2 nrs nr.


r
X r
X r
X s
X
n.j n.1 n.2 n.s N ni. xi ni. x2i xi nij yj
i=1 i=1 i=1 j=1
s
X
n.j yj n.j yj
j=1
Xs
n.j yj2 n.j yj2
j=1
r
X
nij xi
i=1
Xr s
X r
X
yj nij xi yj nij xi
i=1 j=1 i=1

Définitions
Effectifs marginaux La somme des effectifs partiels contenus dans la ligne de xi est égale à l’ef-
fectif des éléments dont la valeur du caractère X est xi . Elle est notée ni. .
s
X
ni. = ni1 + ni2 + . . . + nij + . . . + nis = nij
j=1

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 57/63


La somme des effectifs partiels contenus dans la colonne de yj est égale à l’effectif des éléments
dont la valeur du caractère Y est yj . Elle est notée n.j .
r
X
n.j = n1j + n2j + . . . + nrj = nij
i=1

ni. et n.j sont appelés effectifs partiels marginaux


r
X s
X r X
X s
N= ni. = n.j = nij
i=1 j=1 i=1 j=1

Fréquences marginales



 fi. fréquence marginale de xi
ni. 
fi. = ni. effectif partiel marginal de xi
N  

N effectif total


 f.j fréquence marginale de yj


n.j 
f.j = n effectif partiel marginal de yj
N   .j

N effectif total

r
X s
X r X
X s
1= fi. = f.j = fij
i=1 j=1 i=1 j=1

Fréquences conditionnelles

 fi/j fréquence conditionnelle de xi sachant yj


nij fij 
fi/j = = nij effectif correspondant partiel à X = xi et Y = yj
n.j f.j 


n.j effectif partiel marginal de yj

De même, on définit la fréquence conditionnelle de la valeur yj sachant xi


nij fij
fj/i = =
ni. fi.
On a
fij = fi. × fj/i = f.j × fi/j

Indépendance Les variables X et Y sont indépendantes si et seulement si, quel que soit le couple
(i, j)
fij = fi. × f.j

Calculs :
Moyennes :
r s
1 X 1 X
x= ni. xi ; y = n.j yj
N N
i=1 j=1

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 58/63


Variances :
r
1 X p
V (X) = ni. x2i − x2 ; σ(X) = V (X)
N
i=1
s
1 X p
V (Y ) = n.j yj2 − y 2 ; σ(Y ) = V (Y )
N
j=1

Covariance : On appelle covariance du couple (X, Y ) et on la note cov(X, Y ) ou σXY la moyenne


de (X − X)(Y − Y ).
Par définition
r s
1 XX
cov(X, Y ) = nij (xi − x)(yj − y)
N
i=1 j=1

Pour le calcul on utilise


r s
1 XX
σXY = cov(X, Y ) = nij xi yj − xy
N
i=1 j=1

Coefficient de corrélation linéaire :


cov(X, Y )
ρ(X, Y ) =
σ(X)σ(Y )

5.3 Ajustement - Méthode des moindres carrés

5.3.1 Première droite des moindres carrés


Soit Mij un point de coordonnées (xi , yj ). On appelle distance de Mij parallèlement à (Oy) à la droite
(∆) d’équation y = ax + b le réel positif

dij = |yj − axi − b|

On démontre que la somme des carrés des distances est minimale pour
cov(X, Y ) σXY
a= = et b = y − ax
V (X) (σ(X))2
La droite d’équation y − y = a(x − x) ou y = ax + b s’appelle droite de régression de y en x et est
notée Dy/x .

Remarque 5.1 La droite de régression fournit une idée schématique, mais souvent très utile, de la re-
lation entre les deux variables. En particulier, elle permet facilement d’apprécier comment évolue l’une
des variables (le critère) en fonction de l’autre (le prédicteur).

5.3.2 Deuxième droite des moindres carrés


Soit Mij un point de coordonnées (xi , yj ). On appelle distance de Mij parallèlement à (Ox) à la droite
(∆0 ) d’équation x = a0 y + b0 le réel positif

δij = xi − a0 yj − b0

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 59/63


On démontre que la somme des carrés des distances est minimale pour

cov(X, Y ) σXY
a0 = = et b0 = x − a0 y
V (Y ) (σ(Y ))2

La droite d’équation x − x = a0 (y − y) s’appelle droite de régression de x en y et est notée Dx/y .

5.3.3 Ajustement et corrélation

Relation aa0 = ρ2 On a
cov(X, Y ) cov(X, Y )
a= ; a0 =
V (X) V (Y )

d’où
[cov(X, Y )]2
aa0 = = ρ2
V (X)V (Y )

Forte corrélation La corrélation est forte si 0.87 ≤ ρ ≤ 1 ce qui justifie un ajustement linéaire.
Corrélation nulle Dans le cas où ρ = 0, on dit qu’il y a corrélation nulle entre X et Y , ce qui
n’exclut pas que l’on puisse ajuster X et Y par une courbe.

5.4 Exemple d’application

On considère la distribution suivante

xi 5.5 9.7 8.7 11.8 19.0 5.9 9.5 17.3 13.3 11.0
yi 8.5 13.2 8.7 11.1 3.8 6.5 7.4 5.6 6.5 5.9

18.0 7.8 1.5 1.3 1.8 12.0 2.7 15.4 12.9 6.2
6.7 4.9 0.8 7.4 18.1 4.7 10.2 17.8 11.2 9.0

On a
n = 20
x = 9.57, Vx = 28.90, σ(X) = 5.38
y = 8.40, Vy = 17.70, σ(Y ) = 4.22
σXY = −1.79, ρ = −0.08
Dy/x : y = ax + b, a = −0.06, b = 8.99
Dx/y : y = a0 x + b0 , a0 = −0.10, b0 = 10.41

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 60/63


Corrélation proche de 0.

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 61/63


Annexe

Table de la loi normale centrée réduite N (0; 1)

M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 62/63


M. M OUMNI (FST E RRACHIDIA ) Module M 233 - BCG S3 Année 2020/21 63/63

Vous aimerez peut-être aussi