Vous êtes sur la page 1sur 461

Probabilités et Statistique

Note de cours

Mhamed Mesfioui, Ph. D.


mhamed.mesfioui@uqtr.ca

Département de mathématiques et d’informatique Université du Québec à Trois-Rivières

Automne 2021

1/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales
Paramètres de positionnement et de dispersion
Représentation graphique
Exercices

Partie I
Statistique descriptive

Mhamed Mesfioui, Ph.D.

mhamed.mesfioui@uqtr.ca

Automne 2021

2/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales
Paramètres de positionnement et de dispersion
Représentation graphique
Exercices

Partie I : Statistique descriptive

1 Notions fondamentales

2 Paramètres de positionnement et de dispersion

3 Représentation graphique

4 Exercices

3/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Variable statistique
Paramètres de positionnement et de dispersion Tableau de fréquence
Représentation graphique Nombre de classe
Exercices Tableau de fréquence : Cas de données discrètes

Notions fondamentales

Mhamed Mesfioui, Ph. D.

mhamed.mesfioui@uqtr.ca

Automne 2021

4/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Variable statistique
Paramètres de positionnement et de dispersion Tableau de fréquence
Représentation graphique Nombre de classe
Exercices Tableau de fréquence : Cas de données discrètes

Notions fondamentales

Notions fondamentales
Individu : c’est l’unité sur laquelle on observe une ou plusieurs
caractéristiques. Par exemple : personne, ville, plante, machine, etc.
Population : c’est l’ensemble des individus que l’on veut étudier, qui ont
des propriétés communes et pour lesquelles on veut obtenir de
l’information.
Échantillon : c’est un sous-ensemble de la population, soit la partie
qu’on veut examiner.
Taille : on appelle taille d’un échantillon le nombre d’individus dans cet
échantillon. On le note par n. La taille de la population sera noté N.

5/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Variable statistique
Paramètres de positionnement et de dispersion Tableau de fréquence
Représentation graphique Nombre de classe
Exercices Tableau de fréquence : Cas de données discrètes

Variable statistique

Variable statistique
Une variable statistique est une caractéristique susceptible de
variations observables.
Les modalités d’une variable statistique sont les valeurs possibles à
priori de la variable.
Les données sont les valeurs observées à posteriori de la variable.

6/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Variable statistique
Paramètres de positionnement et de dispersion Tableau de fréquence
Représentation graphique Nombre de classe
Exercices Tableau de fréquence : Cas de données discrètes

Type de variable

Variable quantitative : elle fait référence à un système de mesure


numérique. On distingue deux cas :
1. Variable quantitative discrète : l’ensemble des modalités est
dénombrable. Par exemple, la variable nombre d’enfants par ménage.
2. Variable quantitative continue : l’ensemble des modalités est un
intervalle. Par exemple, la durée de vie d’un instrument électronique.

7/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Variable statistique
Paramètres de positionnement et de dispersion Tableau de fréquence
Représentation graphique Nombre de classe
Exercices Tableau de fréquence : Cas de données discrètes

Type de variable

Variable qualitative : elle ne fait pas référence à un système de mesure


numérique. On distingue deux cas :
1. Ordinale : l’ensemble des modalités correspond à une échelle avec un
ordre. Par exemple, niveau de satisfaction, niveau de scolarité.
2. Nominale : l’ensemble des modalités ne correspond à aucune échelle.
Par exemple, la variable sexe.

8/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Variable statistique
Paramètres de positionnement et de dispersion Tableau de fréquence
Représentation graphique Nombre de classe
Exercices Tableau de fréquence : Cas de données discrètes

Tableau de fréquence

Représentation des données : cas continu


Cas de variables quantitatives continues : données brutes
Exemple 1. Les données ci-dessous représentent les durées de vie (en
heures) d’un certain type d’appareil électronique :

78.9 83.4 90.0 88.2 89.3 60.8


75.0 88.0 92.3 73.1 73.1 76.3
60.3 67.4 84.2 84.2 70.2 97.8
92.1 80.0 77.0 77.0 77.2 84.5
93.7 78.5 65.0 56.5 56.5 84.2

9/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Variable statistique
Paramètres de positionnement et de dispersion Tableau de fréquence
Représentation graphique Nombre de classe
Exercices Tableau de fréquence : Cas de données discrètes

Tableau de fréquence

Données groupées : sont des données obtenues en regroupant les


données brutes ordonnées dans des classes sous la forme d’un tableau
de fréquences.
Notons que les classes sont souvent de la forme [ai , bi [.
La fréquence ou effectif ni relative à une classe [ai , bi [ correspond au
nombre d’observations appartenant à cette classe.
La fréquence relative fi représente le pourcentage d’observations
contenues dans la classe [ai , bi [, elle est déterminée par la formule
ni
fi = .
n

10/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Variable statistique
Paramètres de positionnement et de dispersion Tableau de fréquence
Représentation graphique Nombre de classe
Exercices Tableau de fréquence : Cas de données discrètes

Tableau de fréquence

La valeur centrale mi d’une classe est le milieu de la classe [ai , bi [


ai + bi
mi = .
2
Tableau de fréquences : les données brutes ci-dessus sont résumées
dans le tableau de fréquences suivant :

11/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Variable statistique
Paramètres de positionnement et de dispersion Tableau de fréquence
Représentation graphique Nombre de classe
Exercices Tableau de fréquence : Cas de données discrètes

Tableau de fréquence

Exemple 2.
Fréquences
Classe Fréquences n Valeur centrale m
relatives f
4
[55, 65[ 4 60 30
5
[65, 75[ 5 70 30
13
[75, 85[ 13 80 30
7
[85, 95[ 7 90 30
1
[95, 105[ 1 100 30

n = 30 F =1

12/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Variable statistique
Paramètres de positionnement et de dispersion Tableau de fréquence
Représentation graphique Nombre de classe
Exercices Tableau de fréquence : Cas de données discrètes

Tableau de fréquence

La classe contenant le plus grand nombre d’observations, c’est-à-dire,


celle qui correspond à la plus haute fréquence est appelée classe
modale.
Le centre de la classe modale est appelé le mode.
La classe modale du tableau de fréquence précédent est [75, 85[. Par
contre, le mode sera la valeur centrale de [75, 85[ à savoir 80.

13/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Variable statistique
Paramètres de positionnement et de dispersion Tableau de fréquence
Représentation graphique Nombre de classe
Exercices Tableau de fréquence : Cas de données discrètes

Nombre de classe

Le nombre p de classes dans un tableau de fréquences est donné par



p = n.

Dans l’exemple précédent, on a n = 30 et p = 30 ≈ 5 classes.
Toutefois, il existe d’autres méthodes pour déterminer le nombre de
classes :
La règle de Sturge :
p = 1 + 3.3 log(n) pour n = 30, p ≈ 12.
La règle de Yule :

p = 2.5 n pour n = 30, p ≈ 14.
La méthode du bon sens reste la meilleure.

14/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Variable statistique
Paramètres de positionnement et de dispersion Tableau de fréquence
Représentation graphique Nombre de classe
Exercices Tableau de fréquence : Cas de données discrètes

Tableau de fréquence pour des données discrètes

Variables quantitatives discrètes : données brutes


Exemple 3. Nombre de pièces présentant une défectuosité mineure.
0 1 0 2 0
0 1 2 0 0
1 0 1 3 0
1 2 1 0 0

Tableau de fréquences : on peut présenter les données brutes


précédentes selon les modalités dans le tableau de fréquences suivant.

15/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Variable statistique
Paramètres de positionnement et de dispersion Tableau de fréquence
Représentation graphique Nombre de classe
Exercices Tableau de fréquence : Cas de données discrètes

Tableau de fréquences dans le cas discret

Présentation du tableau de fréquences :


Fréquences
Modalités x Fréquences n
relatives f
0 10 10/20
1 6 6/20
2 3 3/20
3 1 1/20
n = 20 F =1

16/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Moyenne d’un échantillon
Paramètres de positionnement et de dispersion Variance d’un échantillon
Représentation graphique Coefficient de variation
Exercices Étendue

Paramètres de positionnement et de dispersion

Mhamed Mesfioui, Ph. D.

mhamed.mesfioui@uqtr.ca

Automne 2021

17/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Moyenne d’un échantillon
Paramètres de positionnement et de dispersion Variance d’un échantillon
Représentation graphique Coefficient de variation
Exercices Étendue

Paramètres de position et de dispersion

Moyenne d’un échantillon issu d’une variable continue


Cas de données brutes :
La moyenne d’un échantillon x1 , . . . , xn est donnée par la formule :

n
1X x1 + · · · + xn
x̄ = xi = .
n n
i=1

Par exemple la moyenne des données de l’exemple 1 est :

x̄ = 78.49.

18/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Moyenne d’un échantillon
Paramètres de positionnement et de dispersion Variance d’un échantillon
Représentation graphique Coefficient de variation
Exercices Étendue

Moyenne d’un échantillon

Moyenne d’un échantillon issu d’une variable continue


Cas de données groupées
La moyenne des données groupées s’exprime par :

p
1X n1 m1 + · · · + np mp
x̄ = ni mi = .
n n
i=1

Par exemple la moyenne de données groupées de l’exemple 2 est :

x̄ = 78.67.

19/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Moyenne d’un échantillon
Paramètres de positionnement et de dispersion Variance d’un échantillon
Représentation graphique Coefficient de variation
Exercices Étendue

Variance d’un échantillon

Variance d’un échantillon issu d’une variable continue


Cas de données brutes :
La variance d’un échantillon x1 , . . . , xn est donnée par la formule :
n
" n ! #
2 1 X 2 1 X 2 2
s = (xi − x̄) = xi − nx̄ .
n−1 n−1
i=1 i=1

Par exemple la variance et l’écart-type des données de l’exemple 1 sont :

s2 = 125.54 et s = 11.20.

20/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Moyenne d’un échantillon
Paramètres de positionnement et de dispersion Variance d’un échantillon
Représentation graphique Coefficient de variation
Exercices Étendue

Variance d’un échantillon

Variance d’un échantillon issu d’une variable continue


Cas de données groupées
La variance des données s’exprime par :
" p ! #
2 1 X 2 2
s = ni mi − nx̄ .
n−1
i=1

Par exemple la variance et l’écart-type des données de l’exemple 2 sont :

s2 = 107.96 et s = 10.39.

21/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Moyenne d’un échantillon
Paramètres de positionnement et de dispersion Variance d’un échantillon
Représentation graphique Coefficient de variation
Exercices Étendue

Coefficient de variation

Coefficient de variation
Le coefficient de variation est une mesure de dispersion relative à la
moyenne. Il est défini par :
s
CV = .

Il s’agit d’une mesure utile pour comparer la variabilité de deux ou
plusieurs ensembles de données qui diffèrent considérablement de par
l’ampleur des valeurs observées. Par exemple, on pourrait y recourir afin
de comparer la variabilité de la consommation quotidienne de
l’électricité, en janvier, de maisons unifamiliales situées à Québec et à
Vancouver.

22/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Moyenne d’un échantillon
Paramètres de positionnement et de dispersion Variance d’un échantillon
Représentation graphique Coefficient de variation
Exercices Étendue

Étendue

Étendue
L’étendue d’un échantillon x1 , . . . , xn est définie par

R = max(xi ) − min(xi ).

23/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte

Représentation graphique

Mhamed Mesfioui, Ph. D.

mhamed.mesfioui@uqtr.ca

Automne 2021

24/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte

Représentation graphique

Représentations graphiques des données : histogramme


L’histogramme est une visualisation graphique de données issues d’une
variable statistique continue.
Pour construire un histogramme, on inscrit les limites des intervalles des
classes dans l’axe horizontal, puis on calcule la hauteur de chaque
rectangle par la formule :

hauteur du rectangle = fréquence de la classe.

C’est-à-dire :

hi = ni .

25/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte

Interprétation de l’histogramme

L’histogramme donne une idée sur le comportement de la distribution


théorique des données. Par exemple, l’histogramme suivant relatif aux
données des durées de vie de l’exemple 1 laisse croire que la
distribution théorique de ces observations est une distribution bimodale.

26/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte

Illustration d’un histogramme

Histogramme des durée de vie: données exemple 1


7
6
5
Frequency

4
3
2
1
0

60 70 80 90 100
27/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte

Représentation graphique

Représentation graphique d’une variable qualitative ou quantitative


discrète : diagramme à secteurs circulaires
Le diagramme à secteurs circulaires visualise les fréquences des
modalités dans le cas d’une variable qualitative ou quantitative discrète.
L’idée de cette représentation consiste à représenter graphiquement les
fréquences ni par des secteurs circulaires d’angles αi donnés par la
formule suivante :
360ni
αi =
n
Les données discrètes de l’exemple 3 sont reprises dans le diagramme
circulaire ci-dessous.

28/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte

Illustration d’un diagramme à secteurs circulaires

pas de déf
1 déf
2 déf
3 déf

29/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte

Diagramme en boîte

Diagramme en boîte (Box PLot)


Le diagramme en boîte est une représentation graphique qui nous
informe sur la symétrie et la dispersion des données. Il permet aussi
d’identifier les valeurs aberrantes et de comparer plusieurs populations.

Construction du diagramme en boîte


Afin de construire le diagramme en boîte, nous allons définir la médiane
et les quartiles d’un échantillon.

30/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte

Médiane d’un échantillon

Médiane d’un échantillon


La médiane d’un échantillon c’est la valeur qui partage l’échantillon en
deux parties égales.

Calcul de la médiane M
Soit x1 , . . . , xn un échantillon ordonné. Pour calculer la médiane M, on
distingue deux cas :
1. Cas 1 : si n est impair, alors

M = x n+1
2

Par exemple, la médiane des données 1, 2, 3.5, 5.7, 8, 12.3, 14 sera


M = 5.7.
31/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte

Médiane d’un échantillon

2. Cas 2 : si n est pair, alors


x n + x n +1
2 2
M= .
2
Par exemple, la médiane des données 0, 1, 2, 3.5, 5.5, 8, 12.3, 14 sera
M = 4.5.

32/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte

Quartiles d’un échantillon

Quartile d’ordre 1
Le quartile d’orde un, noté Q1 est la médiane des observations qui sont
strictement plus petites que la médiane M.

Quartile d’ordre 3
Le quartile d’orde trois Q3 est la médiane des observations qui sont
strictement plus grandes que la médiane M.

Remarque. le quartile d’ordre Q2 n’est nulle autre que la médiane M.

Exemple. Q1 et Q3 des données 0, 1, 2, 3.5, 5.5, 8, 12.4, 14 seront


Q1 = 1.5 et Q3 = 10.2.

33/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte

Construction du diagramme en boîte

Voici les étapes à suivre pour construire un diagramme en boîte

1. On calcule les quartiles : Q1 , M et Q3


2. On calcule l’écart interquartile : E = Q3 − Q1
3. On calcule les bornes normales :

bi = Q1 − 1.5E et bs = Q3 + 1.5E

4. On calcule la plus petite et la plus grande valeur normale appartenant à


l’échantillon :
xi : plus petite valeur supérieure ou égale à bi
xs : plus grande valeur inférieure ou égale à bs .

34/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte

Illustration d’un diagramme en boîte

Exemple. Ci-après le diagramme en boîte des données suivantes. On


constate que 60 est une valeur aberrante. On remarque aussi que la
distribution de l’échantion est symétrique.
8 10 12 14 16 18 20 22 24 26 40 60

Le diagramme en boîte de cette série ci-après montre que la valeur 60


est aberrante.

35/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte

Illustration d’un diagramme en boîte

Boxplot des données précédentes

60
50
40
30
20
10

36/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte

Boxplot des durées de vie de l’exemple 1

Diagramme en boîte des durée de vie: données exemple 1

90
80
70
60

37/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte

Boxplot des durées de vie de l’exemple 1

Nous constatons du diagramme en boîte précédent que la distribution des


durées de vie présentées dans l’exemple 1 n’est pas symétrique. Car, la
droite passant par la médiane ne partage pas le rectangle en deux parties
égales.

38/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte

Autres utilités d’un diagramme en boîte

Le diagramme boîte est aussi utile pour comparer visuellement plusieurs


populations. Pour ce faire, les logiciels statistiques (comme le logiciel R)
donnent la possibilité de présenter plusieurs diagrammes en boîte sur le
même graphique. Ces diagrammes permettent de comparer visuellement les
distributions de plusieurs populations. Le graphe ci-après présente les
diagrammes en boîte de trois échantillons issus de population normales de
moyennes et de variances différentes.

39/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte

Boxplot

Boxplots associés à trois échantillons de moyennes 2, 4 et 6

12
10
8
6
4
2
0

40/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales
Paramètres de positionnement et de dispersion
Représentation graphique
Exercices

Exercices

Mhamed Mesfioui, Ph. D.

mhamed.mesfioui@uqtr.ca

Automne 2021

41/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales
Paramètres de positionnement et de dispersion
Représentation graphique
Exercices

Exercice 1

Exercice 1. Deux techniciens effectuent un test de dureté sur des feuilles de


métal avant qu’elles ne soient expédiées. En utilisant le même instrument de
mesure, chaque technicien a effectué 10 lectures sur une feuille de métal.
Les résultats sont présentés dans le tableau suivant :

Technicien A 529 528 426 527 525 525 526 527 528 525
Technicien B 527 522 523 526 523 525 526 524 527 523

42/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales
Paramètres de positionnement et de dispersion
Représentation graphique
Exercices

Exercice 1

Boxplots associés aux données des deux Techniciens A et B


520
500
480
460
440

43/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales
Paramètres de positionnement et de dispersion
Représentation graphique
Exercices

Exercice 1

Boxplots des Techniciens A et B sans la VA: 426


529
528
527
526
525
524
523
522

44/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales
Paramètres de positionnement et de dispersion
Représentation graphique
Exercices

Exercice 1

Exercice 1.

a) Calculez les moyennes et les variances A et B.


b) Calculez la médiane M, et les deux quartiles Q1 et Q3 pour A et B.
c) Est ce qu’il y a des valeurs aberrantes dans la série A ? Justifiez.
d) Même question pour la série B ? Justifiez.

45/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales
Paramètres de positionnement et de dispersion
Représentation graphique
Exercices

Réponse Exercice 1

Réponse.

a) x̄A = 516.6, sA2 = 1015.32, x̄B = 524.6 et sB2 = 3.38


b) Pour A : Q1 = 525, M = 526.5, Q3 = 528
Pour B : Q1 = 523, M = 524.5 Q3 = 526
c) V .A = 426 pour la série A, car bi = 520.5, bs = 532.5
d) Pas de V .A pour la série B, car bi = 518.5, bs = 530.5.

46/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales
Paramètres de positionnement et de dispersion
Représentation graphique
Exercices

Exercice 2

Exercice 2. Soit x1 , . . . , xn une série statistique. Posons yi = axi + b où a et


b sont des constantes non nulles. Montrez que

ȳ = ax̄ + b et sy2 = a2 sx2 .

47/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales
Paramètres de positionnement et de dispersion
Représentation graphique
Exercices

Réponse Exercice 2

Réponse.
a) Puisque yi = axi + b, i = 1, . . . , n. Donc la moyenne des yi sera :
n n
1X 1X
ȳ = yi = (axi + b)
n n
i=1 i=1
n n
!
1 X X
= axi + b
n
i=1 i=1
n
!
1 X
= a xi + nb
n
i=1
= ax̄ + b.

48/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales
Paramètres de positionnement et de dispersion
Représentation graphique
Exercices

Réponse exercice 2

b) La variance des yi donnée par :


n n
1 X 1 X
sy2 = (yi − ȳ )2 = (axi + b − (ax̄ + b))2
n−1 n−1
i=1 i=1
n
1 X
= {a(xi − x̄)}2
n−1
i=1
n
1 X
= a2 (xi − x̄)2
n−1
i=1
n
1 X
= a2 (xi − x̄)2
n−1
i=1

= a2 sx2 .

49/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes

Partie II
Probabilités et Variables aléatoires

Mhamed Mesfioui, Ph.D.

mhamed.mesfioui@uqtr.ca

Automne 2021

50/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes

Partie II : Probabilités et Variables aléatoires

5 Définition et propriétés d’une probabilité

6 Analyse Combinatoire appliquée aux calculs de probabilités

7 Probabilités conditionnelles et indépendance

8 Formules de Bayes

51/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes

Partie II : Probabilités et Variables aléatoires

9 Variables aléatoires discrètes et continues

10 Modèles probabilistes discrets

11 Modèles probabilistes continus

12 Théorème central limite et applications

52/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Définition et propriétés d’une probabilité

Mhamed Mesfioui, Ph. D.

mhamed.mesfioui@uqtr.ca

Automne 2021

53/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Vocabulaire

Épreuve aléatoire : C’est une expérience dont le résultat n’est pas


connu avec certitude.
Exemple.
1) Lancer une pièce de monnaie 3 fois.
2) Lancer un dé à six faces 2 fois.

Espace échantillonnal : C’est l’ensemble de tous les résultats


possibles d’une épreuve aléatoire. On le note par S.
Exemple.
1) Pour l’expérience aléatoire 1), on a
S = {PPP, PPF , PFP, FPP, PFF , FPF , FFP, FFF } .
2) Pour l’expérience aléatoire 2), on a
S = {(1, 1), (1, 2), . . . , (1, 6), . . . , (6, 1), (6, 2), . . . , (6, 6)} .

54/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Vocabulaire

Événement : C’est un sous ensemble de l’espace échantillonnal S.


Exemple. On lance un dé deux fois, définir les événements A et B
suivants :
a) A : la somme des chiffres obtenus soit 5.
b) B : le premier chiffre obtenu soit plus grand que le deuxième.
Solution.
a) L’événement A : la somme des chiffres obtenus est 5 s’écrit :
A = {(1, 4), (2, 3), (3, 2), (4, 1)} .
b) De même, l’événement B : le premier chiffre obtenu est plus grand au
deuxième est donné par :
B = {(i, j) : tel que i > j, i, j = 1, . . . , 6}
= {(2, 1), (3, 1), (3, 2), . . . , (6, 1), (6, 2), (6, 3), (6, 4), (6, 5)} .
Ainsi, Card(B) = 15

55/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Approche fréquentielle

On répète une épreuve aléatoire N fois. On suppose que ces répétitions


se font indépendamment les unes des autres et sous les mêmes
conditions.
On fixe un événement A et on s’intéresse au nombre NA défini par :

NA : Nombre d’apparitions de l’événement A.

La fréquence relative de l’événement A, appelée aussi probabilité


empirique, est définie par :
NA
fA = .
N

56/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Approche fréquentielle

Lorsque on fait tendre N vers l’infini, la probabilité empirique fA


converge vers une valeur théorique appelée probabilité de A, notée
P(A). Ainsi :
NA
P(A) = lim .
N→∞ N

Remarque. On peut utiliser les relations

NA∪B = NA + NB − NA∩B et NA = N − NA .

pour déduire la formule de la probabilité de la réunion de deux


événements donnée par :

P(A ∪ B) = P(A) + P(B) − P(A ∩ B) et P(A) = 1 − P(A).

57/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Approche fréquentielle

En effet :

NA∪B = NA + NB − NA∩B

NA∪B NA NB NA∩B
=⇒ = + −
N N N N

NA∪B NA NB NA∩B
=⇒ lim = lim + lim − lim
N→∞ N N→∞ N N→∞ N N→∞ N

=⇒ P(A ∪ B) = P(A) + P(B) − P(A ∩ B).

58/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Approche fréquentielle

De même, on a

NĀ = N − NA

NĀ NA
=⇒ =1−
N N

NĀ NA
=⇒ lim = 1 − lim
N→∞ N N→∞ N

=⇒ P(Ā) = 1 − P(A).

59/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Approche axiomatique
Rappel ensembliste
Réunion : La réunion de deux évènements A et B d’un espace
échantillonnal S est l’évènement A ∪ B défini par :
A ∪ B = {x ∈ S : x ∈A ou x ∈ B}

A B

6
BM 
B 
B 
B
A∪B
Notons que la réunion A ∪ B se réalise si A ou B se réalise. 60/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Approche axiomatique
Intersection : L’intersection de deux évènements A et B d’un espace
échantillonnal S est l’évènement A ∩ B défini par :
A ∩ B = {x ∈ S : x ∈A et x ∈ B}

A B

A∩B
Remarquons que l’intersection A ∩ B se réalise si A et B se réalisent
simultanément. 61/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Approche axiomatique
Complémentaire : Le complémentaire d’un évènement A est
l’évènement A défini par :
A = {x ∈ S : x∈
/ A}

A
Remarque. A se réalise si A ne se réalise pas. 62/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Approche axiomatique

Différence : La différence de deux évènements A et B est l’évènement


A − B défini par

A − B = {x ∈ S : x ∈A et x ∈
/ B} .

A − B se réalise si A se réalise et B ne se réalise pas. Remarque.


Notons que A − B peut aussi s’écrire sous forme :

A − B = A ∩ B.

Événements mutuellement exclusifs ou disjoints


Les évènements A1 , . . . , An sont mutuellement exclusifs ou disjoints si

Ai ∩ Aj = ∅ pour tout i 6= j.

63/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Formules de De Morgan

Formules de De Morgan : cas de deux évènements


Soient A et B deux évènements d’un espace échantillonnal S, alors :

A∪B =A∩B

et
A ∩ B = A ∪ B.
Formules de De Morgan : cas général
Soient A1 . . . , An une suite d’évènements d’un espace échantillonnal S,
alors :
A1 ∪ · · · ∪ An = A1 ∩ · · · ∩ An
et
A1 ∩ · · · ∩ An = A1 ∪ · · · ∪ An .

64/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Définition axiomatique d’une probabilité

En mathématique, une probabilité est une fonction réelle d’ensembles,


notée P, qui fait correspondre à chaque évènement A d’un espace S un
nombre réel, noté P(A). Pour la fonction

P : A 7→ P(A)

soit une probabilité P(A), elle doit nécessairement satisfaire les axiomes
suivants :
1. 0 ≤ P(A) ≤ 1 pour tout A ⊂ S.
2. P(S) = 1.
3. Si A1 , A2 , . . . une suite infinie d’évènements mutuellement exclusifs, alors
P(A1 ∪ A2 ∪ · · · ) = P(A1 ) + P(A2 ) + · · · .

65/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Définition axiomatique d’une probabilité

Remarque. L’axiome 3 reste vraie pour une suite finie d’évènements,


c’est-à-dire, si A1 , . . . , Ak sont des évènements mutuellement exclusifs,
alors :

P(A1 ∪ A2 ∪ · · · ∪ Ak ) = P(A1 ) + P(A2 ) + · · · + P(Ak ).

66/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Espace échantillonnal fini et équiprobable

Espace échantillonnal fini et équiprobable

On dit qu’un espace échantillonnal S est fini et équiprobable si :


1. S = {a1 , . . . , an } .
2. P(a1 ) = P(a2 ) = · · · = P(an ) = 1/n.

Remarque. Les éléments {a1 }, {a2 }, . . . , {an } sont appelés évènements


élémentaires.

67/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Espace échantillonnal fini et équiprobable

Soulignons que dans le cas d’un espace fini et équiprobable, la


probabilité d’un évènement A est donnée par :
card{A} Nombre de cas favorables
P(A) = = .
n Nombre de cas possibles
où card{A} désigne le nombre d’éléments de A. Par exemple, si
A = {a, b, c, d} alors card{A} = 4.

Exercice. On lance une pièce de monnaie équilibrée 4 fois, quelle est la


probabilité d’obtenir exactement 3 fois pile ?
Réponse. Cette probabilié est donnée par :
4
P {PPPF , PPFP, PFPP, FPPP} = = 0.25
16

68/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Espace échantillonnal fini et équiprobable

Exemple d’espace fini et non équiprobable

On considère un dé à six faces non équilibré tel que :

P [d’obtenir la face i] = P{i} = ki, i = 1, . . . , 6.

a) Calculez la valeur de k .
b) Quelle est la probabilité d’obtenir un nombre pair.

69/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Espace échantillonnal fini et équiprobable

Réponse

On considère un dé à six faces non équilibré tel que :


a) La valeur de k s’obtient en utilisant P(1) + · · · + P(6) = 1 qui est équivalent
à:
1
k + 2k + 3k + 4k + 5k + 6k = 1 implique k = .
21
b) La probabilité d’obtenir un nombre pair est
12 4
P(2) + P(4) + P(6) = 12k = = .
21 7

70/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Propriétés d’une probabilité

Les propriétés suivantes sont très utiles pour faire les exercices :
1. P(Ā) = 1 − P(A).
2. P{∅} = 0.
3. P(A ∪ B) = P(A) + P(B) − P(A ∩ B).
4.
P(A ∪ B ∪ C) = P(A) + P(B) + P(C)
− P(A ∩ B) − P(B ∩ C) − P(A ∩ C)
+ P(A ∩ B ∩ C).

5. P(A − B) = P(A ∩ B̄) = P(A) − P(A ∩ B).

71/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Propriétés d’une probabilité

Exercice 1.
Soient les évènements F , G et H tels que :

P(F ) = 0.7, P(G) = 0.6, P(H) = 0.4,

P(F ∩ G) = 0.4, P(F ∩ H) = 0.3, P(G ∩ H) = 0.2,

P(F ∩ G ∩ H) = 0.1.

Calculer :
a) P(F ∪ G), P(F ∩ G), P(F ∩ G) et P(F ∪ G).
Rep : 0.9, 0.1, 0.2 et 0.8

b) P(F ∪ G ∪ H), P(F ∩ G ∩ H) et P(F ∪ G ∪ H) .


Rep : 0.9, 0.1 et 0.7
72/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Propriétés d’une probabilité

Réponse de l’exercice 1.
Calculons P(F ∪ G) :

P(F ∪ G) = P(F ) + P(G) − P(F ∩ G) = 0.9.

Calculons P(F ∩ G). En utilisant la loi de De Morgan, il vient que :

P(F ∩ G) = P(F ∪ G) = 1 − P(F ∪ G) = 0.1.

Calculons P(F ∩ G) :

P(F ∩ G) = P(G) − P(F ∩ G) = 0.2.

73/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Propriétés d’une probabilité

Réponse de l’exercice 1.
Calculons P(F ∪ G). En appliquons la loi de De Morgan, on voit que

P(F ∪ G) = 1 − P(F ∪ G)
= 1 − P(F ∩ G)
= 1 − [P(F ) − P(F ∩ G)] = 0.7.

Calculons P(F ∪ G ∪ H)

P(F ∪ G ∪ H) = P(F ) + P(G) + P(H)


−P(F ∩ G) − P(F ∩ H) − P(G ∩ H)
+P(F ∩ G ∩ H) = 0.9.

74/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Propriétés d’une probabilité

Réponse de l’exercice 1.
Calculons P(F ∩ G ∩ H). En appliquons la loi de De Morgan, on voit que

P(F ∩ G ∩ H) = P(F ∪ G ∪ H) = 1 − P(F ∪ G ∪ H) = 0.1.

Calculons P(F ∪ G ∪ H). En appliquons la loi de De Morgan, on voit que

P(F ∪ G ∪ H) = 1 − P(F ∪ G ∪ H)
= 1 − P(F ∩ G ∩ H)
= 1 − [P(F ∩ G) − P(F ∩ G ∩ H)] = 0.7.

75/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Propriétés d’une probabilité

Exercice 2.
Un client du rayon des costumes d’un magasin achètera un costume avec
une probabilité de 0.22, une chemise avec une probabilité de 0.30 et une
cravate avec une probabilité de 0.28. Le client achètera un costume et une
chemise avec une probabilité de 0.11, un costume et une cravate avec une
probabilité de 0.14 et une chemise et une cravate avec une probabilité de
0.10. Un client achètera les trois vêtements avec une probabilité de 0.06.
Quelle la probabilité qu’un client
a) achète au moins un de ces trois vêtements ? Rep : 0.51
b) achète exactement deux de ces trois vêtements ? Rep : 0.17
c) achète exactement un de ces trois vêtements ? Rep : 0.28
d) achète un costume ou une cravate, mais n’achète pas une chemise ?
Rep : 0.21

76/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Propriétés d’une probabilité

Réponse de l’exercice 2.
Définissons d’abord les événements suivants :

A = Le client achète un costume ;


B = Le client achète une chemise ;
C = Le client achète une cravate.

Nous avons :

P(A) = 0.22, P(B) = 0.30, P(C) = 0.28,

P(A ∩ B) = 0.11, P(A ∩ C) = 0.14, P(B ∩ C) = 0.10,


P(A ∩ B ∩ C) = 0.06.
Ces événements sont décrits par le diagramme de Venn suivant :
77/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Propriétés d’une probabilité

78/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Propriétés d’une probabilité

Réponse de l’exercice 2.
a) L’événement achète au moins un de ces trois vêtements est donné par :

P(A ∪ B ∪ C) = P(A) + P(B) + P(C)


− P(A ∩ B) − P(A ∩ C) − P(B ∩ C)
+ P(A ∩ B ∩ C)
= 0.51.

79/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Propriétés d’une probabilité

Réponse de l’exercice 2.
b) L’événement achète exactement deux de ces trois vêtements est donné
par :

P(A ∩ B ∩ C) + P(A ∩ B ∩ C) + P(A ∩ B ∩ C) = 0.17.

Car :

P(A ∩ B ∩ C) = P(A ∩ B) − P(A ∩ B ∩ C) = 0.05;


P(A ∩ B ∩ C) = P(A ∩ C) − P(A ∩ B ∩ C) = 0.08;
P(A ∩ B ∩ C) = P(A ∩ C) − P(A ∩ B ∩ C) = 0.04.

80/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Propriétés d’une probabilité

Réponse de l’exercice 2.
c) L’événement achète exactement un de ces trois vêtements est donné
par :

P(A ∩ B ∩ C) + P(A ∩ B ∩ C) + P(A ∩ B ∩ C) = 0.28.

Car :

P(A ∩ B ∩ C) = P(A) − P(A ∩ B) − P(A ∩ C) + P(A ∩ B ∩ C)


= 0.03;
P(A ∩ B ∩ C) = P(B) − P(A ∩ B) − P(B ∩ C) + P(A ∩ B ∩ C)
= 0.15;
P(A ∩ B ∩ C) = P(C) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C)
= 0.10.
81/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité

Propriétés d’une probabilité

Réponse de l’exercice 2.
d) L’événement achète achète un costume ou une cravate, mais n’achète
pas une chemise est donné par :

n o
P (A ∪ C) ∩ B = P (A ∪ C ∪ B) − P (B) = 0.21.

82/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités Combinaison
Probabilités conditionnelles et indépendance Permutation
Formules de Bayes

Analyse Combinatoire appliquée aux calculs de probabilités

Mhamed Mesfioui, Ph. D.

mhamed.mesfioui@uqtr.ca

Automne 2021

83/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités Combinaison
Probabilités conditionnelles et indépendance Permutation
Formules de Bayes

Combinaison

Combinaison
Une combinaison consiste en un arrangement d’objets distincts et ne
diffère d’une autre que si son contenu n’est pas le même. L’ordre n’a ici
aucune importance.

Exemple : Combien d’équipes de 2 joueurs peut-on former à partir de 4


joueurs A,B,C et D ? Il y a 6 équipes possibles :

{A, B}, {A, C}, {A, D}, {B, C}, {B, D}, {C, D}.

Ce nombre se note et se calcule de la manière suivante :


 
4
= Nombre d’équipes possibles = 6.
2

84/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités Combinaison
Probabilités conditionnelles et indépendance Permutation
Formules de Bayes

Combinaison

Formule générale

Le nombre de groupes de r objets distincts qu’il est possible de


composer sans répétition à partir d’un total de n objets est
 
n n!
= .
r r !(n − r )!

Par exemple, le nombre d’équipes à 3 joueurs qu’on peut construire à


partir de 8 joueurs sera :

 
8 8!
= = 56.
3 3! × 5!

85/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités Combinaison
Probabilités conditionnelles et indépendance Permutation
Formules de Bayes

Combinaison

Applications aux calculs de probabilités


Exercice 1. Un comité de 5 personnes doit être choisi parmi les 6
hommes et 9 femmes d’un groupe. Si le choix est le résultat du hasard,
quelle est la probabilité que le comité soit composé de 3 hommes et 2
femmes ?
Réponse.
   
6 9
×
3 2 240
  = = 0.2398.
15 1001
5

86/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités Combinaison
Probabilités conditionnelles et indépendance Permutation
Formules de Bayes

Combinaison
Exercice 2. Pour le jeu Lotto 6/49. Calculez la probabilité des événements
suivants :
1. A : avoir exactement 3 bons numéros sur 6.
2. B : avoir exactement 4 bons numéros sur 6.
3. C : avoir exactement 5 bons numéros sur 6.
4. D : avoir les 6 numéros.
5. E : avoir au moins 3 bons numéros sur 6 (appelé prix en argent à Lotto
6/49).
Réponse.
1. La probabilité de l’événement A est :
! !
6 43
×
3 3 20 × 12341
P(A) = ! = = 0.0176504.
49 13983816
6
87/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités Combinaison
Probabilités conditionnelles et indépendance Permutation
Formules de Bayes

Combinaison

2. La probabilité de l’événement B est :


! !
6 43
×
4 2 15 × 903
P(B) = ! = = 0.0009686197.
49 13983816
6

3. La probabilité de l’événement C est :


! !
6 43
×
5 1 15 × 903
P(C) = ! = = 0.0000184499.
49 13983816
6

88/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités Combinaison
Probabilités conditionnelles et indépendance Permutation
Formules de Bayes

Combinaison

4. La probabilité de l’événement D est :


! !
6 43
×
6 0 1
P(D) = ! = = 0.00000007151124.
49 13983816
6

5. La probabilité de l’événement E est :

P(D) = P(A ∪ B ∪ C ∪ D)
= P(A) + P(B) + P(C) + P(D)
= 0.01863754.

89/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités Combinaison
Probabilités conditionnelles et indépendance Permutation
Formules de Bayes

Combinaison

Exercice théorique
1. Montrez que pour tout 0 ≤ k ≤ n, on a
! !
n n
= .
k n−k

2. Montrez que pour tout 0 ≤ k ≤ n, on a


! ! !
n n−1 n−1
= + .
k k k −1

90/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités Combinaison
Probabilités conditionnelles et indépendance Permutation
Formules de Bayes

Permutation

Une permutation consiste en un arrangement ordonné d’objets distincts.


Deux permutations diffèrent l’une de l’autre si
1. leurs contenu n’est pas le même
ou bien
2. si leurs éléments sont ordonnés différemment

Exemple : Considérons quatre jetons qui se distinguant chacun par une


lettre différente, a, b, c et d. Voici toutes les permutations des ces jetons pris
deux à la fois :

ab, ac, ad, bc, bd, cd,


ba, ca, da, cb, db, dc.

91/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités Combinaison
Probabilités conditionnelles et indépendance Permutation
Formules de Bayes

Permutation

Les permutations ab et ba diffèrent l’une de l’autre parce que leurs


éléments ne sont pas dans le même ordre.
Les permutation ab et ac diffèrent l’une de l’autre parce que leurs
contenu n’est pas le même.

92/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités Combinaison
Probabilités conditionnelles et indépendance Permutation
Formules de Bayes

Permutation

Formule calculant le nombre de permutations


Supposons qu’on dispose de n objets distincts à partir desquels on veut
obtenir des permutations de r objets (r ≤ n).
Le nombre de permutations possibles correspond sera :

Prn = n(n − 1)(n − 2)(n − 3) · · · (n − r + 1)


n!
= !.
(n − r )
Relation entre combinaison et permutation
!
n n
Pk = k !.
k

93/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités Combinaison
Probabilités conditionnelles et indépendance Permutation
Formules de Bayes

Permutation

Exercice 1 : Combien de nombres formés par 3 chiffres différents peut-on


écrire à partir des chiffres 1, 2, 4, 8 et 9. Rep : P35 = 60.
Exercice 2 : Combien de mots formés par des lettres différentes peut-on
écrire à partir des lettres a, b, c et d. Rep : P14 + P24 + P34 + P44 = 64.
Exercice 3 : On veut disposer 10 livres sur un rayon de sa bibliothèque.
Quatre d’entre eux sont des livres de mathématique, trois de chimie, deux
d’histoire et un de langue. On veut ranger ces livres de sorte que tous les
livres traitant du même sujet restent groupés. Combien y a-t-il de dispositions
possibles. Rep : 4! × 4! × 3! × 2! × 1! = 6912.

94/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités Combinaison
Probabilités conditionnelles et indépendance Permutation
Formules de Bayes

Permutation

Exercice 4 : Problème d’anniversaire. Il y a n personnes dans une pièce.


On veut déterminer la probabilité que deux ou plusieurs personnes d’entre
elles aient le même mois et le même jour de naissance. Supposons ici qu’il y
a 365 jours dans une année et que l’anniversaire de chaque personne peut
aussi bien tomber sur un jour que sur l’autre. Soit l’événement B défini par
B : deux ou plusieurs personnes ont le même mois et le même jour de
naissance.

a) Déterminer P(B) en fonction de n.


b) Faire un tableau qui donne P(B) en fonction de n = 10, 20, 30, 40, 50.
Conclure ?

95/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités Combinaison
Probabilités conditionnelles et indépendance Permutation
Formules de Bayes

Analyse Combinatoire appliquée aux calculs de probabilités

Solution de l’exercice 4.
a) Il est plus commode de calculer P(B̄). En effet :

Pn365
P(B̄) = .
365n
Par conséquent :

Pn365
P(B) = 1 − P(B̄) = 1 − .
365n
b)
n 10 20 30 40 50
P(B) 0.1169 0.4114 0.7063 0.8912 0.9704

96/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Probabilités conditionnelles et indépendance

Mhamed Mesfioui, Ph. D.

mhamed.mesfioui@uqtr.ca

Automne 2021

97/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Probabilités conditionnelles

Définition
Soient A et B deux événements de S. On appelle probabilité
conditionnelle de B étant donné A, la probabilité de réalisation de B
sachant que l’événement A s’est réalisé. On la note par P (B|A). Sa
valeur est donnée par :
P (A ∩ B)
P (B|A) = , P (A) > 0.
P (A)
De même,

P (A ∩ B)
P (A|B) = , P (B) > 0.
P (B)

98/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Probabilités conditionnelles

Remarques.
1. P(B) peut être vue comme une probabilité conditionnelle par rapport à tout
l’espace échantillonnal S :
P(B) = P(B|S).
2. P(B) et P(B|A) sont en général deux probabilités différentes.

Exemple. On lance une pièce de monnaie trois fois et on s’intéresse aux


événements suivants :
A = " Obtenir au moins deux piles (P) ",
B = " Obtenir pile (P) dans le premier essai ",
C = " Obtenir face (F ) dans le premier essai ".

Calculez P(A), P(A|B) et P(A|C).

99/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Probabilités conditionnelles

Réponse.
A = {PPP, PPF , PFP, FPP};
B = {PPP, PPF , PFP, PFF };
C = {FPP, FPF , FFP, FFF };
A ∩ B = {PPP, PPF , PFP};
A ∩ C = {FPP};

P(A) = 4/8 = 1/2;

P(A ∩ B) 3/8 3
P(A|B) = = = ;
P(B) 4/8 4

P(A ∩ C) 1/8 1
P(A|C) = = = .
P(C) 4/8 4

100/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Probabilités conditionnelles

Conclusion. P(A|C) < P(A) < P(A|B). Donc, une probabilité inconditionnelle
d’un événement donné peut être plus petite comme elle peut être plus
grande que sa probabilité conditionnelle.

Remarque. P(Ā|B) est aussi une probabilité, donc elle satisfait à toutes les
propriétés d’une probabilité. En particulier,

P(Ā|B) = 1 − P(A|B).

101/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Règle de multiplication

Règle de multiplication
Cas de deux événements :
Pour évaluer la probabilité de l’intersection de deux événements A et B,
on utilise la loi suivante :

P(A ∩ B) = P(A)P(B|A),

ou encore,
P(A ∩ B) = P(B)P(A|B).
Notons que cette règle est une conséquence de la définition de P(B|A).
En effet, il est clair que
P(A ∩ B)
P(B|A) = ⇒ P(A ∩ B) = P(A)P(B|A).
P(A)

102/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Règle de multiplication

Cette règle peut-être représentée graphiquement comme suit :

B
A∩B P(A)P(B|A)

A
A∩B
B

B
A∩B
A

A∩B
B

103/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Règle de multiplication
Cas de trois événements :
Soient A, B et C sont trois événements :
P(A ∩ B ∩ C) = P(A)P(B|A)P(C|A ∩ B)

C A∩B∩C P(A)P(B|A)P(C|A ∩ B)

A C ...

B ...

A ...

En général, cette règle s’écrit :


P(A1 ∩ A2 ∩ · · · ∩ An ) = P(A1 )P(A2 |A1 ) · · · P(An |A1 ∩ · · · ∩ An−1 ).
104/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Règle de multiplication

Exercice 1. On tire sans remise deux boules d’une urne contenant trois
boules blanches et cinq boules noires. Calculez la probabilité que les deux
boules aient la même couleur.
Réponse.

Bi = "la i e boule tirée est blanche", i = 1, 2;


Ni = "la i e boule tirée est noire", i = 1, 2.

Par conséquent,

P([B1 ∩ B2 ] ∪ [N1 ∩ N2 ]) = P(B1 ∩ B2 ) + P(N1 ∩ N2 )


= P(B1 )P(B2 |B1 ) + P(N1 )P(N2 |N1 )
3 2 5 4 26 13
= · + · = = .
8 7 8 7 56 28

105/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Règle de multiplication

Exercice 2.
On considère un échantillon de taille 3 tiré de la manière suivante :
On dispose au départ d’une urne contenant 5 boules blanches et 7 rouges. à
chaque tirage, une boule est tirée et sa couleur enregistrée. La boule est
alors réintroduite dans l’urne ainsi qu’une nouvelle boule de même couleur.
Trouver la probabilité que l’échantillon comprenne précisément une boule
blanche.
Réponse.

Bi = "la i e boule tirée soit blanche", i = 1, 2, 3;


Ri = "la i e boule tirée soit rouge", i = 1, 2, 3.

La probabilité que l’échantillon comprenne précisément une boule blanche


est exprimée par :

106/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Règle de multiplication

 
P (B1 ∩ R2 ∩ R3 ) ∪ (R1 ∩ B2 ∩ R3 ) ∪ (R1 ∩ R2 ∩ B3 )
840
= P(B1 ∩ R2 ∩ R3 ) + P(R1 ∩ B2 ∩ R3 ) + P(R1 ∩ R2 ∩ B3 ) =
2184
car :
P(B1 ∩ R2 ∩ R3 ) = P(B1 ) × P(R2 |B1 ) × P(R3 |B1 ∩ R2 )
5 7 8 280
= × × = ,
12 13 14 2184

P(R1 ∩ B2 ∩ R3 ) = P(R1 ) × P(B2 |R1 ) × P(R3 |R1 ∩ B2 )


7 5 8 280
= × × = ,
12 13 14 2184

P(R1 ∩ R2 ∩ B3 ) = P(R1 ) × P(R2 |R1 ) × P(B3 |R1 ∩ R2 )


7 8 5 280
= × × = .
12 13 14 2184
107/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Indépendance d’événements

Définition. Deux événements A et B sont dits indépendants si la


réalisation de l’un n’est pas influencée par la réalisation de l’autre.
L’indépendance de A et B est ainsi définie par :

P(A|B) = P(A),

ou
P(B|A) = P(B).
Ceci est équivalent à :

P(A ∩ B) = P(A)P(B).

108/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Indépendance d’événements

Cas de trois événements :


A, B et C sont dits mutuellement indépendants si
1 P(A ∩ B) = P(A)P(B),
2 P(A ∩ C) = P(A)P(C),
3 P(B ∩ C) = P(B)P(C),
4 P(A ∩ B ∩ C) = P(A)P(B)P(C).

Propriétés. Si A et B sont deux événements indépendants alors,


1 A et B sont indépendants,
2 A et B sont indépendants,
3 A et B sont indépendants.
Preuves à faire en exercice.

109/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Indépendance d’événements

Exercice 1. Soient A, B et C trois événements indépendants tels que


P(A) = 0.2, P(B) = 0.3 et P(C) = p.
a) Calculer P(A ∪ B).
b) Sachant que P(A ∪ C) = 0.9, déterminer p.

110/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Indépendance d’événements

Réponse de l’exercice 1.
a) Calculons P(A ∪ B).

P(A ∪ B) = 1 − P(A ∪ B)
= 1 − P(Ā ∩ B̄) : Loi de De Morgan
= 1 − P(Ā) × P(B̄) : Ā et B̄ sont indépendants
= 1 − 0.8 × 0.7 = 0.44.

111/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Indépendance d’événements

b) Déterminons la valeur de p. Pour ce faire, simplifions d’abord P(A ∪ C̄)


comme suit :
 
P(A ∪ C̄) = 1 − P A ∪ C̄
= 1 − P(Ā ∩ C)
= 1 − P(Ā) × P(C)
= 1 − 0.8p.

Donc :
1
P(A ∪ C̄) = 0.9 ⇐⇒ 1 − 0.8p = 0.9 ⇐⇒ p = .
8

112/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Indépendance d’événements

Exercice 2.
Dans les schémas suivants la probabilité de fermeture de chaque relais des
circuits est p = 0.90. Si tous les relais fonctionnent indépendamment,
déterminer la probabilité qu’un courant circule entre A et B.
a) b)
1 2 1 2

A B
3 4
3 4
A B
Rép : 0.9639
5 6

7 8

Rép : 0.9987

113/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Indépendance d’événements

Réponse de la situation a).


Définissons d’abord les événements suivants :

Fi : le relais i soit fermé, i = 1, 2, 3, 4.


Puisque les relais fonctionnent indépendamment les uns des autres, donc les
événements F1 , F2 , F3 et F4 sont indépendants. On cherche à calculer la
probabilité de l’événement :

H : le courant passe entre les points A et B.

114/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Indépendance d’événements

En utilisant la loi de de Morgan, on voit que :

P(H) = P [(F1 ∩ F2 ) ∪ (F3 ∩ F4 )]


h i
= 1 − P (F1 ∩ F2 ) ∪ (F3 ∩ F4 )
h i
= 1 − P (F1 ∩ F2 ) ∩ (F3 ∩ F4 )
h i h i
= 1 − P (F1 ∩ F2 ) × P (F3 ∩ F4 ) car les Fi sont IND
= 1 − [1 − P (F1 ∩ F2 )] [1 − P (F3 ∩ F4 )]
= 1 − [1 − P (F1 ) × P (F2 )] [1 − P (F3 ) × P (F4 )] car les Fi sont IND
= 1 − [1 − p × p] [1 − p × p]
= 1 − (1 − p2 )2 = 0.9639

115/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Indépendance d’événements

Réponse de la situation b).


On cherche à calculer la probabilité de l’événement :

K : le courant passe entre les points A et B.

On voit que K est équivalent à :

(F1 ∩ F2 ) ∪ (F3 ∩ F4 ) ∪ (F5 ∩ F6 ) ∪ (F7 ∩ F8 ).

Un raisonnement semblable au précédent permet de conclure que :

P(K ) = 1 − (1 − p2 )4 = 0.9987.

116/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Probabilité totale

Partition de l’espace S
On dit que les événements A1 , A2 , . . . , Ak forment une partition de S si
1. A1 , A2 , . . . , Ak sont mutuellement exclusifs, c’est-à-dire,

Ai ∩ Aj = ∅ pour tout i 6= j.

2. A1 , A2 , . . . , Ak couvrent l’espace S, c’est-à-dire,

A1 ∪ A2 ∪ · · · ∪ Ak = S.

117/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Probabilité totale

Illustration :

A1
A5
A6
 S

A2 A4
A3

Ici, A1 , A2 , A3 , A4 , A5 et A6 forment une partition de S.

Remarque : Les événements A et A forment une partition de S, car

A ∩ A = ∅,

A ∪ A = S.
118/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Probabilité totale

Règle. Soient A1 , A2 , . . . , Ak des événements formant une partition de


S, alors pour tout C ⊂ S, on a :

P(C) = P(C|A1 )P(A1 ) + P(C|A2 )P(A2 ) + · · · + P(C|Ak )P(Ak )

 S

C
119/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Probabilité totale

Exercice 1. On prend un premier chiffre au hasard parmi 0, 1, . . . , 9. Ensuite


on prend un second chiffre au hasard parmi les chiffres qui restent. Calculer
la probabilité que le second chiffre soit pair.

Réponse.
Ai = "le i e chiffre est pair", i = 1, 2,
Bi = "le i e chiffre est impair", i = 1, 2.
On cherche P(A2 ). Puisque A1 et B1 forment une partition de S, alors

P(A2 ) = P(A2 |A1 )P(A1 ) + P(A2 |B1 )P(B1 )


4 5 5 5 1
= × + × = .
9 10 9 10 2

120/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Probabilité totale

Exercice 2. On dispose de deux urnes X et Y . X contient 2 boules blanches


et 3 noires. Y contient 3 boules blanches et 2 noires. On échange au hasard
une boule de chaque urne, puis on extrait une de X . Quelle est la probabilité
qu’elle soit blanche ?
Réponse. Soient les événements suivants :

BX = La boule tirée de l’urne X soit blanche,


BY = La boule tirée de l’urne Y soit blanche,
NX = La boule tirée de l’urne X soit noire,
NY = La boule tirée de l’urne Y soit noire.

Considérons la partition :

A1 = BX ∩ BY , A2 = BX ∩ NY ,
A3 = NX ∩ BY , A4 = NX ∩ NY .
121/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

Probabilité totale

Finalement posons,

B = La boule tirée de l’urne X , après ce


double transfert, soit blanche.

On veut calculer P(B), d’après la loi totale :


4
X
P(B) = P(B|Ai )P(Ai ).
i=1

Remarquons que :
2 1 3 2
P(B|A1 ) = , P(B|A2 ) = , P(B|A3 ) = , P(B|A4 ) = .
5 5 5 5

122/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale

De même, nous avons :


2 3
P(A1 ) = P(BX )P(BY ) = × ,
5 5
2 2
P(A2 ) = P(BX )P(NY ) = × ,
5 5
3 3
P(A3 ) = P(NX )P(BY ) = × ,
5 5
3 2
P(A4 ) = P(NX )P(NY ) = × .
5 5
Par conséquent :
4
X 55 11
P(B) = P(B|Ai )P(Ai ) = = = 0.44.
125 25
i=1

123/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes

Formules de Bayes

Mhamed Mesfioui, Ph. D.

mhamed.mesfioui@uqtr.ca

Automne 2021

124/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes

Formules de Bayes

La formule de Bayes permet de calculer des probabilités à posteriori. Une


probabilité a posteriori est une probabilité conditionnelle étant donné une
information obtenue à partir de l’observation d’un évènement.
Les hypothèses de la loi de Bayes sont :

1. On dispose d’une partition A1 , A2 , . . . , Ak de S telle que les probabilités a


priori P(A1 ), P(A2 ), . . . , P(Ak ) sont connues.

2. On observe un évènement B pour lequel les probabilités conditionnelles


P(B|A1 ), P(B|A2 ), . . . , P(B|Ak ) sont connues.

125/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes

Formules de Bayes

On s’intéresse alors à évaluer les probabilités a posteriori


P(A1 |B), P(A2 |B), . . . , P(Ak |B) après la nouvelle information donnée par B.

Règle :

P(B|Ai )P(Ai )
P(Ai |B) = , i = 1, . . . , n.
P(B)
ou encore :
P(B|Ai )P(Ai )
P(Ai |B) = Pn , i = 1, . . . , n.
j=1 P(B|Aj )P(Aj )

126/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes

Formules de Bayes

Exercice 1. Dans une population occidentale, environ 5 hommes sur 100 et


25 femmes sur 10 000 sont daltoniens. Une personne est prise au hasard
dans une telle population où il y a autant d’hommes que de femmes. étant
donné que cette personne est daltonienne, quelle est la probabilité que ce
soit un homme ?

127/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes

Formules de Bayes

Réponse. Considérons les événements suivants :

H = "la personne choisie est un homme";


F = "la personne choisie est une femme";
D = "la personne choisie est daltonienne".

On sait que,
1
P(H) = P(F ) = = 0.5;
2
5
P(D|H) = = 0.05;
100
25
P(D|F ) = = 0.0025.
10000

128/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes

Formules de Bayes

Exercice 1 (suite).
On veut évaluer la probabilité a posteriori P(H|D).

P(D|H)P(H)
P(H|D) =
P(D)
P(D|H)P(H)
=
P(D|H)P(H) + P(D|F )P(F )
0, 05 × 0, 5
=
0, 05 × 0, 5 + 0, 0025 × 0, 5
0, 05
= = 0, 95.
0, 0525
Nous constatons que la probabilité a posteriori est largement plus grande
que la probabilité a priori.

129/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes

Formules de Bayes

Exercice 2. Soit une urne contenant trois boules blanches et cinq boules
noires. On tire deux boules au hasard et sans remise. Sachant que la
deuxième est noire, quelle est la probabilité que la première soit blanche ?

130/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes

Formules de Bayes

Réponse.

Bi = "la i e boule tirée est blanche", i = 1, 2,


Ni = "la i e boule tirée est noire", i = 1, 2.

P(N2 |B1 )P(B1 )


P(B1 |N2 ) =
P(N2 |B1 )P(B1 ) + P(N2 |N1 )P(N1 )
5
7
· 83
= 5 3
7
· 8
+ 74 · 5
8

15 15 3
= = = .
15 + 20 35 7

131/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes

Formules de Bayes

Exercice 3. Une boite contient trois pièces. La première est normale, la


seconde porte deux fois pile et la troisième est biaisée de telle manière que
pile sorte trois fois sur 4. Une pièce est tirée au hasard puis lancée. Sachant
qu’on a obtenu pile, quelle est la probabilité qu’il s’agisse de la pièce à deux
faces identiques ?

Réponse : Posons :

A1 = La pièce tirée soit normale.


A2 = La pièce tirée porte deux fois pile.
A3 = La pièce tirée soit biaisée.
A = Obtenir pile.

On cherche à évaluer la probabilité a posteriori P(A2 |A).

132/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes

Formules de Bayes

D’après la loi de Bayes, on a :


P(A|A2 )P(A2 )
P(A2 |A) =
P(A)
P(A|A2 )P(A2 )
=
P(A|A1 )P(A1 ) + P(A|A2 )P(A2 ) + P(A|A3 )P(A3 )
1
1× 3 4
= 1 1 1 3 1
= .
2
× 3
+1× 3
+ 4
× 3
9

133/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes

Formules de Bayes

Exercice 4. On suppose qu’un test de dépistage de cancer est caractérisé


par une fiabilité de 95% aussi bien pour ceux qui sont malades que ceux qui
n’ont pas cette maladie. Dans la population, 0.4% des gens ont le cancer.
Quelle est la probabilité qu’une personne ait le cancer, sachant que son test
l’indique ?

134/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes

Formules de Bayes

Réponse. Définissons les événements suivants :

C = Avoir le cancer,
D = Le test indique le cancer.

Par hypothèse, on a :

P(C) = 0.004, P(D|C) = P(D|C) = 0.95.

Par conséquent, d’après la loi de Bayes, on a :


P(D|C)P(C)
P(C|D) =
P(D|C)P(C) + P(D|C)P(C)
0.95 × 0.004
= = 0.07090.
0.95 × 0.004 + 0.05 × 0.996

135/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes

Formules de Bayes

Exercice 5. Un entrepôt est muni d’un dispositif d’alarme. Lorsqu’il y a


tentative de cambriolage, le dispositif se déclenche avec une probabilité
égale à 99%. Lorsqu’il n’y a pas tentative de cambriolage, le dispositif se
déclenche tout de même par erreur au cours d’une journée avec une
probabilité égale à 1%. En supposant qu’une tentative de cambriolage au
cours d’une journée ait lieu avec une probabilité égale à 0.1%. Sachant que
le dispositif d’alarme s’est déclenché, quelle est la probabilité qu’il le soit par
une tentative de cambriolage ?

136/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes

Formules de Bayes
Réponse. Soient les événements :

T = "Tentative de cambriolage",
D = "Dispositif se déclenche".

On sait que,

P(T ) = 0.001, P(D|T ) = 0.99, P(D|T̄ ) = 0.01.

D’après la loi de Bayes, on a


P(D|T )P(T )
P(T |D) =
P(D)
P(D|T )P(T )
=
P(D|T )P(T ) + P(D|T̄ )P(T̄ )
0.99 × 0.001
= = 0.090.
0.99 × 0.001 + 0.01 × 0.999
137/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires discrètes et continues

Mhamed Mesfioui, Ph. D.

mhamed.mesfioui@uqtr.ca

Automne 2021

138/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Introduction

Introduction
Après avoir réalisé une expérience, il arrive bien souvent qu’on
s’intéresse plus à une fonction du résultat qu’au résultat lui-même.

Exemple. Lorsqu’on lance une pièce trois fois, il peut être intéressant de
connaître le nombre de fois où pile est apparue plutôt que la séquence
détaillée des piles et des faces. La variable "nombre de piles apparues"
notée X , est appelée variable aléatoire. Elle est définie de l’espace
échantillonnal S vers R par :

139/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Introduction

S −→ R

FFF 7−→ 0
FFP 7−→ 1
FPF 7−→ 1
X :
PFF 7−→ 1
FPP 7−→ 2
PFP 7−→ 2
PPF 7−→ 2
PPP 7−→ 3

Dans cet exemple, les valeurs possibles de la variable X sont 0, 1, 2, 3.

140/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Introduction

Nous distinguons deux types de variables aléatoires : les variables


aléatoires discrètes et les variables aléatoires continues. Nous
commencerons par examiner les variables aléatoires discrètes.

141/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires discrètes

Variables aléatoire discrète


Une variable aléatoire X est dite discrète si l’ensemble des valeurs
possibles de X est un ensemble dénombrable, c’est-à-dire de la forme :

{x1 , x2 , . . . , xn }.

Notons que la variable aléatoire de l’exemple précédent est discrète car


l’ensemble de ces valeurs possibles est {0, 1, 2, 3} qui est dénombrable.

142/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires discrètes

Fonction de masse
Soit X une variable aléatoire discrète dont les valeurs possibles sont :
x1 , x2 , . . . , xi , . . . . On appelle fonction de masse associée à la variable X ,
la fonction P(x) définie par :

p(x1 ) = P[X = x1 ],
p(x2 ) = P[X = x2 ],
.. ..
. .
p(xi ) = P[X = xi ],
.. ..
. .

Notons que : X
p(xi ) = 1.
i

143/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires discrètes

Dans l’exemple précédent, la fonction de masse est donnée par :


1
p(0) = P[X = 0] = P{FFF } = ,
8
3
p(1) = P[X = 1] = P{FFP, FPF , PFF } = ,
8
3
p(2) = P[X = 2] = P{FPP, PFP, PPF } = ,
8
1
p(3) = P[X = 3] = P{PPP} = .
8
Densité d’une variable aléatoire discrète
La densité d’une variable aléatoire discrète est représentée par le
tableau suivant :
x x1 x2 ...
p(x) p(x1 ) p(x2 ) ...
144/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires discrètes

La densité de l’exemple précédent est :


x 0 1 2 3
p(x) 1/8 3/8 3/8 1/8
La représentation graphique de la fonction de masse précédente est :
P(x)
1 6

1
2

1
4
1
8
- xi
0 1 2 3
145/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires discrètes

Espérance d’une variable aléatoire discrète


L’espérance d’une variable aléatoire X est une moyenne pondérée des
valeurs possibles de X , les poids étant les probabilités que ces valeurs
soient prises.
On calcule l’espérance µ de X à partir de sa densité :
x x1 x2 ...
p(x) p(x1 ) p(x2 ) ...
de la manière suivante :

µ = E(X ) = x1 p(x1 ) + x2 p(x2 ) + x3 p(x3 ) + · · ·

c’est-à-dire : X
µ = E(X ) = xi p(xi ).
i

146/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires discrètes

Puisque la densité de notre exemple est de la forme :


x 0 1 2 3
p(x) 1/8 3/8 3/8 1/8
donc,
1 3 3 1
µ = E(X ) = 0× +1× +2× +3×
8 8 8 8
3+6+3 12
= = = 1.5.
8 8
L’espérance peut-être interprétée graphiquement comme l’abcisse du
centre de gravité du système formé par les masses p(0), p(1), p(2) et
p(3).

147/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires discrètes

Graphe représentatif de l’espérance d’une variable aléatoire


discrète
P(x)
1 6

1
2

1
4
1
8
- xi
0 1 62 3

E(X ) = 1, 5

148/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires discrètes

Variance d’une variable aléatoire discrète


Soit une variable aléatoire discrète X de densité :
x x1 x2 ···
p(x) p(x1 ) p(x2 ) · · ·
La variance de X est définie par :

σ 2 = var(X ) = E (X − E(X ))2 = ni=1 (xi − E(X ))2 p(xi ).


  P

Pour l’exemple de la diapo 58, la variance est calculée comme suit :


1 3
σ2 = (0 − 1.5)2 × + (1 − 1.5)2 ×
8 8
3 1
+(2 − 1.5)2 × + (3 − 1.5)2 × = 0.75.
8 8

149/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires discrètes

Formule pratique de la variance


La variance d’une variable aléatoire peut s’écrire sous forme :

σ 2 = var(X ) = E(X 2 ) − [E(X )]2

avec :
n
X
E(X 2 ) = xi2 p(xi ).
i=1

Pour notre exemple :


1 3 3 1 24
E(X 2 ) = 02 × + 12 × + 22 × + 32 × = = 3.
8 8 8 8 8
Par conséquent :

σ 2 = E(X 2 ) − µ2 = 3 − 1.52 = 0.75.


150/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires discrètes

Exercice 1. Le nombre de véhicules retounés à une agence de location peut


être de 0, 1, 2, 3, 4 ou 5 en une journée, avec une probabilité de
1/6, 1/6, 1/3, 1/12, 1/6 ou k /12 respectivement.
a) Déterminez la valeur de k . Rep : k = 1
b) Déterminez l’espérance du nombre de véhicules retournés. Rep :
E(X ) = 2.17
c) Déterminez la variance
pdu nombre de véhicules retournés.Rep :
var(X ) = 2.29 et σ = var(X ) = 1.51.

151/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires discrètes

Réponse.
a) La valeur de k s’obtient en utilisant le fait que :

p(0) + p(1) + p(2) + p(3) + p(4) + p(5) = 1,

ce qui est équivalent à :


1 1 1 1 1 k
+ + + + + = 1 ⇐⇒ k = 1.
6 6 3 12 6 12
b) L’espérance du nombre de véhicules retournés est :
1 1 1 1 1 1
E(X ) = 0 × +1× +2× +3× +4× +5× = 2.17.
6 6 3 12 6 12

152/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires discrètes

Réponse.
c) La variance du nombre de véhicules retournés.

var(X ) = E(X 2 ) − [E(X )]2 = E(X 2 ) − 2.172 ,

avec
1 1 1 1 1 1
E(X 2 ) = 02 × + 12 × + 22 × + 32 × + 42 × + 52 × = 7.
6 6 3 12 6 12
Donc :
var(X ) = 7 − 2.172 = 2.29.

153/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires continues

Définition :
Une variable aléatoire X est dite continue si l’ensemble de toutes ses
valeurs possibles est un intervalle [a, b] de R.

Exemples :
Les variables aléatoires suivantes sont continues :
1 X : durée de vie en heures d’un dispositif électronique
2 Y : température d’une région pendant 24 heures.

Densité :
On associe à chaque variable aléatoire continue X une fonction positive
f (x) appelée densité. Son rôle consiste à évaluer la probabilité que X
soit dans un intervalle [a, b]. Ainsi :
Z b
P(a ≤ X ≤ b) = f (x)dx.
a
154/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires continues

La probabilité P(a ≤ X ≤ b) est représentée graphiquement par la


surface suivante :
f (x) 6

P(a ≤ X ≤ b)








=

- x
6
a b

a≤X ≤b

155/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires continues


Propriétés d’une densité :
Si f (x) est la densité d’une variable aléatoire continue alors
1. f (x) ≥ 0,
R +∞
2. −∞ f (x)dx = 1.

f (x) 6 R∞
−∞
f (x)dx = 1





=

- x
156/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires continues

Remarque : Si X est une variable aléatoire continue, alors

1. P(X = x) = 0 ∀x ∈ R,

2. P(X < x) = P(X ≤ x),

3. P(X > x) = P(X ≥ x),

4. P(a < X < b) = P(a ≤ X ≤ b).

157/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires continues

Espérance d’une variable aléatoire continue


Soit X une variable aléatoire continue de densité f (x). L’espérance
mathématique (ou moyenne) de X est donnée par la formule suivante :
Z +∞
µ = E(X ) = xf (x)dx.
−∞

Variance d’une variable aléatoire continue


La variance d’une v.a X de densité f (x) se calcule par :

σ 2 = var(X ) = E(X 2 ) − [E(X )]2 ,

avec :
Z +∞
E(X 2 ) = x 2 f (x)dx.
−∞

158/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires continues

Fonction de répartition d’une variable aléatoire continue


Soit X une variable aléatoire continue de densité f (x). On appelle
fonction de répartition de X , la fonction F (x) définie par :
Z x
F (x) = P(X ≤ x) = f (t)dt.
−∞

f (x) 6 F (x) = P(X ≤ x)






=

-x
x
159/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires continues

Le rôle de la fonction de répartition est de faciliter le calcul de


probabilités pour des variables aléatoires continues. Ainsi :

P(a ≤ X ≤ b) = F (b) − F (a).

Médiane d’une variable aléatoire continue


On appelle médiane d’une variable aléatoire continue X , la valeur réelle
m telle que :

P(X ≤ m) = P(X ≥ m) = 1/2.

Remarque. La médiane m d’une variable aléatoire X de fonction de


répartition F est déterminée par :

F (m) = 1/2.

160/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Remarque. La densité f (x) et la fonction de répartition F (x) d’une variable


aléatoire continue sont liées par les formules suivantes :
Z x
F (x) = f (t)dt et F 0 (x) = f (x).
−∞

161/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires continues

Exercice 1.
Soit X une variable aléatoire continue de densité

 x + 1/2 si 0 ≤ x ≤ 1,
f (x) =
0 sinon.

1. Vérifiez que f (x) est une densité.


2. Calculez E(X ). Rep : E(X ) = 7/12.
3. Calculez var(X ). Rep : var(X ) = 11/144
4. Calculez la fonction de répartition de X .
5. En déduire P(1/4 ≤ X ≤ 3/4). Rep : 1/2

6. Quelle est la médiane de X ? Rep : m = ( 5 − 1)/2 = 0.618

162/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires continues

Réponse.
1) f (x) est une densité, car d’une part f (x) ≥ 0 pour tout x ∈ R et d’autre
part :
∞ 1 1
x2
Z Z 
x 1 1
f (x)dx = (x + 1/2)dx = + = + = 1.
−∞ 0 2 2 0 2 2

2) L’espérance de X est :
Z ∞ Z 1
E(X ) = xf (x)dx = x(x + 1/2)dx
−∞ 0
1
x3 x2

= +
3 4 0
1 1 7
= + = .
3 4 12
163/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires continues

Réponse.
3) Pour calculer la variance de X , on évalue d’abord E(X 2 ) comme suit :
Z ∞ Z 1
E(X 2 ) = x 2 f (x)dx = x 2 (x + 1/2)dx
−∞ 0
1
x4 x3

= +
4 6 0
1 1 5
= + = .
4 6 12
Donc
 2
5 7 11
var(X ) = E(X 2 ) − [E(X )]2 = − = .
12 12 144

164/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires continues

Réponse.
4) Fonction de répartition de X est définie par F (x) = P(X ≤ x) pour tout
x ∈ R. Elle se calcule comme suit :

 0 si x < 0,




F (x) = x 2 +x
2
si 0 ≤ x ≤ 1,





1 x > 1.

Car si x < 0, on a F (x) = 0, si x > 1, on a F (x) = 1 et si 0 ≤ x ≤ 1, on


a: Z x
x2 x x2 + x
F (x) = (t + 1/2)dt = + = .
0 2 2 2

165/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires continues

Réponse.
5) Calculons P(1/4 ≤ X ≤ 3/4). Notons que

P(1/4 ≤ X ≤ 3/4) = F (3/4) − F (1/4)


3 2 1 2
+ 34 1
 
4 4
+ 4
= −
2 2
1
= .
2

166/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications

Variables aléatoires continues

Réponse.
6) La médiane de X est la valeur m telle que P(X ≤ m) = 1/2, c’est-à-dire
F (m) = 1/2. Ce qui revient à résoudre

m2 + m 1
= ⇐⇒ m2 + m − 1 = 0.
2 2
Cette dernière équation possède deux solutions :
√ √
−1 − 5 −1 + 5
m= < 0 et m = > 0.
2 2
Donc la médiane sera :

−1 + 5
m= = 0.6180
2

167/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Modèles probabilistes discrets

Mhamed Mesfioui, Ph. D.

mhamed.mesfioui@uqtr.ca

Automne 2021

168/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi de Bernoulli

Épreuve de Bernoulli
Une épreuve de Bernoulli est une expérience aléatoire qui présente deux
résultats possibles interprétés comme un échec ou un succès. L’espace
échantillonnal associé à cette expérience sera :

S = {succès, échec}.

Exemples.
1. On lance une pièce, deux résultats sont possibles : pile P ou face F .

P : succès F : échec.

2. On lance un dé et on s’intéresse à la face 1. On définit

{1} : succès {2, 3, 4, 5, 6} : échec.

169/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi de Bernoulli

Variable aléatoire de Bernoulli


On associe à chaque épreuve de Bernoulli une variable aléatoire X
définie par :

1 si on observe un succès,
X =
0 si on observe un échec.

Une telle variable aléatoire est appelée variable aléatoire de Bernoulli.


La probabilité p = P(X = 1) est appelée probabilité de succès. On note
alors X ∼ Ber(p).
La variable aléatoire de Bernoulli associée à l’exemple 2 est :

1 si on observe 1,
X =
0 si on observe 2, 3, 4, 5 ou 6.

Par conséquent X ∼ Ber 16 .




170/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi de Bernoulli

Espérance et variance d’une variable aléatoire de Bernoulli


Notons que la densité d’une variable aléatoire X de Bernoulli est :

x 0 1
p(x) 1−p p

Par suite l’espérance et la variance de X seront données par :

E(X ) = p et var(X ) = p(1 − p).


Preuve à faire en exercice.

171/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Binomiale

Définition de la loi binomiale


On répète n épreuves de Bernouilli indépendantes de même probabilité de
succès p. On s’intéresse à la variable X définie par :

X : Nombre de succès obtenus parmi n essais.

Cette variable aléatoire suit une loi appelée loi binomiale de paramètres n et
p. On note :
X ∼ B(n, p).

172/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Binomiale

Fonction de masse de la loi B(n, p)


La fonction de masse d’une variable aléatoire X de loi binomiale est
définie par :
 
n
P(k ) = P(X = k ) = pk (1 − p)n−k , k = 0, 1, 2, . . . , n
k
avec :
 
n n! Nombre de façons d’obtenir exactement k
= :
k k !(n − k )! succès parmi n.

et
La probabilité d’obtenir exactement k suc-
pk (1 − p)n−k :
cès parmi n essais pour un ordre fixé.

173/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Binomiale

Exercice. Une pièce de monnaie équilibrée est lancée à cinq reprises.


Quelle est la probabilité d’avoir pile au moins trois fois ?
Réponse.

X : Nombre de piles obtenus parmi cinq essais


p = P(succès) = P(pile) = 21 .

D’où, X ∼ B(n = 5, p = 0.5), par conséquent :

P(X ≥ 3) = P(X = 3) + P(X = 4) + P(X = 5)

174/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Binomiale

Il en résulte que :
 
5
P(X ≥ 3) = (0.5)3 (1 − 0.5)5−3
3
 
5
+ (0.5)4 (1 − 0.5)5−4
4
 
5
+ (0.5)5 (1 − 0.5)5−5
5
= 10 × (0.5)5 + 5 × (0.5)5 + (0.5)5
= 0.5

175/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Binomiale

Remarque.
1. Il est clair que B(1, p) = Ber(p).
2. Pour toute v.a X de loi binomiale B(n, p), alors il existe une suite de v.a
X1 , . . . , Xn indépendantes et identiquement distriduées de loi de
Bernoulli de paramètre p telles que

X = X1 + · · · + Xn .

Espérance et variance de la loi binomiale


Soit X une variable aléatoire de loi B(n, p), alors

E(X ) = np et var(X ) = np(1 − p).

176/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Binomiale

Exercice 1. On veut transmettre un message électronique composé des


digits 0 et 1. Les conditions imparfaites de transmission font de sorte qu’il y a
une probabilité égale à 0.1 qu’un 0 soit changé en un 1 et un 1 en 0 lors de la
réception, et ce de manière indépendante pour chaque digit. Pour améliorer
la qualité de la transmission, on propose de transmettre le bloc 00000 au lieu
de 0 et le bloc 11111 au lieu de 1 et de traduire une majorité de 0 dans un
bloc lors de la réception par 0 et une majorité de 1 par 1.
a) Quelle est la probabilité de recevoir une majorité de 1 si 00000 est
transmis ?
b) Est ce que ce procédé a amélioré la qualité de la transmission ?
Justifier ?

177/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Binomiale

Solution de l’exercice 1. Soit X la variable aléatoire définie par

X : nombre de 0 changé en 1 lorsque le bloc 00000 est envoyé.

Il est clair que X suit une loi binomiale B(n = 5, p = 0.10).


a) La probabilité de recevoir une majorité de 1 si 00000 est transmis est
équivalent P(X ≥ 3) qui se calcule comme suit :

P(X = 3) + P(X = 4) + P(X = 5)


! ! !
5 3 2 5 4 5 5
= p (1 − p) + p (1 − p)1 + p (1 − p)0
3 4 5
= 0.00856.

b) Le procédé a effectivement amélioré la qualité de transmission, car il a


réduit l’erreur de transmission de 0.10 à 0.00856.

178/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Binomiale

Exercice 2. On sait que les disquettes produites par une certaine firme sont
défectueuses avec une probabilité de 0.05, indépendamment les unes des
autres. La compagnie vend les disquettes par lot de 10. On choisi un lot par
hasard, quelle est la probabilité qu’il contient
a) Au moins deux disquettes défectueuses.
b) La firme garantie avec remboursement qu’au plus 1 des 10 disquettes
du lot est défectueuse. à l’achat de 5 lots, quelle est la probabilité que 2
lots exactement doivent être retournés ?

179/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Binomiale

Solution de l’exercice 2.
a) Pour calculer qu’un lot pris au hasard contient au moins deux disquettes
défectueuses, on considère la variable aléatoire

X = Nombre de pièce défectueuses parmi 10

On voit que X suit une loi binomiale B(n = 10, p = 0.05). Ainsi la
probabilité qu’un lot pris au hasard contient au moins 2 disquettes
défectueuses est

P(X ≥ 2) = 1 − P(X < 2) = 1 − P(X = 0) − P(X = 1)


! !
10 0 10 10 1
= 1− p (1 − p) − p (1 − p)9 = 0.0861.
0 1

180/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Binomiale

b) On considère la variable aléatoire Y définie par

Y = Nombre de lot à retourner parmi 5

il est clair que Y suit une loi binomiale B(n = 5, p = 0.0861) car p
désigne la probabilité qu’un lot contient au moins deux disquettes
défectueuses que nous avons calculé en a). Finalement,

P[que deux lots exactement doivent être retournés]


= P(Y = 2)
!
5
= (0.0861)2 (1 − 0.0861)3 = 0.0566.
2

181/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Binomiale

Exercice 3. On joue à pile ou face avec une pièce de monnaie équilibrée


selon la règle suivante : si la pièce montre face à la suite d’un jet, on gagne
1$, sinon on perd 1$. On suppose qu’on joue 10 fois. On définie les variables
aléatoires
X : nombre de faces obtenues parmi 10 lancers de la pièce.

Y : Gain net à la fin du jeu.

a) Donnez la loi de X .
b) Établissez une relation entre X et Y .
c) Calculez la probabilité qu’à la fin du jeu :
1. le gain net soit supérieur ou égal à 4$.
2. le gain net soit nul.

182/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Binomiale
Solution de l’exercice 3.
a) La loi de X est une binomiale B(n = 10, p = 0.5)
b) La relation entre X et Y est :
Y = 1$ × X + (−1)$ × (10 − X ) = 2X − 10
c.1) La probabilité qu’à a fin du jeu, le gain net soit supérieur ou égal à 4
égale
P(Y ≥ 4) = P(2X − 10 ≥ 4)
= P(X ≥ 7)
= P(X = 7) + P(X = 8) + P(X = 9) + P(X = 10)
! !
10 7 3 10
= 0.5 × 0.5 + 0.58 × 0.52
7 8
! !
10 9 1 10
+ 0.5 × 0.5 + 0.510 × 0.50 = 0.1719.
9 10
183/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Binomiale

c.2) La probabilité qu’à a fin du jeu, le gain net soit nul égale

P(Y = 0) = P(2X − 10 = 0)
= P(X = 5)
!
10
= 0.55 × 0.55 = 0.2461.
5

184/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi géométrique

Loi géométrique
On considère une série d’épreuves de Bernouilli indépendantes et de même
probabilité de succès p. On s’intéresse à la variable aléatoire X définie par :

X : Nombre d’essais nécessaires pour observer le 1er succès.

Cette variable aléatoire suit une loi géométrique de paramètre p et on


note :
X ∼ G(p).

185/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi géométrique

Fonction de masse d’une loi géométrique


La fonction de masse d’une variable aléatoire X de loi G(p) de
paramètre p est déterminée de la manière suivante :

X =1 ↔ S ↔ p(1) = p

X =2 ↔ ES ↔ p(2) = (1 − p)p

X =3 ↔ EES ↔ p(3) = (1 − p)2 p

.. .. ..
. . .

X =k ↔ E . . . ES ↔ p(k ) = (1 − p)k −1 p.
.. .. ..
. . .

186/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi géométrique

Par conséquent, la fonction de masse de X est :

p(k ) = P(X = k ) = (1 − p)k −1 p, k = 1, 2, 3, 4, . . .

Espérance et variance d’une loi géométrique


Si X ∼ G(p) alors,

E(X ) = 1/p et var(X ) = (1 − p)/p2 .

Preuves à faire en exercice.


Remarque. Les lois binomiale et géométrique ont les mêmes
hypothèses. Pour la loi binomiale, le nombre d’essais, noté n, est fixé à
l’avance mais pour la loi géométrique, le nombre d’essais n’est pas fixé
à l’avance et on s’arrête au premier succès.

187/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi géométrique

Propriété : Soit X une variable aléatoire de loi G(p), alors :

1. P[X > k ] = (1 − p)k ,


2. P(X = n + m|X > m) = P(X = n).

Notons que cette dernière propriété est appelée propriété sans


mémoire.

188/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi géométrique

Exercice 1. Un archer atteint la cible 3 fois sur 5 en moyenne. Cet archer


effectue une série de tirs indépendants. Calculez :
a) la probabilité qu’il atteigne la cible la première fois au cinquième tir ;
b) la probabilité qu’il atteigne la cible la première fois en plus de 4 tirs ;
c) la probabilité qu’il atteigne la cible la première fois au dixième tir étant
donné qu’il ne l’a pas atteinte aux 3 premiers tirs.

189/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi géométrique

Solution de l’exercice 1. La variable aléatoire X : le nombre de tire pour


atteindre la cible suit une loi G(p) avec p = 3/5 = 0.6.
a) La probabilité qu’il atteigne la cible la première fois au cinquième tir est
donnée par

P(X = 5) = (1 − p)4 p = 0.44 × 0.6 = 0.01536.

b) la probabilité qu’il atteigne la cible la première fois en plus de 4 tirs est

P(X > 4) = (1 − p)4 = 0.44 = 0.0256.

190/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi géométrique

c) la probabilité qu’il atteigne la cible la première fois au dixième tir étant


donné qu’il ne la pas atteinte aux 3 premiers tirs sera :

P(X = 10|X > 3) = P(X = 7) : propriété sans mémoire


= (1 − p)6 p = 0.46 × 0.6 = 0.00246.

191/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi géométrique

Exercice 2. Supposons que le coût d’une expérience soit de 1 000$. Si


l’expérience rate, il y a des frais supplémentaires de 300$ pour des
réparations qu’il faut effectuer avant le prochain essai. Si à chaque essai, la
probabilité de succès est 0.2, que les essais sont indépendants et que l’on
continue les expériences jusqu’à ce qu’on obtienne un résultat couronné de
succès, quelle est l’espérance du coût de la procédure complète ?

192/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi géométrique

Solution de l’exercice 2. Considérons la variable aléatoire :

X : nombre d’expériences jusqu’a ce qu’on obtienne un résultat couronné de succès.

Il est clair que X ∼G(p = 0.2). Posons,

Y : coût de la procédure complète.

Les variables aléatoires X et Y sont liées par l’équation :

Y = 1300(X − 1) + 1000 = 1300X − 300.

Donc l’espérance du coût de la procédure complète est :


1300 1300
E(Y ) = 1300E(X ) − 300 = − 300 = − 300 = 6200$.
p 0.2

193/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi de Pascal

Loi binomiale négative appelée aussi loi de Pascal


On exécute une série d’épreuves de Bernouilli indépendantes et de même
probabilité de succès p. On fixe un nombre r et on s’intéresse à la variable
aléatoire X définie par :

X : nombre d’essais minimal nécessaire pour obtenir r succès.

La loi de cette v.a X est appelée loi de Pascal ou loi binomiale


négative de paramètres r et p, et on note :

X ∼ BN(r , p)


r : désigne le nombre de succès fixé à l’avance,
et
p : désigne probabilité de succès.
194/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi de Pascal

Fonction de masse d’une binomiale négative


Notons que les valeurs possibles d’une variable aléatoire X de loi
BN(r , p) sont : r , r + 1, r + 2, . . . .
La fonction de masse de X est :
 
k −1
P(k ) = P(X = k ) = (1 − p)k −r pr k = r , r + 1, r + 2, . . .
r −1
 
k −1 Nombre de façons d’obtenir exactement r −
:
r −1 1 succès parmi k − 1 essais.
et
La probabilité d’obtenir exactement r suc-
(1 − p)k −r pr :
cès parmi k essais pour un ordre fixé.

195/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi de Pascal

Remarques.
1. La loi géométrique est un cas particulier de loi Pascal pour r = 1.

2. Toute variable aléatoire de loi de Pascal BN(r , p) peut-être vue comme


la somme de r variables aléatoires indépendantes et de même loi
géométrique G(p). En effet, définissons les variables aléatoires
suivantes :
Y1 : nombre d’essais nécessaires pour le premier succès,
Y2 : nombre d’essais nécessaires supplémentaires pour le 2e succès,
Y3 : nombre d’essais nécessaires supplémentaires pour le 3e succès,
..
.
Yr : nombre d’essais nécessaires supplémentaires pour le r e succès.

196/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi de Pascal

Il est clair que les variables aléatoires Y1 , . . . , Yr sont indépendantes et


de même loi géométrique G(p), et que la variable aléatoire :

Y = Y1 + Y2 + · · · + Yr

est nécessairement distribuée selon loi de Pascal BN(r , p).


Conclusion. Pour toute variable aléatoire Y de loi de Pascal BN(r , p), il
existe r v.a Y1 , . . . , Yk indépendantes, et de loi géométrique G(p) telles
que :
Y = Y1 + Y2 + · · · + Yr .

197/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi de Pascal

Espérance et variance d’une loi binomiale négative


Si X ∼ BN(r , p) alors,

E(X ) = r /p, et var(X ) = r (1 − p)/p2 .

Preuves à faire en exercice.

198/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi de Pascal

Exercice 1. Deux équipes de sportifs disputent une série de matchs. La


première équipe à enregistrer 4 victoires est déclarée gagnante de la série.
On admet que l’une d’elles est plus forte que l’autre et remporte un match
avec probabilité 0.6, indépendamment de l’issue des autres parties.
a) Trouvez la probabilité que l’équipe la plus forte remporte la série en 6
jeux exactement.
b) Sachant que l’équipe la plus forte a gagné les deux premiers matchs,
quelle est la probabilité qu’elle remporte la série en 7 jeux exactement.

199/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi de Pascal

Solution de l’exercice 1. Soit X le nombre de jeux nécessaires pour que


l’équipe la plus forte reporte la série. On voit que X ∼ BN(r = 4, p = 0.6)
a) La probabilité pour que l’équipe la plus forte remporte la série en 6 jeux
exactement est :
! !
6−1 4 6−4 5
P(X = 6) = p (1 − p) = 0.64 × 0.42 = 0.20736.
4−1 3

b) Soit Y le nombre de jeux additionnels pour que l’équipe la plus forte


reporte la série sachant qu’elle a gagné les deux premiers matchs. Il est
clair que Y ∼ BN(r = 2, p = 0.6). Donc, la probabilité désirée sera :
! !
5−1 2 5−2 4
P(Y = 5) = p (1 − p) = 0.62 × 0.43 = 0.09216.
2−1 1

200/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi de Pascal

Exercice 2. Il se présente un client potentiel à l’heure chez un


concessionnaire automobile où un vendeur a chaque fois une chance sur 10
de conclure une transaction. Cet employé est déterminé à continuer de
travailler jusqu’à ce qu’il ait vendu trois véhicules. Calculez la probabilité :
a) qu’il doive travailler exactement huit heures. Rép : 0.0124,
b) qu’il doive travailler plus que huit heures. Rép : 0.9619.

201/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi de Pascal

Solution de l’exercice 2. Considérons la variable aléatoire :

X = nombre d’heures de travail nécessaires pour vendre 3 véhicules.

Cette variable suit la loi BN(r = 3, p) où p = 0.1 représente la probabilité


pour que le vendeur conclue une transaction durant une heure.
a) La probabilité pour que le vendeur faille travailler exactement huit heures
est :
! !
8−1 3 8−3 7
P(X = 8) = p (1 − p) = 0.13 × 0.95 = 0.0124.
3−1 2

202/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi de Pascal

b) La probabilité qu’il lui faille travailler plus que huit heures :

P(X > 8) = 1 − P(X ≤ 8)


8
X
= 1− P(X = k )
k =3
8
!
X k −1 3
= 1− p (1 − p)k −3
3−1
k =3

203/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi de Pascal

Cette dernière se devient ;


! ! !
2 3 3 3 4 3
P(X > 8) = 1− p − p (1 − p) − p (1 − p)2
2 2 2
! !
5 3 3 6 3
− p (1 − p) − p (1 − p)4
2 2
!
7 3
− p (1 − p)5 = 0.9619.
2

204/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Modèle de Poisson
Modèle de Poisson
Dans plusieurs situations pratiques, on s’intéresse au nombre de réalisations
d’un événement dans un intervalle de temps donné ou dans un espace
donné.

Exemples.
X = le nombre d’appels téléphoniques vers une destination
donnée en une heure.

1 heure
6 6
X = le nombre de pannes d’un réseau informatique enregis-
trées en une année.

1 année
• • •
205/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Modèle de Poisson

X = le nombre de graines ou météorites qui tombent sur une


portion de sol délimitée.
. espace
. . .
..

donné

Le modèle probabiliste approprié pour décrire de tels phénomènes est


appelé modèle de Poisson. Son principe est le suivant :
On fixe un intervalle unitaire de temps [0, 1] et un événement A particulier.
On s’intéresse à la variable aléatoire

X = nombre de réalisations de l’événement A dans [0, 1].

206/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Modèle de Poisson

Cette variable aléatoire suit une loi particulière appelée loi de Poisson de
paramètre λ. On écrit :
X ∼ P(λ)
où λ désigne le nombre moyen de réalisations dans [0, 1]. On le détermine
expérimentalement.
Fonction de masse
Si X ∼ P(λ) alors sa fonction de masse est donnée par

λk e−λ
p(k ) = P(X = k ) = , k = 0, 1, 2, . . . ,
k!
où p(k ) est la probabilité que l’événement se réalise k fois pendant une unité
de temps fixée.

207/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Modèle de Poisson

Remarque : p(k )} est bien une fonction de masse, car :


∞ ∞ ∞
X X λk e−λ X λk
p(k ) = = e−λ = e−λ eλ = e0 = 1.
k! k!
k =0 k =0 k =0

Espérance et variance d’une variable de la loi de Poisson


Si X ∼ P(λ) alors
E(X ) = λ
et
var(X ) = λ.
Preuves à faire en exercice.

208/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Modèle de Poisson

Processus de Poisson
Le processus de Poisson décrit le nombre de réalisations dans un
intervalle de temps quelconque [0, t]. Ainsi, la variable aléatoire définie
par :

Nt : nombre de réalisations d’un événement dans [0, t]

suit une loi de Poisson de paramètre λt :

Nt ∼ P(λt)

où λ est le nombre moyen de réalisations pendant une unité de temps.


La fonction de masse de Nt est donnée par :

(λt)k e−λt
pt (k ) = , k = 0, 1, 2, . . . .
k!

209/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Modèle de Poisson

Exercice 1. En un point A d’une autoroute, le nombre de véhicules qui


passent en une minute dans une direction suit une loi de Poisson de
paramètre λ = 2.
a) Quelle est la probabilité qu’il y ait exactement trois véhicules qui passent
en une minute ?
b) Quelle est la probabilité qu’il y ait exactement trois véhicules qui passent
en cinq minutes ?

210/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Modèle de Poisson

Solution de l’exercice 1. Le nombre X de véhicules qui passent en une


minute dans une direction d’une autoroute est une variable aléatoire qui suit
une loi de Poisson de paramètre λ = 2
a) La probabilité qu’il y ait exactement trois véhicules qui passent en une
minute est :
λk e−λ 23 e−2
P(X = 3) = = = 0.180447.
k! 3!
b) Le nombre Y de véhicules qui passent en 5 minute dans une direction
de cette autoroute est une variable aléatoire qui suit une loi de Poisson
de paramètre λ = 5 × 2 = 10. Donc, la probabilité qu’il y ait exactement
trois véhicules qui passent en cinq minutes est :

λk e−λ 103 e−10


P(Y = 3) = = = 0.00757.
k! 3!

211/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Modèle de Poisson

Exercice 2. Soit X une variable aléatoire qui suit une loi de Poisson de
paramètre λ. Sachant que P(X = 0) = 0.1, calculer : P(X = 1), P(X > 3) et
P(X = 2|X > 1). Rép : 0.2303, 0.2011 et 0.3958.

212/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Modèle de Poisson

Solution de l’exercice 2. Soit X ∼ P(λ) telle que P(X = 0) = 0.1. On


cherche d’abord la valeur de λ telle que P(X = 0) = 0.1. C’est-à-dire :

λ0 e−λ
= 0.1 ce qui implique λ = − ln(0.1) = 2.302585.
0!

a) La probabilité P(X = 1) est

λ1 e−λ
P(X = 1) = = 2.302585 × e−2.302585 = 0.2305.
1!

213/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Modèle de Poisson

b) La probabilité P(X > 3) est

P(X > 3) = 1 − P(X ≤ 3)


= 1 − P(X = 0) − P(X = 1)
−P(X = 2) − P(X = 3)
2.3025852 × e−2.302585
= 1 − 0.1 − 0.2305 −
2!
2.3025853 × e−2.302585

3!
= 0.2011.

214/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Modèle de Poisson

c) La probabilité P(X = 2|X > 1) est

P(X = 2 ∩ X > 1)
P(X = 2|X > 1) =
P(X > 1)
P(X = 2)
=
1 − P(X = 0) − P(X = 1)
0.2650949
= = 0.3959.
1 − 0.1 − 0.2305

215/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Modèle de Poisson

Exercice 3. On admet que le nombre d’accidents survenant sur une


autoroute quotidiennement est une variable aléatoire qui suit une loi de
Poisson de moyenne 0.1.
a) Quelle est la probabilité qu’il survienne exactement 1 accident durant
une semaine ?
b) Quelle est la probabilité qu’il surviennent au moins 3 accidents en quatre
jours ?
c) Sachant qu’au moins un accident a eu lieu en un jour, quelle est la
probabilité qu’il surviennent au moins 3 accidents en un jour ?

216/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Modèle de Poisson

Solution de l’exercice 3. Le nombre d’accidents survenant sur une


autoroute quotidiennement est une variable aléatoire X ∼ P(λ = 0.1).
a) Notons que le nombre d’accidents survenant sur cette autoroute en une
semaine est Y ∼ P(λ = 7 × 0.1 = 0.7). Ainsi, la probabilité qu’il
surviennent exactement 1 accident durant une semaine est :
λ1 e−λ
P(Y = 1) = = 0.7 × e−0.7 = 0.3476.
1!

217/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Modèle de Poisson

b) De même, le nombre d’accidents survenant sur cette autoroute en


quatre jours est Z ∼ P(λ = 4 × 0.1 = 0.4). Donc, la probabilité qu’il
surviennent au moins 3 accidents en quatre jours est :

P(Z ≥ 3) = 1 − P(Z < 3)


= 1 − {P(Z = 0) + P(Z = 1) + P(Z = 2)}
0.42 × e−0.4
 
= 1 − e−0.4 + 0.4 × e−0.4 +
2
= 0.0079.

218/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Modèle de Poisson

c) La probabilité qu’il surviennent au moins 3 accidents en un jour sachant


qu’au moins un accident a eu lieu en un jour est :
P(X ≥ 3 ∩ X ≥ 1)
P(X ≥ 3|X ≥ 1) =
P(X ≥ 1)
P(X ≥ 3)
=
P(X ≥ 1)
1 − P(X < 3)
=
1 − P(X < 1)
1 − P(X = 0) − P(X = 1) − P(X = 2)
=
1 − P(X = 0)
e−0.1
1 − e−0.1 − 0.1 × e−0.1 − 0.12 × 2!
=
1 − e−0.1
= 0.0016.

219/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Hypergéométrique

Loi hypergéométrique
La loi hypergéométrique est la loi d’une variable aléatoire qui gère les tirages
sans remise. Plus précisément, soit une population qui contient a succès et b
échecs. La taille totale de la population est N.

a + b = N.

On prélève m individus sans remise de cette population et on s’intéresse


au nombre de succès parmi ces m individus :

X = nombre de succès parmi les m individus.

La loi de cette variable aléatoire est appelée loi hypergéométrique et on


écrit :
X ∼ h(N, m, a, b).

220/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Hypergéométrique

Fonction de masse d’une loi hypergéométrique


Soit X une variable aléatoire qui suit la loi ∼ h(N, m, a, b). La fonction de
masse de X peut être déterminée de la manière suivante :
nombre de cas favorables
P(k ) = P(X = k ) = .
nombre de cas possibles
Il est clair que le nombre de cas possibles est :
 
N
.
m

Par contre, le nombre de cas favorables est :


  
a b
k m−k

221/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Hypergéométrique

Ceci découle du fait que :

a b
S E

 A
K
 A

k succès m − k échecs
 l   l 
a b
k m−k

222/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Hypergéométrique

Par conséquent, la fonction de masse de X sera :

  
a b
k m−k
P(k ) =   , k = 0, 1, . . . , min(m, a).
N
m

223/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Hypergéométrique

Espérance et variance de la loi hypergéométrique

Si X ∼ h(N, m, a, b) alors,

ma ma(N − a)(N − m)
E(X ) = et var(X ) = .
N N 2 (N − 1)

224/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Hypergéométrique

Exercice 1. Une urne contient 15 boules rouges et 20 noires. On a tiré 10


boules. Calculer la probabilité d’obtenir exactement 4 noires.
a) Si le tirage était avec remise.
b) Si le tirage était sans remise.

225/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Hypergéométrique

Solution de l’exercice 1. Soit X la variable aléatoire définie par :X =nombre


de boules noires parmi 10 tirées d’une urne contenant 15 rouges et 20
noires.
a) Si le tirage était avec remise alors X ∼ B(n = 10, p = 20/35). Dans ce
cas, la probabilité d’obtenir exactement 4 noires est :
!   
4 6
10 20 15
P(X = 4) = = 0.1387.
4 35 35

b) Si le tirage était sans remise alors


X ∼ h(N = 35, m = 10, a = 20, b = 15). Dans ce cas, la probabilité
d’obtenir exactement 4 noires est :
20 15
 
4
P(X = 4) = 35
6 = 0.1321.
10

226/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Hypergéométrique

Exercise 2. Un électricien achète des composants par paquets de 10. Sa


technique de contrôle est de n’examiner que trois des composants, tirés au
hasard dans le paquet, et de n’accepter le lot de 10 que si les trois
composants examinés sont sans défaut. Si chaque paquet contient 4
composants défectueux, quelle proportion des paquets cet électricien
rejettera-t-il ?

227/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique

Loi Hypergéométrique

Solution de l’exercice 2. Soit X la variable aléatoire définie par X =nombre


de pièces défectueuses parmi 3 tirées d’un paquet de 10 contenant 4
défectueuses. Cette variable aléatoire suit la loi
h(N = 10, m = 3, a = 4, b = 6). La proportion des paquets rejetée par cet
électricien sera :
4 6
 
0 3 5
P(X ≥ 1) = 1 − P(X = 0) = 1 − 10 = .
3
6

228/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Modèles probabilistes continus

Mhamed Mesfioui, Ph. D.

mhamed.mesfioui@uqtr.ca

Automne 2021

229/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Uniforme

Loi uniforme
Une variable aléatoire X est dite uniformément distribuée sur un intervalle
[a, b] si sa densité est de la forme :

 1/(b − a) si a ≤ x ≤ b,
f (x) =
0 sinon.

On écrit X ∼ U[a,b] et on lit X suit une loi uniforme sur [a, b].

230/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Uniforme

Graphique de la densité de la loi uniforme U[a,b]

f (x)
6 surface = 1
1 
b−a 
 
 
 


 

  
    - x
a b

231/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Uniforme

Espérance et variance de la loi uniforme


Si X suit une loi uniforme sur [a, b], alors :

a+b (b − a)2
E(X ) = et var(X ) = .
2 12
Fonction de répartition de la loi uniforme
La fonction de répartition d’une variable aléatoire X de loi U[a,b] est
donnée par

 0
 si x ≤ a,



F (x) = (x − a)/(b − a) si a ≤ x ≤ b,




1 si x ≥ b.

232/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Uniforme

Conséquence : Si X ∼ U[a,b] alors :

d −c
P(c ≤ X ≤ d) = ∀ c, d ∈ [a, b].
b−a

f (x)
d−c
6 P(c ≤ X ≤ d) = b−a
1 
b−a



/








 - x
a c d b

233/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Uniforme

Exercice 1. Vous arrivez à un arrêt de bus à 10h sachant que le bus arrivera
à un certain instant qui est distribué selon une loi uniforme entre 10h et
10h30.
a) Quelle est la probabilité que vous deviez attendre plus que 10 minutes ?
b) Si à 10h15 le bus n’est pas encore arrivé, quelle est la probabilité que
vous deviez attendre au moins 10 minutes supplémentaires ?

234/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Uniforme

Solution de l’exercice 1. Considérons la variable aléatoire définie par

X : instant d’arrivée du bus.

Pour simplifier l’exercice, on remplacera l’intervalle de temps [10h,10h30] par


[0, 30]. Il est clair que X ∼ U[0,30] .
a) La probabilité d’attendre plus que 10 minutes est :
30 − 10 20 2
P(10 ≤ X ≤ 30) = = = .
30 − 0 30 3

235/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Uniforme

b) Si à 10h15 le bus n’est pas encore arrivé, la probabilité que vous deviez
attendre au moins 10 minutes supplémentaires est :
P(25 ≤ X ≤ 30, 15 ≤ X ≤ 30)
P(25 ≤ X ≤ 30 15 ≤ X ≤ 30) =
P(15 ≤ X ≤ 30)
P(25 ≤ X ≤ 30)
=
P(15 ≤ X ≤ 30)
30−25
30−0 5 1
= 30−15
= = .
30−0
15 3

Remarquons que cette probabilité peut être calculée en utilisant la v.a


Y ∼ U[15,30] . En effet, la probabilité précédente se calcule directement en
fonction de Y comme suit :
30 − 25 5 1
P(25 ≤ Y ≤ 30) = = = .
30 − 15 15 3
236/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Uniforme

Exercice 2. Les trains à destination de A arrivent à la gare toutes les 15


minutes à partir de 7h du matin, et les trains à destination de B arrivent
toutes les 15 minutes également, mais à partir de 7h 05 du matin. Un certain
passager arrive à la gare à une heure qui suit une loi uniforme entre 7h et 8h
du matin et prend le premier train qui se présente.
a) Avec quelle probabilité se rendra-t-il à la destination A ?
b) Sachant qu’il a raté le troisième train à destination B, avec quelle
probabilité se rendra-t-il à la destination A ?

237/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Uniforme

Solution de l’exercice 2. Soit X l’instant d’arrivée du passager. Pour


simplifier le problème, on peut remplacer l’intervalle de temps [7h,8h] par
[0, 60]. On voit que X ∼ U[0,60] .
a) La probabilité pour que le passager se rende à la destination A est :

P(5 ≤ X ≤ 15) + P(20 ≤ X ≤ 30) + P(35 ≤ X ≤ 45) + P(50 ≤ X ≤ 60).

Cette dernière se calcule comme suit :


15 − 5 30 − 20 45 − 35 60 − 50 40 2
+ + + = = .
60 − 0 60 − 0 60 − 0 60 − 0 60 3

238/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Uniforme

b) La probabilité que le passager se rende à la destination A sachant qu’il a


raté le troisième train à destination B est :

P(35 ≤ X ≤ 45 ou 50 ≤ X ≤ 60 35 ≤ X ≤ 60)

= P(35 ≤ X ≤ 45 35 ≤ X ≤ 60) + P( 50 ≤ X ≤ 60 35 ≤ X ≤ 60)
P(35 ≤ X ≤ 45) P(50 ≤ X ≤ 60)
= +
P(35 ≤ X ≤ 60) P(35 ≤ X ≤ 60)
10 10 20 4
= + = = .
25 25 25 5
Une autre méthode consiste à consider la variable aléatoire Y ∼ U[35,60] .
La probabilité précédente se calcule alors comme suit :
45 − 35 60 − 50 20 4
P(35 ≤ Y ≤ 45) + P(50 ≤ Y ≤ 60) = + = = .
60 − 35 60 − 35 25 5

239/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Exponentielle

Loi exponentielle
En pratique, on s’intéresse souvent aux variables aléatoires qui modélisent le
temps d’attente avant l’arrivée d’un événement spécifique.
Par exemple :
1. X : le temps qui nous sépare du prochain appel téléphonique.
2. Y : le temps entre deux pannes consécutives d’un réseau informatique.
Lorsque les réalisations d’un événement sont gérées par un processus de
Poisson de fréquence λ, le temps X entre deux réalisations consécutives de
cet événement sera distribué selon la loi exponentielle de paramètre λ. On
note X ∼ Exp(λ).

240/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Exponentielle

Densité et fonction de répartition de la loi exponentielle


La densité d’une variable aléatoire de loi exponentielle est donnée par :

 λe−λx

si x ≥ 0,
f (x) =
0 sinon.

Sa fonction de répartition est de la forme :

 1 − e−λx

si x ≥ 0,
F (x) =
0 sinon.

Espérance et variance d’une loi exponentielle


Si X ∼ Exp(λ) alors,
1 1
E(X ) = et var(X ) = .
λ λ2
241/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Exponentielle

Remarques.
1. λ : représente le nombre moyen de réalisations de l’événement sur une
période unitaire de temps.
2. 1/λ : désigne le temps moyen entre deux réalisations de l’événement.

Formule utile : Soit X une variable aléatoire de loi Exp(λ), alors

P(X > t) = e−λt .

242/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Exponentielle

Propriété sans mémoire de la loi exponentielle


La loi exponentielle est la seule distribution continue qui satisfait à la
propriété sans mémoire suivante :

P(X > t + s|X > s) = P(X > t).

Preuve à faire en exercice.

243/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Exponentielle

Exercice 1. Le temps d’attente pour recevoir un service suit une loi


exponentielle de moyenne égale à 5 minutes.
a) Quelle est la probabilité d’attendre plus que 10 minutes ?
b) Quelle est la probabilité d’attendre encore au moins 5 minutes étant
donné qu’on a déjà attendu 5 minutes ?

244/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Exponentielle

Solution de l’exercice 1. Le temps d’attente pour recevoir un service est


une variable aléatoire X qui suit une loi exponentielle de moyenne égale à
µ = 5 minutes. Par conséquent, λ = 1/µ = 1/5 = 0.2
1 La probabilité d’attendre plus que 10 minutes est :

P(X > 10) = e−λx = e−0.2×10 = e−2 = 0.135.

2 En utilisant la propriété sans mémoire de la loi exponentielle, on voit que


la probabilité d’attendre encore au moins 5 minutes étant donné qu’on a
déjà attendu 5 minutes est :

P(X > 10 X > 5) = P(X > 5)
= e−0.2×5
= e−1 = 0.368.

245/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Exponentielle

Exercice 2. La durée de fonctionnement avant défaillance d’un certain


transistor obéit à une loi exponentielle de moyenne 20 000 heures. Or, un tel
transistor, utilisé à une fin particulère, fonctionne déjà depuis 20 000 heures.
Quelle est la probabilité qu’il fonctionne moins de 30 000 heures ?

246/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Exponentielle

Solution de l’exercice 2. La durée de fonctionnement avant défaillance d’un


certain transistor est une variable aléatoire X ∼ExP(λ = 1/20000).
1 Sachant que ce transistor fonctionne déjà depuis 20000 heures alors la
probabilité qu’il fonctionne moins de 30000 heures est

P(X ≤ 30000 X > 20000) = 1 − P(X > 30000 X > 20000)
= 1 − P(X > 10000)
1
= 1 − e−10000× 20000
= 1 − e−0.5 = 0.393.

247/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Gamma

Loi gamma
La loi gamma de paramètres n et λ représente la distribution du temps
d’attente avant la n ième occurrence d’un processus de Poisson de
fréquence λ. On s’intéresse alors à la variable :
X : temps d’attente avant d’observer la n ième réalisation d’un processus de
Poisson de fréquence λ
La loi de X est appelée loi gamma de paramètres n et λ. On écrit alors :

X ∼ gamma(n, λ).

248/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Gamma
Relation entre la loi gamma et le processus de Poisson
Soit {Nt } un processus de Poisson de fréquence λ et soit X une variable
aléatoire de loi gamma(n, λ).
Ces deux quantités sont liées par l’équation suivante :
P[X > t] = P[Nt ≤ n − 1].
Cette constatation nous permet de déterminer la fonction de répartition F (t)
de X . En effet :
P[X > t] = P[Nt ≤ n − 1]
n−1
X
= P[Nt = k ]
k =0
n−1
X
= (λt)k e−λt /k !.
k =0
Par conséquent :
n−1
X
F (t) = 1 − P[X > t] = 1 − (λt)k e−λt /k !, t ≥ 0.
k =0
249/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Gamma

Propriété : Si X une variable aléatoire de loi gamma(n, λ), alors il existe


n variables aléatoires X1 , . . . , Xn indépendantes et de même loi
exponentielle Exp(λ) telles que :

X = X1 + · · · + Xn .

Espérance et variance la loi gamma


Si X ∼ gamma(n, λ), alors :

n n
E(X ) = et var(X ) = .
λ λ2

250/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Gamma

Exercice 1. Soit X une variable aléatoire de loi Gamma(n = 4, λ = 0.25).


Calculer
1) P[X > 4],
2) P[4 < X < 6],
3) P[4 < X < 6|X > 5].

251/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Gamma

Solution de l’exercice 1. Soit X ∼ Gamma(n = 4, λ = 0.25).


1) Calculons P(X > 4)
3
X (λt)k e−λt
P(X > 4) =
k!
k =0
3
X (0.25 × 4)k e−0.25×4
=
k!
k =0
3
X e−1
=
k!
k =0
 
1 1 1
= e−1 1 + + + = 0.98.
1! 2! 3!

252/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Gamma

2) Calculons P(4 < X < 6). Pour ce faire, remarquons d’abord que

P(4 < X < 6) = P(X > 4) − P(X > 6) = 0.98 − P(X > 6).

Il reste donc à évaluer P(X > 6).

253/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Gamma

Cette dernière se calcule comme suit :


3
X (λt)k e−λt
P(X > 6) =
k!
k =0
3
X (0.25 × 6)k e−0.25×6
=
k!
k =0
3
X (1.5)k e−1.5
=
k!
k =0

1.52 1.53
 
1.5
= e−1.5 1 + + + = 0.93.
1! 2! 3!
Donc :

P(4 < X < 6) = P(X > 4) − P(X > 6) = 0.98 − 0.93 = 0.05.
254/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Gamma


3) Calculons P(4 < X < 6 X > 5)
P(4 < X < 6, X > 5)
P(4 < X < 6 X > 5) =
P(X > 5)
P(5 < X < 6)
=
P(X > 5)
P(X > 5) − P(X > 6)
= .
P(X > 5)

Comme P(X > 6) = 0.93, il reste à calculer P(X > 5).

255/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Gamma
En effet
3
X (λt)k e−λt
P(X > 5) =
k!
k =0
3
X (0.25 × 5)k e−0.25×5
=
k!
k =0
3
X (1.25)k e−1.25
=
k!
k =0

1.252 1.253
 
1.25
= e−1.25 1 + + + = 0.96.
1! 2! 3!
Finalement :
P(X > 5) − P(X > 6) 0.96 − 0.93
P(4 < X < 6 X > 5) = = = 0.03.
P(X > 5) 0.96
256/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Gamma

Exercice 2. Un certain système électronique a une durée de vie X1


distribuée selon une loi exponentielle de moyenne 400 heures. Ce système
est supporté par deux autres systèmes X2 et X3 indépendants et de même loi
que X1 . On s’intéresse à la durée de vie totale du système :

Y = X1 + X2 + X3 .

1. Quelle est la loi de Y . Préciser ses paramètres ?


2. Calculer la probabilité que la durée totale Y dépasse 1 200 heures ?

257/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Gamma

Solution de l’exercice 2. Soient X1 , X2 et X3 des variables aléatoires


indépendantes telles que Xi ∼Exp(λ = 1/400). Posons

Y = X1 + X2 + X3 .

1. La variable Y est distribuée selon la loi gamma de paramètres n = 3 et


λ = 1/400, c’est-à-dire,
X ∼Gamma(n = 3, λ = 1/400).

258/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Gamma

2. La probabilité que la durée totale Y dépasse 1200 heures est :


2
X (λt)k e−λt
P(Y > 1200) = =
k!
k =0
2 k 1
X 1
400
× 1200 e− 400 ×1200
=
k!
k =0
2
X 3k e−3
=
k!
k =0

32
 
3
= e−3 1 + + = 0.423.
1! 2!

259/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

La loi normale est le modèle le plus utilisé en statistique. Elle possède


l’avantage d’approcher des distributions de sommes de variables
indépendantes. Elle fut découverte par Karl Friedrich Gauss (1777-1855).

Définition : On dit qu’une variable aléatoire X de moyenne µ et de variance


σ 2 suit une loi normale si sa densité est de la forme :
1 (x−µ)2

f (x) = √ e 2σ2 , pour tout nombre réel x.
σ 2π

La loi normale de moyenne µ et de variance σ 2 est notée N(µ, σ 2 ).

260/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Graphe d’une loi normale


La courbe de la densité de la loi normale a une forme de cloche. Elle est
symétrique par rapport à la droite verticale passant par la moyenne µ.
L’écart type σ représente la distance entre l’axe de symétrie et le point
d’inflexion de la courbe (changement de courbure).

σ-


261/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Effet de la moyenne µ
Lois normales de variances égales mais de moyennes différentes.

N(µ1 , σ 2 ) N(µ2 , σ 2 )
HH 
j
H 


µ1 µ2

La moyenne µ est un paramètre d’échelle, car sa variation permet de


translater la courbe de densité sans changer sa forme.

262/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Effet de la variance σ 2
Lois normales de moyennes égales mais de variances différentes.

N(µ, σ12 )




N(µ, σ22 )



µ

Dans ce cas, on a : σ12 < σ22 . On voit que l’allure de la courbe de densité
est affectée par la variance σ 2 . Cette dernière est appelée alors
paramètre de forme.

263/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Loi normale centrée réduite


La loi normale de moyenne µ = 0 et de variance σ 2 = 1 est appelée la
loi normale centrée réduite. La variable aléatoire qui suit une loi normale
centrée réduite est notée Z :

Z ∼ N(0, 1).

Fonction de répartition de la loi normale centrée réduite


La fonction de répartition de la loi normale N(0, 1) nous permet le calcul
des probabilités par la table de la loi normale. Elle est définie par :

φ(x) = P(Z ≤ x).

264/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Elle représente la surface, située à gauche de x, entre la courbe de densité


et l’axe des abscisses :

φ(x)
Z Densité de Z ∼ N(0, 1)
Z 
~
Z 


0 x

265/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Propriétés de la fonction répartition φ(x)

1. φ(−x) = 1 − φ(x);

2. P[Z > x] = 1 − φ(x);

3. P[a ≤ Z ≤ b] = φ(b) − φ(a).

266/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Exercice. Calculez

1) P(0 ≤ Z ≤ 2.31);
2) P(Z ≤ 2.31) ;
3) P(Z ≥ 1.32) ;
4) P(Z > 1.32) ;
5) P(−2.45 ≤ Z ≤ −1.69).

267/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Supposons que Z ∼ N(0, 1).


1. Calculons P(0 ≤ Z ≤ 2.31)

P(0 ≤ Z ≤ 2.31)φ(2.31) − φ(0) = 0.9896 − 0.5 = 0.4896.

2. Calculons P(Z ≤ 2.31)

P(Z ≤ 2.31) = φ(2.31) = 0.9896.

3. Calculons P(Z ≥ 1.32)

P(Z ≥ 1.32) = 1 − φ(1.32) = 1 − 0.9066 = 0.0934.

268/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

4. Calculons P(Z > 1.32)

P(Z > 1.32) = 1 − φ(1.32) = 1 − 0.9066 = 0.0934.

5. Calculons P(−2.45 ≤ Z ≤ −1.69)

P(−2.45 ≤ Z ≤ −1.69) = P(1.69 ≤ Z ≤ 2.45)


= φ(2.45) − φ(1.69)
= 0.9929 − 0.9545 = 0.0384.

Cette probabilité peut aussi être obtenue d’une autre manière à savoir :

P(−2.45 ≤ Z ≤ −1.69) = φ(−1.69) − φ(−2.45)


= (1 − φ(1.69)) − (1 − φ(2.45))
= φ(2.45) − φ(1.69) = 0.0384.

269/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Calcul de probabilité d’une loi normale quelconque


Propriété : Si X ∼ N(µ, σ 2 ) alors :
X −µ
Z = ∼ N(0, 1).
σ
Exercice. Soit X ∼ N(4, 25), calculez :

1. P(X ≤ 9) ;
2. P(2 ≤ X ≤ 10).

270/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale
Réponse. Soit X ∼ N(4, 25).
1. Calculons P(X ≤ 9)
 
X −4 9−4
P(X ≤ 9) = P ≤
5 5
= P (Z ≤ 1) = φ(1) = 0.8413.

2. Calculons P(2 ≤ X ≤ 10)


 
2−4 X −4 10 − 4
P(2 ≤ X ≤ 10) = P ≤ ≤
5 5 5
= P (−0.4 ≤ Z ≤ 1.2)
= φ(1.2) − φ(−0.4)
= φ(1.2) − (1 − φ(0.4))
= 0.8849 − (1 − 0.6554) = 0.5403

271/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Exercice 1. Les notes obtenues par des étudiants dans un concours se


répartissent selon une variable aléatoire X de loi normale N(68, 100).
a) On choisit un candidat au hasard. Quelle est la probabilité qu’il ait une
note entre 60 et 70 ?
b) Les examinateurs du concours veulent donner la cote A+ aux 5% des
étudiants ayant obtenu les meilleures notes. Déterminer la note
minimale nécessaire pour obtenir A+.

272/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Solution de l’exercice 1. Les notes obtenues par des étudiants dans un


concours se répartissent selon une variable aléatoire
X ∼ N(µ = 68, σ 2 = 100).
a) On choisit un candidat au hasard. La probabilité qu’il ait une note entre
60 et 70 est :
 
60 − 68 X − 68 70 − 68
P(60 ≤ X ≤ 70) = P ≤ ≤
10 10 10
= P (−0.8 ≤ Z ≤ 0.2)
= φ(0.2) − φ(−0.8)
= φ(0.2) − (1 − φ(0.8))
= 0.5793 − (1 − 0.7881) = 0.3674.

273/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale
b) Déterminons la note minimale a nécessaire pour obtenir A+. Puisque les
examinateurs du concours veulent donner la cote A+ aux 5% des
étudiants ayant obtenu les meilleures notes. Donc, on cherche a de
sorte que :
P(X > a) = 0.05 ⇐⇒ P(X ≤ a) = 0.95
 
X − 68 a − 68
⇐⇒ P ≤ = 0.95
10 10
 
a − 68
⇐⇒ P Z ≤ = 0.95
10
 
a − 68
⇐⇒ φ = 0.95
10
a − 68
⇐⇒ = 1.645
10
⇐⇒ a = 84.45.

274/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Exercice 2. On suppose que la taille, en centimètres, d’un homme âgé de 25


ans est une variable normale de moyenne 175 cm et de variance 36 cm2 .
a) Quel est le pourcentage d’hommes de 25 ans ayant une taille supârieure
à 185 cm ?
b) Parmi les hommes mesurant plus de 180 cm, quel pourcentage d’entre
eux dépassent 192 cm ?

275/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Solution de l’exercice 2. On suppose que la taille, en centimètres, d’un


homme âgé de 25 ans est une variable aléatoire X ∼ N(µ = 175, σ 2 = 36).
a) Le pourcentage d’hommes de 25 ans ayant une taille supérieure à 185
cm est :
 
X − 175 185 − 175
P(X ≥ 185) = P ≥
6 6
= P (Z ≥ 1.67)
= 1 − φ(1.67)
= 1 − 0.9525 = 0.0475.

276/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale
b) Parmi les hommes mesurant plus de 180 cm, le pourcentage d’entre eux
qui dépassent 192 cm est
P(X ≥ 192 ∩ X ≥ 180)
P(X ≥ 192 X ≥ 180) =
P(X ≥ 180)
P(X ≥ 192)
=
P(X ≥ 180)
P X −175 ≥ 192−175

6 6
=
P X −175 ≥ 180−175

6 6
P (Z ≥ 2.83)
=
P (Z ≥ 0.83)
1 − φ (2.83)
=
1 − φ (0.83)
1 − 0.9977
= = 0.0113.
1 − 0.7967
277/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Propriété d’additivité de la loi normale


Soit n variables aléatoires indépendantes, notées X1 , . . . , Xn telles que :

Xi ∼ N(µi , σi2 ) pour i = 1, . . . , n.

Posons
Y = a1 X1 + · · · + an Xn ,
alors
Y ∼ N(µY , σY2 ),
avec
n
X n
X
µY = ai µi et σY2 = ai2 σi2 .
i=1 i=1

278/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Exercice. Soient X1 , X2 et X3 des variables aléatoires indépendantes telles


que
X1 ∼ N(12, 0.02),
X2 ∼ N(24, 0.03),
X3 ∼ N(18, 0.04).
On pose Y = X1 + X2 + X3 et T = X1 − X2 + X3 .
1. Déterminer les lois de Y et de T .
2. Calculer : P(53.8 ≤ Y ≤ 54.02) et P(5.8 ≤ T ≤ 6.2).

279/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Soient X1 , X2 et X3 des variables aléatoires indépendantes telles que

X1 ∼ N(µ1 = 12, σ12 = 0.02),


X2 ∼ N(µ2 = 24, σ22 = 0.03),
X3 ∼ N(µ3 = 18, σ32 = 0.04).

1. Déterminons les lois de Y = X1 + X2 + X3 et T = X1 − X2 + X3 . Puisque


X1 , X2 et X3 sont des variables aléatoires normales indépendantes,
donc :
Y ∼ N(µ1 + µ2 + µ3 , σ12 + σ22 + σ32 ) = N(54, 0.09),
et
T ∼ N(µ1 − µ2 + µ3 , σ12 + σ22 + σ32 ) = N(6, 0.09).

280/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

2. Calculons P(53.8 ≤ Y ≤ 54.02) et P(5.8 ≤ T ≤ 6.2). Il est clair que :


 
53.8 − 54 Y − 54 54.02 − 54
P(53.8 ≤ Y ≤ 54.02) = P √ ≤ √ ≤ √
0.09 0.09 0.09
= P (−0.67 ≤ Z ≤ 0.07)
= φ(0.07) − φ(−0.67)
= φ(0.07) − (1 − φ(0.67))
= 0.5279 − (1 − 0.7486) = 0.2765.

281/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

De même, nous avons


 
5.8 − 6 T −6 6.2 − 6
P(5.8 ≤ T ≤ 6.2) = P √ ≤ √ ≤ √
0.09 0.09 0.09
= P (−0.67 ≤ Z ≤ 0.07)
= φ(0.67) − φ(−0.67)
= φ(0.67) − (1 − φ(0.67))
= 2φ(0.67) − 1 = 2 × 0.7486 − 1 = 0.4972.

282/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Exercice. Soient X1 , X2 et X3 des variables aléatoires indépendantes telles


que
X1 ∼ N (µ1 = 16, σ12 = 1),
X2 ∼ N (µ2 = 4, σ22 = 2),
X3 ∼ N (µ3 = 45, σ32 = 4).

1. Déterminez la loi de Y = 2X1 − 5X2 + 3X3 .


2. Calculez : P(130 ≤ Y ≤ 165).
3. Trouvez a tel que : P(Y ≥ a) = 0.05.
4. Trouvez b tel que : P(Y ≥ b) = 0.90.

283/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

Réponse.
1. Puisque X1 , X2 et X3 sont des variables aléatoires normales
indépendantes, donc la loi de Y = 2X1 − 5X2 + 3X3 est :

Y ∼ N (2µ1 − 5µ2 + 3µ3 , 4σ12 + 25σ22 + 9σ32 ) = N (147, 90)

2. Calculons P(130 ≤ Y ≤ 165) :


 
130 − 147 165 − 147
P(130 ≤ Y ≤ 165) = P √ ≤Z ≤ √
90 90
= P (−1.79 ≤ Z ≤ 1.90)
= φ(1.90) − φ(−1.79)
= φ(1.90) − (1 − φ(1.79))
= 0.9713 − (1 − 0.9633) = 0.9346.

284/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

3. Calculons a tel que P(Y ≥ a) = 0.05.

P(Y ≥ a) = 0.05 ⇐⇒ P(Y ≤ a) = 0.95


 
a − 147
⇐⇒ P Z ≤ √ = 0.95
90
 
a − 147
⇐⇒ φ √ = 0.95
90
a − 147
⇐⇒ √ = 1.645
90

⇐⇒ a = 1.645 × 90 + 147 = 162.6058.

285/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale

Loi Normale

4. Calculons b tel que P(Y ≥ b) = 0.90.

P(Y ≥ b) = 0.90 ⇐⇒ P(Y ≤ b) = 0.10


 
b − 147
⇐⇒ P Z ≤ √ = 0.10
90
 
b − 147
⇐⇒ φ √ = 0.10
90
 
147 − b
⇐⇒ φ √ = 0.90
90
147 − b
⇐⇒ √ = 1.285
90

⇐⇒ b = 147 − 1.285 × 90 = 134.8094.

286/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Théorème central limite et applications

Mhamed Mesfioui, Ph. D.

mhamed.mesfioui@uqtr.ca

Automne 2021

287/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Théorème central limite

Théorème central limite


Le théorème central représente le résultat le plus important en probabilité et
statistique.
Version générale du théorème central limite
Soit X1 , X2 , . . . , Xn une suite de variables aléatoires indépendantes telles
que E(Xi ) = µi et var(Xi ) = σi2 . Si Yn = X1 + X2 + · · · + Xn , alors dans
certaines conditions générales, la variable

Yn ≈ N(µn , σn2 ), quand n→∞

avec
µn = µ1 + · · · + µ n et σn2 = σ12 + · · · + σn2 .

288/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Théorème central limite

Version particulière du théorème central limite


Soit X1 , X2 , . . . , Xn une suite de variables aléatoires indépendantes et
identiquement distribuées, telles que E(Xi ) = µ et var(Xi ) = σ 2 . Alors la
variable aléatoire
Yn = X1 + X2 + · · · + Xn
obéit approximativement à une loi normale N(nµ, nσ 2 ) lorsque n tend
vers l’infini, c’est-à-dire

Yn ≈ N(nµ, nσ 2 ), quand n → ∞.

Remarque. En pratique, l’approximation par le théorème central limite


est assez bonne pour n ≥ 30.

289/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Théorème central limite

Exercice 1. Une assurance a 10 000 automobilistes assurés. L’indemnité


annuelle demandée par un assuré i est une variable aléatoire Xi de moyenne
240$ et d’écart-type 8 000$. Soit

Y = X1 + · · · + X10000

les indemnités totales annuelles demandées par les 10 000 assurés. En


utilisant le théorème central limite, évaluez approximativement la probabilité
que ces indemnités annuelles totales dépassent 2 700 000$.

290/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Théorème central limite

Solution de l’exercice 1. Soit Y = X1 + · · · + X10000 où X1 , . . . , X10000 sont


des v.a indépendantes et identiquement
p distribuées telles que
µ = E(Xi ) = 240$ et σ = var(Xi ) = 8000$. Évaluons approximativement la
probabilité que ces indemnités annuelles totales Y dépassent 2700000. Ceci
revient à calculer P(Y > 2700000) approximativement en utilisant le
théorème central limite.

291/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Théorème central limite

Pour ce faire, notons d’abord que

Y = X1 + · · · + X10000 ≈ N(nµ, nσ 2 ) = N(10000 × 240, 10000 × 80002 ).

C’est-à-dire : Y ≈ N(24 × 105 , 64 × 1010 ). Il en resulte que

P(Y > 2700000) = P(Y > 27 × 105 )


Y − 24 × 105 27 × 105 − 24 × 105
 
= P √ > √
64 × 1010 64 × 1010
 
3
= P Z >
8
 
3
= 1−φ = 1 − φ(0.38) = 1 − 0.6480 = 0.3520.
8

292/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Théorème central limite

Exercice 2. On dispose de 100 ampoules dont les durées de vie sont des
variables aléatoires indépendantes et de même loi exponentielle de moyenne
5 heures. Si on allume une ampoule à la fois et qu’une ampoule grillée est
instantanément remplacée par une neuve, quelle est la probabilité qu’il reste
encore une ampoule intacte après 525 heures ?

293/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Théorème central limite

Solution de l’exercice 2. Soit Xi la durée de vie de la ampoule i. On sait que


Xi ∼ Exp(λ = 1/5). Soit

Y = X1 + · · · + X99

la durée de vie des 99 premières ampoules. D’après le théorème central


limite, on a

Y ≈ N (nµ, nσ 2 ), µ = 1/λ = 5, σ 2 = 1/λ2 = 25, n = 99.

Donc

Y ≈ N (495, 2475).

294/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Théorème central limite

On cherche à évaluer la probabilité que Y ≥ 525 :


 
Y − 495 525 − 495
P(Y ≥ 525) = P √ ≥ √
2475 2475
= P (Z ≥ 0, 60)
= 1 − φ(0.60) = 0, 2743.

295/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Théorème central limite

Exercice 3. Soient X1 , . . . , Xn une suite de variables aléatoires inépendantes


et identiquement distribuées telles E(Xi ) = µ = 10 et var(Xi ) = σ 2 = 4. On
pose
Sn = X1 + · · · + Xn .
Pourvu que n ≥ 30, le théorème central limite garantie que la loi de Sn est
approximativement normale de moyenne nµ = 10n et variance nσ 2 = 4n,
c-à-d :
Sn ≈ N(10n, 4n).
Déterminez la valeur de n telle que

P[Sn > 430] ≥ 0.99.

296/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Théorème central limite

Solution de l’exercice 3. Déterminons la valeur de n telle que


P[Sn > 430] ≥ 0.99. En utilisant Sn ≈ N(10n, 4n), on voit que :
 
Sn − 10n 430 − 10n
P[Sn > 430] ≥ 0.99 ⇐⇒ P √ > √ ≥ 0.99
4n 4n
 
430 − 10n
⇐⇒ P Z > √ ≥ 0.99
4n
 
430 − 10n
⇐⇒ 1 − φ √ ≥ 0.99
2 n
 
10n − 430
⇐⇒ φ √ ≥ 0.99
2 n
10n − 430
⇐⇒ √ ≥ 2.325. (1)
2 n

297/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Théorème central limite

On cherche les racines de l’équation :


10n − 430
√ = 2.325
2 n

Pour ce faire, on pose x = n. Ainsi, l’équation précédente devient :

10x 2 − 430
= 2.325 ⇐⇒ 10x 2 − 4.65x − 430 = 0
2x
⇐⇒ x = −6.329059 ou x = 6.794059

Comme x = n > 0, donc la solution sera x = 6.794059. Par suite, le plus
petit n satisfaisant l’inéquation (1) sera l’entier supérieur à
6.7940592 = 46.15924 à savoir

n = 47.

298/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Théorème (De Moivre - Laplace)

Théorème (De Moivre - Laplace)


La loi binomiale est approximée par la loi normale de la faÃS
Son
suivante :
B(n, p) ≈ N[np, np(1 − p)]
pour n assez grand.

Remarque : Par expérience, cette approximation est généralement


assez bonne tant que :

np > 5 et n(1 − p) > 5.

299/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Correction pour la continuité


Pour avoir une meilleure approximation de la loi binomiale par la loi normale,
on doit utiliser le principe de correction pour la contnuité :

Si X ∼ B(n, p) et Xc ∼ N[np, np(1 − p)]

alors  
1 1
p(k ) = P(X = k ) ≈ P k − ≤ Xc ≤ k + .
2 2

6
P(k ) @
I
@
Densité de Xc

-
1 1
k− 2
k k+ 2
300/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Correction pour la continuité

Exercice. Si X ∼ B(100, 0.2), calculer P(X = 15).


On a :
Xc ∼ N[np, np(1 − p)] = N(20, 16).
Donc,

P(X = 15) ≈ P(15 − 0.5 ≤ Xc ≤ 15 + 0.5)


= P(14.5 ≤ Xc ≤ 15.5)
 
14.5 − 20 15.5 − 20
= P ≤Z ≤
4 4
= Φ(P(−1.375 ≤ Z ≤ −1.125))
= Φ(−1.125) − Φ(−1.375)
= Φ(1.375) − Φ(1.125)
= 0.046.

301/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Correction pour la continuité

Propriété : Soit X ∼ B(n, p) et Xc ∼ N[np, np(1 − p)], alors


1
1. P(X = k ) = P(k − 2
≤ Xc ≤ k + 12 ) ;

2. P(X ≤ k ) = P(Xc ≤ k + 21 ) ;

3. P(X < k ) = P(Xc ≤ k − 21 ) ;

4. P(X ≥ k ) = P(Xc ≥ k − 21 ) ;

5. P(X > k ) = P(Xc ≥ k + 21 ) ;


1
6. P(k ≤ X ≤ p) = P(k − 2
≤ Xc ≤ p + 12 ) ;
1
7. P(k < X < p) = P(k + 2
≤ Xc ≤ p − 12 ).

302/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Correction pour la continuité

Exercice. Si X ∼ B(100, 0.2), calculez


a) P(X ≤ 15);
b) P(X < 18) ;
c) P(X ≥ 22) ;
d) P(18 < X < 21).

303/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Correction pour la continuité


Réponse.
a) Calculons P(X ≤ 15)
P(X ≤ 15) ≈ P(Xc ≤ 15.5)
 
Xc − 20 15.5 − 20
= P ≤
4 4
= P (Z ≤ −1.13)
= φ(−1.13) = 1 − φ(1.13) = 1 − 0.8708 = 0.1292.
b) Calculons P(X < 18)
P(X < 18) ≈ P(Xc ≤ 17.5)
 
Xc − 20 17.5 − 20
= P ≤
4 4
= P (Z ≤ −0.63)
= φ(−0.63) = 1 − φ(0.63) = 1 − 0.7357 = 0.2643.
304/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Correction pour la continuité

c) Calculons P(X ≥ 22)

P(X ≥ 22) ≈ P(Xc ≥ 21.5)


 
Xc − 20 21.5 − 20
= P ≥
4 4
= P (Z ≥ 0.38)
= 1 − φ(0.38) = 1 − 0.6480 = 0.352.

305/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Variables aléatoires discrètes et continues
Théorème central limite
Modèles probabilistes discrets
Théorème (De Moivre - Laplace)
Modèles probabilistes continus
Correction pour la continuité
Théorème central limite et applications

Correction pour la continuité

d) Calculons P(18 < X < 21)

P(18 < X < 21) ≈ P(18.5 ≤ Xc ≤ 20.5)


 
18.5 − 20 Xc − 20 20.5 − 20
= P ≤ ≤
4 4 4
= P (−0.38 ≤ Z ≤ 0.13)
= φ(0.13) − φ(−0.38)
= φ(0.13) − 1 + φ(0.38)
= 0.5517 − 1 + 0.6480 = 0.1997.

306/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres
Estimation par intervalle de confiance
Test d’hypothèse
Test de comparaison

Partie III
Estimation et tests d’hypothèses

Mhamed Mesfioui, Ph.D.

mhamed.mesfioui@uqtr.ca

Automne 2021

307/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres
Estimation par intervalle de confiance
Test d’hypothèse
Test de comparaison

Partie III : Estimation et tests d’hypothèses

13 Échantillonnage et Estimation des paramètres

14 Estimation par intervalle de confiance

15 Test d’hypothèse

16 Test de comparaison

308/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Échantillonnage et Estimation des paramètres

Mhamed Mesfioui, Ph. D.

mhamed.mesfioui@uqtr.ca

Automne 2021

309/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Échantillon, Paramètre et Statistique

Échantillon aléatoire
Un échantillon aléatoire est une suite de variables aléatoires X1 , . . . , Xn
indépendantes et de même loi qu’une caractéristique X d’une population.
Paramètre
Un paramètre est un nombre qui décrit une caractéristique de la population
étudiée. Citons, à titre d’exemples, la moyenne µ, la variance σ 2 , la médiane
M et la proportion p d’une population. Notons que les paramètres sont
souvent inconnus.
Statistique
Une statistique est une fonction de l’échantillon qui permet d’estimer un
paramètre de la population.

310/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Échantillon, paramètre et statistique

Par exemple :
1) La moyenne µ d’une population est estimée par la moyenne X̄ d’un
échantillon de cette population :
n
1X
X̄ = Xi.
n
i=1

2) La variance σ 2 d’une population est estimée par la variance s2 d’un


échantillon de cette population :
n
" n #
2 1 X 2 1 X 2 2
S = Xi − X̄ = Xi − nX̄ .
n−1 n−1
i=1 i=1

311/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Échantillon, paramètre et statistique

3) Soit une population ayant une caractéristique qualitative (une maladie


particulière), la proportion p des individus ayant cette caractéristique
dans la population est estimée par :
Xn
p̂ =
n
où Xn désigne le nombre d’individus de l’échantillon qui possèdent cette
caractéristique.
Remarque. Les statistiques X̄ , S 2 et p̂ sont appelées aussi estimateurs. Par
contre, la valeur calculée par un estimateur pour un échantillon donné est
appelée estimation ponctuelle.

312/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Estimateur sans biais

Définition : Un estimateur T d’un paramètre θ est dit sans biais si son


espérance mathématique est égale à la vraie valeur du paramètre à estimer :

E(T ) = θ.

Notons qu’un estimateur sans biais ne surestime ni sous-estime


systématiquement le paramètre. On dit d’un estimateur sans biais qu’il est
bien centré.
Remarque. Notons que X̄ , S 2 et p̂ sont respectivement des estimateurs sans
biais des paramètres µ, σ 2 et p, c’est-à-dire :

E(X̄ ) = µ, E(S 2 ) = σ 2 et E(p̂) = p.

313/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Estimateur efficace

Définition : Soient T1 et T2 deux estimateurs sans biais d’un paramètre


inconnu θ. On dit que T1 est plus efficace que T2 si :

var(T1 ) < var(T2 ).

L’estimateur doit avoir une variance aussi petite que possible, afin d’être
aussi précis que possible. Ainsi les variances des estimateurs X̄ et p̂ sont :

σ2 p(1 − p)
var(X̄ ) = et var(p̂) = .
n n

314/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Qualité d’un estimateur

Ces formules montrent que les variances de X̄ et p̂ diminuent lorsque la taille


n de l’échantillon augmente. Donc, plus l’échantillon est grand, plus les
estimateurs X̄ et p̂ sont précis.

315/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Distribution d’échantillonnage

Un estimateur est par définition basé sur un échantillon qui n’est qu’une
partie de la population étudiée. Il est donc fort improbable que la valeur
prise par cet estimateur coïncide avec le paramètre étudié.

Définition : La distribution d’échantillonnage d’un estimateur est la


distribution de toutes les valeurs possibles de cet estimateur. Ces
valeurs sont calculées à partir d’échantillons de même taille et issus de
la même population.

Afin étudier les distributions d’échantillonnage de quelques estimateurs


intéressants, nous allons d’abord définir certaines distributions très utiles
en statistique.

316/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Rappel : Loi Normale

La loi normale est le modèle le plus utilisé en statistique. Elle fut


découverte par Karl Friedrich Gauss (1777-1855).

Définition : On dit qu’une variable aléatoire X de moyenne µ et de


variance σ 2 suit une loi normale si sa densité est de la forme :
1 (x−µ)2

f (x) = √ e 2σ2 , pour tout nombre réel x.
σ 2π
La loi normale de moyenne µ et de variance σ 2 est notée N(µ, σ 2 ).

317/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Rappel : Loi Normale

La courbe de la densité de la loi normale a une forme de cloche. Elle est


symétrique par rapport à la droite verticale passant par la moyenne µ. L’écart
type σ représente la distance entre l’axe de symétrie et le point d’inflexion de
la courbe (changement de courbure).

σ-


318/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Rappel : Loi Normale

La table de loi normale centrée réduite N(0, 1) nous donne les valeurs de la
fonction φ(x) de Z ∼ N(0, 1).

φ(x)
Densité de Z ∼ N(0, 1)
Z
Z~
Z 



0 x

Quantile d’ordre α de la loi normale


En statistique, on s’intéresse plutôt au quantile zα d’ordre α défini par :

P(Z ≥ zα ) = α.

319/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Rappel : Loi Normale

Cela signifie qu’on cherche zα de sorte que

φ(zα ) = 1 − α.

Tableau important
Le tableau ci-après nous fournit les valeurs de zα les plus fréquentes en
statistique :
α 0.10 0.05 0.025 0.01 0.005
zα 1.285 1.645 1.96 2.325 2.575

320/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Résultats très utiles en statistique

Théorème : Soit X1 , . . . , Xn un échantillon issu d’une population de loi


normale N(µ, σ 2 ), alors

X̄ − µ
Z = √ ∼ N(0, 1).
σ/ n

321/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Théorème centrale limite

Théorème : Soit X1 , . . . , Xn un échantillon issu d’une population de loi


inconnue alors
X̄ − µ
Z = √
σ/ n

suit approximativement une loi normale centrée réduite N(0, 1) quand n tend
vers l’infini. En pratique, l’approximation est considérée bonne pour n ≥ 30.

322/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Loi Khi-Carré

Soient Z1 , . . . , Zk des variables aléatoires indépendantes et identiquement


distribuées de loi normale centrée réduite N(0, 1). La variable aléatoire

χ2 = Z12 + · · · + Zk2 (2)

suit une distribution appelée loi de khi-carré à k degrés de liberté, notée χ2k .
On écrit alors :

χ2 ∼ χ2k .

323/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Loi Khi-Carré

Espérance et variance de la loi khi-carré


Si X est une variable aléatoire de loi χ2k , alors :

E(X ) = k et var(X ) = 2k .

Table de la loi khi-carré


La table de la loi khi-carré donne les valeurs χ2α,k telles que :

P(χ2k > χ2α,k ) = α.

Exemple. En utilisant la table de la loi khi-carré, trouvez les valeurs χ20.05,12 et


χ20.01,10 . La lecture dans la table de khi-deux qui se trouve sur le portail du
cours nous nous fournit :

χ20.05,12 = 21.026, χ20.01,10 = 23.209.

324/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Loi Khi-Carré

Résultat suivant est très utile en pratique


Théorème : Soit X1 , . . . , Xn un échantillon issu d’une population de loi
normale N(µ, σ 2 ), alors :

(n − 1)S 2
∼ χ2n−1
σ2
où S 2 désigne la variance échantillonnale.

325/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Loi de Student

La loi de Student constitue une importante distribution d’échantillonnage.


Définition : Soient Z et V deux variables aléatoires indépendantes telles
que :

Z ∼ N(0, 1) et V ∼ χ2k

alors
Z
T = q
V
k

suit une distribution appelée loi de Student à k degrés de liberté, notée tk . On


écrit alors

T ∼ tk .

326/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Loi de Student

Table de la loi de Student


La table de la loi de Student donne les valeurs tα,k telles que :

P(tk > tα,k ) = α.

Exemple. En utilisant la table de la loi de Student, trouvez les valeurs t0.05,12 ,


t0.01,10 et t0.025,20 . En effet, la lecture dans la table de loi de Student qui se
trouve sur le portail du cours nous donne :

t0.05,12 = 1.782;
t0.01,10 = 1.372;
t0.025,20 = 2.086.

327/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Loi de Student

Espérance et variance de la loi de Student

k
E(tk ) = 0 et var(tk ) = , k > 2.
k −2

328/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Loi de Student

Résultat très important en statistique


Théorème : Soit X1 , . . . , Xn un échantillon issu d’une population de loi
normale N(µ, σ 2 ), alors

X̄ − µ
S
∼ tn−1

n

où X̄ et S désignent respectivement la moyenne et l’écart-type de


l’échantillon.

329/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Loi de Fisher
Loi de Fisher
La loi de Fisher représente aussi une importante distribution
d’échantillonnage.
Définition : Soient U et V deux variables aléatoires indépendantes telles
que :

U ∼ χ2n et V ∼ χ2m

alors
U/n
F =
V /m
est distribuée selon la loi de Fisher à n degrés de liberté au numérateur et m
degrés de liberté au dénominateur, notée Fn,m . On écrit alors :

F ∼ Fn,m .
330/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Loi de Fisher

Moyenne et variance de la loi de Fisher

n 2n2 (n + m − 2)
E(Fn,m ) = et var(Fn,m ) = , n > 4.
n−2 m(n − 2)2 (n − 4)
Tables de la loi de Fisher
Les tables de la loi de Fisher donnent les valeurs Fα,n,m telles que :

P(Fn,m > Fα,n,m ) = α.

331/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Loi de Fisher
Remarque. La relation suivante est utile lors de la lecture dans la table de
Fisher
1
F1−α,n,m = .
Fα,m,n

Exemple. En utilisant les tables de la loi de Fisher, trouvez les valeurs


F0.05,12,15 , F0.95,10,12 F0.01,10,15 et F0.99,12,14 . La lecture dans la table de loi de
Fisher qui se situe sur le portail du cours nous donne :
F0.05,12,15 = 2.475;
1 1
F0.95,10,12 = = = 0.3433;
F0.05,12,10 2.913

F0.01,10,15 = 3.805;
1 1
F0.99,12,14 = = = 0.2468.
F0.01,14,12 4.052
332/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Loi de Fisher

Théorème utile en statistique


Théorème : Soient deux populations normales N(µ1 , σ12 ) et N(µ2 , σ22 ) et
deux échantillons indépendants, l’un de taille n1 tiré de la population 1 et
l’autre de taille n2 tiré de la population 2. Si S12 et S22 représentent les
variances de ces échantillons, alors :

S12 /σ12
F = ∼ Fn1 −1,n2 −1 .
S22 /σ22

333/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Exercices

Exercice 1. Soit X̄ la moyenne d’un échantillon aléatoire issu d’une


population de moyenne µ.
a) Montrez que X̄ est un estimateur sans biais de µ.
b) Déterminez la variance de X̄ .
Exercice 2. Soit S 2 la variance d’un échantillon aléatoire issu d’une
population de moyenne µ et de variance σ 2 . Montrez que S 2 est un
estimateur sans biais de σ 2 .
Exercice 3. Soit X1 , . . . , X7 un échantillon aléatoire tiré d’une population
de moyenne µ et de variance σ 2 . L’un des deux estimateurs de µ définis
ci-après est-il sans biais ? Lequel de ces deux estimateurs est le
meilleur ?
X1 + · · · + X7 2X1 + 3X4 − X6
µ̂1 = , µ̂2 = .
7 4

334/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Réponses

Réponse Exercice 1.
a) Montrons que X̄ est un estimateur sans biais de µ. Pour ce faire, on doit
montrer que E(X̄ ) = µ. En effet,
n
!
1X
E(X̄ ) = E Xi
n
i=1
n
1X
= E(Xi )
n
i=1
n
1X
= µ
n
i=1

= = µ.
n

335/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Réponses

b) Déterminons la variance de X̄ . Puisque les v.a X1 . . . , Xn sont


indépendante, donc :

n
!
1X
var(X̄ ) = var Xi
n
i=1
n
1 X
= var(Xi )
n2
i=1
n
1 X 2
= 2
σ
n
i=1
2
nσ σ2
= 2
= .
n n

336/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Réponses

Réponse Exercice 2. Montrez que S 2 est un estimateur sans biais de


σ 2 . On doit prouver que E(S 2 ) = σ 2 .
( n
!)
2 1 X 2 2
E(S ) = E Xi − nX̄
n−1
i=1
( n )
1 X 2 2
= E(Xi ) − nE(X̄ ) . (3)
n−1
i=1

Les termes E(Xi2 ) 2


et E(X̄ ) se calculent en fonction des variances de Xi
et X̄ comme suit :
E(Xi2 ) = var(Xi ) + [E(Xi )]2 = σ 2 + µ2 (4)
et
σ2
E(X̄ 2 ) = var(X̄ ) + [E(X̄ )]2 = + µ2 . (5)
n
337/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Réponses

En insérant (4) et (5) dans (3), il vient que :


( n  2 )
2 1 X 2 2 σ 2
E(S ) = (σ + µ ) − n +µ
n−1 n
i=1
1 n o
= n(σ 2 + µ2 ) − σ 2 − nµ2
n−1
1 n 2 o
= nσ + nµ2 − σ 2 − nµ2
n−1
1
= × (n − 1)σ 2
n−1
= σ 2 cqfd.

338/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Réponses

Réponse Exercice 3. Notons que les estimateurs


X1 + · · · + X7 2X1 + 3X4 − X6
µ̂1 = , µ̂2 = .
7 4
sont sans biais car :
E(X1 ) + · · · + E(X7 ) µ + ··· + µ 7µ
E(µ̂1 ) = = = =µ
7 7 7
et
2E(X1 ) + 3E(X4 ) − E(X6 ) 2µ + 3µ − µ 4µ
E(µ̂2 ) = = = = µ.
4 4 4

339/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices

Réponses

Donc, le meilleur estimateur sera celui qui possède la plus petite


variance. Donc, on doit calculer les variances de µ̂1 et µ̂2 pour conclure.
Ainsi,

var(X1 ) + · · · + var(X7 ) σ2 + · · · + σ2 7σ 2 σ2
var(µ̂1 ) = 2
= = =
7 49 49 7
et
4var(X1 ) + 9var(X4 ) + var(X6 )
var(µ̂2 ) =
42
4σ 2 + 9σ 2 + σ 2 14σ 2 7σ 2
= = = .
16 16 8
On constate que var(µ̂1 ) < var(µ̂2 ), donc µ̂1 est le meilleur estimateur.

340/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Estimation par intervalle de confiance

Mhamed Mesfioui, Ph. D.

mhamed.mesfioui@uqtr.ca

Automne 2021

341/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Intervalle de confiance de la moyenne

La moyenne X̄ calculée à partir d’un échantillon donné est presque toujours


un peu plus grande ou un peu plus petite que la vraie moyenne de la
population µ. Nous ne pouvons pas s’attendre que notre estimateur X̄ soit
exactement égale à µ. On cherche plutôt une approche qui tient compte de la
marge d’erreur d’estimation. Cette estimation se présente alors sous la
forme :

X̄ ± E.

La marge d’erreur E est appelée précision de l’estimateur X̄ .

342/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Intervalle de confiance de la moyenne

Ainsi l’estimation par intervalle de confiance de µ consiste à déterminer


l’erreur E de façon que

µ ∈ [X̄ − E, X̄ + E]

avec une probabilité égale à 1 − α appelée niveau de confiance.


Par exemple, on peut déterminer un intervalle de confiance qui contient la
valeur de µ avec un niveau de confiance égal à 95%. Cela veut dire que si on
répète la même procédure d’estimation 100 fois, la moyenne sera dans 95
intervalles parmi les 100 intervalles établis. Cela signifie que si on construit
un intervalle de confiance par un seul échantillon, il y aura un risque de 5%
que la valeur de µ ne soit pas dans cet intervalle.

343/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Intervalle de confiance de la moyenne

Construction de l’intervalle de confiance de µ


Soit [X̄ − E, X̄ + E] un intervalle de confiance de µ. Afin de déterminer la
précision E, on distingue quatre cas :
Cas 1 : Si X1 , . . . , Xn est un échantillon issu d’une population de loi normale
de variance σ 2 connue, alors l’intervalle de confiance de niveau 1 − α de µ
est :

 
σ σ
X̄ − zα/2 √ , X̄ + zα/2 √ .
n n
Ainsi la précision de l’estimation sera : E = zα/2 √σn .

344/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Intervalle de confiance de la moyenne

Cas 2 : Si X1 , . . . , Xn est un échantillon issu d’une population de loi normale


de variance σ 2 inconnue, alors l’intervalle de confiance de niveau 1 − α de µ
est :
 
S S
X̄ − tα/2,n−1 √ , X̄ + tα/2,n−1 √ .
n n

La précision de l’estimation dans ce cas sera : E = tα/2,n−1 √Sn .

345/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Intervalle de confiance de la moyenne

Cas 3 : Si X1 , . . . , Xn est un échantillon issu d’une population de loi inconnue,


alors pourvue que la taille n soit assez grande (n ≥ 30), l’intervalle de
confiance de niveau 1 − α de µ est :
 
S S
X̄ − zα/2 √ , X̄ + zα/2 √ .
n n

De même, la précision de l’estimation dans ce cas est : E = zα/2 √Sn .

346/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Intervalle de confiance de la moyenne

Cas 4 : Si X1 , . . . , Xn est un échantillon choisi sans remise à partir d’une


population de taille finie N et de loi inconnue, alors pourvu que la taille n soit
assez grande (n ≥ 30), l’intervalle de confiance de niveau 1 − α est :
" r r #
S N −n S N −n
X̄ − zα/2 √ , X̄ + zα/2 √ .
n N −1 n N −1
q
Dans cette situation la précision sera : E = zα/2 √Sn N−n
N−1
.

347/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Intervalle de confiance d’une proportion

Cas 1 : Taille de la population N inconnue


Soit p la proportion d’individus dans la population ayant une caractéristique
qualitative donnée. L’intervalle de confiance de niveau 1 − α de p est de la
forme :
" r r #
p̂(1 − p̂) p̂(1 − p̂)
p̂ − zα/2 , p̂ + zα/2
n n

pourvu que la taille n soit assez grande et que np̂ ≥ 5 et n(1 − p̂) ≥ 5.

348/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Intervalle de confiance d’une proportion

Cas 2 : Taille de la population N connue


Si la taille de la population N est connue, alors l’intervalle de confiance de p
devient :
" r r r r #
p̂(1 − p̂) N − n p̂(1 − p̂) N − n
p̂ − zα/2 , p̂ + zα/2 .
n N −1 n N −1

Remarque. Si N est très grand, le facteur


r
N −n
→ 1.
N −1
Dans ce cas, on retrouve l’intervalle de confiance précédent.

349/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Intervalle de confiance d’une variance

Soit X1 , . . . , Xn un échantillon issu d’une population de loi normale N(µ, σ 2 ),


et dont la variance échantionnale est S 2 . L’intervalle de confiance de σ 2 est
donné par :
" #
(n − 1)S 2 (n − 1)S 2
,
χ2α/2,n−1 χ21−α/2,n−1


n
1 X
S2 = (Xi − X̄ )2 .
n−1
i=1

350/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Intervalle de confiance d’une variance

Exemple. Déterminez un intervalle de confiance de σ 2 pour les données


suivantes :

17.19 42.25 41.61 14.97 22.25 47.24 33.87

Rep. IC = [71.5974, 836.1266], car S 2 = 172.4232, χ20.025,6 = 14.4494 et


χ20.975,6 = 1.2373

351/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Choix de la taille d’échantillon

La qualité d’un intervalle de confiance se mesure par son degré de


confiance 1 − α et sa marge d’erreur E. Un choix adéquat de la taille de
l’échantillon permet de contrôler simultanément ces deux facteurs.

352/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Choix de la taille d’échantillon

Cas d’une moyenne µ : taille de la population N inconnue


Dans le cas d’une population normale de variance connue (cas 1), nous
pouvons déterminer la taille minimale requise de l’échantillon pour avoir un
intervalle de confiance de niveau 1 − α et de précision fixés à l’avance :

σzα/2 2
 
n≥ .
E

Lorsque σ est inconnu, on le remplacera par une pré-estimation s.

353/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Choix de la taille d’échantillon

Cas d’une moyenne µ : taille la population N connue


Si la population est de taille finie N et le tirage est sans remise, alors :
1) La taille requise pour la moyenne sera :
2
Nzα/2 σ2
n≥ 2
.
(N − 1)E 2 + zα/2 σ2

Ainsi si la variance est inconnue, on la remplace par une pré-estimation


s2 .

354/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Choix de la taille d’échantillon

Cas d’une proportion p : taille de la population N inconnue


Dans le cas d’une proportion, si l’on dispose d’une pré-estimation p̂ de p, la
taille minimale sera :
zα/2 2
 
n≥ p̂(1 − p̂).
E

Par contre, si la pré-estimation n’est pas disponible, on remplacera dans la


formule précédente p̂ par 0.5.

355/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Choix de la taille d’échantillon

Cas d’une proportion p : taille de la population N connue


La taille requise pour la proportion sera :
2
Nzα/2 p̂(1 − p̂)
n≥ 2
.
(N − 1)E 2 + zα/2 p̂(1 − p̂)

De même lorsqu’on ne possède pas de pré-estimation p̂, on prendra p̂ = 0.5.

356/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 1

Exercice 1. On suppose que le poids (en milliers de Kg) d’un camion


remorque empruntant une autoroute obéit à la loi N(µ, 2). On a pesé 20
camions remorques choisis au hasard et observé X̄ = 7.4 comme moyenne.
a) Donnez un intervalle de confiance de niveau 90% pour µ. Préciser
l’erreur d’estimation.
b) Quelle taille d’échantillon devriez-vous avoir afin que la marge d’erreur
d’un intervalle de confiance de niveau 90% pour la moyenne µ soit
inférieure à 0.05 ? rep : n = 2165.

357/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 1

Solution de l’exercice 1.
a) Puisque la variable d’étude qui est le poids des camions suit une loi
normale de variance connue σ 2 = 2, donc, il s’agit du cas 1. Par suite,
l’intervalle de confiance au niveau 90% de la moyenne de la population
µ est :
 
σ σ
IC = X̄ − z α2 × √ , X̄ + z α2 × √
n n
" √ √ #
2 2
= 7.4 − z0.05 × √ , 7.4 + z0.05 × √
20 20
" √ √ #
2 2
= 7.4 − 1.645 × √ , 7.4 + 1.645 × √
20 20
= [6.879805, 7.920195] .

358/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 1

Ainsi, l’erreur d’estimation est :



2
E = 1.645 × √ = 0.5201947.
20

b) On cherche la taille de l’échantillon n de sorte que la marge d’erreur


associée à l’intervalle de confiance est plus petite que E = 0.05 avec
une confiance 1 − α = 0.90, c-à-d, z α2 = 1.645. Ceci s’obtient à l’aide
de la formule :
 α 2 √ !2
σz 2 2 × 1.645
n≥ = = 2164.82
E 0.05

Donc, la taille requise sera : n = 2165.

359/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 2

Exercice 2. Une compagnie qui fabrique des piles s’intéresse à la durée de


vie moyenne µ (en heures) de celles-ci. Un technicien mesure donc la durée
de vie pour chacune des piles d’un échantillon de taille 150. La moyenne et la
variance observées sont 4.7 et 0.07 respectivement.
a) Donnez un intervalle de confiance de niveau 95% pour µ. Préciser
l’erreur d’estimation.
b) Déterminer la taille d’échantillon afin que la marge d’erreur d’un
intervalle de confiance de niveau 95% pour la moyenne µ soit inférieure
à 0.02 ?

360/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 2

a) La variable à l’étude est la durée de vie des piles de loi inconnue. Mais
la taille de l’échantillon est n = 150 ≥ 30. Donc, on calcule l’intervalle de
confiance selon le cas 3. Ainsi, l’intervalle de confiance au niveau 95%
de la moyenne de la population µ est :
 
S S
IC = X̄ − z α2 × √ , X̄ + z α2 × √
n n
 √ √ 
0.07 0.07
= 4.7 − z0.025 × √ , 4.7 + z0.025 × √
150 150
 √ √ 
0.07 0.07
= 4.7 − 1.96 × √ , 4.7 + 1.96 × √
150 150
= [4.657659, 4.742341] .

361/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 2

L’erreur d’estimation est alors donnée par :



0.07
E = 1.96 × √ = 0.04234084
150

b) Cherchons la taille de l’échantillon n de sorte que la marge d’erreur


associée à l’intervalle de confiance soit plus petite que E = 0.02 avec
une confiance 1 − α = 0.95, c-à-d, z α2 = 1.96. Ceci s’obtient à l’aide de
la formule :
√ 2
s × z α2 2
 
0.07 × 1.96
n≥ = = 672.28.
E 0.02
Donc, la taille requise sera : n = 673.

362/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 3

Exercice 3. Les lectures de tension artérielle systolique (en mm Hg) sur un


individu à la même heure pendant 7 jours consécutifs sont :
161 155 142 157 150 158 156

Supposons que la tension artérielle suit une loi normale.


1. Déterminez un intervalle de confiance, au niveau de 95%, de la
moyenne µ de la tension artérielle de cet individu.
2. Déterminer la taille d’échantillon afin que la marge d’erreur d’un
intervalle de confiance de niveau 95% pour la moyenne µ soit inférieure
à 4 mm Hg ?
3. Déterminez un intervalle de confiance, au niveau de 95%, de l’écart-type
σ de la tension artérielle de cet individu.

363/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 3

Solution de exercice 3.
1. La tension artérielle est la variable à l’étude supposée suivre une loi
normale de variance inconnue σ 2 , donc, il s’agit du cas 2. Par
conséquent, l’intervalle de confiance au niveau 95% de la moyenne de la
population µ est :
 
S S
IC = X̄ − t α2 ,n−1 × √ , X̄ + t α2 ,n−1 × √
n n
 
6, 31 6, 31
= 154, 14 − t0.025,6 × √ , 154, 14 + t0.025,6 × √
7 7
 
6.31 6.31
= 154.14 − 2, 4469 × √ , 154.14 + 2, 4469 × √
7 7
= [148.3076, 159.9782] .

364/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 3

Notons que l’erreur d’estimation associée l’intervalle de confiance précédent


est :
6.31
E = 2.4469 × √ = 5.835748.
7

2. Cherchons la taille de l’échantillon n de sorte que la marge d’erreur


associée à l’intervalle de confiance soit plus petite que E = 4 mm Hg
avec une confiance 1 − α = 0.95, c-à-d, z α2 = 1.96. Ceci s’obtient à
l’aide de la formule :
s × z α2 2
   2
6.31 × 1.96
n≥ = = 16.99528.
E 4
Donc, la taille requise sera n = 17.

365/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 3

3. Puisque X1 , ..., X7 est un échantillon issu d’une population de loi normale


N(µ, σ 2 ), et dont la variance échantillonnalle vaut 6, 312 trouvée en
a),l’intervalle de confiance au niveau 95% de la variance de la
population σ 2 est :
" #
(n − 1)S 2 (n − 1)S 2
IC = ,
χ2α ,n−1 χ21− α ,n−1
2 2
" #
6 × 6, 312 6 × 6, 312
= ,
χ20.025,6 χ20.975,6
 
238, 86 238, 86
= ,
14, 4494 1, 2373
= [16, 53, 193, 04] .

366/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 3

Puisqu’on cherche l’intervalle de confiance pour σ , alors on a


hp p i
IC = 16, 53, 193, 04
= [4, 07, 13, 89] .

367/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 4

Exercice 4. Vous avez prélevé un échantillon sur un caractère X obéissant à


la loi N(µ, 4). Avec 5 observations, vous avez construit un intervalle de
confiance au niveau de 95% pour µ. L’intervalle obtenu est [7.7869, 11.2931].
Par la suite, vous vous rendez compte que vous avez oublié 3 observations
qui valent 10.6, 10.7 et 10.9. Reconstruisez votre intervalle de confiance de
niveau 95% pour µ en tenant compte de ces nouvelles observations.
rep : I.C = [8.601570709, 11.37342929]

368/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 4

Solution de l’exercice 4.
a) Trouvons la moyenne X̄5 basée sur l’échantillon de taille n = 5. On sait
que X̄5 est le milieu de l’intervalle de confiance
 
σ σ
IC = X̄5 − z 2 × √ , X̄5 + z 2 × √
α α = [7.7869, 11.2931] .
n n
Donc,
7.7869 + 11.2931
X̄5 = = 9.54.
2

369/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 4

b) En ajoutant les 3 données, la valeur de la moyenne basée sur les 8


observations sera
x6 + x7 + x8 + 5 × X̄5 10.6 + 10.7 + 10.9 + 5 × 9.54
X̄8 = =
8 8
= 9.9875.

Donc le nouveau intervalle de confiance sera :


 
σ σ
IC = X̄8 − z α2 × √ , X̄8 + z α2 × √
8 8
 
2 2
= 9, 9875 − 1.96 × √ , 9, 9875 + 1.96 × √
8 8
= [8.601570709, 11.37342929] .

370/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 5

Exercice 5. En 1976, la commission Carnegie effectua une étude portant sur


les N = 2700 institutions de l’enseignement supérieur des USA à l’aide d’un
échantillon aléatoire de taille n = 225. On a observé une moyenne de
X̄ = 3700 étudiants inscrits par institution, avec un écart-type s = 6000.
1. Trouver un intervalle de confiance de niveau de 95% pour µ, la moyenne
d’inscrits par institution. Donner l’erreur d’estimation relative à cet
intervalle de confiance.
2. Déterminer la taille d’échantillon afin que la marge d’erreur d’un
intervalle de confiance de niveau 95% pour la moyenne µ soit inférieure
à 600 étudiants.

371/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 5

Solution de l’exercice 5.
1. La variable à l’étude est le nombre d’inscriptions par institutions de loi
inconnue. Puisque l’échantillon est choisi sans remise à partir d’une
population de taille finie N = 2700 et de loi inconnue. Puisque la taille de
l’échantillon est n = 225 ≥ 30. Donc, on calcule l’intervalle de confiance
selon le cas 4. Par suite, l’intervalle de confiance au niveau 95% de la
moyenne de la population µ est :

372/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 5

" r r #
S N −n S N −n
IC = X̄ − z α ×√ × , X̄ + z α2 × √ ×
2
n N −1 n N −1
" r #
6000 2700 − 225
= 3700 ± z0.025 × √ ×
225 2700 − 1
" r #
6000 2700 − 225
= 3700 ± 1.96 × √ ×
225 2700 − 1
= [2949.23, 4450.76] .

L’erreur d’estimation est alors


r
6000 2700 − 225
E = 1.96 × √ × = 718.9329.
225 2700 − 1

373/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 5

2. Déterminons la taille d’échantillon afin que la marge d’erreur d’un


intervalle de confiance de niveau 95% pour la moyenne µ soit inférieure
à 600 étudiants. Puisque la taille de la population N est disponible, la
taille de l’échantillon s’obtient alors par la formule :
2
Nzα/2 s2 2700 × 1.962 × 60002
n≥ 2
=
(N − 1)E 2 + zα/2 s2 2699 × 6002 + 1.962 × 60002
= 336.4185.

Par conséquent la taille d’échantillon requise est : n = 337.

374/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 6

Exercice 6. On désire estimer la proportion p de pièces défectueuses parmi


celles produites dans une usine au cours d’une journée. On sait que 100 000
pièces sont produites chaque jour. Pour se faire, on prélève un échantillon de
n pièces d’une journée donnée.
a) Si n = 300 et que 21 pièces sont défectueuses dans cet échantillon,
donnez un intervalle de confiance de niveau de 95% de p.
b) On veut construire un intervalle de confiance au niveau de 95% pour p.
Quelle est la taille minimale d’échantillon nécessaire afin que la marge
d’erreur soit d’au plus 0.005 ?
rep : a) [0.04112793, 0.09887207] b) n = 9095

375/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 6

Solution de l’exercice 6.
a) Puisque la taille de la population est connue : N = 100000. L’intervalle
de confiance de p sera :
" r r #
p̂(1 − p̂) N −n
IC = p̂ ± z 2 ×
α ×
n N −1
" r r #
0.07 × 0.93 100000 − 300
= 0.07 ± z0.025 × ×
300 100000 − 1
" r r #
0.07 × 0.93 100000 − 300
= 0.07 ± 1.96 × ×
300 100000 − 1
= [0.04112793, 0.09887207] .

376/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 6

b) On cherche alors la taille de l’échantillon n de sorte que E = 0.005 et


z α2 = 1.96. Il suffit d’appliquer la formule suivante :

Nz 2α p̂(1 − p̂)
2
n ≥
(N − 1)E 2 + z 2α p̂(1 − p̂)
2

100000 × 1.962 × 0.07 × 0.93


=
99999 × 0.0052 + 1.962 × 0.07 × 0.93
= 9094.11

ce qui implique que la taille requise est n = 9095.

377/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 7

Exercice 7. Une firme de sondage désire estimer la proportion de personnes


en faveur d’un parti politique. Elle s’est fixée une marge d’erreur d’au plus 3%
et ce 19 fois sur 20. Combien de répondants lui faut-il ? Considérez le cas N
grand et N = 5 000.
rep : n1 = 1068 cas infini, et n2 = 880 cas N = 5000.

378/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 7

Solution de l’exercice 7. Sachant que l’erreur de sondage est fixée à


E = 3% = 0.03 et que la confiance est 1 − α = 19/20 = 95%, c’est-à-dire,
z α2 = 1.96. Puisqu’on ne dispose pas de pré-estimation p̂ de p, on prendra
alors p̂ = 0.5.
a) Sous ces conditions, la taille de l’échantillon requise lorsque la taille de
la population N est grande est donnée par la formule ci-dessous :
 α 2 2
z2

1.96
n≥ p̂(1 − p̂) = × 0.52 = 1067.11.
E 0.03
Donc, n = 1068.

379/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Intervalle de confiance de la moyenne
Échantillonnage et Estimation des paramètres
Intervalle de confiance d’une proportion
Estimation par intervalle de confiance
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices

Exercice 7

b) Par contre lorsque la taille de la population est connue, N = 5000, la


taille de l’échantillon requise sera calculée à partir de la formule
suivante :
Nz 2α p̂(1 − p̂)
2
n ≥
(N − 1)E 2 + z 2α p̂(1 − p̂)
2

5000 × 1.962 × 0.52


=
4999 × 0.032 + 1.962 × 0.52
= 879.56

ce qui nous donne n = 880.

Nous constatons qu’il est avantageux d’inclure dans les calculs la taille de la
population lorsqu’elle est connue. Ceci réduira la taille de sondage et permet
d’obtenir des économies.
380/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Test d’hypothèse

Mhamed Mesfioui, Ph. D.

mhamed.mesfioui@uqtr.ca

Automne 2021

381/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Test d’hypothèse

Exemple introductif
À la suite d’une compagne publicitaire portant sur les économies d’énergie,
un échantillon de 400 factures mensuelles révèle une consommation
moyenne de 480 kWh par mois et par logement avec un écart-type de 100
kwh. Avant cette campagne publicitaire, la consommation moyenne était de
490 kWh. On s’interroge sur l’effet de la campagne publicitaire. Cela revient à
confronter deux hypothèses :
H0 : La baisse de consommation observée est simplement due au hasard.
H1 : La baisse de consommation observée est réellement due à la
campagne publicitaire.

382/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Test d’hypothèse

Il s’agit de décider si l’on rejette l’hypothèse nulle H0 au profit de la seconde


H1 ou l’inverse. L’hypothèse nulle H0 représente habituellement l’hypothèse
conservatrice, celle qu’on accepte a priori, à moins que les observations ne
réussissent pas à nous convaincre du contraire.
Posons µ la consommation moyenne de la population après la publicité et
reformulons nos deux hypothèses de la manière suivante :
H0 : µ = 490 kWh : Campagne publicitaire n’a pas eu d’effet sur la
consommation.
H1 : µ < 490 kWh : Campagne publicitaire a porté fruit.

383/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Test d’hypothèse

Principe : L’idée générale d’un test est de supposer que H0 est vraie et
de ne la rejeter que si elle rend les résultats des observations trop
improbables.
Analyse : Supposons que H0 : µ = 490 kWh est vraie. Dans ce cas,
selon le théorème central limite, les fluctuations de X̄ sont
approximativement√ régies par la loi normale de moyenne µ = 490 et
d’écart-type σ/ n = 100/20 = 5. Maintenant, toujours sous H0 ,
évaluons les chances d’observer une valeur de X̄ aussi petite que 480,
c’est-à-dire si on répète notre sondage un grand nombre de fois,
combien de fois observerait-on une consommation moyenne de 480
kWh ou moins ? Ceci se calcule par :

P[X̄ ≤ 480|µ = 490] = P[Z ≤ −2] = 2.28%.

384/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Test d’hypothèse

Cette probabilité est appelée le seuil de signification empirique ou


probabilité empirique. De nombreux logiciels statistiques utilisent le mot
anglais “P-value".
Donc, si jamais la campagne publicitaire n’a pas réellement eu d’effet
significatif, des sondages auprès de 400 foyers nous donneraient une
consommation moyenne de 480 kWh ou moins dans 2.28% des cas
seulement !

385/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Test d’hypothèse

Étant donné qu’une probabilité de 2.28% peut être considérée assez


faible, la valeur de X̄ = 480 semble improbable sous H0 . Nous devrions
rejeter H0 et accepter H1 , c’est-à-dire la campagne publicitaire a porté
fruit. On dira que X̄ = 480 est statistiquement significative.
Le terme statistiquement significatif est un terme technique indiquant
simplement que l’on a suffisamment d’évidences pour croire que le
résultat observé n’est pas dû au simple hasard.

386/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Test d’hypothèse

Remarquons que si au lieu de X̄ = 480, notre sondage nous avait donné


X̄ = 485 alors dans le cas où µ = 490, les chances d’observer une
moyenne aussi petite que 485 auraient été

Pc = P[X̄ ≤ 485|µ = 490] = P[Z ≤ −1] = 15.87%.

Cela veut dire que lorsque la campagne publicitaire est sans effet, un
sondage auprès de 400 foyers nous donnerait une moyenne aussi petite
que 485 kWh environ 16 fois sur 100. Cela semble donc supporter H0 .
L’écart observé pourrait être attribuable au hasard et non à la campagne
publicitaire. Notons que plus le seuil de signification Pc est petit, plus
l’évidence est suffisamment forte pour rejeter H0 .

387/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Risque d’erreur

Dans un test d’hypothèse, on ne peut pas être certain de rejeter l’hypothèse


nulle H0 . On distingue deux types d’erreurs :
1) Erreur du type I : c’est la probabilité de rejeter H0 à tort

α = P[RH0 |H0 : vraie].

2) Erreur du type II : c’est la probabilité d’accepter H0 alors qu’elle est


fausse

β = P[H0 |H0 : fausse].

Remarque. La puissance du test qui mesure la qualité d’un test est définie
par :

π = 1 − β = P[RH0 |H0 : fausse].

388/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Comment exécuter un test d’hypothèse

Nous adoptons les étapes suivantes permettant d’élaborer un test


d’hypothèse :
1. Formulez les hypothèses H0 et H1 à tester.
2. Fixez d’avance le seuil de signification α qui représente le risque de
rejeter à tort H0 .
3. Précisez les conditions d’application du test.
4. Spécifiez la statistique qui convient pour faire le test.
5. Adoptez une règle de décision qui conduira au rejet ou non de
l’hypothèse nulle.
6. Décision et conclusion.

389/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Test sur une moyenne

On veut tester si la moyenne µ d’une population est statistiquement égale à


une valeur hypothétique, notée µ0 . On distingue trois types de tests :
1. H0 : µ = µ0 H1 : µ 6= µ0 : test bilatéral
2. H0 : µ = µ0 H1 : µ > µ0 : test unilatéral à droite.
3. H0 : µ = µ0 H1 : µ < µ0 : test unilatéral à gauche.
Pour exécuter ces tests, on distingue trois situations.

390/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Test sur une moyenne

Cas 1 : Si la variable à l’étude suit une loi normale de variance connue. Dans
ce cas la statistique du test sera :
Statistique de test :

X̄ − µ0
Z = √ ∼ N(0, 1) sous H0 .
σ/ n

Règles de décision :
1. Pour le test 1), on rejette H0 si |Z | > zα/2 .
2. Pour le test 2), on rejette H0 si Z > zα .
3. Pour le test 3), on rejette H0 si Z < −zα .

391/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Test sur une moyenne

Cas 2 : la variable à l’étude suit une loi inconnue de variance inconnue et la


taille de l’échantillon est assez grande (n ≥ 30).
Statistique de test :

X̄ − µ0
Z = √ ≈ N(0, 1) sous H0 .
S/ n

Règles de décision :
1. Pour le test 1), on rejette H0 si |Z | > zα/2 .
2. Pour le test 2), on rejette H0 si Z > zα .
3. Pour le test 3), on rejette H0 si Z < −zα .

392/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Test sur une moyenne

Cas 3 : la population est normale de variance inconnue et la taille de


l’échantillon est petite (n < 30).
Statistique de test :

X̄ − µ0
T = √ ∼ tn−1 sous H0 .
S/ n

Règles de décision :
1. Pour le test 1), on rejette H0 si |T | > tα/2,n−1 .
2. Pour le test 2), on rejette H0 si T > tα,n−1 .
3. Pour le test 3), on rejette H0 si T < −tα,n−1 .

393/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Test sur une proportion

On veut vérifier si la proportion p d’une population est statistiquement égale


à une proportion proposée p0 . La taille de l’échantillon doit être suffisamment
grande de sorte que les conditions np0 ≥ 5 et n(1 − p0 ) ≥ 5 soient
satisfaites. Les tests se présentent comme suit :
1. H0 : p = p0 H1 : p 6= p0 : test bilatéral.
2. H0 : p = p0 H1 : p > p0 : test unilatéral à droite.
3. H0 : p = p0 H1 : p < p0 : test unilatéral à gauche.

394/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Test sur une proportion

Statistique du test :
p̂ − p0
Z = q ≈ N(0, 1) sous H0
p0 (1−p0 )
n

où p̂ désigne la proportion estimée.


Règles de décision :
1. Pour le test 1), on rejette H0 si |Z | > zα/2 .
2. Pour le test 2), on rejette H0 si Z > zα .
3. Pour le test 3), on rejette H0 si Z < −zα .

395/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Test sur une proportion

Remarque importante
Pour tous les tests qui se basent sur la statistique du test Z ∼ N(0, 1), le plus
petit seuil αmin permettant de rejeter l’hypothèse nulle H0 sera :
1. Pour un test bilatéral αmin = 2(1 − φ(|Z |)).
2. Pour un test unilatéral à droite αmin = 1 − φ(Z ).
3. Pour un test unilatéral à gauche αmin = φ(Z ).
Cela signifie que si α > αmin on rejette H0 , sinon l’accepte.

396/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Test sur une variance

Supposons qu’on désire tester l’hypothèse que la variance σ 2 d’une


population normale N(µ, σ 2 ) est égale à une valeur spécifique σ02 . Soit un
échantillon aléatoire X1 , . . . , Xn issu de cette population et dont S 2 est sa
variance échantillonnale. On distingue trois tests :
1. H0 : σ 2 = σ02 H1 : σ 2 6= σ02 : test bilatéral.
2
2. H0 : σ = σ02 H1 : σ 2 > σ02 : test unilatéral à droite.
3. H0 : σ 2 = σ02 H1 : σ 2 < σ02 : test unilatéral à gauche.

397/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Test sur une variance

Statistique du test :

(n − 1)S 2
χ2 = ∼ χ2n−1 sous H0 .
σ02

Règles de décision :
1. Pour le test 1), on rejette H0 si χ2 ∈
/ χ21−α/2,n−1 , χ2α/2,n−1 .
 

2. Pour le test 2), on rejette H0 si χ2 > χ2α,n−1 .


3. Pour le test 3), on rejette H0 si χ2 < χ21−α,n−1 .

398/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Exercice 1

Exercice 1. On s’intéresse au quotient intellectuel (caractère X ) des


étudiants de l’UQTR. On sait que X obéit à la loi N(µ, σ 2 ). Un chercheur croit
que le Q.I. moyen des étudiants de l’UQTR est supérieur à celui de la
population en général qui est de 100 (c’est la norme). Il prélève donc un
échantillon de 15 étudiants et observe X̄ = 107, 4 et s2 = 83, 2. Testez
l’hypothèse du chercheur en utilisant un seuil expérimental de 5%.

399/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Exercice 1

Solution exercice 1. Soient µ0 = 100 le QI moyen de la population et µ le QI


moyen des étudiants de l’UQTR. Pour vérifier l’hypothèse formulée par le
chercheur, on doit confronter les hypothèses suivantes :

H0 : µ = 100 contre H1 : µ > 100.

La population à l’étude X qui est le QI suit une loi normale de variance


inconnue. Donc, il s’agit du cas 3 relatif au test d’hypothèse sur une
moyenne. Dans ce cas, la statistique du test sera de la forme suivante :
Statistique du test :

X̄ − µ0 107.4 − 100
T = S
= √ = 3.142069.
√ √83.2
n 15

400/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Exercice 1

Règle de décision : Comme c’est un test unilatéral à droite basé sur la


loi de Student, on doit donc comparer T à tα,n−1 = t0.05,14 = 1.76131.
Ainsi, puisque
T = 3.142069 > tα,n−1 = 1.76131
donc, on rejette H0 et on accepte H1 .

Conclusion : Au seuil α = 5%, le QI moyen des étudiants est


significativement plus grand que celui de la population.

401/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Exercice 2

Exercice 2. à la suite d’une campagne publicitaire d’économie d’énergie, afin


de faire diminuer la consommation d’électricité qui s’élève jusque là en
moyenne à 490 kWh par mois et par logement. Un échantillon de 400
factures mensuelles révèle une consommation moyenne de 480 kWh par
mois et par logement avec un écart-type de 100 kWh. Peut-on conclure que
l’effet de la campagne publicitaire est significatif au seuil 10% ?

402/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Exercice 2

Solution de l’exercice 2. Soit µ0 = 490 kWh la consommation moyenne


d’électricité par mois et par logement avant la publicité. Soit µ la
consommation moyenne de la population après la publicité. Pour vérifier
l’hypothèse formulée par la campagne publicitaire, on doit confronter les
hypothèses suivantes :

H0 : µ = 490 contre H1 : µ < 490.

La population à l’étude X qui est la consommation d’électricité par mois par


logement suit une loi inconnue, mais la taille d’échantillon n = 400 > 30, il
s’agit donc du cas 2 relatif au test d’hypothèse sur une moyenne. Dans ce
cas, la statistique du test sera de la forme suivante :

403/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Exercice 2.

Statistique du test :

X̄ − µ0 480 − 490
Z = S
= 100
= −2.
√ √
n 400

Règle de décision : Puisque c’est un test unilatéral à gauche basé sur


la loi normale, on doit donc comparer Z à −zα = −z0.10 = −1.285.
Ainsi, puisque
Z = −2 < −zα = −1.285
donc, on rejette H0 et on accepte H1 .

Conclusion : Au seuil α = 10%, la consommation moyenne d’électricité


a diminué d’une significative, ce qui permet de conclure que l’effet de la
publicité est significatif au seuil 10%.

404/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Exercice 3

Exercice 3. Des données recueillies avant 1980 permettent d’affirmer que la


température annuelle moyenne (en o C) à un endroit du globe obéit à une loi
normale de moyenne 10. Les températures annuelles moyennes observées à
cet endroit de 1980 à 1990 ont été les suivantes :
10.5 9.7 10.2 10.9 9.2 10.1 10.3 10.8 10.6 11.1 11.4
Avec un niveau de signification de 5% peut-on penser que la température
annuelle moyenne à cet endroit a augmenté ?

405/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Exercice 3

Solution de l’exercice 3. Soit µ0 = 10 la température annuelle moyenne à


un endroit du globe avant 1980 et soit µ sa température moyenne après
1980. Pour vérifier l’hypothèse formulée par le chercheur, on doit confronter
les hypothèses suivantes :

H0 : µ = 10 contre H1 : µ > 10.

La population à l’étude X qui est la température suit une loi normale de


variance inconnue. Donc, il s’agit du cas 3 relatif au test d’hypothèse sur une
moyenne. Dans ce cas, la statistique du test sera de la forme suivante :

406/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Exercice 3

Statistique du test :

X̄ − µ0 10.436 − 10
T = S
= √ = 2.286403.
√ √0.4
n 11

Règle de décision : Comme c’est un test unilatéral à droite basé sur la


loi de Student, on doit donc comparer T à tα,n−1 = t0.05,10 = 1.812461.
Ainsi, puisque

T = 2.286403 > tα,n−1 = 1.812461

donc, on rejette H0 et on accepte H1 .

Conclusion : Au seuil α = 5%, la hausse de la température est


significative.

407/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Exercice 4

Exercice 4. Un fabricant de disques compacts affirme que 99% de ses


disques n’ont aucune défectuosité. Pour vérifier cette affirmation, on teste
500 disques et on en trouve 10 défectueux.
a) Avec un niveau de signification de 5%, peut-on contester l’affirmation du
fabricant ?
b) Quel est le plus petit α qui permet de rejeter l’hypothèse nulle H0 ?

408/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Exercice 4

Solution de l’exercice 4.
a) Soit p0 = 0.01 la proportion de disques compacts défectueux affirmée
par le fabricant. Soit p la vraie proportion de disques compacts
défectueux. Pour vérifier l’affirmation du fabricant à propos de la
proportion des de disques compacts défectueux, on doit confronter les
hypothèses suivantes :

H0 : p = 0.01 contre H1 : p > 0.01.

La population à l’étude X qui est le nombre de disque sans défectuosité.


Pour éxcuter le test, on doit vérifier les deux inéquations suivantes :

np0 ≥ 5 et n(1 − p0 ) ≥ 5.

Ces dernières sont satisfaites, car np0 = 5 et n(1 − p0 ) = 495.

409/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Exercice 4

Puisque il s’agit d’un test d’hypothèse sur une proportion, la statistique du


test est donc de la forme suivante :
Statistique du test :
p̂ − p0 0.02 − 0.01
Z = √ = √ = 2.2473333.
p0 (1−p0 ) √0.0099
√ 500
n

Règle de décision : Comme c’est un test unilatéral à droite basé sur la


loi Normale, on doit donc comparer Z à zα = z0.05 = 1.645. Ainsi,
puisque
Z = 2.2247333 > zα = 1.645
donc on rejette H0 et on accepte H1 .

410/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Exercice 4

Conclusion : Au seuil α = 5%, on peut contester que 0.99 des disques


du fabricant est non défectueux.

b) Pour trouver le plus petit α, il suffit d’évaluer φ(Z ) car nous sommes en
présence d’un test unilatéral à droite.

αmin = 1 − φ(Z ) = 1 − φ(2.22) = 0.0132.

Donc, αmin = 0.0132 est le plus petit α qui permet de rejeter l’hypothèse
nulle H0 . Par exemple, on accepte H0 pour un risque α = 1% et la
rejette pour un risque α = 5%.

411/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Exercice 5

Exercice 5. Sur 1000 candidats au baccalauréat, 675 ont réussi.


1. Testez au niveau de 5% l’hypothèse selon laquelle la probabilité de
réussite est 0.7.
2. Quel est le plus petit α qui permet de rejeter l’hypothèse nulle H0 ?

412/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Exercice 5

1. Soit p la proportion d’étudiants qui ont réussi le baccalauréat. On veut


comparer cette proportion à une probabilité hypothétique, p0 = 0.70.
Pour ce faire, on doit confronter les hypothèses suivantes :
H0 : p = 0.70 contre H1 : p 6= 0.70.

Vérification des conditions du test : Pour éffectuer ce test, on doit


d’abord vérifier les inéquations suivantes :

np0 ≥ 5 et n(1 − p0 ) ≥ 5.
Ces dernières sont satisfaites car np0 = 700 et n(1 − p0 ) = 300.

413/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Exercice 5

Il s’agit d’un test d’hypothèse sur une proportion. Dans ce cas, la statistique
du test sera de la forme suivante :
Statistique du test :
p̂ − p0 0.675 − 0.70
Z = √ = √ = −1.725.
p0 (1−p0 )
√ √ 0.21
n 1000

Règle de décision : C’est un test bilatéral basé sur la loi Normale, on


doit donc comparer |Z | à z α2 = z0.025 = 1.96. Puisque

|Z | = 1.725 < z α2 = 1.96.

Donc, on accepte H0 .

Conclusion : Au seuil α = 5%, on peut affirmer que la probabilité de


réussir le baccalauréat est de 0.7.
414/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Risque d’erreur
Échantillonnage et Estimation des paramètres
Comment exécuter un test d’hypothèse
Estimation par intervalle de confiance
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance

Exercice 5.

2. Puisque le test est bilatéral, le plus petit α permettant de rejeter H0 est


donnée par :

αmin = 2(1 − φ(|Z |))


= 2(1 − φ(1.73))
= 2 × (1 − 0.9582) = 0.0836 = 8.36%.

415/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Test de comparaison

Mhamed Mesfioui, Ph. D.

mhamed.mesfioui@uqtr.ca

Automne 2021

416/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Comparaison de deux moyennes : Cas d’échantillons indépendants

On veut déterminer si deux populations sont semblables ou nettement


différentes par rapport à une caractéristique particulière.
Exemple. le ministère de l’éducation veut savoir si les enseignants sont
mieux payés que les enseignantes pour une tâche d’enseignement
équivalente. Soient µ1 et µ2 les salaires moyens des enseignants et des
enseignantes. Cela revient à tester si

417/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Comparaison de deux moyennes : Cas d’échantillons indépendants

H0 : µ1 = µ2 : aucune différence significative entre les salaires moyens.


contre :
H1 : µ1 > µ2 : les enseignants sont mieux payés que les enseignantes.

418/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Échantillons indépendants

Considérons deux populations différentes de moyennes µ1 et µ2 , et de


variances σ12 et σ22 . On s’intéresse aux tests d’hypothèses suivants :
1. H0 : µ1 = µ2 H1 : µ1 6= µ2 : test bilatéral.
2. H0 : µ1 = µ2 H1 : µ1 > µ2 : test unilatéral à droite.
3. H0 : µ1 = µ2 H1 : µ1 < µ2 : test unilatéral à gauche.
Pour élaborer ces tests, on prélève deux échantillons indépendants de ces
deux populations. On distingue trois cas possibles.

419/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Échantillons indépendants

Cas 1 : Populations normales de variances σ12 et σ22 connues.


Statistique du test :

X̄1 − X̄2
Z = q ≈ N(0, 1) sous H0 : µ1 = µ2
σ1 /n1 + σ22 /n2
2

Règles de décision : Les règles de décision seront :

1. Pour le test 1), on rejette H0 si |Z | > zα/2 .


2. Pour le test 2), on rejette H0 si Z > zα .
3. Pour le test 3), on rejette H0 si Z < −zα .

420/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Échantillons indépendants

Cas 2 : Populations normales de variances inconnues mais égales :


σ12 = σ22 = σ 2 .
Statistique du test :
Puisque les deux lois normales possèdent une variance commune, il est
donc commode d’utiliser les deux échantillons pour estimer σ 2 par la
variance échantillonnale combinée définie par :

(n1 − 1)S12 + (n2 − 1)S22


Sc2 = .
n1 + n2 − 2
Ainsi la statistique du test sera :

421/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Échantillons indépendants

X̄ − X̄2
T = p 1 ≈ tn1 +n2 −2 sous H0 : µ1 = µ2 .
Sc 1/n1 + 1/n2

Règles de décision :
1. Pour le test 1), on rejette H0 si |T | > tα/2,n1 +n2 −2 .
2. Pour le test 2), on rejette H0 si T > tα,n1 +n2 −2 .
3. Pour le test 3), on rejette H0 si T < −tα,n1 +n2 −2 .

422/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Échantillons indépendants

Cas 3 : Les deux tailles d’échantillons n1 et n2 sont ≥ 30.


Statistique du test :
Dans ce cas, il suffit d’appliquer le théorème central limite pour conclure que

X̄1 − X̄2
Z = q ≈ N(0, 1) sous H0 : µ1 = µ2 .
S12 /n1 + S22 /n2

Règles de décision :
1. Pour le test 1), on rejette H0 si |Z | > zα/2 .
2. Pour le test 2), on rejette H0 si Z > zα .
3. Pour le test 3), on rejette H0 si Z < −zα .

423/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 1

Exercice 1. Une entreprise de marketing croit que le prix moyen d’un certain
type de pantalons est plus bas à Montréal qu’à Québec. Elle choisit au
hasard 30 magasins à Montréal et trouve que la moyenne du prix est 42.36$
avec un écart-type de 3.96$. Elle choisit un autre échantillon, au hasard, de
30 magasins à Québec et trouve que la moyenne des prix est 45.49$ avec un
écart-type de 4.07$. Testez au seuil 5% l’hypothèse proposée ?

424/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 1

Réponse.
- µ1 : prix moyen de pantalons à Montréal
- µ2 : prix moyen de pantalons à Québec
- Populations de loi inconnues, mais avec les tailles d’échantillon
n1 = n2 = 30 ≥ 30, donc cette situation correspond bien au cas 3

Hypothèses à tester :

H 0 : µ1 = µ2 contre H1 : µ1 < µ2 .

425/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 1

Statistique du test :

X̄1 − X̄2
Z = r ≈ N (0, 1).
S12 S22
n1
+ n2

Puisque X̄1 = 42.36, X̄2 = 45.49, S1 = 3.96, S2 = 4.07 et n1 = n2 = 30,


donc
Z = −3.019
Règle de décision :
Z = −3.019 < −zα = −z0.05 = −1.645, donc on rejette H0 et on
accepte H1 . On conclut qu’au seuil 5%, les prix de ce type de pantalons
est significativement plus bas à Montréal qu’à Québec.

426/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 2

Exercice 2. On suppose que la longévité (nombre d’années vécues) d’un


individu est distribuée selon une loi normale. D’après des études actuarielles
récentes, la longévité des hommes a un écart-type de 4 ans, tandis que celle
des femmes à un écart-type de 6 ans. On voulait savoir si les femmes vivent
significativement plus longtemps que les hommes. Pour ce faire, on recueille
un échantillon de 60 personnes, dont 28 sont des femmes. La durée de vie
moyenne des hommes est 72 ans tandis que celle des femmes est de 75
ans. Quelle est la conclusion si on prend un seuil de 5% ?

427/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 2

Réponse.

- µ1 : longévité moyenne chez les hommes


- µ2 : longévité moyenne chez les femmes
- Populations de loi normales de variances connues. Il s’agit donc du cas
1

Hypothèses à tester :

H 0 : µ1 = µ2 contre H1 : µ1 < µ2 .

428/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 2

Statistique du test :

X̄1 − X̄2
Z = r ∼ N (0, 1).
σ12 σ22
n1
+ n2

Puisque X̄1 = 72, X̄2 = 75, σ1 = 4, σ2 = 6, n1 = 32 et n2 = 28, donc


Z = −2.2450.

Règle de décision :

Z = −2.2450 < −zα = −z0.05 = 1.645,

ce implique qu’on rejette H0 et on accepte H1 . Au seuil 5%, on conclut


que les femmes vivent significativement plus longtemps que les
hommes.
429/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 3

Exercice 3. Deux employés postulent à un même poste. Se prétendant plus


qualifié que son confrère, l’employé A affirme qu’il règle ses dossiers en un
temps moyen inférieur à celui de B. Afin de vérifier ses dires, la direction
relève le temps pris par chacun de ces employés pour compléter un
échantillon de 15 dossiers. Elle calcule, pour ces échantillons, un temps
moyen de 4.25h par dossier pour l’employé A et de 4.75h pour l’employé B
avec des variances respectives de 0.4 et 0.36h. D’autre part, on estime que
le temps nécessaire pour compléter ce type de dossier est distribué
normalement. On suppose que les variances des temps des employés sont
égales. Utilisez un seuil de 5% pour tester l’affirmation de l’employé A.

430/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 3

Réponse.
- µ1 : temps moyen de traitement de dossiers par l’employé A
- µ2 : temps moyen de traitement de dossiers par l’employé B
- Populations de loi normales de variances inconnues, mais supposées
égales. Il s’agit donc du cas 2.

Hypothèses à tester :

H 0 : µ1 = µ2 contre H1 : µ1 < µ2 .

431/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 3

Statistique du test :

X̄1 − X̄2
T = q ∼ tn1 +n2 −2 .
Sc n1 + n1
1 2

avec
(n1 − 1)S12 + (n2 − 1)S22
Sc2 =
n1 + n2 − 2
Puisque X̄1 = 4.25, X̄2 = 4.75, S12 = 0.4, S22 = 0.36, n1 = 15 et n2 = 15,
donc Sc2 = 0.38. d’où : T = −2.22

432/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 3

Règle de décision :
T = −2.22 < −tα,n1 +n2 −2 = −t0.05,28 = −1.697, donc on rejette H0 et on
accepte H1 . Donc, au seuil 5%, l’employé A traite significativement plus
rapidement ses dossiers que l’employé B.

433/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Comparaisons de deux variances de lois normales

Le cas 2 concernant le test comparant deux moyennes de deux


populations normales, se fait sous la supposition que les variances des
populations sont inconnues, mais égales. Pour vérifier cette dernière
condition, nous établirons une procédure statistique permettant de tester
l’égalité des variances de deux populations de lois normales.

434/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Comparaisons de deux variances de lois normales

Nous disposons de deux échantillons issus de deux lois normales de


variances respectives σ12 et σ22 , et nous désirons tester l’égalité de ces
variances. Désignons par S12 et S22 les variances échantillonales calculées à
partir de ces échantillons. Le test sera :

H0 : σ12 = σ22
H1 : σ12 6= σ22 : test bilatéral.

435/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Comparaisons de deux variances de lois normales

Statistique du test :

S12
F = ≈ Fn1 −1,n2 −1 sous H0 : σ12 = σ22 ,
S22

où Fn1 −1,n2 −1 désigne la loi de Fisher à n1 − 1 et n2 − 1 degrés de liberté.

Règles de décision. On rejette H0 si

F ∈
/ [F1−α/2,n1 −1,n2 −1 , Fα/2,n1 −1,n2 −1 ].

436/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Comparaisons de deux variances de lois normales

Remarque. Rappelons que la relation suivante est très utile lors de la lecture
dans la table de Fisher
1
F1−α,n,m = .
Fα,m,n

437/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 1

Exercice 1. Deux employés postulent à un même poste. Se prétendant plus


qualifié que son confrère, l’employé A affirme qu’il règle ses dossiers en un
temps moyen inférieur à celui de B. Afin de vérifier ses dires, la direction
relève le temps pris par chacun de ces employés pour compléter un
échantillon de 15 dossiers. Elle calcule, pour ces échantillons, un temps
moyen de 4.25h par dossier pour l’employé A et de 4.75h pour l’employé B
avec des variances respectives de 0.4 et 0.36h. D’autre part, on estime que
le temps nécessaire pour compléter ce type de dossier est distribué
normalement. Utilisez un seuil de 5% pour tester l’égalité des variances des
temps des deux employés A et B.

438/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 1

Réponse.
- σ12 : variance du temps utilisé par l’employé A
- σ22 : variance du temps utilisé par l’employé B
- S12 = 0.4 : variance échantillonale de l’employé A
- S22 = 0.36 : variance échantillonale de l’employé B
- Populations de lois normales

Hypothèses à tester :

H0 : σ12 = σ22 contre H1 : σ12 6= σ22 .

439/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 1

Statistique du test :

S12 0.4
F = 2
= = 1.11
S2 0.36

Règle de décision : Nous avons :

Fα/2,n1 −1,n2 −1 = F0.025,14,14 = 2.979,

1 1
F1−α/2,n1 −1,n2 −1 = F0.975,14,14 = = = 0.3357.
F0.025,14,14 2.979,
Puisque F = 1.11 ∈ [0.3357, 2.979], donc on accepte H0 , l’hypothèse
selon laquelle les deux variances sont significativement égales.

440/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 2

Exercice 2. Deux machines fabriquent des pièces métalliques. On


s’intéresse à comparer les poids moyens des pièces fabriquées par ces
machines. On suppose la normalités des populations. Voici les données
recueillies :
1. Machine 1 : n1 = 25, X̄1 = 0.984 et S12 = 13.46
2. Machine 2 : n2 = 30, X̄2 = 0.907 et S22 = 9.65
a) Testez, au seuil α = 0.05, l’hypothèse selon laquelle les variances des
deux machines sont égales.
b) Testez, au seuil α = 0.05, l’hypothèse selon laquelle les deux machines
fabriquent des pièces ayant le même poids moyen.

441/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 2

Réponse a).
- σ12 : variance du poids des pièces fabriquées par la machine 1
- σ22 : variance du poids des pièces fabriquées par la machine 2
- S12 = 13.46 : variance échantillonale de la machine 1
- S22 = 9.65 : variance échantillonale de la machine 2
- Populations de lois normales

Hypothèses à tester :

H0 : σ12 = σ22 contre H1 : σ12 6= σ22 .

442/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 2

Statistique du test :

S12 13.46
F = = = 1.3948.
S22 9.65

Règle de décision : Nous avons :

Fα/2,n1 −1,n2 −1 = F0.025,24,29 = 2.1540,

1 1
F1−α/2,n1 −1,n2 −1 = F0.975,24,29 = = = 0.4510
F0.025,29,24 2.2175
Puisque F = 1.3948 ∈ [0.4510, 2.1540], donc on accepte H0 ,
l’hypothèse selon laquelle les deux variances sont significativement
égales.

443/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 2

Réponse b).
- Populations normales avec variances inconnues, mais égales d’après a).
Hypothèses à tester :

H 0 : µ1 = µ2 contre H1 : µ1 6= µ2 .

Statistique du test :
Calculons d’abord la variance combinée :
(n1 − 1)S12 + (n2 − 1)S22
Sc2 = = 11.38.
n1 + n2 − 2

444/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 2

Ainsi, la statistique du test sera donnée par :

X̄ − X̄2
T = p 1 = 0.0843.
Sc 1/n1 + 1/n2

Règle de décision :
Puisque |T | = 0.0843 < t α2 ,n1 +n2 −2 = t0.025,53 ≈ 2.009, donc on accepte
H0 . On peut alors conclure, au seuil 5%, que les deux machines
fabriquent des pièces ayant le même poids moyen.

445/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Comparaisons de deux proportions

Le but est de comparer deux proportions p1 et p2 d’un même caractère dans


deux populations différentes. Lestests se présentent comme suit :
1. H0 : p1 = p2 H1 : p1 6= p2 : test bilatéral.
2. H0 : p1 = p2 H1 : p1 > p2 : test unilatéral à droite.
3. H0 : p1 = p2 H1 : p1 < p2 : test unilatéral à gauche.

446/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Comparaisons de deux proportions

Statistique du test :
Lorsque les tailles n1 et n2 des deux échantillons sont assez grandes de
sorte que n1 p̂ ≥ 5, n1 (1 − p̂) ≥ 5, n2 p̂ ≥ 5, n2 (1 − p̂) ≥ 5, où p̂ désigne
l’estimateur combiné calculé par la formule :
n1 p̂1 + n2 p̂2
p̂ = .
n1 + n2
Ainsi, la statistique du test appropriée sera :
p̂1 − p̂2
Z = r   ≈ N(0, 1) sous H0 .
p̂(1 − p̂) n1 + 1
n2
1

447/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Comparaisons de deux proportions

Règles de décision :

1. Pour le test 1), on rejette H0 si |Z | > zα/2 .


2. Pour le test 2), on rejette H0 si Z > zα .
3. Pour le test 3), on rejette H0 si Z < −zα .

448/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 1

Exercice 1. Deux traitements expérimentaux, A et B, sont utilisés contre une


maladie. Le traitement A est administré à 250 malades et le traitement B à
175 malades. Le traitement A donne lieu à 75 guérisons et le traitement B à
44 guérisons. Avec un seuil de signification de 10%, peut-on considérer que
les taux de guérison des 2 traitements ne sont pas identiques ? Quel est le
plus petit seuil α permettant de rejeter l’hypothèse nulle.

449/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 1

Réponse.
- p1 : taux de guérison du traitement A
- p2 : taux de guérison du traitement B
- La proportion combinée p̂ est :
75 44
n1 p̂1 + n2 p̂2 250 × 250 + 175 × 175
p̂ = = = 0.28.
n1 + n2 250 + 175

450/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 1

Vérification des conditions du test : En effet, les inégalités n1 p̂ ≥ 5,


n1 (1 − p̂) ≥ 5, n2 p̂ ≥ 5 et (1 − n2 )p̂ ≥ 5 sont satisfaites car :

n1 p̂ = 70, n1 (1 − p̂) = 180, n2 p̂ = 49 n2 (1 − p̂) = 126.

Hypothèses à tester :

H0 : p1 = p2 contre H1 : p1 6= p2 .

451/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 1

Statistique du test :
p̂1 − p̂2
Z = r   = 1.10.
p̂(1 − p̂) n1 + 1
n2
1

Règle de décision : Puisque |Z | = 1.10 est plus petite que


z α2 = z0.05 = 1.645, donc on ne rejette pas l’hypothèse H0 . On conclut
alors au seuil α = 10% que les deux remèdes ont le mème taux de
guérison.

452/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice 1

Calcul du plus petit seuil : Puisque, il s’agit d’un test bilatéral basé sur
la loi normale. Donc, le plus petit seuil α permettant de rejeter H0 est :

αmin = 2(1 − φ(|Z |)) = 2(1 − φ(1.10)) = 2(1 − 0.8643) = 27.14%.

Ceci signifie que pour rejeter H0 , il faut prendre un risque de premier


espèce au moins égale 27.14%. Ce qui montre que l’hypothèse H0 est
très solide.

453/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Échantillons dépendants (appariés)

Exemple. 10 individus ont été pesés avant et après avoir cessé de fumer
durant une période d’un mois. On veut tester l’hypothèse selon laquelle le fait
de cesser de fumer n’a aucun effet sur le poids. Cela revient à tester
H0 : µ1 = µ2 où µ1 et µ2 désignent respectivement les poids avant et après
avoir cessé de fumer. Pour exécuter le test on mesure les poids avant et
après avoir cessé de fumer de 10 individus :

Sujet 1 2 3 4 5 6 7 8 9 10
X1 : Poids
78 70 90 81 55 68 76 60 73 74
avant
X2 : Poids
78 69 92 83 55 72 74 63 74 76
après
D = X1 − X2 0 1 −2 −2 0 −4 2 −3 −1 −2

454/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Échantillons dépendants (appariés)

Il est clair que les variables X1 et X2 sont dépendantes via les individus.
Par conséquent les deux échantillons sont dépendants. On ne peut donc
pas utiliser la procédure du test établie dans le cas des échantillons
indépendants. Pour élaborer la procédure de test convenable, on pose
µD = µ1 − µ2 , par conséquent

H 0 : µ1 = µ2 ⇔ H0 : µD = 0.

Nous remarquons que µD = µ1 − µ2 est la moyenne de la variable


D = X1 − X2 .

455/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Échantillons dépendants (appariés)

Ainsi, les tests de comparaison de moyennes deviennent s’exprimeront


en fonction de la moyenne D comme suit :
1. HD : µD = 0 H1 : µD 6= 0 : test bilatéral.
2. HD : µD = 0 H1 : µD > 0 : test unilatéral à droite.
3. HD : µD = 0 H1 : µD < 0 : test unilatéral à gauche.
Pour établir ces tests, on distingue deux cas possibles :

456/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Échantillons dépendants (appariés)

Cas 1 : la différence D = X1 − X2 suit une loi normale.


Statistique du test :
On calcule la moyenne D̄ et la variance SD2 de la variable D = X1 − X2 . La
statistique du test sera alors :


T = √ ≈ tn−1 sous H0 : µD = 0.
SD / n

Règles de décision :
1. Pour le test 1), on rejette H0 si |T | > tα/2,n−1 .
2. Pour le test 2), on rejette H0 si T > tα,n−1 .
3. Pour le test 3), on rejette H0 si T < −tα,n−1 .

457/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Échantillons dépendants (appariés)

Cas 2 : la différence D = X1 − X2 de loi inconnue, mais la taille est assez


grande (n ≥ 30).
Statistique du test :
On calcule la moyenne et la variance et de la variable . La statistique du test
sera alors :


Z = √ ≈ N(0, 1) sous H0 : µD = 0.
SD / n

Règles de décision :
1. Pour le test 1), on rejette H0 si |Z | > zα/2 .
2. Pour le test 2), on rejette H0 si Z > zα .
3. Pour le test 3), on rejette H0 si Z < −zα .

458/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice

Exercice 1. On désire vérifier si le taux hypothécaire des banques a changé


durant deux trimestres consécutifs. Pour cela on recueille (en %) le taux X1
du premier et le taux X2 du deuxième trimestre de 9 banques. Posons
D = X1 − X2

Banque 1 2 3 4 5 6 7 8 9
X1 12 12.5 11.7 12 12.9 13 11.9 12.4 12.7
X2 12 12.5 11.6 12 12.8 13.1 11.9 12.3 12.5
D 0 0 0.1 0 0.1 −0.1 0 0.1 0.2

459/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice

Question : On suppose que la différence D suit une loi normale.


D’après ces résultats, peut-on affirmer que les taux hypothécaires sont
demeurés stables ? Prenez un seuil de signification de 5%.

Hypothèse à tester :

H 0 : µD = 0 contre H1 : µD 6= 0.

460/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants

Exercice

Statistique du test :
n n
1X 1 X
D̄ = di = .0444 et SD2 = (di − D̄)2 = 0.008.
n n−1
i=1 i=1

Donc

T = √ = 1.50.
SD / n
Règle de décision :
Puisque |t| = 1.50 < t0.025,8 = 2.3060, donc on accepte H0 .

Conclusion :
On conclut au seuil α = 5% que le taux hypothécaire des banques n’a
pas changé durant ces deux trimestres consécutifs.
461/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001

Vous aimerez peut-être aussi