Vous êtes sur la page 1sur 141

Université Mohammed V- Rabat ‫ﺟﺎﻣﻌﺔ ﻣﺣﻣد اﻟﺧﺎﻣس ـ اﻟرﺑﺎط‬

Faculté des Sciences Juridiques, ‫ﻛﻠﯾﺔ اﻟﻌﻠوم اﻟﻘﺎﻧوﻧﯾﺔ واﻻﻗﺗﺻﺎدﯾﺔ‬


Economiques et Sociales - Agdal ‫واﻻﺟﺗﻣﺎﻋﯾﺔ ـ أﻛدال‬

Licence d’excellence en Sciences de Gestion


Semestre 3
Matière: Statistique inférentielle
Professeur : BENBACHIR Saâd

Chapitre 1: Théorie de l’échantillonnage

50
Introduction :

La statistique inférentielle est fondée sur deux piliers: la


théorie de l'estimation et la théorie des tests.
Elle se base sur l’échantillonnage d’une population pour :
- estimer certains paramètres d’un caractère défini sur la
population à partir d’un échantillon.
- Tester ou comparer certains paramètres d’un caractère
défini sur deux ou plusieurs population à partir
d’échantillons tirés des différentes populations.

51
Chapitre 1: Théorie de l’échantillonnage
I. Définitions :
q Définition : Population
Une population est un ensemble, fini ou non, d'éléments que
l'on souhaite étudier. Il peut s'agir par exemple d'êtres
humains (adultes, enfants, chômeurs, salariés, etc.),
d'animaux ou encore d'objets (entreprises, voitures,
ordinateurs, incendies, accidents, etc.).
Les éléments de la population s’appellent des individus ou
unités statistiques.

q Définition : Unité statistique ou individu


Un élément appartenant à la population est appelé unité
statistique ou individu. 52
q Définition : Caractère ou variable statistique
La caractéristique étudiée sur la population est un caractère
ou variable statistique qui peut être qualitative (par exemple
la catégorie socio-professionnelle de 1'individu : cadre,
employé, etc.) ou quantitative (par exemple la taille ou le
salaire de l’individu).
Pour mener à bien une étude sur la population on peut
recourir à deux solutions : le recensement ou le sondage.

q Définition : Recensement
Un recensement consiste à mesurer ou observer le caractère
d'intérêt de façon exhaustive pour tous les individus de la
population.
Cette solution est très couteuse si la taille de la population
est très élevée. 53
q Définition : Sondage
Un sondage est une enquête partielle ou enquête par
échantillonnage, c’est une enquête au cours de laquelle
seulement une partie des individus est observée.

q Définition : Echantillonnage et échantillon aléatoire


Echantillonner une population consiste à sélectionner au
hasard un sous-ensemble de la population et à mesurer ou
observer le caractère d'intérêt sur ce sous-ensemble. Ce
sous-ensemble est appelé échantillon aléatoire.

54
q Définition : Tirage avec remise et tirage sans remise
Le tirage de l'échantillon peut se faire avec remise (un même
individu de la population peut apparaître plusieurs fois dans
l'échantillon : échantillon aléatoire simple) ou sans remise
(chaque individu de la population ne peut apparaître qu'une
seule fois dans l'échantillon).

q Définition : Taux de sondage


Le taux de sondage est le rapport entre la taille de
l’échantillon et la taille de la population :
𝒏
𝒇=
𝑵
55
q Définition : Variable aléatoire parente
Le caractère d’intérêt est représenté par une variable
aléatoire 𝑋 appelée variable mère ou parente.
Lorsque le caractère est quantitatif la variable 𝑋 est dite
continue. Lorsque le caractère est qualitatif la variable 𝑋 est
dite discrète. Les paramètres de la variable parente X sont :
𝐸 𝑋 = 𝑚 𝑉𝑎𝑟 𝑋 = 𝜎 -
q Définition : Echantillon de variables aléatoires
Lorsqu’on tire un échantillon aléatoire d’individus de taille
𝑛 on associe à chaque individu 𝑖 la variable 𝑋0 qui suit la
même loi que la variable parente 𝑋. On obtient ainsi un
échantillon de 𝑛 variables aléatoires 𝑋1 , 𝑋- , …, 𝑋2 qui
suivent la même loi que 𝑋 et avec:
𝑬 𝑿𝒊 = 𝑬 𝑿 = 𝒎 𝑽𝒂𝒓 𝑿𝒊 = 𝑽𝒂𝒓 𝑿 = 𝝈𝟐
56
q Définition : Echantillon exhaustif et non exhaustif
Lorsque le tirage est sans remise, on dit que l’échantillon
est exhaustif et les variables aléatoires 𝑋1 , 𝑋- , …, 𝑋2 ne
sont pas indépendantes. Lorsque et le tirage est avec
remise, on dit que l’échantillon est non exhaustif et les
variables sont indépendantes.

q Définition : Statistique sur un échantillon aléatoire


On appelle statistique sur un échantillon aléatoire 𝑋1 , 𝑋- ,
…, 𝑋2 de taille 𝑛 une fonction des variables aléatoires 𝑋1 ,
𝑋- , …, 𝑋2 .

q Exemple : La moyenne de l’échantillon 𝑋1 , 𝑋- , …, 𝑋2


1 2
< <
notée 𝑋2 est une statistique : 𝑋2 = ∑0>1 𝑋0
2 57
II. Echantillonnage pour un caractère quantitatif
On considère une population 𝒫 de taille 𝑁. On définit sur
cette population un caractère quantitatif représenté par une
variable aléatoire continue 𝑋 de paramètres 𝐸 𝑋 = 𝑚 et
𝑉𝑎𝑟 𝑋 = 𝜎 - .

𝒫: population 𝑋: variable aléatoire parente continue


× ×

×
× × × 𝐸 𝑋 = 𝑚: moyenne dans 𝒫
× ×
× ×
i ×
𝑉𝑎𝑟 𝑋 = 𝜎 - : variance dans 𝒫
×
×
× ×
× ×
×

58
II.1 Moyenne, variance et quasi-variance d’échantillon

q Définition : Moyenne empirique


On appelle moyenne empirique de l’échantillon aléatoire
𝑋1 , 𝑋- , …, 𝑋2 la statistique notée 𝑋<2 et définie par :
𝒏
𝟏
C 𝒏 = E 𝑿𝒊
𝑿
𝒏
𝒊>𝟏

q Définition : Variance empirique


On appelle variance empirique de l’échantillon aléatoire
𝑋1 , 𝑋- , …, 𝑋2 la statistique notée 𝑆2- et définie par :
𝒏
𝟏
𝑺𝟐𝒏 C𝒏
= E 𝑿𝒊 − 𝑿 𝟐
𝒏 59
𝒊>𝟏
q Définition : Variance empirique corrigée ou Quasi-
Variance

On appelle quasi-variance de l’échantillon aléatoire 𝑋1 , 𝑋- ,


…, 𝑋2 la statistique notée 𝑆′-2 et définie par :
𝒏
𝟏
𝑺′𝟐𝒏 = C𝒏
E 𝑿𝒊 − 𝑿 𝟐
𝒏−𝟏
𝒊>𝟏

q Relation entre 𝑺𝟐𝒏 et 𝑺′𝟐𝒏 :


𝒏
𝑺′𝟐𝒏 = 𝑺𝟐𝒏
𝒏−𝟏

60
q Définition : Moyenne de la moyenne empirique
On considère la moyenne empirique 𝑋<2 de l’échantillon
aléatoire 𝑋1 , 𝑋- , …, 𝑋2 :
2
1
𝑋<2 = E 𝑋0
𝑛
0>1
La moyenne de 𝑋<2 est donnée par :
C𝒏 = 𝒎
𝑬 𝑿
q Définition : Variance de la moyenne empirique
La variance de 𝑋<2 est donnée par :
𝝈𝟐 𝐍 − 𝒏
× 𝐬𝐢 Echantillon est sans remise et 𝑵 𝒇𝒊𝒏𝒊
C𝒏 =
𝑽𝒂𝒓 𝑿 𝒏 𝐍−𝟏
𝝈𝟐
𝐬𝐢 Echantillon est avec remise ou 𝒔𝒊 𝑵 𝒊𝒏𝒇𝒊𝒏𝒊
𝒏 61
q Définition: Moyenne de la variance empirique
On considère la variance empirique 𝑆2- :
2
1
𝑆2 = E 𝑋0 − 𝑋<2 -
-
𝑛
0>1
La moyenne de 𝑆2- est donnée par :
𝟐
𝒏−𝟏 𝟐
𝑬 𝑺𝒏 = 𝝈
𝒏
q Définition: Variance de la variance empirique
Lorsque l’échantillon est avec remise ou la population est
infinie (𝑁 → +∞) alors la variance de 𝑆2- est donnée par :
𝒏−𝟏
𝑽𝒂𝒓 𝑺𝟐𝒏
= 𝒏 − 𝟏 𝝁𝟒 − 𝒏 − 𝟑 𝝈 𝟒
𝒏𝟑
où 𝜇U = 𝐸 𝑋 − 𝑚 U est le moment centré d’ordre 4. 62
q Définition: Moyenne de la quasi-variance
On considère la quasi-variance 𝑆′-2 :
2
1
-
𝑆′2 = E 𝑋0 − 𝑋<2 -
𝑛−1
0>1
La moyenne de la quasi-variance 𝑆′-2 est donnée par :
𝟐
𝒏−𝟏 𝟐
𝑬 𝑺′𝒏 = 𝝈
𝒏
q Définition: Variance de la quasi-variance
Lorsque l’échantillon est avec remise ou la population est
infinie (𝑁 → +∞) alors la variance de la quasi-variance est
donnée par :
𝟏
𝑽𝒂𝒓 𝑺′𝟐𝒏 = 𝒏 − 𝟏 𝝁𝟒 − 𝒏 − 𝟑 𝝈𝟒
𝒏 𝒏−𝟏
63
II.2 Distribution d’échantillonnage de la moyenne :

𝒫: population 𝑋: variable aléatoire parente continue


× ×

×
× × × 𝐸 𝑋 = 𝑚: moyenne dans 𝒫
× ×
× ×
i ×
𝑉𝑎𝑟 𝑋 = 𝜎 - : variance dans 𝒫
×
×
× ×
× ×
×

On considère un échantillon aléatoire 𝑋1 , 𝑋- , …, 𝑋2 . On a :


𝐸 𝑋<2 = 𝑚
𝑉𝑎𝑟 𝑋<2 = 𝜎W-<X
𝜎- 𝑁 − 𝑛
× 𝑠𝑖 Echantillon est sans remise et 𝑐𝑎𝑟𝑑 𝒫 = 𝑁
= 𝑛- 𝑁−1
𝜎
𝑠𝑖 Echantillon est avec remise ou 𝑠𝑖 𝑁 → +∞
𝑛 64
§ Si 𝒏 ≥ 𝟑𝟎 alors grâce au théorème central limite on a :
C 𝒏 ↝ 𝓝 𝒎, 𝝈𝟐𝑿C
𝑿 𝒏
C𝒏 − 𝒎
𝑿
𝒁 = ↝ 𝓝 𝟎, 𝟏
𝝈𝑿C𝒏
𝑋<2 − 𝑚
si Echantillon est sans remise et 𝑐𝑎𝑟𝑑 𝒫 = 𝑁
𝜎 𝑁−𝑛
= 𝑛 𝑁−1
𝑋<2 − 𝑚
𝜎 si Echantillon est avec remise ou 𝑠𝑖 𝑁 → +∞
𝑛
Si 𝜎 - est inconnue alors on remplace 𝜎 par la 𝑠2e où 𝑠′-2 est
1
-
la quasi-variance : 𝑠′2 = ∑20>1 𝑥0 − 𝑥̅2 -
2f1
65
§ Si 𝒏 < 𝟑𝟎 et si 𝑿 ↝ 𝓝 𝒎, 𝝈𝟐 avec 𝝈𝟐 connue alors :
𝑋1 , 𝑋- , …, 𝑋2 ↝ 𝒩 𝑚, 𝜎 -
C𝒏 − 𝒎
𝑿
C𝒏 ↝ 𝓝
𝑿 𝒎, 𝝈𝟐𝑿C𝒏 𝑒𝑡 𝒁 = ↝ 𝓝 𝟎, 𝟏
𝝈𝑿C𝒏
§ Si 𝒏 < 𝟑𝟎 et si 𝑿 ↝ 𝓝 𝒎, 𝝈𝟐 avec 𝝈𝟐 inconnue alors
on remplace 𝜎 - par la quasi-variance 𝑆′-2 :
C𝒏 − 𝒎
𝑿
𝑻= ↝𝒕 𝒏−𝟏
n 𝑿C𝒏
𝝈
𝑋<2 − 𝑚
si Echantillon est sans remise et 𝑐𝑎𝑟𝑑 𝒫 = 𝑁
𝑆′2 𝑁 − 𝑛
𝑛 𝑁−1
=
𝑋<2 − 𝑚
si Echantillon est avec remise ou 𝑠𝑖 𝑁 → +∞
𝑆′2
𝑛 66
II.3 Distribution d’échantillonnage de la variance :

𝒫: population 𝑋: variable aléatoire parente continue


× ×

×
× × × 𝐸 𝑋 = 𝑚: moyenne dans 𝒫
× ×
× ×
i ×
𝑉𝑎𝑟 𝑋 = 𝜎 - : variance dans 𝒫
×
×
× ×
× ×
×

On considère la variance empirique 𝑆2- et la quasi-variance


𝑆′-2 de l’échantillon des 𝑛 variables aléatoires indépendantes
𝑋1 , 𝑋- , …, 𝑋2 .

Si 𝑿 ↝ 𝓝 𝒎, 𝝈𝟐 alors :
𝒏𝑺𝟐𝒏 C𝒏
𝒏 − 𝟏 𝑺′𝟐𝒏 ∑𝒏𝒊>𝟏 𝑿𝒊 − 𝑿 𝟐

𝟐
= 𝟐
= ↝ 𝝌𝟐 𝒏 − 𝟏
𝝈 𝝈 𝝈𝟐
67
II.3 Exercices : Distribution d’échantillonnage de la
moyenne

q Exercice 1 :
Le directeur des ressources humaines d’une entreprise a
établi que les résultats à un test mesurant la dextérité
manuelle de la main d’oeuvre affectée à des taches
d’assemblages de pièces complexes sont distribués d’après
la loi normale de moyenne 𝑚 = 72 et de variance 𝜎 - =
36.
1) Quelle est la probabilité qu’un employé sélectionné au
hasard obtienne un score de dextérité manuelle inférieur
à 63 ?
68
2) Un échantillon aléatoire de 25 employés a subi le test de
dextérité manuelle.
i) Quelle est la distribution de la moyenne empirique?
ii) Quelle est la distribution de la variance de l’échantillon?
3) Quelle est la probabilité que la moyenne empirique soit
comprise entre 69 et 75 ?
4) Quelle est la probabilité que l’écart entre la moyenne de
empirique et la moyenne de la population soit supérieur
à3?

69
q Solution :

𝒫: population 𝑋 = Déxtérité manuelle: variable parente


× ×
× ×
×
× 𝐸 𝑋 = 𝑚 = 72 : Dextérité moyenne dans 𝒫
Employés
i
×
×
×
×
×
𝑉𝑎𝑟 𝑋 = 𝜎 - = 36 : variance dans 𝒫
×

𝑋 ↝ 𝒩 𝑚, 𝜎 -
1) On sélectionne un employé au hasard. Calculons la
probabilité pour que sa dextérité manuelle soit inférieure
à 63. Il faut calculer 𝑝 𝑋 < 63 .

On a d’après l’énoncé :
-
𝑋−𝑚
𝑋 ↝ 𝒩 𝑚, 𝜎 ⟺𝑍= ↝ 𝒩 0,1
𝜎 70
Donc :
𝑋 − 𝑚 63 − 𝑚 63 − 72
𝑝 𝑋 < 63 = 𝑝 < =𝑝 𝑍<
𝜎 𝜎 6
9
= 𝑝 𝑍 < − = 𝑝 𝑍 < −3 = 𝜋 −3 = 1 − 𝜋 3
6
où 𝜋 est la fonction de répartition de la loi normale centrée
et réduite 𝒩 0,1 .
Donc :
𝑝 𝑋 < 63 = 1 − 𝜋 3 = 0,998665 = 99,87% ⟺
𝑝 𝑋 < 63 = 0,9987 = 99,87%

Interprétation : 99,87% des employés de l’entreprise ont une


dextérité manuelle inférieure 63 selon le test. 71
2) Un échantillon aléatoire de 25 employés a subi le test de
dextérité manuelle. On considère l’échantillon de variables
aléatoires 𝑋1 , 𝑋- , …, 𝑋-… associées à ces 25 employés.

i) Cherchons la distribution de la moyenne empirique


𝑋<-… :
-…
1
𝑋<-… = E 𝑋0
25
0>1

Comme :
𝑋 ↝ 𝒩 𝑚, 𝜎 -
On déduit la loi de 𝑋<-… :
𝑋<-… ↝ 𝒩 𝐸 𝑋<-… , 𝜎W-<†‡ 72
Comme la taille de la population 𝑁 est inconnue on va
supposer qu’elle est infinie (ce qui équivaut à un tirage avec
remise). Dans ce cas on a :

𝐸 𝑋<-… = 𝑚 = 72
𝜎 - 36
𝑉𝑎𝑟 𝑋<-… = 𝜎W-<†‡ = = = 1,44
𝑛 25

Donc :
𝑋<-… ↝ 𝒩 72 ; 1,44

73
ii) Cherchons est la distribution de la variance de
l’échantillon :
-…
1
-
𝑆-… = E 𝑋0 − 𝑋<-… -
25
0>1

Comme 𝑋 ↝ 𝒩 𝑚, 𝜎 - donc :

𝑛𝑆2- -
-
↝ 𝜒 𝑛−1 ⟺
𝜎
25 -
𝑆-… ↝ 𝜒 - 𝑛 − 1
36

74
3) Calculons la probabilité que la moyenne empirique soit
comprise entre 69 et 75 :

𝑝 69 < 𝑋<-… < 75 =


69 − 𝐸 𝑋<-… 𝑋<-… − 𝐸 𝑋<-… 75 − 𝐸 𝑋<-…
𝑝 < < =
𝜎W<†‡ 𝜎W<†‡ 𝜎W<†‡
69 − 72 75 − 72
𝑝 <𝑍< = 𝑝 −2,5 < 𝑍 < 2,5
1,44 1,44
Or :
𝑋<-… − 𝐸 𝑋<-…
𝑍= ↝ 𝒩 0,1
𝜎W<†‡
Donc :
𝑝 69 < 𝑋<-… < 75 = 𝜋 2,5 − 𝜋 −2,5
75
= 𝜋 2,5 − 1 − 𝜋 2,5 = 2×𝜋 2,5 − 1
= 2×0,9938 − 1 = 0,9876

𝑝 69 < 𝑋<-… < 75 = 0,9876 = 98,76%

4) Calculons la probabilité pour que l’écart entre la


moyenne empirique 𝑋<-… et la moyenne de la population 𝑚
soit supérieur à 3.

𝑝 𝑋<-… − 𝑚 > 3 = 𝑝 𝑋<-… − 72 > 3 = 𝑝 𝑋<-… > 75


= 1 − 𝑝 𝑋<-… < 75
𝑋<-… − 𝐸 𝑋<-… 75 − 𝐸 𝑋<-…
=1−𝑝 <
𝜎W<†‡ 𝜎W<†‡
76
75 − 72
=1−𝑝 𝑍 < = 1 − 𝑝 𝑍 < 2,5 = 1 − 𝜋 2,5
1,44
= 1 − 0,9938 = 0,0062

D’où :
𝑝 𝑋<-… − 𝑚 > 3 = 0,0062 = 0,62%

77
q Exercice 2 :
On suppose que les étudiants d’un cours de comptabilité
générale, noté sur 100, aient des notes normalement
distribuées avec une moyenne 𝑚 = 72 et un écart-type
σ = 9,1.
1) Trouver la probabilité pour qu’un seul choisi au hasard
ait une note supérieure à 80,2.
2) Trouver la probabilité pour qu’un échantillon aléatoire
de 10 étudiants ait une note moyenne supérieure à 80,3.

78
q Solution :

𝒫: population
× × 𝑋 = Note de comptabilité générale
× × ×
×
𝐸𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑠
i 𝐸 𝑋 = 𝑚 = 72 : Note moyenne dans 𝒫
×
× ×
× ×
×
𝑉𝑎𝑟 𝑋 = 𝜎 - = 9,1- = 82,81 : Variance dans 𝒫
𝑋 ↝ 𝒩 𝑚, 𝜎 -
1) Trouvons la probabilité pour qu’un étudiant choisi au
hasard ait une note supérieure à 80,2 :
𝑋 − 𝑚 80,2 − 𝑚
𝑝 𝑋 > 80,2 = 𝑝 >
𝜎 𝜎
79
80,2 − 72 8,2
=𝑝 𝑍> =𝑝 𝑍>−
9,1 9,1
= 𝑝 𝑍 > −0,901 = 1 − 𝑝 𝑍 < −0,901 =
1 − 𝜋 −0,901 = 𝜋 0,901 = 0,8186
𝑝 𝑋 > 80,2 = 0,8186 = 81,86%
Interprétation : 81,86% des étudiants ont une note supérieure
à 80,2
2) Calculons la probabilité pour qu’un échantillon aléatoire
de 10 étudiants ait une note moyenne supérieure à 80,3. Soit
𝑋1 , 𝑋- , …, 𝑋1Ž l’échantillon aléatoire des notes des 10
étudiants. La note moyenne empirique est donnée par :

1
𝑋<1Ž = E 𝑋0
10 80
0>1
Calculons la probabilité :
𝑋<1Ž − 𝐸 𝑋<1Ž 80,3 − 𝐸 𝑋<1Ž
𝑝 𝑋<1Ž > 80,3 = 𝑝 >
𝜎W<•• 𝜎W<••
La moyenne de 𝑋<1Ž est donnée par :
𝐸 𝑋<1Ž = 𝑚 = 72
La variance de 𝑋<1Ž est donnée par : (on suppose que la taille
de la population est infinie) :
-
𝜎 82,81
𝑉𝑎𝑟 𝑋<1Ž = 𝜎W<•• =
-
= = 8,281. 𝜎W<•• = 2,8776
𝑛 10
D’où :
80,3 − 72
𝑝 𝑋<1Ž > 80,3 = 𝑝 𝑍 > = 𝑝 𝑍 > 2,88
2,8776
= 1 − 𝑝 𝑍 < 2,88 = 1 − 𝜋 2,88 = 0,998 ⟺
𝑝 𝑋<1Ž > 80,3 = 0,998 = 99,80% 81
q Exercice 3 :
La taille dans une population d’étudiants suit une loi
normale de moyenne égale à 1,70 m et un écart-type égal à
0,8 m.
Si un échantillon de 10 étudiants est prélevé, quelle est la
probabilité pour que la taille moyenne empirique s’écarte
de 6 cm de la taille moyenne de la population.
q Solution :
𝒫: population
× ×
× ×
𝑋 = Taille
×
×
𝐸𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑠
i 𝐸 𝑋 = 𝑚 = 1,70𝑚 : Taille moyenne dans 𝒫
×
× ×
× ×
×
𝑉𝑎𝑟 𝑋 = 𝜎 - = 0,8- = 0,64 : variance dans 𝒫
𝑋 ↝ 𝒩 𝑚, 𝜎 - 82
2) Soit 𝑋1 , 𝑋- , …, 𝑋1Ž l’échantillon aléatoire des tailles des
10 étudiants choisis. La taille moyenne empirique est définie
par :

1
𝑋<1Ž = E 𝑋0
10
0>1

Calculons la moyenne et l’écart-type de 𝑋<1Ž : on suppose


que la taille de la population est infinie
𝐸 𝑋<1Ž = 𝑚 = 1,70
-
𝜎 0,64
< -
𝑉𝑎𝑟 𝑋1Ž = 𝜎W<•• = = = 0,064
𝑛 10
𝜎W<•• = 0,25298
83
Calculons la probabilité pour que la taille moyenne de
l’échantillon s’écarte de 6 𝑐𝑚 = 0,06𝑚 de la taille
moyenne de la population :
𝑋<1Ž − 𝑚 0,06
𝑝 𝑋<1Ž − 𝑚 > 0,06 = 𝑝 >
𝜎W<•• 𝜎W<••
𝑋<1Ž − 𝑚
=𝑝 > 0,2372
𝜎W<••
Comme :
𝑋 ↝ 𝒩 𝑚, 𝜎 -

On déduit :
<1Ž − 𝑚
𝑋
𝑋<1Ž ↝ 𝒩 𝐸 𝑋<1Ž , 𝜎W-<•• ⟺ 𝑍 = ↝ 𝒩 0,1
𝜎W<••
84
D’où :
𝑝 𝑋<1Ž − 𝑚 > 0,06 = 𝑝 𝑍 > 0,24 = 1 − 𝑝 𝑍 < 0,24
= 1 − 𝜋 0,24 = 0,5948 ⟺

𝑝 𝑋<1Ž − 𝑚 > 0,06 = 0,5948 = 59,48 %

85
q Exercice 4 :
Un bureau de conseil en organisation et méthodes auprès des
entreprises a mis au point un système d’appréciation ou
d’évaluation de cadres d’entreprise. Diverses caractéristiques
des cadres sont évaluées et on a établi sur une période de
quatre ans que le score global à cette batterie de tests était
distribué normalement avec une moyenne 𝑚 = 600 et un
écart-type 𝜎 = 50. Supposons qu’on fait subir à un échantillon
aléatoire de 25 cadres d’une multinationale l’ensemble des
tests.
1) Caractériser la distribution d’échantillonnage de la
moyenne.
2) Quelle est la probabilité que la moyenne empirique soit
comprise entre 590 et 610 ?
3) Entre quelle valeurs la moyenne empirique peut-elle varier
86
dans 95% des cas autour de 𝑚?
q Solution :

𝒫: population
× × 𝑋 = Score global des tests
× × ×
×
𝐶𝑎𝑑𝑟𝑒𝑠
i 𝐸 𝑋 = 𝑚 = 600 : Score moyen dans 𝒫
×
× ×
× ×
×
𝑉𝑎𝑟 𝑋 = 𝜎 - = 50- = 2500 : variance dans 𝒫
𝑋 ↝ 𝒩 𝑚, 𝜎 -

Soit 𝑋1 , 𝑋- , …, 𝑋-… l’échantillon aléatoire des scores des 25


cadres choisis. Le score moyen empirique est défini par :
-…
1
𝑋<-… = E 𝑋0
25
0>1
87
1) Calculons la moyenne et l’écart-type de 𝑋<-… : (on
suppose que la taille de la population est infinie)
𝐸 𝑋<-… = 𝑚 = 600
-
𝜎 2500
𝑉𝑎𝑟 𝑋<-… = 𝜎W<†‡ =
-
= = 100
𝑛 25
𝜎W<†‡ = 10

Comme :
𝑋 ↝ 𝒩 𝑚, 𝜎 -
On déduit la distribution d’échantillonnage de 𝑋<-… :

𝑋<-… ↝ 𝒩 𝐸 𝑋<-… , 𝜎W-<†‡ ⟺

𝑋<-… ↝ 𝒩 600,100
88
2) Calculons :
𝑝 590 < 𝑋<-… < 610

590 − 𝐸 𝑋<-… 𝑋<-… − 𝐸 𝑋<-… 610 − 𝐸 𝑋<-…


=𝑝 < <
𝜎W<†‡ 𝜎W<†‡ 𝜎W<†‡
590 − 600 610 − 600
=𝑝 <𝑍<
10 10
Où :
𝑋<-… − 𝐸 𝑋<-…
𝑍= ↝ 𝒩 0,1
𝜎W<†‡
Donc :
𝑝 590 < 𝑋<-… < 610 = 𝑝 −1 < 𝑍 < 1
89
= 𝜋 1 − 𝜋 −1 = 𝜋 1 − 1 − 𝜋 1 = 2×𝜋 1 − 1
= 2×0,8413 − 1 = 0,6826
On déduit :
𝑝 590 < 𝑋<-… < 610 = 0,6826 = 68,26 %
3) Cherchons 𝑎 > 0 tel que :
𝑝 𝑋<-… ∈ 𝑚 − 𝑎, 𝑚 + 𝑎 = 0,95 ⟺
𝑝 𝑚 − 𝑎 ≤ 𝑋<-… ≤ 𝑚 + 𝑎 = 0,95 ⟺
𝑝 −𝑎 ≤ 𝑋<-… − 𝑚 ≤ 𝑎 = 0,95 ⟺
−𝑎 𝑋<-… − 𝑚 𝑎
𝑝 < < = 0,95 ⟺
𝜎W<†‡ 𝜎W<†‡ 𝜎W<†‡
−𝑎 𝑎 𝑎 −𝑎
𝑝 <𝑍< = 0,95 ⟺ 𝜋 −𝜋 = 0,95
10 10 10 10
𝑎 𝑎
⟺𝜋 − 1−𝜋 = 0,95 90
10 10
𝑎
⟺ 2×𝜋 − 1 = 0,95 ⟺
10
𝑎 1,95 𝑎
𝜋 = = 0,975 ⟺ = 1,96 ⟺ a = 19,6
10 2 10
D’où :
𝑚 − 𝑎 = 600 − 19,6 = 580,4
𝑚 + 𝑎 = 600 + 19,6 = 619,6
On obtient donc l’intervalle :
𝑚 − 𝑎, 𝑚 + 𝑎 = 580,4; 619,6
On déduit :
𝑝 𝑋<-… ∈ 580,4; 619,6 = 0,95

On conclut que dans 95% des cas le score moyen


empirique varie autour de 𝑚 entre 580,4 et 619,6. 91
q Exercice 5 :
Pendant la période estivale, on admet que le nombre de
touristes présents dans une journée suit une loi normale de
moyenne 50000 et d'écart-type 8000.
1) La préfecture estime que le tourisme est « gérable »
(accueil, environnement, nuisances, …) lorsque la
probabilité d'accueillir moins de 55000 personnes dans
une journée dépasse 70 %. Est-ce le cas ?
2) La préfecture sélectionne un échantillon aléatoire de 10
journées de vacances.
a) Quelle loi suit la variable aléatoire : « nombre moyen
journalier de vacanciers dans un échantillon de 10
jours » ?
b) Quelle est la probabilité que le nombre journalier moyen
empirique de vacanciers soit inférieur à 55000? 92
q Solution :

𝒫: journées de la période estivale


× ×

× × ×
×

i
𝑗𝑜𝑢𝑟𝑛é𝑒𝑠
×
× ×
× ×
×

𝑋 = Le nombre de touristes présents / journée


𝐸 𝑋 = 𝑚 = 50000 : Le nombre moyen de touristes présents dans 𝒫
𝜎 = 8000 : écart type
𝑉𝑎𝑟 𝑋 = 𝜎 - = 8000- = 64000000 : variance dans 𝒫
𝑋 ↝ 𝒩 𝑚, 𝜎 -
93
1) Le tourisme est « gérable » si la probabilité d'accueillir
moins de 55000 personnes dans une journée dépasse
70%. Autrement dit si :
𝑝 𝑋 < 55000 > 0,70
Calculons :
𝑋−𝐸 𝑋 55000 − 𝐸 𝑋
𝑝 𝑋 < 55000 = 𝑝 <
𝜎 𝜎
On pose :
𝑋−𝐸 𝑋
𝑍=
𝜎
Comme :
𝑋 ↝ 𝒩 𝑚, 𝜎 -
On a :
𝑍 ↝ 𝒩 0,1 94
D’où :
55000 − 50000
𝑝 𝑋 < 55000 = 𝑝 𝑍 <
8000
= 𝑝 𝑍 < 0,625 = 𝜋 0,625 = 0,734
𝑝 𝑋 < 55000 = 0,734 = 73,40 %

On a bien :

𝑝 𝑋 < 55000 = 73,40 % >70 %

On conclut que le tourisme est « gérable » selon


l’estimation de la préfecture.
95
2) Soit 𝑋1 , 𝑋- , …, 𝑋1Ž l’échantillon aléatoire des 10
journées de vacances.
Soit la variable aléatoire définie par « Nombre moyen
journalier de vacanciers dans l’échantillon aléatoires des 10
journées sélectionnées ». Cette variable correspond à la
moyenne dans l’échantillon, c’est le nombre moyen
empirique de vacanciers défini par :

1
𝑋<1Ž = E 𝑋0
10
0>1
a) Cherchons la distribution d’échantillonnage de 𝑋<1Ž . On a:
𝐸 𝑋<1Ž = 𝑚 = 50000
- —
𝜎 64×10
< -
𝑉𝑎𝑟 𝑋1Ž = 𝜎W<•• = = = 64×10…
𝑛 10 96
Comme : 𝑋 ↝ 𝒩 𝑚, 𝜎 -
On déduit la distribution d’échantillonnage de 𝑋<1Ž :
𝑋<1Ž ↝ 𝒩 𝐸 𝑋<1Ž , 𝜎W-< ⟺ 𝑋<1Ž ↝ 𝒩 5×10U ; 64×10…
••

𝑋<1Ž − 𝐸 𝑋<1Ž
𝑍= ↝ 𝒩 1,0
𝜎W<••
b) Calculons :
𝑋<1Ž − 𝐸 𝑋<1Ž 55000 − 𝐸 𝑋<1Ž
𝑝 𝑋<1Ž < 55000 = 𝑝 <
𝜎W<•• 𝜎W<••
55000 − 50000
=𝑝 𝑍< = 𝑝 𝑍 < = 𝜋 1,9764
64×10…
= 0,9759 ⟺
𝑝 𝑋<1Ž < 55000 = 0,9759 = 97,59 % > 70 % 97
III. Echantillonnage pour un caractère qualitatif
On considère une population 𝒫 de taille 𝑁. On définit sur
cette population un caractère qualitatif représenté par une
variable aléatoire discrète associée à un évènement succès
choisi dans 𝒫 tel que :
𝑝 = 𝑝 𝐴 : la proportion (le pourcentage) des individus de
𝒫 qui appartiennent à A 𝒫
𝑋↝ℬ 𝑝 𝐴
On a :
𝐴̅
𝐸 𝑋 =𝑝
𝑉𝑎𝑟 𝑋 = 𝑝𝑞 = 𝑝 1 − 𝑝

98
III.1 Définitions :
q Définition: Proportion ou fréquence empirique
On appelle proportion empirique de l’échantillon aléatoire
𝑋1 , 𝑋- , …, 𝑋2 ↝ ℬ 𝑝 la statistique notée 𝐹2 définie par :
𝒏
𝟏
𝑭𝒏 = E 𝑿𝒊
𝒏
𝒊>𝟏
Si l’échantillon est avec remise alors :
𝒏

𝒀 = E 𝑿𝒊 ↝ 𝓑 𝒏, 𝒑
𝒊>𝟏
Si l’échantillon est sans remise alors :
𝒏

𝒀 = E 𝑿𝒊 ↝ 𝓗 𝒏, 𝒑, 𝑵
𝒊>𝟏 99
La variable 𝑌 = ∑20>1 𝑋0 représente le nombre total
d’individus qui appartiennent à 𝐴 dans l’échantillon.

q Définition: Moyenne et variance de la proportion


empirique
On a :
𝑬 𝑭𝒏 = 𝒑

𝑽𝒂𝒓 𝑭𝒏 = 𝝈𝟐𝑭𝒏
𝒑𝒒 𝑵 − 𝒏
× 𝑠𝑖 Echantillon est sans remise et 𝑁 𝑓𝑖𝑛𝑖
= 𝒑𝒒 𝒏 𝑵 − 𝟏
𝑠𝑖 Echantillon est avec remise ou 𝑠𝑖 𝑁 𝑖𝑛𝑓𝑖𝑛𝑖
𝒏
100
III.2 Distribution d’échantillonnage de la proportion :

On considère la proportion empirique de l’échantillon


aléatoire 𝑋1 , 𝑋- , …, 𝑋2 :
2
1
𝐹2 = E 𝑋0
𝑛
0>1

§ Si 𝒏 ≥ 𝟑𝟎, 𝒏𝒑 ≥ 𝟓 et 𝒏𝒑 ≥ 𝟓 alors :
𝑭𝒏 − 𝒑
𝒁= ↝ 𝓝 𝟎, 𝟏
𝝈𝑭𝒏

Si 𝑝 est inconnu alors on le remplace par la proportion


1 2
empirique 𝑓2 = ∑0>1 𝑥0 .
2 101
III.3 Exercices : Distribution d’échantillonnage de la
proportion

q Exercice 1 :
Une étude a révélé que 10% des achats d'un médicament
dans un grand nombre de pharmacies sont faits sans
ordonnance. Un échantillon de 500 achats du médicament
a été tiré (avec remise) au hasard.
1) Calculer la probabilité pour que le nombre d’achats du
médicament fait sans ordonnance parmi les 500 achats
soit supérieur à 40.
2) Donner la distribution d’échantillonnage de la
proportion empirique.
3) Calculer la probabilité pour que la proportion
empirique soit supérieur à 15%. 102
q Solution :

𝒫 : Les achats

𝐴
𝐴 = « Achats faits sans ordonnance »
𝐴̅

𝑝 = 𝑝 𝐴 : proportion des achats faits sans ordonnance


𝑋 ↝ ℬ 𝑝 : variable parente
𝐸 𝑋 =𝑝
𝑉𝑎𝑟 𝑋 = 𝑝𝑞 = 𝑝 1 − 𝑝

103
𝑋1 , 𝑋- , …, 𝑋…ŽŽ ↝ ℬ 𝑝 ∶ Echantillon de taille 𝑛 = 500

𝑌 = ∑…ŽŽ
0>1 𝑋0 : Le nombre d’achats du médicament faits sans
ordonnance parmi les 500 achats.
1
𝐹2 = ∑…ŽŽ 𝑋 : La proportion empirique d’achats du
…ŽŽ 0>1 0
médicament faits sans ordonnance
1) La probabilité pour que le nombre d’achats du
médicament faits sans ordonnance parmi les 500 achats
soit supérieur à 40 est donnée par :
𝑝 𝑌 > 40

104
Comme l’échantillon est tiré avec remise alors :
…ŽŽ

𝑌 = E 𝑋0 ↝ ℬ 𝑛, 𝑝
0>1
Avec :
𝐸 𝑌 = 𝑛×𝑝 = 500×0,10 = 50
𝑉𝑎𝑟 𝑌 = 𝜎§- = 𝑛×𝑝×𝑞 = 500×0,10×0,90 = 45
𝜎§ = 6,708
On a :
𝑛 = 500 > 30 𝑛×𝑝 = 500×0,10 = 50 > 5
𝑛× 1 − 𝑝 = 500×0,90 = 450 > 5
On a :
𝑌 ↝ 𝒩 50,45
𝑌−𝐸 𝑌
𝑍= ↝ 𝒩 0,1
𝜎§ 105
𝑌−𝐸 𝑌 40 − 𝐸 𝑌
𝑝 𝑌 > 40 = 𝑝 >
𝜎§ 𝜎§

40 − 50
=𝑝 𝑍> = 𝑝 𝑍 > −1,49
6,708

= 1 − 𝑝 𝑍 < −1,49 = 1 − 𝜋 −1,49 = 𝜋 1,49 = 0,9706

𝑝 𝑌 > 40 = 97,06 %

106
2) Donnons la distribution d’échantillonnage de la
proportion empirique. La proportion empirique est donnée
par :
…ŽŽ
1 𝑌
𝐹…ŽŽ = E 𝑋0 =
500 500
0>1

On a :
𝐸 𝐹…ŽŽ = 𝑝 = 0,10
𝑝×𝑞 0,10×0,90
𝑉𝑎𝑟 𝐹…ŽŽ = = = 0,0008
𝑛 500
On a :
𝐹…ŽŽ ↝ 𝒩 0,10; 0,0008
𝐹…ŽŽ − 𝐸 𝐹…ŽŽ
𝑍= ↝ 𝒩 0; 1
𝜎¨ 107
3) Calculons la probabilité pour que la proportion
empirique soit supérieur à 15% :

𝐹…ŽŽ − 𝐸 𝐹…ŽŽ 0,15 − 𝐸 𝐹…ŽŽ


𝑝 𝐹…ŽŽ > 0,15 = 𝑝 >
𝜎¨‡•• 𝜎¨‡••
0,15 − 0,10
=𝑝 𝑍> = 𝑝 𝑍 > 1,77 = 1 − 𝑝 𝑍 < 1,77
0,0283

= 1 − 𝜋 1,77 = 0,9616

𝑝 𝐹…ŽŽ > 0,15 = 0,9616 = 96,16 %

108
q Exercice 2 :
Un candidat a obtenu 55 % des suffrages exprimés à une
élection.
1) Quelle est la probabilité d'avoir, dans un échantillon
aléatoire de 100 personnes sélectionnées, moins de 50 %
de voix pour le candidat ?
2) Même question pour un échantillon de 2000 personnes.
3) Combien de personnes faut-il interroger pour que la
probabilité que moins de 50 % d'entre elles aient voté
pour le candidat passe en-dessous de 1 % ?

109
q Solution :
𝒫 : Electeurs

𝐴
𝐴 = « Electeurs votant pour le candidat »
𝐴̅

𝑝 = 𝑝 𝐴 : proportion des électeurs votant pour le candidat


𝑋 ↝ ℬ 𝑝 : variable aléatoire parente
𝐸 𝑋 = 𝑝 = 0,55
𝑉𝑎𝑟 𝑋 = 𝑝𝑞 = 𝑝 1 − 𝑝

110
1) On a un échantillon de taille 𝑛 = 100 :
𝑋1 , 𝑋- , …, 𝑋1ŽŽ ↝ ℬ 𝑝
1
𝐹1ŽŽ = ∑1ŽŽ 𝑋 : La proportion empirique d’électeurs
1ŽŽ 0>1 0
votant pour le candidat

On a :
𝐸 𝐹1ŽŽ = 𝑝 = 0,55
𝑝×𝑞 0,55×0,45
𝑉𝑎𝑟 𝐹1ŽŽ = = = 0,002475
𝑛 100
𝜎¨••• = 0,049749

111
Comme :
𝑛 = 100 > 30 𝑛×𝑝 = 100×0,55 = 55 > 5
𝑛× 1 − 𝑝 = 100×0,45 = 45 > 5
alors :
𝐹1ŽŽ ↝ 𝒩 0,55; 0,002475
𝐹1ŽŽ − 𝐸 𝐹1ŽŽ
𝑍= ↝ 𝒩 0,1
𝜎¨•••
Calculons maintenant la probabilité d'avoir, dans
l’échantillon aléatoire des 100 personnes sélectionnées,
moins de 50 % de voix pour le candidat :
𝐹1ŽŽ − 𝐸 𝐹1ŽŽ 0,5 − 𝐸 𝐹1ŽŽ
𝑝 𝐹1ŽŽ < 0,5 = 𝑝 <
𝜎¨••• 𝜎¨•••
0,5 − 0,55
=𝑝 𝑍< = 𝑝 𝑍 < −1,01
0,049749 112
= 𝜋 −1,01 = 1 − 𝜋 1,01 = 1 − 0,8438 = 0,1562

𝑝 𝐹1ŽŽ < 0,5 = 0,1562 = 15,62 %


Lorsque la taille de l’échantillon est 𝑛 = 100, on a 15,62
% de chances que le candidat ne soit pas élu (mois de 50%
de voix)

2) On suppose que la taille de l’échantillon est égale à 𝑛 =


2000. Calculons 𝑝 𝐹-ŽŽŽ < 0,5 .
On a :
𝐸 𝐹-ŽŽŽ = 𝑝 = 0,55
𝑝×𝑞 0,55×0,45
𝑉𝑎𝑟 𝐹-ŽŽŽ = = = 0,00012375
𝑛 2000
𝜎¨†••• = 0,0111243 113
Comme :
𝑛 = 2000 > 30 𝑛×𝑝 = 2000×0,55 = 1100 > 5
𝑛× 1 − 𝑝 = 2000×0,45 = 900 > 5
alors :
𝐹-ŽŽŽ ↝ 𝒩 0,55; 0,00012375
𝐹-ŽŽŽ − 𝐸 𝐹-ŽŽŽ
𝑍= ↝ 𝒩 0,1
Donc : 𝜎¨†•••

𝑝 𝐹-ŽŽŽ < 0,5


𝐹-ŽŽŽ − 𝐸 𝐹-ŽŽŽ 0,5 − 𝐸 𝐹-ŽŽŽ
=𝑝 <
𝜎¨†••• 𝜎¨†•••
0,5 − 0,55
=𝑝 𝑍< = 𝑝 𝑍 < −4,49
0,0111243
114
= 𝜋 −4,49 = 1 − 𝜋 4,49 = 1 − 1 ≈ 0
𝑝 𝐹-ŽŽŽ < 0,5 ≈ 0 𝑝 𝐹-ŽŽŽ > 0,5 ≈ 1 = 100%

Lorsque la taille de l’échantillon atteint à 𝑛 = 2000, on


est pratiquement sûr (presque 100 % de chances) que le
candidat soit élu (plus de 50% de voix).
Plus la taille de l’échantillon augmente et plus le résultat
du sondage est précis.

3) Cherchons la taille de l’échantillon 𝑛 de personnes à


interroger pour que la probabilité que moins de 50 %
d'entre elles aient voté pour le candidat passe en-dessous de
1%:
𝑝 𝐹2 < 0,5 ≤ 0,01 115
On a :
𝑝×𝑞
𝐸 𝐹2 = 𝑝. 𝑉𝑎𝑟 𝐹2 =
𝑛
On suppose que la taille 𝑛 qu’on cherche est assez grande
de manière à avoir :
𝑛 > 30 𝑛×𝑝 > 5 𝑛× 1 − 𝑝 > 5
Ainsi on aura :
𝐹2 − 𝐸 𝐹2
𝑍= ↝ 𝒩 0,1
Donc : 𝜎¨X
𝐹2 − 𝐸 𝐹2 0,5 − 𝐸 𝐹2
𝑝 𝐹2 < 0,5 ≤ 0,01 ⟺ 𝑝 <
𝜎¨X 𝜎¨X
0,5 − 𝐸 𝐹2
≤ 0,01 ⟺ 𝑝 𝑍 < ≤ 0,01
𝜎¨X
116
0,5 − 𝑝
⟺𝑝 𝑍< ≤ 0,01 ⟺
𝑝𝑞
𝑛
0,5 − 0,55 −0,05
𝑝 𝑍< ≤ 0,01 ⟺ 𝑝 𝑍 < ≤ 0,01
0,55×0,45 0,2475
𝑛 𝑛
0,05 0,05
⟺1−𝜋 ≤ 0,01 ⟺ 𝜋 ≥ 0,99 ⟺
0,2475 0,2475
𝑛 𝑛
0,05 0,05
𝜋 ≥ 𝜋 2,33 ⟺ ≥ 2,33
0,2475 0,2475
𝑛 𝑛
-
-
0,2475 -
2,33 ×0,2475
⟺ 2,33 × ≤ 0,05 ⟺ 𝑛 ≥ -

𝑛 0,05
𝑛 ≥ 538 117
q Exercice 3 :
Une étude a révélé que le taux d’intention d’achat d’un
produit dans une population de jeunes adolescents donnée
est égal à 60 %.
Un échantillon aléatoire de taille 200 a été sélectionné.
1) Déterminer la distribution d’échantillonnage du taux
d’intention d’achat empirique.
2) Calculer la probabilité pour que le taux d’intention
d’achat empirique soit compris entre 55 % et 75 %.

118
q Solution:

𝒫 : Jeunes adolescents

𝐴̅

𝐴 = « Jeunes adolescents ayant l’intention d’achat »


𝑝 = 𝑝 𝐴 : Taux d’intentions d’achat dans la population
𝑋 ↝ ℬ 𝑝 : variable aléatoire parente
𝐸 𝑋 = 𝑝 = 0,60
𝑉𝑎𝑟 𝑋 = 𝑝𝑞 = 𝑝 1 − 𝑝

119
Un échantillon aléatoire de taille 200 a été sélectionné.
𝑋1 , 𝑋- , …, 𝑋-ŽŽ ↝ ℬ 𝑝
1) Déterminons la distribution d’échantillonnage du taux
d’intention d’achat empirique :
-ŽŽ
1
𝐹-ŽŽ = E 𝑋0
200
0>1
On a :
𝐸 𝐹-ŽŽ = 𝑝 = 0,60
𝑝×𝑞 0,60×0,40
𝑉𝑎𝑟 𝐹-ŽŽ = = = 0,0012
𝑛 200
𝜎¨†•• = 0,03464

120
Comme :
𝑛 = 200 > 30 𝑛×𝑝 = 200×0,60 = 120 > 5
𝑛× 1 − 𝑝 = 200×0,40 = 80 > 5
On a :
𝐹-ŽŽ ↝ 𝒩 0,60; 0,0012
𝐹-ŽŽ − 𝐸 𝐹-ŽŽ
𝑍= ↝ 𝒩 0,1
𝜎¨†••

2) Calculons la probabilité pour que le taux d’intention


d’achat empirique soit compris entre 55 % et 75 % :
𝑝 0,55 ≤ 𝐹-ŽŽ ≤ 0,75 =
𝐹-ŽŽ − 𝐸 𝐹-ŽŽ 𝐹-ŽŽ − 𝐸 𝐹-ŽŽ 𝐹-ŽŽ − 𝐸 𝐹-ŽŽ
𝑝 ≤ ≤
𝜎¨†•• 𝜎¨†•• 𝜎¨†••
121
0,55 − 𝐸 𝐹-ŽŽ 0,75 − 𝐸 𝐹-ŽŽ
=𝑝 ≤𝑍≤ =
𝜎¨†•• 𝜎¨†••
0,55 − 0,60 0,75 − 0,60
𝑝 ≤𝑍≤
0,03464 0,03464

−0,05 0,05
=𝑝 ≤𝑍≤ =
0,03464 0,03464
= 𝑝 −1,44 ≤ 𝑍 ≤ 1,44 = 𝜋 1,44 − 𝜋 −1,44
= 𝜋 1,44 − 1 − 𝜋 1,44 = 2×𝜋 1,44 − 1
= 2×0,9251 − 1 = 0,8502

𝑝 0,55 ≤ 𝐹-ŽŽ ≤ 0,75 = 0,85 = 85%

122
q Exercice 4 :

Selon une étude sur le comportement des consommateurs,


25% d'entre eux sont influencés par la marque de commerce
lors de l'achat d'un produit. Un échantillon aléatoire de 100
consommateurs est sélectionné.
1) Caractériser la distribution de la proportion empirique
des consommateurs influencés par la marque de
commerce.
2) Calculer la probabilité pour qu'au moins 35
consommateurs de l’échantillon se déclarent influencés
par la marque de commerce.

123
3) Calculer la probabilité pour que moins de 20% des
consommateurs de l’échantillon se déclarent influencés
par la marque de commerce.
4) Dans quel intervalle la proportion empirique des
consommateurs influencés par la marque de commerce
varie autour de la proportion 𝑝 avec une probabilité
égale à 0,90.

124
q Solution:

𝒫 : Consommateurs

𝐴̅
𝐴 = Consommateurs influencés par la marque de commerce

𝑝 = 𝑝 𝐴 : Proportion de consommateurs influencés par la


marque de commerce
𝑋 ↝ ℬ 𝑝 : variable aléatoire parente
𝐸 𝑋 = 𝑝 = 0,25
𝑉𝑎𝑟 𝑋 = 𝑝𝑞 = 𝑝 1 − 𝑝 = 0,25×0,75 = 0,1875
125
Un échantillon aléatoire de 100 consommateurs a été
sélectionné.
𝑋1 , 𝑋- , …, 𝑋1ŽŽ ↝ ℬ 𝑝

1) Déterminons la distribution d’échantillonnage de la


proportion empirique des consommateurs influencés
par la marque de commerce :
1ŽŽ
1
𝐹1ŽŽ = E 𝑋0
100
0>1
On a :
𝐸 𝐹1ŽŽ = 𝑝 = 0,25
𝑝×𝑞 0,25×0,75
𝑉𝑎𝑟 𝐹1ŽŽ = = = 0,001875
𝑛 100
𝜎¨••• = 0,0433 126
Comme :
𝑛 = 100 > 30 𝑛×𝑝 = 100×0,25 = 25 > 5
𝑛× 1 − 𝑝 = 100×0,75 = 75 > 5
On a :
𝐹1ŽŽ ↝ 𝒩 0,25; 0,0433
𝐹1ŽŽ − 𝐸 𝐹1ŽŽ
𝑍= ↝ 𝒩 0,1
𝜎¨•••

2) Posons :
𝑌1ŽŽ = Le nombre de consommateurs influencés par la
marque de commerce dans l’échantillon.
On a alors :
1ŽŽ
1 𝑌1ŽŽ
𝐹1ŽŽ = E 𝑋0 =
100 100
0>1 127
3) Calculons la probabilité :
𝑝 𝑌1ŽŽ ≥ 35 = 𝑝 100×𝐹1ŽŽ ≥ 35 = 𝑝 𝐹1ŽŽ ≥ 0,35

𝐹1ŽŽ − 𝐸 𝐹1ŽŽ 0,35 − 𝐸 𝐹1ŽŽ


𝑝 ≥
𝜎¨••• 𝜎¨•••
0,35 − 0,25
=𝑝 𝑍≥ = 𝑝 𝑍 ≥ 2,31 = 1 − 𝑝 𝑍 ≤ 2,31
0,0433
= 1 − 𝜋 2,31 = 1 − 0,9896 = 0,0104

𝑝 𝑌1ŽŽ ≥ 35 = 0,0104 = 1,04 %


Interprétation : On a 1,04 % de chances pour qu’au moins
35 consommateurs soient influencés par la marque de
commerce parmi les 100 consommateurs choisis.
128
3) Calculons la probabilité :

𝑝 𝐹1ŽŽ < 0,20 =

𝐹1ŽŽ − 𝐸 𝐹1ŽŽ 0,20 − 𝐸 𝐹1ŽŽ


𝑝 <
𝜎¨••• 𝜎¨•••
0,20 − 0,25
=𝑝 𝑍< = 𝑝 𝑍 < −1,16 = 𝜋 −1,16
0,0433
= 1 − 𝜋 1,16 = 1 − 0,877 = 0,123

𝑝 𝐹1ŽŽ < 0,20 = 0,123 = 12,30%


Interprétation : On a 12,30 % de chances pour que moins
de 20 de consommateurs soient influencés par la marque de
commerce parmi les 100 consommateurs choisis.
129
4) Cherchons 𝑎 > 0 tel que :
𝑝 𝐹1ŽŽ ∈ 𝑝 − 𝑎, 𝑝 + 𝑎 = 0,90 ⟺
𝑝 𝑚 − 𝑎 ≤ 𝐹1ŽŽ ≤ 𝑚 + 𝑎 = 0,90 ⟺
𝑝 −𝑎 ≤ 𝐹1ŽŽ − 𝑚 ≤ 𝑎 = 0,90 ⟺
−𝑎 𝐹1ŽŽ − 𝑚 𝑎
𝑝 < < = 0,90 ⟺
𝜎¨••• 𝜎¨••• 𝜎¨•••
−𝑎 𝑎
𝑝 <𝑍< = 0,90 ⟺
0,0433 0,0433
𝑎 −𝑎
𝜋 −𝜋 = 0,90 ⟺
0,0433 0,0433
𝑎 𝑎
𝜋 − 1−𝜋 = 0,90 ⟺
0,0433 0,0433

130
𝑎 𝑎 0,90
2×𝜋 − 1 = 0,90 ⟺ 𝜋 = = 0,45
0,0433 0,0433 2
𝑎
⟺ = 0,6736 ⟺ 𝑎 = 0,6736×0,0433 ⟺
0,0433

𝑎 = 0,0292
𝑝 − 𝑎 = 0,25 − 0,0292 = 0,2208
𝑝 + 𝑎 = 0,25 + 0,0292 = 0,2792
𝑝 − 𝑎, 𝑝 + 𝑎 = 0,2208; 0,2792 = 22,08 %; 27,92 %
On déduit :
𝑝 𝐹1ŽŽ ∈ 22,08 %; 27,92 % = 0,90
On conclut qu’on a 90% de chances pour que la proportion
empirique varie autour de 𝑝 entre 22,08 % et 27,92 %. 131
IV. Détermination de la taille d’échantillon

IV.1 Détermination de la taille d’échantillon : Caractère


quantitatif

On considère une population 𝒫 de taille 𝑁. On définit sur


cette population un caractère quantitatif représenté par une
variable aléatoire continue 𝑋.

𝒫: population 𝑋: variable aléatoire parente continue


× ×

×
× × × 𝐸 𝑋 = 𝑚: moyenne dans 𝒫
× ×
× i × ×
𝑉𝑎𝑟 𝑋 = 𝜎 - : variance dans 𝒫
×
×
× ×
× ×
×

132
Soit 𝑋<2 la moyenne empirique de l’échantillon aléatoire 𝑋1 ,
𝑋- , …, 𝑋2 :
2
1
𝑋<2 = E 𝑋0
𝑛
0>1

On suppose que la moyenne dans la population 𝑚 est


inconnue et on voudrait l’estimer par la moyenne
empirique 𝑋<2 (voir chapitre sur l’estimation).

133
q Premier cas: on ne connait pas la loi de 𝑿

§ Lorsque l’échantillon est sans remise alors :


𝜎- 𝑁 − 𝑛
𝑉𝑎𝑟 𝑋<2 = ×
𝑛 𝑁−1

Appliquons l’inégalité de Bienaymé Tchebycheff à la


variable aléatoire 𝑋<2 :

Pour tout 𝜀 > 0


𝑉𝑎𝑟 𝑋<2
𝑝 𝑋<2 − 𝐸 𝑋<2 <𝜀 ≥1−
𝜀-
avec
𝐸 𝑋<2 = 𝑚 134
On se fixe une marge d’erreur 𝜀 (précision souhaitée) et une
probabilité (assez grande) 1 − 𝛼en cherchant la taille 𝑛 telle
que la moyenne empirique 𝑋<2 ne s’écarte pas de plus de ±𝜀
de la moyenne 𝑚 de la population avec une probabilité au
moins égale à 1 − 𝛼.

Il suffit de prendre :
𝜎- 𝑁 − 𝑛
1−𝛼 =1− - 𝑛 𝑁 − 1 𝜀 - 𝛼 = 𝜎 - 𝑁 − 𝑛
𝑛𝜀 𝑁 − 1
𝑛 𝑁 − 1 𝜀 - 𝛼 + 𝜎 - = 𝑁𝜎 -

𝑵𝝈𝟐
𝒏=
𝑵 − 𝟏 𝜺𝟐 𝜶 + 𝝈𝟐
135
§ Lorsque l’échantillon est avec remise ou la
population est infinie alors :
𝜎-
𝑉𝑎𝑟 𝑋<2 =
𝑛
Donc :
𝜎-
1−𝛼 =1− -
𝑛𝜀

𝝈𝟐
𝒏= 𝟐
𝜺 𝜶

136
q Deuxième cas: 𝑿 ↝ 𝓝 𝒎, 𝝈𝟐
On a:
𝐸 𝑋<2 = 𝑚
𝑉𝑎𝑟 𝑋<2 = 𝜎W-<X

§ Si 𝑋 ↝ 𝒩 𝑚, 𝜎 - et 𝜎 - est connue alors :


𝑋<2 − 𝑚
𝑍= ↝ 𝒩 0,1
𝜎W<X
𝑋<2 − 𝑚
𝑝 < 𝑧1f¯ = 1 − 𝛼 𝑝 𝑋<2 − 𝑚 < 𝑧1f¯ ×𝜎W<X = 1 − 𝛼
𝜎W<X - -
¯
Où 𝑧1f° est le quantile d’ordre 1 − de la loi 𝒩 0,1 .
† -
On pose :
𝜀 = 𝑧1f¯ ×𝜎W<X
- 137
ü Lorsque l’échantillon est sans remise alors :
-
𝜎 𝑁−𝑛
𝑉𝑎𝑟 𝑋<2 = 𝜎W<X =
-
.
𝑛 𝑁−1
D’où :
-
𝜎 𝑁−𝑛 - - 𝜎 𝑁−𝑛
𝜀 = 𝑧1f¯ . 𝜎W<X = 𝑧1f¯ . . ⟺ 𝜀 = 𝑧1f¯ . .
- - 𝑛 𝑁−1 - 𝑛 𝑁−1

-
⟺ 𝑛. 𝑁 − 1 . 𝜀 - = 𝑧1f -
¯. 𝑁 − 𝑛 . 𝜎 ⟺
-
- -
𝑛 𝑁 − 1 . 𝜀 - + 𝑧1f¯ . 𝜎 -
= 𝑧1f
-
¯ . 𝑁. 𝜎 ⟺
- -

𝑵. 𝒛𝟐𝟏f𝜶 . 𝝈𝟐
𝟐
𝒏=
𝑵 − 𝟏 . 𝜺𝟐 + 𝒛𝟐 𝜶. 𝝈
𝟐
𝟏f
𝟐
138
ü Lorsque l’échantillon est avec remise ou la
population est infinie :
-
𝜎
𝑉𝑎𝑟 𝑋<2 = 𝜎W-<X =
𝑛
D’où
-
𝜎 - 𝜎
𝜀 = 𝑧1f¯ . 𝜎W<X = 𝑧1f¯ . ⟺ 𝜀 - = 𝑧1f ¯. ⟺
- - 𝑛 - 𝑛
-
𝑛. 𝜀 - = 𝑧1f -
¯. 𝜎 ⟺
-

𝒛𝟐𝟏f𝜶 . 𝝈𝟐
𝟐
𝒏=
𝜺𝟐

139
§ Si 𝑋 ↝ 𝒩 𝑚, 𝜎 - et 𝜎 - est inconnue alors :
On remplace 𝜎 - par la quasi-variance 𝑆′-2 définie par:
2
1
-
𝑆′2 = E 𝑋0 − 𝑋<2 -
𝑛−1
0>1
ü Lorsque l’échantillon est sans remise :
-
𝜎 𝑁−𝑛
𝑉𝑎𝑟 𝑋<2 = 𝜎W<X =
-
.
𝑛 𝑁−1
𝑋<2 − 𝑚 𝑋<2 − 𝑚
≈𝑇= ↝𝑡 𝑛−1
𝜎W<X e
𝑆2 𝑁 − 𝑛
.
𝑛 𝑁−1

140
𝑋<2 − 𝑚 2f1
𝑝 < 𝑡1f ¯ =1−𝛼 ⟺
𝑆2e 𝑁−𝑛 -
.
𝑛 𝑁−1
e
𝑆2 𝑁−𝑛
𝑝 𝑋<2 − 𝑚 < 𝑡1f¯ ×
2f1
. =1−𝛼
- 𝑛 𝑁−1
On pose :
e
2f1 𝑠2 𝑁−𝑛
𝜀 = 𝑡1f¯ × . ⟺
- 𝑛 𝑁−1

𝑵. 𝒕𝒏f𝟏
𝟏f
𝟐
𝜶 . 𝒔′𝒏
𝟐
𝒏=
𝑵 − 𝟏 . 𝜺𝟐 + 𝒕𝒏f𝟏𝜶 . 𝒔′𝟐𝒏
𝟏f
𝟐 141
2f1 -
Si en plus 𝑛 ≥ 30 alors on remplace 𝑡1f ° par 𝑧
1f
° :
† †

𝑵. 𝒛𝟐𝟏f𝜶 . 𝒔′𝟐𝒏
𝟐
𝒏=
𝑵 − 𝟏 . 𝜺𝟐 + 𝒛𝟐 𝟐
𝜶 . 𝒔′𝒏
𝟏f
𝟐

ü Lorsque l’échantillon est avec remise ou la population


est infinie :
-
𝜎
𝑉𝑎𝑟 𝑋<2 = 𝜎W-<X =
𝑛
𝑋<2 − 𝑚 𝑋<2 − 𝑚
≈𝑇= e ↝𝑡 𝑛−1
𝜎W<X 𝑠2

𝑛
142
𝑋<2 − 𝑚 2f1
𝑝 e < 𝑡 ¯ =1−𝛼 ⟺
𝑠2 1f
-

𝑛
e
𝑠2
𝑝 𝑋<2 − 𝑚 < 𝑡1f
2f1
¯ × =1−𝛼
- 𝑛
On pose :
e
2f1 𝑠2
𝜀 = 𝑡1f¯ × ⟺
- 𝑛
𝒕𝒏f𝟏
𝟏f
𝟐
𝜶 . 𝒔′𝒏
𝟐
𝒏=
𝜺𝟐
2f1 -
Si en plus 𝑛 ≥ 30 alors on remplace 𝑡1f° par 𝑧1f° :
† †
𝒛𝟐𝟏f𝜶 . 𝒔′𝟐𝒏
𝟐
𝒏=
𝜺𝟐 143
IV.2 Exercices : Détermination de la taille d’échantillon-
Caractère quantitatif

q Exercice 1 :
Une étude sur la population des représentants commerciaux
a révélé que le nombre moyen de jours par an passés sur les
routes est égal à 115 avec un écart-type de 60 jours par an.
On sélectionne un échantillon aléatoire de 50 représentants
commerciaux.
1) Donner la distribution d’échantillonnage du nombre
moyen empirique de jours par an passés sur les routes.
2) Quelle est la probabilité que le nombre moyen empirique
de jours par an passés sur les routes soit supérieur à 115
jours par an?
144
3) Quelle serait la probabilité de la question 2) si la taille
de l'échantillon était 100 ?
4) On suppose maintenant que la taille de l’échantillon est
inconnue. Quel est le nombre de représentants
commerciaux à interroger pour que le nombre moyen
empirique de jours par an passés sur les routes ne
s'écarte pas de plus de ±5 jours de la moyenne dans la
population avec une probabilité au moins égale à 0,95?
5) Même question que la question 4) mais en supposant
que la population est normale et que la probabilité est
égale à 0,95.

145
q Solution:
𝒫: Représentants commerciaux
× ×

× × ×
×
i
× ×
× × ×
×
×
× ×
× ×
×

𝑋 = Le nombre moyen de jours par an passés sur les routes :


Variable aléatoire parente

𝐸 𝑋 = 𝑚 = 115 : moyenne dans 𝒫


𝑉𝑎𝑟 𝑋 = 𝜎 - = 60- = 3600 : variance dans 𝒫
𝜎 = 60 : écart-type dans 𝒫

146
𝑋1 , 𝑋- , …, 𝑋…Ž : Echantillon aléatoire de taille 𝑛 = 50.
On considère le nombre moyen empirique de jours par an
passés sur les routes :
…Ž
1
𝑋<…Ž = E 𝑋0
50
0>1
1) Donnons la distribution d’échantillonnage du nombre
moyen empirique 𝑋<…Ž de jours par an passés sur les
routes.
On a : (population supposée infinie)
𝐸 𝑋<…Ž = 𝑚 = 115
-
𝜎 3600
𝑉𝑎𝑟 𝑋<…Ž = 𝜎W<‡• =
-
= = 72
𝑛 50
𝜎W<‡• = 8,485 147
Comme 𝑛 = 50 > 30 alors grâce au théorème central limite
on a :
<…Ž − 𝑚
𝑋
𝑋<…Ž ↝ 𝒩 𝑚, σ-Ƈ• 𝑒𝑡 𝑍 = ↝ 𝒩 0,1
𝜎W<‡•

2) Calculons la probabilité que le nombre moyen empirique


de jours par an passés sur les routes soit supérieur à 115
jours par an :
𝑋<…Ž − 𝑚 115 − 𝑚
𝑝 𝑋<…Ž > 115 = 𝑝 >
𝜎W<‡• 𝜎W<‡•
115 − 115
=𝑝 𝑍> = 𝑝 𝑍 > 0 = 0,5
8,485
148
𝑝 𝑋<…Ž > 115 = 0,5 = 50%
3) Supposons maintenant que la taille de l’échantillon 𝑋1 ,
𝑋- , …, 𝑋1ŽŽ est 𝑛 = 100.
On a : 𝑛 = 100 > 30
𝐸 𝑋<…Ž = 𝑚 = 115
-
𝜎 3600
𝑉𝑎𝑟 𝑋<…Ž = 𝜎W<‡• =
-
= = 36. 𝜎W<‡• = 6
100 100
𝑋<1ŽŽ − 𝑚 115 − 𝑚
𝑝 𝑋<1ŽŽ > 115 = 𝑝 >
𝜎W<••• 𝜎W<•••
115 − 115
=𝑝 𝑍> = 𝑝 𝑍 > 0 = 0,5
6
La probabilité sera toujours égale à 0,5 quel que soit la taille
de l’échantillon choisie. 149
4) On suppose maintenant que la taille de l’échantillon est
inconnue. Cherchons la taille de l’échantillon 𝑛 telle que :
𝑝 𝑋<2 − 𝑚 < 5 ≥ 0,95
En posant 1 − 𝛼 = 0,95 et 𝜀 = 5; et en appliquant
l’inégalité de Bienaymé Tchebycheff on obtient :
𝜎- 3600
𝑛= - ⟺ 𝑛= - = 2880 ⟺
𝜀 𝛼 5 ×0,05

𝑛 = 2880

150
5) On suppose que 𝑋 ↝ 𝒩 𝑚, 𝜎 -
Cherchons maintenant la taille de l’échantillon 𝑛 telle que :
𝑝 𝑋<2 − 𝑚 < 5 = 0,95
On pose 1 − 𝛼 = 0,95 et 𝜀 = 5. En utilisant les propriétés
de la loi 𝒩 0,1 on obtient : (population supposée infinie)
- -
𝑧1f ¯. 𝜎 -
- 𝑧Ž,µ¶… ×3600
𝑛= -
⟺𝑛=
𝜀 25
Où 𝑧Ž,µ¶… est le quantile d’ordre 0,975 de la loi 𝒩 0,1 ,
obtenu à partir de la table :
𝑧Ž,µ¶… = 1,96
On déduit :
1,96- ×3600
𝑛= = 554
25 151
q Exercice 2 :

Un bureau d’étude réalise une enquête sur le revenu


mensuel moyen des salariés dans un secteur de production.
1) Quelle doit être la taille de l’échantillon de salariés à
interroger pour que le revenu mensuel moyen
empirique ne s’éloigne pas de plus de ±100 DH du
revenu mensuel moyen de la population avec une
probabilité au moins égale à 0,95 sachant que l’écart
type est de 500 DH?
2) Même question mais en supposant que le revenu
mensuel suit une loi normale avec une probabilité égale
à 0,95.

152
q Solution :
𝒫: salariés dans le secteur de production
× ×

× × ×
×
i
× ×
× × ×
×
×
× ×
× ×
×

𝑋 = Revenu mensuel : Variable aléatoire parente


𝐸 𝑋 = 𝑚 : revenu mensuel moyen dans 𝒫

𝑉𝑎𝑟 𝑋 = 𝜎 - = 500- = 250000 : variance dans 𝒫


𝜎 = 500 : écart-type dans 𝒫

153
𝑋1 , 𝑋- , …, 𝑋2 : Echantillon aléatoire de taille 𝑛.
Le revenu mensuel moyen empirique est donné par:
2
1
𝑋<2 = E 𝑋0
𝑛
0>1

Cherchons la taille de l’échantillon 𝑛 telle que :


𝑝 𝑋<2 − 𝑚 < 100 ≥ 0,95

En posant 1 − 𝛼 = 0,95 et 𝜀 = 100; et en appliquant


l’inégalité de Bienaymé Tchebycheff on obtient :
(population supposée infinie)
𝜎-
𝑛= - ⟺
𝜀 𝛼 154
500-
𝑛= -
= 500 ⟺
100 ×0,05

𝑛 = 500
2) On suppose que le revenu mensuel 𝑋 ↝ 𝒩 𝑚, 𝜎 - .
𝑋<2 − 𝑚
𝑍= ↝ 𝒩 0,1
𝜎W<X
Cherchons donc la taille de l’échantillon 𝑛 telle que :
𝑝 𝑋<2 − 𝑚 < 100 = 0,95
On pose 1 − 𝛼 = 0,95 et 𝜀 = 100.

155
On utilise l’égalité :
-
𝑧1f¯ ×𝜎 -
-
𝑛= ⟺
𝜀-
-
𝑧1f ¯ ×250000
-
𝑛=
100-
Où 𝑧Ž,µ¶… est le quantile d’ordre 0,975 de la loi 𝒩 0,1 :
𝑧Ž,µ¶… = 1,96
D’où :
1,96- ×250000
𝑛= -
= 96 ⟺
100

𝑛 = 96 156
q Exercice 3 :
On souhaite réaliser une enquête sur la dépense mensuelle
des ménages d’une population normale composée de 5
millions de ménages.
Quel doit être la taille de l’échantillon des ménages à
interroger pour que la dépense mensuelle moyenne
empirique ne s’écarte pas de plus de ±100 DH avec une
probabilité égale à 0,99 ?
L’écart type de la dépense mensuelle des ménages est
supposée être égale à 2000 DH.

157
q Solution :

𝒫: Ménages × ×

× × ×
×
i
× ×
× × ×
×
×
× ×
× ×
×

𝑁 = 5 millions = Taille de la population


𝑋 = Dépense : Variable aléatoire parente

𝐸 𝑋 = 𝑚 : Dépense mensuelle moyenne dans 𝒫


𝑉𝑎𝑟 𝑋 = 𝜎 - = 2000- = 4000000 : variance dans 𝒫
𝜎 = 2000 : écart-type dans 𝒫

158
𝑋1 , 𝑋- , …, 𝑋2 : Echantillon aléatoire de taille 𝑛.
Dépense mensuelle moyenne empirique est donnée par:
2
1
𝑋<2 = E 𝑋0
𝑛
0>1

Cherchons la taille de l’échantillon 𝑛 telle que :


𝑝 𝑋<2 − 𝑚 < 100 = 0,99

On pose 1 − 𝛼 = 0,99 et 𝜀 = 100.

159
Comme 𝑋 ↝ 𝒩 𝑚, 𝜎 - et 𝑁 est connue on utilise la formule :

-
𝑁. 𝑧Ž,µµ… . 𝜎-
𝑛=
𝑁 − 1 . 𝜀- + 𝑧- ¯ . 𝜎-
1f
-

Où 𝑧Ž,µµ… est le quantile d’ordre 0,995 de la loi 𝒩 0,1 :


𝑧Ž,µµ… = 2,58

D’où :

5×10— ×2,58- ×4×10—


𝑛= — - - —
= 2662 ⟺
5×10 − 1 ×100 + 2,58 ×4×10

𝑛 = 2662 160
q Exercice 4 :

Une population de personnes passe un test de QI (quotient


intellectuel). Les résultats du test forment une variable
aléatoire 𝑋 normale d’écart type σ = 15.
Combien doit-on interroger de personnes pour que le
quotient intellectuel moyen empirique ne s’écarte pas de
plus de ±2 du quotient intellectuel moyen de la population
avec une probabilité au moins égale à 0,95 ?

161
q Solution :
𝒫: Personnes
× ×

× × ×
×
i
× ×
× × ×
×
×
× ×
× ×
×

𝑋 = Quotient intellectuel (QI) : Variable aléatoire parente

𝐸 𝑋 = 𝑚 : QI moyen dans 𝒫

𝑉𝑎𝑟 𝑋 = 𝜎 - = 15- = 225 : variance dans 𝒫


𝜎 = 15 : écart-type dans 𝒫

162
𝑋1 , 𝑋- , …, 𝑋2 : Echantillon aléatoire de taille 𝑛.

Le quotient intellectuel moyen empirique est donné par:


2
1
𝑋<2 = E 𝑋0
𝑛
0>1

Cherchons la taille de l’échantillon 𝑛 telle que :


𝑝 𝑋<2 − 𝑚 < 2 = 0,95

On pose 1 − 𝛼 = 0,95 et 𝜀 = 2.
Comme 𝑋 ↝ 𝒩 𝑚, 𝜎 - on utilise l’égalité :
- -
𝑧1f ¯ ×𝜎
-
𝑛= ⟺
𝜀- 163
-
𝑧Ž,µ¶… ×250
𝑛=
2-

Où 𝑧Ž,µ¶… est le quantile d’ordre 0,975 de la loi 𝒩 0,1 :


𝑧Ž,µ¶… = 1,96
D’où :
1,96 - ×250
𝑛= -
= 240
2

164
IV.3 Détermination de la taille d’échantillon : Caractère
qualitatif

On considère une population 𝒫 de taille 𝑁. On définit sur


cette population un caractère qualitatif représenté par une
variable aléatoire discrète 𝑋 avec :
𝐴 : Evènement succès choisi dans 𝒫
𝑝 = 𝑝 𝐴 : Proportion des individus de 𝒫 qui appartiennent
à A.
𝒫
𝑋↝ℬ 𝑝 𝐴
On a :
𝐸 𝑋 =𝑝 𝐴̅
𝑉𝑎𝑟 𝑋 = 𝑝𝑞 = 𝑝 1 − 𝑝

165
On considère la proportion empirique de l’échantillon
aléatoire 𝑋1 , 𝑋- , …, 𝑋2 :
2
1
𝐹2 = E 𝑋0
𝑛
0>1

On suppose que la proportion 𝑝 dans la population est


inconnue et on voudrait l’estimer par la proportion
empirique 𝐹2 (voir chapitre sur l’estimation).

166
q Premier cas: on ne connait pas la loi de 𝐹2

Appliquons l’inégalité de Bienaymé Tchebycheff à la


variable aléatoire 𝐹2 :

Pour tout 𝜀 > 0


𝑉𝑎𝑟 𝐹2
𝑝 𝐹2 − 𝐸 𝐹2 <𝜀 ≥1−
𝜀-
avec
𝐸 𝐹2 = 𝑝

167
ü Lorsque l’échantillon est sans remise alors :
𝑝𝑞 𝑁 − 𝑛
𝑉𝑎𝑟 𝐹2 = ×
𝑛 𝑁−1

Donc l’inégalité de Bienaymé Tchebycheff s’écrit :


𝑝𝑞 𝑁 − 𝑛
𝑝 𝐹2 − 𝑝 < 𝜀 ≥ 1 −× - ×
𝑛𝜀 𝑁−1
On se fixe une marge d’erreur 𝜀 (précision souhaitée) et une
probabilité (assez grande) 1 − 𝛼 en cherchant la taille 𝑛 telle
que la proportion empirique 𝐹2 ne s’écarte pas de plus de ±𝜀
de la proportion 𝑝 de la population avec une probabilité au
moins égale à 1 − 𝛼.

168
Il suffit de prendre :
𝑝×𝑞 𝑁 − 𝑛 𝑝×𝑞 𝑁 − 𝑛
1−𝛼 =1− -
× ⟺𝛼= -
×
𝑛×𝜀 𝑁−1 𝑛×𝜀 𝑁−1

𝑛× 𝑁 − 1 ×𝜀 - ×𝛼 = 𝑝×𝑞× 𝑁 − 𝑛 ⟺

𝑛× 𝑁 − 1 ×𝜀 - ×𝛼 + 𝑝×𝑞 = 𝑁×𝑝×𝑞 ⟺

𝑵×𝒑×𝒒
𝒏= 𝟐
𝜺 × 𝑵 − 𝟏 ×𝜶 + 𝒑×𝒒

169
ü Lorsque l’échantillon est avec remise ou la
population est infinie alors :
𝑝×𝑞
𝑉𝑎𝑟 𝐹2 =
𝑛
𝑝×𝑞 𝑝×𝑞
1−𝛼 =1− -
⟺𝛼= -
𝑛×𝜀 𝜀 ×𝑛

𝒑×𝒒
𝒏= 𝟐
𝜺 ×𝜶

170
q Deuxième cas: on connait la loi de 𝑭𝒏
Si 𝒏 ≥ 𝟑𝟎, 𝒏𝒑 ≥ 𝟓 et 𝒏𝒑 ≥ 𝟓 alors :
𝟐 𝑭𝒏 − 𝒑
𝑭𝒏 ↝ 𝓝 𝒑, 𝝈𝑭𝒏 . 𝒁 = ↝ 𝓝 𝟎, 𝟏
𝝈𝑭𝒏

𝑝𝑞 𝑁 − 𝑛
𝑠𝑖 Echantillon est sans remise et 𝑐𝑎𝑟𝑑 𝒫 = 𝑁
𝜎¨X = 𝑛 𝑁−1
𝑝𝑞
𝑠𝑖 Echantillon est avec remise ou 𝑠𝑖 𝑁 → +∞
𝑛

Si 𝑝 est inconnu alors on le remplace par la proportion


1 2
empirique 𝑓2 = ∑0>1 𝑥0 .
2
171
Comme :
𝐹2 − 𝑝
𝑍= ↝ 𝒩 0,1
𝜎¨X
On a :

𝐹2 − 𝑝
𝑝 < 𝑧1f¯ = 1 − 𝛼 ⟺
𝜎¨X -
𝑝 𝐹2 − 𝑝 < 𝑧1f¯ ×𝜎¨X = 1 − 𝛼
-
¯
Où 𝑧1f° est le quantile d’ordre 1 − de la loi 𝒩 0,1 .
† -
On pose :
𝜀 = 𝑧1f¯ ×𝜎¨X
-
172
ü 𝑺𝐢 l’échantillon est sans remise et 𝑵 fini alors :

𝑝𝑞 𝑁 − 𝑛
𝜀 = 𝑧1f° ×𝜎¨X ⟺ 𝜀 = 𝑧1f¯ ×
† - 𝑛 𝑁−1

-
𝑝×𝑞 𝑁 − 𝑛 -
𝑝×𝑞 𝑁 − 𝑛
𝜀 = 𝑧1f¯ × × ⟺ 𝜀 = 𝑧1f¯ × ×
- 𝑛 𝑁−1 - 𝑛 𝑁−1
-
⟺ 𝑛× 𝑁 − 1 ×𝜀 - = 𝑧1f¯ × 𝑁 − 𝑛 ×𝑝×𝑞 ⟺
-
- -
𝑛× 𝑁 − 1 ×𝜀 - + 𝑧1f¯ ×𝑝×𝑞 = 𝑧 ¯ ×𝑁×𝑝×𝑞 ⟺
1f
- -

𝑵×𝒛𝟐𝟏f𝜶 ×𝒑×𝒒
𝟐
𝒏=
𝑵 − 𝟏 ×𝜺𝟐 + 𝒛𝟐 𝜶 ×𝒑×𝒒
𝟏f 173
𝟐
ü 𝐒𝐢 Echantillon est avec remise ou 𝐬𝐢 𝑵 𝐢𝐧𝐟𝐢𝐧𝐢

𝑝𝑞
𝜀 = 𝑧1f° ×𝜎¨X ⟺ 𝜀 = 𝑧1f¯ ×
† - 𝑛

𝑝𝑞 -
𝑝𝑞
-
𝜀 = 𝑧1f¯ × ⟺ 𝜀 = 𝑧1f¯ ×
- 𝑛 - 𝑛

-
⟺ 𝑛×𝜀 - = 𝑧1f¯ ×𝑝×𝑞 ⟺
-

𝒛𝟐𝟏f𝜶 ×𝒑×𝒒
𝟐
𝒏=
𝜺𝟐

174
IV.4 Exercices : Détermination de la taille d’échantillon-
Caractère qualitatif
q Exercice 1 :
La direction des statistiques d’un pays a évalué la
population active du pays à 12 millions de personnes sur
une population de 26 millions de personnes en âge de
travailler (15 ans et plus).
1) Quelle est la taille de l'échantillon de personnes à
interroger pour que le taux d’activité empirique ne
s’éloigne pas de plus de ±1% du taux d’activité dans
tout le pays avec une probabilité au moins égale 0,95?
2) Même question mais en supposant que le taux d’activité
empirique suit une loi normale avec une probabilité
égale à 0,95. 175
q Solution :
𝒫: 𝑝𝑒𝑟𝑠𝑜𝑛𝑛𝑒𝑠 𝑒𝑛 â𝑔𝑒 𝑑𝑒 𝑡𝑟𝑎𝑣𝑎𝑖𝑙𝑙𝑒𝑟

𝐴̅

𝐴 = « Personnes actives ».
1-
𝑝 = 𝑝 𝐴 = = 46,15 % ∶ Le taux d’activité dans 𝒫
-—
𝑋↝ℬ 𝑝
𝐸 𝑋 = 𝑝 = 46,15
𝑉𝑎𝑟 𝑋 = 𝑝𝑞 = 0,4615×0,5385 = 0,2485

176
On a :

Taille de la population active


Taux d’activité =
Taille de la population en âge de travailler

1) Cherchons la taille 𝑛 de l’échantillon 𝑋1 , 𝑋- , …, 𝑋2 ↝


ℬ 𝑝 telle que :

𝑝 𝐹2 − 𝑝 < 0,01 ≥ 0,95


Où 𝐹2 le taux d’activité empirique défini par :
2
1
𝐹2 = E 𝑋0
𝑛
0>1

177
On pose :
𝜀 = 0,01 et 1 − 𝛼 = 0,95

Comme la taille de la population 𝑁 est inconnue on suppose


que la population est infinie. Donc :
𝑝×𝑞
𝐸 𝐹2 = 𝑝 𝑉𝑎𝑟 𝐹2 =
𝑛
En utilisant l’inégalité de Bienaymé Techebycheff on
obtient la taille de l’échantillon :
𝑝×𝑞 0,4615×0,5385
𝑛= - ⟺ 𝑛= -
= 49704 ⟺
𝜀 ×𝛼 0,01 ×0,05
𝑛 = 49704
178
2) On cherche la taille de l’échantillon 𝑋1 , 𝑋- , …, 𝑋2 en
supposant que le taux d’intention d’achat empirique suit une
loi normale : (𝑛 ≥ 30, 𝑛𝑝 ≥ 5 et 𝑛𝑝 ≥ 5 )

𝐹2 ↝ 𝒩 𝑝, 𝜎¨-X
𝐹2 − 𝑝
𝑍 = ↝ 𝒩 0,1
𝜎¨X
On cherche donc n telle que :
𝑝 𝐹2 − 𝑝 < 0,01 = 0,95

On utilise l’égalité :
-
𝑧1f ¯ ×𝑝×𝑞
-
𝑛= ⟺
𝜀- 179
-
𝑧Ž,µ¶… ×0,4615×0,5385
𝑛=
0,05-

Où 𝑧Ž,µ¶… est le quantile d’ordre 0,975 de la loi 𝒩 0,1 :


𝑧Ž,µ¶… = 1,96
D’où :

1,96- ×0,4615×0,5385
𝑛= -
= 382 ⟺
0,05

𝑛 = 382

180
q Exercice 2 :

Une enquête récente dans un pays avait donné un taux de


chômage de 10 %. La population active est estimée à 5
millions de personnes.
1) Quelle doit être la taille de l’échantillon d’individus à
prélever pour que le taux de chômage empirique ne
s’écarte pas du taux de chômage dans tout le pays de
plus de ±2% avec une probabilité au moins égale à 0,95.
2) Même question, en supposant que le taux de chômage
empirique suit une loi normale et avec une probabilité
égale à 0,95.

181
q Solution :
Définition : Le taux de chômage exprime la part des
chômeurs dans la population active âgée de 15 ans et plus.
Ce taux est obtenu par le rapport de l'effectif des chômeurs à
celui des actifs âgés de 15 ans et plus.
𝒫: Population active
𝐴

𝐴̅
𝑁 = 8×10— : Taille de la population active
𝐴 = « Chômeurs »
𝑝 = 𝑝 𝐴 = 10% ∶ Le taux de chômage dans 𝒫
𝑋↝ℬ 𝑝
𝐸 𝑋 = 𝑝 = 𝑉𝑎𝑟 𝑋 = 𝑝𝑞 = 0,10×0,90 = 0,09 182
1) Cherchons la taille 𝑛 de l’échantillon 𝑋1 , 𝑋- , …, 𝑋2
telle que :

𝑝 𝐹2 − 𝑝 < 0,02 ≥ 0,95


où 𝐹2 est le le taux de chômage empirique défini par :
2
1
𝐹2 = E 𝑋0
𝑛
0>1

On pose :
𝜀 = 0,02 et 1 − 𝛼 = 0,95

183
Comme la taille de la population 𝑁 est connue on a :

𝑝𝑞 𝑁 − 𝑛
𝐸 𝐹2 = 𝑝 𝑉𝑎𝑟 𝐹2 = ×
𝑛 𝑁−1
En utilisant l’inégalité de Bienaymé Techebycheff on
obtient la taille de l’échantillon :

𝑁×𝑝×𝑞
𝑛= - ⟺
𝜀 × 𝑁 − 1 ×𝛼 + 𝑝×𝑞

8×10— ×0,10×0,90
𝑛= - —

0,02 × 8×10 − 1 ×0,05 + 0,10×0,90

𝑛 = 4498 184
2) On cherche la taille de l’échantillon 𝑋1 , 𝑋- , …, 𝑋2 en
supposant que le taux de chômage empirique suit une loi
normale : (𝑛 ≥ 30, 𝑛𝑝 ≥ 5 et 𝑛𝑝 ≥ 5 )

𝐹2 ↝ 𝒩 𝑝, 𝜎¨-X
𝐹2 − 𝑝
𝑍 = ↝ 𝒩 0,1
𝜎¨X
On cherche donc 𝑛 telle que :
𝑝 𝐹2 − 𝑝 < 0,02 = 0,95

On utilise l’égalité :
-
𝑁×𝑧Ž,µ¶… ×𝑝×𝑞
𝑛= - - ⟺
𝑁 − 1 ×𝜀 + 𝑧Ž,µ¶… ×𝑝×𝑞
185
Où 𝑧Ž,µ¶… est le quantile d’ordre 0,975 de la loi 𝒩 0,1 :
𝑧Ž,µ¶… = 1,96

D’où :

8×10— ×1,96- ×0,10×0,90


𝑛= — - -
= 865 ⟺
8×10 − 1 ×0,02 + 1,96 ×0,10×0,90

𝑛 = 865

186
q Exercice 3 :
Dans une université, 45% des étudiants s'adonnent à au
moins une activité physique par semaine.
Quelle est la taille de l’échantillon d’étudiants à interroger
pour que le pourcentage empirique des étudiants s'adonnant
à au moins une activité physique par semaine ne s’écarte
pas de plus de ±3% du pourcentage des étudiants de
l’université s'adonnant à au moins une activité physique par
semaine avec une probabilité au moins égale à 95%.

187
q Solution :

𝒫: 𝐸𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑠

𝐴̅

𝐴 = « étudiants s'adonnent à au moins une activité


physique par semaine ».
𝑝 = 𝑝 𝐴 = 45 % = 0,45 ∶ Le pourcentage des étudiants
de l’université s'adonnant à au moins une activité physique
par semaine dans 𝒫
𝑋↝ℬ 𝑝
𝐸 𝑋 = 𝑝 = 0,45
𝑉𝑎𝑟 𝑋 = 𝑝𝑞 = 0,45×0,55 = 0,2475
188
1) Cherchons la taille 𝑛 de l’échantillon 𝑋1 , 𝑋- , …, 𝑋2
telle que :

𝑝 𝐹2 − 𝑝 < 0,03 ≥ 0,95


o ù 𝐹2 est le le pourcentage empirique des étudiants
s'adonnant à au moins une activité physique par semaine
défini par :
2
1
𝐹2 = E 𝑋0
𝑛
0>1

On pose :
𝜀 = 0,03 et 1 − 𝛼 = 0,95

189
Comme la taille de la population 𝑁 est inconnue on suppose
que la population est infinie.
On utilise l’inégalité de Bienaymé Tchebycheff pour obtenir
la taille de l’échantillon :
𝑝×𝑞 0,45×0,55
𝑛= - ⟺ 𝑛= -
= 5500
𝜀 ×𝛼 0,03 ×0,05

𝑛 = 5500

190

Vous aimerez peut-être aussi