Académique Documents
Professionnel Documents
Culture Documents
50
Introduction :
51
Chapitre 1: Théorie de l’échantillonnage
I. Définitions :
q Définition : Population
Une population est un ensemble, fini ou non, d'éléments que
l'on souhaite étudier. Il peut s'agir par exemple d'êtres
humains (adultes, enfants, chômeurs, salariés, etc.),
d'animaux ou encore d'objets (entreprises, voitures,
ordinateurs, incendies, accidents, etc.).
Les éléments de la population s’appellent des individus ou
unités statistiques.
q Définition : Recensement
Un recensement consiste à mesurer ou observer le caractère
d'intérêt de façon exhaustive pour tous les individus de la
population.
Cette solution est très couteuse si la taille de la population
est très élevée. 53
q Définition : Sondage
Un sondage est une enquête partielle ou enquête par
échantillonnage, c’est une enquête au cours de laquelle
seulement une partie des individus est observée.
54
q Définition : Tirage avec remise et tirage sans remise
Le tirage de l'échantillon peut se faire avec remise (un même
individu de la population peut apparaître plusieurs fois dans
l'échantillon : échantillon aléatoire simple) ou sans remise
(chaque individu de la population ne peut apparaître qu'une
seule fois dans l'échantillon).
×
× × × 𝐸 𝑋 = 𝑚: moyenne dans 𝒫
× ×
× ×
i ×
𝑉𝑎𝑟 𝑋 = 𝜎 - : variance dans 𝒫
×
×
× ×
× ×
×
58
II.1 Moyenne, variance et quasi-variance d’échantillon
60
q Définition : Moyenne de la moyenne empirique
On considère la moyenne empirique 𝑋<2 de l’échantillon
aléatoire 𝑋1 , 𝑋- , …, 𝑋2 :
2
1
𝑋<2 = E 𝑋0
𝑛
0>1
La moyenne de 𝑋<2 est donnée par :
C𝒏 = 𝒎
𝑬 𝑿
q Définition : Variance de la moyenne empirique
La variance de 𝑋<2 est donnée par :
𝝈𝟐 𝐍 − 𝒏
× 𝐬𝐢 Echantillon est sans remise et 𝑵 𝒇𝒊𝒏𝒊
C𝒏 =
𝑽𝒂𝒓 𝑿 𝒏 𝐍−𝟏
𝝈𝟐
𝐬𝐢 Echantillon est avec remise ou 𝒔𝒊 𝑵 𝒊𝒏𝒇𝒊𝒏𝒊
𝒏 61
q Définition: Moyenne de la variance empirique
On considère la variance empirique 𝑆2- :
2
1
𝑆2 = E 𝑋0 − 𝑋<2 -
-
𝑛
0>1
La moyenne de 𝑆2- est donnée par :
𝟐
𝒏−𝟏 𝟐
𝑬 𝑺𝒏 = 𝝈
𝒏
q Définition: Variance de la variance empirique
Lorsque l’échantillon est avec remise ou la population est
infinie (𝑁 → +∞) alors la variance de 𝑆2- est donnée par :
𝒏−𝟏
𝑽𝒂𝒓 𝑺𝟐𝒏
= 𝒏 − 𝟏 𝝁𝟒 − 𝒏 − 𝟑 𝝈 𝟒
𝒏𝟑
où 𝜇U = 𝐸 𝑋 − 𝑚 U est le moment centré d’ordre 4. 62
q Définition: Moyenne de la quasi-variance
On considère la quasi-variance 𝑆′-2 :
2
1
-
𝑆′2 = E 𝑋0 − 𝑋<2 -
𝑛−1
0>1
La moyenne de la quasi-variance 𝑆′-2 est donnée par :
𝟐
𝒏−𝟏 𝟐
𝑬 𝑺′𝒏 = 𝝈
𝒏
q Définition: Variance de la quasi-variance
Lorsque l’échantillon est avec remise ou la population est
infinie (𝑁 → +∞) alors la variance de la quasi-variance est
donnée par :
𝟏
𝑽𝒂𝒓 𝑺′𝟐𝒏 = 𝒏 − 𝟏 𝝁𝟒 − 𝒏 − 𝟑 𝝈𝟒
𝒏 𝒏−𝟏
63
II.2 Distribution d’échantillonnage de la moyenne :
×
× × × 𝐸 𝑋 = 𝑚: moyenne dans 𝒫
× ×
× ×
i ×
𝑉𝑎𝑟 𝑋 = 𝜎 - : variance dans 𝒫
×
×
× ×
× ×
×
×
× × × 𝐸 𝑋 = 𝑚: moyenne dans 𝒫
× ×
× ×
i ×
𝑉𝑎𝑟 𝑋 = 𝜎 - : variance dans 𝒫
×
×
× ×
× ×
×
Si 𝑿 ↝ 𝓝 𝒎, 𝝈𝟐 alors :
𝒏𝑺𝟐𝒏 C𝒏
𝒏 − 𝟏 𝑺′𝟐𝒏 ∑𝒏𝒊>𝟏 𝑿𝒊 − 𝑿 𝟐
𝟐
= 𝟐
= ↝ 𝝌𝟐 𝒏 − 𝟏
𝝈 𝝈 𝝈𝟐
67
II.3 Exercices : Distribution d’échantillonnage de la
moyenne
q Exercice 1 :
Le directeur des ressources humaines d’une entreprise a
établi que les résultats à un test mesurant la dextérité
manuelle de la main d’oeuvre affectée à des taches
d’assemblages de pièces complexes sont distribués d’après
la loi normale de moyenne 𝑚 = 72 et de variance 𝜎 - =
36.
1) Quelle est la probabilité qu’un employé sélectionné au
hasard obtienne un score de dextérité manuelle inférieur
à 63 ?
68
2) Un échantillon aléatoire de 25 employés a subi le test de
dextérité manuelle.
i) Quelle est la distribution de la moyenne empirique?
ii) Quelle est la distribution de la variance de l’échantillon?
3) Quelle est la probabilité que la moyenne empirique soit
comprise entre 69 et 75 ?
4) Quelle est la probabilité que l’écart entre la moyenne de
empirique et la moyenne de la population soit supérieur
à3?
69
q Solution :
𝑋 ↝ 𝒩 𝑚, 𝜎 -
1) On sélectionne un employé au hasard. Calculons la
probabilité pour que sa dextérité manuelle soit inférieure
à 63. Il faut calculer 𝑝 𝑋 < 63 .
On a d’après l’énoncé :
-
𝑋−𝑚
𝑋 ↝ 𝒩 𝑚, 𝜎 ⟺𝑍= ↝ 𝒩 0,1
𝜎 70
Donc :
𝑋 − 𝑚 63 − 𝑚 63 − 72
𝑝 𝑋 < 63 = 𝑝 < =𝑝 𝑍<
𝜎 𝜎 6
9
= 𝑝 𝑍 < − = 𝑝 𝑍 < −3 = 𝜋 −3 = 1 − 𝜋 3
6
où 𝜋 est la fonction de répartition de la loi normale centrée
et réduite 𝒩 0,1 .
Donc :
𝑝 𝑋 < 63 = 1 − 𝜋 3 = 0,998665 = 99,87% ⟺
𝑝 𝑋 < 63 = 0,9987 = 99,87%
Comme :
𝑋 ↝ 𝒩 𝑚, 𝜎 -
On déduit la loi de 𝑋<-… :
𝑋<-… ↝ 𝒩 𝐸 𝑋<-… , 𝜎W-<†‡ 72
Comme la taille de la population 𝑁 est inconnue on va
supposer qu’elle est infinie (ce qui équivaut à un tirage avec
remise). Dans ce cas on a :
𝐸 𝑋<-… = 𝑚 = 72
𝜎 - 36
𝑉𝑎𝑟 𝑋<-… = 𝜎W-<†‡ = = = 1,44
𝑛 25
Donc :
𝑋<-… ↝ 𝒩 72 ; 1,44
73
ii) Cherchons est la distribution de la variance de
l’échantillon :
-…
1
-
𝑆-… = E 𝑋0 − 𝑋<-… -
25
0>1
Comme 𝑋 ↝ 𝒩 𝑚, 𝜎 - donc :
𝑛𝑆2- -
-
↝ 𝜒 𝑛−1 ⟺
𝜎
25 -
𝑆-… ↝ 𝜒 - 𝑛 − 1
36
74
3) Calculons la probabilité que la moyenne empirique soit
comprise entre 69 et 75 :
D’où :
𝑝 𝑋<-… − 𝑚 > 3 = 0,0062 = 0,62%
77
q Exercice 2 :
On suppose que les étudiants d’un cours de comptabilité
générale, noté sur 100, aient des notes normalement
distribuées avec une moyenne 𝑚 = 72 et un écart-type
σ = 9,1.
1) Trouver la probabilité pour qu’un seul choisi au hasard
ait une note supérieure à 80,2.
2) Trouver la probabilité pour qu’un échantillon aléatoire
de 10 étudiants ait une note moyenne supérieure à 80,3.
78
q Solution :
𝒫: population
× × 𝑋 = Note de comptabilité générale
× × ×
×
𝐸𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑠
i 𝐸 𝑋 = 𝑚 = 72 : Note moyenne dans 𝒫
×
× ×
× ×
×
𝑉𝑎𝑟 𝑋 = 𝜎 - = 9,1- = 82,81 : Variance dans 𝒫
𝑋 ↝ 𝒩 𝑚, 𝜎 -
1) Trouvons la probabilité pour qu’un étudiant choisi au
hasard ait une note supérieure à 80,2 :
𝑋 − 𝑚 80,2 − 𝑚
𝑝 𝑋 > 80,2 = 𝑝 >
𝜎 𝜎
79
80,2 − 72 8,2
=𝑝 𝑍> =𝑝 𝑍>−
9,1 9,1
= 𝑝 𝑍 > −0,901 = 1 − 𝑝 𝑍 < −0,901 =
1 − 𝜋 −0,901 = 𝜋 0,901 = 0,8186
𝑝 𝑋 > 80,2 = 0,8186 = 81,86%
Interprétation : 81,86% des étudiants ont une note supérieure
à 80,2
2) Calculons la probabilité pour qu’un échantillon aléatoire
de 10 étudiants ait une note moyenne supérieure à 80,3. Soit
𝑋1 , 𝑋- , …, 𝑋1Ž l’échantillon aléatoire des notes des 10
étudiants. La note moyenne empirique est donnée par :
1Ž
1
𝑋<1Ž = E 𝑋0
10 80
0>1
Calculons la probabilité :
𝑋<1Ž − 𝐸 𝑋<1Ž 80,3 − 𝐸 𝑋<1Ž
𝑝 𝑋<1Ž > 80,3 = 𝑝 >
𝜎W<•• 𝜎W<••
La moyenne de 𝑋<1Ž est donnée par :
𝐸 𝑋<1Ž = 𝑚 = 72
La variance de 𝑋<1Ž est donnée par : (on suppose que la taille
de la population est infinie) :
-
𝜎 82,81
𝑉𝑎𝑟 𝑋<1Ž = 𝜎W<•• =
-
= = 8,281. 𝜎W<•• = 2,8776
𝑛 10
D’où :
80,3 − 72
𝑝 𝑋<1Ž > 80,3 = 𝑝 𝑍 > = 𝑝 𝑍 > 2,88
2,8776
= 1 − 𝑝 𝑍 < 2,88 = 1 − 𝜋 2,88 = 0,998 ⟺
𝑝 𝑋<1Ž > 80,3 = 0,998 = 99,80% 81
q Exercice 3 :
La taille dans une population d’étudiants suit une loi
normale de moyenne égale à 1,70 m et un écart-type égal à
0,8 m.
Si un échantillon de 10 étudiants est prélevé, quelle est la
probabilité pour que la taille moyenne empirique s’écarte
de 6 cm de la taille moyenne de la population.
q Solution :
𝒫: population
× ×
× ×
𝑋 = Taille
×
×
𝐸𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑠
i 𝐸 𝑋 = 𝑚 = 1,70𝑚 : Taille moyenne dans 𝒫
×
× ×
× ×
×
𝑉𝑎𝑟 𝑋 = 𝜎 - = 0,8- = 0,64 : variance dans 𝒫
𝑋 ↝ 𝒩 𝑚, 𝜎 - 82
2) Soit 𝑋1 , 𝑋- , …, 𝑋1Ž l’échantillon aléatoire des tailles des
10 étudiants choisis. La taille moyenne empirique est définie
par :
1Ž
1
𝑋<1Ž = E 𝑋0
10
0>1
On déduit :
<1Ž − 𝑚
𝑋
𝑋<1Ž ↝ 𝒩 𝐸 𝑋<1Ž , 𝜎W-<•• ⟺ 𝑍 = ↝ 𝒩 0,1
𝜎W<••
84
D’où :
𝑝 𝑋<1Ž − 𝑚 > 0,06 = 𝑝 𝑍 > 0,24 = 1 − 𝑝 𝑍 < 0,24
= 1 − 𝜋 0,24 = 0,5948 ⟺
85
q Exercice 4 :
Un bureau de conseil en organisation et méthodes auprès des
entreprises a mis au point un système d’appréciation ou
d’évaluation de cadres d’entreprise. Diverses caractéristiques
des cadres sont évaluées et on a établi sur une période de
quatre ans que le score global à cette batterie de tests était
distribué normalement avec une moyenne 𝑚 = 600 et un
écart-type 𝜎 = 50. Supposons qu’on fait subir à un échantillon
aléatoire de 25 cadres d’une multinationale l’ensemble des
tests.
1) Caractériser la distribution d’échantillonnage de la
moyenne.
2) Quelle est la probabilité que la moyenne empirique soit
comprise entre 590 et 610 ?
3) Entre quelle valeurs la moyenne empirique peut-elle varier
86
dans 95% des cas autour de 𝑚?
q Solution :
𝒫: population
× × 𝑋 = Score global des tests
× × ×
×
𝐶𝑎𝑑𝑟𝑒𝑠
i 𝐸 𝑋 = 𝑚 = 600 : Score moyen dans 𝒫
×
× ×
× ×
×
𝑉𝑎𝑟 𝑋 = 𝜎 - = 50- = 2500 : variance dans 𝒫
𝑋 ↝ 𝒩 𝑚, 𝜎 -
Comme :
𝑋 ↝ 𝒩 𝑚, 𝜎 -
On déduit la distribution d’échantillonnage de 𝑋<-… :
𝑋<-… ↝ 𝒩 600,100
88
2) Calculons :
𝑝 590 < 𝑋<-… < 610
× × ×
×
i
𝑗𝑜𝑢𝑟𝑛é𝑒𝑠
×
× ×
× ×
×
On a bien :
𝑋<1Ž − 𝐸 𝑋<1Ž
𝑍= ↝ 𝒩 1,0
𝜎W<••
b) Calculons :
𝑋<1Ž − 𝐸 𝑋<1Ž 55000 − 𝐸 𝑋<1Ž
𝑝 𝑋<1Ž < 55000 = 𝑝 <
𝜎W<•• 𝜎W<••
55000 − 50000
=𝑝 𝑍< = 𝑝 𝑍 < = 𝜋 1,9764
64×10…
= 0,9759 ⟺
𝑝 𝑋<1Ž < 55000 = 0,9759 = 97,59 % > 70 % 97
III. Echantillonnage pour un caractère qualitatif
On considère une population 𝒫 de taille 𝑁. On définit sur
cette population un caractère qualitatif représenté par une
variable aléatoire discrète associée à un évènement succès
choisi dans 𝒫 tel que :
𝑝 = 𝑝 𝐴 : la proportion (le pourcentage) des individus de
𝒫 qui appartiennent à A 𝒫
𝑋↝ℬ 𝑝 𝐴
On a :
𝐴̅
𝐸 𝑋 =𝑝
𝑉𝑎𝑟 𝑋 = 𝑝𝑞 = 𝑝 1 − 𝑝
98
III.1 Définitions :
q Définition: Proportion ou fréquence empirique
On appelle proportion empirique de l’échantillon aléatoire
𝑋1 , 𝑋- , …, 𝑋2 ↝ ℬ 𝑝 la statistique notée 𝐹2 définie par :
𝒏
𝟏
𝑭𝒏 = E 𝑿𝒊
𝒏
𝒊>𝟏
Si l’échantillon est avec remise alors :
𝒏
𝒀 = E 𝑿𝒊 ↝ 𝓑 𝒏, 𝒑
𝒊>𝟏
Si l’échantillon est sans remise alors :
𝒏
𝒀 = E 𝑿𝒊 ↝ 𝓗 𝒏, 𝒑, 𝑵
𝒊>𝟏 99
La variable 𝑌 = ∑20>1 𝑋0 représente le nombre total
d’individus qui appartiennent à 𝐴 dans l’échantillon.
𝑽𝒂𝒓 𝑭𝒏 = 𝝈𝟐𝑭𝒏
𝒑𝒒 𝑵 − 𝒏
× 𝑠𝑖 Echantillon est sans remise et 𝑁 𝑓𝑖𝑛𝑖
= 𝒑𝒒 𝒏 𝑵 − 𝟏
𝑠𝑖 Echantillon est avec remise ou 𝑠𝑖 𝑁 𝑖𝑛𝑓𝑖𝑛𝑖
𝒏
100
III.2 Distribution d’échantillonnage de la proportion :
§ Si 𝒏 ≥ 𝟑𝟎, 𝒏𝒑 ≥ 𝟓 et 𝒏𝒑 ≥ 𝟓 alors :
𝑭𝒏 − 𝒑
𝒁= ↝ 𝓝 𝟎, 𝟏
𝝈𝑭𝒏
q Exercice 1 :
Une étude a révélé que 10% des achats d'un médicament
dans un grand nombre de pharmacies sont faits sans
ordonnance. Un échantillon de 500 achats du médicament
a été tiré (avec remise) au hasard.
1) Calculer la probabilité pour que le nombre d’achats du
médicament fait sans ordonnance parmi les 500 achats
soit supérieur à 40.
2) Donner la distribution d’échantillonnage de la
proportion empirique.
3) Calculer la probabilité pour que la proportion
empirique soit supérieur à 15%. 102
q Solution :
𝒫 : Les achats
𝐴
𝐴 = « Achats faits sans ordonnance »
𝐴̅
103
𝑋1 , 𝑋- , …, 𝑋…ŽŽ ↝ ℬ 𝑝 ∶ Echantillon de taille 𝑛 = 500
𝑌 = ∑…ŽŽ
0>1 𝑋0 : Le nombre d’achats du médicament faits sans
ordonnance parmi les 500 achats.
1
𝐹2 = ∑…ŽŽ 𝑋 : La proportion empirique d’achats du
…ŽŽ 0>1 0
médicament faits sans ordonnance
1) La probabilité pour que le nombre d’achats du
médicament faits sans ordonnance parmi les 500 achats
soit supérieur à 40 est donnée par :
𝑝 𝑌 > 40
104
Comme l’échantillon est tiré avec remise alors :
…ŽŽ
𝑌 = E 𝑋0 ↝ ℬ 𝑛, 𝑝
0>1
Avec :
𝐸 𝑌 = 𝑛×𝑝 = 500×0,10 = 50
𝑉𝑎𝑟 𝑌 = 𝜎§- = 𝑛×𝑝×𝑞 = 500×0,10×0,90 = 45
𝜎§ = 6,708
On a :
𝑛 = 500 > 30 𝑛×𝑝 = 500×0,10 = 50 > 5
𝑛× 1 − 𝑝 = 500×0,90 = 450 > 5
On a :
𝑌 ↝ 𝒩 50,45
𝑌−𝐸 𝑌
𝑍= ↝ 𝒩 0,1
𝜎§ 105
𝑌−𝐸 𝑌 40 − 𝐸 𝑌
𝑝 𝑌 > 40 = 𝑝 >
𝜎§ 𝜎§
40 − 50
=𝑝 𝑍> = 𝑝 𝑍 > −1,49
6,708
𝑝 𝑌 > 40 = 97,06 %
106
2) Donnons la distribution d’échantillonnage de la
proportion empirique. La proportion empirique est donnée
par :
…ŽŽ
1 𝑌
𝐹…ŽŽ = E 𝑋0 =
500 500
0>1
On a :
𝐸 𝐹…ŽŽ = 𝑝 = 0,10
𝑝×𝑞 0,10×0,90
𝑉𝑎𝑟 𝐹…ŽŽ = = = 0,0008
𝑛 500
On a :
𝐹…ŽŽ ↝ 𝒩 0,10; 0,0008
𝐹…ŽŽ − 𝐸 𝐹…ŽŽ
𝑍= ↝ 𝒩 0; 1
𝜎¨ 107
3) Calculons la probabilité pour que la proportion
empirique soit supérieur à 15% :
= 1 − 𝜋 1,77 = 0,9616
108
q Exercice 2 :
Un candidat a obtenu 55 % des suffrages exprimés à une
élection.
1) Quelle est la probabilité d'avoir, dans un échantillon
aléatoire de 100 personnes sélectionnées, moins de 50 %
de voix pour le candidat ?
2) Même question pour un échantillon de 2000 personnes.
3) Combien de personnes faut-il interroger pour que la
probabilité que moins de 50 % d'entre elles aient voté
pour le candidat passe en-dessous de 1 % ?
109
q Solution :
𝒫 : Electeurs
𝐴
𝐴 = « Electeurs votant pour le candidat »
𝐴̅
110
1) On a un échantillon de taille 𝑛 = 100 :
𝑋1 , 𝑋- , …, 𝑋1ŽŽ ↝ ℬ 𝑝
1
𝐹1ŽŽ = ∑1ŽŽ 𝑋 : La proportion empirique d’électeurs
1ŽŽ 0>1 0
votant pour le candidat
On a :
𝐸 𝐹1ŽŽ = 𝑝 = 0,55
𝑝×𝑞 0,55×0,45
𝑉𝑎𝑟 𝐹1ŽŽ = = = 0,002475
𝑛 100
𝜎¨••• = 0,049749
111
Comme :
𝑛 = 100 > 30 𝑛×𝑝 = 100×0,55 = 55 > 5
𝑛× 1 − 𝑝 = 100×0,45 = 45 > 5
alors :
𝐹1ŽŽ ↝ 𝒩 0,55; 0,002475
𝐹1ŽŽ − 𝐸 𝐹1ŽŽ
𝑍= ↝ 𝒩 0,1
𝜎¨•••
Calculons maintenant la probabilité d'avoir, dans
l’échantillon aléatoire des 100 personnes sélectionnées,
moins de 50 % de voix pour le candidat :
𝐹1ŽŽ − 𝐸 𝐹1ŽŽ 0,5 − 𝐸 𝐹1ŽŽ
𝑝 𝐹1ŽŽ < 0,5 = 𝑝 <
𝜎¨••• 𝜎¨•••
0,5 − 0,55
=𝑝 𝑍< = 𝑝 𝑍 < −1,01
0,049749 112
= 𝜋 −1,01 = 1 − 𝜋 1,01 = 1 − 0,8438 = 0,1562
118
q Solution:
𝒫 : Jeunes adolescents
𝐴̅
119
Un échantillon aléatoire de taille 200 a été sélectionné.
𝑋1 , 𝑋- , …, 𝑋-ŽŽ ↝ ℬ 𝑝
1) Déterminons la distribution d’échantillonnage du taux
d’intention d’achat empirique :
-ŽŽ
1
𝐹-ŽŽ = E 𝑋0
200
0>1
On a :
𝐸 𝐹-ŽŽ = 𝑝 = 0,60
𝑝×𝑞 0,60×0,40
𝑉𝑎𝑟 𝐹-ŽŽ = = = 0,0012
𝑛 200
𝜎¨†•• = 0,03464
120
Comme :
𝑛 = 200 > 30 𝑛×𝑝 = 200×0,60 = 120 > 5
𝑛× 1 − 𝑝 = 200×0,40 = 80 > 5
On a :
𝐹-ŽŽ ↝ 𝒩 0,60; 0,0012
𝐹-ŽŽ − 𝐸 𝐹-ŽŽ
𝑍= ↝ 𝒩 0,1
𝜎¨†••
−0,05 0,05
=𝑝 ≤𝑍≤ =
0,03464 0,03464
= 𝑝 −1,44 ≤ 𝑍 ≤ 1,44 = 𝜋 1,44 − 𝜋 −1,44
= 𝜋 1,44 − 1 − 𝜋 1,44 = 2×𝜋 1,44 − 1
= 2×0,9251 − 1 = 0,8502
122
q Exercice 4 :
123
3) Calculer la probabilité pour que moins de 20% des
consommateurs de l’échantillon se déclarent influencés
par la marque de commerce.
4) Dans quel intervalle la proportion empirique des
consommateurs influencés par la marque de commerce
varie autour de la proportion 𝑝 avec une probabilité
égale à 0,90.
124
q Solution:
𝒫 : Consommateurs
𝐴̅
𝐴 = Consommateurs influencés par la marque de commerce
2) Posons :
𝑌1ŽŽ = Le nombre de consommateurs influencés par la
marque de commerce dans l’échantillon.
On a alors :
1ŽŽ
1 𝑌1ŽŽ
𝐹1ŽŽ = E 𝑋0 =
100 100
0>1 127
3) Calculons la probabilité :
𝑝 𝑌1ŽŽ ≥ 35 = 𝑝 100×𝐹1ŽŽ ≥ 35 = 𝑝 𝐹1ŽŽ ≥ 0,35
130
𝑎 𝑎 0,90
2×𝜋 − 1 = 0,90 ⟺ 𝜋 = = 0,45
0,0433 0,0433 2
𝑎
⟺ = 0,6736 ⟺ 𝑎 = 0,6736×0,0433 ⟺
0,0433
𝑎 = 0,0292
𝑝 − 𝑎 = 0,25 − 0,0292 = 0,2208
𝑝 + 𝑎 = 0,25 + 0,0292 = 0,2792
𝑝 − 𝑎, 𝑝 + 𝑎 = 0,2208; 0,2792 = 22,08 %; 27,92 %
On déduit :
𝑝 𝐹1ŽŽ ∈ 22,08 %; 27,92 % = 0,90
On conclut qu’on a 90% de chances pour que la proportion
empirique varie autour de 𝑝 entre 22,08 % et 27,92 %. 131
IV. Détermination de la taille d’échantillon
×
× × × 𝐸 𝑋 = 𝑚: moyenne dans 𝒫
× ×
× i × ×
𝑉𝑎𝑟 𝑋 = 𝜎 - : variance dans 𝒫
×
×
× ×
× ×
×
132
Soit 𝑋<2 la moyenne empirique de l’échantillon aléatoire 𝑋1 ,
𝑋- , …, 𝑋2 :
2
1
𝑋<2 = E 𝑋0
𝑛
0>1
133
q Premier cas: on ne connait pas la loi de 𝑿
Il suffit de prendre :
𝜎- 𝑁 − 𝑛
1−𝛼 =1− - 𝑛 𝑁 − 1 𝜀 - 𝛼 = 𝜎 - 𝑁 − 𝑛
𝑛𝜀 𝑁 − 1
𝑛 𝑁 − 1 𝜀 - 𝛼 + 𝜎 - = 𝑁𝜎 -
𝑵𝝈𝟐
𝒏=
𝑵 − 𝟏 𝜺𝟐 𝜶 + 𝝈𝟐
135
§ Lorsque l’échantillon est avec remise ou la
population est infinie alors :
𝜎-
𝑉𝑎𝑟 𝑋<2 =
𝑛
Donc :
𝜎-
1−𝛼 =1− -
𝑛𝜀
𝝈𝟐
𝒏= 𝟐
𝜺 𝜶
136
q Deuxième cas: 𝑿 ↝ 𝓝 𝒎, 𝝈𝟐
On a:
𝐸 𝑋<2 = 𝑚
𝑉𝑎𝑟 𝑋<2 = 𝜎W-<X
-
⟺ 𝑛. 𝑁 − 1 . 𝜀 - = 𝑧1f -
¯. 𝑁 − 𝑛 . 𝜎 ⟺
-
- -
𝑛 𝑁 − 1 . 𝜀 - + 𝑧1f¯ . 𝜎 -
= 𝑧1f
-
¯ . 𝑁. 𝜎 ⟺
- -
𝑵. 𝒛𝟐𝟏f𝜶 . 𝝈𝟐
𝟐
𝒏=
𝑵 − 𝟏 . 𝜺𝟐 + 𝒛𝟐 𝜶. 𝝈
𝟐
𝟏f
𝟐
138
ü Lorsque l’échantillon est avec remise ou la
population est infinie :
-
𝜎
𝑉𝑎𝑟 𝑋<2 = 𝜎W-<X =
𝑛
D’où
-
𝜎 - 𝜎
𝜀 = 𝑧1f¯ . 𝜎W<X = 𝑧1f¯ . ⟺ 𝜀 - = 𝑧1f ¯. ⟺
- - 𝑛 - 𝑛
-
𝑛. 𝜀 - = 𝑧1f -
¯. 𝜎 ⟺
-
𝒛𝟐𝟏f𝜶 . 𝝈𝟐
𝟐
𝒏=
𝜺𝟐
139
§ Si 𝑋 ↝ 𝒩 𝑚, 𝜎 - et 𝜎 - est inconnue alors :
On remplace 𝜎 - par la quasi-variance 𝑆′-2 définie par:
2
1
-
𝑆′2 = E 𝑋0 − 𝑋<2 -
𝑛−1
0>1
ü Lorsque l’échantillon est sans remise :
-
𝜎 𝑁−𝑛
𝑉𝑎𝑟 𝑋<2 = 𝜎W<X =
-
.
𝑛 𝑁−1
𝑋<2 − 𝑚 𝑋<2 − 𝑚
≈𝑇= ↝𝑡 𝑛−1
𝜎W<X e
𝑆2 𝑁 − 𝑛
.
𝑛 𝑁−1
140
𝑋<2 − 𝑚 2f1
𝑝 < 𝑡1f ¯ =1−𝛼 ⟺
𝑆2e 𝑁−𝑛 -
.
𝑛 𝑁−1
e
𝑆2 𝑁−𝑛
𝑝 𝑋<2 − 𝑚 < 𝑡1f¯ ×
2f1
. =1−𝛼
- 𝑛 𝑁−1
On pose :
e
2f1 𝑠2 𝑁−𝑛
𝜀 = 𝑡1f¯ × . ⟺
- 𝑛 𝑁−1
𝑵. 𝒕𝒏f𝟏
𝟏f
𝟐
𝜶 . 𝒔′𝒏
𝟐
𝒏=
𝑵 − 𝟏 . 𝜺𝟐 + 𝒕𝒏f𝟏𝜶 . 𝒔′𝟐𝒏
𝟏f
𝟐 141
2f1 -
Si en plus 𝑛 ≥ 30 alors on remplace 𝑡1f ° par 𝑧
1f
° :
† †
𝑵. 𝒛𝟐𝟏f𝜶 . 𝒔′𝟐𝒏
𝟐
𝒏=
𝑵 − 𝟏 . 𝜺𝟐 + 𝒛𝟐 𝟐
𝜶 . 𝒔′𝒏
𝟏f
𝟐
q Exercice 1 :
Une étude sur la population des représentants commerciaux
a révélé que le nombre moyen de jours par an passés sur les
routes est égal à 115 avec un écart-type de 60 jours par an.
On sélectionne un échantillon aléatoire de 50 représentants
commerciaux.
1) Donner la distribution d’échantillonnage du nombre
moyen empirique de jours par an passés sur les routes.
2) Quelle est la probabilité que le nombre moyen empirique
de jours par an passés sur les routes soit supérieur à 115
jours par an?
144
3) Quelle serait la probabilité de la question 2) si la taille
de l'échantillon était 100 ?
4) On suppose maintenant que la taille de l’échantillon est
inconnue. Quel est le nombre de représentants
commerciaux à interroger pour que le nombre moyen
empirique de jours par an passés sur les routes ne
s'écarte pas de plus de ±5 jours de la moyenne dans la
population avec une probabilité au moins égale à 0,95?
5) Même question que la question 4) mais en supposant
que la population est normale et que la probabilité est
égale à 0,95.
145
q Solution:
𝒫: Représentants commerciaux
× ×
× × ×
×
i
× ×
× × ×
×
×
× ×
× ×
×
146
𝑋1 , 𝑋- , …, 𝑋…Ž : Echantillon aléatoire de taille 𝑛 = 50.
On considère le nombre moyen empirique de jours par an
passés sur les routes :
…Ž
1
𝑋<…Ž = E 𝑋0
50
0>1
1) Donnons la distribution d’échantillonnage du nombre
moyen empirique 𝑋<…Ž de jours par an passés sur les
routes.
On a : (population supposée infinie)
𝐸 𝑋<…Ž = 𝑚 = 115
-
𝜎 3600
𝑉𝑎𝑟 𝑋<…Ž = 𝜎W<‡• =
-
= = 72
𝑛 50
𝜎W<‡• = 8,485 147
Comme 𝑛 = 50 > 30 alors grâce au théorème central limite
on a :
<…Ž − 𝑚
𝑋
𝑋<…Ž ↝ 𝒩 𝑚, σ-Ƈ• 𝑒𝑡 𝑍 = ↝ 𝒩 0,1
𝜎W<‡•
𝑛 = 2880
150
5) On suppose que 𝑋 ↝ 𝒩 𝑚, 𝜎 -
Cherchons maintenant la taille de l’échantillon 𝑛 telle que :
𝑝 𝑋<2 − 𝑚 < 5 = 0,95
On pose 1 − 𝛼 = 0,95 et 𝜀 = 5. En utilisant les propriétés
de la loi 𝒩 0,1 on obtient : (population supposée infinie)
- -
𝑧1f ¯. 𝜎 -
- 𝑧Ž,µ¶… ×3600
𝑛= -
⟺𝑛=
𝜀 25
Où 𝑧Ž,µ¶… est le quantile d’ordre 0,975 de la loi 𝒩 0,1 ,
obtenu à partir de la table :
𝑧Ž,µ¶… = 1,96
On déduit :
1,96- ×3600
𝑛= = 554
25 151
q Exercice 2 :
152
q Solution :
𝒫: salariés dans le secteur de production
× ×
× × ×
×
i
× ×
× × ×
×
×
× ×
× ×
×
153
𝑋1 , 𝑋- , …, 𝑋2 : Echantillon aléatoire de taille 𝑛.
Le revenu mensuel moyen empirique est donné par:
2
1
𝑋<2 = E 𝑋0
𝑛
0>1
𝑛 = 500
2) On suppose que le revenu mensuel 𝑋 ↝ 𝒩 𝑚, 𝜎 - .
𝑋<2 − 𝑚
𝑍= ↝ 𝒩 0,1
𝜎W<X
Cherchons donc la taille de l’échantillon 𝑛 telle que :
𝑝 𝑋<2 − 𝑚 < 100 = 0,95
On pose 1 − 𝛼 = 0,95 et 𝜀 = 100.
155
On utilise l’égalité :
-
𝑧1f¯ ×𝜎 -
-
𝑛= ⟺
𝜀-
-
𝑧1f ¯ ×250000
-
𝑛=
100-
Où 𝑧Ž,µ¶… est le quantile d’ordre 0,975 de la loi 𝒩 0,1 :
𝑧Ž,µ¶… = 1,96
D’où :
1,96- ×250000
𝑛= -
= 96 ⟺
100
𝑛 = 96 156
q Exercice 3 :
On souhaite réaliser une enquête sur la dépense mensuelle
des ménages d’une population normale composée de 5
millions de ménages.
Quel doit être la taille de l’échantillon des ménages à
interroger pour que la dépense mensuelle moyenne
empirique ne s’écarte pas de plus de ±100 DH avec une
probabilité égale à 0,99 ?
L’écart type de la dépense mensuelle des ménages est
supposée être égale à 2000 DH.
157
q Solution :
𝒫: Ménages × ×
× × ×
×
i
× ×
× × ×
×
×
× ×
× ×
×
158
𝑋1 , 𝑋- , …, 𝑋2 : Echantillon aléatoire de taille 𝑛.
Dépense mensuelle moyenne empirique est donnée par:
2
1
𝑋<2 = E 𝑋0
𝑛
0>1
159
Comme 𝑋 ↝ 𝒩 𝑚, 𝜎 - et 𝑁 est connue on utilise la formule :
-
𝑁. 𝑧Ž,µµ… . 𝜎-
𝑛=
𝑁 − 1 . 𝜀- + 𝑧- ¯ . 𝜎-
1f
-
D’où :
𝑛 = 2662 160
q Exercice 4 :
161
q Solution :
𝒫: Personnes
× ×
× × ×
×
i
× ×
× × ×
×
×
× ×
× ×
×
𝐸 𝑋 = 𝑚 : QI moyen dans 𝒫
162
𝑋1 , 𝑋- , …, 𝑋2 : Echantillon aléatoire de taille 𝑛.
On pose 1 − 𝛼 = 0,95 et 𝜀 = 2.
Comme 𝑋 ↝ 𝒩 𝑚, 𝜎 - on utilise l’égalité :
- -
𝑧1f ¯ ×𝜎
-
𝑛= ⟺
𝜀- 163
-
𝑧Ž,µ¶… ×250
𝑛=
2-
164
IV.3 Détermination de la taille d’échantillon : Caractère
qualitatif
165
On considère la proportion empirique de l’échantillon
aléatoire 𝑋1 , 𝑋- , …, 𝑋2 :
2
1
𝐹2 = E 𝑋0
𝑛
0>1
166
q Premier cas: on ne connait pas la loi de 𝐹2
167
ü Lorsque l’échantillon est sans remise alors :
𝑝𝑞 𝑁 − 𝑛
𝑉𝑎𝑟 𝐹2 = ×
𝑛 𝑁−1
168
Il suffit de prendre :
𝑝×𝑞 𝑁 − 𝑛 𝑝×𝑞 𝑁 − 𝑛
1−𝛼 =1− -
× ⟺𝛼= -
×
𝑛×𝜀 𝑁−1 𝑛×𝜀 𝑁−1
𝑛× 𝑁 − 1 ×𝜀 - ×𝛼 = 𝑝×𝑞× 𝑁 − 𝑛 ⟺
𝑛× 𝑁 − 1 ×𝜀 - ×𝛼 + 𝑝×𝑞 = 𝑁×𝑝×𝑞 ⟺
𝑵×𝒑×𝒒
𝒏= 𝟐
𝜺 × 𝑵 − 𝟏 ×𝜶 + 𝒑×𝒒
169
ü Lorsque l’échantillon est avec remise ou la
population est infinie alors :
𝑝×𝑞
𝑉𝑎𝑟 𝐹2 =
𝑛
𝑝×𝑞 𝑝×𝑞
1−𝛼 =1− -
⟺𝛼= -
𝑛×𝜀 𝜀 ×𝑛
𝒑×𝒒
𝒏= 𝟐
𝜺 ×𝜶
170
q Deuxième cas: on connait la loi de 𝑭𝒏
Si 𝒏 ≥ 𝟑𝟎, 𝒏𝒑 ≥ 𝟓 et 𝒏𝒑 ≥ 𝟓 alors :
𝟐 𝑭𝒏 − 𝒑
𝑭𝒏 ↝ 𝓝 𝒑, 𝝈𝑭𝒏 . 𝒁 = ↝ 𝓝 𝟎, 𝟏
𝝈𝑭𝒏
où
𝑝𝑞 𝑁 − 𝑛
𝑠𝑖 Echantillon est sans remise et 𝑐𝑎𝑟𝑑 𝒫 = 𝑁
𝜎¨X = 𝑛 𝑁−1
𝑝𝑞
𝑠𝑖 Echantillon est avec remise ou 𝑠𝑖 𝑁 → +∞
𝑛
𝐹2 − 𝑝
𝑝 < 𝑧1f¯ = 1 − 𝛼 ⟺
𝜎¨X -
𝑝 𝐹2 − 𝑝 < 𝑧1f¯ ×𝜎¨X = 1 − 𝛼
-
¯
Où 𝑧1f° est le quantile d’ordre 1 − de la loi 𝒩 0,1 .
† -
On pose :
𝜀 = 𝑧1f¯ ×𝜎¨X
-
172
ü 𝑺𝐢 l’échantillon est sans remise et 𝑵 fini alors :
𝑝𝑞 𝑁 − 𝑛
𝜀 = 𝑧1f° ×𝜎¨X ⟺ 𝜀 = 𝑧1f¯ ×
† - 𝑛 𝑁−1
-
𝑝×𝑞 𝑁 − 𝑛 -
𝑝×𝑞 𝑁 − 𝑛
𝜀 = 𝑧1f¯ × × ⟺ 𝜀 = 𝑧1f¯ × ×
- 𝑛 𝑁−1 - 𝑛 𝑁−1
-
⟺ 𝑛× 𝑁 − 1 ×𝜀 - = 𝑧1f¯ × 𝑁 − 𝑛 ×𝑝×𝑞 ⟺
-
- -
𝑛× 𝑁 − 1 ×𝜀 - + 𝑧1f¯ ×𝑝×𝑞 = 𝑧 ¯ ×𝑁×𝑝×𝑞 ⟺
1f
- -
𝑵×𝒛𝟐𝟏f𝜶 ×𝒑×𝒒
𝟐
𝒏=
𝑵 − 𝟏 ×𝜺𝟐 + 𝒛𝟐 𝜶 ×𝒑×𝒒
𝟏f 173
𝟐
ü 𝐒𝐢 Echantillon est avec remise ou 𝐬𝐢 𝑵 𝐢𝐧𝐟𝐢𝐧𝐢
𝑝𝑞
𝜀 = 𝑧1f° ×𝜎¨X ⟺ 𝜀 = 𝑧1f¯ ×
† - 𝑛
𝑝𝑞 -
𝑝𝑞
-
𝜀 = 𝑧1f¯ × ⟺ 𝜀 = 𝑧1f¯ ×
- 𝑛 - 𝑛
-
⟺ 𝑛×𝜀 - = 𝑧1f¯ ×𝑝×𝑞 ⟺
-
𝒛𝟐𝟏f𝜶 ×𝒑×𝒒
𝟐
𝒏=
𝜺𝟐
174
IV.4 Exercices : Détermination de la taille d’échantillon-
Caractère qualitatif
q Exercice 1 :
La direction des statistiques d’un pays a évalué la
population active du pays à 12 millions de personnes sur
une population de 26 millions de personnes en âge de
travailler (15 ans et plus).
1) Quelle est la taille de l'échantillon de personnes à
interroger pour que le taux d’activité empirique ne
s’éloigne pas de plus de ±1% du taux d’activité dans
tout le pays avec une probabilité au moins égale 0,95?
2) Même question mais en supposant que le taux d’activité
empirique suit une loi normale avec une probabilité
égale à 0,95. 175
q Solution :
𝒫: 𝑝𝑒𝑟𝑠𝑜𝑛𝑛𝑒𝑠 𝑒𝑛 â𝑔𝑒 𝑑𝑒 𝑡𝑟𝑎𝑣𝑎𝑖𝑙𝑙𝑒𝑟
𝐴̅
𝐴 = « Personnes actives ».
1-
𝑝 = 𝑝 𝐴 = = 46,15 % ∶ Le taux d’activité dans 𝒫
-—
𝑋↝ℬ 𝑝
𝐸 𝑋 = 𝑝 = 46,15
𝑉𝑎𝑟 𝑋 = 𝑝𝑞 = 0,4615×0,5385 = 0,2485
176
On a :
177
On pose :
𝜀 = 0,01 et 1 − 𝛼 = 0,95
𝐹2 ↝ 𝒩 𝑝, 𝜎¨-X
𝐹2 − 𝑝
𝑍 = ↝ 𝒩 0,1
𝜎¨X
On cherche donc n telle que :
𝑝 𝐹2 − 𝑝 < 0,01 = 0,95
On utilise l’égalité :
-
𝑧1f ¯ ×𝑝×𝑞
-
𝑛= ⟺
𝜀- 179
-
𝑧Ž,µ¶… ×0,4615×0,5385
𝑛=
0,05-
1,96- ×0,4615×0,5385
𝑛= -
= 382 ⟺
0,05
𝑛 = 382
180
q Exercice 2 :
181
q Solution :
Définition : Le taux de chômage exprime la part des
chômeurs dans la population active âgée de 15 ans et plus.
Ce taux est obtenu par le rapport de l'effectif des chômeurs à
celui des actifs âgés de 15 ans et plus.
𝒫: Population active
𝐴
𝐴̅
𝑁 = 8×10— : Taille de la population active
𝐴 = « Chômeurs »
𝑝 = 𝑝 𝐴 = 10% ∶ Le taux de chômage dans 𝒫
𝑋↝ℬ 𝑝
𝐸 𝑋 = 𝑝 = 𝑉𝑎𝑟 𝑋 = 𝑝𝑞 = 0,10×0,90 = 0,09 182
1) Cherchons la taille 𝑛 de l’échantillon 𝑋1 , 𝑋- , …, 𝑋2
telle que :
On pose :
𝜀 = 0,02 et 1 − 𝛼 = 0,95
183
Comme la taille de la population 𝑁 est connue on a :
𝑝𝑞 𝑁 − 𝑛
𝐸 𝐹2 = 𝑝 𝑉𝑎𝑟 𝐹2 = ×
𝑛 𝑁−1
En utilisant l’inégalité de Bienaymé Techebycheff on
obtient la taille de l’échantillon :
𝑁×𝑝×𝑞
𝑛= - ⟺
𝜀 × 𝑁 − 1 ×𝛼 + 𝑝×𝑞
8×10— ×0,10×0,90
𝑛= - —
⟺
0,02 × 8×10 − 1 ×0,05 + 0,10×0,90
𝑛 = 4498 184
2) On cherche la taille de l’échantillon 𝑋1 , 𝑋- , …, 𝑋2 en
supposant que le taux de chômage empirique suit une loi
normale : (𝑛 ≥ 30, 𝑛𝑝 ≥ 5 et 𝑛𝑝 ≥ 5 )
𝐹2 ↝ 𝒩 𝑝, 𝜎¨-X
𝐹2 − 𝑝
𝑍 = ↝ 𝒩 0,1
𝜎¨X
On cherche donc 𝑛 telle que :
𝑝 𝐹2 − 𝑝 < 0,02 = 0,95
On utilise l’égalité :
-
𝑁×𝑧Ž,µ¶… ×𝑝×𝑞
𝑛= - - ⟺
𝑁 − 1 ×𝜀 + 𝑧Ž,µ¶… ×𝑝×𝑞
185
Où 𝑧Ž,µ¶… est le quantile d’ordre 0,975 de la loi 𝒩 0,1 :
𝑧Ž,µ¶… = 1,96
D’où :
𝑛 = 865
186
q Exercice 3 :
Dans une université, 45% des étudiants s'adonnent à au
moins une activité physique par semaine.
Quelle est la taille de l’échantillon d’étudiants à interroger
pour que le pourcentage empirique des étudiants s'adonnant
à au moins une activité physique par semaine ne s’écarte
pas de plus de ±3% du pourcentage des étudiants de
l’université s'adonnant à au moins une activité physique par
semaine avec une probabilité au moins égale à 95%.
187
q Solution :
𝒫: 𝐸𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑠
𝐴̅
On pose :
𝜀 = 0,03 et 1 − 𝛼 = 0,95
189
Comme la taille de la population 𝑁 est inconnue on suppose
que la population est infinie.
On utilise l’inégalité de Bienaymé Tchebycheff pour obtenir
la taille de l’échantillon :
𝑝×𝑞 0,45×0,55
𝑛= - ⟺ 𝑛= -
= 5500
𝜀 ×𝛼 0,03 ×0,05
𝑛 = 5500
190