Vous êtes sur la page 1sur 10
 
Université de Metz IUT Thionville
 – 
 Yutz S1M1
 – 
 Mathématiques Frédéric Quignon 1
Doc S4
 – 
 Echantillonnage & Estimation
Echantillonnage
ou « Comment, à partir d'informations connues sur une population (moyenne & écart-type ou  proportion), peut-on prévoir celles d'un échantillon ? »
Moyenne
d’un échantillon
 
Soit une population sur laquelle est définie une variable aléatoire X dont on connaît l'espérance (ou la moyenne) et l'écart-type .  Notons
 X 
 la variable aléatoire qui, à chaque échantillon de taille n, associe sa moyenne (
 X 
 s'appelle encore la distribution des moyennes de
l’échantillon
). Théorème Central Limite (De Moivre & Laplace) Si la VA
X
 suit une
loi normale sur la population
, soit si X ~
 N 
( ; ), Alors la
moyenne
 X 
 
de l’échantillon
 de taille n, prélevé au hasard (et assimilé à un tirage avec remise),
suit également une loi normale
, telle que :
 X 
~
n N 
 ,
 
Si la VA
X
 suit une
loi quelconque sur la population
, avec E(X) = et Var(X) = , Alors la
moyenne
 X 
 
de l’échantillon
 de taille n,
avec n ≥ 30
, prélevé au hasard (et assimilé à un tirage avec remise),
suit approximativement une loi normale
, telle que :
 X 
~
n N 
 ,
 Rem : on remarque une atténuation de la dispersion par le processus d'échantillonnage.
Proportion dans un échantillon
Soit le caractère A, distribué dans la population entière avec une proportion
 p
.  Notons F la VA qui, à chaque échantillon de taille n, associe sa proportion du caractère A (F s'appelle distribution des fréquences
de l’échantillon
). On retiendra le théorème suivant : Soit un caractère A, répandu dans une population avec une fréquence
 p
. Un échantillon de taille n (prélevé avec remise), et tel que
n 30
, présente une fréquence F du caractère A telle que la VA
F suit approximativement une loi Normale
, selon : F ~
n p p p N 
 )1(,
 
 
Université de Metz IUT Thionville
 – 
 Yutz S1M1
 – 
 Mathématiques Frédéric Quignon 2
Estimation
ou « Comment, à partir d'informations calculées sur un échantillon (moyenne & écart-type ou  proportion), estimer celles d'une population entière ? »
Estimation d’une moyenne
 a) Estimation ponctuelle
Soit X une VA sur une population de moyenne (ou espérance)
 µ
 inconnue et d'écart-type
 
(connu ou non). On suppose que l'on a prélevé un échantillon de taille n (tirage avec remise ou assimilé) sur lequel on a calculé la moyenne
 µ
 Sple
 et l'écart-type
 Sple
.
 Une estimation ponctuelle
 ˆ
 de la moyenne
 µ
 de la population est :
 Sple
 
ˆ
 Une estimation ponctuelle
 ˆ
de l'écart-type de la population est :
Sple
nn
1
 
ˆ
 
1
nn
s’appelle le
coefficient de biais. Il est voisin de 1 pour n suffisamment grand. (Ex : pour n = 30, ce coefficient vaut environ 1,017. Dans ce cas,
 
Sple
 est un estimateur acceptable de .) Exemple : dans une université de 10 000 étudiants, on vérifie la taille de 25 étudiants pris au hasard. La moyenne µ
Sple
 et l'écart-type
 
Sple
 pour cet échantillon valent : µ
Sple
 = 176 cm et
Sple
 = 6 cm  Nous pouvons donc estimer les paramètres de la population par :
ˆ
= 176 cm et
ˆ
= (25/24) x 6 6.124 cm
Ce n’est qu’une estimation de la valeur vraie pour la populati
on entière. Pour apprécier
l’imprécision de cette estimation et le risque associé de se tromper en adoptant cette estimation ponctuelle, il est par exemple recours à l’estimation par intervalle de confiance
(IC).
b) Estimation par intervalle de confiance
 Nous savons, avec le Théorème Central Limite, que la VA
 X 
, correspondant à la moyenne
d’un échantillon de taille n pris au hasard
 dans la population considérée, suit, pour n suffisamment grand, une loi normale selon :
 X 
~
n N 
 ,
 Pour un niveau de risque arbitrairement choisi (par exemple, de 5%), nous allons chercher un intervalle autour de µ, de largeur r, tel que :
 Pr 
(
 X 
 r
≤  
 
≤  
 
 X 
 
) 0,95
C’est
-à-dire que, dans 95% des cas, la moyenne µ de la population tombe effectivement dans
l’intervalle
 X 
 ± r.
 
Université de Metz IUT Thionville
 – 
 Yutz S1M1
 – 
 Mathématiques Frédéric Quignon 3 Autrement dit, on a aussi :
 Pr 
(
 µ r
≤  
 
 X 
 ≤  
 
 µ
) 0,95
b.1) connu
Introduisons maintenant la VA
 Z 
. Par définition,
n X  Z 
 )(
suit une loi normale centrée réduite : Z ~
 N 
(0 , 1). Ainsi, estimer
 Pr 
(
 µ
 
r
≤  
 
 X 
 ≤  
 
 µ
) 0,95 revient à estimer :
n Z n
Pr 
= 0.95 Or, comme
 z  Z  z 
Pr 
 = 2
 
(
 z 
)
 – 
 1, il vient :
1
 
n
2
 – 
 1 = 0.95, ou encore :
n
= 0.975. Dans la table de la loi normale centrée réduite, on peut lire :
975.0
 
 z 
. Cette valeur correspond à
z = 1.96
.
[Dans Excel-FR
 , la valeur s’obtient av
ec : « =LOI.NORMALE.STANDARD.INVERSE(0,975) », ou bien « =NORMSINV(0.975) dans  XL-UK]]
Remarques : de même, pour un IC au seuil de 1% de risque,
995.0
 
 z 
correspond à
z = 2.575
une autre appellation courante pour la fonction de répartition d’une loi N(0,
1) est
)(
 z 
(=
 
 z 
)
Ainsi, le choix d’un niveau de risque décide de la valeur de
 z 
, ainsi que de la largeur
 
de l’IC,
 puisque :
n z 
 ou
n z 
 
1
 
A titre d’exercice, développez ces 3 lignes
 

Satisfaites votre curiosité

Tout ce que vous voulez lire.
À tout moment. Partout. Sur n'importe quel appareil.
Aucun engagement. Annulez à tout moment.
576648e32a3d8b82ca71961b7a986505