Vous êtes sur la page 1sur 27

Chapitre 6.

Introduction à
l’échantillonnage
 Les sondages
 Notions fondamentales
 Fluctuations d’échantillonnage d’une moyenne
 Théorème central limite

C6-1
Étude de marché / sondage /
échantillonnage
 Les sondages / échantillonnage visent à découvrir des renseignements
au sujet d’une population particulière
 Une étude de marché / sondage / échantillonnage consiste à prélever
un sous-ensemble d’unités statistiques d’une population afin de mieux
en connaître les caractéristiques (préférences, revenus, intention
d’achat, …)
 Moins dispendieux qu’un recensement qui considère toutes les unités
statistiques de la population
 Bien que plus précis, les recensements sont plus dispendieux et
prennent en général plus de temps
 Pour obtenir des renseignements valides, il faut prélever selon des
méthodes appropriées un échantillon représentatif de la population

C6-2
Population Échantillons

e1 e4 e2 e1
e8 e12
e12 n
s1 x1
e21 e22
e5 e21
e108 L’échantillonnage e102
e323 vise à mieux
connaître un
paramètre d’une
s2 x2 n
population à partir
d’une statistique
E(X) X
2(X) S2(X)
C6-3
f(X) P(X=x)
Fluctuations d’échantillonnage
d’une moyenne
 Il est facile de constater que si nous prélevons tous les
échantillons possibles de même taille n d’une population de taille
N, la moyenne arithmétique calculée sur chaque échantillon peut
varier d’un échantillon à l’autre
 Il y a donc des fluctuations de la moyenne arithmétique des
échantillons autour de la moyenne de la population

C6-4
Distribution d'échantillonnage
 La distribution de probabilité d'une statistique s’appelle la
distribution d’échantillonnage puisque les variations sont
attribuables à l’échantillonnage
 Par exemple, la distribution d'échantillonnage de la moyenne X

C6-5
Espérance mathématique
de la distribution de X
 Soit une variable statistique X qui suit une loi de probabilité de
moyenne E(X) =  et de variance Var(X) = 2
 Si on prélève un échantillon aléatoire de taille n d’une
population infinie (ou d’une population finie et un
échantillonnage avec remise), alors la moyenne d’échantillon X
suit une loi de probabilité d’espérance mathématique

E( X ) = E( X ) = 

C6-6
Variance de la distribution de X
 La variance de est: X

2
Var( X ) =  2 ( X ) =  X2 =
n
• L’écart-type de la moyenne d’échantillon, aussi appelé
l’erreur type de la moyenne, est:


( X ) =  X =
n
C6-7
Théorème central limite
 La distribution d’échantillonnage de la variable aléatoire X
tend à se rapprocher d’une loi normale d’autant plus que la
taille de l’échantillon est grande


 ( X )=
n

E( X )= X

C6-8
Exemple 1: distribution d’échantillonnage
Entreprises Âge d'informatisation (années), X
A 8
B 8,5
C 9
D 9,5
E 10
 On a une population formée de cinq unités statistiques: x1=8,
x2=8,5, x3=9, x4=9,5, x5=10

 = E( X ) =  x
=
i 45
= 9 ans
N 5

 = Var( X ) =
2  i
( x −  ) 2

=
2 ,5
= 0 ,5
C6-9 N 5
Exemple 1: distribution de X
Distribution de la population
Fréquence relative

0,2

0,15

0,1

0,05

0
8 8,5 9 9,5 10

Âge (années)

E( X ) = 9 Var( X ) = 0 ,5
C6-10
Exemple 1: estimation de 
 Afin d’estimer , on prélève avec remise un échantillon aléatoire
de taille n=2
 On peut donc former 5×5 = 25 échantillons différents
 On calcule pour chaque échantillon, la moyenne et on construit
ensuite l’histogramme de ces 25 moyennes, la distribution
d’échantillonnage de X

C6-11
Exemple 1: les échantillons et leur moyenne
Échantillons Entreprises Résultats Moyenne
1 (A,A) (8, 8) 8
2 (A,B) (8, 8,5) 8,25
3 (A,C) (8, 9) 8,5
4 (A,D) (8, 9,5) 8,75
5 (A,E) (8, 10) 9
6 (B,A) (8,5, 8) 8,25
7 (B,B) (8,5, 8,5) 8,5
8 (B,C) (8,5, 9) 8,75
9 (B,D) (8,5, 9,5) 9
10 (B,E) (8,5, 10) 9,25
11 (C,A) (9, 8) 8,5
12 (C,B) (9, 8,5) 8,75
13 (C,C) (9, 9) 9
14 (C,D) (9, 9,5) 9,25
15 (C,E) (9, 10) 9,5
16 (D,A) (9,5, 8) 8,75
17 (D,B) (9,5, 8,5) 9
18 (D,C) (9,5, 9) 9,25
19 (D,D) (9,5, 9,5) 9,5
20 (D,E) (9,5, 10) 9,75
21 (E,A) (10, 8) 9
22 (E,B) (10, 8,5) 9,25
23 (E,C) (10, 9) 9.5
C6-12 24 (E,D) (10, 9,5) 9,75
25 (E,E) (10, 10) 10
Exemple 1: distribution de fréquence de X

Moyennes Fréquence Fréquence relative


8,00 1 0,04
8,25 2 0,08
8,50 3 0,12
8,75 4 0,16
9,00 5 0,20
9,25 4 0,16
9,50 3 0,12
9,75 2 0,08
10,00 1 0,04

C6-13
Exemple 1: distribution d’échantillonnage
de la moyenne

Distribution d'échantillonage de la moyenne

0,25
Fréquence relative

0,20
0,15
0,10
0,05
0,00
8,00 8,25 8,50 8,75 9,00 9,25 9,50 9,75 10,00
Âge (années)

C6-14
Exemple 1: forme de la distribution
d’échantillonnage
 On observe que la forme de la distribution d’échantillonnage
tend vers la loi normale

Distribution d'échantillonage de la moyenne

0,25
Fréquence relative

0,20
0,15
0,10
0,05
0,00
8,00 8,25 8,50 8,75 9,00 9,25 9,50 9,75 10,00
Âge (années)

C6-15
Exemple 1: moyenne de la distribution
d’échantillonnage
Moyennes Fréquence Moyenne × Fréquence
8,00 1 8,00
8,25 2 16,50
8,50 3 25,50
8,75 4 35,00
9,00 5 45,00
9,25 4 37,00
9,50 3 28,50
9,75 2 19,50
10,00 1 10,00
225,00

E (X ) = = 9 = E(X ) = 
225
25
C6-16
Exemple 1: variance de la distribution
d’échantillonnage
X Fréquence X − E(X) (X − E ( X ) )
2
(X − E( X)) 2
f
8,00 1 -1,00 1,00 1,00
8,25 2 -0,75 0,56 1,13
8,50 3 -0,50 0,25 0,75
8,75 4 -0,25 0,06 0,25
9,00 5 0,00 0,00 0,00
9,25 4 0,25 0,06 0,25
9,50 3 0,50 0,25 0,75
9,75 2 0,75 0,56 1,13
10,00 1 1,00 1,00 1,00
6,25

6 ,25 0 ,5 2
Var( X ) = = = 0 ,25 =
25 2 n

C6-17
Transformation de X en une variable aléatoire
centrée réduite
a− b−
P( a  X  b ) = P( Z )
 n  n
N(/n) N()

a  b X z1 0 z2 Z
a−
z1 =
 n b−
z2 =
C6-18  n
Exemple 2: distribution d’échantillonnage
 Les résultats d’un test d’aptitude sont distribués
selon une loi normale de moyenne  = 150 et
de variance 2 = 100
 On fait passer le test à un échantillon aléatoire
de 25 individus
 Déterminer les caractéristiques de la distribution
d’échantillonnage X

C6-19
Exemple 2: forme de la distribution
d’échantillonnage

 Puisque la population échantillonnée est distribuée


normalement, la distribution d’échantillonnage de X
sera également une distribution normale

 10
 ( X )= = =2
n 25

E( X )= = 150 X

C6-20
Exemple 2: calcul des probabilités
 Quelle est la probabilité que la moyenne
d’échantillon soit comprise entre 146 et 154?

146 150 154 X z1 0 z2 Z


 
 146 − 150 154 − 150 
P( 146  X  154 ) = P Z  = P( −2  Z  2 )
 10 10 
 25 25 
= 2  P( 0  Z  2 ) = 2  ( 0 ,4772 ) = 0 ,9544
C6-21
Caractéristique de X

E( X ) = 

Var( X )  2
Var( X ) = =
n n

f X ( x ) tend vers la loi normale lorsque n est grand

C6-22
Distribution de X

 Cas 1: Les observations proviennent d’une


population normale de variance, , connue
si X  N(  , ) alors X  N(  ,
2  2
)
n

quelque soit n

C6-23
Distribution de X
 Cas 2: Les observations proviennent d’une
population de distribution et de variance inconnues
mais n grand, alors on a approximativement
X  N(  , S 2 n )

 Ce résultat découle du théorème central limite

C6-24
Exemple 3: distribution d’échantillonnage

 Provipak fabrique la céréale Cherry-Ô dans des


contenants de 340 grammes,  = 340gr
 Le procédé donne un écart-type du poids des
contenants de 10 grammes,  = 10 gr
 Le poids des contenants suit une distribution
normale, X  N(340 , 102)
 On prélève au hasard un échantillon de 50
contenants
C6-25
Exemple 3: distribution
d’échantillonnage (suite)
 Quel sera la distribution d’échantillonnage de X ?
 Calculer P(338 < X< 342)
 Que devient la distribution d’échantillonnage de X
si on double la taille de l’échantillon
Exemple 3: calcul des probabilités
 La distribution d’échantillonnage de X sera normale
avec E (X ) = 340 et Var (X ) = 100 50 = 2
 338 − 340 342 − 340 
P (338  X  342 ) = P Z 
 2 2 
P(− 1,41  Z  1,41) = 2  0 ,4207 = 0 ,8414
 Si on double la taille de l’échantillon, on a E (X ) = 340
et Var (X ) = 100 100 = 1

C6-27