Vous êtes sur la page 1sur 48

Statistique Appliquée à l'Économie

Chapitre 2

Echantillonnage
Économ
ObjecPfs du chapitre

Au terme de ce chapitre, l’étudiant devrait être capable de :


• Définir la no<on de popula<on Chapitre 2
et d’échan<llon
• Décrire un échan<llon aléatoire simple et dire pourquoi il est
important de travailler sur un échan<llon <ré de la popula<on
Echantillonnage
• Expliquer la différence entre la sta<s<que descrip<ve et la
sta<s<que différen<elle
• Définir le concept de distribu<on d’échan<llonnage (ou
distribu<on empirique)
– Déterminer la moyenne et l’écart-type de la distribu<on empirique
– de la moyenne empirique
– Décrire le Théorème de la Limite Centrale et son importance
– Déterminer la propor<on et l’écart-type de la distribu<on empirique
– de la propor<on empirique
– Décrire la distribu<on empirique de la variance empirique
Population / Echantillon
! Une population est l’ensemble (exhaustif) de tous les sujets
concernés par une question donnée
! la taille de la population sera notée N (peut-être très grand, ou même
infini)
! Un échantillon est une partie observée de la population
! la taille de l’échantillon sera notée n

Ch. 2-3
Échantillon et population
!

Exemples (population):

! Tous les électeurs à la prochaine élection présidentielle


! Toutes les pièces fabriquées dans une usines au cours d’une
journée donnée
!

Exemples (échantillon):
! 1000 électeurs choisis au hasard pour un sondage
! Quelques pièces choisies pour une expérience

Ch. 2-4
Population et échantillon

Population Échantillon

Les valeurs calculées en utilisant


Les valeurs calculées en utilisant des des données de tous les individus
données de tous les individus de la d’un échantillon sont des
population sont des paramètres statistiques
Ch. 2-5
Pourquoi un échantillonnage ?

! En général, les populations sont de très grandes tailles.

! Il peut être difficile d’atteindre certains individus de


la population.

Ch. 2-6
Pourquoi un échantillonnage ?

! Requiert moins de temps qu’un recensement.

! Moins coûteux à administrer qu’un


recensement.

! Il est possible d’obtenir des résultats


statistiques d’une précision satisfaisante à
partir de 'bons' échantillons. Un bon échantillon est
échantillon qui est représentatif de la population.
Un échantillon représentatif est généralement
sélectionné en laissant jouer le hasard ou l’aléatoire.
Ch. 2-7
Échantillonnage aléatoire

Un échantillonnage aléatoire simple est un échantillon


obtenu par un processus dans lequel:
! Chaque unité de la population est choisie strictement par
chance,
! Chaque unité de la population possède la même chance que
quiconque d’autre d’être choisie,
! Tout échantillon de n unités possède la même chance d’être
choisi que n’importe quel autre échantillon de n unités.

L’échantillon ainsi sélectionné est dit échantillon aléatoire

Ch. 2-8
Échantillonnage systématique
Dans le cas d’un échantillonnage systématique:

! Les unités de la population doivent être disposées d’une


manière qui ne soit pas reliée à la question étudiée
! Numéroter les unités de la population
! On sélectionne chaque jème unité de la population
! j est le rapport j = N/n
! Choisir au hasard un nombre compris entre 1 et j;
! ce nombre sera la première unité choisie pour faire partie de
l’échantillon

L’échantillon ainsi sélectionné est dit échantillon systématique

Ch. 2-9
Échantillonnage systématique

Exemple:
Supposons que l’on désire constituer un échantillon de n=9
individus à partir d’une population de N = 72 individus.

j = N / n = 72 / 9 = 8

Choisir au hasard un nombre entre 1 et 8 pour le premier


individu de l’échantillon; supposons avoir choisi 3.

Alors, on choisira chaque 8ème individu à partir de l’individu


3; l’échantillon est alors constitué des individus:
(3, 11, 19, 27, 35, 43, 51, 59, 67)
Ch. 2-10
Statistique descriptive et
statistique inférentielle

! Statistique descriptive
! Collecter, traiter, présenter et décrire des données

! Statistique inférentielle
! Établir des conclusions et/ou prendre des décisions au sujet
d’une population seulement à partir de l’information observée
auprès d’un échantillon tiré de cette population
Ch. 2-11
Statistique descriptive

! Collecte de données
! Ex.: Enquête

! Présentation des données


! Ex.: Tables et graphiques

! Synthèse des données


! Ex.: Moyenne empirique ∑X i

Ch. 2-12
Statistique Inférentielle

! Faire des énoncés au sujet de la population en


examinant les résultats d’un échantillon
Statistiques paramètres de la population
(connu) Inférence (inconnus, mais peuvent être
estimés en utilisant les données
d’un échantillon)

Échantillon Population

Ch. 2-13
Statistique Inférentielle
Établir des conclusions et/ou prendre des décisions au
sujet d’une population seulement à partir de l’information
observée auprès d’un échantillon
! Estimation
! Ex.: Estimer le poids moyen d’une
population à partir du poids moyen
de l’échantillon
! Test d’hypothèse
! Ex.: Utiliser l’évidence fournie par
l’échantillon pour tester l’énoncé
selon lequel le poids moyen de la
population est égal à 60 Kg
Ch. 2-14
Distribution d’échantillonnage

! Une distribution d’échantillonnage ou


distribution empirique est une distribution de
probabilité de toutes les valeurs possibles
d’une statistique pour des échantillons
d’une taille donnée tirés d’une population

Ch. 2-15
Distribution d'échantillonnage

Distributions
empiriques

Distributions Distributions Distributions


empiriques de empiriques de empiriques de
moyennes proportions variances
d’échantillon d’échantillon d’échantillon

Ch. 2-16
Moyenne empirique

! Soit X1, X2, . . ., Xn des observations d’un échantillon


aléatoire tiré d’une population

! La moyenne d’échantillon (échantillonnale) de ces


observations est définie par:

1 n
X = ∑ Xi
n i=1

Ch. 2-17
Écart-type de la moyenne
! Différents échantillons de même taille tirés de la même
population vont conduire à des valeurs différentes pour la
moyenne d’échantillon
! Une mesure de la variabilité des valeurs de la moyenne
d’échantillon d’un échantillon à un autre est donnée par
l’erreur-type de la moyenne:
σ
σX =
n
! Noter que l’erreur-type de la moyenne diminue lorsque la
taille d’échantillon augmente, pour une variance de
population donnée

Ch. 2-18
Détermination d’une distribution
d’échantillonnage
Statistiques descriptives pour la distribution d’échantillonnage:

E(X) =
∑ X
=
18 + 19 + 21+  + 24
i
= 21 = µ
N 16

σX =
∑ ( X i − µ)2

N
(18 - 21)2 + (19 - 21)2 +  + (24 - 21)2
= = 1.58
16
Ch. 2-19
Si les observations ne sont
pas indépendantes
! Si la taille n de l’échantillon n’est pas une petite fraction de
la taille N de la population, alors les individus de
l’échantillon ne sont pas distribués indépendamment les
uns des autres.
! Donc, de tels individus n’ont pas été sélectionnés de façon
indépendante
! Une correction pour petite population est faite pour tenir
compte de la non-indépendance:

σ2 N − n σ N−n
Var(X) = ou σX =
n N −1 n N −1
La quantité (N – n)/(N – 1) est souvent appelée facteur de correction
de petite population
Ch. 2-20
Si la population est normale

! Si la population est normale de moyenne µ et


d’écart-type σ, alors la distribution empirique de X
est aussi distribuée normalement, avec:

σ
µX = µ et
σX =
n
! Si la taille de l’échantillon n n’est pas petite par rapport à la taille de la
population N, alors:
σ N−n
µX = µ σX =
et
n N −1
Ch. 2-21
Distribution normale standard de la
moyenne empirique

! La valeur Z associée à la distribution empirique


de X :
X −µ X −µ
Z= =
σX σ
n
où: X = moyenne d’échantillon
µ = moyenne de population
σ = écart-type de la moyenne empirique
x

Z est une variable aléatoire normale standardisée, de


moyenne 0 et de variance 1
Ch. 2-22
Propriétés de la distribution
d’échantillonnage

Distribution de

E[X] = µ population normale

µ x
( x est un estimateur Distribution empirique
sans biais de µ ) normale

(Les deux distributions ont la


même moyenne )
µx
x
Ch. 2-23
Propriétés de la distribution
d’échantillonnage

σ
σx = Distribution de
n population normale

µ x
Distribution empirique
normale

(La distribution de la moyenne


empirique a un écart-type
plus petit) µx
x
Ch. 2-24
Propriétés de la distribution
d’échantillonnage

si n augmente, Taille d’échantillon


plus grande
σ x diminue

taille d’échantillon
plus petite

µ x
Ch. 2-25
Théorème de la limite centrale

! Même si la population n’est pas normale,

! …les moyennes d’échantillons tirés de la


population vont être distribuées presque
normalement pourvu que la taille des
échantillons soit suffisamment grande.

Ch. 2-26
Théorème de la limite centrale

! Soit X1, X2, . . . , Xn un ensemble de n variables


aléatoires indépendantes ayant la même distribution
(i.i.d.), de moyenne µ et de variance σ2; soit X la
moyenne de ces variables aléatoires.
! Lorsque n devient très grand, le théorème de la limite
centrale énonce que la distribution de:

X − µX ⎛ X −µ ⎞
Z= = n⎜ ⎟
σX ⎝ σ ⎠
approche une distribution normale standard

Ch. 2-27
Théorème de la limite centrale

Lorsque n↑ La distribution
la taille de de la moyenne
empirique
l’échantill
devient presque
on devient
normale, peu
suffisamm importe la forme
ent de la distribution
grande… de population

x
Ch. 2-28
Si la population n’est pas normale

Distribution de population
Propriétés des
distributions empiriques:
Tendance centrale

µx = µ
µ x
Dispersion Distribution empirique
σ (devient normale lorsque n augmente)
σx = Plus
n Plus petite
taille
grande
taille

µx x
Ch. 2-29
‘‘Suffisamment grand’’, c’est quand?

! Pour la plupart des distributions, n > 25


donnera une distribution empirique qui est
proche de la distribution normale
! Si la population a une distribution normale, la
distribution empirique de la moyenne est
toujours normale

Ch. 2-30
Exemple

! Supposons qu’une grande population a une


moyenne µ = 8 et un écart-type σ = 3. On
sélectionne un échantillon aléatoire de taille n = 36.

! Quelle est la probabilité que la moyenne de


l’échantillon soit comprise entre 7.8 et 8.2?

Ch. 2-31
Exemple

Solution:
! Même si la population n’a pas une distribution
normale, le théorème de la limite centrale peut
être appliquée (n > 25)
! … donc, la distribution empirique de x est
approximativement normale
! … de moyenne µx = 8
σ 3
! …et d’écart-type σx = = = 0.5
n 36
Ch. 2-32
Exemple

Solution (suite):
⎛ ⎞
⎜ 7.8-8 X-µ 8.2-8 ⎟
P(7.8 < X < 8.2) = P⎜ < < ⎟
⎜ 3 σ 3 ⎟
⎝ 36 n 36 ⎠
= P(-0.4 < Z < 0.4) = 0.3108

Distribution de Distribution Distribution normale


Population empirique standard
.1554
??? +.1554
? ??
? ? échantillon Standardiser
?? ?
?
7.8 8.2 -0.4 0.4
µ=8 X µX = 8 x µz = 0 Z
Ch. 2-33
Distributions empiriques de
proportions d’échantillon

Distributions
empiriques

Distributions Distributions Distributions


empiriques de empiriques de empiriques de
moyennes proportions variances
d’échantillon d’échantillon d’échantillon

Ch. 2-34
Distributions empiriques de
proportions d’échantillon

P = la proportion de la population qui possède une


certaine caractétristique
! La proportion d’échantillon ( p̂ ) constitue un estimé de P

X nombre d 'éléments de l'échantillon ayant la charactéristique d'intérêt


p̂ = =
n taille de l'échantillon

! 0 ≤ p̂ ≤ 1
! p̂ a une distribution binomiale, mais qui peut être approchée
par une distribution normale lorsque:
! nP(1 – P) > 5
Ch. 2-35
^
Distribution empirique de p
! Approximation normale:
Distribution empirique
P(Pˆ )
.3
.2
.1
0
0 .2 .4 .6 8 1 P̂
Propriétés:
et
P(1− P)
E(pˆ ) = P σpˆ =
n
(où P = proportion au sein de la population)
Ch. 2-36
Valeur Z pour des proportions

Standardiser p̂ pour avoir une distribution


centrée réduite (Z), par la formule:

pˆ − P pˆ − P
Z= =
σ pˆ P(1− P)
n

où la distribution normale standard représente


une bonne approximation de la distribution de
Z lorsque nP(1−P) > 5
Ch. 2-37
Exemple
! Si la vraie proportion d’électeurs qui soutiennnt la
Proposition A est P = 0.4, quelle est la probabilité
qu’un échantillon de taille 200 conduise à une
proportion échantillonnale comprise entre 0.40 et
0.45?

" autrement: si P = 0.4 et n = 200, calculer


P(0.40 ≤ p̂ ≤ 0.45)

Ch. 2-38
Exemple
" si P = 0.4 et n = 200, calculer
P(0.40 ≤ p̂ ≤ 0.45)

P(1− P) .4(1− .4)


Calculer σ pˆ : σ pˆ = = = .03464
n 200

Transformer ⎛ .40 − .40 .45 − .40 ⎞


pour une ˆ
P(.40 ≤ p ≤ .45) = P⎜ ≤Z≤ ⎟
distribution ⎝ .03464 .03464 ⎠
normale = P(0 ≤ Z ≤ 1.44)
standard:
Ch. 2-39
Exemple
" si P = 0.4 et n = 200, calculer
P(0.40 ≤ p̂ ≤ 0.45)
Utiliser la table de la distribution normale standard:
P(0 ≤ Z ≤ 1.44) = .4251
Distribution normale
Distribution empirique standardisée

.4251

Standardiser

.40 .45 p̂ 0 1.44


Z

Ch. 2-40
Distributions d’échantillonnage de
la variance empirique

Distributions
empiriques

Distributions Distributions Distributions


empiriques de empiriques de empiriques de
moyennes proportions variances
d’échantillon d’échantillon d’échantillon

Ch. 2-41
Variance empirique
! Soit (x1, x2, . . . , xn) un échantillon aléatoire tiré d’une
population. La variance échantionnale est:

n
1
s =
2

n − 1 i=1
(xi − x) 2

! La racine carrée de la variance échantionnale est


appelée écart-type échantillonnal

! La variance échantillonnale diffère entre plusieurs


échantillons aléatoires de même taille tirés d’une
même population.
Ch. 2-42
Distribution d’échantillonnage de la
variance empirique

! La distribution empirique de s2 a une moyenne égale à σ2

E[s2 ] = σ 2

! Si la distribution de la population est normale, alors :


4

Var(s ) =
2

n −1

Ch. 2-43
Distribution du Chi-carré pour la
variance et la variance empirique

! Si la distribution de la population est normale, alors :

2
(n - 1)s
χ 2
n−1 = 2
σ

possède une distribution du chi-carré (χ2 )


avec n – 1 degrés de liberté

Ch. 2-44
Degrés de liberté (d.l.)
Idée: Nombre d’observations qui peuvent varier librement
après le calcul de la moyenne de l’échantillon

Exemple: Supposons que la moyenne de 3 nombres soit 8.0

Si la moyenne de ces 3
si X1 = 7 valeurs est 8.0, alors X3 doit
X2 = 8 être égal à 9
c’est quoi X3? (soit, X3 ne peut pas varier
librement)
ici, n = 3, alors les degrés de libertés = n – 1 = 3 – 1 = 2
(2 des 3 valeurs peuvent être n’importe quel nombre, mais le
troisième ne peut pas varier librement pour une moyenne
donnée) Ch. 4-45
Chi-carré: exemple
! Un congélateur commercial doit garder une certaine tempé-
rature avec de faible variation. Les spécifications précisent
que l’écart-type des variations de la température ne doit pas
dépasser 4 degrés (une variance de 16 degrés2).
" On désire tester un échantillon de 14
congélateurs
" Quelle est la limite supérieure (K) de
la variance échantillonnale telle que
la probabilité d’excéder cette limite,
étant donné que l’écart-type de la
population est égal à 4, soit plus
petite que 0.05?
Ch. 4-46
Calcul de la valeur du Chi-carré

(n − 1)s 2
a une distribution du chi-carré avec (n
χ2 = 2 – 1) = 13 degrés de liberté
σ
! Utiliser une distribution du chi-carré, une aire de
0.05 dans la partie supérieure de la distribution

χ213 = 22.36 (α = .05 et 14 – 1 = 13 d.l.)

probabilité
α = .05

χ213
χ213 = 22.36 Ch. 4-47
Chi-carré: exemple

χ213 = 22.36 (α = .05 et 14 – 1 = 13 d.l.)

Donc: ⎛ 2 (n − 1)K ⎞
P(s > K) = P ⎜ χ13 >
2
⎟ = 0.05
⎝ 16 ⎠

(n − 1)K
ou = 22.36 (où n = 14)
16

donc K =
(22.36)(16)
= 27.52
(14 − 1)

Si s2 calculé avec un échantillon de taille n = 14 est supérieure à


27.52, alors la probabilité que la variance empirique prenne des
valeurs supérieures à 27.52 est plus petite que 5%.
Ch. 4-48

Vous aimerez peut-être aussi