Vous êtes sur la page 1sur 5

Chapitre 2 : Echantillonnage et estimations

I. Introduction

Il n’est souvent pas possible d’étudier les caractéristiques de tous les éléments d’une population
en raison des contraintes de coûts et de temps.

Cette difficulté conduit à s’intéresser à une partie de la population mère appelée échantillon.

L’échantillonnage consiste connaissant les propriétés sur la population à déterminer les


propriétés sur les échantillons.
Le problème contraire c’est l’estimation.

Les notations suivantes seront adoptées :

Population mère : Ω Echantillon : 𝐸𝐸𝑖𝑖


Effectif ou taille N n
Moyenne M 𝑥𝑥�𝚤𝚤
Fréquence ou proportion p 𝑓𝑓𝑖𝑖
Variance 𝜎𝜎 2 𝜎𝜎𝑖𝑖′2
Ecart type 𝜎𝜎 𝜎𝜎𝑖𝑖′

Les méthodes probabilistes de constitution des échantillons consistent à prélever au hasard des
éléments de la population et sont les seuls à respecter les lois statistiques mais très souvent
difficile d’application.

Dans la pratique, les méthodes probabilistes sont très souvent délaissées au profit des méthodes
empiriques moins coûteuses et moins difficiles à appliquer. On peut citer parmi ces méthodes :

- Les sondages par grappes

Le sondage en grappe consiste à tirer au sort non pas directement un individu, mais des unités
collectives (par exemple : services hospitaliers, établissements scolaires...). L'ensemble des
individus de l'unité collective sont inclus dans l'enquête. Ce type de sondage est utilisé lorsqu'on
n'a pas de liste des individus, mais qu'on dispose d'une liste de grappes réunissant plusieurs
individus.

- La méthode des quotas

La méthode des quotas a pour objectif la constitution d'un échantillon ayant les mêmes
caractéristiques que la population cible. Pour atteindre toutes les catégories de la population à
couvrir par l'enquête, on impose des quotas = nombre de sujets de chaque catégorie sur lequel
portera l'enquête.

Exemple : on veut que l'échantillon contienne 15 femmes de 25 ans habitant en zone rurale,
10 femmes de 25 ans habitant en zone urbaine, 5 femmes de plus de 25 ans habitant en zone
rurale, 10 femmes de plus de 25 ans habitant en zone urbaine...

N.B. Cette méthode est utilisée habituellement par les Instituts de sondage.
- La méthode des itinéraires

Cette méthode est utilisée pour obtenir des échantillons de ménages ou de logement. Elle
consiste à imposer à l’enquêteur un itinéraire en lui indiquant exactement les points du circuit
où il doit procéder à une interview.

Exemple : un immeuble sur trois, un étage sur deux, appartement correspondant à la porte de
gauche sur le palier etc...

- La méthode stratifiée

La base de sondage est divisée en groupes homogènes (strates) selon un critère lié à la variable
à estimer (exemple tranche d'âge, sexe, habitat urbain-rural etc..). Puis un tirage au sort est
réalisé dans chaque strate. En pratique, on répartit d'abord les individus en sous-groupes
homogènes pour le caractère étudié (strates) puis on tire au sort à l'intérieur de chacune de ces
strates.

Le prélèvement des éléments de l’échantillon peut être effectué :

• Avec remise : l’élément prélevé est immédiatement remis dans la population mère avant
de prélever le suivant, l’échantillon est dit non-exhaustif.
• Sans remise : l’échantillon est dit exhaustif.

Dans la suite, pour pouvoir appliquer les règles du calcul de probabilité les échantillons seront
supposés être constitués avec remise, ou être des échantillons sans remise dont la taille est
négligeable par rapport à celle de la population qui est de grande taille.

II. Distributions d’échantillonnage

On considère une variable aléatoire X définie sur une population mère Ω de taille N, pour
laquelle l’espérance mathématique m, la proportion p et l’écart type 𝜎𝜎 sont connus.

De cette population on extrait k échantillons 𝐸𝐸1 , 𝐸𝐸2 , … , 𝐸𝐸𝑘𝑘 tous de taille n qui auront des
moyennes et des écart types a priori différents.

1. Distribution d’échantillonnage des moyennes

Les moyennes 𝑥𝑥�𝚤𝚤 de chaque échantillon variant d’un échantillon à l’autre représentent la
���𝑛𝑛� qui associe à tout échantillon de taille
distribution des moyennes de la variable aléatoire 𝑋𝑋
n, la moyenne de cet échantillon. On a alors :

���𝑛𝑛�(Ω) = {𝑥𝑥
𝑋𝑋 ���;
1 ���,
𝑥𝑥2 … , ���}
𝑥𝑥𝑘𝑘

- 𝒗𝒗𝒗𝒗𝒗𝒗𝒗𝒗𝒗𝒗𝒗𝒗𝒗𝒗 𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄é𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓 𝒅𝒅𝒅𝒅 ����


𝑿𝑿𝒏𝒏

On montre que :
2
���𝑛𝑛�) = 𝜎𝜎
���𝑛𝑛�) = 𝑚𝑚 𝑒𝑒𝑒𝑒 𝑉𝑉(𝑋𝑋
E(𝑋𝑋 𝑛𝑛

- Loi de probabilité de ����


𝑿𝑿𝒏𝒏

Quelle que soit la taille de l’échantillon, si la variable aléatoire X suit une loi normale, la
���𝑛𝑛� suit une loi normale de paramètres m et 𝜎𝜎
variable aléatoire 𝑋𝑋
√𝑛𝑛

De même, d’après le théorème de la limite centrale, quelle que soit la loi suivie par la variable
���𝑛𝑛� suit une loi normale.
aléatoire X, si 𝑛𝑛 ≥ 30, 𝑋𝑋

- Intervalle d’acceptation

On peut construire des intervalles d’acceptation centrés sur la moyenne m contenant la moyenne
d’un échantillon de taille n au seuil de confiance 𝛼𝛼.

La moyenne d’un échantillon de taille n est donc comprise dans un intervalle d’acceptation,

𝜎𝜎 𝜎𝜎 𝛼𝛼 + 1
𝐼𝐼 = �𝑚𝑚 − 𝑡𝑡𝛼𝛼 ; 𝑚𝑚 + 𝑡𝑡𝛼𝛼 � , 𝑡𝑡𝛼𝛼 /𝐹𝐹(𝑡𝑡𝛼𝛼 ) =
√𝑛𝑛 √𝑛𝑛 2

Construction :

F est la fonction de répartition de la loi normale centrée réduite.

Exemple : contrôle de qualité

Une machine remplit en grande série des bidons dont la contenance est une variable aléatoire
X d’espérance mathématique égale à 15 litres et d’écart-type 0,1litre. Des échantillons de 100
bidons prélevés au hasard sont constitués pour contrôler leur contenance.

������
Soit 𝑋𝑋100 la variable aléatoire qui à chaque échantillon de taille 100 associe la moyenne de la
contenance des bidons de cet échantillon.
1) Déterminer la moyenne et l’écart-type de 𝑋𝑋������
100 .
2) ������
Déterminer la loi de probabilité de 𝑋𝑋100.
3) Calculer la probabilité que la moyenne d’un échantillon de taille 100 tiré au hasard soit :
a) Inférieure à 14,98 litres
b) Comprise entre 15 et 15,02 litres.
4) Déterminer un intervalle d’acceptation centrée autour de la moyenne dans lequel la
moyenne d’un échantillon de taille 100 tiré au hasard se situera dans 95% des cas.

2. Distribution d’échantillonnage des proportions

Soit dans une population mère Ω de taille N, dont une proportion p connue présente le caractère
étudié.

De cette population sont issus k échantillons 𝐸𝐸1 , 𝐸𝐸2 , … , 𝐸𝐸𝑘𝑘 tous de taille n qui auront des
fréquences différentes.

Les fréquences𝑓𝑓𝑖𝑖 de chaque échantillon varient d’un échantillon à l’autre et représentent la


distribution des fréquences de la variable aléatoire 𝐹𝐹𝑛𝑛 qui associe à tout échantillon de taille n,
la fréquence de cet échantillon. On a alors :

𝐹𝐹𝑛𝑛 (Ω) = {𝑓𝑓1 , 𝑓𝑓2 , … , 𝑓𝑓𝑘𝑘 }

- Caractéristiques de 𝑭𝑭𝒏𝒏

On montre que :

𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝
𝐸𝐸(𝐹𝐹𝑛𝑛 ) = 𝑝𝑝; 𝑉𝑉(𝐹𝐹𝑛𝑛 ) = 𝑒𝑒𝑒𝑒 𝜎𝜎(𝐹𝐹𝑛𝑛 ) = �
𝑛𝑛 𝑛𝑛

- Loi de probabilité de 𝑭𝑭𝒏𝒏

𝑝𝑝𝑝𝑝
On admet que si 𝑛𝑛 ≥ 30, la variable aléatoire 𝐹𝐹𝑛𝑛 suit une loi normale de paramètres 𝑝𝑝 𝑒𝑒𝑒𝑒 � 𝑛𝑛 .

- Intervalle d’acceptation

Des intervalles d’acceptation centrés sur la proportion p contenant la proportion d’un


échantillon de taille n peuvent être déterminés au seuil de confiance 𝛼𝛼.

La proportion d’un échantillon de taille n est donc comprise dans un intervalle d’acceptation,

𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝 𝛼𝛼 + 1
𝐼𝐼 = �𝑝𝑝 − 𝑡𝑡𝛼𝛼 � ; 𝑝𝑝 + 𝑡𝑡𝛼𝛼 � � , 𝑡𝑡𝛼𝛼 /𝐹𝐹(𝑡𝑡𝛼𝛼 ) =
𝑛𝑛 𝑛𝑛 2

𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝
𝐼𝐼 = �𝑝𝑝 − 1,96� ; 𝑝𝑝 + 1,96� � 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝛼𝛼 = 95%
𝑛𝑛 𝑛𝑛
𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝
𝐼𝐼 = �𝑝𝑝 − 2,575� ; 𝑝𝑝 + 2,575� � , 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝛼𝛼 = 99%
𝑛𝑛 𝑛𝑛

Exemple : Etude d’un fichier client

D’après le fichier clients d’une grande entreprise de ventes par correspondance 75% des clients
passent une commande par an. Des échantillons de 500 clients sélectionnés au hasard sont
constitués pour effectuer des relances.

Soit 𝐹𝐹500 la variable aléatoire qui à chaque échantillon de taille 500 associe la proportion des
clients de cet échantillon ayant passé une commande.

1) Déterminer l’espérance mathématique et l’écart-type de 𝐹𝐹500 .


2) Calculer la probabilité que la proportion des clients ayant passé une commande d’un
échantillon de taille 500 soit :
a) Strictement supérieure à 76%.
b) Comprise entre 74% et 77%.

Déterminer un intervalle d’acceptation centré sur la proportion dans lequel la proportion d’un
échantillon de taille 500 tiré au hasard sera situé dans 99% des cas

Vous aimerez peut-être aussi