Vous êtes sur la page 1sur 13

THEORIE

D’ECHANTILLONNAGE

CHAPITRE I
METHODES D’ECHANTILLONNAGE
VOCABULAIRE
TERME DEFINITION
Enquête Procédé de collecte et de traitement de données relatives à un phénomène quelconque.
Recensement Enquête exhaustive au cours de laquelle toutes les unités de base de la population sont observées.
 
Sondage
  Enquête partielle, au cours de laquelle seulement une partie des unités de base de la population sont observées.
Population Ensemble que l'on observe et qui sera soumis à une analyse statistique, appelée aussi univers ou ensemble
statistique, chaque élément de cet ensemble est un individu ou unité statistique.
Echantillon Ensemble des unités de base sélectionnées et réellement observées au cours d’un sondage.
 
Base d’échantillonnage Une liste d’élément à partir desquels l’échantillon est sélectionné. Enumération ou présentation ordonnée de toutes
les unités de base constituant la population.
Distribution d’échantillonnage Distribution de probabilité composée de toutes les valeurs possibles d’une statistique d’échantillon.
Sondage
  Enquête partielle, au cours de laquelle seulement une partie des unités de base de la population sont observée.

Méthodes d’échantillonnage Ensemble des démarches qui permettent de sélectionner de façon organisée les éléments de l’échantillon.
Tirage exhaustif Tirage sans remise.
Tirage non exhaustif Tirage avec remise.
Théorie d’échantillonnage Etude des liaisons existantes entre une population et ses échantillons.
Erreur d’échantillonnage Ecart entre les résultats obtenus auprès d’un échantillon et ceux obtenus par un recensement comparable de la
population. Plus la taille de l’échantillon est grande plus cette erreur est petite.
 
Taux de sondage Proportion des unités de la population qui font partie de l’échantillon. C’est le rapport entre la taille de
t = n/N *100 l’échantillon n, et la taille de la population N.
   
paramètre Caractéristique numérique d’une population telle que la moyenne de la population "µ"ou "m", l’écart type de la
population "σ" et la proportion "p" de la population
Le nombre total d’échantillons de taille n qu’on peut avoir en procédant avec remise
(Tirage non exhaustif « TAR » ) est de Nn.
Dans le cas d’un tirage sans remise ( tirage exhaustive « TSR »), le nombre d’échantillon
possible est de C Nn  N! .
n!( N  n)!
Pour tous les échantillons, on peut calculer une statistique (moyenne, écart-type,
variance, etc...) qui variera avec l’échantillon., on obtient alors une distribution de la
statistique que l’on nomme la distribution d’échantillonnage.
Selon la méthode de choix de l’échantillon , on distingue entre :

 échantillons probabilistes (échantillons basés sur la probabilité );


 échantillons non probabilistes ou empiriques (échantillons non basés sur la probabilité).
Les méthodes aléatoires
• Echantillon aléatoire simple
• Echantillonnage stratifié
• Echantillonnage en grappes
• Echantillonnage par degrés
• Echantillonnage systématique
Echantillonnage aléatoire et simple
 
chaque échantillon possible de taille "n" ait la même probabilité d’être choisi, On prélève dans la population des
individus au hasard, tous les individus ont la même probabilité d’être prélevés, et ils le sont indépendamment les uns des
autres.

Comment procéder Pour prélever un échantillon aléatoire et simple?

Constituer la base de sondage et on numérote tous les individus de la liste correspondant aux individus de la
population avec des nombres comportant un même nombre de chiffres de 1à N ;
1. En utilisant une table de nombres aléatoires, une calculatrice ou un programme informatique, on obtient
des nombres aléatoires comportant le nombre de chiffres désiré.
2. On sélectionne les nombres qui coïncident avec la liste. On rejette les nombres qui ne coïncident pas avec
la liste ou qui se répètent, on s’arrête après avoir sélectionné n individus (n représentant le nombre
d’individus souhaités dans l’échantillon).
Echantillonnage aléatoire et simple
 

Application avec Excel


Dans une première colonne on identifie avec un nombre chaque individu de la liste de référence.
Dans une deuxième colonne on note : =alea( )
Puis on Recopie les deux colonnes en valeur à la même place.
Par la suite on trie les deux colonnes en fonction de l’ordre croissant (ou décroissant) de la deuxième colonne.
A la fin on sélectionne les n premiers individus dans la colonne 1
Application:
Choisir au hasard un échantillon de 15 étudiants parmi ceux d’un groupe TD numérotés de 200 à 299 d’une population de
100 étudiants.
Première colonne : identifie avec un nombre chaque étudiant de la liste de 200 à 299
Deuxième colonne : =alea(200;299)
Echantillonnage aléatoire stratifié

 
 
n1
STRATE 1
N1
 

 
STRATE 2 n2
N2  
 

STRATE 3
N3
 
n3
 

STRATE 4
N4 n4
   

N= N1+ N2+ N3+ N4


n = n1+ n2+ n3+ n4
 
 
 
 
Echantillonnage aléatoire stratifié

Exemple :
 
Supposons que 15% des salariés d’une entreprise sont des ingénieurs, 45% des techniciens et 40% des ouvriers, pour
former un échantillon de 60 salariés de cette entreprise en respectant ces strates, on devrait choisir au hasard (n1) 15% x 60
= 9 (n1) ingénieurs ; 45% x 60 = 27 (n2) techniciens ; et 40% x 60 = 24 (n3) ouvriers.

  Répartition optimale
 
Dans une autre solution dite répartition optimale : l’échantillonnage est effectué de façon inégale dans les différentes
strates.
  Il tient compte de quatre facteurs :
- Budget total de l’enquête, G
- Poids de la strate, wi
- Coût de la collecte de l’information dans la strate, c i
-
  Dispersion à l’intérieur de la strate, mesurée par l’écart type σ i.
Ainsi, le nombre d’unités à choisir dans chacune des strates est donné par :
 
ni = K wi* σi/ avec K = G / ∑ wi* σi *
Echantillonnage aléatoire stratifié
Répartition optimale

Poids de la Coût de la collecte Dispersion à


 Dans une population de 5000 entreprises Strate strate de l’intérieur
agroalimentaires, on a pu avoir les informations w
l’information dans de la strate, mesurée
  i la par
suivantes sur le tableau suivant :
    strate, ci l’écart type σ i.
BUDGET G=12000dh. Petite 0,5 70 0,5
Le nombre d’entreprises à choisir dans chacune Moyenne 0,3 95 0,85
des strates est donné par : Grande 0,2 110 1,25
 ni = K wi* σi/ avec K = G / ∑ wi* σi *
K = 12000/ 0.5*0.5*+ 0.3*1.25*+0.2*2.12
 K= 1895.96
 Ainsi donc on aura pour toute strate
n1 = 1895,96*0.5 *0.5/√70 = 56
n2 = 1895,96*0.3 *1.25/√95 = 49
n3 = 1895,96*0.2 *2.125/√110 = 45
Sous ces contraintes notre échantillon comprendra donc 56 petites entreprises ; 49 moyennes entreprises et 45 grandes
Avantages et désavantages de la méthode :

L'échantillonnage stratifié a l'avantage d'assurer une bonne


représentation des différentes strates de la population dans
l’échantillon. Il permet aussi d’obtenir des estimations pour chacune des
strates de la population entraînant ainsi des gains de précision
appréciables, elle facilite en outre les opérations de collecte des données.
Toutefois, la méthode suppose l’existence d’une liste de la population et
des renseignements sur la répartition des strates dans la population.
Echantillonnage aléatoire par grappe

La technique consiste en la division de la population en groupes ou grappes.


On sélectionne au hasard un certain nombre de grappes pour représenter la population, puis on choisit
tous les individus des grappes sélectionnées.
Exemple 1: on tire des immeubles puis on interroge tous les habitants de chaque immeuble choisi.

Exemple 2 : 
Les étudiants de S1 économie et gestion sont répartis en 6 groupes, les groupes sont numérotés de 1
à 6. Supposons que l’on obtienne les nombres 2, 3 , et 5, tous les étudiants de ces 3 groupes feront partie
de l’échantillon.
Avantages et désavantages de la méthode

La méthode ne nécessite pas une liste globale de la population puisque seules les individus inclus
dans les grappes comptent. Elle permet de limiter l’échantillon à des groupes compacts ce qui
permet de réduire les coûts de déplacement, de suivi et de supervision.

Cependant, la méthode peut entraîner des résultats imprécis puisque des unités appartenant à une
même grappe ont tendance à présenter des caractéristiques semblables. Cette perte de précision peut
être compensée par une augmentation de la taille de l’échantillon. De surcroit cette méthode ne
permet pas de contrôler la taille finale de l’échantillon.