Vous êtes sur la page 1sur 36

Traduction par le Réseau nigérien The World Bank Group

de suivi et évaluation (ReNSE) Carleton University


Western Michigan University

International Program for Development Training

Le renforcement des capacités pour


l’évaluation des actions de développement

Module 7. L’ échantillonnage

Mai 2003
Module 7 Vue d’ensemble

 La collecte de données: combien?


 Des différents concepts d’échantillonnage
 Des échantillons prélevés au hasard
 Des échantillons qui ne sont pas prélevés au hasard
 Des questions sur le degré de confiance et de
précision
 La taille de l’échantillon
La collecte de données: combien?

 Peut-on collecter des données sur la population


entière?
 Tous les dossiers, toutes les rues, tous les
habitants?
 Lorsqu’il est possible, il faut généraliser sur toute la
population
 Cependant, il n’est souvent pas possible à cause
des:
 Contraintes au niveau du financement et du temps
La collecte de données: combien?

 Puisqu’il n’est pas possible de collecter des données


sur chaque pays, sur le monde entier et sur toutes
les écoles, on travaille avec des prélèvements
 Ces prélèvements s’appellent des « échantillons »
 Il y a deux possibilités:
 Prélèvements au hasard (l’échantillon de probabilité)
 Prélèvements pas au hasard (l’échantillon de non
probabilité)
Des concepts d’échantillonnage

 La population
 L’ensemble des unités
 L’échantillon
 Un prélèvement de la population
 Un cadre d’échantillonnage
 Une liste à partir de laquelle on peut sélectionner un
échantillon
Des concepts d’échantillonnage

 Le plan d’échantillonnage:
 Des méthodes d’échantillonnage
 Probabilité ou non probabilité

 Paramètres:
 Caractéristiques de la population

 Statistique
 Caractéristiques d’un échantillon
L’échantillon prélevé au hasard

 Un échantillon prélevé au hasard nous permet de


faire des estimations sur la population d’origine à
partir de ce qu’on apprend du prélèvement
 Les avantages:
 Élimine la subjectivité dans la sélection
 Permet de généraliser sur toute la population
 Coût/efficace
Types d’échantillon prélevé au hasard

 L’échantillon simple prélevé au hasard


 L’échantillon stratifié prélevé au hasard
 L’échantillon groupé
Types d’échantillon prélevé au hasard

 L’échantillon simple prélevé au hasard


 Le plus simple
 Vise un groupe sélectionné de la population entière

 Exemple: Un échantillon de tous les diplômés de


l’école normale
Le processus d’échantillonnage au hasard

 Obtenir une liste complète de la population entière


 Attribuer un numéro à chaque cas
 Prélever l’échantillon au hasard à l’aide d’une table de
nombres au hasard

 Lorsqu’il n’existe pas de telle table ou lorsqu’il est


pratique d’en créer une:
 Sélectionner un point de départ au hasard sur la liste de la
population
 Par la suite, sélectionner chaque nième cas sur la même
liste
L’échantillon stratifié prélevé au hasard

Cette méthode est indiquée lorsqu’on cherche à obtenir


des données à partir d’un prélèvement très réduit de
la population:

 Afin d’assurer une représentation de ce groupe et/ou


 Afin qu’on puisse les comparer à d’autres groupes à
l’aide des statistiques
Des types d’échantillons prélevés au hasard

 L’échantillon stratifié prélevé au hasard:


 Répartir la population en strates (ou groupes)
 Ensuite, prélever au hasard un échantillon de chaque strate

 Exemple: la population de diplômés stratifiée par


genre
 Ensuite, prélever un échantillon d’hommes et un échantillon
de femmes
Des types d’échantillons prélevés au hasard

L’échantillon stratifié prélevé au hasard:


 Permet d’assurer que le nombre d’hommes et de
femmes dans chaque groupe est suffisant
 Probablement nécessitera un plus grand échantillon
que pour la méthode d’échantillon simple prélevé au
hasard
Des types d’échantillon prélevés au hasard

L’échantillon groupé:
 Utile lorsqu’on ne dispose pas de liste complète de la
population entière
 Pour faire une enquête sur les parents des enfants à l’école
primaire dans un pays donné, il n’est pas nécessaire
d’obtenir une liste de tous les enfants
Des types d’échantillon prélevé au hasard

L’échantillon groupé:

 Les écoles sélectionnées au hasard

Puis

 Les parents sélectionnés au hasard


La sélection d’un échantillon groupé prélevé
au hasard
 Afin de mesurer le temps passé sur les activités
d’apprentissage, il faut observer les activités en
classe

 D’abord sélectionner au hasard les classes à


observer
et
 Sélectionner au hasard les heures d’observation
dans la journée
et
 Sélectionner au hasard les jours d’observation de la
semaine
La sélection de multiples échantillons
prélevés au hasard
 Pour effectuer une observation de la circulation sur la
route entre le village et la ville principale:
 Sélectionner au hasard les heures et les jours d’observation
 Sélectionner au hasard les saisons d’observation
 Sélectionner au hasard des points d’observation ou
sélectionner un seul point d’observation sur la route
L’échantillonnage de non probabilité

 Les résultats des échantillons de non probabilité ne


peuvent pas être généralisés:
 Les données sont résumées en ces termes:
« Dans le groupe de répondants… »
 La taille de l’échantillon n’est pas tellement important
 Suffisamment pour donner des résultats raisonnables
Les échantillons qui ne sont pas prélevés au
hasard
 Plus facile à les focaliser
 Peut s’assurer de la représentativité d’un petit
échantillon
 Ne permet pas de généraliser sur une plus grande
population
Les échantillons de non probabilité

 Quota: fixer le nombre de chaque échantillon prélevé


de chaque groupe sélectionné de la population
 Au hasard: celui qui passe
 « Boule de neige » ou progressif: demander aux
participants à qui il faut s’adresser encore
 Jugement: établir des critères afin de parvenir à une
conjugaison spécifique de participants
 Convenable: ceux qui sont le plus faciles à contacter
ou ceux qui sont les plus faciles à observer
Les échantillons de non probabilité

 Les questions:
 Ces participants ont-ils été sélectionnés d’une manière
subjective?
 Sont-ils très différents du reste de la population?
 Il serait utile de collecter quelques données afin de
montrer que les participants sélectionnés ont des
caractéristiques de la population générale (c’est-à-
dire, des caractéristiques démographiques)
Les conjugaisons

 Des méthodes d’échantillonnage prélevés au hasard


et pas au hasard peuvent être conjugués
 Un échantillon des écoles qui correspondent aux
caractéristiques pré-déterminées:
 Sélectionner 2 écoles des communautés les plus pauvres et
2 écoles des communautés les plus riches
 Ensuite, prélever au hasard un échantillon des
étudiants
La taille de l’échantillon

 La taille de l’échantillon est déterminée sur la base


de:
 La taille de la population
 Le niveau de confiance recherché
 Le niveau de précision recherché

 En général, l’exactitude et la précision s’améliorent au


fur et à mesure que la taille de l’échantillon augmente
Les questions sur l’échantillon prélevé au
hasard
 Quelle est la population cible?
 Qui et combien?

 Quelle est l’importance de l’exactitude?


 Niveau de confiance

 Quelle est l’importance de la précision?


 L’erreur d’échantillonnage/l’intervalle de confiance
Les échantillons ne sont pas parfaits

 Chaque échantillon a une probabilité d’erreur

 Les statisticiens ont découvert comment calculer


cette probabilité d’erreur
Les échantillons ne sont pas parfaits

 Quel niveau de confiance faut-il sur l’exactitude de


l’échantillon?
 Le niveau de confiance standard est 95%:
 Ceci veut dire que 19 sur 20 échantillons auront des résultats
très similaires
 Ceci veut dire qu’il y a un niveau de certitude de 95% que les
résultats de l’échantillon soient un reflet représentatif de la
population
Les échantillons ne sont pas parfaits

 Quel niveau de précision faut-il dans les résultats?

 Les résultats de l’enquête:


 45% sont opposés à la construction d’un barrage et
55% sont en faveur de la construction d’un barrage
 La marge d’erreur s’élève à +/- 3%
Les échantillons ne sont pas parfaits

 Ceci veut dire que si tout le monde avait été enquêté,


entre 42-48% allaient être opposés à la construction
d’un barrage et entre 52-58% de la population allaient
être en faveur de la construction d’un barrage
 On peut conclure avec une certitude de 95%, que la
majorité des citoyens sont en faveur de la
construction d’un barrage
Les échantillons ne sont pas parfaits

 Le niveau de confiance standard en sciences sociales


est +/- 5%
 Les résultats de l’enquête:
 45% sont opposés à la construction d’un barrage et
55% sont en faveur de la construction d’un barrage
 La marge d’erreur s’élève à +/- 5%
Les échantillons ne sont pas parfaits

 Ceci veut dire que si tout le monde avait été enquêté,


entre 40-50% sont opposés à la construction d’un
barrage et entre 50-60% de la population sont en
faveur de la construction d’un barrage
Les échantillons ne sont pas parfaits
 Les citoyens sont-ils en faveur de ou opposés
à la construction d’un barrage?

 Les résultats sont trop proches pour tirer des


conclusions définitives; Il est possible que si
toute la population avait été enquêtée, il y aura
eu un résultat à l’égalité avec 50% « pour » et
50% « contre »
Les échantillons ne sont pas parfaits

 L’intervalle de confiance est une autre façon


d’estimer avec précision:

 Cette méthode est indiquée lorsqu’on travaille avec les


nombres réels, tels que l’âge ou les salaires
 Le salaire moyen des participants s’élève à 2 000
Rands sud-africains et l’intervalle de confiance se trouve
entre R 1 800 à R 2 000
Les échantillons ne sont pas parfaits

 Ces résultats seraient présentés de la manière


suivante:
 « Nous sommes 95% surs que le vrai revenu moyen per
capita de la population des pauvres en milieu rural se
trouve entre 1 800 et 2 000 Rands sud-africains »
La taille des échantillons

 La taille d’un échantillon est proportionnellement


plus grande lorsque la population est réduite
 Par exemple, si la population s’élève à 100, la
taille de l’échantillon serait de 80
 Si la population s’élève à 1000, la taille de
l’échantillon serait de 278
 Ce sont des conclusions sur la base du niveau de
confiance de 95%, avec une erreur
d’échantillonnage de +/- 5%
La taille des échantillons

 En général, il y a une amélioration de l’exactitude


et de la précision lorsque la taille de l’échantillon
augmente
 Si le niveau de certitude recherché est de 95%
avec une erreur de +/- 5%, alors la taille de
l’échantillon serait de 384
 Si le niveau de certitude recherché est de 95%
avec une erreur de +/- 3%, la taille de l’échantillon
serait de 1 067
La taille des échantillons
pour des grandes populations

Précision Niveau de confiance

99% 95% 90%


1% 16 576 9 604 6 765
2% 4 144 2 301 1 691
3% 1 848 1 067 752
5% 883 384 271