Vous êtes sur la page 1sur 40

2.

Obtenir les Données


Les Méthodes d’échantillonnage

1
Développement d’un
Plan d’Echantillonnage
1. Définir la population de référence
2. Définir une base de sondage
3. Choisir une méthode d’échantillonnage
4. Déterminer la taille de l’échantillon
5. Exécution du plan d’échantillonnage

2
Échantillon ou recensement?
„ Objectifs de recherche: obtenir des
informations sur les caractéristiques ou
les paramètres d’une population.
„ L’information sur les paramètres de la
population peut être obtenue par
recensement ou à travers un échantillon.
„ Les caractéristiques de l’échantillon, ou
statistiques, sont exploitées pour inférer
sur les paramètres de la population:
estimations et tests d’hypothèse.
3
Statistiques: deux faces de la
même pièce

Décision
(question
(question sur
sur une)
une) Induction
Population (Inférence statistique)

Représentatif?

Echantillon
Echantillon
Déduction (mesure)
(mesure)

4
Définitions

„ Population: l’ensemble de tous les


éléments présentant le même set de
caractéristiques visées par le sujet de
l’étude.
„ Recensement: l’énumération complète
des éléments d’une population ou de
l’objet de la recherche
„ Échantillon: un sous-groupe d’éléments de
la population sélectionnés pour être
analysés par la recherche.
5
1. Population de référence

„ … l’ensemble des objets possédant les


informations désirées pour répondre aux
objectifs de l’étude.
„ L’objet peut être le répondant lui-même: on
parle d’élément d’échantillonnage...
„ … ou une entité contenant l’objet: on parle
d’unité d’échantillonnage.
„ La population choisie peut être associée à
un critère de localisation et un critère
temporel.
6
Exemple (1)

Yves Rocher veut tester l’idée d’une nouvelle


crème de beauté:
„ Population : les femmes âgées de 18 ans et
plus
„ unité d’échantillonnage: foyer
„ élément d’échantillonnage : personnes de sexe
féminin, âge = 18+ ans dans chaque foyer de
l’échantillon
„ critère de localisation: canton Genève
„ critère temporel: mars-juillet 2003
7
Activité
Perception de l’image de Migros Chailly par
rapport à ses concurrents directs (p.ex. Coop).
„ Population :

„ Unité d’échantillonnage :

„ Élément d’échantillonnage :

„ Critère géographique :

„ Critère temporel :
8
2. Base de sondage (sampling
farme)

„ … représentation concrète des éléments de la


population cible. Consiste en une liste à partir de
laquelle la sélection des éléments va être opérée.
„ Liste existante: annuaire téléphonique, annuaire
d’entreprise, plan d’une ville, fichier loué à
Swisscom…
„ … ou une construction aléatoire (par exemple une
liste de numéros de téléphone)
„ Erreur de liste (coverage ou sampling frame error):
décalage (positif ou négatif) entre la liste et la
population de référence 9
Problème

„ Pour le sondage de Yves Rocher visant


les femmes de 18 ans et plus, serait-il
possible de créer une liste sur la base de
l’annuaire téléphonique?
„ Si oui, comment? Si non, pourquoi pas?

10
3. Méthodes d’échantillonnage

Complexité augmente
Rôle du hasard augmente

Méthodes Aléatoires Méthodes Empiriques


(Probabilistes) (Non-probabilistes)

Echantillon aléatoire simple Echantillon de convenance


Echantillon systématique Echantillon de jugement (a priori)
Echantillon stratifié Echantillon "boule de neige"
Echantillon en grappes Echantillon par quotas

11
3.2. Méthodes aléatoires

Un échantillon est dit aléatoire (probabiliste)


lorsque n’importe quel élément de la
population cible peut appartenir à
l’échantillon,
et ceci avec une probabilité connue à
l’avance et non nulle,
généralement - mais pas nécessairement -
la même pour tous les éléments.
12
Échantillonnage aléatoire simple

„ Baser le tirage entièrement sur le hasard…


„ … à partir d’une liste exhaustive de la
population (1…N)…
„ … et une procédure aléatoire informatisée
(p.ex. fonction RAND)...
„ … ou une table de nombres au hasard.

13
Tirage avec ou sans
remplacement

„ Tirage avec remplacement:


„ Les probabilités sont égales
„ Risque de tirer les même élément plusieurs fois
„ Retenir chaque élément une seule fois
„ Tirage sans remplacement:
„ P.ex. la loterie à numéros
„ La probabilité diminue au fur et à mesure que l’on tire
des éléments d’échantillonnage.
„ Lorsque l’échantillon est petit par rapport à la
population la probabilité reste presque constante.

14
Problème

„ Comment tirer un échantillon aléatoire


simple de 61 restaurants lausannois
(population=305), pour une enquête sur la
perception du label “Fourchette verte” par
les clients de restaurants.
„ Tirage
„ Avec Remplacement ?
„ Sans Remplacement ?

15
Échantillonnage stratifié
Méthode probabiliste se déroulant en deux étapes:
„ Une partition de la population (strates)
„ groupes mutuellement exclusifs
„ … et collectivement exhaustifs
„ Tirage aléatoire simple dans chacune des strates
„ Échantillonnage stratifié proportionnel
„ La taille de chaque strate dans l’échantillon est
proportionnelle à la taille de la strate correspondante
dans la population.
„ Échantillonnage stratifié disproportionné
„ La taille de chaque strate dans l’échantillon dépend de la
variabilité des strates dans la population.
„ Plus la variabilité est grande plus la strate de l’échantillon est 16
grande
Pourquoi un échantillon stratifié?
„ Les strates sont sélectionnées telles que
chaque strate soit relativement homogène.
„ Moins de variabilité dans chaque strate
„ Le critère de stratification doit être lié à la
caractéristique que l’on mesure
„ Accroît l’efficacité de la stratification.
„ L’estimation de la moyenne est ainsi plus
précise.
„ Le prix à payer: nécessite une analyse préalable
pour définir les critères de stratification.
„ Coût supérieur à l’échantillonnage aléatoire simple.
„ N’améliore pas la représentativité de 17
l’échantillon
Problème

Tirage d’un échantillon stratifié d’hôtels


(ou restaurants) suisses afin d’estimer la
rentabilité moyenne.
„ Quels critère(s) de stratification pourrait
rendre les strates plus homogènes?
„ Quelle procédure pour le tirage aléatoire?
(proportionnel ou disproportionné)

18
Échantillonnage en grappes
(cluster sampling)
Méthode aléatoire en une ou deux étapes:
„ Découpage de la population en grappes
„ mutuellement exclusives
„ collectivement exhaustives
„ Très souvent par critère géographique
„ Tirage aléatoire simple d’un échantillon de grappes
„ Recensement dans chacune des grappes retenues
(un niveau d’échantillonnage), ou...
„ … tirage au hasard (échantillonnage par étapes)

19
Exemple: grappes géographiques

On étudie la consommation de vin par foyer à


Lausanne en relation avec le niveau
socioéconomique.
„ Grappes: les quartiers lausannois (18)
„ Tirage au hasard de 3 quartiers:
„ analyse de tous les foyers (un niveau
d’échantillonnage)
„ Échantillonnage par étapes:
„ par quartier: une rue sur cinq
„ par rue: un immeuble sur trois
„ (si besoin) par immeuble: un foyer par étage
20
Grappes versus Strates

„ Similitudes:
„ On divise la population en sous-groupes
„ Échantillonnage aléatoire
„ Différences:
„ Échantillon stratifié = échantillonnage aléatoire dans
chaque strate
„ Objectif: Homogénéité dans chaque strate
„ Échantillonnage par grappes = tirage aléatoire d’une
grappe et, éventuellement, échantillonnage aléatoire
dans cette grappe.
„ Objectif: Hétérogénéité dans chaque grappe: chacune est la
population en miniature.

21
Avantages et limites

„ Méthode moins contraignante que


l’échantillonnage stratifié: pas besoin d’une
liste exhaustive de la population étudiée.
„ Moins coûteuses que les autres méthodes
probabilistes
„ Aussi moins précise
„ Principal problème: effet de grappe si les
grappes ne sont pas suffisamment
hétérogènes:
„ P.ex. les zones géographiques sont trop spécifiques
par rapport au problème étudié.
Consommation de vin par foyer: Risque de retenir des
quartiers composés essentiellement de logements 22
Échantillonnage systématique
„ Version simplifiée de l’échantillonnage aléatoire
simple.
„ Procédure en trois étapes:
„ calcul d’un intervalle de sondage: i=N/n
„ tirage au hasard d’un nombre a entre 1 et i
„ sélection systématique des individus a, a+i, a+2i...
„ Est en réalité un échantillonnage en grappes en
une étape.
„ Les grappes sont délimités par l’intervalle de sondage
et le début de la liste.

23
Exemple

„ Tirer un échantillon systématique de 5


individus d’une population de 20 individus
désignés par les lettres A à T
„ Intervalle de sondage : 20/5 = 4
„ Tirer un Nombre au hasard entre 1 et 4.

24
3.1. Méthodes empiriques

Un échantillon est dit empirique (ou non


probabiliste) lorsque les éléments, ou les
unités d’échantillonnage, de la population cible
sont choisis sur la base de critères purement
subjectifs et non systématiques.
„Aucune propriété de représentativité a
priori…
„… et très faible possibilité de généraliser les
résultats.

25
Échantillonnage de convenance

„ … ou échantillon accidentel.
„ Les individus composant l’échantillon sont par
hasard là où on collecte l’information pour
l’étude.
„ Aucune vérification que les éléments de la
population possèdent bien certaines
caractéristiques désirées.
„ Impossible de savoir si l’échantillon est
représentatif de la population cible.

26
Exemples

„ Questionnaires figurant dans des


magazines et renvoyés spontanément.
„ Micro-trottoirs.
„ Enquêtes en sortie de caisse
d’hypermarché, si l’on ne dispose
d’aucune qualification a priori des
interviewés.

27
Échantillonnage «a priori»

„ Consiste à sélectionner des individus dont


on pense, avant de les interroger, qu’ils
peuvent être détenteurs d’informations
cruciales pour l’étude.
„ Avantages:
„ utile dans un cadre exploratoire
„ richesse d’informations obtenues d’experts

28
Problème

„ Étude exploratoire sur les valeurs liées à


l’utilisation de la bicyclette. Comment
définir un échantillon « a priori »?
„ Qui sont les experts en bicyclette?

29
Échantillonnage «boule de neige»
„ Réservé aux populations composées
d’experts, ou d’individus dont l’identification
est difficile.
„ Identifier un petit nombre initial (même un
seul individu) et leur demander de faire
appel à d’autres individus possédant les
mêmes caractéristiques.
„ Identifier les paires acheteur-vendeur
„ Chaque individu contacté amène son interlocuteur.
„ Segments atypiques: hommes célibataires
entre 40 et 55 ans
30
Échantillonnage par quotas
„ Étudier la structure de la population selon
des critères choisis empiriquement
(quotas).
„ Prélever un échantillon constituant un
modèle réduit de la population au regard
de ces critères (caractéristiques).
„ L’enquêteur reçoit uniquement
l’information sur les quotas à remplir – le
choix des personnes reste empirique.

31
Problème

„ Dans la population d’une entreprise il y a


50% d’hommes, 25% de germanophones
et 5% de cadres.
„ L’enquêteur doit questionner un
échantillon par quotas de 40 employés.
Comment sera-t-il constitué?
„ L’échantillon devrait comprendre 2 cadres,
10 germanophones et 20 hommes.
32
Échantillonnage stratifié et par
quota: Quelle différence?
„ Similitudes:
„ Division de la population en segments
„ Échantillonnage dans chaque segment
„ Différence de taille:
„ Échantillon stratifié : sélection aléatoire des
éléments d’un segment
„ Échantillon par quota : sélection des éléments
d’un segment par jugement de l’enquêteur

33
Conclusion (i)

„ Échantillonnage:
„ comment sélectionner les “objets” pour
recueillir l’information requise par les objectifs
de l’étude
„ Définir la population de référence:
„ éléments et unités d’échantillonnage
„ critère de localisation
„ critère temporel
„ Déterminer la base de sondage:
„ liste pour sélectionner les unités
d’échantillonnage 34
Conclusion (ii)
„ Méthodes d’échantillonnage:
„ aléatoires (probabiliste):
„ liste nominative et exhaustive de la population
„ généralisation par inférence statistique

„ empiriques (non-probabiliste)
„ choix orienté et pragmatique de la population
„ résultats difficilement généralisables

35
Références

„ G. A. Churchill, Marketing Research,


Dryden Press, 1995
„ Chapter 10
„ J.-L. Giannelloni, E. Vernette, Etudes de
marché, Vuibert 1995
„ Chapitre 7.

36
Exemple: l’âge moyen à l’ehl
„ J’aimerais connaître l’âge moyen des
étudiants de l’ehl.
„ Comment dois-je procéder pour m’assurer
que mon résultat sera fiable?
„ Population ou échantillon?
„ Questionner individuellement ?
„ Distribuer des questionnaires ?
„ Autre procédure ?

„ Comment sélectioner les candidats pour que


mon échantillon soit représantatif?

37
Population

„ Avantages „ Incovenients
„ Toute l’information

38
Définir la procédure

„ Quelle est ma Population?


„ Ö
„ Qu’est-ce que je vais mesurer?
„ Ö
„ Combien de valeurs dois-je obtenir?
„ Ö

39
Est-ce que ma moyenne est la
bonne?

„ Faisons une simulation:


„ Ouvrir le fichier Ages.xls
„ Pour permettre le fonctionnement des Macros:
„ Tools) Macro) Security) Cliquer Medium

„ Est-ce que j’ai calculé l’âge moyen des


étudiants de l’ehl?

„ Est-ce que mon (mes) échantillon(s) est (sont)


représentatif(s)?
40