Vous êtes sur la page 1sur 56

CHAPITRE1 

TECHNIQUES
D’ÉCHANTILLONNAGE

H
Objectif:

 L’étudiant doit être capable d’appliquer le principe


de sélection d’un échantillon à l’aide d’une
méthode aléatoire ou d’une méthode non aléatoire.
Introduction
population: ensemble des éléments sur les quels porte l’étude statistique.

Enquête complète ( exhaustive)


Recensement
paramètre de la population: (m,σ,²σ,p)
Introduction
 Pour multiples raisons: cout, faible taux de réponse,
manque de personnel, impossibilité…
 Echantillon: petit groupe représentatif extrait d’un
grand groupe que l’on nomme « population »
Introduction
population

échantillon
-enquête partielle

Echantillonnage -
sondage

-
caractéristiques de
l’échantillon (
x,S;S²,f)
Introduction
 L’échantillonnage est le processus par lequel on
détermine l’échantillon
 Son but suprême est l’atteinte d’une représentativité
impartiale de la population à l’étude pour que toute
estimation basée sur l’échantillon soit sans biais et
inférée à la population
 La procédure d’échantillonnage doit permettre la
constitution d’un sous-groupe recouvrant les
caractéristiques qui peuvent influencer la valeur des
paramètres que l’on veut estimer
Introduction
L’échantillon doit être représentatif pour cela il faut
connaitre:

 Comment sélectionner un échantillon? (Méthodes


d’échantillonnages)
 Combien d’élément on va prendre dans cet
échantillon? (taille de l’échantillon)
 Est-ce que si suffisant pour estimer les paramètre
de la population? (distribution d’échantillonnage)
Les Méthodes d’échantillonnages
 Echantillonner: c’est choisir une partie d’une
population pour représenter l’ensemble de la
population.
On a donc recours à des techniques bien précises pour
construire un échantillon et s’assurer qu’il est
représentatif de sa population mère. Il existe deux
grandes catégories de méthodes:
 Les méthodes d’échantillonnage non probabilistes

(ou empiriques)
 Les méthodes d’échantillonnage probabilistes (ou

aléatoires).
Les Méthodes d’échantillonnages

 Est-ce que il y’a un critère de choix entre les


deux grandes méthodes ?

Oui, et c’est ce qu’on appelle « la base du sondage »


Les Méthodes d’échantillonnages
 La base du sondage : est une liste ou il y’a les
informations sur tout les éléments de la population
pour qu’on puisse localiser les individus à
interroger.
 Exemple : liste d’amis sur FACEBOOK, liste
d’abonnée de MOBILIS , liste des étudiants….
Les Méthodes d’échantillonnages

 Si on a une base de sondage on utilise les méthodes


probabilistes.

 Si on n’a pas une base de sondage on utilise les


méthodes non probabilistes (méthode des
quotas).
Les méthodes non probabilistes

 Les méthodes d’échantillonnage empiriques Elles


regroupent les techniques où les éléments de
l’échantillon sont choisis sur le terrain en fonction
de jugements sur les caractéristiques de la
population ou bien en reconstituant le hasard. Elles
ne nécessitent pas de base de sondage, elles sont
rapides, et pas très chères.
Les méthodes non probabilistes
Les échantillons obtenus à l’aide de ces méthodes
sont les suivants :

 les échantillons par quotas ou proportionnel


 les échantillons « accidentels » ou à l’aveuglette
 les échantillons de volontaires
 
Echantillonnage par quotas 

Dans cette méthode on prend un échantillon de façon a


avoir une image fidèle sur l’ensemble de la population
c’est à dire qu’on doit respecter les pourcentages
(quotas) de ce qu’on appelle La variable de contrôle.
Echantillonnage par quotas

Mots clés :
 La variable de contrôle : permet d’assurer la

conformité de l’échantillon. exemple : âge, sexe ;


revenu……
 le taux de sondage : n/N
Echantillonnage par quotas

 Exemple d’application :

si on a dans une population 48% d’hommes et 52%


femmes ,25% de jeunes de 25 à 30ans ; l’enquêteur
auprès de 100 personnes donc il devra interroger 48
homme (n X quotas de la population) et 52 femme
et 25 personne de 25à 30.
Echantillonnage par quotas

 Les quotas retenus peuvent être « Simples » c'est-à-


dire avec plusieurs séries de distribution qui seront
répétées de façons indépendantes ou encor
« croisée »en combinant plusieurs caractéristiques.
Echantillonnage par quotas
 Revenons à notre exemple si l’on sait que 19% des
femmes de la population mère ont entre 25à30ans
et 31% des hommes ont de 25 à 30 ans.
L’enquêteur devra respecter ces quotas et interroger
10 femmes et 15 hommes ayant de 25à30ans

19%+31%=50% (19X50)/100=10 ;
(31X50)/100=15
Echantillonnage « accidentels » ou à l’aveuglette

 La personne qui déguste des échantillons de


nouveaux produits pour déterminer lequel est le
meilleur ou le journaliste qui, au moyen d'entrevues
dans la rue, sonde L'opinion du grand public sur un
sujet d'actualité, mettent en pratique la méthode de
L'échantillonnage à l'aveuglette.
Echantillonnage « accidentels » ou à l’aveuglette

 Le grand avantage de cette méthode est qu'elle


demande peu de planification. D'application
restreinte, elle peut malgré tout donner de bons
résultats si la population observée est homogène.
Par exemple, si L'on désire évaluer la concentration
d'un produit chimique dans un lac ou le taux de
glycémie d'une personne, il est raisonnable de
supposer que les résultats devraient être assez
semblables d'un échantillon à L'autre.
Echantillonnage volontaires

 Dans le cas d'expériences psychologiques ou


médicales, d'enquêtes sur les habitudes de
consommation, il ne serait pas pratique de choisir au
hasard des individus dans toute la population. Comme
l'enquête sera longue, exigeante, quelquefois même
désagréable, on préfère réunir des volontaires, d'où le
nom d'échantillonnage de volontaires. Néanmoins, il
faut toujours craindre un écart entre les
caractéristiques des volontaires et celles de la
population.
Les méthodes d’échantillonnage probabiliste :

 Elles regroupent les techniques qui font intervenir


le hasard pour désigner les éléments de
l’échantillon. Elles nécessitent une base de sondage
(liste de tous les individus de la population mère),
sont plus coûteuses et longues que les méthodes
empiriques.
Les méthodes d’échantillonnage probabiliste :

Les échantillons obtenus par ces techniques sont :


 les échantillons aléatoires simples

 les échantillons systématiques

 les échantillons par grappe

 les échantillons stratifiés


Echantillonnage aléatoire simple

 Un échantillon aléatoire simple est un échantillon


sélectionnée de manière à ce que chaque
échantillon possible de taille "n" ait la même
probabilité d’être sélectionné, On prélève dans la
population des individus au hasard, tous les
individus ont la même probabilité d’être prélevés,
et ils le sont indépendamment les uns des autres
Echantillonnage aléatoire simple

pour prévlever un echantillon aléatoire simple il faut :


1) constriure une base de sondage

2) Numéroter les éléments de la population de 1àN

3) Procéder a la selection des éléments pour


constituer l’échantillon a l’aide « la table des
nombre aléatoires »
Echantillonnage aléatoire simple

on utilise la table des nombres aléatoires en suivant 3


étapes :
1. on choisit aléatoirement un nombre (dans la table)
compris entre 1 et N (points d’entré)
2. on choisit notre chemin de lecture : haut ; bas ;
gauche ; droite
3. on suit notre chemin en choisissant seulement les
nombre compris entre 1 et N
Echantillonnage aléatoire simple

 -le tirage de jetons numérotés ou de papier


avec le nom de chaque individu
 - la désignation de façon aléatoire de l’échantillon à

l’aide d’un ordinateur


 - la sélection de nombre identifiant les individus à

l’aide d’une table de nombre aléatoire


Echantillonnage aléatoire simple

 Comment utiliser la table des nombre


aléatoire ?
Cette table est composée de 2000 nombre compris
entre 0et 9.par commodité de lecture ces nombres y
figurent par groupe de 5 chiffres répartis sur 10
colonnes par bloc de 5 ligne
Echantillonnage aléatoire simple

Exemple:
On a une population de 850 individus(N=850) et on
veut choisir un échantillon de taille 6(n=6) on a une
base de sondage
Echantillonnage aléatoire simple

 On va choisir L2 et C2
le nombre : 55777
s’appelle point d’entré
Echantillonnage aléatoire simple
 55777>850 on prend
donc les 3 dernier
chiffre(777)
 premier individu
chemin de haut en bas
à droite
 n={777, 7, 493,
572 ,547 ,475}
Echantillonnage aléatoire stratifié

On suppose que la population soit stratifiée, constituée de


sous-populations homogènes, les strates. (ex: stratification
par tranche d’âge). Dans chaque strate, on fait un
échantillonnage aléatoire simple, de taille proportionnelle
à la taille de strate dans la population .Les individus de la
population n’ont pas tous la même probabilité d’être tirés.
Nécessite une homogénéité des strates. Le chercheur
divise la population en sous-groupes distincts et
homogènes (strates) à partir desquels il sélectionnera un
échantillon aléatoire simple
Echantillonnage aléatoire stratifié

Étapes :
 1. choisir une variable de stratification (ex : tranche

d’age).
 2. Sélectionner un échantillon aléatoire dans

chaque strate.
Echantillonnage aléatoire stratifié
Echantillonnage aléatoire stratifié

Exemple
 On veut choisir par échantillonnage stratifié 10

élèves dans un groupe de 60, en tenant compte du


fait que 50 % d'entre eux sont en première année,
30 % en deuxième année et 20 % en troisième
année. Chaque année sera une strate dans laquelle
on ira chercher des élèves en tenant compte des
pourcentages qu'occupe chaque strate dans la
population. Ainsi, on choisira au hasard :
Echantillonnage aléatoire stratifié

 5 élèves en 1ère année, puisque 10 x 50% = 5


 3 élèves en 2ème année, puisque 10 x 30% = 3
 2 élèves en 3ème année, puisque 10 x 20% = 2.
 Il ne reste plus qu'à sélectionner un échantillon dans
chaque strate, ce qui pourrait être fait par
échantillonnage aléatoire simple ou systématique.
L'échantillonnage systématique
 est une méthode demandant moins de
manipulations que L'échantillonnage aléatoire
simple. Cependant, elle suppose aussi l'existence
d'une liste de la population où chaque individu est
numéroté de 1 jusqu'à N. Notons n, le nombre
d'individus que doit comporter L'échantillon.
L'entier voisin de N/n sera noté r et appelé la raison
de sondage (ou le pas de sondage)
L'échantillonnage systématique
 Choisissons ensuite au hasard un entier d entre 1 et N:
 cet entier sera le point de départ. Pour former
L'échantillon, il s'agira de choisir un premier individu
comme point de départ; ce sera l'individu dont le
numéro correspond à d. Pour sélectionner les autres, il
suffit d'ajouter à d la raison de sondage: les individus
choisis seront alors les individus dont les numéros
correspondent à:
d ; d + r; d + 2r; d + 3r; …… ; d + (n-1)r.
 II faudra reprendre au début lorsque la liste sera épuisée.
L'échantillonnage systématique
 Exemple
 On veut choisir par échantillonnage systématique 6
étudiants parmi un groupe de 60. La raison de
sondage (r) sera 10, car N/n = 10. (Si L'on devait
trouver un échantillon de taille n = 7, la raison
serait plutôt 9 puisque 60/7 = 8,57, arrondi à 9.)
L'échantillonnage systématique
 Si L'origine choisie au hasard est disons, 3, les étudiants
inclus dans L'échantillon correspondront aux numéros
suivants: 3, c'est-à-dire le point de départ ;
 13, c'est-à-dire 3 + 10 ;
 23, c'est-à-dire 3 + (2 x 10)
 33, c'est-à-dire 3 + (3 x 10)
 43, c'est-à-dire 3 + (4 x 10)
 53, c'est-à dire 3 + (5 x 10)
 Notre échantillon est maintenant complet ; il sera composé
des étudiants portant les numéros suivants: 3, 13, 23, 33,
43, 53.
L'échantillonnage systématique
 Selon la raison de sondage et le point de départ
choisi, il peut arriver que le nombre..
obtenu se situe à l'extérieur de la liste. En pareil cas,
il faut revenir au début de la liste. Si L'on reprenait
l'exemple précédent et si L'on devait continuer à
prélever des étudiants, on obtiendrait le numéro 63,
c'est-à-dire 3 + (6 x 10). Comme ce numéro r se
situe à l'extérieur de la liste, on reviendrait au début
de la liste et on choisirait le numéro 3 (puisque 63 -
60 = 3).
Les échantillons par grappe
Dans chacune des méthodes précédentes, les unités de
L'échantillon étaient choisies individuellement.
L'échantillonnage par grappes consiste plutôt à choisir
plusieurs individus en même temps, c'est-à-dire par groupes.
Par exemple, prenons comme population les habitants d'une
ville à partir desquels on désire constituer un échantillon de
600 individus. Selon les méthodes précédentes, il faudrait
choisir 600 individus disséminés dans toute la ville. Suivant
L'échantillonnage par grappes, on pourra choisir les 600
individus dans une vingtaine d'immeubles choisis au hasard,
où tous les occupants auront été retenus.
Les échantillons par grappe
 Exemple:
 Au moyen de L'échantillonnage par grappes, il
s'agit de choisir 12 étudiants; dans un groupe de 60.
On demande aux étudiants de se regrouper par 6.
On choisit ensuite au hasard deux regroupements,
par exemple les grappes numéro 4 et 7 en retenant
tous les individus de ces deux grappes, on constitue
un ; échantillon de 12 étudiants.
Les échantillons par grappe
 Dans l'exemple précédent, la situation était assez
simple. En réalité, les choses sont beaucoup plus
compliquées. Par exemple, dans une ville, les
quartiers et les immeubles ne sont pas composés
d'un nombre égal d'individus. Comment peut-on
procéder alors pour effectuer un échantillonnage
par grappes?
Les échantillons par grappe
 Puisque le nombre d'habitants et le nombre
d'immeubles et de logements de chacun des
quartiers sont généralement connus, il est possible
de quadriller la ville en un grand nombre de
secteurs (qu'on appelle îlots) ayant des populations
à peu près semblables. Pour constituer un
échantillon, il suffira alors de choisir certains de
ces secteurs et, par conséquent, toutes les personnes
qui y habitent
Distribution d’échantillonnage :

 La distribution d’échantillonnage est l’étude de la


de probabilité de l’échantillon en fonction de la
distribution de la variable parente lorsque la taille
de l’échantillon augmente. Pour résoudre les
problèmes d’estimation de paramètres inconnus, il
faut tout d’abord étudier les distributions
d’échantillonnage, c’est à dire la loi de probabilité
suivie par l’estimateur.
Distribution d’échantillonnage :

 Considérons tous les échantillons possibles de taille


n extraits d’une population de taille N, de moyenne
µ, de variance σ ² , …etc. Pour chaque échantillon,
il est possible de calculer les paramètres statistiques
X ;s ;s² …etc qui varient d’un échantillon à l’autre.
Chaque paramètre possédera ainsi une distribution
d’échantillonnage au même titre que la variable
aléatoire X. On utilise souvent :
  
Distribution d’échantillonnage :
Distribution d’échantillonnage des moyennes

 Soit une population de taille N, on désigne par µ et


σ la moyenne et l’écart-type de cette population
respectivement. On extrait de la population une
série d’échantillons de taille n, chacun de ces
échantillons a une moyenne X, les différentes
moyennes obtenues constituent une distribution
d’échantillonnage de moyenne ¯X, on désigne par
μ et σ la moyenne et l’écart type de la distribution
d’échantillonnage de la moyenne.
Distribution d’échantillonnage des moyennes

 On a :
 Si le tirage est exhaustif (sans remise) :

 Dans le cas où la population est infinie ou le tirage


est non exhaustif (avec remise) :
Distribution d’échantillonnage des moyennes

Remarques :
 Si n est petit devant N, la distinction entre exhaustivité et

non exhaustivité est sans objet car

 Si la taille des échantillons est assez grande (en pratique n


≥ 30), la distribution d’échantillonnage de la moyenne
approche la distribution normale quelle que soit la
distribution de la population.
 Si la population est normalement distribuée, la distribution
d’échantillonnage de la moyenne est une loi normale quelle
que soit la valeur n de la taille des échantillons.
Distribution d’échantillonnage des variances :

 Chaque échantillon de taille n de la population à


une variance
ces variances sont des valeurs observées d’une même
variable aléatoire.
Distribution d’échantillonnage des fréquences :

 La probabilité de la réalisation d’un évènement est


supposée être égale à p. on considère les
échantillons de taille n extraits, avec remise, d’une
population de taille N. a chaque échantillon extrait
correspond une fréquence f de réalisation de
l’évènement considéré.
Distribution d’échantillonnage des fréquences :

 On a :
 Si le tirage est avec remise :

 Si le tirage est sans remise


Synthèse
Synthèse

Vous aimerez peut-être aussi