Vous êtes sur la page 1sur 36

Chapitre 4: Théorie d’échantillonnage

Abdellah Zaaloul,
F.S.J.E.S Ait Meloul ,
Année universitaire 2019-2020.

Module : Echantillonnage et Estimation


Théorie d’échantillonnage

Généralités
Considérons une population de taille N dans laquelle on s’intéresse
à étudier deux caractères: L’un quantitatif X de moyenne m et de
variance σ 2 et l’autre quantitatif Y de proportion p.
I Solution1: La première solution consiste à réaliser une étude
sur l’ensemble des individus de la population.c’est ce qu’on
appelée recensement.
I Solution2: La seconde solution consiste à prendre uniquement
une sous-population. appelée échantillon de taille (n < N) et
essayer de trouver des approximations pour les différents
caractéristique. c’est ce qu’on appelle enquête par
échantillonnage.
Théorie d’échantillonnage
Vocabulaire
I Population: rassemblement de tous les cas qui répondent à un
ensemble de caractères spécifiques. Appelée aussi univers ou
ensemble statistique, c’est l’ensemble des éléments auxquels
on s’intéresse.
I Enquête: ensemble des opérations de collecte et de traitement
de données relatives à quelques domaines que ce soit.
I Unité de base: unité d’échantillonnage ou unité de sondage,
c’est l’élément pris en considération dans l’enquête.
I Recensement: Enquête complète ou enquête exhaustive, c’est
une enquête au cours de laquelle toutes les unités de base de
la population sont observées.
I Sondage: enquête incomplète, enquête partielle ou enquête par
échantillonnage, c’est une enquête au cours de laquelle
seulement une partie des unités de base de la population sont
observée.
Théorie d’échantillonnage
Vocabulaire
I Echantillon : ensemble des unités de base sélectionnées et
réellement observées au cours d’un sondage.
I Echantillonnage : ensemble des opérations qui permettent de
sélectionner de façon organisée les éléments de l’échantillon.
I Base de sondage : énumération ou présentation ordonnée de
toutes les unités de base constituant la population.
I Erreur d’échantillonnage : écart entre les résultats obtenus
auprès d’un échantillon et ce que nous apprendrait un
recensement comparable de la population. Plus la taille de
l’échantillon est grande plus l’erreur d’échantillonnage diminue.
I Fraction ou taux de sondage : proportion des unités de la
population qui font partie de l’échantillon. C’est le rapport
entre la taille de l’échantillon n, et la taille de la population N.
n
t= × 100
N
Théorie d’échantillonnage

Méthodes d’échantillonnage
I Méthodes d’échantillonnage : Ensemble des méthodes
permettant de réaliser un sondage (de prélever un échantillon
de données) au sein d’une population, de manière à reproduire
un échantillon aussi représentatif que possible de cette
population.
I Évaluation de ces méthodes : Le système d’échantillonnage
sera jugé d’après la qualité des approximations des paramètres
de la population, calculées sur l’échantillon prélevé. Pour cela,
on étudiera la loi des caractéristiques classiques d’un
échantillon (moyenne arithmétique, variance empirique,....)
Théorie d’échantillonnage

Les Méthodes d’échantillonnage


1. Méthodes d’Échantillonnage Probabilistes.
I Échantillonnage aléatoire et simple
I Échantillonnage stratifié
I Échantillonnage par degrés
I Échantillonnage systématique
2. Méthodes d’Échantillonnage Empiriques
I Échantillonnage accidentel (De convenance)
I Échantillonnage à priori
I Échantillonnage ’Boule de neige’
I Échantillonnage par Quotas.
Méthodes d’Échantillonnage Probabilistes.

Échantillonnage aléatoire et simple


I Un échantillonnage est aléatoire si tous les individus de la
population ont la même probabilité de faire partie de
l’échantillon;
I Un échantillonnage est simple si les prélèvements des individus
sont réalisés indépendamment les uns des autres.
Méthodes d’Échantillonnage Probabilistes.

Échantillonnage aléatoire et simple


Pour constituer un échantillon aléatoire et simple il faut:
I Construire une liste complète et sans répétition des éléments
de la population;
I Numéroter ces éléments de 1 à N ;
I Sélectionner les unités qui constituent l’échantillon en utilisant
une table de nombres aléatoires.
Méthodes d’Echontillonnage Probabilistes.

Exemple : Echantillonnage aléatoire et simple


Supposons qu’on veut constituer un échantillon aléatoire et simple
de 4 étudiants parmi une population de 22 étudiants. On a :

P = {E1 , E2 , ...., EN } ou N = 22

E = {e1 , e2 , ...., en } ou n = 4
Méthodes d’Echontillonnage Probabilistes.
Exemple :Echantillonnage aléatoire et simple
Procédure de sélection:
I Comme la taille N = 22 est composée de 2 chiffres alors on va
utiliser la table des nombres aléatoires qui donne des chiffres
regroupés 2 à 2.
I Supposons que la table des nombres aléatoires fournie par un
logiciel informatique est: 02 29 24 17 21 28 06...
I Sachant que le choix d’élément de démarrage est aléatoire et soit n0
le chiffre de démarrage, alors la règle appliquée est comme suit:
Si n0 < N on retient n0 si non on le rejette.
I Donc on obtient: 02 17 21 06

P = {u1 , u2 , ...., u6 , ..., u17 , ..., u21 , u22 }

E = {U2 , U17 , U21 , U6 } = {e1 , e2 , e3 , e4 }


ou e1 = U2 , e2 = U17 , e3 = U21 , e4 = U6
Méthodes d’Échantillonnage Probabilistes.
Échantillonnage stratifié
L’échantillonnage stratifié est une technique qui consiste à
subdiviser une population hétérogène, d’effectif N, en P
´sous-populationsˇ ou ´ strates ˇ plus homogènes d’effectif Ni
de telle sorte que N = N1 + N2 + ... + Np . Un échantillon,
d’effectif ni , est par la suite, prélevé indépendamment au sein de
chacune des strates en appliquant un plan d’échantillonnage au
choix de l’utilisateur. Le plus souvent, on procédera par un
échantillonnage aléatoire et simple à l’intérieur de chaque strate.
Pour la répartition de l’effectif total, n, de l’échantillon dans les
différentes strates,
I La première solution, dite proportionnelle, consiste à conserver
la même fraction d’échantillonnage dans chaque strate.
I Une seconde solution, dite optimale, tient compte du budget
de l’enquête.
Méthodes d’Échantillonnage Probabilistes.

Échantillonnage par degrés


L’échantillonnage par degrés regroupe toute une série de plans
d’échantillonnage caractérisés par un système ramifié et hiérarchisé
d’unités.
Dans le cas de deux degrés, par exemple, on considère que la
population est constituée d’un certain nombre d’unités de sondage
du premier degré (unités primaires), chacune de ces unités étant
constituée d’un certain nombre d’unités du second degré. (unités
secondaires) On réalise d’abord un échantillonnage d’unités du
premier degré. Ensuite, dans chaque unité sélectionnée au premier
degré, on prélève un échantillon d’unités du second degré. Le mode
de sélection pouvant varier d’un degré à l’autre.
Méthodes d’Échantillonnage Probabilistes.

Échantillonnage par degrés


L’échantillonnage par degrés s’impose lorsqu’il est impossible
d’inventorier les éléments de toute la population et qu’il est possible
d’énumérer les unités prélevées au premier degré. Il permet une
concentration du travail sur le terrain et donc une réduction des
coûts.
Pour un même nombre total d’observations, il faut citer sa plus
faible efficacité que l’échantillonnage aléatoire et simple.
Méthodes d’Échantillonnage Probabilistes.

Échantillonnage par degrés


L’échantillonnage par degrés s’impose lorsqu’il est impossible
d’inventorier les éléments de toute la population et qu’il est possible
d’énumérer les unités prélevées au premier degré. Il permet une
concentration du travail sur le terrain et donc une réduction des
coûts.
Pour un même nombre total d’observations, il faut citer sa plus
faible efficacité que l’échantillonnage aléatoire et simple.

Exemple: Échantillonnage par degres


Pour étudier le niveau de consommation des ménages d’une ville,
on a tiré aléatoirement 5 quartiers. Dans chaque quartier
sélectionné, on retient une rue sur 5, dans chaque rue retenue, on
retient un immeuble sur 3, et dans chaque immeuble, un ménage
par étage sera questionné.
Méthodes d’Échantillonnage Probabilistes.

Échantillonnage systématique
L’échantillonnage systématique est une technique qui consiste a
prélever des unités d’échantillonnage situées a intervalles égaux. Le
choix du premier individu détermine la composition de tout
l’échantillon.
Si on connait l’effectif total de la population N et qu’on souhaite
prélever un échantillon d’effectif n, l’intervalle entre deux unités
successives à sélectionner est donné par :
k = Nn (arrondi à l’entier le plus proche)
Connaissant k, on choisit le plus souvent, pour débuter, un nombre
aléatoire, i, compris entre 1 et k. le rang des unités sélectionnées
est alors i,i+k,i+2k, i+3k,....
Méthodes d’Échantillonnage Probabilistes.

Échantillonnage systématique
Si les éléments de la population se présentent dans un ordre
aléatoire (pas de tendance) l’échantillonnage systématique est
équivalent à l’échantillonnage aléatoire et simple. Par contre si les
éléments de la population présentent une tendance,
l’échantillonnage systématique est plus précis que l’échantillonnage
aléatoire.
L’échantillonnage systématique est facile a préparer et, en général
facile à exécuter, il réduit le temps consacré à la localisation des
unités sélectionnées.
l’échantillonnage systématique est équivalent à l’échantillonnage
aléatoire et simple. Par contre si les éléments de la population
présentent une tendance, l’échantillonnage systématique est plus
précis que l’échantillonnage aléatoire.
Méthodes d’Échantillonnage Probabilistes.

Exemple: Échantillonnage systématique


On veut sélectionner un échantillon de 30 entreprises au sein d’une
population de 1800 entreprises.
1800
k= = 60
30
Ainsi on va tirer une entreprise toutes les 60 en partant d’un
nombre tiré aléatoirement entre 1 et 60.
Supposons ce nombre est le 15. On va donc sélectionner la 15eme
entreprise puis la 75eme , la 135eme . jusqu’à la 1755eme ce qui nous
donnera l’échantillon de 30 entreprises.
Méthodes d’Échantillonnage Empiriques.
Échantillonnage accidentel (De convenance)
Il s’agit d’un échantillon constitué d’individus qui se trouvaient
accidentellement à l’endroit et au moment où l’information a été
collectée.

Exemple:Échantillonnage accidentel (De convenance)


I Enquêtés réalisées dans la rue, les lieux publics, en sortie de
super marché ....
I Questionnaires figurant dans les magasines et renvoyés
spontanément.

Les échantillons accidentels ne peuvent être considérés


représentatifs d’aucune population. Il est risqué de généraliser à
une population donnée des résultats obtenus par un échantillon
accidentel.
Méthodes d’Échantillonnage Empiriques.

Échantillonnage à priori
C’est un échantillonnage par jugement à priori. Il consiste à
sélectionner des individus dont on pense, avant de les interroger,
qu’ils peuvent détenir l’information.
Le risque de ce type d’échantillonnage est de considérer des
individus, apparemment représentatifs de la population étudiée.
Méthodes d’Échantillonnage Empiriques.

Échantillonnage à priori
C’est un échantillonnage par jugement à priori. Il consiste à
sélectionner des individus dont on pense, avant de les interroger,
qu’ils peuvent détenir l’information.
Le risque de ce type d’échantillonnage est de considérer des
individus, apparemment représentatifs de la population étudiée.

Échantillonnage ´ Boule de neige ˇ


Cette méthode est réservée aux populations composées d’individus
dont l’identification est difficile ou qui possèdent des
caractéristiques rares.
La méthode consiste à faire construire l’échantillon par les individus
eux-mêmes. Il suffit d’en identifier un petit nombre initial et de leur
demander de faire appel à d’autres individus possédant les mêmes
caractéristiques.
Méthodes d’Échantillonnage Empiriques.

Échantillonnage par Quotas.


L’échantillonnage par quotas est l’échantillonnage non probabiliste
le plus connu, et finalement le mieux accepté comme substitut aux
méthodes probabilistes dans le cas où ces dernières rencontreraient
des contraintes de base de sondage. Mais la représentativité de la
population étudiée reste douteuse.
L’échantillonnage par quotas consiste à étudier la structure de la
population selon des critères choisis (quotas) empiriquement.
L’échantillon est ensuite construit de manière à constituer une
reproduction en miniature de la population sur ces critères.
L’échantillonnage par quotas est une forme simplifiée de
l’échantillonnage stratifié à fraction de sondage constante. Les
quotas représentent les variables de stratification.
Une fois les quotas sont fixés, les individus sont sélectionnés à la
convenance de l’enquêteur.
Méthodes d’Échantillonnage Empiriques.

Échantillonnage par Quotas.


Les critères servant de base à la définition des quotas ne doivent
pas être nombreux. Au-delà de 3 critères, la démarche devient
complexe. Les quotas doivent être construits sur une base de
données fiables ( statistiques disponibles ) indiquant la répartition
de la population sur les critères choisis. Les critères les plus utilisés
dans les études de marché sont économiques et
socio-démographiques en particulier l’âge, le sexe, la catégorie
socioprofessionnelle,....
Exercices

Exercice 1 :
Le tableau ci-après, établi la répartition des 10000 étudiants d’une
Faculté selon le niveau d’étude et le sexe:

Niveau S1 S2 S3 S4 S5 S6
Sexe
Masculin 2000 1600 1000 900 400 250
Féminin 1500 900 600 500 200 150

On se propose de réaliser une enquête auprès d’un échantillon de


1000 étudiants pour obtenir des informations sur la qualité de
l’enseignement au sein de cette faculté.
Comment répartir cet échantillon entre les différentes strates des
10000 étudiants, en tenant compte du niveau et du sexe ?
Exercices
Solution:
D’après l’énoncé de l’exercice, on constate que la population des
étudiants de cette Faculté est composée de plusieurs strates. Donc
afin d’améliorer la représentativité de l’échantillon, on doit adopter
la méthode de stratification proportionnelle, qui consiste à répartir
les 1000 étudiants proportionnellement au nombre total des
étudiants dans chaque strate. Autrement dit, la construction de
l’échantillon se fera conformément au poids de chaque strate
comme suit:
n
nh = ( ) × Nh
N
Avec:
h: désigne le rang du heme strate;
nh : est la taille de l’échantillon dans la strate h;
Nh : est l’effectif de la population dans la strate h;
n: est la taille de l’échantillon;
N: est la taille de la population.
Exercices

Solution:
Niveau S1 S2 S3 S4 S5 S6
Sexe
Masculin 200 160 100 90 40 25
Féminin 150 90 60 50 20 15

1000
I Exemple: n11 = ( 10000 ) × 2000 = 200
I La stratification consiste à découper la population étudiée en
groupes homogènes, appelés strates, et à tirer
indépendamment un échantillon aléatoire dans chaque strate.
Exercices
Exercice 2 :
Sur une population de 15000 entreprises étudiées selon le chiffre
d’affaires (variable X) et le nombre d’employés (variable Y). On
obtient les résultats suivants:
X(en milliers de DH) Effectifs Y Effectifs
0-50 5500 0-10 7050
50-100 4500 10-50 3700
100-200 1750 50-100 2500
200-500 2000 100-500 1500
500-1000 500 > 500 250
> 1000 750
Total 15000 Total 15000

Soit un taux de sondage de 0,10. Quelle méthode peut-on utiliser


pour déterminer un échantillon ? On supposera que l’institut
responsable du sondage dispose de 30 enquêteurs.
Expliquez votre démarche et les concepts utilisés.
Exercices

Solution:
La méthode à utiliser est la méthode des quotas car on connait la
distribution de la population (15000 entreprises) selon les variables
de contrôle (le chiffre d’affaires: X et le nombre d’employés: Y ).
Soit t = Nn = 10% le taux de sondage choisi par l’institut de
sondage.
Avec:
n: désigne la taille de l’échantillon à constituer,
N: désigne la taille de la population.
Donc, la taille de l’échantillon est de n = 10% × 15000 = 1500
entreprises.
Commençons par les quotas relatifs à la variable de contrôle chiffre
d’affaires, puis, nous calculerons les quotas relatifs à la variable de
contrôle nombre d’employés.
Exercices
Solution:
I Les quotas relatifs à la variable de contrôle chiffre d’affaires
(X):

X en milliers Effectifs Quotas Effectifs Répartition des


de DHs population: population échantillon: enquêteurs
Ns ni
0-50 5500 36,67% 550 11
50-100 4500 30% 450 9
100-200 1750 11,66% 175 3
200-500 2000 13,34% 200 4
500-1000 500 3,33% 50 1
> 1000 750 5% 75 2
Total 15000 = N 100% 1500 = n 30 = Nombre
des enquêteurs
Exercices
Solution:
Avec:
I Quotas population = NNs ;
I L’effectif échantillon peut être calculé de deux façons:
- Soit : ni = Ns × 10%
- Soit : ni = n(taille de l’échantillon)× quotas population ;
I La répartition des enquêteurs est obtenue en multipliant le
nombre total des enquêteurs par chaque quota de la
population.
I Totale:En aucune manière:
- l’effectif de la population ne doit dépasser N;
- la somme des quota ne doit dépasse 100%;
- l’effectif de l’échantillon ne doit dépasser n;
- Et la répartition des enquêteurs, ne doit dépasser le total des
enquêteurs.
Exercices

Solution:
I De la même façon on peut calculer Les quotas relatifs à la
deuxième variable de contrôle : le nombre d’employés (Y):

Y : Le nombre Effectifs Quotas Effectifs Répartition des


d’employés population: population échantillon: enquêteurs
Ns ni
0-10 7050 47% 705 14
10-50 3700 24,66% 370 7
50-100 2500 16,66% 250 5
100-500 1500 10% 150 3
> 500 250 1,68% 25 1
Total 15000 = N 100% 1500 = n 30
Exercices

Exercice 3 :
Soit une population étudiée selon deux variable, l’age des individus
et le nombre d’enfants par individus. Les modalités de la première
variable sont inférieures à 20 ans ; de 20 à 25 ans ; de 25 à 30 ans ;
de 30 à 35 ans ; de 35 à 40 ans et supérieur ou égal à 40 ans.
Les modalités pour la seconde variable sont 0 enfant; 1 enfant ; 2
enfants ; 3 enfants ; 4 enfants ; supérieur ou égal à 5 enfants.
Les effectifs obtenus en fonction des modalités ci-dessus sont:

Première variable 110 150 200 250 190 100


Deuxième variable 50 550 100 150 75 75

Un organisme de sondage dispose de 10 enquêteurs. Chaque


enquêteur doit faire 20 interviews. L’institut de sondage décide
d’un taux de sondage de 20%.
Exercices

Exercice 3 :
a) Définir les variable de contrôle.
b) Définir le taux de sondage et donner les effectifs de l’échantillon
et de la population.
c)Donner le principe de la méthode des Quotas.
d) Applique la méthodes des quotas à l’exemples ci-dessus.
e)Donner la structure d’interviews(en fonction des variable de
contrôle) que doit faire chaque enquêteur.
f) Donner les conditions de mise en œuvre de la méthode des
quotas.
Exercices

Solution:
a) La variable de contrôle est une variable qui permet d’assurer la
conformité de la structure de l’échantillon par rapport à la structure
de la population avec X : Age et Y : Nombre d’enfants.
b) Le taux de sondage désigne le rapport entre la taille de
l’échantillon et la taille de la population mère, donc le taux de
sondage t = Nn , avec N = 1000, ce qui implique que n = 200
(n = N × t = 1000 × 20%)
c) Le principe de la méthode des quotas: en fonction des variables
de contrôle, l’échantillon est choisi de façon à constituer une image
aussi fidèle que possible de la population. En d’autres termes, la
structure de l’échantillon doit être identique à la structure de la
population.
Exercices

Solution:
L’application de la méthode des quotas à cet exemple - en
respectant la même démarche de l’exercice précédent - nous donne
la composition de l’échantillon pour les deux variable de contrôle X
et Y:

X ni Y ni
< 20 22 0 10
20-25 30 1 110
25-30 40 2 20
30-35 50 3 30
35-40 38 4 15
> 40 20 ≥5 15
Total 200 Total 200
Exercices

Solution:
e) La structure des interviews:

X ni Y ni
< 20 2 0 1
20-25 3 1 11
25-30 4 2 2
30-35 5 3 3
35-40 4 4 1,5 → 2 ou 1
> 40 2 ≥5 1,5 → 1 ou 2
Total 20 Total 20
Exercices

Solution:
f) Les conditions de la mise en œuvre da la méthode des quotas
sont respectivement:
- Choix des variables de contrôle;
- Organisation pratique des enquêteurs;
- Le contrôle des enquêteurs.