Académique Documents
Professionnel Documents
Culture Documents
M.JERRY
1. Introduction
2. Théorie de l’échantillonnage
2.1 Introduction
2.2 Les méthodes d’échantillonnage
2.3 Estimation ponctuelle
3. La taille de l’échantillon
3.1 Introduction
3.2 Paramètres en jeux
3.3 Taille de l’échantillon
Introduction
1. Introduction
2. Théorie de l’échantillonnage
2.1 Introduction
2.2 Les méthodes d’échantillonnage
2.3 Estimation ponctuelle
3. La taille de l’échantillon
3.1 Introduction
3.2 Paramètres en jeux
3.3 Taille de l’échantillon
Echantillon
ä L’échantillon est un sous ensemble de la population de
base qui est interrogé après sélection lors d’une enquête.
ä Après traitement, les résultats obtenus auprès de
l’échantillon sont extrapolés à la population étudiée.
ä Pour assurer la fiabilité de cette extrapolation, l’échantillon
doit être représentatif.
ä Le recours à un plan d’échantillonnage répond en général
à une contrainte pratique (manque de temps, de place,
coût financier ...) interdisant l’étude exhaustive de la
population.
a Théorie de l’échantillonage : Etude des liaisons
existantes entre une population et les échantillons de cette
population, prélevés par sondage.
Méthodes d’échantillonnage : ensemble des méthodes
permettant de réaliser un sondage (de prélever un
échantillon de données) au sein d’une population, de
manière à reproduire un échantillon aussi représentatif que
possible de cette population.
Evaluation de ces méthodes : le système
d’échantillonnage sera jugé d’après la qualité des
approximations des paramètres de la population, calculées
sur l’échantillon prélevé. Pour cela, on étudiera la loi des
caractéristiques classiques d’un échantillon (moyenne
arithmétique, variance empirique, ...)
1. Introduction
2. Théorie de l’échantillonnage
2.1 Introduction
2.2 Les méthodes d’échantillonnage
2.3 Estimation ponctuelle
3. La taille de l’échantillon
3.1 Introduction
3.2 Paramètres en jeux
3.3 Taille de l’échantillon
Les méthodes empiriques
Les méthodes empiriques sont les plus utilisées par les instituts
de sondage. Leur précision ne peut pas être calculée et leur
réussite dépend de l’expertise des enquêteurs.
a Echantillonnage sur la base du jugement : Echantillon
prélevé à partir d’avis d’experts, qui connaissent bien la
population et sont capable de dire quelles sont les entités
représentatives.
Problème : l’avis des experts est subjectif.
a Echantillonnage par la méthode des quotas :
Echantillon prélevé librement à condition de respecter une
composition donnée à l’avance (sexe, âge, ...).
Problème : repose sur la pertinence des catégories
retenues.
a Echantillonnage de commodité : On choisit des
individus statistiques qui sont d’accès facile. Par exemple,
un professeur qui mène une expérience à l’université peut
utiliser des étudiants volantaires pour constituer un
échantillon simplement parce qu’ils sont disponible.
Problème : Les échantillons de commodité ont l’avantage
d’être facilement constitués et les données sont facilement
collectées ; cependant, il est impossible d’évaluer le degré
de représentativité de la population.
a Echantillonnage par boule de neige : On choisit
quelques individus (au sein d’une population humaine) qui
sont pertinents pour l’étude, et ensuite on leur demande de
proposer d’autres individus pour l’enquête.
Problème : Il est impossible d’évaluer le degré de
représentativité de la population.
Les méthodes aléatoires
Les méthodes aléatoires reposent sur le tirage au hasard
d’échantillons et sur le calcul des probabilités.
a Echantillonnage aléatoire simple (Simple random
sample) :
ä On prélève dans la population, des individus au hasard,
sans remise : tous les individus ont la même probabilité
d’être prélevés, et ils le sont indépendamment les uns des
autres.
ä La procédure de sélection d’un échantillon aléatoite simple,
à partir d’une population finie, consiste à choisir les
éléments de l’échantillon un par un, de façon à ce que les
éléments restants dans la population aient la même
probabilité d’être sélectioné.
ä Le nombre d’échantillons aléatoires simples de taille n
différents qui peuvent être sélectionés à partir d’une
population de taille N est
N!
CNn =
n!(N − n)!
a Echantillonnage aléatoire stratifié :
ä La population est tout d’abord divisée en groupes
d’éléments appelés strates, de façon à ce que chaque
élément de la population appartienne à une et une seule
strate. L’élément de base qui définit une strate, tel qu’un
service, un lieu, un âge, un type d’industrie, etc..., est laissé
à la discrétion du créateur de l’échantillon.
ä La population est divisée en H strates de taille N1 ,..., NH .
La procédure d’échantillonnage consiste à exécuter un plan
aléatoire simple sans remise de taille nh dans la strate h,
indépendamment des autres strates.
ä Le nombre d’échantillon possible est
H
n
∏ CNhh
h=1
1. Introduction
2. Théorie de l’échantillonnage
2.1 Introduction
2.2 Les méthodes d’échantillonnage
2.3 Estimation ponctuelle
3. La taille de l’échantillon
3.1 Introduction
3.2 Paramètres en jeux
3.3 Taille de l’échantillon
Estimation ponctuelle
1 n
S2 = ∑(xi − x̄)
2
n i=1
1. Introduction
2. Théorie de l’échantillonnage
2.1 Introduction
2.2 Les méthodes d’échantillonnage
2.3 Estimation ponctuelle
3. La taille de l’échantillon
3.1 Introduction
3.2 Paramètres en jeux
3.3 Taille de l’échantillon
Introduction
1. Introduction
2. Théorie de l’échantillonnage
2.1 Introduction
2.2 Les méthodes d’échantillonnage
2.3 Estimation ponctuelle
3. La taille de l’échantillon
3.1 Introduction
3.2 Paramètres en jeux
3.3 Taille de l’échantillon
Paramètres en jeux
* N : Taille de la population-mère (ou population parent, ou
population de référence, ou population d’origine).
* n : Taille de l’échantillon pour une population mère très
grande (infinie).
* s : Seuil de confiance (ou Niveau de confiance ou encore
Taux de confiance) que l’on souhaite garantir sur la
mesure, noté aussi par 1 − α, où α est le risque.
* t : Coefficient de marge déduit du Taux de confiance « s ».
* E : Marge d’erreur (erreur relative) que l’on se donne pour
la grandeur que l’on veut estimer (par exemple on veut
connaître la proportion réelle à 5% près).
* p : Proportion (connue ou supposée estimée) des
éléments de la population-mère qui présentent une
propriété donnée. (lorsque p est inconnue, on utilise p =
0,5). (on dit ausi : Probabilité de succès ou probabilité de
réalisation positive).
* q = 1 − p : Probabilité d’échec ou probabilité de réalisation
négative.
n
* R= N
: Le taux de sondage.
* I = 2E : La fourchette d’incertitude.
1. Introduction
2. Théorie de l’échantillonnage
2.1 Introduction
2.2 Les méthodes d’échantillonnage
2.3 Estimation ponctuelle
3. La taille de l’échantillon
3.1 Introduction
3.2 Paramètres en jeux
3.3 Taille de l’échantillon
Taille de l’échantillon avec la formule de Slovin
t 2 p(1 − p)
n= E2
t p(1 − p)
2
1+( )
NE 2
Taille de l’échantillon pour des populations inconnues
ou très nombreuses
t 2 p(1 − p)
n=
E2
ä Sa réciproque
√
p(1 − p)
E =t
n
ä Toutefois, il n’est pas possible d’utiliser directement ces
formules, puisque la proportion p ne sera connu qu’après
avoir sélectionné un échantillon. En pratique, cette valeur
préalable p est obtenue par l’une des procédures
suivantes.
¶ Utiliser la proportion d’échantillon obtenue à partir d’un
échantillon précédent ayant des caractéristiques similaires.
· Utiliser une étude pilote pour sélectionner un échantillon
préliminaire. La proportion de cet échantillon peut servir de
valeur préalable p.
¸ Utiliser votre intuition pour déterminer la valeur p.
¹ Si aucune de ces procédures n’ait applicable, utiliser la
valeur p = 0, 5.
Valeurs calculées de la taille de l’échnatillon n
Marge d’erreur E
Proportion p q =1−p 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,1
0,3 0,7 8067 2017 896 504 323 224 165 126 100 81
0,4 0,6 9220 2305 1024 576 369 256 188 144 114 92
0,5 0,5 9604 2401 1067 600 384 267 196 150 119 96
Fiabilité de l’échantillon