Vous êtes sur la page 1sur 6

:

Déterminer la taille de l’échantillon

La taille de l’échantillon est le nombre de personnes qui répondent effectivement à


votre questionnaire. Ce nombre est déterminant pour vous permettre de généraliser les résultats
du sondage à l’ensemble de la population ciblée.

Avant de vous lancer dans vos calculs, prenez en compte ces deux facteurs que
connaissent bien les statisticiens :
 la taille de la population mère.
 la variabilité des caractéristiques de la population mère.

NB

Déterminer la taille nécessaire d’un échantillon avant d’effectuer le recueil des données est essentiel
pour éviter que l’échantillon ne se révèle trop petit après le traitement des données.

 1 Taille d’un échantillon destiné à un traitement quantitatif avec tests paramétriques

La précision statistique d'une méthode d'estimation d'un paramètre de la population est définie
comme une mesure de l'écart entre l'estimation obtenue à partir de l'échantillon et la vraie valeur du
paramètre.

 Facteurs généraux liés à la précision

La précision dépend de plusieurs facteurs qui sont :

- le seuil de signification souhaité.

-la variance de la population.

- la technique d’échantillonnage utilisée.

- la taille de la population.

 Calcul de la taille de l’échantillon pour l’estimation de la moyenne

Intervalle de confiance de la moyenne lorsque la variance de la population connue est


calculée par :

𝑺 𝑺
Ȳ– z ≤m≤Ȳ+z
√𝒏 √𝒏
Où Ȳet S désignent respectivement la moyenne et l’écart type de la variable étudiée dans
l’échantillon, n la taille de l’échantillon et Z la valeur de la loi normale pour le seuil de signification α.
Estimation de l'intervalle de confiance à 95% :
Estimation précise :

Lorsque la confiance vaut 95% vaut Z0,975=1,96.

𝑺 𝑺
L'intervalle de confiance va donc de : IC= [Ȳ– 1.96 ; Ȳ + 1.96 ]
√𝒏 √𝒏

Si l’on souhaite se fixer a priori une précision appelée λ de part et d’autre de la


moyenne,

𝑺
on a alors : λ = Z
√𝒏

La taille minimale de l’échantillon pour atteindre la précision souhaitée est alors :

𝑧×𝑠 2
n=( )
𝜆

exemple.

Un sondage dans une commune révèle que sur les n étudiants interrogées, on
veuille connaître le revenu moyen des étudiants mécontents du réseau de transports
en commun. Supposons en outre que l’on connaisse une estimation s de l’écart type du
revenu (10dh), et que l’on souhaite avoir une précision égale à 2dh de chaque côté de
la moyenne et que le seuil de signification souhaité soit de 5% entraîne une valeur de
z égale à 1,96, la taille de l’échantillon est alors :

1.96×10 2
n=( ) =96
2

 Variance de la population et taille de l’échantillon


La variance est un indicateur de dispersion des observations. C’est la moyenne des carrés des
écarts à la moyenne. Plus les observations de la variable étudiée s’écartent de la moyenne et plus
sa valeur est élevée. Plus cette variance est grande, plus grande devra être la taille del’échantillon.

 Seuil de signification et taille de l’échantillon

Le seuil de signification (α) est le pourcentage de chances de se tromper. Plus il est faible, meilleur
est le résultat. Par convention, dans les recherches en management, on considère généralement
les seuils de 1 % et 5 %.

1.96×10 2
Au seuil de signification α = 5 %, z = 1,96 donc n=( ) =96
2

2.576×10 2
Au seuil de signification α= 1 %, z = 2,576 donc n = n=( ) =166
1

■ Précision et taille d’échantillon

En reprenant l’exemple précédent,

-Pour une précision de 2 DH de part et d’autre de la moyenne,

1.96×10 2
n=( ) =96 AVEC α=5%
2
-Pour une précision de 1 DH de part et d’autre de la moyenne z = 1,96

1.96×10 2
n=( ) =385
1
Technique d’échantillonnage et taille de l’échantillon

– Coefficients d’ajustement de la variance en fonction des méthodes d’échantillonnage pour le calcul


de la taille de l’échantillon (henry, 1990)

Méthodes deff Remarques sur le coefficient deff


d’échantillonnages
Échantillons 0,5 à 0,95 Le ratio dépend du nombre de strates et de la corrélation
stratifiés entre les variables utilisées pour la stratification et la
variable étudiée
Échantillons à 1,25 à 1,5 L’effet de la méthode peut être partiellement réduit par
plusieurs degrés
Échantillons par 1,5 à 3,0 Le ratio dépend du nombre de grappes, de l’homogénéité
grappes des individus appartenant à chaque grappe et de l’utilisation
ou non de la stratification.
Grâce à ces coefficients(deff), l’estimation de la taille de l’échantillon peut être calculée de manière Commented [a1]: design effect, coefficients : L'effet de
conception est un facteur de correction utilisé pour ajuster
simple à partir de la formule de base. Il suffit de multiplier la variance par le coefficient la taille d'échantillon requise pour l'échantillonnage en
correspondant à la méthode utilisée (s′2= s2⋅deff). grappes. La taille d'échantillon requise est estimée en
supposant un échantillon aléatoire, puis multipliée par l'effet
de conception
En reprenant l’exemple précédent, avec un échantillon aléatoire simple on obtient :

1.96×10 2
n=( ) =96
2

Avec un échantillon à plusieurs degrés, le coefficient deff maximum indiqué est

1.96×10 2
de 1,5, d’où : n=( ) × 1.5=144
2
-On peut observer que certaines méthodes sont plus efficientes que d’autres

Taille de la population et taille de l’échantillon

Dans le cas où :

-le tirage des éléments de l’échantillon est effectué sans remise

-le taux de sondage est élevé (par convention supérieur à 1/10), et étant donné par le rapport (n/N) .

Ici, La taille de la population est uniquement prise en considération, puisque l’indépendance des
éléments de l’échantillon n’est plus garantie.

D’où la variance doit être corrigée d’un facteur d’exhaustivité K qui s’exprime de manière approchée Commented [a2]: Facteur d'exhaustivité (k):
en fonction du taux de sondage, soit K = 1 – n/N. La taille n′ de l’échantillon corrigée du coefficient
𝑵𝒏 C'est le nombre par lequel il faut multiplier la
d’exhaustivité s’obtient alors par : n′= variance de Y lorsqu'on a un tirage exhaustif, Ce
𝑵+𝒏 nombre étant inférieur à 1, cela signifie que la
variance est plus faible lorsque le tirage se fait sans
remise.
En reprenant l’exemple précédent, n = 96. Si la taille de la population est N = 500, alors le taux Lorsque la population est très grande (N beaucoup
de sondage est supérieur à 1/10 et n′ =81.La prise en compte de la taille de la population plus grand que n), le facteur d'exhaustivité est
entraîne donc une diminution de la variance et, par suite, de la taille de l’échantillon nécessaire. négligeable (presque égal à 1).
 Importance de l’effet mesuré et taille de l’échantillon

L’importance d’un effet décrit l’amplitude ou la force de la relation entre deux ou plusieurs
variables dans la population.

Deux groupes appareillés - Variable numérique


δ : Moyenne des différences individuelles dans la population
σ : Ecart type des différences individuelles .
La taille de l’effet est définie par :

d =| δ |÷σ
Pour quantifier la taille d'un effet dans le cas de deux groupes sur lesquels on compare une
même variable Y, on exprime simplement la différence de moyennes en nombre d'écart types.
Cela se fait en divisant la différence moyenne par l'écart type. C'est la "taille d'effet" proposée
par Cohen (1992)

Exemple
Par exemple, supposonspour chaque groupes un écart type de 15. Si on trouve dans un groupe
A une moyenne de 90 et dans un groupe B une moyenne de 120, cela représentera une taille
d'effet de d= (120-90)/15=2

 Taille de l’échantillon et nombre de paramètres à estimer

La taille de l’échantillon dépend également du nombre de paramètres à estimer, c’est-à-dire, plus le


nombre de paramètres à estimer est grand et plus la taille de l’échantillon doit être grande.
 2 Taille d’un échantillon destiné à un traitement qualitatif
YIN (1984) à distinguer entre deux types d’étude de cas

Le cas unique

Est une étude qui porte sur un cas ayant un caractère unique ou très rare, ou encore difficile d’accès
pour la science, et susceptible de permettre de découvrir des choses qui ne sont pas déjà connues de

La science. Par exemple, un médecin étudie les caractéristiques d’une maladie rare chez un patient.

Les cas multiples

L’étude de cas de type multiple consiste à identifier des phénomènes récurrents parmi un certain
nombre de situations. Par exemple, une équipe de recherche étudie la dynamique interactionnelle
de plusieurs familles qui comptent un jeune enfant atteint d’un cancer

 principe de réplication
Le principe de réplication est utilisé dans les recherches qualitatives aussi bien pour tester
des théories (Yin, 2014) que pour en construire (Eisenhardt, 1989, Eisenhardt et Graebner,
2007). Le principe de réplication dans les recherches qualitatives est analogue à celui qui
prévaut dans les expérimentations multiples, chaque cas correspondant à une
expérimentation.

 Principe de saturation
Pour Glaser et Strauss (1967), la saturation théorique s'applique à un concept (catégorie) et
signifie que celui-ci émerge des données et est confronté par la suite à différents contextes
empiriques, le but du chercheur étant de développer les propriétés du concept et de
s'assurer de sa pertinence théorique et de son caractère heuristique. Lorsque, après des
applications successives, les données n'ajoutent aucune propriété nouvelle au concept, on
peut dire que le concept créé est saturé (catégorie).