Vous êtes sur la page 1sur 9

Dterminer la taille de l'chantillon

Dans toutes les enqutes quantitatives, la taille de l'chantillon est un facteur dterminant
pour obtenir des donnes fiables. Les spcialistes des sondages font appel des thories
statistiques trs complexes pour calculer la taille de l'chantillon en fonction de la marge
d'erreur tolre.

Crdit photo : Keerati,freedigitalphotos.net

Articles en rapport

Pourquoi enquter en ligne ?

Population et chantillon

Un vritable sondage reprsentatif ?

Sans trop rentrer dans les dtails, on peut en retenir quelques rgles simples pour estimer
l'chantillon requis.
La taille de l'chantillon est le nombre de personnes qui rpondent effectivement votre
questionnaire. Ce nombre est dterminant pour vous permettre de gnraliser les rsultats du
sondage l'ensemble de la population cible.
En gnral, plus il y a de personnes qui participent l'enqute et plus votre marge d'erreur sera
faible.
Par exemple, voulez-vous estimer votre taux de clients satisfaits avec une prcision de 2% ? Ou
de 7% ?

Vous pensez peut-tre que plus la population que vous tudiez est grande, et plus il vous faudra
interroger de personnes. Ce n'est pas faux mme si, en ralit, la taille dun chantillon
naugmente pas proportionnellement la taille de la population. Il n'est donc pas si facile que
cela de dterminer le nombre de rpondants ncessaire, mais nous sommes l pour vous aider.
Avant de vous lancer dans vos calculs, prenez en compte ces deux facteurs que connaissent bien
les statisticiens :

la taille de la population mre


Plus la population est importante, plus on a besoin d'un chantillon de plus grande taille.
Cependant, lorsqu'il s'agit de trs grandes populations, la taille de la population n'a plus
d'influence sur la taille de l'chantillon. C'est pour cela que les sondages politiques
raliss aux tats-Unis sur un chantillon de 1000 personnes ont la mme fiabilit que
ceux raliss en France sur un chantillon de mme taille.

la variabilit des caractristiques de la population mre


Plus la population mre qui vous intresse est diverse et prsente des caractristiques
varies, plus il faudra interroger de personnes. A l'inverse, plus cette population est
homogne et moins il faudra interroger de personnes. A l'extrme, si toutes les personnes
d'une population X gagnent le mme salaire, il suffit d'interroger une seule personne pour
connatre le salaire moyen de la population ! vident, non ?

Formule de calcul de la taille de l'chantillon


Voil la fameuse formule que vous attendez : n = z x p ( 1 p ) / m
n = taille de lchantillon
z = niveau de confiance selon la loi normale centre rduite (pour un niveau de confiance de
95%, z = 1.96, pour un niveau de confiance de 99%, z = 2.575)
p = proportion estime de la population qui prsente la caractristique (lorsque inconnue, on
utilise p = 0.5 ce qui correspond au cas le plus dfavorable c'est--dire la dispersion la plus
grande)
m = marge derreur tolre (par exemple on veut connatre la proportion relle 5% prs)
Cette formule dtermine le nombre de personnes n interroger en fonction de la marge d'erreur
m que l'on peut tolrer sur une proportion de rponses p.
Nous retenons ici le calcul d'une proportion qui est trs frquent dans les enqutes en ligne et sur
lequel vous appuierez souvent vos dcisions stratgiques. Par exemple, si vous tudiez le march
pour un nouveau produit lancer, vous investirez pour le mettre en march si la proportion des
rpondants intresss par ce produit est suffisamment grande.
Revenons nos calculs pour vous montrer en exemples ce que cela donne :

1. Pour calculer une proportion avec un niveau de confiance de 95% et une marge derreur
5% :
n = (1.96) x (0,5)(1-0,5) / (0.05) = 384.16
2. Pour calculer une proportion avec un niveau de confiance de 95% et une marge derreur
7% :
n = (1.96) x (0,5)(1-0,5) / (0.07) = 196
3. Pour calculer une proportion avec un niveau de confiance de 99% et une marge derreur
2% :
n = (2.575) x (0,5)(1-0,5) / (0.02) = 3218.75
Vous voyez que la taille relle de lchantillon est un compromis entre le degr de prcision
atteindre, votre budget pour l'enqute et l'ensemble des contraintes oprationnelles (informations
disponibles, dlais, etc.).
Pour effectuer une tude de march suffisamment fiable, on admet le plus souvent une marge
d'erreur de 5% ce qui ncessite d'obtenir environ 400 rponses. Si votre budget est plus limit,
ltude peut se faire auprs de 200 personnes seulement, mais vos rsultats seront moins prcis.
A vous de voir...

Mthode (empirique) des quotas


A dfaut d'un pur tirage alatoire, on a recours la mthode empirique des quotas pour
constituer un chantillon de rpondants qui respecte les caractristiques de la population
tudie (le plus souvent des donnes socio-dmographiques). Avantage ne pas ngliger :
les quotas permettent de grer le nombre et le profil des rpondants selon votre budget !

Crdit photo : Vlado,freedigitalphotos.net

Articles en rapport

Population et chantillon

Appliquer la technique de l'entonnoir

La question combine

Pour obtenir un chantillon reprsentatif, il faut d'abord dfinir la population cible puis - en
thorie - il faut tirer alatoirement un chantillon de personnes, c'est--dire que tous les individus
de la population tudie doivent avoir les mmes chances d'tre interrogs (comme les boules
portant les numros au tirage du Loto).
Dans la plupart des enqutes et sondages, c'est strictement impossible mettre en uvre, d'autant
qu'on ne peut pas OBLIGER un individu rpondre ! En pratique, on choisit donc une mthode
de sondage empirique, la plus connue tant la mthode des quotas.
Le principe de la mthode des quotas est de reprer dans la population cible, quelques critres
de rpartition significatifs puis de respecter cette mme rpartition dans l'chantillon.

Exemple (volontairement trs simple) : si la population tudie se compose de 45% d'hommes et


55% de femmes et que 100 personnes doivent tre interroges, l'chantillon devra comporter 45
hommes et 55 femmes.
La mthode repose sur l'hypothse selon laquelle en contrlant la structure de l'chantillon sur
des critres connus de la population tudie, on peut tendre les rsultats obtenus sur cet
chantillon la population tout entire. Et cela suppose qu'il y ait une corrlation entre les
caractres tudis et les critres utiliss comme quotas.
Il s'agit l de rserves essentiellement thoriques car en pratique, la mthode des quotas fait
preuve de son efficacit depuis des dizaines d'annes !
Concrtement, on interroge directement les rpondants sur les critres utiliss comme quotas et
on carte (poliment!) ceux qui ne les remplissent pas. C'est pourquoi une question quota doit tre
place au dbut : il s'agit ici d'une exception notable la technique de l'entonnoir dans le but de
ne pas drouler inutilement un questionnaire.
Pour des quotas reprsentatifs, les critres utiliss sont le plus souvent des donnes sociodmographiques : sexe et ge ou catgorie socioprofessionnelle ou encore rgion et catgorie
d'agglomration.
Mais vous pouvez galement utiliser des critres comportementaux ou d'opinion, condition que
vous connaissiez la proportion dans la population mre. Si vous interrogez vos propres clients,
vous pouvez chercher respecter dans l'chantillon la proportion de clients par type de produit
consomm, par anciennet d'achat ou tout autre critre de segmentation spcifique votre
business.
En dehors de tout objectif de reprsentativit statistique de l'chantillon, vous pouvez aussi
utiliser des quotas comme critres de slection des individus interroger. Par exemple, vous
pouvez vouloir interroger au minimum 100 clients et 100 prospects pour comparer leurs opinions
sur votre nouveau site web mme si cette proportion n'est pas le reflet de la ralit. Dans
questionnaire-pro, c'est ce que nous appelons un quota seuil.
Les quotas ont un intrt pratique trs important : ils permettent de grer le nombre et le profil
des rpondants en fonction de votre budget.
Toutefois, ne retenez qu'un nombre restreint de quotas : 2 ou 3 de prfrence, 4 au maximum
avec une question combine. A dfaut, la gestion des queues de quotas peut vite devenir un
vritable casse-tte !

Une alternative : la mthode de la boule de


neige
La mthode de la boule de neige consiste diffuser votre questionnaire des personnes
connues ayant les caractristiques que vous recherchez puis de leur demander d'indiquer
d'autres personnes de profil similaire. C'est l'effet boule de neige ! Bien sr, cette mthode
ne fournit pas un chantillon reprsentatif mais elle est trs simple mettre en uvre
quand on se lance sur une nouvelle activit.

Crdit photo : Kamyar Adl,Flickr CC BY 2.0

Articles en rapport

Techniques simples d'chantillonnage

Offrir un incentive, pourquoi pas mais lequel ?

Taux d'abandon, taux de rponse : des indicateurs cls

On pourrait aussi l'appeler la mthode virale ! Et elle fonctionne trs bien sur internet.
La mthode de la boule de neige constitue une alternative intressante aux mthodes
d'chantillonnage classiques quand il s'agit de trouver des individus ayant des caractristiques
particulires, voire trs prcises.
La technique est la suivante : vous diffusez votre questionnaire un groupe de personnes
connues possdant certaines caractristiques et vous leur demandez d'indiquer d'autres personnes
ayant les mmes caractristiques ou de leur faire suivre le lien vers votre questionnaire.

Par exemple, vous crez un nouveau produit pour les sportifs et vous voudriez savoir quelles sont
les attentes des consommateurs dans ce domaine et quel prix ils seraient prts payer pour votre
nouveau produit : commencez envoyer le questionnaire vos amis sportifs et demandez-leur de
le diffuser dans leur propre entourage.
Le risque principal reste le faible nombre de rpondants. Pour booster le taux de rponse, rien ne
vous empche de mettre en place un incentive. Voyez notre article sur ce sujet.
videmment, la mthode de la boule de neige ne fournit pas un chantillon reprsentatif car elle
introduit ncessairement des biais statistiques.
Mais elle est trs facile mettre en uvre et peut tre conseille tous ceux qui se lancent sur
une nouvelle activit ou un nouveau produit, et n'ont de ce fait ni fichier client ni audience
tablie sur le web.
Et d'ailleurs, si vous profitiez de votre enqute en ligne pour collecter des adresses e-mail de
prospects ? Voil une bonne ide !

Un vritable sondage reprsentatif ?


La collecte de donnes sur le web tant devenue si facile et rapide, la notion de sondage est
un peu galvaude. On a tendance oublier qu'un sondage, ce n'est peut-tre pas si simple.
Si en plus on cherche tre reprsentatif, il va falloir contrler la structure de l'chantillon
en appliquant par exemple la mthode des quotas.

Articles en rapport

Population et chantillon

Mthode (empirique) des quotas

Minimiser les biais et les erreurs

A l'heure actuelle, on a tendance appeler sondage tout et n'importe quoi ! De nombreux mdias
baptisent sondage une simple bote question publie sur leur site web comme par exemple :
Pensez-vous que que la Grce va sortir de l'Union Europenne d'ici fin 2015 ?
Faut-il abandonner les 35h comme dure lgale du travail hebdomadaire ?
tes-vous favorable ou oppos l'adoption pour les couples homosexuels ?
Il est vident qu'une simple question pose ainsi aux internautes n'a aucunement valeur de
sondage et que le rsultat n'est reprsentatif que des rpondants qui se sont manifests... La seule
certitude que l'on peut avoir sur l'chantillon, c'est que les rpondants sont des internautes,
visiteurs du site, qui ont pris la peine de cocher une des rponses proposes ! C'est un peu
maigre...
Revenons plutt la question pose : comment faire pour obtenir un chantillon reprsentatif ?

Si l'objectif de votre enqute est de faire ragir les visiteurs sur l'ergonomie de votre site, alors
une fois un nombre suffisant de rponses collectes, il n'y a aucun problme pour exploiter les
rsultats sans contrainte particulire.
De mme, si vous diffusez votre questionnaire par e-mail auprs des salaris de votre entreprises,
des tudiants de votre cole ou des membres de votre association, vous tes sr d'avoir les bons
interlocuteurs. Du moment que la taille de l'chantillon est suffisante, vous pouvez traiter les
rsultats en confiance.
Attention quand mme : sur une population de petite taille, il vous faut un taux de rponse
proportionnellement plus lev pour fiabiliser les rsultats !
Mais comment s'assurer de la reprsentativit d'un chantillon lorsqu'il s'agit d'interroger des
prospects par internet ? Impossible en effet de vrifier l'identit de celui qui complte un
questionnaire en ligne...
Si vous avez lu les articles prcdents portant sur l'chantillonnage, vous savez dj qu'il est
impossible de raliser un pur sondage alatoire mais qu'il existe des mthodes empiriques,
comme la mthode des quotas, qui permettent de contrler la structure de l'chantillon.
Pour prtendre un sondage reprsentatif, il vous faut donc :

disposer en amont de donnes statistiques sur la population tudier, par exemple des
donnes socio-dmographiques,

contrler que l'chantillon des rpondants prsente les mmes caractristiques, en


appliquant des quotas sur les donnes connues.

C'est ainsi qu'en pratique on minimise le risque d'erreur d'chantillonnage.

Vous aimerez peut-être aussi