Vous êtes sur la page 1sur 21

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Le choix de l'chantillon
Statistiques, logiciels et enqute
Benot Le Maux

- Produire et prparer les variables -

Statistiques, logiciels et enqute

Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Pourquoi un chantillon ?
Pourquoi un chantillon ? Pour des raisons de cots ou de dlais. L'objectif est alors de construire un chantillon tel que les observations pourront tre gnralises l'ensemble de la population. Deux mthodes pour constituer un chantillon. Mthode probabiliste : slection de l'chantillon par tirage alatoire dans la population-mre. Chaque individu statistique doit avoir exactement la mme chance que les autres de participer l'enqute. Mthode non-probabiliste : identier dans la population-mre, quelques critres de rpartition signicatifs puis d'essayer de respecter cette rpartition dans l'chantillon d'individus interrogs.

Statistiques, logiciels et enqute

Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

La bonne question

1. Est-ce qu'un chantillon de taille 500 sut pour une population de 10 000 ? 2. Quelle est la taille de l'chantillon qui assure tel degr prcision ?

Il est impossible de rpondre par oui ou par non la premire question. Un chantillon doit fournir une estimation aussi prcise que possible d'une variable, et la prcision s'amliore indniment lorsque la taille de l'chantillon augmente.

Statistiques, logiciels et enqute

Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

La notion de prcision

La notion de prcision (ou abilit d'chantillonnage) est matrialise par un seuil de conance et une marge d'erreur.
Dans le cas de l'estimation d'une proportion :

Un chantillon dni un seuil de conance de 95% et avec une marge d'erreur de e = 3% vous permettra d'extrapoler chaque rsultat issu de votre enqute, avec 5% de risques de vous tromper de + ou - 3%.

Statistiques, logiciels et enqute

Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Dans le cas de l'estimation d'une proportion (1)

Pour calculer la taille de l'chantillon dans le cas de l'estimation d'une proportion, vous pouvez appliquer la formule suivante :
n= z 2 p (1 p ) e2

o n est la taille de l'chantillon, t est une constante issue de la loi normale selon un certain seuil de conance (en gnral 95% et z =1,96), p : est le pourcentage de gens qui prsentent le caractre observ, e est la marge d'erreur d'chantillonnage choisie.

Statistiques, logiciels et enqute

Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Dans le cas de l'estimation d'une proportion (2)

Rpartition des rponses Erreur d'chantillonnage p p 1 % 5 % 0 % 15 % 20 % 50 % 50 % 60 % 40 % 70 % 30 % 80 % 20 % 90 % 10 %


1 1 9604 9220 8068 6147 3458 385 369 323 246 139 97 93 81 62 35 43 41 36 28 16 25 24 21 16 9 Table: Taille de l'chantillon dans le cas d'une proportion

Statistiques, logiciels et enqute

Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Quelques remarques (1)


La gnralisation aux mthodes non-probabilistes : En thorie, les mthodes de calcul scientique de la taille d'chantillon ne s'applique que sur les chantillons obtenus par la mthode probabiliste. En pratique, ces mthodes de calcul sont quand mme utilises. Un chantillon de grande taille mais pas trop Plus votre chantillon est important, plus la gnralisation sera able. Mais, les gains de abilit ne sont pas proportionnels l'augmentation de la taille de l'chantillon.

Statistiques, logiciels et enqute

Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Quelques remarques (2)

La taille de la population-mre c'est un facteur seulement lorsqu'elle est en de de 100 000 ou peu prs. En de, il faut utiliser, pour dterminer la taille de l'chantillon, un lment appel  facteur de correction  :
Dans le cas d'une proportion : n = N

reprsente la population mre.

n + 1+ nN 1

n n 1+ N

Statistiques, logiciels et enqute

Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Quelques remarques (3)


Population Echantillon 50 100 200 1 000 2 000 5 000 10 000 100 000 200 000
N

45 80 132 278 323 357 371 384 385

Table: Population et chantillon dans le cas d'une proportion

Statistiques, logiciels et enqute

Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Quelques remarques (4)

Un faux problme En gnral, pour dterminer la taille d'un l'chantillon, une tude quantitative se base gnralement sur les chires obtenus dans le tableau ci-dessus. Un chantillon de 200-300 individus fournit donc de bon rsultats. On choisit ensuite un seuil de conance (en gnral 95%). La marge d'erreur, et par consquent l'intervalle de conance, sont ensuite dduits via la formule suivante : 1 Pour une proportion : e = z p(np) .

Statistiques, logiciels et enqute

Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Rsum

La prcision dpend de deux lments principaux : La taille n de l'chantillon : plus l'chantillon est grand plus l'estimation est prcise. Le seuil de conance : plus celui-ci sera grand, plus z grandira et plus l'intervalle de conance sera large.
1 2

Statistiques, logiciels et enqute

Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Mthode d'chantillonnage probabiliste


Dnition

Les chantillons probabilistes

ou alatoires sont constitus par tirage au sort dans la population mre pour laquelle on dispose de la liste complte de toutes les units de sondage qui la composent (individus, familles, entreprises, etc.). On distingue 4 mthodes : Echantillonnage alatoire simple Echantillonnage alatoire systmatique Echantillonnage strati Echantillonnage en grappes et plusieurs degrs

Statistiques, logiciels et enqute

Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Echantillonnage alatoire simple


Principe Chaque membre d'une population a une chance gale d'tre inclus l'intrieur de l'chantillon. Chaque combinaison de membres de la population a aussi une chance gale de composer l'chantillon. Mode d'administration Vous devez dresser une liste de toutes les units incluses dans la population observe pour slectionner un chantillon alatoire simple. Un chantillonnage alatoire simple peut s'eectuer avec ou sans remise.
Avantages :

Inconvnients :

facile mettre en uvre. La non-reprsentativit, le cot.

Statistiques, logiciels et enqute

Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Echantillonnage systmatique
Principe Il existe un cart, ou un intervalle, entre chaque unit slectionne qui est incluse dans l'chantillon. Mode d'administration Numroter de 1 N les units incluses dans votre base de sondage (o N est la taille de la population totale). Dterminer l'intervalle d'chantillonnage ou pas de sondage (K) en divisant la population N par la taille de l'chantillon que vous dsirez obtenir. Slectionner au hasard un nombre entre 1 et K. Ce nombre s'appelle l'origine choisie au hasard. Slectionner chaque Kme unit aprs ce premier nombre.
1 2 3 4

La probabilit d'tre slectionne = celle d'un EAS. Inconvnients : Le cot, problme si la population est ordonne.
Avantages :
Statistiques, logiciels et enqute Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Echantillonnage strati
Principe Dcouper la population en sous ensembles appels strates et raliser un sondage dans chacune d'elles. Mode d'administration On divise la population en groupes homognes (appels strates), qui sont mutuellement exclusifs (selon l'ge, le sexe, la province de rsidence, le revenu, etc.) On slectionne partir de chaque strate des chantillons indpendants. On peut utiliser n'importe quelle des mthodes d'chantillonnage La mthode d'chantillonnage peut varier d'une strate une autre.
1 2 3

La probabilit d'tre slectionne = celle d'un EAS. Echantillon plus reprsentatif. Inconvnients : Le cot.
Avantages :
Statistiques, logiciels et enqute Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Echantillonnage en grappes et plusieurs degrs


Principe Limiter les zones gographiques qui font l'objet de l'enqute Mode d'administration Si la population est rpartie sur M grappes (usines, tablissements d'enseignement, subdivisions lectorales) : 1er degr : choisir un chantillon de m grappes. 2me degr : raliser une enqute dans chacune des m grappes : soit auprs de tous les lments (dits aussi units secondaires) : sondage par grappes. soit en dsignant des chantillons d'units secondaires : sondage deux degrs.
1 2

rduire les cots Inconvnients : Eet de grappe (variance intra qui est faible) d l'existence de similarite entre individus d'une mme grappe.
Avantages :
Statistiques, logiciels et enqute Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Mthode d'chantillonnage non-probabiliste


Dnition

La mthode d'chantillonnage non-probabiliste est utilise lorsqu'il n'est pas possible de constituer une liste exhaustive de toutes les units du sondage. Dans le cas de l'chantillonnage probabiliste, chaque unit a une chance d'tre slectionne. Ce n'est plus vrai dans le cas de l'chantillonnage probabiliste. On se xe alors comme rgle que l'chantillon retenu doit avoir la mme composition que la population mre par rapport une ou plusieurs caractristiques.

Statistiques, logiciels et enqute

Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Echantillonnage par quotas


Principe Il s'eectue jusqu' ce qu'un nombre prcis d'units (de quotas) pour diverses sous-populations ait t slectionn. Mode d'administration Les quotas peuvent tre fonds sur des proportions de la population. (par exemple 50% d'hommes et 50% de femmes) Ne retenir qu'un nombre restreint de quotas. Au del de 2 ou 3 quotas, on complique la tche des enquteurs. L'chantillonnage par quotas est gnralement moins coteux que l'chantillonnage alatoire. Il est galement facile administrer. Inconvnients : Certaines units peuvent n'avoir aucune chance d'tre slectionnes.
Avantages :
Statistiques, logiciels et enqute Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Les autres mthodes non-probabilistes (1)


Le volontariat

On prlve l'chantillon partir d'un groupe de volontaires. Inconvnients : chantillon biais

La mthode des itinraires

On impose l'enquteur : Un point de dpart dans une commune. Un itinraire suivre avec tirage systmatique des logements dans lesquels eectuer les interviews Objectif: reproduire un certain tirage alatoire des enquts, sans donner explicitement des noms et adresses l'enquteur.

Statistiques, logiciels et enqute

Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Les autres mthodes non-probabilistes (2)


Technique de  boule de neige 
Utilisation de personnes comme source d'identication d'units additionnelles.

chantillonnage de convenance ou au jug chantillonnage sur place

On prlve un chantillon en se fondant sur certains jugements au sujet de l'ensemble de la population.

L'chantillon tudi est dnie par un lieu. Cette mthode est utilis dans l'chantillonnage de populations mobiles, rares ou spciques. Avec cette mthode, il faut faire attention : ne pas sur-reprsenter les individus passant + de temps sur place les priodes d'enqute les pondrations a posteriori pour tenir compte de la probabilit de prsence
Statistiques, logiciels et enqute Le choix de l'chantillon

La taille de l'chantillon

Mthode d'chantillonnage probabiliste

Mthode d'chantillonnage non-probabiliste

Conclusion

Conclusion
Pourquoi un chantillon ? La population cible est gnralement trop nombreuse et pour des raisons de cots, de dlais, il est pratiquement impossible d'tudier tous les individus d'une population c'est--dire d'eectuer un recensement. 385 Quelle taille d'chantillon ? En gnral, on utilise la formule n = 1+ 385 N pour trouver la taille ncessaire (pour que la marge d'erreur dans l'estimation de la proportion soit infrieur 5 % et ce, pour un seuil de conance de 95%). Objectif : Construire un chantillon tel que les observations pourront tre gnralises l'ensemble de la population (mthode probabiliste ou non-probabiliste). Condition : Il faut que l'chantillon prsente les mmes caractristiques que la population cible. En d'autres termes, qu'il soit reprsentatif. Si ce n'est pas le cas, l'chantillon est biais.

Statistiques, logiciels et enqute

Le choix de l'chantillon