Académique Documents
Professionnel Documents
Culture Documents
Conclusion
Le choix de l'chantillon
Statistiques, logiciels et enqute
Benot Le Maux
Le choix de l'chantillon
La taille de l'chantillon
Conclusion
Pourquoi un chantillon ?
Pourquoi un chantillon ? Pour des raisons de cots ou de dlais. L'objectif est alors de construire un chantillon tel que les observations pourront tre gnralises l'ensemble de la population. Deux mthodes pour constituer un chantillon. Mthode probabiliste : slection de l'chantillon par tirage alatoire dans la population-mre. Chaque individu statistique doit avoir exactement la mme chance que les autres de participer l'enqute. Mthode non-probabiliste : identier dans la population-mre, quelques critres de rpartition signicatifs puis d'essayer de respecter cette rpartition dans l'chantillon d'individus interrogs.
Le choix de l'chantillon
La taille de l'chantillon
Conclusion
La bonne question
1. Est-ce qu'un chantillon de taille 500 sut pour une population de 10 000 ? 2. Quelle est la taille de l'chantillon qui assure tel degr prcision ?
Il est impossible de rpondre par oui ou par non la premire question. Un chantillon doit fournir une estimation aussi prcise que possible d'une variable, et la prcision s'amliore indniment lorsque la taille de l'chantillon augmente.
Le choix de l'chantillon
La taille de l'chantillon
Conclusion
La notion de prcision
La notion de prcision (ou abilit d'chantillonnage) est matrialise par un seuil de conance et une marge d'erreur.
Dans le cas de l'estimation d'une proportion :
Un chantillon dni un seuil de conance de 95% et avec une marge d'erreur de e = 3% vous permettra d'extrapoler chaque rsultat issu de votre enqute, avec 5% de risques de vous tromper de + ou - 3%.
Le choix de l'chantillon
La taille de l'chantillon
Conclusion
Pour calculer la taille de l'chantillon dans le cas de l'estimation d'une proportion, vous pouvez appliquer la formule suivante :
n= z 2 p (1 p ) e2
o n est la taille de l'chantillon, t est une constante issue de la loi normale selon un certain seuil de conance (en gnral 95% et z =1,96), p : est le pourcentage de gens qui prsentent le caractre observ, e est la marge d'erreur d'chantillonnage choisie.
Le choix de l'chantillon
La taille de l'chantillon
Conclusion
Le choix de l'chantillon
La taille de l'chantillon
Conclusion
Le choix de l'chantillon
La taille de l'chantillon
Conclusion
La taille de la population-mre c'est un facteur seulement lorsqu'elle est en de de 100 000 ou peu prs. En de, il faut utiliser, pour dterminer la taille de l'chantillon, un lment appel facteur de correction :
Dans le cas d'une proportion : n = N
n + 1+ nN 1
n n 1+ N
Le choix de l'chantillon
La taille de l'chantillon
Conclusion
Le choix de l'chantillon
La taille de l'chantillon
Conclusion
Un faux problme En gnral, pour dterminer la taille d'un l'chantillon, une tude quantitative se base gnralement sur les chires obtenus dans le tableau ci-dessus. Un chantillon de 200-300 individus fournit donc de bon rsultats. On choisit ensuite un seuil de conance (en gnral 95%). La marge d'erreur, et par consquent l'intervalle de conance, sont ensuite dduits via la formule suivante : 1 Pour une proportion : e = z p(np) .
Le choix de l'chantillon
La taille de l'chantillon
Conclusion
Rsum
La prcision dpend de deux lments principaux : La taille n de l'chantillon : plus l'chantillon est grand plus l'estimation est prcise. Le seuil de conance : plus celui-ci sera grand, plus z grandira et plus l'intervalle de conance sera large.
1 2
Le choix de l'chantillon
La taille de l'chantillon
Conclusion
ou alatoires sont constitus par tirage au sort dans la population mre pour laquelle on dispose de la liste complte de toutes les units de sondage qui la composent (individus, familles, entreprises, etc.). On distingue 4 mthodes : Echantillonnage alatoire simple Echantillonnage alatoire systmatique Echantillonnage strati Echantillonnage en grappes et plusieurs degrs
Le choix de l'chantillon
La taille de l'chantillon
Conclusion
Inconvnients :
Le choix de l'chantillon
La taille de l'chantillon
Conclusion
Echantillonnage systmatique
Principe Il existe un cart, ou un intervalle, entre chaque unit slectionne qui est incluse dans l'chantillon. Mode d'administration Numroter de 1 N les units incluses dans votre base de sondage (o N est la taille de la population totale). Dterminer l'intervalle d'chantillonnage ou pas de sondage (K) en divisant la population N par la taille de l'chantillon que vous dsirez obtenir. Slectionner au hasard un nombre entre 1 et K. Ce nombre s'appelle l'origine choisie au hasard. Slectionner chaque Kme unit aprs ce premier nombre.
1 2 3 4
La probabilit d'tre slectionne = celle d'un EAS. Inconvnients : Le cot, problme si la population est ordonne.
Avantages :
Statistiques, logiciels et enqute Le choix de l'chantillon
La taille de l'chantillon
Conclusion
Echantillonnage strati
Principe Dcouper la population en sous ensembles appels strates et raliser un sondage dans chacune d'elles. Mode d'administration On divise la population en groupes homognes (appels strates), qui sont mutuellement exclusifs (selon l'ge, le sexe, la province de rsidence, le revenu, etc.) On slectionne partir de chaque strate des chantillons indpendants. On peut utiliser n'importe quelle des mthodes d'chantillonnage La mthode d'chantillonnage peut varier d'une strate une autre.
1 2 3
La probabilit d'tre slectionne = celle d'un EAS. Echantillon plus reprsentatif. Inconvnients : Le cot.
Avantages :
Statistiques, logiciels et enqute Le choix de l'chantillon
La taille de l'chantillon
Conclusion
rduire les cots Inconvnients : Eet de grappe (variance intra qui est faible) d l'existence de similarite entre individus d'une mme grappe.
Avantages :
Statistiques, logiciels et enqute Le choix de l'chantillon
La taille de l'chantillon
Conclusion
La mthode d'chantillonnage non-probabiliste est utilise lorsqu'il n'est pas possible de constituer une liste exhaustive de toutes les units du sondage. Dans le cas de l'chantillonnage probabiliste, chaque unit a une chance d'tre slectionne. Ce n'est plus vrai dans le cas de l'chantillonnage probabiliste. On se xe alors comme rgle que l'chantillon retenu doit avoir la mme composition que la population mre par rapport une ou plusieurs caractristiques.
Le choix de l'chantillon
La taille de l'chantillon
Conclusion
La taille de l'chantillon
Conclusion
On impose l'enquteur : Un point de dpart dans une commune. Un itinraire suivre avec tirage systmatique des logements dans lesquels eectuer les interviews Objectif: reproduire un certain tirage alatoire des enquts, sans donner explicitement des noms et adresses l'enquteur.
Le choix de l'chantillon
La taille de l'chantillon
Conclusion
L'chantillon tudi est dnie par un lieu. Cette mthode est utilis dans l'chantillonnage de populations mobiles, rares ou spciques. Avec cette mthode, il faut faire attention : ne pas sur-reprsenter les individus passant + de temps sur place les priodes d'enqute les pondrations a posteriori pour tenir compte de la probabilit de prsence
Statistiques, logiciels et enqute Le choix de l'chantillon
La taille de l'chantillon
Conclusion
Conclusion
Pourquoi un chantillon ? La population cible est gnralement trop nombreuse et pour des raisons de cots, de dlais, il est pratiquement impossible d'tudier tous les individus d'une population c'est--dire d'eectuer un recensement. 385 Quelle taille d'chantillon ? En gnral, on utilise la formule n = 1+ 385 N pour trouver la taille ncessaire (pour que la marge d'erreur dans l'estimation de la proportion soit infrieur 5 % et ce, pour un seuil de conance de 95%). Objectif : Construire un chantillon tel que les observations pourront tre gnralises l'ensemble de la population (mthode probabiliste ou non-probabiliste). Condition : Il faut que l'chantillon prsente les mmes caractristiques que la population cible. En d'autres termes, qu'il soit reprsentatif. Si ce n'est pas le cas, l'chantillon est biais.
Le choix de l'chantillon