Académique Documents
Professionnel Documents
Culture Documents
HADRYA
BIOSTATISTIQUE DE LA SANTE PUBLIQUE Adresse électronique :
fatinehadrya@yahoo.fr
Objectifs Présenter le contexte général de l'échantillonnage
pédagogiques Pouvoir calculer la taille d'échantillon
Echantillonnage : le procédé de sélectionner un sous-ensemble de la
population, pour être son représentant
D. Types de sondage
Réfléchir à la manière dont sera réalisé l'échantillonnage. Pour cela, il faut
connaître les différentes possibilités. 2 grandes familles de sondage :
la famille des sondages non probabilistes (ou non aléatoires)
la famille des sondages probabilistes (ou aléatoires)
La 1ère famille ne permet pas de réaliser des inférences (ICs et tests
statistiques) sur la population puisque dans la majorité des cas il n'est pas
possible d'étudier et de maîtriser le biais de sélection réalisé.
Un sondage aléatoire est défini par le fait que chaque individu a une
probabilité connue ( ≠ 0) d’être retenue lors du tirage au sort. Cette
sélection dépend que du hasard, qui régit l'inclusion ou non d'un
Sondages individu dans l'échantillon.
probabilistes
Procédure de sélection :
Etude de Prévalence des caries dentaires chez les 1200 élèves du niveau Iaire
d'une ville.
Procédure :
liste de tous les élèves de toutes les écoles
Inconvénients :
- Nécessite d'une base de sondage : difficile à avoir
Etude de Prévalence des caries dentaires chez les élèves d'une ville :
N = 1200 et n = 100
Procédure :
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
46 47 48 49 50 51 52 53 54 55
etc. …
Avantages :
19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
37 38 39 ....
3. Sondage stratifié
Certaines bases de sondage possèdent des informations annexes. Si on
souhaite tenir compte de ces informations, il faut décomposer la
population source en sous-populations (≈ en strates), puis tirer au sort un
échantillon de chaque strate.
Ex : la liste des infirmiers d'un établissement de santé comprend la variable
« sexe » de l’individu. Il est donc possible de construire l'échantillon en
sélectionnant aléatoirement des individus chez les hommes d’une part et chez
les femmes d’autre part.
Chaque strate est composée d'individus ayant au moins un point commun
(dans l’exemple : le sexe, « critère de stratification ») : la strate est plus
Ex : enquête sur ville, 3 secteurs homogène que ne l'est la population dans sa globalité.
(aisé, classe moyenne, meilleure représentation de la population.
populaire) puis tirage au sort
dans chacun. la stratification limite les fluctuations d'échantillonnage.
Avantages :
- Bonne représentativité des sous-groupes de la population
- L'estimation globale (sur la population) est plus précise car les
strates sont généralement plus homogènes
- En plus, on obtient une estimation pour chaque strate.
Inconvénients :
- Perte de précision s'il y a un petit nombre d'unités dans
chaque strate
- Besoin d'informations détaillées sur la population cible selon
les variables de stratification
- Besoin d'une base de sondage pour chaque strate
Que faire si ????
la population est très grande : difficulté de construire
construction élevé
(temps, budget, …)
4. Sondage en grappes
L’ensemble des unités secondaires contenues dans les unités primaires
sélectionnées sont intégrées à l’échantillon : les unités primaires sont des
« grappes » d’unités secondaires.
Ex : on souhaite sélectionner des infirmières exerçant dans des établissements
de santé. En réalisant un sondage en grappes, toutes les infirmières des
établissements sélectionnés seront incluses dans l'échantillon. Avantage : il est
moins difficile d'interroger toutes les infirmières de quelques établissements
que d'interroger quelques infirmières dans tous les établissements.
Avantages :
Inconvénients :
( Zα )² x ( p.q )
N=
d²
( Zα )² x ( p1q1 + p2q2 )
N1 = N2 =
d²
( Zα )² x S²
N=
d²
Zα = 1,96
S² = Variance de la variable, à calculer à partir d'un
échantillon pilote.
Si on n'a aucune idée on prend S = Etendue / 4 (parfois 6) ;
où l'Etendue = ( Valeur Maximale - Valeur Minimale).
d = Précision souhaitée de part et d’autre de la moyenne.
Echantillons pour comparer deux moyennes :
( Zα )² x ( S1² + S2² )
N1 = N2 =
d²
Zα = 1,96