Vous êtes sur la page 1sur 22

I n t r o d u c t i o n

chantillonnage
L
Lchantillonnage

l a

r e c h e r c h e

Les objectifs pdagogiques


Reconnatre des erreurs dchantillonnage
Connatre les qualits dun chantillon acceptable
Distinguer un chantillon dun recensement et
reconnatre leurs forces et leurs faiblesses respectives
Connatre les tapes de lchantillonnage
Connatre les principales mthodes dchantillonnage
probabiliste et non probabiliste
Reconnatre les erreurs dchantillonnage
Savoir dterminer la taille dun chantillon

Le sommaire
1. Un chantillon biais
2. Un chantillonnage illustr
3. Quelques dfinitions
4. Lchantillon par rapport au recensement
5. Les avantages de lchantillon.
6. Les principes fondamentaux de la thorie de lchantillonnage
7. Les tapes de lchantillonnage
8. Les mthodes dchantillonnage probabiliste
9. Les mthodes dchantillonnage non probabiliste
10. Les erreurs dchantillonnage
11. La taille de lchantillon
12. Je fais mes exercices
Page 1 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

1. Un chantillon biais
La conception quon se fait dun chantillon varie dun individu lautre.
Chaque conception sappuie sur un principe qui la rend juste ou errone. Avant
de dterminer ce qui confre un caractre scientifique un chantillon, voyons
pourquoi certaines conceptions peuvent tre fausses ou comporter des risques
levs derreurs.
Quelques situations bien concrtes sont prsentes de manire faire ressortir avec plus
dclat les erreurs majeures dchantillonnage.
Votre comit souhaite recueillir la signature des citoyens
afin dappuyer le projet de construction dun centre
communautaire. Vous recueillez les signatures
lentre de la quincaillerie de votre rgion.
Lerreur majeure rside dans la slection des personnes.
Les signataires seront en majorit des propritaires fonciers
dge mr et, probablement, de sexe masculin. Tous les
citoyens ne frquentent pas la quincaillerie galement.

X
!

X
!
X
!
X

Vous menez une enqute tlphonique sur les habitudes


alimentaires des familles. Vous logez vos appels en
matine le plus souvent, puisque cest la seule priode de
la journe o vous tes disponible.
Une fois de plus le choix des rpondants est biais. Les
personnes qui travaillent lextrieur du foyer seront
systmatiquement limines de votre enqute. Votre
chantillon sera compos de rpondants plutt homognes.
Vous tes charg par votre conseil municipal dobtenir
lopinion gnrale de la population sur la cueillette des
ordures mnagres. Vous expdiez un questionnaire
cet effet par la poste.
Les rpondants seront plutt ceux qui sont fortement
insatisfaits du service actuel. Un chantillonnage volontaire
peut inciter les personnes vivement intresses au sujet de
lenqute rpondre en plus grand nombre.
Vous avez conu de nouveaux exercices pour votre cours
de franais. Vous dcidez den faire lessai auprs de
quelques lves de votre classe. Vous choisissez des lves
qui ont un rendement moyen.
Les lves moyens reprsentent le groupe des lves
moyens et non lensemble
des lves de la classe. Cest un chantillon
slectif : il nest pas reprsentatif.

Page 2 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

Il ressort de ces exemples que lerreur majeure quon commet en voulant tirer un
chantillon de la population consiste attribuer aux individus ou aux units
dchantillonnage des probabilits diffrentes dtre choisis.
Autrement dit, pour quun chantillon soit reprsentatif, il faut que
lchantillon respecte les proportions entre les caractristiques constates et
mesures dans la population.

2. Un chantillonnage illustr
Dans le tableau suivant, une population a t dfinie en utilisant des icnes
comme units dchantillonnage, au lieu dindividus, de rgions, de groupes
professionnels, de classes, et ainsi de suite.
Un premier chantillon a t form en choisissant la moiti des icnes de
chacune des catgories. Cest ainsi que les proportions entre les catgories
dicnes dans lchantillon 1 sont les mmes que dans la population.
Cependant, pour lchantillon 2, ces proportions sont loin dtre respectes. On
observe que les carts entre la population et lchantillon 2 varient de 11,11 %
33,33 %. Inutile dinsister sur le fait que les proportions entre les catgories
dicnes de lchantillon 2 diffrent fortement de celles observes dans la
population.
Population

%
chantillon 1
12,50
18,75
6,25
37,50
25,00

%
12,50
18,75
6,25
37,50
25,00

chantillon 2

%
22,22
22,22
11,11
33,33
11,11

Faisons un calcul lmentaire en nous rfrant au tableau ci-dessus. Nous savons


quil y a cinq diffrentes catgories dunits dchantillonnage dans la
population. Chacune possde ses caractristiques propres. Les voici :

Sachant que cette population est constitue de 32 icnes, chacun deux a une
probabilit de 1/32, une proportion de 0,0315 ou un pourcentage de 3,125 % de
faire partie de lchantillon. Ce calcul est exact si lchantillon est choisi selon la
Page 3 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

technique dchantillonnage alatoire simple. Il existe dautres techniques


dchantillonnage que nous expliquerons plus loin.
De plus, vous constatez quil existe cinq familles dicnes dans cette population
et que chacune est prsente en nombres diffrents. La famille dicnes suivante,
, reprsente 18,75 % de la population. La probabilit quune unit de cette
famille fasse partie de lchantillon est donc de 18,75 %. En dautres termes, en
pigeant au hasard 100 icnes dans cette population, vous aurez, de ce nombre,
environ 19 icnes dans votre chantillon (en supposant, bien entendu, que la
population dicnes soit compose dau moins 100 icnes).

?
R

Quelle est la principale qualit dune unit


dchantillonnage ?
Le plus petit lment dune population (p. ex. un individu)
ne peut possder quune seule probabilit
dtre choisi dans lchantillon.

Revenons une population dtres humains. Lorsque nous parlons des


caractristiques de la population, nous faisons allusion la scolarit, ltat
civil, au sexe, la langue maternelle et de nombreux aspects de ce genre. La
population dicnes de notre tableau possde, elle aussi, quelques
caractristiques qui distinguent les icnes entre eux : leur forme, leur couleur, et
leur taille notamment. La notion de caractristiques de la population est cruciale
dans le domaine de lchantillonnage. Si vous jugez quil est important que la
proportion de femmes dans lchantillon soit respecte, il vous faudra connatre
cette proportion dans la population. Si la population est compose de 51 % de
femmes, votre chantillon devra tre compos, lui aussi, de 51 % de femmes.
La vrification
de la reprsentativit dun chantillon
ne peut se faire que
si on connat bien la population.
Une bonne faon de mettre fin cette section-ci consiste vous inviter
rflchir sur lnonc suivant :

Un chantillon est reprsentatif


sil respecte les proportions
entre les caractristiques
de la population.
Page 4 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

3. Quelques dfinitions
Avant daborder dautres aspects de lchantillonnage, il conviendrait de dfinir
certains termes associs la science de lchantillonnage.
Terme
Unit
dchantillonnage
chantillon

Population cible

Dfinition

Exemple

lment choisi de la population


pour faire partie
de lchantillon.
Regroupement dlments dune
population choisis selon une
mthode dfinie.
Partie de la population totale
pour laquelle
nous voulons gnraliser
les rsultats de lchantillon.

Un lve, un lecteur, une


tudiante, un citoyen, une
ferme, un commerce
Les infirmires de la rgion, les
lves du secondaire, les
habitants du quartier
Les enseignants, les
infirmires, les adolescentes,
les propritaires de lots boiss
privs, les accidents
du travail
Les tres humains, les fermes
du pays, les lves du primaire,
les citadins
Enqute mene auprs de tous
les habitants
La loterie

La totalit des individus ou des


choses partageant certaines
caractristiques.
Dnombrement
Recensement
des habitants dun pays.
Qui tient du hasard.
Alatoire
La procdure servant dfinir la
population cible, la mthode
Schme ou plan
dchantillonnage denqute, le choix de lchantillon,
et les caractristiques des units.

Population
gnrale

4. Lchantillon par rapport au recensement


Pour diminuer le risque derreurs dchantillonnage, vous navez qu inclure
toute la population dans votre enqute. Les erreurs de toutes sortes seront
rduites zro, ou presque.
Lerreur dchantillonnage, cest lcart entre les paramtres de la population
cible et les valeurs estimes de lchantillon. Les erreurs dchantillonnage
diminuent mesure que lchantillon augmente. Elles atteignent la valeur zro
lorsque lchantillon se substitue la population : lchantillon comprend la
population cible au complet. Comme le montre le graphique suivant, la
diminution des erreurs est inversement proportionnelle la racine carre de la
taille de lchantillon.

Page 5 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

En augmentant
le nombre dindividus
dans un chantillon,
on diminue ainsi
lerreur dchantillonnage.
Vous constatez en mme temps quil est utopique de penser que pour la moindre
exprience ou enqute il faut faire appel toute la population. Il nest donc pas
ncessaire de tenir un recensement pour toute enqute. Un chantillon suffit
amplement, car il prsente des avantages intressants et souvent insouponns.

5. Les avantages de lchantillon


Premier avantage
Par rapport au recensement, lchantillon permet de rduire les cots bien
des gards. Un recensement mobilise tellement de ressources humaines et
matrielles que seul un pays peut se le permettre intervalles rguliers.
Deuxime avantage
Lchantillon permet de mieux suivre les units chantillonnes. Si votre
enqute consiste rejoindre 250 personnes par tlphone, vous pourrez
aisment excuter des rappels tlphoniques pour les personnes absentes
lors de votre premier appel.
Troisime avantage
Puisque votre chantillon est restreint, vous pourrez poser un plus grand
nombre de questions aux personnes interroges.
Ainsi, votre recherche gagnera en qualit.
Quatrime avantage
La quantit de donnes que vous obtiendrez auprs de votre chantillon pourra
tre manipule aisment laide de la technologie informatique courante.
Aussi, les analyses statistiques seront excutes avec plus de rapidit.
Cinquime avantage
Si votre chantillon a t tir selon les rgles de lart, il comportera moins
derreurs dchantillonnage que le recensement. Ny a-t-il pas l contradiction
avec le texte prcdent ? Lchantillon ne peut tre plus exact que le
recensement, en thorie. Mais, en pratique, les experts soutiennent quil est
impossible de rejoindre toute la population dans un court lapse de temps pour
linterroger fond. Par contre, si lchantillon est restreint,
bien peu dindividus choisis chapperont lenqute.
Page 6 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

6. Les principes fondamentaux de la thorie de lchantillonnage


Singh et Chaudhary (1986)
soutiennent que
la thorie de lchantillonnage
sappuie sur les trois principes fondamentaux suivants :
1. Le principe de validit
Selon ce principe, lchantillonnage doit permettre dobtenir une estimation
valide des paramtres de la population. Lestimation des paramtres sera
valide pour autant que soit connue au pralable la probabilit de chaque individu
de faire partie de lchantillon. Un paramtre est une caractristique mesure de
la population, p.ex. la langue parle au foyer, ltat civil, la scolarit, et ainsi de
suite.
2. Le principe de constance statistique
La ncessit et limportance de choisir un individu comme membre de
lchantillon doivent dcouler de la thorie des probabilits, et non dautres
considrations. Ainsi, on prtend quun groupe assez nombreux dindividus
choisis au hasard comportera les mmes caractristiques que celles de la
population do il origine.
3. Le principe doptimisation
Loptimisation des rsultats consiste obtenir le maximum defficacit avec le
minimum de ressources et de dpenses. Sans jamais perdre de vue la rduction
des erreurs dchantillonnage, il faut rduire les cots et viter les dpenses
inutiles dnergie pour former un chantillon reprsentatif.
Ces principes nont de valeur que si tout est mis en uvre pour quils soient
respects. Ils sont bien plus que des vux pieux. La technique dchantillonnage
que vous utilisez doit respecter la loi des probabilits cote que cote si vous
voulez tre capables de gnraliser les rsultats obtenus auprs de votre
chantillon la population gnrale. Sinon, votre recherche ou votre enqute
aura servi dcrire un groupe quelconque de personnes et non un chantillon.

Lequel de lchantillon ou du recensement


cote le plus cher ?

Page 7 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

Le cot total dun recensement est plus lev que celui dun
chantillon. Par contre, le cot par unit est moins lev
pour un recensement que pour un chantillon.

7. Les tapes de lchantillonnage


Former un chantillon nest pas une tche simple. Elle nest pas prendre la
lgre. Il vaut mieux suivre une dmarche systmatique car il y a des tches
excuter auxquelles on ne peut se soustraire. Par consquent, puisque ces tches
doivent tre effectues, aussi bien les accomplir avec soin.
Plusieurs auteurs consults proposent une dmarche plus labore que la
suivante. Nous avons rduit cette dmarche aux tapes les plus essentielles. Il
nest pas ncessaire dutiliser un bulldozer pour remuer la terre de votre potager.
1. noncer les objectifs
Le but de lchantillon doit faire tat de la raison sociale de lchantillon, des
ressources matrielles et financires qui y seront affectes et des limites qui
seront imposes.
2. Dfinir la population
Les caractristiques qui reprsentent un intrt vital doivent tre dcrites (p. ex.
lge des individus, le sexe, leur tat civil, leur niveau de scolarit, leur lieu de
rsidence, leur statut socioconomique, et bien dautres encore). De toute
vidence, plus vous souhaitez que lchantillon possde des caractristiques
similaires la population cible, plus vous devrez augmenter la taille de votre
chantillon afin de diminuer les diffrences entre les deux.
3. Dterminer les units dchantillonnage
Cette fonction est cruciale et dterminante parce quelle permet de dfinir,
disoler et de choisir chaque membre de lchantillon selon une probabilit
prtablie. Cest loprationnalisation de lchantillon.
4. Choisir un schme dchantillonnage
Comme plusieurs schmes dchantillonnage peuvent tre adopts, il suffit
de les comparer entre eux afin de dterminer celui qui respecte de plus prs
le principe doptimisation.
5. Appliquer le schme dchantillonnage
Il ne suffit pas de planifier avec prcision, il faut aussi excuter avec
justesse. La valeur du schme dchantillonnage tient autant son application
Page 8 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

qu sa conception. Les personnes charges de faire la collecte des donnes,


par exemple, devront excuter les tches requises selon une procdure
systmatique et uniforme. Sil a t dcid dinterroger les individus au
moyen dun questionnaire crit, elles ne peuvent en interroger quelques-uns
dentre eux par des entrevues tlphoniques.

8. Des mthodes dchantillonnage probabiliste


Une fois que vos objectifs dchantillonnage ont t claircis et que votre
population a t dfinie, il ne reste plus qu choisir les units dchantillonnage.
Votre objectif consiste interroger les directrices et les directeurs
dcole de votre province. Ils sont au nombre de 147.
Vous dcidez de former votre chantillon
partir de 25 % de cette population,
soit en choisissant 37 dentre eux.
Vous obtenez du ministre de lducation
la liste complte des 147 individus.
Quelle mthode dchantillonnage allez-vous utiliser pour former un
chantillon de 37 dentre eux ?

Vous utiliserez lun des deux types de mthodes dchantillonnage suivants :

Lchantillonnage probabiliste
Quant ce type dchantillonnage, on accorde une probabilit
quelconque chaque unit de faire partie de lchantillon.

Lchantillonnage non probabiliste

Devant limpossibilit dassigner chaque individu une probabilit dtre


choisi pour faire partie dun chantillon, il arrive quon doive
faire une slection au mieux de notre connaissance.
En gnral, aprs un examen de la population cible, la dcision est prise de
faire appel un groupement dindividus considrs comme typiques de cette
population. Cette slection dcoule dun jugement et
comporte des risques derreurs imminents.
Lutilit des rsultats de la recherche auprs dun chantillon probabiliste
dpendra de la similitude entre lchantillon et la population vise.

Page 9 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

Vous considrez que choisir les directrices et les directeurs


dcole au hasard vous amnerait voyager sur de trop longues
distances.
Vous dcidez plutt dutiliser une technique dchantillonnage
non probabiliste. Pour ce faire, votre population cible deviendra
les directions dcole habitant la partie nord de la province, l
o vous demeurez. Vous tablirez la liste de ces individus
partir de laquelle vous en choisirez, au hasard, 37.
Selon vous, les directions dcole du nord sont, toutes fins utiles,
semblables celles du sud de la province.

Le tableau suivant vous aidera faire la distinction entre une mthode


probabiliste et une mthode non probabiliste dchantillonnage. Pour chacune de
ces deux catgories nous numrons les techniques les plus courantes.
Mthode dchantillonnage probabiliste
Lchantillonnage alatoire simple
Lchantillonnage systmatique
Lchantillonnage stratifi
Lchantillonnage par grappes

Mthode dchantillonnage non probabiliste


Lchantillonnage laveuglette
Lchantillonnage de volontaires
Lchantillonnage au jug
Lchantillonnage par la mthode des quotas

Pour des informations compltes sur chacune de ces techniques, et sur dautres
techniques, nous vous conseillons la rfrence suivante : A. Satin et W. Shastry
(1993). Lchantillonnage : un guide non mathmatique. Statistique Canada,
ministre de lIndustrie, des Sciences et de la Technologie. La bibliographie
contient quelques autres rfrences tout aussi utiles. Comme certaines
techniques sont plus utilises que dautres, nous les expliquerons plus en dtail.
Pour les autres, nous nous contenterons de les dfinir.
8.1 Lchantillonnage alatoire simple
Description : Chaque unit de la population a la mme chance dtre choisie
dans lchantillon.
Exemple : Vous souhaitez interroger les propritaires de petites et de moyennes
entreprises de votre rgion. Vous en dressez une liste complte. Par une pige au
hasard, vous en choisissez 20 % dentre eux qui vous expdiez un
questionnaire crit portant sur les exportations.

Page 10 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

Supposons quil y ait 10 entreprises de taille moyenne ( ) et 20 petites


entreprises ( ) dans votre rgion. Afin de respecter vos objectifs
dchantillonnage, votre chantillon alatoire devrait tre constitu de deux
entreprises moyennes et de quatre petites entreprises. Dans le tableau qui suit,
les entreprises choisies sont reprsentes par les cases colores .

8.2 Lchantillonnage systmatique


Lchantillonnage alatoire simple est la technique prfre entre toutes, mais il
est fastidieux appliquer lorsque la population est nombreuse. On lui prfre
souvent lchantillonnage systmatique.
Description : Les units sont choisies dans une liste selon une squence
dtermine au pralable. Dabord, vous tablissez une liste exhaustive des
units. Ensuite, vous entamez la slection avec, comme point de dpart, une
unit choisie au hasard. Enfin, vous avancez dans la liste en slectionnant lunit
situe une distance fixe de la dernire unit choisie.
Exemple : Comme lannuaire tlphonique contient la quasi-totalit des
individus de votre rgion, vous en faites votre liste de base. Comme 25 013
noms figurent dans lannuaire et que votre chantillon sera compos de 1 250
individus, vous devrez choisir un nom dans chaque bloc de 20 individus. Le
hasard veut que vous commenciez au septime abonn tlphonique. Votre
deuxime unit sera le 27e abonn, la troisime unit sera le 47e, et ainsi de
suite.
1 2 3 4 5 6 7 8 9 10
26 27 28 29 30 31 32 33 34 35
51 52 53 54 55 56 57 58 59 60
76 77 78 79 80 81 82 83 84 85

11
36
61
86

12
37
62
87

13
38
63
88

14
39
64
89

15
40
65
90

16
41
66
91

17
42
67
92

18
43
68
93

19
44
69
94

20
45
70
95

21
46
71
96

22
47
72
97

23
48
73
98

24 25
49 50
74 75
99 100

8.3 Lchantillonnage stratifi

Page 11 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

Lchantillonnage alatoire simple ne requiert aucune connaissance des


caractristiques de la population. Au contraire, lchantillonnage stratifi
consiste regrouper les individus en sous-groupes appels strates selon une ou
plusieurs caractristiques.
Description : La population est subdivise en groupements homognes selon
une ou plusieurs caractristiques. Ensuite, un chantillon alatoire est tir de
chaque groupement ou strate. Cette technique permet dobtenir des groupements
plus homognes quant une caractristiques, rduisant ainsi la variance due
des cas extrmes. Elle permet surtout de sassurer de la reprsentativit de
chacun des groupements.
Exemple : La population cible de votre enqute est le personnel scolaire. Vous
souhaitez interroger les catgories suivantes demploys : administrateurs (A),
directeurs dcole (D), enseignants (E), conducteurs dautobus (C) et prposs
lentretien mnager (P). En tablissant ces catgories vous voulez vous assurer
dobtenir des donnes suffisantes pour chacune delles sans tre oblig
daugmenter fortement le nombre dindividus dans lchantillon. Un chantillon
alatoire pourrait comprendre un nombre respectable denseignants, mais le
nombre absolu de prposs lentretien mnager ne permettrait pas des analyses
statistiques valides.
Cette technique dchantillonnage permet, si vous le dsirez, dimposer
chaque strate une sorte de quota : vous pouvez dcider de choisir, pour une
strate particulire, 20 % des individus au lieu de 10 % comme dans une autre
strate. Dans lexemple qui suit, les enseignants sont proportionnellement plus
nombreux que les employs des autres catgories. Vous parviendrez peut-tre
un degr de prcision acceptable en choisissant 3 % des enseignants (E).
Comme les prposs lentretien mnager (P) sont peu nombreux, pour parvenir
au mme niveau de prcision vous serez peut-tre oblig de choisir 15 % dentre
eux.
Population

Strates

chantillon

C
PP E
E A
D C C DE E
EC
P
D A C C E E A
E E ECE D P
AC
EDE
EE C D DE

AAAA
DDDDDD
EEEEEEEEEEEEEEEE
CCCCCCCCC
PPPP

A
DD
EEEE
CC
A

8.4 Lchantillonnage par grappes


Page 12 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

Description : Lorsque des units de la population sont regroups selon une


hirarchie quelconque, cest de lchantillonnage par grappes. Ce type
dchantillonnage permet didentifier et de choisir des regroupements
homognes dindividus.
Exemple : Les lves appartiennent une classe. Les classes sont regroupes
par niveau. Plusieurs niveaux constituent une cole. Plusieurs coles font partie
du district scolaire. Une grappe, ce peut tre une classe, un niveau, une cole.
Lchantillonnage par grappes offre lavantage davoir accs peu de frais un
grand nombre dunits. Le choix des units dchantillonnage ne se fait pas
partir des units, mais en fonction dune catgorie dunits. Au lieu dune
liste exhaustive dlves du primaire de votre rgion, vous choisissez quelques
classes au hasard. cause de lhomognit des lves dune rgion,
lchantillonnage par grappes est tout aussi efficace que lchantillonnage
alatoire simple.
chantillonnage par grappes
cole
XYZ
Niveaux
1
2
Classes
A
B
D
E
lves
Dans le tableau prcdent, les icnes reprsentent les lves. Les classes sont
assez semblables entre elles, si bien que vous pourriez choisir une classe au
hasard. Un niveau complet pourrait tout aussi bien servir de grappes. En
choisissant un niveau, toutes les classes appartenant ce niveau feront alors
partie de lchantillon.
9. Les mthodes dchantillonnage non probabiliste
9.1 Lchantillonnage laveuglette
Les mthodes dchantillonnage non probabiliste, bien que moins coteuses et
plus pratiques, sont moins exactes. Bien des experts dans le domaine
recommandent de sen loigner. Ces mthodes supposent que les
caractristiques de la population sont distribues de manire alatoire. Cest
peut-tre vrai dans certains cas, mais pas dans tous les cas.
Le biologiste qui prend un chantillon deau dans un lac exerce
lchantillonnage laveuglette. Il prtend que les produits chimiques sont
Page 13 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

rpandus galement partout dans le lac. Il en est de mme pour lpicier qui
gote une seule pomme au comptoir de fruits.
9.2 Lchantillonnage de volontaires
Certaines recherches ne pourraient sexcuter autrement quen faisant appel
des volontaires. Les compagnies pharmaceutiques font appel des volontaires
quils paient aussi afin de vrifier les effets de leurs nouveaux produits.
Un groupe de volontaires risque dtre plus homogne quun groupe tir au
hasard dans la population, offrant ainsi moins de variabilit quon le souhaite.

9.3 Lchantillonnage au jug


Cette mthode est plus souvent utilise quon le croit. Pour des raisons
pratiques, les chercheurs dcident de tenir un sondage auprs de la population
scolaire dun seul district. Ils qualifient ce district de typique, en ce sens quil
possde les caractristiques de la majorit des autres.
Une conseil municipal choisit de tenir son enqute socioconomique dans un
seul quartier de la ville, prtextant que ce quartier choisi ressemble la majorit
des autres. En considrant le rapport cots/bnfices, il ny a pas davantages
tendre leur enqute un deuxime quartier.
9.4 Lchantillonnage par la mthode des quotas
La mthode des quotas est populaire dans les tudes de marketing, entre autres.
La slection des units est faite de manire respecter dans lchantillon les
proportions associes chacune des caractristiques observes dans la
population. Les enquteurs vont sassurer, par exemple, que chaque groupe
dge est bien reprsent, cest--dire dans les mmes proportions que dans la
population. Au contraire de lchantillon alatoire qui ne permet pas de prdire
qui fera partie de lchantillon, la mthode par quotas fait un choix

judicieux des individus selon quils possdent une ou plusieurs


caractristiques recherches.
10. Les erreurs dchantillonnage
Page 14 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

Pour nimporte quel chantillonnage, des erreurs surviennent. Elles sont


invitables. Par contre, elles peuvent tre rduites de plusieurs manires, surtout
en augmentant la taille de lchantillon. Plus on se rapproche de la population,
plus les erreurs dchantillonnage diminuent.
Il existe deux catgories derreurs : les erreurs systmatiques dues
lchantillonnage et les erreurs dues au hasard, dautres facteurs que
lchantillonnage. Voyons dabord en quoi consistent les erreurs systmatiques
dchantillonnage.

Description de lerreur no 1
Accorder une plus grande chance certaines units
dtre choisies dans lchantillon

Exemple
Votre technique dchantillonnage consiste frapper aux portes dune section de votre ville
durant le jour. Nous savons, par ailleurs, que certains quartiers des villes sont habits par des
segments de population plutt homognes. Les personnes ges tendent demeurer dans un
secteur particulier, tandis que les jeunes familles se trouvent en plus grand nombre dans un
autre quartier. Les personnes ges ont plus de chance dtre prsentes leur foyer le jour que
les jeunes couples qui occupent des emplois.

Description de lerreur no 2
Un chantillon en apparence tir au hasard

Exemple
Les sujets de votre enqute ont t slectionns en choisissant un abonn tlphonique
chaque cent abonns. Comme cest le nom du pre qui figure le plus souvent dans lannuaire
tlphonique, vous risquez de vous retrouver avec un chantillon disproportionn quant au
sexe : votre chantillon souffrira dune sur-reprsentation des hommes.
De plus, les noms de tous les citoyens ne figurent pas tous dans lannuaire tlphonique.

Description de lerreur no 3
Substituer une unit pour une autre

Exemple
Selon votre plan dchantillonnage, vous devez interroger une femme habitant au 1248, rue
Principale. Comme elle nest pas prsente lors de votre passage, et afin dviter de retourner
cette adresse, vous allez frapper la porte de sa voisine. Votre critre de slection devient
alors la proximit gographique et non plus les lois du hasard.

Description de lerreur no 4
La nature intrinsque de votre technique dchantillonnage favorise
certaines units plus que dautres

Exemple
Page 15 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

Vous expdiez par la poste un questionnaire qui porte sur la venue dune maison de jeu dans
la rgion. Les personnes qui sadonnent dj aux jeux de hasard vont certainement rpondre
en plus grand nombre. Il se peut aussi que les personnes farouchement opposes ces jeux
fassent des dmarches systmatiques pour inciter les autres opposants rpondre au
questionnaire. Dans tous ces cas, chaque unit na pas la mme probabilit dtre choisie dans
lchantillon. Ce biais dchantillonnage survient surtout dans les situations o la volont de
chaque unit entre en jeu : une personne peut choisir de participer lenqute,
ou de ne pas y participer.

Il y a erreur dchantillonnage lorsque les valeurs de lchantillon scartent de


celles de la population. Pour un chantillonnage probabiliste, il est possible de
mesurer ce degr derreur. Les erreurs dchantillonnage ninvalident pas
lchantillon. Du moins, lorsque nous pouvons calculer le degr derreur, nous
pouvons affirmer que les valeurs de lchantillon se situent lintrieur dune
zone de valeurs probables. Cest ainsi quon parle des marges derreur.
Admettons que la moyenne de votre chantillon soit de 73 une variable
quelconque. La science de lchantillonnage vous indiquera que, en fait, la vraie
moyenne se situe entre 70 et 76 dans 95 % des cas. On peut le dire autrement :
pour 19 chantillons sur 20, la moyenne sera situe parmi les valeurs comprises
entre 70 et 76.
Linconvnient dun chantillonnage non probabiliste, cest limpossibilit de
calculer ce degr de prcision. Pour de la recherche srieuse, il faut viter
lchantillonnage non probabiliste.

11. La taille de lchantillon


La sempiternelle question de la taille de lchantillon finit toujours par surgir.
Combien dunits dchantillonnage sont ncessaires pour que lchantillon soit
reprsentatif ? Une rponse facile donner, mais vague en mme temps,
snonce comme suit : plus grand sera lchantillon, plus prcise sera

la gnralisation des rsultats !


En fait, ce nest pas une rponse pratique, mais plutt un principe directeur
suivre dans la plupart des cas. La dtermination de la taille de lchantillon se
fait en tenant compte de plusieurs facteurs ; les cots, la prcision dsire dans
les estimations, les ressources humaines et matrielles disponibles, le temps dont
le chercheur dispose et laccessibilit aux units dchantillonnage.

Page 16 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

Encore l,
ce nest pas trs clair
ce quil faut faire.
La raison de cette confusion,
cest quil ny a pas
quune seule et unique rponse
cette question.

11.1 Le degr de prcision


Malgr tout, le principal facteur qui sert dterminer la taille dun chantillon
est la prcision souhaite dans lestimation des valeurs statistiques de
lchantillon. Ces valeurs de lchantillon doivent se rapprocher le plus possible
de celles que nous connaissons de la population.
Il est crucial de savoir quen augmentant progressivement la taille de
lchantillon la prcision des estimations naugmente pas de faon
proportionnelle. Il existe des tables conues pour nous indiquer la taille de
lchantillon pour chaque degr de prcision que nous souhaitons. Ces tables
sont de plus en plus remplaces par des logiciels conviviaux.
Par exemple, pour une population de 100 000 units, un niveau de prcision de
0,05, la taille requise de lchantillon est de 383. Par ailleurs, si votre population
est de 20 000 units, votre chantillon, lui, diminuera 377. Si votre population
est de 200 units, il vous faudra tout de mme choisir 132 units
dchantillonnage. Assez tonnant, nest-ce pas ? Et cest peu dire ! Le tableau
suivant vous aidera comparer ces valeurs.
Population
200
20 000
100 000

chantillon
132
377
383

Rapport
132/200=0,660
377/20 000=0,019
383/100 000=0,004

Si vous dsirez augmenter le degr de prcision des estimations de 0,05 0,01,


pour une population de 100 000, votre chantillon devra passer de 383 8 762
units. Votre chantillon devra tre plus de 22 fois plus grand pour ajouter
4 points de prcision. Lvidence mme saute aux yeux ! Il faut donc parfois
sacrifier de la prcision pour que la recherche se ralise.
Degr de prcision
Page 17 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

Population
chantillon

0,05
100 000
383

0,01
100 000
8 762

11.2 La variabilit des caractristiques dans la population


La qualit principale dun chantillon rside dans sa reprsentativit, sa
similitude avec la population mre do il tire son origine. Plus lchantillon est
grand plus la reprsentativit augmente. Par ailleurs, plus il y a de variabilit
dans la population par rapport aux caractristiques cibles, plus grand devra
tre lchantillon de sorte que toutes les caractristiques soient bien
reprsentes.
Le pomiculteur, lautomne, ne gote pas une pomme de
chacun de ses pommiers. Quelques-unes cueillies a et l
suffisent amplement, car la variabilit entre le degr de
mrissement des pommes est rduite.
Par contre, lorsquil sagit de mesurer lintelligence des enfants
de 12 ans, il faudra un chantillon assez nombreux pour que
tous les niveaux dintelligence soient bien reprsents.
11.3 Les ressources humaines, financires et matrielles disponibles
Les contraintes en recherche sont nombreuses et bien relles. Le problme
original doit souvent tre dgrossi de manire rendre la recherche faisable.
Pour excuter bien des analyses statistiques, on doit sassurer dun nombre
minimum dindividus dans lchantillon. Dans plusieurs de ces cas, il faut
calculer 10 individus pour chacune des variables qui fait partie dune analyse. Il
nest pas rare quon doive sabstenir de faire certaines analyses parce que la
taille de lchantillon ne le permet pas.
Chaque variable que vous ajoutez un questionnaire a un prix. Elle occasionne
des dpenses supplmentaires de toutes sortes et souvent insouponnes. Une
recherche qui se limite des variables essentielles a plus de chances de se
faufiler entre toutes sortes de difficults lies aux ressources humaines et
financires. Il nest pas tonnant que votre cadre conceptuel doive tre tricot
serr si vous voulez que votre recherche soit complte.
11.4 Quelques rgles gnrales
Quand il sagit de dterminer la taille dun chantillon probabiliste, on a recours
le plus souvent des formules mathmatiques. En examinant les tables conues
Page 18 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

pour dterminer la taille dun chantillon, on constate demble qu partir dune


population de 1 000 individus il nest pas ncessaire daugmenter la taille de
lchantillon pour sassurer dun degr de prcision suprieur.
Le tableau ci-dessous vous aidera mieux comprendre que la relation entre la
taille de lchantillon ne partage pas une relation linaire avec la taille de la
population.
Population
100 ou moins
101 500
501 1 000
1 001 1 000 000

chantillon
plus de 50 %
25 50 %
10 25 %
1 10 %

La section

Je fais mes exercices


la page suivante

Page 19 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

12. Je fais mes exercices


1. Vous formez un chantillon laide de la technique alatoire simple. Par
consquent, plus vous augmenterez le nombre de sujets dans lchantillon plus
la reprsentativit de votre chantillon augmentera.
O Vrai
O Faux
2. Peu importe la taille de votre chantillon, lerreur dchantillonnage est
constant.
O Vrai
O Faux
3. Lchantillonnage alatoire simple est la seule technique dchantillonnage
valable.
O Vrai
O Faux
4. Lannuaire tlphonique de votre rgion constitue une liste valide de la
population et il peut servir choisir un chantillon.
O Vrai
O Faux
5. Une classe dlves choisie pour votre chantillon constitue :
O Une strate
O Une grappe
6. Lorsque vous demandez vos collgues de classe de se soumettre une
exprience quelconque, cest alors un chantillonnage laveuglette.
O Vrai
O Faux
7. Quand est-ce prfrable de faire un recensement plutt que de choisir un
chantillon ?

Page 20 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

8. Vous tes charg de mesurer la puret de leau dans votre ville. laborez un
plan dchantillonnage. Quels facteurs devrez-vous tenir compte ?

Bibliographie
Angers, Maurice . Initiation pratique la mthodologie des sciences humaines.
Anjou (Qubec): Les ditions CEC Inc., 1996.
Barnett, Vic. Sample Survey Principles and Methods. New York: Oxford
University Press, 1991.
Dayhaw, Laurence T. Manuel de statistique. Ottawa: ditions de lUniversit
dOttawa. 2e dition, 1963.
Ferguson, George A. Statistical Analysis in Psychology and Education. New
York: McGraw-Hill Book Co. 2nd edition, 1966.
Fortin, Marie-Fabienne. Le processus de la recherche: de la conception la
ralisation. Ville Mont-Royal (Qubec): Dcarie diteur Inc., 1996.
Foucault, Luc, et Lucie Verreault. Guide dlaboration dun programme de
formation documentaire. Montral: Confrences des recteurs et des
principaux des universits du Qubec, 1994.
Hair, Joseph F. Jr., Rolph E. Anderson, and Ronald L. Tatham. Multivariate
Data Analysis. 2nd edition. New York: Macmillan Publishing Co., 1987.
Hayduk, Leslie A. Structural Equation Modeling with Lisrel. Baltimore: The
John Hopkins University Press, 1987.
Hays, William L. Statistics for Psychologists. New York: Holt, Rinehart and
Winston, 1963.
List, Carla. Introduction to library research. New York: McGraw-Hill, 1993.

Page 21 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9

Ltourneau, Jocelyn. Le coffre outils du chercheur dbutant. Guide dinitiation


au travail intellectuel. 70 Wynford Drive, Don Mills, Ontario M3C 1J9:
Oxford University Press, 1989.
Marcil, Claude, et Robert Chiasson. Comment chercher: les secrets de la
recherche de linformation. Qubec: MultiMondes, 1992.
McCall, Chester H. Jr. Sampling and Statistics Handbook for Research. 1st
edition. Ames, Iowa 50010: The Iowa State University Press, 1982.
Nunnally, Jim C. Psychometric theory. New York: McGraw-Hill Book Co. 2nd
edition, 1978.
Ouellet, Andr. Processus de recherche: une approche systmique. Qubec:
Presses de lUniversit du Qubec, 1981.
Rice, James Jr. Teaching library use: a guide for library instruction. Westport,
Connecticut: Greenwood Press, 1981.
Satin, A., et W. Shastry. Lchantillonnage: un guide non mathmatique.
Ottawa: Statistique Canada, ministre de lIndustrie, des Sciences et de la
Technologie, 1993.
Scheaffer, Richard L., William Mendenhall, and Lyman Ott. Elementary Survey
Sampling. Boston: Duxbury Press, 1979.
Singh, Daroga, and F. S. Chaudhary. Theory and Analysis of Sample Survey
Design. New York: John Wiley & Sons, Inc., 1986.
Stuart, Alan. Basic Ideas of Scientific Sampling. High Wycombe: Charles
Griffin & Co. Ltd., 1976.
Tabachnik, Barbara G., and Linda S. Fidell. Using Multivariate Statistics. New
York: Harper & Row, 1983.
Williams, Bill. A Sampler on Sampling. New York: John Wiley & Sons, Inc.,
1978.

Page 22 Introduction la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Dveloppement en ducation (CRDE) Universit de Moncton, N.-B. Canada E1A 3E9