Vous êtes sur la page 1sur 120

ECHANTILLONNAGE

Pr. BOULAHOUAL Adil

Sondage

Mthodes

Probabilistes
Alatoire simple
Stratifie
Par degrs
Systmatique

Pr. BOULAHOUAL Adil

Taille

Empiriques
Quotas

Marge derreur tolre


Degr de confiance

Normalit de la population

Nature de linformation :
Quanti (moyenne) ou
Quali (proportion)

Enqute
Ensemble des oprations de collecte et de
traitement de donnes relatives quelques
domaines que ce soit.

Pr. BOULAHOUAL Adil

Population cible
Rassemblement de tous les cas qui rpondent un
ensemble de caractres spcifiques. Appele aussi
univers ou ensemble statistique, cest lensemble
des lments auxquels on sintresse.

Pr. BOULAHOUAL Adil

Sondage
Enqute incomplte, enqute partielle ou enqute
par chantillonnage, cest une enqute au cours de
laquelle seulement une partie des units de base
de la population sont observe.

Pr. BOULAHOUAL Adil

Echantillon
Ensemble des units de base slectionnes et
rellement observes au cours dun sondage.

Pr. BOULAHOUAL Adil

Echantillonnage
Ensemble des oprations qui permettent de
slectionner de faon organise les lments de
lchantillon.

Pr. BOULAHOUAL Adil

Base de sondage
Enumration ou prsentation ordonne de toutes
les units de base constituant la population.

Pr. BOULAHOUAL Adil

Erreur dchantillonnage
Ecart entre les rsultats obtenus auprs dun
chantillon et ce que nous apprendrait un
recensement comparable de la population. Plus la
taille de lchantillon est grande plus lerreur
dchantillonnage diminue.

Pr. BOULAHOUAL Adil

Dtermination de la taille
de lchantillon

Pr. BOULAHOUAL Adil

la taille dchantillon dpend essentiellement de deux


facteurs :

La prcision souhaite : plus on souhaite des


rsultats prcis, plus lchantillon ncessaire est
important.

Le budget disponible : plus on augmente la taille,


plus le cot de lenqute saccrot.

Pr. BOULAHOUAL Adil

Cas dune population de loi inconnue


Taille dchantillon pour estimer une moyenne

Pr. BOULAHOUAL Adil

Exemple : Un parc de loisirs souhaite estimer 10dh prs le


montant moyen dachats effectus par chaque visiteur.
une tude pilote mene sur 50 visiteurs choisis au hasard a
montr que lcart- type des achats est de 100 dh.

Si on se fixe un seuil de confiance (1-) = 95%, La taille de


lchantillon est donc :

Pr. BOULAHOUAL Adil

100 2000
100,05

Cas dune population de loi inconnue


Taille dchantillon pour estimer une proportion

pq
n

Pr. BOULAHOUAL Adil

Exemple : Le parc souhaite estimer la proportion des visiteurs qui font


des achats cinq points prs.
Lenqute pilote a estim cette proportion 65%, cest dire p = 0,65

Si on se fixe un seuil de confiance (1-) = 95%, La taille de


lchantillon est donc :

0
,
65

0
,
35
n
1820
0,050,05

Pr. BOULAHOUAL Adil

Cas dune population normale


Taille dchantillon pour estimer une moyenne
Cas des prlvements dans une population finie avec
remise ou dans une population infinie sans remise

n Z12
Pr. BOULAHOUAL Adil

Exemple : Un parc de loisirs souhaite estimer 10dh prs le


montant moyen dachats effectus par chaque visiteur.
une tude pilote mene sur 50 visiteurs choisis au hasard a
montr que lcart- type des achats est de 100 dh.

Si on se fixe un seuil de confiance (1-) = 95%, La taille de


lchantillon est donc :

n 1,96 100 384,16 385


10

Pr. BOULAHOUAL Adil

Cas dune population normale


Taille dchantillon pour estimer une proportion
Cas des prlvements dans une population finie avec
remise ou dans une population infinie sans remise

n Z12
Pr. BOULAHOUAL Adil

pq

Exemple : Le parc souhaite estimer la proportion des visiteurs qui font


des achats cinq points prs.
Lenqute pilote a estim cette proportion 65%, cest dire p = 0,65

Si on se fixe un seuil de confiance (1-) = 95%, La taille de


lchantillon est donc :

n 1,96 0,650,35 349,58 350


0,05

Pr. BOULAHOUAL Adil

Cas dune population normale


Taille dchantillon pour estimer une moyenne
Cas des prlvements dans une population finie sans
remise

Z1-2 N
n
N Z1-2

Pr. BOULAHOUAL Adil

Cas dune population normale


Taille dchantillon pour estimer une proportion
Cas des prlvements dans une population finie sans
remise.

Z1-2 p q N
n
N Z1-2 p q
Pr. BOULAHOUAL Adil

Mthodes dchantillonnage
- Mthodes dchantillonnage probabilistes
- Mthodes dchantillonnage empiriques

Pr. BOULAHOUAL Adil

Mthodes dchantillonnage
probabilistes
- Echantillonnage alatoire et simple
- Echantillonnage stratifi
- Echantillonnage par degrs
- Echantillonnage systmatique
Pr. BOULAHOUAL Adil

Echantillonnage alatoire et simple


Un chantillonnage est alatoire si tous les
individus de la population ont la mme
chance de faire partie de lchantillon; il est
simple si les prlvements des individus
sont raliss indpendamment les uns des
autres.

Pr. BOULAHOUAL Adil

Echantillonnage alatoire et simple


Si la population est finie, lchantillonnage
alatoire et simple correspond au tirage
alatoire avec remise, qui permet de traiter
les populations finies comme des
populations infinies.

Pr. BOULAHOUAL Adil

Echantillonnage alatoire et
simple
- Constituer la base de sondage qui correspond la liste
complte et sans rptition des lments de la
population ;
- Numroter ces lments de 1 N ;
-

Procder, laide dune table de nombres alatoires ou


dun gnrateur de nombres pseudo alatoires la
slection des units diffrentes qui constitueront
lchantillon.

Pr. BOULAHOUAL Adil

Echantillonnage alatoire et simple


Exemple :
On souhaite avoir un chantillon alatoire et simple de
5 entreprises parmi une population de 22 entreprises.
On dispose de la base de sondage cest dire la liste
complte et sans rptition des 22 entreprises
numrotes de 1 22. On prend un extrait dune table
de nombre alatoire par exemple :

Pr. BOULAHOUAL Adil

Echantillonnage alatoire et simple


On choisit au hasard un nombre de la table, supposons ce nombre
06121. Comme N= 22, on va retenir le premier groupe de 2
chiffres, ce qui donne les N :
06, ensuite 12 ; 19 ; 17 ; les nombres (82,77 et 92) sont
inutilisables. La cinquime entreprise sera le N 10.
10480
22368
24130
42167
37570
77921
Pr. BOULAHOUAL Adil

15011
46573
48390
93093
39975
06907

01536
25595
22527
06243
81837
11008

02011
85393
97265
61680
16656
42751

81647
30995
76393
07856
06121
27756

91646
89198
64809
16376
91782
53498

Echantillonnage stratifi
Lchantillonnage stratifi est une technique qui consiste
subdiviser une population htrogne, deffectif N, en
P sous populations ou strates plus homognes
deffectif Ni de telle sorte que N= N1+N2+. +Np.
Un chantillon, deffectif ni, est par la suite, prlev
indpendamment au sein de chacune des strates en
appliquant un plan dchantillonnage au choix de
lutilisateur. Le plus souvent, on procdera par un
chantillonnage alatoire et simple lintrieur de
chaque strate.
Pr. BOULAHOUAL Adil

Echantillonnage stratifi
La stratification peut entraner des gains de
prcision apprciables, elle facilite en outre
les oprations de collecte des donnes et
fournit des informations pour diffrentes
parties de la population.

Pr. BOULAHOUAL Adil

Echantillonnage stratifi
Pour la rpartition de leffectif total, n, de
lchantillon dans les diffrentes strates, La
premire solution, dite proportionnelle, consiste
conserver la mme fraction dchantillonnage
dans chaque strate. Une seconde solution, dite
optimale, tient compte du budget de lenqute.

Pr. BOULAHOUAL Adil

Rpartition proportionnelle
La rpartition proportionnelle consiste
rpartir la taille de lchantillon n en
utilisant la mme fraction de sondage f dans
chacune des strates. Cette solution tient
compte dun seul facteur qui est le poids de
chaque strate.

Pr. BOULAHOUAL Adil

Rpartition proportionnelle

Dsignons par wi le poids de la strate et par f la fraction


de sondage constant :

f n
N

Ni
et wi
N

le nombre dunits choisir dans chacune des strates est


donc :

ni w i n f Ni

Pr. BOULAHOUAL Adil

Rpartition proportionnelle
Exemple :
Dans une population de 10000 entreprises,
rparties en 5000 petites entreprises, 3000
moyennes entreprises et 2000 grandes entreprises,
on souhaite avoir un chantillon de 500
entreprises.
Fraction de sondage constante :
f = 500 / 10000 = 5 %
Pr. BOULAHOUAL Adil

Rpartition proportionnelle
Strate

Effectif

Taille de lchantillon

Petite
Moyenne
Grande

5000
3000
2000

5000 * 0,05 = 250


3000 * 0,05 = 150
2000 * 0,05 = 100

Total

10000

Pr. BOULAHOUAL Adil

500

Rpartition proportionnelle
Strate

Effectif

Poids Taille de lchantillon

Petite
Moyenne
Grande

5000
3000
2000

50%
30%
20%

Total

10000

Pr. BOULAHOUAL Adil

500 * 0,5 = 250


500 * 0,3 = 150
500 * 0,2 = 100
500

Rpartition optimale
- Budget total de lenqute, G
- Poids de la strate, wi
- Cot de la collecte de linformation dans la strate, ci
- Dispersion lintrieur de la strate, mesure par
lcart type i.

Pr. BOULAHOUAL Adil

Rpartition optimale
le nombre dunits choisir dans chacune
des strates est donn par :

ni k w i i
ci

Pr. BOULAHOUAL Adil

G
w i i ci

Rpartition optimale
Exemple :
Dans la population des 10000 entreprises, on a pu avoir les
informations suivantes :
Strate

wi

ci

i.

Petite
Moyenne
Grande

0,5
0,3
0,2

50
75
100

0,8
1,5
2,2

Pr. BOULAHOUAL Adil

Rpartition optimale
le nombre dentreprises choisir dans chacune des strates
est donn par :
k

G
5000

449,42
wi i ci 0,50,8 50 0,31,5 75 0,22,2 100

n1 449,42 0,5 0,8 26 petites entreprises


50
n2 449,42 0,3 1,5 24 moyennes entreprises
75

n3 449,42 0,2 2,2 20 grandes entreprises


100
Pr. BOULAHOUAL Adil

Echantillonnage par degrs


Lchantillonnage par degrs regroupe toute
une srie de plans dchantillonnage
caractriss par un systme ramifi et
hirarchis dunits.

Pr. BOULAHOUAL Adil

Echantillonnage par degrs


Dans le cas de deux degrs, par exemple, on considre
que la population est constitue dun certain nombre
dunits de sondage du premier degr (units primaires),
chacune de ces units tant constitue dun certain
nombre dunits du second degr. (units secondaires)
On ralise dabord un chantillonnage dunits du
premier degr. Ensuite, dans chaque unit slectionne
au premier degr, on prlve un chantillon dunits du
second degr. Le mode de slection pouvant varier dun
degr lautre.
Pr. BOULAHOUAL Adil

Echantillonnage par degrs


Lchantillonnage par degrs simpose lorsquil est
impossible dinventorier les lments de toute la
population et quil est possible dnumrer les units
prleves au premier degr. Il permet une concentration
du travail sur le terrain et donc une rduction des cots.
Pour un mme nombre total dobservations, il faut citer
sa plus faible efficacit que lchantillonnage alatoire et
simple.
Pr. BOULAHOUAL Adil

Echantillonnage par degrs


Exemple :
Pour tudier le niveau de consommation des
mnages dune ville, on a tir alatoirement 5
quartiers. Dans chaque quartier slectionn, on
retient une rue sur 5, dans chaque rue retenue, on
retient un immeuble sur 3, et dans chaque
immeuble, un mnage par tage sera questionn.
Pr. BOULAHOUAL Adil

Echantillonnage systmatique
Lchantillonnage systmatique est une
technique qui consiste prlever des units
dchantillonnage situes intervalles
gaux. Le choix du premier individu
dtermine la composition de tout
lchantillon.

Pr. BOULAHOUAL Adil

Echantillonnage systmatique
Si on connat leffectif total de la population
N et quon souhaite prlever un chantillon
deffectif n, lintervalle entre deux units
successives slectionner est donn par :

k N
n
Pr. BOULAHOUAL Adil

Echantillonnage systmatique
Connaissant k, on choisit le plus souvent,
pour dbuter, un nombre alatoire, i,
compris entre 1 et k. le rang des units
slectionnes est alors i, i+k, i+2k,

Pr. BOULAHOUAL Adil

Echantillonnage systmatique
Lchantillonnage systmatique est facile
prparer et, en gnral facile excuter, il
rduit le temps consacr la localisation des
units slectionnes.

Pr. BOULAHOUAL Adil

Echantillonnage systmatique
Si les lments de la population se
prsentent dans un ordre alatoire (pas de
tendance) lchantillonnage systmatique
est quivalent lchantillonnage alatoire
et simple. Par contre si les lments de la
population prsentent une tendance,
lchantillonnage systmatique est plus
prcis que lchantillonnage alatoire.

Pr. BOULAHOUAL Adil

Echantillonnage systmatique
Exemple :
On veut slectionner un chantillon de 30 entreprises au sein
dune population de 1800 entreprises.

k 1800 60
30
Ainsi on va tirer une entreprise toutes les 60 en partant dun
nombre tir alatoirement entre 1 et 60.
Supposons ce nombre est le 15. On va donc slectionner la 15me
entreprise puis la 75me, la 135me. jusqu la 1755me ce qui nous
donnera lchantillon de 30 entreprises.
Pr. BOULAHOUAL Adil

Mthodes dchantillonnage
empiriques
- Echantillonnage accidentel (De convenance)
- Echantillonnage priori
- Echantillonnage Boule de neige
- Echantillonnage par Quotas

Pr. BOULAHOUAL Adil

Echantillonnage accidentel
Il sagit dun chantillon constitu dindividus qui se
trouvaient accidentellement lendroit et au moment o
linformation a t collecte.
Enqutes ralises dans la rue, les lieux publics, en sortie de
super march
Questionnaires figurant dans les magasines et renvoys
spontanment.
Les chantillons accidentels ne peuvent tre considrs
reprsentatifs daucune population. Il est risqu de
gnraliser une population donne des rsultats obtenus
par un chantillon accidentel.
Pr. BOULAHOUAL Adil

Echantillonnage priori
Cest un chantillonnage par jugement priori. Il
consiste slectionner des individus dont on
pense, avant de les interroger, quils peuvent
dtenir linformation.
Le risque de ce type dchantillonnage est de
considrer des individus, apparemment
reprsentatifs de la population tudie.

Pr. BOULAHOUAL Adil

Echantillonnage Boule de
neige
Cette mthode est rserve aux populations
composes dindividus dont lidentification est
difficile ou qui possdent des caractristiques
rares.
La mthode consiste faire construire lchantillon
par les individus eux-mmes. Il suffit den
identifier un petit nombre initial et de leur
demander de faire appel dautres individus
possdant les mmes caractristiques.
Pr. BOULAHOUAL Adil

Echantillonnage par Quotas


Lchantillonnage
par
quotas
est
lchantillonnage non probabiliste le plus
connu, et finalement le mieux accept
comme substitut aux mthodes probabilistes
dans le cas o ces dernires rencontreraient
des contraintes de base de sondage. Mais la
reprsentativit de la population tudie
reste douteuse.

Pr. BOULAHOUAL Adil

Echantillonnage par Quotas


Lchantillonnage par quotas consiste
tudier la structure de la population selon
des critres choisis (quotas) empiriquement.
Lchantillon est ensuite construit de
manire constituer une reproduction en
miniature de la population sur ces critres.

Pr. BOULAHOUAL Adil

Echantillonnage par Quotas


Lchantillonnage par quotas est une forme
simplifie de lchantillonnage stratifi fraction
de sondage constante. Les quotas reprsentent les
variables de stratification.
Une fois les quotas sont fixs, les individus sont
slectionns la convenance de lenquteur.

Pr. BOULAHOUAL Adil

Echantillonnage par Quotas


Les critres servant de base la dfinition des quotas
ne doivent pas tre nombreux. Au-del de 3 critres, la
dmarche devient complexe. Les quotas doivent tre
construits sur une base de donnes fiables ( statistiques
disponibles ) indiquant la rpartition de la population
sur les critres choisis. Les critres les plus utiliss
dans les tudes de march sont conomiques et sociodmographiques en particulier lge, le sexe, la
catgorie socioprofessionnelle,

Pr. BOULAHOUAL Adil

Echantillonnage par Quotas :


Exemple
On souhaite avoir un chantillon de 1000 individus. La
structure de la population selon trois critres est la
suivante :
Age
Structure de
Rpartition de
la population lchantillon
20 29 ans
30 49 ans
50 60 ans
Total

Pr. BOULAHOUAL Adil

40 %
35 %
25 %
100 %

400
350
250
1000

Echantillonnage par Quotas :


Exemple
Structure de la population
Age

Pr. BOULAHOUAL Adil

Sexe

Masculin

Fminin

Total

20 29 ans

48 %

52 %

100 %

30 49 ans

49 %

51 %

100 %

50 60 ans

45 %

55 %

100 %

Echantillonnage par Quotas :


Exemple
Rpartition de lchantillon
Age

Pr. BOULAHOUAL Adil

Sexe

Masculin

Fminin

Total

20 29 ans

192

208

400

30 49 ans

172

178

350

50 60 ans

113

137

250

AGE

Sexe

Sans

Etudiant

Agric

Artisans

Prof
librales

Employs

Ouvriers

Total

10%

30%

5%

6%

9%

25%

15%

100%

15%

25%

2%

10%

8%

30%

10%

100%

8%

5%

15%

22%

15%

15%

20%

100%

20%

4%

10%

16%

14%

24%

12%

100%

6%

2%

25%

22%

18%

17%

10%

100%

35%

1%

20%

20%

6%

13%

5%

100%

CSP
20-29

30-49

50-60

Pr. BOULAHOUAL Adil

AGE

Sexe

Sans

Etudiant

Agric

Artisans

Prof
librales

Employs

Ouvriers

Total

19

58

10

12

17

48

28

192

31

52

21

17

62

21

208

14

26

38

26

26

33

172

36

18

28

25

43

21

178

28

25

20

19

12

113

48

27

27

18

137

CSP
20-29

30-49

50-60

Pr. BOULAHOUAL Adil

Test de reprsentativit de
lchantillon
Pour valider les rsultats de l'tude, et pour
minimiser la marge d'erreur, il est
indispensable de vrifier la reprsentativit
de lchantillon.

Pr. BOULAHOUAL Adil

Test de reprsentativit de
lchantillon
- Mise en tableau des rsultats
- Test de reprsentativit

Pr. BOULAHOUAL Adil

Mise en tableau des rsultats


Il faut dans un premier temps laborer un
tableau dans lequel seront notes les
donnes
thoriques
concernant
la
population totale, ainsi que les donnes
relatives l'tude, ce tableau est appel
tableau de test de reprsentativit.

Pr. BOULAHOUAL Adil

Test de reprsentativit
Appel test dajustement ou test Khi-deux, ce test est destin
tester si lchantillon observ peut tre considr comme
reprsentatif de la population tudie. Pour cela on a besoin de
connatre les caractristiques de la population. Le test
d'ajustement consiste calculer la valeur de la statistique khideux qui permet d'valuer les carts entre les frquences
observes dans l'chantillon et les frquences thoriques
correspondantes la population tudie. Lorsque les carts
seront petits, on acceptera la reprsentativit, sinon on la
rejettera.

Pr. BOULAHOUAL Adil

Test de reprsentativit
- Formuler une hypothse nulle
- Calculer la valeur de Khi-deux observ
- Dterminer la valeur de Khi-deux
thorique
- Rsultat du test de reprsentativit

Pr. BOULAHOUAL Adil

Formuler une hypothse nulle

lchantillon observ est reprsentatif de la


population tudie.

Pr. BOULAHOUAL Adil

Calculer la valeur de Khi-deux


observ

(effectif observ - effectif thorique)


Khi deux
effectif thorique

Pr. BOULAHOUAL Adil

Dterminer la valeur de Khideux thorique


On se fixe un seuil de confiance , on se
reporte la table de distribution de Khideux,
et
on
cherche
la
valeur
correspondante une probabilit gale (1) et un nombre de "degrs de libert (ddl)"
gale au nombre de caractristiques de la
population moins 1.

Pr. BOULAHOUAL Adil

Rsultat du test de
reprsentativit
la valeur de Khi-deux observ est nulle lorsque les
frquences observes sont toutes gales aux
frquences thoriques, cest dire lorsquil y a
une concordance parfaite entre lchantillon
observ et la population tudie. Cette valeur est
dautant plus grande que les carts entre les
frquences observes et thoriques sont plus
grands. Il dcoule de la comparaison du Khi-deux
observ et du Khi-deux thorique :

Pr. BOULAHOUAL Adil

Rsultat du test de
reprsentativit
- Si Khi-deux thorique est strictement suprieur
au Khi-deux observ, l'hypothse nulle est
accepte. Donc l'chantillon est reprsentatif de
la population tudie.
- Si Khi-deux thorique est infrieur ou gal au
Khi-deux observ, l'hypothse nulle
est
rejete. En d'autres termes, l'chantillon nest pas
reprsentatif. Il faut donc raliser un
redressement d'chantillon.
Pr. BOULAHOUAL Adil

Test de reprsentativit : exemple


Une enqute a t ralise au prs dun chantillon
de 400 individus prlev au sein dune population
cible de 4 millions d'individus. Les donnes que
l'on possde sur cette population sont les suivantes
:
Hommes 48% soit 1,92 millions dhommes
Femmes 52% soit 2,08 millions de femmes

Pr. BOULAHOUAL Adil

Test de reprsentativit : exemple


Sexe

Hommes

Femmes

Total

Niveau dinstruction

Effectifs

Effectifs

Aucun
Primaire
Secondaire
Formation professionnelle
Suprieur

35
30
15
13
7

672000
576000
288000
249600
134400

50
25
10
10
5

1040000
520000
208000
208000
104000

1712000
1096000
496000
457600
238400

Total

100

1920000

100

2080000

4000000

Pr. BOULAHOUAL Adil

Test de reprsentativit : exemple


Caractristiques de lchantillon :
Sexe

Hommes

Femmes

Total

Niveau dinstruction

Effectifs

Effectifs

Aucun
Primaire
Secondaire
Formation professionnelle
Suprieur

32
28
18
14
8

61
54
35
27
15

54
23
12
8
3

112
48
25
17
6

173
102
60
44
21

Total

100

192

100

208

400

Pr. BOULAHOUAL Adil

Test de reprsentativit :
exemple
Mise en tableau des rsultats
Sexe

Niveau dinstruction

Aucun
Primaire
Secondaire
Formation professionnelle
Suprieur

Total

Pr. BOULAHOUAL Adil

Hommes

Femmes

Effectifs
thoriques

Effectifs
observs

Effectifs
thoriques

Effectifs observs

67,2
57,6
28,8
24,96
13,44

61
54
35
27
15

104
52
20,8
20,8
10,4

112
48
25
17
6

192

192

208

208

Test de reprsentativit : exemple


Hypothse nulle :
lchantillon observ est reprsentatif de la
population tudie.

Pr. BOULAHOUAL Adil

Test de reprsentativit : exemple


Khi-deux observ = [(61-67,2)/67,2 + (5457,6)/57,6 + (35-28,8)/28,8 + (2724,96)/24,96+(15-13,44)/13,44+
(112104)/104+(48-52)/52+(2520,8)/20,8+(17-20,8)/20,8+(6-10,4)/10,4]
Khi-deux observ = 6,80

Pr. BOULAHOUAL Adil

Test de reprsentativit : exemple


Khi-deux thorique : si on se fixe un seuil de
confiance =5%, on se reporte la table de
distribution de Khi-deux, et on cherche la valeur
correspondante une probabilit gale (1)=0,95 et un nombre de "degrs de libert (ddl)"
gale (10-1)=9, on trouve :
Khi-deux thorique = 16,92

Pr. BOULAHOUAL Adil

Test de reprsentativit : exemple


Rsultat du test de reprsentativit
Khi-deux thorique est strictement suprieur
au Khi-deux observ, l'hypothse nulle est
accepte.
Donc
l'chantillon
est
reprsentatif de la population tudie.

Pr. BOULAHOUAL Adil

Redressement de lchantillon
Si l'chantillon slectionn n'est pas reprsentatif
de la population tudie, aprs le test, il est
ncessaire de le redresser. On redressera
l'chantillon
si
par
exemple
certaines
caractristiques
de
la
population
sont
surreprsentes ou sous-reprsentes. On peut
ainsi tirer de l'chantillon original un chantillon
reprsentatif.

Pr. BOULAHOUAL Adil

Redressement de lchantillon
Pour redresser l'chantillon, il existe deux
mthodes distinctes :
- Redressement par extraction
- Redressement par substitution

Pr. BOULAHOUAL Adil

Redressement par extraction


La mthode dite par extraction limine tous les individus
au-del du pourcentage obtenir. L'effectif de l'chantillon
est donc d'autant plus rduit que les pourcentages
thoriques sont diffrents des pourcentages observs. Cette
mthode
permet d'aboutir un chantillon plus
reprsentatif mais au risque d'obtenir un chantillon
ridiculement petit ou mme une impossibilit de
traitement (le nombre minimum de questionnaires
ncessaire pour traiter une tude est de 60. D'autre part,
pour valider les rsultats et pour effectuer des calculs
statistiques, il faut au minimum 5 effectifs par classe.).
Pr. BOULAHOUAL Adil

Redressement par extraction :


Exemple
1200 personnes interroges pour une tude concernant
l'attitude de la population face un produit suivent la
distribution suivante :
HOMMES: 55% soit 660 interrogs
FEMMES: 45% soit 540 interrogs
Or, la population totale a une distribution :
HOMMES:45% soit 540 pers. interroger
FEMMES: 55% soit 660 personnes interroger.
Pr. BOULAHOUAL Adil

Redressement par extraction :


Exemple
Aprs redressement, on aura :
HOMMES: 660-120=540 individus.
FEMMES: 540 individus. (rsultat inchang)
D'o une meilleure rpartition :
HOMMES: 50% soit 540 individus
FEMMES: 50% soit 540 individus
Pr. BOULAHOUAL Adil

Redressement par extraction


Cette mthode a le trs gros inconvnient de faire
fondre l'chantillon original. Dans l'exemple, nous
avons perdu 120 individus sonds. La prcision des
estimations des rsultats s'en trouve fatalement affecte
par ce procd, tout se passe comme si on avait
interrog un plus petit nombre de personnes. Mais, on
obtient une meilleure reprsentativit de la population.
La mthode par extraction est intressante si la taille de
lchantillon est suprieure 1000.
Pr. BOULAHOUAL Adil

Redressement par substitution


A l'oppos, la mthode par substitution remplace comme son
nom l'indique, tout individu en surnombre dans une modalit
sur reprsente par un individu choisi au hasard dans une
modalit sous-reprsente. Ce dernier se trouve donc
dupliqu. L'effectif de l'chantillon est maintenu,
contrairement la mthode par extraction ( on a vu que l'on
tait pass dans l'exemple d'un chantillon de 1200 individus
un chantillon de 1080), mais au prix de nombreuses
duplications qui tendent uniformiser l'chantillon. En fait,
tout se passe comme si les individus des catgories sousreprsentes avaient t interroges plusieurs fois.

Pr. BOULAHOUAL Adil

Redressement par substitution


Les imperfections de l'chantillon sont
limines sans risque apparent puisque la
taille de l'chantillon ne se trouve pas
affecte.
La mthode par substitution est valable si le
diffrentiel de redressement est infrieur
30%.
Pr. BOULAHOUAL Adil

Redressement par substitution :


Exemple
La population totale compte :
HOMMES : 45%

FEMMES : 55%

L'chantillon de 2000 individus tudis compte :


HOMMES : 740 individus (37%) ;
FEMMES : 1220 individus (61%) ;
NREP :40 individus (2%)
Pr. BOULAHOUAL Adil

Redressement par substitution :


Exemple
On pose le tableau suivant :

NREP
FEMMES 61
HOMMES 37

OBTENUS SOUHAITES DIFFERENCE


%
Nbre %
Nbre
S-O
2
40
0
0
-2%
1220 55
1100
-6%
740
45
900
+8%

DIFFERENCIEL DE REDRESSEMENT=
2%+6%+8%=16%.
Pr. BOULAHOUAL Adil

Redressement par substitution :


Exemple
L'chantillon redress correspond ici au nombre souhait :
HOMMES : 45%
FEMMES : 55%

900 individus.
1100 individus.

La rpartition par sexe correspond alors celle de la


population totale.
On remarque ici que le diffrentiel de redressement est
infrieur 16%, ce qui est un bon rsultat et qui ne remet pas
en questions la validation des observations.

Pr. BOULAHOUAL Adil

Redressement de lchantillon
- la mthode par extraction est intressante si on sonde plus
de 1000 personnes
- la mthode par substitution est valable si le diffrentiel de
redressement est infrieur
30%.
- Si l'chantillon n'est pas reprsentatif, et quon ne peut
utiliser aucune des mthodes, il nous faut administrer de
nouveaux questionnaires. C'est pourquoi il faut vrifier le
plus tt possible la reprsentativit de l'chantillon et tout
de suite le redresser.
Pr. BOULAHOUAL Adil

Rgles lies la forme du questionnaire


Rdaction du questionnaire
Le vocabulaire et le style utiliss pour la
rdaction dun questionnaire doivent tre
ceux employs par les rpondants et non
ceux du rdacteur.

Pr. BOULAHOUAL Adil

Rgles lies la forme du questionnaire


Rdaction du questionnaire
Tout vocabulaire technique est viter, sauf si ltude est mene
auprs de spcialistes.
Tout vocabulaire ambigu est viter, cest dire tout mot ou
expression dont la comprhension prte confusion soit parce
quil possde plusieurs sens, soit parce quil est subjectif.
Lambigut peut galement provenir dutilisations diffrentes
dun mme mot selon la rgion, la classe sociale ou la classe
dge.
Le vocabulaire employ doit tre le plus simple le moins ambigu
et adapt la population concerne par ltude.
Pr. BOULAHOUAL Adil

Rgles lies la forme du questionnaire


Style de rdaction
Il est frquent que le style de rdaction soit source de biais, soit
dans la comprhension des questions, soit dans les rponses.
Il faut viter les questions contenant une ngation ou double
ngation. En plus de sa complexit, il y a le risque dorienter la
rponse dans un sens particulier.
Il faut aussi viter les questions tendancieuses, par exemple la
tendance naturelle dire oui.
Une question ne doit tre longue, elle ne doit pas dpasser une
ligne une ligne et demi.
Pr. BOULAHOUAL Adil

Rgles lies la forme du questionnaire


Structure du questionnaire
La structure du questionnaire concerne
lordre dapparition des questions, la
longueur et la prsence de questions
spciales.
Il se structure autour de six points :

Pr. BOULAHOUAL Adil

Rgles lies la forme du questionnaire


Structure du questionnaire
1. Prsentation de lenquteur et de lenqute
2. Questions dintroduction
3. Questions qualifiantes
4. Questions de mise en route
5. Questions spcifiques
6. Questions didentification

Pr. BOULAHOUAL Adil

1. Prsentation de lenquteur et
de lenqute
-

Organisme charg de ltude


Commanditaire de ltude
Intrt de ltude
Objectifs de ltude

Pr. BOULAHOUAL Adil

2. Questions dintroduction
leur but est dinitier la conversation et
gagner la sympathie du rpondant et
lintresser au questionnaire qui va suivre. Il
sagit de questions gnrales souvent
ouvertes.

Pr. BOULAHOUAL Adil

3. Questions qualifiantes
Elles sont utiles si on a besoin de savoir si
lindividu possde linformation recherche.
Elles sont souvent de forme dichotomique.
Elles permettent dorienter le rpondant
des parties spcifiques du questionnaire.

Pr. BOULAHOUAL Adil

4. Questions de mise en route


Elles servent centrer progressivement le
thme de ltude. On commence par des
questions simples, petit petit les questions
deviennent plus complexes.

Pr. BOULAHOUAL Adil

5. Questions spcifiques
Cest le cur du questionnaire, les questions
doivent amener les informations les plus
importantes pour ltude.
A ce stade, le rpondant sest imprgn de lesprit
de ltude et a nou une relation de sympathie avec
lenquteur, on peut donc lui demander des efforts
de rflexion ou des informations personnelles.

Pr. BOULAHOUAL Adil

6. Questions didentification

Elles dcrivent les rpondants. Cette partie


fournit les informations qui serviront
classer les rpondants en groupes distincts.
Il sagit de variables de segmentation.

Pr. BOULAHOUAL Adil

Mise en page du questionnaire


- Arer les questions ;
- Utiliser de temps autre des symboles;
- Soigner la typographie du texte : gras italique
soulign;
- Imprimer sur du papier de qualit, avec en tte de
lorganisme responsable de ltude;
- Utiliser, si ncessaire, de la couleur.

Pr. BOULAHOUAL Adil

Pr-test du questionnaire
Le but du pr-test est de dtecter les erreurs et le
disfonctionnement du questionnaire avant le travail sur
le terrain.
Le pr-test consiste administrer les questionnaires
un chantillon rduit dans les mmes conditions du
terrain.

Pr. BOULAHOUAL Adil

Pr-test du questionnaire
Le pr-test peut se raliser de deux faons :
- Pr-test dclar
- Pr-test non dclar

Pr. BOULAHOUAL Adil

Administration des
questionnaire
- Slection des enquteurs
- Formation des enquteurs
- Motivation des enquteurs
- Contrle des enquteurs

Pr. BOULAHOUAL Adil

Dpouillement des
questionnaires
- SAISIE
- CONTROLE
- ANALYSE DES DONNEES

Pr. BOULAHOUAL Adil

SAISIE
La saisie consiste reporter les codes sur un
support informatique sous forme dune
matrice de donnes (variables/individus) en
utilisant un programme adquat. Cette
opration ncessite une concentration
extrme et un contrle svre.

Pr. BOULAHOUAL Adil

CONTROLE
Le contrle consiste dtecter parmi les
donnes saisies ceux jugs errons pour les
corriger ou les liminer. Cette opration est
appele puration des donnes,
Elle
comporte les deux tapes suivantes :

Pr. BOULAHOUAL Adil

CONTROLE
- Contrle de validit
- Contrle de cohrence

Pr. BOULAHOUAL Adil

Contrle de validit
Il consiste vrifier pour chaque variable si
les codes ou les donnes saisis
correspondent bien aux codes prvus lors de
la codification ou au domaine de dfinition
de la variable.

Pr. BOULAHOUAL Adil

Contrle de cohrence
Il consiste vrifier la cohrence des renvois
prvus dans le questionnaire, cest dire vrifier
pour certaines variables si les codes ou les donnes
saisis concordent bien avec les codes ou les
donnes saisis dautres variables.

Pr. BOULAHOUAL Adil

ANALYSE DES DONNEES


- Prsenter sous forme exploitable (tableaux statistiques,
graphiques, diagrammes, etc..) C'est ce qu'on appelle la
statistique descriptive.
- Substituer cet ensemble de renseignements quelques donnes
simples, comparer cette reprsentation simplifie des
rpartitions thoriques, et tenter de donner une explication du
phnomne observ et en vrifier le bien fond.
- Interprter, conclure et dfinir avec prcision le degr de
confiance accorder aux conclusions gnrales induites partir
des faits observs.
Pr. BOULAHOUAL Adil

ANALYSE DES DONNEES


Lanalyse des donnes peut faire l'objet
d'une variable, et on parlera danalyse
unidimensionnelle. Elle peut concerner
deux variables, on parle alors danalyse
bidimensionnelle. Elle peut concerner
plusieurs variables, on parle alors danalyse
multidimensionnelle.

Pr. BOULAHOUAL Adil

ANALYSE UNIVARIEE
STATISTIQUE DESCRIPTIVE

Tableaux de frquences

Graphiques

Rduction des donnes

Barres
Donnes discrtes

Secteurs
Btons

Donnes en classes

Dispersion

Polygone
Histogramme

Pr. BOULAHOUAL Adil

Position

Forme

ANALYSE BIVARIEE
Relation entre deux variables

Corrlation

Coefficient de corrlation

Indpendance

Tests statistiques

Test Khi deux

Paramtriques

Non paramtriques
Test de signification

Pr. BOULAHOUAL Adil

Tableau crois

Principe dun test statistique

1. Formuler des hypothses :


Hypothse nulle H0 : =
Hypothse alternative H1: < ou > (unilatral) ou (bilatral)
2. Calculer une valeur de dcision ou une probabilit de signification.
3. Dcision :
On rejette H0 si valeur de dcision valeur tabule
On rejette H0 si probabilit de signification seuil de signification
Pr. BOULAHOUAL Adil

ANALYSE MULTIVARIEE

NON

Y-a-t-il
une variable expliquer et une ou plusieurs
variables explicatives ?

OUI

Mthodes descriptives

Mthodes explicatives

Les variables sont


elles quantitatives ?

La variable
expliquer est-elle
quantitative ?

OUI

OUI

Les variables
explicatives
sont-elles
quantitatives ?

NON
OUI

NON

Les variables
explicatives
sont-elles
quantitatives ?

NON
OUI

Analyses
factorielles
(A.C.P. et A.F.C.)

Analyse des
correspondances
(A.C.M.)

Typologie
Pr. BOULAHOUAL Adil

Rgression
linaire

Analyse
de la variance

Analyse
discriminante

NON
Analyse
conjointe