Vous êtes sur la page 1sur 92

E

c
h
a
n
t
i
l
l
o
n
n
a
g
e

Lchantillonnage
Jean-Sbastien Pierre
UMR 6553
20/01/2009
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Plan
1. Introduction
2. Lchantillonnage alatoire
Simple
Squentiel en deux tapes
3. Lchantillonnage stratifi
Mise en uvre et analyse
Optimisation
4. Lchantillonnage en grappes
Mise en uvre et analyse
Optimisation
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Introduction
Pas de modle sans chantillon, pas dchantillon sans modle
Un professionnel du prt--porter

Les tissus, disponibles en quantit limite, ne peuvent tre ni repris ni
changs.
Par contre vous pouvez obtenir un chantillon de chacun des tissus pour
un prix modique.
La boutique A&A, http://www.a-et-a.com/
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Le dictionnaire Robert
1. Vx talon de mesure. (1636) Mod. Type rglementaire de certains matriaux
de construction. Bois d'chantillon. Brique, pav d'chantillon. Mar. Btiment
de fort, de petit, de faible chantillon, suivant la largeur et l'paisseur des pices
de construction.

2. (1407) Cour. Petite quantit d'une marchandise qu'on montre pour donner une
ide de l'ensemble. Les chantillons d'une gamme de produits. chantillons de
vin, de caf. Un cahier d'chantillons (d'toffe). Une palette d'chantillons (de
peinture). Bote, jeux d'chantillons usage commercial. collection, prsentoir.
Il tale ses chantillons, lentement, devant le client (Maurois). Quel
danger, quelle folie de choisir sur des chantillons (Sarraute).
Spcimen remarquable d'une espce, d'un genre. reprsentant. Une trs
jolie servante, charmant chantillon de la beaut des femmes de Malaga
(Gautier).
Fig. Aperu. Je voulus lui donner un chantillon de mon talent
(Rousseau). exemple.

3. Spcialt (Statist.) Fraction d'une population destine tre tudie par
sondage. panel.

4. Inform. lment d'une suite discrte rsultant de l'chantillonnage d'une
grandeur analogique.
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Pourquoi chantillonner ?
Impossibilit daccder
tous les individus dune population
la totalit dune aire
=> On procde donc par infrence
Echantillonnage
Sondage
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Deux grandes stratgies
Alatoire
Simple
Stratifi
En grappe ou par degrs
Systmatique
Transects et grilles
Dcimation/quantisation
chantillonnage temporel
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Limites du cours
On se limitera lchantillonnage
alatoire
Les problmes de lchantillonnage
systmatique seront abords dans
dautes UE propos de
La statistique spatiale
Lanalyse des sries chronologiques
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

2. Lchantillonnage
alatoire
Simple
Squentiel en deux tapes
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Echantillonnage alatoire
simple
Dfinition
Les individus de la population sont tous
quivalents
Le nombre dindividus chantillonner est
dtermin lavance
Chaque individu de la population a la mme
probabilit a priori dtre choisi
Le choix dun individu ne favorise ni ne
dfavorise le choix ultrieur daucun autre
individu de la population (tirages indpendants)
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Les individus ou units
dchantillonnage
Naturels
Animaux, plantes individualises
Arbitraires
Units de surface, de volume, de poids
0.25 m
2
de prairie
1dm
3
deau dans un tang
1k de sol
Attention alors !
Population biologique
Population statistique
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Deux mode de tirage
Avec remise
Ou non exhaustif
La probabilit de slection reste
constante au cours de lchantillonnage
Sans remise
Ou exhaustif
La probabilit de slection saccrot au
cours de lchantillonnage
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Une approximation
Dans les trs grandes populations, on
considre souvent lchantillonnage
comme avec remise, mme lorsquil
ny a pas remise
Dans les populations plus petites, il y
aura lieu de prendre en compte le
taux de sondage f = n/N
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Le modle statistique

^
E
o
2
o
2
O
x
-
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Les paramtres de
lchantillon
Moyenne de lchantillon :



Variance de lchantillon :
x
n
x
i
i
n
=
=

1
1
s
n
x x
i
i
n
2
1
2
1
=
=

( )
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Paramtres et estimateurs
La moyenne est un estimateur sans
biais de la moyenne de la population


La variance s
2
est un estimateur biais
par dfaut (mais asymptotiquement
sans biais) de la variance de la
population
( )
E x =
( )
2 2
E s o <
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Voir annexe polycopie
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Le biais
0 5000 10000 15000 20000 25000
4
.
0
4
.
5
5
.
0
n
s
Comparaison des deux estimateurs sur un mme chantillon
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Le biais
0 20 40 60 80 100
5
1
0
1
5
2
0
2
5
scale
l
v
a
r
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

La prcision
dchantillonnage
Quelle connaissance avons
nous de la moyenne de la
population ?
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Les mesures de prcision
La variance
Incommode (exprime dans le carr des units)
Lerreur standard
Utilise par les anglo-saxons
Le coefficient de variation
Utilis par les agronomes
Le intervalle de confiance
Cest un vritable encadrement
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

La prcision est
Proportionnelle lcart-type de la
moyenne (en gnral de lestimateur) ou
erreur standard sur la moyenne
Comment la calcule-t-on ?
Population infinie
Ou tirage avec remise

Population finie
Et tirage sans remise
m
n
o
o =
( )
1
m
f
n
o
o =
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

estimateurs
Population infinie
Ou tirage non
exhaustif


Population finie
Et tirage exhaustif

m
n
o
o =
( )

1
m
f
n
o
o =
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Le demi intervalle de
confiance
On sait encadrer la moyenne avec
une probabilit derreur dfinie par
lintervalle de confiance (voir annexe)


Ou, si n < 30

2 2

,
c
I x z x z
n n
a a
s s
= - +


1
2
2
1

, n
n
c
I x t x t
n n
a
a
s s
-
-


= - +


E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Prcision absolue et relative
La quantit :

Ou, pour n>30

Sera utilise comme prcision absolue
La quantit

Sera nomme : prcision relative

2
1

n
d t
n
a
s
-
=
2

d z
n
a
s
=
rel
d
d
x
=
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Un exemple
La taille du parasitode
leptomastix dactylopii
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Lanimal
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Lchantillon
On a prlev au hasard 50 individus
femelles partir de cochenilles du manioc
provenant dun champ du congo (donnes
Andr Biassangama)
> print(biassang)
numer tail long fec strate
1 1 0.63 29 52 1
2 2 0.75 25 56 1
3 12 0.85 31 57 1

48 29 2.72 39 115 2
49 32 2.84 39 119 2
50 31 2.92 37 121 2

E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Exemple : taille de
leptomastix
> attach(biassang) # dfinition du jeu de donnes
> sd<-sqrt(var(tail)/n) # calcul de lerreur standard
> qnorm(1-0.025) # calcul de z (alpha/2)
[1] 1.959964
> d<-sd*qnorm(1-0.025) # prcision absolue
> d
[1] 0.1474185
> mean(tail) # taille moyenne (mm)
[1] 1.7818
> mean(tail)-d # borne infrieure
[1] 1.634382
> mean(tail)+d # borne suprieure
[1] 1.929218

E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Encadrement de la
moyenne :
La taille moyenne de la population d
de la population des femelles du
parasitode Leptomastix dactylopii est
estime 1.78 mm
On peut affirmer avec 5% des
chances de se tromper quelle est
comprise entre 1.63 et 1.93 mm
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

La prcision absolue et
relative
La moyenne est connue plus ou
moins 0.15 mm prs

Cest dire 8.3% prs
> d/(mean(tail))*100
[1] 8.273571

E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Contrler la prcision
dchantillonnage
La base du travail pratique
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Comment volue la
prcision ?
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
0 50 100 150 200 250 300 350 400
Effectif de l'chantillon (n)
Prcision relative
0.1
0.2
0.5
1
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Le gain marginal de
prcision
La drive de la prcision relative donne le gain marginal par
unit supplmentaire dchantillonnage.

Gain marginal de prcision
-5
-4
-3
-2
-1
0
1
2 4 6 8 10 12 14 16 18 20
Srie1
Srie2
Srie3
Srie4
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Calculer leffectif ncessaire
1. Dfinir lobjectif atteindre
Le risque o accept (le plus souvent 0.05)
La prcision absolue ou relative dsire
2. Dterminer la variance de la population
On a souvent besoin dun pr-chantillonnage
3. Dterminer n
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Un paradoxe !
Pour faire un bon chantillonnage
faites en dabord un mauvais
(J.S. Pierre, penses)
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

La dtermination de n
De la dfinition de la prcision


On dduit :
2

d z
n
a
s

2
2
2
2

n z
d
a
s

E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Et si on parlait argent ?
On dfinit :
Leffort dchantillonnage : cest n
Le cot de prise en charge de lchantillonnage C
o
Fabrication des cadres, piges, cot
du trajet, affrtement dun bateau,
etc
Le cot unitaire de prlvement dun individu c
Mesur en temps de travail, en
euros, en litres de fuel (chalutier)
etc
Le cot total de lchantillonnage :
0 T
C C nc = +
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Optimisation
Stratgies de type minimax
Maximiser linformation (minimiser la
prcision)
En minimisant, ou au moins en
matrisant les cots
Pas de solution universelle
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Exemple
La taille moyenne de la population de
Leptomastix est connue 8.3% prs
avec un chantillon de 50 femelles
Quel chantillon est ncessaire pour
atteindre une prcision de 5% sur
cette moyenne ?
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Solution
Ecrivons la formule de la prcision
relative

On cherche rsoudre lingalit :


Donc :
2
r
z
d
x n
a s
=
2
0.05 0.05
r
z
d
x n
a s

2 2
2 2 2 2
2 2
0.0025
0.0025
z z
n
x n x
a a
s s

E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Numriquement :
On prendra n=137
Commenter
2
2
2 2
2
2

0.0025
1.96
0.2829
1.71818
136.908
z
n
x
z
x
n
a
a
s
s

=
=
=

E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Lchantillonnage
squentiel en deux tapes
Doit-on refaire un
chantillon de 137
individus ?
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Non !
Il est licite de complter lchantillon
de 50 individus 137
Cest dire daller prlever aux
hasard 137 - 50 = 87 nouveaux
individus
Cette procdure sappelle :
chantillonnage squentiel en deux
tapes
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Ouverture
Un chantillonnage est dit squentiel sil est
conduit par tapes jusqu un critre darrt.
Lchantillon est alors dit informatif il renseigne au
fur et mesure sur la prcision atteinte ou sur
dautres critres darrt
Deux types principaux :
Echantillonnage squentiel prcision fixe
Echantillonnage dcisionnel
Voir par exemple le livre de Frontier : stratgies
dchantillonnage en cologie
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

3. Lchantillonnage
stratifi
Du bon usage des strates
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Que faire si la variance des
individus est leve ?
Lobtention dune bonne prcision est
alors extrmement coteuse
Mais la population est peut-tre trs
htrogne ?
On peut alors la diviser en sous
populations plus homognes
On gagne alors beaucoup de
prcision
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Mise en oeuvre
Le modle statistique
change
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Une nouvelle vision de la
population
Et des paramtres
,o
2
O
S1
S2
S3

1
,o
2
1

2
,o
2
2

3
,o
2
3
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Dfinition des strates
Les strates forment une partition de
la population
Cest dire que leurs intersections
sont deux deux vides (elles sont
disjointes)
Leur runion est la population totale
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Hypothse :
Les variances intra sont
infrieures la variance totale
2 2
1
2 2
2
2 2
3
s s
s s
s s
<
<
<
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Les poids des strates
A chaque strate est affecte un poids
: la proportion de la population totale
quelle reprsente
w
1
,w
2
,w
3
, en gnral w
i

1
1
i
i
p
i
i
N
w
N
w
=
=
=

E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Lchantillon stratifi
On tire un chantillon alatoire simple de
taille n
i
dans la strate i.
Lchantillon complet est de taille n
On appelle allocation le poids de la strate
i dans lchantillon
Si le poids de la strate dans lchantillon est
gal au poids de la strate dans la
population on dit que lallocation est
proportionnelle
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Lestimateur stratifi
On nomme x
ij
la valeur mesure sur le
j ime individu de la strate i
On note x
i.
la moyenne du sous-
chantillon de la strate i
On a le choix entre deux estimateurs
de la moyenne de la population :

1 1
1
..
i
p n
ij
i j
x x
n
= =
=

.
1
p
i i
i
x w x
=
=

E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Comparaison. a) biais
Le premier estimateur est biais, sauf
si lallocation est proportionnelle
Le second est sans biais partir du
moment o le poids des strates dans
la population est connu sans erreur
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Comparaison. b) variance,
prcision
Le second estimateur est de variance
infrieure au premier
( )
( )
2 2
2 2
1 1 1
1
..
i
p n p
ij i
i j i
Var x Var x n
n
n n
s s
= = =
= = =

( )
( )
2
2 2
.
1 1
i i
p p
i
i
i
i i
Var x w Var x w
n
s
= =
= =

E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Optimisation
On va optimiser lallocation
sous une contrainte de
cot
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Fonction de cot
Cot de prise en charge + cot de
prlvement des units de chaque
strate :
C C n C
T i i
i
m
= +
=

0
1
.
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Le problme
Minimiser la variance
de lestimateur


Par rapport aux n
i
Sous la contrainte


Problme de
minimisation sous
contrainte
C C n C
T i i
i
m
= +
=

0
1
.
( )
2
2
1
i
m
i
i i
Var x w
n
s
=
=

E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Technique du Lagrangien
Ou du multiplicateur de Lagrange
Voir annexe 2
On trouve :

.
.
i i
i
i
w
n
C
o

=
2 2
1
0
. .
m
i i i
i
T
w C
C C
o

=
=

E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Intervalle de confiance et
prcision
Lestimateur stratifi de la moyenne
est distribu comme un t n-m
degrs de libert
Do lintervalle de confiance :



Et la prcision
2 2
2 2
2 2
1 1

,
i i
m m
n m n m i i
i i i i
x t w x t w
n n
a a
s s
m
- -
= =


- +




E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Application Leptomastix
La strate 1 reprsente 70% des htes
dans la nature, la strate 2 30%
Corriger lestimation de la moyenne
de la population
Estimer son intervalle de confiance et
sa prcision
Lallocation est-elle optimale ?
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Intrt des strates
Comment juger de lintrt de la
stratification ?
Par analyse de variance
Une technique qui permet de comparer la
variance inter-strate avec la variance intra-
strate
Plus le F est grand, plus la stratification est
intressante
A linverse, si F est non significatif, la
stratification est dpourvue dintrt
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Exemple
Taille de Leptomastix
> attach(biassang)
> anova(lm(tail~strate),test="F")
Analysis of Variance Table

Response: tail
Df Sum Sq Mean Sq F value Pr(>F)
strate 1 8.5617 8.5617 77.559 1.367e-11 ***
Residuals 48 5.2987 0.1104
---
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 `
' 1

E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Contrle graphique
1 2
1
.
0
1
.
5
2
.
0
2
.
5
3
.
0
Effet des strates, taille de leptomastix
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

4. Lchantillonnage en
grappes
Ou chantillonnage du
premier degr
(chantillonnage par
degrs)
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Dfinition
La population peut tre subdivis en units
primaires ou grappes
Chaque grappe contient un certain nombre
dindividus ou grains
Le tirage au hasard seffectue en deux
phases
Choix de m grappes
Choix de n grains par grappe
Analogie : strates trs nombreuses, on ne
peut les sonder toutes
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Image de la population et
du tirage
,o
2
O

Grappe sonde
Grappe non sonde
Grain sond
Grain non sond
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Un schma hirarchique
O
1 2 3
1 2 3 1 2 1 2 3
Population
Grappes
Grains
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e


A est une variable alatoire attache la
grappe, desprance nulle et de variance
(variance intergrappes)
c est une variable alatoire attache
chaque grain, desprance nulle et de
variance (variance rsiduelle ou intra
grappe)
Par ailleurs, les Ai et cij sont indpendants

2.1. Modle statistique
ij i ij
A y c + + =
2
A
o
2
R
o
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

2.2. Estimateurs

On se limitera au cas simple o les
grappes sont deffectifs gaux, et o
on tire un nombre constant de grains
par grappe. Dans ces conditions la
moyenne gnrale de lchantillon :


est un estimateur sans biais de



= =
=
m
1 i
n
1 j
ij . .
y
m . n
1
y
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Dmonstration :
Il suffit dappliquer le modle :
..
1 1
1
( ) ( )
.
m n
ij
i j
E y E y
n m
= =
=

1 1 1 1
0 0
1 1
( ) ( )
. .
m n m n
i ij
i j i j
E A E
n m n m
m e m
= = = =
= =
= + + =

1444444442 444444443 1444444442 444444443
1 1
1
( )
.
m n
i ij
i j
E A
n m
m e
= =
= + +

E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Sa variance
Dpend la fois de et de
2
A
o
2
R
o
..
2 2
1 1
1
( ) ( )
.
m n
ij
i j
Var y Var y
n m
= =




2 2
1 1
1
.
m n
i ij
i j
Var A
n m
m e
= =


= + +




2
2 2 2 2
1 1 1
1 1
0 . ( )
. .
R
m m n
i ij
i i j
Var n A Var
n m n m
s
e
= = =
=

= + +





14442 4443
2
2 2
1
1
.
.
m
R
i
i
Var n A
n m
n m
s
=

= +

2
2
2
1
1
( )
.
A
m
R
i
i
Var A
n m
m
s
s
=
=
= +

14442 4443
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Finalement
Lchantillonnage du premier degr est dautant
moins prcis que les grappes sont plus diffrentes
les unes des autres. Sans considrations de cot,
si le produit n.m est fix, la prcision est optimale
pour n=1 (un seul grain par grappe). On voit bien
les limites de cette stratgie : il est alors
impossible destimer

( )
2 2
..
1
( ) .
.
A R
Var y n
n m
s s = +
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Grappes et analyse de
variance
Modle danalyse de variance alatoire
Un F important signifie que les grappes
sont trs diffrentes entre elles,
relativement homognes au niveau intra
Incite faire porter leffort sur les grappes
plutt que sur les grains
Estimation des composantes de la variance
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Analyse de variance
Source SCE dl CM F
Total nm-1
SCE
T
/(nm-1)

Inter (B) m-1
SCE
B
/(m-1)
CM
B
/CM
W
Intra (W) nm-m
SCE
W
/(nm-m)
( )
2
1 1
..
m n
ij
i j
y y
= =

( )
2
.
1
..
m
i
i
n y y
=

( )
2
.
1 1
m n
ij i
i j
y y
= =

E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Optimisation
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Le problme doptimisation
Minimiser la variance de la moyenne
En dterminant lavance le cot
total de lopration
Combien de grappes ?
Combien de grains par grappe ?
Il faut dterminer
Le cot de prise en charge dune grappe
Le cot de prlvement dun grain
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

On forme le lagrangien
Sous la fonction de cot :
( )
( )
( )
2 2
0 1 2
1
, , .
.
A R T
L n m n C C mc nmc
n m
l s s l = + + - - -
0 1 2 T
C C mc nmc = + +
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Drivation par rapport n
et m
( )
2
2
2
2 2
1 2
2 2
0
.
0
.
R
A R
L
mc
n
n m
L
c nc
m
m n m
s
l
s s
l

= - + =

= - - + - =

2
2
2
2
.
R
m
c n
s
l
=
( )
2 2
1
2
2
A R
R
n n
c
n
c
s s
s
+
+ =
2
1 2
2
2
R
A
c
n
c
s
s
=
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Et finalement :
Evidemment, on en dduit m partir
de la fonction de cot
2
1
2
2
R
A
c
n
c
s
s
=
Grappe
chre
Grain cher
Grains
variables
Grappes
variables
+ de grains/grappe
+ de grappes
+ de grains/grappe
+ de grappes
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Bilan
On ne fait pas un chantillonnage en
grappes pour gagner de la prcision
En gnral, au contraire, on en perd par
rapport lchantillonnage alatoire simple
On ladopte pour sa commodit et son
faible cot
Noubliez pas de loptimiser ds que vous
avez de linformation sur les deux
composantes de la variance !
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

5. Autres plans
dchantillonnage
Echantillonnage par degrs,
chantillonnage en diffrentes occasions,
chantillonnage par rgression
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Echantillonnage par degrs
Gnralisation de lchantillonnage en
grappes
Echantillonnage en grappe =
chantillonnage du premier degr
Echantillonnage du second degr :
On tire au hasard des units primaires
Dans chaque unit primaire on tire au hasard
des units secondaires
Dans chaque unit secondaire des units
tertiaires (grains)
En anglais : cluster sampling
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Exemple
Etude de la croissance des brochets au Canada :
Units primaires = lacs
Units secondaires = barques
Units tertiaires = brochets (grains)
Analyse :
Analyse de variance hirarchise (nested)
Estimation des composantes de la variance
Ici : trois composantes
Entre lacs
Entre barques
Entre brochets (rsiduelle)
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Echantillonnage
diffrentes occasions
On tire au hasard un certain nombre
dindividus dans une population
On les repre
On mesure une caractristique plusieurs
fois (occasions)
Exemples : croissance sur des animaux ou
plantes marques
Analyse : mesures rptes (repeated
measures)
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Echantillonnage par
rgression
On mesure une caractristique peu
coteuse x sur un trs grand nombre N
dindividus
Sur un sous-chantillon alatoire de taille
n, on mesure une autre caractristique,
trs coteuse, y
Ce sous chantillon permet destimer le
coefficient de corrlation entre les deux
caractristiques
Lestimation prcise de la moyenne de x
permet alors de corriger la moyenne de y

E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Exemple
Chez Leptomastix dactylopii on
mesure :
La taille sur 1000 individus
La taille et la fcondit sur 50 dentre
eux
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Exemple
> mean(tail) # Echantillon de 50
[1] 1.7818
> mean(tail2) # Echantillon de 1000
[1] 1.971004
> lm(fec~tail)->m1 # Rgression fcondit / taille
> m1

Call:
lm(formula = fec ~ tail)

Coefficients:
(Intercept) tail
22.41 34.33

> mean(fec) # Echantillon de 50
[1] 83.58
> mean(tail2)-mean(tail)->bt # Biais sur la taille
> bt*m1$coeff[2]+mean(fec) # Correction du biais
fcondit
[1] 90.07582
>
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Variance de lestimateur par
rgression
On le donne ci dessous sans
dmonstration :
2
2
(1 )
y
n
s
r -
Variance
habituelle
Coefficient de
corrlation
entre x et y
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Suite de lexemple
> # Variance de la moyenne fcondit
> var(fec)/50
[1] 7.28089
> #correction par la corrlation avec la taille
> cor(tail,fec)
[1] 0.9570068
> (1-cor(tail,fec))*var(fec)/50
[1] 0.3130290
> v<-(1-cor(tail,fec))*var(fec)/50
> # Erreur standard
> sqrt(v)
[1] 0.5594899
> # prcision
> sqrt(v)*1.96
[1] 1.096600
> #prcision relative
> sqrt(v)*1.96/mean(fec)*100
[1] 1.312037 # 1.31% grace la mesure des 1000 tailles
>

E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Conclusions
En forme de conseils
E
c
h
a
n
t
i
l
l
o
n
n
a
g
e

Conclusions
Connatre les plans types est fondamental
Il est essentiel de savoir dfinir
Ses objectifs (prcision, erreur de dcision)
Ses moyens
Loptimisation permet de gagner du temps
et de largent
Faites simple et si possible standard
Evitez les plans astucieux quon ne sait pas
traiter ou qui se rvlent coteux