Vous êtes sur la page 1sur 15

Estimation et intervalle de

confiance
Eric ETTER & Sophie MOLIA – CIRAD
2016-2017
Introduction: rappel sur
échantillonnage

Paramètres relatifs à la
population

Population cible Estimation

Paramètres relatifs à l’échantillon


Echantillon

Collecte d’information
2
Notation des paramètres

Paramètres de la population (taille N):


Moyenne: µ
Population cible Ecart-type: σ
Proportion: π

Paramètres de l’échantillon (taille n):


Echantillon
Moyenne: m
Ecart-type: s
Proportion: p

Quelles informations ai-je sur µ, σ et π à partir de m, s et p?


Quel intervalle de confiance pour µ et π à partir de m, s et p?
Rappel: formules pour la prévalence
et son écart-type

• Paramètres de la population
κi πi (1 − πi )
πi = σ=
N N

• Paramètres de l’échantillon

ki p (1 − p )
pi = s=
n
n
Rappel: formules pour la
moyenne et son écart type

• Paramètres de la population
N N

∑ xi ∑ i
( x − µ ) 2

µ= i
σ= i

N N

• Paramètres de l’échantillon
n n

∑ xi ∑ i
( x − m ) 2

m= i
s= i

n n −1
Effet de la taille d’échantillon
• Etude du poids de naissance des veaux
– Mesure sur un échantillon de 3 veaux
– 1000 échantillons distincts:
• Echantillon n°1: 31,1; 35,5 ; 37,6 moyenne = 34,7
• Echantillon n°2: 34,2; 36,8; 42,3 = 37,8
• Echantillon n°3: 30,8; 32,3; 33,6 = 32,2
• …
• Echantillon n°1000: 34,4; 36,3; 37,9 = 36,2
0.9
90
0.8
0.7
0.6
Frequency

Distribution de moyennes 50
0.5
0.4
d’échantillon 0.3
(n=3) 0.2
10
0.1
00
28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44
Effet de la taille d’échantillon

– Mesure sur un échantillon de 10 veaux


– 1000 échantillons:
• Echantillon n°1: 30,3; 31,1; 32,0; 38,1,;38,3,;33,2; 34,7; 40,7; 41,7; 39,6 moyenne = 36,0
• Echantillon n°2: ……… = 34,6
• Echantillon n°3: ……… = 36,2
• …
• Echantillon n°1000: …… = 36,9
0.9
90
0.8
0.7
Distribution de moyennes Frequency
0.6

d’échantillon 50
0.5
0.4
(n=10) 0.3
0.2
10
0.1
00
28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44
Effet de la taille d’échantillon

– Mesure sur un échantillon de 20 veaux


– 1000 échantillons:
• Echantillon n°1: 30,3; 31,1; 32,0; 38,1; 38,3; 33,2; 34,7; 40,7; 41,7; 39,6; 32,5; 35,6; 34,4; 40,1; 39,8; 34,6; 37,0; 38,6;
32,7; 32,1 moyenne = 35,9
• Echantillon n°2: ……… = 36,3
• Echantillon n°3: ……… = 36,2
• …
• Echantillon n°1000: …….. = 35,7
0.9
90
0.8
0.7
Distribution de moyennes Frequency 0.6
0.5
50
d’échantillon 0.4
0.3
(n=20) 0.2
10
0.1
00
28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44
Estimation d’une moyenne
0.9
0.8
0.7
0.6 n=3

Frequency
• Ecart-type de la moyenne 0.5
0.4

₋ Erreur standard ou erreur-type 0.3


0.2
0.1
₋ Détermine la précision de la moyenne 0
28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44

₋ Diminue si la taille d’échantillon augmente 0.9


0.8

₋ Formule fonction de n/N 0.7


0.6
n = 10

Frequency
Si n/N ≤ 5% Si n/N > 5% 0.5
0.4
0.3

N −n
0.2

s s
sm = sm =
0.1
0

N −1
28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44

n n 0.9
Height, cm

0.8
0.7
n = 20
Facteur correctif 0.6

Frequency
0.5
d’exhaustivité 0.4
0.3
0.2
0.1
0
28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44
Estimation d’une moyenne

• Intervalle de confiance de la moyenne μ


μ = m ± (coefficient de fiabilité x erreur-type)

n ≥ 30 n < 30
s s
µ = m± z α
2 µ = m± t n −1
α
2
n n
Coefficient de fiabilité Coefficient de fiabilité correspondant à
correspondant à distribution distribution du T de Student avec n-1
normale (0,1) degrés de liberté

Erreur-type
Erreur-type
s N −n
si n/N > 5%: s N −n
n N −1 si n/N > 5%:
n N −1
A quoi correspond z α 2 ?

Distribution normale centrée réduite (0,1)

α = 5% = 0.05
α = 10% z α 2 = 1,645
α=5% z α 2 = 1,960
α=2% z α 2 = 2,326
α=1% z α 2 = 2,576
A quoi correspond nt−1 α 2 ?

Distribution du t de Student
– Fonction des degrés de liberté (degrees of freedom)
– ddl (df) = n-1
Estimation d’une moyenne

• Intervalle de confiance (IC) de la moyenne


n ≥ 30 (et n/N ≤ 5%) n < 30 (et n/N ≤ 5%)
s s
µ = m± z α
2 µ = m± t n −1
α
2
n n
• Interprétation d’un IC
– Intervalle de valeurs plausibles pour la moyenne de la population en
considérant la moyenne de l’échantillon
– Tentant mais incorrect de l’interpréter par “ il y a (1-α)% de
probabilité que la moyenne de la population soit dans cet IC”
– Vrai interprétation est “(1-α) % des IC calculés sur plusieurs
échantillons aléatoires indépendants de la même population
contiennent la vraie moyenne de la population”
Estimation d’une prévalence
• La prévalence observée sur un échantillon est
elle-même une variable aléatoire, elle varie
selon les échantillons
• Si np et n(1-p) sont suffisamment grands, cette prévalence
suit une loi normale centrée sur la prévalence p

• Intervalle de confiance (IC) de la prévalence:


n/N ≤ 5% n/N > 5%

π = p± zα 2
pq
n
π = p± zα 2
pq
n
N −n
N −1

• Soient pinf et psup les bornes inférieures et supérieures de l’IC,


si npinf ou n(1-pinf) ou npsup ou n(1-psup) < 5 alors utiliser la loi
binomiale pour estimer la prévalence
Conclusion
• L’intervalle de confiance (IC) de la moyenne µ pour
une variable donnée (dans une population de taille N)
est calculé à partir de la moyenne m et de l’écart-type s
de cette même variable dans un échantillon de taille n
selon la formule suivante:
n ≥ 30 (et n/N ≤ 5%) n < 30 (et n/N ≤ 5%)
s s
µ = m± z α
2 µ = m± t n −1
α
2
n n
• L’intervalle de confiance de la prévalence est calculé
selon la formule suivante:
n/N ≤ 5% n/N > 5%

π = p± zα 2
pq
n
π = p± zα 2
pq
n
N −n
N −1

15
15