Vous êtes sur la page 1sur 8

Estimation par intervalle de confiance

Q. Leclère – GM4IP-MSP
Estimateurs ponctuels :
Comme vu au chapitre précédent, la moyenne, la variance corrigée ou la proportion obtenues sur un échantillon
d’une population fournissent respectivement une estimation ponctuelle (une valeur) de l’espérance, de la
variance, ou le la proportion de population.

Comment quantifier la notion d’incertitude sur ces estimations ?

L’estimation par intervalle de confiance permet de définir un intervalle auquel le paramètre estimé aura une forte
probabilité d’appartenir.

Exemple estimation de l’espérance d’une population gaussienne :


Echantillon (n=5)
8.9311
9.1905 Estimation ponctuelle : µ ≈ m = 9.3882
7.0557
11.4384 Estimation par intervalle de confiance : p( µ∈[7.3482 11.4282] )=95%
10.3252

Comment obtenir les bornes de l’intervalle de confiance pour une probabilité donnée ?
Définition de l’intervalle de confiance (IC)
1) Risque α : le risque associé à un IC, noté α, correspond au risque que le paramètre estimé soit en réalité en
dehors de l’estimation par intervalle de confiance.
Pour un IC à X%, le risque α vaudra (100-X)%
Les valeurs courantes de risque α sont 5% ou 1% , (IC à 95% ou 99%), elles dépendent du cas d’application
Dans une situation donnée, réduire le risque α conduira mécaniquement à élargir l’intervalle de confiance.
Le choix de α résulte donc d’un compromis entre précision et confiance

2) Latéralité :
La seule définition du risque α ne suffit pas à l’unicité de l’IC : si l’on impose p(θ∈[G,D])=95% on sait que
p(θ<G)+p(θ>D) =5%. Mais comment répartir ces 5% entre p(θ<G) et p(θ>D) ?
L’IC bilatéral (ICB) répartit le risque équitablement à droite et à gauche : p(θ<G) = p(θ>D) = α /2
L’IC Unilatéral Gauche (ICUG) met le risque à gauche : p(θ<G) = α. Dans ce cas l’IC est de la forme [G, +∞[
L’IC Unilatéral Droit (ICUD) met le risque à droite : p(θ>D) = α. Dans ce cas l’IC est de la forme ] -∞, D]

α/2 1- α α/2 α 1- α 1- α α
G D x G’ x D’ x
ICB ICUG ICUD
Le choix de la latéralité dépend de ce qu’on estime. On choisira un IC unilatéral si l’on veut garantir seulement une
valeur minimale (ICUG) ou maximale (ICUD)
I) Intervalle de Confiance de l’espérance de population
I.1) Cas d’une population Gaussienne dont on connait la variance σ²
μ−m
On sait que m=N(µ ; σ²/n) soit U= = N(0 ; 1)
σ/ n
ICB : on cherche [G D] tel que p(µ<G)=p(µ>D)=α/2

Changement de variable : p(U< /


)=p(U> /
)=α/2 , soit
/
= (α/2) et
/
= (1−α/2)

On obtient finalement : G = m − F (1−α/2) et D = m + F (1−α/2)

On constate que l’IC est centré sur l’estimateur ponctuel m (logique, car la loi utilisée est symétrique)
On constate également que la largeur de l’IC est proportionnel à 1/ .
Pour être k fois plus précis dans l’estimation (largeur d’IC divisée par k), il faudra multiplier la taille d’échantillon par k²

ICUG ou D : on cherche G ou D tels que p(µ<G)= α ou p(µ>D)=α

A peu près les mêmes calculs, qui donnent : ICUG : G = m − F (1−α) ICUD : D = m + F (1−α)
I) Intervalle de Confiance de l’espérance de population
I.2) Cas d’une population Gaussienne dont on NE connait PAS la variance σ²
μ−m
On admettra que U= =T Par rapport au cas précédent (I.1), il suffit de
s! / n
remplacer N(0,1) par Tn-1 et σ par sc
où Tn-1 est une loi de Student à n-1 degrés de liberté
#$ #$
ICB : On obtient : G = m − F%&'( (1−α/2) et D = m + F%&'( (1−α/2)
#$ #$
ICUG ou D : ICUG : G = m − F%&'( (1−α) ICUD : D = m + F%&'( (1−α)

Loi de Student à k degrés de libertés : Tk


Soient X et Y deux V.A. indépendantes de loi Normale centrée réduite
pour X, et du Chi2 à k ddl pour Y. Alors le rapport Z = X/ Y/k suivra
par définition une loi de Student à k ddl. On notera Z=Tk T∞ = N(0,1)
E(Tk) = 0 (pour k>1) V(Tk) = k/(k-2) (pour k>2)
La loi de Student est symétrique, sa forme ressemble à la Gaussienne.
On a d’ailleurs -./ 30 = 4(0,1)
0→2

Proposée par William Gosset en 1908 sous


le pseudonyme Student, dans le cadre de
ses travaux chez Guinness ddp de la loi de Student à k ddl
I) Intervalle de Confiance de l’espérance de population
I.3) Cas d’une population de loi inconnue, variance σ² inconnue, et n grand
Cas d’un échantillon de grand taille, application du théoreme Central Limite :

On sait que m ≈ N(µ ; σ²/n) μ−m


U= ≈ N(0 ; 1)
De plus, on admettra que pour n grand on a σ≈ sc 67 / n
Par analogie avec les calculs de la section 1.1) on obtiendra facilement :
#$ #$
ICB : G = m − F (1−α/2) et D = m + F (1−α/2)
;< ;<
ICUG : G = m − F (1−α) ICUD : D = m + F (1−α)

pour résumer : IC de l’espérance d’une population

9 9
IC Bilatéral [G , D] : G = m − F: (1−α/2) et D = m + F: (1−α/2)
avec :
9
IC Unilatéral Gauche [G , +∞[ : G = m − F: (1−α) e= σ ; L=N pour population gaussienne, σ² connue
e= sc ; L=Tn-1 pour population gaussienne, σ² inconnue
9
IC Unilatéral Droit ] -∞ , D] : D = m + F: (1−α) e= sc ; L=N pour population de loi inconnue, n grand
II) Intervalle de Confiance de la variance de population, cas d’une population Gaussienne


Dans le chapitre précédent, nous avons admis que pour une population Gaussienne, le ratio suit une
²
loi de chi2 à n-1 ddl :
ns² ?

σ²

IC bilatéral : on cherche [G,D] tels que p(σ²<G)=p(σ²>D)=α/2

#² #² #² #² ns² E ns² E
p ²
> =p ²
< = α/2 = CD&'( 1− = CD&'(
G 2 D 2
ns² ns²
G= α D= α
FCD 1−2 FCD 2
&'( &'(

ICU Gauche ou Droit : p(σ²<G) ou p(σ²>D)=α. Les mêmes calculs mènent à

#² #²
ICU Gauche : ; +∞ ICU Droit : 0 ;
H '( J H '( J
ID&'( ID&'(
III) Intervalle de Confiance d’une proportion
Dans le chapitre précédent, nous avons vu que la proportion P d’individus dans un échantillon suit une loi
normale quand la taille de l’échantillon est suffisamment grande (TCL) :
π 1−π avec π la proportion dans la population et n la taille d’échantillon
P ≈ N π; En pratique, on admet cette approximation pour n>30 & nπ >10 & n(1-π)>10
n
π−P
Après centrage et réduction, on a U = ≈ N 0; 1
π 1−π
n
N N P
ICB : on cherche G et D tels que p(π<G) = p(π>D) = α/2 , soit p U<
O ('O
=p U>
O ('O
=
?
& &

La proportion π (inconnue) intervenant dans la variance de P, on la P 1−P α


[G D] = P ± F 1−
remplace par son estimateur ponctuel (P) pour le calcul de G et D : n 2
Et pour les IC unilatéraux, les limites à gauche ou à droite s’obtiennent en remplaçant simplement α/2 par α

Exemple : ICB d’une proportion voisine de ½ Dans ce cas, on a [G D]=T ± U/ V


On remarque que pour 40%<P<60% on a P(1-P)≈1/4 Pour un échantillon de 100 individus : [G D]=W ± 10%
P
En prenant α = 5%, on a en plus F 1 − ? ≈2 Pour un échantillon de 1000 individus : [G D]=W ± 3%

Vous aimerez peut-être aussi