Vous êtes sur la page 1sur 59

Estimation paramétrique par

intervalle de confiance

Module : Techniques d’estimation pour l’ingénieur


Plan

1. Introduction
2. Principe de l’estimation par intervalle de confiance
3. Construction de l’intervalle de confiance
• Intervalle de confiance de la moyenne
• Intervalle de confiance de a proportion
• Intervalle de confiance de la variance

1
Introduction

Activité introductive
Dans une société musicale qui exécute des œuvres vocales, supposons
qu’elle cherche à estimer la moyenne µpop de 40 chanteurs à partir d’un
échantillon de 5 observations de cette chorale.
Si on estime µpop par la moyenne d’échantillon µéch , donnée par :
5
1X
µéch = Xi
5
i=1

on ne peut pas raisonablement croire que µéch = µpop exactement. On


fera une petite erreur d’estimation.

2
Introduction

D’ailleurs, comme l’échantillon est aléatoire, la valeur de µéch que vous


auriez obtenue sur un autre échantillon aurait probablement été
différente, quoique tout aussi pertinente.
On dit qu’elle ne prend pas en compte les fluctuations d’échantillonnage.
Voici quelques exemples d’échantillons ; on remarque effectivement que
la valeur de µéch fluctue d’un échantillon à l’autre :

X1 X2 X3 X4 X5 µéch
échantillon 1 1.89 1.79 1.74 1.90 1.74 1.812
échantillon 2 1.74 1.95 1.76 1.75 1.71 1.782
échantillon 3 1.84 1.84 1.88 1.85 1.89 1.86
échantillon 4 1.84 1.84 1.75 1.83 1.75 1.802
échantillon 5 1.59 1.68 1.79 1.89 1.79 1.748

Comment avoir confiance en cette estimation ponctuelle?


3
Introduction

Réponse : pour estimer µpop , vous ne pouvez pas simplement donner


la valeur de µéch , mais vous devez l’accompagner de marges d’erreurs.
En d’autres termes , il est nécessaire de lui associer un intervalle qui
contient, avec une certaine probabilité, la vraie valeur du paramètre dans
la population.
L’objet de ce chapitre est de comprendre comment déterminer ces
marges d’erreurs, ou, en termes mathématiques, comment construire un
intervalle de confiance d’un paramètre inconnu .

4
Principe de l’estimation par intervalle de confiance

Principe
• L’estimation par intervalle de confiance consiste à associer à un
échantillon un intervalle aléatoire Iθ dont on a de fortes chances de
croire qu’il contient la vraie valeur du paramètre inconnu θ.
• Un intervalle de confiance Iθ , de risque α ∈ [0, 1] ou bien de niveau
de signification 1 − α, pour un paramètre θ, est un intervalle
aléatoire de la forme [aα , bα ], où (aα , bα ) ∈ R2 , définit comme suit:

P(θ ∈ Iθ ) = P(aα ≤ θ ≤ bα ) = 1 − α

5
Principe de l’estimation par intervalle de confiance

• Le risque α : est la probabilité que le paramètre θ n’appartienne pas


à l’intervalle Iθ , autrement dit c’est la probabilité que l’on se trompe
en affirmant que θ ∈ Iθ . C’est donc une probabilité d’erreur, qui doit
être assez petite. Les valeurs usuelles de α sont 10%, 5%, 1%, . . . ,
etc.
• Le niveau de signification 1 − α : est la probabilité que le paramètre
θ appartient à l’intervalle Iθ .

6
Principe de l’estimation par intervalle de confiance

Il semble alors logique de chercher un intervalle de confiance Iθ pour θ


de la forme [θ̂ − ε , θ̂ + ε], où θ̂ est un estimateur ponctuel sans biais de
θ. Selon la caractérisation ci-dessus ceci revient alors à déterminer les
marges d’erreurs ε > 0 de sorte que :
P(θ̂ − ε < θ < θ̂ + ε) = P(θb1 < θ < θb2 ) = 1 − α
Avec θb1 = θ̂ − ε et θb2 = θ̂ + ε.

7
Principe de l’estimation par intervalle de confiance

Pour toute la suite du cours :

• (X1 , . . . , Xn ), n > 0, un échantillon de taille n.


• Pour un risque α donné, on construira un intervalle de confiance Iθ
dans le cas où l’inconnu θ est :
1. La moyenne µ ∈ R d’une population
2. La variance σ 2 ∈ R d’une population
3. la proportion p d’un caractère qualitatif relatif à une population.

8
Intervalle de confiance de la moyenne

Intervalle de confiance de la moyenne

Dans toute la suite, on considère les estimateurs ponctuels classiques de


µ et de σ 2 respectivement la moyenne empirique et la variance empirique
corrigée (ou modifiée) donnés par :
n
X1 + . . . + Xn 1 X 2
Xn = et Sn2 = (Xi − X n )
n n−1
i=1

9
Intervalle de confiance de la moyenne

Cas des petits échantillons (n < 30) :

Soit (X1 , . . . , Xn ), n > 0, un n-échantillon de loi normale N (µ, σ 2 ), où µ


est la moyenne et σ 2 est la variance.
•σ 2 connue :

Théorème 1
Un intervalle de confiance de seuil (risque) α pour le paramètre µ
de la loi N (µ, σ) lorsque σ 2 est connue est :
σ σ
IC (µ) = [X n − z α2 √ , X n + z α2 √ ]
n n

10
Intervalle de confiance de la moyenne

Démonstration

Par définition de l’intervalle de confiance, on cherche les bornes (b


µ1 , µ
b2 )
tels que :
P(bµ1 < µ < µ b2 ) = 1 − α

De plus, étant donné que l’échantillon est de loi normale N (µ, σ 2 ) alors:
σ 
X n ∼ N µ, √
n

et par conséquent l’idée est d’essayer de construire à partir de X n une


variable aléatoire ∼ N (0, 1). Posons:

Xn − µ
Z= σ ∼ N (0, 1)

n

11
Intervalle de confiance de la moyenne

Posons z α2 tel que :


α
P(Z > z α2 ) =
2
z α2 est dit le quantile de N (0, 1) d’ordre 1 − α2 , on le détermine à partir
de la table de N (0, 1) (lecture inverse de la table).
Par la symétrie de N (0, 1) on a aussi:
α
P(Z < −z α2 ) =
2

12
Intervalle de confiance de la moyenne

Ce qui implique que:


P(−z α2 < Z < z α2 ) = P(Z > −z α2 ) − P(Z > z α2 )
α α
= 1− −
2 2
= 1−α
Alors:
Xn − µ
P(−z α2 < σ < z α2 ) = 1−α

n
σ σ
P(−z α2 √ < X n − µ < z α2 √ ) = 1−α
n n
σ σ
P(−X n − z α2 √ < −µ < −X n + z α2 √ ) = 1−α
n n
σ σ
P(X n − z α2 √ < µ < X n + z α2 √ ) = 1−α
n n
| {z } | {z }
µˆ1 µˆ2

13
Intervalle de confiance de la moyenne

Exemple
On suppose que le poids d’un nouveau né est une variable aléatoire
normale d’écart-type égal à 0, 5 kg. Au mois de janvier 2004 dans
l’hôpital de Charleville-Mézières, on observe 25 enfants nés dont le poids
moyen (la moyenne empirique) xn = 3, 6 kg.

1. Déterminer un intervalle de confiance de niveau de confiance 95%


pour la moyenne m du poids d’un nouveau né?
2. Quel serait le nombre d’enfants observés pour que l’intervalle de
confiance soit de longueur 0, 1 ?

14
Intervalle de confiance de la moyenne

Solution

Nous sommes dans le cadre d’un petit échantillon n = 25 < 30.


La distribution du poids d’un nouveau né est supposée normale, de
variance connue. Alors ,
σ σ
IC (m) = [X n − z α2 √ , X n + z α2 √ ]
n n

On a le niveau de confiance 1 − α = 0.95 → α


2 = 0.025

α
P(Z > z α2 ) =
2
Où z 2 est déterminé à partir de la table normale N (0, 1) par une lecture
α

inverse.

15
Intervalle de confiance de la moyenne

Par conséquent :
0, 5 0, 5
IC (m) = [3, 6 − 1, 96 √ , 3, 6 + 1, 96 √ ] = [3, 404; 3, 796]
25 25

16
Intervalle de confiance de la moyenne

2. Quel serait le nombre d’enfants observés pour que l’intervalle de


confiance soit de longueur 0, 1 ?.
La longueur de l’intervalle de confiance est donnée par:
Longueur de l’intervalle = 2 * Erreur
Avec E = z α2 . √σn

σ
L = 0, 1 = 2 ∗ z α2 . √
n

Par la suite :

4.z 2α .σ 2
n= 2
≈ 384, 16
(0.1)2
Alors on prends la taille n= 385.

17
Intervalle de confiance de la moyenne

•σ 2 inconnue :

Théorème 2
Un intervalle de confiance de seuil α pour le paramètre µ de la loi
N (µ, σ 2 ) lorsque σ 2 est inconnue est :
r r
Sn′2 Sn′2
IC (µ) = [X n − t 2 ,n−1
α , X n + t 2 ,n−1
α ]
n n

18
Intervalle de confiance de la moyenne

Démonstration

On se propose de donner un intervalle de confiance de risque α pour µ


avec σ 2 est inconnue. Une idée naturelle est alors de remplacer σ 2 par
son estimateur ponctuel (sans biais et convergent):
n
1 X
Sn′2 = (Xi − X n )2
n−1
i=1

et par la suite on définit la variable aléatoire suivante:



Xn − µ n(X n − µ)
q = p (attention elle ne suit pas N (0, 1))
Sn′2
Sn′2
n

Par construction, cette variable aléatoire suit une loi de student.



n(X n − µ)
T = p ∼ t(n − 1)
Sn′2 19
Intervalle de confiance de la moyenne

Grâce à la symétrie de la loi de student, on obtient le résultat suivant:

P(−t α2 ,n−1 < T < t α2 ,n−1 ) = 1 − α

avec t α2 ,n−1 désigne le quantile d’ordre 1 − α2 de la loi t(n − 1) à n − 1


ddl, et il est déterminé à partir de la table de Student.

Par conséquent

n(X n − µ)
P(−t α2 ,n−1 < p < t α2 ,n−1 ) = 1−α
Sn′2
r r
Sn′2 Sn′2
P(X n − t α2 ,n−1 < µ < X n + t α2 ,n−1 ) = 1−α
| {z n} | {z n}
µˆ1 µˆ2

20
Intervalle de confiance de la moyenne

Exemple
Le chiffre d’affaire mensuel d’une entreprise suit une loi normale de
moyenne µ et d’écart-type σ inconnus. Sur les 12 derniers mois, on a
observé une moyenne des chiffres d’affaires égale à 10 000 euros avec un

écart-type s = 2000 euros.
1.Donner une estimation de µ par intervalle de confiance au niveau 0, 95.

21
Intervalle de confiance de la moyenne

Solution
Nous sommes dans le cadre d’un petit échantillon n = 12 < 30.
La distribution du chiffre d’affaire mensuel est supposée normale, d’écart

type inconnu mais estimé par s . Alors ,
r r
Sn′2 Sn′2
IC (µ) = [X n − t α2 ,n−1 , X n + t α2 ,n−1 ]
n n
On a le niveau de confiance 1 − α = 0.95 → α
2 = 0.025

α
P(T > t α2 ,12−1 ) =
2
Où t α2 ,11 est déterminé à partir de la table de Student.

22
Intervalle de confiance de la moyenne

Par conséquent:
2000 2000
IC (µ) = [10000−2, 201 √ , 10000+2, 201 √ ] = [8729, 26; 11270, 74]
12 12

23
Intervalle de confiance de la moyenne

Cas des grands échantillons (n ≥ 30) :

•σ 2 connue :

Théorème 3
• Lorsque l’échantillon n’est pas de loi normale mais sa taille
n ≥ 30, alors le Théorème Central Limite (T.C.L) permet de
construire un intervalle de confiance de seuil α pour le paramètre µ,
seulement lorsque σ 2 connue :
σ σ
IC (µ) = [X n − z α2 √ , X n + z α2 √ ]
n n

24
Intervalle de confiance de la moyenne

Exemple
On suppose que le poids d’un nouveau né est une variable aléatoire
d’écart-type égal à 0,5 kg. Le poids moyen des 49 enfants nés au mois de
janvier 2004 dans hôpital de Charleville-Mézières a été de 3,6 kg.
1.Déterminer un intervalle de confiance à 90% pour le poids moyen d’un
nouveau né dans cet hôpital.

25
Intervalle de confiance de la moyenne

Solution
Nous sommes dans le cadre d’un grand échantillon n = 49 > 30.
La variance dans la population est supposée connue avec σ = 0, 5. Alors ,
σ σ
IC (µ) = [X n − z α2 √ , X n + z α2 √ ]
n n

On a le niveau de confiance 1 − α = 0.90 → α


2 = 0.05

α
P(Z > z α2 ) =
2
Où z α2 est déterminé à partir de la table normale N (0, 1) par une lecture
inverse.

26
Intervalle de confiance de la moyenne

Par conséquent :
0, 5 0, 5
IC (m) = [3, 6 − 1, 64 √ ; 3, 6 + 1, 64 √ ] = [3, 483; 3, 717]
49 49

27
Intervalle de confiance de la moyenne


•σ 2 inconnue mais estimée par Sn2 :

Théorème 4
• Pour n ≥ 30, t(n) ≈ N (0, 1), et par la suite un intervalle de
confiance de seuil α pour le paramètre µ de la loi N (µ, σ 2 ) lorsque
σ 2 est inconnue est :
r r
Sn′2 Sn′2
IC (µ) = [X n − z α2 , X n + z α2 ]
n n

28
Intervalle de confiance de la moyenne

Exemple
Dans un centre avicole, des études antérieures ont montré que la masse
d’un œuf choisi au hasard peut être considérée comme la réalisation
d’une variable aléatoire X, de moyenne et de variance inconnus . On
admet que les masses des œufs sont indépendantes les unes des autres.
On prend un échantillon de n = 36 œufs que l’on pèse. La moyenne
empirique est égale à 55.083 et s = 2.683.
Déterminer L’intervalle de confiance au niveau 98% de la masse moyenne
d’un oeuf.

29
Intervalle de confiance de la moyenne

Solution
Nous sommes dans le cadre d’un grand échantillon n = 36 > 30.
σ dans la population est supposé inconnu mais estimé par s = 2.683.
Alors , r r
Sn′2 Sn′2
IC (µ) = [X n − z α2 , X n + z α2 ]
n n
On a le niveau de confiance 1 − α = 0.98 → α2 = 0.01

α
P(Z > z α2 ) =
2
Où z 2 est déterminé à partir de la table normale N (0, 1) par une lecture
α

inverse.

30
Intervalle de confiance de la moyenne

Par conséquent:
2.683 2.683
IC (µ) = [55.083 − 2.32 √ ; 55.083 + 2.32 √ ] = [54.043; 56.123]
36 36

31
Intervalle de confiance de la moyenne

Exercice
Des tests sur un échantillon de taille 10 sur la conductivité thermique
d’un métal ont permis d’obtenir les données suivantes:

41.60 41.48 42.34 41.95 41.86


42.18 41.71 42.26 41.81 42.04

Soit X la conductivité thermique du métal. On suppose que X suit une


loi Normale des paramètres inconnus.

1. Donner un intervalle de confiance de µ de niveau 95%.


2. Supposons que σ 2 = 0.3, déterminer la taille nécessaire de
l’échantillon pour construire un intervalle de confiance pour µ de
niveau de confiance 95% et d’amplitude égale à 0.06.

32
Intervalle de confiance de la moyenne

Solution
Nous sommes dans le cadre d’un petit échantillon n = 10 < 30.
La distribution de la conductivité thermique est supposée normale, de
variance inconnue. Alors ,
r r
Sn′2 Sn′2
IC (µ) = [X n − t α2 ,n−1 , X n + t α2 ,n−1 ]
n n
Calculons d’abord Xn
10
1 X
Xn = Xi = 41, 923
10
i=1

La variance mesurée sur l’échantillon est donnée par :


10
′ 1 X
Sn2 = (Xi − X n )2 = 0.16
10 − 1
i=1

33
Intervalle de confiance de la moyenne

On a le niveau de confiance 1 − α = 0.95 → α


2 = 0.025

α
P(T > t α2 ,n−1 ) =
2
Où t α2 ,n−1 est déterminé à partir de la table Student.

t0.025,9 = 2, 262

Par la suite :
r r
Sn′2 Sn′2
IC (µ) = [X n − t α
2 ,n−1
, X n + t 2 ,n−1
α ]
n n
0.16 0.16
r r
= [41, 923 − 2, 262 , 41, 923 + 2, 262 ]
10 10
= [41, 63; 42, 20]

34
Intervalle de confiance de la moyenne

2. Supposons que σ 2 = 0.3, déterminer la taille nécessaire de


l’échantillon pour construire un intervalle de confiance pour µ de
niveau de confiance 95% et d’amplitude égale à 0.06.

On a :
q
σ2
L’amplitude = 2 *E = 2 * z α2 n = 0.06

Alors
σ2
(0.06)2 = 4z 2α2 ∗
n
Et donc :
n ≈ 1280, 53
On prends la taille n = 1281.

35
Intervalle de confiance de la proportion

Intervalle de confiance de la proportion

Construire un intervalle de confiance de la proportion est la détermination


d’un intervalle pour le paramètre p ∈]0, 1[ de la loi de Bernoulli au vu
d’un échantillon (X1 , . . . , Xn ) ∼ B(p) .
De ce fait, une proportion n’est que la fréquence de la valeur 1 dans
l’échantillon.

On rappelle qu’on a déjà montré qu’un estimateur ponctuel de p est


X
pbn = X n =
n
où X est le nombre de fois où le caractère apparaît dans l’échantillon de
taille n.

36
Intervalle de confiance de la proportion

Or pour un échantillon qui n’est pas normal, la loi de la statistique X n


n’est pas évident de la trouver et par la suite la détermination de
l’intervalle de confiance n’est plus possible.
Mais lorsque n est suffisamment grand, en faveur du Théorème Central
Limite (T.C.L) , on admet le résultat suivant:

Théorème 5
Si np > 5 et n(1 − p) > 5 (ou n assez grand), alors l’intervalle de
confiance de niveau de signification 1 − α pour une proportion p se
présente comme suit:
" r r #
pbn (1 − pbn ) pbn (1 − pbn )
IC (p) = pbn − z α2 , pbn + z α2
n n

37
Intervalle de confiance de la proportion

Exemple
Sur 500 personnes interrogées, 274 ont déclaré qu’elles voteraient pour le
candidat A.

1. Donner une estimation de p la proportion de personnes favorables au


candidat A dans la population par intervalle de confiance au niveau
de signification 95%.
2. Pour quel degré de confiance a-t-on la borne inférieure exactement
égale à 50% ?

38
Intervalle de confiance de la proportion

Solution
On a n = 500 , α = 1 − 0.95 = 0.05 −→ α2 = 0.025
La proportion dans l’échantillon est donnée par :

274
pbn = = 0.548
500
Les hypothèses sont vérifiées, en effet on a:
n > 30 , n.p = 274 > 5 , et n(1 − p) = 226 > 5.
Alors l’intervalle de confiance de la proportion p est donné par :
" r r #
pbn (1 − pbn ) pbn (1 − pbn )
IC (p) = pbn − z 2α , pbn + z 2
α
n n
avec z α2 est déterminée à partir d’une lecture inverse de la table normale
N (0, 1) tel que :
α
P(Z > z α2 ) = = 0.025
2
z α2 = 1.96 39
Intervalle de confiance de la proportion

r r
pbn (1 − pbn ) 0.548(1 − 0.548)
= = 0, 022
n 500
Par conséquent :

IC (p) = [0.548 − 1.96 × 0.022; 0.548 + 1.96 × 0.022] = [0.504; 0.591]

2. Pour quel degré de confiance a-t-on la borne inférieure exactement


égale à 50% ?
On a la borne inférieure de l’IC(p) est :
r
pbn (1 − pbn )
pbn − z α2
n

40
Intervalle de confiance de la proportion

Par conséquent
r r
pbn (1 − pbn ) pbn (1 − pbn )
pbn − z α2 = 0.5 ⇐⇒ pbn − 0.5 = z α2
n n
pbn − 0.5
⇐⇒ z α2 = q
pbn (1−bpn )
n
0.548 − 0.5
⇐⇒ z α2 =
0.022
⇐⇒ z α2 = 2.18

Sachant que z α2 vérifie


α
P(Z > z α2 ) =
2
Par une lecture directe de la table normale on aura α
2 = 0.0146, et par la
suite :
1 − α = 97%

41
Intervalle de confiance de la variance

Intervalle de confiance de la variance :

Le problème est le suivant : il faut encadrer σ 2 , la variance de la


population qui est inconnue. On recherche donc deux valeurs σ12 et σ22
encadrant σ 2 qui vérifie :

P(σ12 < σ 2 < σ22 ) = 1 − α

On distingue deux cas, celui où la moyenne µ est connue et celui où µ


est inconnue :

42
Intervalle de confiance de la variance

• Cas moyenne µ connue

Théorème 5
Un intervalle de confiance de seuil α pour le paramètre σ 2 de la loi
N (µ, σ 2 ) lorsque µ est connue est :
" #
2
nSµ2 nSµ2
IC (σ ) = ,
χ α2 ,n χ1− α2 ,n

43
Intervalle de confiance de la variance

Démonstration
Soit une population normale de variance σ 2 inconnue. La variable
n
X (Xi − µ)2
aléatoire suit une loi du χ2 (n) à n−degrés de liberté, qui
σ2
i=1
n’est pas une loi symétrique. L’idée principale de la construction de
l’intervalle de confiance Iσ2 pour σ 2 , avec un risque α fixé, est la suivante
On cherche χ1− α2 ,n qui vérifie :
α
P(χ2 (n) < χ1− α2 ,n ) =
2
et χ α2 ,n qui vérifie :
α
P(χ2 (n) > χ α2 ,n ) =
2

44
Intervalle de confiance de la variance

Ce qui implique que :


n
!
X (Xi − µ)2 α α
P χ1− α2 ,n < < χ α2 ,n = 1− − =1−α
σ2 2 2
i=1

alors on montre que


 n n 
X X
2 2
 (Xi − µ) (Xi − µ) 
 i=1 i=1
2
= 1−α

P <σ < 
 χ 2 ,n
α χ1− 2 ,n 
α

45
Intervalle de confiance de la variance

n
X (Xi − µ)2
Si on note Sµ2 := l’estimateur utilisé pour estimer σ 2 on
n
i=1
admet que l’intervalle de confiance de la variance est donné par :
" #
2
nSµ2 nSµ2
IC (σ ) = ,
χ α2 ,n χ1− α2 ,n

46
Intervalle de confiance de la variance

Exemple
Une usine fabrique des câbles. La masse maximale en tonnes supportée
par un câble est une variable aléatoire réelle X suivant la loi Normale de
moyenne µ = 12.2 et d’écart-type inconnu. Une étude portant sur un
échantillon de 20 câbles a donné une variance des charges maximales
supportées égales à 2.2 tonnes.

1. Déterminer un intervalle de confiance de σ 2 pour un niveau de


confiance 90%.

47
Intervalle de confiance de la variance

Solution
•n = 20 , α = 0.1 −→ α2 = 0.05.
La masse maximale en tonnes supportée par un câble est une variable
aléatoire réelle X suivant la loi Normale de moyenne µ = 12.2 et de
variance inconnue mais estimée par s 2 = 2, 2.
Alors l’intervalle de confiance de la variance est donné par :
" #
2 2
nS µ nS µ
IC (σ 2 ) = ,
χ α2 ,n χ1− α2 ,n

A.N :
20 × 2.2 20 × 2.2 20 × 2.2 20 × 2.2
   
2
IC (σ ) = , = ,
χ0.05,20 χ0.95,20 31.41 10.85
= [1.40; 4.05]

48
Intervalle de confiance de la variance

• Cas moyenne µ inconnue


On se propose de donner un intervalle de confiance de niveau de
confiance 1 − α pour σ 2 avec µ inconnue. Dans ce cas l’estimateur
ponctuel proposé pour σ 2
n
1 X 2
Sn2 = (Xi − X n )
n−1
i=1

(n−1)S 2
Par conséquent : σ2
n
suit loi du χ2 (n − 1) à (n − 1)−degrés de
liberté. En suivant la même démarche que celle de la situatuion
précédente on aboutit au résultat suivant :

49
Intervalle de confiance de la variance

Théorème 6
Un intervalle de confiance de seuil α pour le paramètre σ 2 de la loi
N (µ, σ 2 ) lorsque µ est inconnue est :

(n − 1)S 2 (n − 1)S 2
 
2
IC (σ ) = ,
χ α2 ,n−1 χ1− α2 ,n−1

50
Intervalle de confiance de la variance

Exercice
On a mesuré la quantité totale d’alcool (exprimée en g/l) contenue dans
un échantillon de 10 bouteilles de cidre doux du marché. On a obtenu
des valeurs x1 , x2 , x3 , . . . , x10 t.q
10
X 10
X
xi = 62 et xi2 = 388.4124
i=1 i=1

On modélise la quantité d’alcool contenue dans une bouteille, par une


variable aléatoire X suivant une loi normale d’espérance µ et de variance
σ 2 , où les paramètres µ et σ étant inconnus.
1. Proposer des estimations ponctuelles de µ et σ 2 à partir de
l’échantillon observé.
2. Construire un intervalle de confiance pour la moyenne au niveau de
confiance de 1 − α = 95%.
3. Déterminer un intervalle de confiance à 80% de la variance σ 2
51
Intervalle de confiance de la variance

4. (a) Si n désigne la taille d’un grand échantillon (n > 50), exprimer en


fonction de n l’amplitude de l’intervalle de confiance de µ au niveau
de confiance de 95%.
(b) On souhaite construire un intervalle de confiance de µ au niveau de
confiance 95% ayant une amplitude de 0, 2 gramme par litre. Quelle
est la taille de l’échantillon sachant que sn2 = 0.6

52
Intervalle de confiance de la variance

Solution
1. X : la quantité d’alcool contenue dans une bouteille ∼ N (µ, σ) , où
les paramètres µ et σ étant inconnus.

10
X 10
X
n = 10 , xi = 62 et xi2 = 388.4124
i=1 i=1

• Un estimateur de la moyenne µ est la moyenne empirique donnée


par :
n
1X
Xn = Xi
n
i=1

Alors, une estimation de la moyenne est :


10
1 X 1
xn = xi = .62 = 6.2
10 10
i=1

53
Intervalle de confiance de la variance

• Un estimateur ponctuel de la variance est donné par la la variance


empirique corrigée :
n
1 X
Sn2 = (Xi − Xn )2
n−1
i=1

Alors une estimation est donnée par :


n
1 X
sn2 = (xi − xn )2
n−1
i=1
n
1 X 2
xi − 2xi xn + xn 2

=
n−1
i=1
n n
1 X 2xn X n
= xi2 − xi + (xn )2
n−1 n−1 n−1
i=1 i=1
A.N:
1 2 × 6.2 10
sn2 = × 388, 4124 − × 62 + (6.2)2 = 0.44
9 9 9
54
Intervalle de confiance de la variance

2. Construire un intervalle de confiance pour la moyenne au niveau de


confiance de 1 − α = 95%.
•n = 10 < 30, σ 2 inconnue, alors l’intervalle de confiance de la
moyenne :
" r r #
Sn2 Sn2
IC (µ) = Xn − t α2 ,n−1 ; Xn + t α2 ,n−1
n n

•α = 0.05 −→ α
2 = 0.025 −→ t0.025,9 = 2.262

Par conséquent :

0.44 0.44
r r
IC (µ) = [6.2 − 2.262 × ; 6.2 + 2.262 × ] = [5.72; 6.67]
10 10

55
Intervalle de confiance de la variance

3. Déterminer un intervalle de confiance à 80% de la variance σ 2 .


•µ inconnue, alors l’intervalle de confiance de la variance :

(n − 1)Sn2 (n − 1)Sn2
 
2
IC (σ ) = ,
χ α2 ,n−1 χ1− α2 ,n−1

•α = 0.2 −→ α
2 = 0.1 −→ 1 − α
2 = 0.9

Par conséquent :

9 × 0.44 9 × 0.44 9 × 0.44 9 × 0.44


   
IC (σ 2 ) = , = ,
χ0.1,9 χ0.9,9 14.684 4, 168

Conclusion :
IC (σ 2 ) = [0.26; 0.95]

56
Intervalle de confiance de la variance

4.a Si n désigne la taille d’un grand échantillon (n > 50), exprimer en


fonction de n l’amplitude de l’intervalle de confiance de µ au niveau
de confiance de 95%.
• Si n > 50, et la variance est inconnue, alors:
" r r #
Sn2 Sn2
IC (µ) = Xn − z α2 ; Xn + z α2
n n

Ce qui implique que


r
Sn2
Amp(IC (µ)) = 2 ∗ z α2
n
Or α = 0.05 −→ α
2 = 0.025 −→ z α2 = 1.96, par conséquent :
r
Sn2
Amp(IC (µ)) = 2 ∗ 1.96
n

57
Intervalle de confiance de la variance

4.b On souhaite construire un intervalle de confiance de µ au niveau de


confiance 95% ayant une amplitude de 0, 2 gramme par litre. Quelle
est la taille de l’échantillon sachant que sn2 = 0.6
On a r
Sn2
Amp(IC (µ)) = 2 ∗ 1.96 = 0.2
n
Alors
(1.96)2 ∗ 0.6
n= ≈ 230.4
(0.1)2
On prend n = 231.

58

Vous aimerez peut-être aussi