Vous êtes sur la page 1sur 16

Dcision et

Prvision
Statistiques
Thierry Verdel (2007)
Chapitre 4
L'estimation
statistique
Le problme trait dans ce chapitre est le suivant : on se trouve en
prsence d'un chantillon et l'on cherche dterminer explicitement
la loi de probabilit dfinissant la population de rfrence dont ces
observations peuvent tre considres comme issues. Nous
admettrons spcifie la forme analytique de la loi de probabilit que
suivent les observations. Dans ces conditions, on se trouve conduit
estimer les paramtres q
1
, q
2
, ... de la loi de probabilit
pHx ; q
1
, q
2
, ...L partir de l'chantillon observ x
1
, x
2
, ... , x
n
,
c'est dire tirer de cet chantillon une information concernant la
valeur des paramtres inconnus. Il s'agit de plus de pouvoir mettre
un jugement sur la qualit de cette information
1. Estimateur et intervalle de confiance
1.1. La loi des grands nombres
Considrons une suite de variables alatoires X
1
, ..., X
i
, ..., X
n
indpendantes, et ayant toutes la
mme loi de probabilit quune variable alatoire X. La loi de probabilit de X peut tre
quelconque de moyenne EHXL = m et de variance s
2
.
Soit M
n
=
1

n
HX
1
+ ... + X
i
+ ... + X
n
L la moyenne arithmtique des variables X
1
, ... , X
i
, ... , X
n
.
Nous avons calcul au chapitre prcdent sa moyenne EHM
n
L = m et sa variance s
2
HM
n
L =
s
2

n
.
Soit ! un nombre choisi arbitrairement aussi petit que lon veut. En utilisant lingalit de
Bienaym-Tchebichef, on peut crire que :
Prob 8 M
n
- m > !< <
s
2

n !
2
et, en posant
s
2

n !
2
= h, on voit qutant donns ! et h aussi petits quon le veut, il est possible de
trouver un nombre N =
s
2

h !
2
tel que n N entraine :
Prob 8 M
n
- m > !< < h.
Cest la loi des grands nombres que lon peut encore noncer ainsi : quand n augmente, la
moyenne M
n
converge en probabilit vers lesprance mathmatique de X. Il est important de bien
prendre conscience de la diffrence entre la notion de convergence classique et celle, toute
nouvelle, de convergence en probabilit.
Dire que M
n
tend au sens classique vers m, ce serait dire quon peut dterminer n tel qu'tant
donn ! aussi petit quon veut : M
n
- m !.
Dire quil y a convergence en probabilit, cest dire que lvenement 8 M
n
- m ! < nest pas
certain, mais que sa probabilit peut tre rendue aussi voisine de 1 quon le veut, condition que n
soit suffisamment grand :
Prob 8 M
n
- m !< 1 -h.
On peut lillustrer par la figure (4.1) : quand n augmente, la distibution de M
n
se resserre autour
de m .
Chapitre 4 : L'estimation statistique 57
(4.1)
1.2. Estimation et estimateur
Pour simplifier la suite de lexpos, nous supposerons que la loi de rfrence dterminer
dpend dun seul paramtre q. Le problme se rduit donc dterminer une fonction des
observations : q
*
Hx
1
, x
2
, ..., x
n
L, aussi voisine que possible de la valeur vraie q qui est inconnue.
On dit alors que q
*
est une estimation de q.
On peut utiliser, pour rsoudre ce problme, la notion destimateur. Etant donn une variable
alatoire T
n
HX
1
, X
2
, ..., X
n
L fonction des variables alatoires X
1
, X
2
, ..., X
n
, on dit quelle
constitue un estimateur de q si :
- son esprance mathmatique tend vers q quand n augmente indfiniment : EHT
n
L
n
q,
- sa variance tend vers 0 quand n augmente indfiniment : E@T
n
- EHT
n
LD
2

n
0.
Dans le cas particulier o EHT
n
L = q quel que soit n, lestimateur T
n
est dit sans biais.
1.3. Estimateur et convergence en probabilit
Pour clairer la comprhension de la dfinition dun estimateur, on peut la rapprocher de celle de
la convergence en probabilit.
Un estimateur T
n
est dit convergent, si T
n
converge en probabilit vers q, quand n augmente
indfiniment, cest--dire si, tant donns deux nombres ! et h aussi petits qu'on le veut, il est
possible de dterminer un nombre N tel que n > N entrane :
Prob 8 T
n
- q > !< < h.
On a alors limportant rsultat suivant : un estimateur T
n
dont lesprance mathmatique tend
vers q et dont la variance tend vers 0, quand n augmente indfiniment, est convergent. La
dmonstration qui suit peut tre omise.
Daprs lingalit de Bienaym-Tchebichef, on a la relation :
Prob 8 T
n
- EHT
n
L <
!

2
< > 1 -4
s
2
HT
n
L

!
2
et a fortiori :
Prob 8 T
n
-q <
!

2
+ q - EHT
n
L < > 1 -4
s
2
HT
n
L

!
2
.
58 Chapitre 4 : L'estimation statistique
Puisque EHT
n
L converge vers q au sens ordinaire de lanalyse, on peut trouver un nombre N
1
tel
que :
EHT
n
L - q <
!

2
pour n > N
1
,
soit, pour une telle valeur de n :
Prob 8 T
n
-q <
!

2
+
!

2
< > 1 - 4
s
2
HT
n
L

!
2
.
Or, puisque s
2
HT
n
L tend vers 0 quand n augmente indfiniment, on peut trouver un nombre N
2
tel que :
s
2
HT
n
L <
h !
2

4
pour n > N
2
.
Par suite, pour n suprieur au plus grand des deux nombres N
1
et N
2
, on aura :
Prob 8 T
n
-q > !< < h .
Ce critre permet de dfinir lefficacit dun estimateur : un estimateur est dautant plus efficace
que sa variance est plus petite.
1.4. Intervalle de confiance d!une estimation
Il reste maintenant dfinir la prcision de lestimation. Considrons, pour cela, la distribution
de la variable alatoire T
n
. Si nous convenons de considrer comme ngligeable un certain seuil de
probabilit a, nous pouvons dterminer un intervalle :
@q - !
1
, q + !
2
D
tel quil lui corresponde la probabilit H1 - aL.
(4.2)
Il rsulte de la dfinition mme de cet intervalle que lon a la probabilit H1 - aL d'observer
l'vnement 8q - !
1
T
n
q + !
2
<.
Cela tant, chaque fois que cette double ingalit est vrifie, cest--dire dans la proportion
H1 - aL des cas, la double ingalit :
T
n
- !
2
q T
n
+ !
1
est, elle aussi, vrifie. Lintervalle :
@ T
n
- !
2
, T
n
+ !
1
D
Chapitre 4 : L'estimation statistique 59
est ainsi un intervalle alatoire auquel peut tre associe la probabilit H1 - aL de recouvrir la
vraie valeur inconnue de q :
Prob 8T
n
- !
2
q T
n
+ !
1
< = 1 - a.
Si maintenant, nous observons les rsultats de lchantillon effectivement prlev et calculons la
valeur q
*
de T
n
pour cet chantillon, lintervalle :
@q
*
- !
2
, q
*
+ !
1
D
est appel intervalle de confiance de lestimation de q, au seuil de probabilit H1 - aL.
Remarquons quil y a une infinit de faons de rpartir la probabilit a, dont lune correspond
un intervalle minimal, mais qui nest pas toujours facile dterminer en pratique. Cest pourquoi
on convient gnralement de rpartir a par moiti de part et d'autre de lintervalle. Cette rpartition
donne lieu lintervalle minimum dans le cas particulier o la densit de probabilit est
symtrique et dcrot pour des valeurs qui s'loignent de q.
(4.3)
1.5. Estimation d!une proportion
Considrons une population qui contient une proportion v inconnue de pices dfectueuses. La
variable alatoire K
n
, nombre de pices dfectueuses dans un chantillon de taille n, suit une loi
binomiale de moyenne n v et de variance n vH1 - vL. Si nous considrons maintenant la variable
frquence
K
n

n
, elle a pour moyenne v et pour variance
vH1-vL

n
.
K
n

n
a donc les proprits dun
estimateur sans biais de v HEH
K
n

n
L = vL et convergent Js
2
H
K
n

n
L
n
0N.
Pour estimer v, il suffit donc, ayant prlev un chantillon de taille n dans la population, de
calculer le nombre k
n
de pices dfectueuses puis :
v
*
=
k
n

n
.
Pour dterminer lintervalle de confiance, au risque a, de cette estimation, soient c
1
HvL et c
2
HvL
les nombres tels que pour chaque valeur possible de v :
a

2

k=0
c
1
C
n
k
v
k
H1 - vL
n-k
et
a

2

k=c
2

C
n
k
v
k
H1 -vL
n-k
Il est alors possible de construire le graphe ci-dessous en portant v en abcisse et
c
1
HvL

n
ou
c
2
HvL

n
en ordonne. La surface comprise entre les deux courbes est ainsi le lieu des valeurs possibles de
k

n
pour lensemble des valeurs possibles de v, lorsquon nglige le seuil de probabilit a.
60 Chapitre 4 : L'estimation statistique
(4.4)
Lisant maintenant le graphique suivant lhorizontale dordonne v
*
=
k

n
, on peut
immdiatement obtenir lintervalle de confiance @v
1
, v
2
D correspondant cette estimation.
1.6. Estimation d!une moyenne
Etant donne une population de moyenne m inconnue et de variance s
2
connue, soit M
n
la
variable alatoire moyenne dun chantillon de taille n. On a montr que EHM
n
L = m et
s
2
HM
n
L =
s
2

n
. M
n
constitue donc un estimateur sans biais et convergent de m. Par consquent,
ayant prlev un chantillon, sa moyenne est une estimation de m :
m = m
*
.
Si ce rsultat est absolument gnral et quil est, en particulier, indpendant de la forme
analytique de la loi de probabilit suivie par les observations, la dtermination dun intervalle de
confiance ncessite la connaissance de cette forme. Admettons quil sagisse dune loi normale, de
variance s
2
connue.
Il en rsulte que M
n
suit aussi une loi normale de moyenne m et dcart-type
s

!!!
n
. Etant donn
un seuil de probabilit a, on peut crire :
Prob :m - u
a2

s

!!!
n
< M
n
< m + u
a2

s

!!!
n
> = 1 - a
o u
a2
est lu dans la table de la loi normale rduite de telle faon que :
Prob 8 U > u
a2
< = a .
Lintervalle de confiance de m est donc :
m
*
- u
a2

s

!!!
n
< m < m
*
+ u
a2

s

!!!
n
Chapitre 4 : L'estimation statistique 61
(4.5)
Bien souvent la variance s
2
nest pas connue. Nous verrons, dans la suite du chapitre, comment
procder dans ce cas.
Notons que le thorme central limite permet de gnraliser ces rsultats une loi de probabilit
quelconque, mais condition que n soit suffisamment grand (quelques dizaines en pratique).
1.7. Estimation d!une variance
Soit une population quelconque de variance inconnue. Soit S
n
2
la variable alatoire : variance
d'un chantillon de taille n, qui scrit :
S
n
2
=
1

n

i=1
n
HX
i
-M
n
L
2
o M
n
dsigne la variable alatoire moyenne. On peut encore crire :
S
n
2
=
1

n

i=1
n
@HX
i
- mL -HM
n
- mLD
2
,
et, en dveloppant le carr (moyenne des carrs moins carr de la moyenne) :
S
n
2
=
1

n

i=1
n
HX
i
- mL
2
- HM
n
- mL
2
.
Calculons, sous cette dernire forme, EHS
n
2
L. Il vient, compte tenu de la linarit de l'oprateur
Esprance :
EHS
n
2
L =
1

n

i=1
n
E@HX
i
- mL
2
D - E@HM
n
- mL
2
D,
et, en notant que E@HX
i
- mL
2
D et E@HM
n
- mL
2
D sont respectivement les variances de X
i
et de M
n
:
EHS
n
2
L = s
2
-
s
2

n
=
n-1

n
s
2
.
On pourrait montrer, dautre part, mais les calculs sont assez laborieux, que :
s
2
HS
n
2
L = H
n-1

n
L
2

m
4
-s
4

n
+2
n-1

n
3
s
4
,
o m
4
dsigne le moment centr dordre 4, E@HXi - mL
4
D.
Il en rsulte que S
n
2
est un estimateur convergent de s
2
, mais quil nest pas sans biais. Le
passage un estimateur sans biais ne prsente toutefois aucune difficult. Il suffit de considrer la
quantit :
n

n-1
S
n
2
dont lesprance mathmatique est :
EH
n

n-1
S
n
2
L =
n

n-1
EHS
n
2
L = s
2
.
62 Chapitre 4 : L'estimation statistique
Nous noterons, par la suite s
*2
cette estimation sans biais de s
2
:
s
*2
=
n

n-1
s
2
=

i=1
n
Hx
i
-mL
2

n-1
qui est calcule directement par presque toutes les calculettes effectuant des calculs statistiques.
Le calcul de lintervalle de confiance, dans le cas dune population normale, ncessite la
connaissance pralable dune nouvelle loi dchantillonnage que nous allons tablir maintenant.
2. Intervalle de confiance de la variance inconnue d'une
population normale
2.1. Loi du c
2
Soient U
1
, U
2
, ..., U
n
, n variables alatoires indpendantes qui suivent des lois normales
rduites. Posons :
c
n
2
= U
1
2
+ U
2
2
+ ... + U
n
2
.
La variable c
n
2
suit une loi appele loi du c
2
(khi deux) n degrs de libert. Nous allons
tablir la forme analytique de cette loi qui joue un rle essentiel en statistique, et dont il faut retenir
la dfinition, mais le calcul qui suit nest, quant lui, pas essentiel.
Nous nous proposons de dterminer la loi de probabilit de la variable c
n
2
; mais nous allons
d'abord dterminer la loi de probabilit de la variable c
n
, cest--dire que nous allons calculer la
probabilit pour que c
n
se trouve compris dans lintervalle @c, c + cD.
La probabilit pour quon ait la fois :
u
1
U
1
< u
1
+ u
1
, u
2
U
2
< u
2
+ u
2
, ... et u
n
U
n
< u
n
+ u
n

scrit, U
1
, U
2
, ..., U
n
tant indpendantes :
1

!!!!!!!
2 p

-
u
1
2

2
u
1
...
1

!!!!!!!
2 p

-
u
n
2

2
u
n
=
1

H2 pL
n2

-
1

2
Hu
1
2
+...+u
n
2
L
u
1
u
2
....u
n
Ce rsultat peut sinterprter gomtriquement de manire trs simple. Considrons, dans
l'espace n dimensions, le point P de coordonnes HU
1
, U
2
, ..., U
n
L. La probabilit pour que P
tombe lintrieur dun certain volume v dfini autour du point P est :
1

H2 pL
n2

-
1

2
OP
2
v.
Dans ces conditions, la probabilit pour que la variable c
n
soit comprise entre les deux valeurs
c et c + c est gale la probabilit pour que P tombe dans la rgion comprise entre les deux
sphres de centre O et de rayons c et c + c. Or la densit de probabilit est constante dans cette
rgion et elle est gale :
1

H2 pL
n2

-
c
2

2
.
Chapitre 4 : L'estimation statistique 63
Dautre part, le volume de la sphre de centre O et de rayon c est de la forme k c
n
o k est une
certaine constante, si bien que le volume compris entre les deux sphres de rayons c et c + c est
gal : v = k n c
n-1
c. On obtient alors finalement :
Prob 8c c
n
< c +c< =
k n

H2 pL
n2
c
n-1

-
c
2

2
c.
Pour obtenir maintenant la loi de probabilit de la variable c
n
2
, faisons le changement de
variable x = c
2
. On obtient :
Prob 8x c
n
2
< x + x< =
k n

2 H2 pL
n2
x
H
n

2
-1L

-
x

2
x
qui dfinit la loi de probabilit cherche, la constante k prs.
Pour calculer cette constante, on peut crire que : Prob 8 c
n
2
0< = 1, soit :
k n

2 H2 pL
n2

x
H
n

2
-1L

-
x

2
x = 1,
do finalement lexpression de la loi du c
2
:
Prob 8x c
n
2
< x + x< =
x
Hn2 -1L

-x2

x
Hn2 -1L

-x2
x
x.
Notons quon dfinit en mathmatiques les fonctions G (gamma) dont les quations sont de la
forme : GHaL =

0

x
a-1

-x
x, o a est une constante positive. Lintgrale au dnominateur de l
expression de la loi de probabilit du c
2
peut alors scrire :

x
H
n

2
-1L

-
x

2
x = 2
H
n

2
L
GH
n

2
L, et on
peut la calculer partir des valeurs des fonctions G.
Il existe des tables de la loi du c
2
qui donnent gnralement, pour chaque valeur du nombre n de
degrs de libert, la valeur x telle que : Prob 8 c
n
2
> x< = a, o a est une probabilit donne : 1 %,
5 %, ... Il est par consquent inutile de retenir la formule de la loi du c
2
.
Par contre, il est indispensable de connatre les proprits suivantes de la loi du c
2
.
2.1.1. Sommes de variables suivant des lois du c
2
Si c
1
2
et c
2
2
sont deux variables indpendantes qui suivent des lois du c
2
respectivement n
1
et
n
2
degrs de libert, leur somme H c
1
2
+ c
2
2
L suit une loi du c
2
Hn
1
+ n
2
L degrs de libert.
Cela rsulte immdiatement de la dfinition de la loi du c
2
.
2.1.2. Moyenne et variance d!une variable qui suit une loi du c
2
La moyenne dune variable suivant une loi du c
2
n degrs de libert est gale n et sa variance
est gale 2 n.
En effet, U tant une variable centre rduite, sa variance est s
2
HUL = EHU
2
L -@EHULD
2
= 1
(EHUL tant gal 0) et, dautre part, lesprance dune somme est gale la somme des
esprances, do :
EH c
n
2
L = EHU
1
2
L + EHU
2
2
L + ... + EHU
n
2
L = n.
Pour calculer la variance, on sait que la variance dune somme de variables indpendantes est
gale la somme des variances :
64 Chapitre 4 : L'estimation statistique
s
2
H c
n
2
L = s
2
HU
1
2
L + s
2
HU
2
2
L + ... + s
2
HU
n
2
L = n s
2
HU
2
L.
et que la variance est gale lesprance du carr moins le carr de lesprance :
s
2
HU
2
L = EHU
4
L - @EHU
2
LD
2
.
Enfin, on montre facilement, en intgrant par parties, que :
EHU
4
L =

-

u
4

-
u
2

2
u = 3.
Do :
s
2
H c
n
2
L = n H3 - 1L = 2 n.
2.2. Loi de la variance d!un chantillon extrait d!une population normale
dont l'cart-type est connu
Nous allons, en fait, chercher la loi de la quantit :
i=1
n
HX
i
- M
n
L
2
qui figure au numrateur de
la variance et tablir un rsultat dont on pourra dduire immdiatement l'intervalle de confiance
d'une variance. La dmonstration peut tre omise, mais les rsultats suivants sont importants.
Etant donn un chantillon de taille n qui est extrait dune population normale de variance gale
s
2
, la variable alatoire :

i=1
n
HX
i
-M
n
L
2

s
2
suit une loi du c
2
Hn - 1L degrs de libert.
Et, dautre part, les variables M
n
et
i=1
n
HX
i
-M
n
L
2
sont des variables indpendantes. Cette
dernire proprit sera utilise un peu plus loin .
Nous avons montr, au cours de ce chapitre, que lon peut crire :

i=1
n
HX
i
-M
n
L
2
=
i=1
n
X
i
2
-n M
n
2
Soit alors P le point de coordonnes HX
1
, X
2
, ..., X
n
L, et soient HY
1
, Y
2
, ..., Y
n
L ses nouvelles
coordonnes aprs un changement de coordonnes orthonormales, que nous allons choisir tel que
la coordonne Y
n
soit justement gale
!!!
n M
n
. Dans ces conditions,
i=1
n
X
i
2
-n M
n
2
sera gal

j=1
n-1
Y
i
2
, cest--dire la somme de Hn -1L variables, dont nous allons montrer quelles sont
indpendantes et quelles ont mme variance s
2
.
Ces conditions sont ralises si laxe des Y
n
est choisi passant par le vecteur unitaire dont toutes
les coordonnes sont gales
1

!!!
n
dans lancien systme daxes. Les nouvelles coordonnes de P
scrivent :
Y
1
= a
1
1
X
1
+ ... + a
i
1
X
i
+ ....+ a
n
1
X
n
...
Y
j
= a
1
j
X
1
+ ... + a
i
j
X
i
+ ....+ a
n
j
X
n
...
Y
n-1
= a
1
n-1
X
1
+... + a
i
n-1
X
i
+....+ a
n
n-1
X
n
Y
n
=
1

!!!
n
X
1
+ ... +
1

!!!
n
X
i
+ ....+
1

!!!
n
X
n
Chapitre 4 : L'estimation statistique 65
Les a
i
j
sont dtermins dune infinit de faons par les relations :
a
1
j

!!!
n
+ ... +
a
i
j

!!!
n
+ ... +
a
n
j

!!!
n
= 0
a
1
i
a
1
j
+ ... +a
i
i
a
i
j
+ ... +a
n
i
a
n
j
= 0
Ha
1
j
L
2
+ ... + Ha
i
j
L
2
+ ... + Ha
n
j
L
2
= 1
Dans ces conditions, on montre facilement que les nouvelles variables Y
j
suivent des lois
normales, indpendantes, centres et dcart-type s puisque : EHY
j
L = 0, EHY
j
Y
j'
L = 0 et
E@HY
j
L
2
D = s
2
. On a, dautre part :
j=1
n
Y
j
2
=
i=1
n
X
i
2
puisquil sagit dun changement de
coordonnes orthonormales. Comme Y
n
a t choisi de telle sorte que : Y
n
2
= n M
n
2
, la variable :

i=1
n
HX
i
-M
n
L
2

s
2
=

i=1
n
X
i
2
-n M
n
2

s
2
peut sexprimer en fonction des carrs de Hn - 1L variables normales, rduites, indpendantes :

i=1
n
HX
i
-M
n
L
2

s
2
=
j=1
n-1
I
Y
j

s
M
2
Elle suit donc une loi du c
2
Hn - 1L degrs de libert. Et la variable Y
n
tant indpendante des
variables Y
1
, ... , Y
n-1
, M
n
et
i=1
n
HX
i
-M
n
L
2
sont des variables indpendantes.
2.3. Intervalle de confiance de la variance inconnue d'une population
normale
Soit une population normale de variance s
2
inconnue. La variable alatoire

i=1
n
HX
i
-M
n
L
2

s
2
suit une
loi du c
2
Hn - 1L degrs de libert.
(4.6)
Se fixant un seuil de probabilit a, il est possible de dterminer lintervalle @ c
1
2
, c
2
2
D tel que :
c
1
2
<

i=1
n
HX
i
-M
n
L
2

s
2
< c
2
2
avec la probabilit H1 -aL.
On en dduit lintervalle de confiance pour s
2
, au risque a :

i=1
n
Hx
i
-mL
2

c
2
2
< s
2
<

i=1
n
Hx
i
-mL
2

c
1
2
,
ou encore :
n s
2

c
2
2
< s
2
<
n s
2

c
1
2
.
66 Chapitre 4 : L'estimation statistique
3. Intervalle de confiance de la moyenne inconnue d'une
population normale d'cart-type inconnu
3.1. Loi de Student
Considrons Hn + 1L variables alatoires normales, rduites, indpendantes entre elles.
Dsignons les par U, U
1
, ..., U
i
, ..., U
n
. La variable :
T
n
=
U

"################ ###### 1

n

i=1
n
U
i
2
suit, par dfinition, une loi de Student n degrs de libert.
En remarquant que :
i=1
n
U
i
2
suit une loi du c
2
n degrs de libert, on peut encore crire T
n
sous la forme :
T
n
=
U

!!!!!!!!!!!
c
n
2
n
,
o U et c
n
2
sont des variables indpendantes qui suivent respectivement une loi normale rduite
et une loi du c
2
n degrs de libert.
Pour n = 1, la loi de Student sidentifie une loi appele la loi de Cauchy connue pour navoir
ni moyenne, ni variance finies. On montre dautre part que, lorsque n , la loi de Student tend
vers une loi normale rduite. Mais, pour n fini, elle est plus tale que la loi normale, sa variance
(pour n > 2) tant gale
n

n-2
> 1.
Il existe des tables donnant, pour un nombre de degrs de libert donn, et pour des seuils de
probabilit a fixs les valeurs t telles que : Prob 8 T > t< = a.
3.2. Loi de la moyenne d!un chantillon extrait d!une population
normale d!cart-type inconnu
En notant s
*2
lestimateur sans biais de s
2
:
s
*2
=
n

n-1
s
2
=

i=1
n
Hx
i
-mL
2

n-1
,
nous allons montrer que la quantit :
t =
m-m

s
*

!!!
n
est une ralisation dune variable de Student Hn - 1L degrs de libert.
En effet, la variable :
U =
M
n
-m

s
!!!
n
suit une loi normale rduite puisque, si les X
i
suivent une loi normale de moyenne m et
d'cart-type s, M
n
suit une loi normale de moyenne m et cart-type
s

!!!
n
. Dautre part, la variable :
Chapitre 4 : L'estimation statistique 67
c
n-1
2
=

i=1
n
HX
i
-M
n
L
2

s
2
suit une loi du c
2
Hn - 1L degrs de libert. Et ces deux variables sont indpendantes .
Donc, la variable :
T =
U

!!!!!!!!!!!!!!!! !!!!!!
c
n-1
2
Hn-1L
=
M
n
-m

"################ ########
i=1
n
HXi -Mn L
2

n-1

!!!
n
suit une loi de Student Hn - 1L degrs de libert.
3.3. Intervalle de confiance de la moyenne inconnue d!une population
normale d!cart-type inconnu
Soit t
a2
la valeur lue dans la table de Student Hn - 1L degrs de libert, correspondant au
risque a rparti symtriquement. Il rsulte immdiatement de ce qui prcde que l'intervalle de
confiance, au risque a, de la moyenne inconnue m (avec m
*
= m, son estimation) est le suivant :
m
*
- t
a2

s
*

!!!
n
< m < m
*
+ t
a2

s
*

!!!
n
expression dont la forme est la mme que celle de lintervalle de confiance tabli dans le cas o l
cart-type s est connu :
m
*
- u
a2

s

!!!
n
< m < m
*
+ u
a2

s

!!!
n
(4.7)
68 Chapitre 4 : L'estimation statistique
Exercices du chapitre 4
Exercice 1
Sassurer que lon connat parfaitement bien les rponses aux questions suivantes.
a) Dfinition dune variable normale rduite partir dune variable normale quelconque ?
b) Dfinition de la loi du c
2
?
c) Dfinition de la loi de Student ?
d) Quelle est la loi qui fait intervenir la moyenne dun chantillon et les paramtres de la loi
normale de rfrence ?
e) Comment estimer lcart-type de la loi de rfrence
- si sa moyenne est connue,
- si elle nest pas connue ?
f) Quelle est la loi qui fait intervenir la variance de la loi de rfrence et son estimation ?
g) Que devient la loi prcise en d) si lcart-type de la loi de rfrence nest pas connu et quil
faille lestimer ?
Exercice 2
On a mesur la capacit (en microfarad) de 25 condensateurs et calcul la moyenne m = 2.086
et lcart-type s = 0.079. Dterminer les intervalles de confiance de l'estimation de la moyenne m
de la population normale de rfrence, en choisissant un risque de 5 %, puis de 1 %. Est-il normal
que le second soit plus grand que le premier ?
Exercice 3
L'airbag (ou coussin gonflable) est un systme de scurit de plus en plus souvent install dans
les automobiles. Son gonflement est assur par un dispositif pyrotechnique dont les
caractristiques importantes sont la moyenne et lcart-type du dlai entre la mise feu et
l'explosion. Lors de ltude dun certain type de dispositif d'allumage, les rsultats des mesures,
effectues sur 10 exemplaires, ont t (en millisecondes) : {28, 28, 31, 31, 33, 30, 31, 27, 32, 29}.
a) Calculer, au risque 5%, lintervalle de confiance de la moyenne du dlai si on connait
l'cart-type de la population de rfrence et qu'il est gal 2.
b) Calculer ce mme intervalle si on ne connat pas l'cart-type de la population de rfrence.
c) Calculer, au mme risque, lintervalle de confiance de la variance du dlai, dont on dduira
celui de l'cart-type dans le cas o on ne connait pas l'cart-type de la population de rfrence.
Chapitre 4 : L'estimation statistique 69
Exercice 4
Les poids de pices usines en cuivre sont distribus normalement. Ayant prlev 9 pices, on a
obtenu les poids suivants en grammes : 18.457 ; 18.434 ; 18.444 ; 18.461 ; 18.453 ; 18.447 ;
18.452 ; 18.440 ; 18.443. Calculer m et s
2
, puis les intervalles de confiance au risque 5 % de la
moyenne m et de la variance s
2
inconnues.
Exercice 5
Pour estimer la porosit dun certain matriau, on a fait 10 mesures et calcul m = 94 et s
2
= 4.
Dterminer lintervalle de confiance au risque 5 % de m. Combien faudrait il faire de mesures pour
que cet intervalle soit de ! 0.5 seulement ?
Exercice 6
Un fabricant de piles lectriques indique sur ses produits que la dure de vie moyenne de ses
piles est de 200 heures. Une association de consommateurs prlve au hazard un chantillon de
100 piles et observe une dure de vie de 190 heures en moyenne avec un cart type de 30 heures.
S'agit-il de publicit mensongre ?
Exercice 7
On a mesur les dures de vie en heures de fonctionnement de 10 tubes electroniques du mme
type. On a obtenu les rsultats suivants : 26 ; 31 ; 34 ; 40 ; 49 ; 60 ; 72 ; 85 ; 123 ; 179. Trouver
une estimation sans biais du taux de dfaillance, en admettant le modle du processus de Poisson.
70 Chapitre 4 : L'estimation statistique