Vous êtes sur la page 1sur 107

Dpartement de Mathmatiques et Informatique

Abdelhamid El Mossadeq
Professeur lEHTP

A. El Mossadeq
Mai 2008

TABLE DES MATIRES

1.Statistiqueetstructurestatistique

2.Fonctiondevraisemblance

2.1.Structurestatistiquediscrte

2.2.Structurestatistiquecontinue

3.Statistiquesexhaustives

4.Informationconcernantunparamtre

4.1.Matricedinformation

4.2.IngalitdeCramerRao

5.Estimateurs

6.Lestimationparlamthodedelavraisemblance
7.Lestimationponctuelle

7.1.Estimationponctuelleduneproportion
7.2.Estimationponctuelledunemoyenne
7.3.Estimationponctuelledunevariance

8.Lestimationparintervalledeconfiance

8.1.Intervalledepari

8.2.Lessondages

8.3.Intervalledeconfiancedunevariance
8.4.Intervalledeconfiancedunemoyenne

8.4.1.n30

8.4.2.n<30

9.Exercices

1
3
3
3
5
11
12
18
20
27
31
31
32
32
33
33
36
37
39
39
40
42

Structures Statistiques et Estimation

A. El Mossadeq

1. Statistiques et Structures Statistiques


Dnition 1

Soit X un ala dni sur un espace probabilis ( ; T ;P ) valeurs dans un espace


probabilisable (E; B) :
(X1 ; :::; Xn ) est un chantillon de taille n de variable parente X; ou plus simplement un n-chantillon issu de X , si X1 ; :::; Xn sont n alas indpendants qui
suivent la mme loi que X:

Dnition 2

Soit (X1 ; :::; Xn ) un n-chantillon issu dun ala X dni sur un espace probabilis ( ; T ;P ) valeurs dans un espace probabilisable (E; B) et soit g un ala
dni sur (E; B)n :
Lala g (X1 ; :::; Xn ) est appel une statistique.
La loi de g (X1 ; :::; Xn ) est appel une distribution dchantillonnage.

Exemple 1

Soit (X1 ; :::; Xn ) un n-chantillon issu dune variables alatoire X:


Les variables alatoires :
8
n
X
>
1
>
>
M =
Xi
>
>
n i=1
>
<

>
>
>
>
2
>
>
: S

1X
(Xi
n i=1

M )2

sont des statistiques.


M est la moyenne empirique et S 2 est la variance empirique.

Dnition 3

Soit P une famille de lois de probabilit sur un espace probabilisable ( ; T ).


Le triplet ( ; T ;P) est appel une structure statistique.
1

A. El Mossadeq

Structures Statistiques et Estimation

Remarque 1

Le plus souvent, la famille de lois de probabilit P est dcrite laide dun


paramtre appartenant un sous ensemble de Rp , p 1: On crit alors :

P = fP j

g)

et la structure statistique scrit :

( ; T ; fP j
Exemple 2

Soit X une variable alatoire de P oisson de paramtre ,

>0:

p (!) =

!!

o ! 2 N.
La structure statistique associe est (N; fp j

> 0g) :

Exemple 3

Soit X une variable alatoire exponentielle de paramtre ,


8
si x 0
< 0
f (x) =
:
exp x si x > 0

La structure statistique associe est (R; BR ; ff j

>0:

> 0g) :

Dnition 4

On appelle un r-chantillon dune structure statistique ( ; T ; fP j


structure produit :

( ; T ; fP j

g)r = (

rT

;f

rP

g)

g), la

Structures Statistiques et Estimation

A. El Mossadeq

2. Fonction de Vraisemblance
2.1. Structure Statistique Discrte
Dnition 5

Soit ( ; fp j > 0g) une structure statistique discrte.


On appelle fonction de vraisemblance, de cette structure, la fonction numrique
L dnie pour tout ( ; x) 2
par :

L ( ; !) = p (!)
La fonction de vraisemblance dun r-chantillon de cette structure est dnie
r
pour tout ( ; x1 ; :::; xr ) 2
par :

L ( ; ! 1 ; :::; ! r ) =

r
Y

p (! i )

i=1

Exemple 4

Si (X1 ; :::; Xr ) est un r-chantillon issu dune variable alatoire de P oisson de


paramtre , > 0, sa fonction de vraisemlance est :

L ( ; ! 1 ; :::; ! r ) =

r
Y

r
P

!i

i=1

p (! i ) =

i=1

! 1 !:::! r !

2.2. Structure Statistique Continue


Dnition 6

Soit (Rn ; BRn ; fP j > 0g) une structure statistique dans laquelle les probabilits P sont dnies partir de densits f .

A. El Mossadeq

Structures Statistiques et Estimation

On appelle fonction de vraisemblance, de cette structure, la fonction numrique


L dnie pour tout ( ; x) 2
Rn par :

L ( ; x) = f (x)
La fonction de vraisemblance dun r-chantillon de cette structure est dnie
pour tout ( ; x1 ; :::; xr ) 2
(Rn )r par :

L ( ; x1 ; :::; xr ) =

r
Y

f (xi )

i=1

Exemple 5

Si (X1 ; :::; Xr ) est un r-chantillon issu dune variables alatoire exponentielle


de paramtre , > 0, sa fonction de vraisemlance est :

L ( ; x1 ; :::; xr )

r
Y

f (xi )

i=1

r
X

exp

xi

i=1

; xi > 0 ; 1

Exemple 6

Si (X1 ; :::; Xr ) est un r-chantillon issu dune variables alatoire qui suit la loi
uniforme sur lintervalle [0; ], > 0, sa fonction de vraisemlance est :

L ( ; x1 ; :::; xr )

r
Y

f (xi )

i=1

r;

xi 2 [0; ] ; 1

Structures Statistiques et Estimation

A. El Mossadeq

3. Statistiques Exhaustives
Soit ( ; T ;P ) un espace probabilis et T une sous-tribu de T .
Si A est un vnement de T et

la fonction caractristique de A,

j T ], que lon note P [A j T ], sappelle


la probabilit conditionnelle de A relativement la sous-tribu T :
P [A j T ] est une variable alatoire dnie sur ( ; T ) dune faon unique
(P -p.p) par :
Z
Z
P [A j T ] dP =
A dP
lesprence conditionnelle E [

P [AB]

pour tout B 2 T :

Si T est la sous-tribu engendre par une partition A1 ; :::; Ar de

, alors :

P [A j T ] = P [A j Ai ] sur Ai
cest dire :

P [A j T ] =

r
X
i=1

P [A j Ai ]

Ai

Si T est un ala dni sur un espace probabilis ( ; T ;P ) valeurs dans


un espace probabilisable (E; B), on dnit la probabilit conditionnelle
de A relativement T par :

P [A j T ] = P A j T

(B)

et comme :

P [A j T ] = u T = u (T )
alors :

P [A j T = t] = u (t)

A. El Mossadeq

Structures Statistiques et Estimation

Dnition 7

Soit ( ; T ; fP j 2 g) une structure statistique.


Une sous-tribu T de T est dite exhaustive pour la famille fP j 2 g si pour
tout A dans T , la probabilit conditionnelle P [A j T ] est indpendante de :

Dnition 8

On dit que la statistique T dnie sur ( ; T ; fP j 2 g) valeurs dans un


espace probabilisable (E; B) est exhaustive pour la famille fP j 2 g si la
sous tribu T 1 (B) est exhaustive pour cette famille.
Une statistique exhaustive est appele aussi un rsum exhaustif.

Proposition 1

Soit ( ; fp j 2 g) une structure statistique discrte.


Une statistique T dnie sur ( ; T ; fP j 2 g) valeurs dans un espace
probabilisable (E; B) est exhaustive pour la famille fP j 2 g si et seulement
si il existe une fonction positive g dnie sur
et une fonction h dnie sur
telle que pour tout ( ; !) 2
on ait :

L ( ; !) = g ( ; T (!)) h (!)
Preuve 1

Supposons T exhaustif.
Si :

P [T = T (!)] = 0
il su t de prendre :

g ( ; T (!)) = 0
et :

h (!) = 0

Structures Statistiques et Estimation

A. El Mossadeq

Si :

P [T = T (!)] 6= 0
alors :

L ( ; !)

P [f!g \ fT = T (!)g]

P [T = T (!)] P [! j T = T (!)]

On peut poser donc :

g ( ; T (!)) = P [T = T (!)]
et :

h (!) = P [! j T = T (!)]
puisque daprs lexhaustuvit, cette probabilit conditionnelle ne dpend
pas de .
Inversement, supposons que pour tout ( ; !) 2

on a :

L ( ; !) = g ( ; T (!)) h (!)
Il su t de prouver que pour tout (!; t) 2

ne dpend pas de :

E , la probabilit P [! j T = t]

En eet, supposons :

P [T = t] 6= 0
si :

T (!) 6= t
alors :

P [! j T = t]

P [f!g \ fT = tg]
P [T = t]
0

=
=

A. El Mossadeq

Structures Statistiques et Estimation

si :

T (!) = t
alors :

P [! j T = t]

P [f!g \ fT = tg]
P [T = t]
g ( ; T (!)) h (!)
P
g ( ; T (!)) h (!)

=
=

f!2 jT (!)=tg

h (!)
P

h (!)

f!2 jT (!)=tg

Exemple 7

Soit ( ; fp j 2 g) une structure statistique discrte.


Les familles de lois exponentielles :
" k
#
X
L ( ; !) = exp
i ( ) ai (!) + ( ) + b (!)
i=1

admettent des rsums exhaustifs.

Exemple 8

Soit X une variable alatoire de Bernouilli de paramtre , 0 <

L ( ; !) = exp [(1

!) ln (1

<1:

) + ! ln ]

Si (X1 ; :::; Xr ) est un r-chantillon de cette structure alors :

L ( ; ! 1 ; :::; ! r ) = exp
Posons :

r
X

[(1

! i ) ln (1

i=1

1X
T (! 1 ; :::; ! r ) =
!i
r i=1
8

) + ! i ln ]

Structures Statistiques et Estimation

A. El Mossadeq

alors :

L ( ; ! 1 ; :::; ! r )

exp

r
X

[(1

! i ) ln (1

) + ! i ln ]

i=1

=
=

exp r [(1 T (! 1 ; :::; ! r )) ln (1


g [ ; T (! 1 ; :::; ! r )]

) + T (! 1 ; :::; ! r ) ln ]

T est alors un rsum exhaustif pour la famille des lois de Bernouilli de


paramtre , 0 < < 1:

Proposition 2

Soit (Rn ; BRn ; fP j > 0g) une structure statistique dans laquelle les probabilits P sont dnies partir de densit f .
Une statistique T dnie sur (Rn ; BRn ; fP j > 0g) valeurs dans (Rs ; BRs )
est exhaustive pour la famille fP j 2 g si et seulement si il existe une fonction
positive g dnie sur
Rs mesurable pour tout x dans et une fonction
positive et mesurable h dnie sur Rn telle que pour tout ( ; x) 2
Rn on
ait :

L ( ; x) = g ( ; T (x)) h (x)
Preuve 2

Admis

Exemple 9

Soit (Rn ; BRn ; fP j > 0g) une structure statistique dans laquelle les probabilits P sont dnies partir de densit f .
Les familles de lois exponentielles :
" k
#
X
L ( ; x) = exp
i ( ) ai (x) + ( ) + b (x)
i=1

admettent des rsums exhaustifs.

A. El Mossadeq

Structures Statistiques et Estimation

Exemple 10

Soit X une variable alatoire exponentielle de paramtre ,


8
si x 0
< 0
L ( ; x) =
:
exp ( x) si x > 0

>0:

Si (X1 ; :::; Xr ) est un r-chantillon de cette structure alors :


8
r
P
>
r
>
exp
xi
si xi > 0 ; 1
<
i=1
L ( ; x1 ; :::; xr ) =
>
>
:
0
ailleurs

Posons :

alors :

1X
T (x1 ; :::; xr ) =
xi
r i=1

L ( ; x1 ; :::; xr )

=
=

exp

r
X
i=1

xi

exp [ r T (x1 ; :::; xr )]


g [ ; T (x1 ; :::; xr )]

T est alors un rsum exhaustif pour la famille des lois exponentielles de paramtres
, > 0:

Exemple 11

Soit X une variable alatoire normale de paramtres

1
L ( ; ; x) = p exp
2

2 R et

1
(x
2 2

>0:

)2

Si (X1 ; :::; Xr ) est un r-chantillon de cette structure alors :


"
r
1
1 X
L ( ; ; x1 ; :::; xr ) = p
(xi
r exp
2 2
2
i=1

10

)2

Structures Statistiques et Estimation

A. El Mossadeq

Posons :
r

M (x1 ; :::; xr )

1X
xi
r i=1
r

S (x1 ; :::; xr )
On a :

L ( ; ; x1 ; :::; xr )

=
=

1X
[xi
r i=1

M (x1 ; :::; xr )]2

r h 2
1
S (x1 ; :::; xr ) + (M (x1 ; :::; xr )
p
r exp
2 2
2
g ; ; M (x1 ; :::; xr ) ; S 2 (x1 ; :::; xr )

puisque :
r
X
i=1

(xi

) = r S (x1 ; :::; xr ) + (M (x1 ; :::; xr )

M; S 2 est alors un rsum exhaustif pour la famille des lois normales de


paramtres 2 R et 2 , > 0:

4. Information Concernant un Paramtre


Dans tout ce paragraphe, on suppose donn un vecteur alatoire n dimensions dni sur une structure statistique ( ; T ; fP j

permet de trasporter la structure statistique sur Rn .

g), ce qui

Par abus, on note P , la loi (P )X du vecteur alatoire X , et on suppose


que P possde une densit f .
On dsigne par D le domaine :

D = fx 2 Rn j f ( ; x) > 0g

11

A. El Mossadeq

Structures Statistiques et Estimation

4.1. Matrice dInformation


Proposition 3

Soit (Rn ; BRn ; fP j 2 g),


Rk , une structure statistique dans laquelle
les probabilits P sont dnies partir des densits f .
Sous rserve de lgitimit de drivations sous le signe intgrale et en supposant
le domaine :

D = fx 2 Rn j f ( ; x) > 0g

indpendant de ; pour tout

, le vecteur alatoire :

@
ln f ( ; X)
@ j

1 j k

est centr.
Preuve 3

Puisque :

f ( ; x) dx = 1

Rn

alors, en supposant lgitimes les drivations sous le signe dintgration et le


domaine D indpendant de ; pour tout 2 , on obtient :
Z
Z
@
@
f ( ; x) dx =
ln f ( ; x) f ( ; x) dx = 0
@
@
n
n
j
j
R
R
pour tout j , 1

k.

Dnition 9

La matrice des variances et covariances du vecteur alatoire :

@
ln f ( ; X)
@ j

1 j k

est appele, lorsquelle existe, la matrice dinformation concernant le paramtre


fourni par la structure statistique (Rn ; BRn ; fP j 2 g).
12

Structures Statistiques et Estimation

A. El Mossadeq

On la note I [X; ] :
Lorsque n = 1, I [X; ] na quun seul lment appel la quantit dinformation
de Fisher.
Pour calculer les lments de la matrice I [X; ] = [Iij ], partons de la
relation :

f ( ; x) dx = 1

Rn

donc, pour tout j , 1

n, on a :
Z
@
f ( ; x) dx = 0
@ j Rn

Sous reserve de validit des drivations sous le signe intgrale et en supposant le domaine :

D = fx 2 Rn j f ( ; x) > 0g
indpendant de , on obtient :
Z
@
f ( ; x) dx =
Rn @ j
=

Z
0

Rn

@
ln f ( ; x) f ( ; x) dx
@ j

Sous les mmes conditions on a :


Z
@2
ln f ( ; x) f ( ; x) dx +
Rn Z @ i @ j
@
@
ln f ( ; x)
ln f ( ; x) f ( ; x) dx = 0
@ j
Rn @ i

do :

Iij

=
=

@
@
ln f ( ; X)
ln f ( ; X)
@ i
@ j
@2
E
ln f ( ; X)
@ i@ j

13

A. El Mossadeq

Structures Statistiques et Estimation

Remarque 2

En tant que matrice des variances et covariances, I [X; ] est symtrique et


positive.

Exemple 12

Soit X une variable alatoire normale de paramtres 2 R et 2 , > 0:


La matrice dinformation concernant les paramtres et est donne par :

6
I [X; ; ] = 4

1
2

0 7
2 5
2

Remarque 3

Lorsque n = 1, la quantit dinformation de Fisher est :

I [X; ]

=
=

"

@
ln f ( ; X)
@

@2
E
ln f ( ; X)
@ 2

Proposition 4

Soit I [X; ] la matrice dinformation de la structure statistique (Rn ; BRn ; fP j 2


o
Rk et les probabilits P sont dnies partir des densits f , et soit
I [X1 ; :::; Xr ; ] un r-chantillon de cette structure. Sous reserve de lgtimit
de drivations sous le signe intgrale et en supposant le domaine :

D = fx 2 Rn j f ( ; x) > 0g
indpendant de ; pour tout

, alors :

I [X1 ; :::; Xr ; ] = rI [X; ]

14

g),

Structures Statistiques et Estimation

A. El Mossadeq

Preuve 4

Puisque :

L ( ; x1 ; :::; xr ) =
alors :

Iij [X1 ; :::; Xr ; ]

=
=
=

r
X

f ( ; xi )

i=1

@2
E
@ @
" i
@2
E
@ i@

ln L ( ; X1 ; :::; Xr )
#
r
Y
ln
f ( ; Xi )
i=1

i=1

r
Y

@
@ i@

@2
rE
@ i@
rIij [X; ]

ln f ( ; Xi )
j

ln f ( ; X)
j

Exemple 13

Soit X une variable alatoire normale de paramtres 2 R et


suppose que est connu.
"
#
2
@
I [X; ] = E
ln f ( ; X)
@

=
=

)2

(X

1
2

Si X1 ; :::; Xr est un r-chantillon de cette structure, alors :

I [X1 ; :::; Xr ; ]

=
=

15

rI [X; ]
r
2

> 0: On

A. El Mossadeq

Structures Statistiques et Estimation

Proposition 5

Soit T1 ; :::; Ts un systme de s statistiques dnies sur un r-chantillon de la


structure statistique (Rn ; BRn ; fP j 2 g), s r:
On suppose quil existe des statistiques Ts+1 ; :::; Tr telles que les quations :

ti = Ti (x1 ; :::; xr ) ; 1

dnissent un changement de variables continument direntiable.


Sous rserve de lgtimit de drivations sous le signe intgrale et en supposant
le domaine :

D = fx 2 Rn j f ( ; x) > 0g

indpendant de ; pour tout

, la matrice :

I [X1 ; :::; Xr ; ]

I [T1 ; :::; Ts ; ]

est positive.
Elle est nulle si et seulement si T1 ; :::; Ts est un rsum exhaustif.
Preuve 5

Le changement de variables :

ti = Ti (x1 ; :::; xr ) ; 1

permet dcrire :

L ( ; x1 ; :::; xr ) = g ( ; t1 ; :::; ts ) g ( ; ts+1 ; :::; tr j t1 ; :::; ts )

D (t1 ; :::; tr )
D (x1 ; :::; xr )

do :

@2
@ i@

ln L ( ; x1 ; :::; xr )

@2
ln g ( ; t1 ; :::; ts )
@ i@ j
@2
ln g ( ; ts+1 ; :::; tr j t1 ; :::; ts )
@ i@ j

Il en dcoule que :

I [X1 ; :::; Xr ; ] = I [T1 ; :::; Ts ; ] + J

16

Structures Statistiques et Estimation

A. El Mossadeq

La matrice J est positive puisquelle sobtient comme moyenne des matrices des
variances et covariances associes :
@
ln g ( ; ts+1 ; :::; tr j t1 ; :::; ts )
@ i
Elle est nulle si et seulement si la fonction :

g ( ; ts+1 ; :::; tr j t1 ; :::; ts )


est indpendant de , donc si et seulement si (T1 ; :::; Ts ) est un rsum exaustif.

Remarque 4

Dans ces conditions, il est quivalent de travailler avec le r-chantillon ou le


rsum exhaustif.
Remarque 5

Lorsque est un paramtre rel, la quantit dinformation fournie par un rsum T dni sur un r-chantillon est majore par celle qui est fournie par le
r-chantillon :

I [T ; ]

I [X1 ; :::; Xr ; ]

Lgalit a lieu si et seulement si T est un rsum exhaustif.

Exemple 14

Soit X une variable alatoire normale de paramtres 2 R et 2 , > 0:


On suppose que est connu.
Considrons la moyenne empirique M dun un r-chantillon X1 ; :::; Xr issu de
X.
2

Puisque M est une variable alatoire normale de paramtres

I [M; ] =
M est alors un rsum exhaustif pour
sidre.

et

, alors :

r
2

concernant la structure statistique con-

17

A. El Mossadeq

Structures Statistiques et Estimation

4.2. Ingalit de Cramer-Rao


Proposition 6

Soit (Rn ; BRn ; fP j 2 g),


Rk , une structure statistique dans laquelle
les probabilits P sont dnies partir des densits f :
Considrons un r-chantillon de cette structure et notons L sa fonction de
vraisemblance.
Soit :

T =

(X1 ; :::; Xr )

un rsum exhaustif de cette structure.


On suppose que :
(1) la variance 2 [T ] = V [T ] existe,
@
@
(2)
L ( ; x1 ; :::; xr ) et (x1 ; :::; xr ) L ( ; x1 ; :::; xr ) existent et sont int@
@
grables,
(3) la quantit dinformation de Fisher existe,
(4) le domaine D est indpendant de ; pour tout 2 .
Alors sous reserve de lgtimit de drivations sous le signe dintgration on a :
2

V [T ]

@
E [T ]
@
I [X1 ; :::; Xr ; ]

de plus, lgalit a lieu si et seulement si :

@
ln L ( ; X1 ; :::; Xr ) =
@
Cest lingalit de Cramer-Rao.

Preuve 6

( ) [T

E [T ]]

@
Daprs ce qui prcde, la variable alatoire
ln L ( ; X1 ; :::; Xr ) est centre,
@
cest dire :
@
E
ln L ( ; X1 ; :::; Xr ) = 0
@

18

Structures Statistiques et Estimation

A. El Mossadeq

et donc :

E E [T ]
Par dnition :

E [T ] =

@
ln L ( ; X1 ; :::; Xr ) = 0
@

(x1 ; :::; xr ) L ( ; x1 ; :::; xr ) dx1 :::dxr

Rnr

Les hypothses permettent dcrire :

@
E [T ]
@

(x1 ; :::; xr )

Rnr

=
=

@
L ( ; x1 ; :::; xr ) dx1 :::dxr
@

@
ln L ( ; X1 ; :::; Xr )
@
@
E (T E [T ])
ln L ( ; X1 ; :::; Xr )
@

E T

Il sen suit par application de lingalit de Schwarz :

@
E [T ]
@

E (T

E [T ])2 E

"

@
ln L ( ; X1 ; :::; Xr )
@

V [T ] I [X1 ; :::; Xr ; ]
do :
2

V [T ]

@
E [T ]
@
I [X1 ; :::; Xr ; ]

De plus lgalit a lieu si et seulement si :

@
ln L ( ; X1 ; :::; Xr ) =
@

19

( ) [T

E [T ]]

A. El Mossadeq

Structures Statistiques et Estimation

5. Estimateurs
Dnition 10

Soit ( ; T ; fP j

g) une structure statistique et considrons un ala :


h : ( ; W) ! (E; B)

o W est une tribu de P ( ) :


On appelle estimateur de h ( ),

, toute statistique valeurs dans (E; B).

Dnition 11

Soit T un estimateur de h ( ),
variable parente X:

, bas sur un r-chantillon (X1 ; :::; Xr ) de

1. On appelle biais de lestimateur T lcart entre E [T ] et h ( ) :

b (T; ) = E [T ]

h( )

2. T est dit sans biais si :

E [T ] = h ( )
3. T est dit asymptoquement sans biais si :

lim E [T ] = h ( )

r!1

4. T est dit convergent si T converge en probabilit vers h ( ) :

8 > 0 : lim P [jT


r!1

h ( )j

Proposition 7

Soit T un estimateur sans biais de h ( ) telle que :

lim V [T ] = 0

r!1

alors T est un estimateur convergent.

20

]=0

Structures Statistiques et Estimation

A. El Mossadeq

Preuve 7

Si T est un estimateur sans biais de h ( ), et si :


h
lim V [T ] = lim E (T
r!1

h ( ))

r!1

alors T converge en moyenne quadratique vers h ( ), et par consquent, T converge en probabilit vers h ( ) :

Exemple 15

Soit (X1 ; :::; Xr ) un r-chantillon issu dune variable alatoire X de moyenne


et de variance 2 :
1. La statistique :
r

1X
M=
Xi
r i=1

est un estimateur sans biais et convergent de la moyenne


#
" r
1X
Xi
E [M ] = E
r
i=1

1
r

=
=

r
X

E [Xi ]

i=1

2. La statistique :
r

S12

1X
(Xi
=
r i=1

est un estimateur sans biais de la variance

21

)2
2

A. El Mossadeq

Structures Statistiques et Estimation

En eet :

E S12

"

r
1X

1
r

)2

E (Xi

i=1

r
1X

(Xi

i=1
r
X

V [Xi ]

i=1

Donc S12 est un estimateur sans biais de

3. La statistique :
r

S22

1X
(Xi
=
r i=1

M )2

est un estimateur biais de la variance 2 : En eet :


r
r
X
X
2
(Xi M ) =
[(Xi
) (M
)]2
i=1

=
=

i=1
r
X
i=1
r
X

(Xi

r
X

(Xi

) (M

)+

i=1

(Xi

)2

r
X

(M

i=1

)2

r (M

i=1

do :

"

r
X

(Xi

i=1

M)

=
=

E
(r

"

r
X

(Xi

i=1

1)

On en dduit :

E S22 =
do

S22

est bias.

22

1
r

rE (M

)2

Structures Statistiques et Estimation

A. El Mossadeq

4. La statistique :

S =

r
X

M )2

(Xi

i=1

est un estimateur sans biais de la variance

En eet, puisque :

S2 =

r
r

S22

On en dduit :

E S2 =

Dnition 12

Soit T un estimateur de h ( ),
variable parente X:

, bas sur un r-chantillon (X1 ; :::; Xr ) de

1. On appelle risque quadratique de T la quantit :


h
i
2
R (T; ) = E (T h ( ))

2. Si T1 et T2 sont deux estimateurs de h ( ), on dit que T1 est prfrable T2


si :

R (T1 ; )

R (T2 ; )

Remarque 6

On a :

R (T; ) = V [T ] + b (T; )2
Si T un estimateur sans biais de h ( ), alors :

R (T; ) = V [T ]

23

A. El Mossadeq

Structures Statistiques et Estimation

Exemple 16

Soit X une variable alatoire de Bernouilli de paramtre p et (X1 ; :::; Xr ) un


r-chantillon issu dune variable alatoire X:
Considrons la frquence empirique :
r

1X
Xi
F =
r i=1

alors, F est prfrable X1 pour lestimation de p.


En eet :

R (X1 ; p) = V [X1 ] = p (1

p)

alors que :

R (F; p) = V [F ] =

p (1

p)
r

Remarque 7

Si T un estimateur sans biais de h ( ), alors en vertu de lingalit de Cramer-Rao


on a :
[h0 ( )]2
V [T ]
I [X1 ; :::; Xr ; ]
Si de plus h ( ) = , alors :

V [T ]

1
I [X1 ; :::; Xr ; ]

Remarque 8

Soit T lensemble des estimateurs sans biais de h ( ), vriant lingalit de


Cramer-Rao.
On a :
[h0 ( )]2
inf V [T ]
T 2T
I [X1 ; :::; Xr ; ]

24

Structures Statistiques et Estimation

A. El Mossadeq

Dnition 13

Un estimateur T0 de T est dit de variance minimale si :

V [T0 ] = inf V [T ]
T 2T

Dnition 14

Si :

[h0 ( )]2
inf V [T ] =
T 2T
I [X1 ; :::; Xr ; ]
1. On appelle e cacit dun estimateur T0 de T , le rapport :

[h0 ( )]2
e [T0 ] =
I [X1 ; :::; Xr ; ] V [T0 ]
2. T0 est dit e cace lorsque son e cacit est gale 1 :

e [T0 ] = 1
3. Si T1 et T2 sont deux estimateurs de T .
On dit que T1 est plus e cace que T2 si :

e [T1 ]

e [T2 ]

Proposition 8

Soit T = (X1 ; :::; Xr ) un estimateur de T .


Les trois conditions suivantes sont quivalentes :

(i) T est e cace


@
(ii)
ln L ( ; x1 ; :::; xr ) = ( ) [ (x1 ; :::; xr ) h ( )]
@
(iii) T est un rsum exhaustif dont la densit de probabilit g ( ; t) est telle
que :

@
ln g ( ; x) =
@

25

( ) [t

h ( )]

A. El Mossadeq

Structures Statistiques et Estimation

Preuve 8

(1) () (2)
Daprs la dnition de le cacit, T est e cace si et seulement si lingalit
de Cramer-Rao est une galit, donc si et seulement si :

@
ln L ( ; X1 ; :::; Xr ) =
@

( ) [T

h ( )]

(1) =) (3)
T est e cace donc :
V [T ]

[h0 ( )]2
I [X1 ; :::; Xr ; ]

[h0 ( )]2
I [T ; ]

do :

I [X1 ; :::; Xr ; ] = I [T ; ]
et par consquent T est un rsum exhaustif concernant

et on a :

@
ln g ( ; x) = ( ) [t h ( )]
@
par application de lingalit de Cramer-Rao (qui est une galit dans ce cas)
T.
(3) =) (2)
Si T est un rsum exhaustif concernant , alors daprs le thorme de factorisation :

L ( ; X1 ; :::; Xr ) = g ( ; T ) s (X1 ; :::; Xr )


Do :

@
@
ln L ( ; X1 ; :::; Xr ) =
ln g ( ; T ) =
@
@

26

( ) [T

h ( )]

Structures Statistiques et Estimation

A. El Mossadeq

6. LEstimation par la Mthode du


Maximum de Vraisemblance
La mthode du maximum de vraisemblance a pour but de fournir un moyen
e cace pour choisir un estimateur dun paramtre.

Dnition 15

Soit L ( ; X1 ; :::; Xr ) la fonction de vraisemlance dun r-chantillon X1 ; :::; Xr .


Si pour (x1 ; :::; xr ) donn :

(x1 ; :::; xr )

ralise le maximum strict de la fonction :

7 ! L ( ; X1 ; :::; Xr )
on dit que :

^=

(X1 ; :::; Xr )

est lestimateur du maximum de vraisemlance de :

Exemple 17

Soit X1 ; :::; Xr un r-chantillon dune variable alatoire de P oisson de paramtre


, > 0. Sa fonction de vraisemlance est :
r
Y
L ( ; !i)
L ( ; ! 1 ; :::; ! r ) =
i=1

r
P

!i

i=1

! 1 !:::! r !
Cette fonction atteint son maximum strict pour :
r

1X
=
!i
r i=1
27

A. El Mossadeq

Structures Statistiques et Estimation

Donc, lestimateur du maximum de vraisemlance de


r
X
^= 1
Xi
r

est :

i=1

^ est un estimateur sans biais et convergent du paramtre de la loi de P oisson.


^ reprsente la moyenne empirique du r-chantillon.

Exemple 18

Soit (X1 ; :::; Xr ) un r-chantillon dune variable alatoire qui suit une loi normale
de paramtres 2 R et 2 , > 0.
On suppose connu.
La fonction de vraisemlance de ce r-chantillon est :
r
1
1 X
L ( ; x1 ; :::; xr ) = p
(xi
)2
r exp
2
2 i=1
2
Cette fonction atteint son maximum strict pour :
r

1X
=
xi
r i=1

Donc, lestimateur du maximum de vraisemlance de

est :

Et comme :

1X
^=
Xi
r i=1
2

V [^ ] =

et :

I [X1 ; :::; Xr ; ] = rI [X; ] =


donc :

e [^ ] = 1
^ est alors un estimateur e cace de :

28

r
2

Structures Statistiques et Estimation

A. El Mossadeq

Exemple 19

Soit (X1 ; :::; Xr ) un r-chantillon dune variable alatoire qui suit une loi normale
de paramtres 2 R et 2 , > 0.
On suppose connu.
Lestimateur du maximum de vraisemlance de 2 est :
r
1X
2
(Xi
)2
^ =
r
i=1

^ 2 est un estimateur sans biais de

Exemple 20

Soit (X1 ; :::; Xr ) un r-chantillon dune variable alatoire qui suit une loi normale
de paramtres 2 R et 2 , > 0.
Les estimateurs du maximum de vraisemlance de et 2 sont :
8
r
X
>
1
>
>
=
Xi
>
< ^
r i=1
r
>
1X
2
>
2
>
(X
^
)
^
=
i
>
:
r
i=1

^ 2 est un estimateur biais de

Proposition 9

Sil existe un rsum exhaustif T1 ; :::; Ts alors tout estimateur de


mum de vraisemlance est fonction de T1 ; :::; Ts :

Preuve 9

Si (T1 ; :::; Ts ) est un rsum exhaustif alors :

L ( ; x1 ; :::; xr ) = g ( ; t1 ; :::; ts ) h (x1 ; :::; xr )


Donc, maximiser L revient maximiser g .

29

par le maxi-

A. El Mossadeq

Structures Statistiques et Estimation

Proposition 10

Supposons les hypothses de lingalit de Cramer-Rao vries.


Sil existe un estimateur sans biais et e cace T de h ( ), alors toute fonction
^ (x1 ; :::; xr ) telle que :
h
i
^
T (x1 ; :::; xr ) = h (x1 ; :::; xr )
est solution de lquation de vraisemlance et ralise le maximum strict de la
vraisemlance.

Preuve 10

Si T est un estimateur sans biais et e cace de h ( ) alors :

@
ln L ( ; x1 ; :::; xr ) =
@

( ) [t

h ( )]

Donc, pour (x1 ; :::; xr ) donn, toute fonction ^ telle que :


h
i
^
T (x1 ; :::; xr ) = h (x1 ; :::; xr )
est solution de lquation de vraisemblance.
Dautre part :

@2
ln L ( ; x1 ; :::; xr ) =
@ 2

( ) [t

h ( )]

( ) h0 ( )

et :

I [X1 ; :::; Xr ; ]

@2
ln L ( ; X1 ; :::; Xr )
E
@ 2
( ) h0 ( )

=
=

Or :

I [X1 ; :::; Xr ; ]

"

@
ln L ( ; X1 ; :::; Xr )
@

[ ( )]2 V [T ]

donc :

( ) h0 ( ) > 0

30

Structures Statistiques et Estimation

do, pour

A. El Mossadeq

=^:

@2
^; x1 ; :::; xr =
^ h0 ^
2 ln L
@
est strictement ngatif, ce qui assure que ^ ralise le maximum strict.

7. LEstimation Ponctuelle
Soit (X1 ; :::; Xr ) un r-chantillon issu dune variable alatoire X , et soit T
un estimateur dun paramtre , bas sur le r-chantillon (X1 ; :::; Xr ) :
Dnition 16

Si (x1 ; :::; xr ) est une ralisation du r-chantillon (X1 ; :::; Xr ) ; alors T (x1 ; :::; xr )
constitue une estimation ponctuelle de :

7.1. Estimation Ponctuelle dune Proportion


Soit A un vnement alatoire de probabilit inconnue p:
Soit X la variable alatoire de Bernouilli associe A, et (X1 ; :::; Xr ) un

r-chantillon issu X .
Puisque la frquence empirique :
r

1X
F =
Xi
r i=1

est un estimateurs sans biais et convergent de p, alors toute ralisation :

f = F (x1 ; :::; xr )
constitue une estimation ponctuelle de p.

31

A. El Mossadeq

Structures Statistiques et Estimation

7.2. Estimation Ponctuelle dune Moyenne


Soit X une variable alatoire de moyenne , et (X1 ; :::; Xr ) un r-chantillon
issu X:
Puisque la moyenne empirique :
r

1X
M=
Xi
r i=1

est un estimateurs sans biais et convergent de , alors toute ralisation :


r

1X
m = M (x1 ; :::; xr ) =
xi
r i=1

constitue une estimation ponctuelle de .

7.3. Estimation Ponctuelle dune Variance


Soit X une variable alatoire de moyenne

et de variance

, et (X1 ; :::; Xr )

un r-chantillon issu X:

(1) Si

est connue, alors :


r

S12

1X
=
(Xi
r i=1

)2

est un estimateur sans biais et convergent de


r

1X
s =
(xi
r i=1
2

constitue une estimation ponctuelle de

)2
2

(2) La statistique :
1

S =

r
X
i=1

32

(Xi

M )2

. Toute ralisation :

Structures Statistiques et Estimation

A. El Mossadeq

est un estimateur sans biais et convergent de

s =

r
X

(xi

. Toute ralisation :

m)2

i=1

constitue une estimation ponctuelle de

8. LEstimation par Intervalle de


Conance
Soit ~ une estimation ponctuelle du paramtre estimer :

h
Lestimation par intervalle de conance consiste dterminer un intervalle ~
> 0, centr en ~ contenant avec un probabilit 1
xe a priori :
h
i
P ~
< <~+ =1
Dnition 17

;~ +

est appel le niveau de conance.


h est appel ile seuil de conance ou le risque.
~
; ~ + est appel lintervalle de conance de

, ou au seuil :

Remarque 9

Cette nouvelle approche est souvent prfre dans la pratique car elle introduit
la notion dincertitude.
Le seuil de conance permet de sadapter aux exigences de la pratique.

8.1. Intervalle de pari


On considre une population o le caractre tudi ne prend que les valeurs 0 et

1, cest dire X est une variable alatoire de Bernouilli.

33

A. El Mossadeq

Structures Statistiques et Estimation

On dsigne par p la proportion des individus de la population de caractre 1 :

p = P [X = 1]

cest dire le paramtre de la loi de Bernouilli.


On extrait de cette population un chantillon de taille n sur lequel on observe
une frquence f du caractre 1 qui dire plus ou moins de p.
Le hasard de lchantillonnage peut produire une quelconque composition, et la
frquence f est susceptible de prendre des valeurs variant de 0 1, mais un grand
cart entre f et p reste peu probable.
Daprs le theoreme centrale limite, et pourvu que np et n (1

p) soient

suprieurs ou gaux 5 (n est considr dans ces conditions assez grand), la


quantit :

t= r

p (1 p)
n
peut tre considre comme une ralisation de la variable alatoire normale centre rduite :

N=r

p (1 p)
n
o F est la frquence empirique du n-chantillon :
n

Ainsi, pour tout

1X
F =
Xi
n i=1

2 [0; 1], il existe t1

=2

P jN j < t1
cest dire :

t1

=2

t1

=2

2 R tel que :

=2

1
p exp
2

34

=1
t2
dt = 1
2

Structures Statistiques et Estimation

A. El Mossadeq

ou encore :

On dit que :

"

F 2 p
1

t1

=2

t1

=2

1
p exp
2

t2
dt = 1
2

p (1 p)
; p + t1
n

=2

p (1 p)
n

ou au seuil :

Cet intervalle est appel lintervalle de pari 1

Exemple 21

Une urne contient quarante boules noires et soixante boules blanches.


Dans quelles limites peut varier le nombre de boules blanches si lon tire de lurne
trente boules avec remise ?
Construisons dobord lintervalle de pari, pour un chantillon de taille n = 30,
correspondant la probabilit dobtenir une boule blanche p = 0:6.
Au seuil , cet intervalle est dni par :

"
Pour

t1

=2

p (1 p)
; p + t1
n

=2

p (1 p)
n

= 5%, on a :
t:975 = 1:96

On obtient alors lintervalle :

[:42; :78]
Il en rsulte que sur les trente boules tires, le nombre de boules blanches serait
compris, 95%, entre 13 et 23.

35

A. El Mossadeq

Structures Statistiques et Estimation

8.2. Les Sondages


Le plus souvent, la proportion p est inconnue du fait que lexamen de toute la
population est impossible.
Puisque F est un estimateur sans biais de p, on peut extraire un chantillon
de taille n sur lequel on observe une frquence f qui constitue une estimation
ponctuelle de p, puis on assigne p un intervalle de variation appel intervalle
de conance avec une probabilit 1

,0

1:
p) soient suprieurs ou gaux 5, et en

En eet, pourvu que np et n (1


p (1 p)
f (1 f )
estimant
par
, la quantit :
n
n
f p
t= r
f (1 f )
n
peut tre considre comme une ralisation de la variable alatoire normale centre rduite :

N=r

f (1 f )
n
2 [0; 1], il existe t1 =2 2 R tel que :

Ainsi, pour tout

P jN j < t1
Lintervalle :

"

t1

=2

=2

=1

f (1 f )
; f + t1
n

est appel lintervalle de conance de p 1

=2

f (1 f )
n

ou au seuil :

Exemple 22

A la veille dune consultation lectorale, on a intrrog cent lecteurs constituant


un chantillon au hasard. Soixante ont dclar avoir lintention de voter pour le
candidat C .

36

Structures Statistiques et Estimation

A. El Mossadeq

En quelles limites, au moment du sondage, la proportion du corps lectoral favorable C se situe-t-elle ?


Construisons lintervalle de conance correspondant la frquence f = 0:6 du
corps lectoral favorable C observe sur un chantillon de taille n = 100.
Au seuil , cet intervalle est dni par :
"
#
r
r
f (1 f )
f (1 f )
f t1 =2
; f + t1 =2
n
n

= 5%, on a :

Pour

t:975 = 1:96
On obtient alors lintervalle :

[:504; :696]
A 95%, le candidat C serait lu.

8.3. Intervalle de Conance dune Variance


Si X suit une loi normale de moyenne
2

et de variance

1) s2

(n

2
n 1 du Khi-deux (n
existe 2n 1; =2 et 2n 1;1 =2

est une ralisation dune variable


Ainsi, pour tout

Kn

2
n 1; =2

et

, alors la quantit :

2 [0; 1], il
h
P 2n 1; =2 <

2
n 1;1

=2

2
n 1;1

<

=2

vrient :

8
>
>
< Kn
>
>
: Kn

2
n 1; =2

2
n 1;1

=2

tant la fonction de rpartition de

37

=
2
n 1.

=1

2
1

1) degrs de libert.
dans R tels que :

A. El Mossadeq

Structures Statistiques et Estimation

Il en rsulte que :

P
Lintervalle :

"

(n

1) s

2
n 1;1

"

<

(n

<

2
n 1; =2

=2

(n

1) s

2
n 1;1

1) s

(n

=2

1) s

2
n 1; =2

=1

est appel lintervalle de conance de la variance

ou au seuil .

Lintervalle de conance de lcart-type 1


est alors donn par :
#
"s
s
(n 1)
(n 1)
s;
s
2
2
n 1;1

=2

n 1; =2

Exemple 23

La force de rupture dun certain type de cable peut tre assimile une variable
alatoire normale.
Des essais portant sur dix cables ont donn une variance empirique s2 de 1560 N2 .
Construire un intervalle de conance, 95%, de lcart-type de cette force de
rupture.
Au seuil , lintervalle de conace de lcart-type est dni par :
"s
#
s
(n 1)
(n 1)
s;
s
2
2
n 1;1

Pour

= 5% :

8
<
:

=2

n 1; =2

2
9;:025

= 2:7

2
9;:975

= 19

do lintervalle de conace de lcart-type 95% :

[27:18 N; 72:11 N]

38

Structures Statistiques et Estimation

A. El Mossadeq

8.4. Intervalle de Conance dune Moyenne


8.4.1. n

30

La taille de lchantillon est assez grande, daprs le thorme centrale limite, la


quantit :

t=

m
p

n
peut tre considre comme une ralisation de la variable alatoire normale centre rduite :
M
N=
p
n
Ainsi, pour tout 2 [0; 1], il existe t1 =2 2 R tel que :
P jN j < t1
cest dire :

ou encore :

On dit que :

t1

=2

t1

=2

t1

=2

2 m
1

=2

=1

1
p exp
2

t2
dt = 1
2

1
p exp
2

t2
dt = 1
2

t1

=2 p

; m + t1

=2 p

ou au seuil :

Cet intervalle est appel lintervalle de conance de la moyenne


Si la variance

est inconnue, on la remplace sans inconvnient par son estima-

tion s2 :

39

A. El Mossadeq

Structures Statistiques et Estimation

Exemple 24

Dune population de variance 2 = 25, on extrait un chantillon de taille n = 100


sur lequel on observe une moyenne empirique m = 12:5.
Quel intervalle peut-on assigner la moyenne de la population ?
Au seuil , lintervalle de conace de la moyenne est dni par :

m
Pour

t1

=2 p

=2 p

; m + t1

= 5%, on a :
t:975 = 1:96

do lintervalle de conance 95% :

[11:52; 13:48]

8.4.2. n < 30
Si X suit une loi normale de moyenne

et de variance

, alors la quantit Tn

t=

s
p
n
est une ralisation de la variable alatoire de Student (n
:

Tn
Ainsi, pour tout

o tn

1;1

=2

M
S
p
n

2 [0; 1], il existe tn

1;1

=2

P jTn 1 j < tn

1;1

=2

2 R tel que :
=1

vrie :

Fn
Fn

tn

1;1

=2

=1

tant la fonction de rpartition de Tn 1 .

40

1) degrs de libert

Structures Statistiques et Estimation

A. El Mossadeq

On dit que :

2 m
1

tn

1;1

s
; m + tn
n

=2 p

1;1

s
n

=2 p

ou au seuil :

Cet intervalle est appel lintervalle de conance de la moyenne

Exemple 25

Pour dterminer le point de fusion moyen dun certain alliage, on a procd


neuf observations qui ont donnes une moyenne m = 1040 C et un cart-type
s = 16 C.
Construire un intervalle de conance de la moyenne 95%.
Ici on a :

n
m
s

=
=
=

9
1040 C
16 C

Au seuil , lintervalle de conace dune telle moyenne est dni par :

m
Pour

tn

1;1

s
; m + tn
n

=2 p

1;1

= 5%, on a :
t8;:975 = 2:31

do lintervalle de conance 95% :

[1027:68 C; 1052:32 C]

41

s
n

=2 p

A. El Mossadeq

Structures Statistiques et Estimation

9. Exercices
Exercice 1

Dterminer et tudier les proprits de lestimateur du maximum de vraisemlance


dun r-chantillon pour :
1. le paramtre p dune loi de Bernouilli
2. le paramtre p dune loi geometrique
3. le paramtre p dune loi binomiale dordre n
4. le paramtre

dune loi de P oisson

5. le paramtre

dune loi exponentielle

6. les paramtres
7. le paramtre

et

dune loi normale

dune loi unif orme sur lintervalle [0; ]

Solution 1

1. Soit X une variable alatoire de Bernouilli de paramtre p.


Pour tout x 2 f0; 1g, la probabilit lmentaire p (x) de x est :

p (x) = px (1
de plus :

p)1

8
< E [X] = p
:

V [X] = p (1 p)
(a) Recherche du maximum de vraisemlance :
Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dnie pour tout p 2 [0; 1] et tout
(x1 ; :::; xr ) 2 f0; 1gr par :
L (p; x1 ; :::; xr ) =

r
Y

r
P

xi

p (xi ) = pi=1 (1

i=1

42

p)

r
P

i=1

xi

Structures Statistiques et Estimation

A. El Mossadeq

do :
r
X

ln L (p; x1 ; :::; xr ) =

xi ln p +

i=1

r
X

xi ln (1

i=1

p)

Il en rsulte que :

@
ln L (p; x1 ; :::; xr ) =
@p

r
P

xi

i=1

r
P

xi

i=1

do :
r

et comme :

@
1X
ln L (p; x1 ; :::; xr ) = 0 =) p =
xi
@p
r i=1

@2
ln L (p; x1 ; :::; xr ) < 0
@p2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune
structure de Bernouilli est :
r

1X
p^ =
Xi
r i=1

Cest la frquence empirique du r-chantillon.


(b) Etude des proprits de p^ :
Puisque :

E [^
p] = E [X] = p
et :

V [X]
r
p (1 p)
=
r
On en dduit que p^ est un estimateur sans biais et convergent du paramtre
V [^
p]

p dune loi de Bernouilli.

43

A. El Mossadeq

Structures Statistiques et Estimation

2. Soit X une variable alatoire de gomtrique de paramtre p.


Pour tout x 2 N , la probabilit lmentaire p (x) de x est :

p)x

p (x) = p (1
de plus :

8
1
>
E [X] =
>
>
<
p

>
>
1
>
: V [X] =

p2
Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dnie pour tout p 2 [0; 1] et tout (x1 ; :::; xr ) 2

(N )r par :

L (p; x1 ; :::; xr ) =
do :

r
Y

r
P

p (xi ) = p (1

p)i=1

i=1

r
X

ln L (p; x1 ; :::; xr ) = r ln p +

xi

i=1

Il en rsulte que :

@
ln L (p; x1 ; :::; xr )
@p

r
p
r

r
P

xi r

r ln (1

xi

i=1

1 p
r
P
p xi
i=1

p (1

p)

do :

r
@
ln L (p; x1 ; :::; xr ) = 0 =) p = P
r
@p
i=1

44

xi

p)

Structures Statistiques et Estimation

A. El Mossadeq

et comme :

@2
ln L (p; x1 ; :::; xr ) < 0
@p2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune
structure gomtrique est :
r
p^ = P
r
Xi
i=1

Cest linverse de la moyenne empirique du r-chantillon.

3. Soit X une variable alatoire binomiale dordre n et de paramtre p.


pour tout x 2 f0; 1; :::; ng, la probabilit lmentaire p (x) de x est :

p)n

p (x) = C (n; x) px (1
de plus :

8
< E [X] = np
:

V [X] = np (1

p)

(a) Recherche du maximum de vraisemlance :


Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dnie pour tout p 2 [0; 1] et tout

(x1 ; :::; xr ) 2 f0; 1; :::; ngr par :


L (p; x1 ; :::; xr )

=
=

r
Y

p (xi )

i=1
"
r
Y

ln L (p; x1 ; :::; xr ) = ln

r
Y
i=1

xi

C (n; xi ) pi=1 (1

i=1

do :

r
P

C (n; xi ) +

r
X
i=1

45

xi ln p +

rn

rn

p)

r
X
i=1

r
P

xi

i=1

xi ln (1

p)

A. El Mossadeq

Structures Statistiques et Estimation

Il en rsulte que :

@
ln L (p; x1 ; :::; xr )
@p

r
P

xi

r
P

rn

i=1

r
P

xi

i=1

xi

rnp

p (1

p)

i=1

do :
r

@
1 X
ln L (p; x1 ; :::; xr ) = 0 =) p =
xi
@p
rn i=1

et comme :

@2
ln L (p; x1 ; :::; xr ) < 0
@p2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune
structure de binomiale est :
r
1 X
p^ =
Xi
rn i=1

(b) Etude des proprits de p^ :


Puisque :

E [^
p]

=
=

1
E [X]
n
p

et :

V [X]
rn2
p (1 p)
=
rn
on en dduit que p^ est un estimateur sans biais et convergent de p.
V [^
p]

46

Structures Statistiques et Estimation

A. El Mossadeq

4. Soit X une variable alatoire de Poisson de paramtre .


Pour tout x 2 N, la probabilit lmentaire p (x) de x est :
x

p (x) =
de plus :

x!

exp

8
< E [X] =
:

V [X] =
(a) Recherche du maximum de vraisemlance :
Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dnie pour tout

(x1 ; :::; xr ) 2 Nr par :


L ( ; x1 ; :::; xr ) =
do :

ln L ( ; x1 ; :::; xr ) =

r
Y

r
P

> 0, et tout

xi

i=1

p (xi ) =

i=1

x1 !:::xr !

ln (x1 !:::xr !) +

r
X

exp r

xi ln

i=1

Il en rsulte que :

@
ln L ( ; x1 ; :::; xr ) =
@

r
P

xi

i=1

do :
r

1X
@
ln L ( ; x1 ; :::; xr ) = 0 =) p =
xi
@
r i=1

et comme :

@2
ln L ( ; x1 ; :::; xr ) < 0
@ 2

47

A. El Mossadeq

Structures Statistiques et Estimation

donc lestimateur du maximum de vraisemblance dun r-chantillon dune


structure de Poisson est :
r

1X
^=
Xi
r i=1

Cest la moyenne empirique du r-chantillon.


(b) Etude des proprits de ^ :
Puisque :

E [^ ] = E [X] =
et :

V [X]
=
r
r
On en dduit que ^ est un estimateur sans biais et convergent de .
V [^ ] =

5. Soit X une variable alatoire exponentielle de paramtre .


Sa densit de probabilit f est dnie par :

f (x) =
de plus :

8
< 0
:

exp

si

si

x>0

8
1
>
>
E
[X]
=
>
<

>
>
1
>
: V [X] = 2

Considrons un r-chantillon de cette structure.Sa fonction de vraisemblance


est dnie pour tout ,

> 0, et tout (x1 ; :::; xr ) dans Rr ; tous strictement

positifs, par :

L ( ; x1 ; :::; xr ) =

r
Y

f (xi ) =

i=1

exp

r
X
i=1

48

xi

Structures Statistiques et Estimation

A. El Mossadeq

do :

ln L ( ; x1 ; :::; xr ) = r ln
Il en rsulte que :

@
r
ln L ( ; x1 ; :::; xr ) =
@
do :

@
ln L ( ; x1 ; :::; xr ) = 0 =)
@

r
X

xi

i=1

r
X

xi

i=1

r
=P
r

xi

i=1

et comme :

@2
ln L ( ; x1 ; :::; xr ) < 0
@ 2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune
structure exponentielle est :

^= r
r
P
Xi
i=1

Cest linverse de la moyenne empirique du r-chantillon.


6. Soit X une variable alatoire normale de paramtres

et

Sa densit de probabilit f est dnie pour tout x 2 R par :

1
f (x) = p exp
2
de plus :

8
< E [X] =
:

V [X] =

49

1
(x
2 2

)2

A. El Mossadeq

Structures Statistiques et Estimation

(a) Recherche du maximum de vraisemlance :


Considrons un r-chantillon de cette structure.

2 R, tout

Sa fonction de vraisemblance est dnie pour tout


tout (x1 ; :::; xr ) 2 Rr par :

L ( ; ; x1 ; :::; xr )

r
Y

> 0 et

f (xi )

i=1

1
p
2

1 X
(xi
2 2 i=1

exp

do :

ln L ( ; ; x1 ; :::; xr ) =

)2

r ln 2

r ln

Il en rsulte que :
8
r
X
>
@
1
>
>
(xi
L ( ; ; x1 ; :::; xr ) = 2
>
>
>
< @

1 X
(xi
2 2 i=1

)2

i=1

do :

>
>
>
@
>
>
>
: @ L ( ; ; x1 ; :::; xr ) =

8
@
>
>
L ( ; ; x1 ; :::; xr ) = 0
>
< @

>
>
>
: @ L ( ; ; x1 ; :::; xr ) = 0
@

=)

r
1 X
3

(xi

)2

i=1

8
>
>
>
>
>
>
<
>
>
>
>
>
>
:

1X
=
xi
r i=1
r

1X
=
(xi
r i=1

)2

Donc les estimateurs du maximum de vraisemblance dun r-chantillon


dune structure normale est :

50

Structures Statistiques et Estimation

A. El Mossadeq

8
r
X
>
1
>
>
^ =
Xi
>
>
r i=1
>
<

>
r
>
>
1X
>
2
>
(Xi
>
: ^ =r
i=1

^ )2

(b) Etude des proprits de ^ et ^ :


On a :

E [^ ]

E [X]

=
et :

E ^2

1
r

V [X]
2

r
On en dduit que ^ est un estimateur sans biais et convergent de , mais
^ est un estimateur biais de .
7. Soit X une variable alatoire uniforme sur lintervalle [0; ].
Sa densit de probabilit f est dnie pour tout x 2 [0; ] par :
8 1
>
si x 2 [0; ]
<
f (x) =
>
:
0 si x 2
= [0; ]

de plus :

8
>
>
E [X] =
>
<
2
>
>
>
: V [X] =

12
Considrons un r-chantillon de cette structure.

51

A. El Mossadeq

Structures Statistiques et Estimation

> 0, et tout (x1 ; :::; xr )

Sa fonction de vraisemblance est dnie pour tout ,


r

dans [0; ] :

L ( ; x1 ; :::; xr ) =
La fonction :

r
Y

f (xi ) =

1
r

i=1

! L ( ; x1 ; :::; xr )
est strictement dcroissante, donc elle atteint son maximum lorsque

est

minimum.
Et comme :

8i 2 f1; :::; rg :
donc

xi

est minimum lorsque :

= max (x1 ; :::; xr )


Donc lestimateur du maximum de vraisemblance dun r-chantillon dune
structure uniforme est :

^ = max (X1 ; :::; Xr )

Exercice 2

Soit X une variable alatoire dont la densit de probabilit f est dnie par :
8 1
x
>
si x > 0
< exp
f (x) =
>
:
0
si x 0

est un paramtre rel strictement positif.

1. Dterminer lestimateur du maximum de vraisemlance ^ de dun r-chantillon


de variable parente X .
2. ^ est-il un rsum exhaustif ?

52

Structures Statistiques et Estimation

A. El Mossadeq

3. Calculer lesprance mathmatique et la variance de ^:


Que peut-on conclure ?
4. Calculer la quantit dinformation de F isher.
En dduire que ^ est e cace.

Solution 2

Soit X une variable alatoire exponentielle dont la densit de probabilit f est


dnie pour tout x, x > 0, par :

f (x) =

8 1
>
< exp
>
:

si

x>0

si

o est un paramtre rel strictement positif.


On a :
8
< E [X] =

V [X] =

1. Considrons un r-chantillon de cette structure.


Sa fonction de vraisemblance est dnie pour tout ,

Rr ; tous strictement positifs, par :

L ( ; x1 ; :::; xr )

r
Y

> 0, et tout (x1 ; :::; xr ) 2

f (xi )

i=1

1
r

exp

r
P

xi

i=1

do :

ln L ( ; x1 ; :::; xr ) =

53

r ln

r
P

i=1

xi

A. El Mossadeq

Structures Statistiques et Estimation

Il en rsulte que :

@
ln L ( ; x1 ; :::; xr ) =
@

r
P

xi

i=1
2

do :

@
ln L ( ; x1 ; :::; xr ) = 0 =)
@
et comme :

1X
=
xi
r i=1

@2
ln L ( ; x1 ; :::; xr ) < 0
@ 2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune
structure exponentielle est :
r

X
^= 1
Xi
r i=1

Cest la moyenne empirique du r-chantillon.


2. Pour tout ,

> 0, et tout (x1 ; :::; xr ) 2 Rr ; tous strictement positifs, on a :


r
P
xi
1
i=1
L ( ; x1 ; :::; xr ) =
r exp
=

1
r

exp

r^ (x1 ; :::; xr )

Daprs le thorme de factorisation, ^ est un rsum exhaustif puisque :

L ( ; x1 ; :::; xr ) = g

; ^ (x1 ; :::; xr ) h (x1 ; :::; xr )

o :

1
; ^ (x1 ; :::; xr ) = r exp

et :

h (x1 ; :::; xr ) = 1

54

r^ (x1 ; :::; xr )

Structures Statistiques et Estimation

A. El Mossadeq

3. Comme :
r

X
^= 1
Xi
r i=1

alors :

h i
E ^ = E [X] =

et :

h i V [X]
2
^
V
=
=
r
r
On en dduit que ^ est un estimateur sans biais et convergent de .
4. Calculons la quantit dinformation de F isher, I [X; ], concernant .
On a :

I [X; ]

=
=
=
=

@2
ln f ( ; X)
@ 2
@2
X
E
ln
2
@
1
2X
E
+
2
3
E

1
2

Donc la quantit dinformation de F isher, I [X1 ; :::; Xr ; ], concernant


fournie par le r-chantillon est :

r
I [X1 ; :::; Xr ; ] = rI [X; ] = 2
h i
Calculons le cacit e ^ de ^.
On a :
h i
1
h i =1
e ^ =
I [X1 ; :::; Xr ; ] V ^
donc, ^ est e cace.

55

A. El Mossadeq

Structures Statistiques et Estimation

Exercice 3

Soit X une variable alatoire dont la densit de probabilit f est dnie par :
8
< 0
si x 0
x
f (x) =
: k xk 1 exp
si x > 0

o est un paramtre rel strictement positif , k un entier naturel non nul et


une constante rel.

1. Dterminer la constante :
2. Dterminer lestimateur du maximum de vraisemlance ^ de dun r-chantillon
de variable parente X .
3. ^ est-il un rsum exhaustif ?
4. Calculer lesprance mathmatique et la variance de ^:
Que peut-on conclure ?
5. Calculer la quantit dinformation de F isher.
En dduire que ^ est e cace.

Solution 3

Rappelons que pour tout k 2 N :


Z +1

uk exp udu = k!

1. Ainsi :

+1

f (x) dx

+1

Z0 +1

xk
k
uk

(k

1)!

do

1
(k

56

1)!

exp

dx

exp udu

Structures Statistiques et Estimation

puisque :

De plus :

E [X]

=
=

A. El Mossadeq

+1

f (x) dx = 1
1

Z
Z

+1

xf (x) dx
1
+1

et :

E X

=
=

1
xk exp
k
(k 1)!

dx

+1

x2 f (x) dx
1
+1

1
xk+1 exp
k
(k 1)!
0
k (k + 1) 2

dx

do :

V [X]

E X2

E [X]2

2. Considrons un r-chantillon de cette structure.

> 0, et tout (x1 ; :::; xr ) Rr ;

Sa fonction de vraisemblance est dnie pour tout ,


tous strictement positifs, par :

L ( ; x1 ; :::; xr )

r
Y

f (xi )

i=1

[(k

1
1)!]r

57

k 1

rk

(x1 :::xr )

exp

r
P

i=1

xi

A. El Mossadeq

Structures Statistiques et Estimation

do :

ln L ( ; x1 ; :::; xr ) =

r ln (k

1)!

k 1

ln (x1 :::xr )

rk ln

r
P

xi

i=1

Il en rsulte que :

@
ln L ( ; x1 ; :::; xr ) =
@

rk

r
P

xi

i=1
2

do :

@
ln L ( ; x1 ; :::; xr ) = 0 =)
@
et comme :

1 X
=
xi
rk i=1

@2
ln L ( ; x1 ; :::; xr ) < 0
@ 2
donc lestimateur du maximum de vraisemblance dun r-chantillon de cette
structure est :
r
X
1
^=
Xi
rk i=1

3. Pour tout ,

> 0, et tout (x1 ; :::; xr ) 2 Rr ; tous strictement positifs, on a :

L ( ; x1 ; :::; xr )

[(k

1
1)!]r

[(k

1
1)!]r

(x1 :::xr )k

rk

exp

rk

(x1 :::xr )k

exp

r
P

xi

i=1

rk ^ (x1 ; :::; xr )

Daprs le thorme de factorisation, ^ est un rsum exhaustif puisque :

L ( ; x1 ; :::; xr ) = g

; ^ (x1 ; :::; xr ) h (x1 ; :::; xr )

58

Structures Statistiques et Estimation

A. El Mossadeq

o :

; ^ (x1 ; :::; xr ) =

rk ^ (x1 ; :::; xr )

exp

rk

et :

h (x1 ; :::; xr ) =

1
[(k

1)!]

(x1 :::xr )k

4. Puisque :
r

X
^= 1
Xi
rk i=1

alors :

h i
E ^

et :

h i
V ^

1
E [X]
k

=
=

V [X]
rk 2
2

rk

On en dduit que ^ est un estimateur sans biais et convergent de .


5. Calculons la quantit dinformation de F isher, I [X; ], concernant .
On a :

I [X; ]

@2
E
ln f ( ; X)
@ 2

@2
E
@ 2

=
=

k
2

ln (k

1)! + (k

2X
3

k
2

59

1) ln X

k ln

A. El Mossadeq

Structures Statistiques et Estimation

Donc la quantit dinformation de F isher, I [X1 ; :::; Xr ; ], concernant


fournie par le r-chantillon est :

rk
I [X1 ; :::; Xr ; ] = rI [X; ] = 2
h i
Calculons le cacit e ^ de ^.
On a :
h i
1
h i =1
e ^ =
I [X1 ; :::; Xr ; ] V ^
donc, ^ est e cace.

Exercice 4

Soit X une variable alatoire dont la densit de probabilit f est dnie par :
8
= [0; ]
>
< 0 si x 2
f (x) =
>
: 1 si x 2 [0; ]

est un paramtre rel.

1. Dterminer la fonction de rpartition de X:


2. Calculer la quantit dinformation de F isher:
3. Dterminer lestimateur du maximum de vraisemlance ^ de dun r-chantillon
de variable parente X .
4. Calculer lesprance mathmatique et la variance de ^:
Que peut-on conclure ?
5. Dans le cas o ^ est bias, proposer un estimateur sans biais de .

60

Structures Statistiques et Estimation

A. El Mossadeq

Solution 4

1. La fonction de rpartition F de X est dnie pour tout x 2 R par :


Z x
F (x) =
f (t) dt
do :

de plus :

8
0
>
>
>
>
>
< x
F (x) =
>
>
>
>
>
:
1

si

si

si

8
>
>
E [X] =
>
<
2

2. Puisque le domaine D :

>
>
>
: V [X] =

12

fx 2 R jf (x) > 0g

[0; ]

dpend de , donc la quantit dinformation de F isher nexiste pas.


3. Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dnie pour tout ,

[0; ]r :
L ( ; x1 ; :::; xr ) =
La fonction :

r
Y

f (xi ) =

i=1

! L ( ; x1 ; :::; xr )

61

> 0, et tout (x1 ; :::; xr ) 2


1
r

A. El Mossadeq

Structures Statistiques et Estimation

est strictement dcroissante, donc elle atteint son maximum lorsque

est

minimum.
Et comme :

8i 2 f1; :::; rg :
Il en rsulte que

xi

est minimum lorsque :

= max (x1 ; :::; xr )


Donc lestimateur du maximum de vraisemblance dun r-chantillon dune
structure uniforme est :

^ = max (X1 ; :::; Xr )


4. Pour dterminer la densit de probabilit de ^, commenons dabord par calculer sa fonction de rpartition.
(a) Fonction de rpartition de ^ :
Pour tout u 2 R on a :

F^ (u)

=
=
=
=

h
i
^
P
<u

P [max (X1 ; :::; Xr ) < u]


P [X1 < u; :::; Xr < u]
r
Y
P [Xk < u]
k=1

[F (u)]r
8
0
>
>
>
>
>
< u r
>
>
>
>
>
:
1

62

si

si

si

Structures Statistiques et Estimation

A. El Mossadeq

(b) Densit de probabilit de ^ :


Pour tout u 2 R f0; g on a :

f^ (u)

d
F^ (u)
du
8
>
0
>
<

>
ur 1
>
: r r

si

u2
= ]0; [

si

u 2 ]0; [

(c) Esprance mathmatique de ^ :


Z
h i
E ^
=
uf^ (u) du
R
Z
ur
=
r r du
0

r
r+1

2
(d) Esprance mathmatique de ^ :
Z
h 2i
E ^
=
u2 f^ (u) du
ZR
ur+1
=
r r du
0

r
r+2

(e) Variance de ^ :

h i
V ^
Lestimateur ^ de

=
=

h 2i
E ^

h i2
E ^

(r + 1) (r + 2)

est biais, mais il est asymptotiquement sans biais.

63

A. El Mossadeq

Structures Statistiques et Estimation

5. Considrons lestimateur :

T =
Alors :

E [T ]

=
=

r + 1^
r
r + 1 h^i
E
r

et :

V [T ]

=
=

2
h i
r+1
V ^
r
1
2
r (r + 2)

T est donc un estimateur sans biais et convergent de .

Exercice 5

Soit X une variable alatoire dont la densit de probabilit f est dnie par :
8
si x <
< 0
f (x) =
:
exp (
x) si x
o

est un paramtre rel.

1. Dterminer la fonction de rpartition de X:


2. Calculer la quantit dinformation de F isher:
3. Dterminer lestimateur du maximum de vraisemlance ^ de dun r-chantillon
de variable parente X .
4. Calculer lesprance mathmatique et la variance de ^:
Que peut-on conclure ?
5. Dans le cas o ^ est bias, proposer un estimateur sans biais de .

64

Structures Statistiques et Estimation

A. El Mossadeq

Solution 5

1. La fonction de rpartition F de X est dnie pour tout x 2 R par :


Z x
F (x) =
f (t) dt
1

do :

F (x) =
de plus :

8
< 0
:

2. Puisque le domaine D :

exp (

x)

si

si

8
< E [X] = + 1
:

V [X] = 1

fx 2 R jf (x) > 0g

[ ; +1[

dpend de , donc la quantit dinformation de F isher nexiste pas.


3. Considrons un r-chantillon de cette structure.

2 R, et tout (x1 ; :::; xr ) 2

Sa fonction de vraisemblance est dnie pour tout

([ ; +1[)r :
L ( ; x1 ; :::; xr )

r
Y

f (xi )

i=1

exp

r
X

xi )

i=1

La fonction :

! L ( ; x1 ; :::; xr )
est strictement croissante, donc elle atteint son maximum lorsque
mum.

65

est maxi-

A. El Mossadeq

Structures Statistiques et Estimation

Et comme :

8i 2 f1; :::; rg :
Il en rsulte que

xi

est maximum lorsque :

= min (x1 ; :::; xr )


Donc lestimateur du maximum de vraisemblance dun r-chantillon de cette
structure est :

^ = min (X1 ; :::; Xr )


4. Pour dterminer la densit de probabilit de ^, commenons dabord par calculer sa fonction de rpartition.
(a) Fonction de rpartition de ^ :
Pour tout v 2 R on a :

F^ (v)

h
i
P ^<v

P [min (X1 ; :::; Xr )

P [X1 v; :::; Xr
r
Y
P [Xk v]

P [min (X1 ; :::; Xr ) < v]

k=1
r
Y

(1

v]
v]

P [Xk < v])

k=1

=
=

1 [1
8
< 0
:

F (v)]r

exp r (

66

v)

si

si

Structures Statistiques et Estimation

A. El Mossadeq

(b) Densit de probabilit de ^ :


Pour tout u 2 R f g on a :

f^ (v)

=
=

d
F^ (v)
dv
8
< 0
:

r exp r (

v)

(c) Esprance mathmatique de ^ :


Z
h i
E ^
=
vf^ (v) dv
R
Z +1
=
rv exp r (

si

v<

si

v>

v) dv

1
r

(d) Esprance mathmatique de ^ :


Z
h 2i
E ^
=
v 2 f^ (v) dv
ZR+1
=
rv 2 exp r (

1
+
r

v) dv

1
r2

(e) Variance de ^ :

h i
h 2i
^
V
=E ^

Lestimateur ^ de

h i2
1
E ^ = 2
r

est biais, mais il est asymptotiquement sans biais.

5. Considrons lestimateur :

T =^

67

1
r

A. El Mossadeq

Alors :

et :

Structures Statistiques et Estimation

h i
E [T ] = E ^

1
=
r

h i
1
V [T ] = V ^ = 2
r
T est donc un estimateur sans biais et convergent de .

Exercice 6

Les lments dune population possdent un caractre X qui suit une loi de
P oisson de paramtre inconnu :
Une suite de r expriences a fourni les valeurs k1 ; :::; kr :
1. Dterminer lestimateur du maximum de vraisemlance ^ de
proprits de cet estimateur.
2. ^ est-il un rsum exhaustif ?
3. On dsire estimer la quantit :

= P [X = 0]
Dterminer lestimateur du maximum de vraisemlance ^ de .
Que remarquez-vous ?

Solution 6

1. Soit X une variable alatoire de Poisson de paramtre .


pour tout x 2 N, la probabilit lmentaire p (x) de x est :
x

p (x) =
de plus :

x!

exp

8
< E [X] =
:

V [X] =

68

et tudier les

Structures Statistiques et Estimation

A. El Mossadeq

(a) Recherche du maximum de vraisemlance :


Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dnie pour tout

(k1 ; :::; kr ) 2 Nr par :


L ( ; k1 ; :::; kr )

r
Y

> 0, et tout

p (ki )

i=1

r
P

ki

i=1

k1 !:::kr !

exp r

do :

ln L ( ; k1 ; :::; kr ) =

ln (k1 !:::kr !) +

r
X

ki ln

i=1

Il en rsulte que :

@
ln L ( ; k1 ; :::; kr ) =
@

r
P

ki

i=1

do :
r

@
1X
ln L ( ; k1 ; :::; kr ) = 0 =) p =
xi
@
r i=1

et comme :

@2
ln L ( ; k1 ; :::; kr ) < 0
@ 2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune
structure de Poisson est :
r
1X
^=
Xi
r i=1

Cest la moyenne empirique du r-chantillon.

69

A. El Mossadeq

Structures Statistiques et Estimation

(b) Etude des proprits de ^ :


Puisque :

E [^ ] = E [X] =
et :

V [X]
=
r
r
On en dduit que ^ est un estimateur sans biais et convergent de .
V [^ ] =

2. Pour tout ,

> 0, et tout (k1 ; :::; kr ) 2 Nr on a :


r^ (k1 ;:::;kr )

L ( ; x1 ; :::; xr ) =

exp r
x1 !:::xr !
Daprs le thorme de factorisation, ^ est un rsum exhaustif puisque :
L ( ; x1 ; :::; xr ) = g ( ; ^ (x1 ; :::; xr )) h (x1 ; :::; xr )
o :

g ( ; ^ (x1 ; :::; xr )) =

r^ (k1 ;:::;kr )

exp r

et :

h (x1 ; :::; xr ) =

1
x1 !:::xr !

3. On a :

= P [X = 0] = exp
Pour tout ,

> 0, et tout (k1 ; :::; kr ) 2 Nr par :


L ( ; k1 ; :::; kr )

r
Y

p (ki )

i=1

70

r
P

( ln )i=1
k1 !:::kr !

ki
r

Structures Statistiques et Estimation

A. El Mossadeq

do :

ln L ( ; k1 ; :::; kr ) =

ln (k1 !:::kr !) +

r
X

ki ln ( ln ) + r ln

i=1

Il en rsulte que :

r
P

ki
@
r
i=1
ln L ( ; k1 ; :::; kr ) =
+
@
ln
do :

@
ln L ( ; k1 ; :::; kr ) = 0 =)
@

= exp

et comme :

1X
ki
r i=1

@2
ln L ( ; k1 ; :::; kr ) < 0
@ 2
donc lestimateur du maximum de vraisemblance dun r-chantillon de cette
structure est :
!
r
X
1
^ = exp
Xi
r i=1
=

exp

Exercice 7

Soit

un rel appartenant ]1; +1[ et X une variable alatoire telle que :

P [X = k] =

k 1

; k2N

1. Calculer lesprance mathmatique et la variance de X .


2. Dterminer lestimateur du maximum de vraisemlance ^ de
de variable parente X et tudier ses proprits.
3. ^ est-il un rsum exhaustif ?

71

dun r-chantillon

A. El Mossadeq

Structures Statistiques et Estimation

Solution 7

1. On a :

E [X]

1
X

kP [X = k]

k=1

1
X
k

k 1

k=1

=
et :

E [X (X

1)]

1
X

k (k

1) P [X = k]

k=1

1
X
k (k

1)

k 1

k=1

do :

E X2

E [X (X

(2

1)] + E [X]
1)

et :

V [X]

=
=

E [X]2

E X2
(

1)

2. Considrons un r-chantillon de cette structure.


Sa fonction de vraisemblance est dnie pour tout

(x1 ; :::; xr ) 2 (N )r par :

72

2 ]1; +1[ et tout

Structures Statistiques et Estimation

A. El Mossadeq

L ( ; x1 ; :::; xr )

r
Y

p (xi )

i=1

do :

ln L ( ; x1 ; :::; xr ) =

r ln

r
X

@
ln L ( ; x1 ; :::; xr )
@

xi r

i=1

xi

r ln 1

r
P

i=1

Il en rsulte que :

r
P

r
P

xi

i=1

xi

1)

1)

i=1

do :

@
ln L ( ; x1 ; :::; xr ) = 0 =)
@
et comme :

1X
=
xi
r i=1

@2
ln L (p; x1 ; :::; xr ) < 0
@ 2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune
structure gomtrique est :
r

1X
Xi
^=
r i=1

Cest la moyenne empirique du r-chantillon.

73

A. El Mossadeq

Structures Statistiques et Estimation

3. Puisque :
r

alors :

1X
^=
Xi
r i=1
E [^ ]

E [X]

=
et :

V [X]
r
(
1)
=
r
On en dduit que ^ est un estimateur sans biais et convergent du paramtre
dune structure gomtrique.
V [^ ]

Exercice 8

Soit X une variable alatoire qui suit une loi de Pareto dont la densit de probabilit f est dnie par :
8 a
>
si x a
<
+1
x
f (x) =
>
:
0
si x < a
o X reprsente le revenu par habitant, a le revenu minimum et ,
coe cient dpendant du type du pays o lon se place.

> 2, un

1. Vrier que f est bien une densit de probabilit.


2. Calculer lesprance mathmatique et la variance de X .
3. Calculer la fonction de rpartition de X:
4. Dterminer lestimateur du maximum de vraisemlance a
^ de a dun r-chantillon
issu X .
5. Dans le cas o a
^ est bias, proposer un estimateur sans biais de a:

74

Structures Statistiques et Estimation

A. El Mossadeq

Solution 8

1. La densit de probabilit de la loi de Pareto est dnie par :


8 a
>
si x a
<
+1
x
f (x) =
>
:
0
si x < a

f est bien une densit de probabilit.


En eet :
Z
f (x) dx =
R

E [X]

=
=

et :

E X

=
=

dx

xf (x) dx

ZR+1

a
dx
x

1
Z

x2 f (x) dx

ZR+1
a

+1

a
x

2. On a :

+1

a
x

dx

a2

do :

V [X]

=
=

E X2
(

2) (

75

E [X]2
2a

1)

A. El Mossadeq

Structures Statistiques et Estimation

3. La fonction de rpartition F de X est dnie pour tout x 2 R par :


Z x
F (x) =
f (t) dt
1
8
0
si x a
>
>
<
Z x
=
a
>
>
dt si x a
:
+1
a t
8
si x a
>
< 0
=
>
: 1 a
si x a
x
4. Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dnie pour tout a 2 R et tout (x1 ; :::; xr ) 2

(]a; +1[)r , par :

L (a; x1 ; :::; xr ) =
La fonction :

r
Y

r r

f (xi ) =

i=1

a
(x1 :::xr )

+1

a ! L (a; x1 ; :::; xr )
est strictement croissante, donc elle atteint son maximum lorsque a est maximum.
Et comme :

8i 2 f1; :::; rg : a
Il en rsulte que

xi

est maximum lorsque :

a = min (x1 ; :::; xr )


Donc lestimateur du maximum de vraisemblance dun r-chantillon de cette
structure est :

a
^ = min (X1 ; :::; Xr )

76

Structures Statistiques et Estimation

A. El Mossadeq

5. Pour dterminer la densit de probabilit de ^, commenons dabord par calculer sa fonction de rpartition.
(a) Fonction de rpartition de a
^:
Pour tout x 2 R on a :

Fa^ (x)

P [^
a < x]

P [min (X1 ; :::; Xr ) < x]

P [min (X1 ; :::; Xr )

P [X1 v; :::; Xr
r
Y
P [Xk x]

k=1
r
Y

(1

x]
x]

P [Xk < x])

k=1

=
Ainsi :

Fa^ (x) =

[1

8
< 0
: 1

F (x)]r

a
x

si

si

(b) Densit de probabilit de ^ :


Pour tout x 2 R fag on a :

fa^ (x)

d
Fa^ (x)
dv
8
>
< 0

r
>
: r a
xr +1

77

si

x<a

si

x>a

A. El Mossadeq

Structures Statistiques et Estimation

(c) Esprance mathmatique de a


^:
Z
E [^
a] =
vfa^ (v) dv
R
Z +1
r ar
=
dv
r
v
a
r
a
=
r
1
(d) Esprance mathmatique de a
^2 :
Z
2
E a
^
=
v 2 fa^ (v) dv
ZR+1
r ar
dv
=
vr 1
a
r
=
a2
r
2
(e) Variance de a
^:

V [^
a]

=
=

E [^
a]2

E a
^2

r
2) (r

(r

2a

1)

Lestimateur a
^ de a est biais, mais il est asymptotiquement sans biais.
(f) Considrons lestimateur :

T =

1
r

a
^

Alors :

E [T ] = a
et :

V [T ] =

V [^
a] =

a2

r
r (r
2)
T est donc un estimateur sans biais et convergent de a.

78

Structures Statistiques et Estimation

A. El Mossadeq

Exercice 9

Soit X une variable alatoire dont la densit de probabilit f est dnie par :
8
>
0
si x
>
<
f (x) =
>
1
(
x)
>
:
exp
si x >
o

est un paramtre rel et

un paramtre rel strictement positif.

1. Vrier que f est bien une densit de probabilit.


2. Calculer lesprance mathmatique et la variance de X .
3. Calculer la fonction de rpartition de X:
4. On suppose

connu et

inconnu.

(a) Dterminer lestimateur du maximum de vraisemlance ^ de

dun r-

chantillon issu X .
(b) Etudier les proprits de ^ :
(c) Dans le cas o ^ est bias, proposer un estimateur sans biais de :
5. On suppose

connu et

inconnu.

(a) Dterminer lestimateur du maximum de vraisemlance ^ de

dun r-

chantillon issu de X .
(b) Etudier les proprits de ^
(c) Dans le cas o ^ est bias, proposer un estimateur sans biais de :
6. On suppose que

et

sont tous les deux inconnus.

(a) Dterminer lestimateur du maximum de vraisemlance


dun r-chantillon issu de X .
(b) Etudier les proprits de

^; ^

(c) Proposer un estimateur sans biais de ( ; ) :

79

^; ^

de ( ; )

A. El Mossadeq

Structures Statistiques et Estimation

Solution 9

1. f est bien une densit de probabilit.


En eet :

f (x) dx

+1

exp

x)

dx

+1

exp tdt

=
2. On a :

E [X]

=
=
=

xf (x) dx

ZR+1
Z

exp

x)

dx

+1

( t + ) exp tdt

=
et :

E X

x2 f (x) dx

ZR+1

+1

x2

exp

x)

( t + )2 exp tdt

+2

( + )2 +

+
2

do :

V [X]

=
=

dx

E X2
2

80

E [X]2

Structures Statistiques et Estimation

A. El Mossadeq

3. La fonction de rpartition F de X est dnie pour tout x 2 R par :


Z x
F (x) =
f (t) dt
1
8
0
si x
>
>
<
Z x
=
1
(
t)
>
>
:
exp
dt si x
8
>
0
si x
>
<
=
>
(
x)
>
: 1 exp
si x

4. On suppose

connu et

inconnu.

(a) Considrons un r-chantillon de cette structure.


Sa fonction de vraisemblance est dnie pour tout

> 0,

tout (x1 ; :::; xr ) 2 (] ; +1[)r par :

L ( ; x1 ; :::; xr )

r
Y

f (xi )

i=1

exp

r
X
(

xi )

i=1

do :

ln L ( ; x1 ; :::; xr ) =

r ln

xi )

i=1

Il en rsulte que :

@
ln L ( ; x1 ; :::; xr )
@

r
1X

81

r
1 X

"

i=1

r
1X
i=1

xi )
#

xi )

2 R et

A. El Mossadeq

Structures Statistiques et Estimation

do :
r

@
ln L ( ; x1 ; :::; xr ) = 0
@

1X
=
(xi
r i=1

=)

=)

"

et comme :

r
1X

xi

i=1

)
#

@2
ln L ( ; x1 ; :::; xr ) < 0
@ 2
donc lestimateur du maximum de vraisemblance dun r-chantillon de
cette structure est :
" r
#
1X
^=
Xi
r i=1

(b) On a :

E [^ ] = E

"

r
1X

et :

V [^ ]

Xi

i=1

"

1X
Xi
r i=1

V [X]
r

5. On suppose

connu et

r
inconnu.

(a) Considrons un r-chantillon de cette structure.


Sa fonction de vraisemblance est dnie pour tout
r

> 0,

tout (x1 ; :::; xr ) 2 (] ; +1[) , tous strictement positifs, par :

82

2 R et

Structures Statistiques et Estimation

L ( ; x1 ; :::; xr )

A. El Mossadeq

r
Y

f (xi )

i=1

exp

r
X
(

xi )

i=1

La fonction :

! L ( ; x1 ; :::; xr )
est strictement croissante, donc elle atteint son maximum lorsque

est

maximum.Et comme :

8i 2 f1; :::; rg :
Il en rsulte que

xi

est maximum lorsque :

= min (x1 ; :::; xr )


Donc lestimateur du maximum de vraisemblance dun r-chantillon de
cette structure est :

^ = min (X1 ; :::; Xr )


(b) Pour dterminer la densit de probabilit de ^, commenons dabord par
calculer sa fonction de rpartition.
(i) Fonction de rpartition de ^ :
Pour tout v 2 R on a :

F^ (v)

h
i
^
P
<v

P [min (X1 ; :::; Xr ) < v]

P [min (X1 ; :::; Xr )

P [X1

83

v; :::; Xr

v]
v]

A. El Mossadeq

Structures Statistiques et Estimation

F^ (v)

=
=

1
1

r
Y

P [Xk

k=1
r
Y

(1

v]

P [Xk < v])

k=1

=
=

F (v)]r

1 [1
8
0
>
>
<
>
>
: 1

exp r

si

si

(ii) Densit de probabilit de ^ :


Pour tout v 2 R f g on a :

f^ (v)

d
F^ (v)
dv
8
0
>
>
<

r
>
>
:
exp r

si

v<

si

v>

(iii) Esprance mathmatique de ^ :


Z
h i
E ^
=
vf^ (v) dv
R

=
=

+1

v exp r

dv

+1

84

t+

exp tdt

Structures Statistiques et Estimation

A. El Mossadeq

2
(iv) Esprance mathmatique de ^ :
Z
h 2i
=
v 2 f^ (v) dv
E ^
R

+1

v 2 exp r (
2

=
(v) Variance de ^ :
h i
V ^

h 2i
E ^
2

v) dv

r
h i2
E ^

Lestimateur ^ de est biais, mais il est asymptotiquement sans biais.


(c) Considrons lestimateur :

T =^
Alors :

E [T ]

r
h i
E ^

=
=

et :

V [T ]

=
=

h i
V ^

r2
T est donc un estimateur sans biais et convergent de .
6. On suppose que

et

sont tous les deux inconnus.

(a) Considrons un r-chantillon de cette structure.


Sa fonction de vraisemblance est dnie pour tout

85

> 0,

2 R et

A. El Mossadeq

Structures Statistiques et Estimation

tout (x1 ; :::; xr ) 2 (] ; +1[)r , tous strictement positifs, par :

L ( ; ; x1 ; :::; xr )

r
Y

f (xi )

i=1

exp

r
X
(

xi )

i=1

Compte tenu des questions prcedentes, la fonction :

( ; ) 7 ! L ( ; ; x1 ; :::; xr )
atteint son maximum pour :

8
>
>
>
<
>
>
>
:

= min (x1 ; :::; xr )


"

1X
=
xi
r i=1

do, les estimateurs du maximum de vraisemblance ^ ; ^ de ( ; ) sont


donns par :

(b) On a :

et :

8
^ = min (X1 ; :::; Xr )
>
>
>
<
" r
#
X
1
>
>
^
>
Xi
: ^= r
i=1
h i
E ^ =

E [^ ] = E [X]

h i r
E ^ =

Donc les estimateurs ^ et ^ sont biaiss.

86

1
r

Structures Statistiques et Estimation

A. El Mossadeq

(c) Considrons les estimateurs T et S de


8
r
>
T =
^
>
>
<
r 1
alors :

>
>
>
: S=^

et

respectivement dnis par :

8
< E [T ] =
:

E [S] =

Donc T et S sont des estimateurs sans biais de

et

respectivement.

Exercice 10

A la veille dune consultation lectorale, on a intrrog cent lecteurs constituant


un chantillon au hasard. Soixante ont dclar avoir lintention de voter pour le
candidat C .
En quelles limites, au moment du sondage, la proportion du corps lectoral favorable C se situe-t-elle ?

Solution 10

Construisons lintervalle de conance correspondant la frquence f = 0:6 du


corps lectoral favorable C observe sur un chantillon de taille n = 100.
Au seuil , cet intervalle est dni par :
#
"
r
r
f (1 f )
f (1 f )
; f + t1 =2
f t1 =2
n
n
Pour

= 5%, on a :
t:975 = 1:96

on obtient alors lintervalle :

[:504; :696]
A 95%, le candidat C serait lu.

87

A. El Mossadeq

Structures Statistiques et Estimation

Exercice 11

On sait que le taux de mortalit dune certaine maladie est de 30%.


Sur 200 malades tests, combien peut-on envisager de dcs ?

Solution 11

Construisons dobord lintervalle de pari, pour un chantillon de taille n = 200,


correspondant la probabilit de dcs p = 0:3.
Au seuil , cet intervalle est dni par :

"
Pour

t1

=2

p (1 p)
; p + t1
n

=2

p (1 p)
n

= 5%, on a :
t:975 = 1:96

on obtient alors lintervalle :

[0:24; 0:36]
Il en rsulte que sur les 200 malades, le nombre de dcs envisager serait
compris, 95%, entre 48 et 72 dcs.

Exercice 12

Dans une pr-enqute, on selectionne, par tirage au sort cent dossiers.


Quinze dentre eux sont incomplets.
Combien de dossiers incomplets trouvera-t-on sur dix milles dossiers ?

Solution 12

Construisons lintervalle de conance correspondant la frquence f = 0:15 de


dossiers incomplets observe sur un chantillon de taille n = 100.
Au seuil , cet intervalle est dni par :

"

t1

=2

f (1 f )
; f + t1
n

88

=2

f (1 f )
n

Structures Statistiques et Estimation

Pour

A. El Mossadeq

= 5%, on a :
t:975 = 1:96

on obtient alors lintervalle :

[0:08; 0:22]
Il en rsulte que sur les 10000 dossiers, le nombre de dossiers incomplets serait
compris, 95%, entre 800 et 2200 dossiers.

Exercice 13

Dans une maternit, on fait le point de la proportion de lles toutes les cent
naissances.
Comment peut varier cette proportion dune fois lautre si lon admet quil nait
en moyenne 51% de lles ?

Solution 13

Construisons lintervalle de pari, pour un chantillon de taille n = 100, correspondant la probabilit dobtenir une lle p = 0:51.
Au seuil , cet intervalle est dni par :

"
Pour

t1

=2

p (1 p)
; p + t1
n

=2

p (1 p)
n

= 5%, on a :
t:975 = 1:96

on obtient alors lintervalle :

[:41; :61]
Il en rsulte, qu 95%, la proportion de lles varie dune fois lautre, entre
41% et 61%.

89

A. El Mossadeq

Structures Statistiques et Estimation

Exercice 14

Sur un chantillon de 600 sujets atteints du cancer des poumons, on a trouv


550 fumeurs.
Que peut-on dire du pourcentage de fumeurs parmi les cancreux ?

Solution 14

11
Construisons lintervalle de conance correspondant la frquence f =
des
12
cancreux parmi les fumeurs observe sur un chantillon de taille n = 600.
Au seuil , cet intervalle est dni par :
"
Pour

t1

=2

f (1 f )
; f + t1
n

=2

f (1 f )
n

= 5%, on a :
t:975 = 1:96

on obtient alors lintervalle :

[0:9; 0:94]
Il en rsulte que parmi, les fumeurs, la proportion des atteints par le cancer des
poumons est comprise, 95%, entre 90% et 94%.

Exercice 15

Une srie de cent mesures a donn comme rsultat :


8 100
X
>
>
>
xi = 5200
>
>
>
< i=1

"
>
>
100
>
X
>
>
>
xi
:
i=1

100
1 P
xj
100 j=1

90

#2

= 396

Structures Statistiques et Estimation

A. El Mossadeq

1. Estimer la moyenne et la variance.


2. Quel est, 95%, lintervalle de conance de la moyenne ?
3. En supposant la variable mesure gaussienne, dterminer, 95%, lintervalle
de conance de la variance.

Solution 15

1. Soit m lestimation de la moyenne et s2 celle de la variance.


On a :
100

1 X
xi
100 i=1

=
=

52

et :
100

1 X
(xi
99 i=1

=
=

m)2

2. Au seuil , lintervalle de conace de la moyenne est dni par :

m
Pour

t1

=2 p

; m + t1

=2 p

= 5%, on a :
t:975 = 1:96

do lintervalle de conance 95% :

[51:608; 52:392]
3. Au seuil , lintervalle de conace de la variance est dni par :
"
#
(n 1) 2 (n 1) 2
s; 2
s
2
n 1;1

=2

n 1; =2

91

A. El Mossadeq

Pour

Structures Statistiques et Estimation

= 5% :
8
<
:

2
99;:025

'

2
100;:025

= 74:2

2
99;:975

'

2
100;:975

= 129:6

do lintervalle de conace de lcart-type 95% :

[3:06; 5:34]

Exercice 16

La force de rupture dun certain type de cable peut tre assimile une variable
alatoire normale.
Des essais portant sur dix cables ont donn une variance empirique s2 de 1560 N2 .
Construire un intervalle de conance, 95%, de lcart-type de cette force de
rupture.

Solution 16

Au seuil , lintervalle de conace de lcart-type est dni par :

"s
Pour

(n
2
n 1;1

1)

s;

=2

(n

1)

s
2
n 1; =2

= 5% :
8
<
:

2
9;:025

= 2:7

2
9;:975

= 19

do lintervalle de conace de lcart-type 95% :

[27:18 N; 72:11 N]

92

Structures Statistiques et Estimation

A. El Mossadeq

Exercice 17

Une enqute statistique eectue sur cent sujets permet de dnir, 95%,
lintervalle de conance de la moyenne :

[49:6

50:4]

Dans quelles conditions aurait-il t possible que le rsultat ft 95% :

[49:8

50:2]

Solution 17

Il sagit de dterminer la taille n0 de lchantillon prlever pour que lintervalle


de conance de la moyenne 95% soit :

[49:8; 50:2]
sachant que pour un chantillon de taille n = 100, cet intervalle est :

[49:6; 50:4]
Puisque :

t1

=2 p

=2 p

; m + t1

= [49:6; 50:4]

on en dduit :

m=
et :

49:6 + 50:4
= 50
2

n (50:4
2t1

49:6)
=2

' 2:04

Lgalit :

50:2 = m + t1

=2 p 0
n

implique :
0

n =

t1
50:2

=2

93

= 400

A. El Mossadeq

Structures Statistiques et Estimation

Exercice 18

Pour dterminer le point de fusion moyen dun certain alliage, on a procd


neuf observations qui ont donnes une moyenne m = 1040 C et un cart-type
s = 16 C.
Construire un intervalle de conance de la moyenne 95%.

Solution 18

Ici on a :

n
m
s

=
=
=

9
1040 C
16 C

Au seuil , lintervalle de conace dune telle moyenne est dni par :

m
Pour

tn

1;1

s
; m + tn
n

=2 p

1;1

s
n

=2 p

= 5%, on a :
t8;:975 = 2:31

do lintervalle de conance 95% :

[1027:68 C; 1052:32 C]

Exercice 19

Si lcart-type de la dure de vie dun modle de lampe lectrique est estim


cent heures, quelle doit tre la taille de lchantillon prlever pour que lerreur
sur lestimation de la dure de vie moyenne nexde pas vingt heures et ce avec
une probabilit de 95% puis 99% ?

94

Structures Statistiques et Estimation

A. El Mossadeq

Solution 19

Lerreur sur lestimation de la moyenne est donne par :


s
t1 =2 p
n
(i) Pour

= 5%; on a :
t1

=2

= 1:96

do :

t1
(ii) Pour

s
n

=2 p

20 =) n

97

= 1%; on a :
t1

=2

= 2:57

do :

t1

s
n

=2 p

20 =) n

166

Exercice 20

Une machine fabrique des rondelles dont le diamtre D est une variable guassienne.
On prlve au hasard un chantillon de huit rondelles.
Leurs diamtres ont pour mesure en mm :

20:1 19:9 19:7 20:2 20:1 23:1 22:6 19:8


Construire 95% puis 99% les intervalles de conance de la moyenne et de la
variance.

Solution 20

Calculons dabord les estimations m et s2 de la moyenne et de la variance sur


cet chantillon de taille n = 8.

95

A. El Mossadeq

Structures Statistiques et Estimation

On a :
n

1X
xi
n i=1

=
=

20:6875 mm

et

=
=

1
n

n
X

m)2

(xi

i=1

1:827 mm2

1. Lintervalle de conance de la moyenne 1

m
(a) Pour

tn

1;1

s
; m + tn
n

=2 p

est :
1;1

= 5%, on a :
t7;:975 = 2:36

do lintervalle :

[19:163; 22:212]

(b) Pour

= 1%, on a :
t7;:995 = 3:5

do lintervalle :

[18:427; 22:948]
2. Lintervalle de conance de la variance 1
est :
#
"
2
2
(n 1) s (n 1) s
; 2
2
n 1;1

=2

96

n 1; =2

s
n

=2 p

Structures Statistiques et Estimation

(a) Pour

= 5%, on a :

8
<
:

do lintervalle :

A. El Mossadeq

2
7;:025

= 1:69

2
7;:975

= 16

[:79931; 7:5675]
(b) Pour

= 1%, on a :

8
<
:

do lintervalle :

2
7;:005

= :989

2
7;:995

= 20:3

[0:63; 12:931]

Exercice 21

Soient X et Y deux variables alatoires indpendantes, la premire prenant les


valeurs 1 et 0 avec les probabilits respectives et 1
, et la deuxime prenant
les valeurs 1 et 0 avec les probabilits respectives P et 1 P . On suppose
inconnue et P connue, P > 0:5.
On dnit la variable alatoire Z par :
8
< Z = 1 si X = Y

Z=0

si

X 6= Y

On considre un n-chantillon ((X1 ; Y1 ) ; :::; (Xn ; Yn )) de (X; Y ) et on dnit


Zi , 1 i n, partir de Xi et Yi comme on a dni Z partir de X et Y .
1. Montrer que (Z1 ; :::; Zn ) est un n-chantillon de Z .
2. Etudier les proprits de lestimateur :

T =

1
(Z1 + ::: + Zn )
n

97

A. El Mossadeq

Structures Statistiques et Estimation

3. Proposer alors un estimateur sans biais S de .


4. Etudier la variance de S en fonction de .
5. Indiquer un intervalle de conance pour

lorsque n est grand, en supposant

quon dispose dune observation p0 de la variable :

1
(Z1 + ::: + Zn )
n
6. Voyez-vous une application de ce qui prcde dans le domaine des sondages
T =

dopinion ?

Solution 21

On a :

8
< P [X = 0] = 1
:

et :

P [X = 1] =

8
< P [Y = 0] = 1
:

P [Y = 1] = P

X et Y deux variables alatoires de Bernouilli de paramtres


ment.
Dterminons la loi de probabilit de Z :
P [Z = 0]

et P respective-

P [X 6= Y ]

P [f(X; Y ) = (0; 1)g

P [X = 0] P [Y = 1] + P [X = 1] P [Y = 0]

(1

) P + (1

98

P)

f(X; Y ) = (0; 1)g]

Structures Statistiques et Estimation

A. El Mossadeq

et :

P [Z = 1]

P [X = Y ]

P [f(X; Y ) = (0; 0)g

P [X = 0] P [Y = 0] + P [X = 1] P [Y = 1]

(1

) (1

f(X; Y ) = (1; 1)g]

P) + P

Z est donc une variable alatoire de Bernouilli de paramtre :


= (1

) (1

P) + P

E [Z]
V [Z]

=
=

(1

de plus :

1. Puisque (X1 ; Y1 ) ; :::; (Xn ; Yn ) sont indpentants et suivent la mme loi que

(X; Y ), on en dduit que (Z1 ; :::; Zn ) sont indpendants et suivent la mme


loi que Z , donc cest un n-chantillon de Z .
2. Soit lestimateur :

T =

1
(Z1 + ::: + Zn )
n

On a :

E [T ]

E [Z]

(1

) (1

P) + P

et :

V [T ]

=
=

1
V [Z]
n
1
[(1
) (1
n

P ) + P ] [(1

99

) P + (1

P )]

A. El Mossadeq

Structures Statistiques et Estimation

3. T est donc un estimateur biais de

sauf lorsque :

1
2

ou :

P =1
(a) Si :

1
ou P = 1
2

alors il su t de prendre :

S=T
(b) Si :

6=

1
et P 6= 1
2

alors il su t de prendre :

S=

1
2P

[T

(1

P )]

4. On a :

V [S]

=
=

1
(2P

1)2

V [T ]

1
[(1
n (2P 1)2

) (1

P ) + P ] [(1

)P +

(1

P )]

Donc lestimateur S est convergent.


Dautre part :

d
V [S]
d

=
=

1
d
[(1
2
n (2P 1) d

) (1

1
n

100

P ) + P ] [(1

)P +

(1

P )]

Structures Statistiques et Estimation

A. El Mossadeq

La variance de S est strictement dcroissante.


Pour que S soit de variance minimale, il faut maximiser :
5. Si p0 est une observation de T , alors :

f=

1
2P

[p0

(1

P )]

est une observation S:


Daprs le thorme central limit, T peut tre approximer par une loi normale

N (E [T ] ; V [T ]) :
T

N (E [T ] ; V [T ])

V [T ] tant estime par :


p0 (1 p0 )
n
et puisque S est une trasformation a ne de T :
1
S=
[T (1 P )]
2P 1
donc S peut tre approximer par une loi normale N (E [S] ; V [S]) :
V [T ] =

N (E [S] ; V [S])

o :

E [S] =
et :

V [S]

V [T ]
(2P 1)2

p0 (1
n (2P

101

p0 )
1)2

A. El Mossadeq

Structures Statistiques et Estimation

Il en rsulte quau seuil , lintervalle de conance de

f
o

t1

=2

[S] ; f + t1

[S] reprsente lcart type de S:

102

=2

[S]

est donn par :