Vous êtes sur la page 1sur 5

ENSAE deuxi`eme annee

Examen, session 2003, 2 heures


SE 203 : estimation et introduction aux tests
Paul Doukhan
Les documents distribues en cours et les notes manuscrites. Les calculettes sont inutiles et
interdites. On pourra aussi se referer librement aux lemmes, theor`emes et propositions donnes
dans le polycopie support de cours ` a condition dy referer avec precision.
On traitera les exercices dans un ordre arbitraire, ` a la condition de le preciser clairement.
La longueur intentionnellement excessive de lenonce est compensee par un bareme portant
sur plus de 20 points.
Bareme indicatif sur 26 points : A(1,1,1,1,1,2,2) sur 9 points, B(1,1,1,2) sur 5 points,
C(1,1,1,1,1) sur 5 points, D(3,2,2) sur 7 points.
Exercice A (lois ) Soit X = (X
1
, . . . , X
n
) un n-echantillon de loi (p, ) de densite
g
p,
(x) =
p
x
p1
e
x
/(p) sur R
+
. On rappelle ici que la fonction dEuler, (p) =
_

0
t
p1
e
t
dt est reguli`ere sur ]0, [ et verie (p + 1) = p(p) pour p > 0 et (1) = 1.
1. Montrez que X est distribue selon un mod`ele exponentiel canonique en dimension
2. Precisement, on montrera que sa densite (par rapport ` a la la mesure de Lebesgue
sur (R
+
)
n
) secrit h(x)e
T(x)A()
avec = (
1
,
2
) pour
1
= p,
2
= et on
explicitera h(x), T(x), et A().
2. Calculez linformation de Fisher de ce mod`ele (on pourra donner une expression
dans laquelle gurent des derivees de la fonction dEuler).
3. Prouvez que les equations du maximum de vraisemblance equivalent ` a

( p) log

= log X,
p

= X
Devant la haute non linearite de cette expression, on envisage des methodes de
resolution numeriques. Pour initialiser ces methodes, nous mettons en oeuvre les
methodes de moments dans la suite de cet exercice.
4. Donnez une expression de
k
= E

X
k
1
. On pourra expliciter cette expression lorsque
k = 1, 2, 3
5. Determinez des estimateurs de fondes sur les moments dordre 1 et 2.
6. Determinez des estimateurs de fondes sur les moments dordre 2 et 3.
7. Que peut-on dire des proprietes asymptotiques de ces estimateurs ? (le bareme de
cette question ouverte pourra varier selon la precision de la reponse.)
1
Exercice B (information dun mod`ele de Poisson) Soit n 1 entier, z
1
, . . . , z
n
R,
on observe des variables aleatoires independantes X
1
, . . . , X
n
telles que X
i
suive la loi de
Poisson P(
i
) de param`etre
i
= e
+zi
. Par exemple z
i
pourrait modeliser la quantite
de medicament donnee au patient i et Y
i
mesurerait le nombre dagents infectieux par
unite de sang de ce patient 24 heures apr`es labsorption du medicament. Ici , R sont
des param`etres inconnus.
1. Montrez que X = (X
1
, . . . , X
n
) est distribue selon un mod`ele exponentiel canonique
de param`etre = (, ) et de rang 2 que lon precisera.
2. Calculez la matrice dinformation de ce mod`ele.
3. Determinez des bornes inferieures de la variance destimateurs (reguliers) sans biais
de et .
4. Lorsque z
i
= i/(n + 1) pour 1 i n donnez des equivalents de ces bornes
en utilisant lapproximation dune integrale ` a laide de sommes de Riemann (la
notation dependra ici de la rigueur de la reponse proposee).
Exercice C (intervalles de conance et estimateurs) Soit
1
, . . . ,
n
une suite independante
et de loi N(0,
2
) pour un
2
> 0 connu. On suppose que lon observe X
i
=

2
z
2
i
+
i
pour un param`etre R inconnu et o` u le plan dexperience z
1
, . . . , z
n
R est xe.
1. Soit

un estimateur gaussien sans biais de dont la variance v est independante
de . Soit > 0, xe, determinez un intervalle de conance pour au niveau 1.
Comment choisir cet intervalle pour que sa longueur soit minimale ?
2. Calculez lestimateur du maximum de vraisemblance

1
de . Montrez quil est sans
biais et calculez sa variance. On prouvera que cette variance v
1
est independante
de .
3. Montrez que

2
= 2
P
n
i=1
Xi
P
n
i=1
z
2
i
estime sans biais. Prouvez que sa variance v
2
est
independante de .
4. Proposez un intervalle de conance raisonnable I
n
= [a
n
, b
n
] de au niveau 1 ;
on pourra commencer par comparer v
1
et v
2
.
5. Donnez un equivalent asymptotique de b
n
a
n
lorsque z
i
= i/(n+1) pour 1 i n.
Exercice D (test gaussien) Soit X = (X
1
, . . . , X
n
) un n-echantillon de loi normale
N(0, 1/).
1. Calculer

lestimateur de maximum de vraisemblance de . Construire un estima-
teur sans biais de . Cet estimateur est-il ecace, asymptotiquement ecace ?
2. Construire le test le plus puissant de = 1 contre > 1. Si n = 15 et si

15
i=1
x
2
i
=
6, 8, eectuer le test au niveau 5%. Peut-on avoir une idee de la fonction puissance
de ce test ?
3. Construire le test le plus puissant de = 1 contre = 1. Eectuer le test au niveau
5% pour les memes donnees quau point precedent.
2
SE 203 : Corrige succinct :
estimation et introduction aux tests
Paul Doukhan
Exercice A (lois ) Soit X = (X
1
, . . . , X
n
) un n-echantillon de loi (, p) de densite
g
p,
(x) =
p
x
p1
e
x
/(p) sur R
+
, o` u on rappelle que (p) =
_

0
t
p1
e
t
dt verie
(p + 1) = p(p) pour p > 0 et (1) = 1.
1. Ici
T =
_
n

i=1
log x
i
,
n

i=1
x
i
_
, h(x) =
1
x
1
x
n
, A(
1
,
2
) = n(log (
1
)
1
log(
2
)).
2. I
n
() = nI
1
() o` u
I
1
() =
_
_
_

(
1
)

2

2
(
1
)
1

2
1

2
2
_
_
_.
3. Revenant ` a la defnition, on prouve que

( p) log

= log X,
p

= X
4.

k
=
_

0
x
k
g
p,
(x)dx =
(p + k)

k
(p)
_

0
g
p+k,
(x)dx =
(p + k)

k
(p)

1
=
p

,
2
=
p(p + 1)

2
,
3
=
p(p + 1)(p + 2)

3
5. Ici posant
2
=
2

2
1
, il vient
1
=
p

et
2
=
p

2
donc =
1
/
2
et p =

2
1
/
2
sont estimes empiriquement en injectant dans les relations precedentes
1
=
1
n

n
i=1
X
i
et

2
=
1
n

n
i=1
X
2
i
(
1
)
2
.
6. On note quici
2
(p + 2) =
3
pour en deduire que p(p + 1)
2
3
= (p + 2)
2

3
2
ainsi
p est solution de lequation du second degre
(
2
3

3
2
)p
2
+ (
2
3
4
3
2
)p 4
3
2
= 0
cette equation a pour discriminant =
4
3
+ 8
3
2

2
3
0 et on verie que p =

3
2

2
3
+

4
3
+8
3
2

2
3
2(
2
3

3
2
)
.
7. Lois des grands nombres et TLC sappliquent via la Delta methode.
3
Exercice B (information dun mod`ele de Poisson)
1. Ici, T(x) = (

n
i=1
x
i
,

n
i=1
z
i
x
i
) et A() =

n
i=1

i
=

n
i=1
e
+zi
.
2.
I = D
2
A() =
_
_
_
_
_
n

i=1
e
+zi
n

i=1
z
i
e
+zi
n

i=1
z
i
e
+zi
n

i=1
z
2
i
e
+zi
_
_
_
_
_
3.
Var
_
n

i=1
e
+zi
_
1
, Var


_
n

i=1
z
2
i
e
+zi
_
1
4. Pour tout p 0, on a
t
p
=
1
n
n

i=1
z
p
i
e
+zi
=
e

n
n

i=1
log
p
_
i
n + 1
__
i
n + 1
_

_
1
0
log
p
xx

dx
pour la derni`ere equivalence notons que la fonction x log
p
xx

est monotone et
integrable au voisinage de 0 ce qui permet darmer la convergence des sommes de
Riemann precedentes lorsque p 0.
Lemme 1 Soit f :]0, 1] R
+
une fonction decroissante, de restriction ` a tout
intervalle [a, 1] (0 < a < 1) Riemann integrable. Alors si lintegrale generalisee
_
1
0
f(t)dt converge au sens que lim
a0
_
1
0
f(t)dt existe, on a
lim
n
1
n
n

i=1
f
_
i
n
_
=
_
1
0
f(t)dt
Preuve du lemme (non demandee). Par monotonie
_
(i+1)/n
(i)/n
f(t)dt
1
n
f
_
i
n
_

_
i/n
(i1)/n
f(t)dt
donc
_
11/n
0
f(t)dt
1
n
f
_
1
n
_

1
n
n

i=1
f
_
i
n
_

_
1
0
f(t)dt
Pour conclure on note que
1
n
f
_
1
n
_
= 2
1
2n
f
_
1
n
_

_
1/n
1/(2n)
f(t)dt
n
0.
4
Lintegrale
_
1
0
log
p
xx

dx est calculee par recurrence gr ace ` a des integrations par


parties. Lorsque p = 0 on obtient, par exemple t
0
e

/( + 1).
Le calcul precedent prouve que les bornes recherchees sont (nt
0
)
1
et (nt
2
)
1
.
Exercice C (intervalles de conance et estimateurs) Soit
1
, . . . ,
n
une suite independante
et de loi N(0,
2
) pour un
2
> 0 connu. On suppose que lon observe X
i
=

2
z
2
i
+
i
pour un param`etre R inconnu et et o` u le plan dexperience z
1
, . . . , z
n
R est xe.
1. Soit

un estimateur gaussien sans biais de dont la variance v est independante
de . Soit > 0, xe, determinez un intervalle de conance pour au niveau 1.
Comment choisir cet intervalle pour que sa longueur soit minimale. Soient a < b
tels que P(N [a, b]) = 1 pour N N(0, 1), alors P
_
b

v
[a, b]
_
= 1 .
Par suite [

vb,

va] est un intervalle de conance pour au niveau 1 .


On choisit alors a = b =
1/2
, des quantiles de la gaussienne standard.
2. On calcule

1
= 2

n
i=1
z
2
i
X
i

n
i=1
z
4
i
et
v
1
=
4
2

n
i=1
z
4
i
3.
v
2
=
4n
2
(

n
i=1
z
2
i
)
2
4. Par linegalite de Cauchy-Schwartz, v
1
v
2
. Par suite on posera
I = [

1
+

v
1

1/2
,

v
1

1/2
]
5. On utilise encore des sommes de Riemann.
Exercice D (test gaussien)
1.

= n/

n
i=1
X
2
i
. Notons que T =

n
i=1
X
2
i

1

(n/2, 1/2) donc E

nT
1
=
nE1/ si (n/2, 1/2) et avec le calcul de lexercice A, E

nT
1
= nE1/ =
nE1/(n2). Alors

=
n2
n

=
n2
T
estime sans biais. Il ne peut etre ecace car
1

nest pas fonction ane de . On prouve, par contre quil est asymptotiquement
ecace.
2. Soit
1
<
2
la fonction V (x) = p
2
(x)/p
1
(x) = (
2
/
1
)
n/2
e
T(21)/2
est decroissante,
donc la transposition du theor`eme 7.1 du cours ` a ce cas donne un test le plus puis-
sant de = 1 contre > 1 de zone de rejet (T < c).
Si n = 15 et si

15
i=1
x
2
i
= 6, 8, on eectue le test en lisant la table ` a lenvers P( >
7, 21) = 0, 95 donne bien P( < 7, 21) = 0, 05. Le test accepte donc lexperience au
niveau 5% mais pas ` a 2,5%.
3. La zone de rejet est ici T < c
1
ou T > c
2
pour c
1
< c
2
et P( < c
1
) + P( >
c
2
) = 0, 05. On choisit par exemple ces deux quantites egales pour mettre le test en
oeuvre.
5