Vous êtes sur la page 1sur 5

ENSAE deuxième année

Examen, session 2003, 2 heures

SE 203 : estimation et introduction aux tests


Paul Doukhan

Les documents distribués en cours et les notes manuscrites. Les calculettes sont inutiles et
interdites. On pourra aussi se référer librement aux lemmes, théorèmes et propositions donnés
dans le polycopié support de cours à condition d’y référer avec précision.
On traitera les exercices dans un ordre arbitraire, à la condition de le préciser clairement.
La longueur intentionnellement excessive de l’énoncé est compensée par un barême portant
sur plus de 20 points.
Barême indicatif sur 26 points : A(1,1,1,1,1,2,2) sur 9 points, B(1,1,1,2) sur 5 points,
C(1,1,1,1,1) sur 5 points, D(3,2,2) sur 7 points.

Exercice A (lois Γ) Soit X = (X1 , . . . , Xn ) un n-échantillon de loi Γ(p, λ) de densité


gRp,λ (x) = λp xp−1 e−λx /Γ(p) sur R+ . On rappelle ici que la fonction d’Euler, Γ(p) =
∞ p−1 −t
0 t e dt est régulière sur ]0, ∞[ et vérifie Γ(p + 1) = pΓ(p) pour p > 0 et Γ(1) = 1.
1. Montrez que X est distribué selon un modèle exponentiel canonique en dimension
2. Précisément, on montrera que sa densité (par rapport à la la mesure de Lebesgue
sur (R+ )n ) s’écrit h(x)eT (x)·θ−A(θ) avec θ = (θ1 , θ2 ) pour θ1 = p, θ2 = −λ et on
explicitera h(x), T (x), et A(θ).
2. Calculez l’information de Fisher de ce modèle (on pourra donner une expression
dans laquelle figurent des dérivées de la fonction Γ d’Euler).
3. Prouvez que les équations du maximum de vraisemblance équivalent à

Γ0 b = log X, pb
p) − log λ
(b =X
Γ b
λ
Devant la haute non linéarité de cette expression, on envisage des méthodes de
résolution numériques. Pour initialiser ces méthodes, nous mettons en oeuvre les
méthodes de moments dans la suite de cet exercice.
4. Donnez une expression de µk = Eθ X1k . On pourra expliciter cette expression lorsque
k = 1, 2, 3
5. Déterminez des estimateurs de θ fondés sur les moments d’ordre 1 et 2.
6. Déterminez des estimateurs de θ fondés sur les moments d’ordre 2 et 3.
7. Que peut-on dire des propriétés asymptotiques de ces estimateurs ? (le barême de
cette question ouverte pourra varier selon la précision de la réponse.)

1
Exercice B (information d’un modèle de Poisson) Soit n ≥ 1 entier, z1 , . . . , zn ∈ R,
on observe des variables aléatoires indépendantes X1 , . . . , Xn telles que Xi suive la loi de
Poisson P(µi ) de paramètre µi = eα+βzi . Par exemple zi pourrait modéliser la quantité
de médicament donnée au patient i et Yi mesurerait le nombre d’agents infectieux par
unité de sang de ce patient 24 heures après l’absorption du médicament. Ici α, β ∈ R sont
des paramètres inconnus.
1. Montrez que X = (X1 , . . . , Xn ) est distribué selon un modèle exponentiel canonique
de paramètre θ = (α, β) et de rang 2 que l’on précisera.
2. Calculez la matrice d’information de ce modèle.
3. Déterminez des bornes inférieures de la variance d’estimateurs (réguliers) sans biais
de α et β.
4. Lorsque zi = i/(n + 1) pour 1 ≤ i ≤ n donnez des équivalents de ces bornes
en utilisant l’approximation d’une intégrale à l’aide de sommes de Riemann (la
notation dépendra ici de la rigueur de la réponse proposée).

Exercice C (intervalles de confiance et estimateurs) Soit ξ1 , . . . , ξn une suite indépendante


et de loi N (0, σ 2 ) pour un σ 2 > 0 connu. On suppose que l’on observe Xi = 2θ zi2 + ξi
pour un paramètre θ ∈ R inconnu et où le plan d’expérience z1 , . . . , zn ∈ R est fixé.
1. Soit θb un estimateur gaussien sans biais de θ dont la variance v est indépendante
de θ. Soit α > 0, fixé, déterminez un intervalle de confiance pour θ au niveau 1 − α.
Comment choisir cet intervalle pour que sa longueur soit minimale ?
2. Calculez l’estimateur du maximum de vraisemblance θb1 de θ. Montrez qu’il est sans
biais et calculez sa variance. On prouvera que cette variance v1 est indépendante
de θ. Pn
Xi
3. Montrez que θb2 = 2 Pi=1 n 2 estime θ sans biais. Prouvez que sa variance v 2 est
zi
i=1
indépendante de θ.
4. Proposez un intervalle de confiance raisonnable In = [an , bn ] de θ au niveau 1 − α ;
on pourra commencer par comparer v1 et v2 .
5. Donnez un équivalent asymptotique de bn −an lorsque zi = i/(n+1) pour 1 ≤ i ≤ n.

Exercice D (test gaussien) Soit X = (X1 , . . . , Xn ) un n-échantillon de loi normale


N (0, 1/θ).
1. Calculer θ̂ l’estimateur de maximum de vraisemblance de θ. Construire un estima-
teur sans biais de θ. Cet estimateur est-il efficace, asymptotiquement efficace ?
P15
2. Construire le test le plus puissant de θ = 1 contre θ > 1. Si n = 15 et si i=1 x2i =
6, 8, effectuer le test au niveau 5%. Peut-on avoir une idée de la fonction puissance
de ce test ?
3. Construire le test le plus puissant de θ = 1 contre θ 6= 1. Effectuer le test au niveau
5% pour les mêmes données qu’au point précédent.

2
SE 203 : Corrigé succinct :
estimation et introduction aux tests
Paul Doukhan

Exercice A (lois Γ) Soit X = (X1 , . . . , Xn ) un n-échantillon de loi


R ∞Γ(λ, p) de densité
gp,λ (x) = λp xp−1 e−λx /Γ(p) sur R+ , où on rappelle que Γ(p) = 0 tp−1 e−t dt vérifie
Γ(p + 1) = pΓ(p) pour p > 0 et Γ(1) = 1.
1. Ici
n n
!
X X 1
T = log xi , xi , h(x) = , A(θ1 , θ2 ) = n(log Γ(θ1 ) − θ1 log(−θ2 )).
i=1 i=1
x1 · · · x n

2. In (θ) = nI1 (θ) où


 
Γ00 Γ02 1
(θ1 ) − 2 (θ1 )
 θ2 
I1 (θ) =  Γ 1
Γ
θ1  .
− 2
θ2 θ2

3. Revenant à la défnition, on prouve que

Γ0 b = log X, pb
p) − log λ
(b =X
Γ b
λ
4. Z ∞ Z ∞
k Γ(p + k) Γ(p + k)
µk = x gp,λ (x)dx = k gp+k,λ (x)dx =
0 λ Γ(p) 0 λk Γ(p)
p p(p + 1) p(p + 1)(p + 2)
µ1 = , µ2 = , µ3 =
λ λ2 λ3
5. Ici posant σ 2 = µ2 − µ21 , il vient µ1 = λp et σ 2 = λp2 donc λ = µ1 /σ 2 et p =
µ21 /σ 2 sont estimés empiriquement en injectant dans les relations précédentes µ
c1 =
1
Pn c2 1
Pn 2 2
n i=1 Xi et σ = n i=1 Xi − (c
µ1 ) .
6. On note qu’ici µ2 (p + 2) = µ3 λ pour en déduire que p(p + 1)µ23 = (p + 2)2 µ32 ainsi
p est solution de l’équation du second degré

(µ23 − µ32 )p2 + (µ23 − 4µ32 )p − 4µ32 = 0

cette équation
√ a pour discriminant ∆ = µ43 + 8µ32 µ23 ≥ 0 et on vérifie que p =
µ32 −µ23 + µ43 +8µ32 µ23
2(µ23 −µ32 )
.
7. Lois des grands nombres et TLC s’appliquent via la Delta méthode.

3
Exercice B (information d’un modèle de Poisson)
Pn Pn Pn Pn
1. Ici, T (x) = ( i=1 xi , i=1 zi xi ) et A(θ) = i=1 µi = i=1 eα+βzi .
2.  X 
n n
X
 eα+βzi zi e α+βzi

2  i=1 i=1 
I = D A(θ) =  X
n Xn 
 
zi eα+βzi zi2 eα+βzi
i=1 i=1

3. !−1 !−1
n
X n
X
b≥
Var α e α+βzi
, Var βb ≥ zi2 eα+βzi
i=1 i=1

4. Pour tout p ≥ 0, on a
n
1 X p α+βzi
tp = z e
n i=1 i
n   β
eα X p i i
= log
n i=1 n+1 n+1
Z 1
∼ eα logp xxβ dx
0

pour la dernière équivalence notons que la fonction x 7→ logp xxβ est monotone et
intégrable au voisinage de 0 ce qui permet d’affirmer la convergence des sommes de
Riemann précédentes lorsque p ≥ 0.
Lemme 1 Soit f :]0, 1] → R+ une fonction décroissante, de restriction à tout
intervalle [a, 1] (0 < a < 1) Riemann intégrable. Alors si l’intégrale généralisée
R1 R1
0 f (t)dt converge au sens que lima↓0 0 f (t)dt existe, on a

n   Z 1
1X i
lim f = f (t)dt
n→∞ n n 0
i=1

Preuve du lemme (non demandée). Par monotonie


Z (i+1)/n   Z i/n
1 i
f (t)dt ≤ f ≤ f (t)dt
(i)/n n n (i−1)/n

donc Z     Z 1
n
1−1/n
1 1 1X i
f (t)dt − f ≤ f ≤ f (t)dt
0 n n n i=1 n 0

Pour conclure on note que


    Z 1/n
1 1 1 1
f =2 f ≤ f (t)dt →n→∞ 0.
n n 2n n 1/(2n)

4
R1
L’intégrale 0 logp xxβ dx est calculée par récurrence grâce à des intégrations par
parties. Lorsque p = 0 on obtient, par exemple t0 ∼ eα /(β + 1).
Le calcul précédent prouve que les bornes recherchées sont (nt0 )−1 et (nt2 )−1 .

Exercice C (intervalles de confiance et estimateurs) Soit ξ1 , . . . , ξn une suite indépendante


et de loi N (0, σ 2 ) pour un σ 2 > 0 connu. On suppose que l’on observe Xi = 2θ zi2 + ξi
pour un paramètre θ ∈ R inconnu et et où le plan d’expérience z1 , . . . , zn ∈ R est fixé.
1. Soit θb un estimateur gaussien sans biais de θ dont la variance v est indépendante
de θ. Soit α > 0, fixé, déterminez un intervalle de confiance pour θ au niveau 1 − α.
Comment choisir cet intervalle pour que sa longueur soit minimale.
 Soient
 a<b
b
θ−θ
tels que P(N ∈ [a, b]) = 1 − α pour N ∼ N (0, 1), alors P √
v
∈ [a, b] = 1 − α.
b √ b √
Par suite [θ − vb, θ − va] est un intervalle de confiance pour θ au niveau 1 − α.
On choisit alors a = −b = ϕ1−α/2 , des quantiles de la gaussienne standard.
2. On calcule Pn 2
b i=1 zi Xi
θ1 = 2 P n 4
i=1 zi
et
4σ 2
v1 = Pn 4
i=1 zi
3.
4nσ 2
v2 = Pn 2
( i=1 zi2 )
4. Par l’inégalité de Cauchy-Schwartz, v1 ≤ v2 . Par suite on posera
√ √
I = [θb1 + v1 ϕ1−α/2 , θb − v1 ϕ1−α/2 ]

5. On utilise encore des sommes de Riemann.

Exercice D (test gaussien)


Pn Pn 1
1. θ̂ = n/ i=1 Xi2 . Notons que T = 2
i=1 Xi ∼ θ Γ(n/2, 1/2) donc Eθ nT
−1
=
−1
nθE1/γ si γ ∼ Γ(n/2, 1/2) et avec le calcul de l’exercice A, Eθ nT = nθE1/γ =
nθE1/(n − 2). Alors θ̃ = n−2 n−2
n θ̂ = T estime θ sans biais. Il ne peut être efficace car
1
θ n’est pas fonction affine de θ. On prouve, par contre qu’il est asymptotiquement
efficace.
2. Soit θ1 < θ2 la fonction V (x) = pθ2 (x)/pθ1 (x) = (θ2 /θ1 )n/2 e−T (θ2 −θ1 )/2 est décroissante,
donc la transposition du théorème 7.1 du cours à ce cas donne un test le plus puis-
sant de θ = 1 contre θ > 1 de zone de rejet (T < c).
P
Si n = 15 et si 15 2
i=1 xi = 6, 8, on effectue le test en lisant la table à l’envers P(γ >
7, 21) = 0, 95 donne bien P(γ < 7, 21) = 0, 05. Le test accepte donc l’expérience au
niveau 5% mais pas à 2,5%.
3. La zone de rejet est ici T < c1 ou T > c2 pour c1 < c2 et P(γ < c1 ) + P(γ >
c2 ) = 0, 05. On choisit par exemple ces deux quantités égales pour mettre le test en
oeuvre.

Vous aimerez peut-être aussi