Vous êtes sur la page 1sur 7

STT-4000 : Statistique mathématique

Solution de l’examen 1 de l’automne 2018

Numéro 1. On considère un échantillon aléatoire de taille n, disons X1 , X2 , ..., Xn , issu d’une population
dont la densité de probabilité est la suivante :
(
3 2
4 (1 − (x − θ) ) si θ − 1 < x < θ + 1
fθ (x) =
0 sinon.

Voici le graphe et les deux premiers moments de cette densité de probabilité :

moyenne = θ
variance = 1/5

θ−1 θ θ+1

On souhaite estimer le paramètre θ. L’espace paramètre est l’ensemble de tous les nombres réels.

(a) La statisticienne Ursule raisonne de la façon suivante. Puisque cette distribution est symétrique et
centrée à θ, sa médiane est θ. Je vais donc utiliser la médiane échantillonnale Mn pour estimer θ.

(i) Complétez la phrase suivante : La variable aléatoire n(Mn − θ) converge en loi vers la loi
normale de moyenne et de variance .
(ii) Si Ursule utilise un échantillon de taille n = 36, quelle sera l’erreur type associée à son estima-
tion ?

(b) La statisticienne Zelda raisonne de la façon suivante. Puisque cette distribution est symétrique et
centrée à θ, sa moyenne est θ. Je vais donc utiliser la moyenne échantillonnale X pour estimer θ.

(i) Complétez la phrase suivante : La variable aléatoire n(X − θ) converge en loi vers la loi
normale de moyenne et de variance .
(ii) Si Zelda utilise un échantillon de taille n = 36, quelle sera l’erreur type associée à son estima-
tion ?

Solution.
(a) (i)      
√ L 1 1 4
n(Mn − θ) −→ N 0, 2 = N 0, =N 0, .
4fθ (θ) 4(3/4)2 9
(ii) Le résultat de la partie (i) nous dit que lorsque n est grand on a
 
L 4
Mn ≈ N θ, .
9n

1
p
L’erreur type est donc 4/9n. Avec n = 36, ça donne
r
4 2 1
erreur type = = = = 0.1111.
9 × 36 18 9

(b) (i)  
√ L 2 1
n(X − θ) −→ N (0, σ ) = N 0, .
5
(ii) Le résultat de la partie (i) nous dit que lorsque n est grand on a
 
L 1
X ≈ N θ, .
5n
p
L’erreur type est donc 1/5n. Avec n = 36, ça donne
r
1 1
erreur type = = √ = 0.0745.
5 × 36 6 5

Numéro 2. Les variables aléatoires X1 , X2 , X3 et X4 sont i.i.d. avec densité de probabilité donnée par
l’équation suivante : ( 2
x
9 si 0 < x < 3
f (x) =
0 sinon.
Répondez, au choix, à l’une ou l’autre des 2 questions suivantes :
(a) Calculez l’espérance de la troisième statistique d’ordre.
(b) Calculez la valeur modale de la troisième statistique d’ordre.

Solution. D’abord on obtient la fonction de répartition :

 0 si − ∞ < x ≤ 0


x 3
F (x) = 27 si 0 < x ≤ 3

1 si 3 < x < ∞

Puis on obtient la densité de la troisième statistique d’ordre. Après simplifications, on a


( 8  3 
12 x3 1 − x3 si 0 < x < 3
fX(3) (x) =
0 sinon.

Ceux qui préfèrent intégrer font la partie (a). Ceux qui préfèrent dériver font la partie (b).

2
(a)
Z 3
E[X(3) ] = x fX(3) (x) dx
0
Z 3  x 8   x 3 
= x 12 1− dx
0 3 3
Z 3  9   x 3  dx
x
= 108 1−
0 3 3 3
Z 1
= 108 u9 (1 − u3 ) du
0
Z 1 Z 1 
9 12
= 108 u du − u du
0 0
 
1 1
= 108 −
10 13
162
= = 2.4923
65
(b) Le graphe de la densité de probabilité fX(3) (x) est en forme de cloche asymétrique. Sa valeur
modale est simplement l’endroit, entre 0 et 3, où sa dérivée est nulle. On obtient, pour les valeurs
0 < x < 3,
d d  x 8   x 3 
fX (x) = 12 1−
dx (3) dx 3 3
  
d x 8  x 11
= 12 −
dx 3 3
   
8 x 7 11  x 10
= 12 −
3 3 3 3
 x 7   x 3 
= 4 8 − 11
3 3

On a donc
d
fX (x) = 0
dx (3)
 x 3
⇔ 8 − 11 =0
3
 x 3 8
⇔ =
3 11
 1/3
x 8
⇔ =
3 11
 1/3
8
⇔ x=3 ,
11
c’est-à-dire x = 2.6979.

Numéro 3. On considère un échantillon aléatoire de taille n, disons X1 , X2 , ..., Xn , issu de la distribution


N (µ, σ 2 ). Comme d’habitude, on écrit X et S 2 pour dénoter la moyenne échantillonnale et la variance
échantillonnale. On souhaite estimer la quantité µ2 . Trouvez les valeurs a et b pour lesquelles l’estimateur
2
aX + bS 2 sera sans biais pour µ2 .

3
Solution. On a
2 2
E[aX + bS 2 ] = a E[X ] + b E[S 2 ]
= a Var[X] + (E[X])2 + b E[S 2 ]

 2 
σ
= a 2
+ µ + b σ2
n
a 
= aµ2 + + b σ2 .
n
On a donc
a 
2
E[aX + bS 2 ] = µ2 ⇔ aµ2 + + b σ 2 = µ2
n
a
⇔ a = 1 et + b = 0
n
1
⇔ a = 1 et b = − .
n
2
L’estimateur recherché est donc l’estimateur X − S 2 /n.

Numéro 4. On considère à nouveau un échantillon aléatoire de taille n, disons X1 , X2 , ..., Xn , issu de


la distribution N (µ, σ 2 ). On souhaite estimer la quantité 1/σ 4 . Déterminez la constance c∗ pour laquelle
l’estimateur c∗ /S 4 sera, parmi tous les estimateur de la forme c/S 4 , celui qui possède la plus petite erreur
quadratique moyenne.

Solution. Calculons d’abord les deux premiers moments de la variable aléatoire 1/S 4 :
 
n−1 2
  
1 2
E 4 = E  σ
 
2 
S (n−1)S 2
σ2
n−1 2
"  #
σ2
= E avec U ∼ χ2n−1
U2
2
(n − 1)2 Γ(α − 2)

n−1
E U −2 =
 
=
σ2 σ4 Γ(α)λ−2
(n − 1)2 Γ( n−1
2 − 2) (n − 1)2 (1/2)2
= =
σ4 Γ( n−1 σ4 n−1
− 1 n−1
 
−2
2 )(1/2) 2 2 −2
(n − 1)2 (1/2)2 (n − 1)2 1
= n−3
 n−5  = .
σ4 2 2
(n − 3)(n − 5) σ 4

4
De la même façon on obtient
 
n−1 4
  
1 2
E 8 = E  σ
 
S (n−1)S 2 4
 
σ2
n−1 4
"  #
σ2
= E avec U ∼ χ2n−1
U4
4
(n − 1)4 Γ(α − 4)

n−1
E U −4 =
 
=
σ2 σ8 Γ(α)λ−4
(n − 1)4 Γ( n−1
2 − 4) (n − 1)4 (1/2)4
= =
σ8 Γ( n−1 σ8 n−1 n−1
− 2 n−1 n−1
   
−4
2 )(1/2) 2 −1 2 2 −3 2 −4
(n − 1)4 (1/2)4 (n − 1)4 1
= n−3 n−5
 n−7  n−9
 = .
σ8 (n − 3)(n − 5)(n − 7)(n − 9) σ 8

2 2 2 2

L’erreur quadratique moyenne de l’estimateur c/S 4 est donc


"  #
4 c 1 2
EQM[c/S ] = E −
S 4 σ4
 2 
c 2c 1
= E 8− 4 4+ 8
S σ S σ
   
2 1 2c 1 1
= c E 8 − 4E 4 + 8
S σ S σ
(n − 1) 4 1 2c (n − 1)2 1 1
= c2 8
− 4 4
+ 8
(n − 3)(n − 5)(n − 7)(n − 9) σ σ (n − 3)(n − 5) σ σ
4 2
 
(n − 1) (n − 1) 1
= c2 − 2c +1 .
(n − 3)(n − 5)(n − 7)(n − 9) (n − 3)(n − 5) σ8

Il suffit donc de minimiser la fonction


(n − 1)4 (n − 1)2
h(c) = c2 − 2c + 1.
(n − 3)(n − 5)(n − 7)(n − 9) (n − 3)(n − 5)

Le minimum est atteint au point c∗ où la dérivée est nulle. On obtient

(n − 7)(n − 9)
c∗ = .
(n − 1)2

5
Numéro 5. Les variables aléatoires X1 , X2 , ..., X10 sont i.i.d. avec densité de probabilité donnée par
l’équation suivante : ( 2
3x
2 si − 1 < x < 1
f (x) =
0 sinon.
Voici le graphe et les deux premiers moments de cette densité de probabilité :

E[X] = 0
3/2
E[X 2 ] = 3/5

−1 0 1

1 P10 2
Obtenez l’espérance et l’écart-type de la variable aléatoire 9 i=1 (Xi −X) . Réponses numériques exigées.

Solution. Calculons d’abord le quatrième moment central de cette distribution. On obtient


Z 1 Z 1 Z 1
3x2 3 3
µ4 = E[(X − µ)4 ] = E[X 4 ] = x4 f (x) dx = x4 dx = x6 dx = .
−1 −1 2 2 −1 7

La variable aléatoire 91 10 2 2
P
i=1 (Xi − X) est simplement la variance échantillonnale S . On a donc

3
espérance = E[S 2 ] = σ 2 =
5
et
p
écart-type = Var[S 2 ]
s  
1 n−3 4
= µ4 − σ
n n−1
s   r
1 3 7 9 13
= − · = = 0.1219
10 7 9 25 875

Numéro 6. On considère une population avec une variable d’intérêt dont la distribution est la loi normale
de moyenne µ et de variance σ 2 .
(a) Indépendamment les uns des autres, 25 statisticiens obtiennent chacun un échantillon aléatoire de
taille 10 à partir de cette population. Chaque statisticien calcule, à partir de son échantillon de
taille 10, la moyenne échantillonnale X et la variance échantillonnale S 2 . Pour chaque statisticien,
X−µ
on considère la variable aléatoire T = S/√ . On écrit T1 , T2 , ...T25 pour dénoter les 25 variables
10
aléatoires ainsi obtenues. Finalement on considère la variable aléatoire W = 25
P
k=1 Tk . Expliquez
clairement pourquoi la distribution de la variable aléatoire W peut être approximée par une loi
normale et spécifiez la moyenne et la variance de cette loi normale.

6
(b) Ursule et Zelda obtiennent chacune un échantillon aléatoire de taille 1000 à partir de cette popu-
lation. Expliquez clairement pourquoi la variable aléatoire
 2  2
X1 − µ X2 − µ
√ + √
S1 / 1000 S2 / 1000

suit à peu près une loi exponentielle et spécifiez quelle est la moyenne de cette loi exponentielle.
Ici X 1 et S12 dénotent la moyenne échantillonnale et la variance échantillonnale de Ursule alors
que X 2 et S22 dénotent la moyenne échantillonnale et la variance échantillonnale de Zelda.

Solution.
(a) Les variables aléatoires T1 , T2 , ..., T25 sont i.i.d. avec loi de Student à 9 degrés de liberté. En
particulier, elles sont i.i.d. avec moyenne 0 et avec variance 9/7. Le théorème P limite central nous
25
assure qu’on peut approximer la distribution de la variable aléatoire W = k=1 Tk par la loi
normale de moyenne 0 et de variance 25 × 9/7 = 225/7 = 32.14.
(b) Les variables aléatoires
X1 − µ X2 − µ
√ et √
S1 / 1000 S2 / 1000
sont i.i.d. avec loi de Student à 999 degrés de liberté. Or la loi de Student avec 999 degrés de
liberté, c’est quasiment la même chose que la loi N (0, 1). On conclut que la variable aléatoire
 2  2
X1 − µ X2 − µ
√ + √
S1 / 1000 S2 / 1000

suit à peu près la loi du khi-deux à 2 degrés de liberté, c’est-à-dire la loi gamma(2/2, 1/2), c’est-à-
dire la loi exponentielle avec paramètre λ = 1/2, c’est-à-dire la loi exponentielle de moyenne égale
à 2.

Vous aimerez peut-être aussi