Vous êtes sur la page 1sur 5

Math F-105

Corrigé Séance 11

Séance 11 : Estimateurs

Exercice 1

Soit (X 1 , X 2 ,

,

X n ) un échantillon simple extrait d’une population de moyenne µ et de variance σ 2 .

¯

1. Montrer que X =

2. Montrer que W =

3. Proposer un estimateur non biaisé de σ 2 qui est directement lié à W .

n

i=1 n X i est un estimateur sans biais de µ.

1

n i=1 n (X i

1

X) ¯ 2 est un estimateur biaisé de σ 2 et donner l’expression de ce biais.

Solution

1. Grâce à la linéarité de l’espérance, un calcul immédiat permet d’obtenir le résultat. Ce résultat reste-t-il valable si l’on ne suppose plus l’indépendance des variables aléatoires ?

2. Remarquons tout d’abord que, vu que les X i sont i.i.d. de moyenne µ et de variance σ 2 , la moyenne

X est elle-même de moyenne µ, mais de variance σ 2 (à montrer). Dès lors, on a que

¯

n

E(W)

=

=

=

=

=

=

E

1

n

n E

1

n

i=1

n

i=1

(X i X) 2

¯

2

X

i

n X 2

¯

1

n

1

n

n

i=1

2

E(X

i

) nE( X 2 )

¯

n(µ 2 + σ 2 ) n(µ 2 + σ 2 )

n

n 1

n

σ 2

σ 2 σ n 2 ,

et donc le biais correspond à σ 2 . Notez qu’asymptotiquement ce biais est nul ; W est donc un esti- mateur asymptotiquement sans biais de σ 2 .

3. De par la linéarité de l’espérance, il est clair que E(aX) = aE(X). Dès lors, pour se débarrasser de la fraction n1 qui crée le biais, il suffit de multiplier W par n1 pour obtenir un estimateur non biaisé de σ 2 . Cet estimateur se note

n

n

n

S 2 :=

1

n 1

n

i=1

(X i X) 2 .

¯

Exercice 2

Les éléments d’une population possèdent un caractère X qui suit une loi de probabilité dont la densité est donnée par

f θ (x) =

kx 3

θ 4

0

si 0 < x < θ sinon,

k est une constante et θ > 0 le paramètre d’intérêt.

1. Déterminer la constante k.

1

Math F-105

Corrigé Séance 11

¯

2. Montrer que la moyenne X =

3. En déduire un estimateur non biaisé de θ.

1

n n

i=1 X i n’est pas un estimateur sans biais du paramètre θ.

Solution

1. En résolvant l’équation R f θ (x)dx = 1, on obtient k = 4.

¯

2. Calculons l’espérance de X :

 

¯

E(

X)

= E(X 1 )

(pourquoi ?)

=

θ

0

= 4 θ,

5

4

4x 4 dx

θ

¯

et on voit donc que X n’est pas un estimateur sans biais de θ.

¯

3. Une simple multiplication de X par 4 permet d’enlever le biais. Ainsi donc un estimateur sans biais

5

de θ est

θ ˆ = 5 X.

4

¯

Exercice 3

Soit (X 1 , X 2 ,

,

X n ) (avec n > 10) un échantillon aléatoire issu d’une population suivant une loi de

Bernoulli de paramètre p. Considérons les 3 estimateurs suivants du paramètre p :

pˆ 1 = n

i=1 X i 1

n

, pˆ 2 =

1

n/2

n/2

i=1

X 2i ,

pˆ 3 =

1

10

10

i=1

X i .

Comparer ces 3 estimateurs sur base de chacune des 4 propriétés d’estimateurs énoncées dans le rappel.

Solution

Regardons d’abord quels estimateurs sont sans biais (resp. sans biais asymptotique). Des calculs immédiats montrent que

- Ep 1 ) = p n , donc estimateur biaisé, mais sans biais asymptotique.

- Ep 2 ) = p, estimateur sans biais (et donc sans biais asymptotique).

- Ep 3 ) = p, estimateur sans biais (et donc sans biais asymptotique).

1

Considérons à présent la convergence de chacun de ces estimateurs. En tenant compte de l’indépendance des observations, on obtient que

- Varp 1 ) = p(1p) , donc estimateur convergent.

n

- Varp 2 ) = p(1p) , donc estimateur convergent.

n/2

- Varp 3 ) = p(1p) , qui n’est clairement pas un estimateur convergent.

10

Finalement, comparons les 3 estimateurs sur base de leur efficacité, i.e. faisons une comparaison de leurs variances (qu’on vient de calculer pour la convergence).

(puisque n > 10) ;

- Premièrement, il est clair que p(1p)

< p(1p)

n/2

(car n > n/2 ) et que p(1p)

n

< p(1p)

10

n

on en déduit donc que pˆ 1 est l’estimateur le plus efficace des trois.

2

Math F-105

Corrigé Séance 11

- La comparaison entre pˆ 2 et pˆ 3 en termes d’efficacité dépend fortement du nombre d’observations. Ainsi, pˆ 3 est plus efficace que pˆ 2 aussi longtemps que 10 > n/2 , c’est-à-dire pour n [11, 19]. Pour n = 20 et n = 21, les deux estimateurs sont aussi efficaces l’un que l’autre, et à partir de n 22, pˆ 2 est plus efficace que pˆ 3 .

Exercice 4

Considérons un échantillon de taille 1 issu d’une population suivant une loi de Poisson de paramètre λ > 0 (ceci revient donc simplement à considérer une variable aléatoire X avec X ∼ P(λ)).

1. Montrer que l’estimateur δ(X) = 1 [X=0] est non biaisé pour e λ .

2. Montrer que c’est le seul estimateur non biaisé de e λ .

3. On cherche à présent à estimer e 3λ . Que pouvez-vous dire sur la statistique (2) X ?

4. Proposer en toute généralité un estimateur sans biais pour e nλ .

Solution

1. Rappelons aux distraits que si la variable aléatoire X suit une loi de Poisson de paramètre λ, alors

pour tout k 0. Donc,

P(X = k) = e λ λ k! k

E(δ(X)) = E(1 [X=0] ) =

k=0

1 [k=0] P (X = k) = P (X = 0) = e λ ,

ce qui montre que δ(X) est un estimateur sans biais pour e λ .

2. Pour montrer que δ(X) est l’unique estimateur non biaisé de e λ , il faut montrer que si g(X) est un estimateur sans biais de e λ défini sur tout R, alors nécessairement g(x) = δ(x) pour tout x N (pourquoi l’égalité sur N suffit-elle ?).

N. B. Notez qu’ici on a écrit l’égalité entre 2 fonctions et non pas entre deux variables aléatoires et ceci simplifie considérablement le débat. En effet, pour pouvoir écrire une égalité entre 2 fonctions de v.a., il faut préciser la nature de cette égalité (p.s., en probabilité, en distribution), or ici on cherche à montrer que les 2 fonctions doivent coïncider, et donc on travaille au niveau de variables réelles.

Comme g(X) est sans biais pour e λ , on a que E(g(X)) = e λ . Cette égalité donne alors lieu au développement suivant :

E(g(X))

k=0

k

g(k)e λ λ k!

k=0

k

g(k) λ k!

=

=

=

e

e

λ

λ

1.

Cette égalité doit être valable quel que soit le choix de λ > 0. On assiste donc à l’égalité entre deux polynômes, ce qui ne peut se faire que si les coefficients des deux sont égaux ; ainsi donc on obtient

g(0) = 1, g(k) = 0 k 1.

3

Math F-105

Corrigé Séance 11

Donc quel que soit le comportement de g(x) sur R \ N, on obtient que

g(x) = δ(x) x N.

Ceci nous permet de conclure que l’estimateur proposé au point précédent est bien le seul estimateur sans biais de e λ .

3. Pour voir si la statistique (2) X est un estimateur sans biais pour e 3λ , il suffit d’en calculer l’espérance. On obtient

E (2) X =

k=0

k

(2) k e λ λ k!

= e λ

k=0

(2λ) k

k!

= e λ e 2λ = e 3λ ,

et donc (2) X est bien un estimateur sans biais pour e 3λ . Toutefois cette statistique n’est pas un bon estimateur du paramètre, et donc on ne s’intéresse pas aux 3 autres propriétés d’estimateurs.

4. Pour n = 0, il suffit de prendre 1 comme estimateur de 1. Pour n = 1, on a vu que le seul estimateur sans biais de e λ est 1 [X=0] . Pour n 2, on déduit par le point 3. que (1 n) X est un estimateur sans biais de e nλ (ce qui se démontre exactement de la même manière qu’au point 3.).

Exercice 5 Moyenne usuelle VS Moyenne pondérée

Soit (X 1 , X 2 ,

, où a i 1. Ces 2 moyennes estiment chacune le

paramètre µ.

1. Montrer que les 2 moyennes sont sans biais.

2. Comparer la moyenne usuelle et la moyenne pondérée sur base de leur efficacité.

3. Sur base de la comparaison que vous venez d’effectuer, quelle moyenne serait plus favorable pour un étudiant ?

, X n ) une population de moyenne µ et de variance σ 2 . La moyenne usuelle se note X =

¯

1

n n

i=1 X i et la moyenne pondérée

P

X pond = P n

¯

i=1 a i X i

n i=1 a i

Solution

¯

1. Nous avons démontré à l’exercice 1.1 que X était un estimateur sans biais pour µ ; il en va bien évi-

demment de même pour

¯

X pond .

¯ ¯

2. Il s’agit ici de comparer Var( X) et Var( X pond ). L’intuition (ou le flair ou le talent

σ 2

n

σ 2 n

(

n

i=1 a i

2

i=1 a i ) 2 .

) nous indique que

Pour le prouver, il suffit par exemple de remarquer que (après simplification par σ 2 ) :

1

n

n ( i=1

a i ) 2

P

n

2

i=1 a i

(

i=1 a i ) 2

P n

n( n

i=1 a i

2

)

ni>j1 2a i a j (n 1) n

i=1 a

2

i .

Arrivé à ce point, on remarque que dans le membre de droite on a une somme de carrés, où chaque terme survient n1 fois, et qu’à gauche on a n(n1) doubles produits constitués par les mêmes nombres

2

qu’à droite de l’équation. On constate donc qu’on peut former n(n1) carrés parfaits en retranchant de part et d’autre tous les doubles produits, ce qui donne

2

0

ni>j1

(a i a j ) 2 ,

4

Math F-105

Corrigé Séance 11

égalité qui est toujours vraie. Donc on vient de montrer que la variance de la moyenne usuelle est inférieure à celle de la moyenne pondérée, et donc la moyenne usuelle constitue un estimateur plus efficace de µ.

3. La réponse à cette question dépond fortement de l’étudiant : un étudiant qui a régulièrement de très bons points n’a pas intérêt à ce qu’il y ait une grande fluctuation par rapport à sa moyenne, les chances de voir sa moyenne diminuer étant plus grandes que les chances de la voir augmenter. Il aurait donc une préférence pour la moyenne usuelle. Bien évidemment, la situation est tout à fait inversée pour un étudiant ayant des mauvaises notes, et il devrait avoir un penchant pour la moyenne pondérée. La situation est moins claire pour un étudiant qui se situe à la frontière entre la réussite et l’échec.

De manière générale on peut dire que la moyenne usuelle est favorable aux étudiants ayant en général des notes au-dessus de 13, qu’en-dessous de 11 la moyenne pondérée est préférable, et qu’entre 11 et 13 il n’y a pas de véritable différence (au niveau statistique et probabiliste) entre les deux moyennes.

5