Vous êtes sur la page 1sur 5

Exercices : Estimations

Exercice 1:
Soit X de loi U([0; a]) et (X1 , · · · , Xn ) un n-échantillon de X. On cherche à estimer a. On note Xn la
moyenne empirique de X.
1. Soit Tn = 2Xn . Montrer que Tn est un estimateur sans biais de a et calculer son risque quadratique.
2. Soit Tn′ = max(X1 , · · · , Xn ).
Donner la fonction de répartition de X, puis déterminer celle de Tn′ .
En déduire une densité de Tn′ puis son biais et son risque quadratique.
n+1 ′
3. Soit Tn′′ = Tn . Déterminer son biais et son risque quadratique.
n
4. Pour de grandes valeurs de n, quelle est le meilleur estimateur de a ?

Exercice 2:
Soit X ayant une espérance m et une variance v, et soit (X1 , · · · , Xn ) un n-échantillon de X. On appelle
n
1X 2 2
variance empirique de X la variable Wn = Xi − Xn , où Xn est la moyenne empirique de X.
n i=1
1. Soit Y ayant une espérance et une variance. Exprimer E(Y 2 ) en fonction de V (Y ) et E(Y ).
2
2. Calculer E(Xn ) et V (Xn ) et en déduire E(Xn ).
3. Calculer alors E(Wn ) et en déduire un estimateur sans biais de v.

Exercice 3:
Un sériciculteur a pesé 100 cocons provenant de son élevage de vers à soie. Il a obtenu les résultats
suivants :

Poids en g 0,64 0,65 0,66 0,67 0,68 0,69 0,70 0,71


Effectif 3 5 2 6 6 10 12 10

Poids en g 0,72 0,73 0,74 0,75 0,76 0,77 0,78 0,79


Effectif 9 8 8 6 5 4 3 3

On appelle m la moyenne des poids de tous les cocons de l’élevage et on suppose que le poids X d’un
cocon suit une loi normale de variance 0, 0016g 2.
1. Préciser les paramètres de cette loi normale.
2. On choisit au hasard un échantillon de 100 cocons. On appelle Xi le poids du i-ème cocon de cet
échantillon. On suppose que X1 , · · · , X100 sont mutuellement indépendantes, de même loi que X. On
100
1 X
pose T = Xi et on admet que T suit une loi normale.
100 i=1
Préciser les paramètres de cette loi normale et déterminer la variable centrée réduite T ∗ associée à
T.
3. Déterminer un réel t tel que P (−t 6 T ∗ 6 t) > 0, 95.
4. Montrer que P (T − 0, 00784 6 m 6 T + 0, 00784) > 0, 95.
5. En déduire un intervalle de confiance pour m au niveau de confiance 0, 95 et donner une estimation
de cet intervalle.

Probabilités : Chapitre 6 Exercices Page 1 Estimations


Exercice 4:
Lors d’un sondage sur 100 personnes interrogées, 60 pensent voter pour A.
On modélise le choix par un échantillon (X1 , · · · , X100 ) de variables indépendantes de même loi de
Bernoulli de paramètre p.
On cherche à déterminer un intervalle de confiance pour p au niveau de confiance 99 %.
100
1 X
1. Déterminer l’espérance et la variance de la moyenne empirique F = Xi .
100 i=1
2. On note F ∗ la variable centrée réduite associée à F .
Par quelle loi peut-on approcher celle de F ∗ ? On suppose désormais que F ∗ suit la loi N (0, 1).
3. Déterminer t tel que P (−t 6 F ∗ 6 t) > 0, 99 et en déduire que
p p !
p(1 − p) p(1 − p)
P F −t 6p6F +t > 0, 99
10 10

1
4. Montrer que pour tout p ∈ [0; 1], p(1 − p) 6 et en déduire un intervalle de confiance pour p au
4
niveau de confiance 0, 99 puis en donner une estimation.

Probabilités : Chapitre 6 Exercices Page 2 Estimations


Correction
Exercice 1:
1. Tn s’exprime en fonction des Xi donc c’est un estimateur de a. On cherche le biais de Tn donc il nous
faut calculer son espérance.
n n
1X 2 Xa
E(Tn ) = E(2Xn ) = 2 × E(Xi ) = =a
n i=1 n i=1 2

On a donc b(Tn ) = E(Tn ) − a = 0 et ainsi Tn est un estimateur sans biais de a.


Comme Tn est un estimateur sans biais de a, son risque quadratique est égal à sa variance. Or comme
les Xi sont indépendantes on a :
n
! n n
2X 4X 4 X a2 a2
V (Tn ) = V Xi = 2 V (Xi ) = 2 =
n i=1 n i=1 n i=1 12 3n

0x si x < 0


2. • D’après le cours la fonction de répartition de X est définie par F (x) = si 0 6 x 6 a .

 a
1 si x > a
• Notons Gn la fonction de répartition de Tn′ . Par définition Gn (x) = P (Tn′ 6 x). Or [Tn 6 x] =
[X1 6 x] ∩ · · · ∩ [Xn 6 x]. Donc comme les Xi sont indépendantes :

Gn (x) = P (X1 6 x) × · · · × P (Xn 6 x) = (F (x))n




 0  si x < 0
 x n
On a donc Gn (x) = si 0 6 x 6 a .
 a

1 si x > a
• Une densité de Tn s’obtient en dérivant Gn là où elle est dérivable et en complétant les points

manquants : 
0
 si t < 0 ou t > a
gn (t) = n t n−1
 
 si 0 6 t 6 a
a a

• Pour calculer le biais de Tn′ il nous faut calculer son espérance. Comme la densité de Tn′ est nulle
en dehors de [0; a] et que t → tgn (t) est continue sur [0; a], Tn′ admet une espérance et :
a  n−1 a
n an n tn+1

n t na
Z Z
E(Tn′ ) = t× dt = n t dt = n =
0 a a a 0 a n+1 0 n+1

na −a
Donc b(Tn′ ) = −a=
n+1 n+1
• Pour les mêmes raison que pour l’espérance, Tn′ admet une variance et :
a  n−1
n t n a n+1 n2 a2
Z Z
2 ′ 2
V (Tn′ ) = t × dt − E(Tn ) = n t dt −
0 a a a 0 (n + 1)2
 n+2 a
n t n2 a2 na2 n2 a2
= n − = −
a n + 2 0 (n + 1)2 n + 2 (n + 1)2
n
= a2
(n + 2)(n + 1)2

Probabilités : Chapitre 6 Exercices Page 3 Estimations


On a donc :
n a2
r(Tn′ ) = V (Tn′ ) + b(Tn′ )2 = a2
+
(n + 2)(n + 1)2 (n + 1)2
(2n + 2)a2 2a2
= =
(n + 2)(n + 1)2 (n + 2)(n + 1)
na
3. On a vu que E(Tn′ ) = donc E(Tn′′ ) = a et ainsi Tn′′ est un estimateur sans biais de a.
n+1
n 2 a2 a2
De plus comme V (Tn′ ) = a on a V (Tn
′′
) = et donc r(Tn
′′
) = .
(n + 2)(n + 1)2 n(n + 2) n(n + 2)
4. Tn et Tn′′ sont meilleurs que Tn′ car ils sont des estimateurs sans biais. De plus lorsque n tend vers
+∞ on a :
a2 1 1
r(Tn ) ∼ × et r(Tn′′ ) ∼ a2 × 2
n→+∞ 3 n n→+∞ n
Donc le meilleur estimateur est Tn′′ .

Exercice 2:
1. On sait que V (Y ) = E(Y 2 ) − E(Y )2 donc on a E(Y 2 ) = V (Y ) + E(Y )2 .
2. On a : !
n n n
1X 1X 1X
E(Xn ) = E Xi = E(Xi ) = m=m
n i=1 n i=1 n i=1

et comme les variables Xi sont indépendantes :


n
! n n
1X 1X 1X v
V (Xn ) = V Xi = 2 V (Xi ) = 2 v=
n i=1 n i=1 n i=1 n

2 v
Grâce à la question précédente on a donc E(Xn ) = + m2 .
n
3. On a donc : !
n n
1X 2 2 1X 2
E(Wn ) = E Xi − Xn = E(Xi2 ) − E(Xn )
n i=1 n i=1
n
1X 2
v
2

= (v + m ) − +m
n i=1 n
v n−1
= v + m2 − − m2 = v
n n
n
Si on pose Wn′ = Wn alors on a bien que Wn′ est un estimateur de v et de plus E(Wn′ ) =
n−1
n−1
E(Wn ) = v donc c’est bien un estimateur sans biais.
n

Exercice 3:
1. Les paramètres d’une loi normale sont son espérance et sa variance. X ֒→ N (m; 0, 0016)
 
0, 0016 0, 0016
2. E(T ) = m et V (T ) = donc T ֒→ N m; .
100 100
On a par définition :
T − E(T ) T −m T −m
T∗ = p =p =
V (T ) 0, 0016/100 0, 004

Probabilités : Chapitre 6 Exercices Page 4 Estimations


3. On sait donc que T ∗ ֒→ N (0, 1). Donc P (−t 6 T ∗ 6 t) = Φ(t) − Φ(−t) = 2Φ(t) − 1.
On a donc
P (−t 6 T ∗ 6 t) > 0, 95 ⇔ 2Φ(t) − 1 > 0, 95 ⇔ Φ(t) > 0, 975 ⇔ t > 1, 96
On peut donc choisir t = 1, 96.
4. D’après la question précédente :
T −m
 

P (−1, 96 6 T 6 1, 96) > 0, 95 ⇔ P −1, 96 6 6 1, 96 > 0, 95
0, 004
⇔P (−0, 004 × 1, 96 6 T − m 6 0, 004 × 1, 96) > 0, 95
⇔P (T − 0, 00784 6 m 6 T + 0, 00784) > 0, 95
5. D’après la question précédente [T − 0, 00784; T + 0, 00784] est un intervalle de confiance pour m au
niveau de confiance 0, 95.
Le tableau de valeurs nous permet de calculer une réalisation de T : 0, 7132
Un intervalle de confiance réalisé est donc [0, 70536; 0, 72104].

Exercice 4:
100
1 X
1. E(F ) = E(Xi ) = p et, comme les Xi sont indépendantes,
100 i=1
100
1 X p(1 − p)
V (F ) = V (Xi ) = .
10000 i=1 100
2. D’après le théorème de la limite centrée, comme 100 > 30, que les Xi sont indépendantes, suivent
toutes la même loi et ont une variance non nulle, F ∗ suit approximativement la loi normale centrée
réduite.
3. • On a P (−t 6 F ∗ 6 t) = Φ(t) − Φ(−t) = 2Φ(t) − 1 donc
P (−t 6 F ∗ 6 t) > 0, 99 ⇔ 2Φ(t) − 1 > 0, 99 ⇔ Φ(t) > 0, 995 ⇔ t > 2, 58
On choisit t = 2, 58.
F −p
• De plus comme F ∗ = p , on a
p(1 − p)/10
p p !
p(1 − p) p(1 − p)
P (−t 6 F ∗ 6 t) = P F − t 6p6F +t
10 10
p p !
p(1 − p) p(1 − p)
On a donc bien P F − t 6p6F +t > 0, 99
10 10
4. Il suffit ici d’étudier la fonction f : x → x(1 − x) sur [0; 1] et de remarquer qu’elle atteint son
1 1
maximum en x = et que ce maximum vaut .
" 2
p p 4 # 
p(1 − p) p(1 − p)

1 1
On a donc F − t 6p6F +t ⊂ F −t 6p6 F +t donc :
10 10 20 20
p p !
p(1 − p) p(1 − p)
 
1 1
P F −t 6p6 F +t >P F −t 6p6F +t > 0, 99
20 20 10 10

Donc [F − 0, 129 6 p 6 F + 0, 129] est un intervalle de confiance de p au niveau de confiance 0,99.


De plus un réalisation de F est d’après l’énoncé : 0, 6 donc une estimation de cet intervalle est
[0, 471; 0, 729].

Probabilités : Chapitre 6 Exercices Page 5 Estimations

Vous aimerez peut-être aussi