Académique Documents
Professionnel Documents
Culture Documents
1 Intervalle de confiance.
Exercice
Déterminer une valeur approchée de la loi de la moyenne empirique :
E Xn = E (X) , V Xn = n V (X) donc Xn ,→ N E (X) , n1 V (X)
1
∼
2 Exercices
2.1 Variance
1 2
Xi2 − Xn
P
Soit X ayant une espérance m et une variance v, sa variance empirique est Wn = n
avec Xn la moyenne empirique de X et n1
P 2
Xi la moyenne empirique de X 2 .
Solution
1. V (Y ) = E (Y 2 ) − E (X)2 donc E (Y 2 ) = V (Y ) + E (Y )2
2
2. E Xn = m et V Xn = n1 v donc E Xn = n1 v + m2
1
E (Xi2 ) = n1 n (v + m2 ) − n1 v + m2 = 1 − n1 v = n−1
P
3. E (Wn ) = n n
v
n−1
Wn = v et n−1
D’où E n n
Wn variance empirique sans biais est un estimateur sans biais de
la variance.
Si l’enquêteur ignore le résultat du dé, il ne pourra pas savoir si la réponse est franche ou non, et on
peut espérer que la personne sondée acceptera de jouer le jeu.
Généralisons légèrement la situation en tirant pour chaque personne une variable de Bernoulli de
paramètre α.
Cours˙Estimation-c Page 1/ 12
• Si le résultat de cette variable est 1, la réponse est franche,
2. Montrer que Fn , la fréquence observée par l’enquêteur, est un estimateur sans biais de q et de
risque quadratique tendant vers 0 quand n tend vers +∞
5. Pour n fixé, quelle valeur attribuer à α pour que le risque quadratique soit minimum ? Est-ce
acceptable ?
Pour quelle valeur de α ce risque est-il maximum ?
Quel sera le risque quadratique avec le dé (α = 1/6)
1. Soit Tn = 2Xn . Montrer que Tn est sans biais et déterminer son risque quadratique
solution:
Pn
1
Xi donc E Xn = n1 ni=1 E (Xi ) = a2 d’où E (Tn ) = 2 a2 = a et Tn est sans biais.
P
1. Xn = n i=1
Cours˙Estimation-c Page 2/ 12
G (t) = F (t)n .
F est continue sur R et C 1 sauf en 0 et a donc G également et Tn0 est à densité de densité :
0 n−1 0 si x ∈/ [0, a]
g (t) = G (t) = n f (t) F (t) = n x n−1
a a
si x ∈ [0, a]
Ra Ra n 1 n+1 a
L’espérance (qui existe) de Tn0 est alors 0 t g (t) dt = 0 ann tn dt = n+1 an
t 0
n
= n+1 a
Donc Tn0 a pour biais n+1 n
− 1 a = − na (biaisé mais son biais tend vers 0 quand n → +∞ )
Ra Ra n 1 n+2 a
L’espérance (qui existe) de Tn0 2 est 0 t2 g (t) dt = 0 ann tn+1 dt = n+2 an
t 0
n
= n+2 a2
Donc la variance de Tn0 est
2
2
2 n 2 n n
V (Tn0 ) =E Tn0 −E (Tn0 ) = a − 2 a2 = a2
n+2 n+1
(n + 1) (n + 2)
et son risque quadratique est r0 = V (Tn0 ) + b2 = (n+1)n2 (n+2) a2 + n12 a2 = (n+1)n2 (n+2) + n12 a2 ∼
2 2
n2
a
4. Montrer que pour tout p ∈ [0, 1] , p (1 − p) ≤ 14 et en déduire que [F − t/20 ; F + t/20] est un
intervalle de confiance de p au niveau de confiance 99%
Cours˙Estimation-c Page 3/ 12
Solution
1
P100 1
P100 1
1. On a E (F100 ) = E 100 i=1 Xi = 100 i=0 E (Xi ) = 100
100p =p
Donc Fn est un estimateur sans biais de p
F∗ = qF −p =√ 10
(F − p) la fréquence empirique centrée réduite suit approximativement
p(1−p) p(1−p)
100
une loi N (0, 1)
√ √
p(1−p) p(1−p)
Donc P Fn − t 10
≤ p ≤ Fn + t 10
≥ 0, 99
Donc [Fn − t/20 ; Fn + t/20] est un intervalle de confiance de p au niveau de confiance 99%
soit avec l’échantillon de données : p̂ = 0, 6
t/20 ' 0, 13, l’intervalle de confiance au niveau 99% est [0, 47 ; 0, 73] ... ce qui ne renseigne pas
beaucoup sur les chances de remporter l’élection..
Avec un échantillon de taille 10000, on trouvera l’intervalle [Fn − t/200 , Fn + t/200] soit une
largeur d’intervalle proche de 5% pour un niveau de confiance de 99%.
Cours˙Estimation-c Page 4/ 12
√
p(1−p)
Avec un niveau de confiance de 95%, on a t = 1, 96 et pour n = 1000 on a t √1000 ≤ 0, 0302,
c’est la classique des sondages : pour un échantillon de 1000 personne, le résultat est donné
avec un intervalle de confiance de 3% (ce que ne disent pas les sondeurs, c’est que cela n’est
sûr qu’à 95% : il y a 5% de chance que la valeur réelle soit hors de cet intervalle de
de confiance de a2 au niveau α
Solution
√
Soit a ∈ 0; 2 3 , X ,→ U[0,a] et (X1 . . . Xn ) un néchantillon de variables de même loi que X et
indépendantes.
On cherche un intervalle de confiance de a2 au niveau de confiance 99% (niveau de risque 1%).
On note Xn la moyenne empirique
a
1. On a E (X) = 2
Rat2
Et
h 3 comme
ia la densité de X est nulle hors de [0, a] et vaut a1 sur [0, a] on a E (X 2 ) = 0 a
dt =
t 2 2 2 2
3a
= a3 et donc X a une variance qui est V (X) = a3 − a2 = a12
0
Cours˙Estimation-c Page 5/ 12
1
Pn 1
Pn 1
Et V Xn = E n i=1 Xi = n2 i=1 V (Xi ) car les Xi sont indépendants · · · = n2
nV (X) =
a2
12n
a2
Rappeler la moyenne m de X et montrer que V (X) = 12
. En déduire la moyenne et l’espérance
de Xn .
V (Xn ) a2
2. D’après l’inégalité de Bienaymé-Tchebichev on a alors P Xn − a2 > 0, 1 ≤ 0,12 = 100 12n et
√ 2 a
100 a
comme 0 ≤ a ≤ 2 3 alors a ≤ 12 et donc P Xn − 2 > 0, 1 ≤ n et P Xn − 2 ≤ 0, 1 ≥
1 − 100
n
Xn − 0, 1 ≤ a2 ≤ Xn + 0, 1
5. La loi ni=1 Xi somme de variables indépendantes de même loi qui a pour espérance n a2 , et
P
2
pour variance n a12 .
Xn −a/2 ∗
DOnc centreée réduite, elle peut être approchée par une loi N (0, 1) et Xn = √ 2
par
a /12n
N (0, 1)
√
12 a
6. Et pour n = 10000 : P −t ≤ a
100 Xn − 2
< t ' Φ (t) − Φ (−t) = 2Φ (t) − 1
On résout 2Φ (t) − 1 ≥ 0, 99 ⇐⇒ Φ (t) ≥ 0, 995 ce qui est vérifié pour t = 2, 58 ≤ 2, 6
√
On a −t ≤ a12 100 Xn − a2 < t = Xn − t 100a√12 ≤ a2 < Xn + t 100a√12 avec 100a√12 ≤ 1
100
Cours˙Estimation-c Page 6/ 12
donc Xn − 0, 026 ; Xn + 0, 026 est un intervalle de confiance de a2 au niveau de confiance 99%
Cours˙Estimation-c Page 7/ 12
2.6 Comptage par capture et recapture
On cherche à évaluer le nombre N de poissons dans un étang.
Pour cela, on prélève dans l’étang m poissons que l’on bague avant les remettre dans l’étang.
On propose deux méthodes différentes d’estimation de N .
Méthode 1
Soit n ∈ N∗ , n ≥ m.
On prélève des poissons dans l’étang, au hasard et avec remise.
On note Xn la variable aléatoire égale au nombre de poissons qu’il a été nécessaire de pêcher pour
obtenir n poissons marqués.
Pour tout i ∈ [2, n], on pose Di = Xi − Xi−1 . On pose D1 = X1 et on suppose que les Di sont des
variables indépendantes.
Méthode 2
On prélève successivement et avec remise n poissons. Soit Yn le nombre de poissons marqués parmi
eux.
1 1
1. Montrer que Y
nm n
est un estimateur sans biais de N
.
nm
2. Pour quelle raison évidente ne peut-on pas prendre Yn
comme estimateur de N ?
On pose alors Bn = m(n+1)
Yn +1
a) Calculer l’espérance de Bn .
b) Est-il un estimateur sans biais de N ?
Solution
Méthode 1
1. a) Di est la différence du nombre de pèche nécessaire pour obtenir i−1 et i poissons marqués.
C’est le nombre de pèche pour obtenir un poisson marqué de plus.
Cours˙Estimation-c Page 8/ 12
b) Donc Di est le nombre de pèches pour obtenir un poisson marqué de plus dans une suite
de pèche (on peut supposer que la pèche se continue indéfiniment) indépendantes (avec
remise, en supposant que les poissons sont bêtes et ne se souviennent pas qu’il ne faut pas
m
mordre à l’hameçon) ayant toutes une probabilité N de donner un poisson marqué.
m
m
1− N N (N − m)
et E (Di ) = N
Donc Di ,→ G N m
et V (Di ) = 2 =
m m2
N
Comme D1 + D2 + · · · + Dn = Xn on a alors E (Xn ) = n N
m
et comme les (Di )i sont
N (N −m)
indépendants, V (Xn ) = n m2
c) On pose An = m n
Xn .
m
On a alors E (An ) = n
E
(Xn ) = N donc An est un estimateur sans biais de N.
m2
Sa variance est V (An ) = V mn
Xn = n2 V (Xn ) = N (Nn−m)
N (N −m)
Donc son risque quadratique est : biais2 + V (An ) = n
2. a) Pour n assez grand, Xn étant une somme de variables indépendantes et de même loi, Xn∗
peut être approchée par une loi normale centrée réduite.
b) An suit alors également une loi normale de paramètres E (An ) = N et et V (An ) = σ 2
et Anσ−N suit une loi normale centrée réduite.
Donc P −t ≤ Anσ−N ≤ t = Φ (t) − Φ (−t) = Φ (t) − [1 − Φ (t)] = 2Φ (t) − 1
Et
An − N
P −t ≤ ≤ t ≥ 0, 9 ⇐⇒ 2Φ (t) − 1 ≥ 0, 9
σ
⇐⇒ Φ (t) ≥ 0, 95 ' Φ(1, 64)
⇐⇒ t ≥ 1, 64
car Φ est croissante sur R
Comme σ ≤ 100 alors
An − N
−t ≤ ≤ t = (An − tσ ≤ N ≤ An + tσ) ⊂ (An − t100 ≤ N ≤ An + t100)
σ
Et avec t = 1, 64 : P (An − t100 ≤ N ≤ An + t100) ≥ P −t ≤ Anσ−N ≤ t ≥ 0, 9
Méthode 2
On prélève successivement et avec remise n poissons. Soit Yn le nombre de poissons marqués parmi
eux.
m
1. Le nombre Yn de poissons marqués suit une loi binomial de paramètres n, N .
m 1
Yn = N1
Donc son espérance est E (Yn ) = n N et E nm
1
Donc Y
nm n
est un estimateur sans biais de N1 .
1 2
m m
nm(N −m) 1
(N −m)
On a V (Yn ) = n N 1− N = N2
donc V Y
nm n
= nm
V (Yn ) = n m N2
1 1 (N −m)
Donc le risque quadratique de Y
nm n
comme estimateur de N
est n m N2
Cours˙Estimation-c Page 9/ 12
nm
2. Comme Yn peut être nul avec une probabilité non nulle, Yn
aurait une probabilité non nulle
de ne pas être défini.
On pose alors Bn = m(n+1)Yn +1
n
X m(n + 1)
E (Bn ) = P (Yn = k)
k=0
k+1
n
X m(n + 1) n k n−k
= p q
k=0
k+1 k
n
X m(n + 1) n!
E (Bn ) = pk q n−k
k=0
k+1 k! (n − k)!
n
X (n + 1)!
= m pk q n−k
k=0
(k + 1)! (n − k)!
On y reconnaı̂t n+1
k+1
et on réindexe h = k + 1pour faire réapparaitre la formule du
binôme... pour la puissance n + 1
n
X n + 1 k n−k
E (Bn ) = m p q
k=0
k + 1
n+1
X n + 1 h−1 n+1−h
= m p q
k=1
h
n+1 !
m X n + 1 h n+1−h
= p q − q n+1
p k=0 h
m
(p + q)n+1 − q n+1
=
p
m
1 − q n+1
=
p
N 1 − q n+1
=
b) Donc B est biaisé, mais quand n tend vers +∞ (quand on augmente le nombre de repêche)
le biais tend vers 0 : il est asymptotiquement sans biais.