Vous êtes sur la page 1sur 2

Corrigé de l’examen d’Echantillonnage et Estimation/ Session normale

Exercice 1 : 8 p
Enoncé : Soient n variables aléatoires 𝑋1 , 𝑋2 , …. 𝑋𝑛 indépendantes et identiquement distribuées (i.i.d) selon une loi de densité
3 𝑥2
2𝑥 2
de paramètre θ > 0 : f (𝑥) = 𝜃 −2 𝑒 − 𝜃
√𝜋
1) Déterminer un estimateur θ̂ du paramètre θ par la méthode du maximum de vraisemblance.
2) Examiner les propriétés de θ̂ .
Corrigé : (8 p)
On a n variables aléatoires 𝑋1 , 𝑋2 , …. 𝑋𝑛 indépendantes et de même loi de densité que X de paramètre θ > 0 : f
3 𝑥2
2𝑥 2
(𝑥) = 𝜃 −2 𝑒 − 𝜃
√𝜋
1) On détermine l’EMV 𝛉 ̂ = 𝑨𝒓𝒈𝒎𝒂𝒙 𝛉 𝐋 (𝒙𝟏 , 𝒙𝟐 … … 𝒙𝐧 , 𝛉)
 Vraisemblance de l’échantillon :
𝑳θ ( 𝑿𝟏 , 𝑿𝟐 , … … 𝑿𝒏 ) = 𝒇 θ (𝒙𝟏 ) x 𝒇θ (𝒙𝟐 ) x …….x 𝒇θ (𝒙𝒏 )

3 ∑𝑛 2
𝑖=1 𝑥𝑖
2
𝑳θ ( 𝑿𝟏 , 𝑿𝟐 , … … 𝑿𝒏 ) = ( 𝜃 −2 )𝒏 ∏𝒏𝒊=𝟏 𝑥𝑖2 𝑒 − 𝜃
√𝜋
3 ∑𝑛 2
𝑖=1 𝑥𝑖
2
Ln [𝑳θ ( 𝑿𝟏 , 𝑿𝟐 , … … 𝑿𝒏 )] = 𝒍𝒏 [(( 𝜃 −2 )𝒏 ∏𝒏𝒊=𝟏 𝑥𝑖2 𝑒 − 𝜃 ]
√𝜋
3 ∑𝑛 2
𝑖=1 𝑥𝑖
=𝑛 ln(2) − 𝒏𝒍𝒏(√𝜋 ) − 𝒏 𝒍𝒏 (𝜃) + ∑𝑛𝑖=1 ln (𝑥𝑖2 ) −
2 𝜃
𝒅 [𝒍𝒏 𝑳 (𝒙𝟏 , 𝒙𝟐 ……𝒙𝒏 , 𝜽)]
 =𝟎
𝒅𝜽
3 ∑𝑛𝑖=1 𝑥𝑖2
− 𝒏+ =𝟎
2𝜃̂ 𝜃̂ 2
3𝑛𝜃̂ − 2 ∑𝑛𝑖=1 𝑥𝑖2
=𝟎
2𝜃̂ 2
3𝑛𝜃̂ − 2 ∑𝑛𝑖=1 𝑥𝑖2 = 0
𝒏 𝟐
̂ = 𝟐 ∑𝒊=𝟏 𝒙𝒊 peut-être un EMV de 𝜃
𝜽
𝟑𝒏
𝒅𝟐 [𝒍𝒏 𝑳 (𝒙𝟏 , 𝒙𝟐 ……𝒙𝒏 , 𝜃)] 3 2 𝜃 ∑𝑛 2
𝑖=1 𝑥𝑖 3𝑛𝜃−4 ∑𝑛 2
𝑖=1 𝑥𝑖
 = 𝒏− =
𝒅𝜃 2 2𝜃 2 𝜃 4 2𝜃 3
2 ∑𝑛 2
𝑖=1 𝑥𝑖
On a 𝜃 = donc 3𝑛𝜃 = 2 ∑𝑛𝑖=1 𝑥𝑖2
3𝑛
2 ∑𝑛 2 𝑛 2
𝑖=1 𝑥𝑖 −4 ∑𝑖=1 𝑥𝑖 −2 ∑𝑛 2
𝑖=1 𝑥𝑖
Alors 3 = < 0 ( 𝜃̂ est bien un maximum)
2𝜃 2𝜃 3
Ainsi, 𝜃̂ est un EMV de θ
2) Les propriétés de 𝛉̂
3
E (X 2 ) = θ et V(𝑋 2 ) = θ2
2
EMV sans biais :
𝑛 2
2∑ 𝑥 2 2 3
E (𝜃̂) = 𝐸 ( 𝑖=1 𝑖 ) = 𝐸(∑𝑛𝑖=1 𝑥𝑖2 ) = 𝑛θ =𝜃
3𝑛 3𝑛 3𝑛 2
EMV est convergent :
𝑛 2
2∑ 𝑥 4 4𝜃 2
lim 𝑉(𝜃̂) = lim 𝑉( 𝑖=1 𝑖 )= lim 𝑛𝜃 2 = lim =0
𝑛→∞ 𝑛→∞ 3𝑛 𝑛→∞ 9𝑛2 𝑛→∞ 9𝑛

Exercice 2
Enoncé : Une société fabrique en grande quantité des pièces destinées au montage des robots dont on vérifie le diamètre. On prélève d’une
manière non exhaustive dans la production journalière de paramètres (µ ; 𝜎) un échantillon de 40 pièces. La moyenne et l’écart-type à partir
de cet échantillon est : ̅𝑋= 6 mm et 𝑆𝑒 =0,22 mm.
1) Déterminer l’estimation ponctuelle des paramètres de la production journalière.
2) Estimer par un intervalle de confiance de la moyenne à 95%.
Corrigé :( 6p)
On a un échantillon aléatoire de taille n=40 pièces (dont les éléments tirés de façon non exhaustive)
Les statistiques calculés à partir de cet échantillon sont : 𝑋̅= 6 mm et 𝑆𝑒 =0,22 mm.
1) L’estimation ponctuelle des paramètres de la production journalière (µ et 𝝈).
On sait que E( 𝑋̅) = µ est un estimateur sans biais et convergent de µ
Donc µ = 𝑋̅= 6 mm est une estimation ponctuelle de la moyenne de la production journalière.
𝑆𝑒 est un estimateur biaisé de 𝝈 ( avec µ n’est pas connu)
𝑛 40
Donc 𝜎 =√ 𝑆𝑒 = √ x 0,22 = 0,2228 est une estimation ponctuelle corrigée de l’écart type de la
𝑛−1 39

production journalière.
2) L'intervalle de confiance de la moyenne µ
𝑋̅−µ
Sachant que n ≥ 30 et 𝜎 n’est pas connu (mais estimé par 𝑆𝑒 ), la loi de la moyenne 𝑆 → 𝑁(0,1)
√𝑛
𝑛
Avec 𝑺 = √ 𝑆𝑒 = 0,2228(estimateur corrigé de l’écart type)
𝑛−1
On recherche l’intervalle de confiance de telle sorte que :
P(−𝑢1−α/2 ≤U ≤ 𝑢1−α/2 ) = 1-α (avec α =0,05)
𝑋̅−µ
P(−𝑢0,975 ≤ 𝑆 ≤ 𝑢0,975 ) = 0,95 (α =0,05)
√𝑛
D’après la table de la loi normale centrée réduite, 𝑢0,975 correspond à 1,96.
𝑆 𝑆
Donc P (𝑋̅ − 1,96 x ≤ µ ≤ 𝑋̅ + 1,96 x ) = 0,95
√𝑛 √𝑛
𝑆 𝑆
P(µ ∈ [𝑋̅ − 1,96 x ; 𝑋̅ + 1,96 x ] =0,95
√𝑛 √𝑛
L’intervalle de la moyenne µ à 95% de confiance obtenu est :
0,2228 0,2228
IC = [6 − 1,96 x ; 6 + 1,96 x ] = [5,9309 ; 6,0690 ]
√40 √40
Conclusion : Il y a 95% de chances que la moyenne du diamètre des pièces de la production journalière est dans
l’intervalle [5,9309 ; 6,0690]
Exercice 3 : 6 p
Enoncé : Un prestataire de service Internet établit un point local d’accès, qui dessert 10000 abonnés. À un instant donné, chaque abonné a une
probabilité égale à 25% d’être connecté. On suppose que les comportements des abonnés sont indépendants les uns des autres. Soit Y la variable
aléatoire égale au nombre d’abonnés connectés à un instant t.
1) Donner la loi de Y, son espérance et son écart-type.
2) Calculer le nombre de connexions simultanées (N) que le point d'accès pourrait gérer pour que sa probabilité d'être saturé à un instant donné
soit inférieure à 1,5 % (en utilisant T.C.L, rechercher P (Y ≥ N) ≤ 1,5 %).
Corrigé :
1) Y représente le nombre de succès lors de la réalisation de 10000 épreuves aléatoires indépendantes, dont la
probabilité de réalisation de chacune est 0,25. Y=∑𝑛𝑖=1 𝑦𝑖 suit donc une loi binomiale B (10000 ; 0.25)
Son espérance vaut 10000×0,25=2500 et sa variance 10000×0,25×0,75= 1875
2) n≥30
np≥5 les conditions de T.C.L, sont vérifiées alors Y=∑𝑛𝑖=1 𝑦𝑖 → 𝑁(𝑛𝑝; √𝑛𝑝𝑞)
𝑌−𝑛𝑝 ∑𝑛
𝑖=1 𝑦𝑖
npq≥5 donc U= → 𝑁(0,1) ( ou F = 𝑑𝑜𝑛𝑐 ∑𝑛𝑖=1 𝑦𝑖 = 𝑛𝐹)
√𝑛𝑝𝑞 𝑛
On peut calculer : P (Y ≥ N) ≤ 1,5 %
𝑌−𝑛𝑝 𝑁−2500
P( ≥ ) ≤ 0,015
√𝑛𝑝𝑞 √1875
𝑁−2500
P( 𝑈 ≥ ) ≤ 0,015
1875
𝑁−2500
1- P ( 𝑈 ≤ ) ≤ 0,015
√1875
𝑁−2500
P(𝑈≤ ) ≥ 0,985
√1875
𝑁−2500
D’après la table de la loi normale centrée réduite, on π ( ) ≥ 0,985 ≥ π(2,17)
√1875
𝑁−2500
Donc : ≥ 2,17 donc N ≥ 2593,9637
√1875
Conclusion : Le nombre de connexions simultanées (N) que le point d'accès pourrait gérer pour que sa probabilité d'être
saturé à un instant donné soit inférieure à 1,5 % est de 2594 (ou 2593).

Vous aimerez peut-être aussi