Académique Documents
Professionnel Documents
Culture Documents
Estimation statistique
Population Echantillon
Taille : 𝑛
Taille : N Observations 𝑥1 , 𝑥2 , … , 𝑥𝑛
Moyenne 𝑥
Moyenne 𝜇 ? Proportion: 𝑓
Variance : 𝑠 2
Proportion: 𝑝 ? Variance corrigée : 𝑠 2
Variance : 𝜎 2 ??
Estimateur convergent
L’estimateur 𝑻𝒏 sans biais de 𝜽 est dit convergent si lim 𝑉𝑎𝑟 𝑇𝑛 = 0
𝑛→∞
A mesure que la taille de l’échantillon augmente, 𝑇𝑛 tend à prendre
une valeur de plus en plus rapprochée de 𝜽.
Alors , on a:
𝑛 𝑛 𝑛 𝑛
1 1 1 1 1
𝐸 𝑋 =𝐸 𝑋𝑖 = 𝐸 𝑋𝑖 = 𝐸(𝑋𝑖 ) = 𝜇= 𝑛𝜇 = 𝜇
𝑛 𝑛 𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛
1 1
𝐸 𝑆2 = 𝐸 𝑋𝑖 − 𝑋 2
= 𝐸 𝑋𝑖2 − 𝐸(𝑋 2 )
𝑛 𝑛
𝑖=1 𝑖=1
Or
𝑉𝑎𝑟 𝑋 = 𝐸 𝑋 2 − 𝐸 𝑋 2
𝜎2
𝐸 𝑋𝑖2 =𝜎 +𝜇 2 2
𝑒𝑡 𝐸 𝑋 2
= 𝑉𝑎𝑟 𝑋 + 𝐸 𝑋 2
= + 𝜇2
𝑛
2 2 2
𝜎2 2
𝑛 − 1 𝜎2 2
𝜎2
𝐸 𝑆 = 𝜎 +𝜇 − +𝜇 = =𝜎 − ≠ 𝜎2
𝑛 𝑛 𝑛
S² est donc un estimateur biaisé de la variance inconnue 𝜎 2 de la
population
𝑛 𝑛
1 1 1
𝐸(𝑆 2 ) = 𝐸 𝑋𝑖 − 𝑋 2
= 𝐸 𝑛× 𝑋𝑖 − 𝑋 2
𝑛−1 𝑛−1 𝑛
𝑖=1 𝑖=1
𝑛
𝑛 1 𝑛 𝑛 𝑛−1 2
𝐸 𝑆2 = 𝐸 𝑋𝑖 − 𝑋 2
= 𝐸 𝑆2 = × 𝜎 = 𝜎2
𝑛−1 𝑛 𝑛−1 𝑛−1 𝑛
𝑖=1
On a la relation
𝑛
2 2
𝑛 1 2
𝑛
𝜎 =𝑠 = × 𝑥𝑖 − 𝑥 = 𝑠2
𝑛−1 𝑛 𝑛−1
𝑖=1
𝑃 𝜃 ∈ 𝐼𝐶 = 𝟏 − 𝜶, 0<𝛼<1
En general, on prend 𝛼 = 0,05
Pour 𝛼 fixé, on cherche la valeur 𝑡𝛼 sur la table de la loi normale telle que
𝐹−𝑝 𝑓 1−𝑓 𝑓 1−𝑓
𝑃 − 𝑡𝛼 ≤ ≤ 𝑡𝛼 = 1−𝛼 ⇒ 𝑃 −𝑡𝛼 ≤ 𝐹 − 𝑝 ≤ 𝑡𝛼 = 1−𝛼
𝑓 1−𝑓 𝑛 𝑛
𝑛
On soustrait F dans chaque membre
𝑓 1−𝑓 𝑓 1−𝑓
⇒ 𝑃 −𝐹 − 𝑡𝛼 ≤ −𝑝 ≤ −𝐹 + 𝑡𝛼 =1−𝛼
𝑛 𝑛
En multipliant par (-1) les membres de l’encadrement, on a
𝑓 1−𝑓 𝑓 1−𝑓
⇒ 𝑃 𝐹 + 𝑡𝛼 ≥ 𝑝 ≥ 𝐹 − 𝑡𝛼 = 1−𝛼
𝑛 𝑛
On a alors
𝑓 1−𝑓 𝑓 1−𝑓
⇒ 𝑃 𝐹 − 𝑡𝛼 ≤ 𝑝 ≤ 𝐹 + 𝑡𝛼 = 1−𝛼
𝑛 𝑛
D’où l’intervalle de confiance de p de niveau de confiance 1 − 𝛼
𝑓 1−𝑓 𝑓 1−𝑓
⇒ 𝑓 − 𝑡𝛼 ≤ 𝑝 ≤ 𝑓 + 𝑡𝛼
𝑛 𝑛
Abdon Privat PAMBOU Estimation Statistique 2/8/2023
27
Intervalle de confiance de la proportion 𝒑
𝜶𝑪𝒐𝒍𝒐𝒏𝒏𝒆
𝑡𝛼 𝑪𝒐𝒍𝒐𝒏𝒏𝒆
↓
↓
𝛼𝐿𝑖𝑔𝑛𝑒 → 𝑡𝛼 𝛼
𝑡𝛼 𝐿𝑖𝑔𝑛𝑒 → 1−
2
Abdon Privat PAMBOU Estimation Statistique 2/8/2023
29
Intervalle de confiance de la proportion des
comptes dont le solde est inférieur à 3 millions
𝑓 1−𝑓 𝑓 1−𝑓
𝑝 ∈ 𝑓 − 𝑡𝛼 , 𝑓 + 𝑡𝛼
𝑛 𝑛
𝑝 ∈ 0,178 ; 0,238
Calcul de la marge d’erreur
Abdon Privat PAMBOU Estimation Statistique 2/8/2023
0,208 × 1 − 0,208
1,645 = 0,0298
30
2. Intervalle de l‘une moyenne 𝜇
Dans ce cas la variable aléatoire T suit une loi normale centrée réduite
𝑋−𝜇
𝑇 = 𝜎 → 𝑁(0,1)
𝑛
Pour 𝛼 fixé, on cherche la valeur 𝑡𝛼 sur la table de la loi normale telle que
𝑋−𝜇 𝜎 𝜎
𝑃 −𝑡𝛼 ≤ 𝜎 ≤ 𝑡𝛼 = 1 − 𝛼 ⇔ 𝑃 −𝑡𝛼 ≤ 𝑋 − 𝜇 ≤ 𝑡𝛼 =1−𝛼
𝑛 𝑛
𝑛
𝑋−𝜇 𝜎 𝜎
𝑃 −𝑡𝛼 ≤ 𝜎 ≤ 𝑡𝛼 =1−𝛼 ⇔ 𝑃 −𝑋 − 𝑡𝛼 ≤ −𝜇 ≤ −𝑋 + 𝑡𝛼 = 1−𝛼
𝑛 𝑛
𝑛
𝑋−𝜇 𝜎 𝜎
𝑃 −𝑡𝛼 ≤ 𝜎 ≤ 𝑡𝛼 =1−𝛼 ⇔ 𝑃 𝑋 − 𝑡𝛼 ≤ 𝜇 ≤ 𝑋 + 𝑡𝛼 =1−𝛼
𝑛 𝑛
𝑛
𝑺 𝑺
⇔ 𝑃 −𝑡𝛼 ≤ 𝑋 − 𝜇 ≤ 𝑡𝛼 =1−𝛼
𝑛−1 𝑛−1
𝑺 𝑺
𝑃 𝑋 − 𝑡𝛼 ≤ 𝜇 ≤ 𝑋 + 𝑡𝛼 =1−𝛼
𝑛−1 𝑛−1
Abdon Privat PAMBOU Estimation Statistique 2/8/2023
34
Intervalle de confiance de la moyenne:
cas où l’écart-type 𝝈 est inconnu
Corrigé
Données de l’exercice
𝑥 = 8,256 ; 𝑠 = 2,826 , 𝑛 = 500
Ici l’écart-type de la population n’est pas connu, alors
𝑠 𝑠
𝜇 ∈ 𝑥 − 𝑡𝛼 ; 𝑥 + 𝑡𝛼
𝑛−1 𝑛−1
𝑑𝑑𝑙 = 500 − 1 = 499 > 30, on revient à la loi normale
Pour 𝛼 = 1%, 𝑡𝛼 = 2,58
Pour 𝛼 = 5%, 𝑡𝛼 = 1,96
Pour 𝛼 = 10%, 𝑡𝛼 = 1,65
Corrigé
Niveau de confiance de 99%
2,826 2,826
𝜇 ∈ 8,256 − 2,58 × ; 8,256 + 2,58 ×
500 − 1 500 − 1
𝜇 ∈ 7,929 ; 8,582
La marge d’erreur est
2,826
2,58 ×
= 0,326
499
Interprétation: On a 99% de chance que le solde moyen d’un
compte soit compris entre 7,929 millions et 8,582 millions avec
une marge d’erreur de 0,326 millions.
Corrigé
Niveau de confiance de 95%
2,826 2,826
𝜇 ∈ 8,256 − 1,96 × ; 8,256 + 1,96 ×
500 − 1 500 − 1
𝜇 ∈ 8,008 ; 8,504
La marge d’erreur est
2,826
1,96 ×
= 0,247
499
Interprétation: On a 95% de chance que le solde moyen d’un
compte soit compris entre 8,008 millions et 8,504 millions avec
une marge d’erreur de 0,247 millions.
Corrigé
Niveau de confiance de 90%
2,826 2,826
𝜇 ∈ 8,256 − 1,65 × ; 8,256 + 1,65 ×
500 − 1 500 − 1
𝜇 ∈ 8,047 ; 8,464
La marge d’erreur est
2,826
1,65 ×
= 0,208
499
Interprétation: On a 90% de chance que le solde moyen d’un
compte soit compris entre 8,047 millions et 8,464 millions avec
une marge d’erreur de 0,208 millions.
On considère une variable quantitative X qui suit 1er cas la moyenne 𝝁 est connue
une loi normale 𝒩 𝜇, 𝜎 2
(𝑛−1)𝑆 2 𝑛𝑆 2
Pour estimer 𝜎 2 on considère comme estimateur
Dans ce cas = 2 suit une loi du Khi-Deux à
𝜎2 𝜎
sans biais 𝑆 2 n ddl
𝒏 𝒏
𝟏 Pour 𝛼 fixé, 0 < 𝛼 < 1, on cherche les valeurs 𝐶1 et
𝑺𝟐 = 𝑿𝒊 − 𝑿 𝟐 ⇔ (𝒏 − 𝟏)𝑺𝟐 = 𝑿𝒊 − 𝑿 𝟐 𝐶2 sur la loi du Khi-Deux à n ddl
𝒏−𝟏
𝒊=𝟏 𝒊=𝟏
Divisant par 𝜎 2 , on a 𝑛𝑆 2 1 𝜎2 1
𝑛 2 𝑃 𝑐1 ≤ 2
≤ 𝑐2 = 1 − 𝛼 ⇔ 𝑃 ≥ 2
≥ =1−𝛼
(𝑛 − 1)𝑆 2 𝑛𝑆 2 𝑋𝑖 − 𝑋 𝜎 𝑐1 𝑛𝑆 𝑐2
= 2 =
𝜎2 𝜎 𝜎
𝑖=1
𝑛𝑆 2 1 𝜎2 1
On a 𝑃 𝑐1 ≤ 2 ≤ 𝑐2 = 1 − 𝛼 ⇔ 𝑃 ≤ 2 ≤ =1−𝛼
𝜎 𝑐2 𝑛𝑆 𝑐1
𝑋𝑖 − 𝑋
→ 𝒩 0, 1
𝜎
𝑛𝑆 2 𝑛𝑆 2 𝑛𝑆 2
Alors 𝑃 𝑐1 ≤ ≤ 𝑐2 = 1 − 𝛼 ⇔ 𝑃 ≤ 𝜎 2
≤ =1−𝛼
𝑛 2 𝜎2 𝑐2 𝑐1
(𝑛 − 1)𝑆 2 𝑛𝑆 2 𝑋𝑖 − 𝑋 2
= 2 = → 𝜒𝑑𝑑𝑙
𝜎2 𝜎 𝜎
𝑖=1
1er cas la moyenne 𝝁 est connue 𝐶1 et 𝐶2 sont deux fractiles de la loi Khi-
Pour 𝛼 fixé, on cherche les valeurs et sur la Deux à 𝑛 ddl tels que
loi du Khi-Deux à n ddl 𝑃 𝐶1 ≤ 𝜒𝑛2 ≤ 𝐶2 = 1 − 𝛼
𝑛𝑆 2 Soit
𝑃 𝑐1 ≤ 2 ≤ 𝑐2 = 1 − 𝛼 𝑃 𝜒𝑛2 ≤ 𝐶2 = 1 −
𝛼
𝜎 2
2
𝛼
𝑃 𝜒𝑛 ≤ 𝐶1 =
Les bornes de l’intervalle de confiance 2
de 𝝈𝟐 de niveau de confiance 1 − 𝛼 sont
données par :
𝟐
𝑛𝑆 2 𝑛𝑆 2
𝝈 ∈ ,
𝐶2 𝐶1
𝑛 est la taille de l’échantillon
𝑆 2 est la variance calculée dans
l’échantillon de taille 𝑛
2,826 2,826
𝜇 ∈ 8,256 − 1,96 , 8,256 + 1,96
200 − 1 200 − 1
50
Corrigé application-Intervalle
de confiance de la variance
2
200 × 2, 8262 200 × 2, 8262
𝜎 ∈ ,
239, 96 161, 826
D’où l’intervalle de confiance de la variance des montants des
soldes de comptes clients
𝜎 2 ∈ 6,656 ; 9,870
51
Corrigé application-Intervalle
de confiance de la variance