Vous êtes sur la page 1sur 19

Université Abdelmalek Essaadi

Faculté des Sciences – Tétouan


Département de Mathématiques
Filière: SMC 4
Module: Probabilités et statistiques

Chapitre 3
Théorie d’estiamtion

Réalisé par le professeur :


Noureddine Lanjri Zaïdi
Plan de la représentation
1. Introduction

2. Estimation ponctuelle

3. Estimation par I.C. de la moyenne

4. Estimation par I.C. de la différence 𝑚1 − 𝑚2

5. Estimation par I.C. de la variance

𝜎22
6. Estimation par I.C. du rapport
𝜎12

7. Estimation d’une proportion

8. Estimation de la différence 𝑝1 − 𝑝2
1. Introduction
On dispose d’une population de caractéristiques suivantes: la
moyenne 𝑚, la variance 𝜎 2 et la proportion 𝑝 d’individus ayant une
propriété prédéfinie. On en tire un échantillon (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) de taille
𝑛. (𝑥𝑖 est la réalisation d’une v.a. 𝑋𝑖 et les 𝑋𝑖 sont indépendantes et de
même loi de moyenne 𝑚 et de variance 𝜎 2 ) On définit les quantités
suivantes: 𝒏
𝟏
𝒎∗ = ෍ 𝒙𝒊 la moyenne de l′ échantillon ou 𝑚𝑜𝑦𝑒𝑛𝑛𝑒 𝑒𝑚𝑝𝑒𝑟𝑖𝑞𝑢𝑒,
𝒏
𝒊=𝟏
𝒏
𝟏
𝑺∗ 𝟐 = ෍ 𝒙𝒊 − 𝒙 𝟐 la variance de l′ échantillon,
𝒏
𝒊=𝟏
𝒏
𝒏 𝟏
𝑺𝟐𝒙 = 𝑺∗ 𝟐 = ෍ 𝒙𝒊 − 𝒙 𝟐
la quasi variance de l′ é𝑐ℎ𝑎𝑛𝑡𝑖𝑙𝑙𝑜𝑛,
𝒏−𝟏 𝒏−𝟏
𝒊=𝟎
𝒌
𝒑∗ = la proportion d′ individus ayant une propriété prédéfinie 𝑜ù
𝒏
𝑘 𝑒𝑠𝑡 𝑙𝑒 𝑛𝑜𝑚𝑏𝑟𝑒 𝑑 ′ 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑠 𝑑𝑒 𝑙 ′ é𝑐ℎ𝑎𝑛𝑡𝑖𝑙𝑙𝑜𝑛 𝑎𝑦𝑎𝑛𝑡 𝑙𝑎 𝑑𝑖𝑡𝑒 𝑝𝑟𝑜𝑟𝑝𝑟𝑖é𝑡é .
1. Intoduction
Définition: Estimer un paramètre 𝜃 ∈ {𝑚, 𝜎 2 , 𝑝} de la population c’est
lui attribuer une valeur alors que la valeur exacte est inconnue.
L’estimation ponctuelle d’un paramètre 𝜃 consiste à donner une
valeur à ce paramètre alors que l’estimation par intervalle de
confiance consiste à donner un intervalle I auquel peut appartenir ce
paramètre.

Soit 𝜃 un paramètre de la population et soit 𝛼 ∈ 0,1 .

Définition: On appelle intervalle de confiance pour 𝜃 de niveau de


confiance 𝛽 = 1 − 𝛼, l’intervalle aléatoire I tel que
𝑃 𝜃 ∈ 𝐼 = 1 − 𝛼.
Remarques:
1. 𝛽 = 1 − 𝛼 s’appelle le niveau de confiance ou seuil de confiance.
C’est la probabilité que 𝜃 ∈ 𝐼.
2. 𝛼 = 1 − 𝛽 s’appelle le risque d’erreur que le paramètre 𝜃 ∈ 𝐼. C’est
la probabilité que 𝜃 n’appartienne pas l’intervalle de confiance I.
2. Estimation ponctuelle

Estimation ponctuelle d’un paramètre 𝜃 de la population


. L’estimation ponctuelle de la moyenne 𝑚 est donnée par
1
𝑚∗ = 𝑥 = σ𝑛𝑖=1 𝑥𝑖 .
𝑛

. L’estimation ponctuelle de la variance 𝜎 2 est donnée par


𝑛
1
𝑇∗2 = ෍(𝑥𝑖 − 𝑚)2 𝑠𝑖 𝑚 𝑒𝑠𝑡 𝑐𝑜𝑛𝑛𝑢𝑒,
𝑛
𝑖=1
𝑛
1
𝜎 ∗2 = ෍(𝑥𝑖 − 𝑥)2 𝑠𝑖 𝑚 𝑒𝑠𝑡 𝑖𝑛𝑐𝑜𝑛𝑛𝑢𝑒.
𝑛−1
𝑖=1
L’estimation ponctuelle de la proportion 𝑝 d’éléments de la
𝑘
population ayant une propriété prédéfinie est 𝑝∗ = 𝑝 où 𝑘 est le
nombre d’éléments de l’échantillon ayant la dite propriété.
3. Estimation par I.C. de la moyenne
3.1. Estimation par I.C. de la moyenne d’une loi quelconque (𝒏 ≥ 𝟑𝟎)

σ σ
x− U α; x + U α si σ est connue,
n 1−2 n 1−2
IC1−α m =
σ∗ σ∗
x− U1−α ; x + U1−α si σ est inconnue.
n 2 n 2

3.2. Estimation par I.C. de la moyenne d’une loi 𝑵 𝒎, 𝝈𝟐 (𝒏 𝒒𝒖𝒆𝒍𝒄𝒐𝒏𝒒𝒖𝒆)

σ σ si σ est connue,
x− U1−α ; x + U α
n 2 n 1−2
σ∗ σ∗
IC1−α m = x− t α; x + t α si σ est inconnue et n < 30,
n n−1,1−2 n n−1,1−2
σ∗ σ∗
x− U1−α ; x + U1−α si σ est inconnue et n ≥ 30.
n 2 n 2
3. Estimation par I.C. de la moyenne
3.3. Applications
Exemple 1. Déterminer 𝐼𝐶0,95 𝑚 pour X ~ N(m,1) et
𝑥1 , 𝑥2 , 𝑥3 , 𝑥4 , 𝑥5 =(10,5,2,3,5).

Réponse:
𝟏 𝟏 𝟐𝟓
Pour cet échantillon on a 𝒙 = 𝒏 σ𝟓𝒊=𝟏 𝒙𝒊 = 𝟓 𝟏𝟎 + 𝟓 + 𝟐 + 𝟑 + 𝟓 = 𝟓 = 𝟓.
Comme 𝜎 2 = 4 est connue, alors
𝝈 𝝈 2 2
[𝒙 − 𝒏 𝑼𝟏−𝜶 , 𝒙 + 𝒏 𝑼𝟏−𝜶 ] = [5 − 5 𝑈0,975 , 5 + 5 𝑈0,975 ]
𝟐 𝟐
2 2
=[5- × 1,96, 5+ × 1,96]=[3,24; 6,75].
5 5

Ex 2. Déterminer 𝐼𝐶0,95 𝑚 pour 𝑛 = 17, 𝑆𝑥 = 4 𝑒𝑡 𝑥 = 10.


On se trouve dans le cas suivant: Loi quelconque, 𝜎 inconnue et
n<30, alors on a
𝜎∗ 𝜎∗
𝐼𝐶0,95 𝑚 = 𝑥 − 𝑡 𝛼; 𝑥 + 𝑡 𝛼
𝑛 𝑛−1,1− 2 𝑛 𝑛−1,1− 2
𝑆𝑥 𝑆𝑥 4
= 𝑥− 𝑡 𝛼; 𝑥+ 𝑡 𝛼 = 10 ∓ 16 𝑡16,0,975
𝑛−1 𝑛−1,1− 2 𝑛−1 𝑛−1,1− 2
= 10 ∓ 𝑡𝑡16,2 1−0,975 = 10 ∓ 𝑡𝑡16,0,05 = 10 ∓ 7,962] = 2,038; 17,960 .
4. Estimation par I.C. de la différence 𝑚1 − 𝑚2
Soient 𝑥1 , 𝑥2 , … , 𝑥𝑛1 et 𝑦, 𝑦2 , … , 𝑦𝑛2 des échantillons de tailles 𝑛1 et
𝑛2 tirés de deux populations de caractéristiques 𝑚1 , σ12 et 𝑚2 , σ22
respectivement.

4.1. 𝒎𝟏 𝒆𝒕 𝒎𝟐 sont des moyennes de lois normales


L’intervalle de confiance pour 𝑚1 − 𝑚2 au risque 𝛼 est donné par

𝜎12 𝜎22
𝑥−𝑦 ± + 𝒰1−𝛼 𝑠𝑖 σ12 et σ22 𝑠𝑜𝑛𝑡 𝑐𝑜𝑛𝑛𝑢𝑒𝑠 𝑒𝑡 𝑛1 𝑒𝑡 𝑛2 𝑞𝑙𝑞,
𝑛1 𝑛2 2
,
𝑥 − 𝑦 ± 𝐴. 𝑡𝑛 +𝑛 −2,1−𝛼 𝑠𝑖 σ2 =σ2 𝑖𝑛𝑐𝑜𝑛𝑛𝑢𝑒 𝑒𝑡 𝑛 𝑒𝑡 𝑛 𝑞𝑙𝑞
1 2 2 1 2 1 2

𝐼𝐶1−𝛼 =
𝑥 − 𝑦 ± 𝐴. 𝒰1−𝛼 𝑠𝑖 σ12 =σ22 𝑖𝑛𝑐𝑜𝑛𝑛𝑢𝑒 𝑒𝑡 𝑛1 + 𝑛2 − 2 > 30,
2

𝜎1∗ 2 𝜎2∗ 2
𝑥−𝑦 ± + 𝒰1−𝛼 𝑠𝑖σ12 ≠σ22 𝑠𝑜𝑛𝑡 𝑖𝑛𝑐𝑜𝑛𝑛𝑢𝑒𝑠𝑒𝑡 𝑛1 𝑒𝑡 𝑛2 𝑞𝑙𝑞.
𝑛1 𝑛2 2
4. Estimation par I.C. de la différence 𝑚1 − 𝑚2
2 2
𝑛1 −1 𝜎1∗ + 𝑛2 −1 𝜎2∗ 1 1
Où 𝐴 = +𝑛
𝑛1 +𝑛2 −2 𝑛1 2

4.2. 𝒎𝟏 𝒆𝒕 𝒎𝟐 sont des moyennes de lois quelconques


L’intervalle de confiance pour la différence 𝑚1 − 𝑚2 au seuil 1-𝛼 est

𝜎12 𝜎22
𝑥−𝑦 ± + 𝒰1−𝛼 𝑠𝑖 σ12 et σ22 𝑠𝑜𝑛𝑡 𝑐𝑜𝑛𝑛𝑢𝑒𝑠,
𝑛1 𝑛2 2

𝑛1 − 1 𝜎1∗ 2 + 𝑛2 − 1 𝜎2∗ 2 1 1 ,
𝑥−𝑦 ± + 𝒰 𝛼 2 2
𝑛1 + 𝑛2 − 2 𝑛1 𝑛2 1− 2 𝑠𝑖 σ1 =σ2 𝑖𝑛𝑐𝑜𝑛𝑛𝑢𝑒,

𝜎1∗ 2 𝜎2∗ 2
𝑥−𝑦 ± + 𝒰1−𝛼 𝑠𝑖 σ12 ≠σ22 𝑠𝑜𝑛𝑡 𝑖𝑛𝑐𝑜𝑛𝑛𝑢𝑒𝑠.
𝑛1 𝑛2 2

Dans ce cas il est à supposer que 𝑛1 𝑒𝑡 𝑛2 sont assez grands, >30.


5. Estimation par I.C. de la variance

4.1. Estimation par IC de la variance d’une loi N(m, σ𝟐 )

On rappelle que l’estimation ponctuelle de σ𝟐 est donnée par:

𝑛
2 1
𝑇∗ = ෍(𝑥𝑖 −𝑚)2 𝑠𝑖 𝑚 𝑒𝑠𝑡 𝑐𝑜𝑛𝑛𝑢𝑒,
𝑛
𝑖=1
𝑛
2 1
𝜎∗ = ෍(𝑥𝑖 −𝑥)2 𝑠𝑖 𝑚 𝑒𝑠𝑡 𝑖𝑛𝑐𝑜𝑛𝑛𝑢𝑒.
𝑛−1
𝑖=1

2 𝑛 2
On rappelle aussi que la quasi variance de l’échantillon est 𝜎 ∗ = 𝑛−1 𝑆 ∗
2 1
où 𝑆 ∗ = 𝑛 σ𝑛𝑖=1(𝑥𝑖 −𝑥)2 est la variance de l’échantillon de taille 𝑛.
5. Estimation par I.C. de la variance

L’estimation par I.C. de σ𝟐 de la loi N(m, σ𝟐 ) est donnée par:

• Si m est connue, alors

2 2
𝑛𝑇 ∗ 𝑛𝑇 ∗
; 𝑠𝑖 𝑛 ≤ 100,
𝜒2 𝛼 𝜒2 𝛼
𝑛,1− 2 𝑛, 2
𝐼𝐶1−𝛼 σ 𝟐
= ∗2 2
2𝑛𝑇 2𝑛𝑇 ∗
2; 2 𝑠𝑖 𝑛 > 100.
2𝑛 − 1 + 𝑈1−𝛼 2𝑛 − 1 − 𝑈1−𝛼
2 2

• Si m est inconnue, alors

2 2
(𝑛 − 1)𝜎 ∗ (𝑛 − 1)𝜎 ∗
; 𝑠𝑖 𝑛 ≤ 100,
𝜒2 𝛼 𝜒2 𝛼
𝑛−1,1− 2 𝑛−1, 2
𝐼𝐶1−∝ 𝜎 2 = 2 2
2(𝑛 − 1)𝜎 ∗ 2(𝑛 − 1)𝜎 ∗
2; 2 𝑠𝑖 𝑛 > 100.
2 𝑛 − 1 − 1 + 𝑈1−𝛼 2 𝑛 − 1 − 1 − 𝑈1−𝛼
2 2
5. Estimation par I.C. de la variance

4.2. Applications
Exemple 1: Déterminer 𝐼𝐶0,90 σ𝟐 pour 𝑛 = 10 𝑒𝑡 𝑇 ∗ = 2.
Réponse: 𝑇 ∗ = 2 ⇒ 𝑚 𝑒𝑠𝑡 𝑐𝑜𝑛𝑛𝑢𝑒 𝑒𝑡 𝑛 = 10, alors
2 2
𝑛𝑇 ∗ 𝑛𝑇 ∗ 40 40 40 40
𝐼𝐶0,90 σ𝟐 = ; = ; 𝜒2 = ; = 2,184; 10,15 .
𝜒2 𝛼 𝜒2 𝛼 2
𝜒10,0,95 10,0,05 18,307 30940
𝑛,1− 𝑛,
2 2

Exemple 2: Déterminer l’intervalle de confiance à 95% de l’écart


type du poids pour les étudiants d’une université sachant que l’écart
type du poids de 16 étudiants choisis au hasard est 2,40 kg.

Réponse:
Les données: 𝑛 = 16 𝑒𝑡 𝑆𝑥 = 𝑆 ∗ = 2,40 𝑘𝑔 ⇒ 𝑚 est inconnue et donc:
2 2
(𝑛 − 1)𝜎 ∗ (𝑛 − 1)𝜎 ∗ 𝑛𝑆𝑥2 𝑛𝑆𝑥2
𝐼𝐶95% σ𝟐 = ; = 2 ; 2
𝜒2 𝛼 𝜒2 𝛼 𝜒15,0,975 𝜒15,0,025
𝑛−1,1− 2 𝑛−1, 2
16 × (2,4)2 16 × (2,4)2
= ; = 3,35; 14,72 .
27,488 6,262
Ce qui entraîne 𝐼𝐶95% 𝝈 = 3,35; 14,72 = 1,83; 3,84 .
𝜎22
6. Estimation par I.C. du rapport de N(𝑚1 , 𝜎12 ) et N(𝑚2 , 𝜎22 )
𝜎12

𝜎22
5.1. L’intervalle de confiance du rapport des lois normales
𝜎12

𝑇2∗ 2 𝑇2∗ 2
𝐹 𝛼;
∗ 2 𝑛1 ,𝑛2 , 2
𝐹 𝛼 𝑠𝑖 𝑚1 𝑒𝑡
∗ 2 𝑛1 ,𝑛2 ,1− 2
𝑚2 𝑠𝑜𝑛𝑡 𝑐𝑜𝑛𝑛𝑢𝑒𝑠,
𝜎22 𝑇1 𝑇1
𝐼𝐶1−𝛼 =
𝜎12 𝜎2∗ 2 𝜎2∗ 2
𝐹 𝛼; 𝐹 𝛼 𝑠𝑖 𝑚1 𝑒𝑡 𝑚2 𝑠𝑜𝑛𝑡 𝑖𝑛𝑐𝑜𝑛𝑛𝑢𝑒𝑠.
𝜎1∗ 2 𝑛1−1,𝑛2−1, 2 𝜎1∗ 2 𝑛1 −1,𝑛2−1,1− 2
𝜎22
6. Estimation par I.C. du rapport de N(𝑚1 , 𝜎12 ) et N(𝑚2 , 𝜎22 )
𝜎12

5.2.Application

Exemple: Donner une estimation par I.C. au niveau de confiance


𝜎12
0,98 du rapport des variances de lois normales sachant que
𝜎22
deux échantillons de tailles respectives 21 et 9 ont des variances
respectives 16 et 8.

Réponse: 𝑚1 𝑒𝑡 𝑚2 sont inconnues entraîne

2 2
𝜎12 𝜎1∗ 𝜎1∗
𝐼𝐶1−𝛼 2 = ∗ 2 𝐹𝑛2 −1,𝑛1 −1,𝛼 ; ∗ 2 𝐹𝑛2 −1,𝑛1 −1,1−𝛼 .
𝜎2 𝜎2 2 𝜎2 2
𝜎22
6. Estimation par I.C. du rapport de N(𝑚1 , 𝜎12 ) et N(𝑚2 , 𝜎22 )
𝜎12

𝑛
En utilisant 𝜎 ∗ 2 = 𝑛−1 𝑆 ∗ 2 on obtient

𝟐 𝟐
𝜎12 𝒏𝟐𝟏 (𝒏𝟐 − 𝟏)𝟐 𝑺∗𝟏 𝒏𝟐𝟏 (𝒏𝟐 − 𝟏)𝟐 𝑺𝟏∗
𝐼𝐶1−𝛼 = 𝟐 𝑭𝟖,𝟐𝟎,𝟎,𝟎𝟏 ; 𝟐 𝑭𝟖,𝟐𝟎,𝟎,𝟗𝟗
𝜎22 𝒏𝟐 (𝒏𝟏 − 𝟏)𝟐 𝑺∗𝟐 𝟐 𝒏𝟐 (𝒏𝟏 − 𝟏)𝟐 𝑺𝟐∗ 𝟐

𝟐
𝒏𝟐𝟏 (𝒏𝟐 −𝟏)𝟐 𝑺∗𝟏 𝟐𝟏×𝟖 𝟐 𝟏𝟔
Or 𝟐 = × = 𝟏, 𝟕𝟒𝟐, 𝑭𝟖,𝟐𝟎,𝟎,𝟗𝟗 = 𝟑, 𝟓𝟔
𝒏𝟐𝟐 (𝒏𝟏 −𝟏)𝟐 𝑺∗𝟐 𝟗×𝟐𝟎 𝟖

1 1
Et 𝑭𝟖,𝟐𝟎,𝟎,𝟎𝟏 = 𝑭 = 5,36 = 0,186,
𝟖,𝟐𝟎,𝟎,𝟗𝟗

Conclusion:
𝜎12
𝐼𝐶98% = 𝟎, 𝟑𝟐𝟒; 𝟔, 𝟐𝟏𝟎 .
𝜎22
7. Estimation par I.C. d’une proportion

On dispose d’une population dont on tire un échantillon de


taille 𝑛. Soit 𝑝 la proportion d’individus de la population ayant
une propriété prédéfinie et soit 𝑘 le nombre d’individus de
l’échantillon ayant la dite propriété. On rappelle que
k
l’estimation ponctuelle de 𝑝 est p∗ = n = f.
L’estimation par intervalle de confiance de la proportion 𝑝 est
donnée par
f 1−f f 1−f
𝐼𝐶1−𝛼 𝑝 = f − 𝒰1−α ; f + 𝒰1−α si 𝑛 ≥ 30.
n 2 n 2

Exemple: Donner une estimation ponctuelle et par I.C. au


niveau de confiance 95% du taux de mortalité d’une maladie
sachant que parmi 100 sujets atteints de cette maladie, 25
sont décédés.
7. Estimation par I.C. d’une proportion

Réponses:
Il s’agit de l’estimation de la proportion 𝑝 des décès par la maladie.

k 25
- Estimation ponctuelle de 𝑝: p∗ = n = 100 = 0,25.

- Estimation par IC:

𝑝 ∗ 1 − 𝑝∗ 𝑝 ∗ 1 − 𝑝∗
𝐼𝐶95% 𝑝 = 𝑝∗ − 𝒰1−α ; f + 𝒰1−α
n 2 n 2

0,25 × 0,75 0,25 × 0,75


= 0,25 − 𝒰0,975 ; 0,25 + 𝒰0,975 ;
100 100
= 0,25 − 0,043 × 1,96; 0,25 + 0,043 × 1,96
= 0,165; 0,335 .
8. Estimation de la différence 𝑝1 − 𝑝2
On considère deux échantillons de tailles respectives n1 et
n2 tirés de deux populations. 𝑝1 et 𝑝2 sont des proportions. On
se propose d’estimer la différence p1 − p2 .

- L’estimation ponctuelle de p1 − p2 est p1 − p2 ∗ =𝑝1∗ − 𝑝2∗

- L’estimation par I.C. de la différence p1 − p2 au risque 𝛼 est

𝑝1∗ (1 − 𝑝1∗ ) 𝑝2∗ (1 − 𝑝2∗ )


𝐼𝐶1−𝛼 p1 − p2 = 𝑝1∗ − 𝑝2∗ ± + . 𝒰1−α ,
n1 𝑛2 2

Avec n1 ≥ 30 et n2 ≥ 30.

Application: On étudie la résistance à la maladie dite, mosaïque,


des feuilles de tabac en fonction de leur position sur la tige. Parmi
96 feuilles basses, 72 ont résisté à la maladie et parmi 63 feuilles
hautes, 30 ont résisté à la maladie. Donner l’intervalle de
confiance au niveau 0,98 pour la différence des proportions des
feuilles qui résistent à la maladie.
8. Estimation de la différence 𝑝1 − 𝑝2

Réponse:
72 30
D’abord on a 𝑛1 = 96, 𝑛2 = 63, 𝑝1∗ = 96 = 0,750 et 𝑝2∗ = 63 = 0,476

- Estimation ponctuelle p1 − p2 ∗
= 0,750-0,476 =0,274.

- Estimation par intervalle de confiance de p1 − p2 au niveau 0,98

Comme 𝑛1 ≥ 30 𝑒𝑡 𝑛2 ≥ 30 on a
𝑝1∗ (1−𝑝1∗ ) 𝑝2∗ (1−𝑝2∗ )
𝐼𝐶98% p1 − p2 = 𝑝1∗ − 𝑝2∗ ± + . 𝒰1−α
n1 𝑛2 2

72 × 24 30 × 33
= 0,274 ± + . 2,3263
963 633
=[0,095; 0,453].

Vous aimerez peut-être aussi