Chap ESTIMATION

Chapitre 4: Estimation.
Pr. El Mehdi LOUALID
École Nationale des Sciences Appliquées

Université Chouaib Doukkali
May 3, 2022
Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 1 / 27

Sommaire
1. Introduction
2. Estimation ponctuelle
3. Estimation par intervalle de confiance

Introduction
Objectif:
On s’interesse à l’estimation des principales caractéristiques (ou paramètres) d’un
caractère dans une population, à savoir la moyenne, la variance et la fréquence, à partir
des valeurs calculées sur les échantillons.
Question:
Quelle est l’estimation la plus bonne? Et bonne dans quel sense?
Méthodes d’estimation :
Estimation ponctuelle
Estimation par intervalle de confiance
Les paramètres à estimer seront notés les par:
m pour la moyenne de la population.
σ pour l’écart type de la population.
σ 2 pour la variance de la population.
p pour la proportion dans la population.

Estimation ponctuelle
Définition
Un estimateur T = f (X1 , . . . , Xn ) d’un paramètre θ est une statistique et sa réalisation
f (x1 , . . . , xn ) sera appelée estimation ponctuelle de θ.
Définition
On appelle erreur d’estimation la différence entre l’estimateur et le paramètre: Erreur = T − θ.
Cette Erreur peut être décomposer de la façon suivante :
fluctuation autour de la moyenne
z }| {
T −θ = T − E(T ) + E(T ) − θ
| {z }
Biais de l’estimateur

Estimation ponctuelle: Généralités sur les estimateurs
Définition
1. Un estimateur T de θ est dit sans biais si E(T ) = θ.
2. Un estimateur T de θ est dit biaisé ou avec biais si E(T ) 6= θ.
3. Si le biais E(T ) - θ est positif, ( E(T ) > θ ), alors l’estimateur surestime la valeur du
paramètre.
4. Si le biais E(T ) - θ est négatif, ( E(T ) < θ), alors l’estimateur sousestime la valeur du
paramètre.
Définition
Un estimateur T de θ est dit asymptotiquement sans biais si E(T ) → θ quand n → ∞.

Estimation ponctuelle: Généralités sur les estimateurs
Définition
Un estimateur T de θ est dit convergent si Var(T ) −→ 0 quand n → ∞.
Définition
1. Soit T et T 0 deux estimateurs sans biais de θ. On dit que T est plus efficace que T 0 si
Var(T ) ≤ Var (T 0 ).
2. L’estimateur sans biais et de variance minimale est appelé estimateur efficace.

Estimation ponctuelle: Estimation ponctuelle d’une moyenne
Théorème
1 Pk=n
La moyenne empirique X = n k=1 Xk est un estimateur sans biais et convergent de m
Preuve
1 Pk=n
1. On a E(X ) = n k=1 E(Xk ) = m
1 P k=n σ2
2. On a V(X ) = n2 k=1 V(Xk ) = n → 0 quand n → +∞

Estimation ponctuelle: Estimation ponctuelle d’une variance
Soit X une variable aléatoire de moyenne m et d’écart type σ. On veut estimer la variance de
X. On a deux cas:
1. La moyenne m de la population est connue.
2. La moyenne m de la population est inconnue.

1- Le 1er cas: La moyenne m de la population est connue
Théorème
Pn
La statistique T 2 = 1
n j=1 (Xi − m)2 est un estimateur sans biais de la variance σ 2 .
Preuve
On a
n
1 X
2
(Xi − m)2

E T = E
n
j=1
n
1 X
= E (Xi − m)2 , avec E (Xi ) = µ,
n
j=1
1
= × nσ 2 = σ 2 .
n
2- Le 2eme cas: La moyenne m de la population est inconnue

Théorème
1 Pn 2
La statistique Σ2 = n j=1 Xi − X̄ est un estimateur biaisé de la variance σ 2 .
Preuve
On a,
n
2
1X 2 n−1 2
E Σ = E Xi − X̄ = σ
n n
j=1

Proposition
La statistique ( la variance corrigée)
n
n 1 X 2
S2 = Σ2 = Xi − X̄
n−1 n−1
j=1
est un estimateur, de la variance σ 2 , sans biais et convergeant.
Preuve
On a,
n n n−1 2
E S2 = E Σ2 = σ = σ2.

×
n−1 n−1 n

Estimation ponctuelle: Estimation ponctuelle d’une proportion
Soit une population ayant des individus possédant une certaine caractéristique A. On veut
estimer à partir d’un échantillon de taille n la proportion d’individus possédant cette
caractéristique A.Soit F la v.a qui représente le nombre d’individus dans léchantillon possédant
la caractéristique A.
Donc F = Xn où X est le nombre de fois où le caractère apparaît dans le n-échantillon.

Estimation ponctuelle: Estimation ponctuelle d’une proportion
Proposition
X
La fréquence empirique F = n est un estimateur efficace de p.
Preuve
On a, X1 , X2 , . . . , Xn sont des variables de Bernoulli, alors
E (X1 ) + E (X2 ) + . . . + E (Xn ) p + p + ... + p n×p

E(F ) = = = = p.
n n n
En plus F est un estimateur convergeant, car
Var (X1 ) + Var (X2 ) + . . . + Var (Xn ) p(1 − p) + . . . + p(1 − p) p(1 − p)

Var(b
p) = 2
= 2
=
n n n
p ) −→ 0, quand n → +∞.
alors Var(b
Estimation par intervalle de confiance:
Introduction
L’estimation d’un paramètre inconnu par une seule valeur est quelque fois insuffisante, on
préfère souvent donner un intervalle de valeurs. On cherche des intervalles dit "intervalle de
confiance" qui contiennent
la moyenne µ inconnue
l’écart-type σ inconnu
le pourcentage p d’une certaine propriété que possède la population.

Estimation par intervalle de confiance
Définition
Soit X une v.a. dont la loi dépend d’un paramètre inconnu θ. On appelle intervalle de
confiance pour un niveau 1 − α (ou de seuil α ), un intervalle qui a la probabilité 1 − α de
contenir la vraie valeur de θ.
Autrement dit, [t1 , t2 ] est intervalle de confiance pour un niveau 1 − α du paramètre θ si
P {t1 < θ < t2 } = 1 − α
Remarque
α est appelé le seuil ou le risque, et 1 − α est le niveau de confiance.
Plus le niveau de confiance est élevé, plus la certitude est grande que la méthode
d’estimation produira une estimation contenant la vraie valeur de θ.
Les niveaux de confiance les plus utilisés sont 90%, 95% et 99%.

Intervalle de confiance pour une moyenne
Soit X une variable aléatoire et (X1 , . . . , Xn ) un échantillon de X . Nous avons vu que la

moyenne X̄ d’un échantillon aléatoire permet d’estimer la vraie moyenne de la population.
Nous voudrions estimer également la précision de cette moyenne, c’est-à-dire donner une marge
d’erreur ou un intervalle de confiance.
On peut distinguer deux cas:
1. la taille de l’échantillon est petite (n < 30) et X ∼ N (µ, σ):
l’écart type σ est connu
l’écart type σ est inconnu
2. la taille de I’échantillon est grande (n ≫ 30) et X de loi quelconque

Premier cas :
Lorsque la taille de l’échantillon est grande (n ≥ 30) et la variance de la population σ 2
connue, on obtient un intervalle de confiance pour m au seuil de confiance (1 − α) de la
forme:
σ σ
I(1−α)% = x̄ − zα √ ; x̄ + zα √
n n

avec P µ ∈ IC(1−α)% = (1 − α).
Φ (zα ) = 1 − α2 , où Φ est la fdr de la loi normale N (0, 1).
Ceci est aussi vrai pour de petits échantillons (n < 30) lorsque X suit une loi normale
N µ, σ 2 avec σ 2 connue.


Lorsque la taille de l’échantillon est grande (n ≥ 30) et la variance de la population σ 2 est

inconnue, on obtient un intervalle de confiance pour m au seuil de confiance (1 − α) de la
forme :
s s
IC(1−α) % = x̄ − zα √ ; x̄ + zα √
n n
s 2 est l’estimation de σ 2 .
Φ (zα ) = 1 − α2 , où Φ est la fonction de répartition de la loi normale N (0, 1).

Exercice
On a observé la taille de n = 200 hommes marocains adultes. Après calcul, on a obtenu une
moyenne de X̄ = 168. Si on suppose que la variance connue vaut σ 2 = 1. Donnez un intervalle
de confiance à 95% de la vraie moyenne de la population.
Réponse
h i
On a IC(1−α)% = x̄ − zα √σn ; x̄ + zα √σn
Puisque α = 0.05(5%), alors Φ (zα ) = 1 − α2 = 1 − 0.05
2 = 0.975.
Par suite zα = 1.96. Finalement IC95% = [167.86; 168.14], et
P(m ∈ [167.86; 168.14]) = 0.95.

Deuxième cas :
Lorsque la taille de l’échantillon est petite (n < 30) et X suit une loi normale de variance σ 2
inconnue, on obtient un intervalle de confiance pour m au seuil de confiance (1 − α) de la
forme:
s s
IC(1−α) % = x̄ − tα √ ; x̄ + tα √
n n
où tα se déduit de la table Student comme suit: P (T > tα ) = α2 .

Exercice
On veut étudier le coût du logement près du campus universitaire. Un échantillon de 10
appartements a permis d’estimer le coût moyen du loyer mensuel à 350 par mois et un écart
type de 30 . Quel est l’intervalle de confiance de 95% pour la moyenne des loyers mensuels ?
Supposons que les loyers suivent une loi normale.
Réponse
pour un coefficient de confiance de 0,95, on a
α
α = 0, 05, et 2 = 0, 025.
n − 1 = 10 − 1 = 9 degrés de liberté, alors la table de la distribution Student nous donne
tα = 2, 262.
Finalement IC95% = [328.54; 371.46].
i.e., nous sommes confiants à 95% que la moyenne des loyers mensuels (le vrai paramètre de la
population m ), se trouve entre 328.54 et 371.46
Intervalle de confiance pour une proportion p de la population :
Lorsque n est grand (n ≥ 30) et si p̄ est la proportion échantillonnale, alors un intervalle de

confiance pour la proportion p inconnue de la population au seuil de confiance (1 − α) de la
forme : " r r #
p̄(1 − p̄) p̄(1 − p̄)
IC(1−α)% = p̄ − zα ; p̄ + zα
n n
α
avec Φ (zα ) = 1 − 2 pour la loi normale N (0, 1).

Intervalle de confiance pour une proportion p de la population :
Exercice
SPI est une compagnie qui se spécialise dans les sondages politiques. À l’aide de sondages
téléphoniques, les interviewers demandent aux citoyens pour qui ils voteraient si les élections
avaient lieu aujourd’hui. Récemment, SPI a trouvé que 220 votants sur 500 voterait pour un
candidat particulier. SPI veut estimer l’intervalle de confiance à 95% pour la proportion des
votants qui sont en faveur de ce candidat.
Réponse
On a n = 500, p̄ = 220/500 = 0.44 et zα = 1.96 donc
IC95% = [0.3965; 0.4835],
i.e., SPI est confiant à 95% que la proportion des votants qui favoriseront ce candidat est entre
0.3965 et 0.4835.
Intervalle de confiance de la variance σ 2 de la population:
(n−1)S 2
Soit n la taille de l’échantillon et S 2 la variance échantillonnale.Ici, Y 2 = σ2
suit la loi de
loi Khi-deux à n − 1 ddl.
On cherche les deux nombres a et b tels que:
α α
P Y 2 ≥ a = et P Y 2 ≥ b = 1 −

2 2
L’intervalle de confiance au seuil (1 − α) pour la variance inconnue σ 2 de la population est de
la forme :
(n − 1)s 2 (n − 1)s 2

IC(1−α)% = ;
a b

Intervalle de confiance de la variance σ 2 de la population:
Exemple
Pour n = 31 et s 2 = 100, on a : ddl = 31 − 1 = 30.
α
Pour α = 0.05, on a : 2 = 0.025 et donc a = 46.98.
α
Pour α = 0.05, on a : 1 − 2 = 0.975 et donc b = 16.80.
Finalement
IC95% = [0.3965; 0.4835].

La taille de l’échantillon
Détermination de la taille de l’échantillon :

Motivation :
Quelle est la taille n de l’échantillon qui permettrait d’affirmer que, en utilisant un estimateur
ponctuel, l’erreur commise pour un coefficient de confiance (1 − α) serait moindre que la marge
d’erreur E ?

La taille de l’échantillon
Exemple
Pour la moyenne inconnue m de la population, on a trouvé :

σ σ
IC(1−α)% = x̄ − zα √ ; x̄ + zα √ .
n n
Si on fixe une marge d’erreur: E = zα √σn pour un coefficient de confiance (1 − α), alors la
taille de I’échantillon sera : h z · σ i2
α
n= .
E
Pour E = 500, σ = 5000 et α = 5%, on trouve zα = 1.96 et n = 384.
On a besoin d’un échantillon de taille n = 384 pour arriver à une précision de ±500 à un seuil
de confiance de 95%.

Chap ESTIMATION

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Chap ESTIMATION

Transféré par

Droits d'auteur :

Formats disponibles

Chapitre 4: Estimation.

Pr. El Mehdi LOUALID

École Nationale des Sciences Appliquées

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 1 / 27

3. Estimation par intervalle de confiance

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 2 / 27

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 3 / 27

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 4 / 27

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 5 / 27

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 6 / 27

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 7 / 27

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 8 / 27

2- Le 2eme cas: La moyenne m de la population est inconnue

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 10 / 27

est un estimateur, de la variance σ 2 , sans biais et convergeant.

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 11 / 27

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 12 / 27

E (X1 ) + E (X2 ) + . . . + E (Xn ) p + p + ... + p n×p

En plus F est un estimateur convergeant, car

Var (X1 ) + Var (X2 ) + . . . + Var (Xn ) p(1 − p) + . . . + p(1 − p) p(1 − p)

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 14 / 27

P {t1 < θ < t2 } = 1 − α

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 15 / 27

Soit X une variable aléatoire et (X1 , . . . , Xn ) un échantillon de X . Nous avons vu que la

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 16 / 27

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 17 / 27

Lorsque la taille de l’échantillon est grande (n ≥ 30) et la variance de la population σ 2 est

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 18 / 27

P(m ∈ [167.86; 168.14]) = 0.95.

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 19 / 27

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 20 / 27

Lorsque n est grand (n ≥ 30) et si p̄ est la proportion échantillonnale, alors un intervalle de

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 22 / 27

IC95% = [0.3965; 0.4835],

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 24 / 27

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 25 / 27

Détermination de la taille de l’échantillon :

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 26 / 27

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 27 / 27

Vous aimerez peut-être aussi