Vous êtes sur la page 1sur 27

Chapitre 4: Estimation.

Pr. El Mehdi LOUALID

École Nationale des Sciences Appliquées


Université Chouaib Doukkali

May 3, 2022

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 1 / 27


Sommaire

1. Introduction

2. Estimation ponctuelle

3. Estimation par intervalle de confiance

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 2 / 27


Introduction

Objectif:
On s’interesse à l’estimation des principales caractéristiques (ou paramètres) d’un
caractère dans une population, à savoir la moyenne, la variance et la fréquence, à partir
des valeurs calculées sur les échantillons.
Question:
Quelle est l’estimation la plus bonne? Et bonne dans quel sense?
Méthodes d’estimation :
Estimation ponctuelle
Estimation par intervalle de confiance
Les paramètres à estimer seront notés les par:
m pour la moyenne de la population.
σ pour l’écart type de la population.
σ 2 pour la variance de la population.
p pour la proportion dans la population.

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 3 / 27


Estimation ponctuelle

Définition
Un estimateur T = f (X1 , . . . , Xn ) d’un paramètre θ est une statistique et sa réalisation
f (x1 , . . . , xn ) sera appelée estimation ponctuelle de θ.

Définition
On appelle erreur d’estimation la différence entre l’estimateur et le paramètre: Erreur = T − θ.
Cette Erreur peut être décomposer de la façon suivante :
fluctuation autour de la moyenne
z }| {
T −θ = T − E(T ) + E(T ) − θ
| {z }
Biais de l’estimateur

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 4 / 27


Estimation ponctuelle: Généralités sur les estimateurs

Définition
1. Un estimateur T de θ est dit sans biais si E(T ) = θ.
2. Un estimateur T de θ est dit biaisé ou avec biais si E(T ) 6= θ.
3. Si le biais E(T ) - θ est positif, ( E(T ) > θ ), alors l’estimateur surestime la valeur du
paramètre.
4. Si le biais E(T ) - θ est négatif, ( E(T ) < θ), alors l’estimateur sousestime la valeur du
paramètre.

Définition
Un estimateur T de θ est dit asymptotiquement sans biais si E(T ) → θ quand n → ∞.

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 5 / 27


Estimation ponctuelle: Généralités sur les estimateurs

Définition
Un estimateur T de θ est dit convergent si Var(T ) −→ 0 quand n → ∞.

Définition
1. Soit T et T 0 deux estimateurs sans biais de θ. On dit que T est plus efficace que T 0 si
Var(T ) ≤ Var (T 0 ).
2. L’estimateur sans biais et de variance minimale est appelé estimateur efficace.

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 6 / 27


Estimation ponctuelle: Estimation ponctuelle d’une moyenne

Théorème
1 Pk=n
La moyenne empirique X = n k=1 Xk est un estimateur sans biais et convergent de m

Preuve
1 Pk=n
1. On a E(X ) = n k=1 E(Xk ) = m
1 P k=n σ2
2. On a V(X ) = n2 k=1 V(Xk ) = n → 0 quand n → +∞

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 7 / 27


Estimation ponctuelle: Estimation ponctuelle d’une variance

Soit X une variable aléatoire de moyenne m et d’écart type σ. On veut estimer la variance de
X. On a deux cas:
1. La moyenne m de la population est connue.
2. La moyenne m de la population est inconnue.

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 8 / 27


Estimation ponctuelle: Estimation ponctuelle d’une variance
1- Le 1er cas: La moyenne m de la population est connue
Théorème
Pn
La statistique T 2 = 1
n j=1 (Xi − m)2 est un estimateur sans biais de la variance σ 2 .

Preuve
On a
n
1 X
2
(Xi − m)2

E T = E
n
j=1
n
1 X
= E (Xi − m)2 , avec E (Xi ) = µ,
n
j=1
1
= × nσ 2 = σ 2 .
n
Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 9 / 27
Estimation ponctuelle: Estimation ponctuelle d’une variance

2- Le 2eme cas: La moyenne m de la population est inconnue


Théorème
1 Pn 2
La statistique Σ2 = n j=1 Xi − X̄ est un estimateur biaisé de la variance σ 2 .

Preuve
On a,
n
2
 1X 2 n−1 2
E Σ = E Xi − X̄ = σ
n n
j=1

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 10 / 27


Estimation ponctuelle: Estimation ponctuelle d’une variance

Proposition
La statistique ( la variance corrigée)
n
n 1 X 2
S2 = Σ2 = Xi − X̄
n−1 n−1
j=1

est un estimateur, de la variance σ 2 , sans biais et convergeant.

Preuve
On a,
n n n−1 2
E S2 = E Σ2 = σ = σ2.
 
×
n−1 n−1 n

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 11 / 27


Estimation ponctuelle: Estimation ponctuelle d’une proportion

Soit une population ayant des individus possédant une certaine caractéristique A. On veut
estimer à partir d’un échantillon de taille n la proportion d’individus possédant cette
caractéristique A.Soit F la v.a qui représente le nombre d’individus dans léchantillon possédant
la caractéristique A.
Donc F = Xn où X est le nombre de fois où le caractère apparaît dans le n-échantillon.

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 12 / 27


Estimation ponctuelle: Estimation ponctuelle d’une proportion
Proposition
X
La fréquence empirique F = n est un estimateur efficace de p.

Preuve
On a, X1 , X2 , . . . , Xn sont des variables de Bernoulli, alors

E (X1 ) + E (X2 ) + . . . + E (Xn ) p + p + ... + p n×p


E(F ) = = = = p.
n n n

En plus F est un estimateur convergeant, car

Var (X1 ) + Var (X2 ) + . . . + Var (Xn ) p(1 − p) + . . . + p(1 − p) p(1 − p)


Var(b
p) = 2
= 2
=
n n n
p ) −→ 0, quand n → +∞.
alors Var(b
Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 13 / 27
Estimation par intervalle de confiance:

Introduction
L’estimation d’un paramètre inconnu par une seule valeur est quelque fois insuffisante, on
préfère souvent donner un intervalle de valeurs. On cherche des intervalles dit "intervalle de
confiance" qui contiennent
la moyenne µ inconnue
l’écart-type σ inconnu
le pourcentage p d’une certaine propriété que possède la population.

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 14 / 27


Estimation par intervalle de confiance

Définition
Soit X une v.a. dont la loi dépend d’un paramètre inconnu θ. On appelle intervalle de
confiance pour un niveau 1 − α (ou de seuil α ), un intervalle qui a la probabilité 1 − α de
contenir la vraie valeur de θ.
Autrement dit, [t1 , t2 ] est intervalle de confiance pour un niveau 1 − α du paramètre θ si

P {t1 < θ < t2 } = 1 − α

Remarque
α est appelé le seuil ou le risque, et 1 − α est le niveau de confiance.
Plus le niveau de confiance est élevé, plus la certitude est grande que la méthode
d’estimation produira une estimation contenant la vraie valeur de θ.
Les niveaux de confiance les plus utilisés sont 90%, 95% et 99%.

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 15 / 27


Intervalle de confiance pour une moyenne

Soit X une variable aléatoire et (X1 , . . . , Xn ) un échantillon de X . Nous avons vu que la


moyenne X̄ d’un échantillon aléatoire permet d’estimer la vraie moyenne de la population.
Nous voudrions estimer également la précision de cette moyenne, c’est-à-dire donner une marge
d’erreur ou un intervalle de confiance.
On peut distinguer deux cas:
1. la taille de l’échantillon est petite (n < 30) et X ∼ N (µ, σ):
l’écart type σ est connu
l’écart type σ est inconnu
2. la taille de I’échantillon est grande (n ≫ 30) et X de loi quelconque

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 16 / 27


Intervalle de confiance pour une moyenne

Premier cas :
Lorsque la taille de l’échantillon est grande (n ≥ 30) et la variance de la population σ 2
connue, on obtient un intervalle de confiance pour m au seuil de confiance (1 − α) de la
forme:  
σ σ
I(1−α)% = x̄ − zα √ ; x̄ + zα √
n n

avec P µ ∈ IC(1−α)% = (1 − α).
Φ (zα ) = 1 − α2 , où Φ est la fdr de la loi normale N (0, 1).
Ceci est aussi vrai pour de petits échantillons (n < 30) lorsque X suit une loi normale
N µ, σ 2 avec σ 2 connue.


Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 17 / 27


Intervalle de confiance pour une moyenne

Lorsque la taille de l’échantillon est grande (n ≥ 30) et la variance de la population σ 2 est


inconnue, on obtient un intervalle de confiance pour m au seuil de confiance (1 − α) de la
forme :  
s s
IC(1−α) % = x̄ − zα √ ; x̄ + zα √
n n

s 2 est l’estimation de σ 2 .
Φ (zα ) = 1 − α2 , où Φ est la fonction de répartition de la loi normale N (0, 1).

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 18 / 27


Intervalle de confiance pour une moyenne

Exercice
On a observé la taille de n = 200 hommes marocains adultes. Après calcul, on a obtenu une
moyenne de X̄ = 168. Si on suppose que la variance connue vaut σ 2 = 1. Donnez un intervalle
de confiance à 95% de la vraie moyenne de la population.

Réponse
h i
On a IC(1−α)% = x̄ − zα √σn ; x̄ + zα √σn
Puisque α = 0.05(5%), alors Φ (zα ) = 1 − α2 = 1 − 0.05
2 = 0.975.
Par suite zα = 1.96. Finalement IC95% = [167.86; 168.14], et

P(m ∈ [167.86; 168.14]) = 0.95.

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 19 / 27


Intervalle de confiance pour une moyenne

Deuxième cas :
Lorsque la taille de l’échantillon est petite (n < 30) et X suit une loi normale de variance σ 2
inconnue, on obtient un intervalle de confiance pour m au seuil de confiance (1 − α) de la
forme:  
s s
IC(1−α) % = x̄ − tα √ ; x̄ + tα √
n n
où tα se déduit de la table Student comme suit: P (T > tα ) = α2 .

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 20 / 27


Intervalle de confiance pour une moyenne
Exercice
On veut étudier le coût du logement près du campus universitaire. Un échantillon de 10
appartements a permis d’estimer le coût moyen du loyer mensuel à 350 par mois et un écart
type de 30 . Quel est l’intervalle de confiance de 95% pour la moyenne des loyers mensuels ?
Supposons que les loyers suivent une loi normale.

Réponse
pour un coefficient de confiance de 0,95, on a
α
α = 0, 05, et 2 = 0, 025.
n − 1 = 10 − 1 = 9 degrés de liberté, alors la table de la distribution Student nous donne
tα = 2, 262.
Finalement IC95% = [328.54; 371.46].
i.e., nous sommes confiants à 95% que la moyenne des loyers mensuels (le vrai paramètre de la
population m ), se trouve entre 328.54 et 371.46
Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 21 / 27
Intervalle de confiance pour une proportion p de la population :

Lorsque n est grand (n ≥ 30) et si p̄ est la proportion échantillonnale, alors un intervalle de


confiance pour la proportion p inconnue de la population au seuil de confiance (1 − α) de la
forme : " r r #
p̄(1 − p̄) p̄(1 − p̄)
IC(1−α)% = p̄ − zα ; p̄ + zα
n n
α
avec Φ (zα ) = 1 − 2 pour la loi normale N (0, 1).

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 22 / 27


Intervalle de confiance pour une proportion p de la population :

Exercice
SPI est une compagnie qui se spécialise dans les sondages politiques. À l’aide de sondages
téléphoniques, les interviewers demandent aux citoyens pour qui ils voteraient si les élections
avaient lieu aujourd’hui. Récemment, SPI a trouvé que 220 votants sur 500 voterait pour un
candidat particulier. SPI veut estimer l’intervalle de confiance à 95% pour la proportion des
votants qui sont en faveur de ce candidat.

Réponse
On a n = 500, p̄ = 220/500 = 0.44 et zα = 1.96 donc

IC95% = [0.3965; 0.4835],

i.e., SPI est confiant à 95% que la proportion des votants qui favoriseront ce candidat est entre
0.3965 et 0.4835.
Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 23 / 27
Intervalle de confiance de la variance σ 2 de la population:

(n−1)S 2
Soit n la taille de l’échantillon et S 2 la variance échantillonnale.Ici, Y 2 = σ2
suit la loi de
loi Khi-deux à n − 1 ddl.
On cherche les deux nombres a et b tels que:
 α α
P Y 2 ≥ a = et P Y 2 ≥ b = 1 −

2 2
L’intervalle de confiance au seuil (1 − α) pour la variance inconnue σ 2 de la population est de
la forme :
(n − 1)s 2 (n − 1)s 2
 
IC(1−α)% = ;
a b

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 24 / 27


Intervalle de confiance de la variance σ 2 de la population:

Exemple
Pour n = 31 et s 2 = 100, on a : ddl = 31 − 1 = 30.
α
Pour α = 0.05, on a : 2 = 0.025 et donc a = 46.98.
α
Pour α = 0.05, on a : 1 − 2 = 0.975 et donc b = 16.80.
Finalement
IC95% = [0.3965; 0.4835].

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 25 / 27


La taille de l’échantillon

Détermination de la taille de l’échantillon :


Motivation :
Quelle est la taille n de l’échantillon qui permettrait d’affirmer que, en utilisant un estimateur
ponctuel, l’erreur commise pour un coefficient de confiance (1 − α) serait moindre que la marge
d’erreur E ?

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 26 / 27


La taille de l’échantillon

Exemple
Pour la moyenne inconnue m de la population, on a trouvé :
 
σ σ
IC(1−α)% = x̄ − zα √ ; x̄ + zα √ .
n n

Si on fixe une marge d’erreur: E = zα √σn pour un coefficient de confiance (1 − α), alors la
taille de I’échantillon sera : h z · σ i2
α
n= .
E
Pour E = 500, σ = 5000 et α = 5%, on trouve zα = 1.96 et n = 384.
On a besoin d’un échantillon de taille n = 384 pour arriver à une précision de ±500 à un seuil
de confiance de 95%.

Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 27 / 27

Vous aimerez peut-être aussi