Académique Documents
Professionnel Documents
Culture Documents
May 3, 2022
1. Introduction
2. Estimation ponctuelle
Objectif:
On s’interesse à l’estimation des principales caractéristiques (ou paramètres) d’un
caractère dans une population, à savoir la moyenne, la variance et la fréquence, à partir
des valeurs calculées sur les échantillons.
Question:
Quelle est l’estimation la plus bonne? Et bonne dans quel sense?
Méthodes d’estimation :
Estimation ponctuelle
Estimation par intervalle de confiance
Les paramètres à estimer seront notés les par:
m pour la moyenne de la population.
σ pour l’écart type de la population.
σ 2 pour la variance de la population.
p pour la proportion dans la population.
Définition
Un estimateur T = f (X1 , . . . , Xn ) d’un paramètre θ est une statistique et sa réalisation
f (x1 , . . . , xn ) sera appelée estimation ponctuelle de θ.
Définition
On appelle erreur d’estimation la différence entre l’estimateur et le paramètre: Erreur = T − θ.
Cette Erreur peut être décomposer de la façon suivante :
fluctuation autour de la moyenne
z }| {
T −θ = T − E(T ) + E(T ) − θ
| {z }
Biais de l’estimateur
Définition
1. Un estimateur T de θ est dit sans biais si E(T ) = θ.
2. Un estimateur T de θ est dit biaisé ou avec biais si E(T ) 6= θ.
3. Si le biais E(T ) - θ est positif, ( E(T ) > θ ), alors l’estimateur surestime la valeur du
paramètre.
4. Si le biais E(T ) - θ est négatif, ( E(T ) < θ), alors l’estimateur sousestime la valeur du
paramètre.
Définition
Un estimateur T de θ est dit asymptotiquement sans biais si E(T ) → θ quand n → ∞.
Définition
Un estimateur T de θ est dit convergent si Var(T ) −→ 0 quand n → ∞.
Définition
1. Soit T et T 0 deux estimateurs sans biais de θ. On dit que T est plus efficace que T 0 si
Var(T ) ≤ Var (T 0 ).
2. L’estimateur sans biais et de variance minimale est appelé estimateur efficace.
Théorème
1 Pk=n
La moyenne empirique X = n k=1 Xk est un estimateur sans biais et convergent de m
Preuve
1 Pk=n
1. On a E(X ) = n k=1 E(Xk ) = m
1 P k=n σ2
2. On a V(X ) = n2 k=1 V(Xk ) = n → 0 quand n → +∞
Soit X une variable aléatoire de moyenne m et d’écart type σ. On veut estimer la variance de
X. On a deux cas:
1. La moyenne m de la population est connue.
2. La moyenne m de la population est inconnue.
Preuve
On a
n
1 X
2
(Xi − m)2
E T = E
n
j=1
n
1 X
= E (Xi − m)2 , avec E (Xi ) = µ,
n
j=1
1
= × nσ 2 = σ 2 .
n
Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 9 / 27
Estimation ponctuelle: Estimation ponctuelle d’une variance
Preuve
On a,
n
2
1X 2 n−1 2
E Σ = E Xi − X̄ = σ
n n
j=1
Proposition
La statistique ( la variance corrigée)
n
n 1 X 2
S2 = Σ2 = Xi − X̄
n−1 n−1
j=1
Preuve
On a,
n n n−1 2
E S2 = E Σ2 = σ = σ2.
×
n−1 n−1 n
Soit une population ayant des individus possédant une certaine caractéristique A. On veut
estimer à partir d’un échantillon de taille n la proportion d’individus possédant cette
caractéristique A.Soit F la v.a qui représente le nombre d’individus dans léchantillon possédant
la caractéristique A.
Donc F = Xn où X est le nombre de fois où le caractère apparaît dans le n-échantillon.
Preuve
On a, X1 , X2 , . . . , Xn sont des variables de Bernoulli, alors
Introduction
L’estimation d’un paramètre inconnu par une seule valeur est quelque fois insuffisante, on
préfère souvent donner un intervalle de valeurs. On cherche des intervalles dit "intervalle de
confiance" qui contiennent
la moyenne µ inconnue
l’écart-type σ inconnu
le pourcentage p d’une certaine propriété que possède la population.
Définition
Soit X une v.a. dont la loi dépend d’un paramètre inconnu θ. On appelle intervalle de
confiance pour un niveau 1 − α (ou de seuil α ), un intervalle qui a la probabilité 1 − α de
contenir la vraie valeur de θ.
Autrement dit, [t1 , t2 ] est intervalle de confiance pour un niveau 1 − α du paramètre θ si
Remarque
α est appelé le seuil ou le risque, et 1 − α est le niveau de confiance.
Plus le niveau de confiance est élevé, plus la certitude est grande que la méthode
d’estimation produira une estimation contenant la vraie valeur de θ.
Les niveaux de confiance les plus utilisés sont 90%, 95% et 99%.
Premier cas :
Lorsque la taille de l’échantillon est grande (n ≥ 30) et la variance de la population σ 2
connue, on obtient un intervalle de confiance pour m au seuil de confiance (1 − α) de la
forme:
σ σ
I(1−α)% = x̄ − zα √ ; x̄ + zα √
n n
avec P µ ∈ IC(1−α)% = (1 − α).
Φ (zα ) = 1 − α2 , où Φ est la fdr de la loi normale N (0, 1).
Ceci est aussi vrai pour de petits échantillons (n < 30) lorsque X suit une loi normale
N µ, σ 2 avec σ 2 connue.
s 2 est l’estimation de σ 2 .
Φ (zα ) = 1 − α2 , où Φ est la fonction de répartition de la loi normale N (0, 1).
Exercice
On a observé la taille de n = 200 hommes marocains adultes. Après calcul, on a obtenu une
moyenne de X̄ = 168. Si on suppose que la variance connue vaut σ 2 = 1. Donnez un intervalle
de confiance à 95% de la vraie moyenne de la population.
Réponse
h i
On a IC(1−α)% = x̄ − zα √σn ; x̄ + zα √σn
Puisque α = 0.05(5%), alors Φ (zα ) = 1 − α2 = 1 − 0.05
2 = 0.975.
Par suite zα = 1.96. Finalement IC95% = [167.86; 168.14], et
Deuxième cas :
Lorsque la taille de l’échantillon est petite (n < 30) et X suit une loi normale de variance σ 2
inconnue, on obtient un intervalle de confiance pour m au seuil de confiance (1 − α) de la
forme:
s s
IC(1−α) % = x̄ − tα √ ; x̄ + tα √
n n
où tα se déduit de la table Student comme suit: P (T > tα ) = α2 .
Réponse
pour un coefficient de confiance de 0,95, on a
α
α = 0, 05, et 2 = 0, 025.
n − 1 = 10 − 1 = 9 degrés de liberté, alors la table de la distribution Student nous donne
tα = 2, 262.
Finalement IC95% = [328.54; 371.46].
i.e., nous sommes confiants à 95% que la moyenne des loyers mensuels (le vrai paramètre de la
population m ), se trouve entre 328.54 et 371.46
Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 21 / 27
Intervalle de confiance pour une proportion p de la population :
Exercice
SPI est une compagnie qui se spécialise dans les sondages politiques. À l’aide de sondages
téléphoniques, les interviewers demandent aux citoyens pour qui ils voteraient si les élections
avaient lieu aujourd’hui. Récemment, SPI a trouvé que 220 votants sur 500 voterait pour un
candidat particulier. SPI veut estimer l’intervalle de confiance à 95% pour la proportion des
votants qui sont en faveur de ce candidat.
Réponse
On a n = 500, p̄ = 220/500 = 0.44 et zα = 1.96 donc
i.e., SPI est confiant à 95% que la proportion des votants qui favoriseront ce candidat est entre
0.3965 et 0.4835.
Pr. EL MEHDI LOUALID (ENSAJ) Estimation May 3, 2022 23 / 27
Intervalle de confiance de la variance σ 2 de la population:
(n−1)S 2
Soit n la taille de l’échantillon et S 2 la variance échantillonnale.Ici, Y 2 = σ2
suit la loi de
loi Khi-deux à n − 1 ddl.
On cherche les deux nombres a et b tels que:
α α
P Y 2 ≥ a = et P Y 2 ≥ b = 1 −
2 2
L’intervalle de confiance au seuil (1 − α) pour la variance inconnue σ 2 de la population est de
la forme :
(n − 1)s 2 (n − 1)s 2
IC(1−α)% = ;
a b
Exemple
Pour n = 31 et s 2 = 100, on a : ddl = 31 − 1 = 30.
α
Pour α = 0.05, on a : 2 = 0.025 et donc a = 46.98.
α
Pour α = 0.05, on a : 1 − 2 = 0.975 et donc b = 16.80.
Finalement
IC95% = [0.3965; 0.4835].
Exemple
Pour la moyenne inconnue m de la population, on a trouvé :
σ σ
IC(1−α)% = x̄ − zα √ ; x̄ + zα √ .
n n
Si on fixe une marge d’erreur: E = zα √σn pour un coefficient de confiance (1 − α), alors la
taille de I’échantillon sera : h z · σ i2
α
n= .
E
Pour E = 500, σ = 5000 et α = 5%, on trouve zα = 1.96 et n = 384.
On a besoin d’un échantillon de taille n = 384 pour arriver à une précision de ±500 à un seuil
de confiance de 95%.