Contenu du cours
• Sondages
• Mesures statistiques sur un échantillon
• Estimateurs
Mesures statistiques sur un échantillon
€
Paramètres de dispersion
• Variance empirique, d’un échantillon
• Avec x: les valeurs de la variable, m: la moyenne
de l’échantillon et n la taille de l’échantillon
v=
∑ ( x − m)
n
Peut-on estimer σ2 , la variance au niveau de la
population par v???
€
Paramètres de dispersion
2
• NON
v=
∑ ( x − m)
n
NB: L’estimateur v est biaisé
n −1 2 2
E(v) =
n
σ
€ s =
2 n
v=
∑ ( x − m )
n −1 n −1
€
€
Paramètres de dispersion
• Variance: on appelle s2 la variance d’une variable
quantitative calculée sur un échantillon, estimateur
de la variance σ2 inconnue dans la population.
Avec x: les valeurs de la variable, m: la moyenne
de l’échantillon et n la taille de l’échantillon
2
(∑ x)
2 ∑ ( x − m)
2
(∑ x ) − n
2
s = =
n −1 n −1
La variance s2 est l’estimateur de la variance σ2 inconnue
Paramètres de dispersion
• Ecart type: on appelle s l’écart type calculé sur les
valeurs de l’échantillon, σ étant l’écart type
inconnu dans la population.
2
s= s
L’écart type s est l’estimateur de l’écart type σ inconnu
€
Estimation d’un paramètre
• Définir les paramètres d’une population à partir
des paramètres observés sur un échantillon
POPULATION ECHANTILLON
inconnu observé
∑x i
m =€x = i=1
= 132,915µg /100ml
n
La variance σ2 est estimée par s2
n
€
∑ (x i − m) 2
s2 = i=1
= 900
n −1
€
Estimation d’une moyenne
Estimation d’une moyenne
• Fluctuation d’échantillonnage d’une moyenne
• Échantillon 1 -> m1
• Échantillon 2 -> m2
m1 m3 m2
Estimation d’une moyenne
Théorème central limite:
• La moyenne d’une variable quantitative calculée
sur un échantillon est une variable aléatoire
• Qui suit une loi normale (convergence vers une loi
normale)
• Cette loi normale est centrée sur la moyenne µ de
la population
Estimation: intervalle de pari
• On se pose le problème suivant. On s'apprête à
réaliser une série d'expériences, c'est-à-dire à
mesurer la variable X sur un échantillon de n
individus. Peut-on construire un intervalle [a, b]
tel que la probabilité pour que la moyenne
observée que l'on s'apprête à calculer appartienne
à cet intervalle ait une valeur donnée? Il s'agit
donc de construire un intervalle qui contienne
avec une probabilité fixée la valeur observée que
l'on va obtenir.
Estimation d’une moyenne
Résultat: intervalle de pari de la moyenne
• Si, dans une population, une v.a. X a une moyenne
µ et une variance σ2, la moyenne des n valeurs
d’un échantillon a une probabilité 1-α d’être
comprise entre
σ σ
µ− zα et µ+ zα
n n
Condition de validité: n ≥ 30
€ €
Estimation d’une moyenne
L’écart type de la moyenne m peut être estimé par:
s
sm =
n
Avec s: écart type des valeurs de l’échantillon
n: taille de l’échantillon
Applicable ssi la taille de l’échantillon est négligeable par
rapport à la taille de la population (10%).
€
ATTENTION: ne pas confondre s et sm
Intervalle de confiance d’une moyenne
m − z α sm < µ < m + z α sm
€
Intervalle de confiance d’une moyenne
• On cherche à déterminer µ
σ σ
m− zα < µ < m+ zα
n n
σ est inconnu. On le remplace par son estimation s.
€ s s
m− zα < µ < m+ zα
n n
Intervalle de confiance d’une moyenne
€
Machine A garantie par le constructeur comme faisant des
comprimés de poids moyen 0,80g avec un écart-type de 0,02g
Echantillon A prélevé 15 comprimés mA= 0,79 g
• n= 15 , µ = 0.80; σ =0.02
• Intervalle de pari de la moyenne du poids m
sur un échantillon vaut:
σ σ
µ −ε ;µ + ε
n n
ε = 1.96
0.789;0.811
€
Estimation d’un pourcentage
Estimation d’un pourcentage
• Etant donné une population où une proportion P des
individus possède un certain caractère. Il s’agit d’estimer P
à partir de p, proportion trouvée dans un échantillon de
taille n.
• On sait que np suit une loi binomiale B(n,P).
• Si n est petit on utilise les calculs de la loi binomiale
• Si n est grand,
(
np suit N nP; écart - type = nP(1- P) )
P(1- P)
p suit loi N P; ecart - type =
n
€
Estimation d’un pourcentage
P(1− P) et P(1− P)
P − zα P + zα
n n
Condition de validité: nP et n(1− P) ≥ 10
€ €
Estimation d’un pourcentage
p(1− p)
sp =
n