Vous êtes sur la page 1sur 44

Statistique II

1e année bachelor, 2010-11

Chapitre 2 : L’ESTIMATION

3.1 Intervalle de confiance :  connu


3.2 Intervalle de confiance :  inconnu
3.3 Taille d’échantillon minimale
3.4 Les estimateurs

Chapitre 2
L’estimation 1 / 44
Statistique II
1e année bachelor, 2010-11

Chapitre 2 : L’ESTIMATION

3.1 Intervalle de confiance :  connu


3.2 Intervalle de confiance :  inconnu
3.3 Taille d’échantillon minimale
3.4 Les estimateurs

Chapitre 2
L’estimation 2 / 44
Statistique II
1e année bachelor, 2010-11

Bases (1)
 Les statistiques d’échantillon sont de estimateurs ponctuels des
paramètres de la population.
 Nous allons nous concentrer sur deux statistiques :
o la moyenne d’échantillon x comme estimateur de la moyenne
de la population 
o la proportion d’échantillon p comme estimateur de la
proportion de la population p
 Malgré qu’il s’agisse d’estimateurs non-biaisés, on ne peut
s’attendre à ce qu’une estimation ponctuelle particulière soit
exactement égale à la valeur du paramètre de la population
correspondante.
   x  marge d’erreur
 p  p  marge d’erreur

Chapitre 2
L’estimation 3 / 44
Statistique II
1e année bachelor, 2010-11

Bases (2)

 Le calcul de la marge d’erreur est basé sur la distribution


d’échantillonnage de la statistique d’échantillon.
 L’aspect pertinent de la distribution d’échantillonnage est l’écart
type de la population .
 Normalement,  n’est pas connu.
 Toutefois, nous commençons par supposer que  est connu.
 Ceci peut être le cas p.ex. dans des applications de contrôle de
qualité lorsque le processus de production est supposé
fonctionner correctement, ainsi qu’on connaît l’écart type
« normal ».

Chapitre 2
L’estimation 4 / 44
Statistique II
1e année bachelor, 2010-11

La moyenne (1)
 Nous avons vu que la distribution d’échantillonnage de x suit
une loi normale avec une moyenne de  et un écart type
(appelé « erreur type » dans ce contexte) de  x   n (si
n N  0.05 ).
 Par conséquent, la variable Z   x    n  suit une loi normale
centrée réduite.
 Les tables de probabilité de la loi normale centrée réduite
montrent que 95% des valeurs d’une telle variable sont contenues
dans l’intervalle [1.96, 1.96], car z10.05 2  z0.975  1.96 .
 Donc 95% des valeurs de x se situent dans l’intervalle
[ 1.96 x ,   1.96 x ]
 On dit que cet intervalle est établi à un seuil de confiance de
95%, ou que c’est un intervalle de confiance à 95%.
Chapitre 2
L’estimation 5 / 44
Statistique II
1e année bachelor, 2010-11

La moyenne (2)
 Le seuil de confiance de 95% est la valeur la plus courante,
mais des seuils de 90% et de 99% sont aussi fréquemment
utilisés.
o 90% : z0.95  1.645  intervalle [ 1.645 x ,   1.645 x ]
o 99% : z0.995  2.576  intervalle [ 2.576 x ,   2.576 x ]
 Si le seuil de confiance est écrit comme (1  ), ainsi que les
aires de probabilité dans les tables de la distribution normale
centrée réduite (version des tables statistiques sur le site web du
cours ;  Table 1 du manuel de Anderson et al. !) sont données
par 1  ( 2) , alors l’intervalle de confiance peut aussi être défini

comme : x  z1 2  
n .
 On appelle  le « seuil de signification » (pour une raison qui
deviendra claire lorsqu’on présentera les tests d’hypothèses).
Chapitre 2
L’estimation 6 / 44
Statistique II
1e année bachelor, 2010-11

La moyenne (3)

 Excel : =LOI.NORMALE.STANDARD.INVERSE (1α2) donne


la valeur z12 de la distribution normale centrée réduite.

 Si la population suit une loi normale, l’intervalle de confiance


est exact. Autrement, il est approximatif et dépend de la
distribution de la population ainsi que de la taille de l’échantillon
(via le théorème centrale limite). En pratique, un échantillon de
taille 30 est habituellement considéré suffisant.

Chapitre 2
L’estimation 7 / 44
Statistique II
1e année bachelor, 2010-11

La moyenne : tableau récapitulatif


 Valeurs de z1 2 pour les seuils de confiance les plus
fréquemment utilisés

seuil de confiance   2 zz1-22


90% 0.1 0.05 1.645
95% 0.05 0.025 1.96
99% 0.01 0.005 2.576

Chapitre 2
L’estimation 8 / 44
Statistique II
1e année bachelor, 2010-11

Exemple Statville (1)


 Rappel :
o n  30 (individus sélectionnés aléatoirement)
o x  51814 (revenu moyen dans l’échantillon)
o   4000 (supposons pour l’instant que le syndic
connaisse ce chiffre)
 Donc l’erreur type  x est égale à 4000 30  730.3

 Par conséquent, 95% des valeurs de x se situent dans l’intervalle


[ 1431,   1431].

Chapitre 2
L’estimation 9 / 44
Statistique II
1e année bachelor, 2010-11

Exemple Statville (2)

 x = 730.3

1431 1431

Chapitre 2
L’estimation 10 / 44
Statistique II
1e année bachelor, 2010-11

Exemple 730.3

Statville (3)
z0.95 2 *  x  1.96 *730.3  1431

 5% des cas seront


comme x3 (càd l’inter-
valle de 95% ne con- 1431 1431
tient pas ) !

1431

1431
1431

Chapitre 2
L’estimation 11 / 44
Statistique II
1e année bachelor, 2010-11

Chapitre 2 : L’ESTIMATION

3.1 Intervalle de confiance :  connu


3.2 Intervalle de confiance :  inconnu
3.3 Taille d’échantillon minimale
3.4 Les estimateurs

Chapitre 2
L’estimation 12 / 44
Statistique II
1e année bachelor, 2010-11

Bases
 Normalement, ni  ni  ne sont connus, et on doit se baser sur
l’échantillon pour estimer ces deux paramètres.
 L’écart type de l’échantillon, s, est alors utilisé comme
estimateur de l’écart type de la population, .
 Lorsque l’estimation est basé sur s plutôt que , les intervalles de
confiance se construisent non pas à partir d’une distribution de
probabilité normale mais à parti d’une distribution de probabilité
dite distribution du t de Student.
 La distribution de Student est une famille de distributions
centrées symétriquement autour de zéro et fonction d’un
paramètre appelé degré de liberté. Quand le degré de liberté
tend vers l’infini, la distribution de Student converge vers une
distribution normale centrée réduite.
Chapitre 2
L’estimation 13 / 44
Statistique II
1e année bachelor, 2010-11

La distribution du t de Student (1)


 n  1 fonction gamma
  
 n 1
  
2  t 
2
 f t  
1   2 
  
n 1  u
 1   , où  n  u e du
n   n   n
  0
2

Chapitre 2
L’estimation 14 / 44
Statistique II
1e année bachelor, 2010-11

La distribution du t de Student (2)

Chapitre 2
L’estimation 15 / 44
Statistique II
1e année bachelor, 2010-11

La distribution
du t de Student (3) 2

Chapitre 2
L’estimation 16 / 44
Statistique II
1e année bachelor, 2010-11

Mister Student
 La distribution du t de Student fut découvert par William Gosset
(1876-1937), qui écrivit sous le pseudonyme « Student » en
suivant la marque de son calepin The Student’s Science
Notebook puisque son employeur, la brasserie Guinness de
Dublin, ne voulait pas qu’il révèle son identité.
 Son problème consista à tirer des conclusions
inférentielles sur
o la qualité d’une livraison de houblon à partir
de l’analyse d’un échantillon aléatoire
(coûteux et donc petit), et sur
o le contenu en saccharine de fûts de malt (où
la précision était cruciale puisqu’on risquait de
payer plus en impôt si le contenu alcoolique
résultant dépassait un certain plafond).
Chapitre 2
L’estimation 17 / 44
Statistique II
1e année bachelor, 2010-11

La moyenne (1)
 Nous avons vu que la distribution d’échantillonnage de x suit une
loi normale avec une moyenne de  et un erreur type de
 x   n (si n N  0.05 ), ainsi qu’une proportion 1 des
valeurs de x se situent dans l’intervalle de confiance
x  z1 2  n .  
 L’intervalle de confiance correspondant quand  est inconnu
n 1
est donné par x  t 2 s n , où  
→ tn 21 est la valeur t fournissant un aire égale à  2 dans la
queue supérieure de la distribution de Student avec n  1
degrés de liberté, et

→ s
  xi  x 
.
2

n 1
Chapitre 2
L’estimation 18 / 44
Statistique II
1e année bachelor, 2010-11

La moyenne (2)
 Les degrés de liberté (n 1) correspondent au nombre
d’informations indépendantes qui entrent dans le calcul de
  i  : Seules (n 1) des valeurs  xi  x  sont
2
x  x
indépendantes, car si l’on connaît (n 1) valeurs, la dernière
valeur peut être obtenue en utilisant la condition selon laquelle
  xi  x   0 .
 Résumé :

t

Chapitre 2
L’estimation 19 / 44
Statistique II
1e année bachelor, 2010-11

La moyenne (3)

 Si  est inconnu mais on sait que la population suit une loi


normale, l’intervalle de confiance est exact et peut être utilisé
quelle que soit la taille de l’échantillon.
 Si la population ne suit pas une loi normale, l’intervalle de
confiance est approximatif et dépend de la distribution de la
population ainsi que de la taille de l’échantillon (via le théorème
centrale limite). En pratique, un échantillon de taille 30 est
considéré suffisant, sauf si la distribution de la population est
fortement asymétrique ou contient des valeurs extrêmes.

Chapitre 2
L’estimation 20 / 44
Statistique II
1e année bachelor, 2010-11

Une proportion

 Dans le chapitre 3.1, nous avons vu que


o la distribution d’échantillonnage d’une proportion p peut être
approchée par une distribution de probabilité normale lorsque
np  5 et n(1p)  5, et que
o l’erreur type de p est donné par  p  p 1  p  n .

 Puisque p n’est pas connu, on ne connaît pas  p . Ainsi, p est


substitué à p, et l’intervalle de confiance est donnée par
p  z1 2 p 1  p  n

Chapitre 2
L’estimation 21 / 44
Statistique II
1e année bachelor, 2010-11

Distribution d’échantillonnage d’une


proportion

Chapitre 2
L’estimation 22 / 44
Statistique II
1e année bachelor, 2010-11

Exemple Statville
 Rappel :
→ n  30 (individus sélectionnés aléatoirement)
→ x  51844 (revenu moyen dans l’échantillon)
→ s  3348 (écart type de l’échantillon)
 Donc l’intervalle de confiance de 95% est donné par
x  t0.025
29
 
3348 30  51844   2.045 * 611.3   50594,53094
→ Interprétation : Etant donné l’échantillon, la probabilité que la
vraie moyenne  soit couverte par l’intervalle [50594, 53094]
est égale à 95%.
 Excel : =LOI.STUDENT.INVERSE(α;n  1) donne les
probabilités de la distribution de Student
Chapitre 2
L’estimation 23 / 44
Statistique II
1e année bachelor, 2010-11

Intervalle de confiance : interprétation (1)


 Interprétation correcte d’un intervalle de confiance de 95% :
Si l’on prenait plusieurs échantillons et dans chaque cas on
calcule l’intervalle de confiance, alors l’intervalle contiendrait la
moyenne dans 95% des cas.
 Exemple d’interprétation imprécise
o « Ce sondage a été réalisé par l'institut gfs. Au total, 1220
personnes représentatives ont été interrogées dans toute la
Suisse. La marge d'erreur est d'environ 2%. »
o Il aurait fallu écrire: « La marge d’erreur est d’environ ± 2
points de pourcentage avec une probabilité de 95% ».

Chapitre 2
L’estimation 24 / 44
Statistique II
1e année bachelor, 2010-11

Intervalle de confiance : interprétation (2)


 Autres exemples :
o Interprétation imprécise : « Ce sondage a été réalisé par
l’Institut MIS, auprès de 1002 citoyens vaudois, âgés de 18 à
74 ans, représentatifs de la population. La proportion de oui est
de 39%. Marge d’erreur: plus ou moins 3%. »
o Interprétation correcte : « Les résultats sont basés sur un
sondage téléphonique portant sur 1003 adultes âgés de 18 ans
ou plus. La proportion de réponses positives est de 74%. Pour
l’échantillon entier on peut admettre avec 95% de confiance
que la marge d’erreur d’échantillonnage est de ± 3 points de
pourcentage. En plus de la variation d’échantillonnage, il est
possible que la formulation des questions ainsi que des aspects
pratiques des méthodes de sondage introduisent certains biais
aux résultats émanant de sondages. »
Chapitre 2
L’estimation 25 / 44
Statistique II
1e année bachelor, 2010-11

Chapitre 2 : L’ESTIMATION

3.1 Intervalle de confiance :  connu


3.2 Intervalle de confiance :  inconnu
3.3 Taille d’échantillon minimale
3.4 Les estimateurs

Chapitre 2
L’estimation 26 / 44
Statistique II
1e année bachelor, 2010-11

La moyenne :  connu
 Comment choisir la taille de l’échantillon afin d’obtenir une
certaine marge d’erreur ?
 Intervalle de confiance de la moyenne, avec 

connu  x  z1 2 .
n

 Soit M la marge d’erreur souhaitée : M  z1 2
n
z1 2
o donc n  ,
M
o et la taille de l’échantillon minimale est donc donnée par
 1 2 
2
z  2

n
M2
Chapitre 2
L’estimation 27 / 44
Statistique II
1e année bachelor, 2010-11

La moyenne :  inconnu
 Si l’on ignore  (le cas le plus fréquent), on ne peut pas se baser
sur l’écart type de l’échantillon s si la question de la taille de
l’échantillon est posée avant que l’étude soit conduite.
 On peut donc choisir une des procédures suivantes
o Utiliser une estimation de  obtenue antérieurement.
o Utiliser une étude pilote pour sélectionner un échantillon
préliminaire, dont s peut servir de valeur initiale pour .
o Utiliser l’intuition pour estimer . Une règle pratique parfois
adoptée est de prendre un quart de l’étendue des données
(intervalle entre les valeurs minimale et maximale) comme
approximation de .

Chapitre 2
L’estimation 28 / 44
Statistique II
1e année bachelor, 2010-11

Une proportion (1)


p 1  p 
 Intervalle de confiance d’une proportion  p  z1 2 .
n
p 1  p 
 Soit M la marge d’erreur souhaitée : M  z1 2
n
 La taille de l’échantillon minimale est donc donnée par
 z1 2  p 1  p 
2

n
M2
 Puisque p n’est pas connu avant la sélection de l’échantillon, il
faut trouver une valeur préalable p* de p , ainsi que
 z1 2  p * 1  p * 
2

n
M2
Chapitre 2
L’estimation 29 / 44
Statistique II
1e année bachelor, 2010-11

Une proportion (2)

 Pour trouver la valeur préalable p*, on peut choisir une des


procédures suivantes
o Utiliser une estimation de p obtenue antérieurement.
o Utiliser une étudie pilote pour sélectionner un échantillon
*
préliminaire, dont p peut servir de valeur initiale pour p .
o Utiliser l’intuition pour estimer p*.
o Utiliser la valeur p*  0.5.

Chapitre 2
L’estimation 30 / 44
Statistique II
1e année bachelor, 2010-11

Exemple Statville (1)

 Le syndic a obtenu un budget pour interroger un nouvel


échantillon d’individus
 Il veut un échantillon qui lui fournit une estimation du revenu
moyen  à 500 francs près, et du taux de participation à
l’assemblée communale p à 5% près, avec un seuil de
confiance de 99% (  0.01).
 Quelle devrait être la taille minimale de son nouvel échantillon ?
 Il prend l’écart type du revenu (s = 3348) et la proportion de
participants ( p = 0.63) observés dans son premier échantillon
comme estimations de  et de p (« valeurs préalables »)

Chapitre 2
L’estimation 31 / 44
Statistique II
1e année bachelor, 2010-11

Exemple Statville (2)

 Taille de l’échantillon pour estimer  :


 1 2 
2

→ n
z  2


 z0.995 
2
33482 2.5762 * 33482
  298
M2 500 2
500 2

 Taille de l’échantillon pour estimer p :


 z1 2  p * 1  p * 
2
2.5762 * 0.63 * 0.37
→ n   618
M2 0.05 2

 Le syndic aurait besoin d’une augmentation considérable de son


budget.

Chapitre 2
L’estimation 32 / 44
Statistique II
1e année bachelor, 2010-11

Chapitre 2 : L’ESTIMATION

3.1 Intervalle de confiance :  connu


3.2 Intervalle de confiance :  inconnu
3.3 Taille d’échantillon minimale
3.4 Les estimateurs

Chapitre 2
L’estimation 33 / 44
Statistique II
1e année bachelor, 2010-11

Dérivation d’un estimateur

 Il existe deux méthodes principales de dériver un estimateur :


1. La méthode des moments : On choisit comme estimateur
d’un moment de population le moment correspondant dans
l’échantillon.
 C’est ce que nous avons vu jusqu’à présent.
2. La méthode du maximum de vraisemblance : On choisit
comme estimateur la fonction qui maximise la probabilité des
données observées, sous l’hypothèse que ces données
suivent une certaine distribution statistique.
 Implique des hypothèses fortes sur la nature de la
population.

Chapitre 2
L’estimation 34 / 44
Statistique II
1e année bachelor, 2010-11

Maximum de vraisemblance (1)


 On cherche à estimer la valeur d’un paramètre  de la population
(moyenne, variance,…) à partir d’un échantillon aléatoire simple.
 On suppose que, pour un  donné, la densité de probabilité
f(x) de la variable aléatoire continue X soit connue. ( !)
o Puisque X est continu, la probabilité d’un échantillon de
valeurs particulières P(Cn)  P(x1, x2, …, xn) est nulle.
o Le raisonnement porte alors sur l’intervalle des valeurs de
l’échantillon Cn :
Cn    x1  X1  x1  h  ,  x2  X 2  x2  h  ,...,  xn  X n  xn  h .
o Si h est très petit, P  xi  X i  xi  h   h * f  xi  .
o Cn étant un échantillon aléatoire, on peut alors écrire:
P Cn   h n * f  x1  * f  x2  * ... * f  xn   h n * L Cn  , où
o L Cn  est appelée la fonction de vraisemblance.
Chapitre 2
L’estimation 35 / 44
Statistique II
1e année bachelor, 2010-11

Maximum de vraisemblance (2)

 Si les valeurs de l’échantillon Cn se sont produites, c’est qu’il est


vraisemblable que l’échantillon Cn soit représentatif de la
population. On cherche donc l’estimateur de  qui maximise la
vraisemblance de cet échantillon particulier.
 Avec L Cn |    f  x1  * f  x2  * ... * f  xn  , on cherche la valeur
ˆ  g  x1, x2 ,..., xn  qui maximise L, où
o ˆ est l’estimation du maximum de vraisemblance de , et
o la variable aléatoire correspondante Tn  g  X1, X 2 ,..., X n  est
l’estimateur du maximum de vraisemblance de .

Chapitre 2
L’estimation 36 / 44
Statistique II
1e année bachelor, 2010-11

Maximum de vraisemblance : exemple (1)

 Soit X une variable aléatoire qui suit une distribution normale


d’espérance  inconnue, X   ,  .

1  1 x   
2
 Alors : f  x   exp     
 2  2   
 La vraisemblance est donc :
n
 1   1 n 2
L Cn |      exp   2   xi    
  2   2 i 1 
n
  xi    est à son
2
 Cette fonction est à son maximum quand
i 1
minimum.
Chapitre 2
L’estimation 37 / 44
Statistique II
1e année bachelor, 2010-11

Maximum de vraisemblance : exemple (2)


2 2
1 n 1 1
n
 n
1 n
  x i       x i  x     x i     sn    x i   
2 2
 2
n i 1 n i 1  n i 1   n i 1 
n 1 n
  xi    est à son minimum pour ˆ   xi .
2
 Donc
i 1 n i 1
 L’estimateur du maximum de vraisemblance de  est donc la
moyenne d’échantillon x (que l’écart type  soit connu ou
inconnu, puisqu’il n’intervient pas dans la démonstration).
 Dans ce cas particulier, l’estimateur de maximum de
vraisemblance est le même que l’estimateur de la méthode
des moments.  x

Chapitre 2
L’estimation 38 / 44
Statistique II
1e année bachelor, 2010-11

Propriétés désirées des estimateurs


 Qu’est-ce qui caractérise un « bon » estimateur ?
 Pour que Tn soit un bon estimateur de , il faut qu’il y ait une
probabilité élevée pour que Tn prenne une valeur proche de .
 Cela est réalisé, en particulier, lorsque Tn remplit les deux
conditions suivantes :
o E(Tn)   (absence de biais)
o  T faible (précision, erreur type faible)
n

 Certains estimateurs sont biaisés dans des échantillons finis, tel


que E(Tn)  , mais asymptotiquement non-biaisés, tel que
lim E Tn    .
n 

Chapitre 2
L’estimation 39 / 44
Statistique II
1e année bachelor, 2010-11

Précision des estimateurs

Chapitre 2
L’estimation 40 / 44
Statistique II
1e année bachelor, 2010-11

Biais et précision

Chapitre 2
L’estimation 41 / 44
Statistique II
1e année bachelor, 2010-11

Le choix entre absence de biais et précision


 Si un estimateur est non-biaisé, il est clair qu’il est alors d’autant
meilleur que son erreur type est faible.
 Un estimateur biaisé mais à faible erreur type n’est pas
forcément moins « bon » qu’un estimateur non-biaisé mais
imprécis.
 Afin de trancher entre minimisation de biais et maximisation de
précision, dans les cas où il y a conflit entre ces deux critères, on
cherche souvent à minimiser l’erreur quadratique moyenne (ou
fonction de risque), qui est définie par
n
2
 
RT    E Tn      T2   E Tn     .
n
2

 Si l’erreur quadratique moyenne tend vers zéro quand n tend


vers l’infini, on parle d’un estimateur « convergent ».

Chapitre 2
L’estimation 42 / 44
Statistique II
1e année bachelor, 2010-11

Exemple d’un estimateur biaisé (1)


1 n 2 n 1 2
 Variance d’un échantillon : E  s   E    xi  x   
2

 n i 1  n
 Si l’on choisit s comme estimateur de  , on a donc que
2 2

  2
biais  s 2   E  s 2    2 
n 1
 2  2   .
n n
 Le biais vaut   2 n , ce qui signifie que la variance d’échantillon
non corrigée sous-estime systématiquement la variance de la
population.
 Toutefois, quand la taille de l’échantillon n augmente, ce biais
tend vers zéro. s2 est donc un estimateur asymptotiquement
non-biaisé de 2.
Chapitre 2
L’estimation 43 / 44
Statistique II
1e année bachelor, 2010-11

Exemple d’un estimateur biaisé (2)


n 2
 On appelle variance corrigée s 2
 s
corr
n 1
 La variance corrigée est un estimateur sans biais de la variance
de la population.
 On peut montrer que l’erreur type de la variance corrigée tend
vers zéro quand n tend vers l’infini.
 Puisque c’est un estimateur non-biaisé dont l’erreur type tend
vers zéro dans des grands échantillons, il s’agit aussi d’un
estimateur convergent: il converge en probabilité vers  .2

 On peut montrer aussi que


o x est un estimateur non-biaisé et convergent de , et que
o p est un estimateur non-biaisé et convergent de p.

Chapitre 2
L’estimation 44 / 44