Vous êtes sur la page 1sur 25

STATISTIQUE INFERENTIELLE

L ’ESTIMATION
UN EXEMPLE
Montant quotidien des dépôts en liquide dans la banque
Ibardinescroak de Saint Jean de Luz.

5000 10 000 500

Comment obtenir une information sur


la distribution
8000 des dépôts, sur le
montant du dépôt moyen, etc….?
UNE SOLUTION SIMPLE
Observer tous les dépôts

5000 10 000 500

8000

MAIS IMPOSSIBLE A METTRE EN ŒUVRE …...


car le nombre N d’observations est très grand, voire infini!
UNE AUTRE SOLUTION

On observe un échantillon, c.à.d. une partie de la population

5000 10 000 500

échantillon
Statistique
8000 descriptive
INTERET DE LA STATISTIQUE DESCRIPTIVE

5000 Construction d’un


10 000 500
modèle théorique

Echantillo
n
8000

histogramme des dépôts

Fréquence Dépôt moyen = 7500 €


écart-type des dépôts = 2500 €

Montant des dépôts


INTERET DE LA STATISTIQUE DESCRIPTIVE

Servir de base à la construction d’un modèle théorique

Pourquoi ?

Pour faire de la prévision:


Quelle quantité de monnaie acheter à la Banque de France en début de semaine?

Quelle quantité de liquide va-ton pouvoir faire transiter par la Suisse ?…..
UN MODELE MATHEMATIQUE

Test d’ajustement :
On verra plus tard...

X = Montant quotidien des dépôts est une variable aléatoire


de loi Normale
3 affirmations
de moyenne E(X) = 
à vérifier
de variance V(X) = ²

Estimation
ESTIMATION DE LA MOYENNE 

Comment avoir une idée sur la valeur de la moyenne ?

1) Prendre rendez-vous avec Irma la voyante

Problèmes: ça va me coûter cher. Puis-je lui faire confiance ?

2) Utiliser l’intuition et quelques notions de probabilités


Problème: je n’ai rien compris aux probas
C’est pas grave car on ne va plus s’amuser à jeter des dés ou tirer des cartes...
Avantage: je pourrai préciser la confiance à apporter à mon résultat
UNE METHODE INTUITIVE D’ESTIMATION DE LA
MOYENNE

Pour estimer la moyenne  inconnue de la population


on utilise la moyenne x de l’échantillon.

Est-on sûr de faire mieux qu’Irma?


UNE METHODE INTUITIVE D’ESTIMATION DE LA
MOYENNE
On observe n dépôts x1,….,xn sur un échantillon et on en fait la moyenne x
x va-t-elle être proche de  inconnue?

Et si j’insiste Loi de X
lourdement ?

 x Pas mal…
Moins bien…. mais que se serait-il passé si
Et un autre ? j’avais pris un autre échantillon ?

Théorème fondamental:
Pourquoi les observations de x sont-elles concentrées
Si X est une v.a. de moyenne et d’écart-type , alors la v.a. moyenne, notée
autour de la moyenne inconnue  ?

X , obtenue sur un échantillon de taille n tend vers une N μ,  n 
Prendre une décision à partir d’un échantillon, est-ce vraiment fiable ?


x
Précision
Fiabilité Probabilité

Quelle est la probabilité que la moyenne inconnue  se trouve pas trop loin de xobservée ?

Il y a 1- = 95 chances sur 100 que l’intervalle  x-a ; x+a  contienne 


UN PEU…….. DE PROBAS….


X suit une loi N μ,  
n , donc n  X-μ   suit une N(0,1)
Table
P[-u < n  X-μ   < u] = 1-= 0,95 u = environ 2 (1,96)

/ n < X -< u]


P[-u / n = 1-

P[-X -u/ n < -< -X+u]


X / n = 1-

P[X +u/ n >  X -u]


/ n = 1-

P[X - u
/ n < X+u]
/ n = 1-

Il y a 1- chances que la moyenne inconnue  appartienne


à l’intervalle aléatoire X- u n ; X+ u n 
UN PEU…….. DE PROBAS…. FIN

Il y a 95 chances sur 100 que la moyenne inconnue 


appartienne à l’intervalle aléatoire  X- u n ; X+ u n 

Une observation aléatoire nous donne la valeur x de X .


 x-u n ; x+ u n 

Une autre observation nous aurait donné une autre valeur x ,
……. et donc un autre intervalle …. qui ne contient pas forcément 


x x
Si on peut prendre une infinité d’échantillons, 95% des intervalles contiennent 
On dira (pour simplifier) que la moyenne inconnue a 95 chances
sur 100 d’appartenir à l’intervalle numérique  x- u n ; x+ u n 
 
Fiabilité et précision

l’intervalle  x-u n ; x+ u n  a 1- chances de contenir 

précision fiabilité

1- et u sont liés par la P[-u < n  X-μ   < u] = 1-


relation
P[-u < N(0,1) < u] = 1-

Fiablité augmente

u augmente
1-
Précision diminue
-u  u
Pour quelles raisons utiliser la moyenne de l’échantillon
pour estimer la moyenne de la population ?

1) Pour des raisons intuitives


X 50
2) Pour des raisons théoriques
Variable T
quelconque
X X10

 

pour X Pour T
On a une forte probabilité que l’observation Plus la taille de l’échantillon grandit plus
soit dans cette zone la variance diminue. Pour n infini,
 
E X =μ E T   μ l’observation tombe forcément sur .
X est un estimateur sans biais X est un estimateur convergent
RESUME SUR L’ESTIMATION D’UNE MOYENNE
d’une population Normale de variance connue
Pour estimer la moyenne d’une population,
Estimation ponctuelle
on utilise la moyenne de l’échantillon

Pour avoir une idée de la fiabilité et de la


précision du résultat on utilise un intervalle Estimation par
de confiance  x-uσ n ; x+ uσ n  intervalle de confiance

avec u défini par P[-u < N(0,1)< u] = 1-

précision Coefficient
de confiance
Détermination de la taille d’échantillon pour une précision et un coefficient
de confiance donnés
 
2
On veut que l’intervalle soit de la forme x   , donc  = u σ n et n= uσ 
ESTIMATION PONCTUELLE DE LA VARIANCE ²

1) Pour des raisons intuitives


Il est naturel d’estimern la variance d’une population,
  
2
x i -x
2
par la variance s n =
i=1
n de l’échantillon
n
2) Pour des raisons théoriques
  x i -x 
2

2
On estime la variance d’une population par la variance corrigées n-1 =
i=1
n-1
de l’échantillon, notée aussi s².

Pourquoi ? E S 2   σ 2 S2est un estimateur sans biais de ²

V S2  
n 
0 S2est un estimateur convergent de ²
ESTIMATION PAR INTERVALLE DE CONFIANCE DE
LA VARIANCE ² D’UNE POPULATION NORMALE

(n-1) S² suit une loi de ² à (n-1) d.d.l.


²
 (n  1)S2  Table
P a  2
 b   1 α a et b (> 0) pour 1- donné
  
 a 1 b 
P 2
 2
 2 
 1 α
 (n  1)S  (n  1)S 

 (n  1)S2 2 (n  1)S2 
P     1 α
 a b 
 (n  1)S2 2 (n  1)S2 
P     1 α
 b a 
 (n  1)s 2 (n  1)s 2 
D’où un intervalle de confiance  ; 
 b a 
RESUME SUR L’ESTIMATION D’UNE VARIANCE

Pour estimer la variance ² d’une population,


Estimation ponctuelle
on utilise la variance corrigée s² de l’échantillon

Pour avoir une idée de la fiabilité et de la


précision du résultat on utilise un intervalle
de confiance
Estimation par
 (n  1)s (n  1)s 
2 2
intervalle de confiance
 ; 
 b a 
P   (2n1)  a    2
avec a et b définis par
P   (2n1)  b   1   2
ESTIMATION PONCTUELLE D’UNE PROPORTION
Dans la population il y a une proportion p d’individus possédant un certain
caractère.
1) Pour des raisons intuitives
Il est naturel d’estimer la proportion p d’une population
par la proportion f de l’échantillon

2) Pour des raisons théoriques

 p(1-p) 
F, proportion d’échantillon, est une v.a. qui tend vers une loi N  p , 
 n 

E  F  p F est un estimateur sans biais de p


p(1-p)
V F  
n 
0 F est un estimateur convergent de p
n
INTERVALLE DE CONFIANCE D’UNE PROPORTION
 p(1-p) 
F tend vers une N  p ,  , ou encore
 n 
Fp
n est à peu près une N(0,1) dès que n > 100 et 0,1 < p < 0,9
p(1  p)
 Fp  Table
P u  n  u  1 α u pour 1- donné
 p(1  p) 
 p(1  p) p(1  p) 
P u  Fp  u   1 α
 n n 
 p(1  p) p(1  p) 
P F  u  p  F  u   1 α
 n n 
 p(1  p) p(1  p) 
P F  u  p  Fu   1 α
 n n 
p (dans les bornes de l’intervalle aléatoire) étant
 f(1  f) f(1  f) 
inconnu, il est approché par une estimation f, d’où f  u ; f u 
un intervalle de confiance  n n 
RESUME SUR L’ESTIMATION D’UNE PROPORTION

Pour estimer la proportion p d’une population,


Estimation ponctuelle
on utilise la proportion f de l’échantillon

Pour avoir une idée de la fiabilité et de la Estimation par


précision du résultat on utilise un intervalle intervalle de confiance
de confiance
 f(1-f) f(1-f)  pour n > 100 et 0,1 < f < 0,9
 f  u ;f  u 
 n n  (sinon utiliser un abaque)
avec u défini par P[-u < N(0,1)< u] = 1-

Détermination de la taille d’échantillon pour une précision et un coefficient


de confiance donnés
f(1-f)
On veut que l’intervalle soit de la forme f   , donc  = u
et n   u   f(1-f)
2 n
ESTIMATION PONCTUELLE : UNE CONCLUSION

X de loi quelconque
de moyenne E(X) = , de variance V(X) = ²

x s²

La moyenne x de l’échantillon est une bonne estimation de la moyenne  de la population


La variance corrigée s² de l’échantillon est une bonne estimation de la variance ² de la
population

Proportion p d’un caractère

La proportion f de l’échantillon est une bonne estimation de la proportion p de la population


INTERVALLE DE CONFIANCE D’UNE MOYENNE:
EXTENSIONS

Pour obtenir un intervalle de confiance de la moyenne x  u  n


nous avons supposé (sans le dire) que

La taille d’échantillon est grande


La variance ² est connue ( ce qui en pratique est très rare )
Le taux de sondage n/N est faible ( <10% )

Que peut-on faire si ces conditions


ne sont pas respectées ?
INTERVALLE DE CONFIANCE D’UNE MOYENNE
EXTENSIONS
Conditions Intervalle u ou t défini par
² connu Population Normale x  uσ n P-u < N(0,1) < u =1 α
ou n > 5
² inconnu PopulationNormale x  us n P-u<T <u=1α
ou n>30  (n-1) 

Loi de Student à (n-1) d.d.l.qui est


approximativement N(0,1) pour n > 30

Dans ce tableau, on suppose que l’échantillon est prélevé avec remise,


ou
que l’échantillon est prélevé sans remise et le taux de sondage n/N <10 %

Dans le cas d’un échantillon prélevé sans remise, et un taux de sondage


N-n
n/N >10 %, on multiplie  ou s par le facteur d’exhaustivité
N-1

Ce correctif doit aussi être apporté pour un intervalle de confiance d’une proportion

Vous aimerez peut-être aussi