Chapitre 1 Echantillonnage L3

Chapitre 1 :Echantillonnage
1. Introduction :
La statistique désigne à la fois un ensemble de données, d’observations portant sur un
ou plusieurs phénomènes ainsi que leurs traitements et leurs interprétations.
Les ensembles étudiés sont appelés populations, leurs éléments sont appelés
individus. L’étude porte, sur ce qu’on appelle caractère ou variable statistique. Ce
caractère peut être qualitatif ou quantitatif.
2. Echantillon statistique :
On considère une population P contenant N individus, que l’on veut étudier
relativement à un caractère quantitatif réel X .
S’il est possible d’étudier X sur tous les individus de la population, les propriétés de
X seraient parfaitement connues. Mais cette situation est très très rare.
L’étude de X sera donc réalisée sur un échantillon de taille n  N .
Soit xi la valeur du caractère X sur l’individu "i " .
x1 , x2 , ..., xn  Cette suite est appelée échantillon statistique.
Notons, pour chaque expérience, on pose X i : la réponse de l’individu i au caractère
X . X i se comporte comme X , c'est-à-dire, a la même loi de probabilité que X .
x1 , x2 , ..., xn  est une réalisation de l’échantillon, c’est-dire:  X 1 , X 2 , ..., X n 
est un vecteur aléatoire, tel que, les variables aléatoires X i sont indépendantes et de
même loi que X .
3. Caractéristiques d’un échantillon :
La moyenne arithmétique :
La moyenne arithmétique associée à un échantillon  X 1 , X 2 , ..., X n  , est la quantité
réelle définie par :
1 n
Xn   X i
n i 1
Proposition :
E X n  m
 E  X   m 
Soit X une variable aléatoire telle que :  Alors  2
Var  X    2 Var  X n  
 n
Démonstration :
1 n 
E  X n  E   X i 
 n i 1 
1 n  1 n 1 n
 E   X i    E  X i    E  X   n E  X   E  X 
1
n  i 1  n i 1 n i 1 n
Car l’espérance est un opérateur linéaire : E aX  bY   a E  X   b E Y 

 n  n
E   ai X i    ai E  X i 
 i 1  i 1
Mme Laboudi Bouarroudj.F Page 1
Rappel :
V aX  b  a 2 V  X ,  X variable aléatoire et  a R et  b R .
La variance est invariante par translation.
V  X  Y   V  X   V Y   2 cov  X , Y  ,  X et Y deux variables aléatoires.
1 n 
V X n V   X i 
 n i 1 
n 

1  n  1
V  X i    V  X i   2   covX i , X 
j 
n 2  i 1  n 2 i 1 i j 
1 n 1 n 2 2
 V X i   
2 i 1 2 i 1 n
n n
 
Car :  i  j cov X i , X j  0 puisque les variables aléatoires X i sont indépendantes.
4. Comportement asymptotique de X n :
a- Lois faible des grands nombres :
X n converge vers m en probabilité, c’est-à-dire :
  0, P X n  m     0
b- Lois forte des grands nombres :
X n converge vers m presque surement, c’est-à-dire :
P   / lim X n    m   1
c- Théorème central limite :
Xn  m
La variable aléatoire Z  . n  N 0,1

 X m 
Pour n assez grand : P n . n  z    z  .
  
Avec  est la fonction de répartition de la loi N 0,1 .
5. Les paramètres d’échelle (ou de dispersion) :

La variance empirique :
La variance empirique d’un n  échantillon de X est définie par :
2
2 1 n

Sn   X i  X n . 
n i 1
2
Sn 
1 n

 Xi  Xn 
est l’écart-type empirique
n i 1

Propriété :
2
  X i  X n    X i2  X n2 .
1 n 1 n
Sn2
n i 1 n i 1
Démonstration :
 
2
   X i  X n    X i2  2 X i X n  X n2
1 n 1 n
S n2
n i 1 n i 1
1 n 2 1 n 1
 
n i 1
X i 
n
2 X n  Xi  n Xn
n
2
i 1
  X i  X n nX n   X n2
1 n 2 2
n i 1 n
1 n 2 2 2
  Xi  2 Xn  Xn
n i 1
1 n 2 2
  Xi  Xn
n i 1
2
Proposition : E S n   
n 1 2
 , où
n
 2  Var  X  .
Démonstration :
1 2
   X i  X n 
n
E S n2  E 
n 
 i 1 
1 n 2 
 E   X i  X n2 
 n i 1 
1 n 
 E   X i2   E X n2  
 n i 1 
1 n
   
  E X i2  E X n2
n i 1
 E X   E X 
i
2 2
n
Comme : E  X   m et Var  X     E X  E  X 
i i
2
i
2
i
2
 
donc : E X i    m
2 2 2
De même : E  X n  m et Var  X n  
2
n
   
 E X n2  E  X n  2 donc : E X n2 
2
n
 m2

Alors :
     
E S n2  E X i2  E X n2
   m   
 2 
2 2
 m 2 
n  
2  1  n 1 2
 2
 1    2   
n  n  n 
Remarque :
-  
Lim E S n   : pour n assez grand, la variance empirique se
2 2
comporte comme la variance de X en moyenne.
- La variance empirique « modifiée » est définie par :

2
 X i  X n 
1 n
Sn2

n  1 i 1
S n2 
n 2
n 1
S n Alors : E S n2   n
n 1
 
E S n2   2
C’est pour cette raison, on préfère utiliser dans la pratique Sn au lieu de S n .
2 2
6. La fonction de répartition empirique :

On appelle fonction de répartition (ou distribution) empirique d’un échantillon
 X 1 , X 2 , ..., X n  de X , la fonction Fn définie par :
Fn : R  0 ,1
1 n
x  Fn x    IX i  x 
n i 1
 
On note l’échantillon ordonné, par ordre croissant : X 1 , X 2  , ..., X n  , alors la
fonction de répartition empirique s’écrit :
0 si x  X 1

1 si X 1  x  X 2 
n
2
 si X 2   x  X 3
Fn  x    n
.

 n  1 si X
 n n 1  x  X n 

1 si x  X n 

Si on note par F la fonction de répartition de X , alors
1 si X i  x
1 i  n : IX i  x    suit la loi de Bernoulli Ber  p 
0 si non
Avec p  P X i  x   F  x 
IX i  x   Ber  p 
n
 IX i  x   Bn , p   B n , F x 
i 1
Car les variables aléatoires yi  IX i  x  sont indépendantes et de même loi
Ber  p  .
n n
Comme Fn  x    IX i  x  alors : n Fn x    IX i  x   Bn , F x 
1
n i 1 i 1
Donc :
E n Fn  x   n F x   E Fn  x   F  x 
V n Fn x   n F x 1  F x  n 2 V Fn x  
F x 1  F x 
1
V Fn x  
n
Conclusion :
E Fn  x   F  x 
V Fn  x   F  x 1  F  x 
1
n
7. Echantillons Gaussiens :
On considère un échantillon d’une variable aléatoire de X , tel que X suit la loi
normale de paramètres m et  
 2 : N m,  2 , alors le vecteur aléatoire
 X1   m
   
X   m
Z   2   N M ,   Avec M     R
n
: :
   
X 
 n  m

 2 0 ...... 0 
 
0  ... 0 
2
Et       2 In
0 0  0 
2
 
0 0 0 ....  2 
2
Dans le cas Gaussien, on peut connaitre explicitement les lois de X n et de S n , mais
dans le cas général les lois ne sont pas connues.
7-1 : loi de X n :
1 n
Xn 
n
 Xi : C’est une combinaison linéaire des coordonnées d’un vecteur
i 1
gaussien. Donc X n est une variable gaussienne de paramètres :
2   2 
E  X n   m et V  X n   
: Xn  N m ,

n  n 
2
7-2 : Indépendance entre X n et S n :
1 n
Xn 
n
 Xi
i 1
 X i  Xn  
1 n 1 n 2

2
Sn2  X i  X n2
n i 1 n i 1
Théorème :
1 i  n : les variables aléatoires X i  X n et X n sont gaussiennes et
indépendantes.
Démonstration :
  2 

Xn  N m ,
 n 
1 i  n :
1 n
Xi  Xn  Xi   X j
n j 1
1 1 1  1 1 1
 X 1  X 2  ...  X i 1  1   X i  X i 1  ... X n
n n n  n n n

Donc X i  X n est une variable gaussienne car c’est une combinaison linéaires des
coordonnées d’un vecteur gaussien.
E X i  X n   E  X i   E X n   m  m  0
 1  1 
V  X i  X n   V  X 1  X 2  ...  X i 1  1   X i  X i 1  ... X n 
1 1 1 1
 n n n  n n n 
2
1 1 1  1 1 1
 2 V  X 1   2 V  X 2   ...  2 V  X i 1   1   V  X i   .. 2 V  X i 1   ... 2 V  X n 
n n n  n n n

n  1 2  1  2
  1
2

 
n2  n
n 1 2
 
n
 n 1 2 
 1 i  n , X i  X n  N  0 ,  
 n 
Le couple  X n , X i  X n  s’écrit sous la forme :
 Xn 
   AZ  b
 X X 
 i n 
Avec :
1 1 1 1 
 .... ........... 
 0
A 
n n n n
et b   
 1 1  1  1   0
  .....1   .......  
 n n  n  n 

Le couple X n , X i  X n  est un vecteur gaussien :
  2 , ?  
 Xn    
m  n 
   N    ,   
X  X    n 1 2  
 i n    0  ?   
  n  
Rappel :
Si U  N M ,   Alors

V  AU  b  N AM  b , AAt 

La matrice de variance covariance du couple X n , X i  X n  s’obtient par :
1 1 
  
n n 
1 1 1 1  1 1 
 .... ...........    
A  At     2I  n
n n n n n 
 1 1  1  1    1  
  .....1   .......   : 1   
 n n  n  n   n 
 
1 
1 
 
n n 
 1

n  1  1 1  1   1 
n 2    0 
 n n 2
n n  2 n
 2  
  n  1  1 1  1  n  1  1  1 2  
0
n 1

     n 
 n
2
n n n2  n 
Donc
cov X n , X i  X n  0
D’où les variables aléatoires X n et X i  X n sont indépendantes et par conséquent

X n et S n2 sont indépendantes.
2
7-3 Loi de S n :
Rappel :
- Si X sui la loi normale centrée et réduite N 0,1 alors X 2
suite la loi de khi-deux à 1 degré de
liberté 12 .
- Si X suit la loi de khi deux à n 1 degré de liberté :  2
n1
Et Y suit la loi de khi deux à n 2 degré de liberté :  2

n2
- Si X et Y sont indépendantes alors X  Y suit la loi de khi deux à n 1 n 2 degré de liberté :
2 .
n 1 n 2
1 i  n : X i  N m,  2    Zi 
Xi  m

 N 0 ,1
2
n n
 X m n
  X i  m
1
 R    i   2   2n 
2
Z i2
i 1 i 1     i 1

2
 X i  X n   X n  m
1 n 1 n
  X i  m 
2
2 i 1 2 i 1

1
 2
i 1

 X i  X n   X n  m  2X i  X n X n  m
n
2 2

 X i  X n  X n  m  2  X n  m   X i  X n 
1 n n n
2 2
 
2 i 1 2 i 1
2
n S n2  X n  m  n 
n   2  X n  m   X i  n X n 
2
 2 
      i 1 
n  n 
alors 2  X n  m   X i  n X n   0
2
Comme   X i  n X n   0
 i 1    i 1 
2 2
n
 Xi  m  n S n2  X n  m 
Donc : Z        n    2n 
i 1     2
  
A retenir :
2
n
 X m
  i   2n 
i 1  
2
 Xn  m 
 n    21
  
  n S n2 
 E  2   n  1
  

n S n2   n S n2 
  n1  V  2   2 n  1
2
2   
 2 n  1 2
V S n2   
n2



8. Statistique et vraisemblance :
Soit  X 1 , X 2 , ..., X n  un n échantillon d’une variable aléatoire X , toute fonction de
X 1 , X 2 , ..., X n est appelée statistique ou statistique d’échantillonnage .

Exemple :
X n , S n2 , min X i , max X i ...... sont des statistiques.
On appelle fonction de vraisemblance, et on note par L , la fonction définie par :

n
 P X i  xi  dans le cas discret
 i 1
L x1, x2 ,..., xn   
n
 f x 
 X i dans le cas continu
i 1
Dans toute la suite du cours, on suppose que X est une variable aléatoire, de loi de
probabilité dépendant d’un paramètre   R d avec d  1 .
P  x   P x,  est la fonction de masse dans le cas discret.
f  x   f  x,  est la fonction densité dans le cas continu.
Exemples :
1. X : suit la loi de Bernoulli
X  Ber   :
 si x  1
P x   P  X  x      x 1   1 x , x  0 , 1
1    si x  0
 
n n
L x1, x2 ,...xn ,   P X i  xi    xi 1   1 xi I0 , 1 xi 
i 1 i 1
n
 xi n n
 i 1 1     
n xi
i 1
I0 , 1 xi 
i 1
2. X : suit la loi géométrique

P x   P  X  x    1   x1  x  N *
X  G   : avec =
  1   x1 I x 
N*
 
n n
L x1 , x2 ,...xn ,   P  X i  xi    1   x 1 I xi 
N*
i 1 i 1
n n
  n 1    xi n  I xi 
i 1 N*
i 1

3. X : suit la loi de Poisson

x
X  P   ,   0 : P  x   P  X  x   e   x  N
x!
  xi
n n
L x1, x2 ,...xn ,    P  X i  xi    x ! e 
i 1 i 1 i
n
 xi
i 1
 e n n
 xi !
i 1
4. X : suit la loi exponentielle :

X     : f   x    e x , x  0 ,   0
 
n n
L x1, x2 ,...xn ,    f   xi     e xi
i 1 i 1
n
   xi
 n e i 1
5. X  N m,   2
 :   m ,  R xR 2 *

 xm 2
f x  
1 2 2
e , x R
 2
 
n
L x1, x2 ,...xn , m,  2   f  xi 
i 1
 n
2
 xi  m
1 1
 exp   xi  R
 n
 2 
n
 2
2
i 1 
9. Familles de lois exponentielles :

Il s’agit d’une famille de lois de probabilités englobant un très grand nombre de lois
usuelles, pour cette famille de lois, il existe des résultats généraux en théorie de
l’estimation et des tests.
Définition :
 
Une loi de probabilité P   R de densité f .,   est dite appartient à la famille
d
de lois exponentielle d’ordre 1, S’il existe des fonctions réelles a, b, c et d tel que

f  x,   a b x  e c  d  x 
Exemples :
1. X  Ber  
 si x  1
P x   P  X  x      x 1   1 x I0 ,1x 
1    si x  0
 e x log e 1 x log1 I0 ,1 x 


x log
 1    I0 ,1 x  e 1
P  X  x  s’écrit sous la forme a b x  e c  d  x 
Avec :
a   1  
b x   I0 ,1

c   log
1
d x   x
La loi de Bernoulli appartient à la famille de lois exponentielle d’ordre 1 .
2. X suit la loi de Poisson

X  P  ,   0 :
x
P  x   P  X  x   e   x  N
x!
I N x 
1 x log
 e  e
x!
I N  x  e x log
1
 e 
x!
P  X  x  est bien sous la forme a  b x  e c  d  x 
Avec :
a   e 
1
b x   I N  x 
x!
c   log 
d x   x

La loi de Poisson appartient à la famille de lois exponentielle d’ordre 1 .
3. X  N m, 1 :   m R

 xm 2
f x  
1
e 2 , x R
2
  x 2  m2 2 xm 
1
1 
 e 2 , x R
2
1 2 1 2
1  2 x  2 m xm
 e e e
2
f  x  s’écrit sous la forme am  b x  e c m d  x 
Avec :
1 2
1 2 m
am   e
2
1
 x2
b x   e 2
cm   m
d x   x
Donc la loi N m, 1 appartient à la famille de lois exponentielles d’ordre 1.
4. X suit la loi de Cauchy  
f  x  
1
, x  R ,   0
1   x   2
La loi de Cauchy n’appartient pas à la famille des lois exponentielles.

Chapitre 1 Echantillonnage L3

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Chapitre 1 Echantillonnage L3

Transféré par

Droits d'auteur :

Formats disponibles

Chapitre 1 :Echantillonnage

3. Caractéristiques d’un échantillon :

Car l’espérance est un opérateur linéaire : E aX  bY   a E  X   b E Y 

V  X  Y   V  X   V Y   2 cov  X , Y  ,  X et Y deux variables aléatoires.

5. Les paramètres d’échelle (ou de dispersion) :

Mme Laboudi Bouarroudj.F Page 2

Mme Laboudi Bouarroudj.F Page 3

comporte comme la variance de X en moyenne.

- La variance empirique « modifiée » est définie par :

6. La fonction de répartition empirique :

Mme Laboudi Bouarroudj.F Page 4

Si on note par F la fonction de répartition de X , alors

Mme Laboudi Bouarroudj.F Page 5

Mme Laboudi Bouarroudj.F Page 6

D’où les variables aléatoires X n et X i  X n sont indépendantes et par conséquent

Et Y suit la loi de khi deux à n 2 degré de liberté :  2

- Si X et Y sont indépendantes alors X  Y suit la loi de khi deux à n 1 n 2 degré de liberté :

Mme Laboudi Bouarroudj.F Page 8

Mme Laboudi Bouarroudj.F Page 9

On appelle fonction de vraisemblance, et on note par L , la fonction définie par :

2. X : suit la loi géométrique

Mme Laboudi Bouarroudj.F Page 10

3. X : suit la loi de Poisson

4. X : suit la loi exponentielle :

9. Familles de lois exponentielles :

Mme Laboudi Bouarroudj.F Page 11

f  x,   a b x  e c  d  x 

 e x log e 1 x log1 I0 ,1 x 

P  X  x  s’écrit sous la forme a b x  e c  d  x 

2. X suit la loi de Poisson

Mme Laboudi Bouarroudj.F Page 12

La loi de Poisson appartient à la famille de lois exponentielle d’ordre 1 .

f  x  s’écrit sous la forme am  b x  e c m d  x 

Donc la loi N m, 1 appartient à la famille de lois exponentielles d’ordre 1.

4. X suit la loi de Cauchy  

La loi de Cauchy n’appartient pas à la famille des lois exponentielles.

Mme Laboudi Bouarroudj.F Page 13

Vous aimerez peut-être aussi