Académique Documents
Professionnel Documents
Culture Documents
A- 1 Introduction
Etude Statistique = tude des caractristiques (variables statistiques) dun ensemble d'objets (population, compose d'individus) . Recensement : les valeurs des variables sont disponibles sur l'ensemble de la population statistique descriptive (pas besoin de stat infrentielle) Ex : Recensement de la population franaise, notes obtenues par tous les candidats un examen, salaires de tous les employs d'une entreprise, Pbme : coteux, long, impossible (population infinie), mesures destructrices (ex : tests en vieillissement acclrs) Sondage : On n'tudie qu'une partie de la population : un chantillon. Les mthodes permettant de raliser un chantillon de bonne qualit (sui ressemble la population dont il est issu) sont tudies en thorie de lchantillonnage. On cherche alors extrapoler la population entire les proprits mises en vidence sur l'chantillon statistique infrentielle
.
frquence de ralisation
0.00000
0.00005
0.00010
0.00015
2 0 0 0
4 0 0 0 v a le u r s
6 0 0 0 p o s s i b le s
8 0 0 0
1 0 0 0 0
1000
2000
3000 x
4000
5000
6000
caractrise par une densit jointe (variables continues) ou une squence des frquences jointes (variables discrtes).
Ex : les variations simultanes du salaire et de lage des salaris pourront tre dcrites par une fonction de densit jointe f(x,z).
possdant diffrentes caractristiques, par exemple un vecteur esprance, une matrice de variance covariance , un coefficient de corrlation linaire.
La pertinence de ces mthodes repose en premier lieu sur la qualit du sondage effectu thorie de lchantillonnage.
B- Thorie de lchantillonnage
B-1 Introduction
Echantillonnage par grappe : on tire au hasard des grappes ou familles dindividus, et on examine tous les individus de la grappe (ex: on tire des immeubles puis on interroge tous les habitants). La mthode est dautant meilleure que les grappes se ressemblent et que les individus dune mme grappe sont diffrents, contrairement aux strates.
Dans toute la suite du cours, on se place dans le cadre dun chantillonnage alatoire simple, sauf mention contraire.
1 sondage :
2 sondage:
( x1 ,....x100 )
frquence de ralisation 0.00020 0.00030
On pourrait rpter le sondage un grand nombre de fois, on obtiendrait la plupart du temps une rpartition diffrente des valeurs prleves. x = 2050.7 s x = 2959.1 x = 2153.8 s x = 3002.2 Le rsultat dun sondage est alatoire
0.00000 0.00010 0 2000 4000 6000 8000 10000 12000 v a le u r s p o s s i b le s
( x1 ,....x100 )
= ( X (1 ), .... X (100 ))
1 sondage :
2 sondage :
( X 1 ,..., X n )
S = f ( X1 ,..., X n )
Lorsque ( X 1 ,..., X n ) = ( x1 ,..., xn ) la ralisation de S vaut s = f ( s1 ,..., sn ) Exemples de statistiques : Moyenne empirique de lchantillon, variance empirique, covariance empirique, fonction de rpartition,..
C- Distributions dchantillonnage
C-1 Notations
On sintresse la caractristique X dune population (X=v.a.). On pose E ( X ) = m, V ( X ) = On note ( X 1 ,..., X n ) lchantillon alatoire associ un sondage alatoire simple de n individus de cette population et ( x1 ,..., xn ) une ralisation de celui ci (1 sondage particulier)
1 n Xn = Xi n i =1
Info :
i ) E ( X n ) = m, ii ) V ( X n ) =
Proprits asymptotiques :
Loi des grands nombres
estimateur de m. Il est : - sans biais (i)) - asymptotiquement efficace (ii)) - fortement convergent (iii)) - la loi de lerreur dapproximation est approximativement gaussienne lorsque n est grand (iv).
distribution de la moyenne
X n approche m : cest un
P p. s. iii ) X n m ; X n m
n= n>n n>n
n>n
iv) n
Xn m
L n ( X n m ) N (0, )
L N (0,1)
n=50
0.40 0.40
n=500
0.35
0.30
0.25
-1.0
-0.5
0.0 x
0.5
1.0
0.25 -1.0
0.30
0.35
-0.5
0.0 x
0.5
1.0
n=1000
0.40 0.40
n=5000
0.35
0.30
0.25
-1.0
-0.5
0.0 x
0.5
1.0
0.25 -1.0
0.30
0.35
-0.5
0.0 x
0.5
1.0
X 1 n Q = = X i , X i B ( p) n n i =1
1 n 2 S = Xi X 2 = X 2 X 2 n i =1
2 n
1 n (*) S = ( X i m) ( X m) n i =1
2 n
V (S )
2 n
4 4
n
Proprits asymptotiques :
2 P 2 p .s. Sn 2 ; Sn 2
Cov( X n , S ) =
2 n
1 1 n n
2 Sn 2
4 4
2 n
L N (0,1)
Dm :
S = Tn ( X m) avec n
Tn 2
4 4
L P N (0,1) et ( X m) 0
X n N m, n 2 nS n 2 (n 1) 2
X m T (n 1) n 1 n S2 n
Fn(x)
1
(n-1)/n 2/n
Pour chaque valeur x R , Fn ( x) est une variable alatoire Pour une ralisation ( x1 ,..., xn ) donne de lchantillon alatoire, cest une fonction en escalier valeurs dans [0,1], croissante, continue droite dans [0,1], de sauts gaux 1/n.
1/n
x1
x2 x3
xn-1 xn
Proprits asymptotiques
Lois des grands nombres :
P p.s. iv) Fn ( x) F ( x) ; Fn ( x) F ( x)
-2
-1
0 x
Si F est continue sur R et X de fdr F, U=F(X) suit une loi uniforme sur [0,1].
k =1