Vous êtes sur la page 1sur 4

Lois limites Echantillonnage

1 Lois Limites
1.1 Exemple
On considre X1, . . . , Xn ,n variables alatoires indpendantes et de mme loi, de moyenne m et d'cart
type .
X1 +...+ X n

Soit Y n =
alors E (Y n ) = m et (Y n ) =
n
n

1.2 Deux thormes fondamentaux


Th 1 : Loi faible des grands nombres
Soient X1; X2 ; . . . Xn n variables alatoires indpendantes et de mme loi de moyenne m alors la
X + X 2 + ... + X n
variable alatoire Y n = 1
vrifie pour tout rel positif :
n
lim p (| Y n m |< ) = 1
n +

Signification: Lorsque n devient trs grand, le nombre de valeurs de la variable alatoire Yn qui sont
loignes de m devient ngligeable devant celui des valeurs proches de m

Th 2 : Thorme de la limite centre ou thorme limite central


Si X1; X2 ; . . . Xn sont n variables alatoires indpendantes et de mme loi de moyenne m et d'cartX + X 2 + ... + X n
type alors la variable alatoire Y n = 1
suit approximativement une loi normale N
n

)
(m,
n

2 Loi d'chantillonnage
Problme : Etude du lien entre les caractristiques d'une population et celle d'un chantillon de cette
population. Dans cette partie on suppose la population connue et l'on tudie les chantillons.
2.1 Distribution d'chantillonnage des moyennes
L'effectif de la population tudie est N, sa moyenne est m et son cart-type .
On prlve dans cette population un chantillon alatoire de taille n. (tirage non exhaustif )
On va alors chercher estimer la moyenne de cet chantillon ainsi que son cart-type.
On appelle distribution d'chantillonnage des moyennes la variable alatoire X qui, tout chantillon
de taille n prlev avec remise, associe la moyenne de cet chantillon.

Pour n suffisamment grand X suit approximativement la loi N (m,


)
n
Si les tirages sont exhaustifs X suit approximativement la loi N (m,

N n
)
N 1

2.2 Distribution d'chantillonnage des frquences ou des pourcentages


L'effectif de la population est N. une certaine partie de pourcentage p possde une certaine proprit.
Soit F la variable alatoire qui, a tout chantillon alatoire prlev avec remise et d'effectif n fix,
associe le pourcentage des lments de cet chantillon possdant cette proprit.
Pour n suffisamment grand F suit approximativement la loi N (p,

Si le tirage est exhaustif alors pour n suffisamment grand F suit la loi N(p,

pq
) o q = 1 p.
n

pq N n
)
n N 1

2.3 Distribution d'chantillonnage des diffrences et des sommes


On considre deux chantillons A et B issus de deux populations. L'chantillon A est d'effectif nA,
l'chantillon B est d'effectif nB.
D'aprs le 1. les distributions d'chantillonnage sont:

'
= A
Pour A: XA de moyenne m'A = mA d'cart type A
nA

'
= B
Pour B: XB de moyenne m'B = mB d'cart type B
nB
En prenant toutes les combinaisons possibles de 2 lments de ces chantillons, on dfinit les distributions
d'chantillonnages des sommes: S = XA + XB ou des diffrences D = XA XB .
Comme E(X + Y) = E(X) + E(Y) et E(X Y) = E(X) E(Y)
la moyenne de la somme est :
E(S) = m'A + m'B
la moyenne de la diffrence est :
E(D) = m'A m'B
Comme : Si X et Y sont indpendants
et

V(X + Y) = V(X) + V(Y)


V(X Y) = V(X) + V(Y) !

Si les chantillons sont indpendants, l'cart type de la somme et l'cart type de la


diffrence sont gaux : S = D =

' A2 + 'B2

A2
nA

B2
nB

2.4 Distribution d'chantillonnage des variances (hors programme?)


On appelle distribution d'chantillonnage des variances la variable alatoire S qui, tout chantillon de
taille n prlev avec remise, associe la variance de cet chantillon.
La moyenne de la distribution d'chantillonnage des variances est E(S 2 ) =

n 1 2

3 Estimation
Dans cette partie, nous allons chercher des informations sur la population connaissant les
caractristiques d'un chantillon. Il s'agit en fait de faire l'inverse de ce qui a t fait dans la partie
prcdente.

3.1 Estimation ponctuelle


Moyenne: On choisit la moyenne x d'un chantillon prlev au hasard comme estimation de la moyenne
de la population.
Frquence (ou proportion): On choisit la proportion f des lments possdant une certaine proprit dans
un chantillon prlev au hasard comme estimation de la proportion inconnue de la population.
n
'2 comme estimation de la variance inconnue 2 de la
n 1
population. (n est l'effectif et '2 la variance de l'chantillon prlev au hasard dans la population)
n
L'cart type de la population est estim par =
'.
n-1

Variance, cart-type: On choisit le nombre

rem : Dans le cas o n n'est pas petit par rapport N et o le tirage des lments de l'chantillon est sans
remise alors on prend pour estimation ponctuelle de l'cart-type de la population le nombre
N n
=
n N 1

3.2 Estimation par intervalle de confiance d'une moyenne


On commence par se fixer un coefficient de confiance (95% ou 99% ou . . .) et on va chercher un intervalle
de confiance de la moyenne pour ce coefficient , c'est dire trouver un intervalle [a, b] tel que l'on soit sr
95% (ou 99% ou . . . ) que la moyenne est dans cet intervalle.
On a vu ( 2. ) que pour n assez grand (n 30) la distribution d'chantillonnage des moyennes suivait

)
peu prs la loi N (m;
n
donc la v.a.r. T =

n
(X m) suit la loi normale

N (0;1)

alors si t 0 Prob(t T t) = 2(t) 1

Trouver un intervalle de confiance 95% c'est d'abord trouver t tel que


Prob(t T t) = 0,95
On sait que ceci est vrai pour t = 1,96 ( voir feuille loi normale)
Il ne reste plus alors qu' en dduire l'intervalle de confiance sur X
n
X -m 1,96 m- 1,96 X m+1,96
( X -m) 1,96 - 1,96
-1,96

n
n
n
n
Donc avant de prlever un chantillon de taille n, il y a 95% de chances que sa moyenne soit dans
; m + 1,96 ]
l'intervalle [m-1,96
n
n

Mais on peut aussi crire la place de la dernire ingalit

-m - X +1,96 d'o X + 1,96 -m X -1,96


n
n
n
n
m X +1,96
Ce qui peut s'crire X - 1,96
n
n
- X - 1,96

Donc aprs avoir prlev un chantillon de taille n, on peut estimer qu'il y a 95% de chances que la
; x + 1,96 ] o x reprsente la
moyenne de la population soit dans l'intervalle [ x -1,96
n
n
moyenne de l'chantillon.
Rem 1 : Ne connaissant pas on dtermine cette valeur l'aide d'une estimation ponctuelle.
Rem 2 : Pour les intervalles de confiance aux autres taux il faut utiliser les valeurs de t associes aux
autres valeurs.

3.3 Estimation par intervalle de confiance d'une frquence ( ou pourcentage)


On a vu que pour n assez grand, la distribution d'chantillonnage des frquences suivait
pq
approximativement une loi N (p;
)
n
Il suffit alors de reprendre des calculs identiques ceux du 3.2 pour dterminer un intervalle de
confiance.
Exemple : L'intervalle de confiance au taux de 99% pour une frquence est l'intervalle :
f(1-f)
f(1-f)
[f-2.58
; f+2.58
]
n-1
n-1