9. Distributions dechantillonnage
MTH2302D
S. Le Digabel et F. Gilbert,
Ecole Polytechnique de Montreal
A2013
(v3)
MTH2302D: distributions dechantillonnage 1/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Plan
1.
Echantillons aleatoires
2. Statistiques et distributions echantillonnales
3. Distribution echantillonnale de la moyenne
4. Distribution echantillonnale de la variance
5. Loi t de Student
6. Distribution echantillonnale dune dierence de deux
moyennes
7. Distribution echantillonnale dun rapport de variances
MTH2302D: distributions dechantillonnage 2/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
1.
Echantillons aleatoires
2. Statistiques et distributions echantillonnales
3. Distribution echantillonnale de la moyenne
4. Distribution echantillonnale de la variance
5. Loi t de Student
6. Distribution echantillonnale dune dierence de deux
moyennes
7. Distribution echantillonnale dun rapport de variances
MTH2302D: distributions dechantillonnage 3/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Introduction
But
Tirer des conclusions au sujet dune population sans avoir `a
examiner toutes les unites experimentales (dicile ou impossible).
Comment ?
On prel`eve un sous-ensemble (echantillon) de la population et on
tire des conclusions sur la population `a partir des resultats obtenus
avec lechantillon.
Par exemple, on estime la moyenne de la population avec la
moyenne echantillonnale.
MTH2302D: distributions dechantillonnage 4/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Denition dun echantillon aleatoire
Un echantillon aleatoire de taille n de la variable aleatoire X est
une suite de variables aleatoires independantes X
1
, X
2
, . . . , X
n
ayant toutes la meme distribution que X.
Une suite x
1
, x
2
, . . . , x
n
de valeurs prises par les v.a. X
i
est une
realisation de lechantillon.
Remarque
On suppose habituellement que la population est innie ou que la
taille de lechantillon est beaucoup plus petite que la taille de la
population.
MTH2302D: distributions dechantillonnage 5/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Exemple 1
On fait lhypoth`ese que la taille (en cm) des 4000 etudiants
masculins dune ecole de genie est une variable aleatoire X
distribuee normalement, cest-`a-dire que X N(,
2
).
Un echantillon aleatoire de taille 50 de cette population est une
suite de 50 variables aleatoires X
i
N(,
2
), i = 1, 2, . . . , 50.
MTH2302D: distributions dechantillonnage 6/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Param`etres dune population
La moyenne echantillonnale X =
1
n
n
i=1
X
i
La variance echantillonnale S
2
=
1
n 1
n
i=1
(X
i
X)
2
Si X N(,
2
), alors X, et nX sont exactement normales,
meme pour de petits echantillons.
MTH2302D: distributions dechantillonnage 14/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Distribution de la moyenne X (suite)
On peut egalement denir la variable aleatoire
Z =
X
/
n
qui suit approximativement une loi N(0, 1).
Remarques
Si X N(,
2
), alors Z est exactement normale, meme
pour de petits echantillons.
4
.
Soit S
2
la variance echantillonnale. Alors
1. E(S
2
) =
2
(S
2
est un estimateur non-biaise de
2
)
2. V(S
2
) =
4
_
2
n 1
+
2
3
n
_
Remarques
,
3. (x) = (x 1)(x 1) pour x > 1,
4. Si x = n N alors (n) = (n 1)! ,
5. Voir page 139.
MTH2302D: distributions dechantillonnage 20/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
La loi du khi-deux
Soit Z
1
, Z
2
, . . . , Z
k
des variables aleatoires independantes et
identiquement distribuees selon une loi normale N(0, 1). Alors la
variable aleatoire
W = Z
2
1
+Z
2
2
+ +Z
2
k
suit une loi du khi-deux `a k degres de liberte. On note W
2
k
. La
fonction de densite de W est
f(w) =
_
_
1
2
k/2
(k/2)
w
(k/2)1
e
w/2
si w 0 ,
0 sinon.
Remarques :
2
1
(N(0, 1))
2
et
2
k
(k/2, 1/2).
MTH2302D: distributions dechantillonnage 21/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
La loi du khi-deux (suite)
Soit W
2
k
. Alors
1. E(W) = k.
2. V(W) = 2k.
3. Le quantile
2
;k
est deni par P(W >
2
;k
) = avec
0 1.
Calculs avec la loi du khi-deux
En R :
2
;k
est donne par qchisq(1-,k).
En Excel : LOI.KHIDEUX.INVERSE.DROITE(,k).
Exemple 6
Calculer
2
0.1;3
et P(X 11.07) si X
2
5
.
MTH2302D: distributions dechantillonnage 22/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Additivite la loi du khi-deux
Theor`eme
Soient W
1
, W
2
, . . . , W
p
des v.a. khi-deux `a k
1
, k
2
, . . . , k
p
degres de
liberte respectivement. Alors
Y = W
1
+W
2
+. . . +W
p
suit une loi du khi-deux `a k = k
1
+k
2
+ k
p
degres de liberte.
MTH2302D: distributions dechantillonnage 23/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Additivite la loi du khi-deux
Application du theor`eme dadditivite
Soit Z
1
, Z
2
, . . . , Z
n
un echantillon aleatoire de Z N(0, 1).
On denit
A =
n
i=1
Z
2
i
, B =
n
i=1
(Z
i
Z)
2
et C = n(Z)
2
.
On peut montrer que A = B +C.
De plus, A
2
n
et C
2
1
.
On en deduit, dapr`es le theor`eme precedent, que B
2
n1
, car
seule la loi
2
n1
, additionnee `a une loi
2
1
, peut donner une loi
2
n
.
MTH2302D: distributions dechantillonnage 24/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Distribution de la variance S
2
(suite)
Theor`eme
Soit X
1
, X
2
, . . . , X
n
un echantillon aleatoire de taille n dune
variable aleatoire normale X N(,
2
) et S
2
la variance
echantillonnale. Alors la variable aleatoire
W =
(n 1)S
2
2
suit une loi khi-deux avec n 1 degres de liberte.
MTH2302D: distributions dechantillonnage 25/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Distribution de la variance S
2
(suite)
Le theor`eme precedent nous permet de caracteriser la distribution
echantillonnale de S
2
.
Soit W
2
n1
, avec E(W) = n 1 et V(W) = 2(n 1). On a :
P(S
2
b) = P
_
(n1)S
2
2
(n1)b
2
_
= P
_
W
(n1)b
2
_
E(S
2
) = E
_
2
n1
W
_
=
2
n1
E(W) =
2
V(S
2
) = V
_
2
n1
W
_
=
4
(n1)
2
V(W) =
2
4
n1
Remarque : Ces resultats ne sont valides que si la population X
suit une loi N(,
2
).
MTH2302D: distributions dechantillonnage 26/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Exemple 7
On fait lhypoth`ese que la taille (en cm) des 4000 etudiants
masculins dune ecole de genie est une variable aleatoire normale
X de moyenne 175 et variance 10
2
, cest-`a-dire
X N( = 175,
2
= 10
2
).
On choisit 10 echantillons de taille 50 de la population X.
Pour combien de ces echantillons sattend-on `a avoir une variance
echantillonnale S
2
dau plus 101 ?
MTH2302D: distributions dechantillonnage 27/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
1.
Echantillons aleatoires
2. Statistiques et distributions echantillonnales
3. Distribution echantillonnale de la moyenne
4. Distribution echantillonnale de la variance
5. Loi t de Student
6. Distribution echantillonnale dune dierence de deux
moyennes
7. Distribution echantillonnale dun rapport de variances
MTH2302D: distributions dechantillonnage 28/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Loi t de Student
Rappel
Si X
1
, X
2
, . . . , X
n
est un echantillon aleatoire de taille n de la
variable aleatoire X, o` u E(X) = et V(X) =
2
, alors
Z =
X
/
n
suit approximativement une loi N(0, 1). Cette variable aleatoire est
un pivot permettant de denir un intervalle de conance pour .
MTH2302D: distributions dechantillonnage 29/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Loi t de Student (suite)
Si la variance
2
de la population nest pas connue, on remplace
par lecart-type echantillonal S =
S
2
, S
2
etant la variance
echantillonnale.
On obtient alors la variable aleatoire
T =
X
S/
n
Cette v.a. est approximativement normale si n est susamment
grand. Si X N(,
2
), on peut montrer que T suit une loi de
Student. Cette loi est valide pour les petits et les grands
echantillons.
MTH2302D: distributions dechantillonnage 30/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Loi t de Student (suite)
Soit Z une variable aleatoire normale N(0, 1) et W une variable
aleatoire khi-deux `a k degres de liberte. Si Z et W sont
independantes alors la variable aleatoire
T =
Z
_
W/k
suit une loi t de Student avec k degres de liberte. On note T t
k
.
La fonction de densite de T est
f(t) =
_
k+1
2
_
k
_
k
2
_
_
t
2
k
+ 1
_
k+1
2
pour tout t R.
MTH2302D: distributions dechantillonnage 31/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Loi t de Student (suite)
Soit T t
k
. Alors
1. E(T) = 0.
2. V(T) =
k
k2
pour k > 2 (variance innie pour k = 1 et 2).
3. On denit le quantile t
;k
de T par P(T > t
;k
) = avec
0 1.
Propriete
La fonction de densite f(t) est symetrique par rapport `a sa
moyenne 0 et alors t
;k
= t
1;k
.
Theor`eme
La loi t
k
est approximativement identique `a une loi normale N(0, 1)
lorsque k est grand.
MTH2302D: distributions dechantillonnage 32/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Calculs avec la loi de Student
Si on cherche le quantile t
;k
tel que P(T
k
> t
;k
) = :
En R : t
;k
est donne par qt(1-,k).
En Excel : -LOI.STUDENT.INVERSE.N(,k).
Exemple 8
Calculer t
0.9;3
et P(X 2.015) si X T
5
.
MTH2302D: distributions dechantillonnage 33/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Utilisation de la loi de Student
Theor`eme
Soit X
1
, X
2
, . . . , X
n
un echantillon de taille n dune variable
aleatoire normale X N(,
2
). Soit aussi X et S
2
la moyenne et
la variance echantillonnale. On peut montrer que X et S
2
sont
independantes, de sorte que la statistique
T =
X
S/
n
suit une loi de Student avec n 1 degres de liberte.
MTH2302D: distributions dechantillonnage 34/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Exemple 9
Supposons que lon sinteresse maintenant `a la taille (en cm) des
2000 etudiantes dune ecole de genie.
On suppose que la taille X suit une loi normale de moyenne 170
(la variance est inconnue).
Si on choisit un echantillon de taille 25 de cette population, quelle
est la probabilite que le rapport
X 170
S
soit inferieur `a 0.26 ?
MTH2302D: distributions dechantillonnage 35/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
1.
Echantillons aleatoires
2. Statistiques et distributions echantillonnales
3. Distribution echantillonnale de la moyenne
4. Distribution echantillonnale de la variance
5. Loi t de Student
6. Distribution echantillonnale dune dierence de deux
moyennes
7. Distribution echantillonnale dun rapport de variances
MTH2302D: distributions dechantillonnage 36/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Distribution dune dierence de moyennes
Considerons maintenant deux echantillons aleatoires independants
X
1
, X
2
, . . . , X
n
X
et Y
1
, Y
2
, . . . , Y
n
Y
de deux variables aleatoires X
et Y de moyenne et variance
X
,
2
X
et
Y
,
2
Y
respectivement.
On sinteresse `a la dierence des moyennes echantillonnales XY .
Theor`eme
Dans la situation decrite ci-dessus
1. E(X Y ) =
X
Y
.
2. V(X Y ) =
2
X
n
X
+
2
Y
n
Y
.
MTH2302D: distributions dechantillonnage 37/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Distribution dune dierence de moyennes (suite)
Theor`eme
La variable aleatoire
Z =
X Y (
X
Y
)
_
2
X
n
X
+
2
Y
n
Y
suit approximativement une loi normale N(0, 1) lorsque n
X
et n
Y
sont grands.
Remarque : Z suit exactement une loi N(0, 1) si X N(
X
,
2
X
)
et Y N(
Y
,
2
X
).
MTH2302D: distributions dechantillonnage 38/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Exemple 10
Soit X N(175, 10
2
) et Y N(170, 9
2
) la taille (en cm) des
etudiants et etudiantes dune ecole de genie.
On choisit un echantillon de taille 50 de X et un echantillon de
taille 25 de Y .
Quelle est la probabilite que la dierence X Y soit inferieure `a
4 cm?
MTH2302D: distributions dechantillonnage 39/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
1.
Echantillons aleatoires
2. Statistiques et distributions echantillonnales
3. Distribution echantillonnale de la moyenne
4. Distribution echantillonnale de la variance
5. Loi t de Student
6. Distribution echantillonnale dune dierence de deux
moyennes
7. Distribution echantillonnale dun rapport de variances
MTH2302D: distributions dechantillonnage 40/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Distribution dun rapport de variances
Considerons `a nouveau deux echantillons aleatoires independants,
de taille n
X
et n
Y
, des variables aleatoires X et Y .
On suppose que X et Y suivent des lois normales N(
X
,
2
X
) et
N(
Y
,
2
Y
) respectivement.
On sinteresse au rapport des variances echantillonnales S
2
X
/S
2
Y
.
MTH2302D: distributions dechantillonnage 41/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Loi de Fisher
Soient U et V deux variables aleatoires independantes suivant une
loi du khi-deux avec u et v degres de liberte, respectivement. Alors
la variable aleatoire
Y =
U/u
V/v
suit une loi de Fisher `a u et v degres de liberte. On note Y F
u,v
.
La fonction de densite Y est
f(y) =
_
_
(
u+v
2
)
_
u
v
_
u/2
(
u
2
)(
v
2
)
y
(u/2)1
__
u
v
_
y + 1
_
(u+v)/2
si y 0 ,
0 si y < 0.
MTH2302D: distributions dechantillonnage 42/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Loi de Fisher (suite)
Soit Y F
u,v
. Alors
1. E(Y ) =
v
v 2
si v > 2.
2. V(Y ) =
2v
2
(u +v 2)
u(v 2)
2
(v 4)
si v > 4.
3. Le quantile F
;u,v
est deni par P(Y > F
;u,v
) = avec
0 1.
Propriete
Par la denition de la loi de Fisher, 1/Y F
v,u
et on trouve que
F
1;u,v
=
1
F
;v,u
(attention `a linversion des indices !)
MTH2302D: distributions dechantillonnage 43/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Calculs avec la loi de Fisher
Si on cherche le quantile F
;u,v
tel que P(Y > F
;u,v
) = :
Les quantiles de F
u,v
sont donnes `a la page 480 du livre.
En R : F
;u,v
est donne par qf(1-,u,v).
En Excel : F
;u,v
est donne par INVERSE.LOI.F.N(1-,u,v).
Exemple 11
Calculer F
0.75;11,10
et P(X 200) si X F
2,1
.
MTH2302D: distributions dechantillonnage 44/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Distribution dun rapport de variances (suite)
Theor`eme
Soit X
1
, X
2
, . . . , X
n
X
et Y
1
, Y
2
, . . . , Y
n
Y
deux echantillons
aleatoires independants, de taille n
X
et n
Y
, des variables aleatoires
X et Y .
On suppose que X et Y suivent des lois normales N(
X
,
2
X
) et
N(
Y
,
2
Y
) respectivement.
Soit S
2
X
et S
2
Y
les variances echantillonnales. Alors la variable
aleatoire
Y =
S
2
X
/
2
X
S
2
Y
/
2
Y
suit une loi de Fisher `a n
X
1 et n
Y
1 degres de liberte.
MTH2302D: distributions dechantillonnage 45/46
1/7 2/7 3/7 4/7 5/7 6/7 7/7
Exemple 12
Soit X N(175, 10
2
) et Y N(170, 9
2
) la taille (en cm) des
etudiants et etudiantes dune ecole de genie.
On choisit un echantillon de taille 50 de X et un echantillon de
taille 25 de Y .
Quelle est la probabilite que le rapport
S
2
X
S
2
Y
soit inferieur `a 3.0 ?
MTH2302D: distributions dechantillonnage 46/46