Vous êtes sur la page 1sur 11

U.F.R. S.P.S.E.

UNIVERSITE PARIS X NANTERRE


Licence de psychologie L3
PLPSTA02 Bases de la statistique infrentielle
CORRIGE DES EXERCICES : Distributions d'chantillonnage - Intervalles de variation
Exercice 1
P={lves du secondaire}
X= rsultat de fluidit au test de pense Crative de Torrance, variable quantitative de moyenne connue =20, et d'cart-
type connu =6,5 dans P.
Echantillons de taille n de X issu de P pour lesquels x , s et s* ne sont pas calculs.
1) On peut prvoir le rsultat moyen observ x pour chaque chantillon par la moyenne de la moyenne empirique
n
X qui
est gale puisque
n
X est un estimateur sans biais de : cette prvision est constante pour tous les chantillons et
vaut =20.
2) On peut calculer la variance (cart-type) du rsultat moyen par la variance (cart-type) de la moyenne empirique
n
X qui
est gale
n
2

(gal
n

) qui varie avec la taille de l'chantillon : plus la taille de l'chantillon est grande plus la
variance (cart-type) est faible d'o une plus grande prcision dans l'estimation (cf tableau ci-dessous colonnes 3 et 4).
distribution de la variance
empirique
distribution de l'cart-type
empirique
taille distribution de la moyenne empirique
n
X
sans biais * S
2
n
biaise
2
n
S sans biais
*
S
n
biais S
n
n
moyenne

variance
n
2

cart-type
n

moyenne

2
moyenne
( )
2
n
1 n

moyenne

moyenne

n
1 n
1 20 42,25 6,5 42,25 6,5
20 20 2,1125 1,4534 42,25 40,1375 6,5 6,3354
50 20 0,845 0,9192 42,25 41,4050 6,5 6,4347
100 20 0,4225 0,65 42,25 41,8275 6,5 6,4674
remarque : on pourra affiner la prvision du rsultat moyen observ en calculant un intervalle de variation au risque
(par exemple =5%) de la moyenne empirique
n
X en utilisant l'approximation normale sur
n
X pour les deux
chantillons de taille 50 et 100 (n30), qui prdira le rsultat moyen observ avec un risque d'erreur de (=5%) en
faisant intervenir sa moyenne et son cart-type
n

: ( )
(



n
z X I
975 , 0 n % 95
pour n=50 ( ) | | | | | | 8 , 21 ; 2 , 18 8 , 1 20 9192 , 0 96 , 1 20 X I
n % 95
= =
pour n=100 ( ) | | | | | | | | 3 , 21 ; 7 , 18 3 , 1 20 274 , 1 20 65 , 0 96 , 1 20 X I
n % 95
= =
3) On peut prvoir la variance observe du rsultat, biaise s
2
ou sans biais s*
2
pour chaque chantillon, par la moyenne de
la variance empirique biaise
2
n
S ou sans biais * S
2
n
.
- la moyenne de
2
n
S est gale ( )
2
n
1 n

:
2
n
S est un estimateur biais de
2
qui sous estime toujours
2
. Cette
prvision varie avec la taille de l'chantillon : plus la taille de l'chantillon est grande plus le biais est faible, d'o une
prvision qui se rapproche de
2
(cf tableau ci-dessus colonne 6).
- la moyenne de * S
2
n
est gale
2
puisque * S
2
n
est un estimateur sans biais de
2
: cette prvision est constante pour
tous les chantillons et vaut
2
=6,5
2
=42,25 (cf tableau ci-dessus colonne 5).
On peut prvoir l'cart-type observ du rsultat, biais s ou sans biais s* pour chaque chantillon, par la moyenne de
l'cart-type empirique biais S
n
ou sans biais
*
S
n
.
- la moyenne de S
n
est gale

n
1 n
: S
n
est un estimateur biais de qui sous estime toujours . Cette prvision
varie avec la taille de l'chantillon : plus la taille de l'chantillon est grande plus le biais est faible, d'o une prvision
qui se rapproche de = 6,5 (cf tableau ci-dessus colonne 8).
- la moyenne de
*
S
n
est gale puisque
*
S
n
est un estimateur sans biais de : cette prvision est constante pour tous
les chantillons et vaut =6,5 (cf tableau ci-dessus colonne 7).
2
Exercice 2
P={franais recenss en 1999}
X= ge, variable quantitative X~N( =39, =23) dans P.
Echantillons de taille n=25 de X issu de P
1) La moyenne empirique de l'ge,
25
X a une distribution normale de moyenne =39, de variance 16 , 21
25
23
n
2 2
= =

et
d'cart-type 6 , 4
25
23
n
= =

puisque X a une distribution normale de moyenne =39 et d'cart-type =23 dans P.


2) ( ) ( ) ( ) ( ) 000021 , 0 999979 , 0 1 1 , 4 F 1 13 , 4 F 1 13 , 4 F
6 , 4
39 20
Z P 20 X P
25
= = = =
|
.
|

\
|
=
o F est la fonction de rpartition de la loi N(0,1).
quasiment aucun des chantillons de taille 25 de X issus de P ont un ge moyen observ infrieur 20 ans.
3) ( ) ( ) ( ) 20 X P 60 X P 60 X 20 P
25 25 25
= avec ( ) 000021 , 0 20 X P
25
= et
( ) ( ) ( ) 999998 , 0 6 , 4 F 565 , 4 F
6 , 4
39 60
Z P 60 X P
25
= =
|
.
|

\
|
= d'o ( ) = 60 X 20 P
25
0,999998 0,000021=0,999977
o F est la fonction de rpartition de la loi N(0,1).
quasiment tous les chantillons de taille 25 de X issus de P ont un ge moyen observ compris entre 20 et 60 ans.
4) Intervalle de variation 90% (au risque =10%) de l'ge moyen sur les chantillons de taille 25 de X issus de P :
( ) | | | | | | | | | | | | 6 , 46 ; 4 , 31 6 , 7 39 567 , 7 39 645 , 1 6 , 4 39 z 6 , 4 39 Q ; Q I
95 , 0 95 , 0 05 , 0 n % 90
X = = = = =
car z
1(/2)
=z
0,95
=1,645 est le quantile d'ordre 0,95 de la loi N(0,1).
90% des chantillons de taille 25 de X issus de P ont un ge moyen compris entre 31,4 et 46,6 ans.
Intervalle de variation 95% (au risque =5%) de l'ge moyen sur les chantillons de taille 25 de X issus de P :
( ) | | | | | | | | | | | | 48 ; 30 9 39 016 , 9 39 96 , 1 6 , 4 39 z 6 , 4 39 Q ; Q I
975 , 0 975 , 0 025 , 0 n % 95
X = = = = =
car z
1(/2)
=z
0,975
=1,96 est le quantile d'ordre 0,975 de la loi N(0,1).
95% des chantillons de taille 25 de X issus de P ont un ge moyen compris entre 30 et 48 ans.
la valeur de la borne infrieure de cet intervalle de variation 95% ne peut plus remettre en cause l'hypothse de
normalit faite sur la variable moyenne empirique de l'ge sur les chantillons de taille 25.
5) On observe un ge moyen de 35 ans, alors qu'on s'attendait "raisonnablement" (dans 95% des cas) observer un ge
moyen compris entre 30 et 48 ans, ce qui n'est pas surprenant : on ne peut donc pas mettre en cause la reprsentativit
de l'chantillon pour la variable ge dans la population des femmes franaises du recensement de 1990.
6) La demi-longueur de l'intervalle de variation 95% de l'ge moyen ( )
n % 95
X I est denviron 9 ans (cf question 4) ; pour
obtenir une demi-longueur plus faible, de 2 ans maximum, il faudrait donc plus de 25 femmes. Pour n inconnu, =23 et
=5% connus, la demi-longueur de l'intervalle ( )
n % 95
X I s'crit :
n
23
96 , 1
n
z
975 , 0
=

.
On cherche n tel que : 2
n
23
96 , 1 c'est dire n
2
23 96 , 1

d'o 05 , 508 54 , 22
2
23 96 , 1
n
2
2
= =
|
.
|

\
|

on choisirait donc une taille d'chantillon au moins gale 509 pour que la demi-longueur de l'intervalle de pari
95% soit infrieure 2 ans. On aurait donc une marge d'erreur 95% dau plus 2 ans dans lestimation de la
moyenne d'ge dans P, cest dire dans lintervalle [39 2] soit entre 37 et 41 ans, pour 95% des chantillons de
taille n = 509.
3
Exercice 3
P={enfants de 12 ans}
X= rsultat au test de richesse et de prcision du vocabulaire, variable quantitative de moyenne connue =60, et d'cart-
type connu =10 dans P.
Echantillons de taille n de X issu de P pour lesquels x , s et s* ne sont pas calculs.
1) La moyenne empirique
n
X a pour moyenne =60 (puisque
n
X est un estimateur sans biais de ) : cette moyenne est
constante quelle que soit la taille des chantillons (cf tableau ci-dessous colonne 2).
La moyenne empirique
n
X a pour variance
n
2

et pour cart-type
n

qui varient avec la taille des chantillons : plus


la taille de l'chantillon est grande plus variance et cart-type sont faibles, d'o une plus grande prcision dans
l'estimation (cf tableau ci-dessous colonnes 3 et 4).
La forme de la distribution de la moyenne empirique
n
X est inconnue (quelconque) tant que la taille de l'chantillon est
faible (n<30) puisque la distribution de X est inconnue (quelconque). Lorsque la taille de l'chantillon est suffisamment
grande (n30), on peut considrer, d'aprs le thorme central-limite, que la distribution de
n
X est approximativement
normale |
.
|

\
|

n
, N (cf tableau ci-dessous colonne 5).
taille distribution de la moyenne empirique
n
X
n moyenne variance cart-type forme ( ) 63 X P
n
>
1 60 100 10 inconnue inconnue
4 60 25 10/2=5 inconnue inconnue
8 60 12,5 10/22=3,54 inconnue inconnue
16 60 6, 10/4=2,5 inconnue inconnue
32 60 3,125 10/42=1,77 approx. normale 0,04460
64 60 1,5625 10/8=1,25 approx. normale 0,00820
100 60 1 10/10=1 approx. normale 0,00135
2) Pour un chantillon de taille n=16 la forme de la distribution de la moyenne empirique
n
X est inconnue (quelconque)
puisque n<30. Il est donc impossible de calculer cette probabilit.
3) Pour un chantillon de taille n=32 la forme de la distribution de la moyenne empirique
n
X est approximativement
normale puisque n30. Il est donc possible de calculer cette probabilit de manire approche :
( ) ( ) ( ) 0446 , 0 9554 , 0 1 7 , 1 F 1
768 , 1
60 63
Z P 1 63 X P 1 63 X P
32 32
= =
|
.
|

\
|
= >
o F est la fonction de rpartition de la loi N(0,1).
environ 4,46% des chantillons de taille 32 de X issus de P ont un rsultat moyen suprieur 63.
4) Cette probabilit diminue avec la taille de l'chantillon puisque l'cart-type de la moyenne empirique
n
X diminue (cf
tableau ci-dessus colonne 4) : la distribution de
n
X tant donc plus concentre autour de sa moyenne =60, la
probabilit ( ) 63 X P
n
> reprsente par la surface droite de la valeur 63 sous la densit de la loi de
n
X
(approximativement normale pour n30), sera plus petite.
Pour n30
n
X est approximativement normale, il est donc possible de calculer cette probabilit de manire approche :
pour n=64 ( ) ( ) ( ) 0082 , 0 9918 , 0 1 4 , 2 F 1
25 , 1
60 63
Z P 1 63 X P 1 63 X P
64 64
= = =
|
.
|

\
|
= >
o F est la fonction de rpartition de la loi N(0,1).
environ 0,82% des chantillons de taille 64 de X issus de P ont un rsultat moyen suprieur 63.
pour n=100 ( ) ( ) ( ) ( ) 00135 , 0 99865 , 0 1 3 F 1
1
60 63
Z P 1 63 X P 1 63 X P
100 100
= = =

= >
o F est la fonction de rpartition de la loi N(0,1).
environ 0,135% des chantillons de taille 100 de X issus de P ont un rsultat moyen suprieur 63.
quand la taille de l'chantillon augmente, il est de moins en moins probable d'observer un rsultat moyen suprieur
63 lorsque la vraie moyenne est gale 60 (cf tableau ci-dessus colonne 6).
4
Exercice 4
P={enfants gs de 7 ans}
X= quotient intellectuel QI, variable quantitative X~N( =100, =10) dans P.
Echantillon de taille n=16 de X issu de P pour lequel 106 = x et s = 13.
1) population chantillon
taille N= ? n = 16
moyenne = 100 106 = x
variance
2
= 10
2
=100 s
2
= 13
2
=169
2) La moyenne empirique du score sur les chantillons de taille 16,
16
X a une distribution normale de moyenne =100, de
variance 25 , 6
16
100
n
2
= =

et d'cart-type 5 , 2
16
10
n
= =

puisque X a une distribution normale de moyenne =100 et


d'cart-type =10 dans P.
3) ( ) ( ) ( ) ( ) 0082 , 0 9918 , 0 1 4 , 2 F 1
5 , 2
100 106
Z P 1 106 X P 1 106 X P X P
16 16 16
= = =
|
.
|

\
|
= = > = > x
o F est la fonction de rpartition de la loi N(0,1).
0,82% des chantillons de taille 16 de X issus de P ont un QI moyen suprieur 106, QI moyen observ.
4) 2,5% des chantillons de taille 16 ont un QI moyen suprieur au QI cherch, donc 97,5% des chantillons de taille 16
ont un QI moyen infrieur au QI cherch, qui est donc par dfinition le quantile d'ordre 0,975 de
16
X :
( ) ( ) 9 , 104 9 , 4 100 96 , 1 5 , 2 100 z 5 , 2 100 Q
975 , 0 975 , 0
= + = + = + =
car z
0,975
=1,96 est le quantile d'ordre 0,975 de la loi N(0,1).
2,5% des chantillons de taille 16 de X issus de P ont un QI moyen suprieur 104,9.
5) Intervalle de variation 95% (au risque =5%) du QI moyen sur les chantillons de taille 16 de X issus de P :
( ) | | | | | | 9 , 104 ; 1 , 95 9 , 4 100 Q ; Q X I
975 , 0 025 , 0 n % 95
= = =
car Q
0,025
est symtrique de Q
0,975
par rapport =100.
( ) | | | | | | | | | | 9 , 104 ; 1 , 95 9 , 4 100 96 , 1 5 , 2 100 z 5 , 2 100 Q ; Q X I
975 , 0 975 , 0 025 , 0 n % 95
= = = = =
car z
1(/2)
=z
0,975
=1,96 est le quantile d'ordre 0,975 de la loi N(0,1).
95% des chantillons de taille 16 de X issus de P ont un QI moyen compris entre 95,1 et 104,9.
6) La moyenne empirique du score sur les chantillons de taille 100,
100
X a une distribution normale de moyenne =100,
de variance 1
100
100
n
2
= =

et d'cart-type 1
100
10
n
= =

puisque X a une distribution normale de moyenne =100 et


d'cart-type =10 dans P.
( ) ( ) ( ) ( ) 0 1 1 6 F 1
1
100 106
Z P 1 106 X P 1 106 X P X P
100 100 100
= = |
.
|

\
|
= = > = > x
o F est la fonction de rpartition de la loi N(0,1).
quasiment aucun chantillon de taille 100 de X issus de P n'a un QI moyen suprieur 106, QI moyen observ.
Le QI cherch, est par dfinition le quantile d'ordre 0,975 de
100
X :
( ) ( ) 96 , 101 96 , 1 100 96 , 1 1 100 z 1 100 Q
975 , 0 975 , 0
= + = + = + =
car z
0,975
=1,96 est le quantile d'ordre 0,975 de la loi N(0,1).
2,5% des chantillons de taille 100 de X issus de P ont un QI moyen suprieur 101,96.
Intervalle de variation 95% (au risque =5%) du QI moyen sur les chantillons de taille 100 de X issus de P :
( ) | | | | | | 96 , 101 ; 04 , 98 96 , 1 100 Q ; Q X I
975 , 0 025 , 0 n % 95
= = =
car Q
0,025
est symtrique de Q
0,975
par rapport =100.
( ) | | | | | | | | 96 , 101 ; 04 , 98 96 , 1 100 z 1 100 Q ; Q X I
975 , 0 975 , 0 025 , 0 n % 95
= = = =
car z
1(/2)
=z
0,975
=1,96 est le quantile d'ordre 0,975 de la loi N(0,1).
95% des chantillons de taille 100 de X issus de P ont un QI moyen compris entre 98,04 et 101,96.
5
7) La demi-longueur de l'intervalle de variation 95% du QI moyen ( )
n % 95
X I est denviron 4,9 points pour les
chantillons de taille n=16 et est denviron 1,96 point pour les chantillons de taille n=100 ; pour obtenir une demi-
longueur plus faible, de 1 point maximum, il faudrait donc plus de 100 enfants. La demi-longueur de l'intervalle
( )
n % 95
X I s'crit :
n
z
975 , 0

avec n inconnu, =10 et =5% connus et pour qu'elle n'excde pas 1 point, il faut que :
1
n
10
z
975 , 0
donc que n 10 96 , 1 c'est dire que n 19,6
2
= 384,16 donc que n 385
on choisirait donc une taille d'chantillon au moins gale 385 pour que la demi-longueur de l'intervalle de pari
95% n'excde pas 1 point. On aurait donc une marge d'erreur 95% maximum de 1 point dans lestimation du QI
moyen dans P, cest dire dans lintervalle [100 1] soit entre 99 et 101 points de QI, pour 95% des chantillons
de taille 385.
Exercice 5
P={enfants gs de 4 12 ans}
X= score au questionnaire CBCL, variable quantitative de moyenne =20 et d'cart-type =14 dans P.
Echantillon de taille n=36 de X issu de P pour lequel 5 , 20 = x .
1) population chantillon
taille N = ? n = 36
moyenne = 20 5 , 20 = x
variance
2
= 14
2
=196
s
2
* = ?
2) Puisque n=36 30, la moyenne empirique du score
36
X a une distribution approximativement normale de moyenne
=20, de variance 44 , 5
36
196
n
2
=

et d'cart-type 33 , 2 44 , 5
36
14
n
=

car X a une distribution de moyenne


=20 et d'cart-type =14.
3) ( ) ( ) ( ) ( ) 5832 , 0 21 , 0 F 214 , 0 F
33 , 2
20 5 , 20
Z P 5 , 20 X P X P
36 36
= = |
.
|

\
|
< = < x o F est la fonction de rpartition de la loi
N(0,1).
environ 58,3% des chantillons de taille 36 de X issus de P ont un score moyen infrieur 20,5, score moyen
observ.
4) ( ) ( ) ( ) ( ) 0162 , 0 9838 , 0 1 14 , 2 F 1 1429 , 2 F 1
33 , 2
20 25
Z P 1 25 X P 1 25 X P
36 36
= = = |
.
|

\
|

= >
environ 1,6% (peu) des chantillons de taille 36 de X issu de P ont un score moyen suprieur 25.
5) 99% des chantillons de taille 36 ont un score moyen infrieur au score cherch, qui est donc par dfinition le quantile
d'ordre 0,99 de
36
X :
( ) ( ) 4 , 25 425 , 25 425 , 5 20 325 , 2 33 , 2 20 z 33 , 2 20 Q
99 , 0 99 , 0
= + = + = +
car z
0,99
=2,325 est le quantile d'ordre 0,99 de la loi N(0,1).
99% des chantillons de taille 36 de P ont un score moyen infrieur 25,4 environ.
6) Intervalle de variation 98% (au risque =2%) du score moyen sur les chantillons de taille 36 de X issus de P :
( ) | | | | | | | | 4 , 25 ; 6 , 14 4 , 5 20 425 , 5 20 Q ; Q X I
99 , 0 01 , 0 n % 98
= =
car Q
0,01
est symtrique de Q
0,99
par rapport =20.
( ) | | | | | | | | | | 4 , 25 ; 6 , 14 4 , 5 20 325 , 2 33 , 2 20 z 33 , 2 20 Q ; Q X I
99 , 0 99 , 0 01 , 0 n % 98
= = =
car z
1(/2)
=z
0,99
=2,325 est le quantile d'ordre 0,99 de la loi N(0,1).
98% des chantillons de taille 36 de X issus de P ont un score moyen compris entre 14,6 et 25,4 environ.
7) La demi-longueur de l'intervalle de variation 98% du score moyen ( )
n % 98
X I est denviron 5,4 points pour les
chantillons de taille n=36 ; pour obtenir une demi-longueur plus faible, de 4 points maximum, il faudrait donc plus de
36 enfants. La demi-longueur de l'intervalle ( )
n % 98
X I s'crit :
n

z
99 , 0
avec n inconnu, =14 et =1% connus et
6
pour qu'elle n'excde pas 4 points, il faut que : 4
n
14
z
99 , 0
donc que n
4
14
325 , 2 c'est dire que
( ) 5 , 66
4
14
325 , 2 n
2
= donc que n 67
on choisirait donc une taille d'chantillon au moins gale 67 pour que la demi-longueur de l'intervalle de pari 98%
n'excde pas 4 points. On aurait donc une marge d'erreur 98% dau plus 4 points dans lestimation du score moyen
dans P, cest dire dans lintervalle [20 4] soit entre 16 et 24 points de QI, pour 98% des chantillons de taille 67.
Exercice 6
P={sujets} X= score de rsistance au stress (test de Stroop), variable quantitative de moyenne =50 et d'cart-type =25
dans P. Echantillon de taille n=30 de X issu de P pour lequel 41 = x .
population chantillon
taille N = ? n = 30
moyenne = 50 41 = x
cart-type = 25
s* = ?
1) Puisque n=30 30, la moyenne empirique du score
30
X a une distribution approximativement normale de moyenne
=50, de variance 83 , 20
30
25
n
2 2
=

et d'cart-type 564 , 4
30
25
n
=

car X a une distribution de moyenne =50 et


d'cart-type =25.
2) ( ) ( ) ( ) ( ) ( ) 0244 , 0 9756 , 0 1 97 , 1 F 1 97 , 1 F 9718 , 1 F
564 , 4
50 41
Z P 41 X P X P
30 30
= = = = |
.
|

\
|

< = < x o F est la
fonction de rpartition de la loi N(0,1).
environ 2,5% (peu) des chantillons de taille 30 de X issus de P ont un score moyen infrieur 41, score moyen
observ.
3) ( ) ( ) ( ) 9756 , 0 0244 , 0 1 41 X P 1 41 X P X P
30 30 30
= = < > = > x avec F fonction de rpartition de la loi N(0,1).
environ 97,5% des chantillons de taille 30 de X issu de P n'a un score moyen suprieur 41, score moyen observ.
4) 5% des chantillons de taille 30 ont un score moyen suprieur au score cherch donc 95% des chantillons de taille 30
ont un score moyen infrieur au score cherch, qui est donc par dfinition le quantile d'ordre 0,95 de
30
X :
( ) ( ) 5 , 57 5 , 7 50 645 , 1 564 , 4 50 z 564 , 4 50 Q
95 , 0 95 , 0
+ + = +
car z
0,95
=1,645 est le quantile d'ordre 0,95 de la loi N(0,1).
95% des chantillons de taille 30 de X issus de P ont un score moyen infrieur 57,5 environ.
5) Intervalle de variation 90% (au risque =10%) du score moyen sur les chantillons de taille 30 de X issus de P :
( ) | | | | | | | | 5 , 57 ; 5 , 42 5 , 7 50 5 , 7 50 Q ; Q X I
95 , 0 05 , 0 n % 90
= =
car Q
0,05
est symtrique de Q
0,95
par rapport =50.
( ) | | | | | | | | | | 5 , 57 ; 5 , 42 5 , 7 50 645 , 1 564 , 4 50 z 564 , 4 50 Q ; Q X I
95 , 0 95 , 0 05 , 0 n % 90
= = =
car z
1(/2)
=z
0,95
=1,645 est le quantile d'ordre 0,95 de la loi N(0,1).
90% des chantillons de taille 30 de X issus de P ont un score moyen compris entre 42,5 et 57,5 environ.
Exercice 7
P={fumeurs} X= score au test de dpendance tabagique de Fagerstrm, variable quantitative de moyenne =5 et d'cart-
type =4,5 dans P. Echantillon de taille n=45 de X issu de P.
population chantillon
taille N = ? n = 45
moyenne = 5 x = ?
cart-type = 4,5 s* = ?
7
1) Puisque n=45 30, la moyenne empirique du score
45
X a une distribution approximativement normale de moyenne
=5, de variance 45 , 0
45
5 , 4
n
2
2
= =

et d'cart-type 67 , 0
45
5 , 4
n
=

car X a une distribution de moyenne =5 et


d'cart-type =4,5.
2) ( ) ( ) 9319 , 0 49 , 1 F
67 , 0
5 6
Z P 6 X P
45
=
|
.
|

\
|
< o F est la fonction de rpartition de la loi N(0,1).
environ 93% des chantillons de taille 45 de X issus de P ont un score moyen infrieur 6.
3) ( ) ( ) ( ) 0014 , 0 9986 , 0 1 99 , 2 F 1 9851 , 2 F
67 , 0
5 3
Z P 3 X P
45
= =
|
.
|

\
|
<
environ 0,14% des chantillons de taille 45 de X issus de P ont un score moyen infrieur 3.
4) ( ) ( ) ( ) 9305 , 0 0014 , 0 9319 , 0 3 X P 6 X P 6 X 3 P
45 45 45
= = < <
environ 93% des chantillons de taille 45 de X issus de P ont un score moyen compris entre 3 et 6.
5) ( ) ( ) ( ) ( ) 0 1 1 5 F 1 97 , 4 F 1
67 , 0
5 9
Z P 1 9 X P 1 9 X P
45 45
=
|
.
|

\
|
= >
quasiment aucun chantillon de taille 45 de X issu de P n'a un score moyen suprieur 9.
6) 90% des chantillons de taille 45 ont un score moyen infrieur au score cherch, qui est donc par dfinition le quantile
d'ordre 0,9 de
45
X :
( ) ( ) 86 , 5 8576 , 5 8576 , 0 5 28 , 1 67 , 0 5 z 67 , 0 5 Q
9 , 0 9 , 0
= + = + = +
car z
0,9
=1,28 est le quantile d'ordre 0,9 de la loi N(0,1).
90% des chantillons de taille 45 de X issus de P ont un score moyen infrieur 5,86 environ.
7) Intervalle de variation 80% (au risque =20%) du score moyen sur les chantillons de taille 45 de X issus de P :
( ) | | | | | | | | 86 , 5 ; 14 , 4 86 , 0 5 8576 , 0 5 Q ; Q X I
9 , 0 1 , 0 n % 80
= =
car Q
0,1
est symtrique de Q
0,9
par rapport =5.
( ) | | | | | | | | | | 86 , 5 ; 14 , 4 86 , 0 5 28 , 1 67 , 0 5 z 67 , 0 5 Q ; Q X I
9 , 0 9 , 0 1 , 0 n % 80
= = =
car z
1(/2)
=z
0,9
=1,28 est le quantile d'ordre 0,9 de la loi N(0,1).
80% des chantillons de taille 45 de X issus de P ont un score moyen compris entre 4,14 et 5,86 environ.
Exercice 8
P={consommateurs}
X= influence de la marque de commerce lors de l'achat d'un produit, variable qualitative dichotomique : oui, non
p = proportion de consommateurs influencs par la marque de commerce dans P, p = 25% = 0,25
Echantillon de taille n=100 de X issu de P sur lequel lesquels ni le nombre observ de consommateurs influencs, ni la
frquence (proportion) observe de consommateurs influencs f ne sont donns.
1) population chantillon
taille N = ? n = 100
proportion p = 0,25
f = ?
2) Puisque n =100 30, np = 1000,25 = 25 5 d'o n(1p) = 1000,75 5, la frquence empirique F
100
a une
distribution approximativement normale de moyenne p = 0,25
de variance 001875 , 0
100
75 , 0 25 , 0
n
) p 1 ( p
=

, et d'cart-type 0433 , 0 001875 , 0


100
75 , 0 25 , 0
n
) p 1 ( p
=

car la
proportion de consommateurs influencs par la marque de commerce p = 0,25 dans P.
3) Observer au moins 35 consommateurs influencs sur 100 c'est observer une frquence f de plus de 0,35.
( ) ( ) ( ) ( ) 0104 , 0 9896 , 0 1 31 , 2 F 1
0433 , 0
25 , 0 35 , 0
Z P 1 35 , 0 F P 1 35 , 0 F P F P
100 100 100
= =
|
.
|

\
|

= > = > f o F est la
fonction de rpartition de la loi N(0,1).
8
la probabilit d'observer une frquence de consommateurs influencs par la marque de commerce suprieure 35%
sur un chantillon de taille 100 de X issus de P (c'est dire plus de 35 consommateurs influencs par la marque de
commerce), est d'environ 1%.
environ 1% des chantillons de taille 100 de X issus de P ont une frquence observe de consommateurs influencs
par la marque de commerce suprieure 35%.
4) Observer moins de 20 consommateurs influencs sur 100 c'est observer une frquence f de moins de 0,2.
( ) ( ) ( ) ( ) 1251 , 0 8749 , 0 1 15 , 1 F 1 15 , 1 F
0433 , 0
25 , 0 2 , 0
Z P 1 2 , 0 F P F P
100 100
= = =
|
.
|

\
|

= f o F est la fonction de
rpartition de la loi N(0,1).
la probabilit d'observer une frquence de consommateurs influencs par la marque de commerce infrieure 20%
sur un chantillon de taille 100 de X issus de P (c'est dire moins de 20 consommateurs influencs par la marque
de commerce), est d'environ 12,5%.
environ 12,5% des chantillons de taille 100 de X issus de P ont une frquence observe de consommateurs
influencs par la marque de commerce infrieure 20%.
5) Intervalle de variation 90% (au risque =10%) de la frquence observe sur les chantillons de taille 100 de X issus de
P : ( ) | | | | | | | | 07 , 0 25 , 0 0433 , 0 645 , 1 25 , 0 z 25 , 0 Q ; Q F I
100
75 , 0 25 , 0
95 , 0 95 , 0 05 , 0 n % 90
= =

I
90%
(F
n
) [0,18 ; 0,32] [18% ; 32%] car z
1(/2)
=z
0,95
=1,645 est le quantile d'ordre 0,95 de la loi N(0,1).
90% des chantillons de taille 100 de X issus de P ont une frquence observe de consommateurs influencs par la
marque de commerce comprise entre environ 18% et 32% (soit environ entre 18 et 32 consommateurs influencs par
la marque de commerce).
On peut donc s'attendre ce que, sur les 100 consommateurs de l'chantillon observ, 18 32 d'entre-eux environ
soient influencs par la marque de commerce.
6) On observe 31 consommateurs influencs par la marque de commerce sur 100 consommateurs, soit une frquence
observe de 31%, alors qu'on s'attendait "raisonnablement" (dans 90% des cas) en observer entre 18% et 32%, ce qui
n'est pas surprenant : sur cette observation, on ne peut pas mettre en doute la reprsentativit de l'chantillon.
Exercice 9
P={lancers d'une pice de monnaie quilibre}
X= tomber sur le ct face, variable qualitative dichotomique : oui, non
p = proportion de lancers tombant sur le ct face dans P, p = 50% = 0,5
Echantillons de taille n de X issu de P sur lesquels ni le nombre de faces observ, ni la frquence (proportion) observe de
faces f ne sont donns.
1) La frquence empirique F
n
a pour moyenne p =0,5 (puisque F
n
est un estimateur sans biais de p) : cette moyenne est
constante quelle que soit la taille des chantillons (cf tableau ci-aprs colonne 2).
La frquence empirique F
n
a pour variance
n
) p 1 ( p
et pour cart-type
n
) p 1 ( p
qui varient avec la taille des
chantillons : plus la taille de l'chantillon est grande plus la variance et l'cart-type sont faibles d'o une plus grande
prcision dans l'estimation (cf tableau ci-aprs colonnes 3 et 4).
Puisque la distribution de X n'est pas normale ("inconnue"), la forme de la distribution de la frquence empirique F
n
n'est pas normale ("inconnue") tant que la taille de l'chantillon est faible (n<30).
Lorsque la taille de l'chantillon est suffisamment grande (n30) et que la proportion p n'est pas trop proche de 0 ou de
1 (np 5 et n(1p) 5), on peut considrer que la distribution de F
n
est approximativement normale
|
|
.
|

\
|
n
) p 1 ( p
, p N
(cf tableau ci-aprs colonnes 5 et 6).
taille distribution de la frquence empirique F
n
n moyenne variance cart-type condition forme P(F
n
> 0,6)
5 0,5 0,05 0,2236 "inconnue" "inconnue"
10 0,5 0,025 0,1581 "inconnue" "inconnue"
30 0,5 0,0083 0,0913 n/2=15 approx. normale 0,1367
50 0,5 0,005 0,0707 n/2=25 approx. normale 0,0786
100 0,5 0,0025 0,05 n/2=50 approx. normale 0,0228
9
2) Pour un chantillon de taille n=30 la forme de la distribution de la frquence empirique F
n
est approximativement
normale puisque n30 (np = n(1p) =30/2=155). Il est possible de calculer cette probabilit de manire approche, en
remarquant pralablement qu'observer 18 faces sur 30 lancers correspond observer une frquence de 18/30=0,6 :
( ) ( ) ( ) 1357 , 0 8643 , 0 1 1 , 1 F 1
0913 , 0
5 , 0 6 , 0
Z P 1 6 , 0 F P 1 6 , 0 F P
30 30
= =
|
.
|

\
|

= >
o F est la fonction de rpartition de la loi N(0,1).
environ 13,6% des chantillons de taille 30 de X issus de P ont un nombre de faces suprieur 18 (ou une frquence
de faces suprieure 0,6).
3) Pour un chantillon de taille n=50 la forme de la distribution de la frquence empirique F
n
est approximativement
normale puisque n30 et np = n(1p) =50/2=255. Il est donc possible de calculer cette probabilit de manire
approche :
( ) ( ) ( ) 0793 , 0 9207 , 0 1 41 , 1 F 1
0707 , 0
5 , 0 6 , 0
Z P 1 6 , 0 F P 1 6 , 0 F P
50 50
= =
|
.
|

\
|

= >
o F est la fonction de rpartition de la loi N(0,1).
environ 7,9% des chantillons de taille 50 de X issus de P ont une frquence de faces suprieure 0,6 (nombre de
faces suprieur 500,6=30).
4) Cette probabilit diminue avec la taille de l'chantillon puisque l'cart-type de la frquence empirique F
n
diminue (cf
tableau ci-dessus colonne 4) : la distribution de F
n
tant donc plus concentre autour de sa moyenne p =0,5, la
probabilit P(F
n
>0,6) reprsente par la surface droite de la valeur 0,6 sous la densit de la loi de F
n
(approximativement normale pour n30) sera plus petite.
Pour n30, F
n
est approximativement normale, il est donc possible de calculer cette probabilit de manire approche :
pour n=100 ( ) ( ) ( ) 0228 , 0 9772 , 0 1 2 F 1
05 , 0
5 , 0 6 , 0
Z P 1 6 , 0 F P 1 6 , 0 F P
100 100
= = =
|
.
|

\
|

= >
o F est la fonction de rpartition de la loi N(0,1).
environ 2,3% des chantillons de taille 100 de X issus de P ont une frquence de faces suprieure 0,6 (nombre de
faces suprieur 1000,6=60).
quand la taille de l'chantillon augmente, il est de moins en moins probable d'observer une frquence de faces
suprieure 0,6 lorsque la vraie proportion est gale 0,5 (cf tableau ci-dessus colonne 6).
5) On s'attend observer en moyenne une frquence de faces gale p=0,6 c'est dire 60 faces sur un chantillon de 100
lancers. On peut raffiner cette prvision en donnant l'intervalle de variation, par exemple 95% (au risque =5%), de la
frquence empirique de faces sur les chantillons de taille 100 de X issus de P, dduit partir de l'approximation
normale de F
n
puisque n=10030 (np = n(1p) =100/2=505) :
( ) | | | | | | | | 098 , 0 5 , 0 05 , 0 96 , 1 5 , 0 z 5 , 0 Q ; Q F I
100
5 , 0 5 , 0
975 , 0 975 , 0 025 , 0 n % 95
= = =

[0,5 0,1] = [0,4 ; 0,6]
I
95%
(F
n
) [40% ; 60%] car z
1(/2)
=z
0,975
=1,96 est le quantile d'ordre 0,975 de la loi N(0,1).
pour 95% des chantillons de taille 100 de X issus de P la frquence observe de faces sera comprise entre environ
40% et 60% (soit environ entre 40 et 60 faces sur 100 lancers), ce que l'on s'attend donc "raisonnablement"
observer.
6) On observe 35 faces sur 100 lancers soit une frquence observe de faces de 35%, alors qu'on s'attendait
"raisonnablement" (dans 95% des cas) en observer entre 40% et 60%, ce qui est surprenant : soit l'chantillon observ
fait partie des 5% qui ont, par construction de l'intervalle, une frquence de faces en dehors de l'intervalle de pari 95%,
soit l'chantillon observ n'est pas reprsentatif de la variable (par ex, la pice n'est pas rellement quilibre donc la
proportion de faces dans P est diffrente de (infrieure ) 50%). On peut donc douter de la reprsentativit de
l'chantillon.
7) Sur un chantillon de taille n=100, la demi-longueur de l'intervalle de variation 95% est denviron 10% (cf question
5) ; pour obtenir une demi-longueur plus faible, de 5%, il faudrait donc plus de 100 lancers. Pour n inconnu, p=0,50 et
=5% connus, la demi-longueur de l'intervalle I
95%
(F
n
) s'crit :
( )
n
5 , 0 1 5 , 0
96 , 1
n
) p 1 ( p
z
975 , 0

=

.
On cherche n tel que : 05 , 0 % 5
n
5 , 0
96 , 1 = c'est dire n 5 , 0
05 , 0
96 , 1
d'o ( ) 16 , 384 10 96 , 1 5 , 0
05 , 0
96 , 1
n
2
2
= = |
.
|

\
|

on choisirait donc une taille d'chantillon au moins gale 385 pour que la demi-longueur de l'intervalle de pari
95% soit infrieure 5%. On aurait donc une marge d'erreur 95% dau plus 5% dans lestimation de la proportion
de faces dans P, cest dire dans lintervalle [0,5 0,05] = [0,45 ; 0,55] soit entre 45% et 55%, pour 95% des
chantillons de taille n=385.
10
Exercice 10
P={tudiants d'une universit}
X= pratique d'au moins une activit physique par semaine, variable qualitative dichotomique : oui, non
p = proportion d'tudiants pratiquant au moins une activit physique par semaine dans P, p = 45% = 0,45
Echantillon de taille n=400 de X issu de P sur lequel on observe 205 tudiants pratiquant au moins une activit physique
par semaine c'est dire une frquence (proportion) observe f = 205/400 = 0,5125.
1) population chantillon
taille N = ? n = 400
proportion p = 0,45
f = 0,5125
2) Puisque n =400 30, np = 4000,45 = 180 5 d'o n(1p) = 4000,55 5, la frquence empirique F
400
a une
distribution approximativement normale de moyenne p = 0,45 , de variance 00061875 , 0
400
55 , 0 45 , 0
n
) p 1 ( p
=

, et
d'cart-type 025 , 0 0249 , 0 00061875 , 0
400
55 , 0 45 , 0
n
) p 1 ( p
=

car la proportion d'tudiants pratiquant au


moins une activit physique par semaine p = 0,45 dans P.
3) ( ) ( ) ( ) ( ) 006 , 0 994 , 0 1 51 , 2 F 1
0249 , 0
45 , 0 5125 , 0
Z P 1 5125 , 0 F P 1 5125 , 0 F P F P
400 400 400
= =
|
.
|

\
|

= > = > f
o F est la fonction de rpartition de la loi N(0,1).
environ 0,6% des chantillons de taille 400 de X issus de P ont une frquence d'tudiants pratiquant au moins une
activit physique par semaine suprieure 51,25%. L'chantillon observ fait partie de ces 0,6% d'chantillons : on
avait trs peu de chance d'observer autant d'tudiants (205 ou plus) pratiquant au moins une activit physique par
semaine sur un chantillon de taille 400, ce rsultat est donc surprenant.
4) Intervalle de variation 95% (au risque =5%) de la frquence observe sur les chantillons de taille 400 de X issus de
P : ( ) | | | | | | | | 0488 , 0 45 , 0 0249 , 0 96 , 1 45 , 0 z 45 , 0 Q ; Q F I
400
55 , 0 45 , 0
975 , 0 975 , 0 025 , 0 n % 95
= =

I
95%
(F
n
) [0,45 0,05] [0,4 ; 0,5] [40% ; 50%] car z
1(/2)
=z
0,975
=1,96 est le quantile d'ordre 0,975 de la loi N(0,1).
95% des chantillons de taille 400 de X issus de P ont une frquence observe d'tudiants pratiquant au moins une
activit physique par semaine comprise entre environ 40% et 50% (soit environ entre 160 et 200 tudiants pratiquant
au moins une activit physique par semaine).
5) La demi-longueur de l'intervalle prcdent I
95%
(F
n
) est denviron 5% ; pour obtenir une demi-longueur plus faible, de
2%, il faudrait donc plus de 400 tudiants. Pour n inconnu, p=0,45 et =5% connus, la demi-longueur de l'intervalle
I
95%
(F
n
) s'crit :
( ) ( )
n
55 , 0 1 45 , 0
96 , 1
n
p 1 p
z
975 , 0

=

. On cherche n tel que : 02 , 0 % 2


n
55 , 0 45 , 0
96 , 1 =

c'est
dire n 55 , 0 45 , 0
02 , 0
96 , 1
d'o 99 , 2376 55 , 0 45 , 0
02 , 0
96 , 1
n
2
=
|
.
|

\
|

on choisirait donc une taille d'chantillon au moins gale 2 377 pour que la demi-longueur de l'intervalle de pari
95% soit infrieure 2%. On aurait donc une marge d'erreur dau plus 2% dans lestimation de la proportion
dtudiants pratiquant au moins une activit physique dans P, cest dire dans lintervalle [0,45 0,02] =
[0,43 ; 0,47] soit entre 43% et 47%, pour 95% des chantillons de taille 2 377.
11
Exercice 11
P ={franais}
X = consommer des antidpresseurs, variable qualitative dichotomique : oui, non
p = proportion de franais consommateurs d'antidpresseurs dans P, p connue dans P : p = 10% = 0,1
1) Pour un chantillon de taille n=30 de X issu de P n =30 30, mais np = 300,1 =3 > 5, il n'est donc pas possible de
considrer que la frquence empirique F
30
a une distribution approximativement normale. En revanche F
30
a pour
moyenne p = 0,1 et pour cart-type 055 , 0 05477 , 0 003 , 0
30
9 , 0 1 , 0
n
) p 1 ( p
= =

car la proportion de franais


consommateurs d'antidpresseurs dans P est p = 0,1.
2) Pour un chantillon de taille n=80 de X issu de P, puisque n =80 30, np = 800,1 =8 5 d'o n(1p) = 800,9 5, la
frquence empirique F
80
a une distribution approximativement normale de moyenne p = 0,1 et d'cart-type
034 , 0 03354 , 0 001125 , 0
80
9 , 0 1 , 0
n
) p 1 ( p
= =

car la proportion de franais consommateurs d'antidpresseurs


dans P est p = 0,1.
3) Observer 12 consommateurs d'antidpresseurs, ou plus sur n=80 correspond observer une frquence (proportion) d'au
moins f = 12/80 = 0,15. La probabilit correspondante s'crit :
( ) ( ) ( ) ( ) 0708 , 0 9292 , 0 1 ) 47 , 1 ( F 1 4706 , 1 F 1
034 , 0
1 , 0 15 , 0
Z P 1 15 , 0 F P 1 15 , 0 F P F P
80 80 80
= = = |
.
|

\
|
= > = > f
o F est la fonction de rpartition de la loi N(0,1) (calcul exact : 1F(1,4907) 1F(1,49)=10,9319=0,0681).
environ 7% des chantillons de taille 80 de X issus de P ont une frquence de consommateurs d'antidpresseurs
suprieure 15%, soit plus de 12 consommateurs sur 80 franais.
4) Observer 2 consommateurs d'antidpresseurs ou moins sur n=80 correspond observer une frquence (proportion) d'au
plus f = 2/80 = 0,025. La probabilit correspondante s'crit :
( ) ( ) ( ) ( ) 0136 , 0 9864 , 0 1 21 , 2 F 1 2059 , 2 F
034 , 0
1 , 0 025 , 0
Z P 025 , 0 F P F P
80 80
= = |
.
|

\
|
= f o F est la fonction
de rpartition de la loi N(0,1) (calcul exact : F(2,2361) 1F(2,24) = 10,9875=0,0125).
environ 1% des chantillons de taille 80 de X issus de P ont une frquence de consommateurs d'antidpresseurs
infrieure 2,5%, soit moins de 2 consommateurs sur 80 franais.
5) Intervalle de variation au niveau 95% (au risque =5%) de la frquence empirique sur les chantillons de taille 80 de X
issus de P : ( ) | | | | | | | | | | 166 , 0 ; 034 , 0 066 , 0 1 , 0 034 , 0 96 , 1 1 , 0 z 1 , 0 Q ; Q F I
80
9 , 0 1 , 0
975 , 0 975 , 0 025 , 0 80 % 95
= = =

I
95%
(F
80
) [10% 6,6%] [3,4% ; 16,6%] car z
1(/2)
=z
0,975
=1,96 est le quantile d'ordre 0,975 de la loi N(0,1)
95% des chantillons de taille 80 de X issus de P ont une frquence observe de franais consommateurs
d'antidpresseurs entre 3,4% et 16,6% environ (soit entre 3 et 13 consommateurs environ sur 80 franais).
6) Observer 10 consommateurs sur 80 personnes interroges c'est observer une frquence de f =10/80=0,125=12,5% plus
leve que la proportion p=10% mais qui appartient l'intervalle de variation 95% trouv prcdemment, c'est dire
que la probabilit d'observer cette proportion de 12,5% ou plus est suprieure 2,5%, elle n'est donc pas trs faible.
(Elle est gale :
( ) ( ) ( ) ( ) 2296 , 0 7704 , 0 1 74 , 0 F 1 7353 , 0 F 1
034 , 0
1 , 0 125 , 0
Z P 1 125 , 0 F P f F P
80 80
= = =
|
.
|

\
|

> >
donc environ 23% des chantillons de taille 80 de X issus de P ont une proportion de franais consommateurs
d'antidpresseurs suprieure 12,5%)
une proportion non ngligeable d'chantillons (plus de 2,5%) de taille 80 de X issus de P ont une proportion de
franais consommateurs d'antidpresseurs suprieure 12,5%, soit plus de 10 consommateurs sur 80. On peut donc
en dduire que ce n'est pas surprenant d'observer une telle frquence de consommateurs et que l'on ne peut pas
mettre en doute la reprsentativit de l'chantillon pour la variable tudie dans la population tudie, la
consommation d'antidpresseurs chez les franais.