Vous êtes sur la page 1sur 4

EXERCICE CORRIGE

Une laiterie produit des camemberts commercialisés sous la marque « Le moine gourmand ». La masse X, exprimée en g, d’un camembert tiré au hasard dans la production, est distribuée selon une loi normale.

On tire un échantillon simple de 17 camemberts que l’on pèse et dont le tableau suivant fournit les masses :

250

254

254

253

256

250

257

251

253

255

250

255

252

261

 

252

251

255

                     

1-

a)

En utilisant une calculatrice donner la moyenne et la variance de cet

échantillon.

 

b)

Donner une estimation ponctuelle de la variance s² de la production.

 

2-

Déterminer une estimation par intervalle de confiance à 95% de la masse moyenne m de la production.

3-

Le responsable de fabrication des camemberts « Le moine gourmand »

souhaite savoir quelle taille minimale donner à un échantillon aléatoire simple pour obtenir un intervalle de confiance pour m, au niveau 95 %, d’amplitude inférieure à 1.

a)

On indique au responsable que l’on ne peut pas répondre à sa question

sans un renseignement supplémentaire sur la variance de la production.

 

Pourquoi la connaissance de cette variance est-elle nécessaire pour répondre à cette question ?

b)

Le responsable précise alors que s ² = 6,25. Calculer la taille minimale

que doit avoir un échantillon pour que l’intervalle de confiance à 95 % pour m ait une amplitude inférieure à 1.

4-

Le responsable de fabrication estime que plus de 15 % des camemberts de la production ont une masse supérieure à 257 g. On tire un échantillon aléatoire simple de 200 camemberts. On constate que 40 d’entre eux pèsent plus de 257 g. Au vu de cet échantillon, peut-on conclure, au seuil de signification 5 %, que le responsable de fabrication a raison ?

Eléments de correction :

1.

a) x = 253,5 g

b) sˆ ² =

n

n -1

s² = 8,01

sˆ

2

= 8,51

2.

La population est normale, sa variance est inconnue, on utilise une loi de

Student. La variable aléatoire T, définie par

T

=

( X

-m

)

S

X

est

la

n - 1 moyenne de l’échantillon aléatoire de taille n de la variable aléatoire X , -1 moyenne de l’échantillon aléatoire de taille n de la variable aléatoire X, est distribuée selon la loi de Student à n-1 ddl

n = 17, T =

X - m

S

4

, T est distribuée selon la loi de Student à 16 ddl.

Si t = t 0,975 ; 16 alors P(-t < T < t) = 0,95. On lit dans la table : t 0,975 ; 16 = 2,12.

On obtient l’intervalle de confiance aléatoire au niveau 95% :

È

Í

Î

x = 253,5 g et s = 2,8 g sont les valeurs observées de

¥

S

= 253,5 g et s = 2,8 g sont les valeurs observées de ¥ S 4

4

; X

S

¥ 4

˘

˙

˚

X

-

2 12

,

+ 2 12

,

X

et S sur l’échantillon

prélevé d’où une estimation de m par intervalle de confiance au niveau 95 %

È

Í

Î

253 5

,

-

2 12

,

¥

2 8

,

4

;

253

,

5

+

2 12

,

¥

28 ˘

,

4

˙

˚

[252,0 ; 255,0] est un intervalle de confiance de m au niveau 95 %

3. a) Si X est de loi normale la variable T, définie par T

X -m

=

S

X

est la

la variable T , définie par T X -m = S où X est la n

n -1 moyenne de l’échantillon aléatoire de taille n de la variable aléatoire X, est distribuée selon la loi de Student à n-1 ddl. Ce qui fait l’intérêt de la variable de Student T, c’est qu’elle ne dépend pas de l’écart type s de la variable mère X. On utilise ce résultat chaque fois s est inconnu. Si X est distribuée selon une loi normale, de moyenne m et d’écart type s inconnus, l’intervalle de confiance aléatoire de la moyenne m au niveau 95% est :

È S X - t Í 0 975 ;n - 1 Î , n -
È
S
X
-
t
Í
0 975
;n
-
1
Î ,
n -
1
S ˘ ;n - 1 ˙ n - 1 ˚ 2 ¥ t 0 975
S
˘
;n
-
1
˙
n -
1
˚
2 ¥ t
0 975
,
;n -
1

£

1 .

; X

+

t

0 975

,

S

n - 1
n -
1

.

Cet intervalle a pour amplitude

Le problème posé par le responsable de fabrication correspond à la résolution de

l’inéquation

1

S

n - 1
n -
1

2 ¥ t

,

0 975

;n -

Or S, n - 1 et t dépendent de n . En l’absence de données

Or S, n - 1 et t dépendent de n. En l’absence de données supplémentaires

0,975;n-1

on ne peut pas résoudre cette inéquation.

b) X est de loi normale et on connaît maintenant sa variance s ². Sous ces

conditions X

est distribuée selon la loi N(m,

s

), et U, définie par ), et U

U

X -m

=

s ,

n
n

selon la loi normale N(0 ; 1). L’intervalle de confiance aléatoire de la moyenne m

È

Í Î

X -

X -
pour

pour

au niveau 95% est :

Cet

intervalle

a

s ; X + u u 0,975 0,975 n amplitude 2 ¥ u 0 975
s
; X
+ u
u 0,975
0,975
n
amplitude
2 ¥ u
0 975
,
s ˘ ˙ n ˚
s
˘
˙
n
˚

s

n
n

.

.

Pour

obtenir

d’amplitude inférieure ou égale à 1, il suffit de choisir n tel que 2

soit n ( 2¥u

Application numérique :

0 975

,

)

2

¥s

2

n

(

2

¥

1 96

,

)

n

96,04

2

¥

6 25

,

un intervalle s ¥ u £ 1 0 975 , n
un
intervalle
s
¥ u
£
1
0 975
,
n

Un échantillon doit comporter au minimum 97 camemberts pour que l’intervalle de confiance à 95% correspondant ait une amplitude inférieure à 1 .

4. Hypothèses :

Ï

Ì

Ó

H

0

H

1

: p

: p

=

p

0

>

p

0

avec

p

0

=

0 15

,

hypothèse alternativ e fournie par l' énoncé

Ï

soit Ó

Ì

H

0

H

1

: p

: p

=

>

0 15

,

0 15

,

Seuil de signification : a = 5%

Conditions d’application :

Variable de décision :

grand échantillon n = 200 np 0 5 et n(1-p 0 ) 5 On utilise pour ce test la statistique F qui prend pour

valeur la proportion des camemberts de l’échantillon pesant plus de 257 g.

Sous l’hypothèse H o , nF est distribuée selon la loi binomiale B( n; p p (

E(nF) = np 0 ; V(nF) = np 0 (1-p 0 ) d’où E(F) = p 0 ; V(nF) =

Les conditions d’application rendent légitime l’approximation de B( n; p

0 ) .

1-

p

0

)

0

n

0 )

par la loi normale N(np 0 , np (

1 - p ) 0 0
1 -
p
)
0
0

).

Sous l’hypothèse H o , F

normale

N

Ê

Á Á

Ë

p

0

p (1 - p ) , 0 0 n
p
(1
-
p
)
,
0
0
n

ˆ

˜

˜

¯

est approximativement distribuée selon la loi

On prend pour variable de décision U, définie par

soit ici U =

F - 0 15 , 0 15 , ¥ 0 85 , 200
F
- 0 15
,
0 15
,
¥ 0 85
,
200

U =

F - p 0 p 1- p ) 0 ( 0 n
F
- p
0
p
1-
p
)
0 (
0
n

Sous l’hypothèse H o , U est approximativement distribuée selon la loi

normale N(0 ; 1). Règle de décision :

0,95 0,05
0,95
0,05

0

u c = u 0,95

; 1). Règle de décision : 0,95 0,05 0 u c = u 0,95 non rejet
; 1). Règle de décision : 0,95 0,05 0 u c = u 0,95 non rejet

non rejet de H 0

rejet de H 0

La valeur critique u c de la variable U dépend de l’hypothèse alternative H 1 . Le test est unilatéral à droite, u c est définie par P(U £ u c ) = 0,95

On lit dans la table de la fonction de répartition de la loi normale centrée

réduite u c = u 0,95 = 1,64.

Règle de décision :soit u obs la valeur de

la variable U observée sur l’échantillon, si u obs > u c on rejette l’hypothèse nulle, si u obs < u c on ne rejette pas l’hypothèse nulle

Calcul de la valeur observée :

f - 0 15 , obs = u obs 0 15 , ¥ 0 85
f
- 0 15
,
obs
=
u obs
0 15
,
¥
0 85
,
200
Décision et conclusion :

d’où

40 soit f obs = 0,2 f obs = 200 0 20 , - 0
40
soit
f obs = 0,2
f obs = 200
0 20
,
- 0 15
,
=
soit
u obs = 1,98
u obs
0 15
,
¥ 0 85
,
200

Au seuil de signification 5% et au vu de l’échantillon on rejette l’hypothèse nulle H 0 . Plus de 15% des camemberts de la production ont une masse supérieure à 257g. Le responsable de production n’a pas tort.

ªªªªªªªªªªªªªªªªªªª