Ex er ci ces Cor r i g s
Abdelhamid El Mossadeq
P rofesseu r lE H T P
2006-2007
A. El Mossadeq
Exercice 1 Dterminer et tudier les proprits de lestimateur du maximum de vraisemlance dun r-chantillon pour : 1. le paramtre p dune loi de Bernouilli 2. le paramtre p dune loi gomtrique e e 3. le paramtre p dune loi binomiale dordre n 4. le paramtre dune loi de P oisson 5. le paramtre dune loi exponentielle 6. les paramtres et 2 dune loi normale 7. le paramtre dune loi unif orme sur lintervalle [0, ]
Solution 1 1. Soit X une variable alatoire de Bernouilli de paramtre p. Pour tout x {0, 1}, la probabilit lmentaire p (x) de x est : p (x) = px (1 p)1x de plus :
E [X] = p
V [X] = p (1 p) (a) Recherche du maximum de vraisemlance : Considrons un r-chantillon de cette structure. Sa fonction de vraisemblance est dnie pour tout p [0, 1] et tout (x1 , ..., xr ) {0, 1}r par : L (p; x1 , ..., xr ) = = do :
r Y
p (xi )
xi
i=1 r P
i=1
(1 p)
i=1
r P
xi
! ! r r X X xi ln p + r xi ln (1 p) ln L (p; x1 , ..., xr ) =
i=1 i=1
A. El Mossadeq
xi
i=1
1p
r
r P
xi
et comme :
Cest la frquence empirique du r-chantillon. (b) Etude des proprits de p : Puisque : E [] p et : = = E [X] p
2 ln L (p; x1 , ..., xr ) < 0 p2 donc lestimateur du maximum de vraisemblance dun r-chantillon dune structure de Bernouilli est : r 1X p= Xi r i=1
V [X] r p (1 p) = r On en dduit que p est un estimateur sans biais et convergent du paramtre p dune loi de Bernouilli. V [] p = 2. Soit X une variable alatoire de gomtrique de paramtre p. Pour tout x N , la probabilit lmentaire p (x) de x est : p (x) = p (1 p)x1 de plus :
E [X] = 1 p
V [X] = 1 p p2 4
A. El Mossadeq
Considrons un r-chantillon de cette structure. Sa fonction de vraisemblance est dnie pour tout p [0, 1] et tout (x1 , ..., xr ) (N )r par : L (p; x1 , ..., xr ) = = do : ln L (p; x1 , ..., xr ) = r ln p + Il en rsulte que : ln L (p; x1 , ..., xr ) p
r Y i=1 r
p (xi )
r P
p (1 p)i=1 r X
i=1
xi r
xi r ln (1 p)
r P
= do :
1p r P r p xi
i=1
r p
i=1
xi r
p (1 p)
et comme :
r ln L (p; x1 , ..., xr ) = 0 = p = P r p
i=1
xi
2 ln L (p; x1 , ..., xr ) < 0 p2 donc lestimateur du maximum de vraisemblance dun r-chantillon dune structure gomtrique est : r p= P r Xi
i=1
3. Soit X une variable alatoire binomiale dordre n et de paramtre p. pour tout x {0, 1, ..., n}, la probabilit lmentaire p (x) de x est : p (x) = C (n, x) px (1 p)nx
A. El Mossadeq
de plus :
E [X] = np
V [X] = np (1 p) (a) Recherche du maximum de vraisemlance : Considrons un r-chantillon de cette structure. Sa fonction de vraisemblance est dnie pour tout p [0, 1] et tout (x1 , ..., xr ) {0, 1, ..., n}r par : L (p; x1 , ..., xr ) = = do : ln L (p; x1 , ..., xr ) = ln
r Y i=1 i=1 " r Y i=1 r Y
p (xi ) C (n, xi ) p #
i=1 r P
xi
(1 p)
rn
i=1
r P
xi
C (n, xi ) +
Il en rsulte que :
r X i=1
xi ln p +
rn
r X i=1
xi ln (1 p)
ln L (p; x1 , ..., xr ) p
i=1
r P
xi
= do :
i=1
p 1p r P xi rnp p (1 p)
r
rn
i=1
r P
xi
et comme :
2 ln L (p; x1 , ..., xr ) < 0 p2 donc lestimateur du maximum de vraisemblance dun r-chantillon dune structure de binomiale est : r 1 X p= Xi rn i=1
A. El Mossadeq
(b) Etude des proprits de p : Puisque : E [] p et : V [X] rn2 p (1 p) = rn on en dduit que p est un estimateur sans biais et convergent de p. V [] p = = = 1 E [X] n p
4. Soit X une variable alatoire de Poisson de paramtre . Pour tout x N, la probabilit lmentaire p (x) de x est : p (x) = de plus : x exp x!
E [X] =
(a) Recherche du maximum de vraisemlance : Considrons un r-chantillon de cette structure. Sa fonction de vraisemblance est dnie pour tout , > 0, et tout (x1 , ..., xr ) Nr par : L (; x1 , ..., xr ) =
r Y i=1
V [X] =
p (xi )
xi
= do :
r P
xi ln r
xi r
A. El Mossadeq
do : 1X ln L (; x1 , ..., xr ) = 0 = p = xi r i=1
r
et comme :
Cest la moyenne empirique du r-chantillon. (b) Etude des proprits de : Puisque : E [ ] et : = = E [X]
2 ln L (; x1 , ..., xr ) < 0 2 donc lestimateur du maximum de vraisemblance dun r-chantillon dune structure de Poisson est : r 1X Xi = r i=1
V [X] r = r On en dduit que est un estimateur sans biais et convergent de . V [ ] = 5. Soit X une variable alatoire exponentielle de paramtre . Sa densit de probabilit f est dnie par : si x 0 0 f (x) = exp x si x > 0 de plus : E [X] = 1
A. El Mossadeq
Sa fonction de vraisemblance est dnie pour tout , > 0, et tout (x1 , ..., xr ) dans Rr , tous strictement positifs, par : L (; x1 , ..., xr ) = = do : ln L (; x1 , ..., xr ) = r ln Il en rsulte que :
r Y i=1 r
f (xi )
r X i=1
exp
xi
r X i=1 r
xi
do :
xi
et comme :
2 ln L (; x1 , ..., xr ) < 0 2 donc lestimateur du maximum de vraisemblance dun r-chantillon dune structure exponentielle est : r = P r Xi
i=1
6. Soit X une variable alatoire normale de paramtres et 2 . Sa densit de probabilit f est dnie pour tout x R par : 1 1 f (x) = exp 2 (x )2 2 2 E [X] =
de plus :
V [X] = 2
A. El Mossadeq
(a) Recherche du maximum de vraisemlance : Considrons un r-chantillon de cette structure. Sa fonction de vraisemblance est dnie pour tout R, tout > 0 et tout (x1 , ..., xr ) Rr par : L (, ; x1 , ..., xr ) = = do :
r Y i=1
f (xi )
Il en rsulte que :
L (, ; x1 , ..., xr ) = 0 L (, ; x1 , ..., xr ) = 0
r X =1 xi r i=1
Donc les estimateurs du maximum de vraisemblance dun r-chantillon dune structure normale est : r X =1 Xi r i=1 r 2 1X = (Xi )2 r i=1
r 2 1X = (xi )2 r i=1
10
A. El Mossadeq
(b) Etude des proprits de et : On a : E [ ] et : r1 V [X] r r1 2 = r On en dduit que est un estimateur sans biais et convergent de , mais est un estimateur biais de . = E 2 = = E [X]
7. Soit X une variable alatoire uniforme sur lintervalle [0, ]. Sa densit de probabilit f est dnie pour tout x [0, ] par : 1 si x [0, ] f (x) = 0 si x [0, ] / de plus : E [X] = 2
2 V [X] = 12 Considrons un r-chantillon de cette structure. Sa fonction de vraisemblance est dnie pour tout , > 0, et tout (x1 , ..., xr ) [0, ]r : L (; x1 , ..., xr ) = = La fonction : est strictement dcroissante, donc elle atteint son maximum lorsque est minimum. Et comme : i {1, ..., r} : xi L (; x1 , ..., xr )
r Y i=1
f (xi )
1 r
11
A. El Mossadeq
donc est minimum lorsque : = max (x1 , ..., xr ) Donc lestimateur du maximum de vraisemblance dun r-chantillon dune structure uniforme est : = max (X1 , ..., Xr )
Exercice 2 Soit X une variable alatoire dont la densit de probabilit f est dnie par : 1 exp x f (x) = 0 si si x>0 x0
o est un paramtre rel strictement positif. 1. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon de variable parente X. 2. est-il un rsum exhaustif ? 3. Calculer lesprance mathmatique et la variance de . Que peut-on conclure ? 4. Calculer la quantit dinformation de F isher. En dduire que est ecace.
Solution 2 Soit X une variable alatoire exponentielle dont la densit de probabilit f est dnie pour tout x, x > 0, par : 1 exp x f (x) = 0 si si x>0 x0
V [X] = 2
12
A. El Mossadeq
1. Considrons un r-chantillon de cette structure. Sa fonction de vraisemblance est dnie pour tout , > 0, et tout (x1 , ..., xr ) Rr , tous strictement positifs, par : L (; x1 , ..., xr ) =
r Y i=1
f (xi )
r P
= do :
1 exp i=1 r
r P
xi
xi
i=1
r P
et comme :
2 ln L (; x1 , ..., xr ) < 0 2 donc lestimateur du maximum de vraisemblance dun r-chantillon dune structure exponentielle est : r X = 1 Xi r i=1 Cest la moyenne empirique du r-chantillon. 2. Pour tout , > 0, et tout (x1 , ..., xr ) Rr , tous strictement positifs, on a : L (; x1 , ..., xr ) = = xi 1 i=1 exp r (x1 , ..., xr ) 1 r r exp
r P
13
A. El Mossadeq
Daprs le thorme de factorisation, est un rsum exhaustif puisque : L (; x1 , ..., xr ) = g ; (x1 , ..., xr ) h (x1 , ..., xr ) o : 1 r (x1 , ..., xr ) g ; (x1 , ..., xr ) = r exp h (x1 , ..., xr ) = 1 3. Comme : X = 1 Xi r i=1
r
et :
alors :
h i E h i V
= =
E [X] V [X] r 2 r
et : = =
On en dduit que est un estimateur sans biais et convergent de . 4. Calculons la quantit dinformation de F isher, I [X, ], concernant . On a : 2 I [X, ] = E ln f (, X) 2 2 X ln = E 2 2X 1 = E 2+ 3 1 = 2 Donc la quantit dinformation de F isher, I [X1 , ..., Xr , ], concernant fournie par le r-chantillon est : I [X1 , ..., Xr , ] = = rI [X, ] r 2
14
A. El Mossadeq
h i I [X1 , ..., Xr , ] V
Exercice 3 Soit X une variable alatoire dont la densit de probabilit f est dnie par : si x 0 0 f (x) = x k1 si x > 0 x exp k o est un paramtre rel strictement positif , k un entier naturel non nul et une constante rel. 1. Dterminer la constante . 2. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon de variable parente X. 3. est-il un rsum exhaustif ? 4. Calculer lesprance mathmatique et la variance de . Que peut-on conclure ? 5. Calculer la quantit dinformation de F isher. En dduire que est ecace.
Solution 3 La densit de probabilit de la variable alatoire X est dnie par : si x 0 0 f (x) = x k1 si x > 0 x exp k Rappelons que pour tout k N : Z + uk exp udu = k!
0
15
A. El Mossadeq
1. Ainsi :
f (x) dx
= = =
(k 1)! 1 (k 1)!
0 +
f (x) dx = 1
De plus :
Z + 0
x2 f (x) dx
2. Considrons un r-chantillon de cette structure. Sa fonction de vraisemblance est dnie pour tout , > 0, et tout (x1 , ..., xr ) Rr , tous strictement positifs, par :
16
A. El Mossadeq
L (; x1 , ..., xr )
r Y i=1
f (xi )
r P
= do :
xi
k1
rk ln
i=1
r P
xi
r P
et comme :
3. Pour tout , > 0, et tout (x1 , ..., xr ) Rr , tous strictement positifs, on a : L (; x1 , ..., xr ) = = xi 1 i=1 k1 (x1 ...xr ) exp [(k 1)!]r rk 1 rk (x1 , ..., xr ) (x1 ...xr )k1 exp r rk [(k 1)!]
r P
2 ln L (; x1 , ..., xr ) < 0 2 donc lestimateur du maximum de vraisemblance dun r-chantillon de cette structure est : r X = 1 Xi rk i=1
Daprs le thorme de factorisation, est un rsum exhaustif puisque : (x1 , ..., xr ) h (x1 , ..., xr ) L (; x1 , ..., xr ) = g ;
17
A. El Mossadeq
o : 1 rk (x1 , ..., xr ) g ; (x1 , ..., xr ) = rk exp h (x1 , ..., xr ) = 4. Puisque : 1 (x1 ...xr )k1 [(k 1)!]r
r
et :
alors :
et :
On en dduit que est un estimateur sans biais et convergent de . 5. Calculons la quantit dinformation de F isher, I [X, ], concernant . On a : 2 ln f (, X) I [X, ] = E 2 2 X ln (k 1)! + (k 1) ln X k ln = E 2 k 2X = E 2+ 3 k = 2 Donc la quantit dinformation de F isher, I [X1 , ..., Xr , ], concernant fournie par le r-chantillon est : I [X1 , ..., Xr , ] = = rI [X, ] rk 2
18
A. El Mossadeq
Exercice 4 Soit X une variable alatoire dont la densit de probabilit f est dnie par : si x [0, ] / 0 f (x) = 1 si x [0, ] o est un paramtre rel. 1. Dterminer la fonction de rpartition de X. 2. Calculer la quantit dinformation de F isher. 3. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon de variable parente X. 4. Calculer lesprance mathmatique et la variance de . Que peut-on conclure ? 5. Dans le cas o est bias, proposer un estimateur sans biais de .
Solution 4 1. La fonction de rpartition F de X est dnie pour tout x R par : Z x F (x) = f (t) dt
do :
de plus :
0 x F (x) = 1
si si si
x0 0x x
E [X] = 2
2. Puisque le domaine D : D
19
A. El Mossadeq
dpend de , donc la quantit dinformation de F isher nexiste pas. 3. Considrons un r-chantillon de cette structure. Sa fonction de vraisemblance est dnie pour tout , > 0, et tout (x1 , ..., xr ) [0, ]r : L (; x1 , ..., xr ) = = La fonction : est strictement dcroissante, donc elle atteint son maximum lorsque est minimum. Et comme : Il en rsulte que est minimum lorsque : i {1, ..., r} : xi = max (x1 , ..., xr ) Donc lestimateur du maximum de vraisemblance dun r-chantillon dune structure uniforme est : = max (X1 , ..., Xr ) L (; x1 , ..., xr )
r Y i=1
f (xi )
1 r
4. Pour dterminer la densit de probabilit de commenons dabord par calculer , sa fonction de rpartition.
20
A. El Mossadeq
h i <u P
[F (u)]r 0 u r 1
P [max (X1 , ..., Xr ) < u] P [X1 < u, ..., Xr < u] r Y P [Xk < u]
k=1
si si si
u0 0u u
21
A. El Mossadeq
si
u ]0, [ / u ]0, [
R Z 0
uf (u) du r ur du r
r r+1
2
Lestimateur de est biais, mais il est asymptotiquement sans biais. 5. Considrons lestimateur : T = Alors : E [T ] = = r + 1 r r + 1 hi E r
22
A. El Mossadeq
et : V [T ] = =
2 h i r+1 V r 1 2 r (r + 2)
Exercice 5 Soit X une variable alatoire dont la densit de probabilit f est dnie par : si x < 0 f (x) = exp ( x) si x 1. Dterminer la fonction de rpartition de X. 2. Calculer la quantit dinformation de F isher. 3. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon de variable parente X. 4. Calculer lesprance mathmatique et la variance de . Que peut-on conclure ? 5. Dans le cas o est bias, proposer un estimateur sans biais de .
Solution 5 1. La fonction de rpartition F de X est dnie pour tout x R par : Z x F (x) = f (t) dt
do : F (x) = de plus :
si si
x x
1 exp ( x) V [X] = 1
E [X] = + 1
23
A. El Mossadeq
dpend de , donc la quantit dinformation de F isher nexiste pas. 3. Considrons un r-chantillon de cette structure. Sa fonction de vraisemblance est dnie pour tout R, et tout (x1 , ..., xr ) ([, +[)r :
r Y i=1
L (; x1 , ..., xr )
= =
f (xi )
r X i=1
exp
( xi )
La fonction :
est strictement croissante, donc elle atteint son maximum lorsque est maximum. Et comme : i {1, ..., r} : xi
L (; x1 , ..., xr )
= min (x1 , ..., xr ) Donc lestimateur du maximum de vraisemblance dun r-chantillon de cette structure est : = min (X1 , ..., Xr )
4. Pour dterminer la densit de probabilit de commenons dabord par calculer , sa fonction de rpartition.
24
A. El Mossadeq
P [min (X1 , ..., Xr ) < v] 1 P [min (X1 , ..., Xr ) v] 1 P [X1 v, ..., Xr v] r Y P [Xk v] 1 1
k=1 r Y k=1
1 [1 F (v)]r 0
1 exp r ( v)
si si
v< v>
r exp r ( v)
1 r
25
A. El Mossadeq
(e) Variance de : h i2 h i h 2i 1 V =E E = 2 r
Lestimateur de est biais, mais il est asymptotiquement sans biais. 5. Considrons lestimateur : T = Alors : 1 r
et :
h i 1 E [T ] = E = r
Exercice 6 Les lments dune population possdent un caractre X qui suit une loi de P oisson de paramtre inconnu . Une suite de r expriences a fourni les valeurs k1 , ..., kr . 1. Dterminer lestimateur du maximum de vraisemlance de et tudier les proprits de cet estimateur. 2. est-il un rsum exhaustif ? 3. On dsire estimer la quantit : = P [X = 0] Dterminer lestimateur du maximum de vraisemlance de . Que remarquez-vous ?
26
A. El Mossadeq
Solution 6 1. Soit X une variable alatoire de Poisson de paramtre . pour tout x N, la probabilit lmentaire p (x) de x est : p (x) = de plus : x exp x!
E [X] =
(a) Recherche du maximum de vraisemlance : Considrons un r-chantillon de cette structure. Sa fonction de vraisemblance est dnie pour tout , > 0, et tout (k1 , ..., kr ) Nr par : L (; k1 , ..., kr ) =
r Y i=1
V [X] =
p (ki )
ki
= do :
r P
ki ln r
ki r
r
et comme :
1X xi ln L (; k1 , ..., kr ) = 0 = p = r i=1
2 ln L (; k1 , ..., kr ) < 0 2 donc lestimateur du maximum de vraisemblance dun r-chantillon dune structure de Poisson est : r 1X Xi = r i=1 Cest la moyenne empirique du r-chantillon.
27
A. El Mossadeq
(b) Etude des proprits de : Puisque : E [ ] et : V [X] r = r On en dduit que est un estimateur sans biais et convergent de . V [ ] = 2. Pour tout , > 0, et tout (k1 , ..., kr ) Nr on a : L (; x1 , ..., xr ) =
r(k1 ,...,kr ) exp r x1 !...xr !
= =
E [X]
Daprs le thorme de factorisation, est un rsum exhaustif puisque : L (; x1 , ..., xr ) = g (; (x1 , ..., xr )) h (x1 , ..., xr ) o : et :
g (; (x1 , ..., xr )) = r (k1 ,...,kr ) exp r
h (x1 , ..., xr ) = 3. On a : = =
1 x1 !...xr !
P [X = 0] exp
r Y i=1
= do :
( ln ) r k1 !...kr !
r X i=1
ki
ki ln ( ln ) + r ln
28
A. El Mossadeq
2 ln L (; k1 , ..., kr ) < 0 2 donc lestimateur du maximum de vraisemblance dun r-chantillon de cette structure est : ! r 1X = exp Xi r i=1 = exp
Exercice 7 Soit un rel appartenant ]1, +[ et X une variable alatoire telle que : k1 1 1 1 , k N P [X = k] = 1. Calculer lesprance mathmatique et la variance de X. 2. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon de variable parente X et tudier ses proprits. 3. est-il un rsum exhaustif ?
Solution 7 1. On a : E [X] = = =
X k=1 X k=1
kP [X = k] k1 k 1 1
29
A. El Mossadeq
k (k 1) P [X = k]
k1 k (k 1) 1 1 k=1 1 22 1
2. Considrons un r-chantillon de cette structure. Sa fonction de vraisemblance est dnie pour tout ]1, +[ et tout (x1 , ..., xr ) (N )r par : L (; x1 , ..., xr ) =
r Y i=1
p (xi )
r P x r 1 i=1 i 1
1 r
r X
i=1
1 xi r ln 1
r P
xi r r i=1 + ( 1) r P xi r
i=1
( 1)
30
A. El Mossadeq
do : 1X ln L (; x1 , ..., xr ) = 0 = = xi r i=1
r
et comme :
2 ln L (p; x1 , ..., xr ) < 0 2 donc lestimateur du maximum de vraisemblance dun r-chantillon dune structure gomtrique est : r 1X = Xi r i=1
alors :
E [ ] et :
= =
E [X]
V [X] r ( 1) = r On en dduit que est un estimateur sans biais et convergent du paramtre dune structure gomtrique. V [ ] =
o X reprsente le revenu par habitant, a le revenu minimum et , > 2, un coecient dpendant du type du pays o lon se place.
Exercice 8 Soit X une variable alatoire qui suit une loi de Pareto dont la densit de probabilit f est dnie par : a +1 si x a x f (x) = 0 si x < a
31
A. El Mossadeq
1. Vrier que f est bien une densit de probabilit. 2. Calculer lesprance mathmatique et la variance de X. 3. Calculer la fonction de rpartition de X. 4. Dterminer lestimateur du maximum de vraisemlance a de a dun r-chantillon issu X. 5. Dans le cas o a est bias, proposer un estimateur sans biais de a.
Solution 8 1. La densit de probabilit de la loi de Pareto est dnie par : a +1 si x a x f (x) = 0 si x < a f est bien une densit de probabilit. En eet : Z f (x) dx =
R
1 Z
a dx x+1
2. On a : E [X] = = = et : E X2 = = = do : V [X] = =
xf (x) dx a dx x
ZR+
a
a 1 Z x2 f (x) dx a dx x1
ZR+
a
2 a 2
E X 2 E [X]2 2 2a ( 2) ( 1)
32
A. El Mossadeq
f (t) dt
1 a si x a x 4. Considrons un r-chantillon de cette structure. Sa fonction de vraisemblance est dnie pour tout a R et tout (x1 , ..., xr ) (]a, +[)r , par : r Y i=1
0 si x a Z x a dt si x a +1 a t si x a 0
L (a; x1 , ..., xr )
= =
f (xi )
La fonction : est strictement croissante, donc elle atteint son maximum lorsque a est maximum. Et comme : Il en rsulte que est maximum lorsque : i {1, ..., r} : a xi a = min (x1 , ..., xr ) Donc lestimateur du maximum de vraisemblance dun r-chantillon de cette structure est : a = min (X1 , ..., Xr ) a L (a; x1 , ..., xr )
5. Pour dterminer la densit de probabilit de commenons dabord par calculer , sa fonction de rpartition.
33
A. El Mossadeq
(a) Fonction de rpartition de a : Pour tout x R on a : Fa (x) = = = = = = = = P [ < x] a P [min (X1 , ..., Xr ) < x] 1 P [min (X1 , ..., Xr ) x] 1 P [X1 v, ..., Xr x] r Y 1 P [Xk x] 1
k=1 r Y k=1
1 [1 F (x)]r 0 r a 1 x d Fa (x) dv 0
si
x<a
34
A. El Mossadeq
Lestimateur a de a est biais, mais il est asymptotiquement sans biais. (f) Considrons lestimateur : T = Alors : E [T ] = a et : V [T ] = r 1 r 2 1 a2 r (r 2) r 1 a r
V [] = a
Exercice 9 Soit X une variable alatoire dont la densit de probabilit f est dnie par : si x 0 f (x) = ( x) 1 exp si x > o est un paramtre rel et un paramtre rel strictement positif. 1. Vrier que f est bien une densit de probabilit. 2. Calculer lesprance mathmatique et la variance de X. 3. Calculer la fonction de rpartition de X. 4. On suppose connu et inconnu. (a) Dterminer lestimateur du maximum de vraisemlance de dun r chantillon issu X. (b) Etudier les proprits de . (c) Dans le cas o est bias, proposer un estimateur sans biais de . 5. On suppose connu et inconnu. (a) Dterminer lestimateur du maximum de vraisemlance de dun r chantillon issu de X. (b) Etudier les proprits de est bias, proposer un estimateur sans biais de . (c) Dans le cas o
35
A. El Mossadeq
6. On suppose que et sont tous les deux inconnus. (a) Dterminer lestimateur du maximum de vraisemlance dun r-chantillon issu de X. (b) Etudier les proprits de , (c) Proposer un estimateur sans biais de (, ) .
, de (, )
Solution 9 1. f est bien une densit de probabilit. En eet : Z Z + 1 ( x) exp dx f (x) dx = R Z + = exp tdt
0
2. On a : E [X] = = = = et : E X2 = = = = = do : V [X] = =
+ Z
Z +
0
ZR+
22 + 2 + 2 ( + )2 + 2 E X 2 E [X]2
Z +
0
ZR+
36
A. El Mossadeq
3. La fonction de rpartition F de X est dnie pour tout x R par : Z x f (t) dt F (x) = si x 0 Z x = 1 ( t) exp dt si x si x 0 = 1 exp ( x) si x 4. On suppose connu et inconnu. (a) Considrons un r-chantillon de cette structure. Sa fonction de vraisemblance est dnie pour tout , > 0, R et tout (x1 , ..., xr ) (], +[)r par : L (; x1 , ..., xr ) = = do :
r Y i=1
f (xi )
r
# r 1X = xi r i=1 "
37
A. El Mossadeq
et comme : 2 ln L (; x1 , ..., xr ) < 0 2 donc lestimateur du maximum de vraisemblance dun r-chantillon de cette structure est : # " r 1X = Xi r i=1 (b) On a : E [ ] = = et : V [ ] = = V E " " 1X Xi r i=1
r
1X Xi r i=1
r
(a) Considrons un r-chantillon de cette structure. Sa fonction de vraisemblance est dnie pour tout , > 0, R et tout (x1 , ..., xr ) (], +[)r , tous strictement positifs, par : L (; x1 , ..., xr ) = = La fonction :
r Y i=1
f (xi )
r
X ( xi ) 1 exp r i=1
est strictement croissante, donc elle atteint son maximum lorsque est maximum.
L (; x1 , ..., xr )
38
A. El Mossadeq
Et comme : Il en rsulte que est maximum lorsque : = min (x1 , ..., xr ) Donc lestimateur du maximum de vraisemblance dun r-chantillon de cette structure est : = min (X1 , ..., Xr ) (b) Pour dterminer la densit de probabilit de commenons dabord par , calculer sa fonction de rpartition. (i) Fonction de rpartition de : Pour tout v R on a : h i F (v) = P < v = = = = = = = i {1, ..., r} : xi
P [min (X1 , ..., Xr ) < v] 1 P [min (X1 , ..., Xr ) v] 1 P [X1 v, ..., Xr v] r Y P [Xk v] 1 1
k=1 r Y k=1
1 [1 F (v)]r 0 1 exp r v
si v si
v< v>
r exp r
39
A. El Mossadeq
(iii) Esprance mathmatique de : Z h i vf (v) dv E = R Z + r v = v exp r dv Z + t + exp tdt = r 0 + = r (iv) Esprance mathmatique de : Z h 2i v2 f (v) dv E = ZR+ r 2 = v exp r ( v) dv 2 2 + + = r r (v) Variance de : h i h 2i h i2 V = E E 2 = r Lestimateur de est biais, mais il est asymptotiquement sans biais. (c) Considrons lestimateur : T = Alors : E [T ] = = et : r
2
h i E r
40
A. El Mossadeq
6. On suppose que et sont tous les deux inconnus. (a) Considrons un r-chantillon de cette structure. Sa fonction de vraisemblance est dnie pour tout , > 0, R et tout (x1 , ..., xr ) (], +[)r , tous strictement positifs, par : L (, ; x1 , ..., xr ) = =
r Y i=1
f (xi )
r
Compte tenu des questions prcedentes, la fonction : (, ) 7 L (, ; x1 , ..., xr ) atteint son maximum pour : = min (x1 , ..., xr ) # " r 1X = xi r i=1
X ( xi ) 1 exp r i=1
do, les estimateurs du maximum de vraisemblance , de (, ) sont donns par : = min (X1 , ..., Xr ) # " r 1X = Xi r i=1 h i E = + r = =
(b) On a :
et : E [ ]
h i E [X] E r1 r
41
A. El Mossadeq
Exercice 10 Soient X et Y deux variables alatoires indpendantes, la premire prenant les valeurs 1 et 0 avec les probabilits respectives et 1 , et la deuxime prenant les valeurs 1 et 0 avec les probabilits respectives P et 1 P . On suppose inconnue et P connue, P > 0.5. On dnit la variable alatoire Z par : Z = 1 si X = Y On considre un n-chantillon ((X1 , Y1 ) , ..., (Xn , Yn )) de (X, Y ) et on dnit Zi , 1 i n, partir de Xi et Yi comme on a dni Z partir de X et Y . 1. Montrer que (Z1 , ..., Zn ) est un n-chantillon de Z. 2. Etudier les proprits de lestimateur : 1 (Z1 + ... + Zn ) n 3. Proposer alors un estimateur sans biais S de . 4. Etudier la variance de S en fonction de P . 5. Indiquer un intervalle de conance pour lorsque n est grand, en supposant quon dispose dune observation p de la variable : T = 1 (Z1 + ... + Zn ) n 6. Voyez-vous une application de ce qui prcde dans le domaine des sondages dopinion ? T = Z=0 si X 6= Y
42
A. El Mossadeq
Solution 10 On a :
P [X = 0] = 1 P [Y = 0] = 1 P P [Y = 1] = P P [X = 1] =
et :
X et Y deux variables alatoires de Bernouilli de paramtres et P respectivement. Dterminons la loi de probabilit de Z : P [Z = 0] = = = = P [X 6= Y ] P [{(X, Y ) = (0, 1)} {(X, Y ) = (0, 1)}] P [X = 0] P [Y = 1] + P [X = 1] P [Y = 0] (1 ) P + (1 P ) P [X = Y ] P [{(X, Y ) = (0, 0)} {(X, Y ) = (1, 1)}] P [X = 0] P [Y = 0] + P [X = 1] P [Y = 1] (1 ) (1 P ) + P = (1 ) (1 P ) + P de plus : E [Z] V [Z] = = (1 )
et : P [Z = 1] = = = =
1. Puisque (X1 , Y1 ) , ..., (Xn , Yn ) sont indpentants et suivent la mme loi que (X, Y ), on en dduit que (Z1 , ..., Zn ) sont indpendants et suivent la mme loi que Z, donc cest un n-chantillon de Z. 2. Soit lestimateur : 1 T = (Z1 + ... + Zn ) n On a : E [T ] = = E [Z] (1 ) (1 P ) + P
43
A. El Mossadeq
et : 1 V [Z] n 1 [(1 ) (1 P ) + P ] [(1 ) P + (1 P )] = n 3. T est donc un estimateur biais de sauf lorsque : V [T ] = = ou : P =1 (a) Si : = alors il sut de prendre : S=T (b) Si : 6= alors il sut de prendre : S= 4. On a : V [S] = = 1 [T (1 P )] 2P 1 1 et P 6= 1 2 1 ou P = 1 2 1 2
44
A. El Mossadeq
Exercice 1 A la veille dune consultation lectorale, on a intrrog cent lecteurs constituant un chantillon au hasard. Soixante ont dclar avoir lintention de voter pour le candidat C. En quelles limites, au moment du sondage, la proportion du corps lectoral favorable C se situe-t-elle ?
Solution 1 Construisons lintervalle de conance correspondant la frquence f = 0.6 du corps lectoral favorable C observe sur un chantillon de taille n = 100. Au seuil , cet intervalle est dni par : " # r r f (1 f ) f (1 f ) f t1/2 , f + t1/2 n n Pour = 5%, on a : t.975 = 1.96 on obtient alors lintervalle : [.504, .696] A 95%, le candidat C serait lu.
Exercice 2 On sait que le taux de mortalit dune certaine maladie est de 30%. Sur 200 malades tests, combien peut-on envisager de dcs ?
Solution 2 Construisons dobord lintervalle de pari, pour un chantillon de taille n = 200, correspondant la probabilit de dcs p = 0.3. Au seuil , cet intervalle est dni par : " # r r p (1 p) p (1 p) p t1/2 , p + t1/2 n n Pour = 5%, on a : t.975 = 1.96
47
A. El Mossadeq
on obtient alors lintervalle : [.24, .36] Il en rsulte que sur les 200 malades, le nombre de dcs envisager serait compris, 95%, entre 48 et 72 dcs.
Exercice 3 Dans une pr-enqute, on selectionne, par tirage au sort cent dossiers. Quinze dentre eux sont incomplets. Combien de dossiers incomplets trouvera-t-on sur dix milles dossiers ?
Solution 3 Construisons lintervalle de conance correspondant la frquence f = 0.15 de dossiers incomplets observe sur un chantillon de taille n = 100. Au seuil , cet intervalle est dni par : " # r r f (1 f ) f (1 f ) f t1/2 , f + t1/2 n n Pour = 5%, on a : t.975 = 1.96 on obtient alors lintervalle : [.08, .22] Il en rsulte que sur les 10000 dossiers, le nombre de dossiers incomplets serait compris, 95%, entre 800 et 2200 dossiers.
Exercice 4 Dans une maternit, on fait le point de la proportion de lles toutes les cent naissances. Comment peut varier cette proportion dune fois lautre si lon admet quil nait en moyenne 51% de lles ?
Solution 4 Construisons lintervalle de pari, pour un chantillon de taille n = 100, correspondant la probabilit dobtenir une lle p = 0.51.
48
A. El Mossadeq
Au seuil , cet intervalle est dni par : # " r r p (1 p) p (1 p) , p + t1/2 p t1/2 n n Pour = 5%, on a : t.975 = 1.96 on obtient alors lintervalle : [.41, .61] Il en rsulte, qu 95%, la proportion de lles varie dune fois lautre, entre 41% et 61%.
Exercice 5 Une machine former des pilules fonctionne de faon satisfaisante si la proportion de pilules non russies est de 1 pour 1000. Sur un chantillon de 10000 pilules, on a trouv 15 pilules dfectueuses. Que faut-il conclure ?
Solution 5 Ici on :
peut tre considre comme une ralisation dune variable alatoire normale centre rduite. Pour = 5%, on a : t.975 = 1.96
49
A. El Mossadeq
et comme : t = = p (1 p) n 1.58 r f p
on accepte donc lhypothse nulle H0 au seuil = 5%, cest dire, quau seuil = 5%, la machine fonctionne de faon satisfaisante.
Exercice 6 Sur un chantillon de 600 sujets atteints du cancer des poumons, on a trouv 550 fumeurs. Que peut-on dire du pourcentage de fumeurs parmi les cancreux ?
Solution 6 11 Construisons lintervalle de conance correspondant la frquence f = des 12 cancreux parmi les fumeurs observe sur un chantillon de taille n = 600. Au seuil , cet intervalle est dni par : " # r r f (1 f ) f (1 f ) f t1/2 , f + t1/2 n n Pour = 5%, on a : t.975 = 1.96 on obtient alors lintervalle : [.9, .94] Il en rsulte que parmi, les fumeurs, la proportion des atteints par le cancer des poumons est comprise, 95%, entre 90% et 94%.
Exercice 7 Avant de procder au lancement dun produit, une entreprise a fait procder une enqute portant sur deux rgions gographiques A et B. Sur 1800 rponses provenant de la rgion A, 630 se dclarent intresses par le produit. En provenance de B, 150 rponses sur 600 se dclarent favorables. Tester, au seuil de 5%, lhypothse de lidentit des opinions des rgions A et B quant au produit considr.
50
A. El Mossadeq
Solution 7 Ici on : nA = 1800 et fA = 7 20 n = 600 et f = 1 B B 4 Testons, au seuil , lhypothse nulle : H0 : les opinions des rgions A et B sont identiques Sous cette hypothse, la quantit : fA fB fA (1 fA ) fB (1 fB ) + nA nB peut tre considre comme une ralisation dune variable alatoire normale centre rduite. Pour = 5%, on a : t= r t.975 = 1.96 et comme : t = = fA fB fA (1 fA ) fB (1 fB ) + nA nB 4.77 r
on rejette donc lhypothse nulle H0 95% (et mme 99.98%), cest dire, les deux rgions A et B ont des opinions direntes.
Exercice 8 Dans un groupe de 200 malades atteints du cancer du col de lutrus, un traitement par application locale du radium a donn 50 gurisons. Un autre groupe de 150 sujets atteints de la mme maladie a t trait par chirurgie, on a trouv 50 gurisons. Que peut-on conclure ?
51
A. El Mossadeq
Solution 8 Ici on : n1 = 200 , f1 = 1 4 n = 150 , f = 1 2 2 3 Testons, au seuil , lhypothse nulle : H0 : les deux traitements sont quivalents Sous cette hypothse, la quantit : f1 f2 f1 (1 f1 ) f2 (1 f2 ) + n1 n2 peut tre considre comme une ralisation dune variable alatoire normale centre rduite. Pour = 5%, on a : t= r t.975 = 1.96 et comme : t = = f1 f2 f1 (1 f1 ) f2 (1 f2 ) + n1 n2 1.69 r
on accepte donc lhypothse nulle H0 au seuil 5%, cest dire, les deux mthodes sont quivalentes.
Exercice 9 Aux guichets dune gare parisienne, sur les 350 billets vendus vendredi aprs-midi, ` 95 taient des billets de 1ere classe. Sur les 250 billets vendus la matine du lundi ere ` suivant, 55 taient de 1 classe. Peut-on considrer quil y a une dirence entre les proportions de vente de parcours ` en 1ere classe pour les ns et dbuts de semaines ?
52
A. El Mossadeq
Sous cette hypothse, la quantit : f1 f2 f1 (1 f1 ) f2 (1 f2 ) + n1 n2 peut tre considre comme une ralisation dune variable normale centre rduite. Pour = 5%, on a : t= r t.975 = 1.96 et comme : f1 f2 = 1.45 f1 (1 f1 ) f2 (1 f2 ) + n1 n2 on accepte donc lhypothse nulle H0 au seuil 5%, cest dire, les taux de billets ` de parcours en 1ere classe vendus en ns et dbuts de semaines sont identiques et quon peut estimer par : t= r f = = n1 f1 + n2 f2 n1 + n2 0.25
Exercice 10 On a lanc cent fois une pice de monnaie et lon a obtenu soixante fois pile et quarante fois face. Tester au seuil de 5%, puis 1%, lhypothse de la loyaut de la pice.
53
A. El Mossadeq
Solution 10 Ici on :
o f est la frquence de pile. Testons, au seuil , lhypothse nulle : H0 : la pice est loyale Sous cette hypothse, on a : p = 0.5 et la quantit : p (1 p) n peut tre considre comme une ralisation dune variable alatoire normale centre rduite. on a : f p t = r p (1 p) n = 2 (1) Pour = 5%, on a : t.975 = 1.96 on rejette donc lhypothse nulle H0 95%, cest dire, qu 95%, la pice est truque. (2) Pour = 1%, on a : 2.57 < t.995 < 2.58 on accepte donc lhypothse nulle H0 au seuil = 1%, cest dire, quau seuil = 1%, la pice est normale. t= r f p
n = 100 f = 0.6
Exercice 11 Un chantillon de taille n a donn lieu au calcul dune frquence observe f correspondant lintervalle de conance [.22 .34] au seuil = 5%. 1. Calculer n. 2. Par rapport la proportion p = 0.3, lcart est-il signicatif au seuil = 5% ? 3. Dterminer lintervalle de conance de |f p| au seuil = 5%.
54
A. El Mossadeq
Solution 11 1. Au seuil , lintervalle de conance correspondant une frquence f observe sur un chantillon de taille n est dni par : " # r r f (1 f ) f (1 f ) f t1/2 , f + t1/2 n n On en dduit : f = 0.22 + 0.34 2
2. Testons, au seuil , lhypothse nulle : H0 : lcart nest pas singicatif Sous cette hypothse, la quantit : t= r p (1 p) n f p
peut tre considre comme une ralisation dune variable alatoire normale centre rduite. On a : f p t = r p (1 p) n = 0.64 Pour = 5%, on a : t.975 = 1.96 on accepte donc lhypothse nulle H0 au seuil = 5%. 3. Au seuil : f p r t1/2 , t1/2 p (1 p) n
55
A. El Mossadeq
donc, au seuil :
"
p (1 p) n
Exercice 12 Ltude du taux de dfectuosits arentes aux caractristiques de traitements thermiques dune mme pice, traite par deux fours dirents, a donn lieu aux rsultats suivants : * Pour le premier four, 20 pices dfectueuses sur un chantillon de 200 pices traites. * Pour le second four, 120 pices dfectueuses sur un chantillon de 800 pices traites. Que peut-on conclure ?
Solution 12 Ici on :
n1 = 200 , f1 = 0.10 n = 800 , f = 0.15 2 2 H0 : les deux traitements thermiques sont quivalents
peut tre considre comme une ralisation dune variable alatoire normale centre rduite. Pour = 5%, on a : t.975 = 1.96
56
A. El Mossadeq
et comme : t = = f1 f2 f1 (1 f1 ) f2 (1 f2 ) + n1 n2 2.03 r
on rejette donc lhypothse nulle H0 95%, cest dire, les deux traitements ne sont pas quivalents.
Exercice 13 Un questionnaire auquel on ne peut rpondre que par oui ou par non, a t rempli par un chantillon de taille n. Lintervalle de conance de la frquence observe f des rponses oui est (0.35 0.43) au seuil = 5%. 1. Quelle est la taille n de lchantillon. 2. Par rapport la proportion p = 0.4, lcart est-il signicatif au seuil = 5% ? 3. Dterminer lintervalle de conance de |f p| au seuil = 5%. Solution 13 1. Au seuil , lintervalle de conance correspondant une frquence f observe sur un chantillon de taille n est dni par : " On en dduit : f = 0.35 + 0.43 2 Pour = 5%, on a : on obtient alors : r f (1 f ) , f + t1/2 n r f (1 f ) n #
f t1/2
A. El Mossadeq
2. Testons, au seuil , lhypothse nulle : H0 : lcart nest pas singicatif Sous cette hypothse, la quantit : t= r p (1 p) n f p
peut tre considre comme une ralisation dune variable alatoire normale centre rduite. On a : f p t = r p (1 p) n = 0.49 Pour = 5%, on a : t.975 = 1.96 On accepte donc lhypothse nulle H0 au seuil = 5%. 3. Au seuil : f p r t1/2 , t1/2 p (1 p) n donc, au seuil : " # r p (1 p) |f p| 0, t1/2 n Pour = 5%, on a : t.975 = 1.96 do : |f p| [0, 0.04]
Exercice 14 Parmi 470 sujets exposs une infection, 370 nayant pas t immuniss. Parmi ces derniers, 140 contractent la malidie ainsi que 25 sujets immuniss. Le traitement donne-t-il une protection signicative ?
58
A. El Mossadeq
Solution 14 Soient f1 la frquence de contracter la maladie pour un sujet non immunis et f2 la frquence de contracter la maladie pour un sujet immunis. Ici on : n1 = 370 et f1 = 14 37 n = 100 et f = 1 2 2 4 Testons, au seuil , lhypothse nulle : H0 : le traitements nest pas ecace Sous cette hypothse, la quantit : t= r f1 f2 f1 (1 f1 ) f2 (1 f2 ) + n1 n2
peut tre considre comme une ralisation dune variable alatoire normale centre rduite. Pour = 5%, on a : t.975 = 1.96 et comme : t = = f1 f2 f1 (1 f1 ) f2 (1 f2 ) + n1 n2 2.56 r
On rejette donc lhypothse nulle H0 95%, cest dire, le traitement donne une protection signicative.
59
A. El Mossadeq
Exercice 1 Avant de procder au lancement dun produit, une entreprise a fait procder une enqute portant sur deux rgions gographiques A et B. Sur 1800 rponses provenant de la rgion A, 630 se dclarent intresses par le produit. En provenance de B, 150 rponses sur 600 se dclarent favorables. Tester, au seuil de 5%, lhypothse de lidentit des opinions des rgions A et B quant au produit considr.
Solution 1 La rpartition observe est : T ableau des eff ectif s observes e RgionOpinion favorable non favorable T otal e Rgion A e Rgion B e T otal 630 150 780 1170 450 1620 1800 600 2400
Testons, au seuil , lhypothse nulle : H0 : les rgions A et B ont la mme opinion Calculons, sous cette hypothse, la rpartition thorique : T ableau des ef fectif s thoriques e RgionOpinion favorable non favorable T otal e Rgion A e Rgion B e T otal 585 195 780 1215 405 1620 1800 600 2400
tij
63
A. El Mossadeq
est une ralisation dune variable du Khi-deux : (2 1) (2 1) = 1 degr de libert. Pour = 5%, on a : 2 = 3.84 1;.95 Et comme : 2 = =
2 2 X X (oij tij )2 i=1 j=1
tij
20.51
On rejette alors H0 95% (et mme 99.5%), cest dire, les deux rgions ont des opinions direntes quant au produit considr.
Exercice 2 Dans un groupe de 200 malades atteints du cancer du col de lutrus, un traitement par application locale du radium a donn 50 gurisons. Un autre groupe de 150 sujets atteints de la mme maladie a t trait par chirurgie, on a trouv 54 gurisons. Que peut-on conclure ?
Solution 2 La rpartition observe est : T ableau des eff ectif s observes e T raitementRsultat guri non guri T otal e e e radium chirurgie T otal Testons, au seuil , lhypothse nulle : H0 : les deux traitements sont quivalents 50 54 104 150 96 246 200 150 350
64
A. El Mossadeq
Calculons, sous cette hypothse, la rpartition thorique : T ableau des ef fectif s thoriques e T raitementRsultat guri non guri T otal e e e radium chirurgie T otal Sous lhypothse nulle H0 , la quantit : =
2 2 2 X X (oij tij )2 i=1 j=1
tij
est une ralisation dune variable du Khi-deux : (2 1) (2 1) = 1 degr de libert. Pour = 5%, on a : 2 = 3.84 1;.95 Et comme : 2 = =
2 2 X X (oij tij )2 i=1 j=1
tij
4.94
On rejette alors H0 95% , cest dire, les deux traitements ne sont pas quivalents.
Exercice 3 Aux guichets dune gare parisienne, sur les 350 billets vendus vendredi aprs-midi, ` 95 taient des billets de 1ere classe. Sur les 250 billets vendus la matine du lundi ` suivant, 55 taient de 1ere classe. Peut-on considrer quil y une dirence entre les proportions de vente de parcours ` en 1ere classe pour les ns et dbuts de semaines ?
65
A. El Mossadeq
Solution 3 La rpartition observe est : T ableau des eff ectif s observes e jourClasse V endredi A.M Lundi matin T otal
` ` 1ere classe 2ere classe T otal
95 55 150
Calculons, sous cette hypothse, la rpartition thorique : T ableau des ef fectif s thoriques e JourClasse V endredi A.M Lundi matin T otal
` ` 1ere classe 2ere classe T otal
tij
est une ralisation dune variable du Khi-deux : (2 1) (2 1) = 1 degr de libert. Pour = 5%, on a : 2 = 3.84 1;.95
66
A. El Mossadeq
Et comme : 2 = =
2 2 X X (oij tij )2 i=1 j=1
tij
2.06
On accepte alors H0 au seuil = 5% , cest dire, les taux de billets de parcours en ` 1 ere classe vendus en ns et dbuts de semaines sont identiques.
Exercice 4 On a lanc cent fois une pice de monnaie et lon a obtenu soixante fois pile et quarante fois face. Tester au seuil de 5% puis 1%, lhypothse de la loyaut de la pice.
Solution 4 Testons, au seuil , lhypothse nulle : H0 : la pice est loyale Sous cette hypothse, on a : p = 0.5 do les rpartitions : C ot e pile f ace T otal Rpartition Observe Rpartition T horique e e e e 60 40 100 50 50 100
ti
67
A. El Mossadeq
= =
ti
(1) Pour = 5%, on a : 2 = 3.84 1;.95 On rejette donc lhypothse nulle H0 95%, cest dire, qu 95%, la pice est truque. (2) Pour = 1%, on a : 2 = 6.63 1;.99 On accepte donc lhypothse nulle H0 au seuil = 1%, cest dire, quau seuil = 1%, la pice est normale.
Exercice 5 On veut savoir si la russite (R) dun traitement est indpendantes du niveaux de la tension artrielle du malade (T ). On dispose pour cela de 250 observations rparties comme suit : T R basse eleve e Que peut-on conclure ? echec succ`s e 21 29 104 96
68
A. El Mossadeq
Solution 5 La rpartition observe est : T ableau des eff ectif s observes e T R Basse Eleve e T otal Echec Succ`s T otal e 21 29 50 104 96 200 125 125 250
Testons, au seuil , lhypothse nulle : H0 : la russite du traitement est indpendante du niveau de la tension artrielle Calculons, sous cette hypothse, la rpartition thorique, le tableau de cette rpartition est donn ci-aprs. T ableau des ef fectif s thoriques e T R Basse Eleve e T otal Echec Succ`s T otal e 25 25 50 100 100 200 125 125 250
tij
est une ralisation dune variable du Khi-deux : (2 1) (2 1) = 1 degr de libert. Pour = 5%, on a : 2 = 3.84 1;.95
69
A. El Mossadeq
Et comme : 2 = =
2 2 X X (oij tij )2 i=1 j=1
tij
1.6
On accepte alors H0 au seuil = 5% , cest dire, la russite du traitement est indpendante du niveau de la tension artrielle.
Exercice 6 On veut savoir sil y a une liason entre la localisation (L) du cancer du poumon (priphrique , non priphrique) et le ct (C) de la lsion (poumon gauche , poumon droit). Ltude a port sur 1054 malades : LC priphrique e e non priphrique e e Que peut-on conclure ? gauche droit 26 416 62 550
Solution 6 La rpartition observe est : T ableau des eff ectif s observes e LC priphrique e e non priphrique e e T otal Testons, au seuil , lhypothse nulle : H0 : la localisation du cancer est indpendante du ct de la lsion gauche droit T otal 26 416 442 62 550 612 88 966 1054
Calculons, sous cette hypothse, la rpartition thorique. Le tableau de cette rpartition est donne ci-aprs.
70
A. El Mossadeq
T ableau des ef fectif s thoriques e LC priphrique e e nonpriphrique e e T otal Sous lhypothse nulle H0 , la quantit : 2 =
2 2 X X (oij tij )2 i=1 j=1
tij
= =
tij
6.05
On rejette alors H0 95% (mme 97.5%), cest dire, la localisation du cancer dpend du ct de la lsion.
Exercice 7 De nombreuses observations cliniques ont montr que jusque l : 30% 50% 10% 10% des malades atteints de M ont une survie infrieure un an ont une survie entre un an et deux ans ont une survie entre deux ans et cinq ans ont une survie suprieure cinq ans.
71
A. El Mossadeq
12 ont une survie infrieure un an 56 ont une survie entre un an et deux ans 8 ont une survie entre deux ans et cinq ans 4 ont une survie suprieure cinq ans.
Solution 7 Testons, au seuil , lhypothse nulle : H0 : le nouveau traitement nest pas actif contre la maladie M Sous cette hypothse, on a les rpartitions : Survie survie 1 an 1 an < survie 2 ans 2 an < survie 5 ans survie > 5 ans T otal Sous lhypothse nulle H0 , la quantit : 2 =
4 X (oi ti )2 i=1
ti
est une ralisation dune variable du Khi-deux : 41=3 degrs de libert. Pour = 5%, on a : 2 = 7.81 3;.95
72
A. El Mossadeq
Et comme : 2 = =
2 X (oi ti )2 i=1
ti
14.4
on rejette donc lhypothse nulle H0 95% (mme 99.5%), cest dire, qu 99.5%, le nouveau traitement est actif contre la maladie M.
Exercice 8 On suppose pouvoir classer les malades atteints dune maladie M en trois catgories cliniques : A , B , C. On se demande si ces trois catgories dirent par leurs survies un an. Les eectifs observs sont les suivants : SurvieCatgorie e survie a un an ` dcs avant un an e e Que peut-on conclure ? A 5 B 20 C 45
15 50 145
Solution 8 La rpartition observe est : T ableau des eff ectif s observes e SurvieCatgorie e Survie a un an ` A 5 B 20 C 45 T otal 70 210 280
73
A. El Mossadeq
T ableau des ef fectif s thoriques e SurvieCatgorie e Survie a un an ` Dcs avant un an e e T otal Sous lhypothse nulle H0 , la quantit : 2 =
3 2 X X (oij tij )2 i=1 j=1
A 5
B 17.5
C 47.5
tij
= =
tij
.65
On accepte alors H0 au seuil = 5% , cest dire, la survie un an est indpendante de la catgorie clinique.
Exercice 9 75 enfants sont vus en consultation pour un asthme. On relve chez eux les deux symptmes suivants : * Intensit de la maladie asmathique : lgre , moyenne , forte * Existence ou absence dun eczma au moment de lobservation ou dans le pass.
74
A. El Mossadeq
On peut classer les enfants selon la rpartition suivante : EA prsent e pass e jamais fort moyen lger e 8 11 6 2 11 18 2 3 14
Au vu de ces rsultats, existe-t-il une association entre lintensit de lasthme et lexistence dun eczma ?
Solution 9 Le tableau de la rpartition observe est donne ci-aprs: T ableau des eff ectif s observes e EczmaAsthme f ort moyen lger e e prsent e pass e jamais T otal Testons, au seuil , lhypothse nulle : H0 : lintensit de lasthme est indpendante de lexistence dun eczma 8 11 6 25 2 11 18 31 2 3 14 19 T otal 12 25 38 75
Calculons, sous cette hypothse, la rpartition thorique. Le tableau de cette rpartition est donne ci-aprs.
75
A. El Mossadeq
T ableau des ef fectif s thoriques e EczmaAsthme e prsent e pass e jamais T otal f ort 4 8.33 12.67 25 moyen lger e 4.96 10.33 15.71 31 3.04 6.34 9.62 19 T otal 12 25 38 75
Les eectifs thoriques sur la premire ligne sont strictement infrieurs cinq, ce qui empche lapplication dun test du Khi-deux.On peut remdier cet tat en oprant le groupement logique des classes prsent et pass. e e Les nouveaux tableaux des eectifs observs et thoriques, obtenus aprs regroupement de ces deux classes sont donns ci-aprs. T ableau des eff ectif s observes e EczmaAsthme f ort moyen lger e e prsent ou pass e e jamais T otal 19 6 25 13 18 31 5 14 19 T otal 37 38 75
T ableau des eff ectif s thoriques e EczmaAsthme e prsent ou pass e e jamais T otal Sous lhypothse nulle H0 , la quantit : =
2 3 2 X X (oij tij )2 i=1 j=1
T otal 37 38 75
tij
76
A. El Mossadeq
est une ralisation dune variable du Khi-deux : (2 1) (3 1) = 2 degrs de libert. Pour = 5%, on a : 2 = 5.99 2;.95 Et comme :
2 3 2 X X (oij tij )2 i=1 j=1
= =
tij
11.84
On rejette alors H0 95% (mme 99.5%), cest dire, lintensit de lasthme dpend de lexistence dun eczma.
Exercice 10 Une tude statistique relative aux rsultats dadmission du concours dune grande cole fait ressortir la rpartition des admis selon la profession des parents lorsque celle-ci est connue. 1. La profession des parents a-t-elle une inuence sur laccs cette cole ? 2. Cette conclusion persiste-t-elle lorsquon tient compte pour complter la statistique prcdente de 961 candidats dont lorigine socio-professionnelle est inconnue et qui ont obtenus 43 succs ? P rof ession des P arents F ontionnaires et Assimils e Commerce et Industrie P rof essions Librales e P ropritaires Rentiers e P ropritaires Agricoles e Artisans Banques et Assurances Candidats Admis 2224 998 575 423 287 210 209 180 89 48 37 13 18 17
77
A. El Mossadeq
Solution 10 1. La rpartition observe est : P rofession des P arents F ontionnaires et Assimils e Commerce et Industrie P rofessions Librales e P ropritaires Rentiers e P ropritaires Agricoles e Artisans Banques et Assurances T otal Testons, au seuil , lhypothse nulle : H0 : laccs lEcole est indpendant de la profession des parents Calculons, sous cette hypothse, la rpartition thorique : P rof ession des P arents F ontionnaires et Assimils e Commerce et Industrie P rofessions Librales e P ropritaires Rentiers e P ropritaires Agricoles e Artisans Banques et Assurances T otal Candidats Admis Non admis 2224 998 575 423 287 210 209 4916 181.9 80.8 47 34.6 23.5 17.2 17.1 402 2042.1 907.2 528 388.4 263.5 192.8 191.9 4514 Candidats Admis Non admis 2224 998 575 423 287 210 209 4916 180 89 48 37 13 18 17 402 2044 899 527 386 274 192 192 4514
78
A. El Mossadeq
tij
est une ralisation dune variable du Khi-deux : (7 1) (2 1) = 6 degrs de libert. Pour = 5%, on a : 2 = 12.6 6;.95 Et comme :
2 3 X X (oij tij )2 = = 6.28 tij i=1 j=1 2
On accepte alors H0 au seuil = 5% , cest dire, laccs lEcole est indpendant de la profession des parents. 2. Si lon tient compte des 961 candidats dont lorigine socio-professionnelle est inconnue et qui ont obtenus 43 succs, la rpartition observe et la rpartition thorique, sous la mme hypothse nulle, deviennent comme consogns ci-aprs. T ableau des eff ectif s observes e P rofession des P arents F ontionnaires et Assimils e Commerce et Industrie P rofessions Librales e P ropritaires Rentiers e P ropritaires Agricoles e Artisans Banques et Assurances Autres T otal Candidats Admis Non admis 2224 998 575 423 287 210 209 961 5877 180 89 48 37 13 18 17 43 445 2044 899 527 386 274 192 192 918 5432
79
A. El Mossadeq
T ableau des ef fectif s thoriques e P rofession des P arents F ontionnaires et Assimils e Commerce et Industrie P rofessions Librales e P ropritaires Rentiers e P ropritaires Agricoles e Artisans Banques et Assurances Autres T otal Candidats Admis Non admis 2224 998 575 423 287 210 209 961 5877 168.4 74.8 43.5 32 21.7 15.9 15.8 72.8 445 2055.6 913.2 531.5 391 265.3 194.1 193.2 888.2 5432
tij
est une ralisation dune variable du Khi-deux : (8 1) (2 1) = 7 degrs de libert. Pour = 5%, on a : 2 = 14.1 7;.95 Et comme :
3 2 X X (oij tij )2 = = 22.5 tij i=1 j=1 2
On rejette alors H0 95% (mme 99.5%) , cest dire, laccs lEcole est indpendant de la profession des parents.
80
A. El Mossadeq
Exercice 11 Sur un chantillon de 84 prmaturs, on cherche sil existe une liaison entre la survenue dune hypoglycmie et la survenue dun ictre : sur 43 enfants nayant pas dictre, 23 sont hypoglycmiques sur 20 enfants ayant un ictre modr, 6 sont hypoglycmiques sur 21 enfants ayant un ictre intense, 4 sont hypoglycmiques Que peut-on conclure ?
Solution 11 La rpartition observe est donne dans le tableau : T ableau des eff ectif s observes e Ict`reHypoglycmie hypoglycmique non hypoglycmique T otal e e e e pas d0 ict`re e ict`re modr e e e ict`re intense e T otal Testons, au seuil , lhypothse nulle : H0 : la survenue dune hypoglycmie est indpendante de la survenue dun ictre 23 6 4 33 20 14 17 51 43 20 21 84
Calculons, sous cette hypothse, la rpartition thorique : T ableau des ef fectif s thoriques e Ict`reHypoglycmie hypoglycmique non hypoglycmique T otal e e e e pas d0 ict`re e ict`re modr e e e ict`re intense e T otal 16.89 7.86 8.25 33 26.11 12.14 12.75 51 43 20 21 84
81
A. El Mossadeq
tij
est une ralisation dune variable du Khi-deux : (3 1) (2 1) = 2 degrs de libert. Pour = 5%, on a : 2 = 5.99 2;.95 Et comme : 2 = =
2 3 X X (oij tij )2 i=1 j=1
tij
7.97
On rejette alors H0 95% (mme 97.5%), cest dire, la survenue dune hypoglycmie dpend de la survenue dun ictre.
Exercice 12 Un mdicament essay sur 42 patients est contrl quant aux eets secondaires quil peut avoir sur le poids des malades. On peut considrer que : quinze dentre eux ont maigri dix sept nont pas chang de poids dix ont grossi En supposant que la maladie est sans eet sur les variations de poids, le mdicament a-t-il un eet signicatif sur le poids ?
Solution 12 Testons, au seuil , lhypothse nulle : H0 : le traitement est sans eet sur les variations du poids Si le traitement est sans eet sur les variations du poids, alors ces variations sont des seulement au hasard. La loi de probabilit est donc la loi uniforme, cest dire la probabilit de chaque 1 classe est la mme et est gale . 3
82
A. El Mossadeq
Do les rpartitions : V ariations ont maigri n0 ont pas chang e ont grossi T otal Rpartition Observe Rpartition T horique e e e e 15 17 10 42 14 14 14 42
ti
est une ralisation dune variable du Khi-deux : 31=2 degrs de libert. Pour = 5%, on a : 2 = 5.99 2;.95 Et comme :
= =
1.86
2 X (oi ti )2 i=1
ti
on accepte donc lhypothse nulle H0 au seuil = 5%, cest dire, le traitement est sans eet sur les variations du poids.
Exercice 13 Pour tudier la densit de poussires dans un gaz, on a procd une srie dobservations de petits chantillons de gaz au moyen dun microscope. On a ainsi eectu 143 observations et les rsultats sont les suivants :
83
A. El Mossadeq
Peut-on admettre, au seuil = 5%, que le nombre de particules en suspension est une variable de P oisson ?
Solution 13 Testons, au seuil , lhypothse nulle : H0 : le nombre de particules en suspension est une variable de Poisson Calculons une estimation ponctuelle du paramtre de cette loi : k exp k! o X est la variable alatoire reprsentant le nombre de particules en suspension. On sait que : n 1X = Xi n i=1 P [X = k] = est un estimateur sans biais et convergent de . Une estimation ponctuelle de est donne par :
5
= =
1.4336
Do les rpartitions :
84
A. El Mossadeq
Rpartition observe Rpartition thorique e e e e 34 46 38 19 4 2 0 143 34.1 48.9 35.0 16.7 06.0 01.7 00.6 143
Leectif thorique tk , k 0, reprsentant le nombre particules en suspension k est donn par : tk = nP [X = k] On constate que le tableau contient des eectifs thoriques strictement infrieurs 5, ce qui empche lutilisation dun test du khi-deux. On peut remdier cet tat en oprant le groupement logique des classes 4 et plus. Les tableaux des eectifs observs et thoriques deviennent comme consigns ciaprs. P articules en suspension 0 1 2 3 4 T otal Rpartition observe Rpartition thorique e e e e 34 46 38 19 4 143 34.1 48.9 35.0 16.7 08.3 143
85
A. El Mossadeq
ti
degrs de libert.puisque pour calculer les eectifs thoriques, nous avons utilis lestimation, et non la valeur rel, du paramtre de la loi de Poisson. Pour = 5%, on a : 2 = 7.81 3;.95 Et comme : 2 = 2.97 On accepte alors H0 au seuil = 5%, cest dire, le nombre de particules en suspension peut tre ajust par une loi de Poisson dont le paramtre est estim par : = 1.4336
Exercice 14 Le tableau ci-aprs concerne le nombre annuel de cyclones tropicaux ayant atteint la cte orientale des Etats-Unis entre 1887 et 1956 : Nombre annuel de cyclones Nombre d0 annes e 0 1 1 6 2 10 3 16 4 19 5 5 6 8 7 3 8 1 9 1 >9 0 Peut-on admettre, au seuil = 5%, que ce nombre annuel de cyclones est une variable de P oisson ?
86
A. El Mossadeq
Solution 14 Testons, au seuil , lhypothse nulle : H0 : le nombre annuel de cyclones est une variable de Poisson Calculons une estimation ponctuelle du paramtre de cette loi : k exp k! o X est la variable alatoire reprsentant le nombre annuel de cyclones. On sait que : n 1X = Xi n i=1 P [X = k] = est un estimateur sans biais et convergent de . Une estimation ponctuelle de est donne par :
9
Leectif thorique tk , k 0, reprsentant le nombre dannes k cyclones est donn par : tk = nP [X = k] Do les rpartitions : Nombre annuel de cyclones Eff ectif s observs Ef fectifs thoriques e e 0 1 1.68 1 6 6.27 2 10 11.69 3 16 14.53 4 19 13.54 5 5 10.1 6 8 6.28 7 3 3.34 8 1 1.56 9 1 0.65 >9 0 0.36 T otal 70 70
On constate que le tableau contient des eectifs thoriques strictement infrieurs 5, ce qui empche lutilisation dun test du khi-deux. On peut remdier cet tat en oprant le groupement logique : * des classes 0 et 1 dune part, * et des classes 7 et plus dautre part.
87
A. El Mossadeq
Les tableaux des eectifs observs et thoriques deviennent : Nombre annuel de cyclones Ef fectif s observs Eff ectifs thoriques e e 0 ou 1 2 3 4 5 6 7 T otal Sous lhypothse nulle H0 , la quantit : =
2 7 X (oi ti )2 i=1
7 10 16 19 5 8 5 70
ti
degrs de libert.puisque pour calculer les eectifs thoriques, nous avons utilis lestimation, et non la valeur rel, du paramtre de la loi de Poisson. Pour = 5%, on a : 2 = 5.8948 5;.95 Et comme : 2 = 5.81 On accepte alors H0 au seuil = 5%, cest dire, le nombre annuel de cyclones peut tre ajust par une loi de Poisson dont le paramtre est estim par : = 3.7286
88
A. El Mossadeq
Exercice 15 Le tableau suivant indique le rsultat de lexamen de 124 sujets, classs daprs la couleur de leurs yeux (Y ) et la couleur de leus cheveux (C) : Y C Bleus Gris ou V erts Marrons Blonds Bruns Noirs Roux 25 13 7 9 17 13 3 10 8 7 7 5
Solution 15 La rpartition observe est : Y C Bleus Gris ou V erts Marrons T otal Blonds Bruns Noirs Roux T otal 25 13 7 45 9 17 13 39 3 10 8 21 7 7 5 19 44 47 33 124
Testons, au seuil , lhypothse nulle : H0 : les couleurs des yeux et des cheveux sont indpendantes
Calculons, sous cette hypothse, la rpartition thorique : Y C Bleus Gris ou V erts Marrons T otal Blonds Bruns Noirs Roux T otal 16 17 12 45 13.8 14.8 10.4 39 7.4 8 5.6 21 6.8 7.2 5 19 44 47 33 124
89
A. El Mossadeq
tij
est une ralisation dune variable du Khi-deux : (3 1) (4 1) = 6 degrs de libert. Pour = 5%, on a : 2 = 12.6 6;.95 Et comme :
2 3 2 X X (oij tij )2 i=1 j=1
= =
tij
15
On rejette alors H0 95% (mme 97.5%), cest dire, les couleurs des yeux et des cheveux ne sont pas indpendantes.
Exercice 16 On considre les familles de quatre enfants. Sur un chantillon de cent familles quatre enfants, la rpartition suivante a t observe :
Peut-on considrer que la probabilit quun enfant soit une lle est
90
A. El Mossadeq
Solution 16 Testons, au seuil , lhypothse nulle : 1 2 Sous lhypothse nulle H0 , la variable alatoire X gale au nombre de lles parmi 1 1 les quatre enfants suit une loi binomiale dordre 4 et de paramtre : B 4, . 2 2 Ainsi, pour tout k, 0 k 4, la probabilit pk davoir k lles parmi les quatre enfants est : 4 1 pk = C (4, k) 2 H0 : la probabilit davoir une lle est
Leectif thorique tk , 0 k 4, reprsentant le nombre de familles ayant k lles parmi les quatre enfants est donn par : tk = npk Do les rpartitions : Nombre de filles Rpartition observe Rpartition thorique e e e e 0 1 2 3 4 T otal 7 20 41 22 10 100 6.25 25 37.5 25 6.25 100
ti
est une ralisation dune variable du Khi-deux : 51=4 degrs de libert. Pour = 5%, on a : 2 = 9.49 4;.95
91
A. El Mossadeq
Et comme : 2 = 4.03 On accepte alors H0 au seuil = 5% : la probabilit davoir une lle est 1 . 2
Exercice 17 On distribue un jeu de quarante cartes quatre joueurs : A , B , C , D ; chacun reevant dix cartes Un statisticien a labor un programme de distribution de donnes par ordinateur. Pour un ensemble de deux cents donnes, obtenues partir de ce programme, il observe le nombre de donnes o le joueur A reoit k as, 0 k 4. Les rsultats sont les suivants : Nombre d0 as Nombre de donnes 0 1 2 3 4 Le programme du statisticien est-il able ? 64 74 52 8 2
Solution 17 Testons, au seuil , lhypothse nulle : H0 : le programme du statisticien est able Sous lhypothse nulle H0 , la variable alatoire X gale au nombre das du joueur A suit une loi hypergomtrique. Ainsi, pour tout k, 0 k 4, la probabilit pk pour que le joueur A ait k as est : pk = C (4, k) C (36, 10 k) C (40, 10)
Leectif thorique tk , 0 k 4, reprsentant le nombre de donnes k as, du joueur A, est donn par : tk = npk
92
A. El Mossadeq
Do les rpartitions : Nombre d0 as Rpartition observe Rpartition thorique e e e e 0 1 2 3 4 T otal 64 74 52 8 2 200 59.97 88.85 42.84 7.88 0.46 200
On constate que le tableau contient des eectifs thoriques strictement infrieurs 5, ce qui empche lutilisation dun test du khi-deux. On peut remdier cet tat en oprant le groupement logique des classes 3 et 4. Le tableau des eectifs observs et thoriques deviennent : Nombre d0 as Rpartition observe Rpartition thorique e e e e 0 1 2 3 ou 4 T otal 64 74 52 10 200 59.97 88.85 42.84 8.34 200
ti
93
A. El Mossadeq
Pour = 5%, on a : 2 = 7.81 3;.95 Et comme : 2 = 5.0418 On accepte alors H0 au seuil = 5%, cest dire, le programme du statisticien est able.
94
A. El Mossadeq
Exercice 1 Une srie de cent mesures a donn comme rsultat : 100 X xi = 5200 i=1
1. Estimer la moyenne et la variance. 2. Quel est, 95%, lintervalle de conance de la moyenne ? 3. En supposant la variable mesure gaussienne, dterminer, 95%, lintervalle de conance de la variance.
52
1 X xi 100 i=1
100
= =
2. Au seuil , lintervalle de conace de la moyenne est dni par : m t1/2 , m + t1/2 n n Pour = 5%, on a : t.975 = 1.96 do lintervalle de conance 95% : [51.608, 52.392] 3. Au seuil , lintervalle de conace de la variance est dni par : " (n 1) 2 (n 1) 2 s, 2 s 2 n1;/2 n1;1/2 #
97
A. El Mossadeq
Exercice 2 La force de rupture dun certain type de cable peut tre assimile une variable alatoire normale. Des essais portant sur dix cables ont donn une variance empirique s2 de 1560 N2 . Construire un intervalle de conance, 95%, de lcart-type de cette force de rupture.
Solution 2 Au seuil , lintervalle de conace de lcart-type est dni par : "s Pour = 5% : (n 1) s, 2 n1;1/2 s (n 1) s 2 n1;/2 #
Exercice 3 Une enqute statistique eectue sur cent sujets permet de dnir, 95%, lintervalle de conance de la moyenne : Dans quelles conditions aurait-il t possible que le rsultat ft 95% : [49.8 50.2] [49.6 50.4]
98
A. El Mossadeq
Solution 3 Il sagit de dterminer la taille n0 de lchantillon prlever pour que lintervalle de conance de la moyenne 95% soit : [49.8, 50.2] sachant que pour un chantillon de taille n = 100, cet intervalle est : [49.6, 50.4] Puisque : m t1/2 , m + t1/2 = [49.6, 50.4] n n 49.6 + 50.4 2 50 n (50.4 49.6) 2t1/2 2.04
on en dduit :
= =
et : = ' Lgalit :
= =
Exercice 4 Pour dterminer le point de fusion moyen dun certain alliage, on a procd neuf observations qui ont donnes une moyenne m = 1040 C et un cart-type s = 16 C. Construire un intervalle de conance de la moyenne 95%.
99
A. El Mossadeq
Au seuil , lintervalle de conace dune telle moyenne est dni par : s s m tn1;1/2 , m + tn1;1/2 n n t8;.975 = 2.31 do lintervalle de conance 95% : [1027.68 C, 1052.32 C]
Pour = 5%, on a :
Exercice 5 La taille de 1200 conscrits du bureau de recrutement X a pour moyenne X = 172 cm et pour cart-type sX = 6 cm. Les mmes mesures eectues sur les 250 conscrits du bureau de recrutement Y ont donn pour moyenne Y = 170 cm et pour cart-type sX = 5 cm. Que peut-on conclure ?
Solution 5 Testons au seuil lhypothse nulle : H0 : les conscrits des bureaux de recrutement X et Y ont la mme taille Sous lhypothse nulle H0 , la quantit : X Y t= r 2 sX s2 + Y n1 n2 peut tre considre comme une ralisation dune variable alatoire normale centre rduite. Pour = 5%, on a : t.975 = 1.96
100
A. El Mossadeq
Et comme : t = = X Y r 2 sX s2 + Y n1 n2 5.547
On rejette alors lhypothse nulle H0 95% (mme 99%), cest dire, les conscrits des bureaux de recrutement X et Y ont des tailles moyennes direntes.
Exercice 6 On se propose de comparer le poids la naissance chez une srie de primapares (srie 1) et une srie de multipares (srie 2) : Srie 1 : n1 = 95 e m1 = 3197 g s2 = 210100 g2 1
Solution 6 Testons au seuil lhypothse nulle : H0 : les primapares et les multipares ont le mme poids moyen la naissance Sous lhypothse nulle H0 , la quantit : m1 m2 t= r 2 s1 s2 + 2 n1 n2 peut tre considre comme une ralisation dune variable alatoire normale centre rduite.Pour = 5%, on a : t.975 = 1.96 Et comme : t = = m m2 r 12 s1 s2 + 2 n1 n2 3.1256
On rejette alors lhypothse nulle H0 , 95% (mme 99%), cest dire, les primapares et les multipares nont pas le mme poids moyen la naissance
101
A. El Mossadeq
Exercice 7 Chez cent sujet normaux, on dose lacide urique, les rsultats sont : m1 = 53.3 mg/ l s1 = 9.1 mg/ l Chez cent sujet atteints de la maladie de goutte, le mme dosage de lacide urique fournit les rsultats : m2 = 78.6 mg/ l s2 = 13.1 mg/ l Que peut-on conclure ?
Solution 7 Testons au seuil , lhypothse nulle : H0 : la maladie de goutte na pas dinuence sur la dose de lacide urique Sous cette hypothse, la quantit : m1 m2 t= r 2 s1 s2 + 2 n1 n2 peut tre considre comme une ralisation dune variable alatoire normale centre rduite. Pour = 5%, on a : t.975 = 1.96 et comme : t = = m m2 r 12 s1 s2 + 2 n1 n2 15.862
On rejette lhypothse nulle H0 95% (mme 99.99%), cest dire, la maladie de goutte a une inuence sur la dose de lacide urique.
Exercice 8 On admet que la valeur moyenne de la glycmie du sujet normal est 1 g/ l. Sur 17 sujets, on a trouv une moyenne de .965 g/ l et un cart-type estim de .108 g/ l. Cette valeur peut-elle tre considre comme dirente du taux normal ?
102
A. El Mossadeq
Solution 8 Testons au seuil , lhypothse nulle : H0 : la valeur est normale Sous cette hypothse, la quantit : t= m s n
est une ralisation de la variable alatoire Tn1 de Student : n 1 = 16 degrs de libert. Pour = 5%, on a : t16;.975 = 2.12 et comme : t = = m s n 1.3362
on accepte lhypothse nulle H0 au seuil = 5%, cest dire, la valeur est normale.
Exercice 9 Dans un chantillon de 17 prmaturs, la moyenne du Na-plasmatique est : m1 = 133 Soit un autre chantillon de 25 dysmaturs, dans lequel la moyenne du Na-plasmatique est : m2 = 136 Que peut-on conclure ? s2 2 = 56.57 s2 1 = 81.2
Solution 9 Testons dabord, au seuil = 10%, lhypothse nulle dgalit des variances du N aplasmatique chez les prmaturs et les dysmaturs.
103
A. El Mossadeq
est une ralisation dune variable alatoire de Fisher : (n1 1, n2 1) = (16, 24) degrs de libert. Pour = 10%, on a : F16,24;.95 = 2.09 Et comme : f = = s2 1 s2 2 1.4354
on accepte donc lhypothse dgalit des variances des deux populations. Calculons maintenant lestimation commune s2 de cette variance : s2 = = et testons lhypothse nulle : H0 : les prmaturs et les dysmaturs ont la mme moyenne du Na-plasmatique Sous cette hypothse, la quantit : m1 m2 t= r 1 1 s + n1 n2 est une ralisation de la variable alatoire de Student : n1 + n2 2 = 40 degrs de libert. Pour = 10%, on a : t40;.95 = 1.68 Et comme : t = = m m2 r1 1 1 s + n1 n2 1.17 (n1 1) s2 + (n2 1) s2 1 2 n1 + n2 2 66.42
104
A. El Mossadeq
On accepte lhypothse nulle H0 au seuil = 10%, cest dire, les prmaturs et les dysmaturs ont la mme moyenne du Na-plasmatique estime par : m = = n1 m1 + n2 m2 n1 + n2 134.79
Exercice 10 Lorquune machine est bien rgle, elle produit des pices dont le diamtre D est une variable gaussienne de moyenne 25 mm. Deux heures aprs le rglage de la machine, on a prlev au hasard neuf pices. Leurs diamtres ont pour mesure en mm : 22 23 21 25 24 23 22 26 21 Que peut-on conclure quant la qualit du rglage aprs deux heures de fonctionnement de la machine ?
Solution 10 Calculons dabord les estimations m et s2 de la moyenne et de la variance sur cet chantillon de taille n = 9. On a : n 1X m = xi n i=1 = 23 mm
n
et : s
2
= =
3 mm2
Testons lhypothse nulle : H0 : la machine est bien rgle Sous lhypothse nulle H0 , la quantit : t= m s n
105
A. El Mossadeq
est une ralisation dune variable alatoire de Student : n1=8 degrs de libert : T8 . Pour = 5%, on a : t8;.975 = 2.31 et comme : t = = m s n 3.4641
On rejette lhypothse nulle H0 95% (mme 99%), cest dire, le rglage de la machine est rompu.
Exercice 11 Si lcart-type de la dure de vie dun modle de lampe lectrique est estim cent heures, quelle doit tre la taille de lchantillon prlever pour que lerreur sur lestimation de la dure de vie moyenne nexde pas vingt heures et ce avec une probabilit de 95% puis 99% ?
Solution 11 Lerreur sur lestimation de la moyenne est donne par : s t1/2 n (1) Pour = 5%, on a : t1/2 = 1.96 do : s t1/2 20 = n 97 n (2) Pour = 1%, on a : t1/2 = 2.57 do : s t1/2 20 = n 166 n
106
A. El Mossadeq
Exercice 12 Une machine fabrique des rondelles dont le diamtre D est une variable guassienne. On prlve au hasard un chantillon de huit rondelles. Leurs diamtres ont pour mesure en mm : 20.1 19.9 19.7 20.2 20.1 23.1 22.6 19.8 Construire 95% puis 99% les intervalles de conance de la moyenne et de la variance.
Solution 12 Calculons dabord les estimations m et s2 de la moyenne et de la variance sur cet chantillon de taille n = 8. On a : n 1X m = xi n i=1 = 20.6875 mm
n
et s
2
= =
1.827 mm2
1. Lintervalle de conance de la moyenne 1 est : s s m tn1;1/2 , m + tn1;1/2 n n (a) Pour = 5%, on a : t7;.975 = 2.36 do lintervalle : [19.163, 22.212]
107
A. El Mossadeq
2. Lintervalle de conance de la variance 1 est : # " 2 2 (n 1) s (n 1) s , 2 2 n1;/2 n1;1/2 (a) Pour = 5%, on a : 2 7;.025 = 1.69 do lintervalle : (b) Pour = 1%, on a : 2 7;.005 = .989 do lintervalle : 2 7;.995 = 20.3 [.63, 12.931] 2 7;.975 = 16 [.79931, 7.5675]
Exercice 13 On eectue un dosage par deux mthodes direntes A et B. On obtient les rsultats suivants : M ethode A M ethode B .6 .6 .65 .6 .7 .65 .7 .65 .7 .7 .7 .6 .75 .75 .8 .8 .8 .8
108
A. El Mossadeq
et :
Testons dabord, au seuil = 10%, lhypothse nulle dgalit des variances des deux mthodes de dosage. Sous cette hypothse, la quantit : f= s2 2 s2 1
est une ralisation dune variable alatoire de Fisher : (n2 1, n1 1) = (8, 8) degrs de libert. Pour = 10%, on a : F8,8;.95 = 3.44 et comme : f = = s2 2 s2 1 1.75
On accepte donc lhypothse dgalit des variances des deux populations. Calculons maintenant lestimation commune s2 de cette variance : s2 = = et testons lhypothse nulle : H0 : les deux mthodes de dosage sont quivalentes. Sous cette hypothse, la quantit : m1 m2 t= r 1 1 s + n1 n2 est une ralisation de la variable alatoire de Student : n1 + n2 2 = 16 degrs de libert. (n1 1) s2 + (n2 1) s2 1 2 n1 + n2 2 0.0055
109
A. El Mossadeq
on accepte lhypothse nulle H0 au seuil = 10%, cest dire, les deux mthodes de dosage sont quivalentes.
Exercice 14 Dans deux types de forts, on a mesur les hauteurs de treize et quatorze peuplements choisis au hasard et indpendamment dans le but de vrier si les hauteurs de ces deux types darbres sont ou ne sont pas gales. Les rsultats sont les suivants : T ype 1 : 22.5 22.9 23.7 24.0 24.4 24.5 26.0 26.2 26.4 26.7 27.4 28.6 28.7 T ype 2 : 23.4 24.4 24.6 24.9 25.0 26.2 26.3 26.8 26.8 26.9 27.0 27.6 27.7 27.8 On admet que les hauteurs de ces deux types darbres sont des variables gaussiennes N (1 , 2 ) et N (2 , 2 ). 1 2 Que peut-on conclure ?
110
A. El Mossadeq
et :
Testons dabord, au seuil = 10%, lhypothse nulle dgalit des variances des hauteurs des deux types darbres. Sous cette hypothse, la quantit : f= s2 1 s2 2
est une ralisation dune variable alatoire de Fisher : (n1 1, n2 1) = (12, 13)
on accepte donc lhypothse dgalit des variances des hauteurs des deux types darbres. Calculons maintenant lestimation commune s2 de cette variance : s2 = = et testons lhypothse nulle : H0 : les deux types darbres ont la mme hauteur Sous cette hypothse, la quantit : m1 m2 t= r 1 1 s + n1 n2 (n1 1) s2 + (n2 1) s2 1 2 n1 + n2 2 3.0062
111
A. El Mossadeq
est une ralisation de la variable alatoire de Student : n1 + n2 2 = 25 degrs de libert. Pour = 10%, on a : t25;.95 = 1.71 et comme : t = = m m2 r1 1 1 s + n1 n2 0.84155
on accepte lhypothse nulle H0 au seuil = 10%, cest dire, les deux types darbres ont la mme hauteur moyenne estime par : m = = n1 m1 + n2 m2 n1 + n2 25.829
Exercice 15 On considre deux varits de mas M1 et M2 dont les rendements sont des variables alatoires gaussiennes N (1 , 2 ) et N (2 , 2 ). 1 2 An de comparer les rendements de ces deux varits de mas, on a choisi de cultiver dans neuf stations direntes des parcelles voisines encemences de lune ou lautre des deux varits.On a observ les rendements suivants : Station 1 2 3 4 5 36 6 32 7 8 9
V arit 2 39.2 33.1 32.4 25.2 33.1 29.5 24.1 29.2 34.1 ee Que peut-on conclure ?
112
A. El Mossadeq
et :
Testons dabord, au seuil = 10%, lhypothse nulle dgalit des variances des rendements des deux varits de mas. Sous cette hypothse, la quantit : f= s2 2 s2 1
est une ralisation dune variable alatoire de Fisher : (n2 1, n1 1) = (8, 8) degrs de libert. Pour = 10%, on a : F8,8;.95 = 3.44 et comme : f = = s2 2 s2 1 1.2675
On accepte donc lhypothse dgalit des variances des hauteurs des deux types darbres. Calculons maintenant lestimation commune s2 de cette variance : s2 = = = (n1 1) s2 + (n2 1) s2 1 2 n1 + n2 2 s2 + s2 1 2 2 19.4865
113
A. El Mossadeq
et testons lhypothse nulle : H0 : les deux varits de mas ont le mme rendement Sous cette hypothse, la quantit : m1 m2 t= r 1 1 s + n1 n2 est une ralisation de la variable alatoire de Student : n1 + n2 2 = 16 degrs de libert. Pour = 10%, on a : t16;.95 = 1.75 et comme : t = = m m2 r1 1 1 s + n1 n2 .42892
on accepte lhypothse nulle H0 au seuil = 10%, cest dire, les deux varits de mas ont le mme rendement moyen estim par : m = = n1 m1 + n2 m2 n1 + n2 31.75
Exercice 16 Le relev des tempratures journalires minimales de deux stations S1 et S2 , au cours de neuf journes conscutives a fourni les valeurs suivantes en C: Station 1 12 Station 2 8 9 10 11 13 10 7 10 6 8 11 12 9 7
7 11 10
On admet que la distribution des tempratures journalires minimales des deux stations S1 et S2 sont des variables gaussiennes N (1 , 2 ) et N (2 , 2 ). 1 2 1. Dterminer les estimations des moyennes et des variances des tempratures journalires minimales des deux stations S1 et S2 . 2. Construire, au seuil = 5%, les intervalles de conance de ces estimations.
114
A. El Mossadeq
3. Peut-on admettre, au seuil = 10%, lhypothse selon laquelle les tempratures journalires minimales moyennes des deux stations S1 et S2 sont identiques ?
et :
10 2 1X s = (x2i m2 )2 = 4.5 2 8 i=1 (a) Lintervalle de conance de 1 1 est dni par : s1 s1 m1 tn1;1/2 , m1 + tn1;1/2 n n Pour = 5%, on a : t8;.975 = 2.31 do lintervalle : [8.56 C, 11.44 C] (b) Lintervalle de conance de 2 1 est dni par : 1 # " (n 1) s2 (n 1) s2 1 1 , 2 2 n1;/2 n1;1/2 Pour = 5%, on a : 2 8;.025 = 2.18 2 8;.975 = 17.5 115
A. El Mossadeq
do lintervalle : [1.6, 12.8] (c) Lintervalle de conance de 2 1 est dni par : s2 s2 m2 tn1;1/2 , m2 + tn1;1/2 n n Pour = 5%, on a : t8;.975 = 2.31 do lintervalle : [7.37 C, 10.63 C] (d) Lintervalle de conance de 2 1 est dni par : 2 # " 2 2 (n 1) s2 (n 1) s2 , 2 2 n1;/2 n1;1/2 Pour = 5%, on a : 2 8;.025 = 2.18 2 8;.975 = 17.5 [2.06, 16.51] 2. Testons dabord, au seuil = 10%, lhypothse nulle dgalit des variances des tempratures journalires minimales des deux stations S1 et S2 . Sous cette hypothse, la quantit : f= s2 2 s2 1
do lintervalle :
est une ralisation dune variable alatoire de Fisher : (n2 1, n1 1) = (8, 8) degrs de libert. Pour = 10%, on a : F8,8;.95 = 3.44 et comme : f= s2 2 = 1.29 s2 1
116
A. El Mossadeq
Calculons maintenant lestimation commune s2 de cette variance : s2 = = = et testons lhypothse nulle : H0 : les tempratures journalires minimales moyennes des deux stations S1 et S2 .sont identiques m1 m2 t= r 1 1 s + n1 n2 est une ralisation de la variable alatoire de Student : n1 + n2 2 = 16 degrs de libert. Pour = 10%, on a : t16;.95 = 1.75 et comme : m1 m2 t= r = 1.0607 1 1 s + n1 n2 (n1 1) s2 + (n2 1) s2 1 2 n1 + n2 2 s2 + s2 1 2 2 4
On accepte lhypothse nulle H0 au seuil = 10%, cest dire, les tempratures journalires minimales moyennes des deux stations S1 et S2 .sont identiques. Cette temprature moyenne peut tre estime par : m = = = n1 m1 + n2 m2 n1 + n2 m1 + m2 2 9.5
117
A. El Mossadeq
Exercice 17 On tudie leet dune substance sur la croissance dune tumeur gree. Les rsultats sont consigns sur le tableau ci-dessous donnant la surface de la tumeur ` au 20eme jour aprs sa gree : Surf ace 5.5 6 6.5 7 7.5 8 T emoins 1 2 3 8 4 3 T raits e 4 4 8 3 1 1 Le traitement a-t-il un eet signicatif sur la surface tumorale ? On suppose que la surface tumorale est distribue selon des lois normales N (1 , 2 ) 1 et N (2 , 2 ) chez les tmoins et les traits respectivement. 2
et :
Testons dabord, au seuil = 2%, lhypothse nulle dgalit des variances des surfaces tumorales chez les populations des tmoins et des traits. Sous cette hypothse, la quantit : s2 f= 2 s2 1 est une ralisation dune variable alatoire de Fisher : (n2 1, n1 1) = (20, 20) degrs de libert.
118
A. El Mossadeq
on accepte donc lhypothse dgalit des variances des deux populations. Calculons maintenant lestimation commune s2 de cette variance : s2 = = et testons lhypothse nulle : H0 : le traitement est sans eet sur la croissance de la surface tumorale Sous cette hypothse, la quantit : m1 m2 t= r 1 1 s + n1 n2 est une ralisation de la variable alatoire de Student : n1 + n2 2 = 40 degrs de libert. Pour = 2%, on a : t40;.99 = 2.42 et comme : t = = m m2 r1 1 1 s + n1 n2 2.831 (n1 1) s2 + (n2 1) s2 1 2 n1 + n2 2 .66486
on rejette lhypothse nulle H0 98%, cest dire, le traitement a une inuence sur la croissance de la surface tumorale.
119