Vous êtes sur la page 1sur 124

Dpartement de Mathmatiques et Informatique

Ex er ci ces Cor r i g s
Abdelhamid El Mossadeq
P rofesseu r lE H T P

2006-2007
A. El Mossadeq
Juin 2006
TABLE DES MATIERES

Structures Statistiques et Estimation 1

Les Procdures U suelles des Tests dH ypothses :


1. Les Frquences 45

Les Procdures U suelles des Tests dH ypothses :


2. Les Tests du Khi-Deux 61

Les Procdures Usuelles des Tests dH ypothses :


3. Moyennes et Variances 95
Structure Statistique
et
Estimation
A. El Mossadeq Structures Statistiques et Estimation

Exercice 1
Dterminer et tudier les proprits de lestimateur du maximum de vraisemlance
dun r-chantillon pour :
1. le paramtre p dune loi de Bernouilli
2. le paramtre p dune loi geometrique
3. le paramtre p dune loi binomiale dordre n
4. le paramtre dune loi de P oisson
5. le paramtre dune loi exponentielle
6. les paramtres et 2 dune loi normale
7. le paramtre dune loi unif orme sur lintervalle [0, ]

Solution 1
1. Soit X une variable alatoire de Bernouilli de paramtre p.
Pour tout x {0, 1}, la probabilit lmentaire p (x) de x est :
p (x) = px (1 p)1x
de plus :

E [X] = p
V [X] = p (1 p)

(a) Recherche du maximum de vraisemlance :


Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dfinie pour tout p [0, 1] et tout
(x1 , ..., xr ) {0, 1}r par :
Y
r
L (p; x1 , ..., xr ) = p (xi )
i=1
P
r P
r
xi r xi
= pi=1 (1 p) i=1

do :
r ! !
X X
r
ln L (p; x1 , ..., xr ) = xi ln p + r xi ln (1 p)
i=1 i=1

3
Structures Statistiques et Estimation A. El Mossadeq

Il en rsulte que :
P
r P
r
xi r xi
i=1 i=1
ln L (p; x1 , ..., xr ) =
p p 1p
do :
1X
r

ln L (p; x1 , ..., xr ) = 0 = p = xi
p r i=1
et comme :
2
ln L (p; x1 , ..., xr ) < 0
p2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune
structure de Bernouilli est :
1X
r
p = Xi
r i=1
Cest la frquence empirique du r-chantillon.
(b) Etude des proprits de p :
Puisque :
E [p] = E [X]
= p
et :
V [X]
V [p] =
r
p (1 p)
=
r
On en dduit que p est un estimateur sans biais et convergent du paramtre
p dune loi de Bernouilli.

2. Soit X une variable alatoire de gomtrique de paramtre p.


Pour tout x N , la probabilit lmentaire p (x) de x est :
p (x) = p (1 p)x1
de plus :

1

E [X] =
p

1p

V [X] =
p2

4
A. El Mossadeq Structures Statistiques et Estimation

Considrons un r-chantillon de cette structure.


Sa fonction de vraisemblance est dfinie pour tout p [0, 1] et tout (x1 , ..., xr )
(N )r par :
Y
r
L (p; x1 , ..., xr ) = p (xi )
i=1
P
r
xi r
r
= p (1 p)i=1
do :
r !
X
ln L (p; x1 , ..., xr ) = r ln p + xi r ln (1 p)
i=1

Il en rsulte que :
P
r
xi r
r i=1
ln L (p; x1 , ..., xr ) =
p p 1p
P
r
r p xi
i=1
=
p (1 p)
do :
r
ln L (p; x1 , ..., xr ) = 0 = p = P
r
p
xi
i=1
et comme :
2
ln L (p; x1 , ..., xr ) < 0
p2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune struc-
ture gomtrique est :
r
p = Pr
Xi
i=1

Cest linverse de la moyenne empirique du r-chantillon.

3. Soit X une variable alatoire binomiale dordre n et de paramtre p.


pour tout x {0, 1, ..., n}, la probabilit lmentaire p (x) de x est :
p (x) = C (n, x) px (1 p)nx

5
Structures Statistiques et Estimation A. El Mossadeq

de plus :

E [X] = np
V [X] = np (1 p)

(a) Recherche du maximum de vraisemlance :


Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dfinie pour tout p [0, 1] et tout
(x1 , ..., xr ) {0, 1, ..., n}r par :
Y
r
L (p; x1 , ..., xr ) = p (xi )
i=1
" # P
r P
r
Yr
xi rn xi
= C (n, xi ) p i=1 (1 p) i=1

i=1

do :
!
Y
r X
r X
r
ln L (p; x1 , ..., xr ) = ln C (n, xi ) + xi ln p + rn xi ln (1 p)
i=1 i=1 i=1

Il en rsulte que :
P
r P
r
xi rn xi
i=1 i=1
ln L (p; x1 , ..., xr ) =
p p 1p
P
r
xi rnp
i=1
=
p (1 p)
do :
1 X
r

ln L (p; x1 , ..., xr ) = 0 = p = xi
p rn i=1
et comme :
2
ln L (p; x1 , ..., xr ) < 0
p2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune
structure de binomiale est :
1 X
r
p = Xi
rn i=1

6
A. El Mossadeq Structures Statistiques et Estimation

(b) Etude des proprits de p :


Puisque :
1
E [p] = E [X]
n
= p
et :
V [X]
V [p] =
rn2
p (1 p)
=
rn
on en dduit que p est un estimateur sans biais et convergent de p.

4. Soit X une variable alatoire de Poisson de paramtre .


Pour tout x N, la probabilit lmentaire p (x) de x est :
x
p (x) = exp
x!
de plus :

E [X] =
V [X] =

(a) Recherche du maximum de vraisemlance :


Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dfinie pour tout , > 0, et tout
(x1 , ..., xr ) Nr par :
Y
r
L (; x1 , ..., xr ) = p (xi )
i=1
P
r
xi
i=1
= exp r
x1 !...xr !
do :
X
r
ln L (; x1 , ..., xr ) = ln (x1 !...xr !) + xi ln r
i=1

Il en rsulte que :
P
r
xi
i=1
ln L (; x1 , ..., xr ) = r

7
Structures Statistiques et Estimation A. El Mossadeq

do :

1X
r

ln L (; x1 , ..., xr ) = 0 = p = xi
r i=1
et comme :
2
ln L (; x1 , ..., xr ) < 0
2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune
structure de Poisson est :
1X
r
= Xi
r i=1
Cest la moyenne empirique du r-chantillon.

(b) Etude des proprits de :


Puisque :
E [] = E [X]
=
et :
V [X]
V [] =
r

=
r
On en dduit que est un estimateur sans biais et convergent de .

5. Soit X une variable alatoire exponentielle de paramtre .


Sa densit de probabilit f est dfinie par :

0 si x 0
f (x) =
exp x si x > 0

de plus :


1
E [X] =


1

V [X] = 2

Considrons un r-chantillon de cette structure.

8
A. El Mossadeq Structures Statistiques et Estimation

Sa fonction de vraisemblance est dfinie pour tout , > 0, et tout (x1 , ..., xr )
dans Rr , tous strictement positifs, par :
Y
r
L (; x1 , ..., xr ) = f (xi )
i=1
X
r
r
= exp xi
i=1

do :
X
r
ln L (; x1 , ..., xr ) = r ln xi
i=1

Il en rsulte que :
r X
r

ln L (; x1 , ..., xr ) = xi
i=1
do :
r
ln L (; x1 , ..., xr ) = 0 = = P
r

xi
i=1
et comme :
2
ln L (; x1 , ..., xr ) < 0
2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune struc-
ture exponentielle est :
r
= P r
Xi
i=1

Cest linverse de la moyenne empirique du r-chantillon.

6. Soit X une variable alatoire normale de paramtres et 2 .


Sa densit de probabilit f est dfinie pour tout x R par :
1 1
f (x) = exp 2 (x )2
2 2
de plus :

E [X] =
V [X] = 2

9
Structures Statistiques et Estimation A. El Mossadeq

(a) Recherche du maximum de vraisemlance :

Considrons un r-chantillon de cette structure.


Sa fonction de vraisemblance est dfinie pour tout R, tout > 0 et
tout (x1 , ..., xr ) Rr par :
Y
r
L (, ; x1 , ..., xr ) = f (xi )
i=1

1 X
r
1
= r exp 2 (xi )2
2 2 i=1

do :

1 X
r

ln L (, ; x1 , ..., xr ) = r ln 2 r ln 2 (xi )2
2 i=1
Il en rsulte que :

1 X
r



L (, ; x1 , ..., xr ) = 2 (xi )

i=1


1 X
r

r

L (, ; x1 , ..., xr ) = + 3 (xi )2
i=1
do :

1X
r


= xi

L (, ; x1 , ..., xr ) = 0
r i=1

=


1X
r



L (, ; x1 , ..., xr ) = 0 2
= (xi )2
r i=1

Donc les estimateurs du maximum de vraisemblance dun r-chantillon


dune structure normale est :

1X
r



= Xi

r i=1


1X
r


2
= (Xi )2
r i=1

10
A. El Mossadeq Structures Statistiques et Estimation

(b) Etude des proprits de et :


On a :
E [] = E [X]
=
et :
r1
E 2 = V [X]
r
r1 2
=
r
On en dduit que est un estimateur sans biais et convergent de , mais
est un estimateur biais de .

7. Soit X une variable alatoire uniforme sur lintervalle [0, ].


Sa densit de probabilit f est dfinie pour tout x [0, ] par :

1
si x [0, ]
f (x) =


0 si x / [0, ]
de plus :



E [X] = 2


2
V [X] =

12
Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dfinie pour tout , > 0, et tout (x1 , ..., xr )
[0, ]r :
Y
r
L (; x1 , ..., xr ) = f (xi )
i=1
1
=
r
La fonction :
L (; x1 , ..., xr )
est strictement dcroissante, donc elle atteint son maximum lorsque est min-
imum.
Et comme :
i {1, ..., r} : xi

11
Structures Statistiques et Estimation A. El Mossadeq

donc est minimum lorsque :


= max (x1 , ..., xr )
Donc lestimateur du maximum de vraisemblance dun r-chantillon dune struc-
ture uniforme est :
= max (X1 , ..., Xr )

Exercice 2
Soit X une variable alatoire dont la densit de probabilit f est dfinie par :

1 x
exp si x>0
f (x) =


0 si x0

o est un paramtre rel strictement positif.


1. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon
de variable parente X.
2. est-il un rsum exhaustif ?
3. Calculer lesprance mathmatique et la variance de .
Que peut-on conclure ?
4. Calculer la quantit dinformation de F isher.
En dduire que est ecace.

Solution 2
Soit X une variable alatoire exponentielle dont la densit de probabilit f est dfinie
pour tout x, x > 0, par :

1 x
exp si x>0
f (x) =


0 si x0

o est un paramtre rel strictement positif.


On a :

E [X] =

V [X] = 2

12
A. El Mossadeq Structures Statistiques et Estimation

1. Considrons un r-chantillon de cette structure.


Sa fonction de vraisemblance est dfinie pour tout , > 0, et tout (x1 , ..., xr )
Rr , tous strictement positifs, par :
Y
r
L (; x1 , ..., xr ) = f (xi )
i=1
P
r
xi
1
= exp i=1
r
do :
P
r
xi
i=1
ln L (; x1 , ..., xr ) = r ln

Il en rsulte que :
P
r
xi
r i=1
ln L (; x1 , ..., xr ) = + 2

do :
1X
r

ln L (; x1 , ..., xr ) = 0 = = xi
r i=1
et comme :
2
ln L (; x1 , ..., xr ) < 0
2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune struc-
ture exponentielle est :
1X
r
= Xi
r i=1
Cest la moyenne empirique du r-chantillon.

2. Pour tout , > 0, et tout (x1 , ..., xr ) Rr , tous strictement positifs, on a :


P
r
xi
1 i=1
L (; x1 , ..., xr ) = exp
r
1 r (x1 , ..., xr )
= r exp

13
Structures Statistiques et Estimation A. El Mossadeq

Daprs le thorme de factorisation, est un rsum exhaustif puisque :



L (; x1 , ..., xr ) = g ; (x1 , ..., xr ) h (x1 , ..., xr )

o :
1 r (x1 , ..., xr )
g ; (x1 , ..., xr ) = r exp

et :
h (x1 , ..., xr ) = 1
3. Comme :
1X
r
= Xi
r i=1
alors :
h i
E = E [X]
=
et :
h i V [X]
V =
r
2

=
r
On en dduit que est un estimateur sans biais et convergent de .
4. Calculons la quantit dinformation de F isher, I [X, ], concernant .
On a :
2

I [X, ] = E ln f (, X)
2
2
X
= E ln
2

1 2X
= E 2+ 3

1
=
2
Donc la quantit dinformation de F isher, I [X1 , ..., Xr , ], concernant fournie
par le r-chantillon est :
I [X1 , ..., Xr , ] = rI [X, ]
r
=
2

14
A. El Mossadeq Structures Statistiques et Estimation

h i
Calculons lecacit e de ..
On a :
h i 1
e = h i
I [X1 , ..., Xr , ] V
= 1
donc, est ecace.

Exercice 3
Soit X une variable alatoire dont la densit de probabilit f est dfinie par :

0 si x 0

f (x) =
xk1 exp x si x > 0

k
o est un paramtre rel strictement positif , k un entier naturel non nul et une
constante rel.

1. Dterminer la constante .
2. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon
de variable parente X.
3. est-il un rsum exhaustif ?
4. Calculer lesprance mathmatique et la variance de .
Que peut-on conclure ?
5. Calculer la quantit dinformation de F isher.
En dduire que est ecace.

Solution 3
La densit de probabilit de la variable alatoire X est dfinie par :

0 si x 0

f (x) =
xk1 exp x si x > 0

k
Rappelons que pour tout k N :
Z +
uk exp udu = k!
0

15
Structures Statistiques et Estimation A. El Mossadeq

1. Ainsi :
Z + Z +
k1 x
f (x) dx = k
x exp dx
0
Z +
= uk1 exp udu
0
= (k 1)!
do
1
=
(k 1)!
puisque :
Z +
f (x) dx = 1

De plus :
Z +
E [X] = xf (x) dx

Z +
1 x
= k
xk exp dx
0 (k 1)!
= k
et :
Z
+
E X2 = x2 f (x) dx

Z +
1 x
= k
xk+1 exp dx
0 (k 1)!
2
= k (k + 1)
do :

V [X] = E X 2 E [X]2
= k2

2. Considrons un r-chantillon de cette structure.


Sa fonction de vraisemblance est dfinie pour tout , > 0, et tout (x1 , ..., xr ) Rr ,
tous strictement positifs, par :

16
A. El Mossadeq Structures Statistiques et Estimation

Y
r
L (; x1 , ..., xr ) = f (xi )
i=1
P
r
xi
1
= r rk (x1 ...xr )
k1
exp i=1
[(k 1)!]
do :
P
r
xi
k1 i=1
ln L (; x1 , ..., xr ) = r ln (k 1)! ln (x1 ...xr ) rk ln

Il en rsulte que :
P
r
xi
rk i=1
ln L (; x1 , ..., xr ) = + 2

do :
1 X
r

ln L (; x1 , ..., xr ) = 0 = = xi
rk i=1
et comme :
2
ln L (; x1 , ..., xr ) < 0
2
donc lestimateur du maximum de vraisemblance dun r-chantillon de cette
structure est :
1 X
r
= Xi
rk i=1
3. Pour tout , > 0, et tout (x1 , ..., xr ) Rr , tous strictement positifs, on a :
P
r
xi
1
L (; x1 , ..., xr ) = r rk (x1 ...xr )
k1
exp i=1
[(k 1)!]
1 k1 rk (x1 , ..., xr )
= r rk (x1 ...xr ) exp
[(k 1)!]

Daprs le thorme de factorisation, est un rsum exhaustif puisque :



L (; x1 , ..., xr ) = g ; (x1 , ..., xr ) h (x1 , ..., xr )

17
Structures Statistiques et Estimation A. El Mossadeq

o :
1 rk (x1 , ..., xr )
g ; (x1 , ..., xr ) = rk exp

et :
1
h (x1 , ..., xr ) = (x1 ...xr )k1
[(k 1)!]r
4. Puisque :
1 X
r
= Xi
rk i=1
alors :
h i 1
E = E [X] =
k
et :
h i V [X] 2
V = =
rk 2 rk
On en dduit que est un estimateur sans biais et convergent de .
5. Calculons la quantit dinformation de F isher, I [X, ], concernant .
On a :
2

I [X, ] = E ln f (, X)
2
2
X
= E ln (k 1)! + (k 1) ln X k ln
2

k 2X
= E 2+ 3

k
=
2
Donc la quantit dinformation de F isher, I [X1 , ..., Xr , ], concernant fournie
par le r-chantillon est :
I [X1 , ..., Xr , ] = rI [X, ]
rk
=
2
h i
Calculons lecacit e de ..
On a :
h i 1
e = h i =1
I [X1 , ..., Xr , ] V

18
A. El Mossadeq Structures Statistiques et Estimation

donc, est ecace.

Exercice 4
Soit X une variable alatoire dont la densit de probabilit f est dfinie par :

0
si x / [0, ]
f (x) =
1 si x [0, ]


o est un paramtre rel.
1. Dterminer la fonction de rpartition de X.
2. Calculer la quantit dinformation de F isher.
3. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon
de variable parente X.
4. Calculer lesprance mathmatique et la variance de .
Que peut-on conclure ?
5. Dans le cas o est bias, proposer un estimateur sans biais de .

Solution 4
1. La fonction de rpartition F de X est dfinie pour tout x R par :
Z x
F (x) = f (t) dt

do :


0 si x0



x
F (x) = si 0x





1 si x
de plus :



E [X] = 2


2
V [X] =

12
2. Puisque le domaine D :
D = {x R |f (x) > 0}
= [0, ]

19
Structures Statistiques et Estimation A. El Mossadeq

dpend de , donc la quantit dinformation de F isher nexiste pas.

3. Considrons un r-chantillon de cette structure.


Sa fonction de vraisemblance est dfinie pour tout , > 0, et tout (x1 , ..., xr )
[0, ]r :
Y
r
L (; x1 , ..., xr ) = f (xi )
i=1
1
=
r
La fonction :
L (; x1 , ..., xr )
est strictement dcroissante, donc elle atteint son maximum lorsque est min-
imum.
Et comme :
i {1, ..., r} : xi
Il en rsulte que est minimum lorsque :
= max (x1 , ..., xr )
Donc lestimateur du maximum de vraisemblance dun r-chantillon dune struc-
ture uniforme est :
= max (X1 , ..., Xr )

4. Pour dterminer la densit de probabilit de , commenons dabord par calculer


sa fonction de rpartition.

(a) Fonction de rpartition de :

20
A. El Mossadeq Structures Statistiques et Estimation

Pour tout u R on a :
h i
F (u) = P < u
= P [max (X1 , ..., Xr ) < u]
= P [X1 < u, ..., Xr < u]
Yr
= P [Xk < u]
k=1
= [F (u)]r


0 si u0



u r
= si 0u






1 si u

21
Structures Statistiques et Estimation A. El Mossadeq

(b) Densit de probabilit de :


Pour tout u R {0, } on a :

d
f (u) = F (u)
du

0 si u
/ ]0, [

= r1

ru si u ]0, [
r
(c) Esprance mathmatique de :

h i Z
E = uf (u) du
R
Z
ur
= r du
0 r
r
=
r+1
2
(d) Esprance mathmatique de :
h 2i Z
E = u2 f (u) du
R
Z r+1
u
= r r du
0
r 2
=
r+2
(e) Variance de :
h i h 2i h i2
V = E E
r
= 2 2
(r + 1) (r + 2)
Lestimateur de est biais, mais il est asymptotiquement sans biais.
5. Considrons lestimateur :
r+1
T =
r
Alors :
r+1 h i
E [T ] = E
r
=

22
A. El Mossadeq Structures Statistiques et Estimation

et :
2 h i
r+1
V [T ] = V
r
1
= 2
r (r + 2)
T est donc un estimateur sans biais et convergent de .

Exercice 5
Soit X une variable alatoire dont la densit de probabilit f est dfinie par :

0 si x <
f (x) =
exp ( x) si x

o est un paramtre rel.


1. Dterminer la fonction de rpartition de X.
2. Calculer la quantit dinformation de F isher.
3. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon
de variable parente X.
4. Calculer lesprance mathmatique et la variance de .
Que peut-on conclure ?
5. Dans le cas o est bias, proposer un estimateur sans biais de .

Solution 5
1. La fonction de rpartition F de X est dfinie pour tout x R par :
Z x
F (x) = f (t) dt

do :

0 si x
F (x) =
1 exp ( x) si x
de plus :

E [X] = + 1
V [X] = 1

23
Structures Statistiques et Estimation A. El Mossadeq

2. Puisque le domaine D :

D = {x R |f (x) > 0}
= [, +[
dpend de , donc la quantit dinformation de F isher nexiste pas.

3. Considrons un r-chantillon de cette structure.


Sa fonction de vraisemblance est dfinie pour tout R, et tout (x1 , ..., xr )
([, +[)r :

Y
r
L (; x1 , ..., xr ) = f (xi )
i=1
X
r
= exp ( xi )
i=1

La fonction :

L (; x1 , ..., xr )
est strictement croissante, donc elle atteint son maximum lorsque est maxi-
mum.
Et comme :

i {1, ..., r} : xi
Il en rsulte que est maximum lorsque :

= min (x1 , ..., xr )


Donc lestimateur du maximum de vraisemblance dun r-chantillon de cette
structure est :

= min (X1 , ..., Xr )

4. Pour dterminer la densit de probabilit de , commenons dabord par calculer


sa fonction de rpartition.

24
A. El Mossadeq Structures Statistiques et Estimation

(a) Fonction de rpartition de :

Pour tout v R on a :
h i
F (v) = P < v
= P [min (X1 , ..., Xr ) < v]
= 1 P [min (X1 , ..., Xr ) v]
= 1 P [X1 v, ..., Xr v]
Yr
= 1 P [Xk v]
k=1
Yr
= 1 (1 P [Xk < v])
k=1
= 1 [1 F (v)]r

0 si v
=
1 exp r ( v) si v

(b) Densit de probabilit de :

Pour tout u R {} on a :
d
f (v) = F (v)
dv

0 si v<
=
r exp r ( v) si v>

(c) Esprance mathmatique de :


h i Z
E = vf (v) dv
R
Z +
= rv exp r ( v) dv

1
= +
r

25
Structures Statistiques et Estimation A. El Mossadeq

2
(d) Esprance mathmatique de :
h 2i Z
E = v2 f (v) dv
ZR+
= rv 2 exp r ( v) dv

2
1 1
= + + 2
r r
(e) Variance de :
h i h 2i h i2 1
V = E E = 2
r
Lestimateur de est biais, mais il est asymptotiquement sans biais.
5. Considrons lestimateur :
1
T =
r
Alors :
h i 1
E [T ] = E =
r
et :
h i 1
V [T ] = V = 2
r
T est donc un estimateur sans biais et convergent de .

Exercice 6
Les lments dune population possdent un caractre X qui suit une loi de P oisson
de paramtre inconnu .
Une suite de r expriences a fourni les valeurs k1 , ..., kr .
1. Dterminer lestimateur du maximum de vraisemlance de et tudier les
proprits de cet estimateur.
2. est-il un rsum exhaustif ?
3. On dsire estimer la quantit :
= P [X = 0]
Dterminer lestimateur du maximum de vraisemlance de .
Que remarquez-vous ?

26
A. El Mossadeq Structures Statistiques et Estimation

Solution 6
1. Soit X une variable alatoire de Poisson de paramtre .
pour tout x N, la probabilit lmentaire p (x) de x est :
x
p (x) = exp
x!
de plus :

E [X] =
V [X] =

(a) Recherche du maximum de vraisemlance :


Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dfinie pour tout , > 0, et tout
(k1 , ..., kr ) Nr par :
Y
r
L (; k1 , ..., kr ) = p (ki )
i=1
P
r
ki
i=1
= exp r
k1 !...kr !
do :
X
r
ln L (; k1 , ..., kr ) = ln (k1 !...kr !) + ki ln r
i=1

Il en rsulte que :
P
r
ki
i=1
ln L (; k1 , ..., kr ) = r

do :
1X
r

ln L (; k1 , ..., kr ) = 0 = p = xi
r i=1
et comme :
2
ln L (; k1 , ..., kr ) < 0
2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune
structure de Poisson est :
1X
r
= Xi
r i=1
Cest la moyenne empirique du r-chantillon.

27
Structures Statistiques et Estimation A. El Mossadeq

(b) Etude des proprits de :


Puisque :
E [] = E [X]
=
et :
V [X]
V [] =
r

=
r
On en dduit que est un estimateur sans biais et convergent de .

2. Pour tout , > 0, et tout (k1 , ..., kr ) Nr on a :


r(k1 ,...,kr )
L (; x1 , ..., xr ) = exp r
x1 !...xr !
Daprs le thorme de factorisation, est un rsum exhaustif puisque :
L (; x1 , ..., xr ) = g (; (x1 , ..., xr )) h (x1 , ..., xr )
o :
g (; (x1 , ..., xr )) = r(k1 ,...,kr ) exp r
et :
1
h (x1 , ..., xr ) =
x1 !...xr !
3. On a :
= P [X = 0]
= exp
Pour tout , > 0, et tout (k1 , ..., kr ) Nr par :
Y
r
L (; k1 , ..., kr ) = p (ki )
i=1
P
r
ki
( ln ) i=1
= r
k1 !...kr !
do :
X
r
ln L (; k1 , ..., kr ) = ln (k1 !...kr !) + ki ln ( ln ) + r ln
i=1

28
A. El Mossadeq Structures Statistiques et Estimation

Il en rsulte que :
P
r
ki
i=1 r
ln L (; k1 , ..., kr ) = +
ln
do :
!
1X
r

ln L (; k1 , ..., kr ) = 0 = = exp ki
r i=1
et comme :
2
ln L (; k1 , ..., kr ) < 0
2
donc lestimateur du maximum de vraisemblance dun r-chantillon de cette
structure est :
r !
1X
= exp Xi
r i=1
= exp

Exercice 7
Soit un rel appartenant ]1, +[ et X une variable alatoire telle que :
k1
1 1
P [X = k] = 1 , k N

1. Calculer lesprance mathmatique et la variance de X.


2. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon
de variable parente X et tudier ses proprits.
3. est-il un rsum exhaustif ?

Solution 7
1. On a :
X

E [X] = kP [X = k]
k=1
X k1
k 1
= 1
k=1

=

29
Structures Statistiques et Estimation A. El Mossadeq

et :
X

E [X (X 1)] = k (k 1) P [X = k]
k=1
X k1
k (k 1) 1
= 1
k=1


1
= 22 1

do :

E X2 = E [X (X 1)] + E [X]
= (2 1)
et :

V [X] = E X 2 E [X]2
= ( 1)
2. Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dfinie pour tout ]1, +[ et tout (x1 , ..., xr )
(N )r par :
Y
r
L (; x1 , ..., xr ) = p (xi )
i=1
Pr x r
1 1 i=1 i
= 1
r
do :
r !
X 1
ln L (; x1 , ..., xr ) = r ln + xi r ln 1
i=1

Il en rsulte que :
P
r
xi r
r i=1
ln L (; x1 , ..., xr ) = +
( 1)
Pr
xi r
i=1
=
( 1)

30
A. El Mossadeq Structures Statistiques et Estimation

do :
1X
r

ln L (; x1 , ..., xr ) = 0 = = xi
r i=1
et comme :
2
ln L (p; x1 , ..., xr ) < 0
2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune struc-
ture gomtrique est :
1X
r
= Xi
r i=1
Cest la moyenne empirique du r-chantillon.

3. Puisque :
1X
r
= Xi
r i=1
alors :
E [] = E [X]
=
et :
V [X]
V [] =
r
( 1)
=
r
On en dduit que est un estimateur sans biais et convergent du paramtre
dune structure gomtrique.

Exercice 8
Soit X une variable alatoire qui suit une loi de Pareto dont la densit de probabilit
f est dfinie par :

a
+1 si x a
f (x) = x


0 si x < a
o X reprsente le revenu par habitant, a le revenu minimum et , > 2, un
coecient dpendant du type du pays o lon se place.

31
Structures Statistiques et Estimation A. El Mossadeq

1. Vrifier que f est bien une densit de probabilit.


2. Calculer lesprance mathmatique et la variance de X.
3. Calculer la fonction de rpartition de X.
4. Dterminer lestimateur du maximum de vraisemlance a de a dun r-chantillon
issu X.
5. Dans le cas o a est bias, proposer un estimateur sans biais de a.

Solution 8
1. La densit de probabilit de la loi de Pareto est dfinie par :

a
+1 si x a
f (x) = x


0 si x < a
f est bien une densit de probabilit.
En eet :
Z Z +
a
f (x) dx = dx
R a x+1
= 1
2. On a :
Z
E [X] = xf (x) dx
ZR+
a
= dx
a x

= a
1
et :
Z

E X2 = x2 f (x) dx
ZR+
a
= dx
a x1
2
= a
2
do :

V [X] = E X 2 E [X]2
2
= 2a
( 2) ( 1)

32
A. El Mossadeq Structures Statistiques et Estimation

3. La fonction de rpartition F de X est dfinie pour tout x R par :


Z x
F (x) = f (t) dt



0 si x a

= Z x

a
+1
dt si x a
a t

0
si x a
=
1 a

si x a
x
4. Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dfinie pour tout a R et tout (x1 , ..., xr )
(]a, +[)r , par :
Y
r
L (a; x1 , ..., xr ) = f (xi )
i=1
r ar
=
(x1 ...xr )+1
La fonction :
a L (a; x1 , ..., xr )
est strictement croissante, donc elle atteint son maximum lorsque a est maxi-
mum.
Et comme :
i {1, ..., r} : a xi
Il en rsulte que est maximum lorsque :
a = min (x1 , ..., xr )
Donc lestimateur du maximum de vraisemblance dun r-chantillon de cette
structure est :
a = min (X1 , ..., Xr )

5. Pour dterminer la densit de probabilit de , commenons dabord par calculer


sa fonction de rpartition.

33
Structures Statistiques et Estimation A. El Mossadeq

(a) Fonction de rpartition de a :


Pour tout x R on a :
Fa (x) = P [a < x]
= P [min (X1 , ..., Xr ) < x]
= 1 P [min (X1 , ..., Xr ) x]
= 1 P [X1 v, ..., Xr x]
Yr
= 1 P [Xk x]
k=1
Yr
= 1 (1 P [Xk < x])
k=1
= 1 [1 F (x)]r

0 si xa
r
= a
1 si xa
x
(b) Densit de probabilit de :
Pour tout x R {a} on a :
d
fa (x) = Fa (x)
dv

0
si x<a
=r
ra

si x > a
xr+1
(c) Esprance mathmatique de a :
Z
E [a] = vfa (v) dv
R
Z +
rar
= dv
a vr
r
= a
r 1
(d) Esprance mathmatique de a2 :
Z
2
E a = v2 fa (v) dv
ZR+
rar
= dv
a vr1
r 2
= a
r 2

34
A. El Mossadeq Structures Statistiques et Estimation

(e) Variance de a :

V [a] = E a2 E [a]2
r 2
= 2a
(r 2) (r 1)
Lestimateur a de a est biais, mais il est asymptotiquement sans biais.
(f) Considrons lestimateur :
r 1
T = a
r
Alors :
E [T ] = a
et :
2
r 1 1
V [T ] = V [a] = a2
r r (r 2)
T est donc un estimateur sans biais et convergent de a.

Exercice 9
Soit X une variable alatoire dont la densit de probabilit f est dfinie par :

0 si x

f (x) =

1 exp ( x) si x >

o est un paramtre rel et un paramtre rel strictement positif.
1. Vrifier que f est bien une densit de probabilit.
2. Calculer lesprance mathmatique et la variance de X.
3. Calculer la fonction de rpartition de X.
4. On suppose connu et inconnu.
(a) Dterminer lestimateur du maximum de vraisemlance de dun r-
chantillon issu X.
(b) Etudier les proprits de .
(c) Dans le cas o est bias, proposer un estimateur sans biais de .
5. On suppose connu et inconnu.
(a) Dterminer lestimateur du maximum de vraisemlance de dun r-
chantillon issu de X.
(b) Etudier les proprits de
(c) Dans le cas o est bias, proposer un estimateur sans biais de .

35
Structures Statistiques et Estimation A. El Mossadeq

6. On suppose que et sont tous les deux inconnus.



(a) Dterminer lestimateur du maximum de vraisemlance , de (, )
dun r-chantillon issu de X.
(b) Etudier les proprits de ,
(c) Proposer un estimateur sans biais de (, ) .

Solution 9
1. f est bien une densit de probabilit.
En eet :
Z Z +
1 ( x)
f (x) dx = exp dx
R
Z +
= exp tdt
0
= 1
2. On a :
Z
E [X] = xf (x) dx
ZR+
x ( x)
= exp dx

Z +
= (t + ) exp tdt
0
= +
et :
Z

E X2 = x2 f (x) dx
ZR+
x2 ( x)
= exp dx

Z +
= (t + )2 exp tdt
0
= 22 + 2 + 2
= ( + )2 + 2
do :

V [X] = E X 2 E [X]2
= 2

36
A. El Mossadeq Structures Statistiques et Estimation

3. La fonction de rpartition F de X est dfinie pour tout x R par :


Z x
F (x) = f (t) dt



0 si x

= Z x

1 ( t)
exp dt si x


0 si x

=

1 exp ( x) si x

4. On suppose connu et inconnu.

(a) Considrons un r-chantillon de cette structure.


Sa fonction de vraisemblance est dfinie pour tout , > 0, R et tout
(x1 , ..., xr ) (], +[)r par :
Y
r
L (; x1 , ..., xr ) = f (xi )
i=1

1 X ( xi )
r
= exp
r i=1

do :
1X
r
ln L (; x1 , ..., xr ) = r ln + ( xi )
i=1
Il en rsulte que :
1 X
r
r
ln L (; x1 , ..., xr ) = 2 ( xi )
i=1
" #
1X
r
1
= r ( xi )
i=1
do :
1X
r

ln L (; x1 , ..., xr ) = 0 = = (xi )
r i=1
#
"
1X
r
= = xi
r i=1

37
Structures Statistiques et Estimation A. El Mossadeq

et comme :
2
ln L (; x1 , ..., xr ) < 0
2
donc lestimateur du maximum de vraisemblance dun r-chantillon de
cette structure est :
" r #
1X
= Xi
r i=1

(b) On a :
" ! #
1X
r
E [] = E Xi
r i=1
=
et :
" ! #
1X
r
V [] = V Xi
r i=1
V [X]
=
r
2

=
r
5. On suppose connu et inconnu.
(a) Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dfinie pour tout , > 0, R et tout
(x1 , ..., xr ) (], +[)r , tous strictement positifs, par :
Y
r
L (; x1 , ..., xr ) = f (xi )
i=1

1 X ( xi )
r
= exp
r i=1

La fonction :
L (; x1 , ..., xr )
est strictement croissante, donc elle atteint son maximum lorsque est
maximum.

38
A. El Mossadeq Structures Statistiques et Estimation

Et comme :
i {1, ..., r} : xi
Il en rsulte que est maximum lorsque :
= min (x1 , ..., xr )
Donc lestimateur du maximum de vraisemblance dun r-chantillon de
cette structure est :
= min (X1 , ..., Xr )
(b) Pour dterminer la densit de probabilit de , commenons dabord par
calculer sa fonction de rpartition.
(i) Fonction de rpartition de :
Pour tout v R on a :
h i
F (v) = P < v
= P [min (X1 , ..., Xr ) < v]
= 1 P [min (X1 , ..., Xr ) v]
= 1 P [X1 v, ..., Xr v]
Yr
= 1 P [Xk v]
k=1
Yr
= 1 (1 P [Xk < v])
k=1
= 1 [1 F (v)]r


0 si v

=

v
1 exp r si v

(ii) Densit de probabilit de :
Pour tout v R {} on a :
d
f (v) = F (v)
dv


0 si v<

=

r v
exp r si v>

39
Structures Statistiques et Estimation A. El Mossadeq

(iii) Esprance mathmatique de :


h i Z
E = vf (v) dv
R
Z +
r v
= v exp r dv

Z +

= t + exp tdt
0 r

= +
r
2
(iv) Esprance mathmatique de :
h 2i Z
E = v2 f (v) dv
ZR+
r 2
= v exp r ( v) dv

2 2
= + +
r r
(v) Variance de :
h i h 2i h i2
V = E E
2
=
r
Lestimateur de est biais, mais il est asymptotiquement sans
biais.
(c) Considrons lestimateur :

T =
r
Alors :
h i
E [T ] = E
r
=
et :
h i
V [T ] =
V

=
r2
T est donc un estimateur sans biais et convergent de .

40
A. El Mossadeq Structures Statistiques et Estimation

6. On suppose que et sont tous les deux inconnus.


(a) Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dfinie pour tout , > 0, R et tout
(x1 , ..., xr ) (], +[)r , tous strictement positifs, par :
Y
r
L (, ; x1 , ..., xr ) = f (xi )
i=1

1 X ( xi )
r
= exp
r i=1

Compte tenu des questions prcedentes, la fonction :
(, ) 7 L (, ; x1 , ..., xr )
atteint son maximum pour :


= min (x1 , ..., xr )


" r #
1 X
xi
= r

i=1

do, les estimateurs du maximum de vraisemblance , de (, ) sont
donns par :


= min (X1 , ..., Xr )


" r #
1 X

= Xi
r i=1
(b) On a :
h i
E = +
r
et :
h i
E [] = E [X] E
r1
=
r
Donc les estimateurs et sont biaiss.

41
Structures Statistiques et Estimation A. El Mossadeq

(c) Considrons les estimateurs T et S de et respectivement dfinis par :


r

T =
r1

1
S =
r1
alors :

E [T ] =
E [S] =

Donc T et S sont des estimateurs sans biais de et respectivement.

Exercice 10
Soient X et Y deux variables alatoires indpendantes, la premire prenant les
valeurs 1 et 0 avec les probabilits respectives et 1 , et la deuxime prenant les
valeurs 1 et 0 avec les probabilits respectives P et 1 P . On suppose inconnue
et P connue, P > 0.5.
On dfinit la variable alatoire Z par :

Z = 1 si X = Y
Z=0 si X 6= Y
On considre un n-chantillon ((X1 , Y1 ) , ..., (Xn , Yn )) de (X, Y ) et on dfinit Zi ,
1 i n, partir de Xi et Yi comme on a dfini Z partir de X et Y .
1. Montrer que (Z1 , ..., Zn ) est un n-chantillon de Z.
2. Etudier les proprits de lestimateur :
1
T = (Z1 + ... + Zn )
n
3. Proposer alors un estimateur sans biais S de .
4. Etudier la variance de S en fonction de P .
5. Indiquer un intervalle de confiance pour lorsque n est grand, en supposant
quon dispose dune observation p de la variable :
1
T =(Z1 + ... + Zn )
n
6. Voyez-vous une application de ce qui prcde dans le domaine des sondages
dopinion ?

42
A. El Mossadeq Structures Statistiques et Estimation

Solution 10
On a :

P [X = 0] = 1
P [X = 1] =

et :

P [Y = 0] = 1 P
P [Y = 1] = P

X et Y deux variables alatoires de Bernouilli de paramtres et P respectivement.


Dterminons la loi de probabilit de Z :
P [Z = 0] = P [X 6= Y ]
= P [{(X, Y ) = (0, 1)} {(X, Y ) = (0, 1)}]
= P [X = 0] P [Y = 1] + P [X = 1] P [Y = 0]
= (1 ) P + (1 P )
et :
P [Z = 1] = P [X = Y ]
= P [{(X, Y ) = (0, 0)} {(X, Y ) = (1, 1)}]
= P [X = 0] P [Y = 0] + P [X = 1] P [Y = 1]
= (1 ) (1 P ) + P
Z est donc une variable alatoire de Bernouilli de paramtre :
= (1 ) (1 P ) + P
de plus :
E [Z] =
V [Z] = (1 )

1. Puisque (X1 , Y1 ) , ..., (Xn , Yn ) sont indpentants et suivent la mme loi que
(X, Y ), on en dduit que (Z1 , ..., Zn ) sont indpendants et suivent la mme
loi que Z, donc cest un n-chantillon de Z.
2. Soit lestimateur :
1
T = (Z1 + ... + Zn )
n
On a :
E [T ] = E [Z]
= (1 ) (1 P ) + P

43
Structures Statistiques et Estimation A. El Mossadeq

et :
1
V [T ] = V [Z]
n
1
= [(1 ) (1 P ) + P ] [(1 ) P + (1 P )]
n
3. T est donc un estimateur biais de sauf lorsque :
1
=
2
ou :
P =1

(a) Si :
1
= ou P = 1
2
alors il sut de prendre :
S=T
(b) Si :
1
6= et P 6= 1
2
alors il sut de prendre :
1
S= [T (1 P )]
2P 1
4. On a :
1
V [S] = V [T ]
(2P 1)2
1
= [(1 ) (1 P ) + P ] [(1 ) P + (1 P )]
n (2P 1)2

44
T ests d H yp oth ses
Les Frquences
A. El Mossadeq Tests : Les Frquences

Exercice 1
A la veille dune consultation lectorale, on a intrrog cent lecteurs constituant
un chantillon au hasard. Soixante ont dclar avoir lintention de voter pour le
candidat C.
En quelles limites, au moment du sondage, la proportion du corps lectoral favorable
C se situe-t-elle ?

Solution 1
Construisons lintervalle de confiance correspondant la frquence f = 0.6 du corps
lectoral favorable C observe sur un chantillon de taille n = 100.
Au seuil , cet intervalle est dfini par :
" r r #
f (1 f ) f (1 f )
f t1/2 , f + t1/2
n n

Pour = 5%, on a :
t.975 = 1.96
on obtient alors lintervalle :
[.504, .696]
A 95%, le candidat C serait lu.

Exercice 2
On sait que le taux de mortalit dune certaine maladie est de 30%.
Sur 200 malades tests, combien peut-on envisager de dcs ?

Solution 2
Construisons dobord lintervalle de pari, pour un chantillon de taille n = 200,
correspondant la probabilit de dcs p = 0.3.
Au seuil , cet intervalle est dfini par :
" r r #
p (1 p) p (1 p)
p t1/2 , p + t1/2
n n

Pour = 5%, on a :
t.975 = 1.96

47
Tests : Les Frquences A. El Mossadeq

on obtient alors lintervalle :


[.24, .36]
Il en rsulte que sur les 200 malades, le nombre de dcs envisager serait compris,
95%, entre 48 et 72 dcs.

Exercice 3
Dans une pr-enqute, on selectionne, par tirage au sort cent dossiers.
Quinze dentre eux sont incomplets.
Combien de dossiers incomplets trouvera-t-on sur dix milles dossiers ?

Solution 3
Construisons lintervalle de confiance correspondant la frquence f = 0.15 de
dossiers incomplets observe sur un chantillon de taille n = 100.
Au seuil , cet intervalle est dfini par :
" r r #
f (1 f ) f (1 f )
f t1/2 , f + t1/2
n n

Pour = 5%, on a :
t.975 = 1.96
on obtient alors lintervalle :
[.08, .22]
Il en rsulte que sur les 10000 dossiers, le nombre de dossiers incomplets serait
compris, 95%, entre 800 et 2200 dossiers.

Exercice 4
Dans une maternit, on fait le point de la proportion de filles toutes les cent nais-
sances.
Comment peut varier cette proportion dune fois lautre si lon admet quil nait
en moyenne 51% de filles ?

Solution 4
Construisons lintervalle de pari, pour un chantillon de taille n = 100, correspon-
dant la probabilit dobtenir une fille p = 0.51.

48
A. El Mossadeq Tests : Les Frquences

Au seuil , cet intervalle est dfini par :


" r r #
p (1 p) p (1 p)
p t1/2 , p + t1/2
n n

Pour = 5%, on a :
t.975 = 1.96
on obtient alors lintervalle :
[.41, .61]
Il en rsulte, qu 95%, la proportion de filles varie dune fois lautre, entre 41%
et 61%.

Exercice 5
Une machine former des pilules fonctionne de faon satisfaisante si la proportion
de pilules non russies est de 1 pour 1000.
Sur un chantillon de 10000 pilules, on a trouv 15 pilules dfectueuses.
Que faut-il conclure ?

Solution 5
Ici on :


n = 104



f = 15 104




p = 103

Testons, au seuil , lhypothse nulle :


H0 : la machine est bien rgle
Sous cette hypothse, la quantit :
f p
t= r
p (1 p)
n
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.
Pour = 5%, on a :
t.975 = 1.96

49
Tests : Les Frquences A. El Mossadeq

et comme :
f p
t = r
p (1 p)
n
= 1.58
on accepte donc lhypothse nulle H0 au seuil = 5%, cest dire, quau seuil
= 5%, la machine fonctionne de faon satisfaisante.

Exercice 6
Sur un chantillon de 600 sujets atteints du cancer des poumons, on a trouv 550
fumeurs.
Que peut-on dire du pourcentage de fumeurs parmi les cancreux ?

Solution 6 11
Construisons lintervalle de confiance correspondant la frquence f = des
12
cancreux parmi les fumeurs observe sur un chantillon de taille n = 600.
Au seuil , cet intervalle est dfini par :
" r r #
f (1 f ) f (1 f )
f t1/2 , f + t1/2
n n

Pour = 5%, on a :
t.975 = 1.96
on obtient alors lintervalle :
[.9, .94]
Il en rsulte que parmi, les fumeurs, la proportion des atteints par le cancer des
poumons est comprise, 95%, entre 90% et 94%.

Exercice 7
Avant de procder au lancement dun produit, une entreprise a fait procder une
enqute portant sur deux rgions gographiques A et B.
Sur 1800 rponses provenant de la rgion A, 630 se dclarent intresses par le
produit.
En provenance de B, 150 rponses sur 600 se dclarent favorables.
Tester, au seuil de 5%, lhypothse de lidentit des opinions des rgions A et B
quant au produit considr.

50
A. El Mossadeq Tests : Les Frquences

Solution 7
Ici on :
7


nA = 1800 et fA = 20


n = 600 et f = 1
B B
4
Testons, au seuil , lhypothse nulle :
H0 : les opinions des rgions A et B sont identiques
Sous cette hypothse, la quantit :

fA fB
t= r
fA (1 fA ) fB (1 fB )
+
nA nB
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.
Pour = 5%, on a :
t.975 = 1.96
et comme :

fA fB
t = r
fA (1 fA ) fB (1 fB )
+
nA nB
= 4.77
on rejette donc lhypothse nulle H0 95% (et mme 99.98%), cest dire, les
deux rgions A et B ont des opinions direntes.

Exercice 8
Dans un groupe de 200 malades atteints du cancer du col de lutrus, un traitement
par application locale du radium a donn 50 gurisons.
Un autre groupe de 150 sujets atteints de la mme maladie a t trait par chirurgie,
on a trouv 50 gurisons.
Que peut-on conclure ?

51
Tests : Les Frquences A. El Mossadeq

Solution 8
Ici on :
1


n1 = 200 , f1 = 4


n = 150 , f = 1
2 2
3
Testons, au seuil , lhypothse nulle :
H0 : les deux traitements sont quivalents
Sous cette hypothse, la quantit :

f1 f2
t= r
f1 (1 f1 ) f2 (1 f2 )
+
n1 n2
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.
Pour = 5%, on a :
t.975 = 1.96
et comme :

f1 f2
t = r
f1 (1 f1 ) f2 (1 f2 )
+
n1 n2
= 1.69
on accepte donc lhypothse nulle H0 au seuil 5%, cest dire, les deux mthodes
sont quivalentes.

Exercice 9
Aux guichets dune gare parisienne, sur les 350 billets vendus vendredi aprs-midi,
95 taient des billets de 1ere classe. Sur les 250 billets vendus la matine du lundi
suivant, 55 taient de 1ere classe.
Peut-on considrer quil y a une dirence entre les proportions de vente de parcours
en 1ere classe pour les fins et dbuts de semaines ?

52
A. El Mossadeq Tests : Les Frquences

Solution 9
Ici on :
19


n1 = 350 , f1 = 70


n = 250 , f = 11
2 2
50
Testons, au seuil , lhypothse nulle :

H0 : les taux de billets de 1ere classe vendus en fin


et dbut de semaines sont identiques
Sous cette hypothse, la quantit :

f1 f2
t= r
f1 (1 f1 ) f2 (1 f2 )
+
n1 n2
peut tre considre comme une ralisation dune variable normale centre rduite.
Pour = 5%, on a :

t.975 = 1.96
et comme :

f1 f2
t= r = 1.45
f1 (1 f1 ) f2 (1 f2 )
+
n1 n2
on accepte donc lhypothse nulle H0 au seuil 5%, cest dire, les taux de billets
de parcours en 1ere classe vendus en fins et dbuts de semaines sont identiques et
quon peut estimer par :
n1 f1 + n2 f2
f =
n1 + n2
= 0.25

Exercice 10
On a lanc cent fois une pice de monnaie et lon a obtenu soixante fois pile et
quarante fois face.
Tester au seuil de 5%, puis 1%, lhypothse de la loyaut de la pice.

53
Tests : Les Frquences A. El Mossadeq

Solution 10
Ici on :

n = 100
f = 0.6
o f est la frquence de pile.
Testons, au seuil , lhypothse nulle :
H0 : la pice est loyale
Sous cette hypothse, on a :
p = 0.5
et la quantit :
f p
t= r
p (1 p)
n
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.
on a :
f p
t = r
p (1 p)
n
= 2

(1) Pour = 5%, on a :


t.975 = 1.96
on rejette donc lhypothse nulle H0 95%, cest dire, qu 95%, la pice
est truque.
(2) Pour = 1%, on a :
2.57 < t.995 < 2.58
on accepte donc lhypothse nulle H0 au seuil = 1%, cest dire, quau
seuil = 1%, la pice est normale.

Exercice 11
Un chantillon de taille n a donn lieu au calcul dune frquence observe f corre-
spondant lintervalle de confiance [.22 .34] au seuil = 5%.
1. Calculer n.
2. Par rapport la proportion p = 0.3, lcart est-il significatif au seuil = 5% ?
3. Dterminer lintervalle de confiance de |f p| au seuil = 5%.

54
A. El Mossadeq Tests : Les Frquences

Solution 11
1. Au seuil , lintervalle de confiance correspondant une frquence f observe
sur un chantillon de taille n est dfini par :
" r r #
f (1 f ) f (1 f )
f t1/2 , f + t1/2
n n
On en dduit :

0.22 + 0.34

f=
2

f (1 f )

n = t21/2
(f 0.22)2
Pour = 5%, on a :
t0.975 = 1.96
on obtient alors :

f = .28
n = 215
2. Testons, au seuil , lhypothse nulle :
H0 : lcart nest pas singificatif
Sous cette hypothse, la quantit :
f p
t= r
p (1 p)
n
peut tre considre comme une ralisation dune variable alatoire normale
centre rduite.
On a :
f p
t = r
p (1 p)
n
= 0.64
Pour = 5%, on a :
t.975 = 1.96
on accepte donc lhypothse nulle H0 au seuil = 5%.
3. Au seuil :
f p
r t1/2 , t1/2
p (1 p)
n

55
Tests : Les Frquences A. El Mossadeq

donc, au seuil :
" r #
p (1 p)
|f p| 0, t1/2
n

Pour = 5%, on a :
t.975 = 1.96
do :
|f p| [0, 0.06]

Exercice 12
Ltude du taux de dfectuosits arentes aux caractristiques de traitements ther-
miques dune mme pice, traite par deux fours dirents, a donn lieu aux rsultats
suivants :
* Pour le premier four, 20 pices dfectueuses sur un chantillon de 200 pices
traites.
* Pour le second four, 120 pices dfectueuses sur un chantillon de 800 pices
traites.
Que peut-on conclure ?

Solution 12
Ici on :

n1 = 200 , f1 = 0.10
n = 800 , f = 0.15
2 2

Testons, au seuil , lhypothse nulle :


H0 : les deux traitements thermiques sont quivalents
Sous cette hypothse, la quantit :
f1 f2
t= r
f1 (1 f1 ) f2 (1 f2 )
+
n1 n2
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.
Pour = 5%, on a :
t.975 = 1.96

56
A. El Mossadeq Tests : Les Frquences

et comme :
f1 f2
t = r
f1 (1 f1 ) f2 (1 f2 )
+
n1 n2
= 2.03
on rejette donc lhypothse nulle H0 95%, cest dire, les deux traitements ne sont
pas quivalents.

Exercice 13
Un questionnaire auquel on ne peut rpondre que par oui ou par non, a t
rempli par un chantillon de taille n.
Lintervalle de confiance de la frquence observe f des rponses oui est (0.35 0.43)
au seuil = 5%.
1. Quelle est la taille n de lchantillon.
2. Par rapport la proportion p = 0.4, lcart est-il significatif au seuil = 5% ?
3. Dterminer lintervalle de confiance de |f p| au seuil = 5%.

Solution 13
1. Au seuil , lintervalle de confiance correspondant une frquence f observe
sur un chantillon de taille n est dfini par :
" r r #
f (1 f ) f (1 f )
f t1/2 , f + t1/2
n n
On en dduit :

0.35 + 0.43

f=
2

f (1 f )

n = t21/2
(f 0.35)2
Pour = 5%, on a :
t0.975 = 1.96
on obtient alors :

f = 0.39
n = 571

57
Tests : Les Frquences A. El Mossadeq

2. Testons, au seuil , lhypothse nulle :


H0 : lcart nest pas singificatif
Sous cette hypothse, la quantit :
f p
t= r
p (1 p)
n
peut tre considre comme une ralisation dune variable alatoire normale
centre rduite.
On a :
f p
t = r
p (1 p)
n
= 0.49
Pour = 5%, on a :
t.975 = 1.96
On accepte donc lhypothse nulle H0 au seuil = 5%.
3. Au seuil :
f p
r t1/2 , t1/2
p (1 p)
n
donc, au seuil :
" r #
p (1 p)
|f p| 0, t1/2
n

Pour = 5%, on a :
t.975 = 1.96
do :
|f p| [0, 0.04]

Exercice 14
Parmi 470 sujets exposs une infection, 370 nayant pas t immuniss.
Parmi ces derniers, 140 contractent la malidie ainsi que 25 sujets immuniss.
Le traitement donne-t-il une protection significative ?

58
A. El Mossadeq Tests : Les Frquences

Solution 14
Soient f1 la frquence de contracter la maladie pour un sujet non immunis et f2 la
frquence de contracter la maladie pour un sujet immunis.
Ici on :
14

n1 = 370 et f1 = 37



n = 100 et f = 1
2 2
4
Testons, au seuil , lhypothse nulle :
H0 : le traitements nest pas ecace
Sous cette hypothse, la quantit :
f1 f2
t= r
f1 (1 f1 ) f2 (1 f2 )
+
n1 n2
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.
Pour = 5%, on a :
t.975 = 1.96
et comme :
f1 f2
t = r
f1 (1 f1 ) f2 (1 f2 )
+
n1 n2
= 2.56
On rejette donc lhypothse nulle H0 95%, cest dire, le traitement donne une
protection significative.

59
Les Tests du Khi-deux
A. El Mossadeq Les Tests du Khi-Deux

Exercice 1
Avant de procder au lancement dun produit, une entreprise a fait procder une
enqute portant sur deux rgions gographiques A et B.
Sur 1800 rponses provenant de la rgion A, 630 se dclarent intresses par le
produit.
En provenance de B, 150 rponses sur 600 se dclarent favorables.
Tester, au seuil de 5%, lhypothse de lidentit des opinions des rgions A et B
quant au produit considr.

Solution 1
La rpartition observe est :
T ableau des eff ectif s observees

RegionOpinion favorable non favorable T otal

Region A 630 1170 1800

Region B 150 450 600

T otal 780 1620 2400

Testons, au seuil , lhypothse nulle :


H0 : les rgions A et B ont la mme opinion
Calculons, sous cette hypothse, la rpartition thorique :

T ableau des ef fectif s theoriques

RegionOpinion favorable non favorable T otal

Region A 585 1215 1800

Region B 195 405 600

T otal 780 1620 2400

Sous lhypothse nulle H0 , la quantit :


X
2 X
2
(oij tij )2
2 =
i=1 j=1
tij

63
Les Tests du Khi-Deux A. El Mossadeq

est une ralisation dune variable du Khi-deux :


(2 1) (2 1) = 1
degr de libert.
Pour = 5%, on a :
21;.95 = 3.84

Et comme :
X
2 X
2
(oij tij )2
2 =
i=1 j=1
tij
= 20.51
On rejette alors H0 95% (et mme 99.5%), cest dire, les deux rgions ont des
opinions direntes quant au produit considr.

Exercice 2
Dans un groupe de 200 malades atteints du cancer du col de lutrus, un traitement
par application locale du radium a donn 50 gurisons.
Un autre groupe de 150 sujets atteints de la mme maladie a t trait par chirurgie,
on a trouv 54 gurisons.
Que peut-on conclure ?

Solution 2
La rpartition observe est :
T ableau des eff ectif s observees

T raitementResultat gueri non gueri T otal

radium 50 150 200

chirurgie 54 96 150

T otal 104 246 350

Testons, au seuil , lhypothse nulle :


H0 : les deux traitements sont quivalents

64
A. El Mossadeq Les Tests du Khi-Deux

Calculons, sous cette hypothse, la rpartition thorique :


T ableau des ef fectif s theoriques

T raitementResultat gueri non gueri T otal

radium 59.4 140.6 200

chirurgie 44.6 105.4 150

T otal 104 246 350

Sous lhypothse nulle H0 , la quantit :


X
2 X
2
(oij tij )2
2
=
i=1 j=1
tij

est une ralisation dune variable du Khi-deux :


(2 1) (2 1) = 1
degr de libert.
Pour = 5%, on a :
21;.95 = 3.84
Et comme :
X
2 X
2
(oij tij )2
2 =
i=1 j=1
tij
= 4.94
On rejette alors H0 95% , cest dire, les deux traitements ne sont pas quivalents.

Exercice 3
Aux guichets dune gare parisienne, sur les 350 billets vendus vendredi aprs-midi,
95 taient des billets de 1ere classe. Sur les 250 billets vendus la matine du lundi
suivant, 55 taient de 1ere classe.
Peut-on considrer quil y une dirence entre les proportions de vente de parcours
en 1ere classe pour les fins et dbuts de semaines ?

65
Les Tests du Khi-Deux A. El Mossadeq

Solution 3
La rpartition observe est :
T ableau des eff ectif s observees

jourClasse 1ere classe 2ere classe T otal

V endredi A.M 95 255 350

Lundi matin 55 195 250

T otal 150 450 600

Testons, au seuil , lhypothse nulle :


H0 : les taux de billets de parcours en 1ere classe vendus en fin
et dbut de semaines sont identiques
Calculons, sous cette hypothse, la rpartition thorique :
T ableau des ef fectif s theoriques

JourClasse 1ere classe 2ere classe T otal

V endredi A.M 87.5 262.5 350

Lundi matin 62.5 187.5 250

T otal 150 450 600

Sous lhypothse nulle H0 , la quantit :


X
2 X
2
(oij tij )2
2
=
i=1 j=1
tij

est une ralisation dune variable du Khi-deux :


(2 1) (2 1) = 1
degr de libert.
Pour = 5%, on a :
21;.95 = 3.84

66
A. El Mossadeq Les Tests du Khi-Deux

Et comme :
X
2 X
2
(oij tij )2
2 =
i=1 j=1
tij
= 2.06
On accepte alors H0 au seuil = 5% , cest dire, les taux de billets de parcours en
1 ere classe vendus en fins et dbuts de semaines sont identiques.

Exercice 4
On a lanc cent fois une pice de monnaie et lon a obtenu soixante fois pile et
quarante fois face.
Tester au seuil de 5% puis 1%, lhypothse de la loyaut de la pice.

Solution 4
Testons, au seuil , lhypothse nulle :
H0 : la pice est loyale
Sous cette hypothse, on a :
p = 0.5
do les rpartitions :

C ote Repartition Observee Repartition T heorique

pile 60 50

f ace 40 50

T otal 100 100

Sous lhypothse nulle H0 , la quantit :


X
2
(oi ti )2
2
=
i=1
ti

67
Les Tests du Khi-Deux A. El Mossadeq

est une ralisation dune variable du Khi-deux :


21=1
degr de libert.
On a :

X
2
(oi ti )2
2 =
i=1
ti
= 4

(1) Pour = 5%, on a :


21;.95 = 3.84
On rejette donc lhypothse nulle H0 95%, cest dire, qu 95%, la pice
est truque.

(2) Pour = 1%, on a :


21;.99 = 6.63
On accepte donc lhypothse nulle H0 au seuil = 1%, cest dire, quau
seuil = 1%, la pice est normale.

Exercice 5
On veut savoir si la russite (R) dun traitement est indpendantes du niveaux de
la tension artrielle du malade (T ).
On dispose pour cela de 250 observations rparties comme suit :

T R echec succes

basse 21 104

elevee 29 96

Que peut-on conclure ?

68
A. El Mossadeq Les Tests du Khi-Deux

Solution 5
La rpartition observe est :

T ableau des eff ectif s observees

T R Echec Succes T otal

Basse 21 104 125

Elevee 29 96 125

T otal 50 200 250

Testons, au seuil , lhypothse nulle :


H0 : la russite du traitement est indpendante du niveau de la tension artrielle
Calculons, sous cette hypothse, la rpartition thorique, le tableau de cette rpar-
tition est donn ci-aprs.

T ableau des ef fectif s theoriques

T R Echec Succes T otal

Basse 25 100 125

Elevee 25 100 125

T otal 50 200 250

Sous lhypothse nulle H0 , la quantit :


X
2 X
2
(oij tij )2
2 =
i=1 j=1
tij

est une ralisation dune variable du Khi-deux :


(2 1) (2 1) = 1
degr de libert.
Pour = 5%, on a :
21;.95 = 3.84

69
Les Tests du Khi-Deux A. El Mossadeq

Et comme :
X
2 X
2
(oij tij )2
2 =
i=1 j=1
tij
= 1.6
On accepte alors H0 au seuil = 5% , cest dire, la russite du traitement est
indpendante du niveau de la tension artrielle.

Exercice 6
On veut savoir sil y a une liason entre la localisation (L) du cancer du poumon
(priphrique , non priphrique) et le ct (C) de la lsion (poumon gauche ,
poumon droit).
Ltude a port sur 1054 malades :

LC gauche droit

peripherique 26 62

non peripherique 416 550

Que peut-on conclure ?

Solution 6
La rpartition observe est :
T ableau des eff ectif s observees

LC gauche droit T otal

peripherique 26 62 88

non peripherique 416 550 966

T otal 442 612 1054

Testons, au seuil , lhypothse nulle :


H0 : la localisation du cancer est indpendante du ct de la lsion
Calculons, sous cette hypothse, la rpartition thorique.
Le tableau de cette rpartition est donne ci-aprs.

70
A. El Mossadeq Les Tests du Khi-Deux

T ableau des ef fectif s theoriques

LC gauche droit T otal

peripherique 36.9 51.1 88

nonperipherique 405.1 560.9 966

T otal 442 612 1054

Sous lhypothse nulle H0 , la quantit :

X
2 X
2
(oij tij )2
2 =
i=1 j=1
tij
est une ralisation dune variable du Khi-deux :
(2 1) (2 1) = 1
degr de libert.
Pour = 5%, on a :
21;.95 = 3.84
Et comme :
X
2 X
2
(oij tij )2
2
=
i=1 j=1
tij
= 6.05
On rejette alors H0 95% (mme 97.5%), cest dire, la localisation du cancer
dpend du ct de la lsion.

Exercice 7
De nombreuses observations cliniques ont montr que jusque l :
30% des malades atteints de M ont une survie infrieure un an
50% ont une survie entre un an et deux ans
10% ont une survie entre deux ans et cinq ans
10% ont une survie suprieure cinq ans.
On applique un nouveau traitement 80 malades atteint de la maladie M et on
constate :

71
Les Tests du Khi-Deux A. El Mossadeq

12 ont une survie infrieure un an


56 ont une survie entre un an et deux ans
8 ont une survie entre deux ans et cinq ans
4 ont une survie suprieure cinq ans.
Que peut-on conclure ?

Solution 7
Testons, au seuil , lhypothse nulle :
H0 : le nouveau traitement nest pas actif contre la maladie M
Sous cette hypothse, on a les rpartitions :

Survie Repartition Observee Repartition T heorique

survie 1 an 12 24

1 an < survie 2 ans 56 40

2 an < survie 5 ans 8 8

survie > 5 ans 4 8

T otal 80 80

Sous lhypothse nulle H0 , la quantit :

X
4
(oi ti )2
2 =
i=1
ti
est une ralisation dune variable du Khi-deux :
41=3
degrs de libert.

Pour = 5%, on a :
23;.95 = 7.81

72
A. El Mossadeq Les Tests du Khi-Deux

Et comme :
X
2
(oi ti )2
2 =
i=1
ti
= 14.4
on rejette donc lhypothse nulle H0 95% (mme 99.5%), cest dire, qu 99.5%,
le nouveau traitement est actif contre la maladie M.

Exercice 8
On suppose pouvoir classer les malades atteints dune maladie M en trois catgories
cliniques : A , B , C.
On se demande si ces trois catgories dirent par leurs survies un an.
Les eectifs observs sont les suivants :

SurvieCategorie A B C

survie a un an 5 20 45

deces avant un an 15 50 145

Que peut-on conclure ?

Solution 8
La rpartition observe est :
T ableau des eff ectif s observees

SurvieCategorie A B C T otal

Survie a un an 5 20 45 70

Deces avant un an 15 50 145 210

T otal 20 70 190 280

Testons, au seuil , lhypothse nulle :


H0 : la survie un an est indpendante de la catgorie clinique
Calculons, sous cette hypothse, la rpartition thorique.

73
Les Tests du Khi-Deux A. El Mossadeq

T ableau des ef fectif s theoriques

SurvieCategorie A B C T otal

Survie a un an 5 17.5 47.5 70

Deces avant un an 15 52.5 142.5 210

T otal 20 70 190 280

Sous lhypothse nulle H0 , la quantit :

X
2 X
3
(oij tij )2
2 =
i=1 j=1
tij
est une ralisation dune variable du Khi-deux :
(2 1) (3 1) = 2
degrs de libert.

Pour = 5%, on a :
22;.95 = 5.99
Et comme :

X
2 X
3
(oij tij )2
2
=
i=1 j=1
tij
= .65
On accepte alors H0 au seuil = 5% , cest dire, la survie un an est indpendante
de la catgorie clinique.

Exercice 9
75 enfants sont vus en consultation pour un asthme. On relve chez eux les deux
symptmes suivants :
* Intensit de la maladie asmathique : lgre , moyenne , forte
* Existence ou absence dun eczma au moment de lobservation ou dans le pass.

74
A. El Mossadeq Les Tests du Khi-Deux

On peut classer les enfants selon la rpartition suivante :

EA fort moyen leger

present 8 2 2

passe 11 11 3

jamais 6 18 14

Au vu de ces rsultats, existe-t-il une association entre lintensit de lasthme et


lexistence dun eczma ?

Solution 9
Le tableau de la rpartition observe est donne ci-aprs:

T ableau des eff ectif s observees

EczemaAsthme f ort moyen leger T otal

present 8 2 2 12

passe 11 11 3 25

jamais 6 18 14 38

T otal 25 31 19 75

Testons, au seuil , lhypothse nulle :

H0 : lintensit de lasthme est indpendante de lexistence dun eczma


Calculons, sous cette hypothse, la rpartition thorique.
Le tableau de cette rpartition est donne ci-aprs.

75
Les Tests du Khi-Deux A. El Mossadeq

T ableau des ef fectif s theoriques

EczemaAsthme f ort moyen leger T otal

present 4 4.96 3.04 12

passe 8.33 10.33 6.34 25

jamais 12.67 15.71 9.62 38

T otal 25 31 19 75

Les eectifs thoriques sur la premire ligne sont strictement infrieurs cinq, ce qui
empche lapplication dun test du Khi-deux.On peut remdier cet tat en oprant
le groupement logique des classes present et passe.
Les nouveaux tableaux des eectifs observs et thoriques, obtenus aprs regroupe-
ment de ces deux classes sont donns ci-aprs.

T ableau des eff ectif s observees

EczemaAsthme f ort moyen leger T otal

present ou passe 19 13 5 37

jamais 6 18 14 38

T otal 25 31 19 75

T ableau des eff ectif s theoriques

EczemaAsthme fort moyen leger T otal

present ou passe 12.33 15.29 9.38 37

jamais 12.67 15.71 9.62 38

T otal 25 31 19 75

Sous lhypothse nulle H0 , la quantit :


X
2 X
3
(oij tij )2
2
=
i=1 j=1
tij

76
A. El Mossadeq Les Tests du Khi-Deux

est une ralisation dune variable du Khi-deux :


(2 1) (3 1) = 2
degrs de libert.
Pour = 5%, on a :
22;.95 = 5.99
Et comme :
X
2 X
3
(oij tij )2
2
=
i=1 j=1
tij
= 11.84
On rejette alors H0 95% (mme 99.5%), cest dire, lintensit de lasthme
dpend de lexistence dun eczma.

Exercice 10
Une tude statistique relative aux rsultats dadmission du concours dune grande
cole fait ressortir la rpartition des admis selon la profession des parents lorsque
celle-ci est connue.
1. La profession des parents a-t-elle une influence sur laccs cette cole ?
2. Cette conclusion persiste-t-elle lorsquon tient compte pour complter la statis-
tique prcdente de 961 candidats dont lorigine socio-professionnelle est incon-
nue et qui ont obtenus 43 succs ?

P rof ession des P arents Candidats Admis

F ontionnaires et Assimiles 2224 180

Commerce et Industrie 998 89

P rof essions Liberales 575 48

P roprietaires Rentiers 423 37

P roprietaires Agricoles 287 13

Artisans 210 18

Banques et Assurances 209 17

77
Les Tests du Khi-Deux A. El Mossadeq

Solution 10
1. La rpartition observe est :

P rofession des P arents Candidats Admis Non admis

F ontionnaires et Assimiles 2224 180 2044

Commerce et Industrie 998 89 899

P rofessions Liberales 575 48 527

P roprietaires Rentiers 423 37 386

P roprietaires Agricoles 287 13 274

Artisans 210 18 192

Banques et Assurances 209 17 192

T otal 4916 402 4514

Testons, au seuil , lhypothse nulle :


H0 : laccs lEcole est indpendant de la profession des parents
Calculons, sous cette hypothse, la rpartition thorique :
P rof ession des P arents Candidats Admis Non admis
F ontionnaires et Assimiles 2224 181.9 2042.1

Commerce et Industrie 998 80.8 907.2

P rofessions Liberales 575 47 528

P roprietaires Rentiers 423 34.6 388.4

P roprietaires Agricoles 287 23.5 263.5

Artisans 210 17.2 192.8

Banques et Assurances 209 17.1 191.9


T otal 4916 402 4514

78
A. El Mossadeq Les Tests du Khi-Deux

Sous lhypothse nulle H0 , la quantit :


X
7 X
2
(oij tij )2
2
=
i=1 j=1
tij

est une ralisation dune variable du Khi-deux :


(7 1) (2 1) = 6
degrs de libert.
Pour = 5%, on a :
26;.95 = 12.6
Et comme :
X2 X 3
(oij tij )2
2
= = 6.28
i=1 j=1
tij

On accepte alors H0 au seuil = 5% , cest dire, laccs lEcole est indpen-


dant de la profession des parents.
2. Si lon tient compte des 961 candidats dont lorigine socio-professionnelle est
inconnue et qui ont obtenus 43 succs, la rpartition observe et la rpartition
thorique, sous la mme hypothse nulle, deviennent comme consogns ci-aprs.

T ableau des eff ectif s observees


P rofession des P arents Candidats Admis Non admis
F ontionnaires et Assimiles 2224 180 2044

Commerce et Industrie 998 89 899

P rofessions Liberales 575 48 527

P roprietaires Rentiers 423 37 386

P roprietaires Agricoles 287 13 274

Artisans 210 18 192

Banques et Assurances 209 17 192

Autres 961 43 918


T otal 5877 445 5432

79
Les Tests du Khi-Deux A. El Mossadeq

T ableau des ef fectif s theoriques

P rofession des P arents Candidats Admis Non admis

F ontionnaires et Assimiles 2224 168.4 2055.6

Commerce et Industrie 998 74.8 913.2

P rofessions Liberales 575 43.5 531.5

P roprietaires Rentiers 423 32 391

P roprietaires Agricoles 287 21.7 265.3

Artisans 210 15.9 194.1

Banques et Assurances 209 15.8 193.2

Autres 961 72.8 888.2

T otal 5877 445 5432

Sous lhypothse nulle H0 , la quantit :


X
8 X
2
(oij tij )2
2 =
i=1 j=1
tij

est une ralisation dune variable du Khi-deux :


(8 1) (2 1) = 7
degrs de libert.
Pour = 5%, on a :
27;.95 = 14.1
Et comme :
X2 X 3
(oij tij )2
2
= = 22.5
i=1 j=1
tij

On rejette alors H0 95% (mme 99.5%) , cest dire, laccs lEcole est
indpendant de la profession des parents.

80
A. El Mossadeq Les Tests du Khi-Deux

Exercice 11
Sur un chantillon de 84 prmaturs, on cherche sil existe une liaison entre la
survenue dune hypoglycmie et la survenue dun ictre :
sur 43 enfants nayant pas dictre, 23 sont hypoglycmiques
sur 20 enfants ayant un ictre modr, 6 sont hypoglycmiques
sur 21 enfants ayant un ictre intense, 4 sont hypoglycmiques
Que peut-on conclure ?

Solution 11
La rpartition observe est donne dans le tableau :
T ableau des eff ectif s observees

IctereHypoglycemie hypoglycemique non hypoglycemique T otal

pas d0 ictere 23 20 43

ictere modere 6 14 20

ictere intense 4 17 21

T otal 33 51 84

Testons, au seuil , lhypothse nulle :


H0 : la survenue dune hypoglycmie est indpendante de la survenue dun ictre
Calculons, sous cette hypothse, la rpartition thorique :

T ableau des ef fectif s theoriques

IctereHypoglycemie hypoglycemique non hypoglycemique T otal

pas d0 ictere 16.89 26.11 43

ictere modere 7.86 12.14 20

ictere intense 8.25 12.75 21

T otal 33 51 84

81
Les Tests du Khi-Deux A. El Mossadeq

Sous lhypothse nulle H0 , la quantit :


X
2 X
2
(oij tij )2
2
=
i=1 j=1
tij

est une ralisation dune variable du Khi-deux :


(3 1) (2 1) = 2
degrs de libert.
Pour = 5%, on a :
22;.95 = 5.99
Et comme :
X
3 X
2
(oij tij )2
2 =
i=1 j=1
tij
= 7.97
On rejette alors H0 95% (mme 97.5%), cest dire, la survenue dune hypogly-
cmie dpend de la survenue dun ictre.

Exercice 12
Un mdicament essay sur 42 patients est contrl quant aux eets secondaires quil
peut avoir sur le poids des malades.
On peut considrer que :
quinze dentre eux ont maigri
dix sept nont pas chang de poids
dix ont grossi
En supposant que la maladie est sans eet sur les variations de poids, le mdicament
a-t-il un eet significatif sur le poids ?

Solution 12
Testons, au seuil , lhypothse nulle :
H0 : le traitement est sans eet sur les variations du poids
Si le traitement est sans eet sur les variations du poids, alors ces variations sont
des seulement au hasard.
La loi de probabilit est donc la loi uniforme, cest dire la probabilit de chaque
1
classe est la mme et est gale .
3

82
A. El Mossadeq Les Tests du Khi-Deux

Do les rpartitions :

V ariations Repartition Observee Repartition T heorique

ont maigri 15 14

n0 ont pas change 17 14

ont grossi 10 14

T otal 42 42

Sous lhypothse nulle H0 , la quantit :


X
3
(oi ti )2
2 =
i=1
ti
est une ralisation dune variable du Khi-deux :
31=2
degrs de libert.

Pour = 5%, on a :
22;.95 = 5.99
Et comme :

X
2
(oi ti )2
2 =
i=1
ti
= 1.86
on accepte donc lhypothse nulle H0 au seuil = 5%, cest dire, le traitement est
sans eet sur les variations du poids.

Exercice 13
Pour tudier la densit de poussires dans un gaz, on a procd une srie dobservations
de petits chantillons de gaz au moyen dun microscope.
On a ainsi eectu 143 observations et les rsultats sont les suivants :

83
Les Tests du Khi-Deux A. El Mossadeq

Nombre de particules en suspension Nombre d0 echantillons de gaz

0 34

1 46

2 38

3 19

4 4

5 2

>5 0

Peut-on admettre, au seuil = 5%, que le nombre de particules en suspension est


une variable de P oisson ?

Solution 13
Testons, au seuil , lhypothse nulle :
H0 : le nombre de particules en suspension est une variable de Poisson
Calculons une estimation ponctuelle du paramtre de cette loi :
k
P [X = k] = exp
k!
o X est la variable alatoire reprsentant le nombre de particules en suspension.
On sait que :
1X
n
= Xi
n i=1
est un estimateur sans biais et convergent de .
Une estimation ponctuelle de est donne par :

1 X
5
= ini
143 i=0
= 1.4336
Do les rpartitions :

84
A. El Mossadeq Les Tests du Khi-Deux

P articules en suspension Repartition observee Repartition theorique

0 34 34.1

1 46 48.9

2 38 35.0

3 19 16.7

4 4 06.0

5 2 01.7

>5 0 00.6

T otal 143 143

Leectif thorique tk , k 0, reprsentant le nombre particules en suspension k est


donn par :
tk = nP [X = k]
On constate que le tableau contient des eectifs thoriques strictement infrieurs
5, ce qui empche lutilisation dun test du khi-deux.
On peut remdier cet tat en oprant le groupement logique des classes 4 et plus.
Les tableaux des eectifs observs et thoriques deviennent comme consigns ci-
aprs.

P articules en suspension Repartition observee Repartition theorique

0 34 34.1

1 46 48.9

2 38 35.0

3 19 16.7

4 4 08.3

T otal 143 143

85
Les Tests du Khi-Deux A. El Mossadeq

Sous lhypothse nulle H0 , la quantit :

X
4
(oi ti )2
2 =
i=0
ti
est une ralisation dune variable du Khi-deux :
511=3
degrs de libert.puisque pour calculer les eectifs thoriques, nous avons utilis
lestimation, et non la valeur rel, du paramtre de la loi de Poisson.

Pour = 5%, on a :
23;.95 = 7.81
Et comme :

2 = 2.97
On accepte alors H0 au seuil = 5%, cest dire, le nombre de particules en
suspension peut tre ajust par une loi de Poisson dont le paramtre est estim
par :
= 1.4336

Exercice 14
Le tableau ci-aprs concerne le nombre annuel de cyclones tropicaux ayant atteint
la cte orientale des Etats-Unis entre 1887 et 1956 :
Nombre annuel de cyclones Nombre d0 annees
0 1
1 6
2 10
3 16
4 19
5 5
6 8
7 3
8 1
9 1
>9 0
Peut-on admettre, au seuil = 5%, que ce nombre annuel de cyclones est une
variable de P oisson ?

86
A. El Mossadeq Les Tests du Khi-Deux

Solution 14
Testons, au seuil , lhypothse nulle :
H0 : le nombre annuel de cyclones est une variable de Poisson
Calculons une estimation ponctuelle du paramtre de cette loi :
k
P [X = k] = exp
k!
o X est la variable alatoire reprsentant le nombre annuel de cyclones.
On sait que :
1X
n
= Xi
n i=1
est un estimateur sans biais et convergent de .
Une estimation ponctuelle de est donne par :

1 X
9
= ini = 3.7286
70 i=0
Leectif thorique tk , k 0, reprsentant le nombre dannes k cyclones est donn
par :
tk = nP [X = k]
Do les rpartitions :
Nombre annuel de cyclones Eff ectif s observes Ef fectifs theoriques
0 1 1.68
1 6 6.27
2 10 11.69
3 16 14.53
4 19 13.54
5 5 10.1
6 8 6.28
7 3 3.34
8 1 1.56
9 1 0.65
>9 0 0.36
T otal 70 70

On constate que le tableau contient des eectifs thoriques strictement infrieurs


5, ce qui empche lutilisation dun test du khi-deux.
On peut remdier cet tat en oprant le groupement logique :
* des classes 0 et 1 dune part,
* et des classes 7 et plus dautre part.

87
Les Tests du Khi-Deux A. El Mossadeq

Les tableaux des eectifs observs et thoriques deviennent :

Nombre annuel de cyclones Ef fectif s observes Eff ectifs theoriques

0 ou 1 7 7.95

2 10 11.69

3 16 14.53

4 19 13.54

5 5 10.10

6 8 6.28

7 5 5.91

T otal 70 70

Sous lhypothse nulle H0 , la quantit :


X
7
(oi ti )2
2
=
i=1
ti
est une ralisation dune variable du Khi-deux :
711=5
degrs de libert.puisque pour calculer les eectifs thoriques, nous avons utilis
lestimation, et non la valeur rel, du paramtre de la loi de Poisson.
Pour = 5%, on a :
25;.95 = 5.8948
Et comme :
2 = 5.81
On accepte alors H0 au seuil = 5%, cest dire, le nombre annuel de cyclones
peut tre ajust par une loi de Poisson dont le paramtre est estim par :
= 3.7286

88
A. El Mossadeq Les Tests du Khi-Deux

Exercice 15
Le tableau suivant indique le rsultat de lexamen de 124 sujets, classs daprs la
couleur de leurs yeux (Y ) et la couleur de leus cheveux (C) :

Y C Blonds Bruns Noirs Roux

Bleus 25 9 3 7

Gris ou V erts 13 17 10 7

Marrons 7 13 8 5

Existe-t-il une liason entre ces deux caractres ?

Solution 15
La rpartition observe est :

Y C Blonds Bruns Noirs Roux T otal

Bleus 25 9 3 7 44

Gris ou V erts 13 17 10 7 47

Marrons 7 13 8 5 33

T otal 45 39 21 19 124

Testons, au seuil , lhypothse nulle :


H0 : les couleurs des yeux et des cheveux sont indpendantes
Calculons, sous cette hypothse, la rpartition thorique :

Y C Blonds Bruns Noirs Roux T otal

Bleus 16 13.8 7.4 6.8 44

Gris ou V erts 17 14.8 8 7.2 47

Marrons 12 10.4 5.6 5 33

T otal 45 39 21 19 124

89
Les Tests du Khi-Deux A. El Mossadeq

Sous lhypothse nulle H0 , la quantit :


X
3 X
4
(oij tij )2
2
=
i=1 j=1
tij

est une ralisation dune variable du Khi-deux :


(3 1) (4 1) = 6
degrs de libert.

Pour = 5%, on a :
26;.95 = 12.6
Et comme :
X
2 X
3
(oij tij )2
2
=
i=1 j=1
tij
= 15
On rejette alors H0 95% (mme 97.5%), cest dire, les couleurs des yeux et des
cheveux ne sont pas indpendantes.

Exercice 16
On considre les familles de quatre enfants.
Sur un chantillon de cent familles quatre enfants, la rpartition suivante a t ob-
serve :

Nombre de f illes Nombre de f amilles

0 7

1 20

2 41

3 22

4 10

1
Peut-on considrer que la probabilit quun enfant soit une fille est ?
2

90
A. El Mossadeq Les Tests du Khi-Deux

Solution 16
Testons, au seuil , lhypothse nulle :
1
H0 : la probabilit davoir une fille est
2
Sous lhypothse nulle H0 , la variable alatoire X gale au nombre de filles
parmi
1 1
les quatre enfants suit une loi binomiale dordre 4 et de paramtre : B 4, .
2 2
Ainsi, pour tout k, 0 k 4, la probabilit pk davoir k filles parmi les quatre
enfants est :
4
1
pk = C (4, k)
2
Leectif thorique tk , 0 k 4, reprsentant le nombre de familles ayant k filles
parmi les quatre enfants est donn par :
tk = npk
Do les rpartitions :

Nombre de filles Repartition observee Repartition theorique

0 7 6.25

1 20 25

2 41 37.5

3 22 25

4 10 6.25

T otal 100 100

Sous lhypothse nulle H0 , la quantit :


X
4
(oi ti )2
2
=
i=0
ti
est une ralisation dune variable du Khi-deux :
51=4
degrs de libert.
Pour = 5%, on a :
24;.95 = 9.49

91
Les Tests du Khi-Deux A. El Mossadeq

Et comme :
2 = 4.03
1
On accepte alors H0 au seuil = 5% : la probabilit davoir une fille est .
2

Exercice 17
On distribue un jeu de quarante cartes quatre joueurs : A , B , C , D ; chacun
reevant dix cartes
Un statisticien a labor un programme de distribution de donnes par ordinateur.
Pour un ensemble de deux cents donnes, obtenues partir de ce programme, il
observe le nombre de donnes o le joueur A reoit k as, 0 k 4. Les rsultats
sont les suivants :

Nombre d0 as Nombre de donnes

0 64

1 74

2 52

3 8

4 2

Le programme du statisticien est-il fiable ?

Solution 17
Testons, au seuil , lhypothse nulle :
H0 : le programme du statisticien est fiable
Sous lhypothse nulle H0 , la variable alatoire X gale au nombre das du joueur
A suit une loi hypergomtrique.
Ainsi, pour tout k, 0 k 4, la probabilit pk pour que le joueur A ait k as est :
C (4, k) C (36, 10 k)
pk =
C (40, 10)
Leectif thorique tk , 0 k 4, reprsentant le nombre de donnes k as, du
joueur A, est donn par :
tk = npk

92
A. El Mossadeq Les Tests du Khi-Deux

Do les rpartitions :

Nombre d0 as Repartition observee Repartition theorique

0 64 59.97

1 74 88.85

2 52 42.84

3 8 7.88

4 2 0.46

T otal 200 200

On constate que le tableau contient des eectifs thoriques strictement infrieurs


5, ce qui empche lutilisation dun test du khi-deux.
On peut remdier cet tat en oprant le groupement logique des classes 3 et 4.
Le tableau des eectifs observs et thoriques deviennent :

Nombre d0 as Repartition observee Repartition theorique

0 64 59.97

1 74 88.85

2 52 42.84

3 ou 4 10 8.34

T otal 200 200

Sous lhypothse nulle H0 , la quantit :


X
3
(oi ti )2
2
=
i=0
ti
est une ralisation dune variable du Khi-deux :
41=3
degrs de libert.

93
Les Tests du Khi-Deux A. El Mossadeq

Pour = 5%, on a :
23;.95 = 7.81
Et comme :
2 = 5.0418
On accepte alors H0 au seuil = 5%, cest dire, le programme du statisticien est
fiable.

94
T ests d H yp oth ses
Moyennes et Variances
A. El Mossadeq Tests : Moyennes et Variances

Exercice 1
Une srie de cent mesures a donn comme rsultat :
100

X

xi = 5200


i=1

" #2

X
100
1 P
100

xi xj = 396
100 j=1
i=1

1. Estimer la moyenne et la variance.


2. Quel est, 95%, lintervalle de confiance de la moyenne ?
3. En supposant la variable mesure gaussienne, dterminer, 95%, lintervalle de
confiance de la variance.

Solution 1
1. Soit m lestimation de la moyenne et s2 celle de la variance.
On a :
1 X
100
m = xi
100 i=1
= 52
et :
1 X
100
s 2
= (xi m)2
99 i=1
= 4
2. Au seuil , lintervalle de confiace de la moyenne est dfini par :


m t1/2 , m + t1/2
n n
Pour = 5%, on a :
t.975 = 1.96
do lintervalle de confiance 95% :
[51.608, 52.392]
3. Au seuil , lintervalle de confiace de la variance est dfini par :
" #
(n 1) 2 (n 1) 2
s, 2 s
2n1;1/2 n1;/2

97
Tests : Moyennes et Variances A. El Mossadeq

Pour = 5% :
2
99;.025 ' 2100;.025 = 74.2
2 2
99;.975 ' 100;.975 = 129.6

do lintervalle de confiace de lcart-type 95% :


[3.06, 5.34]

Exercice 2
La force de rupture dun certain type de cable peut tre assimile une variable
alatoire normale.
Des essais portant sur dix cables ont donn une variance empirique s2 de 1560 N2 .
Construire un intervalle de confiance, 95%, de lcart-type de cette force de rupture.

Solution 2
Au seuil , lintervalle de confiace de lcart-type est dfini par :
"s s #
(n 1) (n 1)
s, s
2n1;1/2 2n1;/2
Pour = 5% :
2
9;.025 = 2.7
2
9;.975 = 19

do lintervalle de confiace de lcart-type 95% :

[27.18 N, 72.11 N]

Exercice 3
Une enqute statistique eectue sur cent sujets permet de dfinir, 95%, lintervalle
de confiance de la moyenne :
[49.6 50.4]
Dans quelles conditions aurait-il t possible que le rsultat ft 95% :
[49.8 50.2]

98
A. El Mossadeq Tests : Moyennes et Variances

Solution 3
Il sagit de dterminer la taille n0 de lchantillon prlever pour que lintervalle de
confiance de la moyenne 95% soit :

[49.8, 50.2]
sachant que pour un chantillon de taille n = 100, cet intervalle est :

[49.6, 50.4]
Puisque :


m t1/2 , m + t1/2 = [49.6, 50.4]
n n
on en dduit :

49.6 + 50.4
m =
2
= 50
et :

n (50.4 49.6)
=
2t1/2
' 2.04
Lgalit :

50.2 = m + t1/2
n0
implique :
2
0 t1/2
n =
50.2 m
= 400

Exercice 4
Pour dterminer le point de fusion moyen dun certain alliage, on a procd neuf
observations qui ont donnes une moyenne m = 1040 C et un cart-type s = 16 C.
Construire un intervalle de confiance de la moyenne 95%.

99
Tests : Moyennes et Variances A. El Mossadeq

Solution 4
Ici on a :
n = 9
m = 1040 C
s = 16 C
Au seuil , lintervalle de confiace dune telle moyenne est dfini par :

s s
m tn1;1/2 , m + tn1;1/2
n n
Pour = 5%, on a :
t8;.975 = 2.31
do lintervalle de confiance 95% :

[1027.68 C, 1052.32 C]

Exercice 5
La taille de 1200 conscrits du bureau de recrutement X a pour moyenne X = 172 cm
et pour cart-type sX = 6 cm.
Les mmes mesures eectues sur les 250 conscrits du bureau de recrutement Y ont
donn pour moyenne Y = 170 cm et pour cart-type sX = 5 cm.
Que peut-on conclure ?

Solution 5
Testons au seuil lhypothse nulle :

H0 : les conscrits des bureaux de recrutement X et Y ont la mme taille


Sous lhypothse nulle H0 , la quantit :

X Y
t= r 2
sX s2Y
+
n1 n2
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.
Pour = 5%, on a :
t.975 = 1.96

100
A. El Mossadeq Tests : Moyennes et Variances

Et comme :
X Y
t = r 2
sX s2Y
+
n1 n2
= 5.547
On rejette alors lhypothse nulle H0 95% (mme 99%), cest dire, les conscrits
des bureaux de recrutement X et Y ont des tailles moyennes direntes.

Exercice 6
On se propose de comparer le poids la naissance chez une srie de primapares
(srie 1) et une srie de multipares (srie 2) :
Serie 1 : n1 = 95 m1 = 3197 g s21 = 210100 g2

Serie 2 : n2 = 105 m2 = 3410 g s22 = 255400 g2


Que peut-on conclure ?

Solution 6
Testons au seuil lhypothse nulle :
H0 : les primapares et les multipares ont le mme poids moyen la naissance
Sous lhypothse nulle H0 , la quantit :
m1 m2
t= r 2
s1 s22
+
n1 n2
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.Pour = 5%, on a :
t.975 = 1.96
Et comme :
m m2
t = r 12
s1 s2
+ 2
n1 n2
= 3.1256
On rejette alors lhypothse nulle H0 , 95% (mme 99%), cest dire, les prima-
pares et les multipares nont pas le mme poids moyen la naissance

101
Tests : Moyennes et Variances A. El Mossadeq

Exercice 7
Chez cent sujet normaux, on dose lacide urique, les rsultats sont :

m1 = 53.3 mg/ l
s1 = 9.1 mg/ l
Chez cent sujet atteints de la maladie de goutte, le mme dosage de lacide urique
fournit les rsultats :

m2 = 78.6 mg/ l
s2 = 13.1 mg/ l
Que peut-on conclure ?

Solution 7
Testons au seuil , lhypothse nulle :
H0 : la maladie de goutte na pas dinfluence sur la dose de lacide urique
Sous cette hypothse, la quantit :
m1 m2
t= r 2
s1 s2
+ 2
n1 n2
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.
Pour = 5%, on a :
t.975 = 1.96
et comme :
m m2
t = r 12
s1 s2
+ 2
n1 n2
= 15.862
On rejette lhypothse nulle H0 95% (mme 99.99%), cest dire, la maladie de
goutte a une influence sur la dose de lacide urique.

Exercice 8
On admet que la valeur moyenne de la glycmie du sujet normal est 1 g/ l.
Sur 17 sujets, on a trouv une moyenne de .965 g/ l et un cart-type estim de
.108 g/ l.
Cette valeur peut-elle tre considre comme dirente du taux normal ?

102
A. El Mossadeq Tests : Moyennes et Variances

Solution 8
Testons au seuil , lhypothse nulle :
H0 : la valeur est normale
Sous cette hypothse, la quantit :
m
t= s

n
est une ralisation de la variable alatoire Tn1 de Student :
n 1 = 16
degrs de libert.
Pour = 5%, on a :
t16;.975 = 2.12
et comme :
m
t = s

n
= 1.3362
on accepte lhypothse nulle H0 au seuil = 5%, cest dire, la valeur est normale.

Exercice 9
Dans un chantillon de 17 prmaturs, la moyenne du Na-plasmatique est :

m1 = 133
s2 = 81.2
1

Soit un autre chantillon de 25 dysmaturs, dans lequel la moyenne du Na-plasmatique


est :

m2 = 136
s2 = 56.57
2

Que peut-on conclure ?

Solution 9
Testons dabord, au seuil = 10%, lhypothse nulle dgalit des variances du N a-
plasmatique chez les prmaturs et les dysmaturs.

103
Tests : Moyennes et Variances A. El Mossadeq

Sous cette hypothse, la quantit :


s21
f=
s22
est une ralisation dune variable alatoire de Fisher :
(n1 1, n2 1) = (16, 24)
degrs de libert.
Pour = 10%, on a :
F16,24;.95 = 2.09
Et comme :
s21
f =
s22
= 1.4354
on accepte donc lhypothse dgalit des variances des deux populations.
Calculons maintenant lestimation commune s2 de cette variance :
(n1 1) s21 + (n2 1) s22
s2 =
n1 + n2 2
= 66.42
et testons lhypothse nulle :
H0 : les prmaturs et les dysmaturs ont la mme moyenne du Na-plasmatique
Sous cette hypothse, la quantit :
m1 m2
t= r
1 1
s +
n1 n2
est une ralisation de la variable alatoire de Student :
n1 + n2 2 = 40
degrs de libert.
Pour = 10%, on a :
t40;.95 = 1.68
Et comme :
m m2
t = r1
1 1
s +
n1 n2
= 1.17

104
A. El Mossadeq Tests : Moyennes et Variances

On accepte lhypothse nulle H0 au seuil = 10%, cest dire, les prmaturs et les
dysmaturs ont la mme moyenne du Na-plasmatique estime par :
n1 m1 + n2 m2
m =
n1 + n2
= 134.79

Exercice 10
Lorquune machine est bien rgle, elle produit des pices dont le diamtre D est
une variable gaussienne de moyenne 25 mm.
Deux heures aprs le rglage de la machine, on a prlev au hasard neuf pices.
Leurs diamtres ont pour mesure en mm :
22 23 21 25 24 23 22 26 21
Que peut-on conclure quant la qualit du rglage aprs deux heures de fonction-
nement de la machine ?

Solution 10
Calculons dabord les estimations m et s2 de la moyenne et de la variance sur cet
chantillon de taille n = 9.
On a :
1X
n
m = xi
n i=1
= 23 mm
et :
1 X
n
2
s = (xi m)2
n 1 i=1
= 3 mm2
Testons lhypothse nulle :
H0 : la machine est bien rgle
Sous lhypothse nulle H0 , la quantit :
m
t= s

n

105
Tests : Moyennes et Variances A. El Mossadeq

est une ralisation dune variable alatoire de Student :


n1=8
degrs de libert : T8 .
Pour = 5%, on a :
t8;.975 = 2.31
et comme :
m
t = s

n
= 3.4641
On rejette lhypothse nulle H0 95% (mme 99%), cest dire, le rglage de la
machine est rompu.

Exercice 11
Si lcart-type de la dure de vie dun modle de lampe lectrique est estim cent
heures, quelle doit tre la taille de lchantillon prlever pour que lerreur sur
lestimation de la dure de vie moyenne nexde pas vingt heures et ce avec une
probabilit de 95% puis 99% ?

Solution 11
Lerreur sur lestimation de la moyenne est donne par :
s
t1/2
n
(1) Pour = 5%, on a :
t1/2 = 1.96
do :
s
t1/2 20 = n 97
n
(2) Pour = 1%, on a :
t1/2 = 2.57
do :
s
t1/2 20 = n 166
n

106
A. El Mossadeq Tests : Moyennes et Variances

Exercice 12
Une machine fabrique des rondelles dont le diamtre D est une variable guassienne.
On prlve au hasard un chantillon de huit rondelles.
Leurs diamtres ont pour mesure en mm :
20.1 19.9 19.7 20.2 20.1 23.1 22.6 19.8
Construire 95% puis 99% les intervalles de confiance de la moyenne et de la vari-
ance.

Solution 12
Calculons dabord les estimations m et s2 de la moyenne et de la variance sur cet
chantillon de taille n = 8.
On a :
1X
n
m = xi
n i=1
= 20.6875 mm
et
1 X
n
s 2
= (xi m)2
n 1 i=1
= 1.827 mm2

1. Lintervalle de confiance de la moyenne 1 est :



s s
m tn1;1/2 , m + tn1;1/2
n n

(a) Pour = 5%, on a :


t7;.975 = 2.36
do lintervalle :
[19.163, 22.212]

(b) Pour = 1%, on a :


t7;.995 = 3.5
do lintervalle :
[18.427, 22.948]

107
Tests : Moyennes et Variances A. El Mossadeq

2. Lintervalle de confiance de la variance 1 est :


" #
2 2
(n 1) s (n 1) s
,
2n1;1/2 2n1;/2

(a) Pour = 5%, on a :


2
7;.025 = 1.69
2
7;.975 = 16

do lintervalle :
[.79931, 7.5675]
(b) Pour = 1%, on a :
2
7;.005 = .989
2
7;.995 = 20.3

do lintervalle :
[.63, 12.931]

Exercice 13
On eectue un dosage par deux mthodes direntes A et B.
On obtient les rsultats suivants :

M ethode A .6 .65 .7 .7 .7 .7 .75 .8 .8

M ethode B .6 .6 .65 .65 .7 .6 .75 .8 .8

Peut-on considrer que les deux mthodes sont quivalentes ?

Solution 13
Calculons les estimations (m1 , s21 ) de (1 , 21 ) et (m2 , s22 ) de (2 , 22 ) :

1X
9




m1 = 9 x1i = .71
i=1
1X
9



2
(x1i m1 )2 = .004
s1 = 8
i=1

108
A. El Mossadeq Tests : Moyennes et Variances

et :

1X
9




m2 = 9 x2i = .68
i=1
1X
9



2
(x2i m2 )2 = .007
s2 = 8
i=1

Testons dabord, au seuil = 10%, lhypothse nulle dgalit des variances des
deux mthodes de dosage.
Sous cette hypothse, la quantit :
s22
f=
s21
est une ralisation dune variable alatoire de Fisher :
(n2 1, n1 1) = (8, 8)
degrs de libert.
Pour = 10%, on a :
F8,8;.95 = 3.44
et comme :
s22
f =
s21
= 1.75
On accepte donc lhypothse dgalit des variances des deux populations.
Calculons maintenant lestimation commune s2 de cette variance :
(n1 1) s21 + (n2 1) s22
s2 =
n1 + n2 2
= 0.0055
et testons lhypothse nulle :
H0 : les deux mthodes de dosage sont quivalentes.
Sous cette hypothse, la quantit :
m1 m2
t= r
1 1
s +
n1 n2
est une ralisation de la variable alatoire de Student :
n1 + n2 2 = 16
degrs de libert.

109
Tests : Moyennes et Variances A. El Mossadeq

Pour = 10%, on a :
t16;.95 = 1.75
et comme :
m m2
t = r1
1 1
s +
n1 n2
= 0.86
on accepte lhypothse nulle H0 au seuil = 10%, cest dire, les deux mthodes de
dosage sont quivalentes.

Exercice 14
Dans deux types de forts, on a mesur les hauteurs de treize et quatorze peuple-
ments choisis au hasard et indpendamment dans le but de vrifier si les hauteurs
de ces deux types darbres sont ou ne sont pas gales.
Les rsultats sont les suivants :

T ype 1 : 22.5 22.9 23.7 24.0 24.4 24.5 26.0

26.2 26.4 26.7 27.4 28.6 28.7

T ype 2 : 23.4 24.4 24.6 24.9 25.0 26.2 26.3

26.8 26.8 26.9 27.0 27.6 27.7 27.8

On admet que les hauteurs de ces deux types darbres sont des variables gaussiennes
N (1 , 21 ) et N (2 , 22 ).
Que peut-on conclure ?

Solution 14
Calculons les estimations (m1 , s21 ) de (1 , 21 ) et (m2 , s22 ) de (2 , 22 ) :

1 X
13




m1 = 13 x1i = 25.538
i=1
1 X
13



2
(x1i m1 )2 = 4.1576
s1 = 12
i=1

110
A. El Mossadeq Tests : Moyennes et Variances

et :

1 X
14




m2 = 14 x2i = 26.1
i=1
1 X
14



2
(x2i m2 )2 = 1.9431
s2 = 13
i=1

Testons dabord, au seuil = 10%, lhypothse nulle dgalit des variances des
hauteurs des deux types darbres.
Sous cette hypothse, la quantit :
s21
f=
s22
est une ralisation dune variable alatoire de Fisher :

(n1 1, n2 1) = (12, 13)


degrs de libert.

Pour = 10%, on a :
F12,13;.95 = 2.6
et comme :
s21
f =
s22
= 2.1398
on accepte donc lhypothse dgalit des variances des hauteurs des deux types
darbres.
Calculons maintenant lestimation commune s2 de cette variance :

(n1 1) s21 + (n2 1) s22


s2 =
n1 + n2 2
= 3.0062
et testons lhypothse nulle :

H0 : les deux types darbres ont la mme hauteur


Sous cette hypothse, la quantit :

m1 m2
t= r
1 1
s +
n1 n2

111
Tests : Moyennes et Variances A. El Mossadeq

est une ralisation de la variable alatoire de Student :


n1 + n2 2 = 25
degrs de libert.

Pour = 10%, on a :
t25;.95 = 1.71
et comme :

m m2
t = r1
1 1
s +
n1 n2
= 0.84155
on accepte lhypothse nulle H0 au seuil = 10%, cest dire, les deux types darbres
ont la mme hauteur moyenne estime par :
n1 m1 + n2 m2
m =
n1 + n2
= 25.829

Exercice 15
On considre deux varits de mas M1 et M2 dont les rendements sont des vari-
ables alatoires gaussiennes N (1 , 21 ) et N (2 , 22 ).
Afin de comparer les rendements de ces deux varits de mas, on a choisi de cul-
tiver dans neuf stations direntes des parcelles voisines encemences de lune ou
lautre des deux varits.On a observ les rendements suivants :

Station 1 2 3 4 5 6 7 8 9

V ariete 1 39.6 32.4 33.1 27 36 32 25.9 32.4 33.2

V ariete 2 39.2 33.1 32.4 25.2 33.1 29.5 24.1 29.2 34.1

Que peut-on conclure ?

112
A. El Mossadeq Tests : Moyennes et Variances

Solution 15
Calculons les estimations (m1 , s21 ) de (1 , 21 ) et (m2 , s22 ) de (2 , 22 ) :

1 X
13




m1 = 13 x1i = 32.4
i=1
1 X
13



2
(x1i m1 )2 = 17.188
s1 = 12
i=1

et :

1 X
14




m2 = 14 x2i = 31.1
i=1
1 X
14



2
(x2i m2 )2 = 21.785
s2 = 13
i=1

Testons dabord, au seuil = 10%, lhypothse nulle dgalit des variances des
rendements des deux varits de mas.
Sous cette hypothse, la quantit :
s22
f=
s21
est une ralisation dune variable alatoire de Fisher :
(n2 1, n1 1) = (8, 8)
degrs de libert.
Pour = 10%, on a :
F8,8;.95 = 3.44
et comme :
s22
f =
s21
= 1.2675
On accepte donc lhypothse dgalit des variances des hauteurs des deux types
darbres.
Calculons maintenant lestimation commune s2 de cette variance :
(n1 1) s21 + (n2 1) s22
s2 =
n1 + n2 2
2 2
s1 + s2
=
2
= 19.4865

113
Tests : Moyennes et Variances A. El Mossadeq

et testons lhypothse nulle :


H0 : les deux varits de mas ont le mme rendement
Sous cette hypothse, la quantit :
m1 m2
t= r
1 1
s +
n1 n2
est une ralisation de la variable alatoire de Student :
n1 + n2 2 = 16
degrs de libert.
Pour = 10%, on a :
t16;.95 = 1.75
et comme :
m m2
t = r1
1 1
s +
n1 n2
= .42892
on accepte lhypothse nulle H0 au seuil = 10%, cest dire, les deux varits de
mas ont le mme rendement moyen estim par :
n1 m1 + n2 m2
m =
n1 + n2
= 31.75

Exercice 16
Le relev des tempratures journalires minimales de deux stations S1 et S2 , au
cours de neuf journes conscutives a fourni les valeurs suivantes en C:

Station 1 12 8 9 10 11 13 10 7 10

Station 2 7 11 10 6 8 11 12 9 7

On admet que la distribution des tempratures journalires minimales des deux


stations S1 et S2 sont des variables gaussiennes N (1 , 21 ) et N (2 , 22 ).
1. Dterminer les estimations des moyennes et des variances des tempratures
journalires minimales des deux stations S1 et S2 .
2. Construire, au seuil = 5%, les intervalles de confiance de ces estimations.

114
A. El Mossadeq Tests : Moyennes et Variances

3. Peut-on admettre, au seuil = 10%, lhypothse selon laquelle les tempratures


journalires minimales moyennes des deux stations S1 et S2 sont identiques ?

Solution 16
1. Calculons les estimations (m1 , s21 ) de (1 , 21 ) et (m2 , s22 ) de (2 , 22 ).
On a :

1X
11



m = x1i = 10 C

1
9
i=1


1X
11



2
(x1i m1 )2 = 3.5
s1 = 8
i=1
et :

1X
10



m2 = x2i = 9 C

9
i=1


1X
10



2
(x2i m2 )2 = 4.5
s2 = 8
i=1

(a) Lintervalle de confiance de 1 1 est dfini par :



s1 s1
m1 tn1;1/2 , m1 + tn1;1/2
n n
Pour = 5%, on a :
t8;.975 = 2.31
do lintervalle :
[8.56 C, 11.44 C]
(b) Lintervalle de confiance de 21 1 est dfini par :
" #
(n 1) s21 (n 1) s21
,
2n1;1/2 2n1;/2

Pour = 5%, on a :
2
8;.025 = 2.18
2
8;.975 = 17.5

115
Tests : Moyennes et Variances A. El Mossadeq

do lintervalle :
[1.6, 12.8]
(c) Lintervalle de confiance de 2 1 est dfini par :

s2 s2
m2 tn1;1/2 , m2 + tn1;1/2
n n
Pour = 5%, on a :
t8;.975 = 2.31
do lintervalle :
[7.37 C, 10.63 C]
(d) Lintervalle de confiance de 22 1 est dfini par :
" #
2 2
(n 1) s2 (n 1) s2
,
2n1;1/2 2n1;/2

Pour = 5%, on a :
2
8;.025 = 2.18
2
8;.975 = 17.5

do lintervalle :
[2.06, 16.51]

2. Testons dabord, au seuil = 10%, lhypothse nulle dgalit des variances des
tempratures journalires minimales des deux stations S1 et S2 .
Sous cette hypothse, la quantit :
s22
f=
s21
est une ralisation dune variable alatoire de Fisher :
(n2 1, n1 1) = (8, 8)
degrs de libert.
Pour = 10%, on a :
F8,8;.95 = 3.44
et comme :
s22
f= = 1.29
s21
On accepte donc lhypothse dgalit des variances.

116
A. El Mossadeq Tests : Moyennes et Variances

Calculons maintenant lestimation commune s2 de cette variance :

(n1 1) s21 + (n2 1) s22


s2 =
n1 + n2 2
2 2
s1 + s2
=
2
= 4
et testons lhypothse nulle :
H0 : les tempratures journalires minimales moyennes des deux stations
S1 et S2 .sont identiques
Sous cette hypothse, la quantit :
m1 m2
t= r
1 1
s +
n1 n2
est une ralisation de la variable alatoire de Student :
n1 + n2 2 = 16
degrs de libert.

Pour = 10%, on a :
t16;.95 = 1.75
et comme :

m1 m2
t= r = 1.0607
1 1
s +
n1 n2
On accepte lhypothse nulle H0 au seuil = 10%, cest dire, les tempratures
journalires minimales moyennes des deux stations S1 et S2 .sont identiques.
Cette temprature moyenne peut tre estime par :
n1 m1 + n2 m2
m =
n1 + n2
m1 + m2
=
2
= 9.5

117
Tests : Moyennes et Variances A. El Mossadeq

Exercice 17
On tudie leet dune substance sur la croissance dune tumeur gree.
Les rsultats sont consigns sur le tableau ci-dessous donnant la surface de la tumeur
au 20eme jour aprs sa gree :

Surf ace 5.5 6 6.5 7 7.5 8


T emoins 1 2 3 8 4 3
T raites 4 4 8 3 1 1

Le traitement a-t-il un eet significatif sur la surface tumorale ?


On suppose que la surface tumorale est distribue selon des lois normales N (1 , 21 )
et N (2 , 22 ) chez les tmoins et les traits respectivement.

Solution 17
Calculons les estimations (m1 , s21 ) de (1 , 21 ) et (m2 , s22 ) de (2 , 22 ).
On a :

1 X
6



m1 = n1i xi = 7

21
i=1


1 X
6



2
n1i (xi m1 )2 = .45
s1 = 20
i=1
et :

1 X
6



m2 = n2i xi = 6.4048

21 i=1


1 X
6



2
n2i (xi m2 )2 = .87972
s2 = 20
i=1

Testons dabord, au seuil = 2%, lhypothse nulle dgalit des variances des
surfaces tumorales chez les populations des tmoins et des traits.
Sous cette hypothse, la quantit :
s22
f= 2
s1
est une ralisation dune variable alatoire de Fisher :
(n2 1, n1 1) = (20, 20)
degrs de libert.

118
A. El Mossadeq Tests : Moyennes et Variances

Pour = 2%, on a :
F20,20;.99 = 2.94
et comme :
s22
f =
s21
= 1.9549
on accepte donc lhypothse dgalit des variances des deux populations.
Calculons maintenant lestimation commune s2 de cette variance :
(n1 1) s21 + (n2 1) s22
s2 =
n1 + n2 2
= .66486
et testons lhypothse nulle :
H0 : le traitement est sans eet sur la croissance de la surface tumorale
Sous cette hypothse, la quantit :
m1 m2
t= r
1 1
s +
n1 n2
est une ralisation de la variable alatoire de Student :
n1 + n2 2 = 40
degrs de libert.
Pour = 2%, on a :
t40;.99 = 2.42
et comme :
m m2
t = r1
1 1
s +
n1 n2
= 2.831
on rejette lhypothse nulle H0 98%, cest dire, le traitement a une influence sur
la croissance de la surface tumorale.

119

Vous aimerez peut-être aussi