Vous êtes sur la page 1sur 152

Département 

de Mathématiques, Informatique et Géomatique 

Exercices Corrigés

 
 
 


 
 
 
 
 
 
 
© A. El Mossadeq
Juillet 2020
TABLE DES MATIÈRES
 
 
 
 
Structures Statistiques et Estimation       1 
 
 
   
Les Tests d’Hypothèses             67  
 
Structures Statistiques et Estimation A. El Mossadeq

Exercice 1
Déterminer et étudier les propriétés de l’estimateur du maximum de vraisemlance
d’un r-échantillon pour:

1. le paramètre p d’une loi de Bernouilli


2. le paramètre p d’une loi geometrique
3. le paramètre p d’une loi binomiale d’ordre n
4. le paramètre d’une loi de P oisson
5. le paramètre d’une loi exponentielle
2
6. les paramètres et d’une loi normale
7. le paramètre d’une loi unif orme sur l’intervalle [0; ]

Solution 1
1. Soit X une variable aléatoire de Bernouilli de paramètre p.
Pour tout x 2 f0; 1g, la probabilité élémentaire p (x) de x est:

p (x) = px (1 p)1 x

de plus:
8
< E [X] = p
:
V [X] = p (1 p)
(a) Recherche du maximum de vraisemlance:
Considérons un r-échantillon de cette structure.
Sa fonction de vraisemblance est dé…nie pour tout p 2 [0; 1] et tout
(x1 ; :::; xr ) 2 f0; 1gr par:
r
Y
L (p; x1 ; :::; xr ) = p (xi )
i=1
Pr P
r
xi r xi
= pi=1 (1 p) i=1

3
A. El Mossadeq Structures Statistiques et Estimation

d’où:
r
! r
!
X X
ln L (p; x1 ; :::; xr ) = xi ln p + r xi ln (1 p)
i=1 i=1

Il en résulte que:
P
r P
r
xi r xi
@ i=1 i=1
ln L (p; x1 ; :::; xr ) =
@p p 1 p
d’où:
r
@ 1X
ln L (p; x1 ; :::; xr ) = 0 =) p = xi
@p r i=1
et comme:
@2
ln L (p; x1 ; :::; xr ) < 0
@p2
donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’une
structure de Bernouilli est:
r
1X
p^ = Xi
r i=1
C’est la fréquence empirique du r-échantillon.
(b) Etude des propriétés de p^:
Puisque:
E [^
p] = E [X] = p
et:
V [X]
V [^
p] =
r
p (1 p)
=
r
On en déduit que p^ est un estimateur sans biais et convergent du paramètre
p d’une loi de Bernouilli.

4
Structures Statistiques et Estimation A. El Mossadeq

2. Soit X une variable aléatoire de géométrique de paramètre p.


Pour tout x 2 N , la probabilité élémentaire p (x) de x est:

p (x) = p (1 p)x 1

de plus:
8
> 1
>
> E [X] =
< p
>
> 1 p
>
: V [X] =
p2
Considérons un r-échantillon de cette structure.
Sa fonction de vraisemblance est dé…nie pour tout p 2 [0; 1] et tout (x1 ; :::; xr ) 2
(N )r par:
r P
r
Y xi r
r
L (p; x1 ; :::; xr ) = p (xi ) = p (1 p)i=1
i=1

d’où:
r
!
X
ln L (p; x1 ; :::; xr ) = r ln p + xi r ln (1 p)
i=1
Il en résulte que:
P
r
xi r
@ r i=1
ln L (p; x1 ; :::; xr ) =
@p p 1 p
P
r
r p xi
i=1
=
p (1 p)
d’où:
@ r
ln L (p; x1 ; :::; xr ) = 0 =) p = P
r
@p
xi
i=1

5
A. El Mossadeq Structures Statistiques et Estimation

et comme:
@2
ln L (p; x1 ; :::; xr ) < 0
@p2
donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’une
structure géométrique est:
r
p^ = Pr
Xi
i=1
C’est l’inverse de la moyenne empirique du r-échantillon.

3. Soit X une variable aléatoire binomiale d’ordre n et de paramètre p.


pour tout x 2 f0; 1; :::; ng, la probabilité élémentaire p (x) de x est:

p (x) = C (n; x) px (1 p)n x

de plus:
8
< E [X] = np
:
V [X] = np (1 p)

(a) Recherche du maximum de vraisemlance:


Considérons un r-échantillon de cette structure.
Sa fonction de vraisemblance est dé…nie pour tout p 2 [0; 1] et tout
(x1 ; :::; xr ) 2 f0; 1; :::; ngr par:
r
Y
L (p; x1 ; :::; xr ) = p (xi )
i=1
" r
# P
r P
r
Y xi rn xi
= C (n; xi ) pi=1 (1 p) i=1

i=1

d’où:
r r
! r
!
Y X X
ln L (p; x1 ; :::; xr ) = ln C (n; xi )+ xi ln p+ rn xi ln (1 p)
i=1 i=1 i=1

6
Structures Statistiques et Estimation A. El Mossadeq

Il en résulte que:
P
r P
r
xi rn xi
@ i=1 i=1
ln L (p; x1 ; :::; xr ) =
@p p 1 p
P
r
xi rnp
i=1
=
p (1 p)
d’où:
r
@ 1 X
ln L (p; x1 ; :::; xr ) = 0 =) p = xi
@p rn i=1
et comme:
@2
ln L (p; x1 ; :::; xr ) < 0
@p2
donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’une
structure de binomiale est:
r
1 X
p^ = Xi
rn i=1
(b) Etude des propriétés de p^:
Puisque:
1
E [^
p] = E [X]
n
= p

et:
V [X]
V [^
p] =
rn2
p (1 p)
=
rn
on en déduit que p^ est un estimateur sans biais et convergent de p.

4. Soit X une variable aléatoire de Poisson de paramètre .

7
A. El Mossadeq Structures Statistiques et Estimation

Pour tout x 2 N, la probabilité élémentaire p (x) de x est:


x
p (x) = exp
x!
de plus:
8
< E [X] =
:
V [X] =
(a) Recherche du maximum de vraisemlance:
Considérons un r-échantillon de cette structure.
Sa fonction de vraisemblance est dé…nie pour tout , > 0, et tout
(x1 ; :::; xr ) 2 Nr par:
P
r
r xi
Y i=1
L ( ; x1 ; :::; xr ) = p (xi ) = exp r
i=1
x1 !:::xr !
d’où:
r
X
ln L ( ; x1 ; :::; xr ) = ln (x1 !:::xr !) + xi ln r
i=1

Il en résulte que:
P
r
xi
@ i=1
ln L ( ; x1 ; :::; xr ) = r
@
d’où:
r
@ 1X
ln L ( ; x1 ; :::; xr ) = 0 =) p = xi
@ r i=1
et comme:
@2
ln L ( ; x1 ; :::; xr ) < 0
@ 2

8
Structures Statistiques et Estimation A. El Mossadeq

donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’une


structure de Poisson est:
r
1X
^= Xi
r i=1
C’est la moyenne empirique du r-échantillon.
(b) Etude des propriétés de ^ :
Puisque:
E [^ ] = E [X] =
et:
V [X]
V [^ ] ==
r r
On en déduit que ^ est un estimateur sans biais et convergent de .

5. Soit X une variable aléatoire exponentielle de paramètre .


Sa densité de probabilité f est dé…nie par:

8
< 0 si x 0
f (x) =
:
exp x si x>0
de plus:
8
> 1
>
> E [X] =
<
>
> 1
>
: V [X] = 2

Considérons un r-échantillon de cette structure.Sa fonction de vraisemblance


est dé…nie pour tout , > 0, et tout (x1 ; :::; xr ) dans Rr ; tous strictement
positifs, par:
r
Y r
X
r
L ( ; x1 ; :::; xr ) = f (xi ) = exp xi
i=1 i=1

9
A. El Mossadeq Structures Statistiques et Estimation

d’où:
r
X
ln L ( ; x1 ; :::; xr ) = r ln xi
i=1
Il en résulte que:
r
X
@ r
ln L ( ; x1 ; :::; xr ) = xi
@ i=1

d’où:
@ r
ln L ( ; x1 ; :::; xr ) = 0 =) =P
r
@
xi
i=1
et comme:
@2
ln L ( ; x1 ; :::; xr ) < 0
@ 2
donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’une
structure exponentielle est:
^= r
Pr
Xi
i=1
C’est l’inverse de la moyenne empirique du r-échantillon.

2
6. Soit X une variable aléatoire normale de paramètres et .
Sa densité de probabilité f est dé…nie pour tout x 2 R par:

1 1
f (x) = p exp (x )2
2 2 2
de plus:
8
< E [X] =
: 2
V [X] =

10
Structures Statistiques et Estimation A. El Mossadeq

(a) Recherche du maximum de vraisemlance:


Considérons un r-échantillon de cette structure.
Sa fonction de vraisemblance est dé…nie pour tout 2 R, tout > 0 et
tout (x1 ; :::; xr ) 2 Rr par:

r
Y
L ( ; ; x1 ; :::; xr ) = f (xi )
i=1
r
1 1 X
= p r exp (xi )2
2 2 2 i=1
d’où:
r
p 1 X
ln L ( ; ; x1 ; :::; xr ) = r ln 2 r ln (xi )2
2 2 i=1
Il en résulte que:
8 r
>
> @ 1 X
>
> L ( ; ; x1 ; :::; xr ) = 2 (xi )
>
>
< @ i=1

>
> r
>
> @ r 1 X
>
: @ L ( ; ; x1 ; :::; xr ) =
> + 3
(xi )2
i=1

d’où:

8 r
8
@
>
>
> 1X
>
> L ( ; ; x1 ; :::; xr ) = 0 >
> = xi
>
< @ >
< r i=1
=)
>
> >
> r
: @ L ( ; ; x1 ; :::; xr ) = 0
> >
> 1X
>
>
:
2
= (xi )2
@ r i=1
Donc les estimateurs du maximum de vraisemblance d’un r-échantillon
d’une structure normale est:

11
A. El Mossadeq Structures Statistiques et Estimation

8 r
>
> 1 X
>
> ^ = Xi
>
> r i=1
<
>
> r
>
> 1X
> 2
: ^ =r
> (Xi ^ )2
i=1
(b) Etude des propriétés de ^ et ^ :
On a:

E [^ ] = E [X]
=

et:
r 1
E ^2 = V [X]
r
r 1 2
=
r
On en déduit que ^ est un estimateur sans biais et convergent de , mais
^ est un estimateur biaisé de .

7. Soit X une variable aléatoire uniforme sur l’intervalle [0; ].


Sa densité de probabilité f est dé…nie pour tout x 2 [0; ] par:
8 1
>
< si x 2 [0; ]
f (x) =
>
:
0 si x 2 = [0; ]
de plus:
8
>
> E [X] =
>
< 2
>
> 2
>
: V [X] =
12
Considérons un r-échantillon de cette structure.

12
Structures Statistiques et Estimation A. El Mossadeq

Sa fonction de vraisemblance est dé…nie pour tout , > 0, et tout (x1 ; :::; xr )
r
dans [0; ] :
r
Y 1
L ( ; x1 ; :::; xr ) = f (xi ) = r
i=1
La fonction:
! L ( ; x1 ; :::; xr )
est strictement décroissante, donc elle atteint son maximum lorsque est
minimum.
Et comme:
8i 2 f1; :::; rg : xi
donc est minimum lorsque:

= max (x1 ; :::; xr )

Donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’une


structure uniforme est:
^ = max (X1 ; :::; Xr )

Exercice 2
Soit X une variable aléatoire dont la densité de probabilité f est dé…nie par:
8 1 x
>
< exp si x > 0
f (x) =
>
:
0 si x 0
où est un paramètre réel strictement positif.

1. Déterminer l’estimateur du maximum de vraisemlance ^ de d’un r-échantillon


de variable parente X .
2. ^ est-il un résumé exhaustif?

13
A. El Mossadeq Structures Statistiques et Estimation

3. Calculer l’espérance mathématique et la variance de ^:


Que peut-on conclure?
4. Calculer la quantité d’information de F isher.
En déduire que ^ est e¢ cace.

Solution 2
Soit X une variable aléatoire exponentielle dont la densité de probabilité f est
dé…nie pour tout x, x > 0, par:
8 1 x
>
< exp si x>0
f (x) =
>
:
0 si x 0
où est un paramètre réel strictement positif.
On a:
8
< E [X] =
: 2
V [X] =
1. Considérons un r-échantillon de cette structure.
Sa fonction de vraisemblance est dé…nie pour tout , > 0, et tout (x1 ; :::; xr ) 2
Rr ; tous strictement positifs, par:

r
Y
L ( ; x1 ; :::; xr ) = f (xi )
i=1
P
r
xi
1 i=1
= r exp

d’où:
P
r
xi
i=1
ln L ( ; x1 ; :::; xr ) = r ln

14
Structures Statistiques et Estimation A. El Mossadeq

Il en résulte que:
P
r
xi
@ r i=1
ln L ( ; x1 ; :::; xr ) = + 2
@
d’où:
r
@ 1X
ln L ( ; x1 ; :::; xr ) = 0 =) = xi
@ r i=1
et comme:
@2
ln L ( ; x1 ; :::; xr ) < 0
@ 2
donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’une
structure exponentielle est:
X r
^= 1 Xi
r i=1
C’est la moyenne empirique du r-échantillon.

2. Pour tout , > 0, et tout (x1 ; :::; xr ) 2 Rr ; tous strictement positifs, on a:


Pr
xi
1 i=1
L ( ; x1 ; :::; xr ) = r exp

1 r^ (x1 ; :::; xr )
= r exp

D’après le théorème de factorisation, ^ est un résumé exhaustif puisque:

L ( ; x1 ; :::; xr ) = g ; ^ (x1 ; :::; xr ) h (x1 ; :::; xr )

où:
1 r^ (x1 ; :::; xr )
g ; ^ (x1 ; :::; xr ) = r exp
et:
h (x1 ; :::; xr ) = 1

15
A. El Mossadeq Structures Statistiques et Estimation

3. Comme:
X r
^= 1 Xi
r i=1
alors:
h i
E ^ = E [X] =
et:
h i V [X] 2
V ^ = =
r r
On en déduit que ^ est un estimateur sans biais et convergent de .
4. Calculons la quantité d’information de F isher, I [X; ], concernant .
On a:
@2
I [X; ] = E ln f ( ; X)
@ 2
@2 X
= E 2 ln
@
1 2X
= E 2 + 3

1
= 2

Donc la quantité d’information de F isher, I [X1 ; :::; Xr ; ], concernant


fournie par le r-échantillon est:
r
I [X1 ; :::; Xr ; ] = rI [X; ] = 2
h i
Calculons l’e¢ cacité e ^ de ^.
On a:
h i 1
e ^ = h i =1
I [X1 ; :::; Xr ; ] V ^

donc, ^ est e¢ cace.

16
Structures Statistiques et Estimation A. El Mossadeq

Exercice 3
Soit X une variable aléatoire dont la densité de probabilité f est dé…nie par:
8
< 0 si x 0
f (x) = x
: k xk 1 exp si x > 0

où est un paramètre réel strictement positif , k un entier naturel non nul et


une constante réel.

1. Déterminer la constante :
2. Déterminer l’estimateur du maximum de vraisemlance ^ de d’un r-échantillon
de variable parente X .
3. ^ est-il un résumé exhaustif?
4. Calculer l’espérance mathématique et la variance de ^:
Que peut-on conclure?
5. Calculer la quantité d’information de F isher.
En déduire que ^ est e¢ cace.

Solution 3
Rappelons que pour tout k 2 N:
Z +1
uk exp udu = k!
0

1. Ainsi:
Z +1 Z +1
x
f (x) dx = k
xk 1
exp dx
1
Z0 +1
= uk 1
exp udu
0
= (k 1)!

d’où
1
=
(k 1)!

17
A. El Mossadeq Structures Statistiques et Estimation

puisque:
Z +1
f (x) dx = 1
1
De plus:
Z +1
E [X] = xf (x) dx
1
Z +1
1 x
= k
xk exp dx
0 (k 1)!
= k

et:
Z +1
2
E X = x2 f (x) dx
1
Z +1
1 x
= k
xk+1 exp dx
0 (k 1)!
= k (k + 1) 2

d’où:

V [X] = E X2 E [X]2
2
= k

2. Considérons un r-échantillon de cette structure.


Sa fonction de vraisemblance est dé…nie pour tout , > 0, et tout (x1 ; :::; xr ) Rr ;
tous strictement positifs, par:
r
Y
L ( ; x1 ; :::; xr ) = f (xi )
i=1
P
r
xi
1 k 1 i=1
= (x1 :::xr ) exp
[(k 1)!]r rk

18
Structures Statistiques et Estimation A. El Mossadeq

d’où:
P
r
xi
k 1 i=1
ln L ( ; x1 ; :::; xr ) = r ln (k 1)! ln (x1 :::xr ) rk ln

Il en résulte que:
P
r
xi
@ rk i=1
ln L ( ; x1 ; :::; xr ) = + 2
@
d’où:
r
@ 1 X
ln L ( ; x1 ; :::; xr ) = 0 =) = xi
@ rk i=1
et comme:
@2
ln L ( ; x1 ; :::; xr ) < 0
@ 2
donc l’estimateur du maximum de vraisemblance d’un r-échantillon de cette
structure est:
X r
^= 1
Xi
rk i=1
3. Pour tout , > 0, et tout (x1 ; :::; xr ) 2 Rr ; tous strictement positifs, on a:

P
r
xi
1 i=1
L ( ; x1 ; :::; xr ) = (x1 :::xr )k 1
exp
[(k 1)!]r rk

1 rk ^ (x1 ; :::; xr )
= (x1 :::xr )k 1
exp
[(k 1)!]r rk

D’après le théorème de factorisation, ^ est un résumé exhaustif puisque:

L ( ; x1 ; :::; xr ) = g ; ^ (x1 ; :::; xr ) h (x1 ; :::; xr )

19
A. El Mossadeq Structures Statistiques et Estimation

où:
1 rk ^ (x1 ; :::; xr )
g ; ^ (x1 ; :::; xr ) = rk
exp
et:
1
h (x1 ; :::; xr ) = r (x1 :::xr )k 1
[(k 1)!]
4. Puisque:
X r
^= 1 Xi
rk i=1
alors:
h i 1
E ^ = E [X]
k
=

et:
h i V [X]
V ^ =
rk 2
2
=
rk
On en déduit que ^ est un estimateur sans biais et convergent de .
5. Calculons la quantité d’information de F isher, I [X; ], concernant .
On a:
@2
I [X; ] = E ln f ( ; X)
@ 2
@2 X
= E ln (k 1)! + (k 1) ln X k ln
@ 2
k 2X
= E 2 + 3

k
= 2

20
Structures Statistiques et Estimation A. El Mossadeq

Donc la quantité d’information de F isher, I [X1 ; :::; Xr ; ], concernant


fournie par le r-échantillon est:
rk
I [X1 ; :::; Xr ; ] = rI [X; ] = 2
h i
Calculons l’e¢ cacité e ^ de ^.
On a:
h i 1
e ^ = h i =1
I [X1 ; :::; Xr ; ] V ^

donc, ^ est e¢ cace.

Exercice 4
Soit X une variable aléatoire dont la densité de probabilité f est dé…nie par:
8
< 0 si x 2
> = [0; ]
f (x) =
>
: 1 si x 2 [0; ]

où est un paramètre réel.

1. Déterminer la fonction de répartition de X:


2. Calculer la quantité d’information de F isher:
3. Déterminer l’estimateur du maximum de vraisemlance ^ de d’un r-échantillon
de variable parente X .
4. Calculer l’espérance mathématique et la variance de ^:
Que peut-on conclure?
5. Dans le cas où ^ est biasé, proposer un estimateur sans biais de .

21
A. El Mossadeq Structures Statistiques et Estimation

Solution 4
1. La fonction de répartition F de X est dé…nie pour tout x 2 R par:
Z x
F (x) = f (t) dt
1
d’où:
8
>
> 0 si x 0
>
>
>
< x
F (x) = si 0 x
>
>
>
>
>
:
1 si x
de plus:
8
>
> E [X] =
>
< 2
>
> 2
>
: V [X] =
12
2. Puisque le domaine D :

D = fx 2 R jf (x) > 0g
= [0; ]

dépend de , donc la quantité d’information de F isher n’existe pas.

3. Considérons un r-échantillon de cette structure.


Sa fonction de vraisemblance est dé…nie pour tout , > 0, et tout (x1 ; :::; xr ) 2
[0; ]r :
r
Y 1
L ( ; x1 ; :::; xr ) = f (xi ) = r
i=1
La fonction:
! L ( ; x1 ; :::; xr )

22
Structures Statistiques et Estimation A. El Mossadeq

est strictement décroissante, donc elle atteint son maximum lorsque est
minimum.
Et comme:
8i 2 f1; :::; rg : xi
Il en résulte que est minimum lorsque:

= max (x1 ; :::; xr )

Donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’une


structure uniforme est:
^ = max (X1 ; :::; Xr )

4. Pour déterminer la densité de probabilité de ^, commençons d’abord par cal-


culer sa fonction de répartition.

(a) Fonction de répartition de ^:


Pour tout u 2 R on a:
h i
F^ (u) = P ^ <u
= P [max (X1 ; :::; Xr ) < u]
= P [X1 < u; :::; Xr < u]
Yr
= P [Xk < u]
k=1
= [F (u)]r
8
>
> 0 si u 0
>
>
>
< u r
= si 0 u
>
>
>
>
>
:
1 si u

23
A. El Mossadeq Structures Statistiques et Estimation

(b) Densité de probabilité de ^:


Pour tout u 2 R f0; g on a:

d
f^ (u) = F^ (u)
du
8
>
> 0 si u2
= ]0; [
<
=
>
> ur 1
: r r si u 2 ]0; [

(c) Espérance mathématique de ^:


h i Z
E ^ = uf^ (u) du
R
Z
ur
= r r du
0
r
=
r+1
2
(d) Espérance mathématique de ^ :
h 2i Z
E ^ = u2 f^ (u) du
ZR
ur+1
= r r du
0
r 2
=
r+2
(e) Variance de ^:
h i h 2i h i2
V ^ = E ^ E ^
r 2
= 2
(r + 1) (r + 2)
L’estimateur ^ de est biaisé, mais il est asymptotiquement sans biais.

24
Structures Statistiques et Estimation A. El Mossadeq

5. Considérons l’estimateur:
r + 1^
T =
r
Alors:
r + 1 h^i
E [T ] = E
r
=

et:
r+1
2 h i
V [T ] = V ^
r
1 2
=
r (r + 2)
T est donc un estimateur sans biais et convergent de .

Exercice 5
Soit X une variable aléatoire dont la densité de probabilité f est dé…nie par:
8
< 0 si x <
f (x) =
:
exp ( x) si x
où est un paramètre réel.

1. Déterminer la fonction de répartition de X:


2. Calculer la quantité d’information de F isher:
3. Déterminer l’estimateur du maximum de vraisemlance ^ de d’un r-échantillon
de variable parente X .
4. Calculer l’espérance mathématique et la variance de ^:
Que peut-on conclure?
5. Dans le cas où ^ est biasé, proposer un estimateur sans biais de .

25
A. El Mossadeq Structures Statistiques et Estimation

Solution 5
1. La fonction de répartition F de X est dé…nie pour tout x 2 R par:
Z x
F (x) = f (t) dt
1
d’où:
8
< 0 si x
F (x) =
:
1 exp ( x) si x
de plus:
8
< E [X] = + 1
:
V [X] = 1
2. Puisque le domaine D :

D = fx 2 R jf (x) > 0g
= [ ; +1[

dépend de , donc la quantité d’information de F isher n’existe pas.


3. Considérons un r-échantillon de cette structure.
Sa fonction de vraisemblance est dé…nie pour tout 2 R, et tout (x1 ; :::; xr ) 2
([ ; +1[)r :
r
Y
L ( ; x1 ; :::; xr ) = f (xi )
i=1
r
X
= exp ( xi )
i=1

La fonction:
! L ( ; x1 ; :::; xr )
est strictement croissante, donc elle atteint son maximum lorsque est maxi-
mum.

26
Structures Statistiques et Estimation A. El Mossadeq

Et comme:
8i 2 f1; :::; rg : xi
Il en résulte que est maximum lorsque:

= min (x1 ; :::; xr )

Donc l’estimateur du maximum de vraisemblance d’un r-échantillon de cette


structure est:

^ = min (X1 ; :::; Xr )

4. Pour déterminer la densité de probabilité de ^, commençons d’abord par cal-


culer sa fonction de répartition.

(a) Fonction de répartition de ^:


Pour tout v 2 R on a:
h i
F^ (v) = P ^<v
= P [min (X1 ; :::; Xr ) < v]
= 1 P [min (X1 ; :::; Xr ) v]
= 1 P [X1 v; :::; Xr v]
Yr
= 1 P [Xk v]
k=1
Yr
= 1 (1 P [Xk < v])
k=1
= 1 [1 F (v)]r
8
< 0 si v
=
:
1 exp r ( v) si v

27
A. El Mossadeq Structures Statistiques et Estimation

(b) Densité de probabilité de ^:

Pour tout v 2 R f g on a:
d
f^ (v) = F^ (v)
dv
8
< 0 si v<
=
:
r exp r ( v) si v>
(c) Espérance mathématique de ^:
h i Z
E ^ = vf^ (v) dv
R
Z +1
= rv exp r ( v) dv
1
= +
r
2
(d) Espérance mathématique de ^ :
h 2i Z
E ^ = v 2 f^ (v) dv
ZR+1
= rv 2 exp r ( v) dv
2
1 1
= + +
r r2
(e) Variance de ^:
h i h 2i h i2 1
V ^ =E ^ E ^ = 2
r
L’estimateur ^ de est biaisé, mais il est asymptotiquement sans biais.

5. Considérons l’estimateur:
1
T =^
r

28
Structures Statistiques et Estimation A. El Mossadeq

Alors:
h i 1
E [T ] = E ^ =
r
et:
h i 1
V [T ] = V ^ = 2
r
T est donc un estimateur sans biais et convergent de .

Exercice 6
Les éléments d’une population possédent un caractère X qui suit une loi de
P oisson de paramètre inconnu :
Une suite de r expériences a fourni les valeurs k1 ; :::; kr :

1. Déterminer l’estimateur du maximum de vraisemlance ^ de et étudier les


propriétés de cet estimateur.
2. ^ est-il un résumé exhaustif?
3. On désire estimer la quantité:

= P [X = 0]

Déterminer l’estimateur du maximum de vraisemlance ^ de .


Que remarquez-vous?

Solution 6
1. Soit X une variable aléatoire de Poisson de paramètre .
pour tout x 2 N, la probabilité élémentaire p (x) de x est:
x
p (x) = exp
x!
de plus:
8
< E [X] =
:
V [X] =

29
A. El Mossadeq Structures Statistiques et Estimation

(a) Recherche du maximum de vraisemlance:


Considérons un r-échantillon de cette structure.
Sa fonction de vraisemblance est dé…nie pour tout , > 0, et tout
(k1 ; :::; kr ) 2 Nr par:
r
Y
L ( ; k1 ; :::; kr ) = p (ki )
i=1
P
r
ki
i=1
= exp r
k1 !:::kr !
d’où:
r
X
ln L ( ; k1 ; :::; kr ) = ln (k1 !:::kr !) + ki ln r
i=1

Il en résulte que:
P
r
ki
@ i=1
ln L ( ; k1 ; :::; kr ) = r
@
d’où:
r
@ 1X
ln L ( ; k1 ; :::; kr ) = 0 =) p = xi
@ r i=1
et comme:
@2
ln L ( ; k1 ; :::; kr ) < 0
@ 2
donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’une
structure de Poisson est:
r
1X
^= Xi
r i=1
C’est la moyenne empirique du r-échantillon.

30
Structures Statistiques et Estimation A. El Mossadeq

(b) Etude des propriétés de ^ :


Puisque:
E [^ ] = E [X] =
et:
V [X]
V [^ ] = =
r r
On en déduit que ^ est un estimateur sans biais et convergent de .

2. Pour tout , > 0, et tout (k1 ; :::; kr ) 2 Nr on a:


r^ (k1 ;:::;kr )
L ( ; x1 ; :::; xr ) = exp r
x1 !:::xr !
D’après le théorème de factorisation, ^ est un résumé exhaustif puisque:

L ( ; x1 ; :::; xr ) = g ( ; ^ (x1 ; :::; xr )) h (x1 ; :::; xr )

où:
r^ (k1 ;:::;kr )
g ( ; ^ (x1 ; :::; xr )) = exp r
et:
1
h (x1 ; :::; xr ) =
x1 !:::xr !
3. On a:
= P [X = 0] = exp
Pour tout , > 0, et tout (k1 ; :::; kr ) 2 Nr par:
r
Y
L ( ; k1 ; :::; kr ) = p (ki )
i=1
P
r
ki
( ln )i=1 r
=
k1 !:::kr !

31
A. El Mossadeq Structures Statistiques et Estimation

d’où:
r
X
ln L ( ; k1 ; :::; kr ) = ln (k1 !:::kr !) + ki ln ( ln ) + r ln
i=1

Il en résulte que:
P
r
ki
@ i=1 r
ln L ( ; k1 ; :::; kr ) = +
@ ln
d’où:
r
!
@ 1X
ln L ( ; k1 ; :::; kr ) = 0 =) = exp ki
@ r i=1
et comme:
@2
ln L ( ; k1 ; :::; kr ) < 0
@ 2
donc l’estimateur du maximum de vraisemblance d’un r-échantillon de cette
structure est:
r
!
1 X
^ = exp Xi
r i=1
= exp ^

Exercice 7
Soit un réel appartenant à ]1; +1[ et X une variable aléatoire telle que:
k 1
1 1
P [X = k] = 1 ; k2N

1. Calculer l’espérance mathématique et la variance de X .


2. Déterminer l’estimateur du maximum de vraisemlance ^ de d’un r-échantillon
de variable parente X et étudier ses propriétés.
3. ^ est-il un résumé exhaustif?

32
Structures Statistiques et Estimation A. El Mossadeq

Solution 7
1. On a:
1
X
E [X] = kP [X = k]
k=1
1
X k 1
k 1
= 1
k=1

et:
1
X
E [X (X 1)] = k (k 1) P [X = k]
k=1
1
X k 1
k (k 1) 1
= 1
k=1

2 1
= 2 1

d’où:

E X2 = E [X (X 1)] + E [X]
= (2 1)

et:

V [X] = E X2 E [X]2
= ( 1)

2. Considérons un r-échantillon de cette structure.


Sa fonction de vraisemblance est dé…nie pour tout 2 ]1; +1[ et tout
(x1 ; :::; xr ) 2 (N )r par:

33
A. El Mossadeq Structures Statistiques et Estimation

r
Y
L ( ; x1 ; :::; xr ) = p (xi )
i=1
P
r
xi r
1 1 i=1
= r
1

d’où:
r
!
X 1
ln L ( ; x1 ; :::; xr ) = r ln + xi r ln 1
i=1

Il en résulte que:
P
r
xi r
@ r i=1
ln L ( ; x1 ; :::; xr ) = +
@ ( 1)
P
r
xi r
i=1
=
( 1)
d’où:
r
@ 1X
ln L ( ; x1 ; :::; xr ) = 0 =) = xi
@ r i=1
et comme:
@2
ln L (p; x1 ; :::; xr ) < 0
@ 2
donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’une
structure géométrique est:
r
1X
^= Xi
r i=1
C’est la moyenne empirique du r-échantillon.

34
Structures Statistiques et Estimation A. El Mossadeq

Puisque:
r
1X
^= Xi
r i=1
alors:

E [^ ] = E [X]
=

et:
V [X]
V [^ ] =
r
( 1)
=
r
On en déduit que ^ est un estimateur sans biais et convergent du paramètre
d’une structure géométrique.
3. Démontrons que ^ est une statistique exhaustive.
Puisque:
r
Y
L ( ; x1 ; :::; xr ) = p (xi )
i=1
P
r
xi r
1 1 i=1
= r
1
r(^ (x1 ;:::;xr ) 1)
1 1
= r
1

pour tout 2 ]1; +1[ et tout (x1 ; :::; xr ) 2 (N )r , alors en posant:


r(^ (x1 ;:::;xr ) 1)
1 1
g ( ; ^ (x1 ; :::; xr )) = r
1

et:
h (x1 ; :::; xr ) = 1

35
A. El Mossadeq Structures Statistiques et Estimation

on obtient:

L ( ; x1 ; :::; xr ) = g ( ; ^ (x1 ; :::; xr )) h (x1 ; :::; xr )

donc ^ est un résumé exhaustif.

Exercice 8
Soit X une variable aléatoire qui suit une loi de Pareto dont la densité de prob-
abilité f est dé…nie par:
8 a
>
< si x a
x +1
f (x) =
>
:
0 si x < a
où X représente le revenu par habitant, a le revenu minimum et , > 2, un
coe¢ cient dépendant du type du pays où l’on se place.

1. Véri…er que f est bien une densité de probabilité.


2. Calculer l’espérance mathématique et la variance de X .
3. Calculer la fonction de répartition de X:
4. Déterminer l’estimateur du maximum de vraisemlance a
^ de a d’un r-échantillon
issu X .
5. Dans le cas où a
^ est biasé, proposer un estimateur sans biais de a:

Solution 8
1. La densité de probabilité de la loi de Pareto est dé…nie par:
8 a
>
< si x a
x +1
f (x) =
>
:
0 si x < a
f est bien une densité de probabilité.

36
Structures Statistiques et Estimation A. El Mossadeq

En e¤et:
Z Z +1
a
f (x) dx = +1
dx
R a x
= 1

2. On a:
Z
E [X] = xf (x) dx
ZR+1
a
= dx
a x
= a
1
et:
Z
2
E X = x2 f (x) dx
ZR+1
a
= 1
dx
a x
= a2
2
d’où:

V [X] = E X2 E [X]2
2
= 2a
( 2) ( 1)

37
A. El Mossadeq Structures Statistiques et Estimation

3. La fonction de répartition F de X est dé…nie pour tout x 2 R par:


Z x
F (x) = f (t) dt
8 1
>
> 0 si x a
<
= Z x
>
> a
: +1
dt si x a
a t
8
< 0
> si x a
=
>
: 1 a si x a
x
4. Considérons un r-échantillon de cette structure.
Sa fonction de vraisemblance est dé…nie pour tout a 2 R et tout (x1 ; :::; xr ) 2
(]a; +1[)r , par:
r
Y r r
a
L (a; x1 ; :::; xr ) = f (xi ) = +1
i=1
(x1 :::xr )
La fonction:
a ! L (a; x1 ; :::; xr )
est strictement croissante, donc elle atteint son maximum lorsque a est maxi-
mum.
Et comme:
8i 2 f1; :::; rg : a xi
Il en résulte que est maximum lorsque:

a = min (x1 ; :::; xr )

Donc l’estimateur du maximum de vraisemblance d’un r-échantillon de cette


structure est:
a
^ = min (X1 ; :::; Xr )

38
Structures Statistiques et Estimation A. El Mossadeq

5. Pour déterminer la densité de probabilité de ^, commençons d’abord par cal-


culer sa fonction de répartition.

(a) Fonction de répartition de a


^:
Pour tout x 2 R on a:

Fa^ (x) = P [^
a < x]
= P [min (X1 ; :::; Xr ) < x]
= 1 P [min (X1 ; :::; Xr ) x]
= 1 P [X1 v; :::; Xr x]
Yr
= 1 P [Xk x]
k=1
Yr
= 1 (1 P [Xk < x])
k=1
= 1 [1 F (x)]r

Ainsi:
8
< 0 si x a
r
Fa^ (x) = a
: 1 si x a
x
(b) Densité de probabilité de ^:
Pour tout x 2 R fag on a:
d
fa^ (x) = Fa^ (x)
dv
8
< 0
> si x<a
= r
>
: r a si x>a
xr +1

39
A. El Mossadeq Structures Statistiques et Estimation

(c) Espérance mathématique de a^:


Z
E [^
a] = vfa^ (v) dv
R
Z +1
r ar
= r
dv
a v
r
= a
r 1
^2 :
(d) Espérance mathématique de a
Z
2
E a
^ = v 2 fa^ (v) dv
ZR+1
r ar
= dv
a vr 1
r
= a2
r 2
(e) Variance de a
^:

V [^
a] = ^2
E a a]2
E [^
r 2
= 2a
(r 2) (r 1)
L’estimateur a
^ de a est biaisé, mais il est asymptotiquement sans biais.
(f) Considérons l’estimateur:
r 1
T = a
^
r
Alors:
E [T ] = a
et:
2
r 1 1
V [T ] = V [^
a] = a2
r r (r 2)
T est donc un estimateur sans biais et convergent de a.

40
Structures Statistiques et Estimation A. El Mossadeq

Exercice 9
Soit X une variable aléatoire dont la densité de probabilité f est dé…nie par:
8
>
> 0 si x
<
f (x) =
>
> 1 ( x)
: exp si x >

où est un paramètre réel et un paramètre réel strictement positif.

1. Véri…er que f est bien une densité de probabilité.


2. Calculer l’espérance mathématique et la variance de X .
3. Calculer la fonction de répartition de X:
4. On suppose connu et inconnu.

(a) Déterminer l’estimateur du maximum de vraisemlance ^ de d’un r-


échantillon issu X .
(b) Etudier les propriétés de ^ :
(c) Dans le cas où ^ est biasé, proposer un estimateur sans biais de :

5. On suppose connu et inconnu.

(a) Déterminer l’estimateur du maximum de vraisemlance ^ de d’un r-


échantillon issu de X .
(b) Etudier les propriétés de ^
(c) Dans le cas où ^ est biasé, proposer un estimateur sans biais de :

6. On suppose que et sont tous les deux inconnus.

(a) Déterminer l’estimateur du maximum de vraisemlance ^; ^ de ( ; )


d’un r-échantillon issu de X .
(b) Etudier les propriétés de ^; ^
(c) Proposer un estimateur sans biais de ( ; ) :

41
A. El Mossadeq Structures Statistiques et Estimation

Solution 9
1. f est bien une densité de probabilité.
En e¤et:
Z Z +1
1 ( x)
f (x) dx = exp dx
R
Z +1
= exp tdt
0
= 1

2. On a:
Z
E [X] = xf (x) dx
ZR+1
x ( x)
= exp dx
Z +1
= ( t + ) exp tdt
0
= +

et:
Z
2
E X = x2 f (x) dx
ZR+1
x2 ( x)
= exp dx
Z +1
= ( t + )2 exp tdt
0
2 2
= 2 +2 +
= ( + )2 + 2

d’où:

V [X] = E X2 E [X]2
2
=

42
Structures Statistiques et Estimation A. El Mossadeq

3. La fonction de répartition F de X est dé…nie pour tout x 2 R par:


Z x
F (x) = f (t) dt
8 1
>
> 0 si x
<
= Z x
>
> 1 ( t)
: exp dt si x
8
>
> 0 si x
<
=
>
> ( x)
: 1 exp si x

4. On suppose connu et inconnu.

(a) Considérons un r-échantillon de cette structure.


Sa fonction de vraisemblance est dé…nie pour tout , > 0, 2 R et
tout (x1 ; :::; xr ) 2 (] ; +1[)r par:
r
Y
L ( ; x1 ; :::; xr ) = f (xi )
i=1
r
X
1 ( xi )
= r
exp
i=1

d’où:
r
1X
ln L ( ; x1 ; :::; xr ) = r ln + ( xi )
i=1
Il en résulte que:
r
@ r 1 X
ln L ( ; x1 ; :::; xr ) = 2
( xi )
@ i=1
" r
#
1 1X
= r ( xi )
i=1

43
A. El Mossadeq Structures Statistiques et Estimation

d’où:
r
@ 1X
ln L ( ; x1 ; :::; xr ) = 0 =) = (xi )
@ r i=1
" r
#
1X
=) = xi
r i=1
et comme:
@2
ln L ( ; x1 ; :::; xr ) < 0
@ 2
donc l’estimateur du maximum de vraisemblance d’un r-échantillon de
cette structure est:
" r #
1X
^= Xi
r i=1
(b) On a:
" r
! #
1X
E [^ ] = E Xi =
r i=1
et:
" r
! #
1X
V [^ ] = V Xi
r i=1
V [X]
=
r
2
=
r
5. On suppose connu et inconnu.

(a) Considérons un r-échantillon de cette structure.


Sa fonction de vraisemblance est dé…nie pour tout , > 0, 2 R et
r
tout (x1 ; :::; xr ) 2 (] ; +1[) , tous strictement positifs, par:

44
Structures Statistiques et Estimation A. El Mossadeq

r
Y
L ( ; x1 ; :::; xr ) = f (xi )
i=1
r
X
1 ( xi )
= r
exp
i=1

La fonction:
! L ( ; x1 ; :::; xr )
est strictement croissante, donc elle atteint son maximum lorsque est
maximum.Et comme:

8i 2 f1; :::; rg : xi

Il en résulte que est maximum lorsque:

= min (x1 ; :::; xr )

Donc l’estimateur du maximum de vraisemblance d’un r-échantillon de


cette structure est:
^ = min (X1 ; :::; Xr )

(b) Pour déterminer la densité de probabilité de ^, commençons d’abord par


calculer sa fonction de répartition.

(i) Fonction de répartition de ^:


Pour tout v 2 R on a:
h i
F^ (v) = P ^ <v
= P [min (X1 ; :::; Xr ) < v]
= 1 P [min (X1 ; :::; Xr ) v]
= 1 P [X1 v; :::; Xr v]

45
A. El Mossadeq Structures Statistiques et Estimation

r
Y
F^ (v) = 1 P [Xk v]
k=1
Yr
= 1 (1 P [Xk < v])
k=1
= 1 [1 F (v)]r
8
>
> 0 si v
<
=
>
> v
: 1 exp r si v

(ii) Densité de probabilité de ^:


Pour tout v 2 R f g on a:
d
f^ (v) = F^ (v)
dv
8
>
> 0 si v<
<
=
>
> r v
: exp r si v>

(iii) Espérance mathématique de ^:


h i Z
E ^ = vf^ (v) dv
R
Z +1
r v
= v exp r dv

Z +1
= t+ exp tdt
0 r

= +
r

46
Structures Statistiques et Estimation A. El Mossadeq

2
(iv) Espérance mathématique de ^ :
h 2i Z
E ^ = v 2 f^ (v) dv
R
Z +1
r
= v 2 exp r ( v) dv

2 2
= + +
r r
(v) Variance de ^:
h i h 2i h i2
V ^ = E ^ E ^
2
=
r
L’estimateur ^ de est biaisé, mais il est asymptotiquement sans biais.

(c) Considérons l’estimateur:

T =^
r
Alors:
h i
E [T ] = E ^
r
=

et:
h i
V [T ] = V ^

=
r2
T est donc un estimateur sans biais et convergent de .

6. On suppose que et sont tous les deux inconnus.

(a) Considérons un r-échantillon de cette structure.


Sa fonction de vraisemblance est dé…nie pour tout , > 0, 2 R et

47
A. El Mossadeq Structures Statistiques et Estimation

tout (x1 ; :::; xr ) 2 (] ; +1[)r , tous strictement positifs, par:


r
Y
L ( ; ; x1 ; :::; xr ) = f (xi )
i=1
r
X
1 ( xi )
= r
exp
i=1

Compte tenu des questions précedentes, la fonction:

( ; ) 7 ! L ( ; ; x1 ; :::; xr )

atteint son maximum pour:

8
>
> = min (x1 ; :::; xr )
>
<
" r
#
>
> 1X
>
: = xi
r i=1

d’où, les estimateurs du maximum de vraisemblance ^ ; ^ de ( ; ) sont


donnés par:

8
> ^ = min (X1 ; :::; Xr )
>
>
<
" r #
> 1 X
>
> ^
: ^= r Xi
i=1
(b) On a:
h i
E ^ = +
r
et:
h i r 1
E [^ ] = E [X] E ^ =
r
Donc les estimateurs ^ et ^ sont biaisés.

48
Structures Statistiques et Estimation A. El Mossadeq

(c) Considérons les estimateurs T et S de et respectivement dé…nis par:


8
> r
>
> T = ^
< r 1
>
> 1
>
: S=^ ^
r 1
alors:
8
< E [T ] =
:
E [S] =
Donc T et S sont des estimateurs sans biais de et respectivement.

Exercice 10
A la veille d’une consultation électorale, on a intérrogé cent électeurs constituant
un échantillon au hasard. Soixante ont déclaré avoir l’intention de voter pour le
candidat C .
En quelles limites, au moment du sondage, la proportion du corps électoral fa-
vorable à C se situe-t-elle?

Solution 10
Construisons l’intervalle de con…ance correspondant à la fréquence f = 0:6 du
corps électoral favorable à C observée sur un échantillon de taille n = 100.
Au seuil , cet intervalle est dé…ni par:
" r r #
f (1 f ) f (1 f )
f t1 =2 ; f + t1 =2
n n
Pour = 5%, on a:
t:975 = 1:96
on obtient alors l’intervalle:
[:504; :696]
A 95%, le candidat C serait élu.

49
A. El Mossadeq Structures Statistiques et Estimation

Exercice 11
On sait que le taux de mortalité d’une certaine maladie est de 30%.
Sur 200 malades testés, combien peut-on envisager de décès?

Solution 11
Construisons d’obord l’intervalle de pari, pour un échantillon de taille n = 200,
correspondant à la probabilité de décès p = 0:3.
Au seuil , cet intervalle est dé…ni par:
" r r #
p (1 p) p (1 p)
p t1 =2 ; p + t1 =2
n n
Pour = 5%, on a:
t:975 = 1:96
on obtient alors l’intervalle:
[0:24; 0:36]
Il en résulte que sur les 200 malades, le nombre de décès à envisager serait
compris, à 95%, entre 48 et 72 décès.

Exercice 12
Dans une pré-enquête, on selectionne, par tirage au sort cent dossiers.
Quinze d’entre eux sont incomplets.
Combien de dossiers incomplets trouvera-t-on sur dix milles dossiers?

Solution 12
Construisons l’intervalle de con…ance correspondant à la fréquence f = 0:15 de
dossiers incomplets observée sur un échantillon de taille n = 100.
Au seuil , cet intervalle est dé…ni par:
" r r #
f (1 f ) f (1 f )
f t1 =2 ; f + t1 =2
n n

50
Structures Statistiques et Estimation A. El Mossadeq

Pour = 5%, on a:
t:975 = 1:96
on obtient alors l’intervalle:
[0:08; 0:22]
Il en résulte que sur les 10000 dossiers, le nombre de dossiers incomplets serait
compris, à 95%, entre 800 et 2200 dossiers.

Exercice 13
Dans une maternité, on fait le point de la proportion de …lles toutes les cent
naissances.
Comment peut varier cette proportion d’une fois à l’autre si l’on admet qu’il nait
en moyenne 51% de …lles?

Solution 13
Construisons l’intervalle de pari, pour un échantillon de taille n = 100, corre-
spondant à la probabilité d’obtenir une …lle p = 0:51.
Au seuil , cet intervalle est dé…ni par:
" r r #
p (1 p) p (1 p)
p t1 =2 ; p + t1 =2
n n
Pour = 5%, on a:
t:975 = 1:96
on obtient alors l’intervalle:
[:41; :61]
Il en résulte, qu’à 95%, la proportion de …lles varie d’une fois à l’autre, entre
41% et 61%.

51
A. El Mossadeq Structures Statistiques et Estimation

Exercice 14
Sur un échantillon de 600 sujets atteints du cancer des poumons, on a trouvé
550 fumeurs.
Que peut-on dire du pourcentage de fumeurs parmi les cancéreux?

Solution 14
11
Construisons l’intervalle de con…ance correspondant à la fréquence f = des
12
cancéreux parmi les fumeurs observée sur un échantillon de taille n = 600.
Au seuil , cet intervalle est dé…ni par:
" r r #
f (1 f ) f (1 f )
f t1 =2 ; f + t1 =2
n n
Pour = 5%, on a:
t:975 = 1:96
on obtient alors l’intervalle:
[0:9; 0:94]
Il en résulte que parmi, les fumeurs, la proportion des atteints par le cancer des
poumons est comprise, à 95%, entre 90% et 94%.

Exercice 15
Une série de cent mesures a donné comme résultat:
8 100
> X
>
> xi = 5200
>
>
>
< i=1
>
> " #2
>
>
100
X 1 P100
>
> xi xj = 396
: 100 j=1
i=1

52
Structures Statistiques et Estimation A. El Mossadeq

1. Estimer la moyenne et la variance.


2. Quel est, à 95%, l’intervalle de con…ance de la moyenne?
3. En supposant la variable mesurée gaussienne, déterminer, à 95%, l’intervalle
de con…ance de la variance.

Solution 15
1. Soit m l’estimation de la moyenne et s2 celle de la variance.
On a:
100
1 X
m = xi
100 i=1
= 52

et:
100
1 X
s 2
= (xi m)2
99 i=1
= 4

2. Au seuil , l’intervalle de con…ace de la moyenne est dé…ni par:

m t1 =2 p ; m + t1 =2 p
n n
Pour = 5%, on a:
t:975 = 1:96
d’où l’intervalle de con…ance à 95%:

[51:608; 52:392]

3. Au seuil , l’intervalle de con…ace de la variance est dé…ni par:


" #
(n 1) 2 (n 1) 2
2 s; 2 s
n 1;1 =2 n 1; =2

53
A. El Mossadeq Structures Statistiques et Estimation

Pour = 5%:

8 2 2
< 99;:025 ' 100;:025 = 74:2
: 2 2
99;:975 ' 100;:975 = 129:6

d’où l’intervalle de con…ace de la variance à 95%:

[3:06; 5:34]

Exercice 16
La force de rupture d’un certain type de cable peut être assimilée à une variable
aléatoire normale.
Des essais portant sur dix cables ont donné une variance empirique s2 de 1560 N2 .
Construire un intervalle de con…ance, à 95%, de l’écart-type de cette force de
rupture.

Solution 16
Au seuil , l’intervalle de con…ace de l’écart-type est dé…ni par:
"s s #
(n 1) (n 1)
2 s; 2 s
n 1;1 =2 n 1; =2

Pour = 5%:
8 2
< 9;:025 = 2:7
: 2
9;:975 = 19
d’où l’intervalle de con…ace de l’écart-type à 95%:

[27:18 N; 72:11 N]

54
Structures Statistiques et Estimation A. El Mossadeq

Exercice 17
Une enquête statistique e¤ectuée sur cent sujets permet de dé…nir, à 95%,
l’intervalle de con…ance de la moyenne:
[49:6 50:4]
Dans quelles conditions aurait-il été possible que le résultat fût à 95%:
[49:8 50:2]

Solution 17
Il s’agit de déterminer la taille n0 de l’échantillon à prélever pour que l’intervalle
de con…ance de la moyenne à 95% soit:
[49:8; 50:2]
sachant que pour un échantillon de taille n = 100, cet intervalle est:
[49:6; 50:4]
Puisque:

m t1 =2 p ; m + t1 =2 p = [49:6; 50:4]
n n
on en déduit:
49:6 + 50:4
m= = 50
2
et:
p
n (50:4 49:6)
= ' 2:04
2t1 =2
L’égalité:
50:2 = m + t1 =2 p 0
n
implique:
2
0 t1 =2
n = = 400
50:2 m

55
A. El Mossadeq Structures Statistiques et Estimation

Exercice 18
Pour déterminer le point de fusion moyen d’un certain alliage, on a procédé à
neuf observations qui ont données une moyenne m = 1040 C et un écart-type
s = 16 C.
Construire un intervalle de con…ance de la moyenne à 95%.

Solution 18
Ici on a:
n = 9
m = 1040 C
s = 16 C
Au seuil , l’intervalle de con…ace d’une telle moyenne est dé…ni par:

s s
m tn 1;1 =2 p ; m + tn 1;1 =2 p
n n
Pour = 5%, on a:
t8;:975 = 2:31
d’où l’intervalle de con…ance à 95%:

[1027:68 C; 1052:32 C]

Exercice 19
Si l’écart-type de la durée de vie d’un modèle de lampe électrique est estimé à
cent heures, quelle doit être la taille de l’échantillon à prélever pour que l’erreur
sur l’estimation de la durée de vie moyenne n’exède pas vingt heures et ce avec
une probabilité de 95% puis 99%?

56
Structures Statistiques et Estimation A. El Mossadeq

Solution 19
L’erreur sur l’estimation de la moyenne est donnée par:
s
t1 =2 p
n
(i) Pour = 5%; on a:
t1 =2 = 1:96
d’où:
s
t1 =2 p 20 =) n 97
n
(ii) Pour = 1%; on a:
t1 =2 = 2:57
d’où:
s
t1 =2 p 20 =) n 166
n

Exercice 20
Une machine fabrique des rondelles dont le diamètre D est une variable guassi-
enne.
On prélève au hasard un échantillon de huit rondelles.
Leurs diamètres ont pour mesure en mm:
20:1 19:9 19:7 20:2 20:1 23:1 22:6 19:8
Construire à 95% puis 99% les intervalles de con…ance de la moyenne et de la
variance.

Solution 20
Calculons d’abord les estimations m et s2 de la moyenne et de la variance sur
cet échantillon de taille n = 8.

57
A. El Mossadeq Structures Statistiques et Estimation

On a:
n
1X
m = xi
n i=1
= 20:6875 mm
et
n
X
1
s 2
= (xi m)2
n 1 i=1
= 1:827 mm2

1. L’intervalle de con…ance de la moyenne à 1 est:


s s
m tn 1;1 =2 p ; m + tn 1;1 =2 p
n n

(a) Pour = 5%, on a:


t7;:975 = 2:36
d’où l’intervalle:
[19:163; 22:212]

(b) Pour = 1%, on a:


t7;:995 = 3:5
d’où l’intervalle:
[18:427; 22:948]

2. L’intervalle de con…ance de la variance à 1 est:


" #
2 2
(n 1) s (n 1) s
2 ; 2
n 1;1 =2 n 1; =2

58
Structures Statistiques et Estimation A. El Mossadeq

(a) Pour = 5%, on a:


8 2
< 7;:025 = 1:69
: 2
7;:975 = 16
d’où l’intervalle:
[:79931; 7:5675]
(b) Pour = 1%, on a:
8 2
< 7;:005 = :989
: 2
7;:995 = 20:3
d’où l’intervalle:
[0:63; 12:931]

Exercice 21
Soient X et Y deux variables aléatoires indépendantes, la première prenant les
valeurs 1 et 0 avec les probabilités respectives et 1 , et la deuxième prenant
les valeurs 1 et 0 avec les probabilités respectives P et 1 P . On suppose
inconnue et P connue, P > 0:5.
On dé…nit la variable aléatoire Z par:
8
< Z = 1 si X = Y
:
Z=0 si X 6= Y
On considère un n-échantillon ((X1 ; Y1 ) ; :::; (Xn ; Yn )) de (X; Y ) et on dé…nit
Zi , 1 i n, à partir de Xi et Yi comme on a dé…ni Z à partir de X et Y .

1. Montrer que (Z1 ; :::; Zn ) est un n-échantillon de Z .


2. Etudier les propriétés de l’estimateur:
1
T = (Z1 + ::: + Zn )
n

59
A. El Mossadeq Structures Statistiques et Estimation

3. Proposer alors un estimateur sans biais S de .


4. Etudier la variance de S en fonction de .
5. Indiquer un intervalle de con…ance pour lorsque n est grand, en supposant
qu’on dispose d’une observation p0 de la variable:
1
T = (Z1 + ::: + Zn )
n
6. Voyez-vous une application de ce qui précède dans le domaine des sondages
d’opinion?

Solution 21
On a:
8
< P [X = 0] = 1
:
P [X = 1] =
et:
8
< P [Y = 0] = 1 P
:
P [Y = 1] = P
X et Y deux variables aléatoires de Bernouilli de paramètres et P respective-
ment.
Déterminons la loi de probabilité de Z :
P [Z = 0] = P [X 6= Y ]

= P [f(X; Y ) = (0; 1)g f(X; Y ) = (0; 1)g]

= P [X = 0] P [Y = 1] + P [X = 1] P [Y = 0]

= (1 ) P + (1 P)

60
Structures Statistiques et Estimation A. El Mossadeq

et:
P [Z = 1] = P [X = Y ]

= P [f(X; Y ) = (0; 0)g f(X; Y ) = (1; 1)g]

= P [X = 0] P [Y = 0] + P [X = 1] P [Y = 1]

= (1 ) (1 P) + P
Z est donc une variable aléatoire de Bernouilli de paramètre:
= (1 ) (1 P) + P
de plus:
E [Z] =
V [Z] = (1 )

1. Puisque (X1 ; Y1 ) ; :::; (Xn ; Yn ) sont indépentants et suivent la même loi que
(X; Y ), on en déduit que (Z1 ; :::; Zn ) sont indépendants et suivent la même
loi que Z , donc c’est un n-échantillon de Z .
2. Soit l’estimateur:
1
T = (Z1 + ::: + Zn )
n
On a:

E [T ] = E [Z]
= (1 ) (1 P) + P

et:
1
V [T ] = V [Z]
n
1
= [(1 ) (1 P ) + P ] [(1 ) P + (1 P )]
n

61
A. El Mossadeq Structures Statistiques et Estimation

3. T est donc un estimateur biaisé de sauf lorsque:


1
=
2
ou:
P =1

(a) Si:
1
= ou P = 1
2
alors il su¢ t de prendre:
S=T
(b) Si:
1
6= et P 6= 1
2
alors il su¢ t de prendre:
1
S= [T (1 P )]
2P 1
4. On a:
1
V [S] = V [T ]
(2P 1)2
1
= [(1 ) (1 P ) + P ] [(1 )P + (1 P )]
n (2P 1)2
Donc l’estimateur S est convergent.
D’autre part:
d 1 d
V [S] = 2 [(1 ) (1 P ) + P ] [(1 )P + (1 P )]
d n (2P 1) d
1
=
n

62
Structures Statistiques et Estimation A. El Mossadeq

La variance de S est strictement décroissante.


Pour que S soit de variance minimale, il faut maximiser :

5. Si p0 est une observation de T , alors:


1
f= [p0 (1 P )]
2P 1
est une observation S:
D’après le théorème central limit, T peut être approximer par une loi normale
N (E [T ] ; V [T ]):

T N (E [T ] ; V [T ])
V [T ] étant estimée par:
p0 (1 p0 )
V [T ] =
n
et puisque S est une trasformation a¢ ne de T :
1
S= [T (1 P )]
2P 1
donc S peut être approximer par une loi normale N (E [S] ; V [S]):

S N (E [S] ; V [S])

où:
E [S] =
et:
V [T ]
V [S] =
(2P 1)2
p0 (1 p0 )
=
n (2P 1)2

63
A. El Mossadeq Structures Statistiques et Estimation

Il en résulte qu’au seuil , l’intervalle de con…ance de est donné par:

f t1 =2 [S] ; f + t1 =2 [S]

où [S] représente l’écart type de S:

64
Les Tests d’Hypothèse A. El Mossadeq

Exercice 1
Une machine à former des pilules fonctionne de façon satisfaisante si la proportion
de pilules non réussies est de 1 pour 1000.
Sur un échantillon de 10000 pilules, on a trouvé 15 pilules défectueuses.
Que faut-il conclure?

Solution 1
Ici on:
8
>
> n = 104
>
>
<
4
f = 15 10
>
>
>
>
:
p = 10 3
Testons, au seuil , l’hypothèse nulle:
H0 : ”la machine est bien réglée”
Sous cette hypothèse, la quantité:
f p
t= r
p (1 p)
n
peut être considérée comme une réalisation d’une variable aléatoire normale cen-
trée réduite.
Pour = 5%, on a:
t:975 = 1:96
et comme:
f p
t = r
p (1 p)
n
= 1:58
on accepte donc l’hypothèse nulle H0 au seuil = 5%, c’est à dire, qu’au seuil
= 5%, la machine fonctionne de façon satisfaisante.

67
A. El Mossadeq Les Tests d’Hypothèse

Exercice 2
On a lancé cent fois une pièce de monnaie et l’on a obtenu soixante fois ”pile”
et quarante fois ”face”.
Tester au seuil de 5%, puis 1%, l’hypothèse de la loyauté de la pièce.

Solution 2
Ici on:
n = 100
f = 0:6
où f est la fréquence de ”pile”.
Testons, au seuil , l’hypothèse nulle:
H0 : ”la pièce est loyale”
Sous cette hypothèse, on a:
p = 0:5
et la quantité:
f p
t= r
p (1 p)
n
peut être considérée comme une réalisation d’une variable aléatoire normale cen-
trée réduite.
On a:
f p
t = r
p (1 p)
n
= 2

(i) Pour = 5%, on a:


t:975 = 1:96
on rejette donc l’hypothèse nulle H0 à 95%, c’est à dire, qu’à 95%, la pièce
est truquée.

68
Les Tests d’Hypothèse A. El Mossadeq

(ii) Pour = 1%, on a:


2:57 < t:995 < 2:58
on accepte donc l’hypothèse nulle H0 au seuil = 1%, c’est à dire, qu’au
seuil = 1%, la pièce est normale.

Exercice 3
Avant de procéder au lancement d’un produit, une entreprise a fait procéder à
une enquête portant sur deux régions géographiques A et B .
Sur 1800 réponses provenant de la région A, 630 se déclarent intéressées par le
produit.
En provenance de B , 150 réponses sur 600 se déclarent favorables.
Tester, au seuil de 5%, l’hypothèse de l’identité des opinions des régions A et B
quant au produit considéré.

Solution 3
Cet exercice peut être trairé soit par un test de comparaison de deux fréquences
soit par un test d’indépendance du Khi-deux.

1. Test de comparaison de deux fréquences:


Ici on: 8
>
> 7
>
< n A = 1800 et fA =
20
>
> 1
>
: nB = 600 et fB =
4
Testons, au seuil , l’hypothèse nulle:

H0 : ”les opinions des régions A et B sont identiques”

Sous cette hypothèse, la quantité:


fA fB
t= r
fA (1 fA ) fB (1 fB )
+
nA nB

69
A. El Mossadeq Les Tests d’Hypothèse

peut être considérée comme une réalisation d’une variable aléatoire normale
centrée réduite.
Pour = 5%, on a:
t:975 = 1:96
et comme:
fA fB
t = r
fA (1 fA ) fB (1 fB )
+
nA nB
= 4:77

on rejette donc l’hypothèse nulle H0 à 95% (et même à 99:98%), c’est à dire,
les deux régions A et B ont des opinions di¤érentes.
2. Test d’indépendance du Khi-deux:
La répartition observée est:

T ableau des ef f ectif s observes

Region Opinion f avorable non f avorable T otal

Region A 630 1170 1800

Region B 150 450 600

T otal 780 1620 2400

Testons, au seuil , l’hypothèse nulle:

H0 : ”les régions A et B ont la même opinion”

70
Les Tests d’Hypothèse A. El Mossadeq

Calculons, sous cette hypothèse, la répartition théorique:

T ableau des ef f ectif s theoriques

Region Opinion f avorable non f avorable T otal

Region A 585 1215 1800

Region B 195 405 600

T otal 780 1620 2400

Sous l’hypothèse nulle H0 , la quantité:


2 X
X 2
2 (oij tij )2
=
i=1 j=1
tij

est une réalisation d’une variable du Khi-deux à:

(2 1) (2 1) = 1

degré de liberté.
Pour = 5%, on a:
2
1;:95 = 3:84
comme:
2 X
X 2
2 (oij tij )2
=
i=1 j=1
tij
= 20:51

On rejette alors H0 à 95% (et même à 99:5%), c’est à dire, les deux régions
ont des opinions di¤érentes quant au produit considéré.

71
A. El Mossadeq Les Tests d’Hypothèse

Exercice 4
Dans un groupe de 200 malades atteints du cancer du col de l’utérus, un traite-
ment par application locale du radium a donné 50 guérisons.
Un autre groupe de 150 sujets atteints de la même maladie a été traité par
chirurgie, on a trouvé 54 guérisons.
Que peut-on conclure?

Solution 4
Cet exercice peut être trairé soit par un test de comparaison de deux fréquences
soit par un test d’indépendance du Khi-deux.

1. Test de comparaison de deux fréquences:


Ici on:
n1 = 200 ; f1 = 0:25
n2 = 150 ; f2 = 0:36
Testons, au seuil , l’hypothèse nulle:

H0 : ”les deux traitements sont équivalents”

Sous cette hypothèse, la quantité:


f1 f2
t= r
f1 (1 f1 ) f2 (1 f2 )
+
n1 n2
peut être considérée comme une réalisation d’une variable aléatoire normale
centrée réduite.
Pour = 5%, on a:
t:975 = 1:96
et comme:
f1 f2
t= r = 2:12
f1 (1 f1 ) f2 (1 f2 )
+
n1 n2

72
Les Tests d’Hypothèse A. El Mossadeq

on rejette donc l’hypothèse nulle H0 à 95%, c’est à dire, les deux méthodes
ne sont pas équivalentes.
2. Test d’indépendance du Khi-deux:
La répartition observée est:

T ableau des ef f ectif s observees

T raitement Resultat gueri non gueri T otal

radium 50 150 200

chirurgie 54 96 150

T otal 104 246 350

Testons, au seuil , l’hypothèse nulle:

H0 : ”les deux traitements sont équivalents”

Calculons, sous cette hypothèse, la répartition théorique:

T ableau des ef f ectif s theoriques

T raitement Resultat gueri non gueri T otal

radium 59:4 140:6 200

chirurgie 44:6 105:4 150

T otal 104 246 350

Sous l’hypothèse nulle H0 , la quantité:

73
A. El Mossadeq Les Tests d’Hypothèse

2 X
X 2
2 (oij tij )2
=
i=1 j=1
tij
est une réalisation d’une variable du Khi-deux à:

(2 1) (2 1) = 1

degré de liberté.
Pour = 5%, on a:
2
1;:95 = 3:84
Et comme:

2 X
X 2
2 (oij tij )2
=
i=1 j=1
tij
= 4:94

On rejette alors H0 à 95% , c’est à dire, les deux traitements ne sont pas
équivalents.

Exercice 5
Aux guichets d’une gare parisienne, sur les 350 billets vendus vendredi après-midi,
95 étaient des billets de 1ere classe. Sur les 250 billets vendus la matinée du lundi
suivant, 55 étaient de 1ere classe.
Peut-on considérer qu’il y a une di¤érence entre les proportions de vente de
parcours en 1ere classe pour les …ns et débuts de semaines?

Solution 5
Cet exercice peut être trairé soit par un test de comparaison de deux fréquences
soit par un test d’indépendance du Khi-deux.

74
Les Tests d’Hypothèse A. El Mossadeq

1. Test de comparaison de deux fréquences:


Ici on:
8
>
> 19
>
< n 1 = 350 ; f1 =
70
>
> 11
>
: n2 = 250 ; f2 =
50
Testons, au seuil , l’hypothèse nulle:

H0 : ”les taux de billets de 1ere classe vendus en …n


et début de semaines sont identiques”
Sous cette hypothèse, la quantité:
f1 f2
t= r
f1 (1 f1 ) f2 (1 f2 )
+
n1 n2
peut être considérée comme une réalisation d’une variable normale centrée
réduite.
Pour = 5%, on a:
t:975 = 1:96
et comme:
f1 f2
t= r = 1:45
f1 (1 f1 ) f2 (1 f2 )
+
n1 n2
on accepte donc l’hypothèse nulle H0 au seuil 5%, c’est à dire, les taux de
billets de parcours en 1ere classe vendus en …ns et débuts de semaines sont
identiques et qu’on peut estimer par:
n1 f1 + n2 f2
f =
n1 + n2
= 0:25

75
A. El Mossadeq Les Tests d’Hypothèse

2. Test d’indépendance du Khi-deux:


La répartition observée est:

T ableau des ef f ectif s observees

jour Classe 1ere classe 2ere classe T otal

V endredi A:M 95 255 350

Lundi matin 55 195 250

T otal 150 450 600

Testons, au seuil , l’hypothèse nulle:


H0 : ”les taux de billets de parcours en 1ere classe vendus en …n
et début de semaines sont identiques”
Calculons, sous cette hypothèse, la répartition théorique:

T ableau des ef f ectif s theoriques

Jour Classe 1ere classe 2ere classe T otal

V endredi A:M 87:5 262:5 350

Lundi matin 62:5 187:5 250

T otal 150 450 600

76
Les Tests d’Hypothèse A. El Mossadeq

Sous l’hypothèse nulle H0 , la quantité:

2 X
X 2
2 (oij tij )2
=
i=1 j=1
tij
est une réalisation d’une variable du Khi-deux à:

(2 1) (2 1) = 1

degré de liberté.
Pour = 5%, on a:
2
1;:95 = 3:84
Et comme:

2 X
X 2
2 (oij tij )2
=
i=1 j=1
tij
= 2:06

On accepte alors H0 au seuil = 5% , c’est à dire, les taux de billets de


parcours en 1 ere classe vendus en …ns et débuts de semaines sont identiques.

Exercice 6
Un échantillon de taille n a donné lieu au calcul d’une fréquence observée f
correspondant à l’intervalle de con…ance [0:22 0:34] au seuil = 5%.

1. Calculer n.
2. Par rapport à la proportion p = 0:3, l’écart entre f et p est-il signi…catif au
seuil = 5%?
3. Déterminer l’intervalle de con…ance de jf pj au seuil = 5%.

77
A. El Mossadeq Les Tests d’Hypothèse

Solution 6
1. Au seuil , l’intervalle de con…ance correspondant à une fréquence f observée
sur un échantillon de taille n est dé…ni par:
" r r #
f (1 f ) f (1 f )
f t1 =2 ; f + t1 =2
n n
On en déduit:
8
>
> 0:22 + 0:34
>
> f=
< 2
>
> f (1 f )
>
> 2
: n = t1 =2
(f 0:22)2
Pour = 5%, on a:
t0:975 = 1:96
on obtient alors:
f = :28
n = 215
2. Testons, au seuil , l’hypothèse nulle:

H0 : ”l’écart n’est pas singi…catif”

Sous cette hypothèse, la quantité:


f p
t= r
p (1 p)
n
peut être considérée comme une réalisation d’une variable aléatoire normale
centrée réduite.
On a:
f p
t = r
p (1 p)
n
= 0:64

78
Les Tests d’Hypothèse A. El Mossadeq

Pour = 5%, on a:
t:975 = 1:96
on accepte donc l’hypothèse nulle H0 au seuil = 5%.
3. Au seuil :

f p
r 2 t1 =2 ; t1 =2
p (1 p)
n
donc, au seuil :

" r #
p (1 p)
jf pj 2 0; t1 =2
n
Pour = 5%, on a:
t:975 = 1:96
d’où:
jf pj 2 [0; 0:06]

Exercice 7
L’étude du taux de défectuosités a¤érentes aux caractéristiques de traitements
thermiques d’une même pièce, traitée par deux fours di¤érents, a donné lieu aux
résultats suivants:
* Pour le premier four, 20 pièces défectueuses sur un échantillon de 200 pièces
traitées.
* Pour le second four, 120 pièces défectueuses sur un échantillon de 800 pièces
traitées.
Que peut-on conclure?

79
A. El Mossadeq Les Tests d’Hypothèse

Solution 7
Ici on:
8
< n1 = 200 ; f1 = 0:10
:
n2 = 800 ; f2 = 0:15
Testons, au seuil , l’hypothèse nulle:
H0 : ”les deux traitements thermiques sont équivalents”
Sous cette hypothèse, la quantité:

f1 f2
t= r
f1 (1 f1 ) f2 (1 f2 )
+
n1 n2
peut être considérée comme une réalisation d’une variable aléatoire normale cen-
trée réduite.
Pour = 5%, on a:
t:975 = 1:96
et comme:

f1 f2
t = r
f1 (1 f1 ) f2 (1 f2 )
+
n1 n2
= 2:03
on rejette donc l’hypothèse nulle H0 à 95%, c’est à dire, les deux traitements ne
sont pas équivalents.

Exercice 8
Un questionnaire auquel on ne peut répondre que par ”oui” ou par ”non”, a été
rempli par un échantillon de taille n:
L’intervalle de con…ance de la fréquence observée f des réponses ”oui” est
(0:35 0:43) au seuil = 5%.

80
Les Tests d’Hypothèse A. El Mossadeq

1. Quelle est la taille n de l’échantillon.


2. Par rapport à la proportion p = 0:4, l’écart entre f et p est-il signi…catif au
seuil = 5%?
3. Déterminer l’intervalle de con…ance de jf pj au seuil = 5%.

Solution 8
1. Au seuil , l’intervalle de con…ance correspondant à une fréquence f observée
sur un échantillon de taille n est dé…ni par:
" r r #
f (1 f ) f (1 f )
f t1 =2 ; f + t1 =2
n n
On en déduit: 8
>
> 0:35 + 0:43
>
> f =
< 2
>
> f (1 f )
>
> 2
: n = t1 =2
(f 0:35)2
Pour = 5%, on a:
t0:975 = 1:96
on obtient alors:
8
< f = 0:39
:
n = 571
2. Testons, au seuil , l’hypothèse nulle:

H0 : ”l’écart n’est pas singi…catif”

Sous cette hypothèse, la quantité:


f p
t= r
p (1 p)
n

81
A. El Mossadeq Les Tests d’Hypothèse

peut être considérée comme une réalisation d’une variable aléatoire normale
centrée réduite.
On a:
f p
t = r
p (1 p)
n
= 0:49

Pour = 5%, on a:
t:975 = 1:96
On accepte donc l’hypothèse nulle H0 au seuil = 5%.
3. Au seuil :
f p
r 2 t1 =2 ; t1 =2
p (1 p)
n
donc, au seuil :
" r #
p (1 p)
jf pj 2 0; t1 =2
n
Pour = 5%, on a:
t:975 = 1:96
d’où:
jf pj 2 [0; 0:04]

Exercice 9
Parmi 470 sujets exposés à une infection, 370 n’ayant pas été immunisés.
Parmi ces derniers, 140 contractent la malidie ainsi que 25 sujets immunisés.
Le traitement donne-t-il une protection signi…cative?

82
Les Tests d’Hypothèse A. El Mossadeq

Solution 9
Soient f1 la fréquence de contracter la maladie pour un sujet non immunisé et
f2 la fréquence de contracter la maladie pour un sujet immunisé.
Ici on:
8
>
> 14
>
< n 1 = 370 et f1 =
37
>
> 1
>
: n2 = 100 et f2 =
4
Testons, au seuil , l’hypothèse nulle:

H0 : ”le traitements n’est pas e¢ cace”


Sous cette hypothèse, la quantité:

f1 f2
t= r
f1 (1 f1 ) f2 (1 f2 )
+
n1 n2
peut être considérée comme une réalisation d’une variable aléatoire normale cen-
trée réduite.
Pour = 5%, on a:
t:975 = 1:96
et comme:

f1 f2
t = r
f1 (1 f1 ) f2 (1 f2 )
+
n1 n2
= 2:56
On rejette donc l’hypothèse nulle H0 à 95%, c’est à dire, le traitement donne
une protection signi…cative.

83
A. El Mossadeq Les Tests d’Hypothèse

Exercice 10
La taille de 1200 conscrits du bureau de recrutement X a pour moyenne X =
172 cm et pour écart-type sX = 6 cm:
Les mêmes mesures e¤ectuées sur les 250 conscrits du bureau de recrutement Y
ont donné pour moyenne Y = 170 cm et pour écart-type sY = 5 cm:
Que peut-on conclure?

Solution 10
Testons au seuil l’hypothèse nulle:

H0 : ”les conscrits des bureaux de recrutement X et Y ont la même taille”


Sous l’hypothèse nulle H0 , la quantité:

X Y
t= s
s2X s2Y
+
n1 n2
peut être considérée comme une réalisation d’une variable aléatoire normale cen-
trée réduite.
Pour = 5%, on a:
t:975 = 1:96
Et comme:

X Y
t = s
s2X s2Y
+
n1 n2

= 5:547
On rejette alors l’hypothèse nulle H0 à 95% (même à 99%), c’est à dire, les
conscrits des bureaux de recrutement X et Y ont des tailles moyennes di¤érentes.

84
Les Tests d’Hypothèse A. El Mossadeq

Exercice 11
On se propose de comparer le poids à la naissance chez une série de primapares
(série 1) et une série de multipares (série 2):
Serie 1: n1 = 95 m1 = 3197 g s21 = 210100 g2

Serie 2: n2 = 105 m2 = 3410 g s22 = 255400 g2


Que peut-on conclure?

Solution 11
Testons au seuil l’hypothèse nulle:

H0 : ”les primapares et les multipares ont le même poids moyen à la naissance”


Sous l’hypothèse nulle H0 , la quantité:

m1 m2
t= s
s21 s22
+
n1 n2
peut être considérée comme une réalisation d’une variable aléatoire normale cen-
trée réduite.
Pour = 5%, on a:
t:975 = 1:96
Et comme:
m m2
t = s1
s21 s22
+
n1 n2

= 3:1256
On rejette alors l’hypothèse nulle H0 , à 95% (même à 99%), c’est à dire, les
primapares et les multipares n’ont pas le même poids moyen à la naissance.

85
A. El Mossadeq Les Tests d’Hypothèse

Exercice 12
Chez cent sujet normaux, on dose l’acide urique, les résultats sont:
8
< m1 = 53:3 mg= l
:
s1 = 9:1 mg= l
Chez cent sujet atteints de la maladie de goutte, le même dosage de l’acide
urique fournit les résultats suivants:
8
< m2 = 78:6 mg= l
:
s2 = 13:1 mg= l
Que peut-on conclure?

Solution 12
Testons au seuil , l’hypothèse nulle:
H0 : "la maladie de goutte n’a pas d’in‡uence sur la dose de l’acide urique "
Sous cette hypothèse, la quantité:
m1 m2
t= s
s21 s22
+
n1 n2
peut être considérée comme une réalisation d’une variable aléatoire normale cen-
trée réduite.
Pour = 5%, on a:
t:975 = 1:96
et comme:
m1 m2
t= s = 15:862
2 2
s1 s
+ 2
n1 n2
On rejette l’hypothèse nulle H0 à 95% (même à 99:99%); c’est à dire, la maladie
de goutte a une in‡uence sur la dose de l’acide urique.

86
Les Tests d’Hypothèse A. El Mossadeq

Exercice 13
On admet que la valeur moyenne de la glycémie du sujet normal est 1 g= l.
Sur 17 sujets, on a trouvé une moyenne de :965 g= l et un écart-type estimé de
:108 g= l.
Cette valeur peut-elle être considérée comme di¤érente du taux normal?

Solution 13
Testons au seuil , l’hypothèse nulle:

H0 : "la valeur est normale "


Sous cette hypothèse, la quantité:

m
t= s
p
n
est une réalisation de la variable aléatoire Tn 1 de Student à:
n 1 = 16
degrés de liberté.
Pour = 5%, on a:
t16;:975 = 2:12
et comme:
m
t = s
p
n
= 1:3362
on accepte l’hypothèse nulle H0 au seuil = 5%, c’est à dire, la valeur est
normale.

87
A. El Mossadeq Les Tests d’Hypothèse

Exercice 14
Dans un échantillon de 17 prématurés, la moyenne du N a-plasmatique est:
8
< m1 = 133
:
s21 = 81:2
Soit un autre échantillon de 25 dysmaturés, dans lequel la moyenne du N a-
plasmatique est:
8
< m2 = 136
:
s22 = 56:57
Que peut-on conclure?

Solution 14
Testons d’abord, au seuil = 5%, l’hypothèse nulle d’égalité des variances du
N a-plasmatique chez les prématurés et les dysmaturés.
Sous cette hypothèse, la quantité:
s21
f=
s22
est une réalisation d’une variable aléatoire de Fisher à:
(n1 1; n2 1) = (16; 24)
degrés de liberté.
Pour = 5%, on a:
F16;24;:975 = 2:41
Et comme:
s21
f =
s22

= 1:4354
On accepte donc l’hypothèse d’égalité des variances des deux populations.

88
Les Tests d’Hypothèse A. El Mossadeq

Calculons maintenant l’estimation commune s2 de cette variance:

2 (n1 1) s21 + (n2 1) s22


s =
n1 + n2 2

= 66:42
et testons l’hypothèse nulle:
H0 : "les prématurés et les dysmaturés ont la même moyenne du Na-plasmatique "
Sous cette hypothèse, la quantité:
m1 m2
t= r
1 1
s +
n1 n2
est une réalisation de la variable aléatoire de Student à:
n1 + n2 2 = 40
degrés de liberté.
Pour = 5%, on a:
t40;:975 = 2:02
Et comme:
m m2
t = r1
1 1
s +
n1 n2
= 1:17
On accepte l’hypothèse nulle H0 au seuil = 5%, c’est à dire, les prématurés
et les dysmaturés ont la même moyenne du Na-plasmatique estimée par:

n1 m1 + n2 m2
m =
n1 + n2

= 134:79

89
A. El Mossadeq Les Tests d’Hypothèse

Exercice 15
Lorqu’une machine est bien réglée, elle produit des pièces dont le diamètre D
est une variable gaussienne de moyenne 25 mm.
Deux heures après le réglage de la machine, on a prélevé au hasard neuf pièces.
Leurs diamètres ont pour mesure en mm:
22 23 21 25 24 23 22 26 21

Construire à 95% puis 99% les intervalles de con…ance de la moyenne et de la


variance.
Que peut-on conclure quant à la qualité du réglage après deux heures de fonc-
tionnement de la machine?

Solution 15
Calculons d’abord les estimations m et s2 de la moyenne et de la variance sur
cet échantillon de taille n = 9.
On a:
n
1X
m= xi = 23 mm
n i=1
et:
n
X
1
2
s = (xi m)2 = 3 mm2
n 1 i=1
Testons l’hypothèse nulle:
H0 : "la machine est bien réglée "
Sous l’hypothèse nulle H0 , la quantité:
m
t= s
p
n
est une réalisation d’une variable aléatoire de Student à:
n 1=8
degrés de liberté: T8 .

90
Les Tests d’Hypothèse A. El Mossadeq

Pour = 5%, on a:
t8;:975 = 2:31
et comme:
m
t=s = 3:4641
p
n
On rejette l’hypothèse nulle H0 à 95% (même à 99%), c’est à dire, le réglage
de la machine est rompu.

Exercice 16
On e¤ectue un dosage par deux méthodes di¤érentes A et B .
On obtient les résultats suivants:

M ethode A :6 :65 :7 :7 :7 :7 :75 :8 :8

M ethode B :6 :6 :65 :65 :7 :6 :75 :8 :8

Peut-on considérer que les deux méthodes sont équivalentes?

Solution 16
Calculons les estimations m1 ; s21 de 1 ; 21 et m2 ; s22 de 2;
2
2 :
8 9
>
>
> 1X
< m1 = 9
> x1i = :71
i=1
9
X
>
> 1
>
> 2
m1 )2 = :004
: s1 = 8 (x1i
i=1
et:
8 9
>
>
> 1X
< m2 = 9
> x2i = :68
i=1
9
>
>
> 1X
> s 2
: 2 8 = (x2i m2 )2 = :007
i=1

91
A. El Mossadeq Les Tests d’Hypothèse

Testons d’abord, au seuil = 5%, l’hypothèse nulle d’égalité des variances des
deux méthodes de dosage.
Sous cette hypothèse, la quantité:
s22
f= 2
s1
est une réalisation d’une variable aléatoire de Fisher à:
(n2 1; n1 1) = (8; 8)
degrés de liberté.
Pour = 5%, on a:
F8;8;:975 = 4:43
et comme:
s22
f =
s21

= 1:75
On accepte donc l’hypothèse d’égalité des variances des deux populations.
Calculons maintenant l’estimation commune s2 de cette variance:

2 (n1 1) s21 + (n2 1) s22


s =
n1 + n2 2

= 0:0055
et testons l’hypothèse nulle:
H0 : "les deux méthodes de dosage sont équivalentes :"
Sous cette hypothèse, la quantité:

m1 m2
t= r
1 1
s +
n1 n2

92
Les Tests d’Hypothèse A. El Mossadeq

est une réalisation de la variable aléatoire de Student à:


n1 + n2 2 = 16
degrés de liberté.
Pour = 5%, on a:
t16;:975 = 2:12
et comme:
m m2
t = r1
1 1
s +
n1 n2
= 0:86
on accepte l’hypothèse nulle H0 au seuil = 5%, c’est à dire, les deux méthodes
de dosage sont équivalentes.

Exercice 17
Dans deux types de forêts, on a mesuré les hauteurs de treize et quatorze peuple-
ments choisis au hasard et indépendamment dans le but de véri…er si les hauteurs
de ces deux types d’arbres sont ou ne sont pas égales.
Les résultats sont les suivants:

T ype 1 : 22:5 22:9 23:7 24:0 24:4 24:5 26:0

26:2 26:4 26:7 27:4 28:6 28:7

T ype 2 : 23:4 24:4 24:6 24:9 25:0 26:2 26:3

26:8 26:8 26:9 27:0 27:6 27:7 27:8

On admet que les hauteurs de ces deux types d’arbres sont des variables gaussi-
ennes N 1 ; 21 et N 2 ; 22 .
Que peut-on conclure?

93
A. El Mossadeq Les Tests d’Hypothèse

Solution 17
Calculons les estimations m1 ; s21 de 1 ; 21 et m2 ; s22 de 2;
2
2 :
8 13
>
> 1 X
>
< m1 = 13
> x1i = 25:538
i=1
X 13
>
> 1
>
> s 2
= (x1i m1 )2 = 4:1576
: 1
12 i=1
et:
8 14
>
> 1 X
>
< m2 = 14
> x2i = 26:1
i=1
14
X
>
> 1
>
> s 2
= (x2i m2 )2 = 1:9431
: 2
13 i=1
Testons d’abord, au seuil = 5%, l’hypothèse nulle d’égalité des variances des
hauteurs des deux types d’arbres.
Sous cette hypothèse, la quantité:
s21
f= 2
s2
est une réalisation d’une variable aléatoire de Fisher à:

(n1 1; n2 1) = (12; 13)


degrés de liberté.

Pour = 5%, on a:
F12;13;:975 = 3:15
et comme:
s21
f =
s22
= 2:1398
on accepte donc l’hypothèse d’égalité des variances des hauteurs des deux types
d’arbres.

94
Les Tests d’Hypothèse A. El Mossadeq

Calculons maintenant l’estimation commune s2 de cette variance:

2 (n1 1) s21 + (n2 1) s22


s =
n1 + n2 2
= 3:0062
et testons l’hypothèse nulle:

H0 : "les deux types d’arbres ont la même hauteur "


Sous cette hypothèse, la quantité:

m1 m2
t= r
1 1
s +
n1 n2
est une réalisation de la variable aléatoire de Student à:
n1 + n2 2 = 25
degrés de liberté.

Pour = 5%, on a:
t25;:975 = 2:06
et comme:

m m2
t = r1
1 1
s +
n1 n2
= 0:84155
on accepte l’hypothèse nulle H0 au seuil = 5%, c’est à dire, les deux types
d’arbres ont la même hauteur moyenne estimée par:
n1 m1 + n2 m2
m =
n1 + n2
= 25:829

95
A. El Mossadeq Les Tests d’Hypothèse

Exercice 18
On considère deux variétés de maïs M1 et M2 dont les rendements sont des vari-
ables aléatoires gaussiennes N 1 ; 21 et N 2 ; 22 .
A…n de comparer les rendements de ces deux variétés de maïs, on a choisi de
cultiver dans neuf stations di¤érentes des parcelles voisines encemencées de l’une
ou l’autre des deux variétés. On a observé les rendements suivants:

Station 1 2 3 4 5 6 7 8 9

V ariete 1 39:6 32:4 33:1 27 36 32 25:9 32:4 33:2

V ariete 2 39:2 33:1 32:4 25:2 33:1 29:5 24:1 29:2 34:1

Que peut-on conclure?

Solution 18
Calculons les estimations m1 ; s21 de 1;
2
1 et m2 ; s22 de 2;
2
2 :
8 13
>
> 1 X
>
> m1 = x1i = 32:4
>
> 9 i=1
<
>
> 13
>
>
> 1X
> 2
: s1 = 8 (x1i m1 )2 = 17:188
i=1
et:
8 14
>
> 1 X
>
> m2 = x2i = 31:1
>
> 9 i=1
<
>
> 14
>
>
> 1X
> 2
: s2 = 8 (x2i m2 )2 = 21:785
i=1

96
Les Tests d’Hypothèse A. El Mossadeq

Testons d’abord, au seuil = 5%, l’hypothèse nulle d’égalité des variances des
rendements des deux variétés de maïs.
Sous cette hypothèse, la quantité:
s22
f= 2
s1
est une réalisation d’une variable aléatoire de Fisher à:
(n2 1; n1 1) = (8; 8)
degrés de liberté.
Pour = 5%, on a:
F8;8;:975 = 4:43
et comme:
s22
f =
s21
= 1:2675
On accepte donc l’hypothèse d’égalité des variances des rendements des deux
variétés de maïs.
Calculons maintenant l’estimation commune s2 de cette variance:
2 (n1 1) s21 + (n2 1) s22
s =
n1 + n2 2
2 2
s1 + s2
=
2
= 19:4865
et testons l’hypothèse nulle:
H0 : "les deux variétés de maïs ont le même rendement "
Sous cette hypothèse, la quantité:
m1 m2
t= r
1 1
s +
n1 n2

97
A. El Mossadeq Les Tests d’Hypothèse

est une réalisation de la variable aléatoire de Student à:


n1 + n2 2 = 16
degrés de liberté.
Pour = 5%, on a:
t16;:975 = 2:12
et comme:
m m2
t = r1
1 1
s +
n1 n2
= :42892
on accepte l’hypothèse nulle H0 au seuil = 5%, c’est à dire, les deux variétés
de maïs ont le même rendement moyen estimé par:
n1 m1 + n2 m2
m =
n1 + n2

= 31:75

Exercice 19
Le relevé des températures journalières minimales de deux stations S1 et S2 , au
cours de neuf journées consécutives a fourni les valeurs suivantes en C:

Station 1 12 8 9 10 11 13 10 7 10

Station 2 7 11 10 6 8 11 12 9 7

On admet que la distribution des températures journalières minimales des deux


stations S1 et S2 sont des variables gaussiennes N 1 ; 21 et N 2 ; 22 .

1. Déterminer les estimations des moyennes et des variances des températures


journalières minimales des deux stations S1 et S2 .

98
Les Tests d’Hypothèse A. El Mossadeq

2. Construire, au seuil = 5%, les intervalles de con…ance de ces estimations.


3. Peut-on admettre, au seuil = 5%, l’hypothèse selon laquelle les températures
journalières minimales moyennes des deux stations S1 et S2 sont identiques?

Solution 19
1. Calculons les estimations m1 ; s21 de 1;
2
1 et m2 ; s22 de 2;
2
2 .
On a:
8 11
>
> 1 X
>
> m1 = x1i = 10 C
>
> 9 i=1
<
>
> 11
>
>
> 1X
> 2
: s1 = 8 (x1i m1 )2 = 3:5
i=1
et:
8 10
>
> 1 X
>
> m2 = x2i = 9 C
>
> 9 i=1
<
>
> 10
>
>
> 1X
> 2
: s2 = 8 (x2i m2 )2 = 4:5
i=1

(a) L’intervalle de con…ance de 1 à1 est dé…ni par:


s1 s1
m1 tn 1;1 =2 p ; m1 + tn 1;1 =2 p
n n
Pour = 5%, on a:
t8;:975 = 2:31
d’où l’intervalle:
[8:56 C; 11:44 C]

99
A. El Mossadeq Les Tests d’Hypothèse

(b) L’intervalle de con…ance de 21 à 1 est dé…ni par:


" #
2 2
(n 1) s1 (n 1) s1
2 ; 2
n 1;1 =2 n 1; =2

Pour = 5%, on a:
8 2
< 8;:025 = 2:18
: 2
8;:975 = 17:5
d’où l’intervalle:
[1:6; 12:8]
(c) L’intervalle de con…ance de 2 à1 est dé…ni par:
s2 s2
m2 tn 1;1 =2 p ; m2 + tn 1;1 =2 p
n n
Pour = 5%, on a:
t8;:975 = 2:31
d’où l’intervalle:
[7:37 C; 10:63 C]
(d) L’intervalle de con…ance de 22 à 1 est dé…ni par:
" #
(n 1) s22 (n 1) s22
2 ; 2
n 1;1 =2 n 1; =2

Pour = 5%, on a:
8 2
< 8;:025 = 2:18
: 2
8;:975 = 17:5
d’où l’intervalle:
[2:06; 16:51]

100
Les Tests d’Hypothèse A. El Mossadeq

2. Testons d’abord, au seuil = 5%, l’hypothèse nulle d’égalité des variances


des températures journalières minimales des deux stations S1 et S2 .
Sous cette hypothèse, la quantité:
s22
f= 2
s1
est une réalisation d’une variable aléatoire de Fisher à:

(n2 1; n1 1) = (8; 8)

degrés de liberté.
Pour = 5%, on a:
F8;8;:975 = 4:43
et comme:
s22
f =
s21

= 1:29

On accepte donc l’hypothèse d’égalité des variances.


Calculons maintenant l’estimation commune s2 de cette variance:

2 (n1 1) s21 + (n2 1) s22


s =
n1 + n2 2

s21 + s22
=
2

= 4

et testons l’hypothèse nulle:


H0 : ”les températures journalières minimales moyennes
des deux stations S1 et S2 .sont identiques”

101
A. El Mossadeq Les Tests d’Hypothèse

Sous cette hypothèse, la quantité:

m1 m2
t= r
1 1
s +
n1 n2
est une réalisation de la variable aléatoire de Student à:

n1 + n2 2 = 16

degrés de liberté.

Pour = 5%, on a:
t16;:95 = 2:12
et comme:

m m2
t = r1
1 1
s +
n1 n2

= 1:0607

On accepte l’hypothèse nulle H0 au seuil = 5%, c’est à dire, les tem-


pératures journalières minimales moyennes des deux stations S1 et S2 .sont
identiques.
Cette température moyenne peut être estimée par:

n1 m1 + n2 m2
m =
n1 + n2
m1 + m2
=
2
= 9:5

102
Les Tests d’Hypothèse A. El Mossadeq

Exercice 20
On étudie l’e¤et d’une substance sur la croissance d’une tumeur gre¤ée.
Les résultats sont consignés sur le tableau ci-dessous donnant la surface de la
tumeur au 20eme jour après sa gre¤e:

Surf ace 5:5 6 6:5 7 7:5 8

T emoins 1 2 3 8 4 3

T raites 4 4 8 3 1 1

Le traitement a-t-il un e¤et signi…catif sur la surface tumorale?


2
On suppose que la surface tumorale est distribuée selon des lois normales N 1; 1
et N 2 ; 22 chez les témoins et les traités respectivement.

Solution 20
Calculons les estimations m1 ; s21 de 1 ; 21 et m2 ; s22 de 2;
2
2 .
On a:
8 6
>
>
> 1 X
>
> m1 = n1i xi = 7
>
< 21 i=1

>
> 6
>
>
> 1 X
> 2
: s1 = 20 n1i (xi m1 )2 = :45
i=1
et:
8 6
>
>
> 1 X
>
> m2 = n2i xi = 6:4048
>
< 21 i=1

>
> 6
>
>
> 1 X
> 2
: s2 = 20 n2i (xi m2 )2 = :87972
i=1
Testons d’abord, au seuil = 5%, l’hypothèse nulle d’égalité des variances des

103
A. El Mossadeq Les Tests d’Hypothèse

surfaces tumorales chez les populations des témoins et des traités.


Sous cette hypothèse, la quantité:
s22
f= 2
s1
est une réalisation d’une variable aléatoire de Fisher à:
(n2 1; n1 1) = (20; 20)
degrés de liberté.
Pour = 5%, on a:
F20;20;:975 = 2:46
et comme:
s22
f =
s21

= 1:9549
on accepte donc l’hypothèse d’égalité des variances des deux populations.
Calculons maintenant l’estimation commune s2 de cette variance:

2 (n1 1) s21 + (n2 1) s22


s =
n1 + n2 2

= :66486
et testons l’hypothèse nulle:

H0 : "le traitement est sans e¤et sur la croissance


de la surface tumorale "
Sous cette hypothèse, la quantité:

m1 m2
t= r
1 1
s +
n1 n2

104
Les Tests d’Hypothèse A. El Mossadeq

est une réalisation de la variable aléatoire de Student à:


n1 + n2 2 = 40
degrés de liberté.
Pour = 5%, on a:
t40;:99 = 2:02
et comme:
m1 m2
t= r = 2:831
1 1
s +
n1 n2
On rejette l’hypothèse nulle H0 à 95% (et même à 98%), c’est à dire, le traite-
ment a une in‡uence sur la croissance de la surface tumorale.

Exercice 21
De nombreuses observations cliniques ont montré que jusque là:
30% des malades atteints de M ont une survie inférieure à un an
50% ont une survie entre un an et deux ans
10% ont une survie entre deux ans et cinq ans
10% ont une survie supérieure à cinq ans.
On applique un nouveau traitement à 80 malades atteint de la maladie M et on
constate:
12 ont une survie inférieure à un an
56 ont une survie entre un an et deux ans
8 ont une survie entre deux ans et cinq ans
4 ont une survie supérieure à cinq ans.
Que peut-on conclure?

Solution 21
Testons, au seuil , l’hypothèse nulle:
H0 : ”le nouveau traitement n’est pas actif contre la maladie M”

105
A. El Mossadeq Les Tests d’Hypothèse

Sous cette hypothèse, on a les répartitions:


Repartition Repartition
Survie
Observee T heorique
survie 1 an 12 24

1 an < survie 2 ans 56 40

2 an < survie 5 ans 8 8

survie > 5 ans 4 8

T otal 80 80

Sous l’hypothèse nulle H0 , la quantité:


4
X
2 (oi ti )2
=
i=1
ti
est une réalisation d’une variable du Khi-deux à:
4 1=3
degrés de liberté.
Pour = 5%, on a:
2
3;:95 = 7:81
Et comme:
2
X
2 (oi ti )2
=
i=1
ti
= 14:4
on rejette donc l’hypothèse nulle H0 à 95% (même à 99:5%), c’est à dire, qu’à
99:5%, le nouveau traitement est actif contre la maladie M.

106
Les Tests d’Hypothèse A. El Mossadeq

Exercice 22
Le tableau ci-après concerne le nombre annuel de cyclones tropicaux ayant at-
teint la côte orientale des Etats-Unis entre 1887 et 1956:

N ombre annuel de cyclones N ombre d0 annees

0 1

1 6

2 10

3 16

4 19

5 5

6 8

7 3

8 1

9 1

>9 0

Peut-on admettre, au seuil = 5%, que ce nombre annuel de cyclones est une
variable de P oisson?

107
A. El Mossadeq Les Tests d’Hypothèse

Solution 22
Testons, au seuil , l’hypothèse nulle:

H0 : ”le nombre annuel de cyclones est une variable de Poisson”


Calculons une estimation ponctuelle du paramètre de cette loi:

k
P [X = k] = exp
k!

où X est la variable aléatoire représentant le nombre annuel de cyclones.

On sait que:

n
1X
^= Xi
n i=1
est un estimateur sans biais et convergent de .

Une estimation ponctuelle ~ de est donnée par:

9
1 X
~ = ini
70 i=0
= 3:7286
L’e¤ectif théorique tk , k 0, représentant le nombre d’années à k cyclones est
donné par:

tk = nP [X = k]

D’où les répartitions:

108
Les Tests d’Hypothèse A. El Mossadeq

N ombre annuel
Ef f ectif s observes Ef f ectif s theoriques
de cyclones
0 1 1:68

1 6 6:27

2 10 11:69

3 16 14:53

4 19 13:54

5 5 10:1

6 8 6:28

7 3 3:34

8 1 1:56

9 1 0:65

>9 0 0:36

T otal 70 70

On constate que le tableau contient des e¤ectifs théoriques strictement inférieurs


à 5, ce qui empêche l’utilisation d’un test du khi-deux.
On peut remédier à cet état en opérant le groupement ”logique”:
* des classes ”0” et ”1” d’une part,
* et des classes ”7 et plus” d’autre part.
Les tableaux des e¤ectifs observés et théoriques deviennent:

109
A. El Mossadeq Les Tests d’Hypothèse

N ombre annuel
Ef f ectif s observes Ef f ectif s theoriques
de cyclones
0 ou 1 7 7:95

2 10 11:69

3 16 14:53

4 19 13:54

5 5 10:10

6 8 6:28

7 5 5:91

T otal 70 70

Sous l’hypothèse nulle H0 , la quantité:


7
X
2 (oi ti )2
=
i=1
ti
est une réalisation d’une variable du Khi-deux à:
7 1 1=5
degrés de liberté.puisque pour calculer les e¤ectifs théoriques, nous avons utilisé
l’estimation, et non la valeur réel, du paramètre de la loi de Poisson.
Pour = 5%, on a:
2
5;:95 = 5:8948

110
Les Tests d’Hypothèse A. El Mossadeq

Et comme:
2
= 5:81
On accepte alors H0 au seuil = 5%, c’est à dire, le nombre annuel de cyclones
peut être ajusté par une loi de Poisson dont le paramètre est estimé par:
~ = 3:7286

Exercice 23
On veut savoir si la réussite (R) d’un traitement est indépendantes du niveaux
de la tension artérielle du malade (T ).
On dispose pour cela de 250 observations réparties comme suit:

T R echec succes

basse 21 104

elevee 29 96

Que peut-on conclure?

Solution 23
La répartition observée est:

T ableau des ef f ectif s observees

T R Echec Succes T otal

Basse 21 104 125

Elevee 29 96 125

T otal 50 200 250

111
A. El Mossadeq Les Tests d’Hypothèse

Testons, au seuil , l’hypothèse nulle:


H0 : "la réussite du traitement est indépendante du niveau de la tension artérielle "
Calculons, sous cette hypothèse, la répartition théorique:

T ableau des ef f ectif s theoriques

T R Echec Succes T otal

Basse 25 100 125

Elevee 25 100 125

T otal 50 200 250

Sous l’hypothèse nulle H0 , la quantité:


2 X
X 2
2 (oij tij )2
=
i=1 j=1
tij

est une réalisation d’une variable du Khi-deux à:


(2 1) (2 1) = 1
degré de liberté.
Pour = 5%, on a:
2
1;:95 = 3:84
Et comme:
2 X
X 2
2 (oij tij )2
=
i=1 j=1
tij
= 1:6
On accepte alors H0 au seuil = 5% , c’est à dire, la réussite du traitement est
indépendante du niveau de la tension artérielle.

112
Les Tests d’Hypothèse A. El Mossadeq

Exercice 24
75 enfants sont vus en consultation pour un asthme. On relève chez eux les deux
symptômes suivants:
* Intensité de la maladie asmathique: légère , moyenne , forte
* Existence ou absence d’un eczéma au moment de l’observation ou dans le
passé.On peut classer les enfants selon la répartition suivante:

E A f ort moyen leger

present 8 2 2

passe 11 11 3

jamais 6 18 14

Peut-on considérer qu’il existe-t-il une association entre l’intensité de l’asthme


et l’existence d’un eczéma?

Solution 24
Le tableau de la répartition observée est donnée par:

T ableau des ef f ectif s observees

Eczema Asthme f ort moyen leger T otal

present 8 2 2 12

passe 11 11 3 25

jamais 6 18 14 38

T otal 25 31 19 75

113
A. El Mossadeq Les Tests d’Hypothèse

Testons, au seuil , l’hypothèse nulle:


H0 : ”l’intensité de l’asthme est indépendante de l’existence d’un eczéma”
Calculons, sous cette hypothèse, la répartition théorique.

T ableau des ef f ectif s theoriques

Eczema Asthme f ort moyen leger T otal

present 4 4:96 3:04 12

passe 8:33 10:33 6:34 25

jamais 12:67 15:71 9:62 38

T otal 25 31 19 75

Les e¤ectifs théoriques sur la première ligne sont strictement inférieurs à cinq, ce
qui empêche l’application d’un test du Khi-deux.On peut remédier à cet état en
opérant le groupement ”logique” des classes ”present” et ”passe”.
Les nouveaux tableaux des e¤ectifs observés et théoriques, obtenus après re-
groupement de ces deux classes sont donnés ci-après.

T ableau des ef f ectif s observees

Eczema Asthme f ort moyen leger T otal

present ou passe 19 13 5 37

jamais 6 18 14 38

T otal 25 31 19 75

114
Les Tests d’Hypothèse A. El Mossadeq

T ableau des ef f ectif s theoriques

Eczema Asthme f ort moyen leger T otal

present ou passe 12:33 15:29 9:38 37

jamais 12:67 15:71 9:62 38

T otal 25 31 19 75

Sous l’hypothèse nulle H0 , la quantité:

2 X
X 3
2 (oij tij )2
=
i=1 j=1
tij
est une réalisation d’une variable du Khi-deux à:
(2 1) (3 1) = 2
degrés de liberté.
Pour = 5%, on a:
2
2;:95 = 5:99
Et comme:

2 X
X 3
2 (oij tij )2
=
i=1 j=1
tij

= 11:84
On rejette alors H0 à 95% (même à 99:5%), c’est à dire, l’intensité de l’asthme
dépend de l’existence d’un eczéma.

115
A. El Mossadeq Les Tests d’Hypothèse

Exercice 25
On veut savoir s’il y a une liason entre la localisation (L) du cancer du poumon
(périphérique , non périphérique) et le côté (C) de la lésion (poumon gauche ,
poumon droit). L’étude a porté sur 1054 malades:

L C gauche droit

peripherique 26 62

non peripherique 416 550

Que peut-on conclure?

Solution 25
La répartition observée est donnée par:

T ableau des ef f ectif s observees

L C gauche droit T otal

peripherique 26 62 88

non peripherique 416 550 966

T otal 442 612 1054

Testons, au seuil , l’hypothèse nulle:


H0 : ”la localisation du cancer est indépendante du côté de la lésion”
Calculons, sous cette hypothèse, la répartition théorique.

116
Les Tests d’Hypothèse A. El Mossadeq

T ableau des ef f ectif s theoriques

L C gauche droit T otal

peripherique 36:9 51:1 88

nonperipherique 405:1 560:9 966

T otal 442 612 1054

Sous l’hypothèse nulle H0 , la quantité:

2 X
X 2
2 (oij tij )2
=
i=1 j=1
tij
est une réalisation d’une variable du Khi-deux à:
(2 1) (2 1) = 1
degré de liberté.
Pour = 5%, on a:
2
1;:95 = 3:84
Et comme:
2 X
X 2
2 (oij tij )2
=
i=1 j=1
tij

= 6:05
On rejette alors H0 à 95% (même à 97:5%), c’est à dire, la localisation du cancer
dépend du côté de la lésion.

117
A. El Mossadeq Les Tests d’Hypothèse

Exercice 26
On suppose pouvoir classer les malades atteints d’une maladie M en trois caté-
gories cliniques: A ; B ; C:
On se demande si ces trois catégories di¤èrent par leurs survies à un an.
Les e¤ectifs observés sont les suivants:

Survie Categorie A B C

survie a un an 5 20 45

deces avant un an 15 50 145

Que peut-on conclure?

Solution 26
La répartition observée est:

T ableau des ef f ectif s observees

Survie Categorie A B C T otal

Survie a un an 5 20 45 70

Deces avant un an 15 50 145 210

T otal 20 70 190 280

Testons, au seuil , l’hypothèse nulle:


H0 : ”la survie à un an est indépendante de la catégorie clinique”
Calculons, sous cette hypothèse, la répartition théorique.

118
Les Tests d’Hypothèse A. El Mossadeq

T ableau des ef f ectif s theoriques

Survie Categorie A B C T otal

Survie a un an 5 17:5 47:5 70

Deces avant un an 15 52:5 142:5 210

T otal 20 70 190 280

Sous l’hypothèse nulle H0 , la quantité:

2 X
X 3
2 (oij tij )2
=
i=1 j=1
tij
est une réalisation d’une variable du Khi-deux à:
(2 1) (3 1) = 2
degrés de liberté.

Pour = 5%, on a:
2
2;:95 = 5:99
Et comme:

2 X
X 3
2 (oij tij )2
=
i=1 j=1
tij

= 0:65
On accepte alors H0 au seuil = 5% , c’est à dire, la survie à un an est
indépendante de la catégorie clinique.

119
A. El Mossadeq Les Tests d’Hypothèse

Exercice 27
Sur un échantillon de 84 prématurés, on cherche s’il existe une liaison entre la
survenue d’une hypoglycémie et la survenue d’un ictère:
sur 43 enfants n’ayant pas d’ictère, 23 sont hypoglycémiques

sur 20 enfants ayant un ictère modéré, 6 sont hypoglycémiques

sur 21 enfants ayant un ictère intense, 4 sont hypoglycémiques


Que peut-on conclure?

Solution 27
La répartition observée est donnée dans le tableau:

T ableau des ef f ectif s observees

Ictere Hypoglycemie hypoglycemique non hypoglycemique T otal

pas d0 ictere 23 20 43

ictere modere 6 14 20

ictere intense 4 17 21

T otal 33 51 84

Testons, au seuil , l’hypothèse nulle:

H0 : ”la survenue d’une hypoglycémie est indépendante de la survenue d’un ictère”


Calculons, sous cette hypothèse, la répartition théorique.

120
Les Tests d’Hypothèse A. El Mossadeq

T ableau des ef f ectif s theoriques

Ictere Hypoglycemie hypoglycemique non hypoglycemique T otal

pas d0 ictere 16:89 26:11 43

ictere modere 7:86 12:14 20

ictere intense 8:25 12:75 21

T otal 33 51 84

Sous l’hypothèse nulle H0 , la quantité:


2 X
X 2
2 (oij tij )2
=
i=1 j=1
tij

est une réalisation d’une variable du Khi-deux à:


(3 1) (2 1) = 2
degrés de liberté.

Pour = 5%, on a:
2
2;:95 = 5:99
Et comme:
3 X
X 2
2 (oij tij )2
=
i=1 j=1
tij

= 7:97
On rejette alors H0 à 95% (même à 97:5%), c’est à dire, la survenue d’une
hypoglycémie dépend de la survenue d’un ictère.

121
A. El Mossadeq Les Tests d’Hypothèse

Exercice 28
Une étude statistique relative aux résultats d’admission du concours d’une grande
école fait ressortir la répartition des admis selon la profession des parents lorsque
celle-ci est connue:

P rof ession des P arents Candidats Admis

F ontionnaires et Assimiles 2224 180

Commerce et Industrie 998 89

P rof essions Liberales 575 48

P roprietaires Rentiers 423 37

P roprietaires Agricoles 287 13

Artisans 210 18

Banques et Assurances 209 17

1. La profession des parents a-t-elle une in‡uence sur l’accès à cette école?
2. Cette conclusion persiste-t-elle lorsqu’on tient compte pour compléter la sta-
tistique précédente de 961 candidats dont l’origine socio-professionnelle est
inconnue et qui ont obtenus 43 succès?

Solution 28
1. La répartition observée est:

122
Les Tests d’Hypothèse A. El Mossadeq

T ableau des ef f ectif s observees

P rof ession des P arents Candidats Admis N on admis

F ontionnaires et Assimiles 2224 180 2044

Commerce et Industrie 998 89 899

P rof essions Liberales 575 48 527

P roprietaires Rentiers 423 37 386

P roprietaires Agricoles 287 13 274

Artisans 210 18 192

Banques et Assurances 209 17 192

T otal 4916 402 4514

Testons, au seuil , l’hypothèse nulle:

H0 : ”l’accès à l’Ecole est indépendant de la profession des parents”

Calculons, sous cette hypothèse, la répartition théorique.


Le tableau de cette répartition est donnée ci-après.
Sous l’hypothèse nulle H0 , la quantité:

7 X
X 2
2 (oij tij )2
=
i=1 j=1
tij

123
A. El Mossadeq Les Tests d’Hypothèse

T ableau des ef f ectif s theoriques

P rof ession des P arents Candidats Admis N on admis


F ontionnaires et Assimiles 2224 181:9 2042:1

Commerce et Industrie 998 80:8 907:2

P rof essions Liberales 575 47 528

P roprietaires Rentiers 423 34:6 388:4

P roprietaires Agricoles 287 23:5 263:5

Artisans 210 17:2 192:8

Banques et Assurances 209 17:1 191:9


T otal 4916 402 4514

est une réalisation d’une variable du Khi-deux à:

(7 1) (2 1) = 6

degrés de liberté.

Pour = 5%, on a:
2
6;:95 = 12:6
Et comme:
2 X
X 3
2 (oij tij )2
=
i=1 j=1
tij

= 6:28

124
Les Tests d’Hypothèse A. El Mossadeq

On accepte alors H0 au seuil = 5% , c’est à dire, l’accès à l’Ecole est


indépendant de la profession des parents.

2. Si l’on tient compte des 961 candidats dont l’origine socio-professionnelle est
inconnue et qui ont obtenus 43 succès, la répartition observée et la réparti-
tion théorique, sous la même hypothèse nulle, deviennent comme consognés
ci-après.

T ableau des ef f ectif s observees


P rof ession des P arents Candidats Admis N on admis
F ontionnaires et Assimiles 2224 180 2044

Commerce et Industrie 998 89 899

P rof essions Liberales 575 48 527

P roprietaires Rentiers 423 37 386

P roprietaires Agricoles 287 13 274

Artisans 210 18 192

Banques et Assurances 209 17 192

Autres 961 43 918


T otal 5877 445 5432

125
A. El Mossadeq Les Tests d’Hypothèse

T ableau des ef f ectif s theoriques

P rof ession des P arents Candidats Admis N on admis

F ontionnaires et Assimiles 2224 168:4 2055:6

Commerce et Industrie 998 74:8 913:2

P rof essions Liberales 575 43:5 531:5

P roprietaires Rentiers 423 32 391

P roprietaires Agricoles 287 21:7 265:3

Artisans 210 15:9 194:1

Banques et Assurances 209 15:8 193:2

Autres 961 72:8 888:2

T otal 5877 445 5432

Sous l’hypothèse nulle H0 , la quantité:

8 X
X 2
2 (oij tij )2
=
i=1 j=1
tij
est une réalisation d’une variable du Khi-deux à:

(8 1) (2 1) = 7
degrés de liberté.

126
Les Tests d’Hypothèse A. El Mossadeq

Pour = 5%, on a:
2
7;:95 = 14:1
Et comme:

2 X
X 3
2 (oij tij )2
=
i=1 j=1
tij

= 22:5

On rejette alors H0 à 95% (même à 99:5%) , c’est à dire, l’accès à l’Ecole


dépend de la profession des parents.

Exercice 29
Un médicament essayé sur 42 patients est contrôlé quant aux e¤ets secondaires
qu’il peut avoir sur le poids des malades. On peut considérer que:
quinze d’entre eux ont maigri
dix sept n’ont pas changé de poids
dix ont grossi
En supposant que la maladie est sans e¤et sur les variations de poids, le médica-
ment a-t-il un e¤et signi…catif sur le poids?

Solution 29
Testons, au seuil , l’hypothèse nulle:
H0 : ”le traitement est sans e¤et sur les variations du poids”
Si le traitement est sans e¤et sur les variations du poids, alors ces variations sont
dûes seulement au hasard.
La loi de probabilité est donc la loi uniforme, c’est à dire la probabilité de chaque
1
classe est la même et est égale à .
3

127
A. El Mossadeq Les Tests d’Hypothèse

D’où les répartitions:

V ariations Repartition Observee Repartition T heorique

ont maigri 15 14

n0 ont pas change 17 14

ont grossi 10 14

T otal 42 42

Sous l’hypothèse nulle H0 , la quantité:


3
X
2 (oi ti )2
=
i=1
ti
est une réalisation d’une variable du Khi-deux à:
3 1=2
degrés de liberté.

Pour = 5%, on a:
2
2;:95 = 5:99
Et comme:

2
X
2 (oi ti )2
=
i=1
ti
= 1:86
on accepte donc l’hypothèse nulle H0 au seuil = 5%, c’est à dire, le traite-
ment est sans e¤et sur les variations du poids.

128
Les Tests d’Hypothèse A. El Mossadeq

Exercice 30
Pour étudier la densité de poussières dans un gaz, on a procédé à une série
d’observations de petits échantillons de gaz au moyen d’un microscope.
On a ainsi e¤ectué 143 observations et les résultats sont les suivants:
N ombre de particules N ombre d0 echantillons
en suspension de gaz
0 34

1 46

2 38

3 19

4 4

5 2

>5 0

Peut-on admettre, au seuil = 5%, que le nombre de particules en suspension


est une variable de P oisson?

Solution 30
Testons, au seuil , l’hypothèse nulle:
H0 : ”le nombre de particules en suspension est une variable de Poisson”
Calculons une estimation ponctuelle du paramètre de cette loi:
k
P [X = k] = exp
k!
où X est la variable aléatoire représentant le nombre de particules en suspension.

129
A. El Mossadeq Les Tests d’Hypothèse

On sait que:
n
1X
^= Xi
n i=1
est un estimateur sans biais et convergent de .
Une estimation ponctuelle ~ de est donnée par:
5
1 X
~ = ini
143 i=0
= 1:4336
D’où les répartitions:

P articules Repartition Repartition


en suspension observee theorique
0 34 34:1

1 46 48:9

2 38 35:0

3 19 16:7

4 4 06:0

5 2 01:7

>5 0 00:6

T otal 143 143

L’e¤ectif théorique tk , k 0, représentant le nombre particules en suspension k


est donné par:
tk = nP [X = k]

130
Les Tests d’Hypothèse A. El Mossadeq

On constate que le tableau contient des e¤ectifs théoriques strictement inférieurs


à 5, ce qui empêche l’utilisation d’un test du khi-deux.
On peut remédier à cet état en opérant le groupement ”logique” des classes
”4 et plus”.
Les tableaux des e¤ectifs observés et théoriques deviennent comme consignés
ci-après.

P articules Repartition Repartition


en suspension Observee T heorique
0 34 34:1

1 46 48:9

2 38 35:0

3 19 16:7

4 4 08:3

T otal 143 143

Sous l’hypothèse nulle H0 , la quantité:

4
X
2 (oi ti )2
=
i=0
ti
est une réalisation d’une variable du Khi-deux à:
5 1 1=3
degrés de liberté.puisque pour calculer les e¤ectifs théoriques, nous avons utilisé
l’estimation, et non la valeur réel, du paramètre de la loi de Poisson.

131
A. El Mossadeq Les Tests d’Hypothèse

Pour = 5%, on a:
2
3;:95 = 7:81
Et comme:

2
= 2:97
On accepte alors H0 au seuil = 5%, c’est à dire, le nombre de particules en
suspension peut être ajusté par une loi de Poisson dont le paramètre est estimé
par:
~ = 1:4336

Exercice 31
On considère les familles de quatre enfants.
Sur un échantillon de cent familles à quatre enfants, la répartition suivante a été
observée:

N ombre de f illes N ombre de f amilles

0 7

1 20

2 41

3 22

4 10

1
Peut-on considérer que la probabilité qu’un enfant soit une …lle est ?
2

132
Les Tests d’Hypothèse A. El Mossadeq

Solution 31
Testons, au seuil , l’hypothèse nulle:
1
H0 : ”la probabilité d’avoir une …lle est ”
2
Sous l’hypothèse nulle H0 , la variable aléatoire X égale au nombre de …lles parmi
1 1
les quatre enfants suit une loi binomiale d’ordre 4 et de paramètre : B 4; .
2 2
Ainsi, pour tout k , 0 k 4, la probabilité pk d’avoir k …lles parmi les quatre
enfants est:
4
1
pk = C (4; k)
2
L’e¤ectif théorique tk , 0 k 4, représentant le nombre de familles ayant k
…lles parmi les quatre enfants est donné par:
tk = npk
D’où les répartitions:

Repartition Repartition
N ombre de f illes
Observee T heorique
0 7 6:25

1 20 25

2 41 37:5

3 22 25

4 10 6:25

T otal 100 100

Sous l’hypothèse nulle H0 , la quantité:

133
A. El Mossadeq Les Tests d’Hypothèse

4
X
2 (oi ti )2
=
i=0
ti
est une réalisation d’une variable du Khi-deux à:
5 1=4
degrés de liberté.

Pour = 5%, on a:

2
4;:95 = 9:49
Et comme:
2
= 4:03
1
On accepte alors H0 au seuil = 5%: la probabilité d’avoir une …lle est :
2

Exercice 32
Le tableau suivant indique le résultat de l’examen de 124 sujets, classés d’après
la couleur de leurs yeux (Y ) et la couleur de leus cheveux (C):

Y C Blonds Bruns N oirs Roux

Bleus 25 9 3 7

Gris ou V erts 13 17 10 7

M arrons 7 13 8 5

Existe-t-il une liason entre ces deux caractères?

134
Les Tests d’Hypothèse A. El Mossadeq

Solution 32
La répartition observée est:

T ableau des ef f ectif s observees

Y C Blonds Bruns N oirs Roux T otal

Bleus 25 9 3 7 44

Gris ou V erts 13 17 10 7 47

M arrons 7 13 8 5 33

T otal 45 39 21 19 124

Testons, au seuil , l’hypothèse nulle:


H0 : ”les couleurs des yeux et des cheveux sont indépendantes”
Calculons, sous cette hypothèse, la répartition théorique.

T ableau des ef f ectif s theoriques

Y C Blonds Bruns N oirs Roux T otal

Bleus 16 13:8 7:4 6:8 44

Gris ou V erts 17 14:8 8 7:2 47

M arrons 12 10:4 5:6 5 33

T otal 45 39 21 19 124

135
A. El Mossadeq Les Tests d’Hypothèse

Sous l’hypothèse nulle H0 , la quantité:


3 X
X 4
2 (oij tij )2
=
i=1 j=1
tij

est une réalisation d’une variable du Khi-deux à:


(3 1) (4 1) = 6
degrés de liberté.
Pour = 5%, on a:
2
6;:95 = 12:6
Et comme:
2 X
X 3
2 (oij tij )2
=
i=1 j=1
tij
= 15
On rejette alors H0 à 95% (même à 97:5%), c’est à dire, les couleurs des yeux
et des cheveux ne sont pas indépendantes.

Exercice 33
On distribue un jeu de quarante cartes à quatre joueurs: A ; B ; C ; D ; cha-
cun reçevant dix cartes
Un statisticien a élaboré un programme de distribution de donnes par ordinateur.
Pour un ensemble de deux cents donnes, obtenues à partir de ce programme, il
observe le nombre de donnes où le joueur A reçoit k as, 0 k 4. Les résul-
tats sont les suivants:

N ombre d0 as 0 1 2 3 4

N ombre de donnes 64 74 52 8 2

Le programme du statisticien est-il …able?

136
Les Tests d’Hypothèse A. El Mossadeq

Solution 33
Testons, au seuil , l’hypothèse nulle:
H0 : ”le programme du statisticien est …able”
Sous l’hypothèse nulle H0 , la variable aléatoire X égale au nombre d’as du joueur
A suit une loi hypergéométrique.
Ainsi, pour tout k , 0 k 4, la probabilité pk pour que le joueur A ait k as
est:
C (4; k) C (36; 10 k)
pk =
C (40; 10)
L’e¤ectif théorique tk , 0 k 4, représentant le nombre de donnes à k as, du
joueur A; est donné par:
tk = npk
D’où les répartitions:

Repartition Repartition
N ombre d0 as
Observee T heorique
0 64 59:97

1 74 88:85

2 52 42:84

3 8 7:88

4 2 0:46

T otal 200 200

On constate que le tableau contient des e¤ectifs théoriques strictement inférieurs


à 5, ce qui empêche l’utilisation d’un test du khi-deux.
On peut remédier à cet état en opérant le groupement ”logique” des classes
”3 et 4”.

137
A. El Mossadeq Les Tests d’Hypothèse

Le tableau des e¤ectifs observés et théoriques deviennent:

Repartition Repartition
N ombre d0 as
Observee T heorique
0 64 59:97

1 74 88:85

2 52 42:84

3 ou 4 10 8:34

T otal 200 200

Sous l’hypothèse nulle H0 , la quantité:

3
X
2 (oi ti )2
=
i=0
ti
est une réalisation d’une variable du Khi-deux à:
4 1=3
degrés de liberté.

Pour = 5%, on a:
2
3;:95 = 7:81
Et comme:
2
= 5:0418
On accepte alors H0 au seuil = 5%, c’est à dire, le programme du statisticien
est …able.

138
Les Tests d’Hypothèse A. El Mossadeq

Exercice 34
On a croisé deux types de plantes di¤érant par deux caractères A et B .
La première génération est homogène.
La seconde fait apparaitre quatre types de plantes dont les génotypes sont
désignés par:
AB ; Ab ; aB ; ab
Si les caractères se trasmettent selon les lois de M endel, les proportions théoriques
9 3 3 1
des quatre génotypes sont: ; ; ; respectivement.
16 16 16 16
Sur un échantillon de 160 plantes, on a observé les e¤ectifs:
100 pour AB

28 pour Ab

24 pour aB

8 pour ab
Au vu de ces résultats, les lois de M endel sont-elles applicables?

Solution 34
Testons alors, au seuil , l’hypothèse nulle:
H0 : ”les lois de Mendel sont applicables”
Si H0 est vraie, la répartition des 160 plantes sur les quatre génotypes devrait
être comme suit:
t1 = 90 pour AB

t2 = 30 pour Ab

t3 = 30 pour aB

t4 = 10 pour ab

139
A. El Mossadeq Les Tests d’Hypothèse

On résume toutes les données dans le tableau suivant:

Genotypes Repartition Observee Repartition T heorique

AB 100 90

Ab 28 30

aB 24 30

ab 8 10

T otal 160 160

Sous l’hypothèse nulle H0 , et vu que tous les e¤ectifs théoriques sont supérieurs
ou égaux à 5, la quantité:
4
X
2 (oi ti )2
=
i=1
ti
est une réalisation d’une variable du Khi-deux à:
4 1=3
degrés de liberté: 23 .
Pour = 5%, on a:
2
3;:95 = 7:81
et comme:
4
X
2 (oi ti )2
=
i=1
ti
= 2:84

On accepte alors l’hypothèse nulle H0 au seuil de 5%, c’est à dire, les transmis-
sions génétiques de ce type de plantes se font selon les lois de Mendel.

140
Les Tests d’Hypothèse A. El Mossadeq

Exercice 35
On se propose de comparer les réactions produites par deux vaccins A et B .
Un groupe de 348 individus a été divisé, par tirage au sort, en deux séries qui
ont été vaccinées l’une par A et l’autre par B .
Les réactions ont été lues par une personne ignorant le vaccin utilisé:

V accin Reaction legere moyenne ulceration abces

A 12 156 8 1

B 29 135 6 1

Que peut-on conclure?

Solution 35
la répartition observés est:

T ableau des ef f ectif es observes

V accin Reaction legere moyenne ulceration abces T otal

A 12 156 8 1 177

B 29 135 6 1 171

T otal 41 291 14 2 348

Testons, au seuil , l’hypothèse nulle:


H0 : ”les réactions sont indépendantes du vaccin utilisé”
Calculons, sous cette hypothèse, la répartition théorique.

141
A. El Mossadeq Les Tests d’Hypothèse

T ableau des ef f ectif s theoriques

V accin Reaction legere moyenne ulceration abces T otal

A 20:9 148 7:1 1 177

B 20:1 143 6:9 1 171

T otal 41 291 14 2 348

On constate que les e¤ectifs théoriques dans la colonne ”Abces” sont inférieurs
à 5; ce qui empêche l’application d’un test du Khi-deux.
On peut remédier à cet état en opérant le groupement ”logique” des classes
”U lceration” et ”Abces”.
Les tableaux des e¤ectifs observés et théoriques obtenus après regroupement sont
donnés ci-après.
Sous l’hypothèse nulle H0 , la quantité:

2 X
X 3
2 (oij tij )2
=
i=1 j=1
tij
est une réalisation d’une variable du Khi-deux à:
(2 1) (3 1) = 2
Et comme:
2
2;:95 = 5:99
et:
2 X
X 3
2 (oij tij )2
=
i=1 j=1
tij

= 8:8

142
Les Tests d’Hypothèse A. El Mossadeq

On rejette alors, à 95%, l’hypothèse selon laquelle les deux vaccins A et B


provoquent les mêmes réactions.
T ableau des ef f ectif s observes

ulceration
V accin Reaction legere moyenne T otal
ou abces
A 12 156 9 177

B 29 135 7 171

T otal 41 291 16 348

T ableau des ef f ectif s theoriques

ulceration
V accin Reaction legere moyenne T otal
ou abces
A 20:9 148 8:1 177

B 20:1 143 7:9 171

T otal 41 291 16 348

Exercice 36
A…n de juguler le chômage des jeunes, le gouvernement français a créé le CPE
(Contrat Première Embauche) permettant aux entreprises de licencier sans motif
la personne recrutée pendant les deux premières années et d’autre part de béné-
…cier d’avantages …nanciers substantiels.
Il est décidé de faire une enquête à la sortie de l’ANPE (Agence Nationale Pour
l’Emploi) pour connaître l’opinion des jeunes sur ce nouveau contrat.

143
A. El Mossadeq Les Tests d’Hypothèse

La question posée sera:


"Pensez-vous que le CPE est une bonne chose pour
les jeunes en recherche d’emploi?"
On note p la proportion inconnue de la population répondant positivement à
cette question .

1. (a) Exprimer, en fonction d’une estimation f de p, la taille n de l’échantillon


à prélever pour que l’intervalle de con…ance de p obtenu après enquête ait
une amplitude de 0; 05 avec un coe¢ cient de con…ance de 95%.
(b) Si un pré-sondage 30% de réponses positives, quelle doit être la taille n
de l’échantillon à prélever?.
(c) Il est …nalement décidé de diminuer le coe¢ cient de con…ance à 90% et
de n’interroger que 500 personnes dont 130 répondent positivement à la
question posée.
Donner l’intervalle de con…ance de p.
2. Trois mois après la mise en place de ce contrat, le gouvernement françaisan-
nonce que le salaire moyen d’embauche du CPE est de 1100 e.
Lors d’une analyse des salaires de 100 personnes on obtient:

Salaire en e N ombre de personnes

[950-1000[ 17

[1000-1050[ 36

[1050-1100[ 31

[1100-1200[ 13

[1200-1500[ 3

144
Les Tests d’Hypothèse A. El Mossadeq

(a) Donner une estimation de la moyenne et de l’écart-type du salaire de


l’ensemble des personnes recrutées sur ce contrat.
(b) Tester l’hypothèse de normalité de la distribution des salaires de la popu-
lation concernée par ce contrat.
(c) Que pensez-vous de l’annonce du gouvernement français?

Solution 36
1. (a) Au seuil , l’intervalle de con…ance de p correspondant à une fréquence f
observée sur un échantillon de taille n est dé…ni par:
" r r #
f (1 f ) f (1 f )
f t1 =2 ; f + t1 =2
n n
Si l’amplitude de cet intervalle est 0; 05, alors:
r
f (1 f )
0:05 = 2t1 =2
n
d’où:
2t1 =2 2
n= f (1 f )
0:05
Pour = 5%, on a:
t0:975 = 1:96
d’où:
n = 6146:56f (1 f)
(b) Pour:
f = 0:03
on obtient:
n = 1291

145
A. El Mossadeq Les Tests d’Hypothèse

(c) Ici on a:
n = 500
f = 0:26
L’intervalle de con…ance de p est donné par:
" r r #
f (1 f ) f (1 f )
f t1 =2 ; f + t1 =2
n n
Pour = 10%, on a:
t0:95 = 1:645
d’où l’intervalle:
[22:8% 29:2%]

(a) désignons par ni l’e¤ectif de la ieme classe [xi ; xi+1 [ et ci le centre de


cette classe.
L’estimation m de la moyenne est donnée par:
5
1X
m= ni ci = 1058
n i=1

L’estimation s2 de la variance est donnée par:


5
X
1
2
s = ni (ci m)2 = 5364:64
n 1 i=1

d’où:
s = 73:24
(b) Testons au seuil = 10% l’hypothèse nulle H0 selon laquelle la répartition
des salaires (Y ) de la population concernée par ce contrat est distribué
selon une loi normale N m; s2 :La variable aléatoire:
Y m
X=
s

146
Les Tests d’Hypothèse A. El Mossadeq

est distribué donc selon une loi normale centrée réduite.


Calculons les probabilités intermédiaires:
xi m
pi = P [Y < xi ] = P X <
s
pour i 2 f1:2:3:4:5:6g, puisque:

P [xi Y < xi+1 ] = P [Y < xi+1 ] P [Y < xi ] = pi+1 pi

p1 p2 p3 p4 p5 p6

0:070 0:214 0:457 0:717 0:974 1

On obtient alors le tableau des e¤ectifs observée et théoriques:

Salaire en e Ef f ectif s Observes Ef f ectif s T heoriques

] 1-950[ 0 7

[950-1000[ 17 14:4

[1000-1050[ 36 24:2

[1050-1100[ 31 26

[1100-1200[ 13 25:7

[1200-1500[ 3 2:6

[1500- + 1[ 0 0:01

T otal 100 100

147
A. El Mossadeq Les Tests d’Hypothèse

Les e¤ectifs théoriques dans les deux dernières classes sont strictement in-
férieurs à 5, on procède alors aux regroupements des trois dernières classes.
On obtient alors le tableaux:

Salaire en e Ef f ectif s Observes Ef f ectif s T heoriques

] 1-950[ 0 7

[950-1000[ 17 14:4

[1000-1050[ 36 24:2

[1050-1100[ 31 26

[1100- + 1[ 16 28:4

T otal 100 100

Sous l’hypothèse nulle H0 , et vu que tous les e¤ectifs théoriques sont


supérieurs ou égaux à 5, la quantité:
5
X
2 (oi ti )2
=
i=1
ti
est une réalisation d’une variable du Khi-deux à:

5 1 2=2
2
degrés de liberté: 3 ;puisque pour le calcul des e¤ectifs théoriques nous
avons.utilisé les estimations de la moyenne et de la variance et pas leurs
valeurs réelles
Pour = 5%, on a:
2
2;:95 = 5:99

148
Les Tests d’Hypothèse A. El Mossadeq

et comme:
4
X
2 (oi ti )2
=
i=1
ti
= 22:93

On rejette l’hypothèse nulle H0 à 95% (aussi à 99:5%), c’est à dire que


la répartition des salaires de la population concernée par le CPE n’est pas
normale.
(c) Ici on a:
8
>
> n = 100
<
= 1100
>
> m = 1058
:
s = 73:24
Testons l’hypothèse nulle:

H0 : "l’annonce du gouvernement français est vraie "

Sous l’hypothèse nulle H0 , la quantité:


m
t= s
p
n
est une réalisation d’une variable aléatoire normale centrée réduite.
Pour = 5%, on a:
t:975 = 1:96
et comme:
m
t = s
p
n
= 5:73

On rejette alors H0 à 95% (aussi à 99:99%), c’est à dire, l’annonce du


gouvernement français est erronée.

149

Vous aimerez peut-être aussi