Vous êtes sur la page 1sur 12

Chapitre

Les tests d’hypothèses

1. Principe des tests statistiques


Dans le dernier chapitre, le problème de l’estimation a été formulé ainsi : il existe un
paramètre θ inconnue d’une population (moyenne, variance, proportion, …) ou d’une loi de
probabilité que l’on veut estimer à partir d’un échantillon, sans idée a priori sur la valeur de ce
paramètre. En théorie des tests, au contraire, une hypothèse sur le phénomène étudié, sur la
valeur du paramètre, est énoncée. Confirmer cette hypothèse, ou au contraire l’infirmer, sur la
base des résultats d’un échantillon est un problème de test statistique.
Les tests statistiques constituent alors un autre un autre aspect important de l’inférence
statistique. Le principe général d’un test d’hypothèse peut s’énoncer comme suit : soit une
population dont les éléments possèdent un caractère (mesurable ou dénombrable) et dont la
valeur du paramètre, relative au caractère étudié, est inconnue. Une hypothèse est formulée
sur la valeur du paramètre ; cette formulation résulte des considérations théoriques, pratiques
ou encore elle est simplement basée sur un pressentiment.
Il est évident que la statistique (Variable d’échantillonnage) servant d’estimation aux
paramètres de la population ne prendra pas une valeur rigoureusement égale à la valeur
théorique proposée dans l’hypothèse ; elle comporte des fluctuations d’échantillonnage qui
sont régies par des distributions connus.
La construction d’un test d’hypothèse consiste effectivement à déterminer entre quelles
valeurs peut varier la statistique, en supposant l’hypothèse vraie, sur la seule considération du
hasard de l’échantillonnage. Les distributions d’échantillonnage d’une moyenne, d’une
variance et d’une proportion que nous avons traité précédemment vont être particulièrement
utile dans l’élaboration d’un test statistique.

2. Définitions
2.1. Hypothèse Statistique
Une hypothèse statistique est un énoncé (une affirmation) concernant les
caractéristiques (valeurs des paramètres, forme de la distribution des observations) d’une
population.
2.2. Test d’hypothèse
Un test d’hypothèse (ou test statistique) est une démarche qui a pour but de fournir une
règle de décision permettant, sur la base des résultats d’échantillon, de faire un choix entre
deux hypothèses statistiques.
2.3. Hypothèse Nulle (H0) et Hypothèse Alternative (H1)
L’hypothèse selon laquelle on fixe a priori un paramètre de la population à une valeur
particulière s’appelle l’hypothèse nulle ou encore l’hypothèse privilégiée est noté H0.

1
N’importe qu’elle autre alternative est appelé hypothèse adverse (ou encore hypothèse
alternative ou contre hypothèse) et elle est notée H1.
2.4. Seuil de signification d’un test Statistique
Le risque, consenti à l’avance et qu’on note « α », de rejeter à tort l’hypothèse nulle H0
alors qu’elle est vraie (et de favoriser alors l’hypothèse) alternative H1) s’appelle le seuil de
signification du test et s’énonce en probabilité comme suit :
  PErreur Type I 
 PRe jeter H 0 / H 0 est vraie
 P Accepter H 1 / H 0 est vraie
α est la probabilité de rejeter à tort H0, est le risque d’erreur de premier espèce.
  PErreur Type II 
 P Accepter H 0 / H 0 est fausse
 P Accepter H 0 / H 1 est vraie
β est la probabilité d’accepter à tort H0, est le risque d’erreur de deuxième espèce.

2.5. Région Critique « W » et région d’acceptation de H0


1- La région de rejet ou région critique W
La région de rejet de l’hypothèse H0 ou région critique W est le sous ensemble des
réalisations de l’échantillon qui conduisent à rejeter l’hypothèse H0, c’est-à-dire les valeurs
x1 , x2 ,..., xn  telles que : si x1 , x2 ,..., xn W , alors on rejette H0.

2- La région d’Acceptation W
La région d’Acceptation W (complémentaire de W) de l’hypothèse H0 est le sous
ensemble des réalisations de l’échantillon qui conduisent à ne pas rejeter l’hypothèse H0,
c’est-à-dire les valeurs x1 , x2 ,..., xn  telles que : si x1 , x2 ,..., xn W , alors on ne rejette pas
H0.

2.6.Fonction Puissance
La fonction puissance, Π(θ),d’un test de H0 est la probabilité de rejeter H0 lorsque la
vraie valeur du paramètre est θ. Pour des hypothèses simples :
H 0 :    0

H1 :   1 1   0 
On a :  0   PEI    et 1   1  PEII   1  
1     1   est appelée la puissance du test.

Actions Etats Accepter H0 Rejeter H0


H0 est vraie Bonne décision (1-α) Erreur de Premier Espèce (α)
H0 est fausse Erreur de Deuxième Espèce (β) Bonne décision (1-β)

Exemple :
Une population normale admet une variance  2  4 . Déterminer la probabilité β pour les
H 0 :   0
hypothèses simples : 
H1 :   1
à un seuil de signification α = 0.05 pour un échantillon de taille n = 10. Calculer alors la
puissance du test.

2
3. Test Uniformément le plus puissant : « La méthode de Neyman et Pearson »
La méthode de Neyman et Pearson, très utilisée pour construire un test, se situe dans le
contexte suivant : le test est effectué entre deux hypothèses simples : pour une taille
d’échantillon déterminée, on se fixe une valeur α du risque de premier espèce et on détermine
la région critique qui minimise le risque de deuxième espèce β, ou maximise la puissance du
test. Le théorème de Neyman et Pearson fournit la réponse à ce problème.
Soit x1 , x2 ,..., xn  un échantillon de taille « n » issu de f x,  et θ0 et θ1 deux valeurs fixes
de θ. La fonction Vraisemblance de x1 , x2 ,..., xn  est donnée par :
n
Lx1 , x2 ,..., xn ,    f xi ,  .
i 1
S’il existe une constante positive « k » et un sous-ensemble W de l’ensemble de réalisation
telles que :
1- Px1 , x2 ,..., xn W , 0    .
Lx, 0 
2-  k pour x1 , x2 ,..., xn W .
Lx,1 
Lx, 0 
3-  k pour x1 , x2 ,..., xn W .
Lx,1 
Alors W est la meilleur région critique de niveau α pour tester l’hypothèse nulle H0 : θ = θ0
contre l’hypothèse alternative H1 : θ = θ1.

Exemple :
Soit x1 , x2 ,..., xn  un échantillon de taille « n » issu d’une loi de poisson de paramètre λ,
P  . Déterminer la meilleure région critique pour tester :
H 0 :   2
 .
H1 :   4
Calculer alors « α » pour n = 4 et k = 13.

3
4. Test d’une moyenne ou d’une espérance mathématique
Le problème le plus courant est celui du test d’une moyenne. Le contexte est le suivant :
Soit X une Variable Aléatoire et x1 , x2 ,..., xn  un échantillon de X ; on s’intéresse au
paramètre réel   E  X  .
4.1. Test d’une moyenne μ dans le cas où l’écart-type σ est connu
1- La variable X suit une loi Normale
H 0 :    0 ou (    0 )
a- Dans le test Unilatéral droit de niveau α de 
H1 :    0
  
La région de rejet de H0 est : WD   X   0  z .
 n
H 0 :    0 ou (    0 )
b- Dans le test Unilatéral gauche de niveau α de 
H1 :    0
  
La région de rejet de H0 est : WG   X   0  z .
 n
H 0 :    0
c- Dans le test bilatéral de niveau α de 
H1 :    0
   
La région de rejet de H0 est : W   X   0  z  ; X   0  z .
 2 n 2 n 

Exemples :
1. Une population normale admet une variance  2  4 . Déterminer la probabilité « β » pour
H 0 :   0
les hypothèses simples :  à un seuil de signification α = 5% pour un échantillon
H1 :   1
de taille n = 10.
2. Soit x1 , x2 ,..., xn  un échantillon de taille 16 issus d’une distribution normale,
X i  N  ,1 et on veut tester H0 : μ = 20 au niveau de signification α = 5%, basée sur la
moyenne empirique X .
a- Déterminer les régions critiques de la forme A  X /    X  a et B  X / b  X  .

4
b- Déterminer les probabilités de l’erreur de Type II pour chaque région de la question (a)
pour l’alternative H1 : μ = 21. Laquelle des deux régions critiques n’est pas compatibles avec
cette alternative ?
c- Refaire le travail de la question (b) pour l’alternative H1 : μ = 19.
d- Quel est le niveau de signification du test ayant pour région critique A U B ?
e- Quelle est la valeur de « β » pour un test de région critique A U B si   20  1 .
3. Déterminer la région critique du Test de Neyman et Pearson et calculer sa puissance dans
le cas où n=100 et α = 5%. Que devrait être la taille de l’échantillon minimum pour cette
puissance soit supérieure à 95% ?

4.2.Test d’une moyenne μ dans le cas où l’écart-type σ est inconnu


1- La variable X suit une loi Normale
X 
Si n  30 , on utilise la statistique T  *  St n  1 .
S n
H 0 :    0 ou (    0 )
a- Dans le test Unilatéral droit de niveau α de 
H1 :    0
  S* 
La région de rejet de H0 est : WD   X   0  t n1 .
 n
H 0 :    0 ou (    0 )
b- Dans le test Unilatéral gauche de niveau α de 
H1 :    0
  S* 
La région de rejet de H0 est : WG   X   0  t n1 .
 n

5
H 0 :    0
c- Dans le test bilatéral de niveau α de 
H1 :    0
 S*  
La région de rejet de H0 est : W   X   0  tn21 ; X   0  t n21 .
 n n

Remarque:
X 
Si n > 30, alors on utilise T   N 0,1 .
S* n

Exemple :
Lorsqu’une machine est bien réglée, elle produit des pièces dont le poids moyen est de 80
grammes. Trois heures après un réglage de la machine on a prélevé au hasard un échantillon
de 20 pièces. Le poids moyen de cet échantillon de 20 pièces est de 79 grammes et le moment
non centré d’ordre 2 est de 125124. Que peut-on conclure, quant à la qualité du réglage de la
machine après trois heures de fonctionnement ? On prendra un risque α = 5%. On admettra
que le poids moyen est une variable aléatoire normale.

5. Test d’une variance ou d’un écart-type


Les tests sur  2  Var  X  ou   Var  X  se présentent sous la même forme, unilatérale
ou bilatéral, que ceux sur la moyenne :
H 0 :    0 ou (   0 )
 2 2 2 2

-Test unilatéral droit :  .


H1 :    0
 2 2

H 0 :    0 ou (   0 )
 2 2 2 2

- Test Unilatéral Gauche :  .


H1 :    0
 2 2

H 0 :    0
 2 2

- Test bilatéral :  .
H1 :    0
 2 2

 
Soit X  N  , 2 . On cherche une statistique dont la loi de probabilité est connue, sous
l’hypothèse H0.
2
 x  0 
n
 Lorsque μ = μ0 est connue, alors   i    n  .
2

i 1   

6
n  1S *   2 n  1 .
2 2
x X
n

 Lorsque μ est inconnue, et estimée par X , alors   i  
i 1    2

5.1. Test sur la variance σ2 d’une loi Normale où la moyenne μ connue


1 n nS 2
On a S 2   xi   0  donc 2   2 n  .
2

n i 1 
H :    0 ou (   0 )
 2 2 2 2

1- Dans le test Unilatéral droit de niveau α de  0 , la région de


 H
 1 :  2
  2
0


   
2 2

rejet de H0 est : WD  S 2  0  ,n  .

 n  
H 0 :    0 ou (   0 )
 2 2 2 2

2- Dans le test Unilatéral gauche de niveau α de  , la région de


 H
 1 :  2
  0
2


  
2 2


rejet de H0 est : WG  S 2  0 1 ,n  .

 n 

H :    0
 2 2

3- Dans le test Unilatéral bilatéral de niveau α de  0 , la région de rejet de H0


 H
 1 :  2
  2
0

 0  
2 2
 0  
2 2

 2 1 , n
2 
,n
est : W  S  2
ou S 
2
.
 n n 
 
Exemple :
A fin de tester la précision d’une balance, une masse connue avec précision, de 10
grammes, est pesée 10 fois. Les résultats sont les suivants : 10.008, 10.012, 9.99, 9.998,
9.995, 10.001, 9.996, 9.989, 10.0 et 10.015.
Tester la précision de la balance et vérifier si elle reste dans les normes fixées par le
réglementation à σ0 = 0.005. On prendra un risque α = 5%.

7
5-2- Test sur la variance σ2 d’une loi Normale où la moyenne μ inconnue

xi  X 2 donc n  12S   2 n  1.


*2
1 n
On a S *2

n  1 i 1 
H 0 :  2   02 ou ( 2   02 )

1- Dans le test Unilatéral droit de niveau α de  , la région de
H1 :    0
 2 2

 * 2  0   ,n1 
 2 2

rejet de H0 est : WD  S  .

 n 1  
H 0 :    0 ou (   0 )
 2 2 2 2

2- Dans le test Unilatéral gauche de niveau α de  , la région de


H1 :    0
 2 2

 * 2  0 1 ,n1 
 2 2

rejet de H0 est : WG  S  .

 n 1  
H 0 :    0
 2 2

3- Dans le test Unilatéral bilatéral de niveau α de  , la région de rejet de H0



 H 1 :  2
  2
0

 0 
2 2
 0  
2 2

 *2 1 ,n 1
*2
,n 1 
est : W  S  2
ou S  2
.
 n  1 n  1 
 

Exemple :
Soit x1 , x2 ,..., xn  un échantillon de taille n = 20 issus d’une distribution normale,
 
X i  N  , 2 et on suppose que X  11 et S *  4 .
 H 0 :  2  9
a- Tester  avec un niveau de signification α = 0.01.
 H 1 :  2  9
b- Quelle devrait être la taille de l’échantillon dans la question (a) pour avoir 90 % de
chance de rejeter H0 lorsque en réalité  2  18 .

8
6. Test sur une proportion p
On suppose que n > 30.
 p 1  p0  
Sous H0 : p = p0, on a X  N  p0 , 0 .
 n 
H 0 : p  p0 ou ( p  p0 )
a- Dans le test Unilatéral droit de niveau α de 
 H 1 : p  p0
 p0 1  p0  
La région de rejet de H0 est : WD   X  p0  z .
 n 
H 0 : p  p0 ou ( p  p0 )
b- Dans le test Unilatéral gauche de niveau α de 
 H 1 : p  p0
 p0 1  p0  
La région de rejet de H0 est : WG   X  p0  z .
 n 
 H 0 : p  p0
c- Dans le test bilatéral de niveau α de 
 H 1 : p  p0
 p0 1  p0  p0 1  p0  
La région de rejet de H0 est : W   X  p0  z  ; X  p0  z  .
 2
n 2
n 

Exemple :
Pour obtenir l’autorisation de mise sur le marché, un laboratoire pharmaceutique
affirme que son médicament est efficace à 80 %. Dans un centre hospitalier, on choisit au
hasard, un échantillon de 200 individus on administre le médicament. A l’issue d’une certaine
période, on note que pour 150 individus, le traitement est efficace. Que peut-on conclure, au
seuil de signification α = 0.05, quand à l’affirmation du labo.

7. Test de comparaison
7.1. Test de comparaison de deux moyennes de lois normales
   
Soient : X1  N 1,  12 et X 2  N  2 , 22 tel que X1 et X2 sont indépendantes.
1- Comparaison de deux moyennes, les variances étant connues

9
 H 0 : 1   2
a- Dans le cas d’un Test Bilatéral, il s’agit de tester  .
 H 1 : 1   2
On utilise la statistique Z  1
X  X 2   1   2   N 0;1 . Au seuil de signification α, la
 12  12

n1 n2
région critique est :

  12  12  12  12 
W  X 1  X 2    z   ou X 1  X 2   z   


1
2
n 1 n 2
1
2
n1 n 2 

H 0 : 1   2 ou ( 1   2 )
b- Dans le test Unilatéral droit de niveau α de 
H1 : 1   2

  12  12 
La région de rejet de H0 est : WD   X 1  X 2   z1  .

 n1 n 2 

H 0 : 1   2 ou ( 1   2 )
c- Dans le test Unilatéral gauche de niveau α de 
H1 : 1   2

  12  12 
La région de rejet de H0 est : WG   X 1  X 2    z1  .

 n1 n 2 

2- Comparaison de deux moyennes, les variantes étant inconnus, mais égales

Si      , l’estimateur de 
2 2 2 2
utilisé est : S *2

n1  1S1*  n2  1S 2*
2 2

. On utilise,
1 2
n1  n2  2

ainsi, la statistique T 
X 1  X 2   1   2 
 St n1  n2  2
1 1
S *

n1 n2
H 0 : 1   2 ou ( 1   2 )
a- Dans le test Unilatéral droit de niveau α de 
H1 : 1   2
 1 1 
La région de rejet de H0 est : WD   X 1  X 2   t1 ;n1  n2 2 S *  .
 n1 n2 
H 0 : 1   2 ou ( 1   2 )
b- Dans le test Unilatéral gauche de niveau α de 
H1 : 1   2
 
La région de rejet de H0 est : WG   X 1  X 2   t1 ;n1 n2 2 S *
1 1
 .
 n1 n2 
 H 0 : 1   2
c- Dans le cas d’un Test Bilatéral, il s’agit de tester  .
 H 1 : 1   2
Au seuil de signification α, la région critique est :
 1 1 
W   X 1  X 2   t  ou X 1  X 2   t 
1 1
S*  S*  
 1 ;n1  n2  2
2
n1 n 2
1 ;n1  n2  2
2
n1 n2 

10
7.2. Test de comparaison de deux variances
Soit le test de comparaison de deux variances de variables gaussiennes
  12
H
 0 : 1

H 0 :  1   2
2 2
  22
 qui s’écrit également  . Deux situations sont à envisager, selon
H1 :  1   2
 H :  1  1
2 2 2

 1  22
que les moyennes sont connues ou non.

1- Comparaison de deux variances où les moyennes étant connues


n1 S12
n1
 12 S12  22
On a alors F    F n1 ;n2 
n2 S 22 S 22  12
n2
2
2
 
On peut donc écrire : P F   F  F   1 .
 1 2 ,n1 ,n2 2
,n1 ,n2

 S1 2
S12 
La région critique est W   2  F  ou 2  F .
 S2 1 ,n1 ,n2
2
S2 2
,n1 ,n2

2- Comparaison de deux variances où les moyennes étant inconnues


1 n1 1 n2
*2
On utilise les estimateurs de  1 et  2 , S1 
2 2
 xi  X 1  et S 2 
2 *2
 xi  X 2 2 ,
n1  1 i 1 n2  1 i 1
et dans ce cas
n1  1S1* 2 n  1
2
1 S1*  22
2 1
F   F n1  1; n2  1 .
n2  1S 2* 2 n  1 S 2*  1
2 2

22 2

 *2
 S1 S1*
2


La région critique du test est donc : W   2  F  ou 2  F 
 *
 S2
1 ,n1 1,n2 1
2 S 2* 2
,n1 1,n2 1

Exemple :
Pour comparer deux marques d’ampoule électrique, on a effectué des essais sur des
échantillons au hasard. La durée de vie moyenne observée sur un échantillon de 25 ampoules
de la marque (1) est de 1012 heurs, avec un écart-type empirique de 241 heures. Sur un
échantillon de 13 ampoules de la marque (2), on a obtenu respectivement 1104 heures et 319
heures. Peut-on considérer que ces marques sont de qualité équivalente ?

11
7-3- Test de comparaison de deux proportions
Soient : X 1  B1, p1  et X 2  B1, p2  tel que X1 et X2 sont indépendantes.
 H 0 : p1  p2
Considérons le test  à deux échantillons n1 et n2, tirés indépendamment l’un de
 H 1 : p1  p2
l’autre dans X1 et X2. Alors si n1 et n2 > 30 alors d’après le TCL nous permet d’écrire :

X 1  X 2   N  p1  p2 ; p1  p1  1  p2  p2  1  .
 
 n1 n2 
Généralement  1  p1 1  p1  et  2  p2 1  p2  sont inconnues. La région critique est
2 2

 f1  f1  1 f 2  f 2  1 f1  f1  1 f 2  f 2  1 
W  X 1  X 2    z1  ou X 1  X 2   z1  
 n1 n2 n1 n2 

Exemple :
Les proportions des ménages propriétaires de leur logement parmi les 158 ménages du
quartier A est égale à 32.3 %. Dans un quartier voisin, sur un échantillon aléatoire de 250
ménages, on a noté 45% de propriétaires.
Peut-on considérer qu’il y’a une différence entre les proportions des ménages propriétaires
dans les deux cartiers ? On prendra α = 0.05.

12

Vous aimerez peut-être aussi