Vous êtes sur la page 1sur 10

Chapitre 3 : Les Tests statistiques (Paramétriques)

La théorie des tests consiste à formuler des hypothèses particulières sur les paramètres ou sur les
lois qui interviennent dans les problèmes étudiés, puis à apporter un jugement sur ces hypothèses.
Ce jugement est basé d’une part, sur les résultats obtenus sur un ou plusieurs échantillons extraits
de la population concernée et d’autre part, sur l’acceptation d’un certain risque dans la prise de
décision.

1. Notions générales sur les tests statistiques

1.1. Exemple introductif :


Considérons des lampes à incandescence dont la durée de vie est une variable aléatoire gaussienne
de moyenne µ = 1000 heures et d’écart-type σ = 100 heures (résultats établis expérimentalement).
Un ingénieur propose un nouveau procédé de fabrication qui doit améliorer, affirme-t-il, cette
durée de vie moyenne et la rendre égale à 1 075 heures. Cependant, le procédé, étant plus onéreux,
ne pourra être accepté que si l’amélioration est réelle.

Le résultat qui doit être vérifié est donc µ > 1000 heures. Deux hypothèses sont en présence :
– Soit µ = 1000 heures est une hypothèse encore vraie et le nouveau procédé n’a pas
modifié de façon significative la durée de vie des lampes,
– soit µ = 1075 heures et le nouveau procédé a apporté une réelle amélioration.
La deuxième affirmation est aussi une hypothèse car aucune expérience ne permet d’affirmer que
la moyenne des durées de vie augmentera réellement ( µ > 1000 heures). En effet, il est possible
que le nouveau procédé de fabrication n’améliore pas la durée de vie des ampoules de façon
appréciable, il pourrait même la diminuer.
En conclusion, rejeter l’hypothèse µ = 1000 heures ne conduit pas nécessairement à accepter
l’hypothèse µ > 1000 heures.

Les hypothèses ayant été formulées, il faut les accepter ou les rejeter à l’aide des données
apportées par un échantillon. Une incertitude est toujours associée au jugement apporté par le
statisticien, mais ce dernier doit essayer de limiter ce risque.

1.2. Principales définitions

– Une hypothèse statistique est une affirmation concernant certaines caractéristiques d’une
population telles que la valeur d’un ou de plusieurs paramètres, la forme de la distribution...
– Un test d’hypothèse ou test statistique est une démarche conduisant à élaborer une règle de décision
permettant de faire un choix entre deux hypothèses statistiques. Les hypothèses envisagées a
priori s’appellent :
 L’hypothèse nulle H0 . C’est l’hypothèse selon laquelle on fixe apriori la valeur d’un paramètre.
Elle spécifie une valeur particulière à analyser .
 L’hypothèse alternative H1 . On peut choisir pour cette hypothèse n’importe quelle hypothèse
compatible avec le problème étudié, mais différente de H0 . Elle énonce la modification de
l'hypothèse nulle à tester dans l'analyse.
Avant toute démarche statistique, il faut définir à quelle condition l’une ou l’autre des hypothèses
sera considérée comme vraisemblable. Les deux hypothèses ne jouent pas le même rôle. En effet,
c’est l’hypothèse nulle H0 qui est soumise au test et toute démarche statistique consiste à la
considérer comme vraie. Si le test conduit à la rejeter, c’est l’hypothèse alternative H1 qui sera
considérée comme vraie.

 La statistique du test: est la quantité de l'échantillon sur laquelle la décision de rejeter ou non
l'hypothèse nulle est basée.
 La région ou la zone de rejet: est l'ensemble des valeurs de la statistique du test qui entraine le
rejet de l'hypothèse nulle en faveur de l'hypothèse alternative. Le complémentaire de la
région de rejet est l'ensemble des valeurs de la statistique du test ne conduisant pas au rejet
de l'hypothèse alternative (région de non rejet).
 La valeur critique : est la frontière entre la zone de rejet et la zone de non rejet.

Comme hypothèse nulle H0 , on peut tester :


– une valeur particulière d’un paramètre : θ = θ0 ,
– l’égalité des valeurs d’un paramètre défini sur deux populations différentes,
– l’ajustement d’une distribution théorique à une distribution expérimentale.
L’hypothèse alternativeH1peut être :
θ = θ1 θ > θ0 θ < θ 0 θ ≠ θ0

Exemple:

Il est connu que les statistiques déduites des grands échantillons suivent la loi normale. Cela permet
de déterminer facilement la statistique du test pour tester les hypothèses. Comme illustration, on
choisit de tester par exemple : = pour le paramètre dont l'estimateur est suit une
distribution normale de moyenne et d'écart type . On suppose que est connu ou on peut
obtenir une bonne approximation lorsque la taille de l'échantillon est grande.
La statistique du test est donc:

=
En considérant les différentes hypothèses alternatives avec un risque d'erreur , on a:

Pour une hypothèse alternative du type: : > (un test unilatéral à droite) on a:
Pour une hypothèse alternative du type: : < (un test unilatéral à gauche) on a:

Pour une hypothèse alternative du type: : ≠ (un test bilatéral à risque


symétrique) on a:

−!"⁄# !"⁄#

1.3. Risques et probabilités d’erreur


Les tests d’hypothèse font intervenir la loi de la distribution de la statistique utilisée comme
estimateur pour le paramètre entrant en jeu dans l’hypothèse H0 .
Pour établir la crédibilité de l’hypothèse H0 , des règles très précises doivent être énoncées pour
permettre de conclure au rejet ou à l’acceptation de H0 .
Cependant, pour des événements dans lesquels le hasard intervient, il est impossible de prendre la
bonne décision sans risque de se tromper. Il faut donc mettre en œuvre une règle conduisant à rejeter
H0 , si elle est vraie, que dans une faible proportion des cas. Cette décision a un caractère
probabiliste, toute décision comporte un risque qu’elle soit erronée. Ce risque, noté α , qui est le risque
de rejeter à tort l’hypothèse H0 alors qu’elle est vraie et qui favorise donc l’hypothèse H1 s’appelle
seuil de signification ou risque de première espèce (erreur de type I).

= |
Ce risque α définit la région critique W , d’aire α et de probabilité α , sous l’hypothèse H0 . C’est
l’ensemble des valeurs de la variable aléatoire de décision qui conduisent à écarter H0 au profit de
H1 .
La région complémentaire, W , d’aire (1 − α ) et de probabilité (1 − α ) , représente la région
d’acceptation de l’hypothèse H0 .
La règle de décision peut se formuler de la façon suivante :
Si la valeur de la statistique considérée appartient à la région d’acceptation W , on favorise l’hypothèse nulle H0 , si
elle appartient à la région critique W , on favorise l’hypothèse alternative H1 .
La règle de décision comporte un risque β ou risque de deuxième espèce, c’est le risque de ne pas
rejeter H0 alors que H1 est vraie :

%= & ' | ( )

On peut aussi écrire, en introduisant la région critique W :

( )
Pr W / H 0 = 1 − α Pr (W / H1 ) = 1 − β
En résumé:
– Erreur de première espèce : on rejette H0 alors que H0 est vraie.
– Erreur de deuxième espèce : on ne rejette pas H0 alors que H1 est vraie.

1.4. La démarche d'un test statistique


À partir des différents éléments présentés jusqu' à présent (hypothèse nulle, hypothèse alternative,
région critique, seuil critique, statistique de test, risque de première espèce), nous pouvons résumer
la démarche d’un test statistique de la façon suivante :
─ Étape 1. Poser l'hypothèse nulle et l’hypothèse alternative , en faisant attention à ce
que l’hypothèse nulle corresponde à l’hypothèse pour laquelle le coût associé à l'erreur de type
I soit le plus élevé.
─ Étape 2. Définir la forme de la région critique : cela revient à définir la statistique de test * ainsi
que la zone de rejet de l'hypothèse nulle exprimée en fonction des réalisations de cette
statistique.
─ Étape 3. À partir des hypothèses faites sur la (ou les) variable(s) d'intérêt et l'échantillon,
dériver la distribution exacte ou la distribution asymptotique de la statistique de test T sous
l'hypothèse nulle.
─ Étape 4. Déterminer la (ou les) valeur(s) critique(s) en fonction du niveau de risque + du test.
─ Étape 5. Calculer la réalisation de la statistique de test * à partir des observations de
l'échantillon.
─ Étape 6. Comparer cette réalisation à la région critique du test. Si la réalisation de la statistique
de test appartient à la région critique, on conclut au rejet de l'hypothèse nulle pour un
niveau de risque +. Si, au contraire, cette réalisation n'appartient pas à la région critique, on
conclut que l'on ne peut pas rejeter l’hypothèse nulle pour un niveau de risque +.

2. Principaux tests paramétriques sur une seule population


2.1. Tests sur les paramètres µ et σ d’une loi normale
2.1.1. Test sur la moyenne µ des grands échantillons

Cette section traite du cas où, on a de grands échantillons d'une population normale, ou de grands
échantillons d'une population de loi quelconque mais se ramenant à une loi normale par le biais du
théorème central limite. On choisit un risque de première espèce .
Lorsque l’écart-type est connu ou estimé par ,. Selon l’hypothèse H1 , différents cas sont à
étudier :
La statistique du test (lorsque vraie) est donnée par:
-̅ − /
= → 230, 17
⁄ √&

: 8 = 8 9: : 8 ≤ 8 <= :8>8

La variable de décision est la statistique -̅ dont la loi est facile à établir :


Loi de X sous H0 (
N µ0 ;σ n )
Loi de X sous H1 N ( µ ;σ
1 n)
En désignant par α le risque de première espèce, la région critique est définie par :
-̅ − /
3 > !" 7 = ≡ ? > !" @ =
⁄√&
Décision: l'hypothèse nulle est rejetée si

-̅ − /
> !" A) -̅ > / + !" ⁄√&
⁄ √&
Ou encore lorsque
-̅ − /
CDECFEé = > EF = !"
⁄√&

: 8 = 8 9: : 8 ≥ 8 <= :8<8

La variable de décision est la statistique -̅ dont la loi est facile à établir comme dans le cas
précédent. En désignant par α le risque de première espèce, la région critique est définie par :
-̅ − /
3 < −!" 7 = ≡ ? < −!" @ =
⁄√&
Décision: l'hypothèse nulle est rejetée si

-̅ − /
< −!" A) -̅ < / − !" ⁄√&
⁄√&
Ou encore lorsque
-̅ − /
CDECFEé = <− EF = −!"
⁄√&
: 8 = 8 <= :8≠8
La variable de décision est la statistique -̅ dont la loi est facile à établir comme dans le cas
précédent. En désignant par α le risque de première espèce symétrique, la région critique est
définie par :
-̅ − /
I−!"⁄# < < !"⁄# J = ≡ ?−!"⁄# < < !"⁄# @ =
⁄√&
Décision: l'hypothèse nulle est rejetée si

-̅ − / -̅ − / -̅ − /
K K > !"⁄# ≡ < −!"⁄# A) > !"⁄#
⁄√& ⁄√& ⁄ √&

De manière équivalente, on a:
-̅ < / − !"⁄# ⁄√& A) -̅ > / + !"⁄# ⁄√&

Ou encore lorsque
-̅ − /
| CDECFEé | = K K> EF = !"⁄#
⁄√&

2.1.2. Test sur la moyenne µ des petits échantillons


Cette section traite du cas où, on a des échantillons de petite taille d'une population normale, ou
lorsque la loi est inconnue et que le théorème central limite ne peut plus fonctionner mais on fait
l'hypothèse de normalité. On choisit un risque de première espèce .
Dans ce cas, l’écart-type est estimé par ,. Selon l’hypothèse H1 , différents cas sont à étudier :
La statistique du test (lorsque vraie) est donnée par:

-̅ − /
*= → , )L & 3& − 17
⁄√&

: 8 = 8 9: : 8 ≤ 8 <= :8>8

En désignant par α le risque de première espèce, la région critique est définie par :
-̅ − /
I* > 3MNO7," J = ≡ ? > 3MNO7," @ =
⁄√&
Décision: l'hypothèse nulle est rejetée si

-̅ − /
> 3MNO7," A) -̅ > / + 3MNO7," ⁄ √&
⁄ √&
Ou encore lorsque
-̅ − /
*CDECFEé = > EF = 3MNO7,"
⁄√&
2.2. Test sur l’écart-type P
Généralement, la variance de la population est inconnue. Souvent il est souhaitable de faire un test
concernant la valeur de la variance de la population # . Pour ce faire, on utilise la statistique utilisée
lors de la construction de l'intervalle de confiance.

Si la moyenne µ est connue la statistique (sous l'hypothèse ) du test est:

&, Q#
# → R3M7
#

: #
= #
A) : #
≤ #
O:
#
> #

En désignant par α le risque de première espèce, la région critique est définie par :

IR3M7
#
> R3M7,"
#
J=

Décision: On rejette l'hypothèse nulle si


&, Q#
# > R3M7
#

ou si
&, Q#
RCDECFEé
#
= # > REF
#
= R3M7,"
#

: #
= #
A) : #
≥ #
O:
#
< #

En désignant par α le risque de première espèce, la région critique est définie par :

IR3M7
#
< R3M7,ON"
#
J=1−

Décision: On rejette l'hypothèse nulle si


&, Q#
# < R3ON"7,M
#

ou si
&, Q#
RCDECFEé
#
= # < REF
#
= R3M7,ON"
#

: #
= #
O:
#
≠ #

En désignant par α le risque de première espèce symétrique , la région critique est


définie par :

IR3M7,ON"
#
⁄# < R3M7 < R3M7,"⁄# J =
# #

Décision: On rejette l'hypothèse nulle si


&, Q# &, Q#
# > R3M7,"
#
⁄# A) # < R3M7,ON"
#
⁄#

Si la moyenne µ est inconnue la statistique (sous l'hypothèse ) du test est:

3& − 17, #
# → R3MNO7
#

:
= # A)
#
: #≤ # O:
#
> #
En désignant par α le risque de première espèce, la région critique est définie par :

IR3MNO7
#
> R3MNO7,"
#
J=
Décision: On rejette l'hypothèse nulle si
3& − 17, #
# > R3MNO7,"
#

ou si
3& − 17, #
RCDECFEé
#
= # > REF
#
= R3MNO7,"
#

: # = # A) : # ≥ # O:
#
< #
En désignant par α le risque de première espèce, la région critique est définie par :

IR3MNO7
#
< R3MNO7,ON"
#
J= 1−
Décision: On rejette l'hypothèse nulle si
3& − 17, #
# < R3MNO7,ON"
#

ou si
3& − 17, #
RCDECFEé
#
= # < REF
#
= R3MNO7,ON"
#

: #= # O:
#
≠ #
En désignant par α le risque de première espèce symétrique, la région critique est définie par :

IR3MNO7,ON"
#
⁄# < R3MNO7 < R3MNO7,ON"⁄# J =
# #

Décision: On rejette l'hypothèse nulle si


3& − 17, # 3& − 17, #
# > R #
3MNO7,"⁄# A) # < R3MNO7,ON"
#
⁄#

2.3. Tests sur une proportion (grand échantillons)


Le but est de tester si la proportion p d’individus d’une population P , présentant un certain
caractère qualitatif peut être considérée comme égale ou non à une valeur p0 .
Un estimateur sans biais de p est la proportion F d’individus présentant ce caractère dans un
échantillon aléatoire de taille n . La variable aléatoire S = &T (nombre d’individus présentant ce
caractère) suit la loi binomiale B ( n; p ) . Si la taille de l'échantillon est grande de sorte à appliquer
le théorème central limite ( np et n (1 − p ) sont supérieurs à 5), on peut approximer la loi binomiale
par une loi normale. On en déduit que F suit approximativement la loi normale :
 p (1 − p ) 
N  p; 
 n 
 
(M − '
= → 230, 17
U'31 − '7⁄&
Sous l'hypothèse : ' = ' , la statistique du test est donnée par:

(M − '
= → 230, 17
U' 31 − ' 7⁄&

: V = V 9: : V ≤ V <= :V> V
En désignant par α le risque de première espèce, la région critique est définie par :
(M − '
3 > !" 7 = ≡ ? > !" @ =
U' 31 − ' 7⁄&
Décision: l'hypothèse nulle est rejetée si

(M − '
> !" A) (M > ' + !" U' 31 − ' 7⁄&
U' 31 − ' 7⁄&
Ou encore lorsque
(M − '
CDECFEé = > EF = !"
U' 31 − ' 7⁄&

: V = V 9: : V ≥ V <= :V< V
En désignant par α le risque de première espèce, la région critique est définie par :
(M − '
3 < −!" 7 = ≡ ? < −!" @ =
U' 31 − ' 7⁄&
Décision: l'hypothèse nulle est rejetée si

(M − '
< −!" A) (M < ' − !" U' 31 − ' 7⁄&
U' 31 − ' 7⁄&
Ou encore lorsque
(M − '
CDECFEé = <− EF = −!"
U' 31 − ' 7⁄&

: V = V <= :V≠V

En désignant par α le risque de première espèce symétrique, la région critique est définie par :
(M − '
I−!"⁄# < < !"⁄# J = ≡ ?−!"⁄# < < !"⁄# @ =
U' 31 − ' 7⁄&
Décision: l'hypothèse nulle est rejetée si
(M − ' (M − ' (M − '
K K > !"⁄# ≡ < −!"⁄# A) > !"⁄#
U' 31 − ' 7⁄& U' 31 − ' 7⁄& U' 31 − ' 7⁄&
De manière équivalente, on a:
(M < ' − !"⁄# U' 31 − ' 7⁄& A) (M > ' + !"⁄# U' 31 − ' 7⁄&

Ou encore lorsque
(M − '
| CDECFEé | = K K> EF = !"⁄#
U' 31 − ' 7⁄&

: 8 = 8 9: : 8 ≥ 8 <= :8<8
La variable de décision est la statistique -̅ dont la loi est facile à établir comme dans le cas
précédent. En désignant par α le risque de première espèce, la région critique est définie par :
-̅ − /
I* < − 3MNO7," J = ≡ ? < − 3MNO7," @ =
⁄√&
Décision: l'hypothèse nulle est rejetée si

-̅ − /
<− 3MNO7," A) -̅ < / − 3MNO7," ⁄ √&
⁄√&
Ou encore lorsque
-̅ − /
*CDECFEé = <− EF =− 3MNO7,"
⁄ √&

: 8 = 8 <= :8≠8

La variable de décision est la statistique -̅ dont la loi est facile à établir comme dans le cas précédent.
En désignant par α le risque de première espèce symétrique, la région critique est définie par :
-̅ − /
I− 3MNO7,"⁄# < * < 3MNO7,"⁄# J = ≡ ?− 3MNO7,"⁄# < < 3MNO7,"⁄# @ =
⁄ √&

Décision: l'hypothèse nulle est rejetée si

-̅ − / -̅ − / -̅ − /
K K> 3MNO7,"⁄# ≡ <− 3MNO7,"⁄# A) > 3MNO7,"⁄#
⁄ √& ⁄ √& ⁄ √&

De manière équivalente, on a:
-̅ < / − 3MNO7,"⁄# ⁄√& A) -̅ > / + 3MNO7,"⁄# ⁄ √&

Ou encore lorsque
-̅ − /
|*CDECFEé | = K K> EF = 3MNO7,"⁄#
⁄ √&

Vous aimerez peut-être aussi