Vous êtes sur la page 1sur 66

Chapitre IV : Tests d’hypothèses

Pr. A. Zoglat

Dép. de Maths

FSR

SMA
S6 : Statistique Inférentielle

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 1 / 65


Contenu du Chapitre

1 Introduction
2 Méthodes
3 Lemme de Neyman-Pearson
4 Familles à rapport de vraisemblance monotone
5 Exemples
6 Exemples de tests usuels
Tests sur les variances
Tests sur les proportions
Cas des échantillons appariés
7 Exercices
Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 1 / 65
Exemple
La durée de vie d’une ampoule est une v.a. de loi N (µ, σ2 ). Les ampoules
fabriquées selon un certain procédé ont une durée de vie moyenne de 600
heures avec un écart type de 10 heures. Un nouveau procédé est sensé
allonger la durée de vie moyenne. Ci-dessous sont les durées de vie de 10
ampoules fabriquées selon le nouveau procédé :

510; 614; 780; 603; 512; 501; 534; 603; 788; 650.

À partir de ces données peut-on conclure que le nouveau procédé améliore la


durée de vie moyenne des ampoules ? L’objectif d’un test d’hypothèse est de
répondre à ce genre de question.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 2 / 65


Notons encore µ la durée de vie moyenne des ampoules fabriquées
selon le nouveau procédé. La question d’intérêt peut alors être
exprimée de la manière suivante : A t-on “µ ≤ 600” ou “µ > 600” ? De
manière générale, on a la

Définition
Soit θ ∈ Θ un paramètre d’une loi de probabilité et Θ0 et Θ1 deux
sous-ensembles disjoints de Θ tels que Θ0 ∪ Θ1 = Θ. Les assertions
H0 : θ ∈ Θ0 et H1 : θ ∈ Θ1 sont appelées respectivement l’hypothèse
nulle et l’hypothèse alternative.
Un test d’hypothèse est une procédure qui conduit à conclure que H0
est fausse ou qu’elle est vraie.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 3 / 65


Exemple (suite)

Reconsidérons l’exemple de la durée de vie des ampoules fabriquées


selon un nouveau procédé.
On cherche à tester l’hypothèse H0 : µ ≤ 600 versus H1 : µ > 600.
L’échantillon fournit la statistique X qui est un estimateur sans biais
pour µ. Une procédure naturelle de décision consisterait à rejeter H0
lorsque X > C, où C est une constante à déterminer.
La décision qui sera prise dépend donc de l’échantillon observé. Elle
est donc assujettie à l’erreur.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 4 / 65


Quelle que soit la décision prise, il y a toujours un risque d’erreur. Le
tableau ci-dessous résume la situation

H0 vraie H0 fausse
Rejeter H0 Mauvaise décision Bonne décision
Accepter H0 Bonne décision Mauvaise décision

Définition
On appelle erreur de première espèce ou erreur de type 1 la décision
de rejeter H0 alors qu’elle est vraie. La décision de ne pas rejeter H0
alors qu’elle est fausse s’appelle l’appelle
erreur de deuxième espèce ou erreur de type 2.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 5 / 65


Définition
Les probabilités des erreurs de première et deuxième espèce sont
notées

• α = P{Rejeter H0 | H0 est vraie} > 0, et

• β = P{Ne pas rejeter H0 | H0 est fausse} > 0.

Elles s’appellent respectivement “risque de première espèce” et


“risque de deuxième espèce”.

La décision idéale est celle où ces deux risques seraient nuls, i.e.
α = β = 0. Mais cela est, sauf dans des situations triviales, impossible.
Pour illustrer cela, reprenons l’exemple précédent.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 6 / 65


La figure ci dessous qui correspond à la procédure de décision
adoptée pour tester l’hypothèse H0 : µ ≤ µ0 versus H1 : µ > µ0 . On
peut voir que lorsqu’on fait décroître α, β croît et vice versa.

Comme il est impossible de contrôler en même temps α et β, on fixe α


et on cherche la décision pour laquelle β est minimum. C’est cette
approche que nous allons développer dans ce chapitre.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 7 / 65


Méthodes

En général on dispose d’unéchantillon issu d’une population dont la loi


dépend d’un paramètre θ ∈ Θ ⊂ Rd , d ∈ N, et on cherche à conclure
que θ ∈ Θ0 ou θ ∈ Θ1 = Θ r Θ0 .

Définition
Les hypothèses “H0 : θ ∈ Θ0 ” et “H1 : θ ∈ Θ1 ”, où Θ0 et Θ1 sont deux
sous-ensembles complémentaires de Θ, s’appellent respectivement
l’hypothèses nulle et l’hypothèses alternative.
Lorsque Θi est réduit à un seul élément, on dit que Hi est une
hypothèse simple, sinon Hi est une hypothèse composite (i = 0, 1).

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 8 / 65


C’est l’utilisateur qui définit l’hypothèse nulle et l’alternative, l’approche
que nous adoptons ici consiste à convenir que l’erreur de première
espèce est plus “grave” que l’erreur de deuxième espèce et donc il est
préférable de contrôler α (la probabilité de l’erreur de première
espèce).
En pratique, les valeurs les plus courantes de α sont 0.10, 0.05 et
0.01. La valeur de α représente le risque d’erreur de première espèce
que l’utilisateur est prêt à courir.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 9 / 65


Critères pour choisir H0
Le choix de H0 peut être dicté par des raisons telles que :

1- On ne veut pas abandonner trop souvent l’hypothèse H0 qui est


solidement établie et n’a jamais été contredite auparavant.

2- H0 est une hypothèse à laquelle on tient particulièrement (pour


des raisons qui peuvent être subjectives.)

3- H0 correspond à une hypothèse de prudence : Pour tester


l’efficacité d’un nouveau vaccin, il est prudent de choisir une
hypothèse H0 défavorable au nouveau produit.

4- H0 est la seule hypothèse facile à formuler. Par exemple, pour


tester µ = µ0 contre µ 6= µ0 il est clair que seule H0 : µ = µ0
permet d’effectuer des calculs.
Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 10 / 65
Après avoir fixé α et défini l’hypothèse nulle H0 et l’alternative H1 , on
définit un procédé selon lequel on rejette ou accepte l’hypothèse nulle.
On dit qu’on a construit un “test d’hypothèses”.

Définition
Un test d’hypothrèses est une procédure, basée sur l’échantillon
observé x1 , . . . , xn , qui permet de déterminer un sous ensemble R de
Rn tel que

Si ( x1 , . . . , xn ) ∈ R alors on décide de rejeter H0 et d’accepter H1 ,


et

Si ( x1 , . . . , xn ) ∈
/ R alors on décide de rejeter H1 et d’accepter H0 .

L’ensemble R est appelé “ région critique ” ou “ région de rejet ”.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 11 / 65


Notations
La fonction φ(x) = IR (x), définie à partir de la région critique d’un
test, s’appelle la fonction test. Par abus de langage on notera par φ le
test et sa fonction test.

Définition
Considérons le test d’hypothèses H0 : θ ∈ Θ0 contre H1 : θ ∈ Θ1 dont
la région critique est R, et soit α ∈ [0, 1]. On dit que c’est un test de “
niveau ” α si sup Pθ {( X1 , . . . , Xn ) ∈ R} ≤ α.
θ ∈ Θ0
Lorsqu’il y a égalité, on dit que c’est un test de “ taille ” α.
On appelle puissance du test la fonction π : Θ → [0, 1] définie par :
π (θ ) = Pθ {( X1 , . . . , Xn ) ∈ R}

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 12 / 65


Le test idéal est celui dont la fonction puissance vaut 0 sur Θ0 et vaut 1
sur Θ1 . Sauf dans des situations triviales, un tel test ne peut exister.
En pratique on considère comme un “ bon test ” celui dont la fonction
puissance est proche de 0 sur presque tout Θ0 et proche de 1 sur
presque tout Θ1 .
Exemple
On lance 5 fois une pièce de monnaie dont la probabilité d’obtenir face
est θ ∈]0, 1[ et on note X le nombre de faces obtenues. On veut tester
H0 : θ ≤ 1
2 contre H1 : θ > 21 . Notons φ1 = I{5} ( X ) le test qui rejette H0
si X = 5 et π1 sa fonction puissance.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 13 / 65


Exemple (suite)
1
Notons que α = sup π (θ ) ≤ = 0.031. Par
0≤θ ≤0.5 25
contre pour la plupart des θ > 0.5, le risque de
2ème espèce est grand ( θ ≤ 0.90 =⇒ β ≥ 0.409.)

En fait 1 − π1 (θ ) ≤ 0.5 ⇐⇒ θ ≥ 5 0.5 = 0.870.
Pour réduire le risque de deuxième espèce, on

on considère le test φ2 = I{3,4,5} ( X ) qui rejette H0 si X ≥ 3. Notons π2


sa fonction puissance. On a alors π2 (θ ) = 6θ 5 − 14θ 4 + 10θ 3 . Le test φ2
réduit effectivement le risque de deuxième espèce mais son risque de
première espèce est supérieur à celui du test φ1 .

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 14 / 65


Si l’on devait choisir entre ces deux tests, il faudrait décider laquelle
des deux erreurs, celle décrite par π1 (θ ) ou celle décrite par π2 (θ ), est
la plus acceptable.
Le niveau α et la fonction puissance π d’un test contiennent de très
importantes informations quant à l’utilité du test. Par exemple, si α est
petit et inf{π (θ ), θ ∈ Θ1 } est grand, la décision de rejeter H0 est
vraisemblablement correcte. Par contre si si α est grand ou
sup{π (θ ), θ ∈ Θ1 } est petit, la décision de rejeter H0 a de forte chance
d’être mauvaise. En général, un “bon test” devrait avoir certaines
qualités que nous allons présenter ci après.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 15 / 65


Définition
Un test est dit sans biais si sa fonction puissance π est telle que
supθ ∈Θ0 π (θ ) ≤ infθ ∈Θ1 π (θ ).

Soit C une classe de tests pour tester H0 : θ ∈ Θ0 contre H1 : θ ∈ Θ1 .

Définition
Soient φ1 , φ2 ∈ C deux tests et π1 et π2 leurs fonctions puissance
respectives. On dit que φ1 est plus puissant que φ2 si

∀ θ ∈ Θ1 , π1 ( θ ) ≥ π2 ( θ ).

Un test φ ∈ C est uniformément le plus puissant (UPP) dans C s’il est


plus puissant que tout autre élément de C .

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 16 / 65


Théorème ( Lemme de Neyman-Pearson)
Pour tester les hypothèses simples H0 : θ = θ0 contre H1 : θ = θ1 ,
considérons le test de taille α et dont la région critique R vérifie

 x ∈ R si f ( x, θ1 ) > k f ( x, θ0 )

(1)
x ∈

/R si f ( x, θ1 ) < k f ( x, θ0 )

où k ≥ 0 est une constante et f ( x, θ ) est la fdp ( ou la fmp). Alors,

a- (Suffisance) Tout test de taille α dont la région critique vérifie (1) est
UPP dans l’ensemble des tests de niveau α.

b- (Nécessité) S’il existe un test de taille α dont la région critique


vérifie (1) avec k > 0, alors tout test UPP de niveau α est de taille
α et de région critique vérifiant (1) sauf sur un négligeable.
Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 17 / 65
Nous démontrons le théorème dans le cas où f ( x, θ ) est continue.
Notons que puisque Θ0 = {θ0 } tout test de taille α est de niveau α.
=⇒
Soit φ = IR un test de taille α avec R vérifiant (1) et soit π sa
fonction puissance. Considérons φ0 = IR0 un autre test de niveau α et
notons π 0 sa fonction puissance. On a φ = 1 ⇐⇒ f ( x, θ1 ) > k f ( x, θ0 )
et (1) implique que, pour tout x, (φ − φ0 )( f (., θ1 ) − k f (., θ0 ))( x ) ≥ 0.
D’où  Z 
φ( x ) − φ0 ( x )
 
0
 ≤ f ( x, θ1 ) − k f ( x, θ0 ) dx
(2)
) − π 0 (θ 1 ) − k ( π ( θ0 ) − π 0 (θ

 = π ( θ1 0 )).

Comme φ est de taille α et φ0 est de niveau α, (π (θ0 ) − π 0 (θ0 )) ≥ 0.


D’où π (θ1 ) − π 0 (θ1 ) ≥ 0. Comme φ0 est arbitraire, on conclut que φ est
UPP au niveau α.
Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 18 / 65
⇐=
Notons φ0 = IR0 le test UPP de niveau α et π 0 sa fonction
puissance. D’après a-, tout test φ = IR de taille α dont R vérifie (1) est
UPP, donc π (θ1 ) = π 0 (θ1 ). Compte tenu de (2) et du fait que k ≥ 0, on
a
0 ≥ π ( θ0 ) − π 0 ( θ0 ) = α − π 0 ( θ0 ).

Or φ0 est de niveau α, i.e. π 0 (θ0 ) ≤ α. On en déduit que π 0 (θ0 ) = α, i.e.


φ0 est de taille α. Cela implique que l’inégalité dans (2) est en fait une
h ih
égalité. Mais comme φ( x ) − φ0 ( x ) f ( x, θ1 ) − k f ( x, θ0 ) ≥ 0, son


intégrale n’est nulle que si le test φ0 vérifie (1) sauf peut-être sur un
Z
ensemble A tel que f ( x, θi ) dx = 0. 
A

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 19 / 65


Corollaire
Consiérons les hypothèses simples du théorème précédent, et soit
T = T (X) une statistique exhaustive pour θ et g(t, θ ) sa fdp (fmp).
Alors tout test de taille α qui est basé sur T et de région critique S est
UPP de niveau α si

t ∈ S

si g(t, θ1 ) > k g(t, θ0 )
(3)
t ∈

/S si g(t, θ1 ) < k g(t, θ0 )

où k ≥ 0 est une constante.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 20 / 65


Démonstration.
En termes de l’échantillon lui même, le test basé sur T a pour région
critique R={x : T(x)∈ S}. Par le théorème de factorisation, il existe une
fonction positive h telle que

f (x, θi ) = g( T (x), θi ) h(x), i = 0, 1.

En multipliant les inégalités dans (3) par h on obient (1), d’où le


résultat.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 21 / 65


Exemple
Soit X1 , . . . , Xn un échantillon issu d’une loi normale N (µ, σ2 ), avec σ
connu. Soient les hypothèses H0 : µ = µ0 versus H1 : µ = µ1 , avec
µ1 > µ0 .
Le test φ = IR , de région critique R = {( x1 , . . . , xn ) ∈ Rn : x > c}, est
UPP au niveau α

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 22 / 65


Dans plusieurs situations le lemme de Neyman-Pearson ne s’applique
pas directement mais permet d’établir des tests UPP.

Corollaire
Considérons les hypothèses H0 : θ ∈ Θ0 contre H1 : θ ∈ Θ1 , et soit
φ = IS le test de région critique S et vérifiant les conditions suivantes :

(a) Le test est de niveau α.

(b) Il existe un θ0 ∈ Θ0 tel que Pθ0 { T ∈ S} = α.

(c) Pour tout θ1 ∈ Θ1 , il existe k0 > 0 tel que

g(t, θ1 ) > k0 g(t, θ0 ) =⇒ t ∈ S et g(t, θ1 ) < k0 g(t, θ0 ) =⇒ t ∈


/ S,

où g(t, θ ) désigne la fdp (fmp) de T et θ0 est le paramètre de (b).


Alors φ est UPP au niveau α pour tester H0 contre H1 .

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 23 / 65


Démonstration.
Soient π et S la fonction puissance et la région critique du test, et soit
θ1 ∈ Θ1 fixé. Considérons les hypothèses H00 : θ = θ0 contre
H10 : θ = θ1 . En appliquant le corollaire précédent, on a π (θ1 ) ≥ π 0 (θ1 )
pour tout test de niveau α pour tester H00 contre H10 de fonction
puissance π 0 . Or tout test de niveau α pour pour tester H0 contre H1
est aussi de niveau α pour tester H00 contre H10 , donc π (θ1 ) ≥ π 0 (θ1 )
pour tout test de niveau α pour tester H0 contre H1 de fonction
puissance π 0 . Comme θ1 ∈ Θ1 est arbitraire, on a le résultat.

Remarque
Les conditions (a) et (b) du corollaire impliquent que le test est non seulement
de taille α mais qu’il existe θ0 ∈ Θ0 tel que π (θ0 ) = α.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 24 / 65


Définition
Une famille de f.d.p. { g(t, θ ) : t ∈ R, θ ∈ Θ ⊂ R} est dite “à rapport de
vraisemblance monotone” (RVM) si, pour tout θ1 < θ2 , la fonction
g(t, θ2 )
est croissante en t sur ∪2i=1 {t ∈ R : g(t, θi ) > 0}.
g(t, θ1 )

Exemple
Si Θ ⊂ R et si ω (θ ) est croissante en θ alors toute famille exponentielle de la
forme f ( x, θ ) = C (θ )h( x ) exp(ω (θ ) T ( x )) est a rapport de vraisemblance
monotone en T ( x ). M

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 25 / 65


Théorème
Soient les hypothèses H0 : θ ≤ θ0 contre H1 : θ > θ0 , et soit T une
statistique exhaustive pour θ de fdp (ou fmp) g(t, θ ) et telle que la
famille { g(t, θ ) : θ ∈ Θ} est à RVM. Alors pour tout t0 , le test dont la
région critique est donnée par R={T> t0 } est UPP au niveau
α = Pθ0 { T > t 0 } .

Lemme
Si la famille { g(t, θ ) : θ ∈ Θ} est à RVM et si ψ est une fonction
croissante, alors la fonction p : θ 7→ Eθ [ψ( T )] est croissante.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 26 / 65


Preuve du Lemme
Pour θ1 < θ2 , on pose A = {t : g(t, θ1 ) > g(t, θ2 )},
B = {t : g(t, θ1 ) < g(t, θ2 )}, a = sup ψ(t) et b = inf ψ(t). On a b ≥ a et
t∈ A t∈ B

Z
p ( θ2 ) − p ( θ1 ) = ψ(t)( g(t, θ2 ) − g(t, θ1 ))dt
Z Z
≥a ( g(t, θ2 ) − g(t, θ1 ))dt + b ( g(t, θ2 ) − g(t, θ1 ))dt
A B
Z
(∗) = (b − a) ( g(t, θ2 ) − g(t, θ1 ))dt ≥ 0
B

Z Z
(*) car 0 = ( g(t, θ2 ) − g(t, θ1 ))dt = ( g(t, θ2 ) − g(t, θ1 ))dt
A
Z
= + ( g(t, θ2 ) − g(t, θ1 ))dt.
B

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 27 / 65


Démonstration du Théorème

Comme la famille est à RVM, la fonction puissance π (θ ) = Pθ { T > t0 }


est monotone. Ainsi supθ ≤θ0 π (θ ) = π (θ0 ) = α, et donc le test est de
niveau α. Les conditions (a) et (b) du corollaire 2 sont donc vérifiées.
La condition (c) est également vérifiée pour

g(t, θ 0 )
k0 = inf ,
T g(t, θ0 )

où T = {t > t0 : g(t, θ 0 ) > 0 ou g(t, θ0 ) > 0}. 

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 28 / 65


Remarque
Il est clair que par raisonnement analogue, on peut montrer que la conclusion
du théorème reste valable pour les hypothèses H0 : θ ≥ θ0 contre
H1 : θ < θ0 .

En effet considérons le test φ∗ dont la région critique est R∗ = {t < t0 }


où t0 est tel que Pθ0 { T < t0 }. La fonction ψ = 1 − φ∗ est croissante
donc π (θ ) = Eθ [φ∗ ( T )] est décroissante. Ainsi
supθ ≤θ0 π (θ ) = π (θ0 ) = α, et donc le test est de niveau α. Les
conditions (a) et (b) du corollaire 2 sont donc vérifiées. La condition (c)
g(t, θ 0 )
est également vérifiée pour k0 = sup , où
T g ( t, θ0 )
T = {t < t0 : g(t, θ 0 ) > 0 ou g(t, θ0 ) > 0}. 

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 29 / 65


Exemple
Soit X1 , . . . , Xn un échantillon issu de la loi exponentielle de moyenne µ (i.e.
1
f ( x, θ ) = θe−θx I[0,∞[ ( x ), où θ = > 0). Déterminer, s’il existe, le test UPP
µ
au niveau α pour tester H0 : µ ≥ µ0 vs H1 : µ < µ0 . Notons que cela reviens
à tester H0 : θ ≤ θ0 vs H1 : θ > θ0 . La fonction de vraisemblance est
f ( x1 , . . . , xn , θ ) = θ n ∏ I[0,∞[ ( xi ) e−θ ∑ xi . La loi de l’échantillon


appartient donc à une famille à rapport de vraisemblance monotone. De plus


la statistique T ( x1 , . . . , xn ) = ∑ xi est exhaustive pour θ. D’après le
théorème précédent le test dont la région critique est
R = {( x1 , . . . , xn ) ∈ Rn : T = T ( x1 , . . . , xn ) > t0 }, où t0 est un réel tel que
Pθ0 { T > t0 } = α, est UPP au niveau α. M

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 30 / 65


Exemple
Soit X1 , . . . , Xn un échantillon issu de la loi N (µ, σ2 ) où σ > 0 est un réel
donné. La loi de l’échantillon appartient à une famille à RVMet la statistique
T = X est exhaustive pour µ.
Le test φ dont la région critique est R = {( x1 , . . . , xn ) ∈ Rn : x > x0 } , où
x0 est un réel tel que Pθ0 { X > x0 } = α, est UPP au niveau α pour tester
H0 : µ ≤ θ0 versus H1 : µ > θ0 . De même, le test φ∗ dont la région critique
est R∗ = {( x1 , . . . , xn ) ∈ Rn : x < x0∗ } , où x0∗ est un réel tel que
Pθ0 { X < x0∗ } = α, est UPP au niveau α pour tester H0 : µ ≥ θ0 versus
H1 : µ < θ0 .
Cela montre qu’il n’existe pas de test UPP pour tester H0 : µ = θ0 versus
H1 : µ 6= θ0 . M
Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 31 / 65
Exemples de tests usuels :Tests sur les moyennes

Dans ce paragraphe nous présentons les tests les plus usuels


concernant la moyenne d’une population.
Supposons que nous voulons tester, au niveau α ∈]0, 1[, l’hypothèse
nulle µ = µ0 contre l’une des alternatives µ 6= µ0 , µ > µ0 ou µ < µ0 en
nous basant sur un échantillon X1 , . . . , Xn .

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 32 / 65


Échantillon issu d’une loi N (µ, σ2 ) avec σ2 connue

√ X − µ0
La région critique est basée sur la statistique testn .
σ
Le tableau suivant résume les différents cas de figures :

H0 H1 Rejeter H0 lorsque
√ | x − µ0 |
µ = µ0 µ 6 = µ0 n > zα/2
σ
√ x − µ0
µ = µ0 µ > µ0 n > zα
σ
√ x − µ0
µ = µ0 µ < µ0 n < −zα
σ

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 33 / 65


Échantillon issu d’une loi N (µ, σ2 ) avec σ2 inconnue

Dans ce cas, comme d’habitude, on remplace σ2 par son estimateur


dans la statistique test. Si la taille de l’échantillon est petite n < 30, on
remplace zα par tn−1,α . Sinon, on garde zα .

H0 H1 Rejeter H0 lorsque
√ | x − µ0 |
µ = µ0 µ 6 = µ0 n > tn−1,α/2
s
√ x − µ0
µ = µ0 µ > µ0 n > tn−1,α
s
√ x − µ0
µ = µ0 µ < µ0 n < −tn−1,α
s

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 34 / 65


Remarque
Compte tenu du Corollaire 2, il est possible de remplacer µ = µ0 par µ ≤ µ0
de l’hypothèse nulle dans la deuxième ligne du tableau ( ou par µ ≥ µ0 dans
la troisième ligne du tableau) sans rien changer à la décision. Cette remarque
reste valable pour tous les tableaux de ce genre qui vont suivre.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 35 / 65


Exemple
On suppose que la durée de vie d’un pneu d’une certaine marque est une v.a.
qui suit une loi N (µ, σ2 ). Un échantillon de 100 pneus de ladite marque a
révélé une durée de vie moyenne de x = 21431 km avec un écart-type de
s = 1295 km.
Tester au niveau α = 0.05 les hypothèse H0 : µ ≥ 22000 contre
H1 : µ < 22000.
√ x − µ0
On rejette H0 si 100 < −z0.05 . Or z0.05 ' 1.64, et
s
√ x − µ0 √ 21431 − 22000
100 = 100 = −4.39. Conclusion : On rejette
s 1295
l’hypothèse H0 : µ ≥ 22000. M

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 36 / 65


Échantillon de grande taille issu d’une loi quelconque

Lorsque la taille de l’échantillon est assez grande (n ≥ 30), on n’a pas


besoin de supposer que l’échantillon provient d’une loi normale. En
√ X − µ0
effet, grâce au TCL, on a n ' Z, où eσ désigne σ ou son
σ
e
estimateur S selon que la variance est connue ou inconnue. Le tableau
suivant résume les différents cas de figures :

H0 H1 Rejeter H0 lorsque
√ | x − µ0 |
µ = µ0 µ 6 = µ0 n > zα/2
σ̃
√ x − µ0
µ = µ0 µ > µ0 n > zα
σ̃
√ x − µ0
µ = µ0 µ < µ0 n < −zα
σ̃

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 37 / 65


Comparaison de moyennes de deux populations de
lois normales

Pour comparer les moyennes de deux populations, on dispose d’un


échantillon X1 , . . . , Xm issu d’une première population de loi N (µ1 , σ12 )
et d’un échantillon Y1 , . . . , Yn issu d’une deuxième population de loi
N (µ2 , σ22 ). On supposera en plus que les deux échantillons sont
indépendants. Supposons que nous voulons tester, au niveau
α ∈]0, 1[, l’hypothèse nulle µ1 − µ2 = 0 contre l’une des alternatives
µ1 − µ2 6= 0, µ1 − µ2 > 0 ou µ1 − µ2 < 0. Les tableaux suivants
résument les différents cas de figure :

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 38 / 65


Cas où σ12 et σ22 sont connues :

H0 H1 Rejeter H0 lorsque
| x − y|
µ1 − µ2 = 0 µ1 − µ2 6 = 0 q > zα/2
σ12 /m + σ22 /n
x−y
µ1 − µ2 = 0 µ1 − µ2 > 0 q > zα
σ12 /m + σ22 /n
x−y
µ1 − µ2 = 0 µ1 − µ2 < 0 q < −zα
σ12 /m + σ22 /n

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 39 / 65


Cas où σ12 = σ22 = σ2 inconnue

H0 H1 Rejeter H0 lorsque
| x − y|
µ1 − µ2 = 0 µ1 − µ2 6 = 0 √ > tm+n−2,α/2
Sunifié 1/m + 1/n
x−y
µ1 − µ2 = 0 µ1 − µ2 > 0 √ > tm+n−2,α
Sunifié 1/m + 1/n
x−y
µ1 − µ2 = 0 µ1 − µ2 < 0 √ < −tm+n−2,α
Sunifié 1/m + 1/n

s
(m − 1)S2X + (n − 1)SY2
où Sunifié = est l’écart-type unifié.
m+n−2

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 40 / 65


Cas de deux populations de lois quelconques :
Échantillons de grandes tailles

Pour comparer les moyennes de deux populations de lois


quelconques, on dispose d’un échantillon X1 , . . . , Xm issu d’une
première population de moyenne µ1 et de variance σ12 et d’un
échantillon Y1 , . . . , Yn issu d’une deuxième population de moyenne µ2
et de variance σ22 . On supposera en plus que les deux échantillons
sont indépendants.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 41 / 65


Supposons que nous voulons tester, au niveau α ∈]0, 1[, l’hypothèse
nulle µ1 − µ2 = 0 contre l’une des alternatives µ1 − µ2 6= 0,
µ1 − µ2 > 0 ou µ1 − µ2 < 0. D’après le TCL, sous l’hypothèse nulle, on
x−y
a p ' Z, avec σ̃i qui dénote l’écart-type de la ième
2 2
σ̃1 /m + σ̃2 /n
population, de l’échantillon associé ou encore l’écart-type unifié selon
que les variances sont connues, inconnues et différentes ou inconnues
et égales.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 42 / 65


Le tableau suivant résume les différents cas de figure :

H0 H1 Rejeter H0 lorsque
| x − y|
µ1 − µ2 = 0 µ1 − µ2 6 = 0 p > zα/2
σ̃1 /m + σ̃2 2 /n
2
x−y
µ1 − µ2 = 0 µ1 − µ2 > 0 p > zα
σ̃1 /m + σ̃2 2 /n
2
x−y
µ1 − µ2 = 0 µ1 − µ2 < 0 p < −zα
σ̃1 2 /m + σ̃2 2 /n

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 43 / 65


Exemple
Supposons que l’on s’intéresse à la contenance en nicotine pour deux marques
de cigarettes. Un échantillon de 50 cigarettes de marque A a révélé une
moyenne x A = 2.61 mg avec un écart-type s A = 0.12 mg, alors qu’un
échantillon de 40 cigarettes de marque B a révélé une moyenne x B = 2.38 mg
avec un écart-type s B = 0.14 mg. Tester, au niveau de signification α = 0.05,
les hypothèses H0 : µ A − µ B = 0 contre H1 : µ A − µ B 6= 0.
|x A − xB |
On rejette H0 si q > z0.05/2 = 1.96. Or le terme gauche de
s2A /50 + s2B /40
cette inégalité est égal à 1.08. Donc on ne doit pas rejeter H0 . M

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 44 / 65


Tests sur les variances

Supposons que nous voulons tester, au niveau α ∈]0, 1[, l’hypothèse


nulle σ = σ0 contre l’une des alternatives σ 6= σ0 , σ > σ0 ou σ < σ0 et
que pour cela, nous disposons d’un échantillon X1 , . . . , Xn issu d’une
loi N (µ, σ2 ). Le tableau suivant résume les différents cas de figure :

H0 H1 Rejeter H0 lorsque
(n − 1) S2
σ = σ0 σ 6= σ0 > χ2n−1,α/2 ou < χ2n−1,1−α/2
σ02
( n − 1) S2
σ = σ0 σ > σ0 > χ2n−1,α
σ02
( n − 1) S2
σ = σ0 σ < σ0 < χ2n−1,1−α
σ02

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 45 / 65


Remarque
Ici on a supposé que µ est inconnue. Dans le cas où µ est connue, on remplace
(n − 1)S2 par ∑in=1 ( Xi − µ)2 et χ2n−1 par χ2n .

Exemple
L’épaisseur d’une composante, d’un semi-conducteur est une dimension très
importante que l’on suppose suivre une loi N (µ, σ2 ). Elle est considérée
acceptable si sa variation reste inférieure à 0.36. Un échantillon de 18
composantes a révélé une variance s2 = 0.68. Tester, au niveau de
signification α = 0.05, les hypothèses H0 : σ2 ≤ 0.36 contre H1 : σ2 > 0.36.
( n − 1) s2
On rejette H0 si > χ2n−1,α = 27.587. Or le premier terme de cette
σ0 )2
17(0.68)
inégalité est égal à = 32.1, donc on rejette H0 .
0.36 M
Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 46 / 65
Comparaison de deux variances

Nous avons vu, lors des tests de comparaison de deux moyennes,


comment l’égalité ou l’inégalité des variances intervient dans la
détermination de la statistique test. Dans ce paragraphe nous allons
développer les tests de comparaison de deux variances.
Supposons que nous voulons tester, au niveau α ∈]0, 1[, l’hypothèse
nulle σ1 = σ2 contre l’une des alternatives σ1 6= σ2 , σ1 > σ2 ou σ1 < σ2
et que pour cela, nous disposons d’un échantillon X1 , . . . , Xm issu
d’une loi N (µ1 , σ12 ) et d’un échantillon Y1 , . . . , Yn issu d’une loi
N (µ2 , σ22 ) que l’on suppose indépendants.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 47 / 65


Le tableau suivant résume les différents cas de figure :

H0 H1 Rejeter H0 lorsque
S12
σ1 = σ2 σ1 6= σ2 > Fm−1,n−1,α/2 ou < Fm−1,n−1,1−α/2
S22
S12
σ1 = σ2 σ1 > σ2 > Fm−1,n−1,α
S22
S12
σ1 = σ2 σ1 < σ2 < Fm−1,n−1,1−α
S22

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 48 / 65


Tests sur les proportions

Dans ce paragraphe nous présentons les tests les plus usuels


concernant p la probabilité de succès dans une expérience à deux
issues possibles : Succès et échec.
Supposons que nous voulons tester, au niveau α ∈]0, 1[, l’hypothèse
nulle p = p0 contre l’une des alternatives p 6= p0 , p > p0 ou p < p0 en
nous basant sur un échantillon X1 , . . . , Xn issu d’une loi de
B ernoulli(p).

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 49 / 65


Le tableau suivant résume les différents cas de figures :

H0 H1 Rejeter H0 lorsque
√ | pb − p0 |
p = p0 p 6 = p0 n p > Zα/2
p0 (1 − p0 )
√ pb − p0
p = p0 p > p0 n p > Zα
p0 (1 − p0 )
√ pb − p0
p = p0 p < p0 n p < − Zα
p0 (1 − p0 )

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 50 / 65


Exemple
Une compagnie de fabrication de détergent affirme qu’au moins 20% de la
population des consommateurs achètent le détergent de marque A. Tester
cette affirmation au niveau α = 0.01 sachant que parmi les 200 personnes
choisies au hasard, 30 ont déclaré acheter la marque A.
Soit p la vraie proportion des consommateurs qui achètent le détergent de
marque A. Pour vérifier les dires de la compagnie, on va tester l’hypothèse
H0 : p ≥ 0.20 contre l’alternative H1 : p < 0.20.
√ pb − p0 58
On rejette H0 si n p < − Zα avec n = 200, pb = ,
p0 (1 − p0 ) 200
p0 = 0.20, α = 0.01 et Zα = 2.33. Les calculs montrent que
√ pb − p0
n p = −1.77 > − Zα et donc on ne rejette pas H0 .
p0 (1 − p0 ) M

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 51 / 65


Comparaison de deux proportions

Dans ce paragraphe nous allons construire des tests qui permettent


de comparer deux proportions.
Supposons que l’on dispose de deux échantillons indépendants
X1 , . . . , Xm issu d’une loi de B ernoulli(p1 ) et Y1 , . . . , Yn issu d’une loi de
B ernoulli(p2 ) pour tester, au niveau α ∈]0, 1[, l’hypothèse nulle p1 = p2
contre l’une des alternatives p1 6= p2 , p1 > p2 ou p1 < p2 .

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 52 / 65


Le tableau suivant résume les différents cas de figures :

H0 H1 Rejeter H0 lorsque
| pb1 − pb2 |
p1 = p2 p1 6 = p2 p > Zα/2
pb12 (1 − pb12 )(1/n + 1/m)
pb1 − pb2 ,
p1 = p2 p1 > p2 p > Zα
pb12 (1 − pb12 )(1/n + 1/m)
pb1 − pb2
p1 = p2 p1 < p2 p < − Zα
pb12 (1 − pb12 )(1/n + 1/m)

m pb1 + n pb2
où pb12 = .
m+n

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 53 / 65


Exemple

Un organisme de prévention des accidents de la circulation mène une


étude dans le but de montrer que l’utilisation de la ceinture de sécurité
est plus fréquente chez les femmes que chez les hommes. Un
échantillon de 792 automobilistes choisis au hasard a révélé les
données suivantes :

Homme Femme
Met la ceinture 131 148
Ne met pas la ceinture 283 230

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 54 / 65


Notons p1 et p2 les proportions d’hommes et de femmes qui mettent
leur ceinture de sécurité en conduisant. On teste alors l’hypothèse
H0 : p H − p F ≤ 0 contre H0 : p H − p F > 0 au niveau α = 0.05.
pb1 − pb2
On rejette l’hypothèse H0 si p > Zα . Or on a
pb12 (1 − pb12 )

131 148 279 pb1 − pb2


pb1 = , pb2 = , 12 =
pc , d’où p = −0.16.
414 378 792 pb12 (1 − pb12 )

Comme Zα = 1.64, On ne rejette pas H0 .

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 55 / 65


Cas des échantillons appariés

Dans le cas de deux échantillons appariés, on se ramène au cas d’un


seul échantillon en considérant l’échantillon des différences.
Exemple
Le responsable des ressources humaines, d’une chaîne de magasins de
prêt-à-porter, cherche à montrer qu’un programme de formation peut
augmenter les performances des vendeurs. Le tableau ci-dessous montre les
montants moyens de vente par jour (en milliers de DH) , avant et après la
formation, de 12 vendeurs choisis au hasard. M

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 56 / 65


Vendeur : A B C D E F G H I J K L
Avant : 20 29 42 51 21 40 62 56 36 43 50 50
After : 34 28 47 51 21 50 63 56 36 43 52 61

Au niveau de signification α = 0.05, peut-on conclure que le


programme de formation améliore la performance des vendeurs ?

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 57 / 65


Exerice 1
La durée de vie en heures d’une Batterie est une v.a. qui suit une loi
normale de moyenne µ et d’écart-type σ inconnus. Un échantillon
aléatoire de 10 Batteries a donné une moyenne de 40.5 heures et un
écart-type de 1.25 heures.

a) Déterminer un intervalle de confiance de niveau 90% pour µ.


b) Au niveau de signification α = 0.05, pourrait-on conclure que la
moyenne µ est supérieure à 40 heures ?
b1) Définir les hypothèses H0 et H1 à tester pour répondre à cette
question.
b2) Utiliser l’échantillon précédent pour conclure.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 58 / 65


Exerice 2
Une machine M, lorsqu’elle est réglée à la valeur µ, produit en série
des tiges métalliques dont la longueur X est une variable aléatoire de
loi normale de moyenne µ et d’écart-type 0.02 mm. Une tige est
acceptable lorsque sa longueur est supérieure à 23.50 mm.

1- À quelle valeur µ0 faut-il régler la machine pour que 95% des tiges
produites soient acceptables ?

2- Établir une règle de décision pour rejeter H0 : µ ≤ µ0 au seuil


α = 0, 01, lorsqu’on dispose d’un échantillon de 25 tiges.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 59 / 65


Exerice 2 (suite)
Un client A reçoit un lot de 10000 tiges fabriquées par M réglée à la
valeur µ inconnue. Il décide de n’accepter le lot que si le pourcentage
de tiges acceptables est strictement supérieur à 98%. Comme il ne
peut pas contrôler tout le lot, il choisit un échantillon de 400 tiges et
constate que 387 d’entre elles sont acceptables.

3- Selon cet échantillon et avec un risque de première espèce


α = 5%, devrait-il accepter ou refuser le lot ?

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 60 / 65


Exerice 3
On suppose que la durée de vie d’une pile de type K est une v. a. qui
suit une loi normale de moyenne µK et de variance σK2 . Un échantillon
de 9 piles de marque A a révélé une durée de vie moyenne de 75
heures avec un écart-type de 12 heures, alors qu’un échantillon de 7
piles de m marque B a révélé une durée de vie moyenne de 79 heures
avec un écart-type de 15 heures.

a- Au risque α = 0.05, pourrait-on conclure que σA2 = σB2 ?

b- Donner un intervalle de confiance de niveau 95% pour µA − µB .

c- Pourrait-on conclure, avec un risque α = 0.05, que µA < µB ?

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 61 / 65


Exerice 4
La consommation est un facteur déterminant pour l’achat d’une
voiture. Le responsable de ventes chez un grand concessionnaire
prétend que ce facteur influence les femmes plus que les hommes.
Pour vérifier cela, un sondage a été conduit auprès de 50 hommes et
50 femmes. Les réponses à la question “la consommation est-elle un
facteur déterminant pour l’achat d’une voiture ?” sont résumés dans le
Réponse Hommes Femmes
tableau suivant : Oui 76% 84%
Non 24% 16%

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 62 / 65


Exerice 4 (suite)
Notons p H (respectivement p F ) la proportion d’hommes
(Respectivement de femmes) pour qui la consommation est un facteur
déterminant pour l’achat d’une voiture.

a- Donner un intervalle de confiance de niveau 95% pour p F − p H .

b- Définir les hypothèses H0 et H1 pour vérifier si ce que prétend le


responsable des ventes est vrai.

c- Tester ces hypothèses au seuil α = 0.10. Conclure.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 63 / 65


Exercice 5
La durée de vie d’une composante électronique est une variable
1
aléatoire X qui suit une loi exponentielle de moyenne µ = , i. e.
θ
fX ( x ) = θe−θx I[0,∞[ ( x ). Il est établi que les composantes fabriquées
selon l’actuel procédé durent en moyenne 500 heures. Un nouveau
procédé de fabrication a été développé mais ne sera mis en place que
s’il est prouvé plus efficace que l’actuel procédé.

a- Afin d’aider à la prise de décision d’adopter ou de refuser le


nouveau procédé, énoncer l’hypothèse nulle et l’alternative à
tester.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 64 / 65


Exercice 5 (suite)
b- Déterminer la région critique du test de niveau α = 0.05 pour
tester ces hypothèses.

c- Déterminer π (502) où π désigne la fonction puissance de ce test.

Un échantillon de 10 composantes fabriquées selon le nouveau


procédé a été choisi au hasard. Voici les durées de vie (en heures)
observées : 510 ; 498 ; 509 ; 512 ; 495 ; 504 ; 514 ; 499 ; 497 ; 502.

d- Au niveau α = 0.05, devrait-on refuser le nouveau procédé ?

On donne : X = 504 et S = 6.83.

Pr. A. Zoglat (FSR) Ch. IV : Tests d’hypothèses Printemps 2020 65 / 65

Vous aimerez peut-être aussi