Vous êtes sur la page 1sur 27

DESCOGEF 2011

Dr. El Hadji GUEYE


CESAG

Tests d’hypothèses à un échantillon


1. Introduction

2. Tests sur la moyenne d’une population

3. Tests sur la proportion d’une population

4. Relation entre tests et intervalles de confiance


1. Introduction
À partir d’un On porte des conclusions sur la
échantillon population
Inférence statistique

Estimation Tests d’hypothèses

ponctuelle Intervalle de confiance

 Définitions
• Hypothèse : Affirmation sur un paramètre d’une population.
Exemple
Population : La teneur en ammoniac (NH3) d’une solution
μ : teneur moyenne en ammoniac d' une solution.
H : μ  20.4" H : μ  19.7"
H : μ  20.1" H : μ  19.12"
• Test d’hypothèses
Méthode d’inférence statistique qui permet de comparer deux hypothèses H0 et
H1 à l’aide d’un échantillon tiré de la population.

H0 : Hypothèse nulle. Ce qu’on prend pour acquis ou qu’on connaît déjà.


et
H1 : Hypothèse alternative. Ce qu’on cherche à déterminer ou à détecter.

Autrement dit, on prend H0 pour acquis jusqu’à ce qu’une preuve suffisante de


H1 ait été apportée.

Exemple: Dans un Procès, on considère l’accusé


H0 : Innocent
contre
H1 : coupable
• Types d’erreur

Erreur de type I (1ère espèce) : Rejeter H0 alors que H0 est vraie.

Erreur de type II (2ème espèce) : Ne pas rejeter H0 alors que H0 est fausse.

• Décision

Décision H0 vraie H1 fausse

Rejeter H0 Erreur de type I Pas d’erreur

Rejeter H1 Pas d’erreur Erreur de type II

• Risques

Le risque de 1ère espèce :   P commettre une erreur de type I 


 P rejeter H 0 par erreur 
 P rejeter H 0 H 0 est vraie 

α détermine le seuil théorique du test.


Le risque de 2ème espèce:   P commettre une erreur de type II 
 P ne pas rejeter H 0 par erreur 
 P ne pas rejeter H 0 H 0 est fausse 
  1   détermine la puissance du test.

Quelle est l’erreur la plus grave ?

H0 : Innocent et H1 : coupable

L’erreur la plus grave, c’est d’envoyer un innocent en prison ou relaxer un


coupable.

Donc on cherche à contrôler le risque de 1ère espèce α en le rendant petit de


l’ordre inférieur ou égale à 0.05 .
2. Tests sur la moyenne d’une population

A. X ~ N(μ , σ2) avec la variance σ2 connue

Échantillon : X 1 , X 2 , ... , X n iid N  , σ 2 

X
On utilisera la statistique Z  ~ N 0 , 1
 n
2
1er Cas: Test unilatéral à droite

H 0 :    0 contre H1 :    0

On posera
X  0 1
Sous H 0 : Z observé 
2 n
Au seuil  : zcalculé  z (1   )

On rejette H 0 si Z observé  zcalculé


0 z (1   )

On rejette H 0 :    0 au seuil 
X  0
si Zobservé   zcalculé  z (1   )
2
 n
2ème Cas: Test unilatéral à gauche

H 0 :    0 contre H1 :    0
On posera
X  0
Sous H 0 : Z observé 
2 n 1
Au seuil  : zcalculé   z (1   )

On rejette H 0 si Z observé  zcalculé
 z (1   )

On rejette H 0 :    0 au seuil 
X  0
si Zobservé   z calculé   z (1   )
2
 n
3e cas : Test bilatéral

H 0 :    0 contre H1 :    0
On posera
X  0
Sous H 0 : Z observé  1
2
 n
Au seuil  : zcalculé  z (1  2 )
On rejette H 0 si Z observé  zcalculé 
2 
2

On rejette H 0 :   0 au seuil   z (1  2 ) z (1  2 )
X  0
si Zobservé   z calculé  z (1  2 )
2 n
Exemple
Une machine fabrique des claviers d’ordinateur de 47 cm de longueur. Pour
s’assurer que la machine n’est pas déréglée, on a inspecté 60 claviers choisis au
hasard et obtenu une moyenne de 46.5 cm . On fait l’hypothèse que la longueur
d’un clavier suit une loi normale N(μ , 2.25).
La machine est-elle déréglée au seuil α = 0.05 ?
H 0 :   47  la machine fonctionne bien

H 1 :   47  la machine est déréglée

  47 , x  46.5 , σ  2.25 , n  60 ,   0.05


0
2

46.5  47  0.5 0.5


 Sous H 0 : Z observé     2.58
2.25 60 0.1936 0.1936

 Au seuil  : zcalculé  z (1  2 )  z (0.975)  1.96

Z observé  zcalculé  On rejette l' hypothèse H 0 .

Donc la machine ne fonctionne pas bien.


B. X ~ N(μ , σ2) avec la variance σ2 inconnue


Échantillon : X1 , X 2 , ... , X n iid N  , σ 2 
n

 X i  X .
2 2 2
La variance σ étant inconnue, elle est estimée par S  1
n 1
i 1

On utilisera la statistique

X
T ~ Student n  1 si n  30
2
S n
ou
X
Z ~ N (0 , 1) si n  30
2
S n
1er Cas: Test unilatéral à droite

H 0 :    0 contre H1 :   0

On posera
X  0
Sous H 0 : Tobservé  1
2
S n
Au seuil  : tcalculé  t (1   , n  1)

On rejette H 0 si Tobservé  tcalculé


0 t (1   , n  1)

On rejette H 0 :   0 au seuil 
X  0
si Tobservé   tcalculé  t (1   , n  1)
2
S n
2ème Cas: Test unilatéral à gauche

H 0 :    0 contre H1 :    0
On posera
X  0
Sous H 0 : Tobservé 
S2 n 1
Au seuil  : tcalculé  t (1   , n  1)

On rejette H 0 si Tobservé  tcalculé
 t (1   , n  1)

On rejette H 0 :    0 au seuil 
X  0
si Tobservé   t calculé  t (1   , n  1)
2
S n
3e cas : Test bilatéral

H 0 :    0 contre H1 :    0
On posera
X  0
Sous H 0 : Tobservé 
S2 n 1 

Au seuil  : tcalculé  t (1  2 , n  1)
On rejette H 0 si Tobservé  tcalculé 
2 
2

On rejette H 0 :    0 au seuil   t (1  2 , n  1) t (1  2 , n  1)

X  0
si Tobservé   t calculé  t (1  2 , n  1)
S2 n
Exemple
Un fabricant prétend que les écrans d’ordinateur qu’il produit résiste à plus de
5 kg. Une expérience est réalisée pour tester cette affirmation. On suppose
que la résistance d’un écran d’ordinateur suit une loi normale. On effectue une
expérience sur 15 écrans et observe que
la moyenne x  5.61 kg et l' écart - type s  1.17 kg

L’affirmation du fabricant est-elle correcte dans 95% des cas ?


H :   5  affirmatio n incorrecte et H :   5  affirmatio n correcte
0 1

0  5 , x  5.61 , s 2  (1.17) 2 , n  15 , 1    0.95


5.61  5 0.61
 Sous H 0 : Tobservé    2.019
(1.17) 15 0.3021
2

 Au seuil  : tcalculé  t (1   , n  1)  t (0.95 , 14)  1.76

Tobservé  tcalculé  On rejette H 0 .

Donc le fabricant a raison dans 95% des cas.


C. X suit une loi quelconque

Échantillon : X1 , X 2 , ... , X n un EAS de la variable X d' espérance  .


n

 X i  X
2 2 2
La variance σ étant inconnue, elle est estimée par S  1
n 1
i 1

Si n est suffisamment grand n  30 ,


X approx.
On utilisera la statistique Z  ~ N 0 , 1
2
S n
1er Cas: Test unilatéral à droite

H 0 :    0 contre H1 :    0

On posera
X  0 1
Sous H 0 : Z observé 
S2 n
Au seuil  : zcalculé  z (1   )

On rejette H 0 si Z observé  zcalculé


0 z (1   )

On rejette H 0 :    0 au seuil 
X  0
si Z observé   zcalculé  z (1   )
2
S n
2ème Cas: Test unilatéral à gauche

H 0 :    0 contre H1 :    0
On posera
X  0
Sous H 0 : Z observé 
S2 n 1
Au seuil  : zcalculé   z (1   )

On rejette H 0 si Z observé  zcalculé
 z (1   )

On rejette H 0 :    0 au seuil 
X  0
si Zobservé   z calculé   z (1   )
2
S n
3e cas : Test bilatéral

H 0 :    0 contre H1 :    0
On posera
X  0
Sous H 0 : Z observé  1
S2 n
Au seuil  : zcalculé  z (1  2 )
On rejette H 0 si Z observé  zcalculé 
2 
2

On rejette H 0 :   0 au seuil   z (1  2 ) z (1  2 )
X  0
si Zobservé   z calculé  z (1  2 )
S2 n
Exemple
Une fabrique achète régulièrement à un fournisseur un certain type de
transistors. Elle sait par de nombreux sondages qu’elle a effectués, que le
coefficient d’amplification de ces transistors a une distribution de moyenne
155. Lors d’un nouveau contrôle portant sur 200 transistors, elle observe un
coefficient d’amplification moyen de 149 et d’écart - type 42.
Peut-on admettre, au seuil de 1%, que la qualité a varié négativement ?
H 0 :   155  la qualité n' a pas varié

H 1 :   155  la qualité a baissé

  155 , x  149 , s  ( 42) , n  200 ,   0.01


0
2 2

149  155 6
 Sous H 0 : Z observé    2.02
(42) 2 200 2.9698

 Au seuil  : Z calculé   z (1   )   z (0.99)  2.326

Z observé  zcalculé  On ne rejette pas H 0 .

Donc la qualité n' a pas varié significativement au seuil de 1%.


3. Tests sur la proportion d’une population
X ~ B(n , p)

Échantillon : X1 , X 2 , ... , X n iid B1 , p 


n
X   X i ~ B (n , p)
i 1

En supposant n suffisamment grand (n  30), on utilisera la statistiqu e


X  p approx.
Z ~ N 0 , 1
p1  p 
n
1er cas : Test unilatéral à droite

H 0 : p  p0 contre H1 : p  p0
X  p0
Sous H 0 : Z observé 
p0 1  p0 
n
Au seuil  : zcalculé  z (1   )
On rejette H 0 si Z observé  zcalculé

2e cas : Test unilatéral à gauche

H 0 : p  p0 contre H1 : p  p0
X  p0
Sous H 0 : Z observé 
p0 1  p0 
n
Au seuil  : zcalculé   z (1   )
On rejette H 0 si Z observé  zcalculé
3e cas : Test bilatéral

H 0 : p  p0 contre H1 : p  p0
X  p0
Sous H 0 : Z observé 
p0 1  p0 
n
Au seuil  : zcalculé  z (1  2 )
On rejette H 0 si Z observé  zcalculé
Exemple
On pense que dans une bibliothèque, 10% des livres se détériorent par an. En
considérant un échantillon de 400 livres, on observe 24 qui ont été abîmés au
cours d’un an.
Peut-on dire avec α = 0.01, que la proportion p de livres abîmés est
significativement différente de 10% ?

 H 0 : p  0.1 contre H 1 : p  0.1

24
p0  0.1 ; n  400 ; x  0.06 ;   0.01
400
0.06  0.1  0.04 0.04
Sous H 0 : Z observé     2.66
0.11  0.1 0.015 0.015
400
Au seuil  : z calculé  z (1  0.201 )  z (0.995)  2.576

Z observé  z calculé donc on rejette H 0 au seuil   0.01.

La proportion de livres abîmés est significativement différente de 10%.


4. Relation entre tests et intervalles de confiance
 Cas de la moyenne

H 0 :   0 contre H 1 :   0

On rejette H 0 :    0 au seuil  si  0  IC (  ) de niveau 1   .


  0  X  z 1  2   2 n X  z 1  2   2 n 
 Cas de la proportion
H 0 : p  p0 contre H1 : p  p0

On rejette H 0 : p  p0 au seuil  si p0  IC ( p) de niveau 1   .


  0  X  z 1  2   2 n X  z 1  2   2 n 
Exemple : La fabrication des claviers d’ordinateur.
Il a été démontré que la machine est déréglée au seuil α = 0.05.
Peut-on le confirmer par l’intervalle de confiance ?

X ~ N (  , 2.25)
 H 0 :   47 contre H 1 :   47

  47 , x  46.5 , σ  2.25 , n  60 ,   0.05


0
2

L' intervalle de confiance


IC de 1  0.05  0.95 pour  est défini par :

46.5  1.96 2.25 60 


46.5  1.96 2.25 60  46.12 46.88

 0  47  46.12 46.88  On rejette H 0 au seuil   0.05

Donc on confirme que la machine est déréglée.

Vous aimerez peut-être aussi