Académique Documents
Professionnel Documents
Culture Documents
2. Définitions
2.1. Hypothèse Statistique
Une hypothèse statistique est un énoncé (une affirmation) concernant les
caractéristiques (valeurs des paramètres, forme de la distribution des observations) d’une
population.
2.2. Test d’hypothèse
Un test d’hypothèse (ou test statistique) est une démarche qui a pour but de fournir une
règle de décision permettant, sur la base des résultats d’échantillon, de faire un choix entre
deux hypothèses statistiques.
2.3. Hypothèse Nulle (H0) et Hypothèse Alternative (H1)
L’hypothèse selon laquelle on fixe a priori un paramètre de la population à une valeur
particulière s’appelle l’hypothèse nulle ou encore l’hypothèse privilégiée est noté H0.
1
N’importe qu’elle autre alternative est appelé hypothèse adverse (ou encore hypothèse
alternative ou contre hypothèse) et elle est notée H1.
2.4. Seuil de signification d’un test Statistique
Le risque, consenti à l’avance et qu’on note « α », de rejeter à tort l’hypothèse nulle H0
alors qu’elle est vraie (et de favoriser alors l’hypothèse) alternative H1) s’appelle le seuil de
signification du test et s’énonce en probabilité comme suit :
PErreur Type I
PRe jeter H 0 / H 0 est vraie
P Accepter H 1 / H 0 est vraie
α est la probabilité de rejeter à tort H0, est le risque d’erreur de premier espèce.
PErreur Type II
P Accepter H 0 / H 0 est fausse
P Accepter H 0 / H 1 est vraie
β est la probabilité d’accepter à tort H0, est le risque d’erreur de deuxième espèce.
2- La région d’Acceptation W
La région d’Acceptation W (complémentaire de W) de l’hypothèse H0 est le sous
ensemble des réalisations de l’échantillon qui conduisent à ne pas rejeter l’hypothèse H0,
c’est-à-dire les valeurs x1 , x2 ,..., xn telles que : si x1 , x2 ,..., xn W , alors on ne rejette pas
H0.
2.6.Fonction Puissance
La fonction puissance, Π(θ),d’un test de H0 est la probabilité de rejeter H0 lorsque la
vraie valeur du paramètre est θ. Pour des hypothèses simples :
H 0 : 0
H1 : 1 1 0
On a : 0 PEI et 1 1 PEII 1
1 1 est appelée la puissance du test.
Exemple :
Une population normale admet une variance 2 4 . Déterminer la probabilité β pour les
H 0 : 0
hypothèses simples :
H1 : 1
à un seuil de signification α = 0.05 pour un échantillon de taille n = 10. Calculer alors la
puissance du test.
2
3. Test Uniformément le plus puissant : « La méthode de Neyman et Pearson »
La méthode de Neyman et Pearson, très utilisée pour construire un test, se situe dans le
contexte suivant : le test est effectué entre deux hypothèses simples : pour une taille
d’échantillon déterminée, on se fixe une valeur α du risque de premier espèce et on détermine
la région critique qui minimise le risque de deuxième espèce β, ou maximise la puissance du
test. Le théorème de Neyman et Pearson fournit la réponse à ce problème.
Soit x1 , x2 ,..., xn un échantillon de taille « n » issu de f x, et θ0 et θ1 deux valeurs fixes
de θ. La fonction Vraisemblance de x1 , x2 ,..., xn est donnée par :
n
Lx1 , x2 ,..., xn , f xi , .
i 1
S’il existe une constante positive « k » et un sous-ensemble W de l’ensemble de réalisation
telles que :
1- Px1 , x2 ,..., xn W , 0 .
Lx, 0
2- k pour x1 , x2 ,..., xn W .
Lx,1
Lx, 0
3- k pour x1 , x2 ,..., xn W .
Lx,1
Alors W est la meilleur région critique de niveau α pour tester l’hypothèse nulle H0 : θ = θ0
contre l’hypothèse alternative H1 : θ = θ1.
Exemple :
Soit x1 , x2 ,..., xn un échantillon de taille « n » issu d’une loi de poisson de paramètre λ,
P . Déterminer la meilleure région critique pour tester :
H 0 : 2
.
H1 : 4
Calculer alors « α » pour n = 4 et k = 13.
3
4. Test d’une moyenne ou d’une espérance mathématique
Le problème le plus courant est celui du test d’une moyenne. Le contexte est le suivant :
Soit X une Variable Aléatoire et x1 , x2 ,..., xn un échantillon de X ; on s’intéresse au
paramètre réel E X .
4.1. Test d’une moyenne μ dans le cas où l’écart-type σ est connu
1- La variable X suit une loi Normale
H 0 : 0 ou ( 0 )
a- Dans le test Unilatéral droit de niveau α de
H1 : 0
La région de rejet de H0 est : WD X 0 z .
n
H 0 : 0 ou ( 0 )
b- Dans le test Unilatéral gauche de niveau α de
H1 : 0
La région de rejet de H0 est : WG X 0 z .
n
H 0 : 0
c- Dans le test bilatéral de niveau α de
H1 : 0
La région de rejet de H0 est : W X 0 z ; X 0 z .
2 n 2 n
Exemples :
1. Une population normale admet une variance 2 4 . Déterminer la probabilité « β » pour
H 0 : 0
les hypothèses simples : à un seuil de signification α = 5% pour un échantillon
H1 : 1
de taille n = 10.
2. Soit x1 , x2 ,..., xn un échantillon de taille 16 issus d’une distribution normale,
X i N ,1 et on veut tester H0 : μ = 20 au niveau de signification α = 5%, basée sur la
moyenne empirique X .
a- Déterminer les régions critiques de la forme A X / X a et B X / b X .
4
b- Déterminer les probabilités de l’erreur de Type II pour chaque région de la question (a)
pour l’alternative H1 : μ = 21. Laquelle des deux régions critiques n’est pas compatibles avec
cette alternative ?
c- Refaire le travail de la question (b) pour l’alternative H1 : μ = 19.
d- Quel est le niveau de signification du test ayant pour région critique A U B ?
e- Quelle est la valeur de « β » pour un test de région critique A U B si 20 1 .
3. Déterminer la région critique du Test de Neyman et Pearson et calculer sa puissance dans
le cas où n=100 et α = 5%. Que devrait être la taille de l’échantillon minimum pour cette
puissance soit supérieure à 95% ?
5
H 0 : 0
c- Dans le test bilatéral de niveau α de
H1 : 0
S*
La région de rejet de H0 est : W X 0 tn21 ; X 0 t n21 .
n n
Remarque:
X
Si n > 30, alors on utilise T N 0,1 .
S* n
Exemple :
Lorsqu’une machine est bien réglée, elle produit des pièces dont le poids moyen est de 80
grammes. Trois heures après un réglage de la machine on a prélevé au hasard un échantillon
de 20 pièces. Le poids moyen de cet échantillon de 20 pièces est de 79 grammes et le moment
non centré d’ordre 2 est de 125124. Que peut-on conclure, quant à la qualité du réglage de la
machine après trois heures de fonctionnement ? On prendra un risque α = 5%. On admettra
que le poids moyen est une variable aléatoire normale.
H 0 : 0 ou ( 0 )
2 2 2 2
H 0 : 0
2 2
- Test bilatéral : .
H1 : 0
2 2
Soit X N , 2 . On cherche une statistique dont la loi de probabilité est connue, sous
l’hypothèse H0.
2
x 0
n
Lorsque μ = μ0 est connue, alors i n .
2
i 1
6
n 1S * 2 n 1 .
2 2
x X
n
Lorsque μ est inconnue, et estimée par X , alors i
i 1 2
n i 1
H : 0 ou ( 0 )
2 2 2 2
2 2
rejet de H0 est : WD S 2 0 ,n .
n
H 0 : 0 ou ( 0 )
2 2 2 2
2 2
rejet de H0 est : WG S 2 0 1 ,n .
n
H : 0
2 2
0
2 2
0
2 2
2 1 , n
2
,n
est : W S 2
ou S
2
.
n n
Exemple :
A fin de tester la précision d’une balance, une masse connue avec précision, de 10
grammes, est pesée 10 fois. Les résultats sont les suivants : 10.008, 10.012, 9.99, 9.998,
9.995, 10.001, 9.996, 9.989, 10.0 et 10.015.
Tester la précision de la balance et vérifier si elle reste dans les normes fixées par le
réglementation à σ0 = 0.005. On prendra un risque α = 5%.
7
5-2- Test sur la variance σ2 d’une loi Normale où la moyenne μ inconnue
* 2 0 ,n1
2 2
rejet de H0 est : WD S .
n 1
H 0 : 0 ou ( 0 )
2 2 2 2
* 2 0 1 ,n1
2 2
rejet de H0 est : WG S .
n 1
H 0 : 0
2 2
0
2 2
0
2 2
*2 1 ,n 1
*2
,n 1
est : W S 2
ou S 2
.
n 1 n 1
Exemple :
Soit x1 , x2 ,..., xn un échantillon de taille n = 20 issus d’une distribution normale,
X i N , 2 et on suppose que X 11 et S * 4 .
H 0 : 2 9
a- Tester avec un niveau de signification α = 0.01.
H 1 : 2 9
b- Quelle devrait être la taille de l’échantillon dans la question (a) pour avoir 90 % de
chance de rejeter H0 lorsque en réalité 2 18 .
8
6. Test sur une proportion p
On suppose que n > 30.
p 1 p0
Sous H0 : p = p0, on a X N p0 , 0 .
n
H 0 : p p0 ou ( p p0 )
a- Dans le test Unilatéral droit de niveau α de
H 1 : p p0
p0 1 p0
La région de rejet de H0 est : WD X p0 z .
n
H 0 : p p0 ou ( p p0 )
b- Dans le test Unilatéral gauche de niveau α de
H 1 : p p0
p0 1 p0
La région de rejet de H0 est : WG X p0 z .
n
H 0 : p p0
c- Dans le test bilatéral de niveau α de
H 1 : p p0
p0 1 p0 p0 1 p0
La région de rejet de H0 est : W X p0 z ; X p0 z .
2
n 2
n
Exemple :
Pour obtenir l’autorisation de mise sur le marché, un laboratoire pharmaceutique
affirme que son médicament est efficace à 80 %. Dans un centre hospitalier, on choisit au
hasard, un échantillon de 200 individus on administre le médicament. A l’issue d’une certaine
période, on note que pour 150 individus, le traitement est efficace. Que peut-on conclure, au
seuil de signification α = 0.05, quand à l’affirmation du labo.
7. Test de comparaison
7.1. Test de comparaison de deux moyennes de lois normales
Soient : X1 N 1, 12 et X 2 N 2 , 22 tel que X1 et X2 sont indépendantes.
1- Comparaison de deux moyennes, les variances étant connues
9
H 0 : 1 2
a- Dans le cas d’un Test Bilatéral, il s’agit de tester .
H 1 : 1 2
On utilise la statistique Z 1
X X 2 1 2 N 0;1 . Au seuil de signification α, la
12 12
n1 n2
région critique est :
12 12 12 12
W X 1 X 2 z ou X 1 X 2 z
1
2
n 1 n 2
1
2
n1 n 2
H 0 : 1 2 ou ( 1 2 )
b- Dans le test Unilatéral droit de niveau α de
H1 : 1 2
12 12
La région de rejet de H0 est : WD X 1 X 2 z1 .
n1 n 2
H 0 : 1 2 ou ( 1 2 )
c- Dans le test Unilatéral gauche de niveau α de
H1 : 1 2
12 12
La région de rejet de H0 est : WG X 1 X 2 z1 .
n1 n 2
Si , l’estimateur de
2 2 2 2
utilisé est : S *2
n1 1S1* n2 1S 2*
2 2
. On utilise,
1 2
n1 n2 2
ainsi, la statistique T
X 1 X 2 1 2
St n1 n2 2
1 1
S *
n1 n2
H 0 : 1 2 ou ( 1 2 )
a- Dans le test Unilatéral droit de niveau α de
H1 : 1 2
1 1
La région de rejet de H0 est : WD X 1 X 2 t1 ;n1 n2 2 S * .
n1 n2
H 0 : 1 2 ou ( 1 2 )
b- Dans le test Unilatéral gauche de niveau α de
H1 : 1 2
La région de rejet de H0 est : WG X 1 X 2 t1 ;n1 n2 2 S *
1 1
.
n1 n2
H 0 : 1 2
c- Dans le cas d’un Test Bilatéral, il s’agit de tester .
H 1 : 1 2
Au seuil de signification α, la région critique est :
1 1
W X 1 X 2 t ou X 1 X 2 t
1 1
S* S*
1 ;n1 n2 2
2
n1 n 2
1 ;n1 n2 2
2
n1 n2
10
7.2. Test de comparaison de deux variances
Soit le test de comparaison de deux variances de variables gaussiennes
12
H
0 : 1
H 0 : 1 2
2 2
22
qui s’écrit également . Deux situations sont à envisager, selon
H1 : 1 2
H : 1 1
2 2 2
1 22
que les moyennes sont connues ou non.
22 2
*2
S1 S1*
2
La région critique du test est donc : W 2 F ou 2 F
*
S2
1 ,n1 1,n2 1
2 S 2* 2
,n1 1,n2 1
Exemple :
Pour comparer deux marques d’ampoule électrique, on a effectué des essais sur des
échantillons au hasard. La durée de vie moyenne observée sur un échantillon de 25 ampoules
de la marque (1) est de 1012 heurs, avec un écart-type empirique de 241 heures. Sur un
échantillon de 13 ampoules de la marque (2), on a obtenu respectivement 1104 heures et 319
heures. Peut-on considérer que ces marques sont de qualité équivalente ?
11
7-3- Test de comparaison de deux proportions
Soient : X 1 B1, p1 et X 2 B1, p2 tel que X1 et X2 sont indépendantes.
H 0 : p1 p2
Considérons le test à deux échantillons n1 et n2, tirés indépendamment l’un de
H 1 : p1 p2
l’autre dans X1 et X2. Alors si n1 et n2 > 30 alors d’après le TCL nous permet d’écrire :
X 1 X 2 N p1 p2 ; p1 p1 1 p2 p2 1 .
n1 n2
Généralement 1 p1 1 p1 et 2 p2 1 p2 sont inconnues. La région critique est
2 2
f1 f1 1 f 2 f 2 1 f1 f1 1 f 2 f 2 1
W X 1 X 2 z1 ou X 1 X 2 z1
n1 n2 n1 n2
Exemple :
Les proportions des ménages propriétaires de leur logement parmi les 158 ménages du
quartier A est égale à 32.3 %. Dans un quartier voisin, sur un échantillon aléatoire de 250
ménages, on a noté 45% de propriétaires.
Peut-on considérer qu’il y’a une différence entre les proportions des ménages propriétaires
dans les deux cartiers ? On prendra α = 0.05.
12