Académique Documents
Professionnel Documents
Culture Documents
TESTS D’HYPOTHESES
Introduction
Un test d’hypothèse est un procédé d’inférence permettant de contrôler (accepter ou
rejeter) à partir de l’étude d’un ou plusieurs échantillons aléatoires, la validité
d’hypothèses relatives à une ou plusieurs populations. Les méthodes de l’inférence
statistique nous permettent de déterminer, avec une probabilité donnée, si les
différences constatées au niveau des échantillons peuvent être imputables au hasard
ou si elles sont suffisamment importantes pour signifier que les échantillons
proviennent de populations vraisemblablement différentes.
Risques D’Erreur
Types De Test
Principe Des Tests
I-a : Méthodologie
L'hypothèse nulle 𝑯𝟎 est l'hypothèse que nous voulons vérifier : elle consiste
à dire qu'il n'y a pas de différence entre les paramètres comparés, ou que la
différence observée n'est pas significative et est due à des fluctuations
"d'échantillonnage". Cette hypothèse a été soulevée pour être rejetée.
L'hypothèse alternative notant « 𝑯𝟏 » est la "négation" de 𝑯𝟎 revient à dire
"𝑯𝟎 est fausse". Une décision de rejeter 𝑯𝟎 signifie que 𝑯𝟏 est satisfait ou
vrai.
La nature de H0 détermine la formulation de 𝑯𝟏 et donc le caractère
unilatéral ou bilatéral du test. Lorsque l'hypothèse alternative "se
décompose en deux", nous l'appelons un test bilatéral. Par exemple, si H0
signifie que le groupe d'étudiants avec une fréquence de tabagisme 𝒑 est
représentatif La population générale avec la fréquence de tabagisme 𝒑𝟎,
alors on fixe : 𝑯𝟎 ∶ 𝒑 = 𝒑𝟎 𝒆𝒕 𝑯𝟏 ∶ 𝒑 ≠ 𝒑𝟎. Le test sera bilatéral car
on suppose que la fréquence p peut être supérieure ou inférieure à la
fréquence 𝒑𝟎.
Lorsque l'hypothèse alternative "ne consiste qu'en une partie", nous
l'appelons un test unilatéral. Par exemple, si l'on suppose que la fréquence
des fumeurs dans la population étudiante p est supérieure à la fréquence des
fumeurs dans la population 𝒑𝟎, alors on pose 𝑯𝟎 ∶ 𝒑 = 𝒑𝟎 𝒆𝒕 𝑯𝟏 ∶ 𝒑 >
𝒑𝟎. Le test sera unilatéral, car on considère que la fréquence p ne peut être
que supérieure à la fréquence 𝒑𝟎
Il aurait été possible également d’avoir : 𝑯𝟎 ∶ 𝒑 = 𝒑𝟎 𝒆𝒕 𝑯𝟏 ∶ 𝒑 < 𝒑𝟎
Remarque
H0 validé H1 fausse
I-d : Statistique et niveau de signification
Unilatéral Bilatéral
Test 𝑯𝟎 ∶ 𝒕 = 𝒕𝟎 𝑯𝟎: 𝒕 = 𝒕𝟎
Hypothèse 𝑯𝟏 ∶ 𝒕 ≠ 𝒕𝟎
𝑯𝟏 ∶ 𝒕 > 𝒕𝟎 𝑯𝟏 ∶ 𝒕 < 𝒕𝟎
Alternative
II-a : Introduction
II-b : Définition 1
Exemple
II-c : Définition 2
2
On appelle le risque d'erreurs de type II, noté 𝜷 la probabilité de rejeter 𝑯𝟏 en
acceptant 𝑯𝟎 lorsque 𝑯𝟏 est vrai.
Ceci se produit si la valeur de la statistique de test ne tombe pas dans la région
de rejet alors que l’hypothèse H1 est vraie.
Remarque
Pour quantifier le risque 𝜷, il faut connaître la loi de probabilité de la statistique sous
L’hypothèse H1.
Exemple
III-a : Introduction
Notez que le test n'est pas fait pour « prouver » 𝑯𝟎, mais pour « nier » 𝑯𝟎. La
capacité d'un test à rejeter 𝑯𝟎 lorsque 𝑯𝟎 𝒆𝒔𝒕 𝒇𝒂𝒖𝒙 est la puissance du test.
III-b : Définition
𝒎𝒂𝒏𝒒𝒖𝒆 𝒅𝒆 𝒑𝒖𝒊𝒔𝒔𝒂𝒏𝒄𝒆
H0 acceptée 𝒄𝒐𝒓𝒓𝒆𝒄𝒕
𝒓𝒊𝒔𝒒𝒖𝒆 𝒅′𝒆𝒓𝒓𝒆𝒖𝒓 𝒕𝒚𝒑𝒆 𝟐 "𝜷"
III-c : Résumé
1–𝜶 1–β
β 𝜶
-6 -4 -2 0 2 4 6 8 10
Type de Test
Test Paramétrique
IV-a : Introduction
On suppose dans ce chapitre que les échantillons sont issus d’une loi normale ou
peuvent être approximés par une loi normale. On verra les différents tests
paramétriques
1.a. Variance connue : On suppose que l’on a un échantillon qui suit une loi normale
𝑵 (µ𝟎, 𝝈²) ou la variance est connue.
On veut tester 𝑯𝟎 ∶ µ = µ𝟎 𝒄𝒐𝒏𝒕𝒓𝒆 𝑯𝟏 ∶ µ ≠ µ𝟎, c’est le cas bilatéral.
Sois l’hypothèse H0 la variable aléatoire suit une loi 𝑵 (µ𝟎, 𝝈²)
et par conséquent la statistique
Suit une loi normale centrée réduite. Pour un risque d’erreur α fixé on a donc :
2.a. Moyenne connue. On suppose que l’on a un échantillon qui suit une loi normale
𝑵 (µ, 𝝈² ) où la moyenne est connue. On veut tester :
𝑯𝟎 ∶ 𝝈 ² = 𝝈 ² 𝟎 𝒄𝒐𝒏𝒕𝒓𝒆 𝑯𝟏 ∶ 𝝈 ² ≠ 𝝈 ² Sous l’hypothèse H0 la statistique
Avec 𝝌²α/2(𝒏) 𝒆𝒕 𝝌²1−α/2(𝒏) les quantiles d’ordre 𝜶/𝟐 𝒆𝒕 𝟏 − 𝜶/𝟐 de la loi 𝝌²(𝒏).
Donc la région de rejet est
Avec 𝝌²1−α(𝒏) le quantile d’ordre 𝟏 − 𝜶 de la loi 𝝌² (𝒏). Donc la région de rejet est
]χ²1−α(n), +∞[
Test de χ²
IV-e : Définition
C’est-à-dire le nombre fois que la valeur i apparaît dans l’échantillon (X1, X2, ... ,Xn).
On s’intéresse à la répartition de N(n) = (N1(n), N2(n), . . . , Nm(n)).
On a pour tous (i1, i2, . . . , im) tels que 𝟎 ≤ i1, i2, ... , im ≤ 𝒏 et i1 + · · · + im = n
IV-f : Théorème 1
Donc si H0 est fausse on a Dn(p) → +∞, on peut donc utiliser une région de rejet de
type Dn(p) > C (unilatérale). Si on choisit un risque de première espèce inférieur à α,
c’est-à-dire que l’on veut à la limite P(χ² (m − 1) > χ² 1−α(m − 1)) ≤ α car d’après la
convergence en loi :
Le test est donc asymptotiquement de niveau α, de plus sa puissance est 1 car sous
H1, Dn(p) → +∞ et donc
Exemple
On lance 200 fois une pièce et on obtient 110 piles. Le nombre de piles obtenu est une
variable aléatoire β (200, p). On veut tester : 𝑯𝟎 ∶ 𝒑 = 𝟏/𝟐 𝒄𝒐𝒏𝒕𝒓𝒆 𝑯𝟏 ∶ 𝒑 ≠ 𝟏/𝟐.
On observe un échantillon ((X1, Y1), . . . ,(Xn, Yn)) à valeur dans et {(x(i), y(j)), 1 ≤ i ≤ r,
1 ≤ j ≤ s}.
On veut tester H0 : X et Y sont indépendants . Soit Ni,j le nombre de couples
observés (x(i), y(j)) parmi n observations. On pose On peut
alors montrer que sous ces hypothèses
fin