Vous êtes sur la page 1sur 36

Le test d’hypothèse est un procédé qui permet de faire un choix entre deux

hypothèses opposées.

Dans le chapitre sur l’estimation, la valeur du paramètre (par exemple le revenu


moyen de l’ensemble de la population de Paris) était inconnue ; nous utilisions
alors les résultats échantillonnaux pour cerner la véritable valeur du paramètre.
Dans ce cours, les résultats échantillonnaux seront utilisés à une toute autre fin.
Dans la plupart des situations réelles, la valeur du paramètre est inconnue, mais il
arrive fréquemment que le chercheur ait une idée du paramètre et puisse
formuler une hypothèse concernant la valeur de celui-ci.

Par exemple, nous faisons une affirmation (ou hypothèse) sur un paramètre de la
population (un maire suggère que le niveau moyen du revenu des habitants de sa
ville est de 50 000€), puis nous vérifions si cette hypothèse est vraie en examinant
un échantillon aléatoire pris dans la population.

Il arrive fréquemment dans les tests d’hypothèse que la différence entre la valeur
de la statistique échantillonnale et la valeur hypothétique du paramètre ne soit ni
très grande ni très petite, de sorte que la décision à prendre ne s’impose pas
d’elle-même.

Supposons par exemple que la moyenne de l’échantillon soit de 51 000€ ou de


49 000€. Peut-on, en se basant sur l’une ou l’autre de ces valeurs, rejeter
catégoriquement l’hypothèse m = 50 000€ ? Dans ce cas, on s’en doute, la décision
ne saute pas aux yeux et il faut, par conséquent, définir des critères qui
permettent la prise de décision dans les situations délicates. On décidera par
exemple que l’hypothèse est vérifiée si la moyenne de l’échantillon prélevé est
comprise entre 49 400€ et 50 600€. Elle est donc rejetée si la moyenne des revenus
de l’échantillon est en dehors de cet intervalle.

Dans ce cours, nous expliquerons les méthodes permettant de mener des tests
d’hypothèses sur des moyennes ou des pourcentages. Nous expliquerons en
particulier les techniques qui permettent de déterminer objectivement si les
résultats échantillonnaux confirment l’hypothèse concernant la valeur du
paramètre ou si, au contraire, ils l’infirment, entraînant son rejet.

1
I. Les tests d’hypothèses

a) Méthodologie des tests

En général, un test d’hypothèse comporte les étapes suivantes :

1- Choisir l’hypothèse H0 à vérifier.


2- Choisir une hypothèse rivale H1 qui sera acceptée si l’hypothèse originale est
rejetée.
3- Se fixer une règle pour prendre la décision d’accepter ou de rejeter
l’hypothèse.
4- Choisir un échantillon aléatoire dans la population et calculer la statistique
appropriée (moyenne, proportion, variance…).
5- Prendre la décision.

La première étape consiste à spécifier la valeur présumée du paramètre avant


de procéder à l’échantillonnage. Cette hypothèse est appelée hypothèse nulle et
c’est elle qui sera comparée avec le résultat obtenu de l’échantillon.

Par exemple, si nous voulons tester que la moyenne du QI de la population d’une


école de commerce est égale à 100, l’hypothèse nulle aura la forme suivante :

H0 : m = 100

Lorsque l’hypothèse nulle est rejetée, la conclusion acceptée s’appelle


l’hypothèse alternative. Il y a trois hypothèses alternatives possibles. Pour
reprendre notre exemple sur les QI nous aurions :

H1 : m ≠ 100
H1 : m > 100
H1 : m < 100

C’est ainsi qu’on distingue les tests bilatéraux et les tests unilatéraux.

Dans le cas du test bilatéral, les résultats possibles sont :

- Pour les moyennes, H0 : m = m0 et H1 : m ≠ m0,


- Pour les proportions, H0 : p = p0 et H1 : p ≠ p0.

Dans le cas du test unilatéral inférieur, les résultats possibles sont :

- Pour les moyennes, H0 : m = m0 et H1 : m < m0,


- Pour les proportions, H0 : p = p0 et H1 : p < p0.

Dans le cas du test unilatéral supérieur, les résultats possibles sont :

- Pour les moyennes, H0 : m = m0 et H1 : m > m0,


- Pour les proportions, H0 : p = p0 et H1 : p > p0.

2
La troisième étape consiste à établir le critère d’acceptation ou de rejet de
l’hypothèse nulle.

Par exemple la responsable pédagogique d’une école de commerce affirme que le


QI moyen par étudiant est de 100 (hypothèse nulle). Un test est alors mené pour
réfuter ou approuver l’affirmation de la responsable pédagogique. Il est bien sûr
peu probable que la moyenne de l’échantillon étudié soit égale à 100, même si
cette valeur correspond à la véritable moyenne de la population. Le statisticien
sait qu’il y aura sans doute une différence entre la moyenne échantillonnale et la
valeur présumée du paramètre. Le problème auquel il fait face consiste à
déterminer combien grande ou significative doit être la différence entre x et la
valeur présumée pour pouvoir légitimement réfuter l’affirmation de la responsable
pédagogique. Est-ce qu’une différence de 5 est significative ? Et une différence de
10 ?

Supposons que nous ayons une distribution d’échantillonnage de moyenne dont la


véritable moyenne m est égale à la valeur présumée m0 de 100 et dont l’erreur
type  x est égale à 5. Autrement dit, nous prenons pour acquis que la responsable
pédagogique a effectivement raison et que m est réellement égal à 100. Quelles
sont les chances d’obtenir un x différent d’au moins 10 dans une telle situation ?

Lorsque la valeur véritable du paramètre de la population est celle proposée par


l'hypothèse nulle, on sait que la probabilité d'observer une différence entre
la moyenne échantillonnale (l'estimateur) et la valeur hypothétique m0 devient plus
petite à mesure que la différence s'accroît, autrement dit, il est très improbable
d'observer une grande différence. Ainsi la probabilité d’obtenir un x de 110 et plus
(2 erreurs-type) n’est que de 2.3% (à droite) approximativement, la probabilité
d’obtenir un x de 90 et moins n’est que de 2.3% (à gauche), soit une région
d’acceptation de 95.4%. On voit en effet sur la figure que la probabilité totale que

3
x diffère de la moyenne présumée m0 d’au moins deux écart-type est de 4.6%. On
dira alors que l’intervalle,

I X ; 4.6% = [90 ; 110]

est la zone d’acceptation de H0.

Dit autrement :
p (m - t  x ≤ x ≤ m + t  x ) = 1-α

Dans notre exemple :


p (100 – 2×5 ≤ x ≤ 100 + 2×5) = 95.4%

Avant même de prélever l'échantillon, nous devrons toujours déterminer le seuil de


signification du test (symbolisé par la lettre α), c.-à-d. la probabilité de rejeter
l’hypothèse nulle alors même qu’elle est vraie. Dans notre exemple, le risque de
rejet, donc le seuil de signification α, est de 4.6%. On dit aussi que α est l’erreur
de première espèce1. Ainsi :

α = probabilité (refuser H0 / H0 est vraie)

Par exemple α = 0.046 signifie que l’hypothèse nulle sera jugée inacceptable si la
différence entre x et m0 n’a qu’une probabilité de 4.6% ou moins d’arriver lorsque
H0 est vrai. Mais cette différence peut être négative ou positive, c.-à-d. que x peut
être trop petit ou trop grand. Nous voulons donc 2.3% de chances de rejeter
l’hypothèse nulle de chaque côté de la distribution d’échantillonnage et α
représente le risque d’erreur total.

Que se passe-t-il si le statisticien trouve un QI moyen de plus de 110 sur


l’échantillon étudié ? Une si grande différence entre x et m0 étant au départ très
improbable (2.3%), le statisticien jugera qu’il y a une raison suffisante pour rejeter
l’hypothèse de la responsable pédagogique. Supposons que la moyenne de la
population soit réellement de 100. Le statisticien qui ne pouvait savoir que m = 100
aurait pu légitimement, mais à tort, rejeter l’hypothèse de la responsable
pédagogique2.

La quatrième étape consiste à choisir un échantillon aléatoire dans la


population et calculer la statistique appropriée (moyenne dans notre exemple).

La dernière étape consiste à prendre la décision en fonction des critères


préalablement définis.

1
Une erreur de seconde espèce est commise si on accepte H0 et que celle-ci est fausse.
2
Toutefois nous avons vu qu’un tel scénario n’est ici possible que dans 4.6% des fois dans
l’éventualité où notre statisticien effectuerait un grand nombre de tests (où il prélèverait plusieurs
échantillons pour en calculer un QI moyen). Bref, la probabilité minimale acceptable α est bien le
risque de rejeter à tort une bonne hypothèse.

4
b) Illustration

Une entreprise de l’industrie alimentaire spécialisée dans les plats cuisinés


individuels utilise un robot qui verse de la purée dans des barquettes en
aluminium. Chaque barquette doit contenir 150 grammes de purée. Ce poids
noté m0 est appelé la norme. Le robot peut se dérégler, on ignore donc le poids
moyen réel (noté m) effectivement versé par la barquette. On considèrera que
l’écart type est connu : σ = 15 g. L’entreprise veut contrôler régulièrement le bon
fonctionnement du robot.

Pour cela, chaque jour à heure fixe, un employé prélève 50 barquettes et


détermine sur cet échantillon le poids moyen de purée par barquette. On notera x i
la valeur obtenue le jour i. Compte tenu des fluctuations d’échantillonnage, x i
peut être différent de la norme sans que le robot soit mal réglé.

Que dire si l’on obtient x i = 152.4 g ou x i = 145 g ? On prendra α = 5%.

Notre illustration porte sur un test bilatéral, puisque l'hypothèse émise consiste à
tester l'égalité de la valeur du test avec une valeur donnée. Le rejet de l'hypothèse
H0 est décidé si la valeur du test est significativement différente, qu'elle soit
inferieure (zone de rejet de gauche) ou supérieure (zone de rejet de droite).

Soit m le poids moyen d’une barquette de purée. Le problème se résout en testant


au seuil α = 5% les hypothèses suivantes :

H0 : m = 150 ce qui correspond au robot bien réglé


H1 : m ≠ 150 ce qui correspond au robot mal réglé

On détermine la région d’acceptation en déterminant l’intervalle centré en 150 :

IX ; = [150 – a ; 150 + a] avec p [150 – a ≤ X ≤ 150 + a] = 1 – 0.05

En clair, on détermine l’intervalle de confiance IX ;  dans lequel doit se situer


l’estimateur X , et ceci avec une probabilité de p = 1 – α. L’intervalle obtenu
s’appelle la zone d’acceptabilité de l’hypothèse nulle.

On donne α = 0.05, σ = 15 g et n = 50. La taille de l’échantillon étant supérieure à


30, on a :

15
X ⤳ N (150 ; )
50

En effet, si H0 est vraie, alors X ⤳ N (m0 ; )
n

Le graphique suivant nous permet de visualiser la région d’acceptation de


l’hypothèse nulle.

5
Calculons a sachant p [150 – a ≤ X ≤ 150 + a] = 0.95, avec X ⤳ N (150 ; 2.12).

Puisque a correspond à la marge d’erreur, nous pourrons écrire :

p (m - t  x ≤ x ≤ m + t  x ) = 0.95

Pour un niveau de confiance de 95%, nous avons t = 1.96 soit :

p (150 – 1.96 × 2.12 ≤ x ≤ 150 + 1.96 × 2.12) = 0.95

Conclusion :

IX ;5% = [150 – 4.16 ; 150 + 4.16] = [145.8 g ; 154.2 g]

Autrement dit, la zone d’acceptation sera comprise entre 145.8 g et 154.2 g, au


seuil de signification de 5%.

Appliquons les règles de décision :

Cas 1 : on a obtenu IX ;5% = [145.8 g ; 154.2 g] et x 1 = 152.4 g

L’hypothèse H0 est acceptée au seuil de 5% et le robot est donc bien réglé.


Autrement dit, l’écart, peu important, entre la moyenne de l’échantillon et la
valeur présumée de la population est lié aux fluctuations d’échantillonnage (donc
au hasard), non à un problème technique.

6
Cas 2 : on a obtenu IX ;5% = [145.8 g ; 154.2 g] et x 2 = 145 g

L’hypothèse H0 est rejetée au seuil de 5% et le robot est donc mal réglé.

Nous pouvons à présent visualiser la règle de décision :

7
II. Le test du Khi deux

a) Principes généraux

Si X1,..., Xn sont n variables aléatoires indépendantes qui suivent une loi


normale centrée réduite, alors la somme de leur carré suit une loi du Khi deux
à n degrés de liberté.

Ainsi la somme Z = X12 +...+ Xn2, qui est aussi une variable aléatoire, suit la loi du
 2 (lire Khi 2) à n degrés de liberté. On démontre que cette variable Z admet pour
espérance mathématique n et pour variance 2n.

La quantité de variables impliquées donne le nombre de degré de liberté (d.l.) et


ce nombre détermine la forme de la courbe. Celle-ci est positivement
dissymétrique pour des petites valeurs de d.l., mais s'approche progressivement de
la distribution normale à mesure que le nombre de d.l. augmente. De fait, il existe
autant de distributions du  2 que de valeurs de n.

En résumé, la distribution du  2 possède autant de courbes qu’il y a de degrés


de liberté. Le nombre de d.l constitue le seul paramètre d’une distribution  2
et est toujours égal à la moyenne de cette distribution.

La distribution du  2 est utilisée pour les tests d’indépendance. On cherchera par


exemple s’il existe un lien entre le programme d’étude d’une école et le niveau de
satisfaction des étudiants, s’il existe une relation entre le sexe et le parti politique
ou entre les années de scolarité post-lycée et les impôts à l’âge de 40 ans. Ainsi
l’hypothèse nulle consistera à supposer l’absence de lien et l’hypothèse
alternative l’existence d’un lien de dépendance entre les deux variables étudiées.

En second lieu, cette loi permet de réaliser un test d’ajustement analytique. On


recourt à ce test pour déterminer si une population donnée suit une distribution
particulière connue en comparant une distribution observée avec une distribution
théorique. Autrement dit, ce test permettra de vérifier la qualité de l’ajustement
de la population étudiée à une distribution normale, binomiale ou encore uniforme
(une distribution est dite uniforme si toutes les fréquences de la distribution sont

8
égales)3. Par exemple dans le cadre d’une étude de marché, on relève une série de
notes attribuées par 30 répondants à un message publicitaire. Peut-on estimer que
ces notes suivent une loi normale ? Le test du  2 permettra éventuellement de le
confirmer. Si c’est le cas, l’hypothèse H0 suivant laquelle la distribution observée
suit une loi normale sera acceptée.

Une valeur de  2 critique détermine la zone pour laquelle un  2 calculé a peu de


chances d'être aussi élevé si l'hypothèse nulle est vraie. Par conséquent, la zone de
rejet se situera toujours à l'extrémité droite de la distribution.

Par exemple l’extrait de table ci-dessous indique que pour d.l. = 5 et α = 0.10, on
obtient la valeur critique 9.236. En d'autres termes, si les cinq écarts (au carré)
indépendants obtenus empiriquement proviennent véritablement de distributions
normales centrées réduites, il y a 10% des chances que la valeur de  2 calculée
dépasse 9.236.

d.l./ α 0.10 0.05 0.01


1 2.706 3.841 6.635
2 4.605 5.991 9.210
3 6.251 7.815 11.345
4 7.779 9.488 13.277
5 9.236 11.070 15.086

Quelle est la méthode générale d’un test  2 ?

Dans un test de  2 , la décision finale repose toujours sur une évaluation des écarts
entre des fréquences observées à l'intérieur d'échantillons aléatoires et des
fréquences théoriques espérées qui devrait être observées si l'hypothèse nulle

3
Rappelons qu’une distribution de probabilités est simplement une énumération complète de tous
les résultats possibles d’une expérience avec leurs probabilités respectives. La distribution normale
et la distribution binomiale sont parmi les distributions de probabilités les plus importantes. La loi
binomiale s’intéresse aux phénomènes caractérisés par deux issues possibles (pièce défectueuse ou
non, réponse positive ou négative à une question…). Un exemple simple de loi uniforme est le
lancer d’un dé non biaisé. Les valeurs possibles sont 1, 2, 3, 4, 5, 6 ; et à chaque fois que le dé est
lancé, la probabilité d’un score donné est égale à 1/6.

9
soumise au test était vraie. De façon générale, les étapes du test de  2 sont les
suivantes :

Étape 1 : Formuler l'hypothèse nulle et l'hypothèse alternative

Dans ce cas, l'hypothèse nulle affirme qu'il n'existe aucune différence


significative (c.-à-d. non attribuable à l'erreur d'échantillonnage) entre les
fréquences observées dans les populations et les fréquences attendues (c.-à-d.
hypothétiques).

Étape 2 : Choisir le seuil de signification du test.

Étape 3 : Prélever des échantillons aléatoires de chaque population


et relever, pour chacun, les fréquences observées.

Étape 4 : Calculer les fréquences théoriques espérées (ou les pourcentages)


que l'on devrait observer si l'hypothèse nulle était vraie.

Étape 5 : À partir de fréquences observées (fo) et des fréquences théoriques


espérées (fe), calculer la valeur de  2 à l'aide de la formule :

2  
fo  fe 2
fe

On note que si toutes les fréquences observées étaient égales aux fréquences
espérées, cette somme serait égale à 0. Donc 0 est la valeur idéale que devrait
prendre la valeur du  2 lorsque H0 est vraie4.

Étape 6 : Comparer la valeur du  2 calculée à l'étape 5 avec la valeur critique de


la table de  2 (selon α et d.l.) afin de déterminer si le  2 calculé est
significativement différent de 0. Si c'est le cas, c'est donc que ce  2 a si peu de
chance d'être aussi élevé, si l'hypothèse nulle était vraie, qu'on en conclut que
l'hypothèse nulle est probablement fausse. En effet, si  2 est la valeur critique :

Probabilité (  2 >  2 ) = α

b) Illustration avec un test de dépendance

Nous allons d’abord voir comment s’applique la méthode générale du test du  2


pour vérifier si deux variables sont dépendantes ou indépendantes.

Supposons que l'on demande à un certain nombre d'étudiants de trois modules


de l'université s'ils désirent prendre un cours de statistiques à la prochaine
4
Cependant, même si H0 est vraie, nous savons qu’il est improbable que, dans une situation
concrète, fo et fe soient identiques en raison des erreurs d’échantillonnage.

10
session. On veut savoir, au seuil de 5%, si le pourcentage de gens qui songent à
s'inscrire est identique dans chaque module. Les résultats obtenus, présentés sous
forme de tableau de contingences (tableau à double entrée qui permet de
classifier les observations selon deux caractéristiques, ici la discipline étudiée et la
réponse de l’étudiant), sont les suivants :

Module Psychologie Administration Mathématiques Total ligne


Réponse
Oui 30 32 25 87
Non 60 80 40 180
Total colonne 90 112 65 267

PS : 267 = grand total

Voici comment réaliser le test d'hypothèse correspondant :

° Étape 1 : Formuler l'hypothèse nulle et l'hypothèse alternative

H0 : le pourcentage des populations désirant s'inscrire à un cours


de statistiques est le même dans chaque module
vs
H1 : le pourcentage des populations désirant s'inscrire à un cours
de statistiques n'est pas le même dans chaque module

On voit ici l’utilité du test  2 qui permet de comparer les pourcentages de


plusieurs échantillons indépendants (ici on souhaite déterminer s’il existe une
différence entre les pourcentages de trois échantillons d’étudiants). Une autre
façon, équivalente, de formuler les hypothèses, serait :

H0 : le désir de s'inscrire à un cours de statistiques


est indépendant du module auquel appartient l'étudiant
vs
H1 : le désir de s'inscrire à un cours de statistiques
est dépendant du module auquel appartient l'étudiant

° Étape 2 : Choisir le seuil de signification du test.

Ce seuil réfère toujours à la probabilité de commettre une erreur de première


espèce lorsque l'hypothèse nulle est vraie. Le seuil choisi ici est α = 0.05.

° Étape 3 : Prélever des échantillons et relever les fréquences observées (voir le


tableau précédent).

° Étape 4 : Calculer les fréquences théoriques espérées si H0 était vraie.

On remarque que, au total, 87 personnes, sur les 267 interrogées, désirent


effectivement s'inscrire à un cours de statistiques, soit 32.58%. Par conséquent, si
l'hypothèse nulle était vraie, 32.58% de 90 étudiants en psychologie devraient
vouloir suivre un cours de statistiques, soit :

11
32.58% × 90 = (87/267) × 90 = 29.33 personnes

Ce nombre correspond à la fréquence théorique espérée pour la case « Oui –


Psychologie » du tableau de contingence.

De la même façon, on pourrait calculer cette fréquence théorique pour


chaque cellule. Par exemple, pour la case «Non - Mathématiques», on a :

(180/267) × 65 = 43.82

D’où le tableau de fréquences théoriques suivant :

MODULE
Psychologie Administration Mathématiques Total
RÉPONSE

Oui 29.33 30 36.49 32 21.18 25 87

Non 60.67 60 75.51 80 43.82 40 180

Total 90 112 65 267

° Étape 5 : Calculer la valeur de  2

On complète le tableau de calcul suivant :

Case (l/c) fo fe fo - fe (fo - fe)2 (fo - fe)2/fe

1-1 30 29.33 0.67 0.45 0.02

1-2 32 36.49 -4.49 20.16 0.55

1-3 25 21.18 3.82 14.59 0.69

2-1 60 60.67 -0.67 0.45 0.01

2-2 80 75.51 4.49 20.16 0.27

2-3 40 43.82 -3.82 14.59 0.33

Σ 267 267 0.00 1.87

Où, pour vérifier les calculs, on a : Σfo = Σfe et Σ (fo - fe) = 0.

Finalement :

(f0  fe )2
 =
2
= 1.87
fe

° Étape 6 : Comparer la valeur du  2 calculée avec la valeur critique de la table.

12
Pour déterminer la valeur du  2 critique, on doit connaître α et d.l.

Pour un tableau de contingences, le nombre de d.l. est donné par la formule :

d.l. = (l - 1)(c - 1)

Où l = le nombre de lignes du tableau et c = le nombre de colonnes du tableau. Ici :

α = 0.05 et d.l. = (2 - 1)(3 - 1) = 1 × 2 = 2

Cela signifie que dans un tableau 2 × 3, seulement 2 des valeurs fe doivent être
calculées. Les quatre autres valeurs restantes du tableau sont alors
automatiquement déterminées par les totaux des lignes et des colonnes.

Sur la table, on voit que, pour ces valeurs, le  2 critique est 5.991. Cette valeur
critique de 5.991 signifie que si H0 est vrai, la probabilité d’obtenir un  2 calculé
supérieur à 5.991 n’est que de 5%. Puisque le  2 calculé (1.87) est inférieur à la
valeur critique, on doit maintenir H0. En d'autres termes, il semble que le
pourcentage de gens qui désirent suivre un cours de statistiques est le même dans
chaque module.

c) Illustration avec un test d’ajustement

Nous allons maintenant voir comment s’applique la méthode générale du test du


 2 pour vérifier la qualité de l’ajustement de données échantillonnales à une
distribution uniforme. Rappelons en effet qu’on recourt à ce test pour déterminer
si une population donnée (après étude d’un échantillon de cette population) suit
une distribution particulière. Pour ce type de test, l'hypothèse nulle spécifie
toujours que la distribution de la population est de la forme supposée.

La compagnie Pepca Cola veut mettre sur le marché un nouveau cola diététique et
sans saveur appelé Colasancalo. Pour évaluer ce nouveau produit, le directeur du
marketing décide de faire passer un test de goût à 300 personnes. On demande à
chacune d’elles de goûter le Colasancalo ainsi que quatre autres marques de cola à
basse teneur en calories. Afin de ne pas biaiser le test, on identifia les colas par les
lettres A, B, C, D et E. Les résultats sont donnés au tableau suivant :

Marques Nombre de personnes préférant les


marques
A 50
B 65
C 45
D 70
E 70
300

13
ÉTAPE 1 : Énoncer les hypothèses nulles et alternatives

H0 : la distribution de la population est uniforme, autrement dit, les pourcentages


de la population préférant chaque marque de cola sont identiques.
vs
H1 : la distribution de la population n’est pas uniforme, autrement dit, les
pourcentages de la population préférant chacune des marques ne sont pas les
mêmes.

ÉTAPE 2 : On spécifie le seuil de signification, ici 0.05

ÉTAPE 3 : On détermine les fréquences observées (f0). Ces valeurs sont données
dans le tableau précédent.

ÉTAPE 4 : On calcule les fréquences théoriques espérées (f e). Si l’hypothèse nulle


est vraie, il devrait idéalement y avoir le même nombre de personnes dans
l’échantillon préférant l’une ou l’autre des 5 marques de cola. Cela signifie qu’on
devrait retrouver dans l’échantillon 20% (1/5e) des gens qui préfèrent la marque A,
20% des gens qui préfèrent la marque B, et ainsi de suite. Donc la valeur f e pour
chaque marque devrait être de 20% de 300, ou 60.

ÉTAPE 5 : Calculer la valeur de  2

On complète le tableau de calcul suivant :

Marques Nombre de fe fo - fe (fo - fe)2 (fo - fe)2/fe


personnes
préférant
les
marques

fo

A 50 60 -10 100 1.667

B 65 60 5 25 0.417

C 45 60 -15 225 3.750

D 70 60 10 100 1.667

E 70 60 10 100 1.667

Σ 300 9.168

ÉTAPE 6 : Comparaison du calculé  2 avec la valeur critique de la table

Le nombre de degrés de liberté est ici de 4. Ceci s’explique facilement : la somme


des fréquences observées est de 300 et, par conséquent, la somme de f e doit aussi

14
être égale à 300. Cela implique que 4 des 5 cases du premier tableau peuvent
varier « librement », la 5e étant déterminée par le total de 300. Dans un test
d’ajustement à la distribution uniforme, le nombre de degrés de liberté est
toujours égal au nombre de classes ou catégories de la distribution moins 1.

Le nombre de degrés de liberté étant maintenant connu, il est donc possible de


trouver dans la table la valeur  2 critique. Pour 4 d.l, la valeur critique
correspondant au seuil de 0.05 est de 9.488, ce qui est légèrement supérieur au  2
calculé de 9.168.

Nous acceptons donc H0 Puisque le  2 calculé (9.168) est inférieur à la valeur


critique. Á un seuil de 5%, nous ne pouvons rejeter l’hypothèse selon laquelle un
pourcentage égal de la population préfère chacune des 5 marques de cola. Nous
devons en conclure au seuil de 0.05 que Colasancalo n’a pas meilleur goût que les
autres marques.

15
III. Applications

● a) Qu’est-ce qu’une hypothèse nulle ? Alternative ?


b) Qu’est-ce que le seuil de signification ?
c) Qu’entend-on par différence significative dans un test d’hypothèse ?

a) Une hypothèse nulle est une hypothèse qui spécifie la valeur du paramètre ;
c’est cette hypothèse qui est soumise au test statistique. Une hypothèse
alternative est une hypothèse qui doit être acceptée lorsque l’hypothèse nulle est
rejetée.

b) Le seuil de signification α est le risque de rejet d’une hypothèse nulle qui, dans
les faits, est vraie.

c) La différence entre la statistique obtenue et la valeur présumée du paramètre


est significative lorsqu’elle mène au rejet de l’hypothèse nulle.

● Quand doit-on accepter l’hypothèse nulle ? Quand doit-on la rejeter ?

Lorsque la différence entre x et la valeur présumée de m0 dans l’hypothèse H0 se


situe dans la région d’acceptation, l’hypothèse nulle est acceptée. Lorsque la
différence entre x et la valeur présumée de m0 dans l’hypothèse H0 se situe dans
l’une des deux régions critiques (l’écart est donc important), l’hypothèse nulle doit
être rejetée.

● Une entreprise doit remplacer une machine trop ancienne. Plusieurs offres lui ont
été proposées. Après comparaison, l’entreprise porte son dévolu sur l’achat de la
machine référencée A, dont le vendeur affirme qu’il y a 92% de chances que cette
machine ne tombe pas en panne durant ses trois premières années d’utilisation.

Avant de prendre sa décision finale, le responsable chargé de cet achat souhaite


tester la validité de l’affirmation du vendeur au sujet du bon fonctionnement de
cette machine sur les trois premières années. Pour cela, il consulte les statistiques
sur les pannes du matériel A. Sur 300 machines A vendues il y a 3 ans, 269 ne sont
pas tombées en panne.

D’après-vous, que décidera le responsable de l’achat ? On raisonnera sur la base


d’un seuil de 5%.

Le test est dit unilatéral inférieur car l'hypothèse émise évalue si une valeur est
inférieure ou égale à la valeur de test. Le rejet de l'hypothèse H0 est décidé si la
valeur du test est significativement inférieure (zone de rejet à gauche).

16
L’étape 1 consiste à formuler les hypothèses. On note p la probabilité que la
machine ne tombe pas en panne durant ses 3 premières années d’utilisation.

H0 : p = 0.92 soit l’affirmation du vendeur est juste


H1 : p < 0.92 soit l’affirmation du vendeur est fausse

269
D’après l’énoncé on a fi = = 0.8966 soit 89.66%
300

Dans un second temps, on détermine la région d’acceptation de H0, comme le


montre le graphique ci-dessous.

On détermine la région d’acceptation en déterminant l’intervalle :

If ;  = [0.92 – a ; +∞] avec p [f ≥ 0.92 - a] = 1 – 0.05

Autrement dit, la zone d’acceptation sera comprise entre 0.92 - a et l’infini, au


seuil de signification de 5%.

On donne α = 0.05, p0 = 0.92 et n = 300. La taille de l’échantillon étant supérieure


à 30, on a :

0.92  0.08
f ⤳ N (0.92 ; )
300

17
pq
En effet, si H0 est vraie, alors f ⤳ N (p0 ; )
n

En clair, on détermine l’intervalle de confiance IF ;  dans lequel doit se situer


l’estimateur f, et ceci avec une probabilité de 1 – α. L’intervalle obtenu s’appelle
la zone d’acceptabilité de l’hypothèse nulle.

Calculons a sachant p [f ≥ 0.92 - a] = 0.95

f  0.92
Avec f ⤳ N (0.92 ; 0.0157) ⇒ T = ⤳ N (0 ; 1)
0.0157

0.92  a  0.92
p [f ≥ 0.92 - a] = 0.95 ⇔ p [T ≥ ]= 0.95
0.0157

a a
⇔ p [T ≥ ]= 0.95 ⇔ 1 - p [T ≤ ]= 0.95
0.0157 0.0157

D’où la règle de décision suivante sachant que la fréquence fi de l’échantillon est


de 89.67% :

18
L’hypothèse H0 est acceptée au seuil de 5%. L’affirmation du vendeur selon
laquelle il y a 92% de chances que la machine ne tombe pas en panne les trois
premières années d’utilisation peut être considérée, au seuil de 5%, comme juste.

Graphiquement, la règle de décision pourrait être visualisée comme suit :

● Une entreprise de l’industrie alimentaire spécialisée dans les plats cuisinés


individuels utilise un robot qui verse de la purée dans des barquettes en
aluminium. Le fournisseur de barquettes en aluminium garantit que 1% seulement
des barquettes ne sont pas étanches. Celles-ci sont livrées par camion en très
grand nombre une fois par mois.

Un échantillon de 500 barquettes est observé à chaque livraison pour tester la


validité de l’affirmation du fournisseur au sujet de l’étanchéité de ces barquettes.
Dans le cas de non validation, la livraison est refusée.

Au seuil de 5%, quelle décision sera prise si l’on trouve 9 barquettes


défectueuses sur un lot de 500 barquettes ?

Le test est dit unilatéral supérieur car l'hypothèse émise évalue si une valeur est
supérieure ou égale à la valeur de test. Le rejet de l'hypothèse H0 est décidé si la
valeur du test est significativement supérieure (zone de rejet à droite).

19
L’étape 1 consiste à formuler les hypothèses. On note p la proportion de
barquettes non étanches.

H0 : p = 0.01 soit l’affirmation du fournisseur est juste


H1 : p > 0.01 soit l’affirmation du fournisseur est fausse

9
D’après l’énoncé on a sur l’échantillon fi = = 0.018 soit 1.8%
500

Dans un second temps, on détermine la région d’acceptation de H 0, comme le


montre le graphique ci-dessous.

On détermine la région d’acceptation en déterminant l’intervalle :

If ;  = [-∞; 0.01 + a] avec p [f ≤ 0.01 + a] = 1 – 0.05

En clair, on détermine l’intervalle de confiance IF ;  dans lequel doit se situer


l’estimateur f, et ceci avec une probabilité de 1 – α. L’intervalle obtenu s’appelle
la zone d’acceptabilité de l’hypothèse nulle. Ici, la zone d’acceptation sera
comprise entre moins l’infini et 0.01 + a, au seuil de signification (ou risque
d’erreur) de 5%.

20
On donne α = 0.05, p0 = 0.01 et n = 500. La taille de l’échantillon étant supérieure
à 30, on a :

0.01  0.99
f ⤳ N (0.01 ; )
500

pq
En effet, si H0 est vraie, alors f ⤳ N (p0 ; )
n

Calculons a sachant p [f ≤ 0.01 + a] = 0.95

f  0.01
Avec f ⤳ N (0.01 ; 0.0044) ⇒ T = ⤳ N (0 ; 1)
0.0044

0.01  a  0.01
p [f ≤ 0.01 + a] = 0.95 ⇔ p [T ≤ ] = 0.95
0.0044

a a
⇔ p [T ≤ ]= 0.95 ⇔ ∏ [ ]= 0.95
0.0044 0.0044

On regarde dans la table de la fonction de répartition de N (0 ; 1) :

D’où la règle de décision suivante sachant que la fréquence fi de l’échantillon est


de 89.67% :

21
On peut visualiser la règle de décision :

L’hypothèse H0 est rejetée au seuil de 5%. L’affirmation du fournisseur selon


laquelle 1% des barquettes ne sont pas étanches peut être considérée, au seuil de
5%, comme fausse. Autrement dit, H1 est acceptée et l’entreprise refusera cette
commande.

● Le montant des notes de restaurant des cadres d’une PME suit une loi normale de
moyenne 95 euros et d’écart type 26 euros. En début d’année, le chef d’entreprise
a sensibilisé ses cadres à la compression de ces frais généraux. À partir d’un
échantillon de 225 additions choisies au hasard parmi celles de l’année en cours, la
moyenne des frais de restauration ressort à 98 euros pour un écart type de 17
euros. Sur la base de ces éléments, peut-on considérer que le chef d’entreprise n’a
pas été écouté (en retenant un seuil de 1%) ?

22
Le test est dit unilatéral supérieur car l'hypothèse émise évalue si une valeur est
supérieure ou égale à la valeur de test. Le rejet de l'hypothèse H0 est décidé si la
valeur du test est significativement supérieure (zone de rejet à droite).

Le problème se résout en testant au seuil α = 1% les hypothèses suivantes :

H0 : m0 = 95 le boss a été écouté


H1 : m0 > 95 le boss n’a pas été écouté

On détermine la région d’acceptation en déterminant l’intervalle :

I X ; 0.01 = [-∞; 95 + a] avec p [ x ≤ 95 + a] = 1 – 0.01

En clair, on détermine l’intervalle de confiance I X ; 0.01 dans lequel doit se situer


l’estimateur x , et ceci avec une probabilité de 1 – α. L’intervalle obtenu s’appelle
la zone d’acceptabilité de l’hypothèse nulle. Ici, la zone d’acceptation sera
comprise entre moins l’infini et 95 + a, au seuil de signification (ou risque d’erreur)
de 1%.

L’échantillon prélevé comporte n = 225 additions de moyenne x = 98€ et d’écart


type σe = 17€. La taille de l’échantillon étant supérieure à 30, on a :

26
X ⤳ N (95 ; )
225


En effet, si H0 est vraie, alors X ⤳ N (m0 ; )
n
26 X  95
Avec X ⤳ N (95 ; )⇒T= ⤳ N (0 ; 1)
225 1.73

95  a  95 a a
On cherche p [T ≤ ] = 0.99 ⇔ p [T ≤ ]= 0.99 ⇔ ∏ [ ]= 0.99
1.73 1.73 1.73

On regarde dans la table de la fonction de répartition de N (0 ; 1) :

a
= 2.33 soit a = 2.33 × 1.73 = 4.04
1.73

L’intervalle d’acceptation est, au seuil de 1%, de I X ; 0.01 = [-∞; 99.04]. La valeur


observée de 98€ étant inférieure à la valeur critique (99.04€), nous sommes
conduits à accepter l’absence d’augmentation des notes de restauration.

● La société Tesmo produit en série des pièces en bois. Dans son atelier de coupe,
la scieuse automatique a été réglée pour couper à une longueur de 15 cm des

23
taquets pour un type de meubles. La qualité dans l’ajustage du produit final
nécessite une très grande précision dans la dimension des éléments qui le compose,
aussi un test statistique est mis en place pour vérifier que le réglage de la machine
reste constant pendant sa période d’exploitation. Sur un échantillon de 121 taquets
extraits de la production en cours, la longueur mesurée donne une moyenne de
14.91 cm et un écart type de 0.64 cm.

a) Quelle est la nature de ce test et quelles sont les deux hypothèses alternatives
relatives à cette situation ?
b) Au seuil de signification de 5%, la machine est-elle toujours bien réglée ?

a) Notre illustration porte sur un test bilatéral, puisque l'hypothèse émise consiste
à tester l'égalité de la valeur du test avec une valeur donnée. Le rejet de
l'hypothèse H0 est décidé si la valeur du test est significativement différente,
qu'elle soit inferieure (zone de rejet de gauche) ou supérieure (zone de rejet de
droite).

Le problème se résout en testant, au seuil α = 5%, les hypothèses suivantes :

H0 : m = 15 la machine est bien réglée


H1 : m ≠ 15 la machine est mal réglée

b) L’échantillon prélevé comporte n = 121 taquets de longueur moyenne x = 14.91


cm et d’écart type σe = 0.64. En choisissant une probabilité 1-α pour l’intervalle de
confiance (soit un risque d’erreur de α), les bornes de l’intervalle de confiance
sont déterminées par un test bilatéral :

p (m - t  x ≤ x ≤ m + t  x ) = 1-α

Avec  x = .
n

L’écart type σ de la population est inconnu,  x ne peut être calculé. Ce dernier


est estimé par :

σe 0.64
σ̂ x = = = 0.0584
√n−1 √121−1

Avec un risque d’erreur de 5%, t = 1.96 et la variation autour de la moyenne est :

±1.96 × 0.0584 = ± 0.115 cm

L’intervalle d’acceptation est : [14.885 ; 15.115]. La valeur de l’échantillon (14.91


cm) est à l’intérieur de l’intervalle, l’hypothèse H0 est acceptée. La machine est
bien réglée.

24
● Quelle définition du  2 pourriez-vous proposer ?

C’est la statistique qui mesure les écarts relatifs entre les fréquences théoriques
(fe) et les fréquences observées (fo). Elle se calcule à l’aide de la formule :

(f0  fe )2
2 =  f
e

● a) L’hypothèse nulle H0 dans un test de comparaison de k pourcentages stipule


qu’il n’existe aucune différence significative entre les pourcentages au sein des
populations considérées. Vrai ou faux ?
b) Si H0 est vrai, le  2 calculé sera égal à 0. Vrai ou faux ?
c) Si le  2 calculé est plus petit que la valeur  2 critique, il se situe dans la région
de rejet. Vrai ou faux ?
d) Les étapes et les règles de décision d’un test d’ajustement sont essentiellement
les mêmes que pour un test d’indépendance. Vrai ou faux ?

a) Vrai.

b) Faux. Même si H0 est vrai, il est fort probable que la variation d’échantillonnage
produira des écarts entre f0 et fe.

c) Faux. Le  2 calculé se situe alors dans la région d’acceptation et, par


conséquent, H0 devra être accepté.

d) Vrai.

● Pour cerner l'opinion des travailleurs sur un éventuel changement aux règles de
régie interne de la centrale syndicale qui les représente, l'exécutif a fait parvenir
un questionnaire à 100 membres de trois syndicats affiliés. Les résultats du sondage
apparaissent dans le tableau ci-dessous :

SYNDICAT X Y Z
OPINION

Pour 17 23 10

Contre 9 13 8

Indécis 4 4 12

Au seuil de 0.05, les travailleurs des trois syndicats diffèrent-ils significativement


d'opinion ?

25
° Étape 1 : Formuler l'hypothèse nulle et l'hypothèse alternative

H0 : les pourcentages d'opinion sont les mêmes pour chaque syndicat


vs
H1 : les pourcentages d'opinion sont différents selon le syndicat

°Étape 2 : Choisir le seuil de signification du test

Le seuil choisi ici est α = 0.05.

° Étape 3 : Prélever des échantillons et relever les fréquences observées (voir le


tableau ci-dessus).

° Étape 4 : Calculer les fréquences théoriques espérées si H0 était vraie. On


complète le tableau suivant :

SYNDICAT Total
X Y Z
OPINION lignes

Pour 15 17 20 23 15 10 50

Contre 9 9 12 13 9 8 30

Indécis 6 4 8 4 6 12 20

Total colonnes 30 40 30 100

° Étape 5 : Calculer la valeur de  2 . On complète le tableau de calcul suivant :

Case (l/c) fo fe fo - fe (fo - fe)2 (fo - fe)2/fe

1-1 17 15 2 4 0.27

1-2 23 20 3 9 0.45

1-3 10 15 -5 25 1.67

2-1 9 9 0 0 0.00

2-2 13 12 1 1 0.08

2-3 8 9 -1 1 0.11

3-1 4 6 -2 4 0.67

3-2 4 8 -4 16 2.00

3-3 12 6 6 36 6.00

Σ 100 100 0 11.25

Donc :

26
(f0  fe )2
2 =  f = 11.25
e

° Étape 6 : Comparer la valeur du  2 calculée avec la valeur critique de la table


Pour α = 0.05 et d.l. = (3 - 1)(3 - 1) = 2 × 2 = 4 on a un  2 critique de 9.488.
Puisque le  2 calculé est supérieur à la valeur critique, on doit rejeter H0 et
accepter H1. En d'autres termes, les travailleurs des trois syndicats semblent
différer d'opinion.

● Vous affirmez que le nombre de pannes de métro n'est pas identique sur chaque
ligne. Vous relevez les pannes pendant un mois. Voici les résultats :

LIGNE FRÉQUENCE

Verte 56

Orange 66

Bleue 44

Jaune 54

Au seuil de 0.05, que peut-on conclure ?

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative

H0 : le pourcentage de pannes est identique sur chaque ligne métro


(la distribution présumée est donc une distribution uniforme)
vs
H1 : le pourcentage de pannes est différent selon la ligne de métro

° Étape 2 : Choisir le seuil de signification du test

Le seuil choisi ici est α = 0.05

° Étape 3 : Prélever un échantillon et relever les fréquences observées (voir le


tableau de la page précédente)

° Étape 4 : Calculer les fréquences théoriques espérées si H0 était vraie

Si H0 était vraie, on devrait avoir le même nombre de pannes sur chaque ligne.
Comme il y a 4 lignes et un total de 220 pannes, on a : fe = ¼(220) = 55.

° Étape 5 : Calculer la valeur de  2

27
On complète le tableau de calcul suivant :

Ligne fo fe fo - fe (fo - fe)2 (fo - fe)2/fe

Verte 56 55 1 1 0.02

Orange 66 55 11 121 2.20

Bleue 44 55 -11 121 2.20

Jaune 54 55 -1 1 0.02

Σ 220 220 0 4.44

(f0  fe )2
Donc :  2 =  f = 4.44
e

° Étape 6 : Comparer la valeur du  2 calculée avec la valeur critique de la table

Pour α = 0.05 et d.l. = 4 - 1 = 3 on a un  2 critique de 7.815. Puisque le  2 calculé


est inférieur à la valeur critique, on doit maintenir H 0. En d'autres termes, les
données ne permettent pas de montrer que le nombre de pannes est différent sur
chaque ligne de métro.

● Lors d’un sondage, les cinq candidats à une élection ont reçu chacun un certain
nombre de voix. Les données sont les suivantes :

Candidat

Total
A B C D E

122 105 86 83 104 500

a) Rappelez ce qu’est une loi uniforme.


b) Au seuil de 5%, la répartition des voix est-elle égale, à savoir la loi
d’équiprobabilité (ou loi uniforme) est-elle respectée ?

a) Une distribution est dite uniforme si toutes les fréquences de la distribution sont
égales. Un exemple simple de loi uniforme est le lancer d’un dé non biaisé. Les

28
valeurs possibles sont 1, 2, 3, 4, 5, 6 ; et à chaque fois que le dé est lancé, la
probabilité d’un score donné est égale à 1/6.

b) Hypothèses :

H0 : nA = nB = nC = nD = nE
H1 : pas (nA = nB = nC = nD = nE)

L’hypothèse nulle est donc qu’il y a équiprobabilité entre les différents résultats
(le même n donc), alors que l’hypothèse alternative stipule que le nombre de voix
n’est pas semblable.

D’après le tableau, nous remarquons que certains candidats obtiennent plus de voix
que d’autres, et il vaut la peine donc de faire un test. Ce dernier consiste en deux
étapes : obtenir les effectifs théoriques, correspondant à l’équirépartition des voix
dans notre cas et, ensuite, obtenir les valeurs du  2 . Ici, les effectifs théoriques
sont simples à calculer. En effet, étant donné qu’il y a eu 500 réponses, et qu’il y a
5 candidats, l’effectif théorique pour chaque candidat est de 100. Quant à la
valeur du  2 (valeur obtenue), elle s’obtient au moyen de la formule suivante :

(f0  fe )2
 = 
2

fe

Il s’agit donc de prendre chaque effectif observé (f 0), de soustraire l’effectif


théorique (fe), d’élever la différence au carré et de diviser cela par l’effectif
théorique. On somme alors le tout.

(122  100) 2 (104  100) 2


2 = … + = 10.10
100 100

Nous avons un seuil de signification de α = 0.05 et un nombre de degrés de liberté


5 – 1 = 4 (nombre de catégories – 1). En consultant la table, on trouve une valeur
critique de 9.49. Puisque la valeur obtenue est supérieure à la valeur critique, nous
rejetons H0 et acceptons H1.

29
Nous sommes ici dans le cas d’un test de comparaison. La première étape consiste
à formuler les hypothèses.

L’étape suivante consiste à définir la région d’acceptation de H0.

30
Graphiquement :

31
Appliquons les règles de décision. Graphiquement :

32
En conclusion :

33
Au seuil de 5%, les piles des deux marques n’ont pas la même durée de vie
moyenne.

34
35
36

Vous aimerez peut-être aussi