Académique Documents
Professionnel Documents
Culture Documents
hypothèses opposées.
Par exemple, nous faisons une affirmation (ou hypothèse) sur un paramètre de la
population (un maire suggère que le niveau moyen du revenu des habitants de sa
ville est de 50 000€), puis nous vérifions si cette hypothèse est vraie en examinant
un échantillon aléatoire pris dans la population.
Il arrive fréquemment dans les tests d’hypothèse que la différence entre la valeur
de la statistique échantillonnale et la valeur hypothétique du paramètre ne soit ni
très grande ni très petite, de sorte que la décision à prendre ne s’impose pas
d’elle-même.
Dans ce cours, nous expliquerons les méthodes permettant de mener des tests
d’hypothèses sur des moyennes ou des pourcentages. Nous expliquerons en
particulier les techniques qui permettent de déterminer objectivement si les
résultats échantillonnaux confirment l’hypothèse concernant la valeur du
paramètre ou si, au contraire, ils l’infirment, entraînant son rejet.
1
I. Les tests d’hypothèses
H0 : m = 100
H1 : m ≠ 100
H1 : m > 100
H1 : m < 100
C’est ainsi qu’on distingue les tests bilatéraux et les tests unilatéraux.
2
La troisième étape consiste à établir le critère d’acceptation ou de rejet de
l’hypothèse nulle.
3
x diffère de la moyenne présumée m0 d’au moins deux écart-type est de 4.6%. On
dira alors que l’intervalle,
Dit autrement :
p (m - t x ≤ x ≤ m + t x ) = 1-α
Par exemple α = 0.046 signifie que l’hypothèse nulle sera jugée inacceptable si la
différence entre x et m0 n’a qu’une probabilité de 4.6% ou moins d’arriver lorsque
H0 est vrai. Mais cette différence peut être négative ou positive, c.-à-d. que x peut
être trop petit ou trop grand. Nous voulons donc 2.3% de chances de rejeter
l’hypothèse nulle de chaque côté de la distribution d’échantillonnage et α
représente le risque d’erreur total.
1
Une erreur de seconde espèce est commise si on accepte H0 et que celle-ci est fausse.
2
Toutefois nous avons vu qu’un tel scénario n’est ici possible que dans 4.6% des fois dans
l’éventualité où notre statisticien effectuerait un grand nombre de tests (où il prélèverait plusieurs
échantillons pour en calculer un QI moyen). Bref, la probabilité minimale acceptable α est bien le
risque de rejeter à tort une bonne hypothèse.
4
b) Illustration
Notre illustration porte sur un test bilatéral, puisque l'hypothèse émise consiste à
tester l'égalité de la valeur du test avec une valeur donnée. Le rejet de l'hypothèse
H0 est décidé si la valeur du test est significativement différente, qu'elle soit
inferieure (zone de rejet de gauche) ou supérieure (zone de rejet de droite).
15
X ⤳ N (150 ; )
50
En effet, si H0 est vraie, alors X ⤳ N (m0 ; )
n
5
Calculons a sachant p [150 – a ≤ X ≤ 150 + a] = 0.95, avec X ⤳ N (150 ; 2.12).
p (m - t x ≤ x ≤ m + t x ) = 0.95
Conclusion :
6
Cas 2 : on a obtenu IX ;5% = [145.8 g ; 154.2 g] et x 2 = 145 g
7
II. Le test du Khi deux
a) Principes généraux
Ainsi la somme Z = X12 +...+ Xn2, qui est aussi une variable aléatoire, suit la loi du
2 (lire Khi 2) à n degrés de liberté. On démontre que cette variable Z admet pour
espérance mathématique n et pour variance 2n.
8
égales)3. Par exemple dans le cadre d’une étude de marché, on relève une série de
notes attribuées par 30 répondants à un message publicitaire. Peut-on estimer que
ces notes suivent une loi normale ? Le test du 2 permettra éventuellement de le
confirmer. Si c’est le cas, l’hypothèse H0 suivant laquelle la distribution observée
suit une loi normale sera acceptée.
Par exemple l’extrait de table ci-dessous indique que pour d.l. = 5 et α = 0.10, on
obtient la valeur critique 9.236. En d'autres termes, si les cinq écarts (au carré)
indépendants obtenus empiriquement proviennent véritablement de distributions
normales centrées réduites, il y a 10% des chances que la valeur de 2 calculée
dépasse 9.236.
Dans un test de 2 , la décision finale repose toujours sur une évaluation des écarts
entre des fréquences observées à l'intérieur d'échantillons aléatoires et des
fréquences théoriques espérées qui devrait être observées si l'hypothèse nulle
3
Rappelons qu’une distribution de probabilités est simplement une énumération complète de tous
les résultats possibles d’une expérience avec leurs probabilités respectives. La distribution normale
et la distribution binomiale sont parmi les distributions de probabilités les plus importantes. La loi
binomiale s’intéresse aux phénomènes caractérisés par deux issues possibles (pièce défectueuse ou
non, réponse positive ou négative à une question…). Un exemple simple de loi uniforme est le
lancer d’un dé non biaisé. Les valeurs possibles sont 1, 2, 3, 4, 5, 6 ; et à chaque fois que le dé est
lancé, la probabilité d’un score donné est égale à 1/6.
9
soumise au test était vraie. De façon générale, les étapes du test de 2 sont les
suivantes :
2
fo fe 2
fe
On note que si toutes les fréquences observées étaient égales aux fréquences
espérées, cette somme serait égale à 0. Donc 0 est la valeur idéale que devrait
prendre la valeur du 2 lorsque H0 est vraie4.
Probabilité ( 2 > 2 ) = α
10
session. On veut savoir, au seuil de 5%, si le pourcentage de gens qui songent à
s'inscrire est identique dans chaque module. Les résultats obtenus, présentés sous
forme de tableau de contingences (tableau à double entrée qui permet de
classifier les observations selon deux caractéristiques, ici la discipline étudiée et la
réponse de l’étudiant), sont les suivants :
11
32.58% × 90 = (87/267) × 90 = 29.33 personnes
(180/267) × 65 = 43.82
MODULE
Psychologie Administration Mathématiques Total
RÉPONSE
Finalement :
(f0 fe )2
=
2
= 1.87
fe
12
Pour déterminer la valeur du 2 critique, on doit connaître α et d.l.
d.l. = (l - 1)(c - 1)
Cela signifie que dans un tableau 2 × 3, seulement 2 des valeurs fe doivent être
calculées. Les quatre autres valeurs restantes du tableau sont alors
automatiquement déterminées par les totaux des lignes et des colonnes.
Sur la table, on voit que, pour ces valeurs, le 2 critique est 5.991. Cette valeur
critique de 5.991 signifie que si H0 est vrai, la probabilité d’obtenir un 2 calculé
supérieur à 5.991 n’est que de 5%. Puisque le 2 calculé (1.87) est inférieur à la
valeur critique, on doit maintenir H0. En d'autres termes, il semble que le
pourcentage de gens qui désirent suivre un cours de statistiques est le même dans
chaque module.
La compagnie Pepca Cola veut mettre sur le marché un nouveau cola diététique et
sans saveur appelé Colasancalo. Pour évaluer ce nouveau produit, le directeur du
marketing décide de faire passer un test de goût à 300 personnes. On demande à
chacune d’elles de goûter le Colasancalo ainsi que quatre autres marques de cola à
basse teneur en calories. Afin de ne pas biaiser le test, on identifia les colas par les
lettres A, B, C, D et E. Les résultats sont donnés au tableau suivant :
13
ÉTAPE 1 : Énoncer les hypothèses nulles et alternatives
ÉTAPE 3 : On détermine les fréquences observées (f0). Ces valeurs sont données
dans le tableau précédent.
fo
B 65 60 5 25 0.417
D 70 60 10 100 1.667
E 70 60 10 100 1.667
Σ 300 9.168
14
être égale à 300. Cela implique que 4 des 5 cases du premier tableau peuvent
varier « librement », la 5e étant déterminée par le total de 300. Dans un test
d’ajustement à la distribution uniforme, le nombre de degrés de liberté est
toujours égal au nombre de classes ou catégories de la distribution moins 1.
15
III. Applications
a) Une hypothèse nulle est une hypothèse qui spécifie la valeur du paramètre ;
c’est cette hypothèse qui est soumise au test statistique. Une hypothèse
alternative est une hypothèse qui doit être acceptée lorsque l’hypothèse nulle est
rejetée.
b) Le seuil de signification α est le risque de rejet d’une hypothèse nulle qui, dans
les faits, est vraie.
● Une entreprise doit remplacer une machine trop ancienne. Plusieurs offres lui ont
été proposées. Après comparaison, l’entreprise porte son dévolu sur l’achat de la
machine référencée A, dont le vendeur affirme qu’il y a 92% de chances que cette
machine ne tombe pas en panne durant ses trois premières années d’utilisation.
Le test est dit unilatéral inférieur car l'hypothèse émise évalue si une valeur est
inférieure ou égale à la valeur de test. Le rejet de l'hypothèse H0 est décidé si la
valeur du test est significativement inférieure (zone de rejet à gauche).
16
L’étape 1 consiste à formuler les hypothèses. On note p la probabilité que la
machine ne tombe pas en panne durant ses 3 premières années d’utilisation.
269
D’après l’énoncé on a fi = = 0.8966 soit 89.66%
300
0.92 0.08
f ⤳ N (0.92 ; )
300
17
pq
En effet, si H0 est vraie, alors f ⤳ N (p0 ; )
n
f 0.92
Avec f ⤳ N (0.92 ; 0.0157) ⇒ T = ⤳ N (0 ; 1)
0.0157
0.92 a 0.92
p [f ≥ 0.92 - a] = 0.95 ⇔ p [T ≥ ]= 0.95
0.0157
a a
⇔ p [T ≥ ]= 0.95 ⇔ 1 - p [T ≤ ]= 0.95
0.0157 0.0157
18
L’hypothèse H0 est acceptée au seuil de 5%. L’affirmation du vendeur selon
laquelle il y a 92% de chances que la machine ne tombe pas en panne les trois
premières années d’utilisation peut être considérée, au seuil de 5%, comme juste.
Le test est dit unilatéral supérieur car l'hypothèse émise évalue si une valeur est
supérieure ou égale à la valeur de test. Le rejet de l'hypothèse H0 est décidé si la
valeur du test est significativement supérieure (zone de rejet à droite).
19
L’étape 1 consiste à formuler les hypothèses. On note p la proportion de
barquettes non étanches.
9
D’après l’énoncé on a sur l’échantillon fi = = 0.018 soit 1.8%
500
20
On donne α = 0.05, p0 = 0.01 et n = 500. La taille de l’échantillon étant supérieure
à 30, on a :
0.01 0.99
f ⤳ N (0.01 ; )
500
pq
En effet, si H0 est vraie, alors f ⤳ N (p0 ; )
n
f 0.01
Avec f ⤳ N (0.01 ; 0.0044) ⇒ T = ⤳ N (0 ; 1)
0.0044
0.01 a 0.01
p [f ≤ 0.01 + a] = 0.95 ⇔ p [T ≤ ] = 0.95
0.0044
a a
⇔ p [T ≤ ]= 0.95 ⇔ ∏ [ ]= 0.95
0.0044 0.0044
21
On peut visualiser la règle de décision :
● Le montant des notes de restaurant des cadres d’une PME suit une loi normale de
moyenne 95 euros et d’écart type 26 euros. En début d’année, le chef d’entreprise
a sensibilisé ses cadres à la compression de ces frais généraux. À partir d’un
échantillon de 225 additions choisies au hasard parmi celles de l’année en cours, la
moyenne des frais de restauration ressort à 98 euros pour un écart type de 17
euros. Sur la base de ces éléments, peut-on considérer que le chef d’entreprise n’a
pas été écouté (en retenant un seuil de 1%) ?
22
Le test est dit unilatéral supérieur car l'hypothèse émise évalue si une valeur est
supérieure ou égale à la valeur de test. Le rejet de l'hypothèse H0 est décidé si la
valeur du test est significativement supérieure (zone de rejet à droite).
26
X ⤳ N (95 ; )
225
En effet, si H0 est vraie, alors X ⤳ N (m0 ; )
n
26 X 95
Avec X ⤳ N (95 ; )⇒T= ⤳ N (0 ; 1)
225 1.73
95 a 95 a a
On cherche p [T ≤ ] = 0.99 ⇔ p [T ≤ ]= 0.99 ⇔ ∏ [ ]= 0.99
1.73 1.73 1.73
a
= 2.33 soit a = 2.33 × 1.73 = 4.04
1.73
● La société Tesmo produit en série des pièces en bois. Dans son atelier de coupe,
la scieuse automatique a été réglée pour couper à une longueur de 15 cm des
23
taquets pour un type de meubles. La qualité dans l’ajustage du produit final
nécessite une très grande précision dans la dimension des éléments qui le compose,
aussi un test statistique est mis en place pour vérifier que le réglage de la machine
reste constant pendant sa période d’exploitation. Sur un échantillon de 121 taquets
extraits de la production en cours, la longueur mesurée donne une moyenne de
14.91 cm et un écart type de 0.64 cm.
a) Quelle est la nature de ce test et quelles sont les deux hypothèses alternatives
relatives à cette situation ?
b) Au seuil de signification de 5%, la machine est-elle toujours bien réglée ?
a) Notre illustration porte sur un test bilatéral, puisque l'hypothèse émise consiste
à tester l'égalité de la valeur du test avec une valeur donnée. Le rejet de
l'hypothèse H0 est décidé si la valeur du test est significativement différente,
qu'elle soit inferieure (zone de rejet de gauche) ou supérieure (zone de rejet de
droite).
p (m - t x ≤ x ≤ m + t x ) = 1-α
Avec x = .
n
σe 0.64
σ̂ x = = = 0.0584
√n−1 √121−1
24
● Quelle définition du 2 pourriez-vous proposer ?
C’est la statistique qui mesure les écarts relatifs entre les fréquences théoriques
(fe) et les fréquences observées (fo). Elle se calcule à l’aide de la formule :
(f0 fe )2
2 = f
e
a) Vrai.
b) Faux. Même si H0 est vrai, il est fort probable que la variation d’échantillonnage
produira des écarts entre f0 et fe.
d) Vrai.
● Pour cerner l'opinion des travailleurs sur un éventuel changement aux règles de
régie interne de la centrale syndicale qui les représente, l'exécutif a fait parvenir
un questionnaire à 100 membres de trois syndicats affiliés. Les résultats du sondage
apparaissent dans le tableau ci-dessous :
SYNDICAT X Y Z
OPINION
Pour 17 23 10
Contre 9 13 8
Indécis 4 4 12
25
° Étape 1 : Formuler l'hypothèse nulle et l'hypothèse alternative
SYNDICAT Total
X Y Z
OPINION lignes
Pour 15 17 20 23 15 10 50
Contre 9 9 12 13 9 8 30
Indécis 6 4 8 4 6 12 20
1-1 17 15 2 4 0.27
1-2 23 20 3 9 0.45
1-3 10 15 -5 25 1.67
2-1 9 9 0 0 0.00
2-2 13 12 1 1 0.08
2-3 8 9 -1 1 0.11
3-1 4 6 -2 4 0.67
3-2 4 8 -4 16 2.00
3-3 12 6 6 36 6.00
Donc :
26
(f0 fe )2
2 = f = 11.25
e
● Vous affirmez que le nombre de pannes de métro n'est pas identique sur chaque
ligne. Vous relevez les pannes pendant un mois. Voici les résultats :
LIGNE FRÉQUENCE
Verte 56
Orange 66
Bleue 44
Jaune 54
Si H0 était vraie, on devrait avoir le même nombre de pannes sur chaque ligne.
Comme il y a 4 lignes et un total de 220 pannes, on a : fe = ¼(220) = 55.
27
On complète le tableau de calcul suivant :
Verte 56 55 1 1 0.02
Jaune 54 55 -1 1 0.02
(f0 fe )2
Donc : 2 = f = 4.44
e
● Lors d’un sondage, les cinq candidats à une élection ont reçu chacun un certain
nombre de voix. Les données sont les suivantes :
Candidat
Total
A B C D E
a) Une distribution est dite uniforme si toutes les fréquences de la distribution sont
égales. Un exemple simple de loi uniforme est le lancer d’un dé non biaisé. Les
28
valeurs possibles sont 1, 2, 3, 4, 5, 6 ; et à chaque fois que le dé est lancé, la
probabilité d’un score donné est égale à 1/6.
b) Hypothèses :
H0 : nA = nB = nC = nD = nE
H1 : pas (nA = nB = nC = nD = nE)
L’hypothèse nulle est donc qu’il y a équiprobabilité entre les différents résultats
(le même n donc), alors que l’hypothèse alternative stipule que le nombre de voix
n’est pas semblable.
D’après le tableau, nous remarquons que certains candidats obtiennent plus de voix
que d’autres, et il vaut la peine donc de faire un test. Ce dernier consiste en deux
étapes : obtenir les effectifs théoriques, correspondant à l’équirépartition des voix
dans notre cas et, ensuite, obtenir les valeurs du 2 . Ici, les effectifs théoriques
sont simples à calculer. En effet, étant donné qu’il y a eu 500 réponses, et qu’il y a
5 candidats, l’effectif théorique pour chaque candidat est de 100. Quant à la
valeur du 2 (valeur obtenue), elle s’obtient au moyen de la formule suivante :
(f0 fe )2
=
2
fe
29
Nous sommes ici dans le cas d’un test de comparaison. La première étape consiste
à formuler les hypothèses.
30
Graphiquement :
31
Appliquons les règles de décision. Graphiquement :
32
En conclusion :
33
Au seuil de 5%, les piles des deux marques n’ont pas la même durée de vie
moyenne.
34
35
36