Section 2

Chapitre 3: TESTS d’HYPOTHESES
Objectifs :
- comprendre le principe des tests statistiques
- savoir réaliser les tests usuels (adéquation,
comparaison) et interpréter leurs résultats
Master_Phy_Med_2016-17 (S.K.MEHDI) 109

TESTS d’HYPOTHESES
I- Principe des tests statistiques

Introduction
• Un test d’hypothèse est un procédé permettant de contrôler
(accepter ou rejeter) à partir de l'étude d'un ou plusieurs
échantillons aléatoires, la validité d’hypothèses relatives à
une ou plusieurs populations.
• L’objectif du test est de se prononcer sur la validité de

l’hypothèse.
• L’hypothèse est soit vraie soit fausse et l’hypothèse est soit
acceptée soit rejetée.
• En fonction de l’hypothèse testée, plusieurs types de tests

peuvent être réalisés :
tests de conformité
tests d’ajustement
tests d’égalité ou d’homogénéité
test d’indépendance
Un problème type
• 30 sujets hypertendus reçoivent un traitement
hypotenseur A ; leur tension artérielle (TA) moyenne est
de 133.4 mmHg (s=21.3 mmHg)
• 30 autres sujets hypertendus reçoivent un traitement B ;
leur TA moyenne est de 125.7 mmHg (s=17.8 mmHg)
• La différence observée doit-elle conduire à privilégier le

traitement B ? Ou le A ? Ou aucun des deux ?

Erreurs possibles
• Erreur de « 1ère espèce » :
Considérer que les 2 traitements sont différents alors qu’ils
ne le sont pas
La recherche va partir sur une fausse piste en cherchant à expliquer
cette différence
• Erreur de « 2ème espèce » :
Considérer que les 2 traitements ne sont pas différents
alors qu’ils le sont
Les malades ne bénéficieront pas du meilleur traitement
TEST : conclure en limitant au mieux ces 2 erreurs

Tests d’hypothèses : principe (1)
• Le principe des tests d’hypothèse est de poser
une hypothèse de travail et de prédire les
conséquences de cette hypothèse pour la
population ou l’échantillon. On compare ces
prédictions avec les observations et l’on
conclut en acceptant ou en rejetant
l’hypothèse de travail à partir de règles de
décisions objectives.
• Définir les hypothèses de travail, constitue un
élément essentiel des tests d'hypothèses

• Différentes étapes doivent être suivies pour tester
une hypothèse :
• (1) définir l’hypothèse nulle(notée H0) à contrôler,

• (2) choisir un test statistique ou une statistique pour
contrôler H0,
• (3) définir la distribution de la statistique sous
l’hypothèse « H0 est réalisée »,
• (4) définir le niveau de signification du test ou région
critique notée α
• (5) calculer, à partir des données fournies par
l’échantillon, la valeur de la statistique
• (6) prendre une décision concernant l’hypothèse
posée et faire une interprétation .
• Hypothèse nulle à tester
– Notation : H0
– On veut prouver que H0 est FAUSSE
– Exemple : H0 : A= B (pas de différence)
• Hypothèse alternative
– Notation : H1
– C’est ce que l’on CROIT
– Exemple : H1 : A≠ B

• n-échantillon(s) d’observations
• Est-ce que les observations sont cohérentes
avec H0 ?
• H0 : « pas de différence »
⇒ Probabilité sous H0 d’obtenir la différence
observée :
– Suffisamment petite : rejet de H0
– Sinon : pas de rejet de H0

Risques de 1ère et 2ème espèce
Deux types de mauvaises conclusions du test sont possibles
1. On rejette H0 alors que H0 est vraie
risque de 1ère espèce : α = P[rejet H0 | H0]
On fixe souvent α = 5%
2. On ne rejette pas H0 alors que H0 est fausse
risque de 2ème espèce : β = P[non rejet H0 | H1]
PUISSANCE du test = 1-β = P[rejet H0 | H1]
n fixé : diminuer une erreur augmenter l’autre

n est élevé les erreurs sont faibles
La puissance du test est la probabilité de rejeter H0 quand elle

est fausse.
• Le risque β et la puissance du test dépendent
du seuil α fixé.

Exemple : Moyenne d’une population normale
Variance population connue
Une entreprise de vente par correspondance demande un
montant fixe pour les frais d’envoi, indépendamment du
poids du colis. Une étude réalisée il y a quelques années
a montré que le poids moyen d’un colis était de 17.5 kg
avec un écart-type de 3.6 kg.
La comptabilité soupçonne que le poids moyen est
maintenant différent de 17.5 kg.
Un échantillon aléatoire de 100 colis est prélevé et fournit
un poids moyen de 18.4 kg.
On suppose que les poids des colis sont distribués
normalement.

Exemple :
Une société s’approvisionne en pièces brutes qui, conformément aux
conditions fixées par le fournisseur, doivent avoir une masse moyenne
de 780 grammes. Au moment ou 500 pièces sont réceptionnées, on en
prélève au hasard un échantillon de 36 pièces dont on mesure la masse.
On obtient les résultats suivants :

• La masse moyenne des pièces de l’ échantillon est de 774.7 g.
• En supposant que l’ écart-type des masses pour la population des
500 pièces est σ = 12.5 g,
• on obtient [770.61 ; 778.79] comme IC à 95% (c.a.d 1-α = 0.95) de
la moyenne inconnue m de cette population. (voir partie 3.2 sur IC)
Présentation du problème :
• Peut-on considérer que les 500 pièces de la population ont une
masse moyenne de 780 g, comme le prévoient les conditions
fixées par le fournisseur ?
• Autrement dit, doit-on ou non accepter la livraison de ces 500
pièces au vu du résultat obtenu sur l’échantillon?

• Hypothèse nulle : H0
• On suppose que la moyenne de la population est m = 780.
• la variable aléatoire X qui, à tout échantillon aléatoire non
exhaustif de taille n = 36, associe la moyenne de cet échantillon
suit approximativement la loi normale.
• Cherchons h réel positif tel que :
• On déduit la valeur de h = 4,08

• Ainsi, en supposant que m = 780, on sait, avant de prélever un
échantillon aléatoire de taille 36, que l’on a 95% de chances que
sa moyenne soit dans l’intervalle [775.92 ; 784.08]
• Autrement dit, si H0 est vraie, il n’y a que 5% de chances de
prélever un échantillon aléatoire de taille 36 dont la moyenne
soit inférieure à 775,92 ou supérieure à 784,08
• Regle de décision, région critique
• Si m est dans [775 .92 ; 784.08], on accepte H0

• Si m n’est pas dans [775.92 ; 784.08], on rejette H0

• Si H0 est vraie, on prend donc le risque de se tromper
dans 5% des cas en rejetant à tord H0 . On définit ainsi
une région critique au seuil α = 5%.
• Le seuil α est la probabilité de rejeter H0 alors que H0

est vraie. Il correspond à l’erreur de première espèce.
• En général, on fixe a priori la valeur de α (ici égal à

0.05).
• Dans notre exemple, m = 774.7 pour l’échantillon
considéré. On a m < 775.92 et on rejette l’hypothèse
H0.
• Au seuil de 5%, on considère que les 500 pièces de la
population n’ont pas une moyenne de 780 g et on
refuse la livraison
• Erreur de seconde espèce
• On aurait pu choisir un seuil de 1% pour diminuer le
risque de rejeter H0 alors que H0 est vraie.
• Au seuil de 1%, on accepte H0 puisque m appartient à

l’intervalle considéré, et on accepte alors la livraison
des 500 pièces.
• Mais, en acceptant H0 au seuil de 1%, on court un
second risque : celui d’accepter H0 alors que H0 est
fausse : c’est l’erreur de seconde espèce, dont la
probabilité est notée β.
• Hypothèse alternative
• cas où H0 est fausse.
• hypothèse alternative H1
• Dans ce qui précède, m ≠780 comme hypothèse
alternative H1.
• Le test est alors bilatéral, car la région critique est
située des deux côtés de la région où on accepte
H0 .
• m<780 comme hypothèse alternative H1, le test
est alors unilatéral et la région critique est située
entièrement d’un côté de la région où on accepte
H0

• Comparaison de la moyenne de deux populations
• Soit deux échantillons extraits de deux populations
correspondant à deux fournisseurs A et B.
• Soit XA (resp XB ) la variable aléatoire qui, à tout échantillon de

taille nA = 36 (resp nB = 50) prélevé aléatoirement et avec
remise dans la population A (resp B), associe la moyenne des
masses de pièces de l’échantillon.
• On se place dans le Master_Phy_Med_2016-17
cas où les v.a. (S.K.MEHDI)
suivent une loi normale 131
• Soit D, la variable aléatoire : D = XB - XA
• D suit une loi normale :

• Construction du test
• H0 : mA= mB et H1 : mA ≠ mB (on appelle ce test : test bilatéral)
• détermination de la région critique au seuil de α = 5%
• Sous l’hypothèse H0 :
• D suit la loi normale N (0 ; 2.7), donc D/2.7 suit la loi normale
centrée réduite N(0;1).
• En particulier, on a p(- t≤D/2.7≤t ) = 0.95 lorsque t = 1.96, et donc
p(- 5.29 ≤D≤5.29) = 0.95
• Enoncé de la règle de décision

• On prélève avec remise un échantillon aléatoire de taille nA = 30 de
la population A et on calcule sa moyenne xA; on fait de même pour
la population B avec nB= 50.
• On pose d = xB - xA
• si d appartient à [-5.29 ; 5.29] on accepte H0.
• si d n’appartient pas à [-5.29 ; 5.29] on rejette H0 et on accepte H1.

• Utilisation du test
• Calcul de d
• On a d = xB - xA= 779.6 – 774.7 = 4.9
• Application de la règle de décision

• Comme -5.29 ≤ 4.9 ≤ 5.29, on accepte H0 : au
seuil de 5%, il n’existe pas de différence
significative entre les moyennes des deux
échantillons.

• test unilatéral
• H0 : mA= mB et H1 : mA > mB
• détermination de la région critique au seuil de α = 5%
• Sous l’hypothèse H0 :
• D suit la loi normale N (0 ; 2.7), donc D/2.7 suit la loi
normale centrée réduite N(0;1).
• En particulier, on a p(D/2.7≤t ) = 0.95 lorsque t = 1.645, et
donc p(D≤4.44) = 0.95
• Enoncé de la règle de décision
• On prélève avec remise un échantillon aléatoire de taille nA
= 30 de la population A et on calcule sa moyenne xA; on fait
de même pour la population B avec nB= 50.
• On pose d = xB - xA
• si d ≤ 4.44 on accepte H0.
• si d > 4.44 on rejette H0 et on accepte H1.

• Utilisation du test
• Calcul de d
• On a d = xB - xA= 779.6 – 774.7 = 4.9
• Application de la règle de décision

• Comme 4.9 > 4.44, on rejette H0 et on accepte
H1. Au seuil de 5%, la moyenne des masses de
l’échantillon B est significativement supérieure
à celle de A.

II- Tests de comparaison (Student)

Comparaison à 1 proportion théorique
But : on veut savoir si la proportion π d’individus présentant
une caractéristique donnée est π0
• n-échantillon fréquence f observée
• Hypothèse nulle H0 : π = π0
n. π0>5
Sous H0, f~ N(π0, π0.(1- π0)/n) n.(1- π0)>5
f − π0
z= ~ N(0,1) On peut lire la p-value
π 0 .(1 − π 0 )
n
dans les tables de la loi
normale

Comparaison à une proportion
théorique
Mise en pratique du test :
1. On valide que n. π0>5, n.(1- π0)>5
f − π0
2. On calcule z=
π 0 .(1 − π 0 )
n
3. Conclusion du test avec un seuil à 5% :

si |z|>1.96 on rejette H0
(car P(|Z|>1.96)=5%)
si |z|≤1.96 on ne rejette pas H0

Exemple
Pourcentage de lampes défectueuses dans une fabrique (6%) ?
Echantillon de n=500 lampes :
pourcentage observé : p=10%
Cette différence est-elle « significative » ?
• Hypothèse nulle H0 : π = π 0 = 6%
• H1 : π ≠ 6%
0.10-0.06
•|z| = = 3.77 >1.96
0.06 (1-0.06)
500
•On rejette H0 : les pourcentages sont différents

Comparaison à 1 moyenne théorique
• Hypothèse nulle H0 : m = µ0
• n-échantillon moyenne m (variance ²) observées
• On calcule :
m − µ0
z= ~ N(0,1)
σ 2
n n>30
Calcul de la p-value
Si |z|>1.96 on rejette H0

Comparaison de Deux moyennes
But :
savoir si la moyenne mA d’une variable dans un groupe A est
identique à la moyenne mB de cette variable dans un groupe B
• nA et nB-échantillons dans les 2 groupes
moyennes mA( A) et mB( B) observées
• Hypothèse nulle H0 : mA = mB
nA, nB >30
Sous H0, (mA-mB) ~ N(0, A²/nA+ B²/nB)
mA − mB
z= ~ N(0,1) On peut lire la p-value
σ A2 σ B2
+ dans les tables de la loi
nA nB
normale

Comparaison de 2 moyennes
Mise en pratique du test :
1. On valide que nA>30, nB>30
m − m
2. On calcule z =
σ
A
2
σ
B
2
A
+ B
n A n B
3. Conclusion du test :
si |z|>1.96 on rejette H0 (car P(|Z|>1.96)=5%)
si |z|≤1.96 on ne rejette pas H0

Exemple
nA= 50 personnes travaillent dans l’atelier A ;
nB= 40 personnes dans l’atelier B
Délais observées entre 2 arrêts de travail :
– mA = 23 mois ( A=10 mois)
– mB = 18 mois ( B = 10 mois)
Cette différence est-elle « significative » ?

• Hypothèse nulle H0 : mA= mB
• H1 : mA ≠ mB

Exemple (suite)
23 − 18
• |z| = = 2.35 >1.96
100 100
+
50 40
On rejette H0 : les arrêts de travail sont + fréquents dans
l’atelier B
• Calcul de la p-value :
Probabilité de l’observation sous H0 :
p = P[|mA-mB| ≥ 5 mois]
= P[|Z| ≥ 2.35] = 0.0188

Comparaison de 2 proportions
• Hypothèse nulle H0 : pA = pB
• nA-échantillon proportion observée pA
• nB-échantillon proportion observée pB
• On calcule : pA − pB
z=
p A (1 − p A ) p B (1 − p B )
+
nA nB
Si |z|>1.96 on rejette H0 nA. pA>5
nA.(1- pA)>5
nB. pB>5
nB.(1- pB)>5

III- Tests du χ²

Objectif général
Déterminer si un modèle théorique est susceptible de représenter
adéquatement le comportement probabiliste de la variable observée,
comportement fondé sur les fréquences des résultats obtenus sur
l’échantillon.
Le khi-deux permet de décider si une série d’effectifs observés diffère
significativement d’une série d’effectifs théoriques (ou attendus)
• 1,2,.. variables qualitatives

• 1,2,.. Échantillons Effectifs observés
Sont-ils conformes aux effectifs attendus sous H0 ?

1. Homogénéité
Est-ce que la distribution des motifs d’arrêt de travail est la même sur différents
sites d’une même entreprise ?
2. Indépendance
Est-ce qu’il y a indépendance entre une exposition et des symptômes ? (étude
exposés/non exposés ou cas/témoins)
Statistique du χ2
• Mesure l’écart entre des effectifs théoriques ti et des
effectifs observés ni par : 2
χ obs = ∑
k
(ni − ti )
2
i =1 ti
• Suit une loi du χ 2 dont le nombre de d.d.l. = nb d’effectifs
– nb contraintes : cf. Table 5
On établit un seuil χ 2seuil / sous H0 : P[χ 2obs> χ 2seuil]=α=5%
Pour chaque « couple » de type : population / valeur de la variable ou valeur de la

variable 1 / valeur de la variable 2, on a des effectifs observés dans les échantillons.
Ecrire effectifs observés dans le tableau.
Ex : dans notre échantillon de 50 personnes on observe 13 individus qui sont blonds aux
yeux bleus, 20 qui sont blonds aux yeux marrons, etc.
Sous H0 on peut calculer les ti (à voir plus tard) effectifs théoriques si on a vraiment
indépendance par exemple. -> comme pour les tests de comparaison on va calculer une
distance entre ni et ti et la comparer à une valeur seuil -> à lire dans la table.
Table du χ 2 (extrait)
Table 5 : X~ χ 2 à n degrés de liberté (ddl)
nbre(ddl) se calcule à partir du nbre d’effectifs = (nbre de cases de la 1ère «

variable »-1).(nbre.. 2ème -1)
Exemple : blonds/bruns, yeux verts/bleus/marrons -> (2-1).(3-1) -> 2 ddl.
D’où lecture du seuil à 5% (l’équivalent du 1.96) : 5.99

χ 2 d’homogénéité (1)
• Variable X à p modalités
• q échantillons indépendants
Tableau des effectifs observés :
Modalité 1 .. Modalité p TOTAL
Echantillon 1 n11 .. np1 n.1
… .. .. .. ..
Echantillon q n1q .. npq n.q
TOTAL n1. .. np. N
Maintenant on va voir en pratique comment on met en place ces tests.

Homogénéité : la variable X est homogène dans les q populations -> i.e. qu’elle est
distribuée pareil.
Ex. avec 2 modalités et 2 populations : il y a la même proportion de marchandises en
provenance de Chine au port d’Oran et au port d’Alger.
(peut aussi être traité avec test de comparaison de proportions).
Alger Oran Total
Made in China 40 50 90
Autres 60 20 80
Total 100 70 Master_Phy_Med_2016-17
170 (S.K.MEHDI) 153
H0 : «égalité des q distributions observées de X»
Tableau des effectifs attendus sous H0 :
Modalité 1 .. Modalité p TOTAL
Echantillon 1 t11= n1. X n.1/N .. tp1= np. X n.1/N n.1
… .. .. .. ..
Echantillon q t1q= n1. X n.q/N .. tpq= np. X n.q/N n.q
TOTAL n1. .. np. N
Sous H0 les distributions sont les mêmes -> elles sont identiques entre elles et à celles
de la somme.
Exemple : faire le même tableau sans les effectifs observés, en ne gardant que les
totaux (seule donnée connue).
Intuitivement, si la proportion du « Made in China » est la même dans les 2 villes, c’est
la proportion dans la « somme des deux populations », i.e. 90/170 = 53%.
Comme on connaît les tailles des deux échantillons…

• On calcule : p q
(n ij − t ij ) 2
2
χ obs = ∑∑
i =1 j=1
t ij
• χ 2seuil lu sur la Table du χ 2 à (p-1).(q-1) degrés de liberté pour

α=5%
Test d’homogénéité :
Si χ 2obs> χ 2seuil on rejette H0
Si χ 2obs< χ 2seuil on ne rejette pas H0
Mise en pratique du test -> pour chaque case on a tij et nij ->
on calcule le χ 2 -> somme..

Exemple (1)
• Principaux motifs d’arrêt de travail dans 3 sites différents
d’une même entreprise :
• A : (problèmes de dos)
• B : (luxations, entorses)
• C : (tumeurs )
• D : (dépressions)

Exemple (2)
Principaux motifs d’arrêt de travail dans 3 sites différents
Effectifs observés nij :
A B C D TOTAL
Site 1 54 14 6 51 125
Site 2 45 14 8 31 98
Site 3 33 34 12 33 112
TOTAL 132 62 26 115 335
H0 : identité des distributions dans les 3 sites

Exemple (3)
Effectifs attendus tij sous H0 :
A B C D TOTAL
Site 1 132 X 125/335 62 X 125/335 9.70 42.91 125
=49.26 =23.13
Site 2 132 X 98/335 62 X 98/335 7.61 33.64 98
=38.61 =18.14
Site 3 132 X 112/335 62 X 112/335 8.69 38.45 112
=44.13 =20.73
TOTAL 132 62 26 115 335
χ 2obs = (49.26-54)2/49.26 +… = 22.56

ici 12 termes du χ 2 à calculer
Exemple (4)
• On lit la table du χ2 à (4-1).(3-1)=6 ddl.
Pour α=5%, χ2seuil = 12.592
• Donc χ2obs=22.56 > χ2seuil : on rejette H0
La distribution des motifs d’arrêts de travail dépend du

site industriel concerné (fréquence plus élevée des lésions
traumatiques sur le site 3 par rapport à la fréquence
attendue sous H0).

Section 2

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Section 2

Transféré par

Droits d'auteur :

Formats disponibles

Chapitre 3: TESTS d’HYPOTHESES

Master_Phy_Med_2016-17 (S.K.MEHDI) 109

I- Principe des tests statistiques

Master_Phy_Med_2016-17 (S.K.MEHDI) 110

• L’objectif du test est de se prononcer sur la validité de

• En fonction de l’hypothèse testée, plusieurs types de tests

• La différence observée doit-elle conduire à privilégier le

Master_Phy_Med_2016-17 (S.K.MEHDI) 112

TEST : conclure en limitant au mieux ces 2 erreurs

Master_Phy_Med_2016-17 (S.K.MEHDI) 114

• (1) définir l’hypothèse nulle(notée H0) à contrôler,

Master_Phy_Med_2016-17 (S.K.MEHDI) 116

Master_Phy_Med_2016-17 (S.K.MEHDI) 117

n fixé : diminuer une erreur augmenter l’autre

La puissance du test est la probabilité de rejeter H0 quand elle

Master_Phy_Med_2016-17 (S.K.MEHDI) 119

Master_Phy_Med_2016-17 (S.K.MEHDI) 120

Master_Phy_Med_2016-17 (S.K.MEHDI) 122

Master_Phy_Med_2016-17 (S.K.MEHDI) 123

• Cherchons h réel positif tel que :

• On déduit la valeur de h = 4,08

• Regle de décision, région critique

• Si m est dans [775 .92 ; 784.08], on accepte H0

Master_Phy_Med_2016-17 (S.K.MEHDI) 125

• Le seuil α est la probabilité de rejeter H0 alors que H0

• En général, on fixe a priori la valeur de α (ici égal à

• Au seuil de 1%, on accepte H0 puisque m appartient à

Master_Phy_Med_2016-17 (S.K.MEHDI) 130

• Soit XA (resp XB ) la variable aléatoire qui, à tout échantillon de

Master_Phy_Med_2016-17 (S.K.MEHDI) 132

• Enoncé de la règle de décision

Master_Phy_Med_2016-17 (S.K.MEHDI) 133

• Application de la règle de décision

Master_Phy_Med_2016-17 (S.K.MEHDI) 134

Master_Phy_Med_2016-17 (S.K.MEHDI) 136

• Application de la règle de décision

Master_Phy_Med_2016-17 (S.K.MEHDI) 137

II- Tests de comparaison (Student)

Master_Phy_Med_2016-17 (S.K.MEHDI) 139

Master_Phy_Med_2016-17 (S.K.MEHDI) 140

3. Conclusion du test avec un seuil à 5% :

Master_Phy_Med_2016-17 (S.K.MEHDI) 141

•On rejette H0 : les pourcentages sont différents

Master_Phy_Med_2016-17 (S.K.MEHDI) 142

Master_Phy_Med_2016-17 (S.K.MEHDI) 143

Master_Phy_Med_2016-17 (S.K.MEHDI) 144

Master_Phy_Med_2016-17 (S.K.MEHDI) 145

Cette différence est-elle « significative » ?

Master_Phy_Med_2016-17 (S.K.MEHDI) 146

Master_Phy_Med_2016-17 (S.K.MEHDI) 147

Master_Phy_Med_2016-17 (S.K.MEHDI) 148

Master_Phy_Med_2016-17 (S.K.MEHDI) 149

• 1,2,.. variables qualitatives

Sont-ils conformes aux effectifs attendus sous H0 ?

Pour chaque « couple » de type : population / valeur de la variable ou valeur de la

nbre(ddl) se calcule à partir du nbre d’effectifs = (nbre de cases de la 1ère «

Master_Phy_Med_2016-17 (S.K.MEHDI) 152

Maintenant on va voir en pratique comment on met en place ces tests.

Master_Phy_Med_2016-17 (S.K.MEHDI) 154

• χ 2seuil lu sur la Table du χ 2 à (p-1).(q-1) degrés de liberté pour

Master_Phy_Med_2016-17 (S.K.MEHDI) 155

Master_Phy_Med_2016-17 (S.K.MEHDI) 156

TOTAL 132 62 26 115 335