Vous êtes sur la page 1sur 11

Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr.

MEDROUH Bachir

TESTS STATISTIQUES D’HYPOTHESE


‫ا‬

1. Définition
Un test statistique est une procédure de décision entre deux hypothèses concernant la valeur
des paramètres d'un modèle probabiliste. L'hypothèse nulle notée H0 est celle que l'on considère
vraie a priori. Le but du test est de décider si cette hypothèse est crédible. L'hypothèse alternative
notée H1 est l'hypothèse alternative de H0.C’est donc un moyen de comparer des paramètres, un
procédé pour savoir s’il y a un effet significatif ou non.
Les tests statistiques sont utilisés chaque fois que l’on veut comparer un paramètre à une valeur
de référence, à comparer 2 ou plusieurs paramètres entre eux.
Généralement, on peut comparer une moyenne par rapport à une valeur de référence, les
moyennes de deux échantillons indépendants ou appariés, deux ou plusieurs proportions, une
proportion par rapport à une valeur théorique, on peut également comparer deux variances.
Lorsque l’on compare plusieurs moyennes, il s’agit de l’analyse de variance.
2. Principales étapes à suivre
La démarche générale d’un test statistique est la suivante :
- Formulation de la question d’intérêt
- Choix du test à appliquer
- Choix du risque alpha et de sa latéralité (bilatérale ou unilatérale)
- Calcul de la statistique du test
- Comparaison avec la valeur critique, celle donnée par la table adéquate (tables usuelles :
table de l’écart réduit, table de Student, Table de khi-deux, table Fde Fischer, etc.)
- Conclusion ou prise de décision : maintien ou rejet de l’hypothèse nulle.

3. Région de rejet, latéralité


La statistique de test est une fonction qui résume l'information sur l'échantillon (ou la
valeur) qu'on veut tester. On la choisit de façon à pouvoir calculer sa loi sous H0.
On peut alors définir une région de rejet dont dépendra la décision d'accepter ou de
rejeter H0 : on rejette H0 si la valeur observée de la statistique, calculée a partir des données,
appartient à la région de rejet.
Suivant le problème posé, il faut choisir la latéralité du test, qui définit la forme de la
région de rejet :
Test bilatéral : On veut savoir si le paramètre étudié est trop grand ou trop petit, sans a
priori. La région de rejet est alors de la forme] 1; a] [ [b; +1[.
Test unilatéral : On veut savoir si le paramètre est trop petit, ou si le paramètre est trop
grand, sans se soucier de l'autre coté. Le région de rejet est alors de la forme] 1; a] ou [a;
+1[.

1
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir

4. Risque de première espèce et de deuxième espèce


On parle du risque de première espèce ou risque alpha quand on se réfère au risque au-
dessous duquel un événement sous H0 est jugé exceptionnel. La quantité 1-alpha est la confiance du
test. On choisit généralement un risque alpha de 0,05 ou plus rarement de 0,01. La quantité 1- α est la
confiance du test.
On appelle risque de deuxième espèce, et on note β, la probabilité d'accepter H 0 alors que la vérité est
H1. La quantité 1-β est la puissance du test.

Dans un test médical, les hypothèses sont :


H0 : le patient est malade
H1 : le patient n'est pas malade

Le risque de première espèce représente la probabilité de déclarer malades des patients sains (ou faux
positifs). En d'autres termes, la confiance est la proportion de patients sains bien classes.
Le risque de deuxième espèce représente la probabilité de déclarer sains des patients malades (ou faux
négatifs). En d'autres termes, la puissance est la proportion de malades bien détectés.

5. Tests paramétriques versus non paramétriques


En général, les tests paramétriques ont une puissance supérieure aux tests non-paramétriques.
Cependant, leur théorie repose sur des théorèmes asymptotiques tel le théorème centrale limite, et n'est
donc valable que pour les grands échantillons.
En pratique : Pour des échantillons de plus d'une trentaine d’unités, on applique des tests paramétriques
si possibles. Pour de petits échantillons, l’application des tests paramétriques devient difficile et requiert
des conditions supplémentaires, notamment la normalité.

6. Comparaison de fréquences : variables qualitative


6.1. Comparaison d’une proportion à une valeur théorique
On peut utiliser dans ce cas le test de l’écart réduit ou bien le test de chi-deux, que nous allons
aborder par la suite.
L’hypothèse nulle H0 : les deux proportions ne diffèrent pas significativement entre elles.
L’hypothèse H1 : elles diffèrent significativement,
𝑷𝒐−𝑷𝑯𝟎
On calcule maintenant la quantité ε = 𝑷 (𝟏−𝑷𝑯𝟎 )
√ 𝑯𝟎
𝒏

Et on compare cette valeur à celle lue dans la table de l’écart réduit pour le risque alpha
correspondant. On rejette l’hypothèse nulle, si cette valeur calculée est supérieure à celle de la
table.

Exercice 1 : Après antibiothérapie, le taux de guérison habituel d’une infection bactérienne


donnée est de 60%. Parmi 400 maladies atteints par cette infection et traités par un nouvel
antibiotique, 280 ont recouvré leur santé.
- Calculez la proportion de malades guéris par le nouvel antibiotique !
- Peut-on dire, au risque de 5%, que le nouvel antibiotique est plus efficace ?
2
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir

- S’agit-il précédemment de test unilatéral ? pourquoi ?

6.2. Comparaison de deux proportions


On peut utiliser dans ce cas le test de l’écart réduit ou bien le test de chi-deux, que nous allons
aborder par la suite.
H0: P1=P2.. les deux proportions sont égales du point de vue statistique
H1 : P1≠P2
(𝒏𝟏 𝒑𝟏 +𝒏𝟐 𝒑𝟐
D’abord, on calcule la moyenne P pondérée de P1 et P2 : P= 𝒏𝟏+𝒏𝟐
𝑷𝟏 −𝑷𝟐
Maintenant on calcule la quantité ε = 𝟏 𝟏
√𝑷(𝟏−𝑷)(𝒏 +𝒏 )
𝟏 𝟐

En 2ème étape, on compare ε à la valeur seuil uαlue dans la table de la loi normale centrée
réduite. Au risque α=5% correspond uα=1,96 ; au risque α=1% correspond uα=2,576.
En test bilatéral : on rejette H0 si |ε| ≥ uα .

Exercice 2 :
Parmi 200 malades traités par le médicament A, 82 ont souffert d’une récidive. Un autre groupe
de 300 atteints de la même maladie ont bénéficié d’un médicament B dont 240 ont définitivement
recouvré leur santé.
- Calculer les proportions de malades guéris complètement dans les deux groupes A et B !
- Calculer la proportion de guéris définitifs dans l’ensemble des 2 groupes !
- L’efficacité des deux médicaments diffère-t-elle significativement, au risque de 5% ?
- Même question au risque de 1%.

6.3. Comparaison de plusieurs proportions et test de Chi-deux


Les tests du x2 (chi-deux, chi-carré) sont basés sur la statistique du x2 proposée par Karl
Pearson, mathématicien britannique du début du XX eme siècle. L'objectif de ces tests est
principalement de comparer des distributions entre elles. Ces tests peuvent être appliqués a des
variables de nature qualitative (binaire, nominale, ordinale, quantitative regroupée en classes).
Trois types de test du x2 peuvent être distingués :

• Le test du 2 d'ajustement dont l'objectif est de comparer une distribution observée sur un
échantillon à une distribution théorique (binomiale, Poisson, normale, ...) ou a une
distribution connue dans la population sous-jacente.
Exemple : Soit un échantillon de 100 élevages bovins laitiers. La distribution observée (sur
l'échantillon) des races est-elle identique à celle de la population bovine algérienne?

• Le test du 2 d'homogénéité dont l'objectif est de comparer deux ou plusieurs distributions


observées sur des échantillons.
Exemple : Soient trois échantillons de 100 français, 100 belges et 100 algériens. La
distribution observée de l'âge regroupé en classes est-elle différente entre les échantillons.

3
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir

• Le test du 2 d'indépendance qui est utilisé pour étudier sur un même échantillon la liaison
entre deux variables qualitatives.
Exemple : Soit un échantillon de 100 ovins. Existe-t-il un lien entre la race et la couleur de
la toison?
Dans les trois cas, la méthode de calcul de la statistique de chi-deux est la même, seule
l’interprétation diffère.

(𝑶𝒊𝒋 −𝑪𝒊𝒋 )𝟐
χ =Σ
2
𝑪𝒊𝒋
Cette quantité sera comparée à la valeur seuil indiquée par la table de khi-deux pour le risque
α et le degré de liberté ddl.
Quoi qu’il en soit, ddl= (i-1) (j-1)= (nombre de lignes-1) (nombre de colonnes-1).
6.3.1. Test chi-deux d’indépendance
Le test d'indépendance du chi-carré vise à déterminer si deux variables observées sur un même
échantillon sont indépendantes ou non. Les variables étudiées sont des variables qualitatives
catégorielles.
Dans le cadre du test du x2 d'indépendance, le tableau de contingence comporte autant de lignes
que de modalités de la variable X1 et autant de colonnes que de modalités de la variable X2 (Table
1). A chaque croisement de la modalité i de X1 avec la modalité j de X2 est associe l'effectif observé
note oij . L'effectif observé de la modalité i de X1 est note ti et l'effectif observé de la modalité j de
X2 est note nj .
Table 1 {Tableau de contingence / Test x2 d'indépendance

Variable X2

Variable
X1 Modalité 1 Modalité 2 ::: Modalité k Total

o11 o12 o1k


Modalité 1 . t1
o21 o22 o2k
Modalité 2 . t2
. . . . .
op1 op2 opk
Modalité p . tk
Total n1 n2 . nk N

4
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir

Exercice 3 : Une étude a porté sur 300 patients, appartenant à trois tranches d’âges différentes
et atteints d’une certaine maladie, les résultats du traitement ont été consignés dans le tableau ci-
après.
De 20 à 40 ans De 41 à 60ans Plus de 60 ans Total
Guérison 71 62 43
Guérison avec 20 22
séquelles
Echec 9 16 24
Total 100 100

- Complétez le tableau précédent !


- Calculer le degré de liberté ddl !
- Existe-t-il un lien entre la tranche d’âge et le traitement au risque alpha de 5%?
- Peut-on appliquer le test de l’écart réduit (test z) pour répondre à la question précédente ?
pourquoi ?
- Si réellement il y a un lien entre les 2 variables, quel est le degré de signification ?

6.3.2. Test chi-deux d’homogénéité


Il consiste à comparer les effectifs réels de chaque modalité sur les différents échantillons, avec
les effectifs théoriques qu'on devrait obtenir dans le cas où ils seraient issus d'une même
population. Pour cela, on construit un indice d mesurant l'écart constaté entre les effectifs réels et
les effectifs théoriques.
Dans le cas du test x 2 d’homogénéité, le tableau contient autant de colonnes qu'il y a
d'échantillons observés (Table 2). L'effectif associe a la modalité i de l'échantillon j est note oij .
La somme des effectifs de tous les échantillons pour une modalité i est notée ti. La taille d'un
échantillon observé j est notée nj.
Table 2 {Tableau de contingence / Test x2 d’homogénéité

Effectifs observés
Variable Echantillon 1 Echantillon 2 ::: Echantillon k Total
o11 o12 o1k
Modalité 1 . t1
o21 o22 o2k
Modalité 2 . t2
. . . . .
op1 op2 opk tk
Modalité p .
Total n1 n2 . nk N

5
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir

Exercice 4 : une étude s’est intéressée au personnel enseignant dans trois facultés. Les résultats
ont été résumés dans le tableau infra.
Assistants Maitres Maitres de Professeurs Total
assistants conférences
Faculté 1 7 31 24 12
Faculté 2 9 55 16 8
Faculté 3 12 45 10 3
Total 28 50

- Compléter le tableau précédent !


- Calculer le degré de liberté ddl associé au tableau précédent !
- Les trois facultés ont-elles une composante semblable ?
- Quel type de test x2 avez-vous utilisé ?

6.3.3. Test chi-deux de conformité ou d’ajustement à une loi


Dans le cadre du test x2 d'ajustement ou de conformité à une loi, le tableau ne comporte qu'une
seule colonne, car la distribution d'une variable est observée sur un seul échantillon (Tableau 3).
A chaque modalité i de la variable est associe son effectif observé oi.
Table 3 {Tableau de contingence / Test du x2 d'ajustement

Variable Effectifs observés

Modalite 1 o1
Modalite 2 o2
. .
. .
Modalite p op
Total N

Exercice 5
Parmi les étudiants de 4 facultés ayant réussi un test de maitrise d’une langue étrangère, 400 ont
été pris au hasard et les résultats obtenus ont été résumés dans le tableau suivant
Faculté 1 Faculté 2 Faculté 3 Faculté 4
Effectifs 150 105 80 65
observés
6
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir

- Compléter le tableau par les effectifs théoriques !


- Quel est le ddl ?
- Quel type de test khi-deux allons-nous utiliser ?
- Peut-on penser au risque de 5% que les étudiants des 4 facultés ont le même niveau dans
cette langue étrangère ?

7. Comparaison de deux moyennes dans le cas d’échantillons indépendants


7.1. Grands échantillons : test de l’écart réduit
Principe : quand les 2 échantillons à comparer sont grands, i.e. quand n≥301 et n2≥30, on fait appel
au test de l’écart réduit
𝑚1 −𝑚2
Il faut d’abord calculer la quantité ε =
𝑠 2 𝑠 2
√ 1 + 2
𝑛 𝑛
1 2
En 2ème étape, on compare ε à la valeur seuil uα lue dans la table de la loi normale centrée réduite.
Au risque α=5% correspond uα=1,96.
En test bilatéral : on rejette H0 si |ε| ≥ uα.
Exercice 6 :
Dans une maternité pour deux échantillons de nouveau-nés de sexes différents on a obtenu les
résultats suivants :
50 garçons : taille moyenne 51 cm et écart-type des tailles 3 cm
60 filles : taille moyenne 49 cm et écart-type des tailles 3.2 cm.

- Au risque de 5 % peut-on déduire de ces indications une différence significative entre les
moyennes des tailles des nouveau-nés suivant le sexe ?
- L’hypothèse de normalité est-elle nécessaire ? pourquoi ?

7.2. Petits échantillons : test de Student


Dans le cas où n1< 30 et n2 < 30, l’approximation par la loi normale n’est plus possible, et le test
de l’écart réduit n’est plus applicable. Il faut utiliser le test de Student en supposant que la variable
utilisée suive la loi normale.
𝑚 −𝑚 𝑚 −𝑚
Il faut d’abord calculer la quantité t = 1 1 21 = 1𝑛 +𝑛2
√𝑠2 (𝑛 +𝑛 ) √𝑠2 ( 𝑛1 𝑛 𝑆)
1 2 1 2
Où s2 représente l’estimation de la variance commune. Cette estimation est donnée par la formule
suivante qui pondère s12 et s22 par leur nombre de degré de liberté.
(𝑛1 −1)𝑠12 +(𝑛2 −1)𝑠22
s2= 𝑛1 +𝑛2 −2
On compare la valeur de t à la valeur seuil de la loi de Student à (n1+n2-2) degré de liberté. La
règle de décision du test reste toujours identique.

Exercice 7 : Pour un échantillon de 12 sujets sains, on a obtenu les résultats expérimentaux


suivants : Moyenne des taux sanguins de calcium : m 1 = 100 mg/m
Ecart-type des taux sanguins de calcium : s1 = 5.8 mg/l.

7
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir

Pour un échantillon de 16 sujets présentant une tumeur ostéolytique, on a obtenu les résultats
expérimentaux suivants :
Moyenne des taux sanguins de calcium : m2 = 130 mg/m
Ecart-type des taux sanguins de calcium : s2 = 6 mg/l.
En supposant que le taux sanguin se distribue selon la loi normale tester au risque de
5 % l’hypothèse selon laquelle les moyennes des taux sanguins de calcium de ces deux groupes
d’individus sont significativement différents.

8. Comparaison d’une moyenne observée à une valeur théorique


Test Z de l’écart réduit (n≥30)
Hypothèse nulle : m = µH0; hypothèse alternative m et µH0 différentes.

(𝒎−𝝁𝑯𝟎 )
Z= 𝟐
𝝈

𝒏
La variance dans la population σ² étant le plus souvent inconnue, on lui substitue son estimateur
s² (s² = estimation de σ² à partir de l’échantillon)
Et la formule devient :

(𝒎−𝝁𝑯𝟎 )
Z= 𝟐
√𝒔
𝒏
Pour conclure, on compare cette valeur calculée à celle indiquée par la table de la loi normale
centrée réduite.

Exercice 8 : La fréquence cardiaque au repos chez les adultes est en moyenne de 71bpm avec un
écart type de 15bpm (battements par minutes).
On a mesuré la fréquence cardiaque au repos chez 400 adultes pratiquant une activité physique
régulière. La fréquence cardiaque moyenne a été de 55bpm.
- Quelles sont ici les hypothèses nulle et alternative ?
- Peut-on considérer ce groupe physiquement actif comme une sous-population à part, non
représentative de la population générale au sujet de la fréquence cardiaque ?
- Lorsqu’on cherche à démontrer que les sportifs ont en général une fréquence cardiaque
basse, s’agira-t-il de test unilatéral ou bilatéral ?

Petits échantillons ; uniquement test de Student avec hypothèse de normalité obligatoire

8
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir

(𝒎−𝝁𝑯𝟎 )
T= 𝟐
√𝒔
𝒏
On compare T à la valeur critique de la table de Student correspondant au risque alpha et au degré
de liberté ddl= n-1.

9. Comparaison de deux moyennes dans le cas d’échantillons appariés : test


z et test de Student pour échantillons appariés
Test de l’écart réduit (ou test Z) si grand échantillon
Test de Student si n˂30, uniquement le test de Student et l’hypothèse de normalité est obligatoire

𝒎𝒅
Z0= où 𝐦𝐝 moyenne des n couples de différences
𝟐
√𝒔𝒅
𝒏

Dans le cas des petits échantillons, la formule devient :

𝒎𝒅
T0=
𝒔𝟐
√ 𝒅
𝒏

On compare T0 à la valeur critique de la table de Student correspondant au risque alpha et au


degré de liberté ddl= n-1.

Exercice 9 : Un nouveau traitement est supposée diminuer une constante biologique et est testée
sur 10 patients. Cette constante biologique est mesurée avant et après traitement et les résultats
obtenus sont les suivants :
Avant 15 18 17 20 21 18 17 15 19 16
Après 12 16 17 18 17 15 18 14 16 18

Un test préliminaire de normalité est réalisé sur la différence des valeurs de cette constante
biologique avant et après traitement et le résultat de ce test est que l'on peut accepter la normalité
de cette variable au risque 5%.

9
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir

- Calculer la moyenne des différences !


- Calculer la variance des différences !
- Est-ce que ce traitement diminue significativement la valeur de cette constante biologique
au risque 5%?
- Pourquoi avoir testé la normalité des différences ?

10. Comparaison de deux variances


Le principe du test de comparaison des variances de deux échantillons
Soit un échantillon E1, comprenant n1 observations, de variance s1².
Soit un second échantillon E2, comprenant n2 observations, de variance s2². Un test de
comparaison de variance de deux échantillons étudie si les variances s1² et s2² sont égales.
Trois tests paramétriques sont proposés pour la comparaison des variances de deux échantillons.
Remarque : les trois tests : tests de Fisher, Bartlett et Levene requièrent des échantillons
indépendants.

A) Test F de Fisher
Soit R le rapport supposé entre les variances (R vaut 1 lorsque l'on suppose l'égalité).

Le test F consiste à calculer le rapport Fo = SA² / SB² (en mettant la plus grande variance
au numérateur). Ce rapport est comparé à la valeur F lue sur la table F avec ddlA = (nA - 1)
et ddlB = (nB - 1).
Cette statistique suit une loi de Fisher à (n1-1) et (n2-1) de degrés de liberté si les deux
échantillons suivent une loi normale.
Trois types de tests sont possibles en fonction de l'hypothèse alternative choisie :

• le test bilatéral :
o H0 : s1² = s2²
o Ha : s1² ≠ s2²
• le test unilatéral à gauche
o H0 : s1² = s2²
o Ha : s1² < s2²
• le test unilatéral à droite
o H0 : s1² = s2²
o Ha : s1² > s2²

B) Test de Levene
Le test de Levene peut être utilisé pour comparer deux variances ou plus. C'est un test bilatéral
pour lequel les hypothèses nulle et alternative sont dans le cas où deux variances sont comparées
:

• H0 : s1² = s2²
• Ha : s1² ≠ s2²

La statistique de ce test est plus complexe que celle du test de Fisher et fait intervenir les écarts
absolus à la moyenne (article original de Levene, 1960) ou à la médiane (Brown et Forsythe, 1974).
L'utilisation de la moyenne est recommandée pour les distributions symétriques, à queues
moyennement épaisses. L'utilisation de la médiane est recommandée pour les distributions
asymétriques.

10
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir

La statistique de Levene suit une loi de Fisher à 1 et n1+n2-2 degrés de liberté.

C) Test d'homogénéité des variances de Bartlett


Le test de Bartlett peut être utilisé pour comparer deux variances ou plus. Ce test est sensible à
la normalité des données. Autrement dit, si l'hypothèse de normalité des données semble fragile,
on utilisera plutôt le test de Levene ou de Fisher. En revanche, le test de Bartlett est plus performant
si les échantillons suivent une loi normale.
La statistique de Bartlett suit une loi du Khi² à 1 degré de liberté.

Exercice 10 : On veut comparer la pression artérielle diastolique de 20 sujets sains (mA = 70,1)
à celle de 20 sujets atteints de drépanocytose (mB = 61,8). Si les variances dans les 2 groupes
sont respectivement de 116,7 et de 57,2, peut-on tester l’égalité des 2 moyennes ?
- Pourquoi est-il impératif de tester l’homogénéité des 2 variances ?
- Dans quel cas, il sera superflu de tester l’homoscédasticité ?

11. Comparaison de plusieurs moyennes : Analyse de variance


C’est la généralisation du test de Student.
En statistique, l'analyse de la variance (terme souvent abrégé par le
terme anglais ANOVA : analysis ofvariance) est un modèle statistique utilisé pour comparer les
moyennes d'échantillons.
Ce test s'applique lorsque l'on mesure une ou plusieurs variables
explicatives catégorielle (appelées alors facteurs de variabilité, leurs différentes modalités étant
parfois appelées « niveaux ») qui ont de l'influence sur la loi d'une variable continue à expliquer.
On parle d'analyse à un facteur lorsque l'analyse porte sur un modèle décrit par un seul facteur de
variabilité, d'analyse à deux facteurs ou d'analyse multifactorielle sinon.

Il fera l’objet d’un autre chapitre.

11

Vous aimerez peut-être aussi