Académique Documents
Professionnel Documents
Culture Documents
MEDROUH Bachir
1. Définition
Un test statistique est une procédure de décision entre deux hypothèses concernant la valeur
des paramètres d'un modèle probabiliste. L'hypothèse nulle notée H0 est celle que l'on considère
vraie a priori. Le but du test est de décider si cette hypothèse est crédible. L'hypothèse alternative
notée H1 est l'hypothèse alternative de H0.C’est donc un moyen de comparer des paramètres, un
procédé pour savoir s’il y a un effet significatif ou non.
Les tests statistiques sont utilisés chaque fois que l’on veut comparer un paramètre à une valeur
de référence, à comparer 2 ou plusieurs paramètres entre eux.
Généralement, on peut comparer une moyenne par rapport à une valeur de référence, les
moyennes de deux échantillons indépendants ou appariés, deux ou plusieurs proportions, une
proportion par rapport à une valeur théorique, on peut également comparer deux variances.
Lorsque l’on compare plusieurs moyennes, il s’agit de l’analyse de variance.
2. Principales étapes à suivre
La démarche générale d’un test statistique est la suivante :
- Formulation de la question d’intérêt
- Choix du test à appliquer
- Choix du risque alpha et de sa latéralité (bilatérale ou unilatérale)
- Calcul de la statistique du test
- Comparaison avec la valeur critique, celle donnée par la table adéquate (tables usuelles :
table de l’écart réduit, table de Student, Table de khi-deux, table Fde Fischer, etc.)
- Conclusion ou prise de décision : maintien ou rejet de l’hypothèse nulle.
1
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir
Le risque de première espèce représente la probabilité de déclarer malades des patients sains (ou faux
positifs). En d'autres termes, la confiance est la proportion de patients sains bien classes.
Le risque de deuxième espèce représente la probabilité de déclarer sains des patients malades (ou faux
négatifs). En d'autres termes, la puissance est la proportion de malades bien détectés.
Et on compare cette valeur à celle lue dans la table de l’écart réduit pour le risque alpha
correspondant. On rejette l’hypothèse nulle, si cette valeur calculée est supérieure à celle de la
table.
En 2ème étape, on compare ε à la valeur seuil uαlue dans la table de la loi normale centrée
réduite. Au risque α=5% correspond uα=1,96 ; au risque α=1% correspond uα=2,576.
En test bilatéral : on rejette H0 si |ε| ≥ uα .
Exercice 2 :
Parmi 200 malades traités par le médicament A, 82 ont souffert d’une récidive. Un autre groupe
de 300 atteints de la même maladie ont bénéficié d’un médicament B dont 240 ont définitivement
recouvré leur santé.
- Calculer les proportions de malades guéris complètement dans les deux groupes A et B !
- Calculer la proportion de guéris définitifs dans l’ensemble des 2 groupes !
- L’efficacité des deux médicaments diffère-t-elle significativement, au risque de 5% ?
- Même question au risque de 1%.
• Le test du 2 d'ajustement dont l'objectif est de comparer une distribution observée sur un
échantillon à une distribution théorique (binomiale, Poisson, normale, ...) ou a une
distribution connue dans la population sous-jacente.
Exemple : Soit un échantillon de 100 élevages bovins laitiers. La distribution observée (sur
l'échantillon) des races est-elle identique à celle de la population bovine algérienne?
3
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir
• Le test du 2 d'indépendance qui est utilisé pour étudier sur un même échantillon la liaison
entre deux variables qualitatives.
Exemple : Soit un échantillon de 100 ovins. Existe-t-il un lien entre la race et la couleur de
la toison?
Dans les trois cas, la méthode de calcul de la statistique de chi-deux est la même, seule
l’interprétation diffère.
(𝑶𝒊𝒋 −𝑪𝒊𝒋 )𝟐
χ =Σ
2
𝑪𝒊𝒋
Cette quantité sera comparée à la valeur seuil indiquée par la table de khi-deux pour le risque
α et le degré de liberté ddl.
Quoi qu’il en soit, ddl= (i-1) (j-1)= (nombre de lignes-1) (nombre de colonnes-1).
6.3.1. Test chi-deux d’indépendance
Le test d'indépendance du chi-carré vise à déterminer si deux variables observées sur un même
échantillon sont indépendantes ou non. Les variables étudiées sont des variables qualitatives
catégorielles.
Dans le cadre du test du x2 d'indépendance, le tableau de contingence comporte autant de lignes
que de modalités de la variable X1 et autant de colonnes que de modalités de la variable X2 (Table
1). A chaque croisement de la modalité i de X1 avec la modalité j de X2 est associe l'effectif observé
note oij . L'effectif observé de la modalité i de X1 est note ti et l'effectif observé de la modalité j de
X2 est note nj .
Table 1 {Tableau de contingence / Test x2 d'indépendance
Variable X2
Variable
X1 Modalité 1 Modalité 2 ::: Modalité k Total
4
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir
Exercice 3 : Une étude a porté sur 300 patients, appartenant à trois tranches d’âges différentes
et atteints d’une certaine maladie, les résultats du traitement ont été consignés dans le tableau ci-
après.
De 20 à 40 ans De 41 à 60ans Plus de 60 ans Total
Guérison 71 62 43
Guérison avec 20 22
séquelles
Echec 9 16 24
Total 100 100
Effectifs observés
Variable Echantillon 1 Echantillon 2 ::: Echantillon k Total
o11 o12 o1k
Modalité 1 . t1
o21 o22 o2k
Modalité 2 . t2
. . . . .
op1 op2 opk tk
Modalité p .
Total n1 n2 . nk N
5
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir
Exercice 4 : une étude s’est intéressée au personnel enseignant dans trois facultés. Les résultats
ont été résumés dans le tableau infra.
Assistants Maitres Maitres de Professeurs Total
assistants conférences
Faculté 1 7 31 24 12
Faculté 2 9 55 16 8
Faculté 3 12 45 10 3
Total 28 50
Modalite 1 o1
Modalite 2 o2
. .
. .
Modalite p op
Total N
Exercice 5
Parmi les étudiants de 4 facultés ayant réussi un test de maitrise d’une langue étrangère, 400 ont
été pris au hasard et les résultats obtenus ont été résumés dans le tableau suivant
Faculté 1 Faculté 2 Faculté 3 Faculté 4
Effectifs 150 105 80 65
observés
6
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir
- Au risque de 5 % peut-on déduire de ces indications une différence significative entre les
moyennes des tailles des nouveau-nés suivant le sexe ?
- L’hypothèse de normalité est-elle nécessaire ? pourquoi ?
7
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir
Pour un échantillon de 16 sujets présentant une tumeur ostéolytique, on a obtenu les résultats
expérimentaux suivants :
Moyenne des taux sanguins de calcium : m2 = 130 mg/m
Ecart-type des taux sanguins de calcium : s2 = 6 mg/l.
En supposant que le taux sanguin se distribue selon la loi normale tester au risque de
5 % l’hypothèse selon laquelle les moyennes des taux sanguins de calcium de ces deux groupes
d’individus sont significativement différents.
(𝒎−𝝁𝑯𝟎 )
Z= 𝟐
𝝈
√
𝒏
La variance dans la population σ² étant le plus souvent inconnue, on lui substitue son estimateur
s² (s² = estimation de σ² à partir de l’échantillon)
Et la formule devient :
(𝒎−𝝁𝑯𝟎 )
Z= 𝟐
√𝒔
𝒏
Pour conclure, on compare cette valeur calculée à celle indiquée par la table de la loi normale
centrée réduite.
Exercice 8 : La fréquence cardiaque au repos chez les adultes est en moyenne de 71bpm avec un
écart type de 15bpm (battements par minutes).
On a mesuré la fréquence cardiaque au repos chez 400 adultes pratiquant une activité physique
régulière. La fréquence cardiaque moyenne a été de 55bpm.
- Quelles sont ici les hypothèses nulle et alternative ?
- Peut-on considérer ce groupe physiquement actif comme une sous-population à part, non
représentative de la population générale au sujet de la fréquence cardiaque ?
- Lorsqu’on cherche à démontrer que les sportifs ont en général une fréquence cardiaque
basse, s’agira-t-il de test unilatéral ou bilatéral ?
8
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir
(𝒎−𝝁𝑯𝟎 )
T= 𝟐
√𝒔
𝒏
On compare T à la valeur critique de la table de Student correspondant au risque alpha et au degré
de liberté ddl= n-1.
𝒎𝒅
Z0= où 𝐦𝐝 moyenne des n couples de différences
𝟐
√𝒔𝒅
𝒏
𝒎𝒅
T0=
𝒔𝟐
√ 𝒅
𝒏
Exercice 9 : Un nouveau traitement est supposée diminuer une constante biologique et est testée
sur 10 patients. Cette constante biologique est mesurée avant et après traitement et les résultats
obtenus sont les suivants :
Avant 15 18 17 20 21 18 17 15 19 16
Après 12 16 17 18 17 15 18 14 16 18
Un test préliminaire de normalité est réalisé sur la différence des valeurs de cette constante
biologique avant et après traitement et le résultat de ce test est que l'on peut accepter la normalité
de cette variable au risque 5%.
9
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir
A) Test F de Fisher
Soit R le rapport supposé entre les variances (R vaut 1 lorsque l'on suppose l'égalité).
Le test F consiste à calculer le rapport Fo = SA² / SB² (en mettant la plus grande variance
au numérateur). Ce rapport est comparé à la valeur F lue sur la table F avec ddlA = (nA - 1)
et ddlB = (nB - 1).
Cette statistique suit une loi de Fisher à (n1-1) et (n2-1) de degrés de liberté si les deux
échantillons suivent une loi normale.
Trois types de tests sont possibles en fonction de l'hypothèse alternative choisie :
• le test bilatéral :
o H0 : s1² = s2²
o Ha : s1² ≠ s2²
• le test unilatéral à gauche
o H0 : s1² = s2²
o Ha : s1² < s2²
• le test unilatéral à droite
o H0 : s1² = s2²
o Ha : s1² > s2²
B) Test de Levene
Le test de Levene peut être utilisé pour comparer deux variances ou plus. C'est un test bilatéral
pour lequel les hypothèses nulle et alternative sont dans le cas où deux variances sont comparées
:
• H0 : s1² = s2²
• Ha : s1² ≠ s2²
La statistique de ce test est plus complexe que celle du test de Fisher et fait intervenir les écarts
absolus à la moyenne (article original de Levene, 1960) ou à la médiane (Brown et Forsythe, 1974).
L'utilisation de la moyenne est recommandée pour les distributions symétriques, à queues
moyennement épaisses. L'utilisation de la médiane est recommandée pour les distributions
asymétriques.
10
Biostatistique Master 2 Tests statistiques Dr SAIDANI Khelaf & Dr. MEDROUH Bachir
Exercice 10 : On veut comparer la pression artérielle diastolique de 20 sujets sains (mA = 70,1)
à celle de 20 sujets atteints de drépanocytose (mB = 61,8). Si les variances dans les 2 groupes
sont respectivement de 116,7 et de 57,2, peut-on tester l’égalité des 2 moyennes ?
- Pourquoi est-il impératif de tester l’homogénéité des 2 variances ?
- Dans quel cas, il sera superflu de tester l’homoscédasticité ?
11