Vous êtes sur la page 1sur 24

Ministry of Higher Education and Scientific Research

University of Science and Technology Houari Boumediène


Faculty of mathematics

⋆ ⋆ ⋆ BioStatistique ⋆ ⋆ ⋆
Cours 1 : Introduction
(Paramètres d’Évaluation en BioStatistique)

Mme A. MENNI

Mme A. MENNI Cours de BioStatistique (M2SPA)


Plan du Cours
1 Introduction

2 Paramètres d’évaluation de la performance d’un diagnostic

3 Estimation des paramètres d’évaluation

4 Un exemple.

5 Choix d’un seuil pour un signe de type continu

6 Un exemple.

Mme A. MENNI Cours de BioStatistique (M2SPA)


Introduction
La biostatistique est un champ interdisciplinaire qui relie la biologie
à la statistique et l’informatique. Il s’agit d’appliquer un traitement
statistique à des données biologiques.

Le domaine d’application de la biostatistique est large. Il peut concerner


des études écologiques, agronomiques, halieutiques, de santé publique,
de santé environnementale, épidémiologiques, médicales(fondamentales
et/ou cliniques), pharmaceutiques, agropharmaceutiques...

Dans le domaine bio-médicale, notamment, la biostatistique permet de


répondre à de nombreuses questions qui se posent en permanence :
Quelle est la valeur normale d’une grandeur biologique : taille,
poids, glycémie... ?
Quelle est la fiabilité d’un examen complémentaire ?
Quel est le risque de complication d’un état pathologique, et quel
est le risque d’un traitement ?
Un traitement "A" est-il plus efficace que le traitement "B" ?, etc.
Mme A. MENNI Cours de BioStatistique (M2SPA)
Paramètres d’évaluation de la performance d’un diagnostic

D’un point de vue statistique, un diagnostic est considéré comme une


variable aléatoire binaire. Par exemple, le patient souffre ou ne souffre
pas de la maladie considérée. On dit ainsi que le diagnostic est vrai ou
faux chez ce patient. Les états possibles de la variable seront notées
M et M̄ (maladie présente ou absente), ou D et D̄ (diagnostic vrai ou
faux).

À côté du diagnostic, on considère aussi un ensemble d’informations,


sous formes de signes. Un signe est statistiquement présenté comme
une variable déterministe binaire (ex. présence ou absence d’un
nodule) ou continue (ex. glycémie).

Dans la suite, on ne considérera que des signes binaires ; un signe


continu peut être discrétiser en introduisant un seuil de positivité :
d’un côté du seuil, les valeurs sont dites normales, et le signe est
absent ; de l’autre côté du seuil, les valeurs sont dites pathologiques,
et le signe est présent.
Mme A. MENNI Cours de BioStatistique (M2SPA)
Paramètres d’évaluation de la performance d’un diagnostic

Sensibilité et Spécificité

La sensibilité d’un signe pour une maladie est la probabilité que le


signe soit présent si le sujet est atteint de la maladie considérée :

Se = P(S|M )

Un test diagnostic est donc d’autant plus sensible que les sujets
atteints de la maladie présentent plus souvent le signe S.

La spécificité d’un signe pour une maladie est la probabilité que le


signe soit absent si le sujet n’est pas atteint de la maladie :

Sp = P(S̄|M̄ )

Un test diagnostic est donc d’autant plus spécifique que les sujets
indemnes de la maladie présentent moins souvent le signe S.

Mme A. MENNI Cours de BioStatistique (M2SPA)


Paramètres d’évaluation de la performance d’un diagnostic

Pour un diagnostic "parfait", sans aucune erreur, les valeurs de


la sensibilité et de la spécificité sont égales à 1.

Mme A. MENNI Cours de BioStatistique (M2SPA)


Paramètres d’évaluation de la performance d’un diagnostic

Valeurs Prédictives

La valeur prédictive positive d’un signe pour une maladie est la


probabilité que le sujet soit atteint de la maladie si le signe est
présent :
V P P = P(M |S)

la valeur prédictive négative d’un signe pour une maladie est la


probabilité que le sujet soit indemne de la maladie si le signe est
absent :
V P N = P(M̄ |S̄)

Mme A. MENNI Cours de BioStatistique (M2SPA)


Paramètres d’évaluation de la performance d’un diagnostic

On appelle Prévalence de la maladie la probabilité P(M ).

Mme A. MENNI Cours de BioStatistique (M2SPA)


Paramètres d’évaluation de la performance d’un diagnostic

Odds Ratio (une mesure d’association)

En épidémiologie, lorsqu’une variation du pourcentage d’apparition


d’une pathologie, d’une maladie ou d’un décès, semble être associée à
l’exposition ou non de l’individu à un facteur de risque, l’apport de la
statistique est de permettre de savoir si cette variation est
significative pour inférer l’influence ou non de ce facteur. Un outil
largement utilisé en épidémiologie est l’"Odds Ration".

Pour comprendre ce que représente un Odds Ratio voyons sa


définition. Pour cela, reconsidérons les deux événements M et S.

Mme A. MENNI Cours de BioStatistique (M2SPA)


Paramètres d’évaluation de la performance d’un diagnostic
Quatre odds (ou côtes ou chances) peuvent alors être définis :
P(M |S)
O(M |S) = : la côte de la maladie si le signe est présent,
P(M̄ |S)
P(M |S̄)
O(M |S̄) = : la côte de la maladie si le signe est absent,
P(M̄ |S̄)
P(S|M )
O(S|M ) = : la côte du signe si la maladie est présente,
P(S̄|M )
P(S|M̄ )
O(S|M̄ ) = : la côte du signe si la maladie est absente
P(S̄|M̄ )
et il est possible de définir deux odds ratios :

O(M |S) P(M |S)P(M̄ |S̄)


OR(M ) = = : rapport des côtes de la
O(M |S̄) P(M̄ |S)P(M |S̄)
maladie,
O(S|M ) P(S|M )P(S̄|M̄ )
OR(S) = = : rapport des côtes du signe.
O(S|M̄ ) P(S̄|M )P(S|M̄ )
Mme A. MENNI Cours de BioStatistique (M2SPA)
Paramètres d’évaluation de la performance d’un diagnostic

Mais, on montre que OR(M ) = OR(S)

Mme A. MENNI Cours de BioStatistique (M2SPA)


Paramètres d’évaluation de la performance d’un diagnostic

Interprétation

OR(M ) = 1 indique que la probabilité d’être atteint de la


maladie est la même, que le signe soit présent ou non. Autrement
dit, la maladie n’est pas associée au signe (indépendance).
OR(M ) > 1 indique que les individus présentant le signe ont plus
de risque d’être malades et vice versa (association positive).
OR(M ) < 1 indique que les individus n’ayant pas le signe ont
plus de risque d’être malades et vice versa (association négative).

Mme A. MENNI Cours de BioStatistique (M2SPA)


Paramètres d’évaluation de la performance d’un diagnostic

Le Risque Relatif (Relative Risk)


P(M |S)
RR =
P(M |S̄)

RR a une interprétation intuitive claire, ce qui n’est pas le cas pour


l’Odds Ratio. C’est le risque de survenue de la maladie pour les
individus présentant le signe par rapport à ceux qui ne le présentent
pas. Par exemple, si RR = 2, cela signifie que la population
présentant le signe a deux fois plus de risque d’être atteinte par la
maladie que celle qui ne le présente pas.

Mme A. MENNI Cours de BioStatistique (M2SPA)


Paramètres d’évaluation de la performance d’un diagnostic

Rapport de vraisemblance (Likelihood Ratio)

C’est le rapport entre la probabilité d’avoir le signe (ou de ne pas


l’avoir) chez les sujets malades et celui d’avoir le signe (ou de ne pas
l’avoir) chez les sujets indemnes de la maladie.

On distingue, alors, deux types de rapport de vraisemblance :


Se
Rapport de vraisemblance positif : RV P =
1 − Sp
Il permet de répondre à la question suivante :
combien de fois est-il plus vraisemblable d’être malade sachant
qu’on a le signe ?
1 − Se
Rapport de vraisemblance négatif : RV N =
Sp
Il permet de répondre à la question suivante :
combien de fois est-il plus vraisemblable d’être indemne de la
maladie sachant qu’on n’a pas le signe ?
Mme A. MENNI Cours de BioStatistique (M2SPA)
Estimation des paramètres d’évaluation

Considérons un tableau de contingence dans lequel sont indiqués les


effectifs suivants :

V P (Vrais Positifs) : effectif des individus atteints


de la maladie et présentant le signe, M M̄
F P (Faux Positifs) : effectif des individus indemne
de la maladie et présentant le signe,
S VP FP
F N (Faux Négatifs) : effectif des individus atteints
de la maladie sans présenter le signe,
S̄ FN VN
V N (Vrais Négatifs) :effectif des individus indemne
de la maladie et n’ayant le signe.

Mme A. MENNI Cours de BioStatistique (M2SPA)


Estimation des paramètres d’évaluation
Estimation de la sensibilité et de la spécificité

VP
Se ≃
V P + FN
VN
Sp ≃
V N + FP
M M̄
Estimation des valeurs prédictives

VP S VP FP
V PP ≃
V P + FP
VN S̄ FN VN
V PN ≃
V N + FN
Estimation du odds ratio et du Risque Relatif

VP ×VN V P (V N + F N )
OR = | RR =
FP × FN F N (V P + F P )
Mme A. MENNI Cours de BioStatistique (M2SPA)
Un exemple.

Une étude sur la santé publique a été menée en 1982 sur 22071
individus âgés de 40 à 84 ans. Le but était de savoir si la prise
régulière d’aspirine réduisait la mortalité par maladie
cardiovasculaire. Les participants étaient des hommes médecins sans
antécédents de crise cardiaque, d’accident vasculaire cérébral ou de
cancer, sans maladie hépatique ou rénale, sans contre-indication à
l’aspirine et, aussi, sans utilisation actuelle de l’aspirine. Chaque jour,
les participant à l’étude prenaient soit un comprimé d’aspirine soit un
placebo ; et sur une période de 5 ans, on a pris note de la survenue ou
non d’une crise cardiaque.

Mme A. MENNI Cours de BioStatistique (M2SPA)


Un exemple.

Les résultats obtenus sont regroupés dans le tableau de contingence


suivant :

Crise cardiaque pas de crise cardiaque Total


Prise de Placebo 189 10845 11034
Prise d’aspirine 104 10933 11037
Total 293 21778 22071

Estimer et interpréter les paramètres d’évaluation vus dans ce cours.

Mme A. MENNI Cours de BioStatistique (M2SPA)


Choix d’un seuil pour un signe de type continu
La Courbe ROC

Si le signe observé est une variable continue, il est question de


déterminer une valeur-seuil qui discrimine au mieux les valeurs
pathologiques des valeurs normales. Comme la sensibilité et la
spécificité varient en sens inverses, il faut donc tenter de déterminer
un seuil qui correspond à des valeurs-compromis des deux paramètres.

Un outil graphique qui permet de faire un tel choix est la courbe ROC
(Receiving Operating Curve)). Une courbe ROC est le tracé des
valeurs de "Se" (ou taux de vrais positifs) en fonction de "1 − Sp" (ou
taux de faux positifs).

Mme A. MENNI Cours de BioStatistique (M2SPA)


Choix d’un seuil pour un signe de type continu
La Courbe ROC

Mme A. MENNI Cours de BioStatistique (M2SPA)


Choix d’un seuil pour un signe de type continu
Le critère AU C (Area Under Curve)
L’aire sous la courbe ROC exprime la probabilité de placer un
individu positif devant un négatif. Ainsi, pour un diagnostic parfait,
AU C = 1. Mais s’il y a autant de chances de placer un positif devant
un négatif que l’inverse, la courbe ROC se confond avec la première
bissectrice, i.e. AU C = 0.5.
Pour calculer l’AU C, nous pouvons utiliser la méthode dite "des
trapèzes" :
Xn
AU C = ai
i=1

où ai est la surface du trapèze délimité par les individus i et i − 1 :


1
ai = (S̄p(i) − S̄p(i−1) )(Se(i) + Se(i−1) )
2

Mme A. MENNI Cours de BioStatistique (M2SPA)


Choix d’un seuil pour un signe de type continu
Règle de décision pour la qualité de discrimination

Valeur de l’AU C Commentaire


0.5 Pas de discrimination
]0.5 – 0.7[ Mauvaise discrimination
[0.7 – 0.8[ Discrimination acceptable
[0.8 – 0.9[ Excellente discrimination
[0.9 – 1] Discrimination exceptionnelle

Mme A. MENNI Cours de BioStatistique (M2SPA)


Un exemple.
Considérons le tableau ci-dessous qui indique la présence (M = 1) ou
l’absence (M = 0), d’une certaine maladie M , en fonction de la valeur
d’un signe S de type continu.
n° M S Se 1 − Sp ai
0,0000 0,0000
1 1 0,8789 0,1667 0,0000 0,0000
2 1 0,8765 0,3333 0,0000 0,0000
3 0 0,8584 0,3333 0,0714 0,0238
4 1 0,5815 0,5000 0,0714 0,0000
5 0 0,4057 0,5000 0,1429 0,0357
6 1 0,3922 0,6667 0,1429 0,0000
7 1 0,3782 0,8333 0,1429 0,0000
8 0 0,3775 0,8333 0,2143 0,0595
9 1 0,2134 1,0000 0,2143 0,0000
10 0 0,1727 1,0000 0,2857 0,0714
11 0 0,1382 1,0000 0,3571 0,0714
12 0 0,1371 1,0000 0,4286 0,0714
13 0 0,1244 1,0000 0,5000 0,0714
14 0 0,1058 1,0000 0,5714 0,0714
15 0 0,1037 1,0000 0,6429 0,0714
16 0 0,0737 1,0000 0,7143 0,0714
17 0 0,0710 1,0000 0,7857 0,0714
18 0 0,0584 1,0000 0,8571 0,0714
19 0 0,0362 1,0000 0,9286 0,0714
20 0 0,0164 1,0000 1,0000 0,0714

AU C = 0, 9048

Mme A. MENNI Cours de BioStatistique (M2SPA)


Un exemple.

Mme A. MENNI Cours de BioStatistique (M2SPA)

Vous aimerez peut-être aussi