Académique Documents
Professionnel Documents
Culture Documents
UE 4
Biostatistiques
Année universitaire 2017-2018
Tutorat PACES Lyon Est 2
Polycopié UE4
Polycopié UE4
Introduction
Nous insistons sur le fait que les polycopiés du Tutorat sont des Supports Pédagogiques, et ne
sont absolument pas une manière de remplacer les cours en amphithéâtre, ou une référence pour le
concours PACES.
Au sein de cette UE, vous retrouverez plusieurs cours, abordant tous, de manières variées, les
statistiques en médecine, les différentes techniques utilisées pour mener telle ou telle étude clinique,
les aspects de tests diagnostiques, ou encore la façon d'étudier de comparer et de traiter différents
groupes de patients.
L'UE4 est une matière très complète, vous présentant de nombreux aspects des « coulisses » des
études cliniques, des modalités de prise en charge des patients, et avec laquelle vous apprendrez de
multiples nouveaux termes, bien utiles pour appréhender la richesse du discours médical.
Une très bonne connaissance des éléments du cours associée à une bonne compréhension sont
nécessaire à la réussite des exercices. Il reste cependant difficile de comprendre instantanément les
bons raisonnements pour résoudre un problème compliqué. L'entraînement sur les annales et la
répétition des méthodes de résolution sont deux autres piliers de la réussite.
Sommaire
Introduction ...................................................................................................................................................................... 3
Sommaire .......................................................................................................................................................................... 4
Introduction ...................................................................................................................................................................... 9
I. Introduction ............................................................................................................................................................... 9
II. Statistiques descriptives ......................................................................................................................................... 10
A. Notions ......................................................................................................................................................... 10
B. Variables ....................................................................................................................................................... 10
C. Statistiques descriptives d’une variable quantitative .................................................................................. 11
III. Loi Normale ........................................................................................................................................................... 14
A. Distribution de probabilité ........................................................................................................................... 14
B. Loi normale centrée réduite......................................................................................................................... 14
IV. Distribution à deux variables qualitatives ............................................................................................................. 15
V. Conclusion .............................................................................................................................................................. 16
Applications des équations différentielles ....................................................................................................................... 17
I. Rappels de notations et définitions ......................................................................................................................... 17
II. Équations différentielles......................................................................................................................................... 17
III. Système d’équations différentielles ...................................................................................................................... 18
IV. Exemples ............................................................................................................................................................... 18
A. Bactériologie ................................................................................................................................................ 18
B. Pharmacologie ............................................................................................................................................. 19
C. Physique ....................................................................................................................................................... 20
D. Synthèse des trois exemples ........................................................................................................................ 21
V. Caractéristiques des équations différentielles ....................................................................................................... 22
A. Ordre ............................................................................................................................................................ 22
B. Linéarité .................................................................................................... Erreur ! Le signet n’est pas défini.
C. Coefficients ............................................................................................... Erreur ! Le signet n’est pas défini.
D. Second membre ........................................................................................................................................... 23
VI. Caractéristiques des systèmes équations différentielles ...................................................................................... 23
A. Ordre ............................................................................................................................................................ 23
B. Linéarité ....................................................................................................................................................... 24
C. Coefficients .................................................................................................................................................. 24
D. Second membre ........................................................................................................................................... 24
E. Caractéristiques des équations différentielles exemples............................................................................. 24
VII. Solutions des équations différentielles ................................................................................................................ 25
A. Généralités ................................................................................................................................................... 25
B. Premier cas ................................................................................................................................................... 25
C. Deuxième cas ............................................................................................................................................... 26
VIII. Applications ......................................................................................................................................................... 28
A. Épidémiologie............................................................................................................................................... 28
D. Pharmacocinétique ...................................................................................................................................... 32
Probabilités ..................................................................................................................................................................... 37
I. Introduction ............................................................................................................................................................. 37
II. Probabilités ............................................................................................................................................................. 37
A. Expérience aléatoire et évènements............................................................................................................ 37
B. Probabilité .................................................................................................................................................... 40
III. Probabilités conditionnelles .................................................................................................................................. 42
A. Définition...................................................................................................................................................... 42
B. Formules des probabilités composées, totales et formule de Bayes ........................................................... 43
IV. Indépendance........................................................................................................................................................ 44
Variables aléatoires discrètes et continues – Lois classiques ............................................................................................ 47
I. Variables aléatoires continues et discrètes ............................................................................................................. 47
A. Définition...................................................................................................................................................... 47
B. Loi de probabilité et fonction de répartition................................................................................................ 48
C. Espérance et variance .................................................................................................................................. 49
D. Variables aléatoires indépendantes ............................................................................................................. 51
II. Lois classiques ........................................................................................................................................................ 51
A. Lois discrètes : Bernoulli, binomiale, Poisson .............................................................................................. 51
B. Lois continues : loi normale ......................................................................................................................... 54
III. Conclusion ............................................................................................................................................................. 57
De l’évaluation des tests diagnostiques à l’analyse de la décision médicale ..................................................................... 59
I. Évaluation des tests diagnostiques ......................................................................................................................... 59
A. Valeurs intrinsèques du test ........................................................................................................................ 59
B. Les valeurs prédictives positive et négative ................................................................................................. 62
C. Ratio de vraisemblance, probabilité pré et post-test................................................................................... 63
D. Odds ............................................................................................................................................................. 63
II. Analyse de la décision médicale ............................................................................................................................. 64
A. Choix d’un test diagnostique ........................................................................................................................ 64
B. Choix d’un traitement .................................................................................................................................. 65
Fluctuations d’échantillonnage – Estimations ponctuelles et par intervalles de confiance ............................................... 69
I. Introduction : principe des statistiques inférentielles ............................................................................................. 69
II. Échantillonnage ...................................................................................................................................................... 69
III. Estimations ponctuelles et estimateurs ................................................................................................................ 70
A. Généralités ................................................................................................................................................... 70
B. Estimateur de l’espérance : M ..................................................................................................................... 71
2
C. Estimateur de la variance : s ....................................................................................................................... 71
D. Estimateur d’une proportion : F ................................................................................................................... 72
IV. Intervalles de fluctuations et intervalles de confiance.......................................................................................... 72
A. Intervalle de fluctuation / pari ..................................................................................................................... 72
B. Intervalle de confiance ................................................................................................................................. 73
Introduction
Rédigé à partir du cours du Pr ROY
Note de la rédaction. – Ce cours est une introduction et un aperçu de notions qui seront
développées par la suite dans le semestre. Il ne faut pas s’inquiéter s’il ne paraît pas clair, petit à
petit ce sont des notions que vous allez apprivoiser.
I. Introduction
La médecine est une médecine factuelle, c’est l’Evidence Based Medecine (EBM). Chaque
information a un niveau de preuve scientifique, la littérature scientifique médicale permet la diffusion
des connaissances : cette communication scientifique permet un accès aux découvertes de façon
compréhensible en préservant l’intégrité de l’information. Il n’y a pas de sciences sans quantification
des résultats : une question, un dessin d’étude, un niveau de preuve.
Un patient n’est jamais identique à un autre, sa maladie, sa réponse au traitement, son pronostic,
tout varie. Comment alors Analyser, Comprendre, Décider dans un monde où la variabilité est la règle
? Pour répondre à des questions d’ordre général, nous utilisons des échantillons représentatifs de la
population dont ils sont issus.
En effet, il existe des variabilités de résultats. Avec un test parfait, nous distinguerions
parfaitement les malades des non malades. Or, dans la réalité, il existe des faux positifs (des non
malades positifs au test) et des faux négatifs (des malades négatifs au test). Dès lors, il va falloir définir
un seuil pour lequel nous considérons le test positif, ce seuil représente un compromis entre les faux
positifs et les faux négatifs, par exemple nous pouvons avoir un test où nous n'aurons aucun faux
négatif qui serait hypothétiquement « toutes les personnes testées sont malades », ainsi nous ne
passerons pas à côté des malades mais nous aurons un nombre de faux positifs énorme. Ainsi, il va
falloir choisir un seuil qui permet de détecter le plus de malades sans se tromper.
Choix du seuil avec Sp = Spécificité et Se = Sensibilité (notion revue plus tard dans le semestre).
L’inférence statistique correspond à une interprétation, ce n’est pas une simple analyse
descriptive ; nous tirons des conclusions générales à partir de cas particuliers.
Méthodologie de la recherche :
Comment analyser les études ? Par une collecte des données puis une analyse déductive ou
descriptive et une analyse d’inférence ou inductive, c’est-à-dire généraliser à partir d’une étude.
Nous définissons également l’unité statistique, qui est un élément de l’échantillon. L’ensemble
des unités statistique constituent l’échantillon. On remplacera volontiers par la suite le terme « unité
statistique » par le terme « individu ».
La distribution statistique correspond à l’ensemble des couples (xi, ni) où xi est une modalité de
la variable X et ni le nombre de fois où cette modalité est observée (c’est-à-dire l’effectif ou la
fréquence absolue). Cette distribution peut être également l’ensemble des couples (xi, fi) où fi est la
fréquence relative (ou proportion) de la modalité xi.
'(
$% = (avec n l’effectif total des observations).
'
B. Variables
1. Variables qualitatives nominales
Ce sont des variables sans relation d’ordre.
Elles peuvent être binaires, c’est-à-dire ne prendre que deux modalités, comme la variable Sexe
(à femme ou homme).
Répartition de la fréquence des hommes et des femmes dans un groupe donné (variable qualitative binaire).
Score de killip.
3. Variables quantitatives
Elles sont discrètes (exemple : nombre d’enfants, titres d’anticorps sériques) ou continues
(exemples : taille, poids). Pour les variables continues, nous pouvons faire de la discrétisation c’est-à-
dire l’arrondir (exemples : taille en cm par exemple ou âge en année).
4. Séries
Exemple de série.
Nous pouvons également calculer la fréquence cumulée ce qui donne une fonction en escalier
(car les valeurs sont discrètes ; en effet, nous ne pouvons pas avoir 2,5 enfants par exemple et la durée
d’incubation est discrétisée en jours).
Nota Bene. – Si nous avons des classes inégales dans un histogramme, nous pouvons calculer la
+(
densité de fréquence )* = .
,-./%0123(
2. Paramètres de variables quantitatives
Nous allons ensuite pouvoir approfondir l’étude des valeurs prisent par notre variable grâce à
différents paramètres.
Paramètres de position
§ Moyenne arithmétique :
4%
4=
5
Avec 4% la somme des différentes valeurs de X et n le nombre total.
§ Médiane :
Elle partage la série des valeurs triées en deux parties de même effectif, c’est-à-dire qu’il y a
autant de valeurs inférieures que de valeurs supérieures à la médiane.
- Si n est impair, valeur de rang (n+1)/2 ;
- Si n est pair, toute valeur de ]x(n/2)+x((n/2)+1)[.
En pratique, la médiane est la moyenne de ces deux valeurs.
Le mode est la valeur observée avec la plus grande fréquence. Sa valeur s’obtient directement à
partir du tableau statistique ou du diagramme en bâtons. La classe modale est celle qui correspond au
plus grand effectif si toutes les classes ont la même amplitude.
Paramètres de dispersion
Le problème de la moyenne est sa sensibilité aux valeurs extrêmes, ainsi nous allons calculer des
paramètres de dispersion.
§ Variance :
7
(9% − 4)7 9% 7
6 = = − 47
5 5
§ Écart-type :
6= <=>*=5?@
§ Coefficient de variation :
6
AB =
4
§ Quantile de p : valeur de rang p(n+1). Q1, Q2, Q3 sont les quartiles, Q2 est la médiane.
Si X suit une distribution normale de moyenne F et d’écart type 6, alors l’écart réduit suit une
distribution normale standard de moyenne 0 et d’écart type 1.
Nous pouvons également le faire pour des fréquences relatives, dans ce cas il ne faut pas oublier
de diviser par n, nous obtenons alors comme valeur totale 1.
V. Conclusion
Présentation des données, tableaux et graphes :
§ Tableau des effectifs et des proportions de la distribution
§ Diagrammes et histogrammes
ième
§ Sa dérivée n (= d’ordre n) par rapport à t est :
En physique, les notations utilisées pour les dérivées par rapport au temps sont :
§ H = y' : cette notation désigne une dérivée première de y par rapport au temps.
§ H = y'' : cette notation désigne une dérivée seconde de y par rapport au temps.
Les formules usuelles de dérivation sont disponibles sur spiral. Nous distinguons les dérivées de
fonctions et les dérivées de fonctions composées.
Pour pouvoir calculer la (ou les) constante(s) arbitraire(s) et trouver ainsi la solution recherchée,
il faut connaitre une (ou plusieurs) conditions initiales :
§ Si l’équation différentielle est d’ordre 1, il faut connaître une condition initiale. Il s’agit
classiquement de la valeur y quand t = 0. Nous notons alors y(0) = y0.
§ Si l’équation différentielle est d’ordre n, il faut connaître n conditions initiales.
IV. Exemples
A. Bactériologie
Énoncé du problème :
§ Soit une population de bactéries qui se développent dans un milieu favorable (listeria
dans du fromage au lait cru).
§ Nous voulons connaître le nombre de bactéries au cours du temps afin de déterminer
une date limite de consommation (= temps au-delà duquel le nombre de bactérie devient
dangereux pour la santé).
Schéma du problème
B(0) = B0
B(t) = B0.ekt
B. Pharmacologie
Enoncé du problème :
§ Soit un complexe qui se forme lorsqu’un ligand se fixe sur un récepteur et qui devient
alors actif pour transmettre un « signal » à l’intérieur de la cellule lui permettant de
produire une protéine particulière.
§ Nous voulons connaître la concentration en complexe au cours du temps afin d’en
déduire la concentration en protéines produite par la cellule.
Schéma du problème
k : vitesse de réaction.
La solution du système est : [C](t), [L](t), [R](t). Cet exemple peut être modélisé par le graphique
ci-dessous :
Modélisation du système.
C. Physique
Enoncé du problème :
§ Soit un solide de masse m soumis à un ressort de constante de raideur k.
§ Nous voulons connaître l’évolution de sa position au cours du temps.
Schéma du problème
L’équation différentielle suivante peut ainsi être formulée (fonction x qui représente la position
du mobile sur Ox), c’est l’équation du mouvement du solide selon l’axe (Ox) :
L’équation ci-dessous est une équation d’ordre 2, il faut donc deux conditions initiales pour la
résoudre, par exemple :
La solution de l’équation différentielle est x(t), c’est une fonction trigonométrique (cos)
représenté ci-dessous :
m4 + kx = 0
Les caractéristiques et les solutions des équations différentielles sont très différentes.
A. Ordre
L’ordre de l’équation différentielle est l’ordre de la plus haute dérivée.
Exemples.
er
§ 2y’ + (2t)y² + 5 = 6t² est une équation du 1 ordre.
nd
§ 4y(2) + 3y’ + (cos t) y = 7 est une équation du 2 ordre.
B. Linéarité
Une équation linéaire ne contient pas de terme non linéaire en y.
Exemples de termes non linéaires (en y).
I
§ y², yn, H , , ln(y), cos(y), sin(y)…
J
I
§ y’2, y’n, H′ , , ln(, ln(y’), cos(y’), sin(y’)…
JL
J
§ yy’,
JM
Précisions sur la linéarité : On considère une ED qui porte sur la fonction y, on dira que cette ED est
linéaire si elle ne contient pas de termes non linéaires en y. Par exemple, des termes comme cos(y),
sin(y) sont des termes non linéaires en y. Il faut bien comprendre que la linéarité (ou la non linéarité)
de l’ED se regarde par rapport à la fonction considérée.
y'+(cos t) * y = 3
w' + (cos y) * w = 3
C' + (cos C) * z = 3
C. Coefficients
Les coefficients sont les termes situés devant y, y’, y’. Ces coefficients sont dits non constants
s’ils dépendent de t.
Exemples.
§ 4y’’ + 3y’ + 7y = cos t est une équation différentielle à coefficients constants.
§ 4y’’ + (3t)y’ + 7y = 8 est une équation différentielle à coefficients non constants.
D. Second membre
Le second membre regroupe l’ensemble des termes de l’équation différentielle qui ne comporte
ni y ni y' ni y''. Il peut être constant ou fonction de t. Il se met classiquement à la droite du signe égal.
Exemples.
§ 4y’’ + 3y’ = cos t, le second membre de cette équation est d(t) = cos t ;
§ 4y’’ + 3y’ + sin t + 6 = 0, le second membre de cette équation est d(t) = – sin t – 6 ;
§ 4y’’ + 3y’ + (sin t)y = 0, le second membre de cette équation est d(t) = 0, cette équation
est sans second membre.
§ Ordre ;
§ Linéarité / non linéarité ;
§ Coefficients constants / non constants ;
§ Avec / sans second membre ;
A. Ordre
L’ordre d’un système est l’ordre de l’équation différentielle qui a la plus haute dérivée.
B. Linéarité
Un système est dit linéaire si toutes ses équations différentielles sont linéaires (c’est-à-dire pas
de terme non linéaire en chacune des fonctions et pas de terme « mixte »).
Ce système est non linéaire car il comporte un terme mixte (y1 x y2).
C. Coefficients
Un système est dit « à coefficients constants » si toutes les équations différentielles sont à
coefficients constants.
D. Second membre
Un système est dit « avec second membre » si au moins une des équations différentielles du
système comporte un second membre.
er
C’est une équation linéaire, du 1 ordre, à coefficients constants et sans second membre.
er
C’est un système d’équations différentielles non linéaire, de 1 ordre, à coefficients constants et
sans second membre.
§ Physique (fonction de x)
m4+ kx = 0 ⇔mx’’ + kx = 0 (m et k P ℜ)
nd
C’est une équation linéaire, de 2 ordre, à coefficients constants et sans second membre.
Remarques
§ Si l’équation différentielle est d’ordre 1, la solution générale comporte une constante
arbitraire, il faut donc une condition initiale.
§ Si l’équation différentielle est d’ordre n, la solution générale comporte n constantes
arbitraires, il faut n conditions initiales.
H’ = T(U) × H H’ = = × H (a P ℜ)
B. Premier cas
Le premier cas concerne l’équation suivante :
H’ = T(U) × H ⇔ H’ − T(U) × H = 0
Avec g(t), une fonction de t.
C’est une équation différentielle linéaire, à coefficients non constants et sans second membre.
H(U) = W. @ Y(0) (K P ℝ)
Avec G(t) la primitive de g(t).
Remarques
§ La solution est à connaître mais la démonstration (qui est sur spiral) n’est pas au
programme de la PACES.
§ Sur spiral, une fiche rappel des calculs de primitives est disponible. Exemple : la primitive
I
de est ln (y).
J
§ Il y a également sur spiral des rappels des propriétés des exponentielles et des logarithmes
népériens. Exemple : @ (,Z[) = @ , × @ [ .
§ Maîtrisez bien vos relations mathématiques vous gagnerez beaucoup de temps, même
pour l’UE3.
C. Deuxième cas
Le deuxième cas concerne l’équation différentielle suivante :
H’ = = × H ⇔ H’ − =H = 0 (a P ℝ)
er
C’est une équation linéaire, de 1 ordre, à coefficients constants et sans second membre.
H(U) = \. @ ,0 (\ P ℝ)
Démonstration :
§ Considérons un cas particulier du cas précédent : g(t) = a
§ La primitive de g(t) est :
](U) = =U + _ (b P ℝ)
§ La solution est :
H U = K.@ ,0 . @ [ = (K@ [ ) . @ ,0
§ (K@ [ ) est une constante que nous pouvons appeler \.
§ La solution générale de l’équation différentielle est donc :
y(t) = \.@ ,0 (\ P ℝ)
H(U) = H` @ ,0
a(U) = a` @ b0
Remarques
§ Il est important d’être capable de retrouver une solution générale mais aussi particulière
avec l’utilisation d’une condition initiale.
A. Soit y une fonction de x plusieurs fois dérivable sur ℝ. Soit l’équation : 4x²c(E) + 2c(d) + 2x = 0.
ème
Cette équation différentielle est linéaire, du 3 ordre, à coefficients non constants et sans
second membre.
e²c ec
B. Soit y une fonction de t plusieurs fois dérivable sur ℝ. Soit l’équation : 2 + 4y - 3ty = 2t.
eg² eg
Cette équation différentielle est linéaire, du 2ème ordre, à coefficients non constants et avec
second membre.
C. Soit y une fonction de x plusieurs fois dérivable sur ℝ. Soit l’équation : 2c(E) +hd c= 4 cos x.
Cette équation différentielle est linéaire, du 2ème ordre, à coefficients non constants et avec
second membre.
D. Soit y une fonction de t dérivable sur ℝ. Cette fonction vérifie : 3y’ - 2y = 0 et y(0) = 3.
La solution recherchée de cette équation différentielle avec prise en compte de la condition
initiale est une fonction décroissante.
E. Soit y une fonction de x dérivable sur ℝ. Soit l’équation : y’ - hi c = 0.
l
La solution générale de cette équation différentielle est y(x) = \@ jk avec \ P ℜ.
EXERCICE ̶ Correction
ème
A. Faux : l’équation est linéaire, du 3 ordre, à coefficients non constants mais avec second
membre : d(x) = -2x.
B. Faux : l’équation est non linéaire.
ème
C. Vrai : l’équation est bien linéaire, du 2 ordre, à coefficients non constants et avec second
membre.
7
D. Faux : 3y’ - 2y = 0 ⇔ 3y’ = 2y ⇔y’ = y. La solution générale est : y(t) = \@ 70/m (\ P
m
ℝ). La
solution recherchée avec la condition initiale est : y(t) = y(0) x @ 70/m = 3@ 70/m (fonction
croissante).
Remarque concernant a@ [0 (a et b P ℝ) :
§ Si a > 0 et b > 0 ou si a < 0 et b < 0 alors la fonction est croissante.
§ Si a > 0 et b < 0 ou si a < 0 et b > 0 alors la fonction est décroissante.
Rappel. – Savoir si une fonction est croissante / décroissante sur un intervalle Ù calcul de dérivée
§ Soit la fonction y(t) = a x @ [0 avec a et b P ℝ ;
§ Calcul de la dérivée : y’(t) = ab x @ [0 ;
§ Comme @ [0 > 0 (∀t P ℝ), le signe de y’(t) dépend du signe de ab :
- a et b de même signe : ab > 0 donc y(t) > 0 " fonction croissante.
- a et b de signe opposé : ab < 0 donc y(t) > 0 " fonction décroissante.
VIII. Applications
Deux applications seront présentées :
§ En épidémiologie avec le modèle SI (susceptibles et infectés) et le modèle SIR
(susceptibles, infectés et retirés) ;
§ En pharmacocinétique concernant la variation (concentration sanguine puis élimination)
A. Épidémiologie
1. Modèle SI
Énoncé du problème : soit une maladie contagieuse (rougeole) qui touche une population de n
individus. Nous considérons deux groupes :
§ “susceptibles” : personnes non malades mais pouvant attraper la maladie.
§ “infectés” : personnes malades et contagieuses.
Schéma du problème
Pour simplifier, nous supposons que l’augmentation du nombre de malades est proportionnelle
au nombre de susceptibles et de malades (contact nécessaire).
Soit S les susceptibles et I les infectés, le système d’équation suivant peut être formulé :
Les solutions sont I(t) et S(t). La situation est modélisée par le graphique suivant :
Modélisation du problème.
2. Modèle SIR
Énoncé du problème : soit une maladie contagieuse (rougeole) qui touche une population de n
individus. On considère trois groupes :
§ “susceptibles” : personnes non malades mais pouvant attraper la maladie ;
§ “infectés” : personnes malades et contagieuses ;
§ “retirés” : personnes mortes, mises en quarantaines ou immunisés, c’est-à-dire ne
pouvant plus ni attraper la maladie ni la transmettre.
Schéma du problème
Les premiers modèles SIR ont été élaboré par Kermarck et McKendrick en 1927 à partir des
données épidémiologiques de la peste de Bombay (1905-1906).
Soit S les susceptibles, I les infectés et R les retirés, le système d’équation suivant peut être
formulé :
er
Ce système est non linéaire, du 1 ordre, à coefficients constants, sans second membre.
Les solutions sont I(t), S(t) et R(t). La modélisation graphique est différente selon les conditions
initiales. Avec un premier jeu de conditions initiales, voici le graphique obtenu :
Modélisation du problème.
ème
Avec t` = 1, u` = 500, v` = 0, k = 0.001 et r = 0.1. Le pic épidémique se trouve alors au 21 jour.
Schématisation du problème.
Les solutions sont, comme précédemment, I(t), S(t) et R(t). Le graphique suivant modélise cette
situation :
La natalité peut être également prise en compte. Soit f(n) la fonction de natalité dépendant de la
population totale.
La mortalité peut également être prise en compte. Soit m la mortalité par une autre cause que la
maladie étudiée.
B. Pharmacocinétique
La pharmacocinétique est l’étude du devenir d’un principe actif dans l’organisme. L’objectif
est l’étude de l’évolution temporelle de la concentration en principe actif dans le compartiment
d’intérêt : C(t).
Nous administrons à un patient un analgésique et nous souhaitons étudier la façon dont évolue
la concentration plasmatique (C) de ce médicament au cours du temps et selon différents schémas
d’administration :
§ Par voie intraveineuse (IV), en bolus c’est-à-dire de façon instantanée.
§ Par voie orale (= per os = PO), en une prise.
Schéma du problème
La condition initiale est que la concentration dans le compartiment central est immédiatement
maximale :
x
C(0) = A` =
y
Avec V le volume de distribution.
er
C’est une équation différentielle du 1 ordre, à coefficients constants et sans second membre.
La solution de l’équation différentielle est C(t) = A` @ {b| 0 . Le graphique suivant modélise cette
équation, elle suit un modèle mono-exponentiel :
Avec }I/7 la demi vie du principe actif (= temps pour lequel C = A` /2).
§ Nous savons que }I/7 est correspond au temps pour lequel C = A` /2, l’équation suivante
z~
peut en être déduite : C(}I/7 ) = .
7
{b| Å
§ Nous pouvons aussi écrire : C(} ) = A` @ Ä .
Ä
z~ {b| Å
§ Par identification : = A` @ Ä ;
7
{b| Å I
§ Puisque A` ≠ 0 : @ Ä = ;
7
I
§ En passant aux ln : -w3 }I/7 = ln = - ln 2 ;
7
/' 7
§ Donc }I/7 = .
b|
Schéma du problème
Ce modèle est dit mono-compartimental car le compartiment d’absorption n’est pas compté
comme un compartiment (= compartiment “virtuel”=voie digestive).
er
Ce système est linéaire, du 1 ordre, à coefficients constants, et sans second membre.
Les solutions du système sont A, (U) et C(t). Le graphique suivant modélise cette équation, elle
suit un modèle bi-exponentiel :
EXERCICE ̶ Correction
A. Vrai : C’ + w3 A= 0.
x
B. Faux : C(0) = A` = .
y
2zÉ x
C. Vrai : l’équation différentielle est = -w, A, (avec A, (0) = > 0). La solution recherchée est
20 y
A, (t) = A, (0) x @ {bÉ 0 , c’est une fonction décroissante.
D. Vrai.
x
E. Faux : A, (0) = et C(0) = 0.
y
Probabilités
Rédigé à partir du cours du Dr BARDEL
I. Introduction
Les probabilités sont une notion fondamentale pour les métiers de la santé. Elles sont utiles pour :
§ Le diagnostic ;
Exemples. – Probabilité qu'un patient soit malade connaissant ses facteurs de risque, probabilité
qu'un individu soit atteint d'une maladie connaissant le résultat d'un test diagnostic.
§ Le pronostic ;
Exemple. – Probabilité de survie à 10 ans pour une femme traitée pour un cancer du sein.
§ La thérapeutique ;
Exemples. – Probabilité qu'un patient présente un effet secondaire de son traitement, probabilité
qu'un patient ne réponde pas bien au traitement.
§ La génétique.
Les probabilités sont les bases théoriques des statistiques qui sont beaucoup utilisées dans le
monde médical. Quelques exemples d’utilisation des statistiques dans le monde médical :
§ Pour les essais cliniques (pour tester l’efficacité d’un traitement, un effet secondaire...).
Exemples : calcul du nombre de patients nécessaires à l’étude, conclusion de l’étude.
§ En épidémiologie.
Exemples : description de l’état de santé d’une population, recherche de facteurs de risque.
§ Dans la recherche.
Exemples : analyse de résultats d’expériences, critique d’articles.
II. Probabilités
A. Expérience aléatoire et évènements
Expérience aléatoire. – Expérience qui peut être répétée, qui a plusieurs résultats possibles et dont
le résultat est imprévisible.
Exemples. – Lancé d'un dé à six faces, observation du statut maladie d'un individu.
Ensemble fondamental (ou univers). – Ensemble de tous les résultats possibles (évènements
élémentaires) d’une expérience aléatoire. Il est noté Ω ou S.
Exemple. – Pour un lancé de dé à six faces, Ω = {1,2,3,4,5,6}.
Ω peut être :
§ Un ensemble fini ;
Exemple : statut vis-à-vis de la maladie, Ω = {“Malade”, “Non malade”}.
Il existe des évènements particuliers : l’évènement total Ω est certain, l’évènement vide Ø est un
évènement impossible.
Complémentaire de l’évènement A.
Ö ∩ a = Ö ∪ B et Ö∪a = Ö∩a
Évènements incompatibles
Système complet d'évènements. – Nous appelons système complet d’évènements toute partition
de Ω, c’est-à-dire tout ensemble d’évènement (Ai) tel que :
§ ∀*, Ö* ≠ Ø ;
§ ∀* ≠ j, Ö* ∩ Öé = Ø (évènements deux à deux incompatibles) ;
§ % Ö% = è.
Ω {1,2,3,4,5,6}
Union Ö ∪ a {2,3,4,5,6}
Intersection Ö ∩ a {4,6}
Complémentaire de B : a {1,2}
A et C : incompatibles Ö∩A = Ø
Ö ¹ Ø et ê ¹ Ø
Système complet
Ö∩ê = Ø
d'évènements A et D
Ö∪ê = è
B. Probabilité
1. Définition
Probabilité. – Nous appelons probabilité, sur Ω, une application P qui à tout évènement A associe
un réel P(A) positif ou nul tel que :
§ P(Ω) =1.
§ Si A et B sont incompatibles, alors ë(Ö ∪ a) = ë(Ö) + ë(a).
Exemple. – Croisement entre plantes hétérozygotes Aa pour un caractère à dominance stricte (a=
allèle mute, récessif).
Lorsque n " +¥, la fréquence relative tend vers la probabilité (selon la loi des grands nombres).
2. Propriétés
ìî>$=?@ )@ Ö
ë(Ö) =
ìî>$=?@ )@ è
Il existe plusieurs propriétés régissant les probabilités :
§ ë(Ā) = 1 − ë(Ö).
§ ó(ò) ≤ ô.
La probabilité d’un évènement A quelconque est la somme des probabilités des évènements
élémentaires qui constituent A.
Cas particulier Ù Cas de l’équiprobabilité – Tous les évènements élémentaires ont la même
probabilité. Soit è = {õ1, õ2, … , õ5}, les probabilités des évènements élémentaires sont
ü1 = ü2 = … = ü5 = 1/5. La probabilité d’un évènement A quelconque s’écrit alors :
5¢£_>@ )@ ?=ì $=<¢>=_§@ì à §= >é=§*ì=U*¢5 )@ Ö
ë Ö =
5¢£_>@ )@ ?=ì ü¢ìì*_§@ì )@ § L @5ì@£_§@
§ Si Ω est dénombrable : si è = {õ1, õ2, … , õ5. . . } ; pour définir une probabilité sur è, il
suffit de se donner une suite (ü5) de nombres réels positifs tels que Z© %°I ü* = 1. C’est
une définition simplifiée d’une probabilité sur un ensemble Ω infini dénombrable. La
probabilité d'un évènement A quelconque est la somme des probabilités des évènements
élémentaires qui constituent A à savoir P(A) = Z©
™ ∈ ¨ üé .
§ Si Ω est indénombrable : nous définirons une probabilité sur è en utilisant une mesure
m définie sur cet ensemble.
Exemple de mesure : la surface, le volume… La probabilité d’un évènement A quelconque
se calculera ainsi : ë(Ö) = £(Ö)/£(è).
§ ë(è|a) = 1 et ë(Ø|a) = 0.
§ ë(Ā|a) = 1 − ë(Ö|a).
a = a ∩ è = a ∩ (Ö ∪ Ā)
a = (a ∩ Ö) ∪ (a ∩ Ā)
Si {ÖI , Ö7 , … , Ö5} forment un système complet d’évènements, alors pour tout évènement B :
'
3. Le théorème de Bayes
Le théorème de Bayes permet d’exprimer ë(Öé|a) en fonction des ë(a|Öé) et de ë(Öé).
Connaissant la prévalence d'une maladie [ë(Ø)] et la probabilité qu'un test diagnostique soit
positif chez les malades [ë(} + |Ø)] et chez les individus sains ë(} Ø) , calculer la probabilité
qu'un individu soit malade si son test est positif [ë(Ø|}+) = Bëë].
Dans le cas général, le théorème de Bayes se définit ainsi : soient {ÖI , Ö7 , … , Ö5} un système
complet d’évènements et B un évènement de probabilité non nulle. Pour tout j {1,2, …, n} on a :
IV. Indépendance
Deux évènements A et B ≠ Ø sont indépendants (relativement à la probabilité P) si et seulement
si : ó(ò|Æ) = ó(ò). Nous avons alors de la même façon ë(a|Ö) = ë(a). La réalisation d’un des
évènements n’a pas d’influence sur la probabilité de réalisation de l’autre évènement.
Il est possible de définir l’indépendance de deux évènements d’une autre façon : A et B sont
indépendants (relativement à la probabilité P) si et seulement si ó(ò ∩ Æ) = ó(ò) × ó(Æ).
D’une façon plus générale, n évènements peuvent être indépendants deux à deux ou bien
mutuellement indépendants :
Nous parlerons d’épreuves indépendantes lorsque le résultat d’une des épreuves n’a aucune
influence sur le résultat des autres épreuves. L’application en statistiques des épreuves indépendantes
est la constitution de n échantillons.
Note de la rédaction. – Dans ce chapitre, les exemples ne seront pas détaillés car bien détaillés
sur le diaporama du professeur Bardel.
Nous considérons dans ce chapitre un ensemble fondamental des résultats d’une expérience
aléatoire que l’on note Ω. Une variable aléatoire correspond à l’attribution d’un nombre à chaque
résultat de l’expérience. Une variable aléatoire est une variable quantitative.
Dans cette illustration, les évènements de l’ensemble Ω, notés õ, sont associés à un nombre réel,
noté x, qui est la réalisation de la variable X. Il faut, de plus, ne pas oublier que plusieurs événements
peuvent être associés à une même réalisation, comme le souligne l’exemple avec xi et õ 2 et õ 3.
Exemples. – Nombre obtenu avec un dé ; facteur rhésus ; nombre de filles dans une fratrie.
Nous allons donc utiliser une notation particulière pour caractériser les variables aléatoires et
leurs valeurs possibles. Nous utiliserons des majuscules (X, Y, Z, …) pour les variables aléatoires et des
minuscules (xi, a, z) pour les valeurs possibles de cette variable aléatoire, appelées aussi réalisations.
Les événements sont notés : (X = k), (0 ≤ Z ≤ 1).
Ces variables aléatoires font, de plus, appel à différentes propriétés utiles pour réaliser les
différents exercices.
Représentation classique
Calcul de probabilités :
ë 9 = 4% = ë 9 ≤ 4% − ë 9 ≤ 4%{I = ∞ 4% − ∞ 4%{I
Si = ≤ _, ë = < 9 ≤ _ = ∞ _ − ∞(=)
Nous parlons donc dans le cas de variables aléatoires continues de densité de probabilité (ddp),
qui correspond à toute fonction f telle que :
§ ∀4 ∈ ℝ, $(4) ≥ 0 ;
Z©
§ {©
$ 4 )4 = 1 (aire sous la courbe égale à 1).
Dans ce cas de figure, nous pourrons d’ailleurs trouver un lien entre densité de probabilité et
fonction de répartition :
k
Soit, une VA X dont la ddp est f. F : x → F(x) = {©
$ U )U . Alors, nous aurons :
[
ë =≤9≤_ = $ U )U = ∞ _ − ∞(=)
,
C. Espérance et variance
1. Espérance : définitions et propriétés
L’espérance, que nous notons E(X) ou Fk , est la moyenne théorique, elle renseigne sur la position
des valeurs possibles sur une échelle. Elle se définit différemment en fonction de la nature de la VA
(discrète ou continue).
ø(9) = 4% ×ë 9 = 4% = 4% ×ü%
% %
Soit X une VA continue et soit f sa ddp. Son espérance est définie par :
Z©
ø 9 = 4$ 4 )4
{©
Nous parlons de variable aléatoire centrée dans le cas où ø(9) = 0. Donc la VA ∑ avec ∑ =
9 – ø(9) est une variable aléatoire centrée (utile pour passer d’une loi normale à une loi normale
centrée réduite (nous verrons comment réduire dans la suite du cours)).
Contrairement à l’espérance, une variance est toujours positive ou nulle. De plus, elle n’est pas
linéaire, ce qui explique les propriétés suivantes :
§ <=> =9 = = 7 <=> 9 ;
§ <=> 9 + _ = <=> 9 ;
§ <=> 9 + ∑ = <=> 9 + <=> ∑ + 2?¢< 9, ∑ .
3. Écart-type
Soit X une VA. On note 6k l’écart-type de cette VA et se définit par :
6k = <=>(9)
Pour avoir une variable centrée réduite, il faut centrer votre VA puis la réduire, soit :
9 − ø(9)
À=
6k
Propriétés de Z :
§ ø À =0;
§ <=> À = 1.
9 → a@>5(ü)
Dans le cas où X suit une loi de Bernoulli de paramètre p, nous pourrons en déduire l’espérance
et la variance de X beaucoup plus simplement, en reprenant les formules ci-dessus :
ø 9 = 0×Õ + 1×ü = ü
ø 9 7 = 07 ×Õ + 17 ×ü = ü
Œ(¬) = œ et ƒ«(¬) = œ–
La loi de Bernoulli est utile pour modéliser les résultats d’une expérience à deux issues possibles
comme par exemple le statut d’une maladie d’un individu.
2. Loi binomiale
Mise en situation : on se trouve dans une population où la proportion de Rh+ est égale à 0,85. On
prend un groupe de 5 patients et on souhaite savoir la probabilité d’avoir 2 patients avec un Rh+.
Cependant, cela ne fonctionne que pour un patient. Donc, pour 5 patients, nous allons définir une
nouvelle VA notée u' , correspondant au nombre de Rh+. Cela consiste donc à répéter 5 fois l’épreuve
de Bernoulli et ce de façon indépendante. Nous aurons alors :
u' = 9I + 97 + 9m + 9j + 9¥
La probabilité d’obtenir k succès parmi les n répétitions, notée P(Sn = k) est égale à :
0! = 1
Représentation d’une loi de probabilité et de la fonction de répartition d’une loi binomiale de paramètre 10 et 0,1.
Œ ‘’ = ’œ
ƒ« ‘’ = ’œ–
D‘’ = ’œ–
3. Loi de Poisson
Mise en situation : nous savons qu’en France, 17 nouveaux cas de VIH apparaissent chaque jour,
en moyenne. Nous souhaitons savoir la probabilité pour que seulement 10 nouveaux cas apparaissent
en une journée.
Modélisation : pour pouvoir répondre à cette question, nous utilisons une nouvelle loi : la loi de
Poisson. Soit X le nombre de nouveaux cas de VIH par jour. Nous avons une indépendance des
nouveaux cas entre eux et nous connaissons, en outre, le nombre moyen noté \, de nouveaux cas par
jour. X suit donc une loi de Poisson de paramètre \. Soit 9 → ë(\).
La loi de Poisson est donc une loi du nombre d’événements dans un intervalle (de temps ou
d’espace) donné. Elle prend donc les valeurs dans ℕ. Nous l'utilisons le plus souvent dans le cas où les
événements sont rares.
Ainsi, P(X = k) correspond à la probabilité qu’un événement survienne k fois dans un intervalle de
temps ou d’espace donné.
@ {◊ \b
ë 9=w = ü¢î> w ∈ ℕ
w!
Espérance, variances et écart-type de la loi de Poisson :
Œ ¬ =ÿ
ƒ« ¬ = ÿ
D¬ = ÿ
Ÿ(’; œ) ↝ ó(’œ)
Cela a un grand intérêt dans la simplification des calculs. Il est en effet plus aisé d’utiliser la loi de
Poisson que la loi binomiale.
Comme nous sommes dans le cas d’une loi continue, nous utiliserons une densité de probabilité,
qui est définie par :
1 1 4−F 7
$ 4 = × exp − ∀4 ∈ℝ
6× 2‡ 2 6
Comme nous pouvons le supposer à partir de ces deux représentations graphiques, la loi normale
présente différentes propriétés :
§ elle est symétrique par rapport à l’axe vertical passant par F ;
§ elle présente deux points d’inflexion : F − 6 et F + 6 ;
§ elle possède une médiane = mode = C ;
§ son aire sous la courbe vaut 1.
NB : Dans le cadre de la loi normale, les points d’inflexion sont les points de la courbe où la pente
est la plus importante en valeur absolue.
Dans le cas de 2 VA indépendantes suivant une loi normale, on peut composer avec une troisième
telle que :
Fonction de répartition
Soit X une VA suivant une loi normale de paramètres F @U 6. Sa fonction de répartition est alors
définie par :
k 7
1 1 U−F
∞ 4 =ë 9≤4 = exp (− ))U
6 2‡ {© 2 6
ë = ≤ 9 ≤ _ = ∞ _ − ∞(=)
Cependant, le calcul ne peut se réaliser de façon algébrique, nous allons recourir à des tables.
Nous noterons ‰ la fdr de la loi normale centrée réduite. Nous aurons alors :
ë À≤„ =‰ „
ë À ≥„ =1−ë À ≤„ =1− ‰ „
ë À ≥ „ = ë À ≤ −„ = ‰ −„ (du fait de la symétrie de la ddp)
Nous utiliserons alors ensuite les tables de la loi normale qui seront données pour les calculs des
probabilités. Ainsi, pour une valeur de z donnée, la 1ère table donne ë(À ≤ „). Pour une probabilité p
donnée, la 2ème table donne z tel que ë(À ≥ „) = ü.
D¬
Ë ↝ È(CË = C¬ ; DË = )
’
Nous aurons alors d’après le TLC, une approximation de Sn par la loi normale de paramètres ’œ
et ’œ– .
Æ ’, œ ↝ Í ÎÏ ; ’œ–
Remarque. – Il s’agit de l’approximation d’une loi discrète, où ë(9 = w) ≠ 0, par une loi continue,
donc où ë(9 = w) = 0. Nous appliquons donc une correction de continuité. Cependant, cette
correction est négligeable dans le cadre de la PACES.
III. Conclusion
Bien retenir les conditions d’application des différentes lois et les approximations ainsi que les
conditions pour approximer.
Connaître les rôles spécifiques des différentes lois et ce qu’elles représentent dans le cadre des
calculs des probabilités.
Note de la rédaction [NDLR]. – Ce polycopié ne contient pas toutes les démonstrations ni tous les
exemples vus en cours mais reprend toutes les notions essentielles pour comprendre le chapitre et
résoudre tous les exercices des épreuves de Tutorat ou du concours. Pour plus de clarté, certaines
notions ne sont pas traitées dans le même ordre que dans les diapositives de l'enseignant
présentées en cours.
NDLR. – La sensibilité et la spécificité sont appelées « valeurs intrinsèques du test » car elles ne
dépendent que de la performance du test sans être influencées par la prévalence de la maladie.
Un test “parfait”, c’est-à-dire totalement capable de discriminer les malades des non-malades,
est appelé Gold Standard. Il nous permet ainsi de calculer les valeurs intrinsèques du test.
Sensibilité (Se)
C'est la capacité d’un test à détecter tous les malades ou vrais positifs (VP), et donc à éviter les
faux négatifs (FN). Il s’agit donc de la probabilité qu’un sujet soit positif au test sachant qu’il est
réellement malade (T+ : événement « test positif »).
Bë
u@ = = ü(} + Ø)
Bë + ∞Ì
Spécificité (Sp)
C'est la capacité d’un test à détecter uniquement les non malades (VN) et donc à éviter les
faux positifs (FP). Il s’agit donc de la probabilité qu’un sujet soit négatif au test sachant qu’il n’est
réellement pas malade (T- : événement « test négatif »).
BÌ
uü = = ü(} − Ø)
BÌ + ∞ë
Ces deux valeurs varient en fonction de la valeur seuil attribuée au test. Nous choisirons donc un
seuil différent en fonction de ce que nous cherchons : soit un test sensible, soit un test spécifique.
Positif VP FP
Test
Négatif FN VN
VP + FN FP + VN
Dépistage du cancer du sein à l’aide d’un test ordinal avec modification du seuil diagnostique.
Nous constatons avec l'exemple ci-dessus que le seuil choisi va considérablement modifier les
valeurs intrinsèques de notre test, c’est-à-dire la sensibilité et spécificité. Ainsi, il faut trouver un
équilibre pour : à la fois détecter le plus de malades (sensibilité élevée) et ne pas détecter à tort des
non-malades (spécificité élevée).
La valeur seuil de diagnostic est donc à fixer en fonction de la prévalence de la maladie : le test
doit être très sensible si nous sommes dans une population ciblée, le but étant dans ce cas de repérer
un maximum de malades. Le test doit surtout être spécifique si la prévalence diminue.
La courbe ROC est un graphique nous permettant de choisir le test qui sera le plus intéressant
pour répondre à la question clinique posée.
Elle représente les valeurs intrinsèques du test simultanément : pour chaque seuil diagnostique,
nous déterminons le couple (Se ; Sp). Nous visualisons alors l’éloignement de la courbe à la diagonale.
Celle-ci correspond à un test non discriminant quel que soit le seuil choisi (c’est-à-dire pour lesquels
nous avons toujours Sp = Se).
Le point supérieur gauche n’est jamais atteint : il s’agit du Gold Standard (Se = 100% ; Sp = 100%).
La capacité d’un test peut ainsi être estimée par l’aire sous la courbe (ASC). Plus cette aire est
importante (soit plus il se rapproche du test parfait sur la courbe) meilleur sera le test.
Courbe ROC
Elles dépendent des valeurs intrinsèques du test et de la prévalence de la maladie. Celle-ci est
également appelée probabilité pré-test (d’avoir la maladie), c’est-à-dire la probabilité d’être malade
avant d’avoir réalisé le test.
NDLR. – Le test va en effet modifier la probabilité d’être malade en fonction du résultat de ce test.
S’il ne modifie pas cette probabilité, alors il est inutile (aucun renseignement utile nous a été
apporté).
Bë Ó3 × .(Ô)
Bëë = ü Ø } + = =
Bë + ∞ë Ó3 ×. Ô Z I{Ó. ×.(Ô)
BÌ Ó. × .(Ô)
BëÌ = ü Ø } − = =
BÌ + ∞Ì Ó. ×. Ô Z I{Ó3 ×.(Ô)
Propriétés :
§ Plus la prévalence de la maladie est élevée, meilleure est la VPP.
§ Plus la prévalence de la maladie est basse, meilleure est la VPN.
§ Plus le test est sensible, meilleure est la VPN.
§ Plus le test est spécifique, meilleure est la VPP.
Par exemple, si le test utilisé revient positif et que la probabilité post-test est supérieure à 50%,
alors le résultat est accepté et le patient est considéré comme atteint.
u@
vB+ =
1 − uü
1 − u@
vB− =
uü
Ces ratios de vraisemblance permettent ainsi de comparer les tests entre eux, pour savoir lequel
sera le plus pertinent en fonction de la question posée, c’est-à-dire si nous voulons un test spécifique
ou sensible. De plus, nous pouvons aussi savoir si un test est plus sensible ou plus spécifique. Pour cela,
I
il suffit de comparer le RV+ et du même test (nous prenons l’inverse du ratio de vraisemblance
y{
négatif pour pouvoir comparer ces deux ratios n'appartenant pas au même intervalle).
D. Odds
L’Odds ratio est un autre moyen d’accéder à la probabilité post-test d’être malade. Il estime le
risque relatif d’être malade en fonction du résultat des valeurs intrinsèques d’un test, de son résultat
et de la prévalence de la maladie. En effet, si la prévalence d’une maladie est élevée, nous aurons
d’autant plus tendance à croire à la positivité d’un test par exemple.
Ú .
Ò))ì ü>é-U@ìU = = (avec p la prévalence de la maladie)
Ú I{.
En fonction du résultat du test (positif ou négatif), nous aurons l’odds post-test positif ou négatif
(respectivement) :
Ò))ì ü¢ìU−U@ìU
ë>¢_=_*§*Ué ü¢ìU-U@ìU =
1 + ¢))ì ü¢ìU−U@ìU
NDLR. – Il s’agit d’une formule générale qui fonctionne à la fois si le test est positif ou négatif.
Cependant, n’oubliez pas que si vous utilisez l’odds post-test positif, vous aurez une probabilité
post-test positif, de même si le test est négatif.
Prenons ici un exemple pour mieux comprendre : un patient arrive aux urgences avec douleurs
abdominales violentes, des troubles urinaires avec du sang dans les urines. Nous suspectons des calculs
au niveau de l’uretère (voie urinaire excrétrice). Pour confirmer ce diagnostic, nous cherchons le test
présentant la meilleure sensibilité ainsi que la meilleure spécificité.
§ ASP
§ Échographie
§ Uroscanner
Résumé des données des différents tests lors de suspicion de calculs dans les voies excrétrices urinaire.
Nous constatons donc que l’uroscanner est le meilleur test avec la meilleure sensibilité et la
meilleure spécificité.
Résumé des données des différents tests lors de suspicion de calculs dans les voies excrétrices urinaire.
Si nous réalisons le test « artériographie », alors l’espérance de vie, notée EDV sera :
Si nous réalisons le test « intervention chirurgicale », alors l’espérance de vie, notée EDV sera :
øêB = ü Ø ×øêB Ø + ∅U@ìU + ü(Ø)×øêB(Ø − ∅U@ìU)
L’EDV est supérieure si nous réalisons une intervention chirurgicale, c’est donc cette méthode qui
sera retenue.
À RETENIR
§ Sensibilité et spécificité (définitions - formules - dans quel cas nous les utilisons) ;
§ RV+ et RV- (formules et leur utilité pour affirmer ou éliminer la présence de la maladie
en fonction du résultat du test) ;
§ Arbre de décision (bien comprendre le fonctionnement, plus que d’apprendre par cœur
les formules).
Vous devez impérativement comprendre ce cours pour pouvoir suivre correctement celui sur
l’épidémiologie. Les notions de ce cours y seront utilisées.
Note de la rédaction. – Dans un souci de clarté, l’ordre des parties a été modifié. Attention lors
du suivi du cours magistral !
II. Échantillonnage
Pour qu’un échantillon soit qualifié de « statistique », il doit répondre à plusieurs critères :
§ il doit être issu d’un tirage au sort aléatoire ; c’est-à-dire que chaque individu a la même
probabilité d’être tiré au sort.
§ et réalisé manière indépendante, il y a donc remise après tirage ou tirage au sein d’une
grande population par rapport à la taille de l’échantillon.
L’échantillon sera alors considéré comme représentatif de la population mais à plus petite
échelle rendant les calculs plus accessibles. À noter que plus la taille d’un échantillon augmente plus
les résultats seront représentatifs de la population (jusqu’à une certaine taille car sinon les individus
perdent leur indépendance).
Les proportions observées de points verts dans les échantillons 1, 2, 3 et 4 sont des estimations ponctuelles de la vraie
proportion dans la population
Cependant, contrairement aux statistiques descriptives, les individus ne seront plus considérés
comme uniques. Il peut s’agir de n’importe quel individu de la population qui a été tiré au sort pour
constituer un échantillon. Nous avons donc recours, pour les décrire, à des variables aléatoires. Il s’agit
d’une inconnue X définie sur l’ensemble des valeurs que peut prendre n’importe quel individu de la
population générale.
L’estimation d’un échantillon est reliée à la valeur vraie de la population via un estimateur. Un
estimateur est une variable aléatoire exprimée en fonction des variables aléatoires d’échantillon Xi :
} = $(9I , 97 , … , 9' )
Un estimateur attribue donc à un échantillon une estimation d’un paramètre. Une estimation est
une valeur calculée de l’estimateur pour un échantillon donné, à partir des valeurs observées dans
l’échantillon xi :
U = $(4I , 47 , … , 4' )
B. Estimateur de l’espérance : M
Espérance de M : Œ Ë = CË = C¬
DE¬
Variance de M : ƒ« Ë = DEË =
’
Nota Bene. – On dit que M est un bon estimateur de l’espérance, car d’après le TCL, lorsque n tend
vers l’infini, la moyenne observée sur un échantillon de taille n suit une loi normale de moyenne
FÊ et d’écart type 0.
C. Estimateur de la variance : s2
' '
1 1
u7 = (9% − Ø)7 = ( 9%7 − 5×Ø 7 )
5−1 5−1
%°I %°I
Nota Bene. – se² est un estimateur biaisé de la variance, alors que s² en est un bon estimateur.
Espérance de F : Œ(º) = œ
œ–
Variance de F : ƒ«(º) =
’
B. Intervalle de confiance
Dans la population cible, la vraie valeur d’un paramètre est inconnue, et nous disposons
seulement de son estimation ponctuelle dans un échantillon. À partir de son estimation, nous
construisons l’intervalle de confiance (IC) qui va contenir la vraie valeur avec une probabilité, que nous
appelons « niveau de confiance », de 1 − ¯ = 95%.
La valeur complémentaire ¯ = 5%, est le risque que l’intervalle de confiance ne contienne pas le
paramètre vrai (celui de la population).
Les bornes de l’IC dépendent de l’échantillon étudié, on dit qu’il est « aléatoire » en opposition
à l’IF qui est « fixé ». En effet, les données utilisées sont celles de la population qui reste invariable.
Nous définissons :
§ la largeur I d’un IC : I = borne supérieure – borne inférieure.
§ la précision i d’un IC : i= ½ x I.
Nota Bene. – i et I dépendent de n, plus la taille de l’échantillon est grande, plus l’IC est étroit.
Calcul du nombre de sujets nécessaires dans un échantillon pour une précision donnée :
7
$(1 − $) × „˙/7
5≥
*I7
Nota Bene. – Les formules de ce cours (sauf mention contraire) sont à apprendre, il faut essayer
de bien comprendre les exemples ; ce cours est essentiel.
I. Introduction
Un test statistique est un test d’hypothèse. Ces tests ne sont pas à confondre avec d’autres types
de tests comme les tests diagnostiques. Les tests statistiques sont basés sur l’inférence statistique :
analyser des résultats sur un échantillon aléatoire et en tirer des conclusions sur la population d’origine
de l’échantillon.
Mais dès lors, quelle est l’hypothèse testée par le test d’hypothèse ? Comment relier les notions
de test d’hypothèse et d’inférence statistique ?
En 1997, nous avons : tour de taille moyen = 84.6 cm (France). En 2006, nous nous intéressons à
un échantillon aléatoire de 30 personnes, nous obtenons les résultats suivants :
88.39 85.92 88.41 90.36 87.15 89.66 88.5 87.71 89.91 88.86 90.93 88.60 83.67 87.36 83.82 86.19
87.19 90.34 87.56 87.98 87.31 88.56 88.85 87.67 91.35 86.44 90.22 91.41 85.92 91.47
h = 88.26 cm
Nous nous demandons alors si le tour de taille moyen est différent en 2006 de ce qu’il était en
1997. Attention, bien évidemment 84,6 est différent de 88,26 mais nous recherchons si cette
différence est significativement significative !
Comment alors traduire cette question d’ordre général en test d’hypothèse ? Nous ne
connaissons pas la vérité mais nous savons calculer la probabilité de ce que nous observons sous
certaines conditions.
L’hypothèse testée est : entre 1997 et 2006, le tour de taille n’a pas changé. Cette hypothèse
concerne la population. Nous ne savons pas si l’hypothèse testée est vraie, mais nous pouvons
appliquer le calcul des probabilités.
Pour rappel, évidemment 88.26 ≠ 84.6 mais quelle est la probabilité d’observer sur un échantillon
aléatoire de n individus, issu d’une population dans laquelle F = 84,6 ?£, une moyenne calculée
supérieure ou égale à 88.26 cm, c’est-à-dire au moins aussi éloignée de 84.6 cm que l’est 88.26 cm ?
Pour répondre à cette question, l’hypothèse, qui va être testée, est appelée hypothèse nulle, que
nous écrivons H0. Notre hypothèse nulle dans cet exemple est que le tour de taille moyen dans la
population de 1997 est le même que le tour de taille moyen dans la population de 2006.
Ceci nous amène à nous demander : Quelle serait la probabilité d’observer une estimation de la
moyenne d’au moins 88.26 cm (μ de l’échantillon) si le tour de taille moyen en 2006 était de 84.6 cm
(μ de la population) ?
Dans cet exemple, nous supposerons ici que la variable est distribuée normalement, c'est-à-dire
qu'elle suit une loi Normale.
Nous allons lire alors dans la table de la loi Normale, la plus grande valeur de cette table est 4,9 ;
nous avons alors ë(À ≤ 4.9) = 0,999998 ; d’où 1 − 0,999998 = 0,00002. Ainsi, la probabilité
d’avoir un écart aussi important est très faible.
De la même manière, nous allons lire alors dans la table de la loi Normale, la plus grande valeur
de cette table est 4,9 ; nous avons alors ë(À ≤ 4.9) = 0,999998 ; d’où 1 − 0,999998 = 0,00002.
La zone grise est la zone de rejet de l’hypothèse nulle, elle représente la probabilité ¯. Si notre
valeur est dans cet intervalle, nous rejetons H0, si p > ¯, nous ne rejetons pas H0.
La statistique du test repose sur la valeur prise par une variable aléatoire de distribution connue
sous l’hypothèse nulle. La probabilité d’observer une valeur au moins aussi éloignée de la valeur de
référence que celle observée sur l’échantillon est le petit p = degré de significativité du test. Si cette
probabilité est très faible, l’hypothèse nulle est peu vraisemblable, elle est alors rejetée.
D. Significativité
La probabilité d’une valeur au moins aussi éloignée de la valeur de référence que celle observée
sur l’échantillon est le petit p (degré de significativité du test).
Si on précise, avant la réalisation du test, le sens de la différence qui conduit à rejeter l’hypothèse
nulle, le test est unilatéral :
§ Ecriture d’un test unilatéral : ˚` ∶ µ7``˛ = µIˇˇ! et ˚I ∶ µ7``˛ > µIˇˇ!
Ou
˚` ∶ µ7``˛ = µIˇˇ! et ˚I ∶ µ7``˛ < µIˇˇ!
Si on précise, avant la réalisation du test, que l’hypothèse nulle peut être rejetée quel que soit le sens
de la différence, le test est bilatéral :
§ Ecriture d’un test bilatéral : ˚` ∶ µ7``˛ = µIˇˇ! et ˚I ∶ µ7``˛ ≠ µIˇˇ!
La valeur du seuil de significativité est fixée avant le test dans le protocole de l’étude. C’est le
risque d’erreur consenti de rejeter l’hypothèse nulle alors qu’elle est vraie. Le degré de significativité
du test est comparé à la valeur du seuil de significativité une fois l’étude terminée.
§ Soit H0 est rejetée, avec le risque ¯ d’avoir rejeté l’hypothèse nulle à tort. Le petit “p”
(alors inférieur au risque α) est la probabilité d’une valeur au moins aussi éloignée de
l’hypothèse nulle que la valeur observée. Plus cette probabilité est faible, plus le test est
significatif. L’hypothèse nulle est rejetée au profit d’une hypothèse alternative, H1.
§ Soit il n’a pas été possible de rejeter H0, parce qu’il n’y a pas de différence, ou parce que
l’étude n’a pas été capable de détecter une différence réelle.
Attention. – Quand on rejette l’hypothèse nulle H0, on accepte l’hypothèse alternative H1.
En revanche, si on ne rejette pas l’hypothèse nulle, cela ne veut pas dire pour autant qu’on
l’accepte !
La formulation de l’hypothèse alternative englobe une infinité de possibilités de rejeter
l’hypothèse nulle.
Par exemple, l’hypothèse alternative d’un test bilatéral de comparaison de moyennes (µ1 ≠ µ2)
englobe une infinité de différences théoriques tant positives que négatives entre les 2 valeurs
théoriques des moyennes.
Il faut malgré tout noter que la valeur du degré de significativité dépend de la nature unilatérale
ou bilatérale du test effectué. Si nous avons observé une moyenne de 85 cm sur l’échantillon nous
aurons :
Remarque. – Nous utilisons ici les compléments à 1 pour lire dans la table de la loi Normale.
E. Conclusion
H0 vraie H0 fausse
Interprétation
H0 non rejetée β
correcte
Interprétation
H0 rejetée α
correcte
Le petit p ouvre l’analyse : si le test est significatif, la différence observée n’est pas due au hasard.
Nous calculons alors des estimations ponctuelles des paramètres d’intérêt, et leurs intervalles de
confiance.
On va centrer et réduire,
H0 : π = 0.85 = π0
H1 : π ≠0.85 (bilatérale)
n = 50,
f (observée) = 35/50 = 0.70
¯ = 0.05
Sous H0
p est donc < α, nous rejetons H0, la prévalence des sujets rhésus positifs dans la population basque est
inférieure à 0,85.
Les effectifs observés (35 et 15) sont comparés aux effectifs attendus sous l’hypothèse nulle. Il
faut comprendre alors que les effectifs attendus sont les effectifs si H0 est vraie : dans ce cas
l’hypothèse nulle est que la moyenne de rhésus positifs est de 0,85 dans la population française et
dans la population basque, il y a 50 basques dans notre échantillon, sous l’hypothèse nulle nous aurons
comme effectif attendu 50 x 0,85 = 42,5 et 50 - 42,5 =7,5.
Attention. – Nous sommes à 1 ddl, il faudra donc regarder dans la table du Chi-2 à 1ddl.
H0 : π = 0.85 = π0
Sous H0,
H1 : π <0.85 (unilatérale)
n = 50,
f (observée) = 35/50 = 0.70
¯ = 0.05
Remarque. – Le test du Chi-2 est par définition bilatéral. La valeur « test » de notre Chi-2 sera
donc la même que notre hypothèse de départ soit bilatérale ou unilatérale. La probabilité petit p
qui sera lue dans la table du Chi-2 correspond à celle d’un test bilatéral.
Cependant, il est quand même possible de conclure grâce au test du Chi-2 si le test est unilatéral.
Il existe deux méthodes donnant les mêmes conclusions :
• Diviser la probabilité lue dans la table par 2, puis la comparer au risque α (cf. calcul ci-dessus) ;
• Soit, regarder la valeur du Chi-2 seuil dans la table pour 2α, puis la comparer à notre valeur
test que nous avons calculé.
Par exemple, ici, α=0,05. La valeur de Chi-2 seuil pour 2α est de 2,7055. Notre valeur test est de
8,82. Nous remarquons que 8,82>2,7055 (petit p > α), donc nous rejetons l’hypothèse nulle
d’égalité des proportions.
E. Conclusion
Le petit p ouvre l’analyse : si le test est significatif, la différence observée n’est pas due au hasard.
L’hypothèse nulle est rejetée, avec un degré de significativité p < 0,01. Nous disposons d’une
estimation ponctuelle de la proportion de sujets rhésus positif, nous pouvons calculer un intervalle de
confiance.
Sous l’hypothèse nulle H0, la variable qualitative a une distribution de probabilités p1, p2, …, pK.
Sous l’hypothèse alternative H1, la variable a une distribution différente.
Test du Chi-2
Donc au risque ¯, quand notre Chi-2 est supérieur au Chi-2 seuil (c’est-à-dire au Chi2 pour
α = 5%) nous rejetons H0. Lorsque le Chi-2 est plus petit que le Chi-2 seuil, nous ne pouvons pas
rejeter l’hypothèse nulle.
Attention. – Il faut penser aux conditions d’application : tous les effectifs attendus sous H0 doivent
être supérieurs à 5 !
Remarques
§ Les Ei ne sont pas indépendants. Ainsi lorsque (k-1) valeurs sont calculées, la dernière
valeur s’impose car la somme des effectifs attendus est égale à n ! C’est pourquoi il n’y a
que (k-1) ddl.
Ici, nous allons comparer la proportion de décès lors de deux traitements (TTT), l’hypothèse
testée est alors un test bilatéral.
H0 : ‡chir = ‡ortho
H1 : ‡chir ≠ ‡ortho à ¯ = 0,05
Test d ’hypothèse
Nous ne connaissons pas la vérité, mais la probabilité d’observer ce que l’on observe sous une
certaine hypothèse. Ainsi, pour montrer une différence d’efficacité entre deux thérapeutiques, il
faudra calculer la probabilité d’un résultat au moins aussi éloigné de l’hypothèse nulle que le résultat
observé, cette probabilité étant calculée sous l’hypothèse nulle d’absence de différence d’efficacité.
Si cette probabilité est très faible, l’hypothèse nulle est peu vraisemblable, elle est alors rejetée : la
différence observée est significative.
Attention. – Ici, les effectifs des deux traitements sont différents d’où le dénominateur.
Ici, la probabilité de décéder si les deux traitements n’avaient pas de différence d’effets est :
Ì_ )@ )é?èì 67
ü` = = = 0,33
5 204
d’où :
C. Test du Chi-2
L’hypothèse nulle est celle de l’indépendance entre les probabilités de traitement chirurgical ou
orthopédique et le pronostic vital. Le calcul des effectifs attendus sous l’hypothèse nulle en découle.
Par exemple pour le traitement chirurgical : nous avons vu précédemment que la probabilité de
décès sous l’hypothèse nulle est de 0,33 ; d’où la probabilité de décéder sous H0 dans le groupe
traitement chirurgical est ntraitement chirurgical × 0,33 = 139 × 45,7 ; à partir de ce moment, comme nous
avons un tableau avec des marges fixées, il suffit de faire des soustractions pour avoir les autres
effectifs attendus. On comprend donc mieux pourquoi le test est à 1 ddl. Lorsque nous trouvons un
effectif, nous pouvons en déduire les trois autres.
En effet, il faut savoir que pour 1 ddl, le Chi-2 représente le carré d’une loi normale centrée
réduite, nous pouvons alors regarder dans la table de la loi Normale pour la racine du Chi-2 ; ici 3,1.
D. Conclusion
Le petit p ouvre l’analyse : si le test est significatif, la différence observée n’est pas due au hasard.
Nous calculons alors une estimation ponctuelle de la différence d’efficacité et son intervalle de
confiance. Sous les conditions de normalité pour les variables aléatoires fA et fB :
§ Le risque de première espèce (") : probabilité de rejeter l’hypothèse nulle (H0) alors
qu’elle est vraie. Il est fixé avant l’essai.
§ Le risque de seconde espèce (#) : probabilité de ne pas rejeter H0 alors qu’elle est fausse.
§ Puissance = 1-β
Puissance
VII. Conclusion
Nécessité d’inclure suffisamment de patients dans une étude compte tenu de la différence
d’efficacité attendue : études multicentriques nationales, européennes, internationales.
Pour les exercices à la fin du cours voir le diapo de l’année en cours et l’explication en cours.
Note de la rédaction. – L’introduction est un exercice pour se remettre en tête le cours précédant.
§ pour un test unilatéral, nous allons avoir H0 : F7``˛ = 84,6 et H1 : F7``˛ > 84,6.
Évidemment 85,3 > 84,6 ; mais quelle est la probabilité d’observer, sur un échantillon aléatoire
de 30 individus, issu d’une population dans laquelle μ = 84,6 cm, une moyenne calculée supérieure ou
égale à 85,30 cm ; c’est-à-dire supérieure à 84,6 cm (test unilatéral) et au moins aussi éloignée de 84,6
cm que l’est 85,30 cm ?
La grandeur « test » T=1,917 est supérieure à la valeur seuil 1,645 donc nous rejetons l’hypothèse
nulle d’égalité du tour de taille moyen en 1997 et du tour de taille moyen en 2006.
Nous pouvons conclure de la même façon lorsque nous comparons le petit p calculé (p<0,0281) et le
risque α (0,05). Petit p est inférieur à α donc la probabilité d’observer cette différence de tour de taille
moyen entre 1997 et 2006 est trop faible. De ce fait nous rejetons l’hypothèse nulle.
§ pour un test bilatéral, nous allons avoir H0 : F7``˛ = 84,6 et H1 : F7``˛ ≠ 84,6.
Évidemment 85,3 ≠ 84,6 mais quelle est la probabilité d’observer, sur un échantillon aléatoire de
30 individus, issu d’une population dans laquelle μ = 84,6 cm, une moyenne calculée supérieure ou
égale à 85,30 cm, c’est-à-dire supérieure à 84.6 cm (test unilatéral) et au moins aussi éloignée de 84,6
cm que l’est 85,30 cm ?
Dans ce test, nous ne pouvons pas rejeter l’hypothèse nulle car le petit p est supérieur au risque
α consenti.
Ê ZÊÄ Z⋯ZÊÁ
Ø= est un estimateur de F.
'
k Z kÄ Z⋯Z kÁ
£= est une estimation de F.
'
I ' I ' 7
u7 = %°I(9% − Ø)7 = ( %°I 9% − 5×Ø) est un estimateur non biaisé de 6 7 .
'{I '{I
I ' I '
ì7 = %°I(4% − £)7 = ( %°I 4%
7
− 5×£) est une estimation non biaisé de 6 7 .
'{I '{I
B. Théorie
n ≥ 30 n < 30
Ø − F` Ø − F`
X normale
6 → Ì(0; 1) 6 → Ì(0; 1)
D connue
5 5
Ø − F`
→ uUî)@5U(5 − 1))§) Ø − F`
X normale u → uUî)@5U(5 − 1))§)
u
D inconnue 5 5
→ Ì(0; 1)
Ø − F`
X quelconque
6 → Ì(0; 1)
D connue
5
Ø − F`
X quelconque → Ì(0; 1)
D inconnue
u
5
C. Exemples
1. Exemple 1
400 jeunes conscrits sont examinés et nous relevons leur taille. La moyenne de cet échantillon
aléatoire est : 4 = 172,2cm. Peut-on admettre que ce groupe de 400 jeunes est un échantillon tiré au
sort d’une population où la variable taille suit une loi Normale de moyenne m = 171,3 cm et d’écart-
type s = 7 cm?
er
1 cas - X normale, D connue, sous H0
Ø − F`
6 → Ì(0 ; 1)
5
172,2 − 171,3
= 2,57
7
400
En fonction du risque de première espèce retenu, nous aurons deux cas de figures :
2. Exemple 2
20 rats femelles sont tirés au hasard d’une lignée ; le poids utérin après traitement ostrogénique
est mesuré : 9 18 21 26 14 18 22 27 15 19 22 29 15 19 24 30 16 20 24 32. La moyenne et l’écart-type
de l’échantillon sont :
4 = £ = 21 £T
(4% − 4)7
= 5,76 £T
20
Les lignées usuelles ont un poids moyen de 24 mg. Peut-on admettre que notre lignée est une
lignée usuelle ? Nous supposons que la variable X, poids utérin, est gaussienne.
' '
7
1 7
1
ì = ( (4% − £) ) = ( 4% 7 − 5×£ 7 )
5−1 5−1
%°I %°I
Nous allons alors faire une estimation de l’écart-type de la population, s = 5,91 mg.
ème
2 cas - X normale, D inconnue, sous H0, nous prendrons " = 0,05 (bilatéral) :
Ô{%~
n < 30 ∶ & → uUî)@5U(19 ))§)
Á
Iˇ
21 − 24
U'[( = = −2,27
5,91
20
ü = ü } Iˇ > 2,27
Évidemment 2950 ≠ 3010. Mais quelle est la probabilité d’observer, sur deux échantillons
aléatoires de 49 nouveaux nés de sexe féminin issus d’une même population, une différence de valeurs
moyennes de 3010 – 2950, c’est-à-dire de 60 grammes ou plus ? Ici, nous comparons une différence.
er
1 cas - n1 ≥ 30 et n2 ≥ 30 :
ØI − Ø7 − (FI − F7 ) ØI − Ø7 − 0
= → Ì(0; 1)
7 7 7 7
uI u uI u
+ 7 + 7
5I 57 5I 57
ème
2 cas - n1 < 30 et/ou n2 < 30, deux conditions :
§ X normale ;
§ Variances inconnues égales à 6 7 (soit, en résumé, les variances doivent être égales).
ØI − Ø7 − 0
}=
5I − 1 uI 7 + (57 − 1)u7 7 1 1
+
5I + 57 − 2 5I 57
§ H0 : 6I 7 = 67 7 ;
§ H1 : 6I 7 ≠ 67 7 .
uI 7
∞= → ∞(5I − 1; 57 − 1)
u7 7
Pour comparer des variances observées au risque ¯, nous faisons le rapport de la plus grande
des deux à la plus petite et nous comparons ce rapport à la valeur de la table de Fischer correspondant
au seuil ¯ pour (’ô − ô) et (’E − ô) degrés de liberté. Si notre valeur test est supérieure à notre valeur
seuil lue dans la table, nous rejetons l’hypothèse nulle d’égalité des variances et nous ne pouvons pas
continuer le test de comparaison des deux moyennes. Si notre valeur test est inférieure à notre valeur
seuil, nous concluons que nos variances ne sont pas significativement différentes et nous pouvons
continuer la comparaison des moyennes.
§ H1 : FI ≠ F7 .
ü = ë À > 1,76 = 2×(1 − ‰ 1,76 ) = 2(1 − 0,9608) = 0,0784
H0 non rejetée
Il faut travailler sur la distribution des différences pour permettre de pallier la corrélation. Nous
allons tester l’hypothèse À = 0, nous travaillons sur la moyenne des différences, ce qui revient à
observer une moyenne théorique sur une observée.
Hypothèse à tester préalablement (hors PACES) : les variances sont égales ; quelque soit i, 6% 7 =
7
6 .
§ H0 : FI = F7 = ⋯ = Fb
Notations :
B. Principe de l’ANOVA
Dans l’ANOVA, nous calculons une estimation de la variance commune 6 7 dans deux cas :
§ en supposant H0 vraie.
Ceci représente la variance d’un échantillon donné, c’est la somme des écarts quadratiques à la
moyenne divisée par l’effectif total (N) moins le nombre d’échantillon (k).
Cela correspond à la somme des carrés des écarts totaux, c’est-à-dire par rapport à une moyenne
générale.
u) 7
∞ = 7 → ∞(w − 1; Ì − w)
u
Si l’hypothèse nulle est rejetée ; nous allons, pour confirmer, comparer des moyennes deux à
deux en contrôlant le risque de première espèce grâce à la correction de Bonferroni entre autres. En
effet, si nous ne corrigeons pas le risque par la multiplication des tests nous aurons forcément un test
significatif.
"
Correction de Bonferroni = avec ¯ le risque de première espèce et Q le nombre de paires
*
possibles parmi le nombre de groupe noté k.
uAA
ìz 7 =
w−1
ì) 7
∞= → ∞ w − 1; Ì − w
ì7
NDLR. – Moyen mnémotechnique pour retenir les degrés de liberté : ìz 7 , au numérateur, utilise
(k-1) qui va donc se retrouver en premier ddl et de même avec ì 7 et (N-k).
Rappel. – La variance la plus importante est toujours au numérateur. Or comme nous divisons par
un plus petit nombre SCC que SCR (w − 1 < Ì − w), nous pouvons aussi trouver rapidement la
formule en cas d’hésitation.
C. Exemple
Comparaison des durées moyennes d’hospitalisation des patients admis dans trois services d’un
centre hospitalier pour broncho-pneumopathie chronique.
Nous posons ¯ = 0,05, dans la table de Fisher pour 209 et 2 ddl. Au seuil ¯, nous avons
Fseuil = 2,209 ; notre F observé est de 8,26 et est donc > au Fseuil, nous rejetons l’hypothèse nulle.
Nous allons alors comparer les moyennes deux à deux : en contrôlant le risque de première
espèce en appliquant la correction de Bonferroni, ici nous avons trois séries, nous allons donc
comparer A avec B, A avec C et B avec C, ici nous allons faire trois tests dans ce cas (2 parmi 3 est égal
à 3). La comparaison des moyennes va être alors effectuée avec une probabilité de non plus ¯ mais de
¯ /3.
Note. – Nous pouvons également multiplier le petit p par le nombre de comparaison à la place !
Exemple. – Nous nous intéressons à la prévalence des infections nosocomiales dans les hôpitaux
français en 1996. Pour ce faire, nous allons faire une étude transversale c’est-à-dire une étude un
jour donné. Nous disposons d’un échantillon de 46 000 patients hospitalisés dont 3370 patients
avec une infection nosocomiale.
ë× 1 − ë 0,073× 1 − 0,073
ë ± 1,96 = 0,073 ± 1,96
Ì 46000
B. Incidence
Le taux d’incidence mesure la « vitesse d ’apparition » des nouveaux cas, il permet d’estimer la
probabilité pour un individu de développer la maladie par unité de temps. Le taux d’incidence à une
unité : T-1, contrairement à la prévalence.
Le taux d’incidence estimé est le rapport du nombre d’évènement divisé par la durée totale
d’observation.
§ M= nombre total de cas observés (ici 2) ;
§ T= nombre total d’unités de temps observées en années (ici 18 ans) ;
Ô
§ Estimateur : t = ;
Å
7
§ Estimation : t = an-1.
I9
∏
§ Erreur type d’un taux d’incidence estimé : u = .
Å
Intervalle de confiance à 95 % :
0,000089
0,000089 ± 1,96
58 370 786
Soit [0.0000866 à 0.0000914], soit 8.66 à 9.14 pour 100 000 personnes-années.
Corrélation – Régression
Rédigé à partir du cours du Dr MAUCORT-BOULCH
I. Corrélation
A. Introduction
1. Rappels
Commençons par quelques définitions apprises dans le chapitre des variables aléatoires :
Variable aléatoire. – Une variable aléatoire sur è correspond à toute application X : è " ℝ telle
que ∀ x∈ ℝ, 9 {I ([a, b]) est un événement.
Variance. – Elle est notée var(X) (ou 6 7 ). Elle mesure la dispersion d’une variable aléatoire X
autour de son espérance mathématique (moyenne) E(X) (ou F). Sa formule est :
6 7 = E[(9 − F)7 ] = E(X²) - [E(X)]²
2. Définition de la corrélation
Corrélation. – Elle représente une co-relation. C’est une dépendance réciproque de deux
phénomènes qui varient conjointement. Elle correspond au degré de liaison de deux variables
aléatoires X et Y.
3. Différentes notions
§ La corrélation entre le cancer du poumon et le tabagisme met en jeu deux variables
aléatoires qualitatives.
§ Celle entre le poids à la naissance et le sexe met en jeu une variable aléatoire quantitative
et une qualitative.
§ Celle entre le poids et la taille à la naissance met en jeu deux variables aléatoires
quantitatives (cette dernière situation est l’objet de ce cours).
Remarque. – La corrélation entre des mesures faites avec deux appareils différents implique une
concordance entre les deux méthodes.
Exemple Ù Âge gestationnel et poids à la naissance
B. Quantification de la relation
1. Définition de la covariance
Soit un couple de variables aléatoires quantitatives X et Y. Nous notons leur moyenne respective
E(X) = FÊ et E(Y) = F: et leur variance respective 6²Ê et 6²: . Nous pouvons ainsi écrire :
2. Propriétés
§ ?¢<(9, ∑) = ?¢<(∑, 9)
§ ?¢<(?∑, 9) = ? ?¢<(∑, 9) = ? ?¢<(9, ∑), ? étant une constante.
§ ?¢<(9, 9) = 6Ê,Ê = 6 7Ê
§ <=> (9 + ∑) = <=>(9) + <=>(∑) + 2 ?¢<(9, ∑)
§ X et Y indépendantes implique Æ ø(9∑) = ø(9)ø(∑)
Variances et covariance
m˛ Z m! Z m9 Z mˇ Z j`
F¨Y = = 38
¥
C. Coefficient de corrélation
1. Coefficient de corrélation de Pearson
Nous le notons BÊ,: et le calculons avec la formule suivante :
C>,?
BÊ,: =
C> C?
Dr( DE(
=k( J( {
>Ê,: = Á
Ä
Dr( (DE( )²
(=k Ä ( { ) × (=J Ä ( { )
Á Á
Propriétés :
§ -1 ≤ BÊ,: ≤ 1
§ BÊ,: = B:,Ê
§ Le signe de BÊ,: est le signe de 6Ê,:
§ Ce coefficient n’a pas d’unité
§ Si X et Y indépendantes alors BÊ,: = 0
Cas particulier. – Si X et Y ∼ N alors BÊ,: = 0 donc cela implique que X et Y sont indépendantes.
Hypothèses
§ ( X,Y ) ∼ Ì7
G{H G I{G²
Sous ˚` , t = = ∼ U'{722/ avec 6²H estimé par u²H = .
C²H '{7
C²I
« ’JE
t= → g’{Eee≈,"
ô{«²
0.99× 5 − 2
U = = 12.16
1 − 0.99²
Avec 3 ddl, le seuil de rejet de H0 est égal à 3,18 pour un risque consenti ¯ = 5 %. Or U =
12,16 et 12,16 > 3,18 ; nous rejetons donc l’hypothèse nulle et nous concluons à une dépendance
entre l’âge gestationnel et le poids à la naissance. Attention aux conditions de validité et à la
robustesse du test !
Statistique de test :
II. Régression
A. Introduction
B. Régression linéaire
1. Définition
Régression linéaire simple. – On considère deux variables aléatoires X et Y. L’une est à expliquer,
c’est la variable dépendante Y, l’autre est explicative, c’est la variable indépendante X. La droite
décrivant les variations de Y en fonction de X correspond à la droite de régression de Y en X. Le
diagramme de dispersion, ou la courbe empirique de régression, ont une forme générale
approximativement linéaire. En effet, la droite de régression linéaire est la droite qui s’ajuste le
mieux aux données.
2. Équation
Principe :
§ Y = f(X) + P
§ Y = $` + $I .X + P
§ H% = _` + _I .4% + @% Où _` estime $` et _I estime $I
§ @% ∼ Ì iid
§ @% = H% - (_` + _I .4% )
Ainsi :
Résolution
→ (H% − Y) = _I .(4% − X)
Remarques :
§ La droite passe par le point moyen (9,∑).
§ _` représente la valeur moyenne de Y quand X est centré sur sa moyenne.
§ _I correspond à la variation moyenne de Y par unité d’augmentation de X. En l’absence
de relation entre X et Y, _I = 0.
§ @% correspond à l’erreur commise en résumant H% par la valeur prédite par le modèle H%
en 4% .
C. Relation Régression-Corrélation
1. Coefficients de régression et de corrélation
C>,? C>
_I = Æ >Ê,: = _I
C²> C?
2. Informations
L’information est apportée par X pour expliquer Y. L’objectif d’un modèle est d’expliquer au
maximum les données observées Y à partir de X. Les valeurs de Y représentent une quantité
d’informations que nous cherchons à expliquer à l’aide de X.
§ Si Y ne dépend pas de X alors _I = 0, Y = _` = Y, la droite de régression est horizontale et
X n’explique rien de Y.
§ Si Y dépend parfaitement linéairement de X, les points Y s’alignent parfaitement sur la
droite, idéalement tous les @% =0 ∀*, X explique tout, nous pouvons prédire Y sans erreur.
3. Quantification de l’information
Nous allons décomposer l’équation.
§ Soit uAøÅ = uAø + uAøN avec SCE = Somme des Carrés des Écarts
4. Coefficient de détermination
= +
5. Tests
La relation entre Y et X est-elle significative ?
§ Soient ˚` : $I = 0 ˚I : $I ≠ 0
⇒ t=
[ {`
C O
∼ U'{722/ , 6[ estimé par
Nous prenons en compte la validité de la droite de régression. Si la relation est linéaire, les résidus
@% ne contiennent plus d’information structurée ⇒ exploration des résidus.
§ Normalité des résidus : les tests sont relatifs à l’hypothèse @% ∼ Ì**) : Kolmogorov-
Smirnov, Shapiro-Wilks… Ils sont peu puissants, c’est une procédure empirique qui utilise
les graphiques. La droite de Henry correspond à l’opposition des quantiles théoriques de
la loi normale versus les quantiles de la distribution des résidus estimée sur les données.
U(31%/ 7``22/,¥% = 1.97 < U(31%/ I˛922/,¥% < U(31%/ I7`22/,¥% = 1.98
U > 1.98 > U(31%/ I˛922/,¥% . Au risque 5 %, nous rejetons donc H0. Le poids à la naissance
dépend de l’âge gestationnel.
6. Analyse de variance
ÓQ
Test F : F= ∼ ∞(I,A{7)22/
ÓR
III. L’essentiel
À RETENIR
§ Régression linéaire ≡ ANOVA. Test des paramètres de régression, examen des résidus.
À COMPRENDRE
Analyse de la survie
Rédigé à partir du cours du Pr ROY
I. Introduction
L’analyse de la survie s’inscrit dans un contexte médical : nous allons quantifier la probabilité de
décès, de rechute ou de survie, évaluer des facteurs pronostiques et comparer des traitements.
Le risque (ou probabilité) de décès d’un individu est de toute façon égal à un ! Ainsi, la probabilité
de décéder estimée sur une cohorte n’a de sens qu’à délai fixé. La variable d’intérêt est la variable
aléatoire T, que constitue la durée qui sépare le diagnostic de la mort (ou de la rechute). C’est cette
variable dont nous étudions la distribution.
Nous allons nous intéresser au temps entre une origine et un évènement, par exemple :
Censure
L’observation est censurée (à droite) si nous savons seulement que T > t, date à laquelle
l’observation s’est achevée :
§ l’événement est le décès (= mortalité globale, donc toute cause) et le sujet est en vie à la
fin de l’étude.
§ l’événement est le décès par cancer (donc mortalité spécifique) et l’observation s’achève
par un accident (cause de mortalité différente, nous ne pouvons donc pas conclure sur le
délai de mort par cancer).
Voilà des données fictives si tous les sujets tombaient malade au même moment :
(B) : Date de point, nous ne disposons pas de la durée de survie pour II et VIII, les données sont censurées
à droite, ils sont toujours vivant à la date de point. II et VIII constituent des exclus vivants.
(A) : Date de point, nous connaissons tous les temps de survie du groupe.
Le IX est perdu de vue, il biaise l’information, il manque une information : nous ne connaissons
pas son statut à la date de point, nous ne savons pas s'il est mort ou vivant. Ce type de biais est à éviter
absolument.
Pour pouvoir plus facilement analyser, nous allons ramener tous les sujets à la même date
d’origine, nous allons changer l’échelle. L’abscisse représente alors le temps de participation à l’étude.
En résumé, certains sujets ne sont pas suivis jusqu’à ce que l’événement se produise, pour eux
nous savons seulement que T > ti. L’observation correspondante est une observation censurée. Les
données de survie sont donc constituées de deux informations, la durée du suivi T, et l’indicateur
d’événement S : S = 1 si l ’observation se termine par un décès, S = 0 si le sujet est vivant à la fin des
dernières nouvelles.
Définitions
§ Risque de décès : probabilité d’être décédé à la date t = fonction de répartition de la
variable } = v(U) = ë>(} ≤ U) : probabilité que le décès survienne avant t ou à l’instant t.
§ Survie : probabilité d’être en vie à la date U = u(U) = ë>(} > U) = 1 − v(U) (pour
une distribution continue).
Nous pouvons alors faire une fonction de répartition empirique (qui aura une forme
caractéristique des variables aléatoires discrètes) :
La survie est une courbe empirique, c’est-à-dire construite à partir de valeurs. La survie est le
complément à 1 du risque (ces courbes sont valables en absence de censure).
Attention. – La loi Normale décrit mal la survie, nous ne pouvons donc pas donc pas faire
d’approximation par la loi Normale !
Données incomplètes
Nous avons des données incomplètes lorsque certains sujets ne sont pas suivis jusqu’à ce que
l’évènement se produise :
§ pour eux, nous savons seulement que T > g‹ ;
§ g‹ est une observation censurée (exclu vivant).
‘ g‹ = ô − ‹ ’ Ω
ô ô ô
‘ g‹ = ô − ∗ ô− ∗… ô−
’Ω ’Ω − ô ’Ω − ‹ + ô
Uô UE U‹
‘ g‹ = ô − ∗ ô− ∗… ô−
’Ω ’Ω − ô ’Ω − ‹ + ô
§ en cas de censure, l’erreur type est plus élevée que celle ci, nous allons utiliser les
variances de Greenwood.
Exemple :
Lorsque nous avons une égalité entre ev et mort, le décès passe avant la censure dans la méthode
de Kaplan-Meier.
uXm = (1 − ⅛) × (1 − 1/7) × (1 − ⅙) × 1 × (1 − ¼) × (1 − ⅓)
uXm = ⅞ × 6/7 × ⅚ × 1 × ¾ × 2/3
uXm = ⅝ × 1 × 2/4
uXm = 5/16
Nous pouvons voir entre Sj3 et Sj4 que la censure ne modifie pas l’estimation de la survie à un
même temps.
Mais cette troisième option ne compare la situation dans deux groupes qu’à un délai donné. Or
nous souhaitons comparer les distributions de durées de survie, la spécificité des données de survie
suggère alors l’utilisation de méthodes non paramétriques.
C. Test du Log-Rank
Généralisation des tests de rang aux données censurées : les rangs des observations triées
globalement se distribuent-ils au hasard entre les deux groupes ?
§ Le test du “log-rank” est le test efficace contre l’alternative de taux proportionnels dans
les deux groupes.
§ C’est formellement le principe du test de Mantel-Haenszel-Cochran.
§ Calculer pour chaque date de décès le nombre attendu de décès qui serait observé si les
taux de décès étaient les mêmes dans les (deux) groupes.
§ Cumuler les différences entre observés et attendus jusqu’à la date du dernier décès
observé.
Il faut noter que ce test du Log-Rank ne prend en compte que les rangs d’apparition des décès
non la date.
Sous l’hypothèse nulle H0, les d+i décès se distribuent proportionnellement aux effectifs, le
nombre attendu dans le groupe 2 est donc :
Remarque. – wi est le poids, il permet de donner plus d’importance aux différences de survie
précoces qu’aux différences de survie tardives.
Si k est grand ou si les marges de chaque tableau sont grandes, U suit une loi
asymptomatiquement normale. Sous H0, le test s’écrit :
La formule approchée du logrank ci-dessous est conservative (c’est-à-dire qu’elle est plus petite
que le log rank, donc si nous rejetons la formule approchée, nous rejetons forcément la formule du log
rank).
Exemple :
§ Comparaison de plus de deux groupes : la table 2 x 2 est remplacée par une table 2 x k. La
variance par une matrice de covariance. Le test est à k-1 ddl.
§ Contrôle pour des facteurs de confusion : nous stratifions les données selon les valeurs
des variables à contrôler. Nous calculons les observés, les attendus et les variances dans
chaque strate. Nous cumulons les résultats pour construire le test (les attendus sont
calculés à “facteurs de confusion constants”).
Conclusion : nous disposons de nombreux outils pour estimer la distribution de durée de survie
éventuellement censurée. Il existe également des tests de comparaison de distributions, mais nous
aimerions avoir des modèles de régression pour gérer simultanément plusieurs co-variables.
\(t) a une unité : T-1 ! C’est une probabilité conditionnelle dérivée par rapport au temps.
Le taux de décès n’est pas une probabilité en particulier il est éventuellement > 1. \ est le taux
instantané de mortalité.
Relation entre R, S, ÿ :
Lorsque \(t) est constant (= \) la survie est dite exponentielle : ‘ g = @ {◊g . C’est le modèle le
plus simple, c’est le modèle de survie paramétrique.
Dans le premier cas, \ ne varie pas au cours du temps (c’est une constante), nous allons regarder
l’aire sous la courbe, l’intégrale, le taux cumulé. C’est le modèle de survie exponentielle.
Ici, \ est constant par intervalle de temps, c’est un modèle acceptable, nous avons alors un
modèle de survie exponentielle par intervalle.
Les données sont ici parfaitement décrites par une distribution exponentielle ayant la même
moyenne que les données ci-dessus. La distribution exponentielle de moyenne 1/\ est le plus simple
des modèles de survie paramétrique avec :
S(t) = exp(-ÿt)
R(t) = 1-exp(-ÿt)
Le paramètre \ est le taux de mortalité, ou nombre de décès par unité de temps, estimé par
5` / (WU% ) (= 1/moyenne détail pratique !). Les données étant complètes, nous avons en effet observé
n0 décès pour une durée totale d’observation de ces sujets égale à (Wti). Cette quantité s’exprime en
personnes-années d’observation : années d’observation accumulées par l’ensemble des personnes
étudiées.
La fonction de répartition exponentielle qui s’ajuste le mieux aux données est la fonction :
1 − @4ü (−1/2.994 × U) où 2,994 est la moyenne des temps de survie des données.
Modèle paramétrique
Nous allons définir \(t) à l’aide d’une fonction connues aux paramètres près :
Nota Bene. – Pour le modèle de Weibull, quand b = 1, nous retrouvons le modèle exponentiel.
Modèle à deux paramètres. Le modèle exponentiel correspond au cas où b=1. Si γ >1, le taux est
une fonction croissante du temps. Si γ <1, le taux est une fonction décroissante du temps. Le taux
instantané est une puissance du temps.
Nous comptons le nombre de personnes ni-1 exposées au risque de décès en ti-1 pour chaque i.
Nous estimons :
§ le taux de décès ÿi dans chaque intervalle,
§ la probabilité conditionnelle »‹ = chœ −ÿ‹ g‹ − g‹−ô de survivre en ti si on était
vivant en ti-1.
(u% = exp (−\ ∗ §=>T@î> *5U@><=§§@ )@ U@£üì), dans l’intervalle nous avons un modèle de
survie exponentiel)
La survie en ti peut ainsi être calculée comme le produit de la survie dans des intervalles
successifs :
u(U) = ìI × ì7 × . . . . . ì%
Exemple estimation de ÿ :
\ est constant dans l’intervalle, nous avons quatre sujets décédés et deux censures, ici nous avons
une estimation car nous avons des données incomplètes à cause de censures ! Il faut bien diviser par
le temps de participation de tous les participants même les censures !!!!
e‹
«e =
’‹{ô
e‹
ÿe =
e‹
’‹{ô ∗ ∆g‹ − ∗ ∆g‹
E
Remarque. – Nous remarquons que nous retirons la moitié aux décès, nous faisons l’hypothèse
que les décès se sont produits à la moitié du temps (=moyenne). ri = probabilité de décéder en
“première intention”.
§ en cas de censures ci ≠ 0 :
e‹
«e = …‹
’‹{ô −
E
e‹
ÿe =
…‹ e
’‹{ô − ∗ ∆g‹ − ‹ ∗ ∆g‹
E E
»e = ô − «e
Nous supposons ici également que les décès et les censures interviennent au milieu de l’intervalle.
Exemple :
Le modèle de Cox est un modèle à taux proportionnels dans lequel la forme analytique du taux
n’est pas spécifiée. \0(t) est estimé à partir de données mais pas de paramètres.
Le modèle s ’écrit \(U, „) = \(U, 0)@4ü($„), la fonction \(U, 0) est le taux de base (inconnu),
z un vecteur de covariable (mesurée), # un vecteur de paramètre (à estimer) (= influence du ttt sur
la survie et le décès : nouveau paramètre que nous allons estimer).
¯ i = e$ i est le taux relatif des sujets pour lesquels zi = 1 par rapport à ceux pour lesquels zi = 0,
toutes choses égales par ailleurs.
§ le modèle est :
- \(U, „) = \(U, 0)@4ü($„) ; z = 1 pour le nouveau traitement et z = 0 pour le traitement
standard,
- ¯ = @4ü($) est le taux relatif de rechute dans le groupe 6-MP comparé au groupe
placebo,
- le taux de rechute dans le groupe traitement est \(U, 0).
Survie ajustée
0.400.2742 = 0,78
0.200.2742 = 0,64
Ceci nous permet d’avoir une survie à taux proportionnels, nous passons d’une courbe à l’autre
de survie grâce à ¯.
Ci-dessous sont résumées les formules utiles lorsqu’on compare deux groupes (1 et 0) dans un
modèle à taux proportionnels :
\I U = ¯ ∗ \` U
uI U = u` (U)˙
Essais cliniques
Rédigé à partir du cours du Dr MAUCORT-BOULCH
I. Introduction
A. Historique
§ 980-1087. – Avicenne, dans son ouvrage le Canon de la Médecine, décrit les sept règles
d’évaluation de l’effet d’une drogue sur une maladie.
§ 1747. – James Lind soumet 6 groupes de marins atteints de scorbut à des traitements différents.
§ 1948. – Sir Bradford Hill (statisticien) travaille sur la streptomycine et la tuberculose pulmonaire.
B. Définitions
Essai clinique. – Expérimentation planifiée dessinée pour identifier l’intervention appropriée à de
futurs patients présentant une condition médicale donnée, et dans laquelle les résultats d’un
groupe de patients traités par l’intervention évaluée sont comparés à ceux d’un groupe de patients
traités par une intervention contrôle, les deux groupes étant inclus, traités et suivis durant la même
période de temps.
C. Démarche
Lors d’un essai clinique, il y a une démarche précise à respecter. L’objectif de l’essai est de
comparer un effet dans différents groupes d’intervention. Pour cela, il faut un contexte scientifique.
Une question est posée pour dégager une étude avec un schéma adapté à la question. Des tests
d’hypothèses visant à comparer les grandeurs évaluées dans les deux bras d’étude vont être mis en
place. La comparaison de deux interventions se réalise toujours en présence d’un groupe référent,
groupe « contrôle ». Il est nécessaire que le résultat soit imputable à la seule intervention, il ne faut
pas que les fluctuations d’échantillonnage faussent les résultats. Par la suite une analyse statistique,
une interprétation et une conclusion sont nécessaires. La communication des conclusions de l’étude
est primordiale.
D. Principaux acteurs
§ Investigateur : c’est le médecin surveillant la réalisation de l’étude. Le médecin responsable
de l’étude est l’investigateur principal. L’investigateur coordinateur coordonne la réalisation
de l’essai dans les essais multicentriques.
§ Promoteur : c’est une personne physique ou morale prenant l’initiative de la réalisation d’une
étude.
II. Protocole
A. Questions posées
1. Question clinique
La pertinence de la question clinique est déterminée par une revue exhaustive de la littérature
scientifique (rapports de cas, séries de cas, études observationnelles, essais contrôlés randomisés
validés ou non, méta-analyse). La confirmation d’un résultat d’un essai antérieur est possible en
enlevant au maximum les biais possibles ou la réalisation d’un essai innovant est nécessaire si aucune
étude n’a été faite.
Cette question va conditionner le schéma d’étude, le plan expérimental qui est consigné dans un
protocole.
Exemples de questions :
§ Est-ce que la fibrinolyse pré-hospitalière est meilleure que l’angioplastie primaire dans la
prise en charge de l’infarctus du myocarde en phase aiguë (étude CAPTIM) ?
2. Critères de jugement
Il faut un unique critère de jugement principal possédant une pertinence clinique. Il est défini
précisément, sans ambiguïté.
Son évaluation doit être facile, fiable (préalablement évaluée), nous allons devoir assurer la
formation des cliniciens. Le critère de jugement porte le résultat du test et sera à l’origine de la
conclusion sur le traitement testé.
§ Décès, ré-infarctus non fatal, accident vasculaire cérébral non fatal à 30 jours : Critère
composite : si le patient présente un de ces trois critères, il est en situation d’échec
§ Décès, paralysie cérébrale, retard mental (score <85 sur l’échelle de Bayley), surdité ou
cécité à un âge corrigé de 18 à 21 mois : critère composite
Phase Détails
Nous allons déterminer la dose optimale et réaliser une étude des effets
secondaires. L'identification de la population de patients pouvant bénéficier
Phase II
du traitement est réalisée durant cette phase. Les études sont de taille
modérée, de 100 à 200 participants.
Elle est réalisée après l'obtention de l'AMM (elle est post-AMM). C'est la
Phase IV phase de pharmacovigilance, où nous recherchons les effets secondaires
rares, les complications tardives.
C. Échantillon
1. Pourquoi réaliser une randomisation ?
Lors d’un essai comparatif, le but est de démontrer soit l’efficacité d’un nouveau traitement soit
sa supériorité par rapport à un traitement de référence. On souhaite que le résultat soit imputable à
la seule intervention c’est-à-dire que le résultat ne soit pas dû aux fluctuations d’échantillonnage.
Seul le traitement doit différencier les deux groupes inclus dans l’essai. Pour que cela soit possible, il
faut une distribution au hasard des caractéristiques (observables ou non) dans les groupes comparés.
Si l’intervenant choisit de manière volontaire l’allocation du patient à l’un des deux bras de
traitement cela peut entraîner des biais. C’est pourquoi l’ambivalence des investigateurs et des
patients est nécessaire.
Des tests d’hypothèse avec H0 d’absence de différence entre les groupes sont utilisés.
Le hasard peut introduire des déséquilibres, en particulier lorsque n n’est pas très grand. Ceci
pose problème si le déséquilibre touche un facteur de confusion. Pour rétablir une comparaison, il faut
un équilibre entre les bras au sein de chaque catégorie d’un facteur de confusion.
2. Principes de la randomisation
Nous pouvons utiliser une table de nombre au hasard (voir exemple ci-dessous). La liste est
établie avant le début de l’essai. L’équilibre des effectifs entre les groupes est nécessaire. L’allocation
du bras se réalise après vérification de la possible inclusion du patient.
Une procédure centralisée est préférable. Les investigateurs contactent le centre en charge de la
randomisation pour chaque nouveau patient à inclure (téléphone, fax, internet).
§ Création d’une table de nombre aléatoire (entre 0 et 99 ici). Chaque nombre possède la
même probabilité d’être tiré au sort.
§ Choix d’un sens de lecture (par exemple, de gauche à droite et de haut en bas).
§ Définition d’une règle a priori relative à la table : les nombres entre 0 et 49 alloueront le
patient au bras A et les nombres entre 50 et 99 alloueront le patient au bras B.
La séquence est donc ici BABBBBABABABBAAABAAA. L’équilibre est, en moyenne, respecté entre
les deux bras. C’est-à-dire que le premier patient sera attribué au bras B, le second au bras A, le
troisième au bras B et ainsi de suite.
§ Randomisation par bloc : elle consiste en un tirage de nombres aléatoires par un bloc
puis en l’ordonnancement des blocs. Si nous utilisons la stratification en parallèle, nous
allons randomiser par bloc en plus au sein de chaque strate. Il faut un équilibre au niveau
des effectifs entre les bras tous les m sujets inclus. Des blocs de 4 seront donc de la forme
AABB, BBAA, ABAB, BABA, ABBA, BAAB.
3. L’insu
L’insu correspond à l’aveugle. L’évaluation du critère de jugement principal en aveugle permet
d’éviter les biais d’information. L’insu évite les comportements différents des patients et des
médecins. En effet l’insu correspond à la non connaissance par le patient ou le médecin du traitement
reçu, ils ne savent si c’est le bras A ou le bras B qui reçoit le traitement ou le placebo.
§ Double aveugle : patients et médecins ignorent le traitement reçu.
§ Simple aveugle : seuls les patients ignorent le traitement reçu.
Ainsi, nous allons pouvoir conserver la comparabilité des groupes jusqu’au bout de l’essai.
Une attention particulière doit être apportée aux traitements (forme galénique, goût…), il ne faut pas
que le placebo soit reconnaissable.
Ce n’est pas toujours possible et justifié d’avoir un essai avec insu, lors de traitements
chirurgicaux, de traitements avec des effets secondaires caractéristiques, des essais en cancérologie
(nous ne pouvons pas mettre un placebo en cancérologie par exemple). Si l’insu est impossible,
maintien de la comparabilité des groupes par réajustement des traitements selon des procédures
standardisées.
Remarque. – Dans le plan factoriel, le patient reçoit une combinaison des 2 traitements, on peut
tester s’il y a une synergie ou un antagonisme entre les deux molécules.
Il faut choisir soit un placebo (substance inerte sur le plan pharmacologique), soit un traitement
de référence. Nous utilisons généralement un placebo en l’absence de traitement de référence
recommandé, il y a bien-sûr des exceptions en cancérologie, par exemple, où nous ne donnons pas de
placebo lorsqu’un traitement existe déjà.
La définition précise des interventions pour une standardisation, en particulier dans les essais
multicentriques est une étape indispensable. Par exemple, pour les traitements, nous allons définir :
la molécule, la forme galénique, la durée du traitement, la posologie, les horaires de prise, le mode de
conservation.
Lors du choix du groupe contrôle, nous pouvons utiliser un groupe historique ou un groupe
contemporain. Lors de l’utilisation d’un groupe historique, certains points peuvent fausser les résultats
de l’étude. Les patients d’une époque ne sont pas comparables à ceux d’une autre époque, il y a une
évolution dans le temps des modes de prise en charge d’une maladie, de la maladie elle-même. De
nombreux facteurs autres que le traitement lui-même peuvent venir fausser son évaluation. Le groupe
contemporain évite les biais liés aux différences de recrutement dans le temps.
D. Population de l’étude
Deux notions sont à distinguer lors d'un essai clinique : la population et l'échantillon. Nous
cherchons à améliorer la prise en charge thérapeutique d'une population, c'est la population cible.
Une étude exhaustive est impossible étant donné qu'il est impensable de faire l'essai sur l'ensemble
de la population. C'est pourquoi nous allons réaliser l'essai sur une partie seulement de la population :
c'est l'échantillon. L'échantillon est tiré d'une population source.
L’objectif d’un essai est à l’échelle d’une population. Pour cela nous allons utiliser l’inférence.
L’inférence permet que les résultats observés soient vrais pour la population dont est issu l’échantillon
(population source). L’extrapolation des résultats à la population pour laquelle nous souhaitons au
final appliquer le traitement (population cible) est nécessaire. Il faut que l’échantillon soit représentatif
de la population source.
Il existe des critères d’éligibilité pour inclure ou exclure certains patients de l’essai clinique :
E. Taille de l’étude
La question clinique doit être traduite en une question statistique. Pour comparer une grandeur
estimée, la réalisation d’un test statistique est nécessaire.
§ Hypothèse alternative H1, différence minimale critique : il est nécessaire de définir une
hypothèse H1 précise correspondant à la différence minimale que l’on s’attend à
observer. Nous allons utiliser des informations dans la littérature pour déterminer H1. Il
faut par la même occasion une définition d’un risque $ ou d’une puissance (1 - $).
§ Risques consentis
- ¯ = Pr(∣Z∣ ≥ seuil ∣ H0 vraie) choisi a priori ¹ degré de signification p = Pr(∣Z∣ > ∣z0∣),
- $ = Pr (∣Z∣ < seuil ∣ H0 fausse).
Réalité
H0 vraie H0 fausse
Décision
H0 rejetée α 1-β
Différence d’efficacité minimale cliniquement pertinente S. C’est pour cette différence que nous
fixons un risque $.
D’où
Bilan
Autrement dit, on doit augmenter le nombre de sujets lorsqu’on veut peu de risque de se tromper
(α et β faibles), ou lorsqu’on souhaite mettre en évidence un faible écart entre les deux groupes (σ
important et δ faible).
B. Analyse statistique
1. Données manquantes
Les données manquantes sont à envisager dès le protocole.
Nous observons des perdus de vue " manque le critère de jugement principal pour certains
participants :
§ des perdus de vue indépendamment de l’essai, c’est-à-dire pour des motifs identiques
dans les deux bras " biais de sélection non différentiel (perte de puissance),
§ des perdus de vue pour une raison liée au traitement " biais de sélection différentiel
(sus ou sous-estimation de l’effet traitement).
Il existe des méthodes statistiques pour prendre en compte les données manquantes.
Par exemple, nous pouvons utiliser la méthode du biais maximum pour les critères de jugement
dichotomiques. Il faut remplacer les critères de jugement manquants par des succès dans un groupe,
des échecs dans l’autre et analyser puis inversement. Si les conclusions sont concordantes, alors nous
pouvons conclure.
Il n’y a aucune exclusion a posteriori. Ceci permet d’assurer le maintien de la comparabilité des
groupes.
Il peut exister un biais d’attrition ce qui entraîne une non comparabilité des groupes au moment
du recueil du critère de jugement principal. L’exclusion des patients qui n’ont pas commencé le
traitement pour une raison indépendante du bras de randomisation entraîne une analyse en intention
de traiter modifiée. L’exclusion de l’analyse des patients pour lesquels le protocole initial n’est pas
totalement respecté constitue une analyse per-protocole.
3. Analyses statistiques
Les analyses statistiques sont des analyses intermédiaires prévues dès le protocole. Beaucoup
de paramètres sont à prendre en compte : « Flow chart », la description des caractéristiques globales
et par les bras, les données manquantes. Nous allons étudier le risque relatif, la différence de risque,
les taux relatifs (critère de survie) et surtout les intervalles de confiance.
IV. Réglementation
Il existe de nombreuses lois concernant l’expérimentation humaine en se basant sur les principes
de la Déclaration Universelle des Droits de l’Homme (ONU 1978) : liberté, sécurité, égalité, dignité
humaine.
§ Loi du 20 décembre 1988. – ‘relative à la protection des personnes qui se prêtent à des
recherches biomédicales’ (Loi Huriet-Serusclat).
§ Transposition de la directive européenne 2001/20. – Loi relative à la politique de santé
publique du 9 août 2004.
Il existe un Comité de Protection des Personnes (CPP) pour surveiller l’intérêt des patients inclus
dans les essais cliniques.
V. L’essentiel
À RETENIR
Quatre principes :
– Comparatif
– Contrôlé
– Randomisé
– En aveugle
L’hypothèse H1 du calcul du nombre de sujets n’est pas l’hypothèse alternative du test réalisé,
elle n’est pas l’hypothèse en faveur de laquelle se fait la conclusion.
À COMPRENDRE
Il y a une interaction forte entre les différents acteurs (investigateurs et biostatisticien). Tout est
consigné dans un protocole. Le protocole et le déroulement conditionnent les conclusions.
I. Introduction
L’épidémiologie est une étude de type observationnelle. Il existe deux schémas d’étude :
§ L'épidémiologie descriptive,
§ L'épidémiologie analytique.
L’épidémiologie descriptive possède pour objectif de décrire la fréquence des maladies dans
différentes populations et au cours du temps. Il s’agit par exemple de décrire l’hétérogénéité de la
fréquence des cancers selon la zone géographique ou l’évolution de la fréquence avec le temps. Ces
études permettent de soulever des hypothèses sur les facteurs associés au risque de cancer.
Les études d’épidémiologie analytique ont pour objectif de quantifier l’association entre des
facteurs d’exposition et le risque de développer une maladie donnée. Il s’agit par exemple de quantifier
le lien entre l’exposition à l’amiante et le risque de cancer du poumon.
Contrairement aux études expérimentales dont l’exemple le plus classique est l’essai clinique
randomisé, dans les études observationnelles il n’y a pas d’intervention. Nous observons par exemple
des sujets qui sont exposés ou non à un facteur que nous pensons être associé à une augmentation du
risque de développer une maladie. L’investigateur ne contrôle pas l’exposition au facteur de risque.
Si nous nous plaçons sur une échelle de temps, une étude transversale consiste à faire une coupe
à un moment donné et à mesurer la fréquence de la maladie sur cette coupe. Il s’agit d’une
photographie de la population à un moment donné. Dans une étude transversale, il n’y a pas de suivi
des sujets. Nous les observons à un moment donné et ils ont ou ils n’ont pas la maladie.
Une étude transversale est réalisée un jour donné dans tous les hôpitaux en France, ceci permet
une mesure de la prévalence des infections nosocomiales par exemple. Ce type d’étude est réalisé
tous les 5 ans environ. L’évolution de la prévalence est un indicateur de l’efficacité de la lutte
contre les infections nosocomiales.
Les études qui vont permettre de mesurer la vitesse d’apparition de la maladie dans une
population sont les études de cohorte. La différence principale entre une étude transversale et une
étude de cohorte porte sur le suivi des sujets qui vont participer à l’étude.
Dans une étude de cohorte, que l’on appelle également étude longitudinale, les sujets n’ont pas
la maladie étudiée au moment de leur entrée dans la cohorte. Ils vont être suivis un temps plus ou
moins long et on recueille l’apparition ou non de la maladie au cours du suivi.
Il existe un suivi des habitants de la ville de Framingham (Massachusetts, Etats-Unis). Cette étude
a commencé en 1948, la première cohorte de Framingham était constituée de 5209 hommes et
femmes âgés de 30 à 62 ans qui n’avaient pas d’antécédent d’infarctus du myocarde ou d’accident
vasculaire cérébral et pas de symptômes de maladie cardiovasculaire au moment de l’inclusion.
On a observé au cours du temps l’apparition des événements cardio-vasculaires au niveau de cette
population. Elle a contribué à la connaissance des facteurs de risque des maladies cardio-
vasculaires.
Exemple.
Estimation de la prévalence des infections nosocomiales dans les hôpitaux français en 1996. On
réalise une étude transversale à un jour donné. L’étude se réalise au sein d’un échantillon de
46 000 patients hospitalisés, on note 3370 patients avec une infection nosocomiale.
On suppose que l’échantillon constitué un jour donné est représentatif de la population des
patients hospitalisés au cours de l’année 1996. On se sert de la valeur calculée sur l’échantillon de
l’étude pour parler de la prévalence des infections nosocomiales dans les hôpitaux français en
1996. Il s’agit d’un exemple d’inférence statistique.
3370
ë= = 7,3%
46000
On utilise une approximation de la distribution de la prévalence par une distribution normale.
0,073× 1 − 0,073
Ì(0,073; )
46 000
0,073× 1 − 0,073
tAˇ¥% = 0,073 ± 1,96
46 000
L’intervalle de confiance à 95 % est 7,1 % ; 7,5 % . Avec une précision de l’estimation à 0,2 %.
C’est-à-dire que la prévalence des infections nosocomiales dans les hôpitaux français en 1996 a
95 % de chances d’être comprise entre 7,1 % et 7,5 %.
On utilise l’intervalle de confiance pour déduire l’intervalle dans lequel il est le plus probable de
trouver la prévalence d’après son estimation.
Il ne faut pas oublier de vérifier les conditions d’approximation par la distribution normale !
C’est la première chose à faire, ça peut vous éviter de faire des calculs si jamais on est hors
conditions.
Conditions a priori :
§ 5 = 46 000 ≥ 30
Conditions a posteriori :
§ 46 000×0,071 ≥ 5
§ 46 000×(1 − 0,071) ≥ 5
§ 46 000×0,073 ≥ 5
§ 46 000×(1 − 0,073) ≥ 5
Exemple
Estimation du taux d’incidence d’une maladie
Nous pouvons estimer le taux d’incidence en se basant sur l’observation d’un groupe d’individus.
Pour cela, nous supposons que :
§ Tous les individus ont le même taux (on se base sur l’observation d’un groupe d’individus)
§ Le taux est constant sur la période (on se base sur l’observation d’une période de suivi)
Sous ces hypothèses, les individus et les unités de temps sont interchangeables. Ainsi, le suivi de
10 personnes pendant 1 demi-année est équivalent à suivre 5 personnes pendant 2 demi-années, soit
un an.
Dans l'exemple précédent, le nombre d'années est 18. Donc 2 / 18 = 0,11 par personne-année.
L’estimation du taux d’incidence de la maladie est de 11 nouveaux cas pour 100 personnes-année.
Nous pouvons aussi utiliser cette formule suivante pour estimer le taux d’incidence :
5¢£_>@ )′é<é5@£@5Uì
5¢£_>@ ) L î5*Ué )@ U@£üì
\=
k¢5Tî@î> ) L î5*Ué )@ U@£üì
\
<=> \ =
5¢£_>@ )@ ü@>ì¢55@ì − =55é@ì
C. Risque de la maladie
Le risque de la maladie correspond à l’incidence cumulée de la maladie jusqu’à un temps t.
v U = ü(} ≤ U)
Avec M le nombre de nouveaux cas sur la période de suivi ; et N le nombre de sujets à risque au
début de la période.
Exemple.
Estimation du risque de récidive d’une maladie. On se place dans une cohorte de 368 femmes
opérées d’un cancer du sein et suivies pendant 5 ans. On peut estimer le risque de récidive à 5 ans.
Tous les sujets ont eu la maladie.
130
>¥ ,'( = ≈ 35%
368
La durée du suivi est variable d’un individu à l’autre. Le taux d’incidence est constant sur la période
considérée.
La probabilité de développer la maladie avant le temps t = 1 - la probabilité de ne pas l’avoir
développée.
v U = 1 − @ {◊0
Études de cohorte
Nous constituons un groupe de sujets exposés au facteur de risque et un groupe non exposé, tous
les sujets sont initialement sains. Nous allons suivre les sujets dans le temps pour voir l’apparition ou
non de la maladie. Les sujets n’ont pas le critère de résultat au moment où ils rentrent dans l’étude.
Une étude de cohorte permet de mesurer l’incidence du critère de résultat.
La cohorte peut être reconstituée dans le passé : cohortes historiques. L’identification d’un
facteur de risque de survenue de la maladie est possible ainsi que des facteurs pronostiques.
Études cas-témoins
Nous constituons un groupe de sujets malades (les cas) et un groupe de sujets non malades (les
témoins). Nous recherchons l’exposition antérieur (la plupart du temps) des sujets à un facteur de
risque via un interrogatoire. L’identification d’un facteur de risque de survenue de la maladie est dans
ce type d’étude possible aussi.
Les avantages des études cas-témoins par rapport aux études de cohorte :
Les inconvénients des études cas-témoins par rapport aux études de cohorte :
§ Risque de biais plus important (biais de sélection des cas et des témoins, biais de mesure
du facteur étudié car l’exposition n’est pas mesurée en temps réel, biais de confusion).
Le facteur d’exposition est le facteur étudié, par exemple nous pouvons étudier la consommation
de tabac, d’alcool, l’exposition à l’amiante. La maladie est le critère de résultat, par exemple le cancer
du poumon, de l’œsophage, les maladies cardio-vasculaires. Les critères permettant d’identifier un
facteur de risque d’une maladie sont multiples.
§ Il faut mettre en évidence un sur-risque chez les exposés par rapport aux non-exposés.
A. Tableau de contingence
Pour les deux types d’études, il faut réaliser un tableau de contingence. (Etre capable de le faire
++)
Exposés a b a + b = m0
Non-exposés c d c + d = m1
TOTAL a + c = n0 b + d = n1 a+b+c+d=n
Dans une étude de cohorte, les calculs n’ont de sens que sur les lignes du tableau. Dans une étude
cas-témoins, les calculs n’ont de sens que sur les colonnes du tableau.
Il faut bien comprendre pourquoi ! Cela déterminera ce que vous pourrez calculer à partir de vos
données. Tout vient de la manière de sélectionner votre échantillon.
Par exemple ça n’a pas de sens de regarder une proportion d’exposés / non exposés dans une
étude de cohorte puisque c’est vous (l’investigateur de l’étude) qui décidez de combien vous en prenez
en exposés ou non…
(m‹ − Œ‹ )E
~oEô ee≈
Œ‹
Nous allons utiliser les valeurs du tableau de contingence. Oi représente les effectifs observés
(valeurs a, b, c et d) et Ei les effectifs attendus.
(5` ×£` )
Exposés ø= a + b = m0
5
Non exposés c + d = m1
TOTAL a + c = n0 b + d = n1 a+b+c+d=n
Deux possibilités :
§ oE < 3,84, nous ne rejetons pas H0 au risque " = fi% : l’association n’est pas
statistiquement significative au risque de 5%.
Risque relatif
v*ìÕî@ ?ℎ@„ §@ì @4ü¢ìéì ) L =<¢*> §= £=§=)*@
vv =
v*ìÕî@ ?ℎ@„ §@ì 5¢5 − @4ü¢ìéì ) L =<¢*> §= £=§=)*@
0
Soit, vv =
~ 0
=
£`
vv = ?
£I
Si le RR = 3,2 ; les exposés de l’échantillon ont 3,2 fois plus de risque de développer la maladie
que les non exposés.
Taux relatif
\I (U)
}v U =
\` (U)
Si le taux relatif est constant au cours de la période de suivi et que l’événement est rare ou la
durée d’observation courte, nous avons }v ≈ vv.
§ Si RR ou TR ou odds ratio > 1, le facteur est associé à une augmentation du risque d’être
malade.
§ Si RR ou TR ou odds ratio < 1, le facteur est associé à une diminution du risque d’être
malade.
2. Odds ratio
L’odds ratio ne se calcule pas de la même manière si nous nous plaçons dans une étude de
cohorte ou dans une étude cas-témoins.
_
Ò))ì ) L @4ü¢ì*U*¢50é-'%'( =
)
Odds de l’exposition chez les malades :
=
Ò))ì ) L @4ü¢ì*U*¢5),( =
?
L’odds ratio d’exposition correspond à :
Ò))ì ) L @4ü¢ì*U*¢5),(
Òv =
Ò))ì ) L @4ü¢ì*U*¢50é-'%'(
=
=×)
Òv = ? =
_ _×?
)
Selon le type d’étude, nous estimons soit l’OR de la maladie pour les études de cohorte soit l’OR
d’exposition pour les études cas-témoins. Cependant OR de la maladie = OR d’exposition.
Lorsque l’évènement d’intérêt est rare dans la population étudiée, l’odds ratio est proche du
risque relatif et il peut s’interpréter comme un risque relatif.
Alors que dans une étude de cas-témoins, il y a uniquement l’odds ratio d’exposition.
D. Exemples
1. Exemple d’une étude de cohorte
Nous constituons une cohorte de 368 femmes opérées pour un cancer du sein et suivies pendant
5 ans. L’objectif de l’étude est d’évaluer la valeur pronostique du type cytologique de la tumeur sur le
risque de récidive à 5 ans. Le facteur étudié est le type cytologique de la tumeur.
Type cytologique 3
96
>ÅJ.3 m = ≈ 48%
201
Type cytologique 1 ou 2
34
>ÅJ.3 I '1 7 = ≈ 20%
167
L’hypothèse à tester dans cette étude est que le risque de récidive des femmes qui avaient une
tumeur de type cytologique 3 est différent du risque de récidive des femmes qui avaient une tumeur
de type 1 ou 2, soit un test bilatéral.
Pour répondre, il faut utiliser un test du Chi-2. On calcule les effectifs attendus, ils sont entre
parenthèses dans le tableau.
=
£` 0,48
vv = ? = = 2,4
0,20
£I
Les femmes qui ont une tumeur de type 3 ont 2,4 fois plus de risque de récidiver à 5 ans que les
femmes ayant une tumeur de type 1 ou 2. Le risque relatif est estimé à 2,4. Nous pouvons aussi calculer
l’intervalle de confiance du risque relatif, dans cet exemple il est compris entre 1,8 et 3,3.
Pour réaliser les calculs, nous avons calculé le nombre de personnes-année de suivi :
§ 5 personnes-année pour les femmes qui n’ont pas récidivé dans les 5 ans.
§ Délai en années entre l’intervention et la récidive pour celles qui ont récidivé dans les
5 ans.
Nous réalisons une approximation, en considérant que les femmes qui ont récidivé ont été suivies
2,5 ans.
`,I7¥
}v = ≈ 2,8
`,`j¥
Le taux relatif de récidive est estimé à 2,8 alors que le risque relatif de récidive à 5 ans est estimé
à 2,4.
v}Hü@ 1 ¢î 2
Ò))ì )@ >é?*)*<@ÅJ.3 I '1 7 =
1−v}Hü@ 1 ¢î 2
= )?
Les femmes ayant une tumeur de type 3 ont un odds de récidive multiplié par 3,6 par rapport à
celles ayant une tumeur de type 1 ou 2. Nous pouvons aussi calculer un intervalle de confiance, dans
le cas présent l’intervalle de confiance de l’odds ration estimé est compris entre 2,2 et 5,7.
Nous calculons :
§ Le risque de la maladie ;
§ Le risque relatif ;
§ L’odds de la maladie chez les exposés et les non-exposés ;
§ L’odds ratio de la maladie.
770
0 - 79 g 104 666
Il n’est pas possible d’estimer l’incidence de la maladie les effectifs des cas et des témoins étant
déterminés par l’investigateur. Il n’est donc pas possible d’estimer l’ampleur de l’association entre le
facteur étudié et le critère de résultat par un risque relatif ou un taux relatif.
Existe-t-il une relation entre la consommation d’alcool à dose élevée et le risque de cancer de
l’œsophage ?
Nous réalisons un test du Chi-2. Nous calculons les effectifs attendus, ils sont entre parenthèses
dans le tableau.
Étant donné que qI7 >>> 3,84, la probabilité que la différence observée soit due au hasard est
très inférieure à 5%. Le degré de signification est p < 0,0001. La différence est statistiquement
significative. La probabilité d’être exposé est plus élevée chez les cas que chez les témoins.
Quelle est la force de l’association entre la consommation d’alcool à dose élevée et le risque de
cancer de l’œsophage ? Nous calculons l’odds ratio d’exposition :
=×) 96×666
Òv = = = 5,64
?×_ 104×109
L’odds ratio des cas est 5,6 fois plus élevé que celui des témoins. Mais l’odds ratio d’exposition
peut également s’interpréter comme l’odds ratio de la maladie des exposés par rapport aux non-
exposés. Les 2 odds ratio sont égaux. Les hommes qui ont été exposés à une consommation d’alcool ≥
80g par jour ont un risque de cancer de l’œsophage environ 5,6 fois plus élevé que les hommes ayant
été exposés à une consommation inférieure. L’intervalle de confiance à 95 % est compris entre 4 et
7,8. La mise en évidence d’un effet dose est possible. Nous étudions le lien entre la consommation
d’alcool (répartie sur plusieurs niveaux : nulle, faible, régulière et exagérée).
120 g ou plus 45 22
80 - 119 51 87
40 - 79 75 280
0 - 39 29 386
Le calcul de l’odds ratio pour chaque niveau de consommation par rapport au niveau de base
est calculé.
45
ÒvI7`t '1Z/ `{mˇt = 29 = 27,2
22
386
51
Òv9`t{IIˇ/ `{mˇt = 29 = 7,8
87
386
75
Òvj`{!ˇt/ `{mˇt = 29 = 3,6
280
386
A. Biais de sélection
Le biais de sélection correspond à la sélection d’un échantillon qui n’est pas représentatif de la
population cible.
Exemple
Une étude cas-témoins est réalisée pour quantifier le lien entre la consommation d’alcool et le
risque de cancer de l’œsophage. Les sujets inclus dans le groupe des témoins sont des patients
hospitalisés dans un service de gastro-entérologie et qui n’ont pas de cancer de l’œsophage. Les
témoins inclus peuvent avoir des pathologies pour lesquelles la consommation est un facteur de
risque. Ils ont une probabilité plus importante d’être exposés à l’alcool que la population générale.
Cela va entraîner une sous-estimation du lien entre la consommation d’alcool et le risque de
cancer de l’œsophage.
B. Biais de confusion
Le biais de confusion est dû à des facteurs liés à la fois au facteur étudié et au critère de résultat.
Ce sont des facteurs de confusion.
Exemple.
Le tabac est un facteur de risque pour le cancer du poumon. Les sujets qui consomment de l’alcool
sont également le plus souvent fumeurs. Le lien mis en évidence entre consommation d’alcool et
risque de cancer du poumon peut être au moins en partie expliqué par la consommation de tabac.
La consommation de tabac est un facteur de confusion potentiel. Il peut entraîner un biais de
confusion dans la quantification du lien entre consommation d’alcool et risque de cancer du
poumon. Le biais de confusion ira dans le sens d’une surestimation.
Exemple.
Dans les études cas-témoins, un biais de mesure classique du facteur étudié est le biais de
mémoire. On interroge les cas et les témoins sur leur exposition à un facteur dans le passé. Les cas
vont en général mieux se souvenir de leur exposition au facteur étudié que les témoins. Cela
entraîne une surestimation du lien entre le facteur étudié et le critère de résultat.
Remerciements et Remarques
§ Un grand merci aux personnes qui ont donné de leur temps à la rédaction du contenu :
- Julie DIAS
- Noé MOREAU
- Juliane PIC-GRENIER
- Julien CHABAUD-SASSOULAS
Pour toutes suggestions, remarques et corrections, vous pouvez vous rendre sur le forum dédié
aux Polys dans le module Spiral du Tutorat.
Il s'agit de la troisième année d’existence des Polys du Tutorat. Ce poly sera bien sûr amélioré
dans son contenu et dans sa forme au cours des années à venir.
Les Polys du Tutorat sont rédigés à partir des cours de l'année précédente. Ils n'ont aucune valeur
de référence de cours. Ils ne peuvent en aucun cas servir de référence opposable au concours PACES,
à une épreuve majeure ou au concours blanc du Tutorat. La seule référence qui fait foi pour le concours
PACES est le cours magistral donné en amphithéâtre par l'enseignant.
Le Tutorat déconseille fortement de se fier uniquement aux polys et de négliger les cours
magistraux. Une écoute active associée à une prise de notes efficace, puis un recopiage au propre reste
la méthode la plus appropriée à l'apprentissage des cours.