Vous êtes sur la page 1sur 32

FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé

28, avenue de Valombrose Biostatistique, Informatique Médicale


06 107 Nice Cedex 2 et Technologies de Communication

ENSEIGNEMENT DE LECTURE CRITIQUE D’ARTICLE MEDICAL SCIENTIFIQUE

GLOSSAIRE
Tous les termes de ce glossaire sont suivis entre parenthèses de leur équivalent utilisé dans la littérature anglo-
saxonne

A
Actuarielle (Actuarial)
La méthode actuarielle est utilisée pour construire des tables de survie. La méthode prend en compte le fait que
certaines personnes ne peuvent pas être suivies jusqu'au moment où l'événement étudié se produit. A la
différence de la méthode de Kaplan-Meier, les intervalles de temps où est estimée la survie sont fixes et définis
à priori. La courbe de survie a l'allure d'une ligne brisée. Contrairement au modèle de Cox, qui est une forme
d'analyse multivariée, la méthode actuarielle n'introduit pas de covariables (analyse univariée).

Aire sous la courbe (Area under curve – AUC)


L'aire sous la courbe ROC permet d'estimer la qualité discriminante d'un test diagnostique. Elle est au
maximum de 1 si le test est parfait (sensibilité et spécificité = 100%) ; elle est égale à 0 si le test n'a aucune
qualité discriminante.

Ajustement (Adjustment)
Ensemble des procédures ayant pour objectif d'éliminer l'effet de certaines variables, considérées comme
parasites, dans l'étude de la relation entre un facteur que l'on étudie et un critère de jugement. Le terme
d'ajustement est réservé aux procédures utilisées après le recueil des données, dans l'analyse des résultats
(par régression ou standardisation ou stratification).

Analyse coût-bénéfice (Cost-efficacy)


Type d'analyse visant à comparer le coût d'une stratégie et son bénéfice. Dans une telle étude, les coûts et les
conséquences sont exprimés en unités monétaires.

Analyse coût-efficacité (Cost-effectiveness)


Type d'analyse permettant de comparer des stratégies qui diffèrent par leurs coûts et leurs effets. Elle
s'exprime en unités monétaires par indicateur d'efficacité médicale (nombre d'années de vie sauvées, nombre
de cas de maladie évités).

Analyse coût-utilité (Cost-utility)


Type d'analyse comparable à l'analyse coût-efficacité, dont l'indicateur de résultat médical intègre plusieurs
dimensions. L'indicateur généralement utilisé est le QALY (Quality Adjusted Life Years) dont le critère
d'efficacité est le nombre d'années de vie sauvées, ou l'espérance de vie, ajusté sur un critère de qualité de vie.

Analyse de sensibilité (Sensitivity analysis)


Lors d’une analyse de sensibilité, on examine dans quelle mesure le résultat d’une recherche est influencé par
un changement de méthodes, de valeurs, de variables ou de critères de jugement. Plusieurs scénarii sont ainsi
juxtaposés, ce qui permet d’identifier les variables qui influencent le plus les résultats.

Analyse de variance (ANOVA) (Analysis of variance)


L'analyse de la variance permet de comparer plusieurs moyennes (plus de deux moyennes) en calculant la
variance inter-groupes (le degré selon lequel les moyennes des groupes diffère) et la variance intragroupe (la
dispersion des mesures dans chaque groupe). Dans une analyse de variance simple ou de variance à un
facteur, on étudie l'effet d'une seule variable, par exemple l'effet de techniques de physiothérapie sur la
lombalgie. Dans une analyse de variance double ou de variance à deux facteurs, on étudie l'effet (commun) de
deux variables, par exemple l'effet de plusieurs techniques de physiothérapie ayant des durées de traitement
différentes. Avec l'analyse de variance multiple (MANOVA), l'effet de plus de deux variables est examiné. La
mise en oeuvre d'une ANOVA est valide sous certaines hypothèses (distributions gaussiennes, variances
égales).

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 1


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

Analyse en intention de traiter (Intention to treat analysis)


L’analyse est dite en intention de traiter quand tous les patients randomisés sont analysés dans leur groupe de
randomisation initial quel que soit le traitement qu'ils ont effectivement reçu. Ainsi un patient ayant mal pris
son traitement ou l’ayant interrompu prématurément sera analysé dans son groupe initial de randomisation. Le
principe de l’analyse en intention de traiter implique de suivre tous les patients jusqu’à la mesure du critère de
jugement (même ceux ayant mal pris leur traitement), de minimiser au maximum le nombre de données
manquantes, et de mesurer l’impact de ces données manquantes sur les résultats. L’analyse en intention de
traiter évalue l’efficacité du traitement dans les conditions réelles de prescription, contrairement à l’analyse per
protocole (voir ce terme) qui évalue l’effet potentiel du traitement, obtenu dans une situation idéale.

Analyse intermédiaire (Interim analysis)


Les analyses intermédiaires sont les analyses de données réalisées en cours d’essai, avant que tous les patients
prévus aient été recrutés et/ou avant la fin de la période de suivi initialement prévue. Le but de ces analyses
est de pouvoir détecter au plus tôt le bénéfice, la non efficacité ou bien les effets délétères du traitement. Les
analyses intermédiaires entraînent la répétition des comparaisons statistiques d’où une augmentation du risque
de conclure à tort à l’efficacité du traitement (risque alpha). C’est pourquoi ces analyses intermédiaires doivent
être prévues à priori dans le protocole de l’essai ; d’autre part elles doivent faire l’objet de techniques
statistiques adaptées pour contrôler l’augmentation du risque alpha.

Analyse multivariée (Multivariate analysis)


Il s'agit de l'étude des liens entre la variable à expliquer (ou variable dépendante) et les variables explicatives
(ou variables indépendantes), testées simultanément. Ceci permet d'estimer l'effet de chacune des variables
explicatives ajustées sur le niveau des autres ; a pour but de corriger des biais de confusion.

Analyse par sous-groupe (Subgroup analysis)


Cette technique consiste à analyser les résultats d'un sous-groupe séparément de ceux de l'ensemble de la
population concernée par la recherche. Ce type d'analyse par sous-groupe doit avoir été déterminé
préalablement dans le protocole de recherche. Dans le cas contraire, la multiplication des analyses par sous-
groupe augmente le risque alpha global (probabilité de mettre en évidence par hasard une différence). Des
résultats significatifs obtenus à l’aide de nombreuses comparaisons par sous-groupe devront être interprétés
avec prudence et impérativement confirmés par une nouvelle étude.

Analyse per protocole (Per protocol analysis)


Quand les patients n'ayant pas reçu le traitement prévu, ayant mal pris ou arrêté le traitement sont exclus de
l'analyse. L'analyse per protocole ne concerne que les patients qui ont été traités en pleine conformité avec le
protocole. Elle permet d'apprécier l'effet potentiel du traitement tel qu'il peut être obtenu dans une situation
idéale. Elle se différencie de l’analyse en intention de traiter (voir ce terme) qui évalue l’efficacité du traitement
dans les conditions réelles de prescription. Contrairement à l’analyse en intention de traiter, l’analyse per
protocole donne une estimation potentiellement biaisée de l’effet du traitement.

Analyse séquentielle (Sequential analysis)


Les méthodes séquentielles permettent de répéter de nombreuses fois en cours d’essai la comparaison
statistique et d’arrêter l’essai dès qu’il est possible de rejeter l’hypothèse nulle d’efficacité identique des
traitements. L’analyse séquentielle est équivalente à la réalisation de nombreuses analyses intermédiaires (voir
ce terme). A chaque nouvelle paire de patients, on calcule une nouvelle valeur du test que l’on compare à une
valeur maximale et une valeur minimale. L’essai continue si la valeur du test est entre ces deux limites ; il
s’arrête si la valeur maximale est dépassée (le traitement à tester est déclaré efficace) et si la valeur minimale
n’est pas atteinte (le traitement à tester n’est pas déclaré efficace).

Analyse univariée (Univariate analysis)


Etude des liens entre la variable à expliquer, par exemple le critère de jugement principal dans un essai
thérapeutique, et chacune des variables explicatives, par exemple le traitement et les covariables dans un essai
thérapeutique.

Appariement (Matching)
L'appariement est une technique destinée à rendre comparable la distribution de deux ou plusieurs groupes
selon des caractéristiques pertinentes, ce qui permet de prévenir un biais de confusion lié à ces
caractéristiques. L'âge et le sexe, par exemple, font souvent l'objet d'un appariement. Dans un essai
thérapeutique, le patient peut jouer le rôle de son propre témoin (il est alors apparié sur lui-même). L'analyse
des données appariées fait appel à des techniques spécifiques (test du X2 apparié, test t en séries appariées,
test de rang de Wilcoxon...).

Applicabilité (Applicability)
Voir validité externe
12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 2
FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

Arbre de décision (Decision tree)


Outil conçu pour déterminer la décision à rendement maximal quand différentes options sont possibles au cours
d'un processus clinique à étapes (diagnostique ou thérapeutique). Il s'agit d'un graphique où à chaque étape les
options possibles sont représentées par des branches, tout comme les conséquences de ces options.

Association (Relationship)
Dépendance entre deux variables qui peuvent être soit qualitatives (un traitement A ou B et une guérison
présente ou absente), soit qualitatives et quantitatives (un traitement A ou B et la cholestérolémie
plasmatique), soit quantitatives (posologie d'un médicament et cholestérolémie plasmatique). Synonymes :
relation, lien.

Aveugle (Blind)
Procédure destinée à éviter un biais de mesure ou un biais d'information. Synonyme : insu.

Aveugle (double) (Double blind)


Un essai est réalisé en double aveugle (ou double insu) quand le patient et l'expérimentateur ignorent tous
deux si le patient appartient au groupe expérimental ou témoin. Elle permet de réduire non seulement l'effet
placebo dû à la subjectivité du patient, mais aussi les biais dus à la subjectivité de l'expérimentateur.

Aveugle (simple) (Simple blind)


Un essai est réalisé en simple aveugle quand le patient ignore à quel groupe il appartient et que
l’expérimentateur est informé du traitement reçu par le patient. Le double aveugle n’est pas réalisable dans
certaines situations : comparaison d’un traitement médical à un traitement chirurgical, comparaison d’un prise
en charge « améliorée » (kinésithérapie, aide à domicile…) à une prise en charge classique, comparaison d’une
prise en chargé hospitalière à une prise en charge à domicile…

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 3


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

B
Bénéfice absolu
Voir différence de risques

Bénéfice relatif
Voir risque relatif

Biais (Bias)
Un biais est une variété d’erreur dite « systématique » qui s’introduit dans une étude à différente stades : au
moment de la constitution des groupes, de la collecte ou de l’analyse des données, et de l’interprétation des
résultats. Les estimations seront donc systématiquement erronées dans le même sens : soit plus élevées, soit
plus basses que la valeur réelle des paramètres que l'on étudie. Le biais est à différencier de l'erreur due au
hasard ou fluctuation d'échantillonnage. Il altère la fiabilité des résultats d’une enquête.

Biais d’attrition (Attrition bias)


Il concerne les essais thérapeutiques et survient quand des patients randomisés sont écartés de l’analyse. Ces
patients non analysés correspondent soit à des perdus de vue, soit à des données manquantes, ce qui a pour
conséquence dans les deux cas de rendre le critère de jugement principal manquant. Le biais d’attrition
constitue une variété de biais de sélection.

Biais de classement (Assessment bias)


Voir biais d’information

Biais de confusion (Confounding bias)


Il y a biais de confusion lorsque la relation entre deux variables est affectée par une troisième variable. Un
facteur de confusion représente une variable qui est associée aussi bien à l’exposition qu'à la maladie. Ainsi
dans l’étude de la relation entre la prise de contraceptifs oraux et la survenue de thrombose veineuse profonde,
l’âge peut jouer le rôle de facteur de confusion. En effet, l’âge est lié à l’exposition (les femmes sous
contraception orale sont plus jeunes que les femmes utilisant d’autres moyens de contraception) et à la
survenue de la maladie (la fréquence de la thrombose veineuse profonde augmente avec l’âge). Le facteur de
confusion « âge » aura ici pour effet de sous-estimer la relation entre l’exposition et la maladie. Il s'agit du seul
biais que l'on peut corriger au moment de l'analyse (voir ajustement, analyse multivariée).

Biais de publication (Publication bias)


Existe si la publication des études dépend de l'ampleur, de la direction ou de la signification statistique des
résultats de l'étude. De façon générale, à qualité identique, les études significatives sont plus fréquemment
publiées que les études non significatives. Cette forme de biais est importante pour les méta-analyses. La
recherche des biais de publication peut se faire par exemple, à l'aide d'un funnel plot.

Biais de sélection (Selection bias)


L'erreur dans l'estimation résulte de la façon dont les sujets de la population étudiée ont été sélectionnés.
Exemples : groupe contrôle constitué de témoins historiques, biais de suivi (perdus de vue, arrêt du
traitement), biais lié au volontariat…

Biais d'information (Information bias)


Lorsque le classement des individus n'est pas réalisé de la même façon dans les groupes à comparer. Dans une
enquête cas-témoins, classement différent de l'exposition chez les cas et chez les témoins. Dans une enquête
exposés-non exposés, recherche différente de la maladie chez les exposés et les non exposés. Dans un essai
thérapeutique, la recherche de l'effet n'est pas réalisée de la même façon dans les groupes nouveau traitement
et placebo : ce biais est plus fréquent en l'absence d'aveugle et si le critère est subjectif.

Biais maximum (Maximum bias)


L’hypothèse du biais maximum permet de tester la robustesse d’un résultat lorsqu’il existe un taux non
négligeable de perdus de vue. Dans un essai thérapeutique, ceci consiste à considérer que tous les perdus de
vue du groupe traitement à tester sont des échecs du traitement tandis que tous les perdus de vue du groupe
contrôle sont des succès thérapeutiques. Le résultat est considéré comme robuste s’il reste favorable au
traitement étudié dans cette hypothèse. Ce type d’analyse, destinée à prendre en compte les perdus de vue,
est souvent mis en œuvre dans les analyses en intention de traiter (voir ce terme).

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 4


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

Boîte à moustache (Box plot)


Une boîte à moustache est une reproduction graphique des différentes mesures entourant la médiane présentée
sous forme de boîte dont les deux bords sont les 1° et les 3° quartiles, et contenant donc 50% des
observations. La boîte est reliée aux valeurs les plus extrêmes par une droite.

Bras (Arm)
Il s’agit d’un groupe de patients constitué par randomisation et assigné à un même traitement. Voir parallèle.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 5


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

C
Cas : cas rapporté (Case report)
Les cas rapportés (ou cas clinique), en décrivant une observation inhabituelle, constituent souvent la première
étape de la reconnaissance d'une nouvelle maladie ou d'un nouveau facteur de risque. Les cas rapportés
traduisent avant tout l'expérience et l'observation d'un auteur et ne permettent pas de tirer de conclusions
qu'on puisse généraliser à d'autres cas. Ils ne permettent pas d'établir la fréquence d'une maladie : une étude
d'incidence ou de prévalence serait nécessaire pour ce faire. Ces études ne permettent pas non plus d'apprécier
de manière statistique l'importance d'un facteur de risque qu'elles peuvent éventuellement suggérer.

Cas : série de cas (Case serie)


Les séries de cas représentent l'étape suivante du cas rapporté, en regroupant différentes observations
similaires et en établissant ainsi l'existence probable d'une entité pathologique. Les séries de cas traduisent
avant tout l'expérience et l'observation d'un auteur et ne permettent pas de tirer de conclusions qu'on puisse
généraliser à d'autres cas. Ils ne permettent pas d'établir la fréquence d'une maladie : une étude d'incidence ou
de prévalence serait nécessaire pour ce faire. Ces études ne permettent pas non plus d'apprécier de manière
statistique l'importance d'un facteur de risque qu'elles peuvent éventuellement suggérer.

Cas-témoins (Case control)


Voir enquête cas-témoin

Causalité (Causation)
Voir épidémiologie analytique

Coefficient de corrélation (Correlation coefficient)


Le coefficient de corrélation (r) (dit coefficient de Pearson) décrit l'association linéaire entre deux variables
continues, c'est-à-dire si les différentes mesures se situent au plus près par rapport à une ligne droite. La
valeur du coefficient de corrélation varie entre -1 et +1. Si le coefficient de corrélation est égal à 0, aucun lien
n'existe; une valeur de -1 ou de +1 indique une relation parfaitement linéaire avec soit une pente négative (si
égal à -1) soit une pente positive (si égal à +1). Plus la corrélation est élevée, plus il est facile de prévoir la
valeur de la deuxième observation à partir de la première (voir régression linéaire).

Coefficient de corrélation de Spearman (Spearman rank correlation)


Le coefficient de corrélation (rs) de Spearman est la variante non paramétrique du coefficient de corrélation de
Pearson. Quand les variables ne sont pas réparties normalement ou qu'au moins une des deux est mesurée sur
une échelle ordinale, ce test peut être employé. Un ordre de rang est attribué à chaque valeur, rang sur lequel
est calculé le coefficient de corrélation. Une valeur proche de 1 montre une bonne relation, et tandis qu’une
valeur proche de 0 traduit l’absence de relation.

Cohorte (Cohort)
Voir enquête de cohorte

Contrôle (Control)
Voir témoin

Corrélation (Correlation)
Une corrélation est une association entre deux variables quantitatives. On peut constater par exemple qu'une
association existe entre la taille et le poids : les personnes plus grandes ont un poids généralement supérieur à
celui des personnes plus petites. Pour voir dans quelle mesure cette association est linéaire (donc peut être
résumée par une ligne droite), on calcule le coefficient de corrélation.

Cote (Odds)
Voir Odds ratio

Courbe ROC (ROC curve)


La courbe ROC (Receiver Operating Characteristic curve) est un graphique exprimant la capacité d’un test de
dépistage à faire la distinction entre les personnes saines et les personnes malades. Sur le graphique ROC, la
sensibilité du test (vrais positifs) est indiquée sur l’axe des y (ordonnée) au moyen de différentes valeurs-
seuils. Sur l’axe des x (abscisse) on place les faux-positifs (1-spécificité). La valeur optimale se trouve dans le
coin supérieur gauche du graphique indiquant une proportion élevée de vrais-positifs et une faible proportion de
faux-positifs. Une courbe ROC peut également être utilisée pour comparer entre eux différents tests
diagnostiques ; on compare alors les aires sous la courbe.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 6


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

Cox (modèle de) (Cox proportional hazards model)


Ce modèle statistique (Cox 1972) permet de calculer une courbe de survie qui tienne compte de l'influence de
co-variables (analyse de survie multivariée). Appelé aussi modèle des risques proportionnels, il fait l'hypothèse
que l’effet d’une variable est constant au cours du temps : par exemple la réduction du risque chez les patients
sous nouveau traitement devra être identique en début, milieu et fin de suivi. Le résultat obtenu est un rapport
de risque instantané (hazard ratio) entre les patients du groupe avec la ou les covariables et ceux du groupe
sans covariable.

Critère clinique (Clinical outcome ou endpoint)


Critère de jugement correspondant aux l'objectifs thérapeutiques d'un traitement (taux de guérison, taux de
complications, durée de vie, délai de récidive….).

Critère de jugement (Outcome ou endpoint)


Dans une étude analytique, le critère de jugement, ou facteur résultant, se définit comme la situation ou
l'événement supposé être le résultat de l'influence du facteur étudié. Les événements dignes d'intérêt, pour le
patient comme pour le clinicien ou l'épidémiologiste, se répartissent en cinq catégories : la mort, la maladie, le
handicap, l'inconfort, l'insatisfaction. Il peut aussi s'agir de leur inverse : survie, guérison, La définition de ces
critères de jugement doit être aussi précise que possible. Un critère de jugement est une variable, dite
dépendante, par rapport au facteur étudié qui est la variable indépendante.

Critère de jugement principal (Primary endpoint)


Il s’agit du critère qui va servir à la mise en évidence de l’efficacité du traitement étudié. Idéalement, il doit
être unique afin de permettre le contrôle du risque de conclure à tort à l’efficacité (erreur alpha).
Soigneusement choisi, il doit correspondre au critère le plus cliniquement pertinent vis-à-vis de l’objectif
thérapeutique de la maladie.

Critère de jugement secondaire (Secondary endpoint)


Il s’agit d’autres critères analysés à côté du critère de jugement principal. Il peut s’agir de bénéfices
secondaires du traitement, de certains mécanismes d’action, de critères intermédiaires, d’évènements
indésirables. A la différence du critère de jugement principal, les critères secondaires sont présents à titre
documentaire et ne permettent pas de conclure de façon formelle à l’efficacité thérapeutique.

Critères de non inclusion (Non inclusion criteria)


Il s'agit de critères négatifs, c'est à dire qu'ils décrivent les caractéristiques que ne doivent pas présenter les
sujets ou les patients pour être inclus dans l'étude.

Critères de substitution (Surrogate outcome)


Un critère de substitution est un examen de laboratoire ou un signe physique utilisé à la place d'un critère
clinique. Un changement induit par le traitement sur le critère de substitution est supposé refléter un
changement dans le critère clinique. Ceci permet de diminuer le nombre de sujets à inclure ou la durée de suivi.
Les effets sur les critères de substitution ne prédisent souvent pas les effets thérapeutiques sur les vrais
critères cliniques.

Critères d'exclusion (Exclusion criteria)


Voir critères de non inclusion.

Critères d'inclusion (Inclusion criteria)


Il s'agit de critères positifs décrivant les caractéristiques que doivent présenter les sujets ou les patients pour
être inclus dans l'étude.

Critères intermédiaires (Surrogate outcome)


Critères de jugement ne correspondant pas à l'objectif thérapeutique d'un traitement mais à ses mécanismes
d'action. Un argument s'appuyant sur un critère intermédiaire n'est pas une preuve directe d'efficacité. Il s’agit
par exemple de la mesure de la pression artérielle pour évaluer l'efficacité d'un anti-hypertenseur. En effet le
but du traitement n'est pas de faire baisser la pression artérielle mais de prévenir ses complications
potentiellement mortelles (infarctus, AVC). Autre exemple : la densité osseuse pour évaluer l'efficacité d'un
traitement contre l'ostéoporose (le critère clinique pourrait être le taux de fracture du col fémoral).

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 7


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

D
Degré de signification (p value)
Voir p valeur

Dépistage (Screening)
Recherche chez une personne en bonne santé apparente des signes d'une maladie avant qu'elle ne se déclare.

Dépistage de masse (Mass screening)


Dépistage effectué sur une grande échelle, de manière systématique sur une population ciblée avec à la clé une
prise en charge spécifique.

Dépistage individuel (Individual screening)


Dépistage effectué sans programmation de lieu, de temps, de population cible ou d’objectifs. Il est fortement
orienté par le contexte clinique.

Déviation standard (Standard deviation)


Voir écart-type

Différence absolue
Voir différence de risques

Différence de risques (Risk difference)


Appelée aussi différence absolue ou bénéfice absolu, la différence de risque (DR) est la différence des risques
des deux groupes à comparer. Dans un essai thérapeutique, il s'agira de la différence entre le risque sous
traitement à tester et le risque sous placebo (ou traitement de référence). Dans une enquête de cohorte, il
s'agira de la différence entre le risque des sujets exposés et le risque des sujets non exposés. La DR est nulle
en l'absence d'effet; une différence de risque de - 5% signifie que le traitement évite la survenue de 5
évènements pour 100 patients traités.

Dispersion (Dispersion)
Une mesure de dispersion estime la variabilité des observations autour du centre de la distribution. La variance,
l'écart-type, l'intervalle inter-quartile et l'étendue constituent des mesures de dispersion classiques.

Distribution
Voir loi

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 8


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

E
Ecart-type (Standard deviation)
Cette mesure de dispersion traduit la variabilité des mesures au sein de l'échantillon. Il s'agit de la moyenne
des écarts des observations par rapport à la moyenne de l’ensemble des observations. Son calcul passe par le
carré des écarts à la moyenne (variance). Dans une distribution normale, 95% des observations sont situées
entre -2 et +2 écarts types autour de la moyenne.

Ecart-type de la moyenne (Standard error of the mean)


Cette mesure traduit la précision de l'estimation réalisée sur l'échantillon. A ne pas confondre avec l'écart-type
puis qu'il faut diviser ce dernier par la racine carrée de l'effectif de l'échantillon pour obtenir l'écart-type de la
moyenne. L'écart-type de la moyenne dépend de la dispersion des observations (écart-type) et de la taille de
l'échantillon : plus l'échantillon est grand et plus l'écart-type de la moyenne est petit.

Echantillon (Sample)
Ensemble des sujets sur lesquels les données ont été recueillies.

Echantillon représentatif (Representative sample)


Un échantillon est représentatif de la population si tous les sujets de la population concernée ont la même
probabilité, connue et non nulle, de figurer dans l'échantillon. Les conclusions d'une étude réalisée sur
l'échantillon pourront alors être généralisées à l'ensemble de la population d'où est tiré l'échantillon.

Effet Hawthorne (Hawthorne effect)


C'est l'effet (le plus souvent favorable) d'une intervention sur une personne étudiée dû uniquement au fait
qu'elle participe à la recherche. Le nom de cet effet provient d'études réalisées dans les années 1940 dans une
centrale électrique aux États-Unis (Hawthorne). On y étudiait l'effet de l'éclairage du plan de travail sur la
productivité des employés et il a été constaté que les prestations s'amélioraient également dans le groupe
contrôle.

Effet placebo (Placebo effect)


L'effet placebo (souvent, mais pas toujours positif) est l'effet qui ne peut pas être expliqué par un modèle
physiopathologique mais qui est attribué à d'autres facteurs, comme le décours naturel de la plainte, la relation
médecin-patient ou l'attente par le patient, le médecin ou le chercheur qu'une certaine intervention ou un
certain traitement ait un effet

Epidémiologie (Epidemiology)
Il s'agit de l'étude de la fréquence et de la répartition dans le temps et dans l'espace des problèmes de santé
dans les populations humaines, ainsi que le rôle des facteurs qui les déterminent.

Epidémiologie analytique (Analytical epidemiology)


Teste des hypothèses sur le rôle causal de certains facteurs dans la survenue de pathologies ou de problèmes
de santé. Les arguments en faveur d'une relation causale sont l'importance de l'effet, l'existence d'une relation
dose-effet, la détermination de la séquence temporelle, la spécificité de la cause et de l'effet, la cohérence
interne (maîtrise des biais), la cohérence externe (résultats d'autres études), la plausibilité biologique, la
réversibilité de l'association.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 9


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

Epidémiologie descriptive (Descriptive epidemiology)


A pour objet de mesurer l'importance et de décrire la répartition des problèmes de santé selon le lieu, la
période et différents sous-groupes (catégories socio-professionnelle, sexe, âge, ethnie, …). Elle répond aux
questions : quand, où et chez qui survient un problème de santé ?

Epidémiologie évaluative (Evaluative epidemiology)


Elle cherche à mesurer l'efficacité des interventions sanitaires dans les populations humaines. Il s'agit d’études
expérimentales ou quasi-expérimentales, parfois randomisées.

Erreur aléatoire (Random error)


Déviation d'une valeur estimée d'un paramètre à partir de l'observation d'un échantillon, par rapport à sa
valeur réelle dans la population d'où provient l'échantillon. Il s'agit des fluctuations d'échantillonnage dues au
hasard (par opposition aux biais).

Erreur de type I ou de première espèce (Type I error)


C'est conclure, lorsqu'on fait un test statistique, qu'il y a une différence entre les groupes étudiés alors qu'en
réalité il n'y en a pas. La probabilité de cette erreur est le risque alpha, habituellement fixé à 5%. Exemple : en
évaluation thérapeutique, déclarer à tort qu'un médicament est efficace ; en épidémiologie analytique, déclarer
à tort qu'une exposition augmente le risque de survenue d'une maladie.

Erreur de type II ou de deuxième espèce (Type II error)


C'est conclure, lorsqu'on fait un test statistique, qu'il n'existe pas de différence entre les groupes étudiés alors
qu'il en existe une en réalité. La probabilité de cette erreur est le risque beta. Exemple : en évaluation
thérapeutique, déclarer à tort qu'un médicament n'est pas efficace ; en épidémiologie analytique, déclarer à
tort qu'une exposition n'augmente pas le risque de survenue d'une maladie.

Erreur standard de la moyenne (Standard error of the mean )


Voir écart-type de la moyenne

Essai (Trial)
Expérimentation à visée interventionniste - intervention thérapeutique, de dépistage, de prévention ou
d'éducation - dans laquelle l'évaluation des effets sur le groupe de sujets étudiés se fait par rapport à un
groupe témoin de référence : on peut comparer une intervention à l'absence d'intervention, ou à une ou
plusieurs autres interventions du même type, l'objectif étant de déterminer s'il existe une différence entre elles.

Essai croisé (Cross-over trial)


Dans une étude clinique en cross-over, les personnes examinées sont réparties en deux groupes. Le premier
groupe reçoit d'abord le traitement A et ensuite le traitement B, alors que le second groupe sera traité dans
l'ordre inverse. Un avantage de ce type d'étude est que le nombre de personnes qu'il est nécessaire d'inclure
pour mesurer un effet est petit. Une critique de cette méthode est que l'effet du premier traitement peut être
encore présent lorsqu'on débute le deuxième traitement. C'est pour cela qu'après le traitement avec le premier
produit, une période sans médicament ("wash-out-period", période de "lavage") est le plus souvent intercalée.

Essai de non infériorité (Non-inferiority trial)


L'objectif d'un essai d'équivalence (de non infériorité) est de prouver que la nouvelle thérapie et la thérapie
standard sont équivalentes (ou que la nouvelle thérapie n'est pas moins efficace). Montrer l'absence de
différence statistiquement significative entre les deux traitements n'est pas suffisant pour conclure à
l'équivalence (la non infériorité). C'est pourquoi la méthode statistique ne repose pas sur des tests
d'hypothèses classiques mais sur le choix d'un seuil de non infériorité et sur le calcul d'intervalle de confiance.

Essai de supériorité (Superiority trial)


C'est l'essai thérapeutique conventionnel qui vise à montrer la supériorité du nouveau médicament, par rapport
au traitement de référence ou par rapport au placebo en l'absence de traitement de référence.

Essai d'équivalence (Equivalence trial)


Voir essai de non infériorité

Estimation (Assessment)
Estimer un paramètre (inconnu) caractéristique d'une population consiste à en proposer une valeur, appelée
estimation, calculée à partir d'un échantillon. Une estimation est donnée avec son intervalle de confiance.
Exemple : la fréquence d'une maladie, observée sur un échantillon obtenu par tirage aléatoire simple, est une
estimation de la fréquence de la maladie dans la population.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 10


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

Etendue (Range)
Il s'agit de la différence entre la valeur la plus haute et la valeur la plus basse. Par exemple, sur un échantillon
de 100 patients âgés de 25 à 90 ans, l'étendue est de 65 ans.

Etude analytique (Analytic study)


Type d'étude spécialement conçue pour vérifier une hypothèse qui a été soulevée par les résultats d'une étude
descriptive, en cherchant à établir l'association possible entre un ou plusieurs facteurs étudiés et un ou
plusieurs critères de jugement.

Etude cas-témoins (Case control study)


Une étude cas-témoins est une étude d'observation, rétrospective, de type analytique, dans laquelle les
caractéristiques de patients atteints d'une maladie (les cas), sont comparées avec celles de patients indemnes
de la maladie (les témoins), ces caractéristiques étant en général l'exposition à des facteurs de risque que l'on
recherche dans le passé des cas comme dans celui des témoins.

Etude de cohorte (Cohort study)


Une étude de cohorte est une étude d'observation, prospective, de type analytique, dans laquelle un groupe de
sujets exposés à un ou des facteurs de risque d'une maladie est suivi pendant une période de temps donnée. Le
taux d'incidence de la maladie dans ce groupe exposé est comparé à celui d'un groupe témoin, suivi pendant le
même temps, mais non exposé au(x) facteur(s) de risque.

Etude descriptive (Descriptive study)


Toute étude qui a pour but de rendre compte d'un phénomène de santé, de sa fréquence, de sa distribution et
de son évolution, ainsi que des variables apparentées, au sein d'une population donnée. Ce type d'étude
permet, entre autres, d'identifier certains groupes chez qui la fréquence de ce phénomène est anormalement
élevée - ou anormalement faible - afin de déterminer leurs besoins en matière de santé.

Etude d'observation (Observational study)


Étude caractérisée par l'absence d'intervention de la part du chercheur. Ce type d'étude vise soit à décrire l'état
de santé de la population ou ses déterminants, soit à étudier les relations entre l'état de santé d'une population
et l'exposition à un ou plusieurs facteurs, celle-ci n'étant pas contrôlée. Elle ne permet pas d'établir de lien de
causalité.

Etude écologique (Ecologic study)


Elles établissent la comparaison entre l'importance (ou la fréquence) d'un facteur de risque supposé au sein
d'une population et la prévalence ou l'incidence de la maladie supposée secondaire, à partir de données déjà
disponibles au niveau de cette population. Elles sont transversales dans la mesure où elles superposent deux
types de données (fréquence du facteur de risque et fréquence de la maladie) recueillies dans une même
période de temps.

Etude expérimentale (Intervention study)


Étude dans laquelle l'expérimentateur choisit, dans un groupe donné, les sujets qui seront soumis à l'action du
facteur étudié (intervention médicale, chirurgicale…), maîtrise dans la mesure du possible l'effet d'autres
facteurs concomitants et mesure les variations de l'état des sujets soumis à l'expérience afin d'établir un lien de
causalité entre le facteur étudié et l'effet mesuré. Quand les exigences de l'éthique médicale la rendent
possible, l'étude expérimentale est préférable à l'étude d'observation, car elle permet d'établir la preuve directe
d'une relation causale, l'exposition au facteur étudié étant contrôlée.

Etude longitudinale (Longitudinal study)


Étude qui consiste à suivre une ou plusieurs cohortes à l'aide d'examens périodiques et répétés pendant une
assez longue période, contrairement à ce qui se passe dans l'étude transversale où la durée est suffisamment
courte pour que l'élément temps devienne une donnée négligeable.

Etude médico-économique (Medico-economic study ou medico-economic evaluation)


Une étude médico-économique prend en compte le facteur coût dans la mesure de l’effet. Il existe différentes
sortes d’évaluations économiques : voir analyse coût-bénéfice, analyse coût-efficacité, analyse coût-utilité.

Etude ouverte (Open label study)


Dans une étude ouverte, les patients comme les prescripteurs sont au courant du traitement reçu, en
opposition avec une étude en aveugle.

Etude pilote (Pilot study)


Etude à petite échelle permettant de tester en pratique un instrument de mesure ou un protocole d'étude.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 11


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

Etude prospective (Prospective study)


Étude qui comporte la récolte de données sur des événements à venir. Elle consiste généralement à suivre un
groupe de sujets exposés à un facteur de risque particulier, afin d'étudier les phénomènes de santé qui
affectent ce groupe au cours du temps. Le facteur étudié est enregistré avant que se produise le critère de
jugement.

Etude rétrospective (Retrospective study)


Étude dans laquelle on recherche un lien possible entre un phénomène de santé (maladie ou autre) présent au
moment de l'étude et des événements (facteurs de risque) survenus dans le passé. Par exemple, on examine
les antécédents d'un groupe de patients afin d'identifier les sujets qui, dans le passé, ont subi une exposition à
un facteur de risque particulier. L'information concernant les événements passés est obtenue au moyen de
documents d'archives ou par l'interrogatoire. Le facteur étudié est enregistré rétrospectivement, après que le
critère de jugement s'est produit.

Etude transversale (Cross-sectional study)


Est ainsi nommée car elle analyse la présence d'un facteur donné ou d'une maladie particulière dans une
population P à un moment précis t, sans référence au passé ou sans suivi dans le futur. Elle représente
l'équivalent d'un sondage rigoureusement et scientifiquement construit, ou de l'instantané photographique
d'une situation précise dans la population étudiée. Ce type d'études est surtout effectué dans un but descriptif.
Il pose des problèmes d'interprétation liés au manque d'information sur la chronologie des événements et à des
problèmes de sélection.

Exactitude d'un signe ou d'un test diagnostique (Accuracy)


Il s'agit de la proportion de tests ayant donné un résultat exact (somme des vrais positifs et des vrais négatifs
rapportée à l'ensemble des mesures).

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 12


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

F
Facteur de risque (Risk factor)
Caractéristique individuelle ou collective, endogène (propre à l'individu) ou exogène (liée à l'environnement),
qui augmente la probabilité de survenue d'une maladie ou de tout autre phénomène de santé. Le lien est
purement statistique et ne préjuge en rien de la causalité.

Faux négatifs (False negative)


Sujets ayant un test négatif (ou chez qui le signe est absent) parmi les malades. Le taux de faux négatif chez
les malades est égal à 1 - la sensibilité.

Faux positifs (False positive)


Sujets ayant un test positif (ou chez qui le signe est présent) parmi les non malades. Le taux de faux positifs
chez les non malades est égal à 1 - la spécificité.

Fiabilité (Reliability, validity)


Voir reproductibilité

Funnel plot (Funnel plot)


Un funnel plot est une méthode graphique permettant de rechercher les biais de publication lors de la
réalisation d'une méta-analyse. Pour chaque étude, l'effet trouvé est mis en relation avec le nombre de
personnes incluses dans l'étude (taille de l'échantillon). La distribution des points dans ce graphique devrait
être disposée en entonnoir « (funnel » en anglais), la dispersion étant plus grande au fur et à mesure que la
taille de l'échantillon diminue. Une asymétrie dans la forme de l'entonnoir indique que des études manquent
(par exemple, études non publiées ou non identifiées par la stratégie de recherche).

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 13


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

G
Graphique de dispersion (Scatter plot)
Un graphique de dispersion, appelé aussi nuage de points, est un résumé graphique de données bivariées (de
deux variables) permettant de visualiser une corrélation linéaire ou de construire une ligne de régression.
Chaque unité est représentée par un point dans le nuage et les points ne sont pas reliés entre eux. Un nuage
de points est utilisé au cours de la première phase d'une analyse pour explorer les données. Cela permet
d'avoir des informations sur la moyenne, la forme de la distribution et les valeurs extrêmes.

Gauss (loi de) (Gauss distribution)


Voir loi normale

Gold standard
C'est une méthode, procédure ou mesure qui est généralement considérée comme la meilleure méthode
disponible. Un gold standard (test de référence) est surtout utilisé lors de la comparaison de tests diagnostiques
et est alors défini comme le test qui peut discriminer le mieux entre les patients atteints ou non d'une maladie
déterminée. Étant donné le fait que le gold standard est souvent un test complexe ou invasif (par exemple
l'augmentation des antistreptolysines sériques entre un 2ème et un 1er prélèvement pour affirmer l'origine
streptococcique d'un mal de gorge aigu) on utilise en pratique des tests diagnostiques moins précis. La valeur
d'un test diagnostique est exprimée par rapport au gold standard en termes de sensibilité et de spécificité.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 14


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

H
Healthy worker effect
C'est une forme de biais de sélection qui a été, à l'origine, mis en exergue dans le cadre de la recherche en
médecine du travail. Lors de la comparaison d'une population active avec la population générale, on a constaté
que les taux de morbidité et de mortalité sont moindres dans le premier groupe. Ce phénomène peut être
expliqué par le fait que la population active est en moyenne en meilleure santé que la population générale qui
se compose également des personnes trop malades pour travailler.

Hypothèse alternative (H1) (Alternative hypothesis)


Par opposition à l'hypothèse nulle, l'hypothèse alternative suppose une association (ou une différence).
L'hypothèse alternative est acceptée lorsque le test statistique est significatif.

Hypothèse du biais maximum


Voir biais maximum

Hypothèse nulle (H0) (Null hypothesis)


Une hypothèse nulle propose que l'association ou la différence observée entre deux résultats peut être attribuée
au seul effet du hasard, ou autrement dit, qu'il n'y a en réalité aucune association ou différence. L'hypothèse
nulle s'oppose à l'hypothèse alternative qui suppose une association. L'hypothèse nulle est le point de départ
des tests statistiques qui permettent de calculer la probabilité que le résultat puisse être attribuée au hasard.
L'hypothèse nulle est rejeté lorsque le test est significatif.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 15


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

I
IMRed (IMRaD)
Introduction, Méthodes, Résultats et Discussion. Il s'agit des sections composant la structure d'un article
scientifique.

Incidence (Incidence)
Nombre de nouveaux cas d'une maladie pendant une période donnée rapporté à l'effectif des personnes
susceptibles de contracter cette maladie pendant la même période. Par exemple, l'incidence du cancer colo-
rectal en France était de 58 cas / 100 000 habitants en 1995.

Insu (Blind)
Voir aveugle

Interaction (Interaction)
On parle d’interaction entre le traitement et une autre variable lorsque que le bénéfice thérapeutique est
différent selon la valeur prise par la variable. L’interaction est dite quantitative lorsque le meilleur traitement
reste le même mais que l’écart augmente en fonction de la valeur de la variable. Par exemple, le bénéfice d’une
chimiothérapie intensive est d’autant plus important que le score selon l’index pronostique est élevé.
L’interaction est dite qualitative lorsque le meilleur traitement change en fonction de la valeur de la variable.
Par exemple, l’effet d’une chimiothérapie intensive est positif chez les sujets jeunes mais négatif chez les sujets
âgés.

Intervalle de confiance (Confidence interval)


Intervalle de probabilité qui exprime la dimension d'incertitude statistique de l'estimation d'une valeur dans
l'analyse d'un échantillon. En général à 95%, l'IC est l'étendue des valeurs qui a 95% de chances de recouvrir
la valeur vraie. Les deux bornes de l'intervalle de confiance à 95% sont définies par la moyenne +/- 2 fois
l'erreur standard de la moyenne. La largeur de l'intervalle de confiance dépend notamment de la taille de
l'échantillon : plus l'échantillon est de grande taille, plus l'estimation est précise et plus l'intervalle de confiance
est étroit.

Intervalle inter quartile (Inter quartile range)


Il s'agit de l'intervalle dont les extrémités sont constituées par le premier et le troisième quartile. Il contient la
moitié des observations.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 16


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

K
Kaplan-Meier
L'estimation de Kaplan-Meier est une méthode (non paramétrique) développée par Kaplan et Meier (1958) pour
construire des tables de survie. La méthode prend en compte le fait que certaines personnes ne peuvent pas
être suivies jusqu'au moment où l'événement étudié se produit. A la différence de la méthode actuarielle, les
intervalles de temps où sont estimés la survie ne sont pas fixes mais dépendent de la date de survenue des
évènements. La courbe de survie est en marche d'escalier, chaque ligne verticale correspondant à la survenue
d'un (ou plusieurs) évènement(s). Contrairement au modèle de Cox, qui est une forme d'analyse multivariée, la
méthode de Kaplan et Meier n'introduit pas de covariables (analyse univariée).

Kappa
Un des coefficients les plus utilisés pour mesurer le degré de concordance entre des juges classant les mêmes
individus (par exemple, des patients) dans une ou plusieurs catégories préalablement définies (par exemple,
des diagnostics). Il est égal à 1 en cas de concordance parfaite et à 0 en cas de concordance nulle.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 17


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

L
Loi normale (Normal distribution)
Appelée aussi loi de Gauss ou loi de Laplace-Gauss, il s’agit d’une distribution symétrique et unimodale où la
moyenne, la médiane et le mode se confondent, réalisant une courbe en cloche. Cette loi occupe une place
primordiale en statistique du point de vue théorique et pratique. Si la distribution est gaussienne, les deux tiers
des observations sont situées entre -1 et +1 écart-type autour de la moyenne, 95 % des observations sont
situées entre -2 et +2 écart-types autour de la moyenne.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 18


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

M
Médecine fondée sur les preuves (Evidence-Based Medicine)
La médecine fondée sur les preuves (EBM) désigne l'utilisation judicieuse de résultats de la recherche
scientifique systématiquement rassemblés lors de la prise de décision pour des patients individuels. La
transposition de l'EBM dans la pratique implique d'intégrer l'expertise clinique ainsi que les preuves scientifiques
disponibles et les préférences du patient qui jouent un rôle important.

Médiane (Median)
Lorsque les observations de l'échantillon sont classées selon leur valeur, la médiane est la valeur du milieu. Elle
sépare l’échantillon en deux parties de même effectif et correspond au 50° percentile ou encore au 2° quartile.

Méta-analyse (Meta-analysis)
C'est une synthèse méthodique dans laquelle les résultats d'études cliniques comparables sont sommés
(poolés) et recalculés. Cette technique permet de tirer des conclusions plus fiables sur l'efficacité
d'interventions ou traitements.

Mode (Mode)
Correspond à la valeur (variable discrète) ou à la plage des valeurs (variable continue) la plus souvent
rencontrée dans l'échantillon. Une distribution unimodale présente un seul pic de fréquence, une distribution
bimodale présente deux pics de fréquence

Modèle de Cox
Voir Cox

Modèle des risques proportionnels


Voir Cox

Modificateur d'effet (Effect modifier)


C'est un facteur qui modifie l'effet d'un facteur causal possible étudié. L'âge par exemple est souvent un
modificateur d'effet. La prédisposition génétique peut être également modificatrice d'effet pour certaines formes
de cancer. Parfois appelé interaction.

Moyenne (Mean)
Par défaut, la moyenne arithmétique est égale à la somme des valeurs divisée par l'effectif. Son calcul n'a de
sens que sur des variables continues ou discrètes.

Multicentrique (Multicenter study)


Une étude est dite multicentrique si elle se déroule dans plusieurs centres (par opposition à une étude
monocentrique). Un centre peut être un hôpital, une clinique ou une pratique médicale de généraliste(s). Tous
les centres appliquent le même protocole d'étude. Les résultats de tous les centres sont rassemblés et analysés
comme étant ceux d'une seule étude.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 19


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

N
Nombre de sujets nécessaires (Sample size)
Voir Taille de l'échantillon

Nombre de sujets nécessaires de traiter (Number need to treat)


Le nombre de sujets nécessaires de traiter (NNT) correspond au nombre moyen de sujets qu'il est nécessaire
de traiter pour éviter un évènement. Il est égal à l'inverse de la différence de risque. Pour une différence de
risque de -5% (-0,05), le NNT est de -20 : il faut traiter en moyenne 20 patients pour éviter un évènement, le
signe moins témoigne de l'effet bénéfique du traitement.

Nombre de sujets nécessaires pour nuire (Number need to harm)


Le nombre de sujets nécessaires pour nuire (NNH) est le nombre de personnes qu'il faut traiter pour observer
un effet négatif (un effet secondaire nuisible ou un décès) consécutif à l'intervention. Il est égal à l'inverse de la
différence de risque. Pour une différence de risque de 2% (0,02), le NNH est de 50 : il faut traiter en moyenne
50 patients pour provoquer un évènement négatif, le signe plus témoigne de l'effet nocif de l'intervention.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 20


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

O
Observance (Compliance)
Le fait de se conformer, pour le sujet inclus dans l'étude, aux prescriptions du corps médical, et pour le
chercheur au protocole de recherche.

Odds ratio
L'odds ou cote est le rapport entre la probabilité d'un évènement divisée par la probabilité de l'absence de cet
évènement. La cote de la maladie chez les exposés est le nombre de malades divisé par le nombre de non
malades chez les exposés. Le rapport entre deux cotes constitue l'odds ratio (OR) : par exemple la cote de la
maladie chez les exposés divisée par la cote de la maladie chez les non exposés. L'OR mesure la force du lien
entre deux caractères qualitatifs (par exemple une exposition présente ou absente et une maladie présente ou
absente). Il est égal à 1 ou proche de 1 en l'absence de lien ; il est inférieur à 1 si le facteur est protecteur ; il
est supérieur à 1 si le facteur est nocif. Si la maladie est rare (prévalence < 5 à 10%), l'OR s'interprète comme
un risque relatif : un OR égal à 2 signifie que l'exposition multiplie (environ) par deux le risque de maladie.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 21


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

P
p valeur (p value)
Probabilité d'avoir observé une différence au moins aussi grande que celle qui a été effectivement observée si
en réalité il n'y a pas de différence (c'est-à-dire si H0 est vraie). Autrement dit, la p valeur est la probabilité que
la différence (l'association) puisse être expliquée par le hasard, les fluctuations d'échantillonnage. La différence
sera déclarée statistiquement significative si p est inférieur ou égal au risque alpha, habituellement si p ≤ 0,05.

Perdu de vue (Lost to follow up)


Sujet dont on n'a plus de nouvelle et dont on a perdu la trace au cours d'une étude prospective et pour lequel
les informations le concernant ne seront pas disponibles au moment de l'analyse.

Placebo
Voir effet placebo

Population
En statistique, une population est un ensemble d'unités susceptibles d'être observées (qui peuvent ne pas être
des personnes physiques). En épidémiologie, il convient de distinguer la population examinée, que l'on peut
également qualifier d'échantillon, de la population d'où provient cet échantillon. Dans l'un et l'autre cas, la
population doit être, dans la mesure du possible, définie et décrite de manière précise.

Population cible (Target population)


Constituée par l'ensemble des sujets visés par l'étude, auxquels on veut généraliser les résultats.

Parallèle (Parallel groups)


Un essai en groupes parallèles (ou en bras parallèles) constitue l’archétype de l’essai thérapeutique. Il consiste
à comparer deux ou plusieurs groupes de patients différents, constitués par randomisation et suivis en
parallèles. Il s’agit le plus souvent d’essai sur deux groupes parallèles où le traitement à étudier est comparé à
un traitement contrôle (placebo ou traitement actif). Les essais en parallèles s’opposent aux essais croisés dans
lesquels chaque patient reçoit l’ensemble des traitements à comparer.

Plan factoriel (Factorial design)


Il s’agit d’études dans lesquelles on explore simultanément l’effet de plusieurs thérapeutiques ou facteurs en
association. Par exemple, si deux traitements A et B sont évalués par un plan factoriel, alors ¼ des patients
recevront le traitement A et le traitement B, ¼ des patients recevront le traitement A et le placebo du
traitement B, ¼ des patients recevront le placebo du traitement A et le traitement B et ¼ des patients
recevront le placebo de A et le placebo de B.

Précision (Precision)
Propriété d'une mesure rendant compte de la dispersion des valeurs qu'elle fournit autour de sa moyenne pour
une grandeur donnée. La mesure sera d'autant plus précise que la dispersion des valeurs autour de la moyenne
sera faible.

Prévalence (Prevalence)
Nombre de personnes atteintes d'une maladie à un moment donné rapporté à l'effectif de la population
présente au même moment.

Probabilité post-test (Post-test probability)


Nouvelle probabilité d'une maladie ou d'un caractère fournie par la connaissance du résultat d'un signe clinique
ou d'un examen paraclinique. La probabilité post-test d'un résultat positif est la valeur prédictive positive, la
probabilité post-test d'un résultat négatif est égale à 1 moins la valeur prédictive négative. Synonyme :
probabilité secondaire.

Probabilité pré-test (Pre-test probability)


Probabilité d'une maladie ou d'un caractère dans une population avant l'application d'un test ou avant la
connaissance de son résultat. Elle correspond par exemple à la prévalence de la maladie dans la population
étudiée. Synonyme : probabilité primaire.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 22


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

Protocole (Protocol)
Description de l'ensemble des étapes nécessaires pour la réalisation d'une étude. Dans une étude, la mise au
point du protocole est au moins aussi importante que le recueil des données, car la validité des résultats
dépend de cette mise au point.

Puissance statistique (Statistical power)


La puissance d'un test (ou d'une étude) est la probabilité de conclure, à partir de l'échantillon, à une différence
ou à effet statistiquement significatif lorsque cette différence ou cet effet existe réellement dans la population.
La puissance est le complément de l’erreur de deuxième espèce (risque ß) ; elle est notée 1-ß. Une étude
manque de puissance lorsque la conception de son protocole ou les conditions de sa réalisation ne permettent
pas de mettre en évidence un effet ou une différence, quand ceux-ci existent réellement dans la population.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 23


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

Q
QALY (Quality adjusted life years)
QALY (Quality Adjusted Life Years) est défini comme une année en bonne santé. Si à la suite d'une intervention,
l'espérance de vie est prolongée d'une année en bonne santé, le résultat est un QALY. De même si
l'intervention ne prolonge pas la durée de vie mais améliore la qualité de vie, par exemple en passant d'une
qualité réduite d'un tiers à une qualité entière pendant trois ans, il y aura également un gain d'un QALY. La
valeur de la qualité de vie a été déterminée à partir des préférences des individus ou de la société concernant
les états de santé. Elles ont été évaluées à l'aide de questionnaires individuels dans lesquels ont été relevées
les valeurs que chacun attache à un certain état de santé (par exemple l'état après un infarctus du myocarde
ou après un accident vasculaire cérébral provoquant une hémiplégie) comparé à un état de santé intègre. Sur
la base des données d'un grand nombre de répondants, des tables ont été établies et sont utilisées pour le
calcul des QALYs.

Qualité de vie
Il s’agit de l'ensemble des satisfactions et insatisfactions éprouvées par un sujet à propos de sa vie actuelle en
général. Ces éléments peuvent être évalués de manière quantitative mais aussi qualitative. La qualité de vie
recouvre plusieurs dimensions qui sont physique, psychique et cognitive. II s'agit donc d'un concept complexe
et multidimensionnel. Il existe classiquement trois grandes familles d'instruments permettant d'évaluer la
qualité de vie : les mesures d'utilité tels que les Qalys (voir ce mot), les instruments de mesure de qualité de
vie génériques (par exemple le questionnaire SF-36), des instruments de mesure de qualité de vie spécifiques à
une spécialité médicale (par exemple le questionnaire de Saint George en cas de pathologie respiratoire).

Quantile (Quantile)
Les quantiles d'une variable quantitative permettent de diviser la population en groupes d'effectifs égaux. Les
quartiles divisent la population en quatre groupes d'effectifs égaux, les quintiles en cinq, les déciles en dix et les
percentiles en cent.

Quartile (Quartile)
Lorsque les valeurs de l'échantillon sont classées par ordre croissant, les quartiles sont les 3 valeurs qui
séparent l'échantillon en 4 parties égales. 25 % des valeurs sont inférieures au premier quartile, 50 % des
valeurs sont inférieures au deuxième quartile (2° quartile = médiane) et 75% des valeurs sont inférieures au 3°
quartile.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 24


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

R
Randomisation (Randomization)
Répartition d'un échantillon ou d'une population en deux ou plusieurs groupes comparables, à l'aide d'une
méthode fondée sur le hasard. La répartition est effectuée par tirage au sort, notamment à l'aide des tables de
nombres au hasard. C'est la meilleure solution pour contrôler l'influence des facteurs de confusion, qu'ils soient
connus ou inconnus. La randomisation a pour but de répartir également l'ensemble des caractéristiques dans
les différents groupes, de sorte que leur effet sur le critère de jugement s'annule et qu'ainsi, si une différence
est observée entre les deux groupes, elle puisse être attribuée à l'effet du facteur étudié.

Rapport de cotes
Voir odds ratio

Rapport de vraisemblance d'un résultat négatif (Negative likelihood ratio)


Est égal à (1 - sensibilité) / spécificité. Désigne dans quelle mesure on a plus de chance d'observer le signe
négatif chez un malade que chez un non malade. Exemple : le rapport de vraisemblance négatif = 0,19 quant
à l'absence d'un reflux acide (signe -) au cours du diagnostic du reflux gastro-oesophagien (maladie) : cela
signifie que l'absence d'un reflux acide est 0,19 fois plus fréquente (c'est à dire environ 5 fois moins fréquente)
en cas de reflux gastro-eosophagien qu'en son absence.

Rapport de vraisemblance d'un résultat positif (Positive likelihood ratio)


Est égal à la sensibilité / (1 - spécificité). Désigne dans quelle mesure on a plus de chance d'observer le signe
positif chez un malade que chez un non malade. Exemple : le rapport de vraisemblance positif = 4,9 quant à la
présence d'un reflux acide (signe +) au cours du diagnostic du reflux gastro-oesophagien (maladie) : cela
signifie que la présence d'un reflux acide est 4,9 fois plus fréquente en cas de reflux gastro-oesophagien qu'en
son absence.

Ratio (Ratio)
Relation de type division que deux grandeurs, deux quantités, ayant chacune une nature distincte. Exemple :
sex-ratio H/F = nombre d'hommes / nombre de femmes. Le ratio est différent de la proportion dont le
dénominateur contient le numérateur.

Réduction absolue du risque (Absolute risk reduction)


Voir différence de risque

Réduction relative du risque (Relative risk reduction)


La réduction relative du risque (RRR) est assez fréquemment utilisée à la place du risque relatif (RR) dans les
essais thérapeutiques. Elle est égale à (1 – RR) x 100. Ainsi un RR de 0,8 correspond à une RRR de 20%, un RR
de 0,66 correspond à une RRR de 33%. Voir aussi risque relatif.

Régression
Dans une analyse de régression, on utilise l'association entre deux variables afin de prédire la valeur d'une
variable à partir de l'autre variable. Dans l'analyse de régression, cette relation est décrite par l'équation
y = a + bx. Dans une régression linéaire, y peut représenter par exemple le débit expiratoire de pointe et x
représente la taille de l’enfant ; dans une régression logistique y peut représenter la survenue d’une maladie et
x l’exposition à un facteur de risque.

Régression linéaire (Linear regression)


Il s'agit de prédire la valeur d'une variable continue (poids de naissance) en fonction de la valeur d'une autre ou
de plusieurs autres variable continue (taille de la mère, âge de la mère...).

Régression logistique (Logistic regression)


Il s'agit de prédire la valeur d'une variable dichotomique (survenue d'un décès : oui / non) en fonction de la
valeur d'une autre ou de plusieurs autres variables qui peuvent être de tous types : dichotomique (métastase :
oui / non), nominale (type histologique), ordinale (extension du cancer : T1, T2, T3, T4), continue (âge, dosage
d'un marqueur tumoral).

Régression multiple (Multiple regression)


Lorsque l'on inclut plusieurs variables indépendantes dans le modèle : régression linéaire multiple, régression
logistique multiple. Réalisée dans le cadre des analyses multivariées.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 25


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

Régression simple (Simple regression)


Lorsque l'on inclut une seule variable indépendante dans le modèle : régression linéaire simple, régression
logistique simple. Réalisée dans le cadre des analyses univariées.

Régression vers la moyenne (Regression to the mean)


Tendance des résultats de mesures multiples, effectuées sur une même variable à se rapprocher de la valeur
moyenne. Ce phénomène incite à inclure les patients dans une étude après plusieurs mesures. Par exemple
inclusion du patient si la pression artérielle systolique est > 160 mm Hg à deux reprises.

Relation dose-effet (Dose-response relationship)


Relation dans laquelle un changement dans l’intensité ou la durée de l’exposition (exposition à un facteur de
risque potentiel, à un traitement) est associé à une modification du risque étudié (incidence de la maladie dans
une enquête de cohorte, critère de jugement dans un essai thérapeutique). La relation dose-effet constitue un
des critères de l’existence d’une relation causale.

Relation dose-réponse (Dose-response relationship)


Voir relation dose-effet.

Reproductibilité (Repeatability)
Indique le degré avec lequel la répétition de la mesure au cours de différents contacts cliniques produit les
mêmes résultats. Un test est reproductible s'il donne les mêmes résultats dans des situations identiques. La
quantification de la reproductibilité d'un test est fondée sur le coefficient KAPPA pour les variables qualitatives,
sur le coefficient de corrélation intra-classe pour une mesure quantitative.

Risque (Risk)
Probabilité de survenue d'un événement pendant une période donnée. En épidémiologie, cette probabilité varie
en fonction de certaines caractéristiques endogènes (âge, sexe, hérédité, ...) ou exogènes (milieu, profession,
...) qui peuvent constituer des facteurs de risque.

Risque absolu (Absolute risk)


Probabilité de survenue d'un événement exprimée sans référence à une autre probabilité. S'il s'agit de la
probabilité d'être atteint d'une maladie, le risque absolu sera souvent estimé d'après le taux d'incidence de la
maladie au sein de la population.

Risque alpha (Alpha error)


Voir erreur de type I

Risque beta (Beta error)


Voir erreur de type II

Risque relatif (RR) (Relative risk)


Il s'agit du % de survenue d'évènements chez les exposés rapporté au % de survenue d'évènements chez les
non exposés. Dans un essai thérapeutique, les exposés sont les patients sous traitement à tester, les non
exposés sont sous traitement de référence ou sous placebo. Interprétation du risque relatif : = 1 ou proche de
1 en l'absence d'effet du traitement ; inférieur à 1 en cas de facteur protecteur (exemple : RR = 0,5 => le
traitement divise par 2 la survenue de l'évènement) ; supérieur à 1 en cas de facteur nocif (exemple : RR = 10
=> l'exposition multiplie par 10 le risque de survenue de la maladie).

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 26


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

S
Sensibilité (analyse de) (Sensitivity analysis)
Voir analyse de sensibilité

Sensibilité d'un signe ou d'un test diagnostique (Sensitivity)


Il s'agit du % de test positif parmi les sujets malades (ou du % de signe présent parmi les sujets malades).
Exemple : Le test de détection de la phénylcétonurie a une sensibilité parfaite (100%) : tous les enfants
malades sont détectés par le test.

Signification clinique (Clinical significance)


Lorsque le bénéfice lié au nouveau traitement est suffisamment important pour justifier sa prescription. La
signification clinique se juge sur l’importance de l’effet (différence de risque, différence de moyenne, nombre de
sujets nécessaires de traiter…). Ainsi parfois, un effet cliniquement intéressant peut être non significatif sur le
plan statistique.

Signification statistique (Statistical significance)


Lorsque le degré de signification ‘p’ est inférieur ou égal au risque alpha. Dans un essai thérapeutique, ceci
implique que la différence est réelle et ne peut être rapportée à la chance. Cependant, une différence
statistiquement significative peut n’avoir aucun intérêt pour les patients (cas d’une petite différence constatée
sur un échantillon de grande taille).

Spearman
Voir coefficient de corrélation de Spearman

Spécificité d'un signe ou d'un test diagnostique (Specificity)


Il s'agit du % de test négatif parmi les sujets non malades (ou du % de signe absent parmi les sujets non
malades). Exemple : Le test de détection de la phénylcétonurie a une spécificité de 99,99% : pour 10 000
enfants indemnes, le test sera négatif dans 9999 cas (ou encore le taux de faux positif est de 1 pour 10 000).

Standardisation (Standardisation)
Méthode qui rend comparable des taux bruts dans des groupes qui diffèrent par la distribution d'une autre
variable (âge, sexe, niveau socio-économique, ...). Exemple : taux de mortalité standardisé sur l’âge pour
comparer la mortalité entre des pays dont la structure d’âge est différente.

Standardisation directe (Direct standardisation)


Pour l'âge, on calcule le taux que l'on observerait dans la population étudiée si elle avait la même structure
d'âge qu'une population de référence. Appelée aussi méthode de la population type.

Standardisation indirecte (Indirect standardisation)


Pour l'âge, on calcule le nombre d'événements attendu (maladies, décès, ...) dans la population étudiée, en
appliquant à chaque classe d'âge les taux spécifiques d'une population de référence. Appelée aussi méthode du
taux type.

Stratification (Stratification)
Répartition des sujets en sous-groupes ou strates, en fonction d'une ou plusieurs caractéristiques, de sorte que
chaque strate soit homogène pour cette ou ces caractéristiques. On peut ainsi stratifier les individus en fonction
de l'âge, du sexe, des deux, du niveau socio-économique, du niveau de risque. Cette méthode permet de
rendre comparable, en procédant strate par strate, deux groupes différents.

Student (Student's t test)


Voir test t

Suivi (Follow up)


C'est l'observation pendant une période de temps donnée d'un individu, d'un groupe ou d'une population dont
les caractéristiques ont été définies, afin de pouvoir observer et enregistrer tout changement ou tout
événement intéressant la santé de ces individus.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 27


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

Surveillance épidémiologique (Surveillance system)


Il s'agit d'un processus de collecte, de compilation, d'analyse des données ainsi que la diffusion à l'ensemble de
ceux qui ont besoin d'être informés. Ce processus est continu et systématique. Il doit être rapide dans le
traitement de l’information et dans la diffusion des résultats. Les informations doivent servir à la prise de
mesure de prévention ou de contrôle d’un problème de santé publique.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 28


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

T
Tableau 2 x 2 (2 x 2 Table)
Mode de représentation, sous forme de tableau, de la relation entre deux variables qualitatives : chaque ligne
représente une modalité d'une variable, chaque colonne une modalité de l'autre variable. Par exemple la
relation entre le résultat d'un test diagnostique (en ligne) et la survenue de la maladie (en colonne), ou bien la
relation entre une exposition (en ligne) et la survenue de la maladie (en colonne).

Taille de l'échantillon (Sample size)


C'est le nombre de sujets à inclure nécessairement dans l'étude afin que celle-ci ait une puissance suffisante
pour mettre en évidence l'effet recherché. Le calcul de la taille de l'échantillon nécessite la définition de l'effet
recherché, de la variance du phénomène et des risques statistiques alpha et beta. Dans un essai thérapeutique,
le calcul de la taille de l’échantillon est déterminé à partir de l’effet mesuré sur le critère de jugement principal.

Taux (Rate)
Un taux mesure la probabilité de survenue d’un évènement donné au cours du temps (taux de mortalité, taux
d’incidence, taux d’attaque).

Taux brut (Crude rate)


Taux qui rend compte uniquement d'une fréquence d'événements au sein d'une population donnée, au cours
d'une période déterminée. Il permet seulement d'évaluer l'intensité d'un phénomène de santé dans une
population, mais ne permet pas de comparer l'impact de ce phénomène dans des populations dont les
structures (d'âge, de sexe, ..) sont différentes.

Taux spécifique (Stratum-specific rate)


Taux calculé pour une fraction d'une population déterminée par une ou plusieurs caractéristiques (par exemple,
taux spécifique par tranche d'âge et par sexe, par catégorie socioprofessionnelle, par ethnie,…).

Taux standardisé (Standardized rate)


Taux calculé par des méthodes particulières (standardisation) permettant d'éliminer l'effet de certains facteurs
(par exemple, l'âge, les facteurs socioculturels,...) distribués différemment entre deux ou plusieurs populations.
On peut ainsi, comparer l'intensité d'un phénomène donné (la mortalité par exemple) dans des populations de
structures différentes. Voir aussi standardisation.

Témoin (Control)
Sujet ou groupe de sujets dont les caractéristiques servent de référence pour l'estimation de l'association entre
un ou plusieurs facteurs étudiés et un ou plusieurs critères de jugement dans la population que l'on étudie.

Tendance centrale (Central tendancy)


Différents paramètres permettent d'étudier la position centrale d'une variable dans une population. Moyenne,
médiane et mode constituent les mesures classiques de tendance centrale.

Test de Mantel-Haenszel (Cochran-Mantel-Haenszel statistic)


Le test de Mantel-Haenszel (ou Cochran-Mantel-Haenszel) est un test du Chi2 qui explore si, après contrôle
d'une autre variable, une association existe entre deux variables. Le test de Mantel-Haenszel évalue la solidité
de cette association.

Test de Kruskal-Wallis (Kruskal-Wallis test)


C'est une forme non paramétrique d'analyse de variance (ANOVA) utilisée lors de la comparaison de plus de
deux groupes. C'est un élargissement du test de Mann-Whitney qui lui est utilisé pour la comparaison de deux
groupes.

Test de Mann-Whitney (Mann Whitney U test)


Le test de Mann-Whitney est une méthode non paramétrique permettant d'évaluer la différence entre deux
groupes (équivalent du test-t). Le résultat de ce test est le "U-statistic". Quand il y a plus de deux groupes on
utilise le test de Kruskal-Wallis.

Test du Chi2 (Chi square test)


Le test du Chi2 est utilisé dans le cas de variables catégorielles, quand on veut vérifier si deux ou plusieurs
proportions observées diffèrent réellement. Ce test consiste à comparer les valeurs observées aux valeurs
attendues sur base de l'hypothèse nulle d'indépendance.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 29


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

Test du Log-Rank (Log-Rank test)


Le test du log-rank est utilisé dans le cas de variables censurées. Il sert à comparer deux ou plusieurs courbes
de survie estimées par la méthode de Kaplan-Meier ou par la méthode actuarielle. Son principe est proche de
celui du Chi2.

Test exact de Fisher (Fisher's exact test)


Le test exact de Fisher est utilisé pour comparer deux pourcentages dans le cas de petits échantillons qui ne
permettent pas d'employer le test du Chi2.

Test non paramétrique (Non-parametric test)


Les tests statistiques non paramétriques ne posent pas de conditions quant à la distribution des valeurs d'une
variable, contrairement aux tests paramétriques. On peut citer par exemple: le test de Wilcoxon de la somme
des rangs, le test de Mann-Whitney, le test de Kruskal Wallis. En contrepartie, les tests non paramétriques sont
un peu moins puissants que les tests paramétriques.

Test paramétrique (Parametric test)


Les tests paramétriques sont valides sous certaines conditions, tout particulièrement sur les petits échantillons
(effectifs des groupes < à 30). Les variables doivent suivre une distribution imposée (distribution normale le
plus souvent) et les variances des groupes à comparer doivent être égales. Le test-t et l'analyse de variance
(ANOVA) sont des tests paramétriques.

Test statistique (Statistical test)


Lorsqu'on observe une différence, soit entre un paramètre observé sur un échantillon et une valeur théorique,
soit entre les valeurs prises par ce paramètre sur plusieurs échantillons, se pose la question de savoir si l'écart
observé est seulement dû au hasard. On ne peut jamais rejeter, de façon absolue, l'hypothèse nulle selon
laquelle l'écart observé est dû au hasard, mais on sait estimer le risque d'observer un tel écart simplement par
le fait du hasard, par le calcul de la statistique de test.

Test t (t test ou Student's t test)


Le test t (ou test-t de student) est utilisé pour comparer des moyennes et examiner si les moyennes de deux
groupes diffèrent statistiquement. Après lecture du résultat du test t dans une table statistique (loi de Student),
une p valeur est obtenue. Le test t est un test paramétrique et cela suppose que les valeurs soient distribuées
normalement et que les variances des deux groupes soient égales.

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 30


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

V
Valeur extrême (Outlier)
Dans un échantillon, il s’agit de valeurs tellement extrêmes par rapport à l’ensemble des autres valeurs, que
leur appartenance à l’échantillon est mise en doute. Ces observations extrêmes peuvent traduire des erreurs de
mesure ou de saisie, ou bien correspondre à des observations bien réelles mais hors normes (dont l'analyse
peut être très utile). Ces valeurs ont une influence importante sur la moyenne estimée ; elles remettent en
cause les hypothèses de normalité et d’égalité des variances nécessaires à la mise en œuvre des méthodes
statistiques paramétriques (t-test, ANOVA, corrélation linéaire, régression linéaire).

Valeur prédictive négative (Negative predictive value)


Il s'agit du % de non malades parmi les sujets ayant un test négatif (ou du % de non malades parmi les sujets
chez qui le signe est absent). Exemple : le test de détection de la phénylcétonurie a une VPN parfaite (100%) :
tous les nouveau-nés négatifs sont indemnes de la maladie. Synonyme : probabilité post-test d'un test négatif.

Valeur prédictive positive (Positive predictive value)


Il s'agit du % de malades parmi les sujets ayant un test positif (ou du % de malades parmi les sujets chez qui
le signe est présent). Exemple : le test de détection de la phénylcétonurie a une VPP de 50 % : un nouveau-né
positif sur deux aura son diagnostic confirmé. Synonyme = probabilité post-test d'un test positif.

Validité (Validity)
Possibilité d'une méthode (enquête, examen, test diagnostique, dépistage) de fournir une valeur exacte de ce
qu'elle est censée mesurer.

Validité externe (External validity)


Possibilité de généralisation des observations issues de l'échantillon à la population générale. La validité externe
est menacée par le biais d'échantillonnage, lorsque les conclusions fondées sur un échantillon sont généralisées
à d'autres groupes qui ne sont pas semblables à l'échantillon. Synonyme : applicabilité.

Validité interne (Internal validity)


Capacité intrinsèque de la méthode à fournir des observations exactes pour les sujets ayant participé à l'étude,
dans les conditions particulières de cette étude. La validité interne d’une étude est menacée par les erreurs
systématiques (biais) et aléatoires (chance).

Variabilité (Variability)
Voit dispersion

Variable censurée (Censored data)


Donnée caractérisée par une information incomplète (survie, survie sans récidive….) : lorsque certains individus
sont encore en vie (ou n'ont pas récidivé) à l'arrêt de l'étude, leur durée de survie n'est pas connue avec
certitude mais est supérieure à leur temps de participation dans l'étude. Ces données doivent faire l'objet
d'analyse spécifiques dites de survie (méthodes de Kaplan-Meier ou actuarielles, tests de Log-Rank, modèle de
Cox...).

Variable aléatoire (Random variable)


Caractérise le procédé qui associe une valeur à chaque sujet de la population. Le terme aléatoire (souvent non
prononcé) signifie qu'on ne peut pas prédire avec certitude, avant la mesure ou l'observation, la valeur de la
variable pour un sujet : le patient sera-t-il décédé ou pas 5 ans après le diagnostic ? sera-t-il en rémission
complète ou pas à 6 mois ? quelle sera sa calcémie ?….

Variable qualitative (Nominal-scale data ; ordinal-scale data)


Il s'agit de données non manipulables d’un point de vue arithmétique, sans lien numérique entre catégories.
Les différents états ou les différentes valeurs d’une variable qualitative sont appelées modalités ou classes. On
distingue les variables qualitatives ordinales lorsqu'il existe un ordre logique entre les classes (degré
d’extension d’un cancer : in situ – localisé – locorégional - métastatique), les variables qualitatives nominales
quand il n'y a pas de lien logique entre les catégories (groupe sanguin : A, B, O, AB).

Variable quantitative (Quantitative variable)


Données manipulables d’un point de vue arithmétique ; la variable est discrète s'il s'agit de dénombrements
(nombre d'enfants), elle est continue s'il s'agit de mesures pouvant présenter une infinité de valeurs dans un
intervalle donné (taille, poids).

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 31


FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication

Variance (Variance)
Moyennes des carrés des écarts entre les valeurs et la moyenne. Appartient aux mesures de dispersion.

Vrais négatifs (True negative)


Il s'agit des sujets ayant un test négatif (ou chez qui le signe est absent) parmi les non malades. Le taux de
vrai négatif chez les non malades est la spécificité.

Vrais positifs (True positive)


Il s'agit des sujets ayant un test positif (ou chez qui le signe est présent) parmi les malades. Le taux de vrai
positif chez les malades est la sensibilité.

Vraisemblance (Likelihood)
Voir rapport de vraisemblance

12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 32

Vous aimerez peut-être aussi