Académique Documents
Professionnel Documents
Culture Documents
GLOSSAIRE
Tous les termes de ce glossaire sont suivis entre parenthèses de leur équivalent utilisé dans la littérature anglo-
saxonne
A
Actuarielle (Actuarial)
La méthode actuarielle est utilisée pour construire des tables de survie. La méthode prend en compte le fait que
certaines personnes ne peuvent pas être suivies jusqu'au moment où l'événement étudié se produit. A la
différence de la méthode de Kaplan-Meier, les intervalles de temps où est estimée la survie sont fixes et définis
à priori. La courbe de survie a l'allure d'une ligne brisée. Contrairement au modèle de Cox, qui est une forme
d'analyse multivariée, la méthode actuarielle n'introduit pas de covariables (analyse univariée).
Ajustement (Adjustment)
Ensemble des procédures ayant pour objectif d'éliminer l'effet de certaines variables, considérées comme
parasites, dans l'étude de la relation entre un facteur que l'on étudie et un critère de jugement. Le terme
d'ajustement est réservé aux procédures utilisées après le recueil des données, dans l'analyse des résultats
(par régression ou standardisation ou stratification).
Appariement (Matching)
L'appariement est une technique destinée à rendre comparable la distribution de deux ou plusieurs groupes
selon des caractéristiques pertinentes, ce qui permet de prévenir un biais de confusion lié à ces
caractéristiques. L'âge et le sexe, par exemple, font souvent l'objet d'un appariement. Dans un essai
thérapeutique, le patient peut jouer le rôle de son propre témoin (il est alors apparié sur lui-même). L'analyse
des données appariées fait appel à des techniques spécifiques (test du X2 apparié, test t en séries appariées,
test de rang de Wilcoxon...).
Applicabilité (Applicability)
Voir validité externe
12.03.2006 G Daideri – J Testa – F Berthier – P Staccini 2
FACULTE DE MEDECINE DE NICE Laboratoire STIC Santé
28, avenue de Valombrose Biostatistique, Informatique Médicale
06 107 Nice Cedex 2 et Technologies de Communication
Association (Relationship)
Dépendance entre deux variables qui peuvent être soit qualitatives (un traitement A ou B et une guérison
présente ou absente), soit qualitatives et quantitatives (un traitement A ou B et la cholestérolémie
plasmatique), soit quantitatives (posologie d'un médicament et cholestérolémie plasmatique). Synonymes :
relation, lien.
Aveugle (Blind)
Procédure destinée à éviter un biais de mesure ou un biais d'information. Synonyme : insu.
B
Bénéfice absolu
Voir différence de risques
Bénéfice relatif
Voir risque relatif
Biais (Bias)
Un biais est une variété d’erreur dite « systématique » qui s’introduit dans une étude à différente stades : au
moment de la constitution des groupes, de la collecte ou de l’analyse des données, et de l’interprétation des
résultats. Les estimations seront donc systématiquement erronées dans le même sens : soit plus élevées, soit
plus basses que la valeur réelle des paramètres que l'on étudie. Le biais est à différencier de l'erreur due au
hasard ou fluctuation d'échantillonnage. Il altère la fiabilité des résultats d’une enquête.
Bras (Arm)
Il s’agit d’un groupe de patients constitué par randomisation et assigné à un même traitement. Voir parallèle.
C
Cas : cas rapporté (Case report)
Les cas rapportés (ou cas clinique), en décrivant une observation inhabituelle, constituent souvent la première
étape de la reconnaissance d'une nouvelle maladie ou d'un nouveau facteur de risque. Les cas rapportés
traduisent avant tout l'expérience et l'observation d'un auteur et ne permettent pas de tirer de conclusions
qu'on puisse généraliser à d'autres cas. Ils ne permettent pas d'établir la fréquence d'une maladie : une étude
d'incidence ou de prévalence serait nécessaire pour ce faire. Ces études ne permettent pas non plus d'apprécier
de manière statistique l'importance d'un facteur de risque qu'elles peuvent éventuellement suggérer.
Causalité (Causation)
Voir épidémiologie analytique
Cohorte (Cohort)
Voir enquête de cohorte
Contrôle (Control)
Voir témoin
Corrélation (Correlation)
Une corrélation est une association entre deux variables quantitatives. On peut constater par exemple qu'une
association existe entre la taille et le poids : les personnes plus grandes ont un poids généralement supérieur à
celui des personnes plus petites. Pour voir dans quelle mesure cette association est linéaire (donc peut être
résumée par une ligne droite), on calcule le coefficient de corrélation.
Cote (Odds)
Voir Odds ratio
D
Degré de signification (p value)
Voir p valeur
Dépistage (Screening)
Recherche chez une personne en bonne santé apparente des signes d'une maladie avant qu'elle ne se déclare.
Différence absolue
Voir différence de risques
Dispersion (Dispersion)
Une mesure de dispersion estime la variabilité des observations autour du centre de la distribution. La variance,
l'écart-type, l'intervalle inter-quartile et l'étendue constituent des mesures de dispersion classiques.
Distribution
Voir loi
E
Ecart-type (Standard deviation)
Cette mesure de dispersion traduit la variabilité des mesures au sein de l'échantillon. Il s'agit de la moyenne
des écarts des observations par rapport à la moyenne de l’ensemble des observations. Son calcul passe par le
carré des écarts à la moyenne (variance). Dans une distribution normale, 95% des observations sont situées
entre -2 et +2 écarts types autour de la moyenne.
Echantillon (Sample)
Ensemble des sujets sur lesquels les données ont été recueillies.
Epidémiologie (Epidemiology)
Il s'agit de l'étude de la fréquence et de la répartition dans le temps et dans l'espace des problèmes de santé
dans les populations humaines, ainsi que le rôle des facteurs qui les déterminent.
Essai (Trial)
Expérimentation à visée interventionniste - intervention thérapeutique, de dépistage, de prévention ou
d'éducation - dans laquelle l'évaluation des effets sur le groupe de sujets étudiés se fait par rapport à un
groupe témoin de référence : on peut comparer une intervention à l'absence d'intervention, ou à une ou
plusieurs autres interventions du même type, l'objectif étant de déterminer s'il existe une différence entre elles.
Estimation (Assessment)
Estimer un paramètre (inconnu) caractéristique d'une population consiste à en proposer une valeur, appelée
estimation, calculée à partir d'un échantillon. Une estimation est donnée avec son intervalle de confiance.
Exemple : la fréquence d'une maladie, observée sur un échantillon obtenu par tirage aléatoire simple, est une
estimation de la fréquence de la maladie dans la population.
Etendue (Range)
Il s'agit de la différence entre la valeur la plus haute et la valeur la plus basse. Par exemple, sur un échantillon
de 100 patients âgés de 25 à 90 ans, l'étendue est de 65 ans.
F
Facteur de risque (Risk factor)
Caractéristique individuelle ou collective, endogène (propre à l'individu) ou exogène (liée à l'environnement),
qui augmente la probabilité de survenue d'une maladie ou de tout autre phénomène de santé. Le lien est
purement statistique et ne préjuge en rien de la causalité.
G
Graphique de dispersion (Scatter plot)
Un graphique de dispersion, appelé aussi nuage de points, est un résumé graphique de données bivariées (de
deux variables) permettant de visualiser une corrélation linéaire ou de construire une ligne de régression.
Chaque unité est représentée par un point dans le nuage et les points ne sont pas reliés entre eux. Un nuage
de points est utilisé au cours de la première phase d'une analyse pour explorer les données. Cela permet
d'avoir des informations sur la moyenne, la forme de la distribution et les valeurs extrêmes.
Gold standard
C'est une méthode, procédure ou mesure qui est généralement considérée comme la meilleure méthode
disponible. Un gold standard (test de référence) est surtout utilisé lors de la comparaison de tests diagnostiques
et est alors défini comme le test qui peut discriminer le mieux entre les patients atteints ou non d'une maladie
déterminée. Étant donné le fait que le gold standard est souvent un test complexe ou invasif (par exemple
l'augmentation des antistreptolysines sériques entre un 2ème et un 1er prélèvement pour affirmer l'origine
streptococcique d'un mal de gorge aigu) on utilise en pratique des tests diagnostiques moins précis. La valeur
d'un test diagnostique est exprimée par rapport au gold standard en termes de sensibilité et de spécificité.
H
Healthy worker effect
C'est une forme de biais de sélection qui a été, à l'origine, mis en exergue dans le cadre de la recherche en
médecine du travail. Lors de la comparaison d'une population active avec la population générale, on a constaté
que les taux de morbidité et de mortalité sont moindres dans le premier groupe. Ce phénomène peut être
expliqué par le fait que la population active est en moyenne en meilleure santé que la population générale qui
se compose également des personnes trop malades pour travailler.
I
IMRed (IMRaD)
Introduction, Méthodes, Résultats et Discussion. Il s'agit des sections composant la structure d'un article
scientifique.
Incidence (Incidence)
Nombre de nouveaux cas d'une maladie pendant une période donnée rapporté à l'effectif des personnes
susceptibles de contracter cette maladie pendant la même période. Par exemple, l'incidence du cancer colo-
rectal en France était de 58 cas / 100 000 habitants en 1995.
Insu (Blind)
Voir aveugle
Interaction (Interaction)
On parle d’interaction entre le traitement et une autre variable lorsque que le bénéfice thérapeutique est
différent selon la valeur prise par la variable. L’interaction est dite quantitative lorsque le meilleur traitement
reste le même mais que l’écart augmente en fonction de la valeur de la variable. Par exemple, le bénéfice d’une
chimiothérapie intensive est d’autant plus important que le score selon l’index pronostique est élevé.
L’interaction est dite qualitative lorsque le meilleur traitement change en fonction de la valeur de la variable.
Par exemple, l’effet d’une chimiothérapie intensive est positif chez les sujets jeunes mais négatif chez les sujets
âgés.
K
Kaplan-Meier
L'estimation de Kaplan-Meier est une méthode (non paramétrique) développée par Kaplan et Meier (1958) pour
construire des tables de survie. La méthode prend en compte le fait que certaines personnes ne peuvent pas
être suivies jusqu'au moment où l'événement étudié se produit. A la différence de la méthode actuarielle, les
intervalles de temps où sont estimés la survie ne sont pas fixes mais dépendent de la date de survenue des
évènements. La courbe de survie est en marche d'escalier, chaque ligne verticale correspondant à la survenue
d'un (ou plusieurs) évènement(s). Contrairement au modèle de Cox, qui est une forme d'analyse multivariée, la
méthode de Kaplan et Meier n'introduit pas de covariables (analyse univariée).
Kappa
Un des coefficients les plus utilisés pour mesurer le degré de concordance entre des juges classant les mêmes
individus (par exemple, des patients) dans une ou plusieurs catégories préalablement définies (par exemple,
des diagnostics). Il est égal à 1 en cas de concordance parfaite et à 0 en cas de concordance nulle.
L
Loi normale (Normal distribution)
Appelée aussi loi de Gauss ou loi de Laplace-Gauss, il s’agit d’une distribution symétrique et unimodale où la
moyenne, la médiane et le mode se confondent, réalisant une courbe en cloche. Cette loi occupe une place
primordiale en statistique du point de vue théorique et pratique. Si la distribution est gaussienne, les deux tiers
des observations sont situées entre -1 et +1 écart-type autour de la moyenne, 95 % des observations sont
situées entre -2 et +2 écart-types autour de la moyenne.
M
Médecine fondée sur les preuves (Evidence-Based Medicine)
La médecine fondée sur les preuves (EBM) désigne l'utilisation judicieuse de résultats de la recherche
scientifique systématiquement rassemblés lors de la prise de décision pour des patients individuels. La
transposition de l'EBM dans la pratique implique d'intégrer l'expertise clinique ainsi que les preuves scientifiques
disponibles et les préférences du patient qui jouent un rôle important.
Médiane (Median)
Lorsque les observations de l'échantillon sont classées selon leur valeur, la médiane est la valeur du milieu. Elle
sépare l’échantillon en deux parties de même effectif et correspond au 50° percentile ou encore au 2° quartile.
Méta-analyse (Meta-analysis)
C'est une synthèse méthodique dans laquelle les résultats d'études cliniques comparables sont sommés
(poolés) et recalculés. Cette technique permet de tirer des conclusions plus fiables sur l'efficacité
d'interventions ou traitements.
Mode (Mode)
Correspond à la valeur (variable discrète) ou à la plage des valeurs (variable continue) la plus souvent
rencontrée dans l'échantillon. Une distribution unimodale présente un seul pic de fréquence, une distribution
bimodale présente deux pics de fréquence
Modèle de Cox
Voir Cox
Moyenne (Mean)
Par défaut, la moyenne arithmétique est égale à la somme des valeurs divisée par l'effectif. Son calcul n'a de
sens que sur des variables continues ou discrètes.
N
Nombre de sujets nécessaires (Sample size)
Voir Taille de l'échantillon
O
Observance (Compliance)
Le fait de se conformer, pour le sujet inclus dans l'étude, aux prescriptions du corps médical, et pour le
chercheur au protocole de recherche.
Odds ratio
L'odds ou cote est le rapport entre la probabilité d'un évènement divisée par la probabilité de l'absence de cet
évènement. La cote de la maladie chez les exposés est le nombre de malades divisé par le nombre de non
malades chez les exposés. Le rapport entre deux cotes constitue l'odds ratio (OR) : par exemple la cote de la
maladie chez les exposés divisée par la cote de la maladie chez les non exposés. L'OR mesure la force du lien
entre deux caractères qualitatifs (par exemple une exposition présente ou absente et une maladie présente ou
absente). Il est égal à 1 ou proche de 1 en l'absence de lien ; il est inférieur à 1 si le facteur est protecteur ; il
est supérieur à 1 si le facteur est nocif. Si la maladie est rare (prévalence < 5 à 10%), l'OR s'interprète comme
un risque relatif : un OR égal à 2 signifie que l'exposition multiplie (environ) par deux le risque de maladie.
P
p valeur (p value)
Probabilité d'avoir observé une différence au moins aussi grande que celle qui a été effectivement observée si
en réalité il n'y a pas de différence (c'est-à-dire si H0 est vraie). Autrement dit, la p valeur est la probabilité que
la différence (l'association) puisse être expliquée par le hasard, les fluctuations d'échantillonnage. La différence
sera déclarée statistiquement significative si p est inférieur ou égal au risque alpha, habituellement si p ≤ 0,05.
Placebo
Voir effet placebo
Population
En statistique, une population est un ensemble d'unités susceptibles d'être observées (qui peuvent ne pas être
des personnes physiques). En épidémiologie, il convient de distinguer la population examinée, que l'on peut
également qualifier d'échantillon, de la population d'où provient cet échantillon. Dans l'un et l'autre cas, la
population doit être, dans la mesure du possible, définie et décrite de manière précise.
Précision (Precision)
Propriété d'une mesure rendant compte de la dispersion des valeurs qu'elle fournit autour de sa moyenne pour
une grandeur donnée. La mesure sera d'autant plus précise que la dispersion des valeurs autour de la moyenne
sera faible.
Prévalence (Prevalence)
Nombre de personnes atteintes d'une maladie à un moment donné rapporté à l'effectif de la population
présente au même moment.
Protocole (Protocol)
Description de l'ensemble des étapes nécessaires pour la réalisation d'une étude. Dans une étude, la mise au
point du protocole est au moins aussi importante que le recueil des données, car la validité des résultats
dépend de cette mise au point.
Q
QALY (Quality adjusted life years)
QALY (Quality Adjusted Life Years) est défini comme une année en bonne santé. Si à la suite d'une intervention,
l'espérance de vie est prolongée d'une année en bonne santé, le résultat est un QALY. De même si
l'intervention ne prolonge pas la durée de vie mais améliore la qualité de vie, par exemple en passant d'une
qualité réduite d'un tiers à une qualité entière pendant trois ans, il y aura également un gain d'un QALY. La
valeur de la qualité de vie a été déterminée à partir des préférences des individus ou de la société concernant
les états de santé. Elles ont été évaluées à l'aide de questionnaires individuels dans lesquels ont été relevées
les valeurs que chacun attache à un certain état de santé (par exemple l'état après un infarctus du myocarde
ou après un accident vasculaire cérébral provoquant une hémiplégie) comparé à un état de santé intègre. Sur
la base des données d'un grand nombre de répondants, des tables ont été établies et sont utilisées pour le
calcul des QALYs.
Qualité de vie
Il s’agit de l'ensemble des satisfactions et insatisfactions éprouvées par un sujet à propos de sa vie actuelle en
général. Ces éléments peuvent être évalués de manière quantitative mais aussi qualitative. La qualité de vie
recouvre plusieurs dimensions qui sont physique, psychique et cognitive. II s'agit donc d'un concept complexe
et multidimensionnel. Il existe classiquement trois grandes familles d'instruments permettant d'évaluer la
qualité de vie : les mesures d'utilité tels que les Qalys (voir ce mot), les instruments de mesure de qualité de
vie génériques (par exemple le questionnaire SF-36), des instruments de mesure de qualité de vie spécifiques à
une spécialité médicale (par exemple le questionnaire de Saint George en cas de pathologie respiratoire).
Quantile (Quantile)
Les quantiles d'une variable quantitative permettent de diviser la population en groupes d'effectifs égaux. Les
quartiles divisent la population en quatre groupes d'effectifs égaux, les quintiles en cinq, les déciles en dix et les
percentiles en cent.
Quartile (Quartile)
Lorsque les valeurs de l'échantillon sont classées par ordre croissant, les quartiles sont les 3 valeurs qui
séparent l'échantillon en 4 parties égales. 25 % des valeurs sont inférieures au premier quartile, 50 % des
valeurs sont inférieures au deuxième quartile (2° quartile = médiane) et 75% des valeurs sont inférieures au 3°
quartile.
R
Randomisation (Randomization)
Répartition d'un échantillon ou d'une population en deux ou plusieurs groupes comparables, à l'aide d'une
méthode fondée sur le hasard. La répartition est effectuée par tirage au sort, notamment à l'aide des tables de
nombres au hasard. C'est la meilleure solution pour contrôler l'influence des facteurs de confusion, qu'ils soient
connus ou inconnus. La randomisation a pour but de répartir également l'ensemble des caractéristiques dans
les différents groupes, de sorte que leur effet sur le critère de jugement s'annule et qu'ainsi, si une différence
est observée entre les deux groupes, elle puisse être attribuée à l'effet du facteur étudié.
Rapport de cotes
Voir odds ratio
Ratio (Ratio)
Relation de type division que deux grandeurs, deux quantités, ayant chacune une nature distincte. Exemple :
sex-ratio H/F = nombre d'hommes / nombre de femmes. Le ratio est différent de la proportion dont le
dénominateur contient le numérateur.
Régression
Dans une analyse de régression, on utilise l'association entre deux variables afin de prédire la valeur d'une
variable à partir de l'autre variable. Dans l'analyse de régression, cette relation est décrite par l'équation
y = a + bx. Dans une régression linéaire, y peut représenter par exemple le débit expiratoire de pointe et x
représente la taille de l’enfant ; dans une régression logistique y peut représenter la survenue d’une maladie et
x l’exposition à un facteur de risque.
Reproductibilité (Repeatability)
Indique le degré avec lequel la répétition de la mesure au cours de différents contacts cliniques produit les
mêmes résultats. Un test est reproductible s'il donne les mêmes résultats dans des situations identiques. La
quantification de la reproductibilité d'un test est fondée sur le coefficient KAPPA pour les variables qualitatives,
sur le coefficient de corrélation intra-classe pour une mesure quantitative.
Risque (Risk)
Probabilité de survenue d'un événement pendant une période donnée. En épidémiologie, cette probabilité varie
en fonction de certaines caractéristiques endogènes (âge, sexe, hérédité, ...) ou exogènes (milieu, profession,
...) qui peuvent constituer des facteurs de risque.
S
Sensibilité (analyse de) (Sensitivity analysis)
Voir analyse de sensibilité
Spearman
Voir coefficient de corrélation de Spearman
Standardisation (Standardisation)
Méthode qui rend comparable des taux bruts dans des groupes qui diffèrent par la distribution d'une autre
variable (âge, sexe, niveau socio-économique, ...). Exemple : taux de mortalité standardisé sur l’âge pour
comparer la mortalité entre des pays dont la structure d’âge est différente.
Stratification (Stratification)
Répartition des sujets en sous-groupes ou strates, en fonction d'une ou plusieurs caractéristiques, de sorte que
chaque strate soit homogène pour cette ou ces caractéristiques. On peut ainsi stratifier les individus en fonction
de l'âge, du sexe, des deux, du niveau socio-économique, du niveau de risque. Cette méthode permet de
rendre comparable, en procédant strate par strate, deux groupes différents.
T
Tableau 2 x 2 (2 x 2 Table)
Mode de représentation, sous forme de tableau, de la relation entre deux variables qualitatives : chaque ligne
représente une modalité d'une variable, chaque colonne une modalité de l'autre variable. Par exemple la
relation entre le résultat d'un test diagnostique (en ligne) et la survenue de la maladie (en colonne), ou bien la
relation entre une exposition (en ligne) et la survenue de la maladie (en colonne).
Taux (Rate)
Un taux mesure la probabilité de survenue d’un évènement donné au cours du temps (taux de mortalité, taux
d’incidence, taux d’attaque).
Témoin (Control)
Sujet ou groupe de sujets dont les caractéristiques servent de référence pour l'estimation de l'association entre
un ou plusieurs facteurs étudiés et un ou plusieurs critères de jugement dans la population que l'on étudie.
V
Valeur extrême (Outlier)
Dans un échantillon, il s’agit de valeurs tellement extrêmes par rapport à l’ensemble des autres valeurs, que
leur appartenance à l’échantillon est mise en doute. Ces observations extrêmes peuvent traduire des erreurs de
mesure ou de saisie, ou bien correspondre à des observations bien réelles mais hors normes (dont l'analyse
peut être très utile). Ces valeurs ont une influence importante sur la moyenne estimée ; elles remettent en
cause les hypothèses de normalité et d’égalité des variances nécessaires à la mise en œuvre des méthodes
statistiques paramétriques (t-test, ANOVA, corrélation linéaire, régression linéaire).
Validité (Validity)
Possibilité d'une méthode (enquête, examen, test diagnostique, dépistage) de fournir une valeur exacte de ce
qu'elle est censée mesurer.
Variabilité (Variability)
Voit dispersion
Variance (Variance)
Moyennes des carrés des écarts entre les valeurs et la moyenne. Appartient aux mesures de dispersion.
Vraisemblance (Likelihood)
Voir rapport de vraisemblance