Académique Documents
Professionnel Documents
Culture Documents
Eléments de statistiques
médicales
2018-2019
MV
2
1e partie :
I. Introduction :
Exemple :
- Population trop grande : population = femmes atteintes d’un cancer du sein.
- Population virtuelle (échantillon) : population = femmes atteintes d’un cancer du
sein et soignées avec un nouveau traitement bien spécifique.
Les outils utilisés pour décrire une population sont les paramètres statistiques.
Les outils utilisés pour décrire un échantillon sont des statistiques .
Unité expérimentale : chacun des éléments de l’échantillon sur lesquels les mesures sont
réalisées (x)
But : inférer les caractéristiques de la population d’origine à partir des données obtenues
sur l’échantillon.
On utilise des données d’échantillon pour :
- Estimer la valeur d’un paramètre d’une population
- Tester une hypothèse sur la population
MV
3
Statistique = science qui permet de tirer des conclusions sur une population au départ
d’observations faites sur un échantillon représentatif de cette population. = recensement
Attention : il s’établit avant le début de l’expérience. Des décisions critiques pour la réussite
de l’expérience et l’analyse statistique des données sont prise dès ce moment.
But : Créer des groupes semblables auxquels des « traitements » différents seront
appliqués.
→Pas de raison que le groupe A soit différent du groupe B. S’il y’a différence, elle ne peut
être due qu’au traitement.
Variable : mesure qui peut prendre des valeurs différentes d’une unité expérimentale à
l’autre, ou d’un groupe d’unités expérimentales à un autre.
MV
4
Il existe différents types de variables et les techniques statistiques utilisées pour résumer
et analyser ces variables vont dépendre du type de variable.
→En principe, le nombre de valeurs possibles qu’une valeur continue peut prendre est
infini. En pratique, les mesures se font avec une précision finie dans un intervalle borné →
nombre fini de valeurs. Ex : Poids mesuré en kg : 50, 51, 52,.. Poids mesuré en gramme :
50.1, 50,2,..
• Variable qualitative/catégorielle : variable dont les modalités indiquent à quelle
catégorie appartient l’unité expérimentale (décrit une caractéristique). Ex : sexe,
couleur des yeux, présence/absence de mutation génétique,..
MV
5
d) Données statistiques :
Données brutes : ensemble des valeurs mesurées pour les variables pour toutes les unités
expérimentales de l’échantillon. = observation.
But : décrire les données de l’échantillon et résumer les mesures réalisées lors de l’étude au
moyen de graphiques et tableaux.
f) Inférence statistique :
But : utiliser l’information contenue dans l’échantillon pour tirer des conclusions sur la
population.
Techniques :
- Estimation des caractéristiques de la population sur base des mesures réalisées sur
l’échantillon.
- Tests d’hypothèse : procédure statistique permettant de vérifier, à partir des
données de l’échantillon, si des hypothèses émises a priori sont plausibles au niveau
de la population.
- Modélisation du lien entre différentes variables.
Rem : En faisant de l’inférence, il arrive que l’on commette des erreurs. Ce qu’on déduit de
l’échantillon ne peux pas forcement être induit à la population
→Les méthodes statistiques vont inclure des notions de probabilité afin de quantifier les
risques d’erreur dans l’inférence.
→Dans le but de tirer des conclusions sur le phénomène étudié sur base de ces données et
de les extrapoler à la population étudiée.
h) Protocole d’expérience :
MV
6
Variable : X
Valeurs des variables observées pour toutes les unités expérimentales de l’échantillon :
X1, X2, .., Xn (n = nombre d’unités expérimentales)
→donc Xi = valeur observée pour la variable X pour la ième unité expérimentale de
l’échantillon.
MV
7
Exemple : enquête chez 50 étudiants de bac 2. Pour chacun on détermine son sexe
(variable binaire), son âge (variable continue), son grade obtenu en 1e (variable
catégorielle), son humeur du jour (variable continue).
a) Variable qualitative :
- Fréquence : nombre de fois que la valeur a été observée dans notre échantillon
- Fréquence relative : fréquence divisée par le nombre total d’observation (et pe
exprimé en pourcentage)
b) Variable quantitative :
On considère les mêmes éléments MAIS on ne va en général pas pouvoir utiliser le même
type de représentation car :
MV
8
→La variable poids prends des valeurs réelles = variable quantitative continue
→La plupart des valeurs apparaissent une seule fois.
a) Variable qualitative :
Diagramme en barre : chaque fréquence de la variable est représentée par une barre. Rem :
fréquence et fréquence relative
b) Variable quantitative :
On peut pas utiliser ces graphiques car la variable prend trop de valeurs et la plupart de ces
valeurs n’apparaissent qu’une fois. → groupement de ces valeurs en intervalles (on gagne
en lisibilité mais on perd en précision) →utilisation d’un histogramme.
MV
9
Attention :
= somme des observations pour cette variable divisée par le nombre d’observation :
- Souvent une valeur qui n’est pas observée dans nos données.
- Sensible aux valeurs extrêmes : dans certains cas n’est plus représentative de la
localisation du gros de la distribution. On dit qu’elle est peu robuste pour les valeurs
extrêmes.
- Moyenne d’échantillon = moyenne des observations de l’échantillon.
= quantile 50% = la plus petite valeur supérieure ou égale à au moins 50% des données.
→Médiane = 3 soit la plus petite valeur supérieure ou égale à au moins 50% des
observations.
Exemple : nombre pair d’observation : supposons que pour une variable nous ayons
observé les valeurs 1, 2, 3, 4 (n=4)
→Médiane = 2
Pour certains : médiane = la moyenne des deux valeurs centrales
(ici : 2+3/2 =2,5)
MV
10
→ « Plutôt satisfait » est la classe médiane car c’est la 1e classe à remplir la condition
que 50% des observations sont dans cette classe ou dans une des classes
précédentes.
= valeur la plus souvent observée dans les données, correspond à la valeur associée à la
plus grande fréquence.
Rem : pour les variables quantitatives continues : la fréquence des valeurs observées est
souvent 1(on les retrouve qu’une fois) : autant de modes que de données. → intervalles
(classes) sur la gamme des valeurs possibles de la variable. Le(s) sous-intervalle(s)
contenant le plus d’observations est donc la classe modale.
MV
11
b) Mesures de dispersion :
= indiquent si les valeurs observées sont fort rassemblées ou pas autour de la tendance
centrale. →Information sur l’hétérogénéité des variables.
- Ne dépend donc que du min et du max : fortement influencée par les valeurs
extrêmes.
- Tends à augmenter avec le nombre d’observations dans l’échantillon.
• Ecart inter-quartile :
Quartile Q1 : quantile 25% càd la plus petite valeur supérieure ou égale à au moins 25% des
données.
Quartile Q2 : quantile 50% càd la plus petite valeur supérieure ou égale à au moins 50% des
données. = médiane !!
Quartile Q3 : quantile 75% càd la plus petite valeur supérieure ou égale à au moins 75% des
données.
L’écart inter-quartile : Q3-Q1 càd l’étendue des 50% des données centrales.
Exemple n=12
MV
12
Attention : souvent on divise par (n-1) plutôt que par n →permet d’obtenir une meilleur
estimation de la variance. Rem : dans la pratique ça se fait pas ou peu sauf si on considère
des échantillons de petites tailles.
MV
13
c) Mesures d’asymétrie :
Moyenne < médiane (en général) Moyenne > médiane (en général)
MV
14
Chapitre 3 : Intervalles :
- Echantillon aléatoire : oui car les membres de la population sont sélectionnés de telle
sorte que chaque membre individuel a la même chance d’être sélectionné.
- Echantillon aléatoire simple : non car les sujets sont choisis de telle façon, que
chaque échantillon possible n’est pas la même chance d’être choisi (impossible
d’avoir un élève de la 1e rangée et un élève de la 2e rangée).
II. Distributions :
a) Types de données :
MV
15
Conventions :
Quelques notions :
- P(E) = probabilité de survenue d’un événement E
- p = proportion dans un échantillon (ou p)
- π = proportion dans la population
- p-valeur : (def donnée plus tard)
b) Densité de probabilité :
= fonction qui permet de représenter une loi de probabilité (sous forme d’intégrale).
n = 100 n = 1000
MV
16
MV
17
- Aire de la courbe entre 2 points = probabilité que les valeurs X (ici âge) soient
comprises entre ces 2 points.
Analyse : Une variable X distribuée normalement a 5 chances sur 100 de présenter un écart
à la moyenne supérieur à 1.96σ (environ 2σ). Autrement dit, 95% des sujets sont distribués
dans une étendue de 4σ.
2 façons :
L’écart type de la distribution des moyennes (des différents échantillons d’une même
population) est appelé l’erreur standard ou déviation standard de la moyenne ou ESM et
vaut :
ESM peut être utilisée pour mesurer la précision de la moyenne d’un échantillon.
MV
18
→ Données binaires : (0,1) : Le TCL affirme que les moyennes des échantillons d’une
variable binaire tendent aussi vers une variable aléatoire gaussienne
MV
19
En simplifiant, on peut dire : Si la variable X suit une distribution normale ou lorsque la taille
de l’échantillon est assez grande (n>30) alors la distribution d’échantillonnage de la moyenne
aura une forme approximativement normale de moyenne µ et de variance σ2/n
On pose : On pose :
Aire de la courbe entre 2 points = probabilité que les valeurs de X soient comprises entre ces
2 points.
MV
20
But : Tout ramener sur le même graphique et avoir un tableau avec Z-valeur : + simple
Exemples :
MV
21
Exemple :
MV
22
Un belge sur quatre ne se sent pas bien mentalement. Quelle est la probabilité qu’une
proportion dans un échantillon (n=580) dépasse 26, 2% ? Calculez IP 95%
IC se déduit à partir d’un échantillon « connu » → on obtient des infos sur la moyenne de
la population (2 cas selon que l’on connait la variance de la pop ou non)
Pouvons-nous conclure que la proportion pour les prisonniers est plus élevée que la
proportion dans la population ? Quelle est la vraie proportion des prisonniers qui ne se
sentent pas bien
Cet intervalle est construit autour de la vrai valeur (ex :µ). On n’utilise pas d’estimateur
puisqu’on connait la vraie valeur.
→ ESM =
→ ESM =
MV
23
Rem : IP n’est valide que si la population suit une distribution gaussienne (loi normale) ou si
n>30 (et np>5 et n(1-p) > 5 pour une proportion) + EAS
MV
24
→ Rare dans la pratique de connaître la vraie valeur du caractère étudier dans la population
Interprétation : Nous avons 95% de confiance (≠ chance) que l’intervalle contienne la vraie
valeur de la population. Cela signifie que si on sélectionnait de nombreux échantillons de
même taille et qu’on construisait les IC correspondants, à long terme, 95% d’entre eux
contiendraient la vraie valeur µ (X) ou π (p). Cette interprétation (correcte) fait référence au
taux de réussite de la procédure utilisée pour estimer la moyenne (un paramètre) de la
population
Incorrect : Il y a 95% de chance que µ soit dans l’intervalle de confiance (analogie : définir le
sexe d’un bébé)
IP et IC :
Loi t caractérisée par des degrés de liberté = ddl (=n-1 car l’estimateur de S2, s2 est basé
sur (n-1) termes indépendants.
MV
25
Z ou t ?
Z : pour une proportion Loi de z : z = 1,96
- σ est connu et la population est normalement distribuée
- σ est connu est n> 30
t: Loi de t : t = 1,984
- σ est inconnu (utiliser S) et la population est normalement distribuée
- σ est inconnu (utiliser S) et n>30
Conditions de validité :
- Si la distribution est normale : EAS
- Si la distribution n’est pas normale : EAS et n>30
MV
26
n = 30 n = 200 n = 1000
Exemple :
→ Interprétation : pour un IC 95% : Nous avons confiance à 95% que l’IC contienne la vraie
valeur de µ : Cela signifie que si l’on sélectionnait de nombreux échantillons de même taille
MV
27
et qu’on construisait les IC correspondant, à long terme, 95% d’entre eux contiendraient la
vraie valeur de µ.
Conditions de validité :
- EAS
- 4 conditions à remplir : n = taille d’échantillon
n x borne inférieure de IC > 5
n x (1-borne inférieur de IC > 5
n x borne supérieure de IC > 5
n x (1-borne supérieure de IC) > 5
Ex :
- Nombre fixe de répétitions
- Essais indépendants
- Probabilités constante (& 2 catégories)
MV
28
→ Interprétation : pour un IC 95% : Nous avons confiance à 95% que l’IC contienne la vraie
valeur de π : Cela signifie que si l’on sélectionnait de nombreux échantillons de même taille
et qu’on construisait les IC correspondant, à long terme, 95% d’entre eux contiendraient la
vraie valeur de π.
Etapes :
- Fixer α → 1 – α = niveau de confiance
a = erreur de type I = probabilité de rejeter H0 alors que H0 est vraie (ex : conclure qu’il y a
une différence entre 2 moyennes alors que ce n’est pas vrai) ex : α = 0,05
- Trouver une statistique de test approuvée en fonction du paramètre à estimer (zα/2,
td1 = x, α/2,..) ex : zα/2= 1,96
- Trouver l’écart-type du paramètre à estimer
- Interprétation
L’estimation d’un paramètre quelconque est ponctuelle si l’on associe une valeur à
l’estimateur à partir des données observables sur un échantillon aléatoire. L’estimation
par intervalle associe à un échantillon aléatoire, in intervalle qui recouvre avec
une certaine confiance (≠ probabilité/chance)
L’intervalle de confiance IC est un intervalle de valeurs utilisé pour estimer la vraie valeur
d’un paramètre d’une population
Le niveau de confiance est la probabilité 1-α qui est la proportion du nombre de fois où
l’intervalle de confiance contient le paramètre de la population si on repète l’estimation un
grand nombre de fois
Interprétation : Nous avons 95% (ou 90%) de confiance (≠ chance) que l’intervalle
contienne la vraie valeur de la population. Cela signifie que si on sélectionnait de
nombreux échantillons de même taille et qu’on construisait les intervalles de confiances
correspondants, à long terme, 95% ou (90%) d’entre eux contiendraient la vraie valeur µ
(X)
MV
29
2e partie
Principe H0 :
Les décisions prises sur base d’un tel test peuvent être erronées : erreurs inévitables
POPULATION (inconnu)
HO est vraie H1 est vraie
ECHANTILLON RHO Erreur de type I ✓
(observé) P(RH0│H0) = α
NON-RHO ✓ Erreur de type II
P(NRH0│H1) = β
L’hypothèse que l’on fait dans la population porte sur la moyenne d’une variable continue.
Grâce au TCL on peut utiliser la moyenne X pour estimer µ (si X est approximativement
normale) :
→ Si H0 : µ = µ0 alors : →
L’idée est de rejeter l’hypothèse nulle H0 si notre statistique de test Z prend une valeur trop
peu probable par rapport à la distribution de la statistique de test sous H0 : càd de rejeter
l’hypothèse nulle H0 si notre statistique de ce test prend une valeur trop extrême pour une
N(0,1)
MV
30
Illustrations :
→ On calcule la P-valeur = probabilité d’observer une valeur au moins aussi extrême que
celle observée (Zobs) si H0 est vraie càd pour une N(0,1)
Rem : par aussi extrême on veut dire toute valeur de Z qui remet H0 en cause (en faveur
de H1) au moins autant que la valeur Zobs dans notre échantillon pour Z.
- Si p-valeur est trop petite : c’est une indication que les données observées ne
sont pas plausibles sous H0
→ H0 est rejetée
→ Le test est dit (statistiquement) significatif
- Si p-valeur est grande : c’est une indication que les données observées ne sont
pas fortement en contradiction avec H0 (la majorité du vert est probable)
→ H0 n’est pas rejetée
→ Le test est dit non (statistiquement) significatif
MV
31
Rem : parfois on ne sait pas calculer Z car σ inconnu → T suit une distribution de Student
sous H0 :
Règle de décision :
ou de façon, équivalente :
avec
MV
32
→ Puissance d’un test : On va souvent parler de la puissance d’un test, donnée par
puissance = 1-β, plutôt que du risque d’erreur de type II (β), ce qui est en fait équivalent :
! Le type d’erreur de type II (et donc la puissance) est en fait contrôlé pour une hypothèse
alternative H1 prédéfinie
Rem : En pratique, on va se fixer un risque d’erreur de type II (β) que l’on trouve acceptable
(souvent β = 0,10 ou 0,20) et on va calculer la taille d’échantillon n nécessaire pour contrôler
ce risque à cette valeur.
MV
33
Test bilatéral : lorsqu’on cherche à mettre en évidence une différence mais sans s’occuper
du sens de la différence :
Test unilatéral : lorsqu’on cherche à mettre en évidence une différence pour un sens de la
différence pré-définie
→ La p-valeur est la probabilité d’obtenir pour la statistique de test une valeur plus extrême
que la valeur observée et ce uniquement dans le sens de l’hypothèse alternative :
MV
34
Recommandation :
- Choisir (avant d’avoir accès aux données de l’étude) de faire un test bilatéral ou
unilatéral en fonction de l’objectif de l’étude. On recommande de faire un test
unilatéral lorsque la différence est d’office dans un sens
- Lorsque l’on présente une p-valeur ; toujours spécifier à quel type de test celle-ci
se rapporte
- Toujours vérifier si un test est bilatéral ou unilatéral avant d’interpréter sa p-valeur
et interpréter les résultats du test en fonction du type de test.
- Ne pas « sur-interpréter » une p-valeur non significative
MV
35
L’hypothèse que l’on fait dans la population porte sur la probabilité de succès d’une variable
binaire.
Estimation :
IC à 95% :
Rem : si la proposition a un n non suffisamment : on utilise un test exact qui se base sur la
distribution binomiale du nombre de succès sous l’hypothèse nulle
MV
36
POPULATION ECHANTILLON
A B A B
→ On calcule la probabilité d’observer une différence d dans notre échantillon si HO est vraie
dans la population
Conditions d’applications :
Méthode :
MV
37
Test d’hypothèse
(bilatéral)
Statistique de test
Résume ce que l’on a
observé dans notre
échantillon
Distribution sous H0
Résume ce à quoi on
s’attend si H0 est vrai
P-valeur
Règle de décision
Compare ce que l’on a
observé et ce à quoi
on s’attendait
Erreur de type I : probabilité de conclure qu’il y a un effet du traitement (µ1 ≠ µ2) alors qu’en
fait il n’y en a pas (µ1 = µ2) = faux positif
Erreur de type II : probabilité de conclure qu’il n’y a pas d’effet du traitement (µ1 = µ2) alors
qu’en fait il y’en a un (µ1 ≠ µ2) = faux négatif
En pratique :
MV
38
ATTENTION :
- Si en réalité l’effet du traitement dans la population est plus petit (<&) alors la
puissance (1 – β) sera plus faible que prévu
- Si en réalité l’effet du traitement dans la population est plus grand (>&) alors la
puissance (1 – β) sera plus forte que prévu
Avec une taille d’échantillon suffisamment grande même une très petite différence peut être
indicative
- Il ne faut pas prendre de décision sur l’avenir d’un traitement sur la seule base d’une
p-valeur
- Un résultat statistiquement significatif n’est pas nécessairement biologiquement
significatif
- Il est recommandé d’accompagner la p-valeur d’un intervalle de confiance pour le
paramètre de population sur lequel l’hypothèse a été formulée
Test bilatéral : on cherche à mettre une différence entre 2 moyennes mais sans s’occuper
du sens de la différence. On parle « d’effet du traitement » sans sur concentrer sur un effet
positif ou un effet négatif
MV
39
Test unilatéral : on cherche à mettre en évidence une différence entre deux moyennes pour
un sens de la différence prédéfinie
p-valeur : probabilité d’obtenir pour la statistique de test une valeur plus extrême que la
valeur observée et ce uniquement dans le sens de l’hypothèse alternative
MV
40
Si je veux monter que mon nouveau traitement (trt1) est plus efficace (augmente la
moyenne) que celui de mon concurrent (trt2) :
Si au lieu de faire une seule fois l’expérience, on la reproduisait un grand nombre de fois, alors
dans 95% des expériences, la valeur estimée pour µ1 - µ2 serait dans cet IC
→ Avec le même raisonnement qui précédemment, si IC ne contient pas zéro, cela confirme
l’hypothèse que µ1 et µ2 ont des valeurs différentes dans la population
MV
41
On peut utiliser 2 méthodes pour tester une hypothèse H0 avec un niveau de signification
α:
- Test statistique, calculer la p-valeur et la comparer avec α
- Calculer un intervalle de confiance (1-α) x 100% pour le paramètre de population
testé
➢ S’il contient la valeur suggérée par H0, on ne rejette pas H0 à un niveau de
signification α
➢ S’il ne contient pas la valeur suggérée par H0, on rejette H0 à un niveau de
signification α
Ex : mesures avant/après sur les mêmes sujets, mesures sur des paires de jumeaux,
mesures des organes différents du même sujet
→ On doit utiliser des techniques spécifiques pour le calcul des tests d’hypothèse et la
construction d’intervalles de confiance
Idée : s’il n’y a pas de différence au niveau de la population, on s’attend à ce que d soit
proche de zéro → on vérifie que d n’est pas trop grande
MV
42
Statistique de test
Distribution sous H0
P-valeur
Règle de décision
Conditions d’applications :
• La variable mesurée est une variable binaire, on peut donc résumer les données par
la proportion de « succès »
• 2 échantillons (aléatoires) indépendants
- Chaque échantillon est représentatif de sa population
- Pas de facteurs confondants
- Les valeurs observées pour un échantillon ne sont pas liées aux valeurs observées
dans l’autre échantillon
Idée :
MV
43
Statistique de test
Distribution sous H0
P-valeur
Règle de décision
MV
44
Rem : il existe aussi une procédure de calcul de l’IC exact si on n’est pas dans les conditions
d’applications de l’approximation normale
Dans la pratique, il est assez rare que l’on utilise la différence des proportions pour résumer
l’effet d’un traitement sur un endpoint binaire
On va plutôt utiliser : le rapport des risques (RR) et le rapport des cotes (OR)
ATTENTION : le RR peut se calculer dans les études prospectives (et donc dans les essais
cliniques) mais pas dans une étude rétrospective de type cas-contrôle
Interprétations :
MV
45
Rapport de cotes : rapport entre la cote dans le groupe 1 et la cote dans le groupe 2
ATTENTION : le OR peut se calculer dans tous les types d’études. Souvent utilisé mais
souvent mal interprété
Interprétation :
RR et OR : interprétation
MV
46
I. Corrélation linéaire :
Il y’a une corrélation entre 2 variables quand l’une est liée à l’autre
→ En interprétant un tel graphique, on peut se faire une bonne idée de comment évolue ces
2 variables l’une par rapport à l’autre :
Mesure la corrélation :
MV
47
→ Pour ce faire on « résume » la relation linaire X et Y par une droite : il faut donc trouver la
« meilleure » droite pour résumer cette relation.
→ Trouver la « meilleure » droite pour résumer cette relation, revient à trouver les valeurs de
a et b qui « collent » le mieux aux données : tout le monde n’est pas sur cette droite
→ On choisit la droite qui minimise la somme des carrés des erreurs (ei) :
= critère des moindres carrés
→ Ce qui nous intéresse en réalité c’est de faire de l’inférence, càd extrapoler les résultats à
la population :
→ On peut montrer qu’on peut estimer α et β par a et b obtenu selon le critère des moindres
carrés. On a :
→ On peut montrer qu’on peut estimer σ par l’écart type des résidus :
MV
48
On cherche à mieux décrire le lien entre : une variable Y (=réponse) continue et plusieurs
variables X explicatives
On trouve les valeurs de par le critère des moindres carrées et par la méthode
du maximum de vraisemblance
Interprétation de :
Interprétation de :
- Coefficient de
- Changement moyen de valeur de Y quand augmente d’une unité (les valeurs de
toutes les autres variables étant fixées)
Modèle simplifié : on retire du modèle les variables qui n’ont pas un impact statistiquement
significatif
On cherche à mieux décrire le lien entre une variable Y (=réponse) binaire et plusieurs
variables X explicatives
MV