Académique Documents
Professionnel Documents
Culture Documents
biostatistiques
Brice Leclère
DFASM2
Les types de variables
– Comptage : 8 malades
– Pourcentage : 40 % de malades
– Ratio : 8 malades pour 12 non-malades, ou 2 pour 3, ou 0,67
– Taux : 8 malades pour 6 mois ou 1,3 malade par mois
▪ V. quantitative
ex : âge d’une population d’étude
18, 22, 24, 26, 29, 30, 31, 50, 55, 95
– Moyenne : 38 ans
– Médiane : 29,5 ans
– Étendue : 18-95 ans
– Ne pas oublier les mesures de dispersion !
nb d'observations
Distribution symétrique
Moyenne
Écart-type
variable X
Nb d'observations
Distribution asymétrique
Plutôt médiane
Écart interquartile
Variable X
Mesures d’occurrence d’une
maladie
▪ Prévalence
Plus adaptée aux maladies chroniques
Proportion, Pourcentage, Poids de la maladie
Nb de cas / Population totale
▪ Incidence
Plus adaptée aux maladies aigües
Deux mesures :
– Incidence cumulée = risque
Nb de nouveaux cas / population à risque
– Taux d’incidence ou densité d’incidence = vitesse
Nb de nouveaux cas / personnes-temps à risque
Fréquence d’une maladie dans une population fictive
Première année, 5
personnes atteintes
Année 2, 7 personnes
de plus atteintes
Année 3, 4 personnes
de plus atteintes
La baignoire de
l’épidémiologiste
Comparer des variables
binaires
▪ Ex :
▪ Ex :
▪ Ex :
Coefficient de corrélation :
▪ Varie entre -1 et 1
▪ Entre 0 et 1, association positive
▪ Entre -1 et 0, association négative
▪ Si égal à 1 (ou -1), corrélation
parfaite entre les deux variables
▪ Si égal à 0, aucune association
valeur observée
« vraie » valeur
erreur
Précision - validité
Prévalence = 40 %
Prévalence = 0 %
Prévalence = 40 %
Prévalence = 80 %
Fluctuation d’échantillonnage
n=8
Prévalence = 37,5 %
Prévalence = 25 %
Prévalence = 40 %
Prévalence = 50 %
Intervalle de confiance à 95
%
distribution d'échantillonnage
0
Cadre du test d’hypothèse
0 2
Cadre du test d’hypothèse
En fonction de la taille de
l’échantillon et de la variance
attendue de la mesure, on
peut estimer les distributions
des statistiques de test
0 2
Cadre du test d’hypothèse
Région de rejet de
l’hypothèse nulle
risque alpha
0 2
Cadre du test d’hypothèse
Région d’acceptation de
l’hypothèse nulle
Risque bêta
0 2
Cadre du test d’hypothèse
Statistique observée
Valeur p
0 2
Test uni ou bilatéral
α=5%
H0 : A < ou = à B H0 : A = B
H1 : A > B H1 : A > B ou A < B
Test unilatéral Test bilatéral
Vrai ou faux ?
Risque α
probabilité d’avoir un test positif sachant qu’il n’existe pas de différence
Erreurs de type I / (Erreurs de type I + vrais négatifs)
Risque β
probabilité d’avoir un test négatif sachant qu’il existe une différence
Erreurs de type II / (Erreurs de type II + vrais positifs)
Puissance
probabilité d’avoir un test positif sachant qu’il existe bien une différence
1 – risque β
IC 95 % et petit p avec α = 5 % sont
équivalents
+
Maladie -
exposition
+ 80 20
- 50 50
Test du Khi2
χ²=18,5 p=2×10-5 seuil α = 5 %
3 grands types de biais
▪ Biais de sélection
au moment de la constitution et du suivi de la
population d’étude
▪ Biais de confusion
au moment de l’interprétation des résultats
Biais de sélection :
hiérarchie des populations
Population cible
Population éligible
Population source
Population d’étude
(échantillon)
Biais de sélection :
hiérarchie des populations
Population cible
Population éligible
Si ces deux populations sont
différentes = biais de
Population source
sélection
Population d’étude
(échantillon)
Exemple 1
?
Café Cancer du poumon
Biais de confusion
Tabagisme
Facteur de confusion
Comment prendre en compte les
biais de confusion ?
Maladie
+ -
50 160
+
Café
-
25 120
RR = 1
-
15 40
Maladie Tabac -
+ -
20 80
+
Café
RR = 1
-
20 80
Analyse multivariée
Exemple
Étude observationnelle sur durée d’une opération
chirurgicale
2 procédures :
Procédure A : 189,8 min [IC95: 180,5 ; 198,1]
Procédure B : 181,3 min [IC95: 174,9 ; 187,6]
Non significatif
- Ordonnée à l’origine :
219 [IC95: 211 ; 227]
Ancienneté
Facteur de confusion
Analyse multivariée
Exemple
Paramètres du plan :
- Ordonnée à l’origine :
245 [IC95: 236 ; 253]
- effet de l’ancienneté :
- 5,7 [IC95: -6,5 ; -5,0]
▪ Modèle de Poisson
pour les variables de comptage (nb de cas, etc.)
▪ Modèle de Cox
pour les données censurées à droite (survie, etc.)
voir cours études pronostiques