Vous êtes sur la page 1sur 42

Pr.

François KOHLER
Faculté de Médecine de Nancy

Probabilités
Expérience aléatoire,
événement aléatoire
• Une expérience est dite aléatoire (random
experiment-random trial) lorsqu'on ne peut pas en
prévoir exactement les résultats du fait que tous
les facteurs qui déterminent ce résultat ne sont
pas maîtrisés ou contrôlés.
• Un événement aléatoire est un événement qui
peut ou ne pas se réaliser au cours d'une
expérience aléatoire.
• Exemple : expérience aléatoire "traverser la route"
- événement aléatoire "se faire écraser".
Définition classique
• Si m résultats peuvent se produire avec des
chances égales et si k résultats correspondent
à la réalisation de l'événement, la probabilité
de l'événement est le rapport k/m : nombre
de cas favorables sur nombre de cas possibles.
• Par exemple, dans un jeu de 52 cartes, on a 13 coeurs,
si toutes les cartes ont des chances égales d'être tirées,
la probabilité d'extraire un cœur est 13/52 = 0,25
Définition fréquentielle
• Si une expérience a été répétée un grand
nombre de fois dans des conditions
uniformes, on constate généralement que la
fréquence relative (% de réalisation) d'un
événement (fi) se stabilise.
• Ce phénomène est connu sous le nom de
régularité statistique.
• Ce nombre fixe est par définition la
probabilité mathématique de l'événement
considéré.
Définition fréquentielle
• La probabilité ainsi définie est une forme
idéalisée de la fréquence relative.
• Une estimation pragmatique de la probabilité
d’un événement est fournie par la fréquence
relative, la précision de cette estimation peut être
fournie par son intervalle de confiance pour un
risque donné.
• Dans de nombreux cas, la probabilité peut être
modélisée par une loi.
Expérience, événement,
propositions, logique…
• Evénement : toute proposition logique
associée aux résultats de l’expérience.
• Représentation ensembliste :
– Diagramme de Venn

S ensemble des événements possibles


A sous-ensemble de S
B sous-ensemble de S
….
Evénements exclusifs
• Les événements A et B ne peuvent se produire
simultanément. Pour tous couples (A,B)
l'ensemble A* B est vide.
– Exemple : extraire un cœur ou un carreau.
• Si 2 événements sont exhaustifs et
mutuellement exclusifs (mort-vivant)
– La non-réalisation de l’un implique la réalisation
de l’autre.
Evénements non exclusifs
• Les événements peuvent se produire
simultanément .
• L’intersection n’est pas vide.
• Exemple :
• Extraire une dame et un carreau
• Avoir un diabète et rouler avec des pneus lisses.
• Avoir un diabète et une angine.
• Ne pas confondre événements exclusifs et
événements indépendants.
Opérateurs logiques
• On note Vrai 1, Faux 0.
A ou B; A et B; Non(A) Non(A)
A B A U B; AB; Non(A) Non(B) Non(AouB) Non(AetB) et ou
A+B A*B Non(B) Non(B)

1 1 1 1 0 0 0 0 0 0
1 0 1 0 0 1 0 1 0 1
0 1 1 0 1 0 0 1 0 1
0 0 0 0 1 1 1 1 1 1
Rappel de logique
A et B A ou B

A B

Non(A) Non(B)

Non(A et B) Non(A ou B)
Rappels de logique
• Théorèmes de De Morgan
– Non(A et B) = Non(A) ou Non(B)
– Non(A ou B) = Non(A) et Non(B)
• La plupart des problèmes de probabilités n’ont
comme difficulté que l’interprétation logique
de l’énoncé.
Axiomes élémentaires
• 0 < P(A) < 1 : Une probabilité est toujours comprise entre 0 et 1.
• P(A) = 1 : L’événement est toujours réalisé.
• P(A) = 0 : L’événement est impossible.
• Si 2 événements sont exclusifs :
– P(A ou B) = P(A + B) = P(A U B) = P(A) + P(B)
• Exemple : Probabilité d'extraire un cœur ou un carreau = P(Cœur ou Carreau) =
0,25 + 0,25 = 0,5.
– Généralisation P(A+B+C) = P(A)+P(B)+P(C).
– Si 2 événements sont mutuellement exclusifs (mort-vivant) et
constituent l’ensemble des possibles :
• on a P(A)+P(B) = 1 => P(A) = 1-P(B).
– La probabilité de survie à un moment donné est égale à 1 moins la probabilité de
décéder à ce moment.
Evénements non exclusifs
• Les événements peuvent se produire simultanément. Exemples :
« avoir un infarctus du myocarde », « être diabétique ».
• P(A ou B) = P(B ou A)
= P(A) + P(B) - P(A et B)
• Ceci se déduit des relations :
– P(A ou B) = P(A sans B) + P(B sans A) + P(A et B)
– P(A sans B) = P(A) - P(A et B)
– P(B sans A) = P(B) - P(A et B)
• En conclusion :
– P(A ou B) < P(A) + P(B)
– P(A ou B ou C) = P(A) + P(B) + P(C) - P(A et B) - P(B et C) - P(A et C) +
P(A et B et C)
Probabilités conditionnelles
et indépendance
• En médecine, l’utilisation des probabilités
conditionnelles est fréquente et apparaît naturelle.
– On dira que « un individu a 5 fois plus de chances de
développer une maladie coronarienne s’il fume un
paquet de tabac par jour que si il ne fume pas »…
• La connaissance n’est pas figée : avant la
réalisation d’un test, la probabilité d’une maladie
est p. Que devient-elle si on sait que le test est
positif ?
Probabilité conditionnelle
• Soit deux événements non exclusifs A et B :
– On regarde la probabilité que l’un se réalise alors
que l’autre est déjà réalisé.
• On note P(A/B) la probabilité de A si B est
réalisé, l’inversement du conditionnement
P(B/A) est la probabilité de B si A est réalisé.
• Quelle est la probabilité d’avoir une douleur de la fosse
illiaque droite alors que l’on a une appendicite ?
• Quelle est la probabilité d’avoir une appendicite alors
que j’observe une douleur dans la fosse iliaque droite ?
Probabilité conditionnelle
• Eléments de base :
P( A  B)
P( A / B) 
P( B)
P( A  B)  P( B  A)  P( A / B) * P( B)  P( B / A) * P( A)

• Indépendance :
– Deux événements sont indépendants si la réalisation
de l’un n’influence pas la réalisation de l’autre.
• Exemple : Pluie, rouler avec des pneus lisses : a priori
indépendant; pluie, avoir un accident a priori non
indépendant.
Indépendance
• P(A/B) = P(AB)/P(B) = P(A)
=> P(AB) = P(A)*P(B)

• Si et seulement si deux événements sont


indépendants alors P(A et B) = P(A) * P(B)
Inversion du conditionnement
• Intérêt : évaluation des examens complémentaires.
• Théorème de Bayes :
P( A  B) A
P( A / B)   P ( A  B)  P ( A / B ) * P ( B ) P(A/B)
P( B)
B Non A
P( A  B) P( A / B) * P( B) P(B)
P ( B / A)  
P ( A) P ( A)
P ( Non B )  1  P ( B ) A
P(A)/nonB)
Non B
P ( A / Non B )  1  P ( Non A / Non B ) Non A
P ( A)  P ( A / B ) * P ( B )  P ( A / Non B ) * P ( Non B )
P ( A)  P ( A / B ) * P ( B )  [1  P ( Non A / Non B )] * [1  P ( B )]
Le tableau à 4 cases
• En médecine, 2 tableaux
Maladie + Maladie - Total
à 4 cases sont très Test + A (VP) B (FP) T+=A+B=VP+FP
Test - C (FN) D (VN) T-=C+D=FN+VN
utilisés et renvoient au Total M+ = A+C = VP+FN M-=B+D=FP+VN n

conditionnement. P(T+/M+); P(T-/M-); P(M+/T+); P(M-/T-)

– Evaluation des signes et


examens Maladie + Maladie - Total

complémentaires. Exposés
Non exposés
A
C
B
D
E+=A+B
E-=C+D

– Recherche de facteurs de M+ = A+C M- = B+D A+B+C+D

risque. P(M+/E+); P(M+/E-); P(E+/M+);P(E-/M-)


Les arbres de décision
• Un homme se présente aux
urgences. Quelle est la
probabilité qu’il ait une
sténose coronarienne ?

( Coro+) = P (EE+  Coro+) + P (EE-  Coro+)


= 0,8*0,6 + 0,4*0,3
= 0,48 + 0,12
= 0,60
Evaluation des examens
complémentaires
• Il n’existe pas de signe ou Maladie + Maladie - Total
d’examen parfait qui serait
Test + A (VP) B (FP) T+=A+B=VP+FP
toujours présent en cas de
présence de la maladie et Test - C (FN) D (VN) T-=C+D=FN+VN

absent en cas d’absence de Total


M+ = A+C =
VP+FN
M-
=B+D=FP+VN N=A+B+C+D
la maladie.
Fréquence de la maladie = Prévalence=P(M+)
= (VP+FN)/N
Sensibilité = P(T+/M+) = VP/(VP+FN)
Spécificité = P(T-/M-)= VN/(VN+FP)
VPP = P(M+/T+) = VP/(VP+FP)
VPN = P(M-/T-) = VN/(VN+FN)
Evaluation des examens
complémentaires
• La prévalence de la maladie dépend de différents
facteurs notamment :
– Zone géographique : le paludisme est beaucoup plus
fréquent en Afrique qu’en France.
– De la sélection réalisée par le premier niveau de soins
(la prévalence dans le groupe sélectionné est égale à
la VPP du test qui a servi à la sélection).
– ….
• La prévalence est la probabilité d’avoir la maladie
avant d’avoir fait le test : probabilité pré-test.
Evaluation des examens
complémentaires
• Sensibilité (probabilités des tests positifs chez les
malades) et spécificité (probabilités des tests
négatifs chez les non malades) sont des
caractéristiques intrinsèques du test.
• Elles supposent le problème résolu puisqu’ un
test de référence (gold standard) a permis de
déterminer si la personne était malade ou non.
• Elles sont influencées notamment par le stade
évolutif de la maladie.
Evaluation des examens
complémentaires
• La valeur prédictive positive (VPP = probabilité d’avoir la
maladie si le test est positif) et la valeur prédictive négative
(VPN = probabilité de ne pas avoir la maladie si le test est
négatif) sont les éléments qui servent à la décision médicale.
• La VPP est la probabilité post-test. Dans le groupe des sujets
ayant un test positif, elle représente la probabilité d’avoir la
maladie.
• Si le généraliste utilise la positivité du test pour adresser les
sujets au spécialiste, la fréquence de la maladie (prévalence)
dans le groupe adressé au spécialiste sera la VPP.
Valeurs prédictives
• Les valeurs prédictives dépendent de :
– La sensibilité du test,
– La spécificité du test,
– La prévalence du test.
• En conséquence, le même test (même
sensibilité et spécificité) aura des VPP et VPN
très différentes en fonction de la prévalence
de la maladie.
Valeurs prédictives
Test Positif
Sensibilité
• VPP et VPN correspondent à Malade
l’inversion du
Prévalence 1 - Sensibilité Test Négatif
conditionnement de la
sensibilité et de la spécificité.
Test Positif
• L’arbre des probabilités 1 - Prévalence 1 - Spécificité
permet facilement cette Non Malade
opération. Spécificité
Test Négatif
prévalence * sensibilit é
VPP 
( prévalence * sensibilté )  (1  prévalence) * (1  spécificit é )

(1  prévalence) * ( spécificit é )
VPN 
(1  prévalence) * ( spécificit é )  ( prévalence) * (1  sensibilté )
VPP et VPN
en fonction de la prévalence
• Pour une sensibilité et
1,00

0,90

une spécificité donnée : 0,80

– Une augmentation de la
0,70

0,60

prévalence entraîne une 0,50


VPP
VPN
augmentation de la VPP. 0,40

– Une augmentation de la 0,30

0,20
prévalence entraîne une 0,10

diminution de la VPN. 0,00


0,00 0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90 1,00
Prévalence
Exemple
• Le paludisme a une prévalence de 90% en 0,9 * 0,95
Afrique et de 0,001 en France. Un test VPPAfrique   0,983
biologique est utilisé pour le diagnostic
0,9 * 0,95  (1  0,9) * (1  0,85)
avec une sensibilité de 95% et une
spécificité de 85%. Quelles seront les
0,001* 0,95
probabilités pour des patients Africains et
VPPFrance   0,006
Français d’avoir le paludisme quand le test 0,001* 0,95  (1  0,001) * (1  0,85)
est positif et inversement de ne par avoir la
maladie quand le test est négatif ?
• Conclusion : si le test est positif en Afrique, (1  0,9) * 0,85
on est quasiment certain que le patient a le VPN Afrique   0,654
paludisme alors qu’en France on ne peut (1  0,9) * 0,85  (0,9 * (1  0,95))
rien conclure. Par contre si le test est
négatif, on est quasiment certain qu’en
France le patient n’a pas de palu alors qu’en (1  0,001) * 0,85
Afrique, on ne peut rien dire. VPNFrance   0,9999
(1  0,001) * 0,85  (0,001* (1  0,95))
• => Attention au transfert d’expérience.
Rapports de vraisemblance
Se
• RV+ : L =
1 - Sp
– Un sujet a L fois plus de chance d'avoir le test positif s'il est atteint de la
maladie que dans le cas contraire.
1  Se
• RV- :  
Sp
• L'apport diagnostique d'un résultat positif du test est
d'autant plus grand que le RV+ (L) est plus élevé.
L'apport diagnostique d'un résultat négatif d'autant
plus grand que le RV- est plus petit et proche de zéro.
• B.Grenier
Diagramme de Fagan
• Permet, sans calcul, de
déterminer la probabilité
post-test à partir de la
prévalence (probabilité
pré-test) et du rapport de
vraisemblance.
(source HAS)

Prévalence = 10%
L = 12
Dépistage,
Confirmation diagnostique
• Dépistage : Maladie + Maladie - Total
– S’adresse à des sujets ne se plaignant de
rien à priori sains. Test + A (VP) B (FP) T+=A+B=VP+FP
– Prendre un test à sensibilité élevée (peu de
FN, VPN très grande) . Test - C (FN) D (VN) T-=C+D=FN+VN
– Éventuellement suivi d’un test de M+ = A+C = M-
confirmation. Total VP+FN =B+D=FP+VN N=A+B+C+D
– Ne pas oublier les autres éléments :
• Acceptabilité, Risque, Coût
• Confirmation d’une maladie suspectée :
– Prendre un test avec une spécificité élevée
(peu de FP, VPP très grande) d’autant plus
que le coût du faux positif est élevé.
Valeurs diagnostiques d’un test
• Si un test a une spécificité élevée, un résultat positif
confirme l’hypothèse diagnostic.
• Si un test a une sensibilité élevée, un résultat négatif
élimine le diagnostic .
(Règles de Sacket)
• Gain diagnostic positif :
– C’est la différence entre la probabilité pré-test (prévalence)
de la maladie et la probabilité post-test (valeur prédictive
positive).
– Gain positif = VPP – prévalence.
Et si le test consiste à comparer une
valeur quantitative à une limite ?
• Si le résultat du test biologique ou du signe
clinique est une variable quantitative (glycémie -
diabète; tension artérielle systolique -
hypertension ...), la sensibilité et la spécificité
vont dépendre du seuil que l'on choisit pour dire
que le test est positif ou négatif.
• Pour chaque valeur de la limite, on aura une
valeur de la sensibilité et une valeur de la
spécificité.
• Ceci conduit à la courbe de ROC.
Spécificité et sensibilité en
fonction de la limite
Ici si l’on déplace la limite
vers la droite, la
spécificité va augmenter
et le sensibilité va
diminuer (diabète et
glycémie par exemple).

Attention, il existe des


cas inverse : taux
d’hormones et
hypothyroidie.
Courbe de ROC
Sensibilité
• A chaque valeur de la limite L du
critère quantitatif, on a une valeur de 1
la sensibilité et de la spécificité.
– On obtient ainsi 1 point de la courbe.
– En faisant varier la limite L, on obtient
d’autres points.
• La courbe joignant les points est la
courbe de ROC.
• Les valeurs de sensibilité et spécificité
en fonction de L peuvent être
obtenues par l’observation ou par la 0 1
modélisation du phénomène par une
loi de probabilité. 1-Spécificité
Courbe de ROC
• Aire sous la courbe : AROC
– Entre 0,5 (examen au hasard : pile ou face)
et 1 (examen parfait).
– Instrument privilégié d’évaluation et de
comparaison des performances
diagnostiques des examens
complémentaires.
Importance de l’indépendance
• Indépendance est opposé à liaison.
– Deux phénomènes sont indépendants si la réalisation
de l’un n’influence pas la réalisation de l’autre.
– Deux phénomènes sont liés si la réalisation de l’un
influence la réalisation de l’autre.
• Attention : Liaison ne veut pas dire causalité.
• Indépendance = hypothèse nulle du test du Khi2
sous laquelle sont calculés les effectifs
théoriques.
Application à la reproductibilité
• Problème fréquent en
santé : Médecin A
– Deux médecins donnent Oui Non Total
un avis sur l’opportunité
de réaliser une Oui 10 20 30
Médecin B
intervention chirurgicale. Non 5 45 50
– Si la reproductibilité était
parfaite les deux Total 15 65 80
médecins seraient La concordance observée est : (10+45)/80 = 0,69
toujours d’accord. Mais…
Reproductibilité
Médecin A
• Si les deux jugements étaient indépendants, Oui Non Total
quels auraient été les résultats ? Oui 10 20 30
Médecin B
P (Oui / A) 
15 Non 5 45 50
80 Total 15 65 80
30
P (Oui / B)  Les probabilités peuvent être approchées par les
80 fréquences. Sous l’hypothèse d’indépendance, on
Sous l ' hypothèse d ' indépendance obtient le tableau :
Médecin A
15 30
P[(Oui / A)]  P[(Oui / B)]  * Oui Non Total
80 80
En termes d ' effectifs attendus: Oui 5,6 24,4 30
Médecin B
15 30 15 * 30 Non 9,4 40,6 50
E  * * 80   5,6
80 80 80 Total 15 65 80
Reproductibilité
Médecin A
Oui Non Total
Concordance observée
Oui 10 20 30
Cobs=(10+45)/80 = 0,69 Médecin B
Non 5 45 50
Concordance sous hypothèse Total 15 65 80
d’indépendance
Cthéo =(5,6+40,6)/80 = 0,58 Médecin A
Oui Non Total
Coefficient de Kappa Oui 5,6 24,4 30
Cobs - C théo 0,69 - 0,58 Médecin B
Kappa    0,26 Non 9,4 40,6 50
1 - C théo 1 - 0,58 Total 15 65 80

Si Kappa > 0,6 : bonne concordance


Application à la survie
• Soit les événements Morts-Vivants
– P(Vivant) = 1 - P(Mort)
– La probabilité d'être vivant au jour J et au jour J+1 est égale au produit des
probabilités d'être vivant au jour J et J+1.

Jour Exposés DCD PDV P(DCD) P(Viv.) Pcum(Viv)


0 100 0 0 0 1 1
1 100 3 0 0,03 0,97 1*0,97
6 97 2 0 2/97=0,0206 0,9794 0,97*0,9794
= 0,95002
7 95 0 3 0 1 0,95002
10 92 … … … … …

Vous aimerez peut-être aussi