Vous êtes sur la page 1sur 13

Probabilités A.

Rousseau

Probabilités conditionnelles, sensibilité, spécificité, valeurs


prédictives

I. Notion de probabilité

 Concept lié à la répétition d’une expérience aléatoire : expérience dont on ne connaît pas le
résultat avant l’expérience.
 La seule information dont on dispose pour chaque valeur est la probabilité de trouver « un
individu » (un résultat) qui ait cette valeur
Exemple du lancé d’une pièce de monnaie, on ne peut pas prédire avec certitude le résultat
de l’expérience avant sa réalisation  : 1 chance sur 2 d’obtenir côté pile ou côté face.
 Evènements équiprobables.

 Une expérience aléatoire (épreuve) peut présenter un certain nombre de résultats. Chacun
de ces résultats est un événement élémentaire Ei ( événement non décomposable )
 Cette notion d’évènement peut-être étendue à un ensemble de plusieurs résultats
(évènements non élémentaires)
o Si Ω est un ensemble fini d’évènements équiprobables et A une partie de Ω

nombre de cas favorables


P ( A )=
nombre de cas possibles

Formule applicable uniquement si les évènements possibles sont équiprobables et en


nombre fini.

Exemple en épidémiologie  :

Dans une population de 60 million d’habitants, 500  000 personnes meurent chaque année.
500000
Si équiprobabilité  ; probabilité de décès  : =0.0083
60000000

Cependant, chaque individu n’a pas la même probabilité de décéder dans l’année. Le calcul de
probabilité basé sur l’équiprobabilité atteint rapidement ses limites.

1
Probabilités A. Rousseau

II. Rappels sur des notions d’analyse combinatoire


Lorsque l’équiprobabilité est admissible, on peut utiliser les connaissances connues sur le
dénombrement.

Sans répétition Avec répétition


Avec Ordre Arrangements de n objets p à p (nombre de Arrangements avec répétitions
groupes de p objets que l’on peut extraire de n A chaque choix, correspond n
objets) Arrangements tous distincts et ordonnés : possibilités
np
n! Exemples de 3 lettres a,b,c
Anp =n ( n−1 ) ( n−2 ) … ( n− p+1 )=
( n−p ) ! considérées 2 à 2 :
3! Ex  : aa,bb,cc,ab,ba,ac,ca,bc,cb
Ex  : 3 lettres(a,b,c) considérées 2 à 2  : A= =6
1!
p
Sans Ordre A n! Combinaison avec répétition
Notion de combinaisons : C np= n =
p ! p ! ( n− p ) !
K np =Cnp+ p−1
Ex  : Lettres a,b,c considérées 2 à 2 conduisent à 3
combinaisons (ab, bc, ac) C = 6/2 = 3

III. Propriétés élémentaires des probabilités


Définitions :

 si A est certain, p ( A )=1.


 p ( Ω )=1 et P ( ∅ )=0

Théorème des probabilités totales :


Exprime la probabilité de réaliser A ou B.
Considérons A et B, 2 événements quelconques :
p ( A ∪ B ) =p ( A )+ p ( B )− p ( A ∩ B )

Si les évènements A et B sont incompatibles p( A ∩ B)=0 soit p ( A ∪ B ) =p ( A )+ p ( B )

Si on considère 3 événements :

p ( A ∪ B ∪C )= p ( A )+ p ( B ) + p ( C ) −p ( A ∩ B )− p ( A ∩C )− p ( B ∩C ) + p ( A ∩B ∩C )

Si A, B, C sont incompatibles 2 à 2, alors p ( A ∪ B ∪C )= p ( A )+ p ( B ) + p(C)

Généralisation : Si plus de deux évènements sont 2 à 2 incompatibles ( Ai ∩ A j=∅ ) ;

alors p ( A i ∩ A j ∩… ∩ A k )= p ( Ai ) + p ( A j ) +…+ p( A k )

La probabilité de la réunion d’un ensemble fini ou dénombrable d’évènements 2 à 2incompatibles


est égale à la somme de leur probabilité

2
Probabilités A. Rousseau

Exemple  : Calcul de la probabilité d’obtenir un as ou un pique lorsqu’on tire au hasard une carte dans
un jeu

4
 p ( As )=
52
13
 p ( Pique )=
52
1
 p ( As ∩ Pique )=
52
4 13 1 4
P ( A ∪ B)= + − =
52 52 52 13

IV. Probabilités conditionnelles


Définition :

Considérons 2 événements A et B au cours d’une expérience aléatoire, tels que :

o A et B deux événements compatibles et de probabilités non nulles


o La réalisation de B influence celle de A.

La probabilité que A soit réalisé sachant B est réalisé est appelée probabilité conditionnelle de A
sachant B et s’écrit p( A / B)
p(A∩B)
p ( A / B )=
p ( B)

p ( A / B ) représente≤calcul de la probabilité de A , sur les sous ensemble réduit de B de Ω . On


l’appelle aussi probabilité a posteriori.

Remarque  : p ( ∅ / A )=0 ; p ( A / A )=1

1. Généralisation

Théorème des probabilités composées qui permet le calcul de la probabilité de réaliser A et B.


On peut encore écrire :
P ( A ∩ B )= p ( B ) × p ( A / B ) =p ( A ) × p ( B / A ) =p ( B∩ A)

Exemple  : alcoolisme et problèmes hépatiques


Une enquête montre  que  : 4% des français souffrent de problèmes hépatiques, 75% de ces malades
consomment régulièrement de l’alcool. 60% des français consomment régulièrement de l’alcool.
On définit les événements H malade hépatique et A consommation alcool.
p ( H )=0.04 , p ( A )=0.60 et p ( A / H )=0.75 (correspond à la probabilité qu’un sujet pris au hasard
consomme de l’alcool sachant qu’il est malade du foie)

3
Probabilités A. Rousseau

p ( H ∩ A ) p ( H ) × P ( A / H ) 0.03
p ( H / A )= = = =0.05
p ( A) p(A) 0.6

Il y a donc 5% de chance pour que, si un sujet pris au hasard est consommateur d’alcool, il
soit malade du foie.
Ici on s’intéresse à la probabilité d’un évènement (maladie) sachant que la cause est réalisée
(consommation d’alcool).

Diagramme récapitulatif :

A Á
F 0,04 × 0,75=0,03 0,04−0,03=0,01 0,04
F́ 0,6−0,03=0,57 1−0,6 ¿−(0,04−0,03)
0,96
0,60 0,40 1

2. Evènements indépendants

2 évènements A et B sont indépendants (en probabilité) :

o si la réalisation ou la non réalisation e A ne modifie pas la probabilité de


réalisation de B (p(B))
o c’est-à-dire si la probabilité conditionnelle de B est la même que A ou Á se soit
réalisé, alors p ( B / A )= p ( B / Á )= p(B)

Remarque : Ne pas confondre évènements indépendants et événements incompatibles.

Considérons les deux évènements suivants :


 A : avoir les yeux bleus
 B : être diabétique.

Ces deux évènements sont a priori indépendants, et sont compatibles (il existe bien des
personnes diabétiques aux yeux bleus.

On sait, par des enquêtes médicales, qu’un individu appartenant à une population
donnée a la probabilité 1/100 d’être atteint par une affection A et la probabilité 1/20
d’être atteint d’une autre affection B.
Sous l’hypothèse d’indépendance de ces 2 affections, calculons :
a) le nombre de sujets (environ) atteint de l’une au moins de ces 2 affections parmi
10.000 sujets pris dans la population
b) le nombre de sujets atteints de B sur 500 sujets atteints de A.

a. Si A et B indépendants, p ( A ∩ B )= p ( A ) × p (B)

4
Probabilités A. Rousseau

D’où : probabilité d’être atteint de l’une ou de l’autre est


1 1 1 1
+ − × =0.0595
20 100 20 100
Soit sur 10.000 sujets, 595 sujets.

1
b. Sur 500 sujets atteints de A, on doit trouver ×500=25 sujets atteints de B
20
Si on trouve nettement plus que 25 sujets atteints, on ne peut plus admettre
l’indépendance. On dit alors qu’il y a entre elles une association, une relation
statistique.

3. Arbre probabiliste

 Outil adapté au résumé des données d’un problème mettant en jeu les probabilités conditionnelles.
 Principe :
o A partir de la racine de l’arborescence partent autant de branches que d’évènements dans la
population générale
o Ces branches sont pondérées par les probabilités a priori des évènements qu’elles
représentent
o Ensuite ces branches mères se divisent et à chaque nœud, s’introduit la probabilité
conditionnelle liée à la réalisation de la branche parente
o En bout de branche on calcule la probabilité de l’intersection des différents évènements
rencontrés par simple produit des probabilités parcourues le long du chemin qui va de la
racine à l’extrémité

4. Théorème de Bayes – Probabilité des causes

 Dans le théorème précédent des probabilités composées, on s’intéressait à la


probabilité de réaliser un événement E sachant qu’une certaine cause s’était réalisée
 Ici on s’intéresse à un événement E réalisé. Cette réalisation peut être due à N causes
C i différentes et incompatibles 2 à 2.  On cherche P(C i / E)

Le théorème de Bayes revient à une écriture différente du théorème des probabilités


composées.

Cas de 2 causes :

Soit un événement E qui peut dépendre de 2 causes C 1 et C2 différentes et incompatibles ¿)


calculons P(C i / E).

P ( C1 ∩ E ) =P ( C1 ) × P ( E /C 1 )=P ( E ) × P(C 1 / E)

On cherche P(C 1 / E) car E est réalisé et P( E) est connue

5
Probabilités A. Rousseau

P ( C1 ) × P ( E /C 1 )
P ( C1 / E )= avec
P(E)
P ( C1 ) probabilité à priori et P ( C 1 / E ) probabilité a posteriori .

On peut remplacer P( E) par l’expression : P ( E )=P ( C 1) × P ( E / C1 ) + P ( C 2 ) × P(E /C 2 )

d’où ( P ( C 1) × P ( E / C 1 ) )
P ( C 1 / E )=
¿¿

Généralisation : Soit un événement E qui peut dépendre de N causes C i différentes et incompatibles 2 à 2, calculons
P(C i / E)

¿ i=1 ¿ N E ∩C i car l’ensemble des C i constituent un système complet (ou système exhaustif)

Remarque  : Le symbole U désigne une union. l’union est disjointe → P(E) va être calculée à partir de la somme des
probabilités des intersections E ∩C i

 Exemple :

Trois formes d’une maladie peuvent produire un même symptôme (S).

 F1 produit S dans 100% des cas [ P ( S / F 1 )=1 ¿


 F2 produit S dans 50% des cas [ P ( S / F 2 )=0,5 ¿
 F3 produit S dans 10% des cas [ PS / F 3 )=0,1 ¿
 De plus, dans la population
o P ( F 1 )=0.01
o P ( F 2 )=0.005
o P ( F 3 )=0,02

Etapes préliminaires :

On dispose des données sous forme de probabilités.


Bien identifier les causes (la forme de la maladie ici.
Bien identifier l’événement observé, S : événement « Symptôme de la maladie ».

Calcul de la probabilité qu’un sujet présentant S soit atteint de la forme F3 [P ¿

P (F 3) × P (S / F 3)
P (F 3 / S)= =0,138
P ( F 3 ) × P ( S / F 3 )+ P ( F 2 ) × P ( S / F 2 ) + P ( F 1 ) × P ( S / F 1 )

La probabilité qu’un patient présente la forme F3 de la maladie est plus grande s’il présente
le symptôme S que si l’on ne sait rien.

6
Probabilités A. Rousseau

5. Evaluation et choix d’un test diagnostic


Dépend de :
 La qualité de l’examen
 La prévalence de maladie (probabilité de la maladie dans la population générale)
 Des contraintes liées à la mise en œuvre du test
o Coûts
o Risques iatrogènes inhérents à l’examen
o Vécu psychologique
 Décision de traitement, notion de seuil de traitement
o Dans quelle mesure les résultats d’un test vont conduire à une prise de
décision ?
o Seuil de probabilité de la maladie au-dessus duquel on décide d’intervenir :
seuil de traitement
o Le seuil dépend du bénéfice global attendu (bénéfice/risque : amélioration de
l’état de santé/effets secondaires potentiels.

Exemple :

 Mise sous anticoagulant si suspicion d’embolie pulmonaire : seuil à 10, 20%.


 Chimiothérapie si suspicion de cancer du sein : seuil proche de 100%.

Malade Non Malade


Test positif Vrai positif VP Faux positif FP
Test négatif Faux négatif FN Vrai négatif VN
Malades : VP + FN Non malades : FP + VN

6. Critère d’appréciation d’un test 


a. Caractéristiques intrinsèques

7
Probabilités A. Rousseau

Sensibilité : Capacité du test à diagnostiquer la maladie, proportion des tests positifs parmi
les malades.
VP
Se=P ( + / M )=
VP+ FN

 Plus le test est sensible, moins les faux négatifs sont nombreux

Spécificité : Capacité du test à ne diagnostiquer que la maladie, proportions des tests


négatifs parmi les non-malades

VN
Sp=P (−/ Ḿ )=
VN + FP

 Plus le test spécifique, moins les faux positifs sont nombreux.

La valeur diagnostique d‘un test est d’autant meilleure que le test est à la fois sensible et
spécifique.
La valeur globale du test : proportion de résultats exacts :

VP+VN
 E=
VP + FP+VN + FN
 (0 ≤ E ≤1)
 E=1 : test idéal
 Tirage au sort correspond à E=0,5

Propriétés :

 La sensibilité et la spécificité sont indépendantes de la prévalence de la maladie


dans la population considérée.
 Test qualitatif : Se et Sp fixes.
 Test quantitatif : Se et Sp dépendent du seuil de positivité choisi ; Se et Sp varient en
sens inverse.
Le choix de la valeur seuil et important, il ne doit pas être arbitraire, il dépend du
problème posé.

8
Probabilités A. Rousseau

Distribution du paramètre étudié chez les sujets présentant l’événement et chez les
sujets ne présentant pas l’événement.

Choix du seuil :

 Un test sensible (donc un seuil bas) doit être préféré quand la maladie est
grave et curable (on souhaite minimiser FN).
 Un test spécifique (donc un seuil élevé qui diminue FP) doit être préféré :
 Lorsque les tests faussement positifs sont psychologiquement
traumatisants ou coûteux
 Quand on veut confirmer un diagnostic suggéré par d’autres tests
(test de confirmation).

Un test diagnostic de bonne sensibilité conduit à un résultat positif chez (presque) tous les
malades : utilisable pour un dépistage.

Si le test possède une bonne spécificité, il conduit à un résultat négatif chez presque tous
les non-malades, utilisables pour confirmer un diagnostic.

b. Caractéristique extrinsèque

Valeur prédictive positive


VP P ( M ) × Se
VPP=P ¿ et VPP= =
VP+ FP P ( M ) Se + ( 1−P ( M ) ) ( 1−Sp )

Valeur prédictive négative


VPN =P ¿

Les VP dépendent de la prévalence de la maladie.


On doit choisir un test ayant une VPP élevée quand le traitement d’un sujet faux positif
peut avoir des conséquences graves.
Un test ayant une VPN élevée doit être retenu quand l’absence de traitement est
préjudiciable chez un patient FN.

c. Courbe de ROC : valeur diagnostique d’une variable quantitative

9
Probabilités A. Rousseau

 Le coin gauche correspond


à Se = 1 et Sp = 1
 Plus la courbe s’éloigne de
la diagonale vers l’angle
supérieur gauche, meilleur
est le test
 Elle permet de comparer
plusieurs test de choisir
une valeur seuil

10
Probabilités A. Rousseau

d. Performance du test : traitement détaillé d’exemples


 Exemple 1 :

Un laboratoire a mis au point un alcootest. On sait que 2% des personnes contrôlées par la
police sont réellement en état d’ébriété (P(E)=0,02]. Les premiers résultats ont conduit aux
résultats :

11
Probabilités A. Rousseau

 lorsqu’une personne est réellement en état d’ébriété, 95% du temps l’alcootest se


révèle positif (Se = 0.95)
 Lorsqu’une personne n’est pas en état d’ébriété, 96% du temps l'alcootest se révèle
négatif (Sp = 0,96)

Calcul de la probabilité pour qu’une personne soit réellement en état d’ébriété lorsque
l’alcootest est positif (VPP : P ¿

Formules de Bayes : P ¿

Personne ne soit pas en été d’ébriété lorsqu’ l’alcootest est négatif (VPN : P ¿

P¿

Les VPP et VPN dépendent fortement de la probabilité a priori (ex : proba d’ébriété, proba
d’être malade), ce qui explique qu’elles sont moins utilisées que les caractéristiques de test
Se et Sp

Reprenons l’exemple avec P ( E )=0,5


P¿

Remarque : Cet exemple pourrait aussi être traité en s’aidant d’un arbre probabiliste.

Reprenons à nouveau l’exemple et considérons que l’on réalise 2 fois le test par sujet, de
façon indépendante.
Quelle est la probabilité que la personne soit réellement en état d’ébriété si le résultat du test
a été 2 fois positif P ¿.

P (+ +/ E )=0,9025, les deux test sont en effet indépendants et P ( É )=0,98


2
P ( ++ / É )=P ( + / É ) =0 , 04²=0,0016

Ainsi, P ¿

 Exemple 2  :

Symptôme du patient induisent P ( M )=0,40


Examen positif
Sensibilité de cet examen Se=0,90 et Sp=0,95.

VPP=P ¿

 Cet exemple montre que le résultat d’un test (évaluation d’un symptôme) dépend de
2 notions différentes
 Les caractéristiques intrinsèques du test.

12
Probabilités A. Rousseau

 La prévalence de la maladie dans la population où on applique le


test.

13

Vous aimerez peut-être aussi