Vous êtes sur la page 1sur 40

PROBLEMATIQUE DE

L’IDENTIFICATION BACTERIENNE
Cours d’aide à la décision médicale
Année 2010-2011

WILFART SEBASTIEN
MASTER 2 INFO
Introduction – Les entérobactéries (1)

Famille de bactéries pathogènes ou non


ayant des caractéristiques biochimiques
communes et dont l’habitat est le tube
digestif de l’homme ou celui des animaux.

Escherichia coli Salmonella


Introduction – Les entérobactéries (1)

Yersinia
Escherichia
Citrobacter
Providencia
Enterobacter

Serrata
Klebsiella
Proteus

Salmonella Shigella

Morganella
Introduction – Les entérobactéries (2)

L’identification des bactéries est réalisée à


l’aide de micro-tests biochimiques prêts à
l’emploi.
+ - + - + - + - - + - + + + + + + + + +
+ - + - + - + - - + - + + + + + + + + +
+ - + - + - + - - + - + + + + + + + + +

5 2 1 5 7 6 3
Méthode probabiliste - Introduction
Introduction – Les entérobactéries (3)

PROCESSUS D’IDENTIFICATION
Organisme Informations de classification
inconnu u

Kits de microtubes Modèle


d’identification

Proposition
d’identification

OUI Fiabilité de la NON


proposition
Formulation de
Tests additionnels
l’identification
Introduction – Les entérobactéries (4)

MODELE D’IDENTIFICATION

Afin de choisir parmi plusieurs bactéries celle(s) qui


ressemble(nt) le plus à un germe inconnu prélevé
sur un individu présumé malade, on peut avoir
recours:
• à la méthode dichotomique
 arbres de décision
• à la méthode probabiliste
 approche bayésienne +
maximum de vraisemblance
Méthode des arbres de décision (1)

Méthode reposant sur la construction d’un


arbre binaire tel que:

- chaque sommet représente un test


biochimique à résultat binaire
- chaque feuille représente une bactérie
potentielle (ou un groupe de bactéries)
Méthode des arbres de décision (2)

HY-ENTEROTEST
Méthode des arbres de décision (3)

HY-ENTEROTEST
Méthode des arbres de décision (4)

5%

17%

11%

1%

HY-ENTEROTEST
Méthode probabiliste - Introduction

Méthode basée sur l’utilisation d’une matrice


donnant pour chaque bactérie identifiable,
sa probabilité de réaction positive à chaque
test.
Méthode probabiliste - Introduction
Méthode probabiliste – Introduction (1)

Soient:
• u le germe inconnu à identifier
• n tests biochimiques t1, t2, ... , tn
T = t1, t2, ..., tn
• m espèces identifiables b1, b2, ... , bm
B = b1, b2, ... , bm

R(u) = ensemble des résultats des tests de T


réalisés sur le germe inconnu u
Méthode probabiliste – Introduction (2)
P(biR(u)) = probabilité a posteriori de bi

P(bi) = probabilité a priori de bi

P(R(u)bi) = probabilité qu’une souche de la bactérie


bi  B donne l’ensemble des résultats R(u) obtenus
pour le germe u
Méthode probabiliste – Théorème de Bayes
P(biR(u)) = probabilité a posteriori de bi

P(bi) = probabilité a priori de bi

P(R(u)bi) = probabilité qu’une souche de la bactérie


bi  B donne l’ensemble des résultats R(u) obtenus
pour le germe u

Par le théorème de Bayes:

P(bi ).P( R(u ) | bi )


P(bi | R(u ))  m

 P(b ).P( R(u) | b )


k 1
k k
Méthode probabiliste - Théorème de Bayes

Règle de décision de Bayes:

P(b* | R(u))  max 1im P(bi | R(u))


Méthode probabiliste - Règle de Bayes

Règle de décision de Bayes:

P(b* | R(u))  max 1im P(bi | R(u))

Qui est équivalente à:

P(b* | R(u))  max 1im{P(bi ).P( R(u) | bi )}


Méthode probabiliste – Règle de Bayes

P(b* | R(u))  max 1im{P(bi ).P( R(u) | bi )}


Méthode probabiliste – Règle de Bayes

P(b* | R(u))  max 1im{P(bi ).P( R(u) | bi )}

Les probabilités a priori P(bi) ne pouvant


être connues avec exactitude, elles sont
supposées constantes.
Méthode probabiliste – Règle de Bayes

P(b* | R(u))  max 1im{P(bi ).P( R(u) | bi )}

Les probabilités a priori P(bi) ne pouvant


être connues avec exactitude, elles sont
supposées constantes.

Comment calculer les P(R(u)|bi)?


Méthode probabiliste – Règle de Bayes

P(b* | R(u))  max 1im{P(bi ).P( R(u) | bi )}

Les probabilités a priori P(bi) ne pouvant


être connues avec exactitude, elles sont
supposées constantes.

Comment calculer les P(R(u)|bi)?


Méthode du maximum de vraisemblance
Méthode probabiliste – MLE

L(R(u)bi) = vraisemblance de l’hypothèse


« le germe inconnu u est la bactérie bi  B »
par rapport aux résultats R(u)

L(R(u)bi) ≈ P(R(u)bi)
Méthode probabiliste – MLE

Soit: Ni souches bien identifiées de la bactérie bi


Nik souches positives au test tk  T

La vraisemblance d’une réaction positive au


test tk, pour une souche de l’espèce bi :

N
0 X (b )  ik  1
k i N
i
Méthode probabiliste – MLE

Soit: R(bi) = r1, r2, ... , rn

La vraisemblance des résultats R(bi), pour une


souche de l’espèce bi

  
LRbi  bi    X k bi   1  X k bi 
 rk    rk  
Méthode probabiliste – MLE

Soit un germe inconnu u.


On pose:
k
    quand rk est positive pour u,
Y u,b  X b
i k i
Y u, b   1  X b  quand r est négat ive pour u,
k i k i k

Dès lors:

m
L( R(u ) | bi )   Yk (u, bi )
k 1
Méthode probabiliste – MLE

Principe du maximum de vraisemblance

Choisir b* comme la (les) bactéries(s)


représentative(s) du germe u telle(s) que:

L( R(u) | b* )  max 1im{L( R(u) | bi )}


Méthode probabiliste – Exemple

EXEMPLE
- T = {Mobilité, H2S, Indole, Urée, ONPG, Gaz}
- B = {Prot. vulgaris, Prot. mirabilis, Edwardsiella, Salmonella}
- un germe inconnu u de profil R(u)
- R(u) = mobilité (+), H2S (+), Indole (+), Urée (+), ONPG (–), Gaz (+)}

Xk(bi) Mobilité H2 S Indole Urée ONPG Gaz

P. vulgaris 0.95 0.83 0.89 0.99 0.00 0.86


P. mirabilis 0.96 0.83 0.02 0.99 0.00 0.93

Edwardsiella 0.98 0.94 1.00 0.00 0.00 0.99

Samonella 0.95 0.86 0.03 0.00 0.02 0.92


Méthode probabiliste – Exemple
L(R(u)  P. vulgaris) = 0.95 x 0.83 x 0.89 x 0.99 x (1.00 – 0) x 0.86 = 0.597

L(R(u)  P. mirabilis) = 0.96 x 0.83 x 0.02 x 0.99 x (1.00 – 0) x 0.93 = 0.015

L(R(u)  Edwardsiella) = 0.98 x 0.94 x 1.00 x 0 x (1.00 – 0) x 0.99 = 0

L(R(u)  Salmonella) = 0.95 x 0.86 x 0.03 x 0 x (1 – 0.98) x 0.92 = 0

Xk(bi) Mobilité H2 S Indole Urée ONPG Gaz

P. vulgaris 0.95 0.83 0.89 0.99 0.00 0.86


P. mirabilis 0.96 0.83 0.02 0.99 0.00 0.93

Edwardsiella 0.98 0.94 1.00 0.00 0.00 0.99

Samonella 0.95 0.86 0.03 0.00 0.02 0.92


Méthode probabiliste – Exemple
L(R(u)  P. vulgaris) = 0.95 x 0.83 x 0.89 x 0.99 x (1.00 – 0) x 0.86 = 0.597

L(R(u)  P. mirabilis) = 0.96 x 0.83 x 0.02 x 0.99 x (1.00 – 0) x 0.93 = 0.015

L(R(u)  Edwardsiella) = 0.98 x 0.94 x 1.00 x 0 x (1.00 – 0) x 0.99 = 0

L(R(u)  Salmonella) = 0.95 x 0.86 x 0.03 x 0 x (1 – 0.98) x 0.92 = 0

Xk(bi) Mobilité H2 S Indole Urée ONPG Gaz

P. vulgaris 0.95 0.83 0.89 0.99 0.00 0.86


P. mirabilis 0.96 0.83 0.02 0.99 0.00 0.93

Edwardsiella 0.98 0.94 1.00 0.00 0.00 0.99

Samonella 0.95 0.86 0.03 0.00 0.02 0.92


Méthode probabiliste – Normalisation et seuil

Normalisation des vraisemblances


L( R(u ) | bi )
L(bi | R(u ))  m

 L( R(u) | b )
k 1
k

Choisir b* comme la (les) bactéries(s)


représentative(s) du germe u telle(s) que:

L(b* | R(u ))  max 1i m {L(bi | R(u ))} et L(b* | R(u ))  s*


Méthode probabiliste – Exemple 1

EXEMPLE 1
- T = {Mobilité, H2S, Indole, Urée, ONPG, Gaz}
- B = {Prot. vulgaris, Prot. mirabilis, Edwardsiella, Salmonella}
- un germe inconnu u de profil R(u)
- R(u) = {mobilité (+), H2S (+), Indole (+), Urée (+), ONPG (–), Gaz (+)}

Xk(bi) Mobilité H2 S Indole Urée ONPG Gaz

P. vulgaris 0.95 0.83 0.89 0.99 0.00 0.86


P. mirabilis 0.96 0.83 0.02 0.99 0.00 0.93

Edwardsiella 0.98 0.94 1.00 0.00 0.00 0.99

Samonella 0.95 0.86 0.03 0.00 0.02 0.92


Méthode probabiliste – Exemple 1

EXEMPLE 1

L(R(u)  P. vulgaris) = 0.597


L(R(u)  P. mirabilis) = 0.015
L(R(u)  Edwardsielle) =0
L(R(u)  Salmonella) =0
__________
TOTAL 0,612

L(P. vulgaris|R(u)) = 0.597 / 0,612 = 0,975


L(P. mirabilis|R(u)) = 0.015 / 0,612 = 0,025
L(Edwardsielle|R(u)) = 0 / 0,612 =0
L(Salmonella|R(u)) = 0 / 0,612 =0
__________
TOTAL 1
Méthode probabiliste – Exemple 1

EXEMPLE 1

L(R(u)  P. vulgaris) = 0.597


L(R(u)  P. mirabilis) = 0.015
L(R(u)  Edwardsielle) =0
L(R(u)  Salmonella) =0
__________
TOTAL 0,612

L(P. vulgaris|R(u)) = 0.597 / 0,612 = 0,975


L(P. mirabilis|R(u)) = 0.015 / 0,612 = 0,025
L(Edwardsielle|R(u)) = 0 / 0,612 =0
L(Salmonella|R(u)) = 0 / 0,612 =0
__________
TOTAL 1
Méthode probabiliste – Exemple 2

EXEMPLE 2
- T = {Mobilité, H2S, Indole, Urée, ONPG, Gaz}
- B = {Prot. vulgaris, Prot. mirabilis, Edwardsiella, Salmonella}
- un germe inconnu u de profil R(u)
- R(u) = {mobilité (+), H2S (+), Indole (-), Urée (+), ONPG (–), Gaz (+)}

Xk(bi) Mobilité H2 S Indole Urée ONPG Gaz

P. vulgaris 0.95 0.83 0.89 0.99 0.00 0.86


P. mirabilis 0.96 0.83 0.02 0.99 0.00 0.93

Edwardsiella 0.98 0.94 1.00 0.00 0.00 0.99

Samonella 0.95 0.86 0.03 0.00 0.02 0.92


Méthode probabiliste – Exemple 2

EXEMPLE 2

L(R(u)  P. vulgaris) = 0.074


L(R(u)  P. mirabilis) = 0.719
L(R(u)  Edwardsielle) =0
L(R(u)  Salmonella) =0
__________
TOTAL 0,793

L(P. vulgaris|R(u)) = 0.074 / 0,793 = 0,093


L(P. mirabilis|R(u)) = 0.719 / 0,793 = 0,907
L(Edwardsielle|R(u)) = 0 / 0,793 =0
L(Salmonella|R(u)) = 0 / 0,793 =0
__________
TOTAL 1

Vous aimerez peut-être aussi