Vous êtes sur la page 1sur 36

1 Introduction 4 Processus de

développement du modèle

Plan 2 Le cancer du sein 5 Résultats

3 Problématique 6 Conclusion

2
Introduction
NTRODUCTION
Statistiques sur le cancer du sein

‫ ﻤ‬Le cancer du sein est la tumeur maligne la plus


fréquente chez la femme
‫ ﻤ‬1 femme / 8 aura un cancer du sein dans sa vie
‫ ﻤ‬52783 nouveaux cas au Maroc
‫ > ﻤ‬14 225 décès / an au Maroc
‫ ﻤ‬36.9% du total des cancers chez les femme

4
Le cancer du
sein
LE CANCER DU SEIN
INTRODUCTION
INTRODUCTION
Anatomie du sein
Principe
o Les seins sont principalement constitués de tissus adipieux entrecoupés de tissu conjonctif
o Il y a aussi des parties moins visibles :
• lobes
• conduits
• ganglions lymphatiques

6
LE CANCER DU SEIN
INTRODUCTION
INTRODUCTION
Anatomie du sein
Principe

o Chaque sein a 15 à 20 sections (lobes)


disposées comme les pétales de marguerite
o À l'intérieur de chaque lobe se trouvent de
nombreuses structures plus petites appelées
lobules
o À la fin de chaque lobule se trouvent de
minuscules sacs (bulbes) qui peuvent produire
du lait

7
LE CANCER DU SEIN
INTRODUCTION
INTRODUCTION
Mammographie
Principe

• Utilise un système de rayons X à faible dose pour examiner


les seins.
• La mammographie numérique remplace le film
radiographique par des détecteurs à semi-conducteurs qui
convertissent les rayons X en signaux électriques. Ces signaux
sont utilisés pour produire des images qui peuvent être
affichées sur un écran d'ordinateur (similaire aux appareils
photo numériques).
• Réalisée à l'aide d'un appareil qui sert exclusivement à
l'exploration des seins et spécifiquement adapté à celle-ci : un
mammographe
8
LE CANCER DU SEIN
INTRODUCTION
INTRODUCTION
Mammographie
Principe

9
LE CANCER DU SEIN
INTRODUCTION
INTRODUCTION
Anomalies au niveau du sein
Principe
Les deux indicateurs les plus importants qu’on peut mentionner lors d’une mammographie sont :

10
Masse Calcification
Problématique
LE CANCER DU SEIN
INTRODUCTION
INTRODUCTION
Mammographie
Principe
La mammographie est la méthode la plus fiable pour la détection précoce du cancer du sein.
Mais, en raison du nombre élevé de mammographies à lire, le taux de précision a tendance à
diminuer:
• Les radiologues diagnostiquent de manière erronée 10 à 30% des cas malins
• Parmi les cas envoyés pour une biopsie chirurgicale, seuls 10 à 20% sont en fait
malins
• Il a été prouvé que la double lecture des mammographies augmentait la précision,
mais à un coût élevé.
• Sensibilié dépendante de la densité mammaire.

12
Problématique
INTRODUCTION
INTRODUCTION
Pourquoi un DA0 ?
Principe

49 cas de cancer détecté


• Sur les 49 cancers détectés dans l'étude groupe, 8 ont été
initialement détectés par DAO seulement Les CAD seuls
16%

• Une augmentation de la proportion des malignités détectés de


stade précoce (stade 0 et 1).

• L’emploi d’un DA0 dans ce centre du sein a entraîné à une


Les radiologues
augmentation de 20% du nombre de cancers détectés et une seuls
18%
amélioration de la détection précoce de la tumeur.
Les radiologues +
Les CAD
La DA0 peut donc aider les radiologues à atteindre une efficacité et une 65%

efficacité élevées
13
F reer T W, Ulisse y MJ, “Computer-aided Detection in Screening Mammography: A Prospective
Study of 12,860 Patients in a Community Breast Center”, Radiology 2000; 2217 (P), 400.
Problématique
INTRODUCTION
INTRODUCTION
Pourquoi un CAD ?
Principe

les systèmes de détection/Diagnostic Assisté par Ordinateur


(DAO) a pour but d’offrir une seconde interprétation aux
radiologues afin de les aider à détecter/diagnostiquer à un stade
précoce, les lésions malignes quelles que soient leurs natures
masses ou microcalcifications.

14
Problématique
INTRODUCTION
INTRODUCTION
L’apprentissage automatique Vs l’apprentissage en profondeur
Principe

15
Problématique
INTRODUCTION
INTRODUCTION
Les réseaux de neurones à convolution
Principe

16
Problématique
INTRODUCTION
INTRODUCTION
Transfer Learning
Principe

Au lieu d’entrainer un réseau profond à partir de zéro pour


résoudre une nouvelle problématique, on peut:
• Se servir d’un réseau entrainé sur un domaine différent pour
une tâche différente.
• L’adapter à notre domaine et à notre tâche cible.

17
Problématique
INTRODUCTION
INTRODUCTION
Transfer Learning
Principe

18
Développement
du modèle
Développement du modèle
INTRODUCTION
INTRODUCTION
La DDSM et la CBIS-DDSM
Principe

• La DDSM (Digital Database of Screening


Mammography) est une base de données de 2 620
études de mammographie sur film numérisé. Il contient
des cas normaux, bénignes et malignes avec des
informations de pathologie vérifiées.

• Le CBIS-DDSM (Curated Breast Imaging Subset of


DDSM) est un sous-ensemble de la base de données
DDSM organisée par un mammographe qualifié.

20
Développement du modèle
INTRODUCTION
INTRODUCTION
Préparation de données
Principe

21
Développement du modèle
INTRODUCTION
INTRODUCTION
Data preprocessing – Otsu Segmentation
Principe

22
Développement du modèle
INTRODUCTION
INTRODUCTION
Labels pour images
Principe

000000.dcm 000001.dcm

P_00016_LEFT_CC_FULL.png P_00016_LEFT_CC_MASK.pn
g

23
Développement du modèle
INTRODUCTION
INTRODUCTION
Extraction de patch
Principe

 Les patchs pour les images normales ont été extraits au hasard
dans la zone d'image du sein.
 Les patchs pour les images anormales ont été créés par
échantillonnage à partir du centre et autour de la région du ROI

24
Développement du modèle
INTRODUCTION
INTRODUCTION
Augmentation des données
Principe

 Pivoter l'image prise en entrée de 0, 90, 180 ou 270 degrés au


hasard, tous avec la même probabilité de se produire.
 Effet miroir à l'image horizontalement et verticalement avec la
probabilité fixée à 0,5 pour chaque sens de retournement.

25
Développement du modèle
INTRODUCTION
INTRODUCTION
Auto-encodeur
Principe

 Nouvelle représentation d’un jeu de données.


Numéro Labels
 Plus compacte.
0 Normale
 Présente moins de descripteurs.
1 Calcification bégnine

2 Masse bégnine

3 Calcification maligne

4 Masse maligne

26
Développement du modèle
INTRODUCTION
INTRODUCTION
Répartition de donnée du Dataset
Principe

 Répartition de données entre l’entrainement et le test


était suivant le rapport 80/20.
 50% de données de test pour l’évaluation.

Nombre de données 30656


d’entrainement
Nombre de données de validation 3447

Nombre de données de test 3447

27
Résultats
Résultats
INTRODUCTION
INTRODUCTION
Comparaison de différents modèles
Principe

Architecture Transfer Classification binaire Multiple classification (*)


Learning

Métriques Acuracy Spécifité Sensibilité F-score Acuracy Spécifité Sensibilité F-score

VGG (from scratch) - 0.73 0.78 0.73 0.83 - - - -

VGG16 ImageNet 0.90 0.89 0.72 0.91 0.80 0.92 0.57 0.6

DenseNet201 ImageNet 0.94 0.93 0.95 0.95 - - - -

ResNet50 ImageNet 0.90 0.94 0.89 0.93 0.78 0.90 0.48 0.49

InceptionResNetV2 ImageNet - - - - 0.86 0.93 0.65 0.68

InceptionResNetV2 (avec ImageNet 0.96 0.96 0.93 0.95 0.877 0.95 0.69 0.71
classe_weight)

(*) : Ces mesures sont calculées en considérant le ‘Macro Average’. 29


Résultats
INTRODUCTION
INTRODUCTION
Architecture du modèle InceptionResNetV2
Principe
Architecture de InceptionResNetV2

• Modèle déjà implémenté et pré-entrainé dans la bibliothèque


Keras
• Initialisation des poids avec ImageNet

Le but est d'identifier les transactions frauduleuses, mais vous n'avez pas beaucoup de ces
échantillons positifs avec lesquels travailler, vous voudriez donc que le classificateur pondère
fortement les quelques exemples disponibles. Vous pouvez le faire en passant des pondérations Keras
pour chaque classe via un paramètre. Cela amènera le modèle à "accorder plus d'attention" aux
exemples d'une classe sous-représentée.

30
Résultats
INTRODUCTION
INTRODUCTION
Classe weight
Principe

Classe weight pour une classification binaire Classe weight pour une classification multiple

Classe Normal Anormal Classe Normale Calcification bégnine Masse bégnine Calcification maligne Masse maligne

Poids 0.69749089 1.76588115


Poids 0.27818512 2.1634439 2.7177305 3.84883867 3.17185722

31
Résultats
INTRODUCTION
INTRODUCTION
Discussion – Classification binaire
Principe

nceptionResNetv2 classification binaire : AUC plot et matrice de confusion et métriques 32


Résultats
INTRODUCTION
INTRODUCTION
Discussion – Classification multiple
Principe

33
nceptionResNetv2 classification multiple : AUC plot et matrice de confusion et métriques
Résultats
INTRODUCTION
INTRODUCTION
Visionnement des résultats
Principe

34
Conclusion
Conclusion
Ce travail a suggéré d'utiliser le diagnostic assisté par ordinateur systèmes pour aider les radiologues à détecter la présence d’anomalies de façon plus rapides que les
procédures traditionnelles.
Les résultats qu’on a obtenu pour une classification binaire sont prometteurs. Toutefois, pour la classification multiple les résultats était relativement bas, mais
acceptables. Le déséquilibre entre les classes multiples influence sur la capacité du réseau à bien apprendre.
Cependant, nous pouvons profiter de notre réseau en se contentant des probabilités plutôt que des prédictions. Ces probabilités devront fournir des informations
supplémentaires aux radiologues plutôt que de les remplacer. Cela permettra donc aux radiologues de se concentrer sur des scans plus ambigus tout en consacrant moins de
temps aux scans qui sont de très faibles probabilités.
Notre travail n’est pas achevé à ce stade. En dépendance du matériel nécessaire, notre travail futur inclura le travail sur des images de mammographie entières, ce qui
veut dire l’élaboration d’un système qui va prendre en entrée une image de mammographie et l'analysera, en passant d’un classificateur de patch à un classificateur d’image

36 entière.
Merci pour votre attention !

Vous aimerez peut-être aussi