Académique Documents
Professionnel Documents
Culture Documents
Remerciement
KBIR M’hamed, de tout cœur pour votre excellent encadrement durant votre
module de vision artificielle. Votre enseignement a été d'une grande aide pour
nous. Votre façon d'expliquer les concepts complexes et de nous guider dans la
Encore une fois, nous vous remercions de nous avoir donné l'opportunité
2
Table de matières
I.Introduction..................................................................................................................................................... 4
II.Objectifs de projet : .......................................................................................................................................4
III.Description du dataset : ............................................................................................................................... 5
IV.Outils utilisés : .............................................................................................................................................. 8
V.Création de modèle : ...................................................................................................................................... 9
1.Chargement de données : ............................................................................................................................. 9
2.Répartition de données : ............................................................................................................................. 10
3.Prétraitement des images :.......................................................................................................................... 11
4.Construction du modèle U-Net :................................................................................................................. 16
VI.Exemples des Predictions du modèle ……………………….……………………………………….……21
VII.Deploiment du modèle…………………………………………………………………………………...….22
VIII.Conclusion : ............................................................................................................................................. 26
IX.Bibliographie : ............................................................................................................................................ 27
3
I. Introduction
Les tumeurs cérébrales demeurent un défi majeur dans le domaine médical et neurologique,
caractérisées par une croissance anormale de cellules dans le cerveau, la moelle épinière ou
les structures crâniennes. Qu'elles soient bénignes ou malignes, leur détection précoce et une
évaluation précise s'avèrent cruciales pour la prise en charge efficace des patients. Les
symptômes, variant en fonction de la taille et de l'emplacement de la tumeur, incluent des
maux de tête, des nausées, des troubles visuels, des perturbations de l'équilibre et des
altérations de la parole.
Le diagnostic repose souvent sur des examens tels que l'IRM, la TDM et la ponction lombaire,
permettant d'orienter le choix des traitements, parmi lesquels la chirurgie, la radiothérapie et
la chimiothérapie. Cependant, malgré ces avancées, les tumeurs cérébrales demeurent un
défi redoutable, et leur taux de survie, selon l'OMS, est estimé à environ 30 % à 5 ans.
Un facteur crucial dans le pronostic est le retard de diagnostic, influençant grandement les
chances de survie. Une étude révélatrice publiée dans le journal "Cancer" souligne que le taux
de survie à 5 ans varie de manière significative en fonction du moment du diagnostic, passant
de 43 % pour une détection précoce (dans les 3 mois suivant l'apparition des symptômes) à
25 % pour des diagnostics tardifs (plus de 6 mois après le début des symptômes).
Cependant, même avec les progrès notables dans le domaine de l'imagerie médicale, la
détection précoce des tumeurs cérébrales reste entravée par des défis techniques,
notamment le bruit dans les images d'IRM. Ces obstacles influent de manière substantielle sur
la précision de la détection précoce, constituant un appel à l'innovation dans le domaine de
l'analyse et du traitement des images IRM. Ce projet se positionne au cœur de cette
nécessité, visant à surmonter ces obstacles pour améliorer significativement les perspectives
de traitement et les résultats pour les patients atteints de tumeurs cérébrales.
Dans le cadre de ce projet, notre objectif principal est de mettre en œuvre un programme de
Deep learning dédié à la segmentation des images IRM du cerveau, suivi de la détection
précise des tumeurs cérébrales. Les grandes lignes de nos objectifs sont les suivantes :
1. Segmentation des Images IRM :
• Mettre au point un modèle de deep learning capable de segmenter les structures
cérébrales sur les images IRM en créant des masques pour les tumeurs. La
segmentation précise constitue la première étape cruciale pour la détection
ultérieure des tumeurs.
2. Détection Précise des Tumeurs Cérébrales :
4
• Intégrer des mécanismes de détection des tumeurs dans le modèle, permettant
l'identification des anomalies présentes dans les régions segmentées.
3. Optimisation du Modèle :
• Optimiser le modèle de deep learning en ajustant ses paramètres afin d'améliorer sa
performance globale. Cette étape vise à garantir la précision et la fiabilité du modèle.
4. Validation et Évaluation Comparative :
• Valider rigoureusement le modèle en utilisant divers ensembles de données. Ensuite,
procéder à une évaluation comparative avec les méthodes de détection actuellement
en usage pour démontrer l'efficacité de notre approche.
5. Tester le modèle manuellement avec des nouveaux images IRM :
• La mise en œuvre d’une application (programme de teste) basique pour tester notre
modèle en faisant la prédiction sur les nouvelles images IRM.
Remarque :
Le choix du modèle UNET pour notre projet de segmentation d'images médicales s'est avéré
judicieux en raison de ses nombreux avantages. UNET est spécifiquement conçu pour les
tâches de segmentation, avec une architecture qui permet de capturer à la fois les
caractéristiques contextuelles et spatiales des images. Sa structure en forme d'U, avec une
combinaison de couches d'encodeur et de décodeur, favorise une représentation détaillée
des régions d'intérêt. De plus, UNET est capable de gérer efficacement les images médicales
avec des structures complexes, telles que les tumeurs cérébrales, en fournissant une
segmentation précise même dans les zones difficiles à discerner. Cette adaptabilité et cette
performance en font un choix optimal pour notre application, où la précision de la
segmentation est cruciale pour le diagnostic médical.
Le Dataset utilisé dans le cadre de notre projet n'a pas été constitué en interne, mais a été
5
obtenu à partir d'une source externe, spécifiquement sur Internet. Cette base de données
exhaustive regroupe un grand nombre d'images IRM de cerveaux, caractérisées par leur
qualité élevée. Un aspect essentiel de ce Dataset est son inclusion de masques associés aux
tumeurs.
Voici une description claire trouvée avec le dataset :
‘’ Ce dataset contient des images IRM cérébrales accompagnées de masques manuels de
segmentation des anomalies FLAIR. Les images ont été obtenues à partir de The Cancer Imaging
Archive (TCIA). Elles correspondent à 110 patients inclus dans la collection de gliomes de bas grade de
The Cancer Genome Atlas (TCGA) avec au moins une séquence d'inversion de récupération atténuée
par le fluide (FLAIR) et des données de regroupement génomique disponibles. Les clusters
génomiques des tumeurs et les données des patients sont fournies dans le fichier data.csv.
Toutes les images sont fournies au format .tif avec 3 canaux par image. Pour 101 cas, 3
séquences sont disponibles, à savoir pré-contraste, FLAIR, post-contraste (dans cet ordre de
canaux). Pour 9 cas, la séquence post-contraste est manquante et pour 6 cas, la séquence
pré-contraste est manquante. Les séquences manquantes sont remplacées par la séquence
FLAIR pour que toutes les images aient 3 canaux. Les masques sont des images binaires à 1
canal. Ils segmentent les anomalies FLAIR présentes dans la séquence FLAIR (disponible pour
tous les cas).
Le dataset est organisé en 110 dossiers nommés d'après l'ID du cas qui contient des
informations sur l'institution source. Chaque dossier contient des images IRM avec la
convention de dénomination suivante :
TCGA_<code-de-l'institution>_<id-du-patient>_<numéro-de-tranche>.tif
Les masques correspondants ont un suffixe _mask. ‘’
6
Exemple TGCA_CS :
Exemple TGCA_DU :
Exemple TGCA_FG :
Exemple TGCA_HT :
7
IV. Outils utilisés :
1. Bibliothèques Python :
• matplotlib.pyplot: Utilisée pour la visualisation des graphiques.
• numpy: Utilisée pour les opérations numériques.
• glob: Utilisée pour rechercher des chemins de fichiers correspondant à un motif
spécifique.
• cv2 (OpenCV): Utilisée pour le traitement d'images.
• pandas: Utilisée pour manipuler et analyser des données.
2. Deep Learning Framework :
• torch (PyTorch): Utilisé pour la construction et l'entraînement de modèles de
deep learning.
3. Modules PyTorch spécifiques :
• torchvision.transforms: Utilisé pour appliquer des transformations aux images.
• torch.nn: Utilisé pour définir des modules de réseaux de neurones.
4. Algorithmes / Concepts de Deep Learning :
• U-Net : Architecture de réseau de neurones convolutionnels CNN souvent
utilisée pour la segmentation d'images médicales.
• Optimiseur Adam : Algorithme d'optimisation adaptatif utilisé pour mettre à jour
les poids du modèle pendant l'entraînement.
• Fonction de perte CrossEntropy : Utilisée pour évaluer la divergence entre les
prédictions du modèle et les masques réels.
8
5. Techniques de Prétraitement d'Images :
• Normalisation des images : Utilisée pour normaliser les valeurs des pixels des
images.
• Data Augmentation : Utilisée pour augmenter la taille du dataset en appliquant
des transformations telles que la rotation et le retournement.
V. Création de modèle :
1. Chargement de données :
9
2. Répartition de données :
Résultat :
10
3. Prétraitement des images :
11
Résultat :
12
➢ Division du jeu de données en ensembles d'entraînement, de validation et de
test :
Ce code divise le jeu de données en ensembles d'entraînement, de validation et de test en
fonction d'un pourcentage prédéfini. Il affiche également la taille de chaque ensemble pour
vérification.
Résultat :
->Le jeu de données est divisé en 3 parties : 1336 images d’entraînement, 445 images de
13
validation et 446 images de test.
➢ Augmentation de données :
Remarque :
Les transformations d'augmentation, telles que la rotation et le retournement, sont
appliquées de manière aléatoire à chaque image du jeu de données. Cela crée une diversité
dans les exemples présentés au modèle pendant l'entraînement. Par exemple, le modèle peut
14
voir la même tumeur sous différents angles en raison de la rotation, ou il peut apprendre à
reconnaître une tumeur indépendamment de son orientation grâce au retournement vertical
ou horizontal.
15
4. Construction du modèle U-Net :
Définition d’une architecture U-Net pour la segmentation d'images médicales. La classe
ConvBlock représente un bloc de convolution individuel utilisé dans la partie bottleneck du
réseau. Les classes StackEncoder et StackDecoder définissent les parties encodeur et
décodeur du réseau, respectivement. Enfin, la classe UNET combine ces parties pour créer le
modèle complet U-Net.
Le modèle prend en compte les dimensions d'entrée spécifiées dans input_shape.
La fonction forward effectue la propagation avant à travers le réseau.
16
➢ Génération de données aléatoires pour tester le modèle U-Net :
Ce code génère des données d'entrée aléatoires pour tester le modèle U-Net. Il crée une
instance du modèle avec la même forme que les données d'entrée et passe ensuite les
données d'entrée à travers le modèle. Enfin, il affiche les formes des données d'entrée et de
sortie pour vérifier les dimensions :
Dans ce code, un optimiseur Adam est configuré pour optimiser les paramètres du modèle.
L'optimiseur utilise un taux d'apprentissage de 0.0001. De plus, la fonction de perte
CrossEntropyLoss est définie comme critère pour évaluer la différence entre les prédictions
du modèle et les véritables étiquettes (labels) lors de l'entraînement.
17
sauvegardés :
Résultat :
18
➢ Évaluation du modèle :
19
➢ Tester le modèle sur le jeu de données de test :
Résultat :
✓ Le résultat du test indique que le modèle a correctement prédit 3 865 589 pixels sur
un total de 4 128 768 pixels, ce qui correspond à une précision de 93,63%. Cela
suggère que le modèle a bien performé sur le jeu de données de test, avec une
grande majorité des pixels correctement prédits. La précision est un indicateur de la
capacité du modèle à effectuer des prédictions précises par rapport aux véritables
valeurs de pixels dans les masques du jeu de données de test. Un résultat élevé, tel
que celui-ci, est généralement positif et indique une performance robuste du
modèle.
20
VI. Exemples des Prédictions du modèle :
On prend un exemple de visualisation :
L’image originale :
Le masque :
La prédiction :
21
Autre façon de visualisation de résultat :
22
Frontend :
23
1.2 Prédiction :
Autres cas :
24
25
VIII. Conclusion :
En résumé, notre projet de segmentation d'images médicales pour la détection
de tumeurs cérébrales à partir d'IRM représente une étape encourageante dans
l'application de l'intelligence artificielle à des problématiques médicales
complexes. Les résultats obtenus témoignent de l'efficacité du modèle UNET
dans la segmentation des zones tumorales. Toutefois, il est important de noter
que des défis subsistent, notamment en ce qui concerne l'optimisation continue
du modèle pour garantir une performance robuste sur divers ensembles de
données.
26
IX. Bibliographie :
- https://soar.suny.edu/bitstream/handle/20.500.12648/1610/Kalakuntla_Shash
ank%20Pro ject%20Final%20Document.pdf?sequence=1&isAllowed=y
- http://dspace.univ-medea.dz/bitstream/123456789/8041/1/M122189.pdf
- https://di.univ-
blida.dz/jspui/bitstream/123456789/11334/1/M%C3%A9moire_R%C3%A9ctifi
%C3%A9_B outiara_Khermaza_%281%29.pdf
- https://www.siemens-healthineers.com/fr-ma/medical-
imaging#:~:text=L'imagerie%20m%C3%A9dicale%20occupe%20une,%C3%A9t
roite%20de
%20la%20r%C3%A9ponse%20th%C3%A9rapeutique.
- https://www.fondation-arc.org/cancer/cancer-cerveau/symptomes-
diagnostic-
cancer#:~:text=L'examen%20dure%20une%20vingtaine,le%20scanner%20en%
20premi%C 3%A8re%20intention.
- https://www.cea.fr/comprendre/Pages/sante-sciences-du-vivant/essentiel-
sur-imagerie- medicale.aspx
- https://www.kaggle.com/datasets/navoneel/brain-mri-images-for-brain-
tumor-detection
- https://www.kaggle.com/datasets/ahmedhamada0/brain-tumor-detection
27
28