Académique Documents
Professionnel Documents
Culture Documents
Sous l’encadrement de
Dr Jules WAKU
(Chargé de cours, Université de Yaoundé I)
ANNÉE ACADÉMIQUE 2020-2021
♣ Dédicaces ♣
i
♣ Remerciements ♣
Je remercie le DIEU TOUT PUISSANT, qui m’a accordé santé, force, sagesse et
courage tout au long de ce travail.
Je remercie aussi tous ceux qui ont participé de près ou de loin à la réalisation de ce
travail. Je cite entre autres :
• Mes amis pour leur proximité dans un soutien quotidien et leur motivation respec-
tive. J’associe l’expression de ma reconnaissance à l’endroit de tous ceux dont mon
cœur ne saurait exprimer par des écrits, pour des efforts multiples consentis à mon
égard.
ii
♣ Table des matières ♣
Dédicaces i
Remerciements ii
Résumé v
Abstract vi
1 Introduction 1
*
2 Cancer du sein 3
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Anatomie du sein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.3 Les maladies du sein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.4 Les facteurs de risques du cancer du sein . . . . . . . . . . . . . . . . . . . 4
2.5 Dépistage du cancer du sein . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.6 Le diagnostic du cancer du sein . . . . . . . . . . . . . . . . . . . . . . . . 5
2.7 Méthodes préventives conte le cancer du sein . . . . . . . . . . . . . . . . . 5
2.8 Traitement du cancer du sein . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3 Etat de l’art 6
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.2 Composition des systèmes DAOx . . . . . . . . . . . . . . . . . . . . . . . 6
3.3 Segmentation d’image . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.3.1 Segmentation par l’algorithme de la ligne de partage des eaux
contrôlée par des marqueurs . . . . . . . . . . . . . . . . . . . . . . 7
3.3.2 Segmentation à l’aide d’un modèle de contour actif (ACM) . . . . . 9
3.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4 Modèle 12
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4.2 Base d’images . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4.3 Prétraitement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
iii
TABLE DES MATIÈRES TABLE DES MATIÈRES
4.4 Segmentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4.4.1 La segmentation par seuillage global . . . . . . . . . . . . . . . . . 14
4.4.2 La segmentation morphologique . . . . . . . . . . . . . . . . . . . . 15
4.4.2.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4.4.2.2 Élément Structurant . . . . . . . . . . . . . . . . . . . . . 15
4.4.2.3 Dilatation morphologique . . . . . . . . . . . . . . . . . . 15
4.4.2.4 Érosion morphologique . . . . . . . . . . . . . . . . . . . . 16
4.4.2.5 Ouverture morphologique . . . . . . . . . . . . . . . . . . 16
4.4.2.6 Fermeture morphologique . . . . . . . . . . . . . . . . . . 16
4.4.3 Schéma de la méthode de segmentation . . . . . . . . . . . . . . . . 17
4.5 Extraction des descripteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
4.5.1 Les descripteurs morphologiques . . . . . . . . . . . . . . . . . . . . 18
4.5.2 Les descripteurs d’intensité . . . . . . . . . . . . . . . . . . . . . . . 19
4.5.3 Les descripteurs de texture . . . . . . . . . . . . . . . . . . . . . . . 19
4.6 Classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
4.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
5 Mise en œuvre 22
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
5.2 Résultats de la segmentation . . . . . . . . . . . . . . . . . . . . . . . . . . 22
5.3 Application à la classification . . . . . . . . . . . . . . . . . . . . . . . . . 24
5.3.1 Extraction des descripteurs . . . . . . . . . . . . . . . . . . . . . . 24
5.3.2 Critères d’évaluation des classifieurs . . . . . . . . . . . . . . . . . . 24
5.3.3 Tests et résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
*
Conclusion et perpectives 28
Références 29
Le cancer du sein est le cancer le plus fréquent parmi ceux rencontrés chez les femmes
dans le monde. Il affecte 99% des femmes et 1% des hommes. L’efficacité du traitement
dépend de la détection précoce de la maladie. Le diagnostic assisté par ordinateur joue
un rôle de plus en plus important dans ce domaine. En particulier, le traitement des
images médicales est récemment devenue une discipline riche et variée, dans laquelle les
nombreuses méthodes existantes sont appliquées aux problèmes réels. Les travaux de ce
mémoire s’inscrivent dans le diagnostic assisté par ordinateur du cancer du sein basé sur
l’analyse des images d’histopathologie du sein. La tâche actuelle est de classifier celles-ci
comme bénigne ou maligne. Nous proposons une procédure de segmentation des noyaux
dans les images. Premièrement, nous effectuons une séparation des canaux de couleur
de l’image dans l’espace de couleur RGB. Ensuite un seuillage global est appliqué dans
chacun des trois canaux de couleur de l’image ; obtenant ainsi trois images qui seront
fusionnée en une seule grâce à l’opérateur logique « AND ». Enfin, nous employons
*
v
♣ Abstract ♣
Breast cancer is the most common cancer among women in the world. It affects 99% of
women and 1% of men. The effectiveness of the treatment depends on the early detection
of the disease. Computer-assisted diagnosis plays an increasingly important role in this
field. In particular, the treatment of medical images has recently become a rich and varied
discipline, in which the many existing methods are apply to real problems. The work
of this thesis is part of the computer-assisted diagnosis of breast cancer based on the
analysis of histopathology images of breast. The current task is to classify these as benign
or malignant. We propose a procedure of segmentation of nuclei in the images. First,
we perform a separation of the color channels from the image in the RGB color space.
Then a global thresholding is applied in each of the three color channels of the image ;
thus obtaining three images that will be merged into one thanks to the logical operator
« AND ». Finally, we use morphological opening to obtain the final segmentation. A
set of 16 characteristics extracted from the segmented nuclei is used in the classification
*
by the classifiers SVM, KNN and decision trees (DT), where we obtained respectively
a classification rate of 97.5%, 94.4% and 92.5%. The approach was examined on 508
histopathology images of breast obtained from dataset (BreakHis). The results of our
classification show that interactive systems to support medical decisions based on our
method would provide better diagnostic information.
vi
♣ Table des figures ♣
vii
♣ Liste des tableaux ♣
3.1 Résumé des différents algorithmes utilisés pour l’analyse des images d’his-
topathologie mammaires. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
viii
? ? Chapitre un ? ?
Introduction
L’interprétation des images médicales est l’un des domaines de recherche les plus encou-
rageants, étant donné qu’elle offre des facilités pour le diagnostic et les décisions théra-
peutiques de plusieurs pathologies à l’instar des cancers tel que le cancer du sein. Selon
l’organisation mondiale de la santé (OMS), le cancer du sein est le cancer le plus fréquent
chez les femmes dans le monde (avec 11 900 décès estimés en 2015) et représente 16%
de l’ensemble des cancers féminins. Bien que l’on considère cette maladie comme une
maladie du monde développé, une majorité (69%) de l’ensemble de décès par cancer du
sein survient dans les pays en développement (WHO Global Burden of Disease, 2004).
Au Cameroun 150 000 cas sont enregistrés chaque année avec un taux de mortalité de
80% (Run For a Cure Africa Cameroon). Plusieurs études (Filipczuk et al. [3], Kowal and
Filipczuk [4], Jain et al. [2]) ont montrées qu’un dépistage précoce reste le principal moyen
de lutter contre la maladie en ce sens qu’il permet d’améliorer les chances de survie ainsi
*
1
CHAPITRE 1. INTRODUCTION
d’interprétation est devenue difficile et fastidieux à gérer par les pathologistes. Ceci en-
traine habituellement non seulement les risques d’erreurs dans la détection du cancer mais
également une consommation excessive en temps. Ceci est dû à l’interpretation manuelle
au microscope des images de biopsies, à la grande variabilité dans la forme des masses
mammaires malignes et bénignes, et au fait que les pathologies sont souvent cachées dans
les tissus mammaires.
Depuis peu de temps une grande quantité d’études a été entreprise sur le diagnostic as-
sisté par ordinateur du cancer de sein basée sur la formation d’image de mammographie
Ganesan et al. [6], Mohanty et al. [7]. Beaucoup de chercheurs ont étudiés la segmentation
des images de biopsies des tumeurs de sein, cependant, quelques-uns de ces chercheurs
ont examiné l’efficacité de leur méthodologie dans un système de classification automatisé
complet de cancer de sein. Jelen et al. [8] a présenté une approche basée sur la méthode
réglée de segmentation de niveau. L’efficacité de classification a été examinée sur 110 (44
malins, 66 bénins) images avec des résultats atteignant 82.6%. Niwas et al. [9] ont pré-
senté une méthode basée sur l’analyse de la texture des noyaux employant une vaguelette
transformée. L’efficacité de classification avec l’algorithme k-nearest neighbor sur 645 (311
malins, 334 bénins) images a atteint 93.9%. Une autre approche a été présentée par Malek
et al. [10]. Ils ont utilisés des découpes actives pour segmenter des noyaux et ont classi-
fiés 200 (80 malins, 120 bénins) images employant l’algorithme Fuzzy c-means, réalisant
l’efficacité de 95%. Le diagnostic du cancer de sein a été également étudié par Xiangchun
et al. [11]. La régression des moindres carrés partielle a été employée pour classifier 699
(241 malins, 458 bénins) images, rapportant à 96.57% l’efficacité. Cependant, les auteurs
n’ont pas décrit la méthode de segmentation employée pour extraire des noyaux.
Dans ce cas d’étude l’interêt est porté sur la construction d’un système de décision basé
*
sur le Diagnostic Assisté par Ordinateur (DAOx) du cancer du sein devant résoudre deux
principaux problèmes : le premier est lié à la segmentation des images cytologiques de
tissu de biopsie d’aiguille fine, tandis que le second concerne la classification des différents
cas de tumeurs comme bénin ou malin.
Afin de résoudre ce problème, dans ce document une méthode hybride basée sur le seuillage
global (utilisé par Filipczuk et al. [3] et Kowal and Filipczuk [4]) dans l’espace de couleur
RVB est employée pour la première étape de segmentation des noyaux. Ensuite, l’ouver-
ture morphologique est employée afin d’améliorer les résultats de la méthode précédente.
Enfin, nous montrons comment combiner ces différentes méthodes afin de construire un
système d’aide à la décision basé sur une segmentation robuste dont la finalité sera non
pas de remplacer le pathologiste mais de l’aider dans son diagnostic.
Le présent mémoire porte sur l’application de la segmentation des images au diagnostic
du cancer du sein, il est structuré en quatres chapitres et sera organisé comme suit :
Le chapitre 1 présente les généralités sur le cancer du sein afin de justifier l’importance
accordée à ce type de cancer.
Dans le chapitre 2, nous exposons quelques techniques connues de segmentation d’images
liées au diagnostic du cancer du sein ainsi que leurs insuffisances.
Le chapitre 3 présente et décrit le modèle de segmentation et de classification utilisé afin
de résoudre notre problème.
Au sein du chapitre 4 la mise en œuvre ainsi les résultats expérimentaux obtenus par
la méthode proposée seront abordés. Le document se termine par une conclusion et pers-
pectives.
Cancer du sein
2.1 Introduction
Le cancer du sein est l’une des principales causes de mortalité féminine. Au Cameroun, il
représente 21,3% des 14.000 malades du cancer selon le comité national de lutte contre le
cancer pour l’année 2016. L’incidence du cancer du sein reste croissante au Cameroun. Bien
que le ministère de la santé publique initie fréquemment des programmes de dépistage de la
pathologie, cela reste insuffisant car ils ne ciblent que les femmes des grandes métropoles.
Du fait du diagnostic tardif de la maladie, il en résulte souvent un traitement lourd,
mutilant et coûteux qui s’accompagne d’un taux de mortalité élevé.
Le sein est un organe pair et symétrique de forme hémisphérique, situé en avant du thorax,
entre la troisième et la cinquième côte, au-dessus du muscle grand pectoral. Sa fonction
biologique est de produire du lait afin de nourrir un nouveau-né. Il est essentiellement
constitué d’un tissu adipeux graisseux plus ou moins important qui lui donne sa forme
et son volume. La glande mammaire, noyée dans le tissu conjonctif, est composée d’une
vingtaine de lobules qui deviennent actives en période de lactation. Le lait sécreté est
déversé par des canaux galactophores séparés au niveau du mamelon. Le sein, parcouru
par une multitude de vaisseaux sanguins, est maintenu par la peau qui le recouvre et par
des fibres liées au muscle pectoral.
• Les tumeurs bénignes : elles résultent d’une simple anormalité, mais ne mettent pas
en danger la vie du sujet ;
3
2.4. LES FACTEURS DE RISQUES DU CANCER DU SEIN CHAPITRE 2. CANCER DU SEIN
• L’âge : le cancer du sein atteint plus fréquemment les femmes de plus de 50 ans.
• L’âge au moment de la première grossesse : les femmes qui n’ont pas eu d’enfant ou
celles qui ont donné naissance à leur premier enfant quand elles avaient plus de 30
ans.
• Une radiothérapie au thorax, surtout si elle a été reçue avant l’âge de 30 ans.
2.9 Conclusion
Dans ce chapitre nous avons présenté des notions de base concernant l’anatomie, les causes
et les traitements associés au cancer du sein.
Dans le chapitre suivant nous allons présenté quelques méthodes et techniques utilisées
dans la littérature pour la segmentation des images d’histopathologie mammaires.
Etat de l’art
3.1 Introduction
Traiter une image c’est la modifier pour améliorer son aspect visuel, la préparer à la
transmission par voie télématique ou la préparer à l’extraction d’une mesure. Par contre
analyser une image c’est en extraire une information, une mesure sur le contenu d’une
image. L’analyse et la classification font partie d’une chaı̂ne compacte indissociable de
traitement numérique et automatique (ou semi-automatique) intitulée le diagnostic as-
sisté par ordinateur (DAOx). Ainsi, une bonne évaluation de la performance d’une telle
partie de segmentation ou de classification nécessite la maı̂trise de toute la chaı̂ne de
diagnostic (présentée dans la figure 3.1). Ce chapitre présente des travaux et contribu-
tions existants dans la littérature qui s’intéressent au diagnostic du cancer du sein par
l’approche de segmentation. Cette littérature permettra une meilleure compréhension des
*
- Une étape de prétraitement qui sert à améliorer la qualité de l’image avant toutes
manipulations.
- Une étape de description qui a pour but de caractériser les lésions à travers des
formulations mathématiques.
Ces différentes étapes sont résumées dans le diagramme représenté dans la figure 3.1. On
détaille dans les sections qui suivent l’état de l’art concernant l’étape de segmentation
d’un système de diagnostic assisté par ordinateur.
6
3.3. SEGMENTATION D’IMAGE CHAPITRE 3. ETAT DE L’ART
les marqueurs FRST (Fast Radial Symmetry Transform) et l’autre les marqueurs minima
régionaux. L’ensemble des rayons R (rayon de l’élément structurant utilisé pour les opé-
rations morphologiques) peut être obtenu par le calcul de la FRST S. Cette disposition
des rayons reflète la taille des noyaux qui ont été bien représenté dans le prétraitement
d’image. Les marqueurs de noyaux sont extraits des minima de S en utilisant un paramètre
par défaut h = 0,4. La transformée des h-minima de la FRST, S est défini par l’équation
3.1 :
Sh = ρS (S + h) (3.1)
Où ρ est le facteur de niveaux de gris et est l’opérateur d’érosion.
Dans l’étape de post-traitement, les régions peu susceptibles de représenter les noyaux sont
supprimées et les contours des régions restantes sont paramétrés en ellipses. En variant la
taille de l’élément structurant dans l’étape de prétraitement, la procédure de segmentation
peut être réglée pour rechercher des noyaux à différents niveaux, permettant une analyse
à plusieurs niveaux. Les résultats de segmentation des échelles multiples et deux types
de marqueurs sont ensuite fusionnés en résolvant des régions simultanées pour donner la
segmentation finale.
La figure 3.2 montre les résultats de la segmentation utilisant l’algorithme de la ligne de
partage des eaux contrôlée par des marqueurs.
*
adaptée que pour certains types d’images. En effet, pour des spécimens d’histopatholo-
*
gie contenant un très grand nombre de noyaux se chevauchant d’une part et des noyaux
accolés aux cellules d’autre part, le résultat de la segmentation est de mauvaise qualité.
Toutefois, Jain et al. [2] affirment que la technique du seuillage bien qu’étant simple, n’est
pas parfaite pour séparer les cellules qui se chevauchent. Dans ce contexte, certaines mé-
thodes peuvent être utilisé pour trouver les bords entre les cellules qui se chevauchent.
Le modèle ACM est d’autant plus important, particulierement lorsque des formes spora-
diques (par exemple des cellules malignes) sont présentes dans l’image. Dans cette tech-
nique, ils ont commencé avec des contours prédéfinis, caractérisés par une fonction appro-
priée. Ces contours sont définis dans les deux régions qui sont à l’intérieur et à l’extérieur
du contour. Ces contours sont croissant à partir d’une fonction de définition de niveau
prédéfini. Les spécifications de cette fonction de définition de niveau prédéfini peuvent
être modifiée pour obtenir l’optimisation requise.
Chan and Vese [13] ont utilisé une technique adaptée à la segmentation des images d’his-
topathologie. Contrairement au modèle de contour actif, cette technique ne dépend pas
de l’emplacement de la frontière. Dans le modèle de Chan and Vese [13], une opération
d’énergie est utilisée avec les quatre paramètres d’accompagnement :
La figure 3.4 montre les résultats de la segmentation utilisant le modèle de contour actif
de Jain et al. [2].
Le taux de réussite de l’algorithme proposé par Jain et al. [2] se situe autour de 83.47%
*
Figure 3.4 – (a) Image originale (b) Image segmentée par le modèle de contour actif.
Jain et al. [2]
Tableau 3.1 – Résumé des différents algorithmes utilisés pour l’analyse des images
d’histopathologie mammaires.
Parvenu au terme de cette littérature, il en ressort que chacun des deux modèles pro-
*
posés par Veta et al. [1] et Jain et al. [2] présente tous des limites liées aux noyaux qui
se chevauchent dans les image segmentées. Cependant, celui de Jain et al. [2] basé sur le
modèle de contour actif offre non seulement une exactitude de résultat de segmentation
élevée, mais aussi est basée sur une technique assez simple (le seuillage). Toutefois ce
seuillage possède un inconvenient majeur à savoir : la possibilité d’obtenir des cellules ac-
colées. Une façon de pallier à ce chevauchement serait donc de faire recours aux opérations
morphologiques utilisées par Veta et al. [1].
Il apparait donc que notre méthode de segmentation dédiée à l’analyse d’images d’histo-
pathologie mammaire est une association entre une technique de seuillage global pour un
début de segmentation et l’utilisation des opérations de morphologie mathématique pour
une post-segmentation faisant ainsi d’elle une méthode hybride.
3.4 Conclusion
Ce chapitre nous a permis d’étudier les différentes étapes d’un système de diagnostic assisté
par ordinateur. Une telle étude est nécessaire afin de faire des choix appropriés pour le
traitement des images de tissus mammaires. En effet, le fait d’aborder quelques méthodes
de segmentation a permis d’étudier les limites de chaque méthode et par la suite, cela nous
a permis de choisir une méthode plus appropriée pour notre application. Une présentation
plus ou moins générale concernant l’étape de description dans une chaı̂ne DAOx est menée
dans l’objectif de préparer le terrain à une étude des différents descripteurs dans le chapitre
suivant. Ces différentes étapes sont des outils, à la fois utiles et nécessaires pour réussir le
diagnostic automatique du cancer du sein grâce aux images d’histopathologie mammaires.
Modèle
4.1 Introduction
Ce chapitre dresse la synoptique de la démarche préconisée qui comprend cinq étapes
essentielles qui sont : le procédé d’acquisition des images médicales utilisées pour l’essai,
le prétraitement éffectué sur les images de biopsie du sein, ensuite la méthode de seg-
mentation employée afin de localiser les noyaux est présenté. L’étape suivante est celle de
l’extraction des descripteurs des noyaux cellulaires de l’image segmentée et enfin le cha-
pitre se termine par la classification des images en deux catégories : maligne ou bénigne.
L’organigramme du système est présenté par la figure 4.1.
*
12
4.2. BASE D’IMAGES CHAPITRE 4. MODÈLE
4.3 Prétraitement
L’étape qui suit l’acquisition des images est celle du prétraitement, elle se déroule en deux
étapes suivantes :
• Le filtrage : cette opération a pour but de réduire le bruit causé par le dispositif
électronique d’acquisition des images. Afin de réduire ce bruit, les images sont filtrées
à l’aide d’un filtre passe-bas gaussien (Nixon et Aguado, 2012) qui s’exprime par
l’équation 4.1 :
*
!
(x2 + y 2 )
hg (x, y) = exp − (4.1)
2σ 2
Où σ = 0.85, et hg est le masque du filtre ayant pour taille 3 × 3 (Kowal and Filipczuk
[4]).
4.4 Segmentation
L’étape succédant au prétraitement d’images est la segmentation. La segmentation va
mettre en évidence des segments qui correspondent à des objets, des parties d’objets ou
des groupes d’objets qui apparaissent dans une image. Dans le cas présent les objets qui
devront être mis en exergue sont les noyaux cellulaires. Pour faire face à la segmentation
des noyaux, une étape de présegmentation de l’image par sélection de couleurs est
effectuée, elle consiste à extraire des plages de pixels ayant une certaine couleur. Ensuite,
un procédé de segmentation hybride est proposé. Il repose sur deux techniques de
segmentation à savoir : le seuillage global à seuil fixe et l’ouverture morphologique
basée sur les opérations de dilatation morphologique et d’érosion morphologique. Notre
technique de segmentation est donnée par la formule 4.2.
(1) Seuillage global à seuil f ixe
Segmentation = (4.2)
(2) Ouverture morphologique
Où k représente chaque composante de couleur extraite de l’image I, Igk (i,j) est la
valeur de luminance du pixel de coordonnées (i,j) de la composante k l’image originale I
en niveau de gris et S le seuil. Le seuil Sk est une valeur entière comprise entre 0 et 255,
ISr la composante seuillée de IR , ISv la composante seuillée de IB et ISb la composante
seuillée de IB .
Après l’opération de seuillage, un autre traitement est nécessaire pour supprimer le bruit
sur l’image précedemment segmentée, cette tâche est réalisée en utilisant une opération
morphologique appelée ouverture. Cependant, les noyaux segmentées de l’image sont de
couleur noir dans un fond blanc or il est plus intuitif de travailler avec des objets blancs
sur un fond noir ; cette tâche est réalisée par le complement de l’image. Ensuite les trous
se trouvant dans les régions segmentées sont remplis.
4.4.2.1 Définitions
Les transformations morphologiques reposent sur le concept de transformation géomé-
trique d’une image par un élément structurant. L’élément structurant (ES) est un
masque de forme quelconque dont ses éléments forment un motif.
Bx = {b + x | b ∈ B}
*
δB (X) = X ⊕ B = {x + b | b ∈ B, x ∈ R2 } =
S
x∈R2 Bx
B (X) = X B = {x ∈ R2 , Bx ⊂ X}
X ◦ B = δB (B (X))
X • B = B (δB (X))
avec (x1 , y1 ) et (x2 , y2 ) qui sont les points délimitant le segment de l’axe principale.
avec (x1 , y1 ) et (x2 , y2 ) qui sont les points délimitant le segment de l’axe secondaire.
• L’excentricité : est la grandeur scalaire qui indique le rapport entre la distance focale
de l’ellipse qui a les mêmes moments secondaire que le noyau et la longueur de l’axe
principale.
• La circularité ou compacité : est une formule mathématique, elle tend vers 1 pour
les formes parfaitement rondes et est d’autant plus basse que la forme est plus
irrégulière, autrement éloignée de celle d’un cercle. A partir du calcul du périmètre
(P) et de l’aire (S), la circularité ou la compacité (C) est calculée :
4πS
C=
P2
surf aceconvexe
• L’intensité maximale : est la valeur du pixel ayant la plus grande intensité du noyau.
• L’intensité minimale : est la valeur du pixel ayant la plus petite intensité du noyau.
avec la valeur i de niveau de gris arrive décalé par une distance donnée à un pixel avec la
valeur j. ici, nous calculons la moyenne de quatre caracteristiques de la GLCM déterminés
pour des décalages correspondant à 0˚, 45˚, 90˚et 135˚utilisant huit niveaux de gris. Dans
la suite, p est la matrice normalisée de Co-occurrence :
• L’énergie ou uniformité : est la somme des carrés des éléments dans la matrice de
co-occurrence de niveau de gris (GLCM).
N
p(i, j)2
X
Energie =
i,j=1
N
X p(i, j)
Homogénéité =
i,j=1 1 + |i − j|
4.6 Classification
La classification est considérée comme étant la dernière étape dans un système de diagnos-
tic assisté par ordinateur (DAOx). Elle exploite le résultat de l’extraction des descripteurs
(qui lui même exploite le résultat de la segmentation) pour pouvoir décider de la nature
pathologique des images. La notion de classification signifie l’affectation d’une étiquette à
des échantillons d’une base de données en utilisant un certain nombre de caractéristiques.
Ces caractéristiques doivent bien évidemment être capable d’identifier chaque échantillon.
En traitement d’images, l’échantillon peut désigner un pixel, une zone dans l’image, un
objet représenté dans l’image ou l’image elle-même. Selon l’application, le but de la clas-
sification est soit de :
• Classifier les pixels de l’image en différentes zones. Dans ce cas, le problème de
classification revient à un problème de segmentation d’images en différents objets.
4.7 Conclusion
Ce chapitre nous a permis d’exposer les différentes parties de notre modèle du diagnostic
assisté par ordinateur. Le prétraitement d’images a été la première phase où nous avons
redimensionner et filtrer les images à l’aide d’un filtre gaussien, ensuite nous avons pré-
senté la méthode de segmentation utilisée pour extraire les noyaux de l’image. Dans cette
méthode nous avons exposé les techniques de binarisation ou seuillage et celles basées sur
les opérateurs de morphologie mathématique que sont l’érosion et la dilatation. Par la
suite, nous avons procedé à l’extraction des différents descripteurs des noyaux dans les
images segmentées qui nous permettront de les classer. Enfin, nous avons ouvert une fe-
nêtre sur la classification supervisée en mentionnant les trois méthodes qui seront utilisées
pour catégoriser les images de biopsies mammaires : les k plus proches voisins (KNN), les
arbres de décision et la classification par les séparateurs à vaste marge (SVM).
*
Mise en œuvre
5.1 Introduction
Dans ce dernier chapitre nous présentons les résultats obtenus des applications de la
méthode de segmentation des images de biopsies mammaires. La classification de ces
images en tant que tumeurs bénignes ou malignes grâce aux algorithmes de classification
supervisée (kNN, SVM et les arbres de décision) sera également présentée. Ce chapitre
se termine par l’évaluation des résultats de la méthode proposée. L’environnement de
programmation qui nous a permis de mettre en œuvre nos algorithmes et de créer les
interfaces graphiques est la version R2017a de Matlab « Matrix Laboratory » fonctionnant
sur Windows 10 64 bits.
*
Il est à noter que la valeur du seuil dans le canal de couleur rouge (e) a été fixé à 0.53
et à 0.25 dans les canaux de couleur vert et bleu.
22
5.2. RÉSULTATS DE LA SEGMENTATION CHAPITRE 5. MISE EN ŒUVRE
(a) (b)
1. Sensibilité (Se) : Représente la probabilité que le test soit positif si la tumeur est
maligne.
VP
Sensibilite =
(V P + F N )
2. Spécificité (Sp) : Représente la probabilité que le test soit négatif si la tumeur est
bénigne.
VN
Specif icite =
(V N + F P )
- C’est une courbe croissante entre le point (0,0) et le point (1,1) et en principe au-
dessus de la première bissectrice.
- Une prédiction idéale est l’horizontale y=1 sur ]0,1] et le point (0,0).
*
- L’aire sous la courbe ROC (AUC, Area Under the Curve) donne un indicateur de
la qualité de la prédiction (1 pour une prédiction idéale, 0.5 pour une prédiction
random).
Les résultats obtenus de la classification des images de la base de test par les kNN,
SVM et les arbres de décision sont représentés dans le tableau 5.6.
toujours positifs, ceci garantit que ces deux modèles prédisent correctement les tumeurs
malignes, expliquant ainsi les taux de sensibilité de 100% pour ces deux algorithmes. Par
contre, en utilisant le meilleur de ces algorithmes (SVM), pour les 150 patients testés,
on peut garantir qu’il sera susceptible d’enregistrer des erreurs se chiffrant autour de 6
patients testés positifs alors que ceux-ci sont réelement négatifs (faux positif) ; ce qui
justifie le taux de spécificité de 93.23% de cet algorithme.
5.4 Conclusion
Parvenu au terme de ce chapitre, où nous avons détaillé l’implémentation de notre ap-
proche de segmentation issue du seuillage et de l’ouverture morphologique en vue de
la détection des noyaux de cellules dans les images d’histopathologie mammaires. Par
ailleurs, nous avons extrait des descripteurs morphologiques, d’intensité et de texture à
partir des images segmentées. Ces descripteurs nous ont permis d’utiliser trois algorithmes
d’apprentissage supervisé kNN, SVM et les arbres de décision pour la classification de nos
images afin de différencier les tumeurs malignes des tumeurs bénignes. Les résultats ob-
tenus après l’entraı̂nement ainsi que ceux des tests se situent au-dessus de ceux étudiés
dans la littérature par Veta et al. [1] et Jain et al. [2] qui étaient respectivement de 81.2%
et 83.47%.
*
Le cancer du sein touche des milliers de femmes chaque année dans le monde. Au Ca-
meroun, l’incidence de ce cancer reste croissante et représente 21.3% des 14.000 malades
du cancer selon le comité national de lutte contre le cancer pour l’année 2016. Selon Run
For a Cure Africa Cameroon, le cancer du sein représente un taux de mortalité de 80%
des cas dépistés. L’efficacité du traitement dépend de la détection précoce de la maladie.
Malgré les évolutions des nouvelles technologies pour améliorer la qualité des images de
cytologies, l’interprétation et l’analyse de ces images restent une tâche difficile même pour
un pathologiste étant donné que ces images sont fortement texturées et diffèrent d’un pa-
tient à un autre. D’où le besoin de développer des systèmes d’analyse et d’interprétation
automatique d’images d’histologies numériques qui serviront d’outil d’aide à la décision.
Ce qui aura pour conséquence d’augmenter la fiabilité de l’interprétation de ces images
par un expert.
Dans ce mémoire où l’objectif était de construire un système d’aide au diagnostic du can-
*
cer du sein basé sur la segmentation des images, nous avons commencé par présenté la
description de quelques notions médicales sur le cancer du sein. Puis nous avons passé en
revue quelques méthodes de segmentation et classification connus avec leurs insuffisances
par rapport au problème à résoudre.
Par la suite, nous avons développé un algorithme afin de détecter les noyaux présents dans
les images. Dans un premier temps, les images de biopsies originales ont été prétraitées,
afin de réduire le bruit causé par le dispositif électronique d’acquisition des images, en-
suite nous sommes passé à l’étape de segmentation dont le but était d’extraire les noyaux.
Cette opération était fondée sur deux approches essentielles que sont le seuillage des trois
canaux de couleur (rouge, vert et bleu) et la morphologie mathématique. A la suite de la
segmentation, nous avons procédé à l’extraction des trois types de descripteurs des noyaux
segmentés à savoir : les descripteurs morphologiques, d’intensités et de textures qui ont
été utilisés par la suite pour la classification des images d’histopathologie mammaires.
Enfin, la dernière partie de ce mémoire, nous a permis de mettre en œuvre notre al-
gorithme, où nous avons procedé à la classification de nos images en deux catégories :
bénigne et maligne. Pour y parvenir, nous avons utilisé trois classifieurs les machines à
support de vecteurs (SVM), les k-proches voisins (kNN), et les arbres de décision avec des
taux de classification respectifs de 97.5%, 94.4% et 92.2%. Cette étude nous a donnée des
résultats satisfaisants au vu des résultats présentés dans la littérature.
Ce mémoire a permis de dégager de nombreuses perspectives que nous résumons dans ces
quelques lignes :
• L’amélioration de la segmentation en utilisant d’autres approches. Dans ce contexte,
nous proposons d’implémenter des algorithmes se basant sur la segmentation
d’images basée sur les statistiques des rangs des niveaux de gris, la segmentation
28
5.4. CONCLUSION CHAPITRE 5. MISE EN ŒUVRE
d’images basée sur un modèle fonctionnel et la fusion à l’aide de régions floues des
régions précédemment segmentées.
• Les descripteurs que nous avons utilisés restent très simple, donc il serait possible
de les enrichir par d’autres attributs de plus haut niveau à l’instar de l’entropie, la
dissimilarité, la densité, etc.
• Des travaux futurs seront également focalisés pour améliorer le système en dévelop-
pant des méthodes de segmentations hybrides tel que le système hybride de segmen-
tation non supervisée d’images par des Chaı̂nes de Markov cachées. D’ailleurs, nous
projetons agrandir l’ensemble d’images d’essai et de réduire également le taux de
faux positif.
*
[1] Veta, D. Van, Kornegoor, Huisman, Viergever, and Pluim, “Automatic nuclei seg-
mentation in h & e stained breast cancer histopathology images.” PloS ONE, vol. 8,
no. 7, p. e70221, 2013.
[2] Jain, Atey, S. Vinayak, and Srivastava, “Cancerous cell detection using histopatholo-
gical image analysis.” International Journal of Innovative Research in Computer and
Communication Engineering, vol. 2, no. 12, pp. 7419–26, 2014.
[3] P. Filipczuk, K. Marek, and O. Andrzej, “Fuzzy clustering and adaptive threshol-
ding based segmentation method for breast cancer diagnosis,” Computer Recognition
Systems 4, pp. 613–622, 2011b.
[4] M. Kowal and P. Filipczuk, “Nuclei segmentation for computer aided diagnosis of
breast cancer.” International Journal for Application Mathematics and Computer,
*
[7] A. K. Mohanty, S. M. Ranjan, and L. S. Kumar, “An improved data mining tech-
nique for classification and detection of breast cancer from mammograms,” Neural
Computing and Applications, vol. 22, pp. S303–S310, 2013.
[8] L. Jelen, F. Thomas, and K. Adam, “Classification of breast cancer malignancy using
cytological images of fine needle aspiration biopsies,” International Journal of Applied
Mathematics and Computer Science, vol. 18, no. 1, pp. 75–83, 2010.
30
[11] X. Xiangchun, K. Yangon, B. Yuncheol, R. D. Wong, and K. Soo-Hong, “Analysis
of breast cancer using data mining & statistical techniques,” in 6th International
Conference on Software Engineering, Artificial Intelligence, Networking and Paral-
lel/Distributed Computing 1st ACIS International Workshop on Self-Assembling Wi-
reless Networks, Towson, 2005, pp. 82–87.
[12] Aswathy and J. Mohan, “Detection of breast cancer on digital histopathology images :
Present status and future possibilities.” Informatics in Medicine, pp. 74–79, 2017.
[13] T. Chan and L. Vese, “Active contours without edges.” IEEE Trans Image Proc,
vol. 10, no. 2, pp. 266–77, 2001.
*
31