Vous êtes sur la page 1sur 186

N° d’ordre : 66/ 217- C/ ELN

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE


Ministère de l’Enseignement Supérieur et de la Recherche Scientifique
Université des Sciences et de la Technologie Houari Boumediène

Faculté d’Electronique et d’Informatique

THÈSE

Présentée pour l’obtention du diplôme de DOCTORAT 3 ème Cycle

En : ELECTRONIQUE

Spécialité : Contrôle de Processus et Rendu Interactif (CPRI)

Par : Chekir Amira

Sujet

Clustering à base de multi-agents bio-inspirés


appliqués à l’imagerie médicale cérébrale.
Soutenue publiquement, le 03 / 07 / 2017, devant le jury composé de :

Mme Drias Habiba Professeur à l’USTHB Présidente


Mme Oulebsir-Boumghar Fatima Professeur à l’USTHB Directrice de thèse
Mme Hassas Salima Professeur à l’université de Lyon1 Co- Directrice de thèse
M Kechid Samir Professeur à l’USTHB Examinateur
M Mansour Moufid MCA à l’USTHB Examinateur
M Ait-Aoudia Samy Professeur à l’ESI Examinateur
M Bouyoucef Kheireddine Professeur à CHU Blida Invité
Remerciements
D'abord, je tiens à remercier celles sans qui je ne serais pas la chercheuse
que je suis devenue aujourd'hui : mes directrices de thèse, Pr. Oulebsir Boum-
ghar Fatima et Pr. Hassas Salima, pour m'avoir oert cette opportunité de
travailler avec vous. Ce fût un privilège de bénécier de votre supervision
scientique et de votre support. Merci Pr. Boumghar pour votre indéfectible
aide, votre support, vos conseils, votre patience et votre conance sans cesse
renouvelée. Merci Pr. S. Hassas pour votre accueil dans votre laboratoire de
recherche LIRIS à l'Université Lyon 1, ces belles discussions sur les systèmes
multi-agents. Je sortais toujours de votre bureau avec la tête débordante de
nouvelles idées. Elles ont été des sources de motivation et de créativité.
Durant ma thèse, j'ai eu la grande chance de faire des stages dans des labo-
ratoires étrangers. Ma première magnique expérience fut dans le laboratoire
de recherche "SCIL" à l'université de Sherbrooke, que je dois principalement
à un grand monsieur : Pr. Maxime Descoteaux, qui m'a accueilli à bras ou-
verts dans son laboratoire et m'a aidé à progresser sur le plan scientique,
grâce à ses remarques pertinentes et ses précieux conseils. Merci Max pour le
support pour le service de révision en ligne de notre papier. J'ai pu également
travailler avec son équipe : Marc-Alexandre Côté , Gabriel Girard, Samuel St-
Jean et Eleftherios Garyfallidis, que je remercie pour leurs immense aide et
collaboration.
Une autre expérience a eu lieu au laboratoire Neuroinformatics "NILab" à
l'université de Trento, me permettant aussi de faire la connaissance de nom-
breuses personnes toutes plus charmantes, plus attentionnées, plus amicales
et plus humaines les unes que les autres. Merci à Ali Muhaddisa Barat et à
Sharmin Nusrat.
Merci à l'ensemble des membres de l'équipe ParIméd. Ces années de re-
cherche se sont passées dans un environnement chaleureux, convivial et intel-
lectuellement très stimulant.
Enn, je tiens surtout à remercier ma petite famille. La plus belle famille
que l'on puisse rêver. Merci à mon père Rabah, à ma mère Fatma Zohra,
d'avoir toujours encouragé ma curiosité et de m'avoir supportée. Merci mon
petit frère Ayoub pour ton aide, ton soutien et, particulièrement, pour ton
intérêt dans mes recherches. Je vous aime tous.
Je tiens aussi à remercier mon époux Saber, sans qui je n'aurais, certai-
nement pas, mener ce travail à terme.

i
À mes très chers parents
Résumé : L'objectif du travail réalisé dans le cadre de cette thèse, est la pro-
position d'outils informatiques permettant d'aider les cliniciens dans le diagnostic
de pathologies cérébrales, à travers l'étude de la connectivité anatomique du cer-
veau. Cette étude se base sur l'IRM de diusion cérébrale, qui est une technique
non invasive permettant d'explorer l'architecture de la substance blanche compo-
sant le tissu cérébral, à partir de la mesure de la diusion des molécules d'eau. La
substance blanche est composée de faisceaux de bres qui connectent les diérentes
régions de la matière grise, permettant ainsi la transmission d'informations entre les
cellules nerveuses. Il est possible de visualiser les zones interconnectées du cerveau
et détecter d'éventuelles anomalies, grâce à l'usage de la tractographie qui permet
de reconstruire les trajectoires des faisceaux de bres, composant le tissu cérébral.
Vue la nature complexe des données issues de la tractographie, leur variabilité,
leur grand volume ainsi que la présence des outliers, nous proposons dans cette thèse
plusieurs approchess pour répondre à la question de leur analyse et leur clustering
en faisceaux anatomiquement signicatifs, qui est actuellement un problème non
encore résolu.
Dans un premier temps, nous avons eectué une étude comparative entre les
diérentes méthodes de tractographie an de sélectionner la meilleure solution pour
générer nos bases de données. Une fois la base de données de tractographie établie,
nous avons proposé une nouvelle approche hybride combinant, le clustering basé sur
la similarité et la segmentation basée sur l'a priori anatomique consigné dans un
atlas. Ceci, dans le but d'augmenter l'ecacité et la précision des résultats.
Dans un deuxième temps, nous avons étendu la problématique au clustering
inter-sujets, an de considérer la variation de la substance blanche d'un sujet à un
autre. Dans ce cadre, une première approche simple a été développée, considérant
des données statiques et opérant séquentiellement le clustering, en s'appuyant sur
un calcul de densité. Cette première méthode a montré son ecacité à extraire les
faisceaux de bres au niveau de la population et sa robustesse face aux outliers.
Néanmoins, elle reste limitée dans la considération dynamique de la variation des
données d'une population de faisceaux émanant de diérents sujets, tout comme
les autres approches existantes dans la littérature. Le clustering est statique et ne
permet pas le transfert d'une donnée aectée à un cluster vers un autre cluster plus
approprié qui apparaîtrait suite à l'enrichissement des données.
Pour répondre à cette limite, nous avons proposé une nouvelle méthode ori-
ginale appelée : "3D-Streamlines Stream Flocking (3D-SSF)", alliant dynamicité,
distribution et coopération dans le processus de clustering des données. Ces proprié-
tés inhérentes au paradigme multi-agents, ont été mises en ÷uvre par l'adaptation
d'un modèle multi-agents inspiré du Flocking (Multiple Species Flocking (MSF))
au problème du clustering dynamique et distribué, des streamlines des diérents
sujets considérés. Dans ce modèle, le ux de données représentant les streamlines
d'une population de sujets, sont réiés par une population d'agents mobiles dans
un espace 3D, où chaque agent représente une streamline et répond aux règles de
ocking pour opérer le clustering. L'objectif étant d'aboutir à des essaims d'agents
ou cluster matérialisant les streamlines similaires et se séparant des outliers. Les
agents évoluent dans l'espace 3D, en cherchant continuellement à former des es-
saims d'appartenance, qui correspondent à la similarité la plus élevée. Ce processus
est répété jusqu'à stabilisation de la population dans les clusters les plus appropriés.
Ce processus adaptatif permet de répondre à la fois à la taille des données, leur
variabilité et leur complexité. La robustesse et l'ecacité de la méthode 3D-SSF ont
été démontrées par les résultats obtenus et en comparaison à des algorithmes de la
littérature pris comme Baseline, en utilisant à la fois des données simulées et des
données réelles.
Mots clés : Approches bio-inspirées, système multi-agents, clustering des bres
neuronales, IRM de diusion, substance blanche cérébrale.

iv
Abstract : The objective of the work achieved in this thesis is the proposal of
computing tools to help clinicians better understand brain development and aging,
as well as improving early detection of some diseases through the study of the brain
anatomical connectivity. This study is based on diusion MRI, which is a non-
invasive technique, to explore the architecture of the white matter that composes
the brain tissue, from the measurement of the water molecules diusion. It allows
the non invasive reconstruction of brain ber bundle trajectories that connect the
dierent regions of the gray matter using a tractography process.
Given the complex nature of the tractography dataset, data variability, its large
volume and the presence of outliers, we propose in this thesis several techniques to
analyze and quantify the structures dened by tractography, and in particular, to
extract the ber bundles, which is still an unsolved problem.
As a rst step, we achieved a comparative study between dierent methods of
tractography in order to select the best one for the generation of our tractography
datasets.
Once the tractography dataset established, we proposed a new hybrid approach
combining from one side, a clustering based on similarity and from another side, a
segmentation based on anatomical a priori, that is recorded in an atlas. This is to
increase the eciency and the accuracy of the results.
Our second step was to extend the problem to inter-subject clustering, in order
to consider the variation of the white matter from one subject to another.
In this context, a simple rst approach has been developed, considering static
data and operating the clustering sequentially, based on the density estimation. This
rst method has shown its eciency in extracting ber bundles at the population
level and its robustness face to outliers. Nevertheless, it remains limited, as the other
existing approaches in the literature, in dynamically considering the variations issued
from several subjects.
To address this limit, we introduced a novel dynamic multi-subject clustering fra-
mework based on a distributed multiagent implementation of the Multiple Species
Flocking model, that we name 3D-Streamlines Stream Flocking (3D-SSF). Speci-
cally, we consider streamlines from dierent subjects as data streams, and each
streamline is assigned to a mobile agent. Agents work together following ocking
rules in order to form a ock. Thanks to a similarity function, the agents that are
associated with similar streamlines form a ock, whereas the agents that are associa-
ted with dissimilar streamlines are considered outliers. We use various experiments
performed on noisy synthetic and real human brain data to validate 3D-SSF and
demonstrate that it is more ecient and robust to outliers compared to other classi-
cal approaches. 3D-SSF is able to extract WM bundles at a population level, while
considering WM variation across subjects and eliminating outlier streamlines.
keyword : Bio-inspired approaches, multi-agent systems, multi-subject clustering,
diusion MRI, white matter tractography.
vi
Table des matières
Introduction générale 1
1 Anatomie cérébrale, les faisceaux de la substance blanche et prin-
cipes de l'IRM de diusion 7
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2 Anatomie cérébrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.1 Anatomie Générale du cerveau humain . . . . . . . . . . . . . 8
1.2.2 Organisation de la substance blanche cérébrale . . . . . . . . 11
1.3 Le phénomène de la diusion dans le cerveau humain . . . . . . . . . 15
1.4 Concept de l'IRM de diusion . . . . . . . . . . . . . . . . . . . . . . 17
1.5 Modélisation de la diusion en IRMd . . . . . . . . . . . . . . . . . . 19
1.5.1 Imagerie de Tenseur de Diusion . . . . . . . . . . . . . . . . 20
1.5.2 Imagerie de Diusion à Haute Résolution Angulaire . . . . . 24
1.6 Tractographie des bres de la substance blanche . . . . . . . . . . . . 29
1.6.1 La tractographie déterministe . . . . . . . . . . . . . . . . . . 33
1.6.2 La tractographie probabiliste . . . . . . . . . . . . . . . . . . 35
1.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

2 Approches de clustering et systèmes multi-agents 37


2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.2 Approches de clustering . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.2.1 Dénition du clustering . . . . . . . . . . . . . . . . . . . . . 38
2.2.2 Les catégories de clustering . . . . . . . . . . . . . . . . . . . 39
2.3 Clustering distribué à base de multi-agents . . . . . . . . . . . . . . . 45
2.3.1 Les agents informatiques . . . . . . . . . . . . . . . . . . . . . 45
2.3.2 Algorithmes d'intelligence en essaim . . . . . . . . . . . . . . 48
2.3.3 La méthode des colonies de fourmis . . . . . . . . . . . . . . . 49
2.4 Evaluation du résultat de clustering . . . . . . . . . . . . . . . . . . 50
2.4.1 Indice de Rand . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.4.2 Indice Silhouette . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.4.3 Indice d'homogénéité . . . . . . . . . . . . . . . . . . . . . . . 52
2.4.4 Indice d'exhaustivité . . . . . . . . . . . . . . . . . . . . . . . 52
2.4.5 Indice de kappa . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

3 Clustering des bres neuronales et détection des outliers 55


3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2 Le recalage inter-sujets . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2.1 Le recalage linéaire et non linéaire . . . . . . . . . . . . . . . 56
3.2.2 La normalisation spatiale . . . . . . . . . . . . . . . . . . . . 58
Table des matières

3.3 La segmentation basée ROIs . . . . . . . . . . . . . . . . . . . . . . . 58


3.4 Le clustering basé similarité . . . . . . . . . . . . . . . . . . . . . . . 61
3.4.1 Les mesures de similarité . . . . . . . . . . . . . . . . . . . . 62
3.4.2 Le clustering intra-sujet . . . . . . . . . . . . . . . . . . . . . 68
3.4.3 Le clustering inter-sujets . . . . . . . . . . . . . . . . . . . . . 71
3.5 Le clustering hybride . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.6 Les approches de détection des outliers . . . . . . . . . . . . . . . . . 78
3.6.1 La détection des outliers basée sur la distribution . . . . . . . 79
3.6.2 La détection des outliers basée sur la distance . . . . . . . . . 79
3.6.3 La détection des outliers basée sur la densité . . . . . . . . . 80
3.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

4 Clustering intra-sujet des bres neuronales 83


4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.2 Travaux antérieurs et motivations . . . . . . . . . . . . . . . . . . . . 84
4.3 Evaluation des méthodes de tractographie . . . . . . . . . . . . . . . 87
4.3.1 Méthodologies de tractographie . . . . . . . . . . . . . . . . . 87
4.3.2 Expérimentations, résultats et discussion . . . . . . . . . . . . 90
4.4 Clustering intra-sujet des bres neuronales . . . . . . . . . . . . . . . 95
4.4.1 Une méthode de segmentation hybride . . . . . . . . . . . . . 95
4.4.2 Expérimentations, résultats et discussions . . . . . . . . . . . 98
4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

5 Clustering inter-sujets statique des bres neuronales 103


5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
5.2 Travaux antérieurs et motivations . . . . . . . . . . . . . . . . . . . . 104
5.3 Une méthode séquentielle basée sur la densité . . . . . . . . . . . . . 105
5.3.1 Le clustering basé sur la densité . . . . . . . . . . . . . . . . . 106
5.3.2 L'estimation et l'injection des représentants . . . . . . . . . . 109
5.4 Expérimentations, résulats et discussion . . . . . . . . . . . . . . . . 110
5.4.1 Expérimentation et résultats sur les données synthétiques . . 110
5.4.2 Expérimentation et résultats sur les données réelles . . . . . . 112
5.5 Avantages et limites de la méthode séquentielle basée sur la densité . 115
5.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

6 Clustering inter-sujets dynamique des bres neuronales 117


6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
6.2 Travaux antérieurs et motivations . . . . . . . . . . . . . . . . . . . . 118
6.3 Un mécanisme adaptatif de détection des outliers . . . . . . . . . . . 120
6.4 Mesure de similarité . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
6.5 Les modèles de "ocking" . . . . . . . . . . . . . . . . . . . . . . . . 123
6.5.1 Règles de Reynolds . . . . . . . . . . . . . . . . . . . . . . . . 123
6.5.2 Le ocking d'espèces multiples (MSF) . . . . . . . . . . . . . 127
6.6 Potentiel du clustering basé sur les multi-agents . . . . . . . . . . . . 127

viii
Table des matières

6.7 L'algorithme 3D-SSF . . . . . . . . . . . . . . . . . . . . . . . . . . . 128


6.8 Expérimentations, résultats et discussion . . . . . . . . . . . . . . . . 130
6.8.1 Expérimentations et résultats sur les données synthétiques . . 133
6.8.2 Expérimentations et résultats sur les données réelles . . . . . 136
6.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

Conclusion générale et perspectives 145


Bibliographie 147
A Atlas de la substance blanche 163

ix
Table des gures
1.1 Diérentes parties du cerveau . . . . . . . . . . . . . . . . . . . . . . 9
1.2 Les quatre lobes externes composant l'hémisphère gauche cérébral.
(source : Gray's Anatomy). . . . . . . . . . . . . . . . . . . . . . . . 9
1.3 Cerveau humain adulte d'une IRM anatomique T1. . . . . . . . . . . 10
1.4 Quelques neurones dans le cerveau . . . . . . . . . . . . . . . . . . . 11
1.5 Représentation de diérents types de bres . . . . . . . . . . . . . . 12
1.6 Fibres commissurales . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.7 Les principaux faisceaux de la SB . . . . . . . . . . . . . . . . . . . . 15
1.8 Le phénomène de la diusion. . . . . . . . . . . . . . . . . . . . . . . 16
1.9 Diusions isotrope et anisotrope . . . . . . . . . . . . . . . . . . . . . 17
1.10 Magnétisme nucléaire . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.11 Les trois étapes de l'acquisition du signal IRM pour un voxel . . . . 19
1.12 Une séquence simpliée d'acquisition IRM . . . . . . . . . . . . . . . 20
1.13 Imagerie du Tenseur de Diusion (DTI) . . . . . . . . . . . . . . . . 22
1.14 Coupes axiales d'un cerveau humain, montrant les cartes scalaires
provenant du DTI . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.15 Diérentes modélisations de la diusion . . . . . . . . . . . . . . . . 26
1.16 Le prol de l'ADC en présence de deux bres qui se croisent. . . . . 27
1.17 Un schéma de reconstruction DSI . . . . . . . . . . . . . . . . . . . . 28
1.18 Exemple d'une portion de la base de données de tractographie. . . . 30
1.19 Schéma des algorithmes de tractographie déterministe et probabiliste
avec la fODF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.20 Comparaison de tractographie déterministe et probabiliste sur le fais-
ceau Cortico-Spinal (CST). . . . . . . . . . . . . . . . . . . . . . . . 31
1.21 Les diérentes approches de tractographie déterministe . . . . . . . . 34
1.22 Principe de l'algorithme EuDX . . . . . . . . . . . . . . . . . . . . . 35

2.1 Principe du clustering hiérarchique. . . . . . . . . . . . . . . . . . . . 41


2.2 Exemple de clustering basé sur la densité. . . . . . . . . . . . . . . . 43
2.3 Clustering basé sur les grilles. . . . . . . . . . . . . . . . . . . . . . . 44
2.4 Clustering basé sur les graphes. . . . . . . . . . . . . . . . . . . . . . 44
2.5 Algorithme OEP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.1 Un diagramme schématique de trois types d'opérations ROIs . . . . 59


3.2 Une parcellisation SWM issue d'un étiquetage manuel basé sur les ROIs 60
3.3 Distance en nombre de voxels partagés. . . . . . . . . . . . . . . . . . 62
3.4 La distance minimum average direct-ip (MDF) . . . . . . . . . . . . 64
3.5 Illustration des diérentes mesures de distance . . . . . . . . . . . . . 66
3.6 Illustration du clustering hiérarchique des streamlines . . . . . . . . . 69
3.7 Une méthode de clustering basée sur les voxels . . . . . . . . . . . . 73
Table des gures

3.8 Le pipeline de la méthode de clustering inter-sujets par les graphes . 74


3.9 Les résultats du clustering basé sur les voxels à travers les sujets . . 75
3.10 Illustration de la segmentation de la SB basée sur un cadre mathé-
matique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.11 Schéma du pipeline d'analyse statistique des populations de MDPs . 78

4.1 Exemple du comportement de la méthode TEND avec diérentes


formes d'ellipsoïdes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.2 Visualisation des données synthétiques simulées . . . . . . . . . . . . 91
4.3 Un seul faisceau de streamlines incurvé. . . . . . . . . . . . . . . . . 92
4.4 Deux faisceaux de streamlines qui se croisent à 90 degrés. . . . . . . 93
4.5 Deux faisceaux de streamlines qui se croisent avec diérentes angles. 94
4.6 Le clustering QB appliqué à la totalité du cerveau . . . . . . . . . . 95
4.7 Les résultats du clustering des streamlines . . . . . . . . . . . . . . . 99
4.8 Multiples subdivisions du corps calleux . . . . . . . . . . . . . . . . . 100
4.9 Evaluation Quantitative des résultats . . . . . . . . . . . . . . . . . . 101

5.1 Notions de points densité-accessibles


et de densité-connectés . . . . . 107
5.2 Heuristique de xation des paramètres . . . . . . . . . . . . . . . . . 108
5.3 Résultats de l'évaluation quantitative . . . . . . . . . . . . . . . . . . 112
5.4 Evaluations quantitatives des faisceaux . . . . . . . . . . . . . . . . . 113
5.5 Illustration de quelques faisceaux obtenus avec notre méthode. . . . . . . . . . 115

6.1 Illustration des distances basées sur les points les plus proches . . . . 123
6.2 Comparaison des trois distances entre paires de streamlines . . . . . 124
6.3 La règle d'alignement . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
6.4 La règle de séparation . . . . . . . . . . . . . . . . . . . . . . . . . . 126
6.5 La règle de cohésion . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
6.6 Example de l'algorithme 3D-SSF . . . . . . . . . . . . . . . . . . . . 130
6.7 Les résultats de diérentes méthodes de clustering (3D-SSF, HQB et
V-Bundles) sur des données synthétiques. . . . . . . . . . . . . . . . 135
6.8 Evaluation quantitative des faisceaux obtenus avec la méthode 3D-SSF139
6.9 L'analyse de diusivité quantitative entre les faisceaux de l'atlas et
les faisceaux obtenus avec les méthodes 3D-SSF et MSQB . . . . . . 140
6.10 Illustration de quelques faisceaux obtenus avec la méthode 3D-SSF . 141
6.11 L'ecacité computationnelle de la méthode 3D-SSF . . . . . . . . . . 143

A.1 Concept du WMQL . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

xii
Liste des tableaux
5.1 Comparaison quantitative des trois méthodes (Notre-méthode, HQB,
V-bundles) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
5.2 Valeurs de l'indice Silhouette obtenus avec notre méthode et la mé-
thode MSQB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

6.1 Comparaison quantitative des trois méthodes de clustering (3D-SSF,


HQB, V-Bundles) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
6.2 les valeurs SMD obtenues avec les méthodes 3D-SSF et MSQB. . . . 140
6.3 L'indice de Rand ajusté entre quelques faisceaux obtenus avec l'algo-
rithme 3D-SSSF et les faisceaux de l'atlas . . . . . . . . . . . . . . . 144

A.1 Les subdivisions du corps calleux dans le WMQL . . . . . . . . . . . 165


A.2 La dénition des faisceaux de projections dans le WMQL . . . . . . 165
A.3 La dénition des faisceaux d'associations dans le WMQL . . . . . . . 166
Liste des Abréviations

3D-SSF 3D-Streamlines Stream Flocking


ADC Coecient Apparent de Diusion
ADMM Absolute Distance between the Medoid and Medoids
BOI Bundle Of Interest
CA Commissure Antérieure
CASTER Cluster Analysis Through Smartly Extracted Representatives
CC Corps Calleux
CG cingulum
CSD Constant Solid Deconvolution
CST Faisceau CorticoSpinal
DBSCAN Density-Based Spatial Clustering of Applications with Noise
dODF Fonction de Distribution des Orientations de diusion
DSI Imagerie Spectrale de Diusion
DTI Imagerie de Tenseur de Diusion
EM Expectation Maximization
FA Anisotropie Fractionnelle
FACT Fiber Assignment by Continuous Tracking
fODF Fonction de Distribution des Orientations des bres
HARDI Imagerie à Haute Résolution Angulaire
HCA Clustering Hiérarchique Agglomerative
HCP Human Connectome Project
HDPM Hierarchical Dirichlet Processes Mixture
HQB Hiérarchique QuickBundle
IFO Faisceau Fronto-Occipital Inférieur
ILF Faisceau Longitudinal Inférieur
IRMd Imagerie par Résonnance Magnétique de diusion
LCR Liquide Céphalo-Rachidien
LOFs Local Outlier Factors
MD Diusivité Moyenne
MDF Minimum Average Direct Flip
MNI Montreal Neurological Institut
MSF Multiple Species Flocking
NFG Numerecal Fiber Generator
OEP Optimisation par Essaim Particulaire
OR Radiation Optique
PDF Fonction de Distribution de Probabilité
PGSE Pulse Gradient Spin Echo
QB QuickBundles
Liste des Abréviations

QSI Imagerie Q-Space


ROIs Regions Of Interest
SB Substance Blanche
SH Harmoniques Sphériques
SG Substance Grise
SLF Faisceau Longitudinal Supérieur
SMR Spatial Matching Ratio
SNC Système Nerveux Central
SVA Spatial Volume Agreement
UNC Faisceau Unciné
WMQL White Matter white Query Language

xvi
Introduction générale

Contexte
Le cerveau est l'un des organes les plus importants et des plus complexes du corps
humain. Il est constitué de tissus cérébraux qui sont généralement divisés en trois
catégories distinctes : la substance blanche (SB), la substance grise (SG) ainsi que le
liquide céphalo-rachidien (LCR). La SB est responsable de la communication entre
les diérentes régions de la SG qui est elle, constituée des terminaisons nerveuses
des corps axonaux qui gèrent les fonctions cérébrales. La SB peut être vue comme
un réseau de transmission de l'information à travers les régions fonctionnelles du
cerveau. Ces diérents réseaux de connectivité de la SB constituent en fait des
faisceaux d'axones. Le LCR quand à lui, est un liquide biologique transparent dans
lequel baigne le système nerveux central. Il absorbe les mouvements et les chocs an
de réduire les risques d'endommagement du cerveau.
Le signal bio-électrique (ou inux nerveux) transmis à travers le cerveau via les
axones de la SB est rendu possible grâce à la centaine de milliards de neurones
présents dans le cerveau humain. Les axones de la SB sont regroupés en faisceaux
(bundles) assurant diérentes fonctions cérébrales.
Depuis plus d'un siècle, la compréhension de l'organisation et de la fonction du
cerveau a présenté un intérêt fondamental pour la neurologie et les neurosciences,
notamment la structure et l'organisation de la SB qui n'est pas encore connue dans
sa totalité. Connaitre la carte de la connectivité anatomique cérébrale est alors un
grand dé, du plus grand intérêt pour comprendre le fonctionnement du cerveau et
étudier de nombreuses pathologies neuro-dégénératives comme celles d'Alzheimer et
de Parkinson dont les origines ne sont toujours pas connues et expliquées, ou encore
pour localiser la détérioration des bres concomitamment à la présence de tumeurs
cérébrales.
L'imagerie par résonance magnétique (IRM) est un outil non-invasif pour l'étude
du cerveau permettant de visualiser sa structure interne. Elle repose sur les prin-
cipes physiques de la résonance magnétique nucléaire (RMN). Les molécules d'eau
présentes majoritairement dans le cerveau (environ 78% d'eau), initialement à l'état
d'équilibre, sont excitées par un apport d'énergie, créé par le champ magnétique de
l'aimant dans l'IRM, durant un temps donné, puis reviennent graduellement à leur
état initial. C'est ce principe de retour à l'équilibre, appelé relaxation qui permettra
d'imager les tissus du cerveau.
En plus des images de type anatomique, une nouvelle modalité induite de l'IRM
a vu le jour, nommée IRM de diusion (IRMd). En modiant les paramètres des sé-
quences d'acquisitions, plus précisément en laissant diuser les molécules d'eau pré-
sentes dans le cerveau pendant un court instant, il est possible de mesurer l'intensité
de leur déplacement le long de plusieurs directions. L'IRMd est basée sur l'étude
Introduction générale

du mouvement Brownien, énoncé par Albert Einstein en 1956 [Einstein 1956], qui
stipule que l'eau diuse de manière isotrope dans chaque direction et ce, dans un
milieu sans contrainte. En présence de tissus structurés, l'eau a tendance à suivre
les prolongements d'axones plutôt que de les traverser. Il est donc possible de dé-
duire que la mesure qui renferme la direction de déplacement des molécules d'eau
contient de l'information cachée sur les structures microscropiques latentes. Ce type
d'acquisition fournit donc un volume en quatre dimensions (4D), constitué d'un en-
semble d'images 3D pour chaque direction de diusion où la quatrième dimension
correspond aux directions de diusion.
Une phase de reconstruction permet ensuite d'estimer le prol de diusion angu-
laire à partir de l'ensemble des images de diusion acquises. Le modèle de diusion
le plus utilisé jusqu'à présent est l'Imagerie du Tenseur de Diusion (DTI) qui re-
présente les images de diusion par un champ de tenseurs d'ordre deux [Tuch 2002],
dont l'utilisation est très attrayante pour l'étude de la structure interne de la SB du
cerveau car le prol angulaire de la diusion fournit de précieuses informations sur
les faisceaux de bres reliant les diérentes aires corticales. L'extraction de ces in-
formations à partir de la reconstruction DTI d'images cérébrales peut alors prendre
plusieurs formes : indice d'anisotropie (fraction d'anisotropie), quantité de diusion,
etc. Cependant la DTI présente quelques limitations au niveau de la représentation
de la conguration des faisceaux de bres.
Avec l'émergence des IRMs plus puissantes, permettant des résolutions spa-
tiales plus élevées, de nouvelles techniques d'IRMd à haute résolution angulaire
(HARDI) [Descoteaux 2008] (High Angular Resolution Diusion-weighted Imaging)
ont vu le jour, utilisant des modèles mathématiques de dimensions supérieures. Ces
modèles permettent une meilleure détection des croisements entres réseaux de bres,
ce qui constitue la principale diculté rencontrée avec le modèle DTI classique.
Ces modèles locaux de diusion permettent d'extraire les directions les plus pro-
bables de diusion des molécules d'eau. À l'aide de ces informations de direction, il
est alors possible de reconstruire le réseau des faisceaux de bres de la SB avec un
procédé nommé tractographie. La tractographie est une classe d'algorithmes dont
l'objectif est d'estimer la structure de la SB en suivant les orientations cohérentes,
obtenues de l'IRM pondérée en diusion, parmi les voxels voisins. Les algorithmes de
tractographie ont pour dé d'utiliser au mieux l'information présente dans chaque
voxel et de produire un résultat respectant les hypothèses de structure et de connec-
tivité du réseau d'axones du cerveau [Hagmann 2003]. La tractographie produit des
courbes 3D, appelées tractes de la SB ou streamlines. Dans cette thèse, nous utili-
sons le terme "streamline" pour décrire un ensemble de points 3D représentant une
bre de la SB dans la base de données de tractographie.

Problématiques et motivations
Les données de tractographie sont aujourd'hui de meilleure qualité, mais malgré
ces progrès, elles ne sont pas dépourvues d'artefacts, ce qui engendre des outliers.

2
Ces données sont très complexes avec des positions spatiales, des formes géomé-
triques et des longueurs variables. De plus, elles sont très volumineuses, avec plus
d'un million de streamlines par cerveau. En eet, l'analyse et le regroupement des
streamlines issues de la tractographie en faisceaux anatomiquement signicatifs,
reste un problème non résolu, dû entre autres, aux raisons suivantes :
 La complexité de l'architecture de la SB et le manque de dénitions claires
concernant la structure et l'organisation des faisceaux de streamlines ;
 Le problème de grande taille de l'ensemble des données de tractographie
faisant intervenir diérents streamlines de diverses géométries complexes ;
 La variabilité de la SB cérébrale d'un sujet à un autre, en terme de propriétés
géométriques et de connectivités, ce qui complique le développement d'une
solution générale pour le clustering des streamlines à travers les sujets ;
 La présence des outliers, due aux erreurs de tractographie et des mouve-
ments du patient lors de l'examen radiologique, ce qui aecte le résultat du
clustering en introduisant des streamlines erronés.

Objectifs et contributions de thèse


L'objectif du travail réalisé dans le cadre de cette thèse, est la proposition de
méthodes et d'outils informatiques permettant d'aider les cliniciens dans le diag-
nostic de pathologies cérébrales, à travers l'étude de la connectivité anatomique du
cerveau.
La problématique de recherche abordée dans cette thèse est alors la proposition
de solutions informatiques au problème de l'analyse et du clustering des stream-
lines (faisceaux de bres) issues de la tractographie, en faisceaux anatomiquement
signicatifs, qui est actuellement un problème non encore résolu.
Au cours de notre travail de recherche, nous avons suivi une méthodologie incré-
mentale. Dans un premier temps, nous avons proposé une étude comparative entre
les diérentes méthodes de tractographie existantes, que nous avons implémentées,
an de sélectionner la meilleure méthode pour générer nos bases de données de
tractographie.
Ensuite, une fois nos bases de données de tractographie établies et vu leur nature
complexe, leur variabilité et leur grand volume, nous avons proposé de nouvelles
techniques pour répondre à la question de leur analyse et leur clustering en des
ensembles plausibles anatomiquement.
Notre première approche proposée, considère un clustering intra-sujet, selon une
approche hybride combinant, le clustering basé sur la similarité et la segmentation
basée sur l'a priori anatomique consigné dans un atlas. Ceci, dans le but d'augmenter
l'ecacité et la précision des résultats.
Une suite logique à ce travail, dans la démarche incrémentale que nous suivons, a
été d'étendre la problématique au clustering inter-sujets, an de considérer la varia-
tion de la SB d'un sujet à un autre, qui permet d'établir un modèle de faisceaux de la
SB, pour le diagnostic de diérentes pathologies neuro-dégénératives. Dans ce cadre,

3
Introduction générale

une première approche simple a été développée, considérant des données statiques
et opérant le clustering séquentiellement, en s'appuyant sur un calcul de densité.
Cette première méthode a montré son ecacité à extraire les faisceaux de bres au
niveau de la population et sa robustesse face aux outliers. À ce stade, nous avons
mis en évidence les limites de l'approche, comme pour toutes les autres approches
existantes, par rapport au caractère dynamique de la variation des données d'une
population de faisceaux émanant de diérents sujets. Le clustering est statique et
ne permet pas le transfert d'une donnée aectée à un cluster vers un autre cluster
plus approprié qui apparaîtrait suite à l'enrichissement des données.
Pour répondre à cette limitation, nous avons proposé une nouvelle méthode
incrémentale, alliant dynamicité, distribution et coopération dans le processus de
clustering des données. Ces propriétés inhérentes au paradigme multi-agents, ont
été mises en oeuvre par la proposition d'un modèle multi-agents inspiré du Flocking
(Multiple Species Flocking (MSF)). Le Flocking est un phénomène bien connu, ob-
servé dans la nature, dans les nuées d'oiseaux ou les bancs de poisson, qui est une
illustration parfaite d'une intelligence collective émergeant d'interactions simples
entre les individus. Les interactions sont exprimées dans ce phénomène par des lois
physiques et obéissent à trois règles : la règle de cohésion du groupe qui consiste à
rapprocher les individus les uns des autres pour former un groupe, la règle de sépa-
ration pour éviter que les individus se heurtent en se retrouvant au même endroit
au même moment et, la règle d'alignement pour éviter la dispersion des individus.
Cette nouvelle méthode, appelée : "3D-Streamlines Stream Flocking (3D-SSF)"
est une adaptation de ce modèle au problème du clustering dynamique et distri-
bué des streamlines des diérents sujets considérés. Dans notre modèle, le ux de
données représentant les streamlines d'une population de sujets, sont réiés par une
population d'agents mobiles dans un espace 3D, où chaque agent représente une
streamline et répond aux 3 règles de ocking pour opérer le clustering. L'objectif
étant d'aboutir à des essaims d'agents matérialisant les streamlines similaires et
se séparant des outliers. Les agents évoluent dans l'espace 3D, en cherchant conti-
nuellement à former des essaims ou cluster d'appartenance, qui correspondent à la
similarité la plus élevée. Ce processus est répété jusqu'à stabilisation de la popula-
tion dans les clusters les plus appropriés. Ce processus adaptatif permet de répondre
à la fois à la grande taille des données, à leur variabilité et à leur complexité. La
méthode 3D-SSF a été implémentée et validée à la fois sur des données synthétiques
et des données réelles. La robustesse et l'ecacité de cette méthode ont été démon-
trées par les résultats obtenus et comparées à des algorithmes de la littérature pris
comme Baseline.

Organisation du manuscrit
Ce manuscrit s'organise en six chapitres. Les trois premiers chapitres détaillent
l'état de l'art d'une part, des connaissances nécessaires en anatomie du cerveau et
des techniques relevant de l'IRM de diusion et d'autre part, des approches et des

4
outils informatiques utilisés pour le clustering des données issues de la tractographie
ainsi que des approches à base de systèmes multi-agents. Les trois derniers chapitres
abordent nos principales contributions dans le domaine du clustering des bres de
la SB.
Ainsi, un premier chapitre autour de l'Anatomie cérébrale, les faisceaux de la
SB et les principes de l'IRM de diusion décrit d'abord l'anatomie cérébrale et en
particulier, la SB ainsi que les principaux faisceaux qui la constituent, indispensables
pour comprendre à la fois les termes techniques utilisées dans la suite, l'échelle
à laquelle se situe notre travail et, pour dénir, toute l'étendue de la complexité
de ce fabuleux organe. Puis, les enjeux de l'IRM de diusion sont présentés ainsi
que les outils mathématiques pour décrire le processus de diusion. Enn, nous
expliquons les diérentes techniques de tractographie existantes, tout en discutant
les principaux avantages et inconvénients de ces approches.
Au second chapitre intitulé "Approches de clustering et systèmes multi-agents",
nous visons à introduire les diérentes catégories des méthodes de clustering tradi-
tionnelles existantes dans la littérature, tout en mettant l'accent sur leurs limites.
Nous nous focaliserons sur les nouveaux algorithmes qui ont été proposés récemment
pour résoudre les problèmes de ces méthodes, et qui sont inspirés du comportement
collectif biologique, comme l'algorithme des essaims particulaires (Particle Swarm
Optimization) et l'algorithme de colonies de fourmis. Ces nouvelles méthodes uti-
lisent une implémentation distribuée des système multi-agents que nous décrirons
également en détail dans ce chapitre.
Troisième chapitre portant sur le clustering dans la SB cérébrale et la détection
des outliers, dresse un état de l'art sur les méthodes de clustering intra-sujet et
inter-sujets. Comme le clustering inter-sujets nécessite un recalage des données de
diérents sujets, nous commençons donc par décrire les diérentes méthodes de
recalage inter-sujets. Nous expliquons ensuite, comment les méthodes existantes de
mesure de la similarité sont utilisées pour le clustering. Nous présentons aussi, à
la n de ce chapitre, un bref état de l'art de ce qui a été fait dans le domaine de
la détection et de l'élimination des streamlines outliers. Cette étude a pour but de
mieux situer nos contributions tout au long de cette thèse.
Le chapitre 4 sur le clustering intra-sujet des bres neuronales, présente nos pre-
mières contributions de cette thèse, son but initial étant l'étude de la précision des
algorithmes de tractographie basés sur le modèle DTI et le modèle HARDI. Cela
nous a permis de choisir la meilleure méthode de tractographie pour générer nos
bases de données de tractographie. Nous introduirons ensuite une méthode hybride
de segmentation de ces bases de données de tractographie, an de générer les prin-
cipaux faisceaux de bres qui constituent la connectivité de la SB cérébrale au sein
d'un seul sujet.
Un chapitre 5 traitant du clustering inter-sujets statique des bres, est l'occa-
sion de présenter une nouvelle méthode séquentielle de clustering inter-sujets basée
sur la densité, qui permet une inférence d'un modèle composé d'une liste des fais-
ceaux génériques présents dans la plupart des sujets. Nous détaillons le principe de
cette méthode, avant de présenter les résultats obtenus sur des données réelles et

5
Introduction générale

synthétiques ainsi que leurs validations.


Le chapitre 6 relatif au clustering inter-sujets dynamique des bres neuronales,
constitue la charnière ou le coeur de cette thèse, car il présente notre contribution
majeure dans le cadre du clustering inter-sujets dynamique basé sur une implé-
mentation multi-agents distribuée du modèle MSF, que nous avons nommée 3D-
Streamlines Stream Flocking (3D-SSF). Nous commençons par situer notre travail
par rapport aux méthodes de la littérature tout en mettant en évidence leurs prin-
cipaux inconvénients tout en exposant les solutions apportées par notre méthode.
Ensuite, nous décrivons le concept de la méthode 3D-SSF. Enn, nous exposons les
diérentes expériences réalisées sur des données synthétiques bruitées et des données
réelles de diusion du cerveau humain pour valider notre méthode 3D-SSF et dé-
montrer son ecacité et sa robustesse par rapport aux outliers, comparée à d'autres
approches classiques.

6
Chapitre 1

Anatomie cérébrale, les faisceaux


de la substance blanche et
principes de l'IRM de diusion

 Les hommes doivent savoir que c'est du cerveau et du cerveau seul


que naissent nos plaisirs, nos joies, nos rires et plaisanteries, aussi
bien que nos chagrins, nos douleurs, nos peines et nos larmes. . . 
Hippocrate (466-377 avant J.-C.).

Sommaire
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2 Anatomie cérébrale . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.1 Anatomie Générale du cerveau humain . . . . . . . . . . . . . 8
1.2.2 Organisation de la substance blanche cérébrale . . . . . . . . 11
1.3 Le phénomène de la diusion dans le cerveau humain . . . 15
1.4 Concept de l'IRM de diusion . . . . . . . . . . . . . . . . . 17
1.5 Modélisation de la diusion en IRMd . . . . . . . . . . . . . 19
1.5.1 Imagerie de Tenseur de Diusion . . . . . . . . . . . . . . . . 20
1.5.2 Imagerie de Diusion à Haute Résolution Angulaire . . . . . 24
1.6 Tractographie des bres de la substance blanche . . . . . . 29
1.6.1 La tractographie déterministe . . . . . . . . . . . . . . . . . . 33
1.6.2 La tractographie probabiliste . . . . . . . . . . . . . . . . . . 35
1.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion
1.1 Introduction
L'objectif de cette thèse est l'analyse de la connectivité anatomique du cerveau.
La compréhension de ce travail de thèse nécessite une connaissance de base de l'ana-
tomie cérébrale.
Dans ce chapitre, nous présentons en premier lieu les principaux concepts de
l'anatomie du cerveau en commençant d'abord par décrire la constitution tissulaire
cérébrale d'un point de vue histologique : substance blanche (SB) et substance grise
(SG). Nous nous focalisons surtout sur la SB et les diérents modèles de connexions
qui la constitue.
En deuxième lieu, nous développons les principes de l'IRM de diusion, car elle
est, comme nous le verrons, la seule technique non invasive permettant d'explorer
l'architecture de la SB à partir de la mesure de la diusion des molécules d'eau. Nous
expliquons d'abord les principes de base de la diusion moléculaire, puis la diusion
dans le cerveau. Nous verrons comment cette diusion est mesurée grâce à l'IRM
de diusion. Ensuite, nous présentons l'Imagerie du Tenseur de Diusion (DTI) et
l'Imagerie à Haute Résolution Angulaire (HARDI). Enn, dans la dernière section
de ce chapitre, nous nous intéressons aux diérentes techniques de tractographie
existantes qui permettent de générer l'ensemble des bres de la SB.

1.2 Anatomie cérébrale


1.2.1 Anatomie Générale du cerveau humain
Le cerveau humain est l'un des organes les plus importants et des plus complexes
du corps humain. Depuis plus d'une centaine d'années, la compréhension de son
organisation et de son fonctionnement a présenté un intérêt fondamental pour la
neurologie et les neurosciences.
Le cerveau est l'organe qui supervise le système nerveux central (SNC), il est
considéré comme l'unité fonctionnelle majeure ; il intègre les informations, contrôle
la motricité et assure les fonctions cognitives.
Le cerveau peut être divisé en quatre parties : le télencéphale, composé par les
deux hémisphères cérébraux, le diencéphale, composé par des structures localisées
dans le cerveau profond, le cervelet et le tronc cérébral, composé par le bulbe rachi-
dien, le pont et le mésencéphale (gure 1.1).
Le SNC contient également la moelle épinière (moelle spinale) qui prolonge le
tronc cérébral et le bulbe rachidien tout le long de la colonne vertébrale dans laquelle
elle est contenue. Son rôle est de distribuer les nerfs entre le cerveau et les diérentes
parties du corps.
Les hémisphères cérébraux constituent la partie la plus importante du cerveau.
Leur surface est parcourue par des circonvolutions appelées gyri. Elles sont séparées
par des sillons dont les plus profonds sont dénommés scissures. Chaque hémisphère
est divisé en quatre lobes externes illustrés à la gure 1.2 et deux lobes internes
(l'insula et le lobe limbique) avec des fonctionnalités distinctes.

8
1.2. Anatomie cérébrale

Figure 1.1  Diérentes parties du cerveau (coupe sagittale).


Le lobe occipital occupe la partie postérieure du cerveau ; il est responsable de la
réception et du décodage des informations visuelles. Le lobe pariétal est situé dans
la partie moyenne du cerveau, en arrière du lobe frontal ; il intègre les informations
sensitives et l'orientation spatiale. Le lobe temporal est situé sous le lobe frontal. Il
contient les centres de l'audition, sa partie gauche est responsable de la mise en place
de la structure phonétique et grammaticale du langage et la partie interne composée
de l'hippocampe est responsable de la mémorisation à court terme. Le lobe frontal
est situé dans la partie antérieure des hémisphères cérébraux. Il joue un rôle dans le
raisonnement, la planication, l'articulation du langage, la mémoire et la motricité.
Le cinquième lobe appelé insula se situe dans la profondeur de la vallée Sylvienne
entre le lobe frontal et temporal. À ces cinq lobes s'ajoute le lobe limbique, située
le long de la zone médiale du cortex, en profondeur de la paroi interhémisphérique.

Figure 1.2  Les quatre lobes externes composant l'hémisphère gauche cérébral.
(source : Gray's Anatomy).

Le cerveau humain est protégé par la boîte crânienne et baigne dans un milieu
aqueux : le liquide cérébro-spinal, ou liquide céphalo-rachidien (LCR). A l'échelle
microscopique, il est composé de diérents structures comme la substance blanche

9
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion

(SB) et la substance grise (SG). Ces structures présentent des contrastes diérents
dans une image de résonance magnétique (IRM) anatomique, de contraste T1 (gure
1.3).

Figure 1.3  Cerveau humain adulte d'une IRM anatomique T1. (a) Coupe sagit-
tale. (b) Coupe transversale. ( Visible Human Project  [Ackerman 1999]). La SB
apparait en couleur blanche à l'intérieur du cerveau. Le cortex de SG est la couche
grise qui entoure le cerveau.

La SG du cerveau contient les corps cellulaires des cellules nerveuses (neurones),


illustrée en gure 1.4. Le neurone est constitué par un corps cellulaire dénommé
Soma d'où partent des prolongements de deux types, les dendrites et l'axone, qui
dièrent par de nombreux caractères. Les dendrites, habituellement multiples, et
toujours très courtes, conduisent l'inux nerveux vers le corps cellulaire. L'axone,
toujours unique, parfois très long, conduit l'inux nerveux à partir du corps cel-
lulaire jusqu'à ses cibles. Certains axones sont entourés par une gaine de myéline
qui les isole électriquement et augmente considérablement la vitesse de conduction
de l ?inux nerveux. La SG est distribuée dans le cortex (surface des hémisphères
cérébraux et du cervelet) et plus profondément, dans les noyaux (thalamus, hy-
pothalamus), dans le tronc cérébral et la colonne vertébrale. Les structures de la
SG traitent l'information provenant des organes sensoriels ou d'autres régions du
cerveau constituées de substance grise.
La SB contient les bres nerveuses (axones des cellules nerveuses) entourées
d'une gaine de myéline protectrice (gure 1.4). La myéline, qui donne la couleur
blanche, agit comme un isolant qui facilite la transmission des signaux transmis par
les bres nerveuses.
La SB est composée de faisceaux de bres qui connectent les diérentes régions
de SG et transmettent les communications entre les cellules nerveuses. Nous allons
détailler davantage les faisceaux de la SB car l'objectif de cette thèse est l'analyse
de la connectivité anatomique du cerveau.

10
1.2. Anatomie cérébrale

Figure 1.4  Quelques neurones dans le cerveau, constituées d'un corps cellulaire,
de dendrites et d'un axone entouré d'une gaine de myéline. (Source : http://www.
arsep.org).

1.2.2 Organisation de la substance blanche cérébrale


La SB est essentiellement formée de faisceaux de bres nerveuses myélinisées,
avec un trajet plus ou moins sinueux, qui s'entrecroisent très fréquemment les uns
aux autres. Les faisceaux de bres sont très variables en terme de formes géomé-
triques, positions spatiales et longueurs.
Les principaux faisceaux sont regroupés selon les structures qu'ils connectent,
ils sont divisés en trois types : les faisceaux commissuraux qui unissent les régions
des deux hémisphères entre-elles, les faisceaux d'association qui relient les régions
du cortex d'un même hémisphère, et les faisceaux de projection qui connectent le
cortex avec les centres sous-corticaux et la moelle épinière.
Une description de ces faisceaux est présentée en détail ci-dessous, basée sur les
articles de [Catani 2008, Aralasmak 2006, Jellison 2004], et les travaux de thèse de
[Perrin 2006, Guevara 2011a, Laouchedi 2015].

1.2.2.1 Les faisceaux d'association


Les faisceaux d'association sont de longueurs variables, ils peuvent être divisés en
deux catégories : les faisceaux d'association courts appelés les bres en "U", reliant
les régions corticales adjacentes, et les faisceaux d'association longs établissant des
connexions entre les diérents lobes cérébraux (gure 1.5).

11
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion

Les faisceaux d'association longs


Le cingulum (CG) est un faisceau associatif médial, qui se localise tout autour
du corps calleux. Il fait partie du lobe limbique, impliqué dans l'attention, la mémoire
et les émotions.

Le faisceau longitudinal supérieur (le faisceau arqué) (SLF) est en dehors


de la capsule interne (gure 1.5). Il associe les lobes frontal, pariétal, occipital et
temporal. Pour la plupart des personnes, le faisceau arqué de l'hémisphère gauche
est impliqué dans le langage, tandis que le faisceau arqué droit est souvent impliqué
dans le traitement visuo-spatial et autres aspects du langage, comme la prosodie
incluant l'intonation et la sémantique.

Le faisceau longitudinal inférieur (ILF) traverse la partie ventro-latérale du


lobe temporal. Il réunit les lobes temporaux et occipitaux. Il est impliqué dans la
reconnaissance des visages, la perception visuelle, la lecture, la mémoire visuelle et
autres fonctions reliées au langage.

Figure 1.5  Représentation de diérents types de bres. (a) Diérents faisceaux


d'association longs en coupe sagittale ; (b) Capsule interne, externe et extrême sur
une coupe coronale. (Figure adaptée de [Jbabdi 2006]).

Le faisceau unciné (UNC) est un faisceau associatif ventral qui connecte le lobe
temporal avec le cortex orbito-frontal médial et latéral. Ce faisceau est considéré
comme une partie du lobe limbique, et semble être impliqué dans le traitement des
émotions, de la mémoire et du langage.

Le faisceau fronto-occipital inférieur (IFO) est un faisceau associatif ventral


qui connecte le lobe occipital ventral avec le cortex orbito-frontal. Il est possible qu'il
soit impliqué dans la lecture, l'attention et le traitement visuel. Chez les humains,
il représente les seules connexions directes entre les lobes occipital et frontal.

12
1.2. Anatomie cérébrale

Les faisceaux d'association courts


Les faisceaux d'association courts (bres en U) sont situées dans la SB super-
cielle, entre la substance blanche profonde et le cortex. Jusqu'à présent, ces bres
n'ont pas été bien caractérisées dans la littérature ; quelques travaux seulement ont
étudié ces faisceaux à partir d'une analyse de groupe [Guevara 2011b, Oishi 2008,
Zhang 2010].

1.2.2.2 Les faisceaux commissuraux (les commissures)


Les faisceaux commissuraux (gure 1.6) relient les deux hémisphères entre eux
et regroupent le corps calleux et les commissures antérieure et postérieure.

Le corps calleux (CC) est le plus grand faisceau du cerveau humain (environ
300 millions de bres). Il connecte les hémisphères cérébraux droit et gauche, il est
conventionnellement divisé en quatre parties : le bec (rostrum), le genou (genu),
le tronc (truncus) et le bourrelet (splenium). Le CC est impliqué dans plusieurs
fonctions motrices, sensorielles et cognitives.

La commissure antérieure (CA) est un petit faisceau qui relie les lobes tem-
poraux des deux hémisphères au niveau de l'amygdale situé dans la région antéro-
interne du lobe temporal. Ses fonctions sont peu connues.

La commissure postérieure (CP) est un petit faisceau qui connecte les noyaux
des nerfs crâniens, et les deux moitiés du mésencéphale et du diencéphale. Il est très
rarement reconstruit à partir de l'IRMd.

Figure 1.6  Fibres commissurales ; Les commissures antérieure et postérieure dé-


terminent l'axe CA-CP. (Figure adaptée de [Jbabdi 2006]).

13
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion

1.2.2.3 Les faisceaux de projections


Les faisceaux de projections connectent les aires corticales avec les structures
sous-corticales et la moelle épinière. Ils sont divisés en deux types : les faisceaux
ascendants et descendants.
Les faisceaux ascendants transportent l'information sensorielle des diérentes
parties du corps vers le cortex. Les tractus descendants transmettent les commandes
motrices issues du cortex moteur. Dans la profondeur des deux hémisphères, les bres
de projection constituent, avec les bres thalamo-corticales, la couronne rayonnante
et la capsule interne.

Le faisceau corticospinal (pyramidal) (CST) est constitué d'un groupement


de bres nerveuses possédant un trajet commun, provenant du cortex jusqu'à la
moelle épinière. Il passe à travers la couronne rayonnante, la capsule interne, le
pédoncule cérébelleux et les régions pyramidales (moelle allongée). Ce faisceau est
destiné à acheminer les messages moteurs volontaires.

Les radiations thalamiques sont composées des bres cortico-thalamiques et


thalamo-corticales qui forment un éventail plus ou moins continu. Ces bres pro-
viennent des noyaux thalamiques, lesquels se projettent vers une ou quelques ré-
gions corticales bien dénies. Les radiations thalamiques sont souvent regroupées en
quatre sous-groupes : antérieur (frontal), supérieur (pariétal), inférieur (temporal)
et postérieur (occipital). Les radiations optiques se projettent vers le cortex visuel
primaire tandis que les radiations acoustiques se projettent vers le lobe temporal.

Le Fornix est une commissure intra et inter-hémisphérique placée sous le corps


calleux. Il connecte l'hippocampe et l'hypothalamus. Il s'étend de l'hippocampe au
corps mamillaire dans chaque hémisphère. En avant, il est formé de deux colonnes
(piliers antérieurs) qui arrivent jusqu'aux corps mamillaires. Ces piliers sont accolés
vers l'arrière dans la partie moyenne, appelée le corps du fornix. En arrière il se
divise en deux piliers postérieurs qui nalement longent l'hippocampe en formant un
faisceau n appelé mbria. Le fornix appartient au système limbique et est impliqué
dans la mémoire.

Faisceaux cérébelleux connectent le cervelet aux autres régions du cerveau. Il


existe deux types :
 Un faisceau direct ou postérieur qui gagne le cervelet par le pédoncule cére-
belleux inférieur et véhicule les aérences en provenance du tronc.
 Un faisceau croisé ou antérieur qui gagne le cervelet par le pédoncule cére-
belleux supérieur et véhicule les aérences en provenance des membres.
La gure 1.7 présente un exemple de quelques faisceaux de bres les plus connus
reconstruits à partir de l'IRMd.

14
1.3. Le phénomène de la diusion dans le cerveau humain

Figure 1.7  Les principaux faisceaux de la SB décrits dans la littérature, obte-


nus à partir de la tractographie déterministe sur un champ de tenseur de diu-
sion. Faisceaux commissuraux : commissure antérieure et corps calleux. Faisceaux
de projection : Faisceau corticospinal, capsule interne/couronne rayonnante et for-
nix. Faisceaux d'association longs : faisceau arqué, faisceau longitudinal inférieur,
faisceau fronto-occipital inférieur, faisceau unciné et cingulum. (Figure adaptée de
[Catani 2008]).

1.3 Le phénomène de la diusion dans le cerveau humain


Lorsqu'on place deux liquides miscibles de couleurs diérentes dans un tube, la
surface de séparation devient oue et les liquides se mélangent. L'agitation ther-
mique, liée à l'énergie cinétique des molécules dans le uide, est responsable de
chocs entre les particules en suspension, et provoque leurs déplacements aléatoires
dans l'espace. Décrit pour la première fois dans [Brown 1828], ce déplacement porte
désormais le nom de mouvement brownien, illustré par la gure 1.8(a). Cette agi-
tation, plus élevée dans les liquides que dans les solides, est directement liée à la
température. En l'absence de barrières capables d'entraver les mouvements des mo-
lécules, la diusion obéit à la loi de Fick qui s'applique à la diusion libre, dénie
comme le processus de transport irréversible des molécules à partir d'une région à
forte concentration vers une région à faible concentration (gure 1.8(b)). Elle a donc
tendance à homogénéiser la composition du milieu. La première loi de Fick (équa-
tion 1.1) décrit pour un milieu incompressible, la dépendance du ux moléculaire J

15
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion

au gradient de concentration moléculaire 5C :

J = −D 5 C (1.1)
avec D le coecient scalaire de diusion (m/s) qui ne dépend que de la nature
du milieu, C la concentration de l'espèce diusante (mol/m3 ) et J le ux de matière
((mol/m2 )/s).
La diusion moléculaire, ou mouvement brownien, a été formalisé par Einstein
[Einstein 1956], par l'équation 1.2 et relie le coecient de diusion D à la moyenne
quadratique de la distance parcourue par l'atome en trois dimensions :

< P T p >= 6Dt, (1.2)

où les symboles <> désigne la moyenne des valeurs k p k possibles du déplace-


ment des molécules .

(a) Mouvement brownien d'un atome (b) Exemple de mélange de deux pro-
modélisé en deux dimensions par une duits par diusion.
marche aléatoire.

Figure 1.8  Le phénomène de la diusion.


En suivant l'objectif de cette thèse, nous considérons le cas de la diusion dans
les tissus biologiques du cerveau. Le cerveau, comme on l'a vu dans le paragraphe
1.2, présente trois structures qui modulent la diusion : le liquide céphalo-rachidien
(LCR), la SG et la SB. La diusion des molécules d'eau dans le LCR peut être
assimilée à la diusion en milieu homogène de faible viscosité. La SG est constituée
d'un maillage dense de corps neuronaux, de dendrites et d'axones, ce qui confère à
la diusion un caractère quasi-isotrope. Une organisation spécique des faisceaux
axonaux de la SB en bres parallèles serrées, aecte de manière signicative la
diusion, qui est plus rapide dans le sens des bres que dans le sens transversal. Ce
phénomène appelé diusion anisotrope est illustrée dans la gure 1.9.
L'IRM de diusion du cerveau se base sur le fait que le mouvement des molécules
d'eau dans le tissu cérébral dépend de la structure de ce dernier. Le fait de s'intéresser
au mouvement des molécules d'eau dans une direction donnée renseigne donc sur la
géométrie du tissu cérébral et permet en particulier de détecter les axones alignés
selon cette direction.

16
1.4. Concept de l'IRM de diusion

Figure 1.9  Diusions isotrope et anisotrope. (a) Prol de diusion isotrope ; (b)
Prol de diusion anisotrope ; (c) Diusion restreinte dans la SB. La diusion dans la
direction des bres D k est trois fois plus importante que la diusion perpendiculaire
D ⊥ [Bihan 2003]. L'eau diuse plus facilement en suivant la structure de l'axone
qu'en essayant de passer au travers.

1.4 Concept de l'IRM de diusion


L'IRM de diusion [Bihan 1986, Merboldt 1985, Taylor 1985] tente d'imager la
SB en analysant le déplacement des molécules d'eau présentes dans le cerveau lors-
qu'elles sont soumises à un champ magnétique orienté.
Le cerveau humain est composé d'environ 78% de molécules d'eau (H2 O) et
a fortiori majoritairement d'atomes d'hydrogènes (H). Chaque noyau d'hydrogène
possède un spin qui est une caractéristique quantique de la nature de la particule,
au même titre que sa masse et sa charge électrique.
Le spin peut être interprété en première approximation comme la rotation de la
particule autour d'un axe [Pauli 1940, Wigner 1939], auquel on associe un moment
magnétique de spin ce qui conduit la molécule à être paramagnétique. Lorsque qu'un
champ magnétique B0 est appliqué à ces spins, il y a résonance lorsque le champ
magnétique tournant B0 a la même fréquence de rotation que celle du moment de
spin du noyau. Le vecteur de moment magnétique tend alors à s'aligner le long de ce
champ comme illustré par la gure 1.10(a) et les atomes résonnent à la fréquence de
Larmor w0 variable, selon la puissance du champ magnétique, donnée par l'équation
1.3 [Levitt 2003] :

w0 = γ k B 0 k (1.3)
où le rapport gyromagnétique pour 1H est : γ = 2.68 × 108 . A l'échelle d'un voxel
de 2 à 3 mm, plusieurs atomes entrent en résonance et on parle alors de vecteur de
magnétisation macroscopique des spins M , comme illustré à la gure 1.10(b).
Le signal d'écho de spins, mesuré par résonance magnétique des atomes, est
obtenu par la séquence suivante (résumée par la gure 1.11) :
 Un champ magnétique B0 de très grande magnitude, de l'ordre de quelques
Teslas, est généré par la machine IRM. On choisit par convention B0 orienté
le long de l'axe z (gure 1.11(a)).

17
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion

Figure 1.10  Magnétisme nucléaire. (a) Précession d'un atome à la fréquence de


Larmor sous la présence d'un champ magnétique orienté B0 . (b) Représentation du
vecteur de magnétisation moyen M d'un ensemble d'atomes à l'échelle d'un voxel.

 En plus du champ magnétique B0 , une impulsion radiofréquence (RF) B1


est appliquée à la fréquence de Larmor du proton dans le plan orthogonal à
B0. Le temps de cette impulsion est nement réglé pour que le vecteur de
magnétisation moyen M soit aligné sur le plan xy (gure 1.11(b)). On parle
de RF à 90◦ ou de bascule à 90◦ .
 Lorsque l'impulsion radiofréquence B1 est arrêtée, le vecteur de magnétisa-
tion M évolue sous la seule inuence du champ magnétique B0 et va graduel-
lement s'aligner avec l'axe z , revenant à sa position initiale. Cette dernière
étape, nommée relaxation de spin, génère le signal radiofréquence que mesure
les antennes de la machine IRM.
Une fois le signal acquis, la transformée de Fourier inverse permet de récupé-
rer l'image. Pour encoder l'espace, l'IRM utilise trois champs magnétiques appelés
gradients. L'addition des gradients au champ magnétique statique B0 fait varier
linéairement le champ magnétique sur tout le volume d'intérêt, dans les trois direc-
tions orthogonales de l'espace.
La fréquence de Larmor devient alors dépendante de la position, ce qui permet
l'encodage spatial dans l'IRM. Dans la séquence d'acquisition, les gradients sont
appliqués de façon à échantillonner l'espace de fréquences (espace q ), ce qui permet
d'échantillonner l'espace 3D : un gradient de sélection de coupe est appliqué en même
temps que l'impulsion RF ; un autre gradient, de sélection de ligne, est appliqué après
l'impulsion RF et le troisième gradient est appliqué pendant la lecture du signal.
An de mesurer la diusion des molécules d'eau dans le cerveau par IRMd, il
sut d'ajouter successivement une paire de forts gradients de champs à une séquence
IRM conventionnelle (gure 1.12) [Stejskal 1965], comme une séquence de spin-écho
à gradients de champ magnétique pulsés (PGSE pour pulsed gradient spin echo).
Cette séquence est expliquée comme suit : le premier gradient de diusion gd(0)
marque les spins suivant leurs positions au temps t = 0. Après l'impulsion radio-
fréquence à 180◦ , qui permet d'ajuster la phase des spins au temps d'écho TE, le

18
1.5. Modélisation de la diusion en IRMd

Figure 1.11  Les trois étapes de l'acquisition du signal IRM pour un voxel. (a)
A l'équilibre, le vecteur de magnétisation M s'aligne avec le champ magnétique
B0 . (b) Après excitation par une impulsion radiofréquence (RF) B1 orientée à 90◦
par rapport à B0 , M se situe dans le plan xy . (c) L'arrêt de la RF B1 entraîne
la relaxation de M vers l'axe z et émet une onde radiofréquence, l'écho, que l'on
mesure à l'aide d'antenne situées à proximité.

deuxième gradient de diusion gd(δ) est appliqué et marque à nouveau les spins
suivant leur position à t = δ . Deux cas de gure se présentent : (i) les spins n'ont
pas bougé et les marques s'annulent ; (ii) les spins ont bougé, entraînant une perte
du signal proportionnelle au déplacement des spins. Si on assume que les gradients
sont inniment courts, le signal mesuré peut s'exprimer selon l'équation 1.4 :
TR TE
f (x, y) = M0 (1 − e− T 1 ) e− T 2 e−bD (1.4)
où, M0 est la densité protonique du voxel, T1 et T2 sont les constantes de
temps des relaxations dans le tissu, TR est le temps de répétition de la séquence,
D est le coecient de diusion et le facteur b représente la sensibilité à la diusion
[Bihan 1986].
Les variantes de la séquence échoplanaire (EPI, Imagerie Echo Planaire), propo-
sée par [Manseld 1977], sont les plus utilisées actuellement car elles sont beaucoup
plus rapides que la séquence PGSE. Elles produisent cependant des distorsions géo-
métriques dans l'image à cause du train d'acquisition très long, pendant lequel toutes
les erreurs d'encodage en phase s'accumulent. Ces distorsions doivent être corrigées,
en fonction du type, soit par l'acquisition elle-même, soit par un post-traitement.
En plus, un autre post-traitement devra être appliqué pour réduire le bruit Ricien,
présent dans les données de diusion.

1.5 Modélisation de la diusion en IRMd


A partir du signal acquis en IRM pondérée en diusion, une estimation de la
diusion est calculée en chacun des voxels. Une multitude de techniques ont été dé-

19
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion

Figure 1.12  Une séquence simpliée d'acquisition IRM. Deux gradients courts
d'aires similaires, dans ce cas d'amplitudes et de durées similaires, sont utilisés.
(Source : [Descoteaux 2008].)

veloppées pour estimer et modéliser localement le signal de diusion : L'Imagerie de


Tenseur de Diusion (DTI) et l'Imagerie de Diusion à Haute Résolution Angulaire
(HARDI). Chaque modèle a ses avantages et ses limites [Seunarine 2007].

1.5.1 Imagerie de Tenseur de Diusion


Le tenseur de diusion [Basser 1994, Basser 2000] permet de modéliser les pro-
priétés de diusion des tissus cérébraux. En posant comme hypothèse que la diusion
de l'eau est libre, cela permet de la modéliser par une distribution gaussienne 3D,
en sous-entendant qu'une seule population de bres traverse chacun des voxels. Bien
que cette hypothèse ne soit pas correcte en raison de la nature des tissus biologiques,
le DTI est le modèle le plus répandu en clinique, de par sa simplicité d'acquisition
et l'utilité anatomique des cartes scalaires que l'on peut en tirer.
Comme déjà mentionné, la diusion dans un milieu homogène est entièrement
décrite par le coecient de diusion scalaire D. Toutefois, dans le cas d'un milieu
anisotrope, la caractérisation de la diusion nécessite un tenseur du second ordre
symétrique, D, qui décrit la diusion le long de chaque direction de l'espace 3D. Le
signal RM dans le cadre des impulsions inniment étroites σ δ est donc donnée par

20
1.5. Modélisation de la diusion en IRMd

l'équation 1.5 :
S4 (q) = S0 exp(− 4 q T Dq) (1.5)
Les diérents paramètres d'imagerie sont souvent décrits par un scalaire unique,S0
est le signal obtenu sans application de gradients de diusion et le facteur b est dé-
nie par l'équation 1.6 comme suit :

b = 4 k q k2 = 4γ 2 δ 2 k gd k2 (1.6)
Pour le schéma de Stejskal-Tanner, 4 est habituellement remplacé dans le facteur b
par le temps de diusion eectif (4 − δ/3) , an de compenser la durée innie des
impulsions du gradient [Bihan 1986].
Le tenseur de diusion D dans l'équation 1.5 est un tenseur du 2me ordre positif
et symétrique, qui peut être représenté par une matrice 3x3. Il possède donc 6 degrés
de liberté. Un minimum de 6 mesures de diusion sera alors nécessaire an d'estimer
le tenseur de diusion dans un voxel (généralement, une douzaine de directions
sont mesurées), ainsi que l'acquisition réalisée en l'absence de gradient de diusion.
Mathématiquement le tenseur de diusion a la forme suivante :
 
Dxx Dyx Dzx
Dxy Dyy Dzy 
Dxz Dyz Dzz

où Dxx , Dyy , et Dzz correspondent aux coecients de diusion dans les directions
principales x, y et z . La matrice est symétrique, ce qui signie que Dxy = Dyx , Dzx =
Dxz et Dzy = Dyz . Ces six coecients sont estimés selon la relation d'atténuation
du signal RMN [Bihan 1986], avec l'équation 1.7 suivante :
Sk
A= = exp(−bgkT Dgk ) (1.7)
S0
où, S0 est le signal de référence en l'absence de gradient de diusion, Sk le signal
dans la direction k, k = 1, 2, .., 6. gk = (xyz)T est la direction du vecteur gradient
de diusion normalisé. Les directions d'application du gradient de diusion sont
habituellement choisies pour échantillonner de façon homogène l'espace. Cependant,
les coordonnées exactes de chaque direction sont propres à chaque constructeur.
Il est possible d'extraire les trois valeurs propres (λ1 , λ2 , λ3 ) et vecteurs propres
(e1 , e2 , e3 ), par la diagonalisation de la matrice. Ces valeurs sont obtenues en résol-
vant l'équation 1.8 suivante :
    
Dxx Dyx Dzx xi xi
Dxy Dyy Dzy   yi  = λi  yi  ⇐⇒ D.Vi = λi Vi (1.8)
Dxz Dyz Dzz zi zi
avec Vi vecteurs propres, perpendiculaires entre eux, λi valeurs propres. i =
1, 2, 3.
En fonction des trois vecteurs propres, qui représentent les trois directions or-
thogonales de diusion, la forme du tenseur de diusion peut s'allonger, s'aplatir

21
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion

ou encore se goner comme illustré à la gure 1.13. En l'absence de restrictions


physiques, comme dans les ventricules avec le milieu aqueux du LCR, le tenseur
prend la forme d'une sphère (gure 1.13(A)). On dit alors que la diusion est iso-
trope lorsque λ1 = λ2 = λ3 . Le tenseur peut aussi avoir la forme d'un ellipsoïde si
seulement deux valeurs propres sont égales λ1 = λ2 . On parle alors d'anisotropie
planaire (gure 1.13(B)). Finalement, lorsqu'une valeur propre prédomine les deux
autres, le tenseur de diusion prend la forme d'un cigare allongé (gure 1.13(C)).
Nous sommes alors en présence d'une forte anisotropie.
Il existe plusieurs mesures scalaires pouvant être déduites du tenseur. Ces mé-
triques sont souvent utilisées à des ns de comparaison entre diérents sujets lors
d'études de groupes car elles fournissent une information sur la propriété des tissus
sous-jacents, propre à chaque ensemble de données.

Figure 1.13  Imagerie du Tenseur de Diusion (DTI). A : Le tenseur de diu-


sion peut être représenté par un ellipsoide. Dans des tissus structurés comme les
bres nerveuses, la diusion est anisotrope, en présentant une orientation privilé-
giée de diusion, dans la direction des bres. L'ellipsoïde représente la diusivité
parallèle ou axiale (λ k, λ1 ) et la diusivité perpendiculaire ou radiale des bres
(λ ⊥, λ2,3 ). B : Exemples d'ellipsoïdes avec une diusivité moyenne (M D) similaire
(0.7 × 10−3 mm2 /s) et une anisotropie fractionnelle (F A) diérente. C : Exemple
d'images de diusivité moyenne (MD) et d'anisotropie fractionnelle. D : A gauche,
une image de diusivité moyenne M D avec la superposition des ellipsoïdes, pour
une région. A droite, un zoom de cette région. (Figures adaptées de [Arsigny 2006]).

Diusion moyenne
Ce paramètre de diusion permet d'obtenir une estimation de la diusion au sein
d'un voxel (Figure 1.13). Il caractérise le déplacement global des molécules au sein
d'un voxel et permet de déceler la présence d'obstacles à la diusion. La diusion
moyenne est considérée comme étant un indicateur sensible aux changements de

22
1.5. Modélisation de la diusion en IRMd

maturation dans le cerveau indépendants des mesures d'anisotropie. Ce paramètre


est déni comme la moyenne des coecients diagonaux du tenseur de diusion
[Bihan 1986], il est donné par l'équation 1.9 :
1 1
M D = traceD = (λ1 + λ2 + λ3 ) (1.9)
3 3

Fraction d'anisotropie FA


FA représente l'amplitude de D qui peut être attribuée à la diusion aniso-
trope. Il est l'indice le plus utilisé en pratique, dénit par l'équation 1.10.
p
3.((λ1 − < λ >)2 + (λ2 − < λ >)2 + (λ3 − < λ >)2 )
FA = p . (1.10)
2(λ21 + λ22 + λ23 )

Rapport de volume RA


RA est le rapport entre la partie anisotrope du tenseur D et sa partie isotrope,
dénit par l'équation 1.11.
p
3.((λ1 − < λ >)2 + (λ2 − < λ >)2 + (λ3 − < λ >)2 )
RA = √ . (1.11)
3<λ>

Volume Ratio VR


VR est le rapport entre le volume de l'ellipsoïde et celui d'une sphère de rayon
< λ >, dénit par l'équation 1.12.
λ1 λ2 λ3
VR= . (1.12)
< λ >3

Coecient de linéarité Cl


Cl est déni dans [Westin 1997], par l'équation 1.13 suivante :
λ1 − λ2
Cl = . (1.13)
λ1 + λ2 + λ3

Coecient de planarité Cp


Cp est déni dans [Westin 1997], par l'équation 1.14 suivante :
2(λ1 − λ2 )
Cp = . (1.14)
λ1 + λ2 + λ3

Coecient de sphéricité Cs


Cs est déni dans [Westin 1997], par l'équation 1.15 suivante :
3λ3
Cs = . (1.15)
λ1 + λ2 + λ3

23
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion

Les FA et RA varient de 0 (cas des liquides comme le LCR et l'÷dème vasogé-


nique) à 1 (cas des structures bien organisées tels les faisceaux CST et CC et plus
généralement dans les régions à forte anisotropie). Ils prennent des valeurs faibles
dans les structures faiblement organisées comme la matière grise et les croisements
ou évasement (dispersion) de faisceaux bres et ne permet pas de distinguer toutes
ces structures. Le comportement de la MD est à l'opposé de celui de la FA, illustré
par la gure 1.14.

Figure 1.14  Coupes axiales d'un cerveau humain, montrant les cartes scalaires
provenant du DTI. (a) : diusion moyenne MD. (b) : FA, (c) : carte couleur RGB de
la FA (vert : direction antéro-postérieure, bleu : direction crâno-caudale et rouge :
direction gauche-droite).

1.5.2 Imagerie de Diusion à Haute Résolution Angulaire


Le modèle du tenseur de diusion fait l'hypothèse d'une distribution gaussienne
de la diusion. Cette hypothèse n'est pas toujours valide, en particulier pour les
zones de croisement des faisceaux de bres. An de résoudre les limitations du
DTI, des techniques plus sophistiquées de la diusion qui permettent une meilleure
modélisation en distinguant les croisements de bres à l'intérieur d'un voxel telles
que les méthodes HARDI, ont vu le jour.
Comparativement au faible nombre de directions mesurées en imagerie du ten-
seur de diusion, les méthodes HARDI peuvent atteindre une centaine de directions
an de reconstruire la distribution de probabilité angulaire (PDF) qui décrit le phé-
nomène de diusion en 3D [Descoteaux 2008, Tuch 2002]. Un nombre élevé d'orien-
tations entraîne cependant une augmentation du temps d'acquisition pour un sujet
qui devra subir une telle séquence d'IRMd.
L'information contenue par la PDF nous indique à quoi peut ressembler la struc-
ture complexe des bres sous-jacentes, ce que le tenseur ne pourrait pas faire en
raison de ses propriétés géométriques gaussiennes, le modèle du tenseur de diusion
faisant l'hypothèse d'une distribution gaussienne de la diusion. Cette hypothèse
n'est pas toujours valide en particulier dans les zones de croisement des faisceaux
de bres.

24
1.5. Modélisation de la diusion en IRMd

Diérentes techniques HARDI ont été proposées, avec ou sans modèle de diu-
sion.

1.5.2.1 Les techniques avec modèle de diusion


Les techniques avec modèle de diusion utilisent des hypothèses sur les types de
populations présentes dans chaque voxel. Les modèles les plus connus sont :

Le modèle multi-tensoriel
Les auteurs dans [Tuch 2002] ont proposé de modéliser le signal HARDI comme
un mélange ni de n Gaussiennes. Ce modèle (gure 1.15(a)) est une extension du
modèle DTI, il généralise la DTI sous l'hypothèse que le signal du prol de diusion
est la somme des signaux de plusieurs faisceaux de bres, chacuns modélisés par un
tenseur d'ordre deux. Dans le cas de présence de k tenseurs, le signal est donné par
l'équation 1.16 :
k
(1.16)
X
Si = S0 fj exp(−bgiT Dj gi )
j=1

où S0 : le signal obtenu sans application de gradients de diusion, b : constante


spécique de l'acquisition, gi : gradients de diusion (g1 , .., gn ), Si : signal mesuré
correspondant au gradient i, Dj : tenseur j , fj : poids non négatif dont la somme
j=1 fj = 1.
Pk

Ce modèle exige que le nombre de bres dans un voxel n soit connu. La plupart
des méthodes utilisent n = 2. An de rendre la solution numérique plus stable,
diérents contraintes peuvent être rajoutées à ce modèle. Par exemple, Tuch et
al dans [Tuch 2002] imposent la symétrie des valeurs propres. Les auteurs dans
[Maier 2004, Peled 2006] forcent une certaine amplitude a priori pour les valeurs
propres et dans [Chen 2004] imposent la dénition positive du tenseur. Une ex-
tension multi-Gaussiennes utilise une fonction de base de diusion de Gaussiennes
[Ramirez-Manzanares 2007] pour récupérer le croisement des bres.

Le modèle "Ball and stick"


Ce modèle proposé dans [Behrens 2003], peut être considéré comme une simpli-
cation du modèle multi-tenseurs (gure 1.15(b)). Le modèle Ball et Stick, dans le
cas d'un voxel avec une seule population de bres, modélise le signal comme étant la
somme de deux composantes : une composante anisotrope (Pa ) (la bre) suivant une
distribution Gaussienne, modélisée par un bâton (stick) et mathématiquement par
un tenseur n'ayant qu'une seule valeur propre correspondante au vecteur propre,
orienté dans la direction de la bre et, une composante parfaitement isotropique
(Pf ) (une sphère) modélisant tout le reste (population libre), donc avec des valeurs
propres égales ; il en résultera une seule valeur propre à estimer. La PDF P est donc
donnée par l'équation 1.17 :

25
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion

P = αPf + (1 − α)Pa (1.17)

où α représente la fraction volumique de la population libre. Un mélange de com-


partiments restreints a été utilisé dans [Behrens 2007] pour récupérer les orientations
de bres multiples des compartiments.

Le modèle CHARMED
Le modèle Composite and Hindered Restricted Model of Diusion (CHARMED)
proposé par Assaf et al [Assaf 2004] (gure 1.15(c)), divise la diusion en deux pro-
cessus : un compartiment fortement restreint qui est non-Gaussien avec une diu-
sion rapide (intra-axonale) et, un compartiment freiné qui est approximativement
Gaussien avec une diusion lente, donc la diusion est modélisée par une DTI Gaus-
sienne et une diusion à l'intérieur d'un cylindre. Cette approche a été améliorée
dans [Assaf 2008] qui propose le modèle AxCaliber qui tient compte de la varia-
bilité du diamètre axonal ce qui permet l'établissement de cartes pondérées par le
diamètre axonal, utilisées pour la segmentation de la SB en fonction du diamètre
axonal. [Behrens 2003].

Figure 1.15  Diérentes modélisations de la diusion. (a) modèle multi-tenseurs,


(b) modèle Ball et Stick, (c) modèle CHARMED. En rouge, les faisceaux de bres.

1.5.2.2 Les techniques sans modèle de diusion


Les techniques sans modèle de diusion sont des techniques non paramétriques
qui ne nécessitent pas d'informations spéciques sur les compartiments de diu-
sion. Ces techniques estiment la fonction de distribution des orientations des bres
(fODF), représentant la distribution de probabilité des orientations des bres pour
chaque voxel. Quelques techniques reconstruisent la fonction de distribution des
orientations de diusion (dODF), représentant la distribution de probabilité de dif-
fusion et s'approchant le plus possible de la vraie nature de la diusion.

26
1.5. Modélisation de la diusion en IRMd

Imagerie du prol de l'ADC à haute résolution angulaire


Cette technique introduite dans [Frank 2002, Alexander 2002] permet de décrire
la diusion au sein de chaque voxel en estimant l'ADC (Apparent Diusion Coe-
cient) directement à partir du signal HARDI selon l'équation 1.18 suivante :
1 S(gi , b)
ADC = D(gi ) = − log( ) (1.18)
b S0
L'ADC est révélateur du croisement de bres au sein d'un voxel. Cependant, les
maximums de l'ADC ne s'alignent pas avec les populations de bres sous-jacentes,
donc les orientations elles-mêmes ne sont pas calculées, ce qui empêche son utilisation
directe pour le suivi des bres en tractographie [Descoteaux 2008] (gure 1.16).
Le prol de l'ADC peut être modélisé par des tenseurs d'ordre supérieure (HOT),
des harmoniques sphériques (SH), et des approches similaires DTI généralisées [Frank 2002,
D. Alexander 2002, Zhan 2003, Liu 2004].

Figure 1.16  Le prol de l'ADC en présence de deux bres qui se croisent.

Imagerie Spectrale de Diusion


L'Imagerie Spectrale de Diusion (DSI) échantillonne le signal sur une grille
cartésienne de points dans l'espace q et calcule ensuite l'inverse de la transformée
de Fourier en 3D pour obtenir la PDF [Wedeen 2000, Tuch 2002, Wedeen 2005].
Cette technique est dérivée de l'Imagerie Q- space (QSI ; [Callaghan 1991]). Un
schéma d'acquisitions DSI du cerveau humain complet a été développé et utilisé dans
[Tuch 2002, Lin 2001]. Ce dernier a été amélioré pour eectuer des acquisitions sur
un seul hémisphère dans [Gigandet 2009], car le signal est supposé être symétrique.
La gure 1.17 montre un exemple de diusion spectrale obtenu par la DSI dans le
cas du croisement des bres et leurs dODF.
La limite majeure du modèle DSI est liée aux exigences techniques d'acquisition
car il est nécessaire de réaliser de nombreuses mesures, ce qui engendre un temps
important lors de l'acquisition. Une autre limite est liée aux très grandes valeurs de
b utilisées par ce modèle, comparées à celles de l'IRM conventionnelle, ce qui est

27
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion

Figure 1.17  Un schéma de reconstruction DSI. A : tissu dans un voxel avec deux
populations de bres qui se croisent. B : Grâce au schéma d'acquisition MR, le
signal est échantillonné. C : Pour reconstruire le spectre de diusion, la transformée
de Fourier 3D discrète est utilisée . D : Pour simplier la représentation d'une
tranche d'imagerie, la structure angulaire de diusion est représentée par le dODF
(un diagramme polaire de la projection radiale). Le codage des couleurs correspond à
l'orientation de la diusion (vert : diusion verticale, rouge : diusion transversale).
(Source : [Wedeen 2005]).

impraticable en clinique courante. La possibilité de limiter le temps d'acquisition en


réduisant la résolution spatiale a été proposée dans [Wedeen 2005] en utilisant des
voxels de taille 3.6 × 3.6 × 3.6 mm3 pour un temps d'acquisition de 25 minutes.

Imagerie q-Ball
L'imagerie q-ball est basée sur une estimation de l'ODF de diusion. Cette ODF
contient l'intégralité de l'information angulaire de la PDF de diusion et est dénie
comme suit : Z
G[f (w)](u) = f (w)dw (1.19)
w∈uT

Le q-Ball a été proposé initialement dans [Tuch 2002, Tuch 2004] pour reconstruire
une ODF de diusion plus lisse, directement à partir de l'acquisition HARDI d'une
seule couche de l'espace-q ou coquille, en utilisant la transformée de Funk-Radon
(FRT).
Des méthodes plus récentes [Descoteaux 2008] ont introduit une solution ana-
lytique d'harmoniques sphériques pour la reconstruction, qui s'avère plus rapide et
plus robuste. La solution analytique a développé une estimation du signal HARDI
avec les harmoniques sphériques (SH) et a résolu ensuite de façon analytique la FRT
avec les SH.
La décomposition du signal dans la base des SH, en association avec l'utilisation
du théorème de Funk-Hecke, a permis d'obtenir une estimation analytique de l'ODF
de diusion, Ψ, avec l'équation 1.20 :
R
(1.20)
X
Ψ(θi , φi ) = cj Yj (θi , φi )
j=1

28
1.6. Tractographie des bres de la substance blanche

Yj représentent les SH dénies par l'équation 1.21 :


 √
|
 2Re(Yl m |),
 if m inf 0
Yj = Y m if m = 0 (1.21)
 √2(−1)( m + 1)Im(Y m ),
 l
l if m sup 0

Avec j(l, m) = (l2 + l + 2)/2 + m


L'ODF est intuitive car ses maximas sont alignés sur les directions des popula-
tions sous-jacentes de bres. C'est une fonction plus intéressante pour la tractogra-
phie que l'ADC.

Coquilles HARDI multiples


Plusieurs techniques HARDI basées sur un échantillonnage sur plusieurs coquilles
(sphères) ont été développées récemment dans [Khachaturian 2007].
Ce modèle est une extension ad hoc de la méthode QBI pour l'échantillonnage
multi-coquilles qui combine des données DTI à faible valeur de b et une acquisition
QBI à valeur de b élevée et estimant indépendamment l'ODF sur chacune des sphères
en utilisant le domaine des ondelettes sphériques de Gabor.
Les auteurs dans [Aganj 2009] ont proposé un calcul linéaire et rapide de l'ODF
dans la base des harmoniques sphériques pour l'échantillonnage parcimonieux de
l'espace q. Ce modèle est un compromis entre l'acquisition DSI et l'acquisition à
une seule coquille.

1.6 Tractographie des bres de la substance blanche


La tractographie, outil basé sur l'IRM de diusion, permet d'analyser les connexions
cérébrales du cerveau et d'imager les faisceaux de bres de la SB qui connectent les
diérentes régions fonctionnelles du cerveau constituant la SG.
Les méthodes de tractographie se divisent en deux catégories principales, les
méthodes dites locales et celles dites globales. Les méthodes locales de tracto-
graphie sont généralement divisées en deux sous-catégories, les approches déter-
ministes et celles probabilistes, tandis que les méthodes globales se divisent en
trois sous-catégories : minimisation d'énergie globale [Mangin 2002, Kreher 2008,
Fillard 2009], à base de graphes [Collins 2010, Oguz 2012] et à base de géodésiques
[Tuch 2002, Parker 2003, Campbell 2006]. Seules les méthodes locales, déterministe
et probabiliste, seront abordées dans cette section, car ce sont les méthodes les plus
utilisées dans la littérature.

Tractographie locale : Principe général


La terminologie locale vient du fait que chaque "tracte" est calculée individuel-
lement et propagée selon une direction extraite du modèle local de chaque voxel en
fonction de son voisinage local. Le principe général de la tractographie est illustré

29
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion

à la gure 1.19 et un exemple d'une portion de la base de données de tractographie


est illustré à la gure 1.18.
Comme nous l'avons mentionné, la tractographie de type locale se divise géné-
ralement en deux catégories : déterministe basée sur l'utilisation des maximas des
représentations locales et, probabiliste basée sur une distribution de probabilités de
bres de la SB, calculée à partir des mêmes représentations locales.
Le principe de la tractographie locale consiste à propager la tracte le long d'une
direction à partir d'un point d'initialisation jusqu'à atteindre un critère d'arrêt et
ensuite refaire la même chose dans la direction opposée. C'est ainsi que chaque
tracte est formée. Ce processus de création d'une tracte est répété avec diérents
points d'initialisation jusqu'à l'obtention du nombre de tractes désiré. La gure 1.20
illustre les résultats de la tractographie déterministe et probabiliste sur le faisceau
Cortico-Spinal (CST).

Figure 1.18  Exemple d'une portion de la base de données de tractographie. Elle


est composée d'un ensemble de streamlines. Une streamline est représentée par un
ensemble de points avec les coordonnées (x,y,z).

Paramètres de tractographie
Stratégie d'initialisation Il existe deux stratégies d'initialisation pour l'estima-
tion locale de la position initiale assurant la propagation des tractes :
 Initialisation complète : Dénir les points d'initialisation aléatoirement à l'in-
térieur d'un masque complet de la SB extrait à partir d'une segmentation de
l'image anatomique T1 ou dans un masque déni par une carte d'anisotropie
fractionnelle seuillée à 0.2 (généralement).
 Initialisation par régions : Initialiser des tractes dans une région d'intérêt ou
un sous-ensemble du masque. Dans les deux cas, une ou plusieurs initialisa-
tions peuvent être faites par voxel. Si plusieurs initialisations sont faites au
sein d'un même voxel, le centre du voxel ne sera pas nécessairement choisi

30
1.6. Tractographie des bres de la substance blanche

Figure 1.19  Schéma des algorithmes de tractographie déterministe et probabiliste


avec la fODF. La tractographie suit la distribution locale des faisceaux de façon
itérative avec des pas de longeur δt. La direction de propagation doit avoir un
rayon de courbure supérieur à R (la déviation maximale est indiquée par l'angle θ,
R = δt/(2sin(θ/2))). a) l'algorithme de tractographie déterministe suit toujours le
maximum de la fODF le plus aligné avec la direction précédente. b) L'algorithme de
tractographie probabiliste choisit aléatoirement une direction dans le cône d'angle
θ, pondérée par les valeurs de la fODF. (Figures adaptées de [côté 2013]).

Figure 1.20  Comparaison de tractographie déterministe et probabiliste sur le


faisceau Cortico-Spinal (CST).

comme position initiale. Une position à l'intérieur du voxel sera choisie aléa-
toirement, puis une interpolation sera faite sur les représentations locales an
d'obtenir la représentation locale à la position initiale [Tournier 2012]. Au-
trement, des positions initiales peuvent aussi être tirées aléatoirement dans le
masque d'initialisation jusqu'à l'obtention d'un nombre déterminé de tractes
[Tournier 2012].

Masque de la matière blanche La tractographie de la matière blanche doit


être restreinte dans un domaine de génération des tractes an de s'assurer qu'ils

31
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion

représentent des faisceaux cohérents qui font partie de la matière blanche. Souvent,
un masque binaire de la matière blanche est utilisé. Ce dernier peut être généré à
partir d'un seuillage de la carte d'anisotropie fractionnelle (FA) ou d'une segmenta-
tion de l'image anatomique T1. Le choix du masque de la SB a un impact crucial
sur le résultat de la tractographie. Un masque seuillé par l'anisotropie fractionnelle
est basée sur la valeur de celle-ci qui est généralement plus grande dans la SB que
dans la matière grise ou dans le LCR. Cependant, la FA peut être inférieure au
seuil choisi dans des voxels où il y a des croisements de faisceaux de la SB, ce qui
peut engendrer des trous à l'intérieur même de la matière blanche, ce qui modi-
era considérablement les tractes qui arrêteront leur parcours à ces endroits. Pour
remédier à ce problème, les auteurs dans [Guevara 2011b] ont proposé de n'utiliser
qu'un masque de matière blanche segmentée de l'image pondérée T1, qui produit
des tractogrammes plus riches et plus précis.

Pas de propagation Le pas de propagation (δt) correspond à la distance par-


courue entre chaque étape de propagation et donc, entre chaque point de la tracte
nale. Il est généralement calculé par deux stratégies :
 Un pas de propagation xe : généralement entre 0.2mm et 1mm
[Descoteaux 2008, Tournier 2012, Centuro 1999] combiné à une méthode d'in-
terpolation des représentations locales ou des données de diusion, pour ob-
tenir la représentation locale à la position courante
[Tournier 2012, Descoteaux 2008, Arsigny 2006],
 Un pas de propagation variable : les directions de propagation sont détermi-
nées par voxel et le pas de propagation correspond à la distance nécessaire
pour traverser le voxel [Mori 1999, Jones 2008]. L'interpolation des représen-
tations locales n'est donc pas nécessaire avec cette stratégie. La gure 1.19
schématise ce paramètre.

Angle d'ouverture L'angle θ d'ouverture correspond à l'angle maximum alloué


entre la direction courante et la direction de propagation suivante. Cet angle d'ouver-
ture permettra de contraindre la direction de propagation de manière à régulariser
les tractes en évitant les virages abruptes qui contredisent l'hypothèse de régularité
des bres de la matière blanche.
Si l'algorithme de tractographie mène à une situation où l'angle entre la direc-
tion courante et la direction suivante est supérieur à θ, l'algorithme suppose une
erreur dans les données de diusion et termine le processus. Ce paramètre peut
être exprimée en fonction de minimum de rayon de courbure R = δt/(2sin(θ/2))
[Tournier 2012, Jones 1999] avec δt le pas de propagation et θ l'angle d'ouverture,
illustré à la gure 1.19.

Longueur des bres La longueur minimale (Lmin ) et maximale (Lmax ) des bres
permet de contrôler la taille des tractes générées par l'algorithme de tractographie.
Ainsi, une tracte plus longue que (Lmax ) ne peut pas représenter des faisceaux réels.

32
1.6. Tractographie des bres de la substance blanche

Si elle est plus courte que (Lmin ) du fait d'erreurs de segmentation du masque, les
faisceaux résultants seront exclus du résultat nal de tractographie.

1.6.1 La tractographie déterministe


La tractographie locale déterministe est la première catégorie de méthodes pro-
posées pour reconstruire le réseau de connectivités cérébrales.
L'algorithme déterministe consiste à créer chaque tracte individuellement en
débutant à un point d'initialisation puis, à générer de nouveaux points en suivant une
direction de propagation jusqu'à l'obtention d'un critère d'arrêt ensuite, à relancer
la procédure dans la direction opposée et enn, à créer une tracte en joignant les
deux sections.
Le choix de la direction de propagation est basé sur la direction principale du
modèle local estimé (les maxima des fODFs). Dans le cas où le modèle local présente
plus d'un maxima, celui qui forme le plus petit angle d'ouverture avec la direction
d'arrivée sera privilégié [Mori 1999, Jones 1999]. Les algorithmes les plus connus
sont les suivants :

FACT
L'algorithme Fiber Assignment by Continuous Tracking (FACT) a été proposé
par Mori et al. [Mori 1999]. Son principe consiste à initier la trajectoire des bres à
partir des voxels dénis par l'utilisateur, et à suivre la direction du vecteur propre
principal, de voxel à voxel, en 3D. Quand la trajectoire de la bre atteint le bord
du voxel, la direction de la trajectoire change pour suivre celle du vecteur propre
principal du prochaine voxel comme cela est illustré en gure 1.21(b).
An de restreindre la propagation des bres dans certaines régions du cerveau,
une autre amélioration a été introduite par les auteurs en mettant au point un
nouveau critère d'arrêt qui est le produit scalaire des vecteurs dominants voisins.

TEND
La méthode Tensor deection (TEND) proposée par Lazar et al. [Lazar 2003]
génère un bon suivi des bres même dans des régions ayant une anisotropie basse et,
tend à pénaliser les trajectoires avec des courbes prononcées. L'algorithme dénit
la trajectoire du vecteur comme le produit du tenseur de diusion avec la direction
du vecteur d'entrée ; la progression en un point est donc faite en tenant compte de
la direction dominante du point précédent (gure 1.21(c)).
Cette technique a été utilisée dans l'étude de la connectivité. Dans le but de
minimiser les erreurs de trajectoires, l'utilisation du ltrage et la régularisation
permettent d'éviter des suivis de bres non conformes à la réalité cérébrale.

33
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion

Figure 1.21  Les diérentes approches de tractographie déterministe, (a) stream-


line simple : la trajectoire (ligne noir en gras) est déviée de la bre authentique
(èches grises), (b) méthode FACT : suivi dans le champ vectoriel reconstruit, (c)
Méthode TEND [Source : [Lazar 2003]].

EuDX
L'algorithme Euler integration avec interpolation trilinéaire (EuDX) proposé par
[Garyfallidis 2012b], est un algorithme déterministe général qui fonctionne bien sur
les croisements de bres. Il est basé sur une intégration d'Euler et une interpolation
trilinéaire qui utilise la totalité des informations sur les orientations des bres au
niveau des voxels, an de prendre en compte les croisements des bres.
Chaque voxel est représenté par un ou plusieurs vecteurs des maximas estimés
avec l'ODF. La méthode EuDX lance plusieurs tractes initialisés à partir d'un seul
point-germe si leurs valeurs d'anisotropie sont supérieures à un certain seuil, donc
l'algorithme est capable de générer diérents directions à partir du même point-
germe, ce qui lui permet de remédier au problème de croisement des bres comme
l'illustre la gure 1.22.

Avantages et inconvénients des méthodes déterministes


Les algorithmes déterministes sont des méthodes simples et rapides, les algo-
rithmes basés sur les techniques de reconstruction HARDI montrent que le suivi de
bres est amélioré. Toutefois, ces algorithmes restent sensibles au bruit notamment

34
1.6. Tractographie des bres de la substance blanche

Figure 1.22  Principe de l'algorithme EuDX. Au niveau de chaque voxel, il se


trouve un seul ou plusieurs vecteurs (point noir). Détection de croisement des bres
(étoile bleu). Source : [Garyfallidis 2012a].

dans les régions de croisement des bres et héritent des limites classiques des algo-
rithmes déterministes telles que le choix de l'initialisation [Jones 2008], la sensibilité
lors de l'estimation de la direction de diusion et le manque des informations de
connectivité entre les régions du cerveau [Tuch 2002]. Pour surmonter ces limites,
des algorithmes probabilistes ont été proposés.

1.6.2 La tractographie probabiliste


La tractographie locale probabiliste suit le même principe de fonctionnement
que la tractographie déterministe, cependant la seule diérence fondamentale entre
les deux méthodes repose sur la direction de propagation (V~(pn) ).
La tractographie déterministe sélectionne le maxima du modèle local, le plus
proche de la direction précédente, alors que la tractographie probabiliste sélectionne
quant à elle une direction de propagation parmi les directions probables qui se
trouvent à un angle d'ouverture maximal de θ de la direction précédente, soit à
l'intérieur d'un cône d'incertitude.
En fait, la tractographie probabiliste propage la tracte, suivant des transitions
basées sur une fonction de distribution modélisant l'incertitude des données, jusqu'à
l'atteinte d'une contrainte d'arrêt.
Certaines méthodes estiment la variation dans la position des maximas, par
exemple avec des techniques de bootstrap, et produisent une fonction de densité de
probabilité de présence de bres ou un cône d'incertitude pour chacun des maxima.
La fODF (voir section 1.5.2) est intéressante pour ce type d'algorithme, car elle
peut être considérée comme la fonction de densité de probabilité de bres pour la
tractographie probabiliste.

35
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion

Avantages et inconvénients des méthodes probabilistes


La tractographie probabiliste génère plus de tractes erronées, mais aussi des
estimations de faisceaux plus riches et complètes [côté 2013].
D'autre part, il est intéressant d'estimer des cartes de connectivité probabilistes
entre des régions, avec une grande quantité de tractes. Les tractes erronées ont alors
moins d'importance par rapport à la densité des tractes faisant partie du faisceau
recherché.
Ces cartes de connectivité s'avèrent être des outils intéressants pour quantier
et comparer la connectivité, comme dans [Behrens 2007, Alexander 2005].

1.7 Conclusion
Dans ce chapitre nous avons détaillé l'anatomie cérébrale tout en introduisant
la nomenclature des faisceaux de la SB. Nous avons ensuite abordé les bases de
l'IRM de diusion, qui mesure le déplacement moyen des molécules d'eau le long
de plusieurs directions et, sur la base de ces mesures, expliquer que les modèles de
diusion reconstruisent une estimation plus ou moins directe des orientations des
bres sous-jacentes. Les méthodes de tractographie utilisent l'orientation estimée des
bres pour tracer des trajectoires 3D représentant les voies de la SB. Les faisceaux
de bres résultants dépendent fortement de la qualité des données de diusion ainsi
que du modèle de diusion.
Les bases de données de tractographie sont utilisées pour étudier la connectivité
du cerveau, et en particulier, pour identier les faisceaux de bres de la SB exploités
dans la recherche et les études cliniques.
Dans le chapitre suivant nous aborderons ainsi l'état de l'art des méthodes de
clustering classiques, en nous focalisant sur les nouvelles approches distribuées basées
sur les systèmes multi-agents.

36
Chapitre 2

Approches de clustering et
systèmes multi-agents

 C'est la théorie qui décide de ce que nous pouvons observer.


Pierre Thuillier, Darwin and Co, Éditions Complexe, Bruxelles,
Belgique, 1981.

Sommaire
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.2 Approches de clustering . . . . . . . . . . . . . . . . . . . . . 38
2.2.1 Dénition du clustering . . . . . . . . . . . . . . . . . . . . . 38
2.2.2 Les catégories de clustering . . . . . . . . . . . . . . . . . . . 39
2.3 Clustering distribué à base de multi-agents . . . . . . . . . . 45
2.3.1 Les agents informatiques . . . . . . . . . . . . . . . . . . . . . 45
2.3.2 Algorithmes d'intelligence en essaim . . . . . . . . . . . . . . 48
2.3.3 La méthode des colonies de fourmis . . . . . . . . . . . . . . 49
2.4 Evaluation du résultat de clustering . . . . . . . . . . . . . . 50
2.4.1 Indice de Rand . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.4.2 Indice Silhouette . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.4.3 Indice d'homogénéité . . . . . . . . . . . . . . . . . . . . . . . 52
2.4.4 Indice d'exhaustivité . . . . . . . . . . . . . . . . . . . . . . . 52
2.4.5 Indice de kappa . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Chapitre 2. Approches de clustering et systèmes multi-agents

2.1 Introduction
Le clustering consiste à partitionner un ensemble d'éléments en plusieurs groupes,
de manière à ce que les éléments d'un même groupe soient le plus proches possibles,
par rapport aux éléments des autres groupes, au vue d'une mesure de similarité don-
née. Autrement dit, les éléments d'un sous-ensemble partagent le plus grand nombre
de caractéristiques communes. Il existe trois raisons principales pour eectuer un
clustering. La première est de dévoiler la structure cachée des données permettant
ainsi d'émettre des hypothèses, de détecter des anomalies ou d'identier les carac-
téristiques importantes. La deuxième vise à identier le degré de corrélation entre
certaines données. La dernière est la compression, c'est-à-dire réduire la dimension
des données. L'embûche principale réside dans le fait que la dénition d'un groupe
est souvent oue et dépend de l'application.
Il existe un grand nombre d'algorithmes variés de clustering dans la littérature.
Dans ce chapitre, nous dénissons d'abord de manière formelle ce qu'est le cluste-
ring, puis nous classions les méthodes de clustering en plusieurs catégories, dont
on peut citer : le clustering hiérarchique, le clustering basé sur la densité, le clus-
tering basé sur les graphes, le clustering spectral, le clustering hybride et enn le
clustering distribué à base de multi-agents. Nous présentons ensuite, les avantages
et les inconvénients de chacune des méthodes de clustering.
Nous portons une attention particulière à la dernière catégorie de clustering, en
commençant par présenter les systèmes multi-agents puis, nous détaillons diérents
algorithmes de clustering bio-inspiré utilisant les systèmes multi-agents.
Dans ce chapitre, nous abordons également les métriques d'évaluation du clus-
tering, utilisées pour valider les résultats obtenus avec les méthodes proposées dans
cette thèse.

2.2 Approches de clustering


2.2.1 Dénition du clustering
Le clustering ou regroupement, ou encore partitionnement, est une tâche dont
l'objectif est de trouver des groupes ou classes au sein d'un ensemble d'éléments
décrits par leurs caractéristiques propres, ou attributs, représentant leurs proprié-
tés. Les groupes recherchés, appelés communément clusters, forment des ensembles
homogènes d'éléments du jeu de données, partageant ainsi, des caractéristiques com-
munes.
Pour réaliser cette opération de regroupement, on fait appel fréquemment, à la
notion de similarité entre les éléments dans les données. En eet, cette notion de
similarité prend tout son sens en clustering, car il s'agit d'évaluer à quel point deux
éléments sont similaires (ou dissimilaires) avant de les regrouper ou de les séparer.
Le choix de la mesure de similarité, permettant de comparer les éléments entre eux,
va induire la façon de les regrouper. Selon la mesure de similarité dénie, la com-
paraison des éléments entre eux, et de fait leur regroupement ou non, produira des

38
2.2. Approches de clustering

regroupements diérents. Cette notion de similarité est une première étape pour
dénir un algorithme permettant de regrouper les éléments, mais elle n'est pas suf-
sante. En eet, il est nécessaire de décrire la stratégie utilisant cette similarité et
permettant la construction explicite des clusters. Plusieurs stratégies peuvent être
mises en place en utilisant une même mesure de similarité.
Il existe de très nombreuses méthodes de clustering permettant de créer, de
manière automatique, ces clusters, chacune utilisant une stratégie et un objectif
propre, pour construire les clusters.

2.2.2 Les catégories de clustering


Nous donnons les principaux algorithmes de clustering, classés dans les catégories
suivantes :

2.2.2.1 Le clustering spectral


Partant d'une matrice de similarité entre les objets, le fondement du clustering
spectral consiste à projeter les objets dans un sous-espace de variance maximum puis,
d'utiliser une méthode de partitionnement dans un tel sous-espace, pour identier
les clusters [Ng 2002].
La première étape de la méthode consiste donc à calculer les valeurs propres de
la matrice de similarité, ainsi que les vecteurs propres associés. Les objets sont alors
projetés dans l'espace formé par une partie de ces vecteurs propres associés.
Diérentes techniques peuvent ensuite être utilisées, pour partitionner l'ensemble
des objets projetés. On peut utiliser soit un algorithme de type K-means dans un
nouvel espace soit, utiliser un algorithme de partition de graphe pour trouver la
zone de coupure maximisant la séparation entre les objets.
Cette technique de partitionnement est alors utilisée pour diviser la base des
objets en deux, puis elle est réitérée sur chaque sous-groupe cible, jusqu'à ce que
le nombre de clusters recherchés par l'utilisateur soit atteint. Autrement dit, une
telle méthode nécessite souvent le nombre de clusters recherchés, mais plusieurs
techniques ont été suggérées pour dénir automatiquement ce paramètre.
L'intérêt d'utiliser de telles transformations des données, est de se placer à chaque
étape de la méthode dans un sous-espace dans lequel les diérences entre clusters
sont plus importantes que dans l'espace initial. Utiliser une telle technique avec
l'algorithme des K-means [Hartigan 1979] permet par exemple, de cibler des clusters
d'orientation quelconque, alors que l'algorithme des K-means seul, n'est pas capable
de cibler de tels clusters.
Ce type de méthodes ayant émergé relativement récemment, de nombreuses va-
riantes ont été proposées. Puisqu'elles sont capables de transformer l'espace de des-
cription des objets, elles sont potentiellement capables d'identier des clusters de
forme quelconque. Par contre, partant d'une matrice de similarité entre toutes les
paires d'objets puis, utilisant des méthodes basées sur des calculs matriciels, leur
complexité s'avère élevée.

39
Chapitre 2. Approches de clustering et systèmes multi-agents

Le clustering K-means
L'algorithme k-moyennes ou k-means [Hartigan 1979] construit k classes à partir
d'un ensemble de n individus, tout en minimisant la quantité :
k X
(2.1)
X
(xi − gr )2
r=1 xi ∈Cr

où, Cr est la classe numéro r, xi est un individu dans une classe et gr est le centre
de la classe Cr .
Le principe de la méthode de clusteing K-means est le suivant :
1. Choisir aléatoirement K objets de la base qui formeront l'ensemble des cen-
troïdes initiaux représentant les k clusters recherchés ;
2. Assigner chaque objet au cluster dont le centroïde est le plus proche ;
3. Puis tant qu'au moins un objet change de cluster d'une itération à l'autre :
 Mettre à jour les centroïdes des clusters en fonction des objets qui leur
sont associés.
 Mettre à jour les assignations des objets aux clusters en fonction de leur
proximité aux nouveaux centroïdes.
Le clustering K-médoïdes
En statistiques, un médoïde est le représentant le plus central d'une classe. Dans
les méthodes k-médoïdes une classe est représentée par l'un de ses points. Ces al-
gorithmes sont ecaces puisqu'ils traitent n'importe quel type d'attributs et que
les médoïdes ont une résistance intégrée contre les données atypiques, les points
périphériques des clusters n'étant pas pris en compte. Quand les médoïdes sont sé-
lectionnés, les classes sont dénies comme des sous-ensembles de points proches des
médoïdes respectifs, et la fonction objective est dénie comme la distance moyenne
ou une autre mesure de dissimilarité entre un point et son médoïde.

2.2.2.2 Le Clustering hiérarchique


Diérents algorithmes de clustering hiérarchique ont été proposées dans la litté-
rature [Guha 1998, Guha 2000, Ramakrishnan 1996]. Ces algorithmes ne produisent
pas une seule partition, mais une hiérarchie de partitions emboîtées. Un cluster est
déni ici comme un noeud d'arbre, auquel est associé l'ensemble des éléments qui le
composent, ainsi que leurs caractéristiques.
Il existe deux grandes catégories d'algorithmes hiérarchiques : les méthodes as-
cendantes et les méthodes descendantes. Dans les méthodes ascendantes ou agglo-
mératives, la partition initiale contient autant de clusters que d'éléments (c = n).
A chaque étape, on cherche un couple (Ca , Cb ) de clusters candidats à la fusion
qui maximise (resp. minimise) une certaine mesure de similarité (resp. de dissimi-
larité). On réitère ce processus jusqu'à n'obtenir qu'un cluster contenant tous les
éléments. An de déterminer le nombre de clusters, on coupe la hiérarchie à un
certain niveau de détail. Concernant ce choix, Beneld et Raftery ont proposé une

40
2.2. Approches de clustering

heuristique appelée "AWE" (Approximate Weight of Evidence) dans un cadre bayé-


sien [Baneld 1993]. La gure 2.1 illustre cette hiérarchie de partitions, sous forme
de dendrogramme.
Trois mesures de similarité se distinguent en clustering hiérarchique. Pour les
algorithmes qui se basent sur le critère de lien minimum (Single-link), la similarité
entre deux clusters est le minimum des distances entre toutes les paires de données.
Pour ceux qui se basent sur le critère de lien complet "complete-link", la similarité
est dénie par le maximum de ces distances. Enn, pour les algorithmes qui se basent
sur le critère de la distance moyenne (Average-link), la similarité est dénie par la
moyenne de ces distances. L'utilisation du critère de lien complet engendrera des
clusters plus compacts, alors que l'utilisation du critère de lien minimum (Single-
link) engendrera des clusters plus allongés.
L'un des avantages des techniques de clustering hiérarchique est de fournir, via
le dendrogramme, une interprétation naturelle du comportement de l'algorithme. A
l'opposé, on est généralement confronté à une grande complexité en temps et surtout
en espace. En eet, la création de la partition initiale avec un élément par cluster,
nécessite de calculer et de stocker les distances entre tous les couples de points. Cette
complexité quadratique peut s'avérer critique pour les jeux de données de grande
taille. Divers travaux ont été menés pour réduire la taille de la partition initiale
[Posse 2001]. Un autre problème se pose avec ces méthodes. Elles sourent de l'eet
de chaîne : des clusters proches mais distincts peuvent être concaténés s'il existe une
chaîne de points qui les relie.

(a) Ensemble d'éléments à classer (b) Dendrogramme de la partition

Figure 2.1  Principe du clustering hiérarchique en illustrant une hiérarchie de


partitions, sous forme de dendrogramme

2.2.2.3 Le clustering basé sur la densité


Une autre vision possible des clusters est de considérer des régions homogènes
de haute densité, entourées par des régions de faible densité. Une autre famille de
méthodes, basée sur cette vision des clusters, est ainsi apparue. Elle est fondée
sur la formation des clusters de manière gloutonne, à partir d'un certain critère de
densité. Les méthodes de référence dans ce cadre, sont la méthode non paramétrique

41
Chapitre 2. Approches de clustering et systèmes multi-agents

DENCLUE basée sur l'estimation d'un noyau de densité et la méthode DBSCAN


(Density Based Spatial Clustering of Applications with Noise) basée sur la notion
de densité de clusters qui permet de découvrir des clusters de forme arbitraire ainsi
que le bruit [Keim 1999, Ester 1996]. Pour cela, deux paramètres qui contrôlent la
densité sont utilisés :
 ε : rayon de voisinage (distance max) de l'élément ;
 M inP oints : seuil de densité (nombre min d'éléments qui doivent être conte-
nus dans ce voisinage pour considérer la zone comme dense).
La gure 2.2 illustre un exemple de clustering basé sur la densité, dont le principe
général est décrit comme suit :
 Sélectionner l'un des éléments x̄i de la base qui n'est encore assigné à aucun
cluster.
 Si son voisinage respecte le critère de densité, c'est-à-dire si au moins M inP oints
éléments sont présents dans l'hypersphère de centre x̄i et de rayon ε, alors
les éléments correspondants sont intégrés au cluster courant et cette même
phase est réitérée pour ces éléments.
Un avantage important de cette méthode est qu'elle permet de considérer des
clusters de formes très variées ainsi que des clusters concentriques (c'est-à-dire conte-
nus les uns dans les autres). Elle est également naturellement capable de faire face
au bruit qui peut exister dans les données. En revanche, sa complexité est quadra-
tique en fonction du nombre d'éléments de la base. De plus, elle soure du problème
d'eet de chaîne.
Cette méthode est par ailleurs sensible aux valeurs xées pour les deux para-
mètres ε et M inP oints. Or, il est souvent très dicile à un utilisateur de spécier
les valeurs les plus appropriées pour ces paramètres. De plus, ces paramètres étant
xés de manière globale, ils ne permettent pas de cibler des clusters dont les densités
sont très diérentes.

2.2.2.4 Le clustering basé sur les grilles


Une autre approche possible pour eectuer le clustering d'un ensemble d'élé-
ments est d'utiliser une grille pour partitionner l'espace, en de nombreuses cellules,
puis d'identier les ensembles de cellules denses connectées, pour former les clusters
[Wang 1997]. Dans ce cas, l'utilisateur doit spécier la taille de la grille à utiliser et la
densité minimum, déterminant si une cellule de la grille est considérée comme dense
ou pas. Dans un premier temps, l'espace de description des éléments est découpé
en intervalles réguliers sur chaque dimension. Puis, la densité de chaque cellule est
évaluée et, les cellules satisfaisant le critère de densité minimum sont détectées. Les
composantes connexes, c'est-à-dire les ensembles de cellules denses connectées, sont
ensuite identiées. Enn, un test d'uniformité de ces composants connexes est mené.
Les composantes connexes uniformes forment alors les clusters, et pour les autres,
la cellule la moins dense est supprimée, et le test est renouvelé sur chacune des deux
sous-composantes obtenues jusqu'à ce que toutes les composantes soient considérées
comme uniformes.

42
2.2. Approches de clustering

Figure 2.2  Exemple de clustering basé sur la densité.


La gure 2.3 présente cette méthode à partir d'un exemple. On peut ainsi ob-
server qu'elle admet que certains éléments soient isolés. C'est le cas de l'élément
caractérisé par une longueur de 176 et un prix de 10600. Dans ce cas, c'est la consé-
quence du choix de la taille de grille utilisée, mais dans d'autres cas, cela permet
d'isoler le bruit qui peut exister dans les données. Pour ces méthodes, la probléma-
tique réside dans le choix du critère de densité et de la taille de la grille utilisée :
 Des cellules de trop petite taille amènent à une estimation bruitée de la
densité : c'est le problème du sur-partitionnement.
 A l'inverse, des cellules de trop grande taille amènent à de trop faibles den-
sités : c'est le problème du sous-partitionnement.
Par ailleurs, ces techniques ont les mêmes forces et faiblesses que les méthodes
basées sur la densité : elles sourent de l'eet de chaîne et prennent dicilement en
compte le fait que des clusters de densités diérentes puissent exister. Cependant,
elles sont capables d'identier des clusters de formes très variées ou concentriques
et de gérer le bruit qui peut exister dans les données.

2.2.2.5 Le clustering basé sur les graphes


La méthode de clustering basée sur les graphes, illustrée par la gure 2.4, consiste
à considérer les clusters comme des ensembles de n÷uds connectés dans un graphe.
On construit dans un premier temps, le graphe complet des éléments, dans lequel
un n÷ud correspond à un élément et un arc à la distance entre les deux éléments
considérés. On en déduit ensuite le graphe connexe MST (Minimal Spanning Tree) :
graphe connexe dont la somme des valeurs des arcs, correspondant aux distances
dans notre cas, est minimale. Puis, selon le paramètre utilisé pour la formation des

43
Chapitre 2. Approches de clustering et systèmes multi-agents

(a) Division de l'espace à base d'une grille (b) Le clustering associé

Figure 2.3  Clustering basé sur les grilles.

clusters, il peut s'agir soit de supprimer les arcs les plus longs, soit de conserver les
arcs dont la valeur est inférieure à un seuil spécié.
La limite principale de ce type de clustering est la complexité de la méthode
utilisée pour former le graphe MST initial : en utilisant une méthode classique
de construction de MST, la complexité est en O(N 2 logN ). Diérentes techniques
utilisées pour réduire cette complexité peuvent être trouvées dans [Keim 1999], mais
celle-ci sera de toute façon au moins quadratique, dans le meilleur des cas.

Figure 2.4  Clustering basé sur les graphes.

44
2.3. Clustering distribué à base de multi-agents

2.2.2.6 Le clustering hybride


Le développement de certaines méthodes hybrides entre les versions hiérarchiques
et les versions par partition du clustering a été motivé par l'exploitation des avan-
tages de ces deux techniques qui semblent complémentaires : le clustering hiérar-
chique est plus souple que le clustering par partition, alors que ce dernier a une
complexité en temps et en espace qui est inférieure. Ainsi, une combinaison des
méthodes proposée dans [Steinbach 1999] consiste par exemple à :
 Former un cluster unique regroupant tous les éléments ;
 Réitérer jusqu'à ce que le nombre désiré de clusters soit atteint :
 Choisir un cluster à diviser selon un certain critère, favorisant éventuel-
lement ceux qui contiennent le plus d'éléments ;
 Trouver deux sous-clusters en utilisant l'algorithme K-means. Une autre
combinaison de méthode a été proposée dans [Wang 1997]. Dans ce cas, la
méthode hiérarchique est combinée à une méthode basée sur les grilles. En
haut de la hiérarchie, une cellule unique représente l'ensemble de l'espace
et, plus on descend dans la hiérarchie, plus la résolution de la division de
l'espace par les grille est ne.
Le principe suivi consiste à créer un ensemble initial important de petits clusters,
en utilisant une méthode par partition du graphe des plus proches voisins, puis à
les fusionner en utilisant un algorithme hiérarchique ascendant. Les caractéristiques
des méthodes mises en ÷uvre dans ce cadre, dépendent donc des méthodes utilisées
lors de la combinaison.

2.3 Clustering distribué à base de multi-agents


Les approches traditionnelles de clustering citées ci-dessus, ne sont pas susam-
ment souples pour traiter les données complexes de grande taille dans le contexte de
clustering des bres neuronales. Ainsi, au cours des dernières années, de nouveaux
algorithmes de clustering inspirés des modèles biologiques tels que les colonies de
fourmis, les volées d'oiseaux, et les essaims d'abeilles, ont été proposés pour résoudre
certains problèmes très complexes en eectuant des tâches simples au niveau indivi-
duel. Ces algorithmes se caractérisent par l'interaction d'un grand nombre d'agents
informatiques qui suivent les mêmes règles et, présentent un comportement complexe
émergent.
Dans le paragraphe ci-dessous, nous commençons par décrire les agents infor-
matiques, puis nous détaillons les algorithmes bio-inspirés comme la méthode des
essaims particulaires, la méthode des colonies de fourmis.

2.3.1 Les agents informatiques


Le premier à introduire l'agent en informatique semble être Allen Newell dans
les années 80 [Newell 1982], chercheur en intelligence articielle et en psychologie
cognitive. Cette première dénition de l'agent intelligent a fait orès depuis lors,

45
Chapitre 2. Approches de clustering et systèmes multi-agents

en initiant tout un champ de recherche informatique. Nous résumons dans cette


section les grandes lignes de ce qu'on entend par agent en informatique, concept au
conuent de la robotique et de l'intelligence articielle. Une dénition synthétique et
générique de l'agent informatique est donnée par Jacques Ferber dans son ouvrage
sur les systèmes multi-agents [Ferber 1995] :

Dénition 1 On appelle agent une entité physique ou virtuelle :


 qui est capable d'agir dans un environnement,
 qui peut communiquer directement avec d'autres agents,
 qui est mû par un ensemble de tendances (sous la forme d'objectifs indivi-
duels ou d'une fonction de satisfaction, voire de survie, qu'elle cherche à
optimiser),
 qui possède des ressources propres,
 qui est capable de percevoir (mais de manière limitée) son environnement,
 qui ne dispose que d'une représentation partielle de cet environnement (et
éventuellement aucune),
 qui possède des compétences et ore des services,
 qui peut éventuellement se reproduire,
 dont le comportement tend à satisfaire ses objectifs, en tenant compte des res-
sources et des compétences dont elle dispose, et en fonction de sa perception,
de ses représentations et des communications qu'elle reçoit.
Aussi, M. Wooldridge [Wooldridge 1995] propose une dénition qui limite les
agents aux systèmes informatiques :
Dénition 2 Un agent est un système informatique qui est situé dans un environ-
nement et qui est capable d'appliquer des actions autonomes dans le but de satisfaire
ses buts.
Toutes ces dénitions se basent sur des notions semblables que sont : un agent
est autonome, plongé dans un environnement et qui a des objectifs à atteindre.
L'informatique distingue cependant deux grandes classes d'agents, les agents
réactifs et les agents cognitifs.

Dénition 3 Agents réactifs. Les agents dits réactifs sont caractérisés par :
 un mode de fonctionnement réactif basique de type stimulus-réponse,
 une absence de représentation interne de l'environnement,
 un mode d'interaction simple avec les autres agents et l'environnement,
 une organisation de groupe et une dynamique collective en modalité multi-
agent qui en font un paradigme idéal pour l'étude des systèmes complexes.
Dénition 4 Un agent cognitif possède :
 une représentation élaborée de son environnement,
 des capacités de raisonnement sur les données dont il dispose,
 d'un but explicite à atteindre,
46
2.3. Clustering distribué à base de multi-agents

 d'une capacité à mémoriser ses actions passées, de planier ses actions fu-
tures,
 des capacités de communication en utilisant un langage approprié.
On qualie de rationnel un agent qui agit en fonction d'un objectif à atteindre.

Conception à base d'agent


Wooldridge et Jennings distinguent dans [Wooldridge 1995] :
 la théorie agent qui s'attache à la conceptualisation du domaine agent et aux
formalismes mathématiques qui soutiennent les approches agents,
 l'architecture des agents qui regroupe les problématiques autour de la concep-
tion logicielle et matérielle des agents,
 les langages agents destinés à normaliser la communication entre agents.
Ces deux auteurs distinguent également la notion d'agent au sens faible et au sens
fort. L'agent au sens faible reprend les caractéristiques mentionnées précédemment.
L'agent au sens fort tend à rapprocher l'agent de plus en plus du fonctionnement
humain. Ainsi on parlera de connaissance, de croyance, d'intention, d'obligation,
d'émotions pour un agent alors que ce sont des notions habituellement attribuées à
l'état mental de l'humain.
Enn, l'étude des phénomènes d'organisation collective et d'intelligence distri-
buée ont nécessité le recours à l'aspect collectif des agents : les systèmes multi-
agents. Ferber donne une dénition des systèmes multi-agents dans [Ferber 1995] et
une spécication générique :

Dénition 5 On appelle système multi-agent (ou SMA), un système composé des


éléments suivants :
 Un environnement E, c'est-à-dire un espace disposant généralement d'une
métrique.
 Un ensemble d'objets O situés dans l'environnement (repérés par une position
dans E). Ce sont des objets passifs c'est-à-dire qu'ils peuvent être perçus,
créés, détruits et modiés par les agents.
 Un ensemble A d'agents, qui sont des objets particuliers représentant les en-
tités actives du système.
 Un ensemble de relations R qui unissent les objets (et donc des agents) entre
eux.
 Un ensemble d'opérations Op permettant aux agents dans l'ensemble A de
percevoir, produire, consommer, transformer et manipuler des objets de O.
 Des opérateurs chargés de représenter l'application de ces opérations et la
réaction du monde à cette tentative de modication, que l'on appellera les
lois de l'univers.
Dans les méthodes multi-agents, les agents en question n'ont qu'une vision lo-
cale du problème à traiter et interagissent entre eux, ou avec leur environnement
pour proposer une solution. Nous parlons alors d'intelligence collective en essaim

47
Chapitre 2. Approches de clustering et systèmes multi-agents

car la solution du problème émerge du travail collectif des agents. Une des sources
d'inspiration d'algorithmes montrant une intelligence en essaim est le déplacement
des animaux en groupe où aucun individu ne contrôle les autres. Néanmoins, des
formes et des comportements complexes peuvent apparaître lors de ces déplacements
comme dans les algorithmes d'optimisation par essaim particulaire [Kennedy 1995]
et les algorithmes de colonies de fourmis [Dorigo 1996], qui utilisent un ensemble de
particules caractérisées par leur position et leur vitesse pour maximiser une fonc-
tion dans un espace de recherche. Des interactions ont lieu entre les particules an
d'obtenir des comportements globaux ecaces. Ce principe a été appliqué en 1998
dans [Proctor 1998] pour la première fois, au problème du clustering automatique où
chaque agent représente une donnée se déplaçant vers les données qui lui sont le plus
similaires, permettant ainsi de créer des groupes de données similaires assimilables
aux classes de la partition.

2.3.2 Algorithmes d'intelligence en essaim


2.3.2.1 La méthode des essaims particulaires
L'optimisation par essaim particulaire (OEP) (Particle Swarm Optimization -
PSO) est une métaheuristique d'optimisation proposée pour la première fois par J.
Kennedy et R. Eberhart en 1995 [Kennedy 1995] en s'inspirant des modélisations
statistiques développées par [Reynolds 1987], qui permettent de simuler le déplace-
ment de volées d'oiseaux et de bancs de poissons. Dans l'algorithme par essaim par-
ticulaire, la recherche s'eectue par une population d'individus appelés particules.
Chaque particule survolant l'espace de recherche en quête de l'optimum global est
considérée comme solution potentielle du problème. An de dénir sa direction de
vol, une particule se base sur deux types d'informations : une information tirée de sa
propre expérience et une information tirée de l'expérience de l'essaim. Le mouvement
des particules est régi par les équations 2.2 et 2.3 :

V (k+1) = w.V (k) + c1 .rand1 (P best(k) − X (k) ) + c2 .rand2 .(Gbest(k) − X (k) ) (2.2)

X (k+1) = X (k) + V (k+1) (2.3)


où : X : est la position des particules, V : est la vitesse des particules, w : est
le paramètre d'inertie, P best : est la meilleure position personnelle, Gbest : est la
meilleure solution de l'essaim, rand1 et rand2 : sont des variables aléatoires entre 0
et 1, c1 et c2 : sont des constantes positives, et k : est la variable d'itération.
Les trois termes de l'équation de vitesse peuvent être traduits comme suit :
 w.V (k) : représente une composante physique d'inertie, qui incite chaque
particule à suivre sa direction courante de déplacement,
 c1 .rand1 .(P best(k) − X (k) ) : représente une composante cognitive, qui incite
la particule à revenir vers le meilleur site qu'elle a déjà visité,

48
2.3. Clustering distribué à base de multi-agents

 c2 .rand2 .(Gbest(k) − X (k) ) : représente une composante sociale, qui incite la


particule à se diriger vers le meilleur site trouvé par ses congénères.
La gure 2.5 illustre un exemple de direction de vol d'une particule dans un
espace de recherche.

Figure 2.5  Algorithme OEP ou PSO : La stratégie de déplacement d'une particule


dans l'espace de recherche.

2.3.3 La méthode des colonies de fourmis


Les algorithmes de colonies de fourmis sont une famille de métaheuristiques d'op-
timisation inspirées du comportement collectif de fourmis réelles dans leur procédé
de dépôt et de suivi de pistes. Ces algorithmes ont été initiés par Dorigo et al. dans
[Dorigo 1996], qui ont modélisé le comportement aléatoire des fourmis.
Le premier algorithme d'optimisation, basé sur les colonies de fourmis, intitulé
"Ant System" (AS), a été proposé pour résoudre le problème du voyageur de com-
merce [Dorigo 1996]. Depuis, plusieurs améliorations et variantes ont vu le jour et
ont été appliquées dans plusieurs domaines, avec plus ou moins de succès. Il a été
remarqué que les fourmis réelles sont capables d'emprunter le chemin le plus court
entre leur nid et une source de nourriture grâce à un comportement collaboratif
collectif, sachant qu'aucun individu n'a une vision globale du parcours. Le compor-
tement des fourmis est basé sur les principes suivants :
 L'auto-organisation : les fourmis sont capables, en eectuant individuellement
des tâches simples, de résoudre des problèmes complexes. Le comportement
simple et local de chaque individu fait émerger un modèle (pattern) de niveau
global, grâce aux interactions.
 La stigmergie : qui est la technique de communication entre les individus
(fourmis) en modiant, d'une manière dynamique, l'environnement où elles
évoluent. En eet, en se déplaçant, les fourmis déposent de la phéromone pour
marquer le chemin parcouru. En absence de cette substance, les fourmis se

49
Chapitre 2. Approches de clustering et systèmes multi-agents

déplacent aléatoirement dans l'environnement. Par contre, en sa présence,


une fourmi la détecte et peut suivre sa trace avec une probabilité propor-
tionnelle à son intensité. Ainsi, plus une piste est parcourue, plus elle est
attractive.
 Un contrôle décentralisé : cela signie qu'il n'y a pas de décision prise à un
niveau donné ou par un seul individu. En eet, chaque individu eectue des
actions relativement simples en se basant uniquement sur des informations
locales de l'environnement, sans vision du problème dans sa globalité.
 Une hétérarchie dense : par opposition à une structure hiérarchique, où la
population est dirigée par un individu, l'hétérarchie dense est une structure
horizontale, où les individus sont fortement connectés, agissant ainsi sur les
propriétés globales du système.
On peut considérer les algorithmes de colonies de fourmis comme des algorithmes
multi-agents probabilistes, utilisant une distribution de probabilité implicite pour
eectuer la transition entre chaque itération. Dans leurs versions adaptées à des
problèmes combinatoires, ils utilisent une construction itérative des solutions.
Ces algorithmes ont été appliqués par Deneubourg et al. [Deneubourg 1991] dans
le domaine du tri automatique d'objets en utilisant des fourmis articielles. Par la
suite le pas qui sépare le tri d'objets du clustering a été franchi dans la méthode
proposée par Monmarché et al. [Monmarché 2000]. Il existe plusieurs algorithmes de
clustering automatique basée sur des fourmis articielles. Un modèle à base de four-
mis pour la classication, utilisant le système d'identication chimique des fourmis
a été proposé dans [Chu 2004].

2.4 Evaluation du résultat de clustering


De par sa dénition, un clustering est dicile à évaluer. Lorsqu'on applique
un clustering sur un jeu de données, on cherche à découvrir la structure qui les
caractérise. Mais sans a priori sur les données, comment évaluer la qualité du résultat
obtenu ? Bien sûr, l'utilisateur peut juger satisfaisant ou non le résultat, mais rien
ne lui indique si le résultat est pertinent ou pas. Plusieurs solutions permettent
néanmoins d'évaluer la qualité de l'algorithme.

2.4.1 Indice de Rand


L'indice de Rand, noté RI, est une mesure utilisée pour évaluer un clustering
[Rand 1971]. On considère deux partitions de données, en clusters : C l'ensemble
des k clusters engendrés et Ĉ l'ensemble des k̂ clusters trouvés par l'algorithme. On
cherche à grouper deux observations dans un même cluster si elle proviennent d'un
même cluster articiel. On mesure donc le taux de bonne assignation de ces paires
d'observations. Pour chaque couple d'observations, on peut compter quatre types
d'assignations possibles :
 Les vrais positifs (VP) : les deux observations sont dans le même cluster dans
C et Ĉ ,

50
2.4. Evaluation du résultat de clustering

 Les vrais négatifs (VN) : les deux observations sont dans des clusters diérents
dans C et Ĉ ,
 Les faux positifs (FP) : l'algorithme a classé les observations dans le même
cluster dans Ĉ alors qu'elles ne le sont pas dans C ,
 Les faux négatifs (FN) : l'algorithme a classé les observations dans des clusters
diérents de Ĉ alors qu'elles sont dans le même C .

Dénition 6 L'indice de Rand est déni comme le pourcentage de bonnes assigna-


tions donné par l'équation 2.4.
|V P | + |V N |
RI = (2.4)
|V P | + |V N | + |F P | + |F N |
Le nombre total d'assignations est donné par l'équation 2.5.
1
|V P | + |V N | + |F P | + |F N | vaut × m × (m − 1) (2.5)
2
où m est le nombre d'observations.
L'indice de Rand est compris entre 0 et 1. Deux clustering exactement identiques
donnent une valeur de 1 à la mesure. Le problème de l'indice de Rand est que pour
deux partitions aléatoires, on peut avoir des valeurs diérentes et non nulles. Une
version ajustée ARI de cette mesure est donc plus souvent utilisée : l'indice de Rand
Ajusté [Hubert 1985]. On compare la valeur de l'indice de Rand avec sa valeur
attendue en cas d'indépendance de la classe engendrée et de la classe retrouvée.
L'indice de Rand peut être ajusté de la manière suivante (équation 2.6) :
RI − ERI
ARI = (2.6)
max(RI) − ERI

où ERI est la valeur de l'indice de Rand avec sa valeur attendue en cas d'indé-
pendance de la classe engendrée et de la classe retrouvée.

2.4.2 Indice Silhouette


L'indice silhouette [Rousseeuw 1985] est diérent, des indices de qualité traités
ci-dessus. Il travaille à l'échelle microscopique, c'est à dire qu'il s'intéresse aux items
à classer en particulier et non pas aux classes d'items. Le but de Silhouette est de
vérier si chaque item a été bien classé. Pour cela, et pour chaque item i de la
partition, on calcule la valeur suivante selon l'équation 2.7 :
b(i) − a(i)
− 1 ≤ s(i) = ≤1 (2.7)
max(a(i), b(i))

a(i) représente la distance moyenne qui sépare l'item i des autres items de la
classe à laquelle il appartient.
b(i) représente la distance moyenne qui sépare l'item i des items qui appar-
tiennent à la classe la plus proche.

51
Chapitre 2. Approches de clustering et systèmes multi-agents

Quand S(i) est proche de 1, l'item est bien classé : la distance qui le sépare
de la classe la plus proche est très supérieure à celle qui le sépare de sa classe. En
revanche, si S(i) est proche de -1, cela veut dire que l'item est mal classé. Mais si
S(i) est proche de 0, alors il pourrait également être classé dans la classe la plus
proche. L'indice Silhouette d'un cluster est calculé à partir de la moyenne entre les
indices de ses éléments.

2.4.3 Indice d'homogénéité


An de satisfaire des critères d'homogénéité [Lebart 1982], un clustering doit
aecter uniquement les points de données qui sont membres d'une seule classe, à un
cluster unique. La répartition de la classe au sein de chaque cluster doit donc être
incluse dans une seule classe, ce qui correspond à une entropie nulle. On détermine
la proximité d'un clustering donné avec cet idéal en examinant l'entropie condition-
nelle de la distribution de la classe, compte tenu du clustering proposé. Dans le cas
parfaitement homogène, cette valeur, H(C|K), est nulle.
Cependant, dans une situation imparfaite, au lieu de prendre l'entropie condi-
tionnelle brute, on normalise cette valeur par la réduction maximale de l'entropie
que les informations de regroupement pourraient fournir, en particulier H(C). On
note que H(C|K) est maximal (et équivaut à H(C)) lorsque le cluster ne fournit pas
de nouvelles informations : la distribution de classe dans chaque cluster est égale à
la répartition globale de la classe. H(C|K) est nulle lorsque chaque cluster contient
uniquement des membres d'une classe unique, un clustering parfaitement homogène.
Dans le cas dégénéré où H(C) = 0, lorsqu'il n'y a qu'une seule classe, on dénit
l'homogénéité comme étant 1. Pour une solution parfaitement homogène, cette nor-
malisation, H(C|K)
H(C) est égale à 0. Ainsi, pour adhérer à la convention de la valeur 1
est souhaitable et 0 indésirable, on dénit l'homogénéité comme suit (équation 2.8) :
(
1 if H(C) = 0
(2.8)
1 − H(C|K)
H(C) else

où,
|K| |C|
X X ack ack
H(C|K) = − log P|C|
N
k=1 c=1 c=1 ack

|C| P|K| P|K|


k=1 ack k=1 ack
X
H(C) = − log
n n
c=1

Tel que ack est le nombre d'éléments de la classe c dans le cluster k.

2.4.4 Indice d'exhaustivité


L'exhaustivité est symétrique à l'homogénéité. An de satisfaire les critères d'ex-
haustivité, un cluster doit assigner tous les points de données qui sont membres
d'une seule classe dans un seul cluster. Pour évaluer l'exhaustivité, on examine la

52
2.4. Evaluation du résultat de clustering

répartition des aectations de cluster au sein de chaque classe. Dans une solution de
clustering parfaitement complète, chacune de ces distributions sera complètement
biaisée à un cluster unique. Nous pouvons évaluer ce degré d'inclinaison en calculant
l'entropie conditionnelle de la distribution de cluster proposée, compte tenu de la
classe des points de données des composants, H(K|C). Dans le cas d'une solution
de clustering parfaitement complète, H(K|C) = 0. Cependant, dans le pire des cas,
chaque classe est représentée par chaque cluster avec une distribution égale à la
distribution des tailles de clusters, H(K|C) est maximal et équivaut à H(K). Enn,
dans le cas dégénéré, lorsqu'il existe un cluster unique, où H(K) = 0, nous dé-
nissons l'exhaustivité comme valant 1. Par conséquent, de manière symétrique au
calcul ci-dessus, nous dénissons l'indice d'exhaustivité comme suit (équation 2.9) :
(
1 if H(K) = 0
(2.9)
1 − H(K|C)
H(K) else

où,
|C| |K|
X X ack ack
H(K|C) = − log P|K|
N
c=1 k=1 k=1 ack

|K| P|C| P|C|


c=1 ack ack
X
H(K) = − log c=1
n n
k=1

Tel que ack est le nombre d'éléments de la classe c dans le cluster k.

2.4.5 Indice de kappa


L'indice de kappa est un coecient destiné à mesurer l'accord entre deux va-
riables qualitatives ayant les mêmes modalités, donc c'est un estimateur de qualité
qui exprime la réduction proportionnelle de l'erreur obtenue par une classication,
comparée à l'erreur obtenue par une classication complètement au hasard ou aléa-
toire. Le coecient kappa κ est déni avec le rapport suivant :

Po − Pe
κ= (2.10)
1 − Pe

où, Po est la proportion d'accord observée et Pe est la proportion d'accord aléa-


toire ou concordance attendue.
Plus ce rapport est proche de 1, et plus l'écart entre la proportion d'accords
observée et la proportion théorique d'accords aléatoires, se rapproche de l'écart
entre l'accord parfait des deux observateurs et leur concordance aléatoire. Une valeur
de Kappa de 0.95 (cas du corps calleux donné plus loin au paragraphe 4.4.2.2) signie
que la proportion de 95% de la classication n'est pas due au hasard.

53
Chapitre 2. Approches de clustering et systèmes multi-agents

2.5 Conclusion
Ce chapitre a présenté diérentes techniques de clustering, en décrivant les prin-
cipes opératoires et leurs caractéristiques en terme d'avantages et d'inconvénients.
Il a aussi présenté les métriques utilisées pour apprécier la qualité d'un clustering.
La première catégorie présentée, regroupe les techniques traditionnelles, qui
sourent d'un manque de exibilité par rapport aux données complexes, notamment
concernant la prise en compte des aspects dynamiques. Par ailleurs, ces approches
sourent d'un problème de passage à l'échelle, face aux ensembles de données de
grande taille. La deuxième catégorie de techniques de clustering présentée corres-
pond à de nouveaux algorithmes de clustering inspirés de modèles biologiques tels
que les colonies de fourmis, les nuées d'oiseaux, et les essaims d'abeilles. Ces al-
gorithmes sont dotés de caractéristiques intéressantes telles que la distribution, la
dynamicité, la capacité d'adaptation, qui permettent de mieux répondre aux limita-
tions des approches traditionnelles. Ceci grâce à la notion d'intelligence collective,
incarnée par l'interaction d'un grand nombre d'agents informatiques qui suivent les
mêmes règles et présentent un comportement complexe émergent.
Dans le chapitre suivant, nous étudierons les principales méthodes de clustering
employées pour regrouper les bres dans une base de données de tractographie an
d'étudier la connectivité anatomique du cerveau.

54
Chapitre 3

Clustering des bres neuronales et


détection des outliers

One machine can do the work of fty ordinary men. No machine can
do the work of one extraordinary man.  Elbert Hubbard.

Sommaire
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2 Le recalage inter-sujets . . . . . . . . . . . . . . . . . . . . . . 56
3.2.1 Le recalage linéaire et non linéaire . . . . . . . . . . . . . . . 56
3.2.2 La normalisation spatiale . . . . . . . . . . . . . . . . . . . . 58
3.3 La segmentation basée ROIs . . . . . . . . . . . . . . . . . . . 58
3.4 Le clustering basé similarité . . . . . . . . . . . . . . . . . . . 61
3.4.1 Les mesures de similarité . . . . . . . . . . . . . . . . . . . . 62
3.4.2 Le clustering intra-sujet . . . . . . . . . . . . . . . . . . . . . 68
3.4.3 Le clustering inter-sujets . . . . . . . . . . . . . . . . . . . . . 71
3.5 Le clustering hybride . . . . . . . . . . . . . . . . . . . . . . . 75
3.6 Les approches de détection des outliers . . . . . . . . . . . . 78
3.6.1 La détection des outliers basée sur la distribution . . . . . . . 79
3.6.2 La détection des outliers basée sur la distance . . . . . . . . . 79
3.6.3 La détection des outliers basée sur la densité . . . . . . . . . 80
3.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Chapitre 3. Clustering des bres neuronales et détection des outliers

3.1 Introduction
Comme nous l'avons relaté au premier chapitre, l'IRM de diusion permet, à
travers la tractographie, de reconstruire un million de tractes environ, pour le cer-
veau entier et ce, de façon non-invasive. Dans cette thèse, nous utilisons le terme
"streamlines" pour décrire un ensemble de points 3D représentant ces tractes neu-
ronaux.
En neuro-imagerie, en fonction de ce qui doit être étudié, deux modèles cou-
rants d'analyse de la base de données de tractographie, proposés dans la littérature,
permettent la modélisation des diérentes connexions de la SB cérébrale, avec dié-
rents objectifs. Le clustering des streamlines basé sur la similarité (que nous noterons
clustering basé similarité dans la suite), permet de reconstruire les faisceaux corres-
pondant aux divisions anatomiques de la SB. Cependant la segmentation basée sur
la détection de régions d'intérêt (que nous noterons dans la suite : segmentation
basée ROIs pour Regions Of Interest) divise la SB en faisceaux, en fonction des
régions corticales, où les n÷uds, qu'ils connectent permettant d'étudier le cerveau
comme un réseau de connexions.
Récemment, une troisième catégorie a été développée ; elle combine les aspects
de la segmentation basée ROIs et le clustering des streamlines basé similarité, pour
faire correspondre l'analyse de la connexion des structures à l'anatomie de la SB.
Cette thèse vise à regrouper les trajectoires putatives des streamlines en faisceaux
cohérents et anatomiquement signicatifs. An de situer notre travail, ce chapitre
présente un aperçu des méthodes de clustering des streamlines dans la littérature .
Nous nous focalisons sur la première catégorie, le clustering basé similarité, qui inclue
deux classes, le clustering intra-sujet et le clustering inter-sujets. Le clustering intra-
sujet permet de regrouper les streamlines au sein d'un seul sujet en s'appuyant sur la
mesure de similarité entre les streamlines. Nous décrivons également les principales
méthodes existantes de mesure de la similarité entre les streamlines. Cependant cette
classe de méthodes est limitée face à la variation de la SB cérébrale à travers les
sujets et sa complexité. Le clustering inter-sujets a été ainsi proposé an de remédier
à ce problème, permettant d'établir un modèle de faisceaux à travers une population
de sujets. Le clustering inter-sujets exige que toutes les images des sujets se trouvent
dans un référentiel commun, un recalage entre les sujets est donc nécessaire. Pour
cela, nous proposons de commencer par aborder les diérentes méthodes de recalage
inter-sujets.

3.2 Le recalage inter-sujets


3.2.1 Le recalage linéaire et non linéaire
L'étude de l'anatomie des structures ou les propriétés de diusion à travers les
sujets, nécessite de faire une mise en correspondance entre les sujets, de telle manière
à associer à une position d'un sujet, une position correspondante dans un autre sujet.
La correspondance peut être trouvée entre les images ou entre les ROIs.

56
3.2. Le recalage inter-sujets

Le recalage est un ajustement spatial d'une image an de correspondre à une


autre. L'image d'entrée appartient à un sujet, et l'image de référence peut être
une autre image du même sujet, d'un autre sujet, ou d'un référentiel (Template)
du cerveau. Ce template est créé en calculant la moyenne de plusieurs images de
diérents sujets se trouvant dans le même espace commun.
Deux types de recalage existent dans la littérature, le recalage linéaire et le
recalage non-linéaire [Johansen-Berg 2009].

Le recalage linéaire C'est la catégorie de recalage la plus couramment employée,


qui comprend notamment les translations, les ips ou retournements (inversion
d'axes), les rotations pures, les transformations rigides, les similitudes et plus géné-
ralement les transformations anes. Ces transformations sont adaptées au recalage
intra-sujet (deux images du même sujet) en l'absence de déformations dues à des
traitements particuliers.
Diverses méthodes de recalage robustes adaptées à la plupart des problèmes cou-
ramment rencontrés ont été proposées dans la littérature. Nous citons, la méthode de
maximisation de l'information mutuelle, la méthode basée sur les contours/surfaces
et, la méthode de minimisation des moindres carrés [Johansen-Berg 2009].

Le recalage non-linéaire inclut des transformations plus exibles que les trans-
formations anes, permettant d'aner la mise en correspondance dans les cas où
des déformations non-linéaires entre les images sont présentes.
Ce recalage peut être paramétré de façon à ne permettre que des déformations
simples et grossières, ou de façon à autoriser l'application des déformations très ne-
ment, détaillées et complexes, an de tenter de faire correspondre l'image d'entrée
à l'image de référence aussi parfaitement que possible. Cette deuxième catégorie
de déformation doit être utilisée prudemment car les images peuvent être trop dé-
formées et qu'elles ressemblent presque exactement les unes aux autres, mais les
images peuvent ne pas avoir atteint l'homologie structurelle globale, c'est-à-dire la
préservation de la façon dont les diérentes caractéristiques se rapportent les unes
aux autres.
Le recalage non-linéaire peut être divisé en deux types, les approches géomé-
triques et les approches d'intensité.
Les approches géométriques construisent des modèles explicites d'éléments ana-
tomiques identiables dans chaque image. Ces éléments comprennent typiquement
des surfaces fonctionnellement importantes, des courbes et des repères ponctuels
qui peuvent correspondre à leurs contreparties dans la deuxième image. Ces cor-
respondances dénissent la transformation d'une image par rapport à une autre
[Crum 2004].
L'approche d'intensité est réalisée par optimisation, basée sur une mesure de
similarité d'image qui quantie le degré de similarité entre les motifs d'intensité
dans deux images. Le critère de similarité peut être la minimisation de la diérence
quadratique moyenne [Friston 1995], la maximisation de la corrélation croisée nor-

57
Chapitre 3. Clustering des bres neuronales et détection des outliers

malisée [Studholme 1995], la minimisation de la variance des rapports d'intensité


[Woods 1993], la maximisation de l'information mutuelle (MI) [Viola 1997] ou, l'in-
formation mutuelle normalisée (NMI) [Maes 1997]. Les trois dernières peuvent être
utilisées pour le recalage intermodalité mais la MI et la NMI sont considérées comme
des standards dans le recalage d'images multimodales [Gholipour 2007]. Ces mé-
thodes dièrent principalement par le schéma de régularisation et la stratégie d'op-
timisation, qui ont une inuence cruciale sur le processus du recalage [Hellier 2003].
Des algorithmes hybrides ont également été proposés, combinant des modèles
basés sur l'intensité et des modèles basés sur les géométries pour établir des corres-
pondances plus précises dans des problèmes de recalage diciles.

3.2.2 La normalisation spatiale


Dans le cadre des études de groupes et étant donné la diérence morphologique
cérébrale inter-sujets, une étape de recalage élastique (non-rigide) vers un volume
de référence (référentiel ou template) est nécessaire an de pouvoir comparer les
résultats de traitement et de déterminer des comportements généraux à travers une
population.
L'objectif principal de la normalisation est de permettre le moyennage inter-
sujets et donc de réaliser des études de groupe. Pour ce faire, les images de deux
sujets diérents doivent être ré-échantillonnées dans un espace commun à tous les
sujets, de manière à ce que les régions fonctionnelles homologues soient aussi bien
appariées que possible. De plus, si les cerveaux sont normalisés dans un système de
coordonnées standard pour la communauté de neuro-imagerie, il devient possible de
comparer les streamlines de diérents sujets et eectuer un clustering.
Plusieurs référentiels ont été proposés dans la littérature dont les plus connus
sont le référentiel de "Talairach" [Talairach 1988] et le référentiel développé par le
"Montreal Neurological Institut" (MNI) [Mazziotta 1995]. Généralement, le recalage
est eectué à travers les étapes suivantes :
 Estimation des paramètres de recalage entre le référentiel et l'image anato-
mique qui a la meilleure résolution.
 Application des paramètres estimés de l'image anatomique précédente sur les
données recalées.
Une autre technique de normalisation appelée "Dartel" (Dieomorphic Anatomi-
cal Registration Through Exponentiated Lie Algebra), montrant une bonne précision
de recalage a été proposée dans [Ashburner 2007]. Cette méthode permet l'estima-
tion conjointe d'un référentiel issu d'une population d'étude et des paramètres de
recalage vers ce référentiel.

3.3 La segmentation basée ROIs


La stratégie la plus simple de segmentation des données issues de la tractographie
est fondée sur les régions d'intérêt (ROIs), lesquelles sont utilisées pour sélectionner
ou exclure les streamlines de façon plus ou moins interactive pour chaque sujet, an

58
3.3. La segmentation basée ROIs

de reconstruire les faisceaux cérébraux connus [Wakana 2007, Catani 2008].


Les auteurs dans [Catani 2008] proposent un template pour guider la délimitation
des ROIs, an de reconstruire les faisceaux d'association, de projection et commissu-
raux du cerveau. Les faisceaux peuvent être sélectionnés en utilisant une approche
basée sur un ROI unique (faisceau arqué, cingulum, le corps calleux, la commis-
sure antérieure et le fornix) ou une approche basée sur deux ROIs (faisceau fronto-
occipital longitudinal inférieur, faisceaux cérébelleux et unciné).
Dans [Wakana 2007] les auteurs utilisent aussi plusieurs ROIs pour construire 11 fais-
ceaux, employant diérents types d'opérations, comme "AND", "OR", et "NOT",
dont le choix dépend des caractéristiques de la trajectoire de chaque streamline. La
gure 3.1 illustre la segmentation manuelle de la SB basée sur les ROIs.

Figure 3.1  Un diagramme schématique de trois types d'opérations ROIs : AND,


NOT, et CUT. Lorsque le premier ROI est établi, tous les streamlines qui traversent
ce ROI sont récupérés (A). Si une opération "AND" est appliquée avec le second
ROI, les streamlines qui pénètrent par les deux ROIs sont conservées (B). Si une
opération "NOT" est utilisée, un sous-ensemble des streamlines qui pénètre dans la
ROI du NOT est supprimé (C). L'opération CUT est similaire à l'opération "AND"
mais seuls les résultats de streamlines entre les deux ROIs sont conservés (D). Les
résultats des opérations "AND" et "CUT" sont comparés dans (E : and) et (F : CUT)
en utilisant le faisceau cortico-spinal comme exemple. (Source : [Wakana 2007]).

Cette stratégie a été utilisée pour créer manuellement, des atlas de faisceaux de
la SB, à partir d'un seul sujet, comme celui de Mori et al. [Mori 2008, Lawes 2008]
ou extraire des longs faisceaux au sein de plusieurs sujets comme l'étude dans
[Maddah 2005a, Zhang 2008] et diérents faisceaux courts d'association, en utili-

59
Chapitre 3. Clustering des bres neuronales et détection des outliers

sant des données provenant d'un groupe de sujets [Oishi 2008, Zhang 2010].
Par exemple, les auteurs dans [Oishi 2008] ont fourni une parcellisation de la SB
supercielle (SWM), dénie comme la zone entre le cortex et la SB profonde. La
SWM a été extraite en utilisant des seuils appliqués à une carte probabiliste générée
de la SB. La SWM a été parcellée manuellement en neuf grandes structures appelées
pales (ou blades), qui ont été sous-parcellées encore en 23 régions en relation avec
les 24 régions corticales cérébrales et le cervelet. Les blades ont été utilisées comme
ROIs pour les sélections, lors du processus de tractographie. Quatre faisceaux courts
et un faisceau long inter-blade ont été trouvés. Voir la gure 3.2 (B-D) pour une vue
3D de la parcelle SWM et les faisceaux inter-blades identiés.

Figure 3.2  Une parcellisation SWM issue d'un étiquetage manuel basé sur les
ROIs. (A) Une vue en 3D de l'atlas ICBM-DTI-81, carte de parcelle de SB profonde
segmentée à la main (WMPM) [Mori 2008]. B-C La SWM obtenue dans [Oishi 2008].
(D) Résultats des neuf "blades" de SWM identiées manuellement pour un cerveau
individuel. (E) Les quatre faisceaux courts d'association identiés : frontal (jaune),
fronto-central (vert), centrale (rouge) et pariétale (bleu). Le faisceau d'association
longitudinal est représenté en violet (Source : [Oishi 2008]).

Les auteurs ont étendu cette méthode dans [Oishi 2009] en proposant une com-
binaison des atlas de plusieurs sujets basés sur le modèle DTI et, en utilisant des
méthodes de recalage non linéaires pour la segmentation automatisée de la SB.
Les auteurs ont créé trois types de cartes de parcellisation de la SB (WMPM)
dans l'espace "ICBM-152" (Atlas JHU-DTI-MNI) et l'espace "Talairach" (JHU-
DTI-Talairach atlas) contenant des régions anatomiques 3D prédénies. La mé-
thode non-linéaire "dual-channel Large Deformation Dieomorphic Metric Map-
ping" (LDDMM) [Huang 2008, Miller 2005] a été utilisée pour la normalisation.
Récemment, des approches automatiques pour la reconstruction des faisceaux,
basée sur les ROIs ont été proposées. Dans [Zhang 2008, Zhang 2010], les auteurs

60
3.4. Le clustering basé similarité

ont extrait un ensemble de faisceaux en utilisant un atlas de ROIs après la normali-


sation des données dans l'espace de l'atlas, une fois avec l'atlas en coordonnées MNI
(ICBM-DTI-81) [Mori 2008], ce qui a abouti à la reconstruction de 11 faisceaux
majeurs de la SB et une seconde fois avec l'atlas WMPM de type II [Oishi 2009],
contenant 130 ROIs. Dans le dernier cas, les faisceaux ont été extraits en utilisant
les connaissances anatomiques données par un modèle de ROIs appelées "template
ROI Set" (TRS). Trente TRSs ont été établis pour reconstruire 32 faisceaux (12 seg-
ments du corps calleux (CC), 10 faisceaux de projection thalamiques et 8 faisceaux
longs d'association). Cette approche a été utilisée également pour examiner les liens
entre les 24 segments SWM associés à diérentes zones du cortex. A partir de cette
analyse, 29 faisceaux courts d'associations ont été extraits.
Une autre méthode de segmentation basée sur les ROIs a été développée par
Wassermann et al. [Wassermann 2016]. Cette méthode appelée White Matter Query
Language (WMQL), utilise des requêtes basées sur :
1. des termes anatomiques qui indiquent si un faisceau de streamlines traverse
ou se termine dans une certaine région anatomique du cerveau,
2. des termes de position relative qui indiquent si le faisceau de streamlines se
trouve, par exemple latéral ou frontal, dans certaines structures anatomiques
et,
3. les opérations logiques qui sont par exemple des conjonctions, des disjonctions
ou des exclusions des deux types de termes précédents.
Le concept du WMQL est décrit plus en détails dans l'annexe A.

Avantages et inconvénients
Les méthodes de segmentation de la SB basées sur des ROIs se sont avérées
très puissantes mais elles reposent fortement sur la performance de la méthode de
recalage et nécessitent des connaissances approfondies sur la structure de la SB. En
plus, elles ne tiennent pas compte de la morphologie et de la position des streamlines
pour reconstruire un faisceau.

3.4 Le clustering basé similarité


Le clustering dans la SB regroupe en faisceaux les streamlines issues de la trac-
tographie du cerveau entier, contenant des streamlines avec des formes géométriques
et des positions spatiales similaires.
L'objectif de ce clustering est l'organisation des streamlines en forme de faisceaux
qui ont une signication anatomique [Ding 2003]. Par conséquent, ce clustering per-
met de réduire la quantité énorme de streamlines fournies par les algorithmes de
tractographie, en un nombre limité de streamlines plus gérables et compréhensibles.
Les faisceaux de la SB peuvent être utilisés pour eectuer des comparaisons quan-
titatives entre les diérents sujets [Moberts 2005]. Le paragraphe suivant détaille les

61
Chapitre 3. Clustering des bres neuronales et détection des outliers

principales méthodes de clustering des streamlines de la SB et les diérentes mesures


de similarité entre les streamlines, utilisées en entrée par la plupart des méthodes
de clustering proposées dans la littérature.

3.4.1 Les mesures de similarité


La mesure de similarité est une fonction qui calcule la (dis) similitude entre paires
de streamlines. Deux streamlines sont considérées comme similaires lorsqu'elles ont
des longueurs comparables ou des formes similaires, et sont séparées par une petite
distance [Ding 2003].
Diérentes mesures de similarité ont été proposées dans la littérature et peuvent
être divisées en deux catégories : les mesures basées sur les voxels et les mesures
basées sur la similarité.

3.4.1.1 Les mesures basées voxels


Les techniques basées voxels mesurent la diérence dans les caractéristiques de
diusion entre les voxels connectés par les streamlines [Jonasson 2005, Wassermann 2010].
Ce type de méthode présente un bon passage à l'échelle mais nécessite des étapes
fastidieuses de post et de pré-traitement.
La méthode proposée dans [Jonasson 2005] se base sur les voxels pour eectuer
une comparaison de la distance et de la forme entre les streamlines, comme l'illustre
la gure 3.3. La similarité a été dénie comme le nombre d'intersections entre les
streamlines, représentée par le nombre de fois où deux streamlines partagent le même
voxel. Cette métrique considère le chevauchement des streamlines.

Figure 3.3  Distance en nombre de voxels partagés.


Une autre technique proposée dans [Wassermann 2010] dénit la similarité entre
les streamlines (ou faisceaux) en utilisant un framework mathématique qui permet

62
3.4. Le clustering basé similarité

d'eectuer une analyse statistique des streamlines et des faisceaux. Ce modèle est
basé sur un mécanisme d'apprentissage qui inclut les informations de diusion et
relie chaque faisceau (ou streamline) à une région dans le volume. Il dénit un
degré d'appartenance de chaque voxel à un bundle appelé "Bundle blurred Indicator
Function (BIF)". Chaque streamline S est alors modélisée avec un BIF, Ys : p ∈
R3 → R représentant un niveau maximal qui correspond à S . Le BIF est ensuite
modélisé par un processus Gaussien (GP) déni par l'équation 3.1.

YS (p) ∼ GP (YS∗ (P ), CS (P, P 0 )) (3.1)


où la fonction moyenne YS∗ (P ) et la fonction de covariance CS (P, P 0 ) sont les
paramètres de ce processus stochastique. La mesure de similarité entre les faisceaux
a été dénie dans leurs chevauchements. Pour cela, le produit intérieur entre deux
faisceaux, S et S 0 , est déni par l'équation 3.2 suivante :
Z
< S, S 0 >:= YS∗ (P )YS∗0 (P )dp (3.2)
R3

Avec cette norme : k S k2 =< S, S >


La mesure de similarité est alors normalisée pour obtenir des valeurs entre 0 et
1, selon l'équation 3.3.
< S, S 0 >
< S, S 0 >norm := (3.3)
k S kk S 0 k
Cette métrique sert alors de mesure probabiliste de l'inclusion de deux stream-
lines (ou faisceaux).

3.4.1.2 Les mesures basées similarité


Les mesures basées similarité utilisent une matrice de similarité contenant les
distances entre streamlines ou diérentes caractéristiques de streamlines.
Diérentes stratégies, proposées dans la littérature, permettent de quantier la
distance entre deux streamlines et peuvent être divisées en deux catégories princi-
pales, les mesures de positions spatiales et les mesures géométriques, car la base de
données de tractographie est composée de streamlines avec des formes géométriques
variées et des longueurs et positions spatiales diérentes.
Une nouvelle mesure hybride qui combine les diérentes caractéristiques de
streamlines (position spatiale, orientation et forme géométrique) a été proposée dans
[Ros 2013].
Ce type de mesure donne de meilleures résultats par rapport aux mesures basées
voxels mais il soure des problèmes de passage à l'échelle ; SA et SB désignant deux
streamlines qui n'ont pas nécessairement le même nombre de points.

Les mesures de positions spatiales


Plusieurs mesures de positions spatiales existent. La première est la mesure de
distance entre les centres de masse des streamlines. Le centre de masse est obtenu

63
Chapitre 3. Clustering des bres neuronales et détection des outliers

en calculant la moyenne de tous les points d'une streamline. La distance est ensuite,
simplement dénie comme la distance euclidienne entre ces centres de masse. Bien
que cette mesure tienne implicitement compte de chaque point, elle n'est, en gé-
néral, pas assez juste pour permettre un bon clustering. En eet, deux streamlines
peuvent avoir un centre de masse très proche l'un de l'autre, mais avoir des formes
géométriques complètement diérentes. Cette mesure a été utilisée entre autres dans
[Corouge 2004].
La deuxième métrique utilise plutôt la comparaison point à point, ce qui im-
plique que les streamlines comparées doivent posséder le même nombre de points.
Une de ces mesures est la distance dénie par l'erreur quadratique moyenne (MSE
pour Mean Squared Error). Autrement dit, c'est la norme euclidienne moyenne des
diérences entre les streamlines, dénie par l'équation 3.4 :
E(k S A − S B k) (3.4)
Il faut également mentionner la distance MDF ou Minimum average Direct-Flip
[Visser 2010] qui a été reprise par [Garyfallidis 2012b], dénie par l'équation 3.5 et
illustrée par la gure 3.4.

M DF (S A , S B ) = min(ddirect , df lipped ) (3.5)


ddirect (S A , S B ) = N1 i=1 N (k SiA − SiB k)2
P

1
df lipped (S A , S B ) = SiA − SN
B 2
P
N i=1 N (k −i k)

Figure 3.4  La distance minimum average direct-ip (MDF), une fonction de dis-
tance symétrique qui peut traiter le problème de bi-directionnalité des streamlines ;
les streamlines doivent avoir le même nombre de points.
Pour cette distance MDF, en plus d'exiger que les streamlines aient le même
nombre de points N , il faut que leurs points soient équidistants. Le premier avantage
des deux métriques précédentes, est leur rapidité d'exécution (complexité d'ordre

64
3.4. Le clustering basé similarité

O(n)), puisqu'elles ne reposent que sur une comparaison point à point directe. En
revanche, il est nécessaire d'eectuer en pré-traitement, une interpolation linéaire
(le sous-échantillonnage est privilégié pour un gain en rapidité), car les streamlines
ont rarement le même nombre de points.
Il existe aussi une catégorie de mesures où les streamlines n'ont pas besoin d'avoir
le même nombre de points. En revanche, leur temps d'exécution est plus long, et est
de l'ordre de O(NA ∗ NB ) où, NA , NB sont respectivement le nombre de points que
possèdent les streamlines SA et SB .
La distance minimale (Closest Distance) [Corouge 2004, Gerig 2004] en est une
et représente la plus petite distance séparant deux streamlines. Le principe de cette
mesure est illustrée par la gure 3.5(a) et elle est dénie par l'équation 3.6 suivante :

dc (S A , S B ) = mini,j |SiA , SjB | (3.6)


La faiblesse de cette mesure réside dans le fait que la distance entre deux stream-
lines est dénie en n'utilisant qu'une seule paire de points. Deux streamlines qui se
croisent en un point quelconque auront donc une distance nulle.
Une solution est d'utiliser la moyenne des distances minimales, surnommée dis-
tance minimale moyenne (Mean Closest Distance - MCD) [Corouge 2004, Gerig 2004],
en chaque point (équation 3.7) :
NA NB
1 1 X 1 X
dM (S A , S B ) = ( )minj |SiA − SjB |) + ( )minj |SiA − SjB |) (3.7)
2 NA NB
i=1 i=1

Cette mesure MCD permet entre autres d'éviter de pénaliser les faisceaux qui
se terminent en éventail comme c'est le cas pour le faisceau cortico-spinal. En eet,
la moyenne permet de réduire l'impact des points aux extrémités qui sont souvent
peu nombreux.
Zhang et al. [Zhang 2008] ont développé une métrique nommée la moyenne de
la distance la plus proche (Mean of Thresholded Closest Distance). Cette distance
reprend le concept de la distance minimale moyenne, mais permet d'éviter que des
points bruités puissent contribuer au résultat de la mesure. Avec cette mesure, un
faisceau comme le corticospinal (CST) sera pénalisé puisqu'une de ses extrémités se
termine en éventail, augmentant ainsi la distance entre deux streamlines contenues
dans le CST. Ceci étant dit, il se peut que ce soit une propriété désirable en fonc-
tion de l'objectif de la segmentation, par exemple pour séparer le corps calleux en
plusieurs sections.
Une troisième mesure dénit simplement la similarité entre deux streamlines
comme étant la distance entre leurs extrémités. Brun et al. [Brun 2004] utilise la
distance Euclidienne pour mesurer la similarité entre les extrémités des streamlines.
La gure 3.5(b) donne un aperçu de cette mesure. Mais, l'inconvénient est que deux
streamlines ayant des extrémités éloignées peuvent appartenir au même faisceau,
par exemple le corps calleux et le cortico-spinal.
Toutes ces métriques considèrent uniquement la position absolue des points dans
l'espace. Elles sont basées sur l'hypothèse que si des streamlines commencent au

65
Chapitre 3. Clustering des bres neuronales et détection des outliers

(a) Distance minimale. (b) Distance entre les extrémités.

(c) Distance d'Hausdor (non symé-


trique).

Figure 3.5  Illustration des diérentes mesures de distance calculées entre deux
courbes. Les segments de couleurs vertes représentent la valeur qui sera choisie par
l'algorithme de distances utilisé. Les autres couleurs représentent d'autres valeurs
(non exhaustives) calculées lors de l'application de l'algorithme.

même endroit, suivent le même chemin et terminent ensemble, alors elles doivent
appartenir au même faisceau. Or, ce n'est pas toujours le cas. Tel que mentionné,
le corps calleux est déni principalement par sa forme en "U". C'est pourquoi des
mesures dites locales existent. Il s'agit des mesures qui font appel à la position
relative des points par rapport aux points adjacents.
Ces mesures ne considèrent donc pas les caractéristiques géométriques des stream-
lines comme la courbure et la torsion. An de remédier à ces problèmes, de nouvelles
mesures de similarité de streamlines ont été proposées.

Les mesures géométriques


La distance géométrique dG (T 1, T 2) permet de quantier la dissimilitude entre
deux courbes relativement à leur forme : U, S, L, hélice, rectiligne, etc.

66
3.4. Le clustering basé similarité

An de considérer la forme des streamlines, une mesure a été envisagée en se


basant sur la distance d'Hausdor [Rockafellar 1998] qui estime la similarité entre
deux formes géométriques. Pour chaque point de SA , le point le plus près dans SB
est trouvé. La valeur maximale de ces distances représente la mesure d'Hausdor.
Le principe de cette mesure est montré à la gure 3.5(c). Cette mesure n'étant pas
symétrique, elle peut le devenir avec l'équation 3.8 suivante :

dH (S A , S B ) = max(maxi minj |SiA − SjB |, maxj mini |SiA − SjB |) (3.8)


Bien que la littérature regorge de métriques, celle qui est la plus utilisée pour
segmenter les streamlines reste la distance d'Hausdor.
D'autres travaux mesurent la courbure et la torsion des streamlines [Ding 2003,
Corouge 2004, Gerig 2004, Batchelor 2006].

3.4.1.3 Les mesures hybrides


La Distance Combinée (DC), proposée par [Ros 2013], est basée sur l'hypothèse
que la position spatiale, l'orientation et la forme géométrique sont les principales
caractéristiques d'une streamline.
Par conséquent, la mesure DC utilise ces propriétés pour déterminer la simila-
rité entre deux streamlines SA et SB avec respectivement N , M points. La "Tract
centroide distance" dT CD (p, q) est utilisée pour mesurer la position spatiale et la
"Tract Orientation Similarity distance" dT OS (p, q) pour mesurer l'orientation d'une
streamline. La forme géométrique est estimée en adoptant le concept proposé dans
[Attalla 2005] qui est basé sur l'échantillonnage des streamlines et la segmentation
du contour.
Un échantillonnage est eectué pour déterminer les deux points qui minimisent la
distance entre SA et SB . En utilisant ces deux points, une correspondance partielle
est eectuée qui permet d'extraire les sous streamlines SA et SB . Pour ces sous
streamlines, la forme géométrique est calculée en utilisant dT SS (p, q) [Attalla 2005].

Tract Centroid Distance (TCD) La "Tract Centroid Distance" dT CD (p, q)


entre deux streamlines est dénie par la distance euclidienne entre leurs centroïdes
GSA et GSB (équation 3.9) :

dT CD (p, q) =k Gp − Gq k (3.9)
Pour n'importe quelle streamline S décrite par un ensemble de points P =
{p1 , p2 , ....pN } avec N ≥ 2. Le centroïde d'une streamline Gp est le centre de gravité.
Chaque ensemble de deux points pi et pi+1 successifs dénit un segment de
streamline, le centroïde et la longueur de chaque segment, notés respectivement par
gi et li . (équation 3.10, équation 3.11) :

pi + 1 − pi
gi = pi + (3.10)
2

67
Chapitre 3. Clustering des bres neuronales et détection des outliers

li =k pi+1 − pi k (3.11)
Le centre de gravité pour p points, peut être déni comme la longueur moyenne
pondérée de tous les segments centroïdes de p. Si Lp est la longueur du streamline,
alors Gp est donné par l'équation 3.12 :
N −1
1 X
Gp = gi × li (3.12)
Lp
i=1

PN −1
lp = i=1 li

Tract Orientation Similarity (TOS) An de déterminer l'orientation d'une


streamline, la distance dT OS (p, q) entre deux streamlines SA et SB avec respecti-
vement N , M points a été proposée. Cette métrique calcule la distance angulaire
entre leurs vecteurs d'orientation O~ p et O
~ q , selon l'équation 3.13.

~p • O
O ~q
dT OS (p, q) = arccos( ) (3.13)
~p k × k O
kO ~q k

~ p et O
O ~ q , vecteurs d'orientation, utilisent l'orientation du point nal de chaque
streamline :
~ p = p N − P1 ,
O

~ q = qM − q1 .
O

La distance combinée (DC) La dDC − O(p, q) regroupe toutes ces métriques,


elle est dénie alors par la somme de ces mesures individuelles, comme le montre
l'équation 3.14 (entre 0 et 1) :

1
dDC − O(p, q) = (dT CD (p, q) + dT OS (p, q) + dT CD (p0 , q 0 ) + dT SS (p0 , q 0 )) (3.14)
4
Il est aussi utile de refaire ce calcul sur la streamline inversée q = qM , qM −1 , ..., q2 , q1 ,
ce qui donne dDC − R(p, q). La distance combinée entre les streamlines SA et SB est
alors le minimum entre dDC − O(p, q) et dDC − R(p, q) donné par l'équation 3.15 :

dDC (p, q) = min(dDC − O(p, q), dDC − R(p, q)) (3.15)

3.4.2 Le clustering intra-sujet


Les approches de clustering des streamlines issues d'un seul sujet sont la première
tentative pour regrouper les streamlines de la SB. Ces approches visent à réduire la
complexité des données et à identier les principaux faisceaux de la SB.

68
3.4. Le clustering basé similarité

Nous présentons dans ce qui suit les principales méthodes de la littérature du


clustering des streamlines au sein d'un seul sujet, qui peuvent être divisées en fonc-
tion du concept de clustering utilisé, décrit au paragraphe 2.2.2, selon plusieurs
modèles.

Le clustering hiérarchique
Le clustering hiérarchique proposé dans [Corouge 2004, Ding 2003, Zhang 1998,
Zhang 2008, Guevara 2011b] est la première classe proposée des méthodes.
Par exemple, les auteurs dans [Corouge 2004] ont développé un algorithme ité-
ratif, pour regrouper les courbes de streamlines en faisceaux basés sur des mesures
de similarité, considérant la forme et la position des streamlines décrites dans la
section 3.4.1. La méthode proposée utilise un seuil de distance t, et un algorithme
de propagation de sorte que, pour chaque streamline Si dans une classe C , au moins
une streamline Sj , dans C est telle que d(Si , Sj ) < t.
Dans [Zhang 2008], les auteurs ont proposé une version améliorée de leurs tra-
vaux précédents [Zhang 2003, Zhang 1998] (gure 3.6). Initialement, les streamlines
courtes se trouvant dans le voisinage des streamlines longues sont éliminées. Les
streamlines issues de cette étape sont ensuite partitionnées en utilisant un regroupe-
ment hiérarchique (HC) à liaison unique, basé sur une distance qui détecte n'importe
quelle diérence entre les streamlines. Le nombre de clusters est déni préalablement
en utilisant un seuil approximatif, qui varie entre 0.1 et 10 mm. La limite de ce tra-
vail est l'hypothèse stipulant qu'il existe un seuil qui peut séparer un ensemble de
trajectoires signicatives anatomiquement, en clusters discrets.

Figure 3.6  Illustration du clustering hiérarchique des streamlines. Les clusters


issus de deux sujets ont été obtenus, pour chaque sujet, en utilisant une seule liaison
(HC). (Source : [Zhang 1998]).

Guevara et al. [Guevara 2011b] combinent plusieurs algorithmes allant du clus-


tering hiérarchique jusqu'à des techniques de lignes de partage des eaux. Ils utilisent
beaucoup de pré-traitement an de réduire le temps de calcul, comme la séparation
des streamlines en fonction de leurs longueurs et de leurs positions dans le cerveau
(hémisphère gauche/droite, avant/arrière). Le clustering est ensuite eectué sur les

69
Chapitre 3. Clustering des bres neuronales et détection des outliers

voxels puis, sur les extrémités pour former des sous-faisceaux. La distance d'Haus-
dor est alors utilisée an de fusionner les diérents sous-faisceaux.

Le clustering spectral
Brun et al. [Brun 2004] ont présenté le concept du pseudo-coloriage des stream-
lines pour améliorer la visualisation dans les bases de données de tractographie.
L'intégration spectrale a été utilisée pour cartographier chaque point de données
à un espace euclidien de faible dimension, en utilisant une distance qui considère
uniquement les points naux de chaque paire de streamlines.
O'Donnell et al. [O'Donnell 2005, O'Donnell 2006] ont ensuite utilisé le clustering
spectral pour regrouper les streamlines en faisceaux et trouver la correspondance
entre les sujets . Pour déterminer l'espace d'incorporation, les auteurs ont utilisé
une coupe normalisée avec la méthode de "Nistrom" [Fowlkes 2004]. Puis, au lieu
de calculer la matrice de similarité entière, un échantillon aléatoire de streamlines
(1500 streamlines) a été utilisé pour déterminer les vecteurs propres. La matrice de
similarité a été calculée à partir de la version symétrique de la distance moyenne la
plus proche [Corouge 2004] entre streamlines, décrite au paragraphe 3.4.1.

Le clustering avec le modèle "Gamma mixture"


Maddah et al. [Maddah 2005b, Maddah 2008] ont présenté un modèle statistique
de faisceaux, estimé comme la moyenne et l'écart-type d'une représentation paramé-
trique des streamlines . En utilisant cette représentation, l'espérance- maximisation
(expectation maximization - EM) a été eectuée pour regrouper les streamlines dans
un framework du modèle "Gamma mixture". La correspondance point à point des
streamlines à l'intérieur d'un faisceau a été obtenue en construisant des cartes de
distances à partir de chaque centre de cluster, à chaque itération de l'algorithme EM.
La similarité de chaque streamline avec le centre a été faite en calculant la distance
de Mahalanobis. Un terme de pénalité a été ajouté à la distance pour chaque point
manquant, an de gérer le chevauchement partiel. La distance était également nor-
malisée par la longueur de la streamline. La méthode n'a été appliquée qu'à certains
faisceaux principaux de la SB.
Le résultat de ce clustering est une probabilité d'aectation d'une streamline à
chaque cluster, une estimation des paramètres de cluster et des points de corres-
pondance. Cette approche nécessite l'initialisation par l'utilisateur, en sélectionnant
manuellement une streamline dont son appartenance à un faisceau est connue.

Le clustering par les graphes


Leemans and Jones [Leemans 2009] proposent une méthode de clustering des
streamlines de la SB qui utilise les concepts de la théorie des graphes, et plus par-
ticulièrement la propagation d'anité. Cette méthode itérative vise à identier au-
tomatiquement des représentants de groupes via l'échange de messages entre les
éléments du système.

70
3.4. Le clustering basé similarité

Le clustering par l'agglomération hiérarchique


Garyfallidis et al. [Garyfallidis 2012b] mettent l'accent sur la rapidité du cluste-
ring plutôt que sur le fait de trouver des faisceaux anatomiquement signicatifs. Ils
proposent l'algorithme des QuickBundles, inspiré de BIRCH [Zhang 1997] an de
fournir un clustering des streamlines en un temps linéaire, en moyenne.
Le principe de cette méthode repose sur l'utilisation d'une streamline-moyenne
pour représenter un cluster. Pour chaque streamline, la distance au modèle de chaque
cluster existant est ensuite comparée à un certain seuil T . Si, pour un cluster donné,
la distance est en dessous de ce seuil, la streamline est ajoutée au cluster et une
nouvelle streamline modèle est calculée. Si, au contraire, elle est plus élevée, alors
un nouveau cluster est formé. Un avantage important, mis à part sa vitesse, est que
le nombre de faisceaux n'a pas besoin d'être connu à l'avance.
Demir et al dans [Demir 2013, Demir 2015] ont proposé, plus récemment, une
approche de clustering hiérarchique agglomérative (HCA). Les auteurs projettent le
problème comme un clustering de ux de données en utilisant un cadre séquentiel
pour traiter une seule streamline à la fois. Cette méthode représente les clusters avec
des modèles paramétriques et eectue un clustering hiérarchique d'un petit nombre
de streamlines, lorsque les paramètres doivent être initialisés et / ou mis à jour puis,
assigne des étiquettes aux ux suivants de données selon les modèles actuels.
Le clustering HCA est une méthode rapide qui bénécie d'un nombre prédéni de
clusters ; il accorde rapidement des étiquettes aux données entrantes avec une grande
précision. Le mécanisme de clustering en séquentiel allège le calcul des distances
entre chaque paire de streamlines dans la base de données de tractographie.

3.4.3 Le clustering inter-sujets


Le clustering hiérarchique
Les auteurs dans [Zhang 2008] proposent une extension de leur méthode de clus-
tering intra-sujet [Zhang 1998], en utilisant les clusters identiés à partir de quatre
sujets, après les avoir alignés avec un recalage linéaire ane pour construire un
modèle de faisceaux de la SB. Ce modèle a été utilisé pour identier automatique-
ment, les faisceaux de deux nouveaux sujets. La méthode de clustering a été d'abord
appliquée aux sujets puis, les clusters résultants ont été déplacés vers l'espace du
modèle et étiquetés avec le même label que le cluster du modèle qui a la plus courte
distance par rapport à son centroïde. L'algorithme recherche un seuil approximatif
pour chaque nouveau sujet qui maximise la correspondance.
Les faisceaux longs connus de la SB ou ceux dont la géométrie est distincte
de leur voisins ont été identiés avec précision dans le modèle des faisceaux . En
revanche, les faisceaux courts de la SB comme la commissure antérieure étaient
presque complètement absents du modèle. Les faisceaux de streamlines les plus
proches les uns des autres, n'ont pas été inclus dans ce modèle comme par exemple,
le faisceau longitudinal inférieur avec le faisceau fronto-occipital, qui présentent des
trajectoires rapprochées dans le cerveau. En outre, l'exactitude de l'étiquetage des

71
Chapitre 3. Clustering des bres neuronales et détection des outliers

résultats étaient également susceptibles d'être aectés par la variation anatomique


d'un faisceau de streamlines à travers les sujets et les erreurs de recalage.
Visser et al. dans [Visser 2011] ont proposé une méthode de clustering des
streamlines de la SB, qui peut être appliquée à une large base de données de tracto-
graphie. Les streamlines sont d'abord réparties aléatoirement en sous-ensembles de
N s = 10000 streamlines. Chaque sous-ensemble est ensuite regroupé séparément,
en se basant sur l'hypothèse que les clusters trouvés dans ces sous-ensembles sont,
dans une certaine mesure, semblables à ceux qui pourraient être trouvés lors du
regroupement de la totalité de la base de données de tractographie d'origine.
Un clustering hiérarchique avec liaison complète est eectué dans chaque sous-
ensemble en utilisant la somme des distances euclidiennes entre les points corres-
pondants des streamlines comme mesure de similarité.
Un nombre arbitraire de clusters (Nc ) est alors déni et utilisé pour obtenir
la partition nale, ce nombre doit être assez grand pour éviter de fusionner les
faisceaux anatomiques. La procédure de création des sous-ensembles et de clustering
est répétée un nombre déni de fois. Les résultats de toutes les répétitions sont
ensuite combinés, en utilisant une procédure de correspondance entre les clusters,
an de trouver des clusters cohérents dans la base de données de la tractographie
originale, avec une bonne reproductibilité. Les résultats sont présentés pour un seul
sujet, où 4 faisceaux longs connus et un faisceau en "U" ont été identiés. La méthode
a également été appliquée à un ensemble de données contenant des données de 15
sujets an de trouver des faisceaux correspondants à travers les sujets.
Dans une étude récente [Garyfallidis 2015], les auteurs proposent une méthode
de recalage linéaire des faisceaux de la SB, qui a été également utilisée pour le
clustering inter-sujets.
Cette méthode est basée sur l'algorithme des QuickBundles QB, proposée dans
[Garyfallidis 2012b]. Les streamlines ayant une longueur inférieure à 50 mm sont
d'abord éliminées, puis, les streamlines issues de cette étape sont regroupées en
clusters en utilisant la méthode QB. Chaque cluster est représenté par une streamline
représentante.
Ce processus est répété pour chaque sujet et nalement, les streamlines repré-
sentantes issues du clustering de tous les sujets ont été regroupées pour établir des
faisceaux naux représentant la variation de la SB à travers une population de sujets.

Le clustering avec le processus hiérarchique de Dirichlet


Wang et al. dans [Wang 2011] proposent une méthode de clustering des stream-
lines basée sur les voxels. Cette méthode utilise les coordonnées des points qui com-
posent la streamline et son orientation pour déterminer la similarité entre les voxels.
Le clustering des voxels est réalisé à l'aide d'un modèle hiérarchique de mélange de
processus de Dirichlet "Hierarchical Dirichlet Processes Mixture" (HDPM).
Un apprentissage automatique, sans supervision, piloté par un processus de Di-
richlet antérieur est eectué sur un ensemble de données pour établir un modèle des
faisceaux qui permet de dénir le nombre de clusters. Ces modèles peuvent alors

72
3.4. Le clustering basé similarité

être utilisés comme a priori pour regrouper (ou classier) des streamlines issues de
nouveaux sujets, avec la possibilité de créer de nouveaux clusters pour des structures
non observées dans les données d'apprentissage.
Cette méthode est basée sur des mesures de similarité entre les voxels, au lieu de
calculer les distances par paires entre les streamlines, ce qui permet d'analyser des
grands ensembles de données de tractographie, le plus grand ensemble de données
utilisé étant de 120 000 streamlines.
Cette méthode a été comparée à la méthode proposée dans [O'Donnell 2007].
Les résultats obtenus par Wang et al. dans [Wang 2011] montrent une meilleure
complétude et une meilleure exactitude pour le nombre de clusters déterminées
automatiquement par l'approche HDPM. Le concept de cette approche de clustering
est illustré à la gure 3.7.
Cette approche est très intéressante, mais certaines limitations peuvent exister
dues à l'utilisation uniquement d'une stratégie basée sur le voxel, qui peut dimi-
nuer la qualité des résultats lorsque les faisceaux se chevauchent, i.e. partageant un
nombre important de voxels.

Figure 3.7  Une méthode de clustering de la tractographie basée sur les voxels
utilisant le modèle de mélange de processus de Dirichlet hiérarchique. A : Étiquet-
tage anatomique de certains faisceaux générés par cette méthode. B : Exemple de
clustering multiscale. C : Erreurs de tractographie qui engendrent de courtes stream-
lines dans (C1) et des streamlines traversant deux faisceaux dans (C2) (Source :
[Wang 2011]).

Le clustering par les graphes


Récemment, les auteurs dans [Dodero 2015] ont proposé une méthode automa-
tique de clustering inter-sujets qui tient compte de la variance de la SB entre les
sujets.

73
Chapitre 3. Clustering des bres neuronales et détection des outliers

Cette méthode est basée sur l'algorithme des ensembles dominants (Dominants
Sets (DS)) qui est une méthode de théorie des graphes opérant sur deux niveaux :
le clustering intra- et, inter sujets.
Clustering intra-sujet Le clustering a d'abord été appliqué à la base de don-
nées de tractographie d'un seul sujet pour extraire un ensemble de faisceaux
homogènes. Ceci permet de réduire la dimensionalité des données et donc la
complexité informatique. Le cerveau a été divisé en trois ensembles de don-
nées plus petits : hémisphère gauche, hémisphère droit et streamlines inter-
hémisphériques, ce qui donne environ 15000 streamlines par sous-ensemble
de données ;
Clustering inter-sujets Dans l'approche proposée, les faisceaux récupérés pour
tous les sujets séparément sont regroupés dans une deuxième étape selon le
cadre des ensembles dominants (DS). À cette n, les clusters déterminés lors
de la première étape sont remplacés par leurs streamlines représentatives,
puis toutes les bases de données de tractographie sont regroupés en une seule
base de données, en éliminant les doublons issus des diérentes bases. De
cette façon, des clusters cohérents de faisceaux, n'incluant qu'un seul fais-
ceau représentatif de chaque base de données de tractographie, sont générés.
Le principe de cette méthode est illustré à la gure 3.8

Figure 3.8  Le pipeline de la méthode de clustering inter-sujets par les graphes.


(A) Le clustering intra-sujet à travers les ensembles dominants. (B) Extraction de
points de repère et centroïdes codant sur l'espace des repères. (C) Clustering inter-
sujets à travers la matrice de blocs d'anité. (Source : [Dodero 2015]).

74
3.5. Le clustering hybride

3.5 Le clustering hybride


Le clustering hiérarchique
La méthode proposée dans [Ding 2003] est similaire aux algorithmes employés
par Gerig et al. [Gerig 2004]. Cependant, Ding et al. utilisent les ROIs pour construire
des faisceaux de streamlines et déterminer les courbes correspondantes aux clusters
de streamlines.
Une autre approche dans [Kouby 2005], utilise une stratégie d'inférence d'un mo-
dèle de faisceaux de la SB en deux étapes, composée en premier lieu, d'un clustering
intra-sujet, puis d'une correspondance de faisceaux entre les sujets.
Le clustering intra-sujet est basé sur la connectivité entre les voxels de la SB
au lieu d'une mesure directe de similarité entre les streamlines. Premièrement, le
masque de la SB du sujet est recalé dans l'espace Talairach. Ensuite, une matrice de
connectivité est créée, contenant pour chaque paire de ROIs le nombre de streamlines
les traversant et postérieurement binarisée. Le clustering k-means est eectué en se
basant sur la distance euclidienne entre les lignes de la matrice.
Le clustering inter-sujets utilise des masques 3D lissés pour représenter des fais-
ceaux et une mesure de similarité donnée par le coecient de corrélation entre les
représentations de faisceaux. L'algorithme des k-means est ensuite appliqué pour
faire correspondre des faisceaux entre les sujets. Cette méthode est appliquée à onze
sujets, où certains faisceaux anatomiques connus sont identiés dans la plupart des
sujets (voir gure 3.9 ).
L'analyse des faisceaux de streamlines dans le domaine des voxels est une idée in-
téressante, mais sa mise en ÷uvre nécessite plusieurs post-traitements pour nettoyer
les résultats et obtenir les clusters dénitifs.

Figure 3.9  Les résultats du clustering basé sur les voxels à travers les sujets
décrits dans [Kouby 2005] obtenus pour deux sujets. Pour chaque sujet, deux vues
sont présentées. Chaque faisceau est désigné par une couleur diérente. (Source :
[Kouby 2005]).

Les auteurs dans [Li 2010] propose une approche hybride automatique pour le
clustering et l'étiquetage des streamlines de la SB, qui utilise à la fois la parcellisation
du cerveau et la mesure de similarité entre les streamlines.
La première étape est d'abord appliquée à l'ensemble de la tractographie. Il s'agit
d'un clustering guidé par l'anatomie, visant à regrouper des streamlines en se basant
sur les régions du cerveau qu'elles traversent ou touchent. L'atlas MNI a été utilisé
pour subdiviser les images DTI des sujets et étiqueter les structures de la substance

75
Chapitre 3. Clustering des bres neuronales et détection des outliers

blanche /grise. Cette étape basée sur le ROI extrait 9 faisceaux majeurs à partir
des données de tractographie, suivant un ordre spécié pour l'extraction de chaque
faisceau. Premièrement, les streamlines du corps calleux reliant les lobes frontaux,
pariétaux et occipitaux sont extraites, suivies par les streamlines de projection pé-
nétrant les mêmes lobes. Enn, le cingulum, la partie inférieure fronto-occipitale et
le faisceau inférieur longitudinale sont obtenus consécutivement.
La deuxième étape, utilisant un clustering basé sur la similarité, vise à séparer et
identier deux autres faisceaux (faisceau supérieur longitudinal et l'uncinate). Tout
d'abord, une méthode non linéaire d'analyse par composantes principales (PCA) est
utilisée pour projeter les streamlines dans un espace de PCA. Ensuite, un algorithme
de clusteringfuzzy c-mean est appliqué pour regrouper automatiquement les stream-
lines dans l'espace des caractéristiques. La distance de Hausdor [Corouge 2004] est
utilisée comme métrique de mesure de similarité entre streamlines, avec l'addition
de la longueur d'une streamline comme facteur. Une fois les clusters obtenus, un
algorithme de reconnaissance est appliqué, basé sur une méthode manuelle d'ex-
traction de faisceaux [Wakana 2007], pour la construction d'un histogramme des
points naux des streamlines.

Le clustering avec le processus Gaussien


Maddah et al. dans [Maddah 2008] pour intégrer l'information anatomique dans
le clustering des streamlines. L'algorithme EM (Espérance - Maximisation) est utilisé
pour regrouper les streamlines, basé sur un atlas qui sert d'a priori anatomique pour
l'étiquetage. Les auteurs ont utilisé l'atlas décrit dans [Wakana 2004], qui contient
des régions étiquetées des principaux faisceaux de streamlines anatomiques. Les
streamlines ont d'abord été projetées dans l'atlas MNI et les ROIs de l'atlas ont été
utilisées pour le calcul de la probabilité d'appartenance initiale de chaque faisceau.
Cet a priori anatomique a donné plus de robustesse à l'algorithme, mais la méthode
nécessite la dénition des centres de faisceaux initiaux.
Une autre approche bayésienne est proposée dans [Wassermann 2010] où un atlas
anatomique est utilisé en conjonction avec une métrique de similarité de streamline
pour regrouper et classer les streamlines. Ils proposent un cadre de processus Gaus-
sien qui facilite les opérations mathématiques entre les faisceaux par la dénition
d'un espace de produit interne. Le modèle inclut l'information de diusion et relie
chaque faisceau (ou streamline) avec un ROI dans le volume, cartographiant chaque
voxel à un degré d'appartenance au faisceau. La mesure de similarité est dénie pour
les faisceaux et les streamlines, qui sont considérés comme des faisceaux uniques.
La base de données de tractographie est calculée à partir de 10 sujets, après
recalage dans l'espace standard MNI puis, une représentation du processus Gaussien
est produite pour chaque streamline. Un clustering d'agglomération hiérarchique est
alors appliqué à chaque sujet individuellement, an d'obtenir un dendrogramme.
Les clusters sont automatiquement sélectionnés par l'utilisation d'un atlas donné
dans [Wakana 2004], de la matière grise et blanche du cerveau, accessible au public.
Pour l'identication de chaque faisceau, cette étape utilise une "tract query", qui

76
3.5. Le clustering hybride

dénit un ensemble de régions de matière grise et blanche que le faisceau doit traver-
ser. Cette méthode réussit à bien extraire les faisceaux anatomiques les plus connus.
Finalement, les auteurs créent des cartes de probabilité moyenne de population pour
chaque faisceau identié (voir gure 3.10).

Figure 3.10  Illustration de la segmentation de la SB en utilisant le cadre ma-


thématique décrit dans [Wassermann 2010]. La procédure regroupe les streamlines
en faisceaux anatomiques et produit une carte de probabilité de streamlines pour
chaque faisceau. Tout d'abord, les images de tenseur de diusion sont recalées en
utilisant un recalage déformable du cerveau entier et ensuite calculées pour obte-
nir environ 10 000 streamlines par cerveau. La représentation du processus Gaussien
pour chaque streamline est ensuite produite. Enn, on peut générer une carte de pro-
babilités de répartition en moyenne de la population pour chaque faisceau (Source :
[Wassermann 2010]).

G. Prasad et al. dans [Prasad 2014] ont également utilisé l'étiquetage basé sur
l'atlas et les chemins de densité maximale pour construire les modèles de faisceaux.
Ils ont introduit un cadre pour l'analyse de la population des streamlines de
la SB basés sur des images pondérées en diusion du cerveau. La méthode permet
l'extraction de streamlines à partir d'images HARDI, le clustering des streamlines
basé en partie sur les connaissances a priori d'un atlas, le clustering des faisceaux de
streamlines de manière compacte en utilisant un chemin suivant les points de densité
les plus élevées (chemin de densité maximum - MDP) et, l'enregistrement de ces
chemins en utilisant la courbe géodésique correspondant à trouver des associations
locales à travers une population (gure 3.11).

Le clustering par les graphes


Les auteurs dans [Jin 2015] ont présenté une méthode de clustering de ux de la
SB, qui peut regrouper des streamlines en croissance continue provenant d'un ROI
sélectionné manuellement.

77
Chapitre 3. Clustering des bres neuronales et détection des outliers

Figure 3.11  Schéma du pipeline d'analyse statistique des populations de MDPs.


Le premier panneau représente les MDPs d'une population de sujets pour un faisceau
donné de la SB. Une méthode itérative non linéaire qui utilise des recalages de
courbes géodésiques est utilisée pour calculer un MDP moyen représentant la forme
moyenne de la population. Une correspondance est établie pour tous les MDPs
de sujets via le MDP moyen. L'anisotropie fractionnelle (FA) de chaque sujet est
rééchantillonnée pour les points correspondants et comparée à travers la population.
(Source : [Prasad 2014]).

La méthode surveille la divergence d'une streamline point par point en utilisant


un mécanisme de détection de dérive. Seul un petit sous-ensemble de streamlines
est alimenté dans l'étape de clustering à base de propagation d'anité, qui peut
déterminer le nombre de clusters automatiquement.
La méthode peut générer sans supervision et avec précision et abilité des fais-
ceaux cohérents et anatomiquement signicatifs avec un temps beaucoup plus réduit.
Il peut devenir un outil pratique qui peut aider les médecins à inspecter l'intégrité
de la SB des patients dans un contexte clinique.

3.6 Les approches de détection des outliers


Un outlier, est une observation qui dière tellement des autres observations
qu'elle intrigue, il peut être généré par diérents mécanismes.
Ces observations irrégulières contiennent souvent des informations utiles sur le
comportement anormal du système décrit par les données. La détection de ces don-
nées irrégulières est donc également, ou même, plus intéressantes et utiles que de
trouver des motifs réguliers applicables à une partie considérable d'objets dans un
jeu de données. Par exemple, l'identication d'activités criminelles ou la fraude par
carte de crédit qui est cruciale dans les applications de commerce électronique.
La base de données de tractographie est riche en outliers dû aux mouvements du

78
3.6. Les approches de détection des outliers

patient et au bruit lors de l'acquisition des données, ainsi qu'aux erreurs générées
par le processus de traitement (la reconstruction et la tractographie). Un mécanisme
de détection et d'élimination d'outliers est donc nécessaire dans le clustering des
streamlines de la SB, an d'éliminer les faux streamlines qui altèrent le résultat.
Actuellement, la détection et l'élimination des outliers suscite de l'intérêt et
quelques approches récentes de clustering des streamlines de la SB intègrent des mé-
canismes de détection des outliers [Ros 2013, Prasad 2014, côté 2015, Guevara 2011b]
an de garantir la robustesse des méthodes de clustering face au bruit et accroître
ainsi la précision du résultat.
Cependant, elles sourent d'un ou de plusieurs des inconvénients suivants : elles
supposent explicitement ou implicitement que les données suivent un modèle de dis-
tribution donné. Les résultats de nombreuses méthodes dépendent fortement d'une
paramétrisation appropriée (seuil d'outliers) et / ou leurs résultats sont diciles à
interpréter. En outre, la plupart des approches sont restreintes à une structure de
données et ne prennent pas en charge des données hiérarchiques complexes.
Les approches existantes en matière de détection des outliers dans le clustering
de la SB, peuvent être classées en trois catégories : la détection des outliers basée
sur la distribution, la distance et, la densité.

3.6.1 La détection des outliers basée sur la distribution


Les méthodes de cette catégorie sont principalement développées dans le do-
maine de la statistique. En général, ils supposent un modèle de distribution connu
(Gaussien) pour les observations basées sur l'analyse statistique d'un ensemble de
données. Les outliers sont dénis comme des objets qui dérogent considérablement
aux hypothèses du modèle [Prasad 2014, Dodero 2015].
Les auteurs dans [Prasad 2014] utilisent un a priori Gaussien et des tests sta-
tistiques pour éliminer les outliers du clustering intra-sujet, basé sur l'espérance -
maximisation générale (generalized Expectation Maximization).
Récemment, les méthodes développées dans [Dodero 2015] détectent les stream-
lines outliers en utilisant des courbes Gaussiennes et des tests statistiques. En sup-
posant que les données sont réparties selon un modèle gaussien, les streamlines sont
considérées comme outliers en se basant sur la cohésion de tous les clusters avec un
niveau de conance (marge d'erreur) p < 0, 05.

3.6.2 La détection des outliers basée sur la distance


Les techniques de détection des outliers basées sur la distance, identient les
outliers potentielles à partir de points ordinaires en fonction du nombre de points
dans un voisinage spécié. Ils dénissent un point dans un ensemble de données T
comme étant un outlier si, au moins p fraction de points dans T ont une distance
plus grande que la distance de celui-ci. Cette notion est utilisée dans [côté 2015]
qui a proposé une méthode probabiliste pour l'élimination d'outliers basée sur une
utilisation d'un arbre de clustering hiérarchique construit à partir d'applications

79
Chapitre 3. Clustering des bres neuronales et détection des outliers

multiples de l'algorithme QB [Garyfallidis 2012b]. Cependant, les résultats de ces


méthodes dépendent fortement d'un seuil prédini xé manuellement ou nécessite
des connaissances a priori sur le nombre de clusters.

3.6.3 La détection des outliers basée sur la densité


Les auteurs dans [Ros 2013] incorporent le mécanisme du "Local Outlier Factors
(LOFs)" dans leur méthode hiérarchique agglomérative de clustering appelée CAS-
TER (Cluster Analysis Through Smartly Extracted Representatives) qui calcule le
degré relatif d'isolation de streamline pour le classer en outliers. Une streamline
est considérée comme outlier si sa densité locale ne correspond pas à la densité des
streamlines dans son voisinage. Cependant cette méthode ne tient pas compte de la
taille des clusters.
Les auteurs dans [Guevara 2011b] utilisent la carte de densité des streamlines
pour éliminer les outliers. Une image de densité de faisceau est créée avec des seuils
automatiquement. Les streamlines dont la trajectoire est supérieure à 20% dans
cette région seront considérées comme des outliers.
Bien que les approches de détection des outliers basée sur la densité soient utiles,
leurs performances sont sensibles au paramètre M inpoints qui peut être très dicile
à déterminer.

3.7 Conclusion
Dans ce chapitre, nous avons présenté une analyse des approches les plus perti-
nentes du clustering des streamlines de la SB. Ces approches nécessitent l'utilisation
des algorithmes de clustering et des mesures de similarité entre les streamlines an
de regrouper ces derniers en faisceaux anatomiquement signicatifs. Pour l'identi-
cation des faisceaux anatomiques connus de la SB, l'addition d'informations ana-
tomiques peut également être nécessaire, étant la plupart du temps sous la forme
d'un atlas de la SB.
Le clustering et l'identication des faisceaux de la SB est une tâche compliquée
pour plusieurs raisons. Tout d'abord, ces faisceaux présentent des formes et des
tailles diérentes, de plus plusieurs faisceaux se chevauchent sur une partie non
négligeable de leur trajectoire. Et, même si la localisation relative des trajectoires
reste la même pour tous les sujets, la variabilité inter-sujets est très importante.
La forme et la taille de la SB varient selon les sujets, nécessitant l'utilisation de
méthodes sophistiquées pour l'alignement et l'identication des faisceaux. De plus,
le résultat du clustering dépend fortement de la qualité des images de diusion et
la capacité de la méthode à éliminer les outliers, causés par la qualité des images, le
mouvement du patient et les erreurs de tractographie.
Tous ces aspects imposent une méthode de clustering très robuste, ce qui est
rarement satisfait. De plus, les nouvelles images de diusion HARDI permettent
une meilleure précision mais génèrent de grandes bases de données de tractographie,
qui ne peuvent pas être analysées avec les méthodes classiques de clustering.

80
3.7. Conclusion

Par conséquent, nous avons concentré notre travail sur le développement de nou-
veaux algorithmes de clustering des streamlines, capable d'analyser de très grandes
bases de données de tractographie pour l'identication des faisceaux de la SB. Le
chapitre suivant décrira les stratégies que nous avons adoptées pour d'abord le clus-
tering intra-sujet.

81
Chapitre 4

Clustering intra-sujet des bres


neuronales

Research is to see what everybody else has seen, and to think what
nobody else has thought. Albert Szent-Györgyi.

Sommaire
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.2 Travaux antérieurs et motivations . . . . . . . . . . . . . . . 84
4.3 Evaluation des méthodes de tractographie . . . . . . . . . . 87
4.3.1 Méthodologies de tractographie . . . . . . . . . . . . . . . . . 87
4.3.2 Expérimentations, résultats et discussion . . . . . . . . . . . 90
4.4 Clustering intra-sujet des bres neuronales . . . . . . . . . . 95
4.4.1 Une méthode de segmentation hybride . . . . . . . . . . . . . 95
4.4.2 Expérimentations, résultats et discussions . . . . . . . . . . . 98
4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
Chapitre 4. Clustering intra-sujet des bres neuronales

4.1 Introduction
La tractographie par IRM de diusion gagne de plus en plus d'importance car
elle est l'unique modalité d'imagerie en mesure de caractériser in vivo, l'architecture
et l'intégrité des streamlines de la SB. Toutefois, la disponibilité croissante de mo-
dèles de diusion et d'algorithmes de tractographie rend le choix d'une méthode de
reconstruction de bres dicile. Plus important encore, les performances de chaque
méthode peuvent varier, et il est dicile de garantir que les streamlines reconstituées
soient eectivement représentatives de la véritable organisation des streamlines, ou
représentatives d'artefacts simplement.
L'objectif de ce chapitre, en premier lieu, est l'étude de la précision des algo-
rithmes de tractographie basés sur les modèles DTI et HARDI. Nous avons implé-
menté plusieurs algorithmes déterministes et proposé une nouvelle approche adap-
tative, an de comparer leurs résultats. L'étude de la abilité a été eectuée sur des
données synthétiques de diusion, avec diérentes congurations de streamlines.
Cette étude nous a permis de choisir la meilleure méthode de tractographie
déterministe pour générer nos bases de données de tractographie. Ces dernières
vont être utilisées en entrée de toutes les approches de clustering proposées dans
cette thèse. Ensuite, nous avons proposé une méthode hybride de segmentation de
ces bases de données de tractographie, an de générer les principaux faisceaux de
bres qui constituent la connectivité de la SB cérébrale au sein d'un seul sujet.

4.2 Travaux antérieurs et motivations


Nous avons vu au chapitre 1 que le principe de l'IRMd repose sur l'étude du
mouvement Brownien, qui stipule que l'eau diuse de manière isotrope dans chaque
direction et ce, pour un milieu sans contrainte. En présence de tissus structurés, l'eau
a tendance à suivre les prolongements d'axones plutôt que de traverser ceux-ci. Il est
donc possible de déduire que la mesure qui renferme la direction de déplacement des
molécules d'eau contient de l'information cachée sur les structures microscropiques.
Une phase de reconstruction permet ensuite d'estimer le prol de diusion angu-
laire à partir de l'ensemble des images de diusion acquises. Le modèle de diusion le
plus utilisé jusqu'à présent est le tenseur de diusion DTI [Tuch 2002] qui représente
les images de diusion par un champ de tenseurs d'ordre deux dont l'utilisation est
très attrayante pour l'étude de la structure interne de la SB du cerveau car le prol
angulaire de la diusion fournit de précieuses informations sur les faisceaux de bres
reliant les diérentes aires corticales. L'extraction de ces informations à partir de la
reconstruction DTI d'images cérébrales peut alors prendre plusieurs formes : indice
d'anisotropie (FA), quantité de diusion, etc. Cependant la DTI présente quelques
limitations au niveau de la représentation de croisements dans la conguration des
faisceaux de bres. Avec l'émergence des IRMs plus puissantes, permettant des ré-
solutions spatiales plus élevées, de nouvelles techniques d'IRMd à haute résolution
angulaire (HARDI) [Descoteaux 2008] ont vu le jour, utilisant des modèles mathé-
matiques de dimensions supérieures comme les tenseur d'ordres supérieurs et l'ima-

84
4.2. Travaux antérieurs et motivations

gerie q-Ball (QBI). Ces modèles permettent par exemple une meilleure détection des
croisements entres réseaux de bres, et résolvent la principale diculté rencontrée
avec le modèle DTI classique, mais au prix d'une augmentation non négligeable du
temps de l'examen clinique.
Ces modèles locaux de diusion permettent d'extraire les directions les plus
probables de diusion des molécules d'eau. À l'aide de ces informations de direc-
tion, il sera alors possible de reconstruire le réseau des faisceaux de bres de la
SB avec un procédé nommé tractographie. La tractographie est une classe d'algo-
rithmes dont l'objectif est d'estimer la structure de la SB en suivant les orientations
cohérentes, obtenues de l'IRM pondérée en diusion, parmi les voxels voisins. Les
algorithmes de tractographie ont pour dé d'utiliser au mieux l'information présente
dans chaque voxel et de produire un résultat respectant les hypothèses de structure
et de connectivité du réseau d'axones du cerveau [Hagmann 2003, Tournier 2007].
La tractographie produit des courbes 3D, appelées tractes ou streamlines.
Les méthodes de tractographie sont généralement divisées en deux sous-catégories,
les approches déterministes et celles probabilistes. Une revue de ces méthodes peut
être trouvée au chapitre 1. Les performances de chaque algorithme peuvent varier,
d'où l'importance du choix de l'algorithme.
Les algorithmes déterministes orent des méthodes simples et rapides. Toutefois,
ils restent sensibles au bruit, notamment dans les régions de croisement des stream-
lines, même si les algorithmes basés sur les techniques de reconstruction HARDI
montrent que le suivi de streamlines est amélioré. La tractographie probabiliste gé-
nère plus de streamlines erronées, mais aussi des estimations de faisceaux plus riches
et complètes [côté 2013].
Pour notre part, nous nous intéressons aux méthodes déterministes basées sur
des critères locaux an de déterminer la trajectoire des faisceaux. La plupart de ces
algorithmes utilisent le vecteur propre principal comme information de base pour
le calcul des trajectoires, certains algorithmes tel que TEND [Lazar 2003] utilisent
l'information du tenseur tout entier ce qui répond modérément à certaines limites
des méthodes déterministes basées sur le modèle DTI que l'on verra dans ce cha-
pitre. Bien que les algorithmes déterministes puissent sembler sourir de nombreuses
limites liées au bruit [Basser 2000] et aux eets du volume partiel [Alexander 2001],
plusieurs études [Aymeric 2011, Clarisse 2008, Burak 2007, Mori 1999] ont montré
que ces algorithmes représentent la quasi-totalité des méthodes actuellement mises
à la disposition des cliniciens pour l'étude des maladies neurodégénératives et la
planication neurochirurgicale. Pour cela, la méthode Eudx [Garyfallidis 2012b],
l'algorithme d'Euler, une autre approche qui combine deux méthodes déterministes
(Streamline et TEND) [Lazar 2003] ont été mises en application, en nous basant
une fois sur le modèle DTI et une seconde fois sur le modèle HARDI.
An d'évaluer la reproductibilité puis, comparer et analyser ces méthodes de
tractographies, des données synthétiques modélisant le croisement de deux fais-
ceaux de bres ont été générées ; les streamlines générés par les algorithmes sont
ensuite comparés avec les trajets, idéaux, connus, des données synthétiques. En-
n, les avantages et les inconvénients de chaque algorithme sont présentés et les

85
Chapitre 4. Clustering intra-sujet des bres neuronales

stratégies d'amélioration sont discutées.


Dans cette thèse, nous nous sommes intéressés, dans un premier temps, au clus-
tering des bres neuronales dans la base de données de tractographie, au sein d'un
même sujet. Deux catégories de méthodes ont été proposées dans la littérature.
La première catégorie est la segmentation basée sur les Régions d'intérêt (ROIs)
d'un atlas du cerveau [Catani 2008, Mori 2008, Wakana 2007]. Ces ROIs sont utili-
sées pour sélectionner ou exclure les streamlines de façon plus ou moins interactive
pour chaque sujet, an de reconstruire les faisceaux neuronaux connus. Ce type de
méthode nécessite des connaissances extensives sur l'anatomie cérébrale, plus préci-
sément sur la connectivité de la SB et des interactions intensives de l'utilisateur.
La deuxième catégorie est le clustering des streamlines basé sur les mesures de
similarité [Brun 2003, O'Donnell 2006]. Ces méthodes sont totalement automatiques
mais le nombre de streamlines qu'ils peuvent analyser est limité, car N streamlines,
engendrent (N ∗ (N − 1))/2 comparaisons entre les paires de ces streamlines.
Diverses approches du clustering intra-sujet basé similarité, décrites en détail
au chapitre 3, ont pour objectif de réduire la complexité computationnelle, ont
été proposées dans la littérature, comme par exemple, le clustering hiérarchique
[Corouge 2004, Zhang 2008, Guevara 2011b], le clustering spectral [O'Donnell 2006],
le clusteringfuzzy c-means [Li 2010], et le clustering basé sur les graphes, spéci-
quement la propagation d'anité [Jin 2015] et l'ensemble dominant [Dodero 2015].
Toutes ces méthodes ont une complexité d'ordre O(N 2 ) dans les meilleurs des
cas, où N est le nombre total des streamlines ; leur complexité augmente quadrati-
quement avec le nombre de streamlines.
D'autres approches utilisent des stratégies plus avancées, comme le K-plus proche
voisin [Ding 2003], le processus Gaussian [Wassermann 2010], le processus hiérar-
chique de Dirichlet [Wang 2011] et le clustering séquentiel agglomératif hiérarchique
[Demir 2015]. La limite de ces méthodes est qu'elles nécessitent de grands eorts de
la part des utilisateurs pour la sélection des paramètres. De plus, diérents post-
traitements additionnels peuvent être nécessaires. Ces méthodes essayent de faire
face au problème de très grande taille de la base de données de tractographie mais,
elles nécessitent plusieurs heures voire plusieurs jours pour les analyser.
Garyfallidis et al. [Garyfallidis 2012b] ont proposé, comme solution à ce pro-
blème, un algorithme simple et très rapide qu'ils ont dénommé "QuickBundles"
(QB) : il permet de réduire la taille de la base de données de tractographie à une
structure accessible en temps linéaire en fonction du nombre de streamlines. Cepen-
dant, cette méthode n'utilise aucun a priori anatomique an de guider le processus
de clustering, ce qui peut générer des clusters qui ne correspondent à aucun faisceau
anatomique. Récemment, une troisième catégorie a été développée, qui combine les
aspects de la segmentation basée ROIs et le clustering des streamlines basé simila-
rité, pour regrouper l'analyse de la connexion des structures et l'anatomie de la SB
[Li 2010, Jin 2015].

86
4.3. Evaluation des méthodes de tractographie

4.3 Evaluation des méthodes de tractographie


Dans le but d'étudier les performances des méthodes de tractographie détermi-
nistes basées sur les modèles de reconstruction DTI et HARDI, nous avons implé-
menté plusieurs méthodes de tractographie déterministes comme la méthode Euler,
Eudx et nous avons proposé une nouvelle méthode adaptative dans [Chekir 2012].
Nous avons eectué une évaluation qualitative de ces méthodes de tractographie, en
utilisant des données synthétiques dont la conguration est connue préalablement.

4.3.1 Méthodologies de tractographie


La méthode EuDX
Les auteurs ont proposé dans [Garyfallidis 2012b], une méthode de tractogra-
phie déterministe générale, nommée "Euler integration with trilinear interpolation"
(EuDX), qui fonctionne bien au niveau des croisements des streamlines.
Chaque voxel est représenté par un ou plusieurs vecteurs modélisant les crêtes
obtenues avec l'ODF. La méthode d'EuDX fait le suivi de plusieurs crêtes initialisées
à partir d'un seul point-germe, si leurs valeurs d'anisotropie sont supérieures à un
certain seuil. Ceci permet à l'algorithme d'être en mesure de générer diérentes
directions à partir du même point-germe pour remédier au problème de croisement
des streamlines.
An de créer des streamlines S , plusieurs points-germes ont été fournis initiale-
ment. Ils peuvent être choisis au hasard ou spéciés explicitement. Chaque point-
germe p0 devient le point de départ de la propagation d'une streamline. Pour l'in-
tégration, le système 4.1 suivant est résolu :
Z t
pt = p0 + V (p(s)) ds (4.1)
0

Et l'intégration numérique en utilisant la méthode d'Euler est eectuée selon


l'équation 4.2.

pn+1 = pn + V (pn )δs (4.2)


où δs est la taille du pas de propagation qui doit être au moins inférieure à
la taille de voxel et V est la direction de propagation. Pour les critères d'arrêt
d'EuDX, une fonction scalaire standard comme la Fraction d'Anisotropie (FA) peut
être utilisée, mais nous pouvons également utiliser des fonctions vectorielles comme
l'Anisotropie Quantitative (QA), ou même la Fonction de Densité d'Orientation
(ODF) [Descoteaux 2008].
L'algorithme EuDX est décrit de la manière suivante : A(ui ) représentant un
champ vectoriel dans lequel chaque point contient les directions des crêtes superpo-
sées aux valeurs d'anisotropie, est estimé à chaque point du volume. Une liste vide de
streamlines est créée T = ∅ et ensuite des points-germes aléatoires ou pré-spéciés
sont générés.

87
Chapitre 4. Clustering intra-sujet des bres neuronales

Ces points-germes sont propagés vers une seule direction donnée par l'équation
4.3 :

V (pn ) = argu maxA(u) (4.3)

Ils sont également propagés dans le sens inverse de cette direction −V (pn ). La
condition d'arrêt de suivi d'EuDX est établie. Elle prend comme entrée, un seuil pour
l'anisotropie Athr . Si A(pn ) < Athr , EuDX cesse de se propager. Sinon, il ajoute le
point à la streamline en cours. Cela peut être utile pour annuler les points-germes
qui se trouvent dans le fond ou dans des zones qui correspondent à l'absence de bre
où le suivi n'est pas recommandé.
Une interpolation trilinéaire est alors utilisée pour trouver la direction de propa-
gation suivante an de générer une tractographie lisse, selon les étapes suivantes :
 Nous trouvons la direction la plus proche du point-germe de la direction
initiale V (pn ), pour chaque direction de crête ui , de chacun coin des 8 coins
du voisinage du point-germe.
 Si arccos(xi , pn ) ≤ θthr , on compte le poids correspondant ; autrement conti-
nuer jusqu'au poids suivant et vérier simultanément la condition A(u) <
Athr .
 Tous les poids adjacents contribueront à la nouvelle direction selon l'équation
4.4 suivante :

´ n) = (4.4)
X
V (p wm V (pm )
m

´
où V (pm ) = kVV (p´m )k est normalisé.
(pm )

Le point suivant est calculé avec l'équation 4.1. Le nouveau point de la streamline
est inséré et le suivi est perpétué jusqu'à ce que l'un des critères d'arrêt soit respecté.
Toutes ces étapes sont répétées dans la direction opposée de la direction de
propagation initiale V (p0 ).
Enn, la procédure est répétée pour le prochain point-germe, jusqu'à ce que tous
les points-germes soient visités. Lorsque toutes les points-germes auront été visitées,
nous obtiendrons la totalité de la base de données de tractographie.

4.3.1.1 Approche adaptative


Nous avons proposé une nouvelle approche de tractographie adaptative, com-
binant deux algorithmes déterministes ; Streamline (STT) [Mori 1999] qui utilise
uniquement le vecteur propre principal pour déterminer la direction des streamlines
et l'algorithme TENsor Déexion (TEND) [Lazar 2003] qui utilise la totalité de
l'information contenue dans le tenseur de diusion. An de pouvoir comparer cette
approche nous avons implémenté également un autre algorithme déterministe Euler
qui se base sur le vecteur propre interpolé.

88
4.3. Evaluation des méthodes de tractographie

La méthode d'interpolation par Euler Cette méthode est basée sur le dé-
veloppement de Taylor de premier ordre exploitée dans les travaux de [Mori 1999,
Alexander 2001]. Elle utilise l'équation 4.5 suivante :

´0 )(s1 − s0 ) + O(s1 + s0 )
r(s1 ) = r(s0 ) + r(s (4.5)
Avec r(s´0 ) tangente à la trajectoire r(s0 ) suivant le vecteur V1 , sachant que :
r(s0 ) = V1 (r(s0 )) et α = s1 − s0 qui est le pas de l'algorithme prenant ses valeurs
´
entre 0 et L (L étant la taille du voxel). On obtient donc l'équation 4.6 :

r(s1 ) = r(s0 ) + V1 (r(s0 )) × α + O(α) (4.6)


Cette équation 4.6 est appliquée de manière itérative, partant d'un point-germe
r0 = r(s0 ) jusqu'à arriver à l'un des critères d'arrêt de l'algorithme.

La méthode streamline C'est une technique dont le modèle de propagation suit


le vecteur propre principal [Mori 1999, Alexander 2001].

La méthode TEND Lazar et al. proposent dans [Lazar 2003] un modèle de suivi
de streamlines fondé sur une déexion des trajectoires, induite par tenseurs. Il s'agit
de la méthode TEND (TENsor Déexion). Lors de la propagation, la nouvelle di-
rection prend en compte le tenseur de diusion local D et la direction incidente Vin ,
tangente à la streamline. Ainsi, en notant Vout , la nouvelle direction dite sortante
par rapport au point courant, elle est donnée par l'équation 4.7 :

~out = D × V
V ~in (4.7)
La gure 4.1 illustre le comportement de l'algorithme pour diérentes formes du
tenseur local.

Figure 4.1  Exemple du comportement de la méthode TEND avec diérentes


formes d'ellipsoïdes [Source : [Lazar 2003]].

 Pour λ1  λ2 , λ3 , la diusion est fortement anisotrope, le vecteur sortant


sera dévié selon le vecteur propre principal ;
 Pour λ1 ≈ λ2  λ3 , la diusion est planaire dans ce cas, si le vecteur entrant
est parallèle au plan de diusion il ne sera pas dévié ;
 Pour λ1 ≈ λ2 ≈ λ3 , la diusion est isotrope, le vecteur sortant est presque
égal au vecteur entrant.

89
Chapitre 4. Clustering intra-sujet des bres neuronales

Approche adaptative La manière avec laquelle les deux algorithmes (Stream-


Line et TEND) sont combinés pour déterminer le prochain vecteur de propagation
(Vprop ) dépendant de la forme du tenseur de diusion locale, est donné par l'équation
suivante 4.8 :

Vprop = f V1 + (1 − f )[(1 − g)Vin + gD × Vin ] (4.8)


Pour notre implémentation, nous avons décidé de prendre : f = Cl. Le coecient
de linéarité, donné par l'équation 4.9 :

λ1 − λ2
Cl = (4.9)
λ1 + λ2 + λ3
g = W Paramètre de contrôle.
Nous avons fait varier le paramètre de contrôle W , qui prend les valeurs comprises
entre 0 et 1, an d'obtenir de meilleures précisions pour notre tractographie. Nous
remplacons la valeur Cl, dans l'équation 4.9 et nous obtenons l'équation 4.10 :

~out = ClV
V ~1 + (1 − Cl)((1 − w)V
~in + wD × V
~in ) (4.10)
La direction de propagation est une combinaison de trois vecteurs. Le vecteur
propre principal V~1 , le vecteur entrant V~in et le vecteur  sortant  V~out et cela an
de stabiliser la propagation tout en s'adaptant aux caractéristiques de la diusion
de la région. Pour l'implémentation de cet algorithme, nous avons utilisé la méthode
d'intégration d'Euler.

4.3.2 Expérimentations, résultats et discussion


4.3.2.1 Données synthétiques
An de pouvoir valider les résultats de l'approche adaptative proposée dans
cette étude et évaluer les performances des algorithmes de tractographie détermi-
nistes, nous avons été amenés à construire des données synthétiques de diusion
avec diérentes congurations de streamlines en se basant sur la méthode décrite
dans [Barmpoutis 2010].
Comme dans le cas des données réelles, nous devons spécier les paramètres
d'acquisition (les b-valeurs et l'ensemble des orientations magnétiques de gradients)
pour obtenir un signal de l'IRM de diusion simulé.
Dans notre cas, nous avons pris à titre d'exemple une tranche de dimension
32 × 32 voxels avec un ensemble de 22 orientations de gradients, le premier gradient
correspond à une faible pondération en diusion (S0 ) et le reste des 21 gradients a
la même valeur de pondération en diusion b = 1500s/mm2 .
Nous avons créé une variété de structures breuses : Deux faisceaux de stream-
lines qui se croisent avec un angle de 90◦ (gure 4.2(b)), deux faisceaux de stream-
lines qui se croisent au centre du champ où l'un des faisceaux de streamlines est
incurvé de sorte que le passage corresponde à diérents angles d'intersection entre

90
4.3. Evaluation des méthodes de tractographie

les streamlines à chaque voxel (gure 4.2(c)), un seul faisceau de streamlines incurvé
(gure 4.2(a)).
Nous avons créé deux types de données, le premier type en utilisant le tenseur de
diusion, calculé avec la méthode des moindres carrés pour chaque voxel, diagonalisé
pour obtenir les valeurs propres et les vecteurs propres. La carte de la fraction
d'anisotropie a été dérivée de ces données.
Le deuxième type de données est générée en utilisant un modèle de reconstruc-
tion HARDI appelé Constant Solid Deconvolution (CSD) [Aganj 2010] basé sur la
déconvolution sphérique (SD), qui fournit une estimation de la distribution d'orien-
tation des bres (FOD). La fonction de réponse a été estimée en utilisant des voxels
avec une valeur d'anisotropie fractionnaire (FA) supérieure à 0,7 et une harmonique
d'ordre maximale de 8.

(a) (b) (c)

Figure 4.2  Visualisation des données synthétiques simulées, représentation par


carte couleur FA. (a) Un faisceau de bres incurvé. (b) Croisement de deux faisceaux
de bres à 90 degrés. (c) Croisement de deux faisceaux de bres avec diérentes
angles.

4.3.2.2 Expérimentations et résultats


Nous avons implémenté plusieurs méthodes de tractographie déterministes comme
la méthode Euler, Eudx et notre méthode adaptative proposée dans cette étude.
Ceci nous a permis d'évaluer la précision des résultats obtenus avec notre mé-
thode de tractographie, comparée aux autres méthodes.
Toutes ces méthodes ont été testées sur des données synthétiques, simulées avec
l'outil Fandtasia [Barmpoutis 2010], avec les diérentes congurations décrites ci-
dessus, après une reconstruction mathématique sur le signal de diusion généré en
premier lieu, avec le modèle DTI et en deuxième lieu avec le modèle HARDI. Les
gures (4.3, 4.4, 4.5) illustrent les résultats obtenus.
Nous constatons dans le cas d'un seul faisceau de streamlines, que tous les al-
gorithmes de tractographie, avec les modèles DTI et HARDI, ont été en mesure
de reconstruire les faisceaux tels qu'ils sont réellement (gure 4.3). Les résultats té-
moignent ainsi de la réussite du suivi de bres dans les régions fortement anisotropes
où les structures breuses suivent une direction privilégiée de diusion (gure 4.3).

91
Chapitre 4. Clustering intra-sujet des bres neuronales

(a) Données synthé-


tiques

(b) Euler sur DTI (c) Euler sur HARDI (d) Notre méthode sur
DTI

(e) Notre méthode sur (f) EuDX sur DTI (g) EuDX sur HARDI
HARDI

Figure 4.3  Un seul faisceau de streamlines incurvé.

Dans le cas d'un croisement à 90 degrés de deux faisceaux de streamlines, notre


algorithme adaptatif a réussi à traverser la zone de croisement en reconstruisant des
streamlines qui suivent correctement les vraies trajectoires (gure 4.4(d, e)), que
ce soit dans le cas du modèle DTI ou de celui de HARDI et ce contrairement à la
méthode d'Euler qui reconstruit juste le début des streamlines et arrête le suivi dès
qu'elle rencontre un croisement aussi bien pour le modèle DTI que pour celui de
HARDI (gure 4.4(b, c)). La méthode EuDX a réussi, quant à elle, à reproduire
correctement les deux faisceaux dans le cas des données synthétiques basées sur le
modèle HARDI et a échoué dans le cas du modèle DTI (gure 4.4(f, g)).
Dans le cas d'un croisement de deux faisceaux de streamlines avec diérents
angles, l'algorithme Euler comme dans le cas précédent reconstruit juste le début
des streamlines pour les deux modèles DTI et HARDI (gure 4.5(b, c)), tandis
que l'algorithme adaptatif permet de propager plus loin les streamlines, tout en les
détournant de leurs vraies trajectoires lorsqu'elles arrivent à la zone de croisement,
que ce soit avec les modèles DTI ou HARDI (gure 4.5(d, e)). Donc l'approche

92
4.3. Evaluation des méthodes de tractographie

(a) Données synthé-


tiques

(b) Euler sur DTI (c) Euler sur HARDI (d) Notre méthode sur
DTI

(e) Notre méthode sur (f) EuDX sur DTI (g) EuDX sur HARDI
HARDI

Figure 4.4  Deux faisceaux de streamlines qui se croisent à 90 degrés.

adaptative malgré sa capacité à traverser les régions de faibles anisotropies, peut


entrainer des trajectoires erronées.
La méthode EuDX réussit, pour sa part, à traverser les zones de croisement et à
reproduire parfaitement la réalité terrain des données synthétiques pour le modèle
HARDI (gure 4.5(g)). Nous pouvons dire alors que la méthode de tractographie
EuDX permet, pour le modèle HARDI, d'améliorer considérablement les résultats
de tractographie dans les régions de croisement de streamlines.

4.3.2.3 Discussion
Ce travail met en lumière la limite principale du modèle tensoriel classique qui se
situe au niveau des croisements des streamlines. Nous avons obtenu avec toutes les
méthodes de tractographie basées sur le modèle DTI, des résultats non satisfaisants
dans les régions de croisement de streamlines, pour la raison évidente que dans les
régions où nous avons une diusion planaire, le vecteur principal n'est pas en mesure

93
Chapitre 4. Clustering intra-sujet des bres neuronales

(a) Données synthé-


tiques

(b) Euler sur DTI (c) Euler sur HARDI (d) Notre méthode sur
DTI

(e) Notre méthode sur (f) EuDX sur DTI (g) EuDX sur HARDI
HARDI

Figure 4.5  Deux faisceaux de streamlines qui se croisent avec diérentes angles.

de caractériser correctement les deux compartiments de streamlines de ces régions.


Les résultats de cette étude montrent clairement que cette limite peut être levée
en utilisant des méthodes de tractographie fondées sur les modèles HARDI.
Les approches de tractographie fondées sur le modèle HARDI, sont clairement
une grande amélioration par rapport aux méthodes basées sur le modèle DTI dans le
cas des congurations complexes de streamlines, particulièrement avec la méthode
EuDX qui donne les meilleurs résultats.
En se basant sur cette étude, nous avons opté pour la méthode de tractographie
déterministe EuDX [Garyfallidis 2012b], dans la suite de nos travaux, en utilisant
un modèle de reconstruction HARDI appelé Constant Solid Deconvolution (CSD)
pour générer correctement nos bases de données de tractographie. La précision des
résultats des méthodes de clustering que nous appliquerons sur celles-ci, dépendra
fortement de la qualité des bases de données de tractographie déterminées durant
cette première étape.

94
4.4. Clustering intra-sujet des bres neuronales

4.4 Clustering intra-sujet des bres neuronales


4.4.1 Une méthode de segmentation hybride
Nous avons proposé dans [Chekir 2014], une approche automatique de segmen-
tation et de classication intra-sujet des streamlines de la SB cérébrale, qui combine
les aspects des deux catégories de segmentation, le clustering basé sur la similarité
et la segmentation basée sur l'a priori anatomique.
Cette méthode opère selon deux niveaux complémentaires. Au premier niveau,
l'algorithme QuickBundle (QB) [Garyfallidis 2012b] est utilisé an de réduire la
taille de l'ensemble de données de tractographie. Le deuxième niveau permet d'in-
corporer des connaissances anatomiques par le biais d'un atlas référentiel construit
pour notre étude, an de guider le processus de segmentation.

4.4.1.1 Le Clustering avec l'algorithme QuickBundles


À ce premier niveau de notre approche, l'algorithme QB, dont le principe est
détaillé dans [Garyfallidis 2012b], est appliqué an de réduire la taille de la base de
données de la tractographie, d'un million à quelques centaines de clusters homogènes.
Les clusters résultants sont réguliers et composés par des streamlines de formes et
de positions similaires. Chaque cluster est représenté par une seule streamline re-
présentante appelée "médoïde" inspirée de l'algorithme K-Medoids [Kaufman 1987].
L'algorithme QB a été appliqué avec un seuil de 15 mm de distance. Les streamlines
ont été échantillonnés pour avoir seulement 21 points, car le QB exige que toutes les
streamlines aient le même nombre de points. Les principaux avantages du QB sont
sa simplicité et sa rapidité. Il est donc recommandé lorsque de grands ensembles
de données sont impliqués. Cependant, il ne tient pas compte des connaissances
anatomiques disponibles et n'utilise aucune information anatomique pour guider le
regroupement ; les clusters résultants peuvent ne pas correspondre à des faisceaux
anatomiques comme le montre la gure 4.6.
Le principe de l'algorithme QB est donné avec le pseudo code de l'algorithme 1.

(a) (b) (c)

Figure 4.6  Le clustering QB appliqué à la totalité du cerveau. (a) la tractographie du cerveau


entier constituée de 1 200 000 streamlines. (b), les diérents clusters avec des couleurs aléatoires.
(c), les 2 494 streamlines médoïdes colorées selon leur cluster d'appartenance.

95
Chapitre 4. Clustering intra-sujet des bres neuronales

Algorithm 1 Le principe de l'algorithme QB.


1: Input :T={s1 , ...., si , ..sn }, θ
2: Output : C=[c1 , .., ck , ...cm ]
3: Création du premier cluster
4: c1 ← ([1], s1,1 )
5: c ← [c1 ]
6: M ←1
7: for i=2 to N do
8: alld ← innity(M)
9: f lip ← Zeros(M)
10: for k=1 to M do
11: v ← ck × h/ck × n)
12: d ← ddirect(t,v)
13: f ← dipped(t,v)
14: Evaluer la distance MDF
15: if f < d then
16: d←f
17: f lipk ← 1
18: end if
19: alldk ← d
20: end for
21: m ← min(alld)
22: l ← argmin(alld)
23: if m < θ then
24: Ajouter au cluster curent
25: if f lipl is 1 then
26: cl × h ← cl × h + tF
27: else if then
28: cl × h ← cl × h + t
29: end if
30: cl × h ← cl × h + 1
31: append (cl × I , i)
32: else if then
33: Création d'un nouveau cluster
34: cM +1 ← ([i], t, 1)
35: append ((c, cM +1 )
36: M ← M+1
37: end if
38: end for

4.4.1.2 L'étiquetage automatique


Le deuxième niveau de notre approche consiste à incorporer des connaissances
anatomiques déterminées à l'aide de notre atlas, conçu pour cette partie d'intégra-

96
4.4. Clustering intra-sujet des bres neuronales

tion des connaissances anatomiques dans le processus de segmentation.

Construction semi-automatique d'un atlas de la SB Nous avons créé un


atlas de faisceaux de la SB semi-automatiquement, à partir des données de trac-
tographie du premier sujet en utilisant l'outil Trackvis 1 et le modèle ICBM-152
appelé WFPM Type II Eve Atlas [O'Donnell 2007] qui contient une parcellisation
de 130 régions d'intérêts (ROIs). Les données réelles des sujets ont été recalées dans
le même espace de ce modèle, en utilisant une transformation ane, pour ajuster
globalement la position du cerveau, la rotation et la taille, avec l'outil de recalage des
images linéaires FLIRT, contenu dans la suite logicielle FSL 2 . Ensuite, une trans-
formation non linéaire est appliquée, avec l'outil de recalage non linéaire FNIRT
inclus dans FSL, pour assurer un meilleur recalage.
La carte de parcellisation des matières grise et blanche de l'atlas Eve établi dans
l'étude de [Oishi 2008], a été superposée aux données du sujet et, les étiquettes
des ROIs ont été réaectées à ces données. Les streamlines de la base de données
de tractographie, qui traversent les ROIs sont extraites selon la description anato-
mique des faisceaux dans [Zhang 2010] pour former un faisceau d'intérêt (Bundle
Of Interest BOI). Par exemple, le faisceau cortico-spinal est composé de stream-
lines passant entre le gyrus précentral et le pédoncule cérébrale. Chaque faisceau a
été amélioré manuellement en supprimant les outliers visibles. L'atlas de faisceaux
créé contient 13 faisceaux de la SB (voir la première ligne dans la gure 4.7(a,
b, c)) (le faisceau corticospinal (CST) gauche / droit, le faisceau uncinée (UNC)
droit/gauche gauche / droit, le faisceau longitudinal supérieur (SLF) gauche / droit,
le faisceau fronto-occipital inférieur (IFO) droit / gauche, le faisceau longitudinal
inférieur (ILF) gauche et les 11 segments du corps calleux (CC), Gyrus lingual, gyrus
occipital supérieur, gyrus occipital moyen et rectus). Nous notons que le faisceau
cortico-spinal ou CST est le faisceau principal associé au mouvement volontaire ; les
lésions du CST peuvent entraîner diérents niveaux de paralysie.
Une fois l'atlas des faisceaux créé, il est utilisé pour introduire l'information ana-
tomique au deuxième niveau de segmentation. Chaque cluster résultant du clustering
"QB", lors du premier niveau de notre approche, est assigné à son "BOI" correspon-
dant dans l'atlas. Un ou plusieurs clusters générés avec l'algorithme "QB", peuvent
êtres assignés au même "BOI", en se basant sur la technique du plus proche voisin,
en utilisant la distance MDF [Garyfallidis 2012b] entre les streamlines médoïdes du
"BOI" de l'atlas et les streamlines médoïdes des clusters issus du clustering "QB".
L'ensemble de paires de distances est obtenu en quelques minutes. La distance MDF
ne peut être appliquée que lorsque les deux streamlines ont le même nombre de
points. Nous avons eectué un échantillonnage des streamlines médoïdes des BOIs
pour avoir 21 points équitablement répartis, par une simple interpolation linéaire. Le
seuil a été adapté manuellement à chaque BOI (entre 8 et 10 mm) en tenant compte
de la longueur moyenne de la streamline et de la proximité avec d'autres faisceaux
1. http://trackvis.org/
2. https://fsl.fmrib.ox.ac.uk/fsl/

97
Chapitre 4. Clustering intra-sujet des bres neuronales

d'atlas, conduisant à des seuils plus élevés pour les faisceaux longs et isolés.

4.4.2 Expérimentations, résultats et discussions


4.4.2.1 Données réelles
Notre méthode a été testée sur trois bases de données de tractographie, estimées à
partir des données réelles de sujets sains acquises avec une IRM 3T Signa Excite (GE
Medical Systems, Milwaukee, WI), au centre d'imagerie cognitive et neurobiologique
de l'université de Stanford 3 . La base de données de tractographie du premier sujet
a été utilisée pour la construction de l'atlas de la SB et les deux autres bases de
données de tractographie des deux autres sujets ont été utilisées pour valider notre
approche de segmentation-classication hybride. La valeur b de ces données est de
2000s/mm2 , 10 images non pondérées en diusion (b = 0) ont été acquises au début
du balayage, suivie de 150 directions avec diérentes pondérations de diusion. La
résolution du voxel de toutes les données est de 2 mm isotrope.

4.4.2.2 Evaluation quantitative


Notre méthode a été testée sur deux bases de données de tractographie, estimées
à partir des données réelles de sujets sains. Elle permet de tirer les avantages du
clustering oerts par l'algorithme "QB", tout en la complétant avec l'injection de l'a
priori anatomique an d'augmenter la précision des résultats. Notre méthode a réussi
à bien extraire automatiquement 13 faisceaux majeurs, illustrés à la gure 4.7 : le
faisceau cortico-spinal droit/gauche (CST), le faisceau uncinée droit/gauche (UNC),
le faisceau longitudinal inférieur droit/gauche (ILF), le faisceau Occipito-frontal
droit/gauche (IFO), le faisceau longitudinal supérieur(SLF), et les 11 partitions du
corps calleux à la gure 4.8.
An d'évaluer la précision des résultats obtenus par notre méthode, nous la
comparons aux faisceaux de notre atlas standard qui représentent la réalité terrain de
la SB. Diverses mesures de la qualité du clustering ont été choisies pour déterminer
le degré de correspondance entre eux comme la diusivité quantitative et l'analyse
de "Kappa" [Moberts 2005].

L'analyse de Kappa Les diérents faisceaux obtenus à l'aide de notre méthode


et les faisceaux de l'atlas sont convertis en cartes binaires, dans lesquelles chaque
pixel occupé par le faisceau est déni à 1, et les autres à 0. Les deux cartes sont
superposées l'une sur l'autre et la valeur de Kappa est calculée pour la comparaison
des faisceaux. La moyenne de ces valeurs de Kappa de tous les faisceaux est calculée
pour chaque sujet. Sachant qu'avec une valeur de Kappa entre 0.11-0.35 l'accord
entre les faisceaux est considéré léger, 0.21-0.4 équitable, 0.61-0.80 substantiel et
0.81-1.0 presque parfait.
Les faisceaux obtenus par notre méthode de segmentation-classication ont des
valeurs de Kappa considérablement élevées avec une moyenne de Kappa pour tous
3. http://cni.stanford.edu/

98
4.4. Clustering intra-sujet des bres neuronales

(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

Figure 4.7  Les résultats du clustering des streamlines. (a, b, c) illustrent l'atlas représentatif
des faisceaux construits. (d, e, f, g, h, i) illustrent les résultats obtenus avec notre méthode de
segmentation automatique, pour les deux sujets. (a, d, g) vues axiales du haut, (b, e, h) vues
sagittales gauches et (c, f, i) vues axiales du bas, des principaux faisceaux, distingués en couleur.

les faisceaux, supérieure à 0.70, ce qui conrme le grand accord entre les faisceaux
trouvés avec notre méthode et nos faisceaux de référence, démontrant ainsi la capa-
cité de la méthode proposée à extraire correctement des faisceaux cohérents.
La gure 4.9(a) montre les mesures de Kappa pour les faisceaux de deux en-
sembles de données. Les valeurs de Kappa sont ainsi assez élevées pour tous les
faisceaux. Le cortico-spinal droit obtient le plus petit indice d'accord (Kappa =
0,69), le corps calleux correspond au meilleur accord (Kappa = 0,95).

L'analyse de la diusivité quantitative Une autre méthode de validation a été


considérée pour conrmer les bonnes performances de notre approche, en calculant
la corrélation des valeurs FA des 13 faisceaux entre les deux sujets et l'atlas. Le
résultat est illustré à la gure 4.9(b). Nous avons calculé la FA moyenne sur tous

99
Chapitre 4. Clustering intra-sujet des bres neuronales

(a) (b) (c)

Figure 4.8  Multiples subdivisions du corps calleux. (a) Subdivisions du corps


calleux dans l'atlas, en couleurs diérentes. (b) et (c) Subdivisions du corps calleux
obtenues par notre méthode de segmentation, pour les deux sujets.

les voxels des cartes FA, parcourus par ces faisceaux spéciques. La corrélation
moyenne de FA de tous les 13 faisceaux obtenus est assez élevée (R = 0.94 ± 0.03),
ce qui indique que notre méthode de segmentation-classication génère des faisceaux
exacts et précis.

4.5 Conclusion
Dans ce chapitre, nous avons présenté d'une part, une étude comparative des
diérents algorithmes de tractographie déterministes d'abord, en nous basant sur
une reconstruction DTI puis, en utilisant une reconstruction HARDI et ce, sur des
données synthétiques. Cette étude nous a permis de choisir les meilleures méthodes
du pré-traitement pour générer une base de données de tractographie d'une bonne
qualité.
D'autre part, nous avons développé une approche hybride automatique puissante
de segmentation-classication intra-sujet des streamlines de la SB cérébrale. Cette
approche utilise d'un côté, l'algorithme "QB" qui permet de faire face à la grande
taille et à la complexité de l'ensemble de données et de l'autre côté, des connaissances
anatomiques fournies par un atlas, construit dans cette étude, an d'augmenter
l'ecacité et la précision des résultats de notre méthode.
Cependant, le clustering des données de la SB issues d'un seul sujet est in-
susant pour établir un modèle de faisceaux à travers une population, parce que
l'architecture de la SB est variable d'un sujet à l'autre et très complexe.
Dans les chapitres suivants, nous proposons une solution à ce problème de deux
manières diérentes, la première à travers un clustering statique et la deuxième avec
une méthode de clustering dynamique.

100
4.5. Conclusion

(a) La comparaison des valeurs kappa obtenues avec les faisceaux des deux sujets.

(b) La corrélation des valeurs FA des 13 faisceaux entre les deux sujets et l'atlas.

Figure 4.9  Evaluation Quantitative des résultats

101
Chapitre 5

Clustering inter-sujets statique


des bres neuronales

Imagination will often carry us to worlds that never were. But


without it we go nowhere. Carl Sagan.

Sommaire
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
5.2 Travaux antérieurs et motivations . . . . . . . . . . . . . . . 104
5.3 Une méthode séquentielle basée sur la densité . . . . . . . . 105
5.3.1 Le clustering basé sur la densité . . . . . . . . . . . . . . . . 106
5.3.2 L'estimation et l'injection des représentants . . . . . . . . . . 109
5.4 Expérimentations, résulats et discussion . . . . . . . . . . . . 110
5.4.1 Expérimentation et résultats sur les données synthétiques . . 110
5.4.2 Expérimentation et résultats sur les données réelles . . . . . . 112
5.5 Avantages et limites de la méthode séquentielle basée sur
la densité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
5.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
Chapitre 5. Clustering inter-sujets statique des bres neuronales

5.1 Introduction
Nous avons présenté dans le chapitre précédent une méthode hybride de cluste-
ring intra-sujet robuste, capable d'analyser des jeux de données très grands, conte-
nant plus d'un million de streamlines par sujet. Elle permet d'obtenir pour chaque
sujet un ensemble de faisceaux principaux. Cependant, ces faisceaux sont diérents
d'un sujet à l'autre et ne considèrent pas la variation de la SB à travers une popu-
lation de sujets.
Pour surmonter ce problème, dans ce chapitre nous présentons une méthode
séquentielle de clustering inter-sujets basée sur la densité, qui permet une inférence
d'un modèle composé d'une liste de faisceaux génériques présents dans la plupart
des sujets.
Nous commençons par détailler le principe de cette méthode, les résultats obte-
nus sur des données réelles et synthétiques ainsi que leurs validations.
Nous nalisons par une conclusion, en discutant les avantages et les limites de
cette méthode.

5.2 Travaux antérieurs et motivations


An de mieux comprendre le fonctionnement du cerveau humain et améliorer
ainsi la détection de plusieurs maladies neurodégénératives, un modèle de faisceaux
représentant la variation de la SB à travers les sujets doit être établi, en utilisant
un clustering inter-sujets des streamlines de la SB.
Diverses approches ont été proposées pour le clustering inter-sujets des stream-
lines de la SB, détaillées dans le chapitre 3.
Dans [Wang 2011], un cadre bayésien utilisant un mélange de processus de Di-
richlet hiérarchique (HDPM) a été utilisé pour l'apprentissage sans supervision des
modèles de faisceaux à partir des données de tests, puis ce modèle a été utilisé
comme a priori pour le clustering dans la base de données de tractographie de nou-
veaux sujets. Cette méthode est capable de regrouper un ensemble de plus de 120
000 streamlines, mais des ensembles de streamlines plus importants dégradent la
qualité des résultats.
Les auteurs dans [Visser 2011] ont proposé de regrouper les partitions de don-
nées, en utilisant le clustering hiérarchique à plusieurs reprises, suivi par l'analyse
des aectations des clusters pour créer les faisceaux naux de toute la base de don-
nées de tractographie de manière évolutive.
Guevara et al. ont aussi proposé dans [Guevara 2011b] une méthode de clustering
hiérarchique qui utilise un clustering intra-sujet pour simplier les données, suivi
par un clustering inter-sujets an d'établir un modèle de faisceaux à travers une
population de sujets.
Dans [Prasad 2014], les auteurs ont utilisé l'étiquetage basé sur un atlas de la
SB et les chemins de densité maximale pour construire des modèles de faisceaux.
Plus récemment, Dodero et al. ont proposé une méthode basée sur un algorithme
"Dominant Sets" et utilisant deux niveaux de clustering [Dodero 2015], un clustering

104
5.3. Une méthode séquentielle basée sur la densité

intra-sujet suivit par un clustering inter-sujets.


Dans [Garyfallidis 2015], les auteurs ont proposé "Streamline-based Linear Re-
gistration (SLR)", une méthode basée sur le QB algorithme qui peut être utilisé
pour le clustering inter-sujets.
Les approches de clustering inter-sujets ont aussi été utilisées pour créer des
atlas de la SB, considérant la variation de cette dernière à travers plusieurs sujets
[Jin 2015, Ziyan 2009].
La limitation de ces méthodes est qu'elles nécessitent un eort de l'utilisateur
pour la sélection des paramètres. De plus, diérentes étapes supplémentaires de
post-traitement peuvent être nécessaires. Ces méthodes essaient de faire face à la
contrainte de la taille des jeux de données, mais elles nécessitent plusieurs heures
à plusieurs jours pour s'exécuter sur un ensemble de données de taille standard
(environ un million de streamlines par un seul sujet). Elles sourent alors d'un
manque d'ecacité en temps de calcul.
De plus, la base de données de tractographie contient un grand nombre de fausses
courbes en raison de la qualité des données de diusion, des erreurs de tractogra-
phie et d'autres facteurs considérés comme des outliers anatomiques qui aectent
la connectivité. Les méthodes de clustering doivent donc être robustes aux outliers
an de trouver des clusters valides.
Mises à part, quelques méthodes récentes telles que celles décrites dans [Ros 2013,
Guevara 2011b, Dodero 2015, côté 2013, Ziyan 2009], la plupart des approches n'in-
cluent pas un mécanisme d'élimination des outliers, ce qui est essentiel pour un
résultat de clustering robuste.
Les auteurs de [Ziyan 2009] utilisent la maximisation d'espérance généralisée
(EM) pour l'élimination des outliers.
Guevara et al. dans [Guevara 2011b] utilisent une carte de densité des streamlines
pour éliminer les outliers, mais la méthode utilisée ne considère que la taille du
cluster pour le classer comme outliers.
Ros et al. dans [Ros 2013] intègrent des facteurs locaux des outliers (LOF) dans
leur technique de clustering, basée sur un degré relatif d'isolement des streamlines
pour éliminer les outliers.
Dodero et al. dans [Dodero 2015] détectent les streamlines outliers en utilisant
la courbe gaussienne et des tests statistiques.
Récemment, côté et al. dans [côté 2013] proposent une technique probabiliste
d'élimination des outliers basée sur une utilisation hiérarchique de l'algorithme QB.
Cependant, les résultats de ces méthodes dépendent fortement d'un seuil xe déni
manuellement ou nécessitent de connaître a priori le nombre de clusters.

5.3 Une méthode séquentielle basée sur la densité


Nous avons proposé une nouvelle méthode de clustering inter-sujets basée sur
la densité dans [Chekir 2017b], qui permet de remédier aux limites des méthodes
existantes de clustering citées ci-dessus. Une manière simple et automatique est

105
Chapitre 5. Clustering inter-sujets statique des bres neuronales

d'incorporer l'information issue du clustering d'un sujet pour guider le clustering du


sujet suivant an d'augmenter la précision des résultats en renforçant les critères de
décision.
Plus précisément, notre méthode considère les streamlines de l'ensemble de la
tractographie, issue de diérents sujets comme un ux de données venant de plu-
sieurs sources. Ce ux de données est divisé en partitions an de maintenir uni-
quement une seule partition, à la fois, en mémoire. Ensuite, nous appliquons un
algorithme de clustering sur cette partition, ce qui génère un ensemble de clusters
pour lesquels nous calculons des représentants. Ces streamlines représentants sont
injectées dans le clustering de la partition suivante et ainsi de suite jusqu'à la der-
nière partition.
Les résultats de cette méthode sont les faisceaux naux issus du clustering du
dernier sujet, considérant la variation de la SB à travers tous les sujets. Pour chaque
partition du ux de données, deux phases de traitement sont exécutées.

5.3.1 Le clustering basé sur la densité


Dans cette première phase, nous avons appliqué l'algorithme "Density-based
spatial clustering of applications with noise (DBSCAN)" [Ester 1996]. Notre choix
s'est porté sur cet algorithme, car sa dénition est intuitive dans notre contexte
et il n'a jamais été utilisé pour le clustering des streamlines de la SB malgré les
améliorations qu'il apporte par rapport aux méthodes existantes, comme nous allons
le constater plus loin dans ce chapitre.

5.3.1.1 Notions de Cluster basé sur la densité


L'algorithme DBSCAN [Ester 1996] est basé sur l'idée de dénir la notion de
voisinage de rayon ε d'un point comme l'illustre la gure 5.1 : tous les points situés à
une distance de ce point inférieure à ε appartiennent au voisinage. Pour qu'une classe
soit identiée, il est nécessaire qu'un voisinage contienne plus d'un nombre minimal,
noté M inP oints, d'autres points. Les clusters sont alors agrandis en associant de
proche en proche les points des voisinages qui respectent les conditions précédentes.
DBSCAN utilise la notion de densité-connecté pour former des classes :
 Un point est dit directement dense-accessible (ε − M inP oints) d'un autre
point s'il se trouve dans le voisinage (ε − M inP oints) de ce point.
 Un point est dit dense-accessible (ε − M inP oints) d'un autre point s'il y a
une chaîne de points entre eux, où chaque deux points successifs de la chaine
sont directement dense-accessible (ε − M inP oints).
 Un point est dit dense-connecté (ε − M inP oints) d'un autre point s'il existe
un point, à partir duquel tous les deux points sont dense-accessibles.
Une classe avec ε et M inP oints prédénis est dénie comme un ensemble non
vide d'individus qui satisfait deux conditions :
 La condition de connectivité, i.e. tous les points de la classe doivent être
dense-connectés ,

106
5.3. Une méthode séquentielle basée sur la densité

 La condition de maximum, i.e. tous les points qui se trouvent dans le voisinage
(ε − M inP oints) d'un point de la classe, doivent appartenir à cette classe.
Le bruit est déni comme un ensemble des points qui n'appartiennent à aucune
classe. Il y a deux points diérents qui sont pris en compte dans la classication :
 Un point noyau : C'est le point qui a un voisinage (ε − M inP oints).
 Un point non noyau : C'est celui qui n'a pas un tel voisinage.
Un point non noyau peut être un point de frontière ou bruit. L'algorithme commence
en prenant en compte un point arbitraire et cherche tous les points dense-accessibles .
S'il s'agit d'un point noyau, alors cette phase forme une classe. S'il s'agit d'un point
frontière et qu'il n'y a aucun point qui estdense-accessible depuis lui, alors c'est un
bruit, l'algorithme passe à un autre point.

Figure 5.1  Notions de points densité-accessibles et de densité-connectés. (Adaptée


de [Ester 1996] ).

5.3.1.2 Algorithme DBSCAN


Le but de l'algorithme DBSCAN est de découvrir les clusters et éliminer le bruit
dans une base de données.
Idéalement, nous devrions connaitre les paramètres appropriés ε et M inP oints
de chaque cluster et un point de chacun des clusters respectifs. Nous pouvons ensuite
retrouver tous les points de densité accessibles des points donnés à partir de ces
paramètres corrects. Mais il n'est pas facile d'obtenir ces informations à l'avance
pour chaque cluster de la base de données. Pourtant il existe une heuristique simple
et ecace (voir sous-section précédente 5.3.1.3), pour déterminer les paramètres ε
et M inP oints des clusters les plus minces. Ces paramètres de densité sont des bons
candidats pour les paramètres globaux spéciant des densités les plus basses qui ne
sont pas considérés comme du bruit.
Pour trouver un cluster, DBSCAN commence par un point arbitraire p et re-
cherche tous les points de densité accessibles à partir de p. Si p est un point noyau,
la procédure ajoute p au cluster. Si p est un point frontière alors aucun point n'est
atteignable à partir de p et DBSCAN visitera le prochain point de la base de données.
Grâce à l'utilisation des valeurs globale ε et M inP oints, DBSCAN peut fusion-
ner deux clusters dans le cas où deux clusters de densité diérente sont proches
l'un de l'autre. Deux ensemble de point ayant au moins la densité la plus petite
seront séparés l'un de l'autre si la distance entre les deux est plus large que ε. En

107
Chapitre 5. Clustering inter-sujets statique des bres neuronales

conséquence, un appel récursif de DBSCAN peut se révéler nécessaire pour les clus-
ters détectés avec la plus haute valeur de M inP oints. Cela n'est pas forcément un
désavantage car l'application récursive de DBSCAN reste un algorithme basique, et
n'est nécessaire que sous certaines conditions.
Ainsi, pour chaque objet que l'on ajoute, on a une zone de croissance qui va
permettre d'étendre le cluster. Evidemment plus cette zone (sphérique) est grande
et plus le cluster aura de chances de s'étendre. La notion de voisinage est la clé de
cette méthode. On forme donc le cluster de proche en proche. La diculté que nous
pouvons rencontrer vient de la taille de la zone (rayon de la sphère) d'extension.
Le pseudo code 2 résume le principe de l'algorithme DBSCAN.

Algorithm 2 Algorithme DBSCAN


Input : ε, M inP oints
Output : C= {C1 , C2 , Cn }
1: Répéter
2: Prendre un point p aléatoirement ;
3: Mettre dans une classe Ci tous les points densité-accessibles à partir de p ;
4: Si le point p est noyau, alors Ci est une classe ;
5: Si p est un point non noyau (frontière) :
6: Passer à un autre point et retourner en (3)
7: Jusqu'à passer tous les points

5.3.1.3 Détermination des paramètres de DBSCAN


Dans cette partie, nous allons présenter une heuristique simple et ecace pour
déterminer les paramètres ε et M inP oints du plus petit cluster de la base de don-
nées. Cette heuristique est basée sur les observations, donnée par la gure 5.2 :

Figure 5.2  Heuristique de xation des paramètres. (Source : [Ester 1996]).


En général, il peut être délicat de détecter la première vallée automatiquement,
mais il est relativement simple pour l'utilisateur de voir cette vallée sur une repré-
sentation graphique. C'est pourquoi une approche interactive pour déterminer ce

108
5.3. Une méthode séquentielle basée sur la densité

seuil est intéressante. DBSCAN a besoin des paramètres ε et M inP oints. Les expé-
riences ont montré que les graphes de distance k (k > 4) ne dièrent pas vraiment
des graphes de distance 4 mais nécessite des calculs bien plus important. Ainsi, nous
éliminons le paramètre M inP oints en le xant à 4 pour toutes les bases de données.
Il s'agit ensuite d'utiliser une approche interactive pour déterminer le paramètre ε
de DBSCAN :
 Le système calcule et ache le graphe de distance 4 pour la base de données.
 Si l'utilisateur peut estimer le pourcentage de bruit, ce pourcentage est entré
et le système en déduit une proposition pour le seuil de point.
 L'utilisateur peut accepter ou non le seuil proposé ou sélectionner un autre
seuil qui est alors utilisé dans DBSCAN.

5.3.2 L'estimation et l'injection des représentants


Dans cette deuxième phase de la méthode proposée, nous exploitons la notion
centrale de l'algorithme DBSCAN qui est l'objet noyau. Une streamline est consi-
dérée comme un objet noyau, si elle a plus d'un nombre spécié de streamlines
(M inP oints) dans son rayon ε et se trouve à l'intérieur d'un cluster. Les stream-
lines noyaux des clusters potentiels sont estimées pour une partition donnée et injec-
tées dans le clustering de la partition suivante. Les streamlines noyaux des clusters
outliers sont éliminées.
Le principe de la méthode de clustering inter-sujets, basée sur la densité est
présenté par le pseudo code donné par l'Algorithme 3 :

Algorithm 3 L'algorithme du clustering inter-sujets basé sur la densité


Input : partitions of data stream, ε, M inP oints
Output : C= {C1 , C2 , Cn }
1: C = {}
2: for each partition p do
3: for each unvisited streamline S in partition p do
4: mark S as visited
5: N eighborP ts = regionQuery(S, ε)
6: if sizeof (N eighborP ts) < M inP oints then
7: mark S as outlier
8: else
9: C = next cluster
10: ExpandCluster (S, N eighborP ts, C, ε, M inP oints)
11: end if
12: end for
13: Return potential-cluster, potential-representatives
14: Injection potential-representatives into NextPartition
15: end for

109
Chapitre 5. Clustering inter-sujets statique des bres neuronales

1: procedure ExpandCluster(()S , N eighborP ts, C , ε, M inP oints)


2: add S to Potential-representatives
3: add S to Potential-cluster C
4: for each streamline S' in NeighborPts do
5: if S' is not visited then
6: mark S' as visited
7: N eighborP ts0 = regionQuery(S 0 , ε)
8: regionQuery return all streamlines within ε-neighborhood of S
9: if sizeof (N eighborP ts0 ) ≥ M inP oints then
10: NeighborPts=NeighborPts joined with NeighborPts'
11: end if
12: else if S' is not yet member of any Potential-cluster then
13: add S' to cluster C
14: end if
15: end for
16: end procedure

5.4 Expérimentations, résulats et discussion


5.4.1 Expérimentation et résultats sur les données synthétiques
5.4.1.1 Données synthétiques
Dans un premier temps, nous avons évalué l'ecacité de notre méthode et sa
robustesse face aux outliers, sur des données synthétiques générées en utilisant le
logiciel "Numerecal Fiber Generator (NFG)" [Close 2009]. Ces données synthétiques
ont un volume sphérique avec un rayon xe et sont composées de 20 faisceaux, ce qui
engendre 635 streamlines individuelles, simulant quelques structures de la SB dans
le cerveau (gure 5.3(a)). Nous avons ajouté à ces données synthétiques 4 autres
lignes et 3 hélices (faisceaux rouges et violets dans la gure 5.3(a)), représentants
les streamlines outliers, ce qui donne un total de 642 streamlines synthétiques.

5.4.1.2 Expérimentations
Nous avons implémenté deux algorithmes de clustering de la SB : la méthode
hiérarchique QuickBundle (HQB) [Garyfallidis 2015] qui est une version améliorée
de l'algorithme QB [Garyfallidis 2012b] permettant l'élimination des outliers. Elle a
été appliquée en utilisant la distance MDF avec un seuil de 8 mm. La distance MDF
exige que les streamlines aient le même nombre de points, l'algorithme eectue un
échantillonnage automatique des streamlines pour n'avoir que 20 points et la mé-
thode V-Bundles [Reichenbach 1996] qui utilise une adaptation du champs vectoriel
de l'algorithme k-means pour le clustering des streamlines de la SB. Nous avons
choisi les mêmes paramètres adoptés dans [Reichenbach 1996] , le nombre maximal
d'itérations de k-means [Hartigan 1979] égal à 3, λ = 0, 001, γ = 0, 6, rv = 15mm
et rz = 9mm. Pour notre méthode basée-densité, nous avons déni les paramètres

110
5.4. Expérimentations, résulats et discussion

optimaux en utilisant le concept heuristique, et avons pris M inP oints = 10 et


ε = 1, 5mm.

5.4.1.3 Résultats

Les résultats obtenus avec les trois méthodes (notre méthode basée densité, HQB,
V-Bundles) sont présentés à la gure 5.3.
Notre méthode a été capable de séparer les streamlines en 21 clusters signicatifs,
20 clusters représentant les faisceaux principaux et un cluster avec le label (-1),
regroupant les deux clusters d'outliers introduits (Figure 5.3 (b)). La méthode HQB
a réussi l'élimination des outliers, mais elle a confondu deux faisceaux principaux
dans un même et seul faisceau, le faisceau vert jaune et orange dans la gure 5.3 (c).
On obtient un total de 20 clusters : un cluster d'outliers et 19 clusters principaux.
La méthode V-bundles a été perturbée par les outliers, elle a extrait les 20
faisceaux principaux mais confondus avec les outliers (Figure 5.3 (d)).
Nous avons eectué une comparaison statistique robuste, en utilisant les indices
de Rand ajusté Adjusted Rand Index
, l'indice d'exhaustivité completeness
et l'indice
d'homogénéité homogeneity[Moberts 2005] pour évaluer l'exactitude et la perfor-
mance des trois méthodes.
L'indice de Rand ajusté est déni comme le nombre total de paires de faisceaux
en accord divisé par le nombre total de paires. Si les deux partitions concordent com-
plètement, l'indice Rand renvoie une valeur de 1, sinon la limite inférieure de cet
indice est 0. Une grande valeur de l'indice "completeness" signie que les streamlines
appartenant au même faisceau anatomique sont regroupées ensemble et l'indice d'ho-
mogénéité calcule le degré qu'un cluster contient uniquement les streamlines d'une
seule classe. Si l'indice Rand est égal à 1, il ya donc un accord parfait entre les deux
faisceaux. Une valeur de 0.7 est considérée comme susante pour dire que les deux
faisceaux sont assez en accord.
La table 5.1 et la gure 5.4 illustrent les résultats de cette analyse quantitative.
La table 5.1 présente les moyennes de chaque indice, calculées sur tous les faisceaux
obtenus avec chaque méthode et la gure 5.4 illustre les valeurs des indices de chaque
faisceau, obtenues avec les trois méthodes.
En comparaison avec les autres méthodes, notre méthode a montré des valeurs
supérieures d'exhaustivité, d'indice de Rand ajusté et d'homogénéité. Les résul-
tats de la méthode HQB ont démontré également un degré d'exhaustivité élevé,
mais une homogénéité plus faible, indiquant que les clusters sont complets, mais
ne contiennent pas uniquement les streamlines du même faisceau. La méthode V-
bundles a donné de mauvais résultats à la fois en ce qui concerne l'homogénéité
et l'exhaustivité par rapport aux autres approches, ce qui signie que les clusters
résultants ne sont généralement pas bien séparés.

111
Chapitre 5. Clustering inter-sujets statique des bres neuronales

(a) Synthetic data. (b) Our method

(c) HQB (d) V-Bundles

Figure 5.3  Résultats de l'évaluation quantitative détaillée des clusters obtenus


avec les diérentes méthodes ; notre méthode, HQB et V-bundles.

Table 5.1  Comparaison quantitative des trois méthodes (Notre-méthode, HQB, V-bundles)
Méthode
XXX
Notre-Méthode HQB V-Bundles
XXX
Indice
XXX
XX
Adjusted Rand Index
X
0.897 0.838 0.791
Completeness 0.927 0.920 0.886
Homogeneity 0.927 0.899 0.816

5.4.2 Expérimentation et résultats sur les données réelles


5.4.2.1 Données réelles
La méthode proposée a été également testée sur des données réelles, obtenues par
la base de données ouverte du projet HCP Human Connectome Project [Essen 2011,
Sotiropoulos 2013] et sur les données de 10 sujets sains avec les identiants sui-
vants :100307, 124422, 161713, 199655, 201111, 239944, 245333, 366446, 528446 et
856766. Ces données ont été acquises avec une IRM Siemens Skyra 3T, paramé-

112
5.4. Expérimentations, résulats et discussion

(a)

(b)

(c)

Figure 5.4  Evaluations quantitatives des faisceaux, obtenues avec les trois mé-
thodes (Notre-méthode, HQB, V-bundles). (a) Les indices de Rand ajusté. (b) L'in-
dice d'exhaustivité et (c) L'indice d'homogénéité.

113
Chapitre 5. Clustering inter-sujets statique des bres neuronales

trée à 90 gradients de codage de diusion avec une valeur b de 1000s/mm2 et une


résolution spatiale isotrope de 2mm.
Les orientations locales des streamlines ont été estimées avec la méthode de
reconstruction CSD [Aganj 2010] basée sur la déconvolution sphérique (SD), qui
fournit une estimation de la distribution d'orientation des bres (FOD) (détaillée au
paragraphe 1.5.2.2 du chapitre 1). La fonction de réponse a été estimée en utilisant
des voxels avec une valeur FA supérieure à 0,7 et un ordre harmonique maximal de
8.
La base de données de tractographie est générée avec un algorithme détermi-
niste "EuDX" [Garyfallidis 2012b] basé sur l'intégration d'Euler et l'interpolation
trilinéaire, dont le principe est détaillé au chapitre 2. Le seuil FA d'arrêt de l'algo-
rithme a été déni à 0.2 pour s'assurer d'être dans la région de la SB. La tractogra-
phie a été initiée à partir de 1 000 000 points-germes aléatoires, la taille de la base
de données de tractographie pour un sujet est d'environ 1 000 000 streamlines. La
reconstruction et la tractographie ont été générées avec la suite logicielle Dipy 1 .
Les données réelles de diusion issues de la base de données HCP de tous les
sujets étant dans l'espace standard MNI-152, le clustering au sein d'une population
de sujets peut donc être eectué sans aucun recalage inter-sujets.

5.4.2.2 Expérimentations
Nous avons comparé notre méthode en terme d'ecacité et de précision des
résultats avec une autre technique récente de la littérature, appelée MSQB (Multi-
subjects Clustering with QuickBundles), proposée dans [Garyfallidis 2015], qui est
basée sur l'algorithme QB. Nous avons implémenté cette méthode en suivant les
mêmes étapes que dans [Garyfallidis 2015]. Nous avons regroupé les streamlines en
faisceaux, en utilisant l'algorithme QB avec un seuil de distance de 20 mm et les
streamlines sont automatiquement échantillonnées, pour avoir 20 points équidis-
tants. Chaque cluster est représenté par une streamline virtuelle appelée streamline
centroïde. Ce processus est répété pour chaque sujet. Finalement, nous avons re-
groupé les streamlines centroïdes de chaque sujet pour obtenir des faisceaux repré-
sentant la variation de la SB à travers une population de sujets.

5.4.2.3 Résultats
Notre méthode a ainsi réussi à bien extraire 16 faisceaux neuro-anatomiques
majeurs à partir de la base de données de tractographie issue de 10 sujets de la
base HCP, Il s'agit du faisceau arqué (AF), du faisceau cortico-spinal (CST), du
faisceau cingulum (CG), du faisceau unciné (UNC), de la radiation optique (OR),
du faisceau longitudinal médian (MDLF), du faisceau longitudinal inférieur (ILF),
et du faisceau inférieur fronto occipital (IFO). La gure 5.5 illustre un exemple de
quelques faisceaux obtenus avec notre méthode.
1. http://nipy.org/dipy/

114
5.5. Avantages et limites de la méthode séquentielle basée sur la densité

(a) CST (b) ILF (c) IFO (d) UNC

Figure 5.5  Illustration de quelques faisceaux obtenus avec notre méthode.

Evaluation de l'ecacité du clustering An d'évaluer la qualité relative des


faisceaux obtenus par notre méthode, nous avons utilisé l'indice de Silhouette, tout
en comparant les résultats de notre méthode à la méthode MSQB.
Le but de l'indice de Silhouette est de vérier si chaque streamline a été bien
classé. Quand l'indice de Silhouette est proche de 1, la streamline est bien classée :
la distance qui la sépare de la classe la plus proche est très supérieure à celle qui la
sépare de sa classe. Par contre, si l'indice de Silhouette est proche de -1, cela veut
dire que la streamline est mal classée. Mais si cet indice est proche de 0 alors il
pourrait également être classé dans la classe la plus proche. L'indice de Silhouette
du faisceau est calculé à partir de la moyenne entre les indices des streamlines qui
le compose.
La moyenne des indices de Silhouettes obtenus pour tous les faisceaux extraits
avec notre méthode est de 0.792 versus 0.678 pour la méthode MSQB. Ce qui si-
gnie que notre méthode bénécie d'une meilleure aectation des streamlines aux
faisceaux adéquats. La table 5.2 détaille les valeurs de l'indice de silhouette de
quelques faisceaux obtenus avec notre méthode et la méthode MSQB.

Table 5.2  Valeurs de l'indice Silhouette de quelques faisceaux obtenus avec notre méthode et
avec celles de la méthode MSQB .
HH
HH CSTL CSTR UNCL UNCR IFOL IFOR ILFL ILFR SLFL SLFR

Notre-Méthode 0.751 0.788 0.811 0.808 0.722 0.754 0.790 0.787 0.841 0.825
MSQB 0.655 0.671 0.712 0.701 0.582 0.618 0.688 0.624 0.756 0.688

5.5 Avantages et limites de la méthode séquentielle basée


sur la densité
Dans cette étude, nous avons présenté une méthode de clustering inter-sujets
basée sur une adaptation originale de l'algorithme DBSCAN. Notre méthode per-
met d'établir un modèle de faisceaux à travers une population de sujets, grâce aux
avantages suivants :

115
Chapitre 5. Clustering inter-sujets statique des bres neuronales

 Une bonne ecacité sur les larges bases de données de tractographie, géné-
rées à partir de plusieurs sujets grâce à son concept d'exécution séquentielle,
permettant de traiter les données par partition.
 La découverte de cluster de forme arbitraire car les faisceaux dans les bases de
données de tractographie peuvent avoir des formes U, S, L, hélice, rectiligne,
etc.
 Un minimum de connaissances sur le domaine an de déterminer les para-
mètres d'entrée car les valeurs appropriées ne sont pas souvent connues à
l'avance lorsqu'on travaille avec des bases de données importantes.
Cependant, l'inconvénient de cette méthode est qu'elle donne des résultats variés
avec des conditions initiales diérentes, car l'ordre des sujets aecte le résultat nal,
à cause du caractère statique de la méthode. Une fois qu'une streamline est aectée
à un cluster elle reste dans ce dernier, et cela comme toutes les approches proposées
dans la littérature, en raison de leurs caractère statique, qui fait que le clustering
d'une streamline est dénitif dans une classe donnée. Par conséquent, toutes ces
méthodes sont limitées dans la considération dynamique de la variation des données
issues de plusieurs sujets.

5.6 Conclusion
Dans ce chapitre, une nouvelle approche de clustering multi-sujets de la SB est
présentée, utilisant une adaptation originale de l'algorithme de clustering basé sur
la densité "DBSCAN".
Notre méthode regroupe ecacement les streamlines similaires au sein d'un sujet
en cluster. Chaque cluster est représenté par des streamlines représentantes. Ces
streamlines sont injectées d'une manière entièrement automatique dans le clustering
du prochain sujet et considérées comme des connaissances issues de l'apprentissage
au sein du sujet précédent, ce qui permet de prendre en compte la variation de la
SB et augmenter la précision des résultats.
Notre méthode est ecace sur les grandes bases de données générées à partir
de diérents sujets grâce à son concept d'exécution séquentielle, permettant de ne
maintenir qu'une seule partition de données en mémoire. Elle a montré également
d'excellents résultats, car elle discerne parfaitement les principaux faisceaux de la
SB, tout en éliminant complètement les outliers.
Nous avons évalué la précision et l'ecacité de cette méthode sur des données
synthétiques et des données réelles, tout en comparant nos résultats meilleurs à ceux
obtenus par d'autres techniques de la littérature.
Néanmoins, notre méthode est dépendante des conditions initiales et fournit des
résultats diérents selon l'ordre des sujets car la méthode est statique ; une fois
qu'une streamline est assignée à un cluster, elle reste dans celui-ci.
Dans le chapitre suivant, nous allons présenter une solution possible à ce pro-
blème, en proposant une méthode de clustering inter-sujets dynamique.

116
Chapitre 6

Clustering inter-sujets dynamique


des bres neuronales

 La recherche est un processus sans n dont on ne peut jamais dire


comment il évoluera. L'imprévisible est dans la nature même de la
science. François Jacob, Le jeu des possibles, Points, Paris, France,
1981.

Sommaire
6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
6.2 Travaux antérieurs et motivations . . . . . . . . . . . . . . . 118
6.3 Un mécanisme adaptatif de détection des outliers . . . . . . 120
6.4 Mesure de similarité . . . . . . . . . . . . . . . . . . . . . . . . 121
6.5 Les modèles de "ocking" . . . . . . . . . . . . . . . . . . . . 123
6.5.1 Règles de Reynolds . . . . . . . . . . . . . . . . . . . . . . . . 123
6.5.2 Le ocking d'espèces multiples (MSF) . . . . . . . . . . . . . 127
6.6 Potentiel du clustering basé sur les multi-agents . . . . . . . 127
6.7 L'algorithme 3D-SSF . . . . . . . . . . . . . . . . . . . . . . . 128
6.8 Expérimentations, résultats et discussion . . . . . . . . . . . 130
6.8.1 Expérimentations et résultats sur les données synthétiques . . 133
6.8.2 Expérimentations et résultats sur les données réelles . . . . . 136
6.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales

6.1 Introduction
Comme nous l'avons constaté au chapitre précédent, il y a un intérêt croissant
pour l'étude de la variation de la SB entre les sujets et en particulier, l'analyse
des faisceaux spéciques de la SB pour mieux comprendre le développement du
cerveau et le vieillissement, ainsi que pour améliorer la détection précoce de certaines
maladies neurodégénératives.
Plusieurs méthodes de clustering inter-sujets ont été proposées pour étudier les
faisceaux de la SB. Dans ce chapitre, nous commençons par résumer le principe
général de ces diérentes méthodes, tout en mettant en évidence leurs limites. Ces
méthodes ont été décrites plus en détail au chapitre 3.
Les méthodes proposées dans la littérature visent à surmonter la complexité du
problème, induite en partie par le volume important des données de tractographie,
générées à partir de plusieurs sujets, produisant ainsi des streamlines variées, avec
diérentes positions, longueurs et formes géométriques, ainsi que la présence des
streamlines outliers. Cependant, ces méthodes restent limitées en terme de exibilité
et dans leur capacité à prendre en compte l'ensemble de ces contraintes. La prise en
compte de ces limites a été une motivation majeure pour notre proposition d'une
nouvelle approche, comme nous l'exposerons plus loin dans ce chapitre.
Dans ce chapitre, nous présentons en détail un nouveau cadre de clustering,
dynamique incrémentale, inter-sujets, basé sur une implémentation multiagent dis-
tribuée du modèle MSF. Il s'agit de notre méthode que nous avons nommée 3D-SSF
(3D-Streamlines Stream Flocking), qui considère les streamlines de diérents sujets
comme un ux de données où, chaque streamline est aectée à un agent mobile. Les
agents travaillent ensemble en suivant les règles du ocking an de former un essaim.
Grâce à la fonction de similarité, les agents associés à des streamlines similaires for-
meront un essaim, tandis que les agents associés à des streamlines dissemblables
seront considérés comme des outliers.
Finalement, nous exposons les diérentes expériences réalisées sur des données
bruitées synthétiques et des données réelles de diusion du cerveau humain pour
valider notre méthode 3D-SSF et démontrer qu'elle est plus ecace et robuste aux
outliers, comparée aux autres approches classiques.

6.2 Travaux antérieurs et motivations


Les streamlines issus de plusieurs sujets, ayant diérentes SB, doivent être ana-
lysées ensemble an de créer un modèle composé d'un regroupement de faisceaux
génériques qui peuvent être détectés dans la plupart des sujets. Ce modèle est né-
cessaire pour mieux comprendre le fonctionnement du cerveau humain et améliorer
la détection de plusieurs maladies neurodégénératives.
Nous avons pu constater que le clustering intra-sujet, est déjà complexe et, le
clustering inter-sujets constituera un dé encore plus grand du fait de la grande
taille de la base de données de tractographie générée à partir de plusieurs sujets, à
sa complexité due à sa composition en plusieurs streamlines de diérentes formes

118
6.2. Travaux antérieurs et motivations

géométriques, positions spatiales, longueurs, avec la présence de streamlines outliers,


ainsi que la variation de la SB d'un sujet à un autre.
Une solution utilisée par diérentes méthodes de la littérature [Visser 2011],
consiste à regrouper les streamlines au sein du même sujet indépendamment, puis à
combiner les résultats obtenus avec plusieurs sujets pour déduire les clusters naux
à travers une population de sujets. Le clustering au niveau de chaque sujet ne sera
donc pas inuencé par les résultats du clustering d'un autre sujet. Les streamlines de
chaque sujet ne peuvent pas être regroupées indépendamment, car déterminer alors
quel cluster d'un sujet correspond à quel cluster d'un autre sujet n'est pas triviale.
Idéalement, il faut regrouper les streamlines de tous les sujets ensemble, mais cela
devient plus dicile car le nombre de streamlines augmente considérablement.
D'autres méthodes plus exibles [Dodero 2015, Demir 2015] consistent à diviser
le processus de clustering en deux phases : apprentissage et aectation. Dans la phase
d'apprentissage, un modèle est construit pour chaque faisceau, qui peut identier les
streamlines lui appartenant. Ensuite, pendant la phase d'aectation, chaque stream-
line est assignée à l'un des faisceaux trouvés pendant la phase d'apprentissage. Ce
qui n'est pas toujours simple.
Ces méthodes sourent de leur caractère statique, une fois qu'une streamline est
aectée à un cluster, elle reste dans ce dernier. Par conséquent, toutes les méthodes
de la littérature sont limitées dans la prise en compte dynamique de la variation des
données issues de plusieurs sujets.
Les approches traditionnelles de clustering citées ci-dessus ne sont pas susam-
ment exibles pour traiter les données complexes de grande taille. Ainsi, au cours
des dernières années, de nouveaux algorithmes inspirés des modèles biologiques des
comportements sociaux et collectifs des individus ont été introduits pour résoudre
le problème du clustering, comme l'algorithme des essaims particulaires (Particle
Swarm Optimization (PSO) [Kennedy 1995] et l'algorithme de tri collectif (ou Ant
clustering algorithm) [Deneubourg 1991]. Ce dernier algorithme, inspiré du com-
portement de tri collectif des fourmis naturelles, permet le partitionnement sans
connaissances a priori sur le nombre de clusters potentiels, ou sur la partition ini-
tiale.
Deneubourg et al. dans [Deneubourg 1991] ont proposé un modèle basique pour
expliquer le comportement des fourmis. Dans leur étude, une population de fourmis
représentée par des agents eectuent des mouvements sur une grille de dimension
2. Chaque agent suit uniquement une règle simple : se déplacer aléatoirement sur
une grille et regrouper des objets similaires sous forme de tas (clusters), selon une
probabilité respectivement de prise de dépôt d'objets en fonction des objets déposées
dans leurs voisinage, ou d'objets déjà collectés dans le passé (selon leur mémoire).
Après plusieurs itérations, le résultat du clustering émerge à partir des activités
collectives de ces agents. Cette organisation décentralisée ore les avantages de la
simplicité, de la exibilité et de la robustesse.
Wu dans [Wu 2004] et Handl dans [Handl 2002] ont exploité cet algorithme des
fourmis pour eectuer un clustering des documents et conrme que les résultats
de leur méthode sont meilleures que ceux obtenus avec l'algorithme K-means. Ce-

119
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales

pendant, avec l'algorithme Ant clustering les objets regroupés ne disposent pas de
mobilité par eux-mêmes. Le comportement des objets est implémenté à travers des
mouvements d'un petit nombre d'agents fourmis, ce qui ralentit la vitesse du clus-
tering. Chaque agent fourmi, portant un objet isolé ne communique pas avec les
autres agents fourmis ; il ne connaît donc pas la meilleure position pour supprimer
l'objet. L'agent fourmi doit se déplacer ou sauter aléatoirement dans l'espace de
grille jusqu'à ce qu'il satisfasse le critère de suppression d'objet, ce qui consomme
un temps d'exécution élevé.
Dans ce chapitre, nous présentons un nouvel algorithme de clustering inter-sujets
des streamlines basé sur le modèle MSF. Cet algorithme est également un algorithme
de partitionnement ne nécessitant pas de connaissances a priori sur le nombre de
clusters dans la base de données. L'avantage par rapport aux autres méthodes bio-
inspirées basées sur les systèmes multi-agents est que chaque objet dans la collection
est assigné à un agent eectuant des mouvements dans l'espace virtuel obéissant à
un mécanisme heuristique, contrairement aux autres méthodes où le mouvement est
aléatoire.

6.3 Un mécanisme adaptatif de détection des outliers


Nous avons proposé également dans ce travail [Chekir 2017a] une nouvelle ap-
proche pour la détection des outliers basée sur deux niveaux de vérications en
utilisant des seuils adaptatifs. Cette approche utilise le concept de la médoïde in-
troduit par l'algorithme des k-moyennes, (en anglais k-means) [Hartigan 1979], qui
est couramment utilisé dans le clustering de données.

Calcul du médoïde
En statistiques, un médoïde est le représentant le plus central d'une classe. L'al-
gorithme des k-médoïdes est un algorithme de partitionnement plus robuste vis-à-vis
les données aberrantes (outliers) que celui des k-means (k-moyennes). L'algorithme
des k-médoïdes minimise l'erreur quadratique moyenne qui est la distance entre les
points de la classe et le point central (ou médoïde). Dans le cas des K-means, un
cluster est représenté par son centre, qui est une moyenne des streamlines aectée au
cluster. Soit K clusters (C1 , C2 , ...Ck ), un cluster étant composé de Sj streamlines,
tel que (1 ≤ j ≤ N ), la streamline médoïde des K clusters est dénie par l'équation
6.1 :

1
∀k, 1 ≤ k ≤ K, Rk = P Sj (6.1)
|Ck | j,Sj ∈Ck

Principe de la méthode
Un cluster est considéré comme un cluster d'outliers s'il satisfait aux deux condi-
tions suivantes :

120
6.4. Mesure de similarité

 Le premier niveau de vérication est basé sur le nombre de streamlines qui


constitue chaque cluster. Le cluster est sélectionné entièrement comme un
cluster outlier, s'il contient moins que le nombre moyen (SizeThreshold) de
streamlines ; SizeT hreshold = n/k , où n est le nombre de streamlines de la
partition en cours de traitement et k est le nombre de clusters obtenus dans
cette partition.
 Au deuxième niveau de vérication, pour chaque cluster, la distance abso-
lue entre son médoïde et les médoïdes des autres clusters, est calculée ; la
streamline médoïde pour un cluster étant dénie comme la streamline pour
laquelle la dissimilarité moyenne par rapport aux autres streamlines dans le
cluster est minimale. La distance absolue ADMM (Absolute Distance bet-
ween the Medoid and Medoids) est ainsi calculée. Pour chaque cluster, le
degré d'isolement est la valeur d'entrée la plus faible possible de la simila-
rité requise pour joindre deux streamlines dans le même cluster. La valeur
du degré d'isolement est calculée comme la moyenne de toutes les valeurs
ADM M , de tous les clusters dans la partition courante multipliée par une
constante Cst suivant l'équation 6.2 :

DegreIsolation = (Average(ADM M )) ∗ Cst (6.2)

Désormais, pour chaque cluster, la valeur ADM M est calculée et comparée


avec la valeur IsolationDegree correspondante. Si l'ADM M d'un cluster
spécique est supérieure à sa valeur de seuil correspondante, il est considéré
comme outlier.

6.4 Mesure de similarité


Le choix de la mesure de similarité entre les streamlines est important, car il
aecte directement le résultat du clustering.
Diérentes mesures de similarité ont été proposées dans la littérature, détaillées
au paragraphe 3.4.1 du chapitre 3. Comme nous l'avons vu, ces mesures de similarités
peuvent être divisées en deux catégories : les mesures de similarité basées sur les
voxels [Wassermann 2010] et les mesures de similarité basées sur les streamlines
[Corouge 2004].
Les méthodes utilisant les mesures de similarité basées sur les voxels calculent
la diérence dans les caractéristiques de diusion entre les voxels connectés par les
streamlines qu'on veut comparer. Ce type de méthode a une bonne capacité de
passage à l'échelle mais nécessite des étapes de post- et pré-traitement. Le deuxième
type de méthodes donne des résultats plus précis mais soure des problèmes de
passage à l'échelle.
Dans cette thèse nous nous intéressons à la deuxième catégorie de mesures de
similarités. Les auteurs dans [Corouge 2004], ont eectué un clustering en utilisant la
similarité entre les courbes des zones adjacentes an de les regrouper en faisceaux.
Ils ont proposé les trois distances principales utilisées pour mesurer la similarité

121
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales

entre paires de streamlines, où une streamline Si , est représentée par un ensemble


de points 3D : pk , S = Si , Si = pk .

La distance du point le plus proche (Closest point distance, dc ) dénie


comme la distance la plus proche entre les paires de courbes Si et Sj , donnée par
l'équation 6.3 :

dc (Si , Sj ) = minpk ∈Si ,pl ∈Sj k pk − pl k (6.3)


où, k . k est la norme Euclidienne.

La moyenne des distances les plus proches (Mean of closest distances,


dM ) pour chaque point de la courbe Si à la courbe Sj , est donnée par l'équation
6.4 :

dM (Si , Sj ) = mean(dm (Si , Sj ), dm (Sj , Si )) (6.4)


avec, dm (Si , Sj ) = meanpl ∈Si minpk ∈Sj k pk − pl k

La distance de Hausdor, dH mesure si deux formes sont les mêmes. Si elles


sont diérentes, la distance quantie ces dissemblances. Elle est dénie comme le
maximum des distances les plus proches pour chaque point de la courbe Si à la
courbe Sj , donnée par l'équation 6.5 :

dH (Si , Sj ) = max(dh (Si , Sj ), dh (Sj , Si )) (6.5)


avec, dh (Si , Sj ) = maxpk ∈Si minpl ∈Sj k pk − pl k

Guevara et al. dans [Guevara 2011b], ont eectué une étude comparative entre ces
trois mesures de similarité. La gure 6.1 illustre les distances les plus proches entre
deux streamlines. La distance dc ne peut pas distinguer les diérentes formes de
streamlines, car elle prend en compte seulement des informations très grossières de
similarité et de proximité, contrairement à la distance dM qui fournit une mesure
de similarité globale intégrée tout au long de la courbe. La distance d'Hausdor dH
est la distance la plus favorable.
La gure 6.2 montre un exemple de comparaison de ces trois mesures de similarité
entre quatre streamlines.
Les distances entre la streamline en rouge et les autres streamlines (cyan, vert
et bleu) ont été calculées. Dans cet exemple, on peut voir que les streamlines en
bleu et vert ont une distance dc similaire, même si la streamline en vert est pourtant
plus similaire à la streamline en rouge. Pire, la streamline en cyan, qui présente une
forme géométrique un peu diérente, a une très petite distance dc . La distance dM
est plus appropriée pour une meilleure représentation de la similarité moyenne entre
les streamlines mais la distance dH semble plus précise si une mesure de similarité
stricte est requise. Ces distances peuvent traiter un degré variable de chevauchement

122
6.5. Les modèles de "ocking"

Figure 6.1  Illustration des distances basées sur les points les plus proches. Les
distances directes les plus proches entre deux points (seulement de la streamline i à
j ) sont représentées par des èches (d1 , d2 , ...d10 ). La distance du point le plus proche
est représentée par la èche verte (voir l'équation 6.3). La distance maximale directes
des distances les plus proches (dh ) est représentée par la èche rouge. La distance
d'Hausdor (dH ) est le maximum des deux distances directes dh (voir équation 6.5).
La moyenne directe des distances les plus proches (dm ) est la moyenne des distances
(d1 , ...d10 ). La moyenne des distances les plus proches (dM ) est la moyenne des deux
distances dm (voir l'équation 6.4) (Source [O'Donnell 2007].

partiel et ont été utilisées avec succès pour le clustering des streamlines de la SB du
cerveau entier.
En se basant sur cette étude, pour obtenir des résultats précis en matière de
clustering, dans notre contexte, nous avons opté pour la distance d'Hausdor pour
estimer la similarité entre les streamlines. Car l'étude dans [Guevara 2011b] dé-
montre que la moyenne des distances les plus proches (dM ) est plus appropriée pour
une bonne représentation de la ressemblance moyenne entre les streamlines.

6.5 Les modèles de "ocking"


6.5.1 Règles de Reynolds
On parle de mouvements collectifs dès lors que des individus parviennent via
leurs interactions à engendrer un mouvement de groupe cohérent. Le ocking est un
exemple de tels comportements. Le terme ocking emprunté à l'anglais, signie ori-
ginellement vol en formation ou en nuée, par analogie aux comportements collectifs
des oiseaux. Les premiers modèles de ces comportements sont apparus dans les an-
nées 1980. Reynolds dans [Reynolds 1987], pionnier dans le domaine, fut le premier
à proposer un modèle décentralisé simple permettant de modéliser le phénomène

123
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales

Figure 6.2  Comparaison des trois distances entre paires de streamlines : La


distance du point le plus proche (dc ), la moyenne des distances les plus proches
(dM ) et la distance d'Hausdor (dH ). Les distances entre la streamline en rouge et
les trois autres streamlines (cyan, vert et bleu) ont été calculées. La distance dc est
la distance moins discriminante, alors que la distance dM est plus appropriée pour
une bonne représentation de la similarité moyenne entre les streamlines. De l'autre
côté, la distance dH semble plus précise si une mesure de similarité stricte est requise
(Source : [Guevara 2011b]).

bio-inspiré du ocking.
Dans ce modèle, chaque individu (appelé boid) prend des décisions de mouve-
ment sans aucune communication explicite avec les autres. Les boids agissent selon
trois règles simples de base (alignement, séparation et cohésion) qui génèrent un
comportement global complexe pour la totalité de l'essaim. Ces règles décrivent
comment un boid réagit au mouvement d'autres boids dans son voisinage, local. Le

124
6.5. Les modèles de "ocking"

voisinage local est déterminé par le rayon de visibilité du boid ε. Un boid (agent)
ne réagit pas aux autres boids en dehors de son voisinage. Une distance minimale λ
doit également être maintenue entre les boids pour éviter la collision.

La règle d'alignement Comme illustré sur la gure 6.3, l'agent tend à se déplacer
dans le même sens que celui des agents voisins, c'est-à-dire à donner à un agent la
capacité d'aligner son vecteur de vélocité au vecteur de vélocité moyenne d'autres
agents voisins se trouvant dans sa plage de visibilité. Elle est décrite par la formule
6.6 suivante :

n
1X
Si (d(Fi , Ac ) ≤ ε) ∧ (d(Fi , Ac ) ≥ λ) ⇒ v~ar = v~i (6.6)
n
i

où v~ar est la vélocité entraînée par la règle d'alignement, ε le rayon indiquant la


plage de visibilité des agents, λ la distance minimale qui doit être maintenue entre
eux respectivement (avec ε > λ), d(Fi , Ac ) est la distance euclidienne entre l'agent
Ac et son voisin Fi , ~vi est la vélocité de l'agent Fi et n est le nombre d'agents voisins.

Figure 6.3  La règle d'alignement. l'agent se dirige vers la position moyenne


des agents locaux voisins dans sa zone de visibilité ε.

La règle de séparation Comme illustré sur la gure 6.4, la règle de séparation


donne à un agent la capacité de maintenir une distance minimale avec les autres
agents à proximité. Cette règle permet d'éviter les collisions avec les plus proches
voisins. Elle est décrite par la formule 6.7 suivante :
n
v~i + v~c
(6.7)
X
Si d(Fi , Ac ) ≤ 2 ∗ λ ⇒ v~sr =
d(Fi , Ac )
i
où v~sr est la vélocité de séparation, v~c est la vélocité de l'agent courant et v~i est
la vélocité des agents ith dans son voisinage.

125
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales

Figure 6.4  La règle de séparation. L'agent évite d'encombrer les agents du


voisinage dans sa zone de visibilité en maintenant entre eux une distance minimale
λ.

La règle de cohésion Comme illustré sur la gure 6.5, le vecteur de vélocité d'un
agent est aligné avec la direction de la position spatiale moyenne des autres agents
dans sa plage de visibilité. Ce qui permet à l'agent de rester proche de ses voisins
en se rapprochant du centre d'essaim. Elle est décrite par la formule 6.8 suivante :

n
(6.8)
X
Si (d(Fi , Ac ) ≤ ε) ∧ (d(Fi , Ac ) ≥ λ) ⇒ v~cr = (Pi − Pc )
i

où v~cr est la vélocité de cohésion. Pi et Pc sont les positions de l'agent en cours.

Figure 6.5  La règle de cohésion. Les agents se déplacent vers la position


moyenne des agents de voisinage.

126
6.6. Potentiel du clustering basé sur les multi-agents

6.5.2 Le ocking d'espèces multiples (MSF)


Le modèle MSF [Cui 2006] a été développé pour simuler plus précisément le
comportement de ocking au sein d'une population hétérogène d'entités.
Le MSF inclut en plus des règles de Reynolds, une règle additionnelle de si-
milarité, qui permet à chaque agent de se distinguer parmi ses voisins et de ne se
regrouper qu'avec ceux qui lui ressemblent. L'ajout de cette règle permet à l'es-
saim d'organiser des groupes multi-espèces hétérogènes en sous-groupes homogènes
constitués uniquement d'individus de la même espèce.
Les agents dissimilaires essayent de rester à l'écart des autres agents qui ont des
caractéristiques dissimilaires, par l'intermédiaire d'une force répulsive, inversement
proportionnelle à la distance entre les agents et la similarité entre ces derniers.

La règle de similarité Les agents similaires utilisent la force d'attraction pour


rester dans le même essaim. Elle est calculée avec l'équation 6.9 suivante :
n
(6.9)
X
Vsim = (Sim(Fi , Ac ) ∗ d(Pi , Pc ))
i

La règle de dissimilarité Les agents dissimilaires utilisent une force répulsive


pour rester loin l'un de l'autre. Elle est calculée avec l'équation 6.10 suivante :
n
1
(6.10)
X
Vdsim =
(Sim(Fi , Ac ) ∗ d(Pi , Pc ))
i

Où Vsim , Vdsim sont respectivement, la vélocité de similarité et de dissimilarité


Sim(Fi , Ac ) est la distance d'Hausdor utilisée dans notre cas pour estimer les
caractéristiques des streamlines portées par les agents Fi et Ac , et, d(Pi , Pc ) est la
distance euclidienne entre leurs positions.
Le vecteur de vélocité de chaque agent est enn calculé en additionnant les
vecteurs de vélocité donnés par les règles d'alignement, de cohésion et de séparation,
selon l'équation 6.11 :

~ = V~ar + V~sr + V~cr + Vsim


V ~ + Vdsim
~ (6.11)

6.6 Potentiel du clustering basé sur les multi-agents


L'algorithme de ockage tire son avantage sur le principe heuristique du méca-
nisme de recherche des essaims. En eet, le mécanisme de recherche heuristique aide
les boids à former un essaim rapidement. Puisque les boids volent en permanence
dans l'espace virtuel et se joignent pour former des essaims constitués des boids
similaires, de nouveaux résultats peuvent être rapidement générés lors de l'ajout
d'entités de boids ou la suppression d'une partie des boids au moment de l'exécu-
tion, et si un boid rencontre d'autres boids dont le degré de similarité est supérieur

127
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales

à son essaim d'appartenance, il change d'essaim en abandonnant son essaim initial


en rejoignant ce nouvel essaim.
Cette fonctionnalité rend l'algorithme de ockage "MSF" intéressant pour être
appliqué au clustering des streamlines de la SB, an d'analyser le ux d'informations
en changement dynamique et nous l'adoptons, sachant qu'il n'a jamais été utilisé
dans ce contexte.
Ainsi, nous nous sommes basés sur ce modèle bio-inspiré pour proposer une nou-
velle méthode de clustering inter-sujets, tout en permettant d'éliminer les outliers.
Nous avons également introduit la notion des multi-agents en considérant le
type d'agent, qui permet à chaque agent d'exécuter une tache prédénie. Les ca-
ractéristiques du paradigme multi-agent telles que l'adaptabilité, le parallélisme,
l'asynchronisme et la décentralisation permettent à notre méthode d'adresser toutes
les contraintes du clustering des streamlines de la SB citées auparavant.

6.7 L'algorithme 3D-SSF


Nous avons exploité les concepts décrits ci-dessus pour proposer une nouvelle
méthode dynamique incrémentale de clustering inter-sujets des streamlines de la
SB, tout en permettant d'éliminer les streamlines outliers, dans [Chekir 2017a].
Nous avons nommé cette méthode "3D-Streamlines Stream Flocking (3D-SSF)" .
Notre méthode 3D-SSF considère les streamlines de la SB de diérents sujets entrant
dans le système à des intervalles réguliers comme un ux séquentiel de données. Ce
ux est divisé en partitions. Nous opérons sur chaque partition indépendamment,
et l'historique des statistiques représentant l'information ancienne issue du cluste-
ring de la partition précédente, est inséré dans la partition suivante. Ce principe
permet à la méthode de passer à l'échelle pour de grands ensembles de données de
tractographie générés à partir de plusieurs sujets.
La méthode 3D-SSF utilise un système multi-agents avec des fonctionnalités
simples et distinctes pour simuler le comportement du modèle MSF, ce qui donne un
aspect dynamique à la méthode. Chaque streamline est aectée à un agent déterminé
par sa position P = (x; y; z) et son vecteur de vélocité V~ . Les agents sont déployés
aléatoirement dans l'espace 3D.
Notre méthode opère en deux phases, à travers lesquelles, trois types d'agents
sont introduits :SimpleAgent PotentialAgent OutlierAgent
, et .

La phase d'initialisation
Au début, lorsque la première partition du ux est introduite dans le système,
chaque streamline est associé à un agent appelé SimpleAgent . Les SimpleAgents
travaillent en parallèle pour un nombre prédéni d'itérations an de regrouper en-
semble des agents transportant des streamlines similaires, exploitant la fonction de
similarité (distance d'Hausdor). Chaque agent compare sa fonction de similitude
avec seulement ses agents voisins. L'agent est considéré comme un voisin d'un autre
agent s'il est dans son rayon de visibilité.

128
6.7. L'algorithme 3D-SSF

Le vecteur de vélocité V~ de l'agent est calculé en appliquant les règles locales de


Reynolds avec les règles de similarité et de dissimilarité. En particulier, le vecteur
de vélocité pour chaque agent est calculé en additionnant les vecteurs de vélocité
donnés par les règles de similarité, dissimilarité, alignement, cohésion et séparation
pour former un ock (groupement) composé uniquement d'agents similaires. Grâce
aux règles de similarité et de dissimilarité, l'agent tente de rester proche des agents
ayant des caractéristiques similaires et loin des agents ayant des caractéristiques
diérentes.
Par conséquent, la règle de similarité confère un comportement adaptatif à
l'agent, ce qui fait que la participation d'un agent à un cluster n'est pas déni-
tive. Si un agent plus semblable est rencontré pendant l'exploration spatiale, le ock
actuel peut être abandonné, et l'agent rejoint un autre ock avec une similitude plus
élevée.
Plusieurs ocks (nuées ou essaims) sont obtenus à la n de cette phase. Ces
essaims sont divisés en deux types, suivant le mécanisme adaptatif de détection
des outliers détaillé au paragraphe 6.3 : les essaims potentiels et les essaims outliers.
L'essaim potentiel est représenté par un médoïde potentiel, assigné à un nouvel agent
introduit dans le système appelé PotentielAgent . L'essaim outlier est représenté par
un médoïde outlier, aecté à un nouvel agent introduit dans le système appelé
OutlierAgent .

La phase de maintenance des statistiques représentatives et du clus-


tering
Lorsque de nouvelles partitions sont introduites une à une dans le système, les
streamlines qui les constituent sont attribuées à de SimpleAgents et tentent de fusion-
ner avec les agents potentiels et outliers résultant des étapes précédentes. Diérents
cas peuvent survenir :
 Un PotentialAgent/OutlierAgent rencontre un PotentialAgent/OutlierAgent
dans son rayon de perception, la similarité entre eux est calculée. Si les agents
sont similaires, ils calculent le vecteur de vélocité en appliquant les règles de
Reynolds avec les règles de similarité et de dissimilarité et se joignent pour
former un essaim (i.e. cluster) dePotentialAgents/OutlierAgents similaires.
 Un SimpleAgent rencontre un autrePotentielAgent/OutlierAgent dans son
rayon de perception. La similarité entre eux est calculée, et s'ils sont simi-
PotentielAgent/OutlierAgent
laires, le simple agent est absorbé par le .
 Un SimpleAgent SimpleAgent
rencontre un autre . La similarité entre les deux
agents est calculée, et si les agents sont similaires, le vecteur de vélocité
est calculé, et les deux SimpleAgents se joignent pour former un essaim
OutlierAgents
d' .
Pendant ce mouvement, l'agent peut changer d'appartenance à un essaim, s'il
rencontre un essaim plus similaire. Les statistiques récapitulatives sont mises à jour
à la n d'un nombre maximum xe d'itérations en estimant les potentiels et les
outliers représentatifs des essaims nouvellement obtenus. Si la taille d'un essaim de

129
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales

PotentialAgents diminue en dessous d'une taille dénie SizeT hreshold ou sa valeur


ADM M augmente au-dessus d'un degré d'isolation déni IsolationDegree, elle est
dégradée pour devenir un essaim d' OutlierAgents . Sinon, si la taille d'un essaim
d'OutlierAgents augmente au-dessus de SizeT hreshold ou son ADM M diminue en
dessous de l'IsolationDegree, un nouvel essaim de PotentialAgents est créé.
Notre méthode donne des essaims de médoïdes potentiels et des essaims de mé-
doïdes outliers à la n de l'itération, et les essaims outliers sont rejetés. Les faisceaux
naux sont les essaims des agents potentiels représentatifs.
Le concept de l'algorithme 3D-SSF est ainsi introduit par le pseudo code de
l'algorithme 5. Nous avons commencé par introduire la procédure 4 qui calcule les
statistiques représentatives, ensuite, nous décrivons les étapes de l'algorithme 3D-
SSF, y compris la phase d'initialisation et la phase de maintenance des statistiques
représentatives et du clustering. La gure 6.6 montre les diérentes étapes succes-
sives de la façon dont le processus évolue pour un seul faisceau.

Figure 6.6  Example de l'algorithme 3D-SSF appliqué au faisceau cortico-spinal


gauche (CST-L) à travers dierents sujets.

6.8 Expérimentations, résultats et discussion


Nous avons évalué notre méthode 3D-SSF à travers diérentes expérimentations
sur des données synthétiques et réelles, tout en comparant nos résultats avec d'autres
approches de la littérature. L'algorithme 3D-SSF a été implémenté en langage Py-

130
6.8. Expérimentations, résultats et discussion

Algorithm 4 La fonction de calcul des statistiques représentatives


1: procedure Summary Statistics(swarms)
2: for Each Swarm do
3: compute medoid
4: for Each medoid M do
5: ADM M = EuclideanDistance(medoid M, medoid)
6: IsolationDegree = (average(ADM M ) ∗ Cst)
7: end for
8: if (len(swarm)
> (len(ChunkStream)/N umberOf Swarms)) and
(ADM M < IsolationDegree) then
9: PotentialMedoid= medoid
10: Append (PotentialMedoid) to PotentialSwarm
11: else if then
12: OutlierMedoid= medoid
13: Append (OutlierMedoid) to OutlierSwarm
14: end if
15: end for
16: return PotentialMedoid, OutlierMedoid
17: end procedure

Algorithm 5 L'algorithme 3D-SSF - Phase d'initialization


Input : Streamlines of the rst stream chunck
Output : PotentialSwarms, OutlierSwarms
for i = 1 to M axIterations do
2: for streamline in ChunkStream do
SimpleAgent=streamline
4: end for
for Each SimpleAgent X do
6: if DirectDistance(X, Y ) < ε (X contains in its visibility range a Sim-
pleAgent Y) then
if similarity(X, Y ) < γ then
8: computeVelocity(ock, MSF rules)
Move SimpleAgent : P ositionSimpleAgent = P ositionSimpleAgent +
~velocity
V
10: Append (SimpleAgent) to SimpleSwarm
end if
12: end if
end for
14: end for
Compute Summary Statistics Function(swarms)
16: Aect PotentialMedoid to PotentialAgent and OutlierMedoid to OutlierAgent

131
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales

Algorithm 6 L'algorithme 3D-SSF - Phase de maintenance des statistiques repré-


sentatives et du clustering
Input : Streamlines of the chunk stream, PotentialMedoids, OutlierMedoids
Output : PotentialSwarms, OutlierSwarms
Repeat for every chunk in stream :
2: for i = 1 to M axIterations do
for streamline in NewChunkStream do
4: SimpleAgent=streamline
end for
6: for Each PotentialAgent X do
if DirectDistance(X, Y ) < ε (X contains in its visibility range a Poten-
tialAgent Y) then
8: if similarity(X, Y ) < γ then
computeVelocityVector(ock, MSF rules)
10: Move PotentialAgent : P ositionP otentialAgent =


P ositionP otentialAgent + V velocity
Append (PotentialAgent) to PotentialSwarm
12: end if
end if
14: end for
for Each OutlierAgent X do
16: if DirectDistance(X, Y ) < ε (X contains in its visibility range a Outlie-
rAgent Y) then
if similarity(X, Y ) < γ then
18: computeVelocityVector(ock, MSF rules)
Move OutlierAgent : P ositionOutlierAgent = P ositionOutlierAgent +


V velocity
20: Append (OutlierAgent) to OutlierSwarm
end if
22: end if
end for
24: end for
for Each SimpleAgent do
26: if DirectDistance(X, Y ) < ε (X contains in its visibility range a Outlie-
rAgent Y) then
SimpleAgent X is temporary absorbed in the OutlierSwarm
28: else if DirectDistance(X, Y ) < ε (X contains in its visibility range a Sim-
pleAgent Y) then
if similarity(X, Y ) < γ then
30: computeVelocityVector(ock, MSF rules)
Move SimpleAgent : P ositionSimpleAgent = P ositionSimpleAgent +
Vvelocity
32: Append (SimpleAgent) to OutlierSwarm
end if
34: end if
end for 132
6.8. Expérimentations, résultats et discussion

thon. L'exécution a été eectuée sur le processeur Intel (R) Core (TM) i7 doté de 8
Go de mémoire.

6.8.1 Expérimentations et résultats sur les données synthétiques


6.8.1.1 Données synthétiques
En premier lieu, an d'évaluer la capacité de notre méthode à extraire correc-
tement divers faisceaux, elle a été appliquée aux données synthétiques, créées en
utilisant le logiciel NFG [Close 2009]. Ces données ont été construites dans le cadre
du challenge ISBI 2013 1 . Elles ont un volume sphérique avec un rayon xe et des
diamètres allant de 1, 83mm à 7, 27mm et elles sont composées d'un total de 940
streamlines synthétiques constituant 20 faisceaux, simulant la réalité connue de la
SB, avec des formes géométriques diérentes, imitant des congurations d'embrasses,
de exion, de branchement et de croisement à des angles compris entre 30◦ et 90◦
, comme l'illustre la gure 6.7 (a). Pour évaluer également la robustesse de notre
méthode face aux outliers, deux autres faisceaux composés de 4 lignes et 3 courbes
ont été ajoutés aux données synthétiques (faisceaux rouge foncé et pourpre sur la
gure 6.7 (a)), ce qui génère un total de 947 streamlines synthétiques.

6.8.1.2 Expérimentations
Nous avons implémenté deux autres méthodes de clustering des streamlines de
la SB : le clustering HQB [côté 2013], qui est une version améliorée de l'algorithme
QB [Garyfallidis 2012b], elle utilise un arbre probabiliste de clustering à partir des
applications multiples du clustering QB pour l'élimination les streamlines outliers et
la méthode V-Bundles [Reichenbach 1996]. Nous avons appliqué le clustering HQB
en utilisant la distance MDF, avec un seuil de 8mm. La distance MDF (détaillée au
paragraphe 3.4.1 du chapitre 3) exige que les streamlines comparées aient le même
nombre de points. A cet eet, les streamlines ont été automatiquement échantillon-
nées pour avoir seulement 20 points en se basant sur la méthode d'échantillonnage
détaillée dans [Garyfallidis 2012b].
La méthode V-Bundles est basée sur une adaptation du champ de vecteur de l'al-
gorithme k-means [Hartigan 1979] pour extraire les faisceaux de la SB. Nous avons
maintenu les mêmes paramètres adoptés dans la proposition originale [Reichenbach 1996] ;
le nombre maximal d'itérations des k-means = 3, λ = 0.001, γ = 0.6, rv = 15mm
et rz = 9mm.
Initialement, nous avons testé uniquement la phase d'initialisation avec l'en-
semble des données synthétiques pour évaluer la capacité du clustering dynamique
basée sur le modèle MSF à reproduire ecacement les faisceaux des données syn-
thétiques. Nous avons utilisé un certain nombre d'agents initiaux correspondant au
nombre total de streamlines dans les données Na = 947, pour assigner à chaque
agent une streamline, nous avons aussi xé le seuil de similarité à 8mm et le nombre
1. http://hardi.epfl.ch/static/events/2013_ISBI/

133
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales

d'itération maximale M axIterations = 100, qui se sont avérés des paramètres opti-
maux. Nous avons utilisé le concept d'élimination des outliers décrit au paragraphe
6.3 , avec une constante de degré d'isolement xée à une valeur de 1.5.
Nous avons ensuite exécuté les deux phases de notre méthode 3D-SSF, initialisa-
tion et maintenance des statistiques représentatives et du clustering, en utilisant les
mêmes paramètres spéciés ci-dessus, sauf la taille de l'échantillon, car nous avons
divisé la totalité des données en blocs de 100 streamlines, donc nous avons xé le
nombre d'agents initiaux à Na = 100.

6.8.1.3 Evaluation quantitative


Les résultats obtenus avec les trois méthodes (3D-SSF (phase initiale), HQB et
V-Bundles) sur des données synthétiques sont illustrés à la gure 6.7.
La méthode 3D-SSF a été capable de séparer les streamlines en 22 clusters signi-
catifs : 20 faisceaux principaux représentés par 20 courbes de médoides potentiels (la
médoide est la streamline en noir dans les faisceaux de la gure 6.7 (b)) attribuées
aux agents potentiels et deux clusters d'outliers représentés par deux streamlines
médoides outliers, transportées par des agents éloignés et qui ont été éliminés du
résultat nal.
La méthode HQB a réussi à éliminer les streamlines outliers, mais elle a confondu
deux faisceaux principaux (les faisceaux jaune vert et orange dans la gure 6.7 (a))
dans le même cluster (faisceau orange dans la gure 6.7 (c)). Ainsi, nous avons
obtenu un total de 21 clusters avec la méthode HQB : deux clusters d'outliers et 19
faisceaux principaux (voir la gure 6.7 (c))).
La méthode V-bundles a été perturbée par les streamlines outliers ; elle a extrait
donc les 20 faisceaux principaux, mais ils ont été confondus avec les streamlines
outliers (gure 6.7 (d)).
Les résultats obtenus avec la méthode 3D-SSF démontrent sa capacité à repro-
duire parfaitement la vérité terrain des faisceaux synthétiques, en extrayant les 22
clusters construits initialement, 20 faisceaux principaux et deux clusters d'outliers.
Chaque faisceau est caractérisé par un ensemble de streamlines médoïdes.
Nous avons eectué une comparaison statistique robuste en utilisant l'indice de
Rand ajusté Adjusted Rand Index , l'indice d'exhaustivité Completeness et l'indice
d'homogénéité homogeneity [Moberts 2005] pour évaluer l'exactitude et les perfor-
mances des trois méthodes de clustering.
Un degré d'exhaustivité supérieur indique que les streamlines appartenant au
même faisceau anatomique sont regroupés ensemble.
L'indice de Rand ajusté est déni comme le nombre d'agrément de paires de
streamlines divisé par le nombre total de paires. Si deux faisceaux coïncident com-
plètement, l'indice de Rand retourne la valeur de 1. Sinon, la limite inférieure de cet
indice est 0.
L'indice d'homogénéité calcule le degré pour lequel un cluster ne contient que
des streamlines d'une seule classe.
Le tableau 6.1 présente les résultats de cette analyse. Notre méthode 3D-SSF

134
6.8. Expérimentations, résultats et discussion

(a) Les données synthétiques (b) Les résultats obtenus avec


initiales. Les 20 faisceaux princi- la méthode 3D-SSF. Elle a été
paux simulés, en diérentes couleurs en mesure de reproduire les 20 fais-
et les deux faisceaux d'outliers avec ceaux principaux, représentés par
les couleurs rouge foncé et violet. les streamlines médoides en couleur
noire, et éliminer les faisceaux d'out-
liers.

(c) Les résultats obtenus avec (d) Les résultats obtenus avec la
la méthode HQB. Elle a réussi à méthode V-Bundles. Les 20 prin-
éliminer les outliers, tout en mélan- cipaux faisceaux confondus par les
gant deux faisceaux initiaux dans le streamlines outliers en couleurs dif-
même faisceau en orange férentes.

Figure 6.7  Les résultats de diérentes méthodes de clustering (3D-SSF, HQB et


V-Bundles) sur des données synthétiques.

a montré des valeurs importantes pour l'exhaustivité, l'indice de Rand ajusté et


l'homogénéité, coïncidant avec les résultats obtenus précédemment, qui montre que
la méthode 3D-SSF génère des clusters correspondant à la vérité terrain. Cette
expérimentation a conrmé la capacité de notre méthode à éliminer les outliers, ce
qui est idéal dans notre cas car données réelles sont très bruitées.
Les résultats de la méthode HQB ont également montré un degré d'exhaustivité
élevé mais une homogénéité inférieure, ce qui indique que les clusters obtenus sont
complets mais ne contiennent pas de streamlines de la même structure.

135
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales

Les résultats obtenus avec la méthode V-bundle ont révélé des valeurs médiocres
en ce qui concerne à la fois l'homogénéité et l'exhaustivité par rapport aux autres
approches, et les clusters résultants ne sont généralement pas bien séparés.

Table 6.1  Comparaison quantitative des trois méthodes de clustering (3D-SSF,


HQB, V-Bundles)
XXXMéthode
XXX
3D-SSF HQB V-
X
Indice
Bundles
XXX
XX
Indice Rand ajusté 0.955 0.838 0.791
Exhaustivité 0.981 0.920 0.886
Homogénéité 0.981 0.899 0.816

6.8.2 Expérimentations et résultats sur les données réelles


6.8.2.1 Données réelles
La méthode proposée a été testée sur des données réelles de diusion issues de 10
sujets sains, collectées de la base de données "Human Connectome Project (HCP)"
[Essen 2011, Sotiropoulos 2013]. Ces données ainsi que le processus du prétraitement
eectué pour obtenir la base de données de tractographie, qui a été utilisée en entrée
aux méthodes de clustering, sont décrits au paragraphe 5.4.2.1 du chapitre 5.

6.8.2.2 Construction automatique d'un atlas de la SB


Le problème principal avec le clustering de la SB est la validation toute méthode
sur des données réelles de diusion, comme nous l'avons constaté également au
chapitre précédent 5, et cela en raison de l'absence de la réalité terrain des faisceaux
de la SB. Pour évaluer l'exactitude de nos résultats sur les données réelles, décrites
ci-dessus, nous avons construit un atlas de faisceaux de la SB que nous considérions
comme notre standard.
Dans cette étude, nous avons utilisé une méthode de segmentation totalement
automatique, en se basant sur le langage de requête de la SB "white matter query
language (WMQL)", pour segmenter les bases de données réelles de tractographie
issues de nos dix sujets selon la parcellisation de la suite logicielle FreeSurfer 2 et les
dénitions anatomiques des faisceaux de la SB (les détails sont donnés en annexe
A).
Nous avons obtenu pour chaque sujet, 37 faisceaux neuroanatomiques : plusieurs
faisceaux de projection, d'association et commissuraux, à savoir le faisceau cortico-
spinal gauche / droit (CST), le cingulum gauche / droit (CG), le faisceau arqué droit
/ gauche, le faisceau longitudinal gauche / droit (ILF), le faisceau fronto-occipital
inférieur gauche / droit (IFO), le faisceau longitudinal supérieur gauche / droit 1, 2
et 3 (SLF 1, 2, 3) ; et enn les sept parties du corps calleux (CC 1-7).
2. https://surfer.nmr.mgh.harvard.edu/fswiki/CorticalParcellation

136
6.8. Expérimentations, résultats et discussion

Ensuite, nous avons généré un atlas de tous ces faisceaux en utilisant la méthode
de segmentation décrite dans [Hua 2008]. Les faisceaux obtenus avec la segmentation
WMQL de chaque sujet ont été convertis en cartes binaires (1 : pixels qui contenaient
la rationalisation, 0 : pixels qui ne contenaient pas la rationalisation). Les cartes
binaires obtenues à partir des 10 sujets ont été moyennées pour produire une carte
probabiliste de la SB dans la norme MNI et ce, pour chaque faisceau.
Les cartes probabilistes des faisceaux de l'atlas ont été superposées aux cartes
binaires des faisceaux obtenus avec les méthodes de clustering an d'estimer le
degré de correspondance spatiales entre les faisceaux pour l'analyse statistique de
la reproductibilité comme indiqué dans [Wakana 2007].

6.8.2.3 Expérimentations
L'algorithme 3D-SSF a été testé sur les données réelles de diusion décrites ci-
dessus. Les paramètres de notre algorithme ont été choisis pour obtenir les meilleurs
résultats. Nous avons considéré les données des dix sujets comme un ux séquentiel
de streamlines. Ce ux a été divisé en partitions de 10000 streamlines par parti-
tion. Le nombre d'agents initiaux dénit à Na = 10000 (les mêmes résultats sont
obtenus avec diérentes tailles de partitions en raison de la nature dynamique de
notre approche), le seuil de similarité à 8mm, le nombre maximum d'itérations
M axIterations = 100 et les streamlines outliers ont été déterminés en utilisant le
concept décrit au paragraphe 6.3.
Nous avons comparé la précision du clustering et l'ecacité du temps de calcul de
notre méthode 3D-SSF avec d'autres techniques de la littérature, comme l'approche
la plus récente, "Multi-subjects Clustering with QuickBundles" (MSQB), propo-
sée dans [Garyfallidis 2015], qui est basée sur l'algorithme QB, considéré comme
l'algorithme le plus rapide dans la littérature [Garyfallidis 2012b].
Nous avons mis en oeuvre la méthode MSQB en suivant les mêmes étapes que
dans l'étude initiale [Garyfallidis 2015], détaillées au chapitre 3.
Les deux méthodes ont été également comparées à l'atlas de la SB construit dans
cette étude, qui est considéré comme notre référence.

6.8.2.4 Evaluation de l'ecacité du clustering


Nous avons estimé le rapport de correspondance spatiale spatial matching ratio
(SMR), l'accord du volume spatial spatial volume agreement (SVA) et les caracté-
ristiques statistiques kappa entre les faisceaux de l'atlas, les faisceaux résultants du
clustering 3D-SSF et du clustering MSQB pour des ns de comparaison.
Le SMR entre deux faisceaux est déni comme suit (équation 6.12) :
V (Ia ∩ Im )
SM R(Ba , Bm ) = (6.12)
V (Ia ∪ Im )
Le SVA entre deux faisceaux est déni comme suit (équation 6.13) :
V (Ia − Im )
SV A(Ba , Bm ) = |1 − | (6.13)
V (Ia + Im )

137
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales

où Ba est le faisceau extrait automatiquement, Bm est le faisceau obtenu par


étiquetage manuel, Ia et Im sont les cartes binaires pour Ba et Bm respectivement,
V () représentent le volume voxel non nul, l'opérateur ∩ prend l'intersection des deux
images binaires et l'opérateur ∪ prend l'union des deux images binaires.
Les résultats de l'analyse kappa sont illustrés à la gure 6.8(a). Les valeurs de
Kappa sont assez élevées pour tous les faisceaux obtenus avec notre méthode. Une
valeur de Kappa moyenne de plus de 0,80 a été observée, contre 0,7 pour le clustering
MSQB, ce qui démontre de la précision de notre méthode, même pour des données
réelles. Le faisceau longitudinal inférieur gauche (ILF-L) a le plus faible indice de
concordance (Kappa = 0,73), et le faisceau cortico-spinal droit (CST-R) a le meilleur
accord (Kappa = 0,93).
Les résultats moyens de SMR et SVA pour les deux méthodes sont illustrés
à la gure 6.8(b, c). Les résultats de notre méthode indiquent un haut niveau de
correspondance pour tous les faisceaux. La moyenne des SMR et SVA ont été respec-
tivement de 86% et 94% pour notre méthode, contre 78% et 84% pour le clustering
MSQB, ce qui démontre de la bonne performance de l'approche 3D-SSF par rapport
à la méthode MSQB.
Nous avons également eectué une analyse de diusivité quantitative en me-
surant les valeurs moyennes d'anisotropie fractionnelle FA, de chaque faisceau, en
utilisant le logiciel Trackvis. 3 .
Pour chaque faisceau, la valeur FA a été estimée en faisant la moyenne des valeurs
de FA calculées sur les voxels appartenant à ce faisceau. Les faisceaux obtenus avec
notre méthode et la méthode MSQB ont été superposés sur la carte probabiliste
de FA du faisceau correspondant dans l'atlas, construit à partir de la moyenne des
cartes de FA des dix sujets.
La gure 6.9 montre que la diérence de la diusivité quantitative entre les
faisceaux de l'atlas et les faisceaux issus de notre méthode 3D-SSF est assez faible,
conrmant les bonnes performances de la méthode.
Une étude de la diérence de métrique d'échelle Scale Metrics Dierence (SMD)
a été menée. La SMD est dénie comme suit (équation 6.14) :

|Sa − Sm |
SM D(Ba , Bm ) = (6.14)
Sm
où Sa est la valeur moyenne d'une métrique DTI, telle que la FA ou l'ADC,
dans un faisceau obtenu par la méthode automatique proposée, et Sm est celui des
faisceaux obtenus par l'étiquetage manuel d'expert.
Cette étude a révélé une moyenne assez faible, ce qui indique que les faisceaux ob-
tenus par notre méthode sont exacts. La table 6.2 résume les valeurs SMD obtenues
avec les méthodes 3D-SSF et MSQB.
Ces résultats expérimentaux prouvent que la méthode 3D-SSF atteint une haute
qualité de clustering par rapport à celle de la méthode MSQB et arment la ca-
pacité de notre méthode à extraire correctement les principaux faisceaux de la
3. http://www.trackvis.org/

138
6.8. Expérimentations, résultats et discussion

(a)

(b)

(c)

Figure 6.8  Evaluation quantitative des faisceaux obtenus avec la méthode 3D-
SSF. (a) L'analyse Kappa . (b) Spatial matching ratio (SMR) et (c) Spatial volume
agreement (SVA).
139
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales

(a)

(b)

Figure 6.9  L'analyse de diusivité quantitative entre les faisceaux de l'atlas et


les faisceaux obtenus avec les méthodes 3D-SSF et MSQB. (A) La FA moyenne de
douze faisceaux choisis alléatoirement. (B) La FA moyenne des sept partitions du
corps calleux.

Table 6.2  les valeurs SMD obtenues avec les méthodes 3D-SSF et MSQB.
HH
HH CSTL CSTR CGL CGR IFOL IFOR ILFL ILFR ORL ORR SLFL SLFR

3D-SSF 0.142 0.121 0.129 0.142 0.285 0.341 0.028 0.052 0.147 0.05 0 0.22
MSQB 0.981 0.920 0.886 0.955 0.838 0.791 0.142 0.078 0.096 0.355 0.135 0.088

SB. La gure 6.10 présente quelques faisceaux principaux obtenus avec notre mé-
thode, comme le faisceau cortico-spinal gauche/droit (CST), le faisceau cingulum
gauche/droit (CG), le faisceau longitudinal inférieur gauche/droit (ILF), le faisceau
fronto-inférieur gauche/droit (IFO), le faisceau arqué gauche/droit (AF) et enn les
septs partitions du corps calleux (CC).

140
6.8. Expérimentations, résultats et discussion

(a) (b)

(c)

Figure 6.10  Illustration de quelques faisceaux obtenus avec la méthode 3D-SSF,


distingués en couleurs. (a) Montre une vue sagittale gauche. (b) Montre une vue
sagittale droite. (c) Montre les diérentes partitions du corps calleux.

6.8.2.5 Evaluation de l'ecacité computationnelle


An d'évaluer l'ecacité computationnelle de la méthode 3D-SSF, l'analyse des
temps d'exécution a été réalisée en examinant le temps nécessaire pour eectuer le
clustering dans chaque partition des streamlines issus d'un seul sujet choisi aléa-
toirement puis, le temps de clustering de la totalité de l'ensemble des données de
tractographie des dix sujets.
La complexité d'exécution de notre méthode 3D-SSF est d'ordre linéaire parce
que l'agent doit comparer ses caractéristiques avec seulement les agents de son voi-
sinage. Pour N streamlines, la complexité est de O(N kT ), où k est le nombre de
streamlines, se trouvant dans la plage de visibilité de chaque agent (telque k  N )
et T est le nombre d'itérations (T = 100 dans notre cas).
En revanche, la plupart des méthodes de la littérature ont une complexité de
O(N 2 ) parce qu'elles nécessitent la comparaison entre toutes les N streamlines dans
la base de données de tractographie. Ces méthodes nécessitent beaucoup plus de
temps que notre méthode 3D-SSF pour regrouper n'importe quel ensemble de don-

141
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales

nées. Par conséquent, nous avons choisi la méthode la plus rapide dans la littérature,
QB, pour la comparaison dans le clustering d'un seul sujet et la méthode MSQB
basé sur cette dernière, pour l'étude comparative du clustering inter-sujets, car la
QB est de complexité O(N ) dans le meilleur des cas, où N est le nombre total de
streamlines.
La gure 6.11(a) montre le temps requis pour regrouper un jeu de données réelles
d'un sujet contenant approximativement 800 000 streamlines par pas de 10 000
(la taille d'une partition). Les résultats de cette expérience montrent que notre
méthode nécessite un temps de calcul court pour terminer le clustering dans les
partitions initiales. Cependant, le temps de calcul augmente par la suite pour les
autres partitions, ce qui peut être expliqué par la taille des partitions qui augmente
après l'injection des streamlines représentatives issues du clustering des partitions
précédentes.
La gure 6.11(b) montre le temps requis par notre méthode pour eectuer un
clustering sur un ensemble de données composé des streamlines issues des dix sujets
par rapport à la méthode MSQB. Notre méthode nécessite 1027 secondes pour obte-
nir de bons résultats de clustering pour un seul sujet d'environ 800 000 streamlines,
alors que la méthode QB nécessite 370,3 secondes. Le temps requis pour chaque sujet
dépend du nombre de streamlines qui le constitue. Pour réaliser le clustering inter-
sujets des dix sujets, notre méthode nécessite 10 701 secondes (environ 3 heures),
alors que la méthode MSQB nécessite 5 257 secondes (approximativement une heure
et demie) pour regrouper les mêmes streamlines.
Les résultats de cette expérience démontrent que notre méthode présente des
performances de temps acceptables par rapport à la grande taille de l'ensemble de
données. Notre méthode nécessite un peu plus de temps, comparée à la méthode la
plus rapide dans la littérature, pour obtenir des résultats de clustering plus précis
que cette dernière, ce qui rend notre méthode scalable sur de très grands ensembles
de données.

6.8.2.6 Ecacité de la manière de calculer le vecteur de vélocité


Dans cette expérience, nous démontrons l'ecacité de la manière de calculer
le vecteur de vélocité basée sur la combinaison des quatre règles et explorons cer-
taines de ses caractéristiques. Le clustering 3D-SSF a été appliqué sur l'ensemble de
données réelles avec diérentes manières de calculer le vecteur de vélocité d'agent.
Dans le premier cas, nous avons calculé le vecteur de vélocité pour chaque agent
en sommant les vecteurs de vélocité donnés par les règles de similarité, d'alignement,
de cohésion et de séparation (équation 6.11). Dans le second cas, nous avons appli-
qué uniquement les règles de Reynolds (alignement, cohésion et séparation) sans la
règle de similarité et dissimilarité (équation 6.9, 6.10). Enn, dans le troisième cas,
le vecteur de vélocité pour chaque agent a été calculé en sommant les vecteurs de
vélocité donnés par les règles d'alignement, de cohésion, de séparation et de simila-
rité, mais le vecteur de similarité a été déni comme la diérence entre la vélocité
de similarité et de la dissimilarité, selon l'équation 6.15 suivante :

142
6.8. Expérimentations, résultats et discussion

(a) Temps d'exécution de notre méthode pour chaque partition dans la


base de données de tractographie d'un seul sujet, contenant environ 800
000 streamlines.

(b) Comparaison de temps d'exécution de notre méthode 3D-SSF


et la méthode MSQB, en faisant varier le nombre de streamlines
d'un sujet à dix sujets.

Figure 6.11  L'ecacité computationnelle de la méthode 3D-SSF

~ = V~ar + V~sr + V~cr + Vsim


V ~ − Vdsim
~ (6.15)
De plus, pour étudier la performance de la distance d'Hausdor utilisée pour
estimer la similarité entre les caractéristiques des streamlines portées par les agents,
le clustering 3D-SSF a été réalisé deux fois sur l'ensemble de données réelles, en
utilisant la même méthode pour le calcul du vecteur de vélocité, mais à chaque fois,
avec des mesures de similarité des streamlines diérentes. On a utilisé la distance
HD et la distance MDF proposée dans [Garyfallidis 2012b].
Les faisceaux résultants de ces diérents cas ont été comparés à notre référentiel
standard (l'atlas construit dans cette étude) en utilisant les indices de validation de

143
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales

clustering comme l'indice de Rand ajusté pour évaluer les performances de chaque
cas. La table 6.3 présente les résultats de cette évaluation quantitative.
Les résultats obtenus en utilisant la distance d'Hausdor sont généralement
meilleurs pour les trois cas, ce qui coïncide avec l'hypothèse posée préalablement,
dans l'étude [Guevara 2011b]. Nous avons conrmé que la distance d'Hausdor est
plus précise que la distance MDF pour la mesure de similarité entre les streamlines.
Le premier et le troisième cas donnent les meilleurs résultats comparés au deuxième
cas pour tous les faisceaux. L'ajout de la règle de similarité améliore nettement la
précision des résultats de clustering et contribue à la formation rapide de clusters
composés uniquement de streamlines similaires. En revanche, dans le second cas,
dans lequel seules les trois règles de Reynolds ont été appliquées, la méthode de
clustering 3D-SSF devient limitée pour séparer correctement les streamlines en fais-
ceaux cohérents confondus par les ourliers. Le troisième cas atteint des résultats
presque identiques à ceux du premier cas.
Cette performance peut être expliquée par la capacité de la vélocité de similarité
à maintenir les agents similaires dans le même cluster et la capacité de la vélocité
de dissimilarité à repousser les autres agents portant des streamlines dierents.

Table 6.3  L'indice de Rand ajusté calculé entre quelques faisceaux obtenus avec l'algorithme
3D-SSSF et les faisceaux de l'atlas pour diérents cas de calcule du vecteur de vélocité.
H
HH CSTL CSTR CGL CGR IFOL IFOR ILFL ILFR ORL ORR SLFL
H
Case 1 (HD) 0.986 0.992 0.982 0.892 0.777 0.772 0.781 0.785 0.979 0.990 0.880
Case 1 (MDF) 0.899 0.923 0.844 0.782 0.728 0.713 0.689 0.699 0.800 0.885 0.752
Case 2 (HD) 0.561 0.586 0.450 0.488 0.299 0.332 0.388 0.395 0.411 0.513 0.355
Case 2 (MDF) 0.441 0.458 0.282 0.290 0.235 0.199 0.259 0.210 0.301 0.422 0.315
Case 3 (HD) 0.988 0.981 0.957 0.947 0.819 0.830 0.885 0.873 0.966 0.962 0.812
Case 3 (MDF) 0.948 0.955 0.899 0.821 0.730 0.754 0.738 0.785 0.857 0.911 0.795

6.9 Conclusion
Nous avons présenté dans ce chapitre une nouvelle méthode de clustering inter-
sujets ecace, capable d'analyser des jeux de données de tractographie de grande
taille, issus d'une population de sujets, tout en éliminant les outliers, an de déduire
un modèle des faisceaux génériques présents dans la plupart des sujets.
Cette approche dynamique utilise le modèle bio-inspiré MSF basé sur les sys-
tèmes multi-agents, lui permettant de bénécier des avantages oerts par les multi-
agents tel que l'adaptabilité, le parallélisme, l'asynchronisme et la décentralisation
pour faire face à la grande taille de la base de données de tractographie, sa com-
plexité et variabilité.
Nous avons testé la robustesse et la qualité des résultats de la méthode 3D-
SSF sur des données simulées et des données réelles. Les résultats obtenus ont été
comparés avec d'autres stratégies de la littérature. Un atlas multi-sujets de la SB a
été également construit automatiquement dans cette étude, pour valider les résultats
obtenus avec notre méthode.

144
Conclusion générale et
perspectives
Dans cette thèse, nous avons commencé par étudier et discuter les méthodes
proposées dans la littérature, pour la segmentation et le clustering des faisceaux
an de mettre en évidence les forces et les limites de ces méthodes et cerner ainsi
la problématique. Au passage, nous avons proposé une étude et une analyse com-
parative des diérentes méthodes de tractographie déterministe, an de selectioner
la meilleure méthode pour la génération de nos bases de données de tractographie
à partir des données IRMd. Tout au long de cette thèse, nous avons proposé des
nouvelles méthodes de clustering des jeux de données de tractographie massifs et
complexes, contenant plus d'un million de streamlines. Nos contributions principales
se composent de deux parties, un clustering intra-sujet et un clustering inter-sujets.
En premier lieu, nous avons développé une méthode hybride pour la segmentation
des streamlines intra-sujet, qui combine le clustering basé sur la similarité et la
segmentation qui utilise un a priori anatomique, donné par un atlas de la SB. Ceci
dans le but d'augmenter l'ecacité et la précision des résultats. Cette méthode a
réussi à extraire 13 faisceaux principaux de la SB avec une précision appréciable,
mesurée par une analyse Kappa qui a donné une moyenne supérieure à 0,70.
En deuxième lieu, nous avons développé deux nouvelles méthodes de clustering
inter-sujets, capable d'analyser des jeux de données de tractographie de très grande
taille à partir d'une population de sujets tout en éliminant les outliers, pour dé-
duire un modèle des faisceaux génériques présents dans la plupart des sujets. Une
approche statique basée sur la densité et une autre approche dynamique, qui uti-
lise les systèmes multi-agents basée sur le modèle bio-inspiré MSF, appelée 3D-SSF,
visant à surmonter les limites des méthodes de clustering statiques, tout en béné-
ciant des avantages oerts par les système multi-agents telles que l'adaptabilité, le
parallélisme, l'asynchronisme et la décentralisation.
Nous avons testé la robustesse et la qualité des résultats de la méthode 3D-SSF
sur des données synthétiques d'abord, en eectuant une comparaison statistique ro-
buste avec d'autres approches de la littérature. La méthode 3D-SSF a montré des
valeurs importantes d'exhaustivité, d'indice de Rand ajusté et d'homogénéité. Puis
sur des données réelles, armant la capacité de notre méthode à extraire correc-
tement presque tous les principaux faisceaux de la SB, avec une haute valeur de
Kappa qui atteint une moyenne de plus de 0,80. La méthode 3D-SSF a une com-
plexité d'ordre linéaire, avec des performances de temps acceptables par rapport à la
grande taille de l'ensemble de données, elle a nécessité environ 3 heures pour réaliser
le clustering inter-sujets des dix sujets.
Un atlas de la SB multi-sujets, considéré comme notre référentiel, a été également
construit automatiquement dans cette thèse, pour valider les résultats obtenus par
nos méthodes.
CONCLUSION

L'implication du paradigme multi-agents dans le domaine du clustering des


streamlines de la SB ouvre un large horizon. Pour cela nous planions d'étendre
notre approche dynamique de clustering inter-sujets, basée multi-agents, en incor-
porant diérentes mesures de similarités pour renforcer les critères de décision et
augmenter la précision des résultats, en exploitant l'anatomie des agents et la dé-
centralisation du système.
Nous planions aussi d'appliquer cette approche dans l'étude des bres courtes
d'association, qui sont très peu étudiées, jusqu'à présent, à cause de leur grande
variabilité à travers les sujets.

146
Bibliographie
[Ackerman 1999] M. Ackerman. Direct Calculation of the Information Matrix via
the EM Algorithm . J. R. Statistical Society, vol. 61, no. 2, pages 479482,
1999. (Cité en page 10.)
[Aganj 2009] I. Aganj, C. Lenglet, G. Sapiro, E. Yacoub, K. Ugurbil et N. Harel.
Multiple q-shell odf reconstruction in q-ball imaging
. In proceedings in MIC-
CAI, pages 423431, 2009. (Cité en page 29.)
[Aganj 2010] I. Aganj, C. Lenglet, G. Sapiro, E. Yacoub, K. Ugurbil et N. Harel.
Reconstruction of the orientation distribution function in single and multiple-
shell q-ball imaging within constant solid angle. Magnetic Resonance in Me-
dicine, vol. 64, no. 2, pages 554566, 2010. (Cité en pages 91 et 114.)
[Alexander 2001] A. L. Alexander, K. M. Hasan, M. Lazar, J. S. Tsuruda et D. L.
Parker. Analysis of partial volume eects in diusion-tensor MRI . Magn
Reson Med, vol. 45, no. 4, pages 770780, 2001. (Cité en pages 85 et 89.)
[Alexander 2002] D. Alexander, G. Barker et S. Arridge. Detection and Modeling of
Non Gaussian Apparent Diusion Coecient Proles in Human Brain Data.
Magnetic Resonance in Medicine, vol. 48, no. 2, pages 331340, 2002. (Cité
en page 27.)
[Alexander 2005] D. Alexander. Multiple-Fibre reconstruction algorithms for diu-
sion MRI . In Annals of the New York Academy of Sciences 1046, pages
113133, 2005. (Cité en page 36.)
[Aralasmak 2006] A. Aralasmak, J. L. Ulmer, M. Kocak, C. V. Salvan, A. E. Hillis
et D. M. Yousem. A diusion tensor imaging tractography atlas for virtual
in vivo dissections
. J Comput Assist Tomogr, vol. 30, no. 5, pages 695715,
2006. (Cité en page 11.)
[Arsigny 2006] V. Arsigny, P. Fillard, X. Pennec et N. Ayache. Log-Euclidean me-
trics for fast and simple calculus on diusion tensors . Magnetic resonance
in medicine, vol. 56, no. 2, pages 411421, 2006. (Cité en pages 22 et 32.)
[Ashburner 2007] J. Ashburner. A fast dieomorphic image registration algorithm.
Neuroimag, vol. 38, no. 1, pages 95113, 2007. (Cité en page 58.)
[Assaf 2004] Y. Assaf, R. Z. Freidlin, G. K. Rohde et P. J. Basser. New Modeling
and Experimental Framework to Characterize Hindered and Restrcited Water
Diusion in Brain White Matter. Magnetic Resonance in Medicine, vol. 52,
pages 965978, 2004. (Cité en page 26.)
[Assaf 2008] Y. Assaf, T. Blumenfeld-Katzir, Y. Yovel et P. J. Basser. AxCaliber :
a method for measuring axon diameter distribution from diusion MRI. Ma-
gnetic Resonance in Medicine, vol. 59, no. 6, pages 134754, 2008. (Cité en
page 26.)
Bibliographie

Robust shape similarity retrieval based on contour


[Attalla 2005] E. Attalla et P Siy.
segmentation polygonal multiresolution and elastic matching. Pattern Re-
cogn, vol. 38, no. 12, pages 22292241, 2005. (Cité en page 67.)
[Aymeric 2011] S. Aymeric. Diusion Directions Imaging (DDI). PhD thesis, rap-
port de recherche INRIA N 7683, 2011. (Cité en page 85.)
[Baneld 1993] A. Baneld, D. Jerey et E. Raftery. Model-Based Gaussian and
Non-Gaussian Clustering. Biometrics, vol. 49, no. 3, pages 803821, 1993.
(Cité en page 41.)
[Barmpoutis 2010] A. Barmpoutis. Tutorial on Diusion Tensor MRI using Matlab.
PhD thesis, Electronic Edition, University of Florida, 2010. (Cité en pages 90
et 91.)
[Basser 1994] P. J. Basser, J. Mattiello et D. Le Bihan. Estimation of the eective
self-diusion tensor from the NMR spin echo . J Magn Reson, vol. 103, no. 3,
pages 247254, 1994. (Cité en page 20.)
[Basser 2000] P. J. Basser, S. Pajevic, C. Pierpaoli, J. Duda et A. Aldroubi. In vivo
ber tractography using DTMRI data . Magn Reson Med, vol. 44, no. 4, pages
625632, 2000. (Cité en pages 20 et 85.)
[Batchelor 2006] P. G. Batchelor, F. Calamante, J.-D. Tournier, D. Atkinson,
D. L. G. Hill et A. Connelly. Quantication of the shape of ber tracts .
Magn Reson Med, vol. 55, no. 4, pages 894903, 2006. (Cité en page 67.)
[Behrens 2003] T. Behrens, M. Woolrich, M. Jenkinson, H. Johansen-Berg,
R. Nunes, S. Clare, P. Matthews, J. Brady et S. Smith.Characterization
and Propagation of Uncertainty in Diusion-Weighted MR Imaging . Magn
Reson Med, vol. 50, pages 10771088, 2003. (Cité en pages 25 et 26.)
[Behrens 2007] T. E. Behrens, H. Johansen-Berg, S. Jbabdi, M. F. S. Rushworth
et M. W. Woolrich. Probabilistic diusion tractography with multiple bre
orientations. What can we gain? NeuroImage, vol. 34, no. 1, pages 144155,
2007. (Cité en pages 26 et 36.)
[Bihan 1986] D. Le Bihan, E. Breton et D. Lallemand et al. MR imaging of intra-
voxel incoherent motions : application to diusion and perfusion in neurologic
disorders. Radiology, vol. 161, no. 2, pages 401407, 1986. (Cité en pages 17,
19, 21 et 23.)
[Bihan 2003] D. Le Bihan. Looking into the functional architecture of the brain with
diusion MRI. Nat Rev Neurosci., vol. 6, no. 4, pages 469480, 2003. (Cité
en page 17.)
[Brown 1828] R. Brown. A brief account of microscopical observations made in the
months of June, July and August, 1827, on the particles contained in the pol-
len of plants; and on the general existence of active molecules in organic and
inorganic bodies. Phil. Mag, no. 4, pages 161173, 1828. (Cité en page 15.)
[Brun 2003] A. Brun, H. Park, H. J. Knutsson et C. F.Westin. Coloring of dt-mri
ber traces using laplacian eigenmaps. In In Proceedings of EUROCAST,
pages 564572, 2003. (Cité en page 86.)

148
Bibliographie

[Brun 2004] A. Brun, H. Knutsson, H. jeong Park, M. E. Shenton et C. fredrik


Westin. Clustering ber traces using normalized cuts
. In In Proceedings of
MICCAI 2004, LNCS 57-62, Springer-Verlag, pages 368375, 2004. (Cité en
pages 65 et 70.)
[Burak 2007] A. Burak et Y. Erdem. Split and Merge Tractography for DT-MRI.
In MICCAI 2007, Part II, pages 153160, 2007. (Cité en page 85.)
[Callaghan 1991] P. T. Callaghan. Principles of Nuclear Magnetic Resonance Mi-
croscopy. In Oxford science publications, pages 10281031, 1991. (Cité en
page 27.)
Probabi-
[Campbell 2006] J. S. Campbell, W. P. Savadjiev, K. Siddiqi et B. G. Pike.
listic Monte Carlo Based Mapping of Cerebral Connections Utilising Whole-
Brain Crossing Fibre Information. In proceedings in Third IEEE Interna-
tional Symposium on Biomedical Imaging (ISBI) : from Nano to Macro.
Arlington, Virginia, USA, pages 351354, 2006. (Cité en page 29.)
[Catani 2008] M. Catani et M. Thiebaut de Schotten. A diusion tensor imaging
tractography atlas for virtual in vivo dissections
. Cortex, vol. 44, no. 8, pages
11051132, 2008. (Cité en pages 11, 15, 59 et 86.)
[Centuro 1999] T. E. Centuro, N. F. Lori, T. S. Cull, E. Akbudak, A. Z. Snyder, J. S.
Shimony, R. C. McKinstry, H. Burton et M. E. Raichle. Tracking neuronal
ber pathways in the living human brain . the National Academy of Sciences,
vol. 96, pages 1042210427, 1999. (Cité en page 32.)
[Chekir 2012] A. Chekir, F. Ahmed-Sid et F. Oulebsir Boumghar. Approche adap-
tative en tractographie de la substance blanche : Evaluation d'une méthode
déterministe. In Biomedical Engineering International Conference (BIO-
MEIC'12), 2012. (Cité en page 87.)
[Chekir 2014] A. Chekir, M. Descoteaux, E. Garyfallidis, M.A. Côté et F. Oulebsir-
Boumghar. A hybrid approach for optimal automatic segmentation of white
matter tracts in hardi
. In in Proceedings of IEEE Biomedical Engineering and
Sciences (IECBES), Kuala Lumpur, pages 177180, 2014. (Cité en page 95.)
[Chekir 2017a] A. Chekir, S. Hassas, M. Descoteaux, M-A. Côté, E.Garyfallidis et
F. Oulebsir-Boumghar. 3D-SSF : A bio-inspired approach for dynamic multi-
subject clustering of white matter tracts
. Computers in Biology and Medicine,
vol. 83, no. 1, pages 1021, 2017. (Cité en pages 120 et 128.)
[Chekir 2017b] A. Chekir et F. Oulebsir-Boumghar. Sequential Density-Based
Multi-Subject Clustering in Massive Tractography Dataset. In 5th Internatio-
nal Work-Conference on Bioinformatics and Biomedical Engineering (IWB-
BIO 2017) Grenade, Espagne, 2017. (Cité en page 105.)
[Chen 2004] Y. Chen, W. Guo, Q. Zeng, G. He, B. Vemuri et Y. Liu. Recovery
of Intra-Voxel Structure From HARD DWI . In proceedings in IEEE ISBI,
pages 10281031, 2004. (Cité en page 25.)

149
Bibliographie

[Chu 2004] SC. Chu, J. F. Roddick, C. J. Su et J. S. Pan. Constrained Ant Colony


Optimization for Data Clustering . In In Proceedings of the Trends in Ar-
ticial Intelligence. PRICAI 2004. Lecture Notes in Computer Science, vol
3157. Springer, Berlin, Heidelberg, 2004. (Cité en page 50.)
[Clarisse 2008] P. Clarisse.Tractographie Cérébrale par IRM de tenseur de diu-
sion : inuence des paramtères d'acquisition et de la méthode de tractogra-
phie sur la reproductibilité et la plausibilité anatomique des résultats dans
la perspective d'une application en routine clinique. PhD thesis, Thèse de
doctorat de l'université de Toulouse, 2008. (Cité en page 85.)
[Close 2009] T. G. Close, J.-D. Tournier, F. Calamante, L. Johnston, I. Mareels et
A. Connelly. A software tool to generate simulated white matter structures
for the assessment of bre-tracking algorithms
. Neuroimage, vol. 47, no. 1,
pages 12881300, 2009. (Cité en pages 110 et 133.)
[Collins 2010] M. Collins, V. Singh et A. Alexander. Network Connectivity via In-
ference over Curvature-regularizing Line Graphs. In proceedings in Network
Connectivity via Inference over Curvature-regularizing Line Graphs, pages
6578, 2010. (Cité en page 29.)
Towards a shape model of white
[Corouge 2004] I. Corouge, S. Gouttard et G. Gerig.
matter ber bundles using diusion tensor MRI. In In Proceedings of ISBI
2004, pages 6572, 2004. (Cité en pages 64, 65, 67, 69, 70, 76, 86 et 121.)
[côté 2013] M.-A. côté, G. Girard, A. Boré, E. Garyfallidis, J.-C. Houde et M. Desco-
teaux.Tractometer : Towards Validation of Tractography Pipelines . Medical
Image Analysis, vol. 17, no. 7, pages 844857, 2013. (Cité en pages 31, 36,
85, 105 et 133.)
[côté 2015] M.-A. côté, E. Garyfallidis, H. Larochelle et M. Descoteaux. Cleaning up
the mess : tractography outlier removal using hierarchical quickbundles clus-
tering. In In Proceedings of the International Society of Magnetic Resonance
in Medicine (ISMRM), Toronto, Canada, 2015. (Cité en page 79.)
[Crum 2004] W. Crum, R. T. Hartkens et D. L. G. Hil. Non-rigid image registration :
theory and practice. Br J Radiol, vol. 77, no. 2, pages 140153, 2004. (Cité
en page 57.)
[Cui 2006] X. Cui et T. E. Potok. A distributed agent implementation of multiple
species ocking model for document partitioning clustering. In In Proceedings
in Cooperative Information Agents, pages 124137, 2006. (Cité en page 127.)
[D. Alexander 2002] G. Barker S. Arridge D. Alexander D. Detection and Modeling
of Non-Gaussian Apparent Diusion Coecient Proles in Human Brain
Data. Magnetic Resonance in Medicine, vol. 48, no. 2, pages 331340, 2002.
(Cité en page 27.)
[Demir 2013] A. Demir et al. Online agglomerative hierarchical clustering of neural
ber tracts. In In Proceedings of IEEE EMBC, pages 8588, 2013. (Cité en
page 71.)

150
Bibliographie

[Demir 2015] A. Demir et H. E. etingl. Sequential hierarchical agglomerative clus-


tering of white matter ber pathways. IEEE Transactions on Biomedical
Engineering, vol. 62, no. 6, pages 14781489, 2015. (Cité en pages 71, 86
et 119.)
[Deneubourg 1991] J. Deneubourg, L. Goss, S. Franks, N. Sendova-Franks, A. De-
train et C. Chretien. The dynamic of collective sorting robot-like ants and
ant-like robots
. In In Proceedings of J. A. Meyer and S. W. Wilson (eds), SAB
90 - 1st Conference On Simulation of Adaptive Behavior : From Animals to
Animats, MIT Press, 1991. (Cité en pages 50 et 119.)
[Descoteaux 2008] M. Descoteaux. High Angular Resolution Diusion MRI : From
Local Estimation to Segmentation and Tractography. In Ph.D. thesis, Uni-
versite de Nice, Sophia Antipolis, 2008. (Cité en pages 2, 20, 24, 27, 28, 32,
84 et 87.)
[Ding 2003] Z. Ding, J. Gore et A. Anderson.Classication and Quantication of
Neuronal Fiber Pathways Using Diusion Tensor MRI. Magnetic Resonance
in Medicine, vol. 49, pages 716721, 2003. (Cité en pages 61, 62, 67, 69, 75
et 86.)
[Dodero 2015] L. Dodero, S. Vascon, V. Murino, A. Bifone, A. Gozzi et D. Sona.
Automated multi-subject ber clustering of mouse brain using dominant sets .
Front Neuroinform, vol. 8, page 87, 2015. (Cité en pages 73, 74, 79, 86, 104,
105 et 119.)
[Dorigo 1996] M. Dorigo, V. Maniezzo et A. Colorni. Ant system : optimization
by a colony of cooperating agents
. In In Proceedings of IEEE Transactions
on Systems, Man, and Cybernetics, Part B (Cybernetics), 1996. (Cité en
pages 48 et 49.)
[Einstein 1956] A. Einstein. Investigations on the Theory of the Brownian Move-
ment . PhD thesis, Dover Pubns, 1956. (Cité en pages 2 et 16.)
[Essen 2011] D. Essen, M. Glasser, DL. Dierker, J. Harwell et T. Coalson. Parcel-
lations and hemispheric asymmetries of human cerebral cortex analyzed on
surface-based atlases. Cereb. Cortex, vol. 22, pages 22412262, 2011. (Cité
en pages 112 et 136.)
[Ester 1996] M. Ester, H. P. Kriegel, J. Sander et X. Xu. A density-based algorithm
for discovering clusters in large spatial databases with noise. In In Procee-
dings of the 2nd International Conference on Knowledge Discovery and Data
mining, pages 226231, 1996. (Cité en pages 42, 106, 107 et 108.)
[Ferber 1995] J. Ferber. Les systèmes multi-agents. Vers une intelligence collective.
In InterEditions, Paris, 1995. (Cité en pages 46 et 47.)
[Fillard 2009] P. Fillard, C. Poupon et J.-F Mangin.A novel global tractography
framework based on an adaptive spin glass model. In proceedings in 12 th
MICCAI, 2009. (Cité en page 29.)

151
Bibliographie

[Fowlkes 2004] C. Fowlkes, S. Belongie, F. Chung et J. Malik. Spectral grouping


using the Nystrom method . IEEE Trans. Pattern Anal. Mach. Intell., vol. 26,
no. 2, pages 214225, 2004. (Cité en page 70.)
[Frank 2002] L. Frank. Characterization of Anisotropy in High Angular Resolution
Diusion-Weighted MRI. Magnetic Resonance in Medicine, vol. 47, no. 6,
pages 10831099, 2002. (Cité en page 27.)
[Friston 1995] K. J. Friston, J. Ashburner, C. D. Frith, J.-B. Poline, J. D. Heather et
R. S. J. Frackowiak.Spatial registration and normalization of images . Hum.
Brain Mapp., vol. 3, no. 3, pages 165189, 1995. (Cité en page 57.)
[Garyfallidis 2012a] E. Garyfallidis. Towards an Accurate Brain. PhD thesis, PhD
thesis, University of Cambridge, 2012. (Cité en page 35.)
[Garyfallidis 2012b] E. Garyfallidis, M. Brett, M.-M. Correia, G.-B. Williams et
I. Nimmo-Smith. Quick-bundles, a method for tractography simplication .
Frontiers in Neuroscience, vol. 6, page 175, 2012. (Cité en pages 34, 64, 71,
72, 80, 85, 86, 87, 94, 95, 97, 110, 114, 133, 137 et 143.)
[Garyfallidis 2015] E. Garyfallidis, O. Ocegueda, D. Wassermann et M. Descoteaux.
Robust and ecient linear registration of white-matter fascicles in the space
of streamlines. Neuroimage, vol. 117, pages 124140, 2015. (Cité en pages 72,
105, 110, 114 et 137.)
[Gerig 2004] G. Gerig, S. Gouttard et I. Corouge. Analysis of Brain White Matter
via Fiber Tract Modeling. In In Proceedings of IEEE EMBS, 2004. (Cité en
pages 65, 67 et 75.)
[Gholipour 2007] A. Gholipour, N. Kehtarnavaz, R. Briggs, M. Devous et K. Go-
pinath. Brain functional localization : a survey of image registration tech-
niques. IEEE Trans Med Imaging, vol. 26, no. 4, pages 427451, 2007. (Cité
en page 58.)
[Gigandet 2009] X. Gigandet. Global Brain Connectivity Analysis by Diusion MR
Tractography : Algorithms, Validation and Applications. PhD thesis, Thèse
de doctorat. école Polytechnique Fédérale de Lausanne. Suisse, 2009. (Cité
en page 27.)
[Guevara 2011a] P. Guevara. Inference of a human brain ber bundle atlas from high
angular resolution diusion imaging. PhD thesis, Ph.D. thesis, Università c
Paris XI, France, 2011. (Cité en page 11.)
[Guevara 2011b] P. Guevara, C. Poupon et D. Rivire. Robust clustering of massive
tractography datasets. Neuroimage, vol. 54, pages 19751993, 2011. (Cité en
pages 13, 32, 69, 79, 80, 86, 104, 105, 122, 123, 124 et 144.)
[Guha 1998] S. Guha, R. Rastogi et K. Shim. CURE : an ecient clustering al-
gorithm for large databases. In In proceedings of the 1998 ACM SIGMOD
international conference on Management of data (SIGMOD98), Ashutosh Ti-
wary and Michael Franklin (Eds.). ACM, New York, NY, USA, pages 7384,
1998. (Cité en page 40.)

152
Bibliographie

[Guha 2000] S. Guha, R. Rastogi et K. Shim. ROCK : a robust clustering algorithm


for categorical attributes
. Inf. Syst., vol. 25, no. 5, pages 345366, 2000. (Cité
en page 40.)
[Hagmann 2003] P. Hagmann, J.-P. Thiran, L. Jonasson, P. Vandergheynst,
S. Clarke et et al. DTI mapping of human brain connectivity : statistical
bre tracking and virtual dissection
. NeuroImage, vol. 19, no. 3, pages 545
554, 2003. (Cité en pages 2 et 85.)
[Handl 2002] J. Handl et B. Meyer. Improved ant-based clustering and sorting in
document retrieval interface. In In Proceedings of the Seventh International
Conference on Parallel Problem Solving from Nature, volume 2439 of LNCS,
Springer-Verlag, Berlin, Germany, pages 913923, 2002. (Cité en page 119.)
[Hartigan 1979] J. A. Hartigan et M. A. Wong. Algorithm AS 136 : A K-Means
Clustering Algorithm. Journal of the Royal Statistical Society, vol. 28, no. 1,
pages 100108, 1979. (Cité en pages 39, 40, 110, 120 et 133.)
[Hellier 2003] P. Hellier, C. Barillot, I. Corouge, B. Gibaud, G. L. Goualher, D. L.
Collins, A. Evans, G. Malandain, N. Ayache, G. E. Christensen et H. J.
Johnson. Retrospective evaluation of intersubject brain registration
. IEEE
Trans Med Imaging, vol. 22, no. 9, pages 11201130, 2003. (Cité en page 58.)
[Hua 2008] K. Hua, J. Zhang, S. Wakana, H. Jiang, X. Li, D. Reich, P. Calabresi,
J. Pekarand P. van Zijl et S. Mori. Tract probability maps in stereotaxic
spaces : Analyses of white matter anatomy and tract-specic quantication
.
NeuroImage, vol. 39, pages 336347, 2008. (Cité en pages 137 et 164.)
[Huang 2008] H. Huang, C. Ceritoglu, X. Li, A. Qiu, M. I. Miller, P. C. M.
van Zijl et S. Mori. Correction of B0 susceptibility induced distortion in
diusion-weighted images using large-deformation dieomorphic metric map-
ping. Magn Reson Imaging, vol. 26, no. 9, pages 12941302, 2008. (Cité en
page 60.)
[Hubert 1985] L. Hubert et P. Arabie. Objective criteria for the evaluation of clus-
tering methods. Journal of Classication, vol. 1, no. 2, pages 193218, 1985.
(Cité en page 51.)
[Jbabdi 2006] S. Jbabdi. Modélisation de la connectivité anatomique cérébrale et
simulation de la croissance des gliomes de bas grade : apport de l'IRM de
diusion. PhD thesis, Ph.D. thesis, Ecole Centrale Paris, France, 2006. (Cité
en pages 12 et 13.)
[Jellison 2004] B.J. Jellison, A. S. Field, J. Medow, M. Lazar, M. S. Salamat et A. L.
Alexander. A diusion tensor imaging tractography atlas for virtual in vivo
dissections. AJNR Am J Neuroradiol, vol. 25, no. 3, pages 356369, 2004.
(Cité en page 11.)
[Jin 2015] Y. Jin et H. E. eting. Tractography-embedded white matter stream clus-
tering. In In Proceedings of ISBI, pages 432435, 2015. (Cité en pages 77,
86 et 105.)

153
Bibliographie

[Johansen-Berg 2009] H. Johansen-Berg et T. E. Behrens.Diusion MRI : From


Quantitative Measurement to In-vivo Neuroanatomy. In Academic Press,
2009. (Cité en page 57.)
[Jonasson 2005] L. Jonasson, X. Bresson, P. Hagmann, O. Cuisenaire, R. Meuli
et J.-P. Thiran. White matter ber tract segmentation in DT-MRI using
geometric ows . Medical Image Analysis, vol. 9, pages 223236, 2005. (Cité
en page 62.)
[Jones 1999] D. K. Jones, A. Simmons, S. C. Williams et M. Horseld. Non-invasive
assessment of axonal ber connectivity in the human brain via diusion ten-
sor MRI. Magnetic resonance in medicine, vol. 42, no. 1, pages 3741, 1999.
(Cité en pages 32 et 33.)
[Jones 2008] D. K. Jones. Tractography gone wild : probabilistic bre tracking using
the wild bootstrap with diusion tensor MRI. EEE transactions on medical
imaging, vol. 27, no. 9, pages 12681274, 2008. (Cité en pages 32 et 35.)
[Kaufman 1987] L. Kaufman et P-J. Rousseeuw. Clustering by means of Medoids,
in Statistical Data Analysis Based on the L1 Norm and Related Methods.
edited by Y. Dodge, pages 405416, 1987. (Cité en page 95.)
[Keim 1999] D. A. Keim et A. Hinneburg. Clustering techniques for large data
sets?from the past to the future. In In Tutorial notes of the fth ACM
SIGKDD international conference on Knowledge discovery and data mining
(KDD '99), Jiawei Han (Ed.). ACM, New York, NY, USA, pages 141181,
1999. (Cité en pages 42 et 44.)
[Kennedy 1995] J. Kennedy et R. C. Eberhart. Particle swarm optimization
. In In
Proceedings of IEEE International Conference on Neural NetworksPiscata-
way, NJ, pages 19421948, 1995. (Cité en pages 48 et 119.)
Boosting the
[Khachaturian 2007] M. H. Khachaturian, J. J. Wisco et D. S. Tuch.
Sampling Eciency of q-Ball Imaging Using Multiple Wavevector Fusion .
Magnetic Resonance in Medicine, vol. 57, pages 289296, 2007. (Cité en
page 29.)
[Kouby 2005] V. El Kouby, Y. Cointepas, C. Poupon, D. Riviere, N. Golestani, J. B.
Poline, D. Le Bihan et J.-F. Mangin. MR diusion-based inference of a ber
bundle model from a population of subjects . In In Proceedings of MICCAI
2005, LNCS 5762, Springer-Verlag, pages 196204, 2005. (Cité en page 75.)
[Kreher 2008] B. W. Kreher, I. Mader et V. G. Kiselev. Gibbs tracking : A novel
approach for the reconstruction of neuronal pathways . Magn Reson Med,
vol. 60, pages 953963, 2008. (Cité en page 29.)
[Laouchedi 2015] M. Laouchedi. étude des circuits cérébraux de la conscience en
IRM de diusion par tractographie probabiliste : Application aux trauma-
tismes craniens sévères. PhD thesis, Ph.D. thesis, Université USTHB, Alge-
rie, 2015. (Cité en page 11.)
[Lawes 2008] I. N. C. Lawes, T. R. Barrick, V. Murugam, N. Spierings, D. R. Evans,
M. Song et C. A. Clark. Atlas-based segmentation of white matter tracts of
154
Bibliographie

the human brain using diusion tensor tractography and comparison with
classical dissection. Neuroimage, vol. 39, no. 1, pages 6279, 2008. (Cité en
page 59.)
[Lazar 2003] M. Lazar, D. M. Weinstein, J. S. Tsuruda, K. M. Hasan, K. Arfana-
kis, M. E. Meyerand, B. Badie, H. Rowley, V. Haughton, A. Field et A. L.
Alexander. White matter tractography using diusion tensor deection
. Hu-
man Brain Mapping, vol. 18, no. 4, pages 306321, 2003. (Cité en pages 33,
34, 85, 88 et 89.)
[Lebart 1982] L. Lebart, A. Maurineau et M. Piron. Traitement des données statis-
tiques. In Dunod, Paris, 1982. (Cité en page 52.)
[Leemans 2009] A. Leemans et D. Jones. A new approach to fully automated ber
tract clustering using anity propagation. In In ISMRM, page 856, 2009.
(Cité en page 70.)
[Levitt 2003] M. Levitt. Spin dynamics : basics of nuclear magnetic resonance. In
Wiley New York, 2003. (Cité en page 17.)
[Li 2010] H. Li, Z. Xue, L. Guo, T. Liu, J. Hunter et S. T. C. Wong. A hybrid
approach to automatic clustering of white matter bers. Neuroimage, vol. 49,
no. 2, pages 12491258, 2010. (Cité en pages 75 et 86.)
[Lin 2001] C. P. Lin, W. Y. Tseng, H. C. Cheng et J. H. Chen. Validation of diusion
tensor magnetic resonance axonal ber imaging with registered manganese-
enhanced optic tracts. Neuroimage, vol. 14, no. 5, pages 103547, 2001. (Cité
en page 27.)
[Liu 2004] C. Liu, R. Bammer, B. Acar et M. E. Moseley. Characterizing Non-
Gaussian Diusion by Using Generalized Diusion Tensors. Magnetic Re-
sonance in Medicine, vol. 51, pages 924937, 2004. (Cité en page 27.)
[Maddah 2005a] M. Maddah, A.U. Mewes, S. Haker, W. Grimson et S. Wareld. Au-
tomated Atlas-Based Clustering of White Matter Fiber Tracts from DTMRI.
In In Proceedings of MICCAI 2005, LNCS 5762, Springer-Verlag, 2005. (Cité
en page 59.)
[Maddah 2005b] M. Maddah, W.Wells, S.Wareld, C.-F.Westin et W. Grimson.
Probabilistic Clustering and Quantitative Analysis of White Matter Fiber
Tracts. In In Proceedings of IPMI, 2005. (Cité en page 70.)
[Maddah 2008] M. Maddah, W. Grimson, S. Wareld et W. Wells. A Unied Frame-
work for Clustering and Quantitative Analysis of White Matter Fiber Tracts.
Medical Image Analysis, vol. 12, no. 2, pages 191202, 2008. (Cité en pages 70
et 76.)
[Maes 1997] F. Maes, A. Collignon, D. Vandermeulen, G. Marchal et P. Suetens.
Multimodality image registration by maximization of mutual information
.
IEEE Trans Med Imaging, vol. 16, no. 2, pages 187198, 1997. (Cité en
page 58.)

155
Bibliographie

[Maier 2004] S. E. Maier, S. Vajapeyam, H. Mamata, C.-F. Westin, F. A. Jolesz et


R. V. Mulkern. Biexponential Diusion Tensor Analysis of Human Brain
Diusion Data . Magnetic Resonance in Medicine, vol. 51, pages 321330,
2004. (Cité en page 25.)
[Mangin 2002] J.F Mangin, C. Poupon, C. Clark, D. Le Bihan et I. Bloch. Distortion
correction and robust tensor estimation for MR diusion imaging
. Med Image
Anal, vol. 6, no. 3, pages 191198, 2002. (Cité en page 29.)
[Manseld 1977] P. Manseld. Multi-Planar Image Formation using NMR Spin
Echoes. Journal of Physics, vol. 10, no. c, pages 5558, 1977. (Cité en
page 19.)
[Mazziotta 1995] J. C. Mazziotta, A. W. Toga, A. Evans, P. Fox et J. Lancaster. A
probabilistic atlas of the human brain : theory and rationale for its develop-
ment. Neuroimag, vol. 2, no. 2, pages 89101, 1995. (Cité en page 58.)
[Merboldt 1985] K. Merboldt, W. HÃnicke et J. FRAHM. Self-diusion NMR ima-
ging using stimulated echoes. Journal of magnetic resonance, vol. 64, no. 3,
pages 479486, 1985. (Cité en page 17.)
[Miller 2005] M. I. Miller, M. F. Beg, C. Ceritoglu et C. Stark. Increasing the power
of functional maps of the medial temporal lobe by using large deformation
dieomorphic metric mapping. In In Proceedings of Natl Acad Sci USA
102(27), pages 96859690, 2005. (Cité en page 60.)
[Moberts 2005] B. Moberts, A. Vilanova et J. J. van Wijk. Evaluation of ber
clustering methods for diusion tensor imaging. In In Proceedings of the
IEEE Visualization VIS 05, pages 6572, 2005. (Cité en pages 61, 98, 111
et 134.)
[Monmarché 2000] N. Monmarché, G. Venturini et M. Slimane. Classication non
supervisee par une population de fourmis articielles . Actes Coll. Insectes
Sociaux, vol. 13, pages 4352, 2000. (Cité en page 50.)
[Mori 1999] S. Mori, B. J. Crain, V. P. Chacko et P. C. M. Van Zijl. Three-
dimensional tracking of axonal projections in the brain by magnetic resonance
imaging. Annals of Neurology, vol. 45, no. 2, pages 265269, 1999. (Cité en
pages 32, 33, 85, 88 et 89.)
[Mori 2008] S. Mori, K. Oishi, H. Jiang, L. Jiang, X. Li, K. Akhter, K. Hua, A. V.
Faria, A. Mahmood, R. Woods, A. W. Toga, G. B. Pike, P. R. Neto, A. Evans,
J. Zhang, H. Huang, M. I. Miller, P. van Zijl et J. Mazziotta.Stereotaxic
white matter atlas based on diusion tensor imaging in an ICBM template .
Neuroimage, vol. 40, no. 2, pages 570582, 2008. (Cité en pages 59, 60, 61
et 86.)
[Newell 1982] A. Newell. The knowledge level . Articial Intelligence, vol. 18, pages
87127, 1982. (Cité en page 45.)
[Ng 2002] A. Ng, M. Jordan et Y. Weiss. On spectral clustering : Analysis and
an algorithm . JProceedings of Advances in Neural Information Processing
Systems, pages 849856, 2002. (Cité en page 39.)

156
Bibliographie

[O'Donnell 2005] L. O'Donnell et C.-F. Westin. White Matter Tract Clustering and
Correspondence in Populations . In In Proceedings of MICCAI 2005, LNCS
5762, Springer-Verlag. Palm Springs, CA, USA, pages 140147, 2005. (Cité
en page 70.)
[O'Donnell 2006] L. J. O'Donnell, M. Kubicki, M. E. Shenton, M. H. Dreusicke,
W. E. L. Grimson et C. F. Westin. A method for clustering white matter
ber tracts
. AJNR Am J Neuroradiol, vol. 27, no. 5, pages 10321036, 2006.
(Cité en pages 70 et 86.)
[O'Donnell 2007] L. O'Donnell et C. Westin. Automatic tractography segmentation
using a highdimensional white matter atlas . IEEE Transactions on Medical
Imaging, vol. 26, no. 11, pages 15621575, 2007. (Cité en pages 73, 97 et 123.)
[Oguz 2012] I. Oguz, A. Boucharin, W. Lu, C. Vachet, F. Budin, Y. Shi et M. Styner.
A Minimum Cost Approach to Connectivity from Orientation Distribution
Functions via Ecient Multi-directional Graph Propagation. In proceedings
in International Conference on Medical Image Computing and Computer As-
sisted Intervention (MICCAI'12)-Computational Diusion MRI Workshop,
2012. (Cité en page 29.)
[Oishi 2008] K. Oishi, K. Zilles, K. Amunts, A. Faria, H. Jiang, X. Li, K. Akh-
ter, K. Hua, R. Woods, A. W.Toga, G. B. Pike, P. Rosa-Neto, A. Evans,
J. Zhang, H. Huang, M. I. Miller, P. C. M. van Zijl, J. Mazziotta et S. Mori.
Human brain white matter atlas : Identication and assignment of common
anatomical structures in supercial white matter. NeuroImage, vol. 43, no. 3,
pages 447457, 2008. (Cité en pages 13, 60 et 97.)
[Oishi 2009] K. Oishi, A. Faria, H. Jiang, X. Li, K. Akhter, J. Zhang, J. T. Hsu, M. I.
Miller, P. C. M. van Zijl, M. Albert, C. G. Lyketsos, R. Woods, A. W. Toga,
G. B. Pike, P. Rosa-Neto, A. Evans, J. Mazziotta et S. Mori. Atlas-based
whole brain white matter analysis using large deformation dieomorphic me-
tric mapping : application to normal elderly and Alzheimer's disease partici-
pants. Neuroimage, vol. 46, no. 2, pages 486499, 2009. (Cité en pages 60
et 61.)
[Parker 2003] G. Parker et D. Alexander. Probabilistic Monte Carlo Based Mapping
of Cerebral Connections Utilising Whole-Brain Crossing Fibre Information.
In proceedings in IPMI, pages 684695, 2003. (Cité en page 29.)
[Pauli 1940] W. Pauli. The connection between spin and statistics. Physical Review,
vol. 58, no. 8, pages 716722, 1940. (Cité en page 17.)
[Peled 2006] S. Peled, O. Friman, F. Jolesz et C.-F. Westin. Geometrically constrai-
ned two-tensor model for crossing tracts in DWI. Magnetic Resonance Ima-
ging, vol. 24, pages 12631270, 2006. (Cité en page 25.)
[Perrin 2006] M. Perrin. Imagerie de diusion a haute resolution angulaire : étude
du modle q-ball par couplage simulations- fantomes et applications au suivi
de bres et a la parcellisation du cortex. PhD thesis, Ph.D. thesis, Université
Paris XI, France, 2006. (Cité en page 11.)

157
Bibliographie

[Posse 2001] C. Posse. Hierarchical Model-Based Clustering for Large Datasets .


Journal of Computational and Graphical Statistics, vol. 10, no. 3, pages
464486, 2001. (Cité en page 41.)
[Prasad 2014] G. Prasad. Automatic clustering and population analysis of white
matter tracts using maximum density paths . Neuroimage, vol. 97, pages 284
295, 2014. (Cité en pages 77, 78, 79 et 104.)
[Proctor 1998] G. Proctor et C. Winter. Information Flocking : Data Visualisation
in Virtual Worlds using Emergent Behaviours . In In Proceedings of the 1st
Int. Conf. Virtual Worlds, VW, pages 168176, 1998. (Cité en page 48.)
[Ramakrishnan 1996] T. ZhangRaghu Ramakrishnan et M. Livny. BIRCH : an
ecient data clustering method for very large databases . In In proceedings
of the 1996 ACM SIGMOD international conference on Management of data
(SIGMOD96), Jennifer Widom (Ed.). ACM, New York, NY, USA, pages
103114, 1996. (Cité en page 40.)
[Ramirez-Manzanares 2007] A. Ramirez-Manzanares, M. Rivera, B.Vemuri, P. Car-
ney et T. Mareci. Diusion basis functions decomposition for estimating
white matter intravoxel ber geometry . IEEE Transactions on Medical Ima-
ging, vol. 26, no. 8, pages 10911102, 2007. (Cité en page 25.)
[Rand 1971] W. M. Rand. Objective criteria for the evaluation of clustering me-
thods . Journal of the American Statistical Association, American Statistical
Association, vol. 66, no. 336, pages 846850, 1971. (Cité en page 50.)
[Reichenbach 1996] A. Reichenbach, G. Mathias, H. Christian et M. Hlawitschka. V-
Bundles : Clustering Fiber Trajectories from Diusion MRI in Linear Time .
In In Proceedings of MICCAI, page 191, 1996. (Cité en pages 110 et 133.)
[Reynolds 1987] C. W. Reynolds. Flocks, herds and school :a distributed behavioral
model . In In Proceedings of SIGGRAPH 87, pages 25965, 1987. (Cité en
pages 48 et 123.)
[Rockafellar 1998] R. T. Rockafellar et J. B. Wets. Variational analysis . In Springer
Verlag, pages 368375, 1998. (Cité en page 67.)
[Ros 2013] C. Ros, D. Gllmar, M. Stenzel, H.-J. Mentzel et J.-R. Reichenbach. Atlas-
guided cluster analysis of large tractography datasets . PLoS ONE, vol. 10,
page 1371, 2013. (Cité en pages 63, 67, 79, 80 et 105.)
[Rousseeuw 1985] Peter J. Rousseeuw. Silhouettes : a Graphical Aid to the Inter-
pretation and Validation of Cluster Analysis . Computational and Applied
Mathematics, vol. 20, pages 5365, 1985. (Cité en page 51.)
[Seunarine 2007] K.K Seunarine, P. A. Cook, M. G. Hall, K. V. Embleton, G. J. M.
Parker et D. C. Alexander. Exploiting peak anisotropy for tracking through
complex structures . In In : Mathematical Methods in Biomedical Image Ana-
lysis, MMBIA, 2007. (Cité en page 20.)
[Sotiropoulos 2013] S. Sotiropoulos, S. Moeller, S. Jbabdi, J. Xu, J. L. Andersson,
E. J. Auerbach, E. Yacoub, D. Feinberg, K. Setsompop, L. Wald, T. E. J.

158
Bibliographie

Behrens, K. Ugurbil et C. Lenglet. Eects of image reconstruction on bre


orientation mapping from mul-tichannel diusion mri : Reducing the noise
using sense. Magnetic Resonance in Medicine, vol. 70, no. 6, page 1682, 2013.
(Cité en pages 112 et 136.)
[Steinbach 1999] M. Steinbach, G. Karypis et V. Kumar. A comparison of document
clustering techniques. In In proceedings KDD Workshop on Text Mining,
1999. (Cité en page 45.)
[Stejskal 1965] E. Stejskal et J. Tanner. Spin diusion measurements - spin echoes
in presence of a time-dependent eld gradient. J. Chem. Phys, vol. 42, no. 1,
pages 288292, 1965. (Cité en page 18.)
[Studholme 1995] C. D. Studholme, L. G. Hill et D. J. Hawkes. Multiresolution
Voxel Similarity Measures for MR-PET Registration. In In Proceedings of
Information Processing in Medical Imaging, Vol. 3. Ile de Berder, France,
pages 287298, 1995. (Cité en page 58.)
[Talairach 1988] J. Talairach et P. Tournoux. Co-Planar Stereotaxic Atlas of the
Human Brain. 3-Dimensional Proportional System : An Approach to Cerebral
Imaging. In In Proceedings Thieme Medical Publishers, Inc., Georg Thieme
Verlag, Stuttgart, New York, pages 287298, 1988. (Cité en page 58.)
[Taylor 1985] D. Taylor et M. Bushell. The spatial mapping of translational diusion
coecients by the NMR imaging technique. Physics in medicine and biology,
vol. 30, pages 345349, 1985. (Cité en page 17.)
[Tournier 2007] J. D. Tournier, F. Calamante et A. Connelly. Robust determina-
tion of the bre orientation distribution in diusion MRI : Non-negativity
constrained superresolved spherical deconvolution. NeuroImage, vol. 35, no. 4,
pages 14591472, 2007. (Cité en page 85.)
[Tournier 2012] J.-D. Tournier, F. Calamante et A. Connelly. MRtrix : Diusion
tractography in crossing ber regions. International Journal of Imaging Sys-
tems and Technology, vol. 22, no. 1, pages 5366, 2012. (Cité en pages 31
et 32.)
[Tuch 2002] D. S. Tuch, T.G Reese, M.R. Wiegell, N. Makris, J.W. Belliveau et
V.J.Wedeen. High angular resolution diusion imaging reveals intravoxel
white matter ber heterogeneity
. Magn Reson Med, vol. 48, no. 4, pages
577582, 2002. (Cité en pages 2, 24, 25, 27, 28, 29, 35 et 84.)
[Tuch 2004] D. Tuch. Q-Ball Imaging. Magnetic Resonance in Medicine, vol. 52,
no. 6, pages 13581372, 2004. (Cité en page 28.)
[Viola 1997] P. Viola et W. M. Wells. Alignment by Maximization of Mutual Infor-
mation. Int. J.Comput. Vision, vol. 24, no. 4, pages 137154, 1997. (Cité en
page 58.)
[Visser 2010] E. Visser, E. Nijhuis, J. Buitelaar et M. Zwiers. Partition-based mass
clustering of tractography streamlines. NeuroImage, vol. 54, no. 1, pages
30312, 2010. (Cité en page 64.)

159
Bibliographie

[Visser 2011] E. Visser, E. H. J. Nijhuis, J. K. Buitelaar et M. P. Zwiers. Partition-


based mass clustering of tractography streamlines . Neuroimage, vol. 54, no. 1,
pages 303312, 2011. (Cité en pages 72, 104 et 119.)
[Wakana 2004] S. Wakana, H. Jiang, L. M. Nagae-Poetscher, P. C. M. van Zijl et
S. Mori. Fiber tractbased atlas of human white matter anatomy . Radiology,
vol. 230, no. 1, pages 7787, 2004. (Cité en page 76.)
[Wakana 2007] S. Wakana, A. Caprihan, M. M. Panzenboeck, J. H. Fallon, M. Perry,
R. L. Gollub, K. Hua, J. Zhang, H. Jiang, P. Dubey, A. Blitz, P. van Zijl
et S. Mori. Reproducibility of quantitative tractography methods applied to
cerebral white matter . Neuroimage, vol. 36, no. 3, pages 630644, 2007. (Cité
en pages 59, 76, 86 et 137.)
[Wang 1997] W. Wang, J. Yang et R. Muntz. STING : A Statistical Information
Grid Approach to Spatial Data Mining . In In Proceedings of the 23rd Inter-
national Conference on Very Large Data Bases (VLDB '97), Matthias Jarke,
Michael J. Carey, Klaus R. Dittrich, Frederick H. Lochovsky, Pericles Louco-
poulos, and Manfred A. Jeusfeld (Eds.). Morgan Kaufmann Publishers Inc.,
San Francisco, CA, USA, pages 186195, 1997. (Cité en pages 42 et 45.)
[Wang 2011] X. Wang, W. E. L. Grimson et C.-F. Westin. Tractography segmen-
tation using a hierarchical Dirichlet processes mixture model . Neuroimage,
vol. 54, no. 1, pages 290302, 2011. (Cité en pages 72, 73, 86 et 104.)
[Wassermann 2010] D. Wassermann, L. Bloy, E. Kanterakis, R. Verma et R. De-
riche.Unsupervised white matter ber clustering and tract probability map
generation : Applications of a Gaussian process framework for white matter
bers. Neuroimage, vol. 51, pages 228241, 2010. (Cité en pages 62, 76, 77,
86 et 121.)
[Wassermann 2016] D. Wassermann, M. Nikos, R. Yogesh, S. Martha, K. Ron,
K. Marek et W. Carl-Fredrik. The white matter query language : a novel
approach for describing human white matter anatomy . Brain Structure and
Function, vol. 1, no. 17, pages 18632661, 2016. (Cité en pages 61, 163
et 164.)
[Wedeen 2000] V. Wedeen, T. Reese, D. Tuch, M. Wiegel, J.-G. Dou, R. Weisko et
D. Chessler. Mapping ber orientation spectra in cerebral white matter with
Fourier transform diusion MRI . Magnetic Resonance in Medicine, page 82,
2000. (Cité en page 27.)
[Wedeen 2005] V. Wedeen, P. Hagmann, W.Y. Tseng, T. Reese et R. Weissko. Map-
ping complex tissue architecture with diusion spectrum magnetic resonance
imaging. Magn Res Med, vol. 54, pages 13771386, 2005. (Cité en pages 27
et 28.)
[Westin 1997] C. F. Westin, S. Peled, H. Gudbjartsson, R. Kikinis et F.A. Jolesz.
Geometrical diusion measures for MRI from tensor basis analysis . In In
Proceedings of the 5th Annual Meeting of ISMRM, Vancouver, Canada, page
1742, 1997. (Cité en page 23.)

160
Bibliographie

[Wigner 1939] E. Wigner. On unitary representations of the inhomogeneous Lorentz


group. In Annals of Mathematics, pages 149204, 1939. (Cité en page 17.)
[Woods 1993] R. P. Woods, J. C. Mazziotta et S. R. Cherry. MRI-PET registration
with automated algorithm . J Comput Assist Tomogr, vol. 17, no. 4, pages
536546, 1993. (Cité en page 58.)
[Wooldridge 1995] M. Wooldridge et N. R. Jennings. Intelligent Agents : Theory
and Practice. Knowledge Engineering Review, vol. 10, pages 115152, 1995.
(Cité en pages 46 et 47.)
[Wu 2004] B. Wu et Z. Shi. A clustering algorithm based on swarm intelligence . In
In Proceedings of Info-tech and Info-net ICII 2001, vol. 3, pages 5866, 2004.
(Cité en page 119.)
Circular
[Zhan 2003] W. Zhan, H. Gu, S. Xu, D. A. Silbersweig, E. Stern et Y. Yang.
Spectrum Mapping for Intravoxel Fiber Structures Based on High Angular Re-
solution Apparent Diusion Coecients. Magnetic Resonance in Medicine,
vol. 49, pages 10771088, 2003. (Cité en page 27.)
[Zhang 1997] T. Zhang, R. Ramakrishnan et M. Livny. BIRCH : A new data cluste-
ring algorithm and its applications. Data Mining and Knowledge Discovery,
vol. 1, no. 2, pages 141182, 1997. (Cité en page 71.)
[Zhang 1998] S. Zhang et D. H. Laidlaw. DTI Fiber Clustering and Cross-subject
Cluster Analysis. In In Proceedings International Society for Magnetic Re-
sonance in Medicine (ISMRM). Miami, FL, 1998. (Cité en pages 69 et 71.)
[Zhang 2003] S. Zhang, C. Demiralp et D. H. Laidlaw. Visualizing diusion tensor
MR images using streamtubes and streamsurfaces. IEEE Transactions on
Visualization and Computer Graphics, vol. 9, no. 4, pages 454462, 2003.
(Cité en page 69.)
[Zhang 2008] S. Zhang, S. Correia et D. H. Laidlaw. Identifying White-Matter
Fiber Bundles in DTI Data Using an Automated Proximity-Based Fiber-
Clustering Method. IEEE Transactions on Visualization and Computer Gra-
phics, vol. 14, no. 5, pages 10441053, 2008. (Cité en pages 59, 60, 65, 69,
71 et 86.)
[Zhang 2010] Y. Zhang, J. Zhang, K. Oishi, A. V. Faria, X. Li H. Jiang, K. Akhter,
P. Rosa-Neto, G. B. Pike, A. Evans, A. W. Toga, R. Woods, J. C. Mazziotta,
M. I. Miller, P. C. van Zijl et S. Mori.Atlas-guided tract reconstruction
for automated and comprehensive examination of the white matter anatomy .
NeuroImage, vol. 52, no. 4, pages 12891301, 2010. (Cité en pages 13, 60
et 97.)
[Ziyan 2009] U. Ziyan, M. Sabuncu, W. Grimson et C.-F. Westin. Consistency
clustering : A robust algorithm for group-wise registration, segmentation and
automatic atlas construction in diusion mri. International journal of com-
puter vision, vol. 83, no. 3, pages 279290, 2009. (Cité en page 105.)

161
Annexe A

Atlas de la substance blanche

Construction automatique de l'atlas de la SB


Un atlas de la SB peut être généré automatiquement à partir de la base de
données de tractographie issue de plusieurs sujets en utilisant un outil qui dé-
crit l'anatomie de la SB humaine appelé White Matter Query Language (WMQL)
[Wassermann 2016].
Le WMQL est basé sur un nouveau langage de requête avec une syntaxe textuelle
proche de l'anglais. Ce langage de requête nous permet de construire un dictionnaire
de dénitions anatomiques décrivant les principaux faisceaux de la SB. Les déni-
tions comprennent les régions adjacentes de la SB et la SG, ainsi que les règles
relatives aux relations spatiales.
Nous avons conçu les requêtes dans le WMQL pour formaliser les descriptions
courantes dans la littérature anatomique. Ces descriptions sont construites en termes
de relations diérentes entre les gyri, les sillons, les structures sous-corticales ou les
régions de la SB. Les opérations du WMQL peuvent être divisées en 3 groupes :
1. Termes anatomiques indiquant si un faisceau de streamlines parcourt ou se
termine dans une certaine structure du cerveau,
2. Termes de position relative indiquant si les parcelles sont, par exemple, mé-
diale ou frontale à un faisceau, et
3. Les opérations logiques comme la conjonction, la disjonction ou l'exclusion
des deux types de clauses précédentes. Nous illustrons ces trois types d'opé-
rations dans la gure A.1.
Pour appliquer des requêtes WMQL, comme dans la gure A.1, nous devons
situer des structures cérébrales comme les gyri, les sillons et sur les données de
tractographie . Pour cela, nous superposons un atlas des structures cérébrales sur les
données de tractographie. Dans ce travail, nous avons utilisé la parcelle de matière
corticale et blanche basée sur l'Atlas de Desikan, qui sont facilement disponibles
dans FreeSurfer 1 .
Nous avons obtenu pour chaque sujet 37 faisceaux neuroanatomiques en se ba-
sant sur la description anatomique de la SB, formalisée selon le WMQL donnée par
les tables (A.2, A.3, A.1) ; plusieurs faisceaux de projection (table A.2), d'association
(table A.3) et commissuraux (table A.1), à savoir le faisceau cortico-spinal gauche
/ droit (CST), le cingulum gauche / droit (CG), le faisceau arqué droit / gauche,
le faisceau longitudinal gauche / droit (ILF), le faisceau fronto-occipital inférieur
1. http://www.freesurfer.org
Annexe A. Atlas de la substance blanche

Figure A.1  Un exemple de construction des faisceaux de l'atlas de la SB avec le


WMQL. (Source [Wassermann 2016]).

gauche / droit (IFO), le faisceau longitudinal supérieur gauche / droit 1, 2 et 3


(SLF 1, 2, 3). Et enn les sept parties du corps calleux (CC 1-7).
Ensuite, nous avons généré un atlas de tous ces faisceaux en utilisant la mé-
thode décrite dans [Hua 2008]. Les faisceaux obtenus avec la segmentation WMQL
de chaque sujet ont été convertis en cartes binaires (1 : pixels qui contenaient la
rationalisation, 0 : pixels qui ne contenaient pas la rationalisation). Les cartes bi-
naires obtenues à partir des 10 sujets ont été moyennées pour produire une carte
probabiliste de la SB dans la norme MNI pour chaque faisceau.

164
Table A.1  Les subdivisions du corps calleux dans le WMQL
Corpus callosum WMQL query
tract name
Rostrum CC_1= endpoints_in(orbitofrontal.left) and end-
points_in(orbitofrontal.right)
Genu CC_2= endpoints_in(prefrontal.left) and endpoints_in(prefrontal.right)
Rostral body CC_3 = endpoints_in(premotor.left) and endpoints_in(premotor.right)
Anterior midbody CC_4 = endpoints_in(motor.left) and endpoints_in(motor.right)
Posterior midbody CC_5 = endpoints_in(postcentral.left or posteriorcingulate.left or paracen-
tral.left) and endpoints_in(postcentral.right or posteriorcingulate.right or pa-
racentral.right)
Isthmus CC_6 = endpoints_in(superior_temporal_lobule.left or
posterior_parietal_lobule.left or isthmus cingulate.side)
and endpoints_in(superior_temporal_lobule.right or poste-
rior_parietal_lobule.right or isthmus cingulate.side)
Splenium CC_7 = endpoints_in(occipital.left or inferior_temporal_lobule.left) and
endpoints_in(occipital.right or inferior_temporal_lobule.right)

Table A.2  La dénition des faisceaux de projections dans le WMQL


Projection tract WMQL query
name
Cortico-spinal cortico_spinal.side = endpoints_in(brainstem) and end-
tract points_in(precentral.side or postcentral.side)
Thalamo- thalamo_prefrontal.side = endpoints_in(thalamus.side) and end-
prefrontal points_in(prefrontal.side)
Thalamo-premotor thalamo_premotor.side = endpoints_in(thalamus.side) and end-
points_in(premotor.side)
Thalamo- thalamo_precentral.side = endpoints_in(thalamus.side) and end-
precentral points_in(precentral.side)
Thalamo- thalamo_postcentral.side = endpoints_in(thalamus.side) and end-
postcentral points_in(postcentral.side)
Thalamo-parietal thalamo_parietal.side = endpoints_in(thalamus.side) and end-
points_in(parietal.side)
Thalamo-occipital thalamo_occipital.side = endpoints_in(thalamus.side) and end-
points_in(occipital.side)
Striato-fronto- striato_fronto_orbital.side = endpoints_in(striatum.side) and end-
orbital points_in(orbitofrontalgyrus.side)
Striato-prefrontal striato_prefrontal.side = endpoints_in(striatum.side) and end-
points_in(prefrontal.side)
Striato-premotor striato_premotor.side = endpoints_in(striatum.side) and end-
points_in(premotor.side)
Striato-precentral striato_precentral.side = endpoints_in(striatum.side) and end-
points_in(precentral.side)
Striato-postcentral striato_poscentral.side = endpoints_in(striatum.side) and end-
points_in(postcentral.side)
Striato-parietal striato_parietal.side = endpoints_in(striatum.side) and end-
points_in(parietal.side)
Striato-occipital striato_parietal.side = endpoints_in(striatum.side) and end-
points_in(occipital.side)

165
Annexe A. Atlas de la substance blanche

Table A.3  La dénition des faisceaux d'associations dans le WMQL


Association tract WMQL query
name
Cingulum bundle CB.side = only(cingular.side and (middle_frontal.side or cuneus.side or ento-
rhinal.side or superior_frontal.side or inferior parietal.side or fusiform.side or
medial orbitofrontal.side or lateral orbitofrontal.side or parahippocampal.side
or precuneus.side or lingual.side or centrum_semiovale.side))
Extreme capsule EmC.side = (endpoints_in(inferior_frontal.side or middle_frontal.side)
and endpoints_in(inferior_parietal_lobule.side) and temporal.side and in-
sula.side) not in hemisphere.opposite
Superior longitudi- SLF_I.side = endpoints_in(superior_parietal.side) and
nal fascicle I (middle_frontal_gyrus.side or superiorfrontal.side) and only(frontal.side or
parietal.side or centrum_semiovale.side)
Superior longitudi- SLF_II.side = endpoints_in(inferiror_parietal.side or lateral_occipital.side)
nal fascicle II and (middle_frontal_gyrus.side or superiorfrontal.side) and only(frontal.side
or parietal.side or centrum_semiovale.side)
Superior longitudi- SLF_III.side = endpoints_in(supramarginal.side) and end-
nal fascicle III points_in(inferiorfrontalgyrus.side) and only(frontal.side or parietal.side
or centrum_semiovale.side)
Arcuate fascicle AF.side = endpoints_in(inferior_frontal.side or middle_frontal.side
or precentral.side) and endpoints_in(temporal.side) not in me-
dial_of(supramarginal.side) and only(frontal.side or temporal.side or
parietal.side or centrum_semiovale)
Inferior occipito- IOFF.side = endpoints_in(orbitofrontalgyrus.side or inferiorfrontalgy-
frontal fascicle rus.side) and endpoints_in(occipital.side) and temporal.side and insula.side
Inferior longitudinal fascicle ILF.side = only(temporal.side and occipital.side)
and anterior_of(hippocampus.side) not in parahippocampal.side
Middle longitudi- MdLF.side = ((temporal.side and anterior_of(amygdala.side)) or
nal fascicle superiortemporal.side) and (inferior_parietal_lobule.side or super-
ior_parietal_lobule.side) and only(temporal.side or centrum_semiovale.side
or parietal.side)
Uncinate fascicle UF.side = insula.side and (inferior frontal.side or middle frontal.side
or orbito frontal.side) and endpoints_in(temporal.side and ante-
rior_of(amygdala.side))

166
Contributions de l'auteur
Publication dans une revue internationale
Amira Chekir, Salima Hassas, Maxime Descoteaux, Marc-Alexandre Côté, Elef-
therios Garyfallidis and Fatima Oulebsir-Boumghar. 3D-SSF : A bio-inspired
approach for dynamic multi-subject clustering of white matter tracts. Ed.
Elsevier, Computers in Biology and Medicine, Vol. 83, N 1, pp.10-21, April 2017,
ISSN 0010-4825, DOI :10.1016/j.compbiomed.2017.01.016, https://www.ncbi.nlm.
nih.gov/pubmed/28188985

Communications internationales
Amira Chekir and Fatima Oulebsir Boumghar. Sequential Density-Based
Multi-Subject Clustering in Massive Tractography Dataset. 5th Interna-
tional Work-Conference on Bioinformatics and Biomedical Engineering (IWBBIO
2017)- Avril 26-28, Grenade, Espagne.,http://iwbbio.ugr.es/program.php).
Amira Chekir, Maxime Descoteaux , Eleftherios Garyfallidis , Marc-Alexandre
Côté and Fatima Oulebsir Boumghar. A Hybrid Approach for Optimal Au-
tomatic Segmentation of White Matter Tracts in HARDI. IEEE Enginee-
ring in Medicine and Biology and Humanity (IECBES'14) - DOI :10.1109/IECBES.
2014. 7047481, pp 177-180, INSPEC Accession Number 14950568. Publisher : IEEE.
Décembre 8-10, 2014, MIRI, Sarawak (Malaisie). http://ieeexplore.ieee.org/
document/7047481/.

Amira Chekir, Farid Ahmed-Sid, Fatima Oulebsir Boumghar. Approche adap-


tative en tractographie de la substance blanche : Evaluation d'une mé-
thode déterministe. Biomedical Engineering International Conference (BIOMEIC'12)
ISSN 2253-0886. October 10-11, 2012, Tlemcen (Algeria). https://sites.google.
com/site/biomeic12/conference-program.

167
169

Vous aimerez peut-être aussi