Académique Documents
Professionnel Documents
Culture Documents
THÈSE
En : ELECTRONIQUE
Sujet
i
À mes très chers parents
Résumé : L'objectif du travail réalisé dans le cadre de cette thèse, est la pro-
position d'outils informatiques permettant d'aider les cliniciens dans le diagnostic
de pathologies cérébrales, à travers l'étude de la connectivité anatomique du cer-
veau. Cette étude se base sur l'IRM de diusion cérébrale, qui est une technique
non invasive permettant d'explorer l'architecture de la substance blanche compo-
sant le tissu cérébral, à partir de la mesure de la diusion des molécules d'eau. La
substance blanche est composée de faisceaux de bres qui connectent les diérentes
régions de la matière grise, permettant ainsi la transmission d'informations entre les
cellules nerveuses. Il est possible de visualiser les zones interconnectées du cerveau
et détecter d'éventuelles anomalies, grâce à l'usage de la tractographie qui permet
de reconstruire les trajectoires des faisceaux de bres, composant le tissu cérébral.
Vue la nature complexe des données issues de la tractographie, leur variabilité,
leur grand volume ainsi que la présence des outliers, nous proposons dans cette thèse
plusieurs approchess pour répondre à la question de leur analyse et leur clustering
en faisceaux anatomiquement signicatifs, qui est actuellement un problème non
encore résolu.
Dans un premier temps, nous avons eectué une étude comparative entre les
diérentes méthodes de tractographie an de sélectionner la meilleure solution pour
générer nos bases de données. Une fois la base de données de tractographie établie,
nous avons proposé une nouvelle approche hybride combinant, le clustering basé sur
la similarité et la segmentation basée sur l'a priori anatomique consigné dans un
atlas. Ceci, dans le but d'augmenter l'ecacité et la précision des résultats.
Dans un deuxième temps, nous avons étendu la problématique au clustering
inter-sujets, an de considérer la variation de la substance blanche d'un sujet à un
autre. Dans ce cadre, une première approche simple a été développée, considérant
des données statiques et opérant séquentiellement le clustering, en s'appuyant sur
un calcul de densité. Cette première méthode a montré son ecacité à extraire les
faisceaux de bres au niveau de la population et sa robustesse face aux outliers.
Néanmoins, elle reste limitée dans la considération dynamique de la variation des
données d'une population de faisceaux émanant de diérents sujets, tout comme
les autres approches existantes dans la littérature. Le clustering est statique et ne
permet pas le transfert d'une donnée aectée à un cluster vers un autre cluster plus
approprié qui apparaîtrait suite à l'enrichissement des données.
Pour répondre à cette limite, nous avons proposé une nouvelle méthode ori-
ginale appelée : "3D-Streamlines Stream Flocking (3D-SSF)", alliant dynamicité,
distribution et coopération dans le processus de clustering des données. Ces proprié-
tés inhérentes au paradigme multi-agents, ont été mises en ÷uvre par l'adaptation
d'un modèle multi-agents inspiré du Flocking (Multiple Species Flocking (MSF))
au problème du clustering dynamique et distribué, des streamlines des diérents
sujets considérés. Dans ce modèle, le ux de données représentant les streamlines
d'une population de sujets, sont réiés par une population d'agents mobiles dans
un espace 3D, où chaque agent représente une streamline et répond aux règles de
ocking pour opérer le clustering. L'objectif étant d'aboutir à des essaims d'agents
ou cluster matérialisant les streamlines similaires et se séparant des outliers. Les
agents évoluent dans l'espace 3D, en cherchant continuellement à former des es-
saims d'appartenance, qui correspondent à la similarité la plus élevée. Ce processus
est répété jusqu'à stabilisation de la population dans les clusters les plus appropriés.
Ce processus adaptatif permet de répondre à la fois à la taille des données, leur
variabilité et leur complexité. La robustesse et l'ecacité de la méthode 3D-SSF ont
été démontrées par les résultats obtenus et en comparaison à des algorithmes de la
littérature pris comme Baseline, en utilisant à la fois des données simulées et des
données réelles.
Mots clés : Approches bio-inspirées, système multi-agents, clustering des bres
neuronales, IRM de diusion, substance blanche cérébrale.
iv
Abstract : The objective of the work achieved in this thesis is the proposal of
computing tools to help clinicians better understand brain development and aging,
as well as improving early detection of some diseases through the study of the brain
anatomical connectivity. This study is based on diusion MRI, which is a non-
invasive technique, to explore the architecture of the white matter that composes
the brain tissue, from the measurement of the water molecules diusion. It allows
the non invasive reconstruction of brain ber bundle trajectories that connect the
dierent regions of the gray matter using a tractography process.
Given the complex nature of the tractography dataset, data variability, its large
volume and the presence of outliers, we propose in this thesis several techniques to
analyze and quantify the structures dened by tractography, and in particular, to
extract the ber bundles, which is still an unsolved problem.
As a rst step, we achieved a comparative study between dierent methods of
tractography in order to select the best one for the generation of our tractography
datasets.
Once the tractography dataset established, we proposed a new hybrid approach
combining from one side, a clustering based on similarity and from another side, a
segmentation based on anatomical a priori, that is recorded in an atlas. This is to
increase the eciency and the accuracy of the results.
Our second step was to extend the problem to inter-subject clustering, in order
to consider the variation of the white matter from one subject to another.
In this context, a simple rst approach has been developed, considering static
data and operating the clustering sequentially, based on the density estimation. This
rst method has shown its eciency in extracting ber bundles at the population
level and its robustness face to outliers. Nevertheless, it remains limited, as the other
existing approaches in the literature, in dynamically considering the variations issued
from several subjects.
To address this limit, we introduced a novel dynamic multi-subject clustering fra-
mework based on a distributed multiagent implementation of the Multiple Species
Flocking model, that we name 3D-Streamlines Stream Flocking (3D-SSF). Speci-
cally, we consider streamlines from dierent subjects as data streams, and each
streamline is assigned to a mobile agent. Agents work together following ocking
rules in order to form a ock. Thanks to a similarity function, the agents that are
associated with similar streamlines form a ock, whereas the agents that are associa-
ted with dissimilar streamlines are considered outliers. We use various experiments
performed on noisy synthetic and real human brain data to validate 3D-SSF and
demonstrate that it is more ecient and robust to outliers compared to other classi-
cal approaches. 3D-SSF is able to extract WM bundles at a population level, while
considering WM variation across subjects and eliminating outlier streamlines.
keyword : Bio-inspired approaches, multi-agent systems, multi-subject clustering,
diusion MRI, white matter tractography.
vi
Table des matières
Introduction générale 1
1 Anatomie cérébrale, les faisceaux de la substance blanche et prin-
cipes de l'IRM de diusion 7
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2 Anatomie cérébrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.1 Anatomie Générale du cerveau humain . . . . . . . . . . . . . 8
1.2.2 Organisation de la substance blanche cérébrale . . . . . . . . 11
1.3 Le phénomène de la diusion dans le cerveau humain . . . . . . . . . 15
1.4 Concept de l'IRM de diusion . . . . . . . . . . . . . . . . . . . . . . 17
1.5 Modélisation de la diusion en IRMd . . . . . . . . . . . . . . . . . . 19
1.5.1 Imagerie de Tenseur de Diusion . . . . . . . . . . . . . . . . 20
1.5.2 Imagerie de Diusion à Haute Résolution Angulaire . . . . . 24
1.6 Tractographie des bres de la substance blanche . . . . . . . . . . . . 29
1.6.1 La tractographie déterministe . . . . . . . . . . . . . . . . . . 33
1.6.2 La tractographie probabiliste . . . . . . . . . . . . . . . . . . 35
1.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
viii
Table des matières
ix
Table des gures
1.1 Diérentes parties du cerveau . . . . . . . . . . . . . . . . . . . . . . 9
1.2 Les quatre lobes externes composant l'hémisphère gauche cérébral.
(source : Gray's Anatomy). . . . . . . . . . . . . . . . . . . . . . . . 9
1.3 Cerveau humain adulte d'une IRM anatomique T1. . . . . . . . . . . 10
1.4 Quelques neurones dans le cerveau . . . . . . . . . . . . . . . . . . . 11
1.5 Représentation de diérents types de bres . . . . . . . . . . . . . . 12
1.6 Fibres commissurales . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.7 Les principaux faisceaux de la SB . . . . . . . . . . . . . . . . . . . . 15
1.8 Le phénomène de la diusion. . . . . . . . . . . . . . . . . . . . . . . 16
1.9 Diusions isotrope et anisotrope . . . . . . . . . . . . . . . . . . . . . 17
1.10 Magnétisme nucléaire . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.11 Les trois étapes de l'acquisition du signal IRM pour un voxel . . . . 19
1.12 Une séquence simpliée d'acquisition IRM . . . . . . . . . . . . . . . 20
1.13 Imagerie du Tenseur de Diusion (DTI) . . . . . . . . . . . . . . . . 22
1.14 Coupes axiales d'un cerveau humain, montrant les cartes scalaires
provenant du DTI . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.15 Diérentes modélisations de la diusion . . . . . . . . . . . . . . . . 26
1.16 Le prol de l'ADC en présence de deux bres qui se croisent. . . . . 27
1.17 Un schéma de reconstruction DSI . . . . . . . . . . . . . . . . . . . . 28
1.18 Exemple d'une portion de la base de données de tractographie. . . . 30
1.19 Schéma des algorithmes de tractographie déterministe et probabiliste
avec la fODF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.20 Comparaison de tractographie déterministe et probabiliste sur le fais-
ceau Cortico-Spinal (CST). . . . . . . . . . . . . . . . . . . . . . . . 31
1.21 Les diérentes approches de tractographie déterministe . . . . . . . . 34
1.22 Principe de l'algorithme EuDX . . . . . . . . . . . . . . . . . . . . . 35
6.1 Illustration des distances basées sur les points les plus proches . . . . 123
6.2 Comparaison des trois distances entre paires de streamlines . . . . . 124
6.3 La règle d'alignement . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
6.4 La règle de séparation . . . . . . . . . . . . . . . . . . . . . . . . . . 126
6.5 La règle de cohésion . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
6.6 Example de l'algorithme 3D-SSF . . . . . . . . . . . . . . . . . . . . 130
6.7 Les résultats de diérentes méthodes de clustering (3D-SSF, HQB et
V-Bundles) sur des données synthétiques. . . . . . . . . . . . . . . . 135
6.8 Evaluation quantitative des faisceaux obtenus avec la méthode 3D-SSF139
6.9 L'analyse de diusivité quantitative entre les faisceaux de l'atlas et
les faisceaux obtenus avec les méthodes 3D-SSF et MSQB . . . . . . 140
6.10 Illustration de quelques faisceaux obtenus avec la méthode 3D-SSF . 141
6.11 L'ecacité computationnelle de la méthode 3D-SSF . . . . . . . . . . 143
xii
Liste des tableaux
5.1 Comparaison quantitative des trois méthodes (Notre-méthode, HQB,
V-bundles) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
5.2 Valeurs de l'indice Silhouette obtenus avec notre méthode et la mé-
thode MSQB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
xvi
Introduction générale
Contexte
Le cerveau est l'un des organes les plus importants et des plus complexes du corps
humain. Il est constitué de tissus cérébraux qui sont généralement divisés en trois
catégories distinctes : la substance blanche (SB), la substance grise (SG) ainsi que le
liquide céphalo-rachidien (LCR). La SB est responsable de la communication entre
les diérentes régions de la SG qui est elle, constituée des terminaisons nerveuses
des corps axonaux qui gèrent les fonctions cérébrales. La SB peut être vue comme
un réseau de transmission de l'information à travers les régions fonctionnelles du
cerveau. Ces diérents réseaux de connectivité de la SB constituent en fait des
faisceaux d'axones. Le LCR quand à lui, est un liquide biologique transparent dans
lequel baigne le système nerveux central. Il absorbe les mouvements et les chocs an
de réduire les risques d'endommagement du cerveau.
Le signal bio-électrique (ou inux nerveux) transmis à travers le cerveau via les
axones de la SB est rendu possible grâce à la centaine de milliards de neurones
présents dans le cerveau humain. Les axones de la SB sont regroupés en faisceaux
(bundles) assurant diérentes fonctions cérébrales.
Depuis plus d'un siècle, la compréhension de l'organisation et de la fonction du
cerveau a présenté un intérêt fondamental pour la neurologie et les neurosciences,
notamment la structure et l'organisation de la SB qui n'est pas encore connue dans
sa totalité. Connaitre la carte de la connectivité anatomique cérébrale est alors un
grand dé, du plus grand intérêt pour comprendre le fonctionnement du cerveau et
étudier de nombreuses pathologies neuro-dégénératives comme celles d'Alzheimer et
de Parkinson dont les origines ne sont toujours pas connues et expliquées, ou encore
pour localiser la détérioration des bres concomitamment à la présence de tumeurs
cérébrales.
L'imagerie par résonance magnétique (IRM) est un outil non-invasif pour l'étude
du cerveau permettant de visualiser sa structure interne. Elle repose sur les prin-
cipes physiques de la résonance magnétique nucléaire (RMN). Les molécules d'eau
présentes majoritairement dans le cerveau (environ 78% d'eau), initialement à l'état
d'équilibre, sont excitées par un apport d'énergie, créé par le champ magnétique de
l'aimant dans l'IRM, durant un temps donné, puis reviennent graduellement à leur
état initial. C'est ce principe de retour à l'équilibre, appelé relaxation qui permettra
d'imager les tissus du cerveau.
En plus des images de type anatomique, une nouvelle modalité induite de l'IRM
a vu le jour, nommée IRM de diusion (IRMd). En modiant les paramètres des sé-
quences d'acquisitions, plus précisément en laissant diuser les molécules d'eau pré-
sentes dans le cerveau pendant un court instant, il est possible de mesurer l'intensité
de leur déplacement le long de plusieurs directions. L'IRMd est basée sur l'étude
Introduction générale
du mouvement Brownien, énoncé par Albert Einstein en 1956 [Einstein 1956], qui
stipule que l'eau diuse de manière isotrope dans chaque direction et ce, dans un
milieu sans contrainte. En présence de tissus structurés, l'eau a tendance à suivre
les prolongements d'axones plutôt que de les traverser. Il est donc possible de dé-
duire que la mesure qui renferme la direction de déplacement des molécules d'eau
contient de l'information cachée sur les structures microscropiques latentes. Ce type
d'acquisition fournit donc un volume en quatre dimensions (4D), constitué d'un en-
semble d'images 3D pour chaque direction de diusion où la quatrième dimension
correspond aux directions de diusion.
Une phase de reconstruction permet ensuite d'estimer le prol de diusion angu-
laire à partir de l'ensemble des images de diusion acquises. Le modèle de diusion
le plus utilisé jusqu'à présent est l'Imagerie du Tenseur de Diusion (DTI) qui re-
présente les images de diusion par un champ de tenseurs d'ordre deux [Tuch 2002],
dont l'utilisation est très attrayante pour l'étude de la structure interne de la SB du
cerveau car le prol angulaire de la diusion fournit de précieuses informations sur
les faisceaux de bres reliant les diérentes aires corticales. L'extraction de ces in-
formations à partir de la reconstruction DTI d'images cérébrales peut alors prendre
plusieurs formes : indice d'anisotropie (fraction d'anisotropie), quantité de diusion,
etc. Cependant la DTI présente quelques limitations au niveau de la représentation
de la conguration des faisceaux de bres.
Avec l'émergence des IRMs plus puissantes, permettant des résolutions spa-
tiales plus élevées, de nouvelles techniques d'IRMd à haute résolution angulaire
(HARDI) [Descoteaux 2008] (High Angular Resolution Diusion-weighted Imaging)
ont vu le jour, utilisant des modèles mathématiques de dimensions supérieures. Ces
modèles permettent une meilleure détection des croisements entres réseaux de bres,
ce qui constitue la principale diculté rencontrée avec le modèle DTI classique.
Ces modèles locaux de diusion permettent d'extraire les directions les plus pro-
bables de diusion des molécules d'eau. À l'aide de ces informations de direction, il
est alors possible de reconstruire le réseau des faisceaux de bres de la SB avec un
procédé nommé tractographie. La tractographie est une classe d'algorithmes dont
l'objectif est d'estimer la structure de la SB en suivant les orientations cohérentes,
obtenues de l'IRM pondérée en diusion, parmi les voxels voisins. Les algorithmes de
tractographie ont pour dé d'utiliser au mieux l'information présente dans chaque
voxel et de produire un résultat respectant les hypothèses de structure et de connec-
tivité du réseau d'axones du cerveau [Hagmann 2003]. La tractographie produit des
courbes 3D, appelées tractes de la SB ou streamlines. Dans cette thèse, nous utili-
sons le terme "streamline" pour décrire un ensemble de points 3D représentant une
bre de la SB dans la base de données de tractographie.
Problématiques et motivations
Les données de tractographie sont aujourd'hui de meilleure qualité, mais malgré
ces progrès, elles ne sont pas dépourvues d'artefacts, ce qui engendre des outliers.
2
Ces données sont très complexes avec des positions spatiales, des formes géomé-
triques et des longueurs variables. De plus, elles sont très volumineuses, avec plus
d'un million de streamlines par cerveau. En eet, l'analyse et le regroupement des
streamlines issues de la tractographie en faisceaux anatomiquement signicatifs,
reste un problème non résolu, dû entre autres, aux raisons suivantes :
La complexité de l'architecture de la SB et le manque de dénitions claires
concernant la structure et l'organisation des faisceaux de streamlines ;
Le problème de grande taille de l'ensemble des données de tractographie
faisant intervenir diérents streamlines de diverses géométries complexes ;
La variabilité de la SB cérébrale d'un sujet à un autre, en terme de propriétés
géométriques et de connectivités, ce qui complique le développement d'une
solution générale pour le clustering des streamlines à travers les sujets ;
La présence des outliers, due aux erreurs de tractographie et des mouve-
ments du patient lors de l'examen radiologique, ce qui aecte le résultat du
clustering en introduisant des streamlines erronés.
3
Introduction générale
une première approche simple a été développée, considérant des données statiques
et opérant le clustering séquentiellement, en s'appuyant sur un calcul de densité.
Cette première méthode a montré son ecacité à extraire les faisceaux de bres au
niveau de la population et sa robustesse face aux outliers. À ce stade, nous avons
mis en évidence les limites de l'approche, comme pour toutes les autres approches
existantes, par rapport au caractère dynamique de la variation des données d'une
population de faisceaux émanant de diérents sujets. Le clustering est statique et
ne permet pas le transfert d'une donnée aectée à un cluster vers un autre cluster
plus approprié qui apparaîtrait suite à l'enrichissement des données.
Pour répondre à cette limitation, nous avons proposé une nouvelle méthode
incrémentale, alliant dynamicité, distribution et coopération dans le processus de
clustering des données. Ces propriétés inhérentes au paradigme multi-agents, ont
été mises en oeuvre par la proposition d'un modèle multi-agents inspiré du Flocking
(Multiple Species Flocking (MSF)). Le Flocking est un phénomène bien connu, ob-
servé dans la nature, dans les nuées d'oiseaux ou les bancs de poisson, qui est une
illustration parfaite d'une intelligence collective émergeant d'interactions simples
entre les individus. Les interactions sont exprimées dans ce phénomène par des lois
physiques et obéissent à trois règles : la règle de cohésion du groupe qui consiste à
rapprocher les individus les uns des autres pour former un groupe, la règle de sépa-
ration pour éviter que les individus se heurtent en se retrouvant au même endroit
au même moment et, la règle d'alignement pour éviter la dispersion des individus.
Cette nouvelle méthode, appelée : "3D-Streamlines Stream Flocking (3D-SSF)"
est une adaptation de ce modèle au problème du clustering dynamique et distri-
bué des streamlines des diérents sujets considérés. Dans notre modèle, le ux de
données représentant les streamlines d'une population de sujets, sont réiés par une
population d'agents mobiles dans un espace 3D, où chaque agent représente une
streamline et répond aux 3 règles de ocking pour opérer le clustering. L'objectif
étant d'aboutir à des essaims d'agents matérialisant les streamlines similaires et
se séparant des outliers. Les agents évoluent dans l'espace 3D, en cherchant conti-
nuellement à former des essaims ou cluster d'appartenance, qui correspondent à la
similarité la plus élevée. Ce processus est répété jusqu'à stabilisation de la popula-
tion dans les clusters les plus appropriés. Ce processus adaptatif permet de répondre
à la fois à la grande taille des données, à leur variabilité et à leur complexité. La
méthode 3D-SSF a été implémentée et validée à la fois sur des données synthétiques
et des données réelles. La robustesse et l'ecacité de cette méthode ont été démon-
trées par les résultats obtenus et comparées à des algorithmes de la littérature pris
comme Baseline.
Organisation du manuscrit
Ce manuscrit s'organise en six chapitres. Les trois premiers chapitres détaillent
l'état de l'art d'une part, des connaissances nécessaires en anatomie du cerveau et
des techniques relevant de l'IRM de diusion et d'autre part, des approches et des
4
outils informatiques utilisés pour le clustering des données issues de la tractographie
ainsi que des approches à base de systèmes multi-agents. Les trois derniers chapitres
abordent nos principales contributions dans le domaine du clustering des bres de
la SB.
Ainsi, un premier chapitre autour de l'Anatomie cérébrale, les faisceaux de la
SB et les principes de l'IRM de diusion décrit d'abord l'anatomie cérébrale et en
particulier, la SB ainsi que les principaux faisceaux qui la constituent, indispensables
pour comprendre à la fois les termes techniques utilisées dans la suite, l'échelle
à laquelle se situe notre travail et, pour dénir, toute l'étendue de la complexité
de ce fabuleux organe. Puis, les enjeux de l'IRM de diusion sont présentés ainsi
que les outils mathématiques pour décrire le processus de diusion. Enn, nous
expliquons les diérentes techniques de tractographie existantes, tout en discutant
les principaux avantages et inconvénients de ces approches.
Au second chapitre intitulé "Approches de clustering et systèmes multi-agents",
nous visons à introduire les diérentes catégories des méthodes de clustering tradi-
tionnelles existantes dans la littérature, tout en mettant l'accent sur leurs limites.
Nous nous focaliserons sur les nouveaux algorithmes qui ont été proposés récemment
pour résoudre les problèmes de ces méthodes, et qui sont inspirés du comportement
collectif biologique, comme l'algorithme des essaims particulaires (Particle Swarm
Optimization) et l'algorithme de colonies de fourmis. Ces nouvelles méthodes uti-
lisent une implémentation distribuée des système multi-agents que nous décrirons
également en détail dans ce chapitre.
Troisième chapitre portant sur le clustering dans la SB cérébrale et la détection
des outliers, dresse un état de l'art sur les méthodes de clustering intra-sujet et
inter-sujets. Comme le clustering inter-sujets nécessite un recalage des données de
diérents sujets, nous commençons donc par décrire les diérentes méthodes de
recalage inter-sujets. Nous expliquons ensuite, comment les méthodes existantes de
mesure de la similarité sont utilisées pour le clustering. Nous présentons aussi, à
la n de ce chapitre, un bref état de l'art de ce qui a été fait dans le domaine de
la détection et de l'élimination des streamlines outliers. Cette étude a pour but de
mieux situer nos contributions tout au long de cette thèse.
Le chapitre 4 sur le clustering intra-sujet des bres neuronales, présente nos pre-
mières contributions de cette thèse, son but initial étant l'étude de la précision des
algorithmes de tractographie basés sur le modèle DTI et le modèle HARDI. Cela
nous a permis de choisir la meilleure méthode de tractographie pour générer nos
bases de données de tractographie. Nous introduirons ensuite une méthode hybride
de segmentation de ces bases de données de tractographie, an de générer les prin-
cipaux faisceaux de bres qui constituent la connectivité de la SB cérébrale au sein
d'un seul sujet.
Un chapitre 5 traitant du clustering inter-sujets statique des bres, est l'occa-
sion de présenter une nouvelle méthode séquentielle de clustering inter-sujets basée
sur la densité, qui permet une inférence d'un modèle composé d'une liste des fais-
ceaux génériques présents dans la plupart des sujets. Nous détaillons le principe de
cette méthode, avant de présenter les résultats obtenus sur des données réelles et
5
Introduction générale
6
Chapitre 1
Sommaire
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2 Anatomie cérébrale . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.1 Anatomie Générale du cerveau humain . . . . . . . . . . . . . 8
1.2.2 Organisation de la substance blanche cérébrale . . . . . . . . 11
1.3 Le phénomène de la diusion dans le cerveau humain . . . 15
1.4 Concept de l'IRM de diusion . . . . . . . . . . . . . . . . . 17
1.5 Modélisation de la diusion en IRMd . . . . . . . . . . . . . 19
1.5.1 Imagerie de Tenseur de Diusion . . . . . . . . . . . . . . . . 20
1.5.2 Imagerie de Diusion à Haute Résolution Angulaire . . . . . 24
1.6 Tractographie des bres de la substance blanche . . . . . . 29
1.6.1 La tractographie déterministe . . . . . . . . . . . . . . . . . . 33
1.6.2 La tractographie probabiliste . . . . . . . . . . . . . . . . . . 35
1.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion
1.1 Introduction
L'objectif de cette thèse est l'analyse de la connectivité anatomique du cerveau.
La compréhension de ce travail de thèse nécessite une connaissance de base de l'ana-
tomie cérébrale.
Dans ce chapitre, nous présentons en premier lieu les principaux concepts de
l'anatomie du cerveau en commençant d'abord par décrire la constitution tissulaire
cérébrale d'un point de vue histologique : substance blanche (SB) et substance grise
(SG). Nous nous focalisons surtout sur la SB et les diérents modèles de connexions
qui la constitue.
En deuxième lieu, nous développons les principes de l'IRM de diusion, car elle
est, comme nous le verrons, la seule technique non invasive permettant d'explorer
l'architecture de la SB à partir de la mesure de la diusion des molécules d'eau. Nous
expliquons d'abord les principes de base de la diusion moléculaire, puis la diusion
dans le cerveau. Nous verrons comment cette diusion est mesurée grâce à l'IRM
de diusion. Ensuite, nous présentons l'Imagerie du Tenseur de Diusion (DTI) et
l'Imagerie à Haute Résolution Angulaire (HARDI). Enn, dans la dernière section
de ce chapitre, nous nous intéressons aux diérentes techniques de tractographie
existantes qui permettent de générer l'ensemble des bres de la SB.
8
1.2. Anatomie cérébrale
Figure 1.2 Les quatre lobes externes composant l'hémisphère gauche cérébral.
(source : Gray's Anatomy).
Le cerveau humain est protégé par la boîte crânienne et baigne dans un milieu
aqueux : le liquide cérébro-spinal, ou liquide céphalo-rachidien (LCR). A l'échelle
microscopique, il est composé de diérents structures comme la substance blanche
9
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion
(SB) et la substance grise (SG). Ces structures présentent des contrastes diérents
dans une image de résonance magnétique (IRM) anatomique, de contraste T1 (gure
1.3).
Figure 1.3 Cerveau humain adulte d'une IRM anatomique T1. (a) Coupe sagit-
tale. (b) Coupe transversale. ( Visible Human Project [Ackerman 1999]). La SB
apparait en couleur blanche à l'intérieur du cerveau. Le cortex de SG est la couche
grise qui entoure le cerveau.
10
1.2. Anatomie cérébrale
Figure 1.4 Quelques neurones dans le cerveau, constituées d'un corps cellulaire,
de dendrites et d'un axone entouré d'une gaine de myéline. (Source : http://www.
arsep.org).
11
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion
Le faisceau unciné (UNC) est un faisceau associatif ventral qui connecte le lobe
temporal avec le cortex orbito-frontal médial et latéral. Ce faisceau est considéré
comme une partie du lobe limbique, et semble être impliqué dans le traitement des
émotions, de la mémoire et du langage.
12
1.2. Anatomie cérébrale
Le corps calleux (CC) est le plus grand faisceau du cerveau humain (environ
300 millions de bres). Il connecte les hémisphères cérébraux droit et gauche, il est
conventionnellement divisé en quatre parties : le bec (rostrum), le genou (genu),
le tronc (truncus) et le bourrelet (splenium). Le CC est impliqué dans plusieurs
fonctions motrices, sensorielles et cognitives.
La commissure antérieure (CA) est un petit faisceau qui relie les lobes tem-
poraux des deux hémisphères au niveau de l'amygdale situé dans la région antéro-
interne du lobe temporal. Ses fonctions sont peu connues.
La commissure postérieure (CP) est un petit faisceau qui connecte les noyaux
des nerfs crâniens, et les deux moitiés du mésencéphale et du diencéphale. Il est très
rarement reconstruit à partir de l'IRMd.
13
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion
14
1.3. Le phénomène de la diusion dans le cerveau humain
15
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion
J = −D 5 C (1.1)
avec D le coecient scalaire de diusion (m/s) qui ne dépend que de la nature
du milieu, C la concentration de l'espèce diusante (mol/m3 ) et J le ux de matière
((mol/m2 )/s).
La diusion moléculaire, ou mouvement brownien, a été formalisé par Einstein
[Einstein 1956], par l'équation 1.2 et relie le coecient de diusion D à la moyenne
quadratique de la distance parcourue par l'atome en trois dimensions :
(a) Mouvement brownien d'un atome (b) Exemple de mélange de deux pro-
modélisé en deux dimensions par une duits par diusion.
marche aléatoire.
16
1.4. Concept de l'IRM de diusion
Figure 1.9 Diusions isotrope et anisotrope. (a) Prol de diusion isotrope ; (b)
Prol de diusion anisotrope ; (c) Diusion restreinte dans la SB. La diusion dans la
direction des bres D k est trois fois plus importante que la diusion perpendiculaire
D ⊥ [Bihan 2003]. L'eau diuse plus facilement en suivant la structure de l'axone
qu'en essayant de passer au travers.
w0 = γ k B 0 k (1.3)
où le rapport gyromagnétique pour 1H est : γ = 2.68 × 108 . A l'échelle d'un voxel
de 2 à 3 mm, plusieurs atomes entrent en résonance et on parle alors de vecteur de
magnétisation macroscopique des spins M , comme illustré à la gure 1.10(b).
Le signal d'écho de spins, mesuré par résonance magnétique des atomes, est
obtenu par la séquence suivante (résumée par la gure 1.11) :
Un champ magnétique B0 de très grande magnitude, de l'ordre de quelques
Teslas, est généré par la machine IRM. On choisit par convention B0 orienté
le long de l'axe z (gure 1.11(a)).
17
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion
18
1.5. Modélisation de la diusion en IRMd
Figure 1.11 Les trois étapes de l'acquisition du signal IRM pour un voxel. (a)
A l'équilibre, le vecteur de magnétisation M s'aligne avec le champ magnétique
B0 . (b) Après excitation par une impulsion radiofréquence (RF) B1 orientée à 90◦
par rapport à B0 , M se situe dans le plan xy . (c) L'arrêt de la RF B1 entraîne
la relaxation de M vers l'axe z et émet une onde radiofréquence, l'écho, que l'on
mesure à l'aide d'antenne situées à proximité.
deuxième gradient de diusion gd(δ) est appliqué et marque à nouveau les spins
suivant leur position à t = δ . Deux cas de gure se présentent : (i) les spins n'ont
pas bougé et les marques s'annulent ; (ii) les spins ont bougé, entraînant une perte
du signal proportionnelle au déplacement des spins. Si on assume que les gradients
sont inniment courts, le signal mesuré peut s'exprimer selon l'équation 1.4 :
TR TE
f (x, y) = M0 (1 − e− T 1 ) e− T 2 e−bD (1.4)
où, M0 est la densité protonique du voxel, T1 et T2 sont les constantes de
temps des relaxations dans le tissu, TR est le temps de répétition de la séquence,
D est le coecient de diusion et le facteur b représente la sensibilité à la diusion
[Bihan 1986].
Les variantes de la séquence échoplanaire (EPI, Imagerie Echo Planaire), propo-
sée par [Manseld 1977], sont les plus utilisées actuellement car elles sont beaucoup
plus rapides que la séquence PGSE. Elles produisent cependant des distorsions géo-
métriques dans l'image à cause du train d'acquisition très long, pendant lequel toutes
les erreurs d'encodage en phase s'accumulent. Ces distorsions doivent être corrigées,
en fonction du type, soit par l'acquisition elle-même, soit par un post-traitement.
En plus, un autre post-traitement devra être appliqué pour réduire le bruit Ricien,
présent dans les données de diusion.
19
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion
Figure 1.12 Une séquence simpliée d'acquisition IRM. Deux gradients courts
d'aires similaires, dans ce cas d'amplitudes et de durées similaires, sont utilisés.
(Source : [Descoteaux 2008].)
20
1.5. Modélisation de la diusion en IRMd
l'équation 1.5 :
S4 (q) = S0 exp(− 4 q T Dq) (1.5)
Les diérents paramètres d'imagerie sont souvent décrits par un scalaire unique,S0
est le signal obtenu sans application de gradients de diusion et le facteur b est dé-
nie par l'équation 1.6 comme suit :
b = 4 k q k2 = 4γ 2 δ 2 k gd k2 (1.6)
Pour le schéma de Stejskal-Tanner, 4 est habituellement remplacé dans le facteur b
par le temps de diusion eectif (4 − δ/3) , an de compenser la durée innie des
impulsions du gradient [Bihan 1986].
Le tenseur de diusion D dans l'équation 1.5 est un tenseur du 2me ordre positif
et symétrique, qui peut être représenté par une matrice 3x3. Il possède donc 6 degrés
de liberté. Un minimum de 6 mesures de diusion sera alors nécessaire an d'estimer
le tenseur de diusion dans un voxel (généralement, une douzaine de directions
sont mesurées), ainsi que l'acquisition réalisée en l'absence de gradient de diusion.
Mathématiquement le tenseur de diusion a la forme suivante :
Dxx Dyx Dzx
Dxy Dyy Dzy
Dxz Dyz Dzz
où Dxx , Dyy , et Dzz correspondent aux coecients de diusion dans les directions
principales x, y et z . La matrice est symétrique, ce qui signie que Dxy = Dyx , Dzx =
Dxz et Dzy = Dyz . Ces six coecients sont estimés selon la relation d'atténuation
du signal RMN [Bihan 1986], avec l'équation 1.7 suivante :
Sk
A= = exp(−bgkT Dgk ) (1.7)
S0
où, S0 est le signal de référence en l'absence de gradient de diusion, Sk le signal
dans la direction k, k = 1, 2, .., 6. gk = (xyz)T est la direction du vecteur gradient
de diusion normalisé. Les directions d'application du gradient de diusion sont
habituellement choisies pour échantillonner de façon homogène l'espace. Cependant,
les coordonnées exactes de chaque direction sont propres à chaque constructeur.
Il est possible d'extraire les trois valeurs propres (λ1 , λ2 , λ3 ) et vecteurs propres
(e1 , e2 , e3 ), par la diagonalisation de la matrice. Ces valeurs sont obtenues en résol-
vant l'équation 1.8 suivante :
Dxx Dyx Dzx xi xi
Dxy Dyy Dzy yi = λi yi ⇐⇒ D.Vi = λi Vi (1.8)
Dxz Dyz Dzz zi zi
avec Vi vecteurs propres, perpendiculaires entre eux, λi valeurs propres. i =
1, 2, 3.
En fonction des trois vecteurs propres, qui représentent les trois directions or-
thogonales de diusion, la forme du tenseur de diusion peut s'allonger, s'aplatir
21
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion
Diusion moyenne
Ce paramètre de diusion permet d'obtenir une estimation de la diusion au sein
d'un voxel (Figure 1.13). Il caractérise le déplacement global des molécules au sein
d'un voxel et permet de déceler la présence d'obstacles à la diusion. La diusion
moyenne est considérée comme étant un indicateur sensible aux changements de
22
1.5. Modélisation de la diusion en IRMd
23
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion
Figure 1.14 Coupes axiales d'un cerveau humain, montrant les cartes scalaires
provenant du DTI. (a) : diusion moyenne MD. (b) : FA, (c) : carte couleur RGB de
la FA (vert : direction antéro-postérieure, bleu : direction crâno-caudale et rouge :
direction gauche-droite).
24
1.5. Modélisation de la diusion en IRMd
Diérentes techniques HARDI ont été proposées, avec ou sans modèle de diu-
sion.
Le modèle multi-tensoriel
Les auteurs dans [Tuch 2002] ont proposé de modéliser le signal HARDI comme
un mélange ni de n Gaussiennes. Ce modèle (gure 1.15(a)) est une extension du
modèle DTI, il généralise la DTI sous l'hypothèse que le signal du prol de diusion
est la somme des signaux de plusieurs faisceaux de bres, chacuns modélisés par un
tenseur d'ordre deux. Dans le cas de présence de k tenseurs, le signal est donné par
l'équation 1.16 :
k
(1.16)
X
Si = S0 fj exp(−bgiT Dj gi )
j=1
Ce modèle exige que le nombre de bres dans un voxel n soit connu. La plupart
des méthodes utilisent n = 2. An de rendre la solution numérique plus stable,
diérents contraintes peuvent être rajoutées à ce modèle. Par exemple, Tuch et
al dans [Tuch 2002] imposent la symétrie des valeurs propres. Les auteurs dans
[Maier 2004, Peled 2006] forcent une certaine amplitude a priori pour les valeurs
propres et dans [Chen 2004] imposent la dénition positive du tenseur. Une ex-
tension multi-Gaussiennes utilise une fonction de base de diusion de Gaussiennes
[Ramirez-Manzanares 2007] pour récupérer le croisement des bres.
25
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion
Le modèle CHARMED
Le modèle Composite and Hindered Restricted Model of Diusion (CHARMED)
proposé par Assaf et al [Assaf 2004] (gure 1.15(c)), divise la diusion en deux pro-
cessus : un compartiment fortement restreint qui est non-Gaussien avec une diu-
sion rapide (intra-axonale) et, un compartiment freiné qui est approximativement
Gaussien avec une diusion lente, donc la diusion est modélisée par une DTI Gaus-
sienne et une diusion à l'intérieur d'un cylindre. Cette approche a été améliorée
dans [Assaf 2008] qui propose le modèle AxCaliber qui tient compte de la varia-
bilité du diamètre axonal ce qui permet l'établissement de cartes pondérées par le
diamètre axonal, utilisées pour la segmentation de la SB en fonction du diamètre
axonal. [Behrens 2003].
26
1.5. Modélisation de la diusion en IRMd
27
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion
Figure 1.17 Un schéma de reconstruction DSI. A : tissu dans un voxel avec deux
populations de bres qui se croisent. B : Grâce au schéma d'acquisition MR, le
signal est échantillonné. C : Pour reconstruire le spectre de diusion, la transformée
de Fourier 3D discrète est utilisée . D : Pour simplier la représentation d'une
tranche d'imagerie, la structure angulaire de diusion est représentée par le dODF
(un diagramme polaire de la projection radiale). Le codage des couleurs correspond à
l'orientation de la diusion (vert : diusion verticale, rouge : diusion transversale).
(Source : [Wedeen 2005]).
Imagerie q-Ball
L'imagerie q-ball est basée sur une estimation de l'ODF de diusion. Cette ODF
contient l'intégralité de l'information angulaire de la PDF de diusion et est dénie
comme suit : Z
G[f (w)](u) = f (w)dw (1.19)
w∈uT
Le q-Ball a été proposé initialement dans [Tuch 2002, Tuch 2004] pour reconstruire
une ODF de diusion plus lisse, directement à partir de l'acquisition HARDI d'une
seule couche de l'espace-q ou coquille, en utilisant la transformée de Funk-Radon
(FRT).
Des méthodes plus récentes [Descoteaux 2008] ont introduit une solution ana-
lytique d'harmoniques sphériques pour la reconstruction, qui s'avère plus rapide et
plus robuste. La solution analytique a développé une estimation du signal HARDI
avec les harmoniques sphériques (SH) et a résolu ensuite de façon analytique la FRT
avec les SH.
La décomposition du signal dans la base des SH, en association avec l'utilisation
du théorème de Funk-Hecke, a permis d'obtenir une estimation analytique de l'ODF
de diusion, Ψ, avec l'équation 1.20 :
R
(1.20)
X
Ψ(θi , φi ) = cj Yj (θi , φi )
j=1
28
1.6. Tractographie des bres de la substance blanche
29
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion
Paramètres de tractographie
Stratégie d'initialisation Il existe deux stratégies d'initialisation pour l'estima-
tion locale de la position initiale assurant la propagation des tractes :
Initialisation complète : Dénir les points d'initialisation aléatoirement à l'in-
térieur d'un masque complet de la SB extrait à partir d'une segmentation de
l'image anatomique T1 ou dans un masque déni par une carte d'anisotropie
fractionnelle seuillée à 0.2 (généralement).
Initialisation par régions : Initialiser des tractes dans une région d'intérêt ou
un sous-ensemble du masque. Dans les deux cas, une ou plusieurs initialisa-
tions peuvent être faites par voxel. Si plusieurs initialisations sont faites au
sein d'un même voxel, le centre du voxel ne sera pas nécessairement choisi
30
1.6. Tractographie des bres de la substance blanche
comme position initiale. Une position à l'intérieur du voxel sera choisie aléa-
toirement, puis une interpolation sera faite sur les représentations locales an
d'obtenir la représentation locale à la position initiale [Tournier 2012]. Au-
trement, des positions initiales peuvent aussi être tirées aléatoirement dans le
masque d'initialisation jusqu'à l'obtention d'un nombre déterminé de tractes
[Tournier 2012].
31
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion
représentent des faisceaux cohérents qui font partie de la matière blanche. Souvent,
un masque binaire de la matière blanche est utilisé. Ce dernier peut être généré à
partir d'un seuillage de la carte d'anisotropie fractionnelle (FA) ou d'une segmenta-
tion de l'image anatomique T1. Le choix du masque de la SB a un impact crucial
sur le résultat de la tractographie. Un masque seuillé par l'anisotropie fractionnelle
est basée sur la valeur de celle-ci qui est généralement plus grande dans la SB que
dans la matière grise ou dans le LCR. Cependant, la FA peut être inférieure au
seuil choisi dans des voxels où il y a des croisements de faisceaux de la SB, ce qui
peut engendrer des trous à l'intérieur même de la matière blanche, ce qui modi-
era considérablement les tractes qui arrêteront leur parcours à ces endroits. Pour
remédier à ce problème, les auteurs dans [Guevara 2011b] ont proposé de n'utiliser
qu'un masque de matière blanche segmentée de l'image pondérée T1, qui produit
des tractogrammes plus riches et plus précis.
Longueur des bres La longueur minimale (Lmin ) et maximale (Lmax ) des bres
permet de contrôler la taille des tractes générées par l'algorithme de tractographie.
Ainsi, une tracte plus longue que (Lmax ) ne peut pas représenter des faisceaux réels.
32
1.6. Tractographie des bres de la substance blanche
Si elle est plus courte que (Lmin ) du fait d'erreurs de segmentation du masque, les
faisceaux résultants seront exclus du résultat nal de tractographie.
FACT
L'algorithme Fiber Assignment by Continuous Tracking (FACT) a été proposé
par Mori et al. [Mori 1999]. Son principe consiste à initier la trajectoire des bres à
partir des voxels dénis par l'utilisateur, et à suivre la direction du vecteur propre
principal, de voxel à voxel, en 3D. Quand la trajectoire de la bre atteint le bord
du voxel, la direction de la trajectoire change pour suivre celle du vecteur propre
principal du prochaine voxel comme cela est illustré en gure 1.21(b).
An de restreindre la propagation des bres dans certaines régions du cerveau,
une autre amélioration a été introduite par les auteurs en mettant au point un
nouveau critère d'arrêt qui est le produit scalaire des vecteurs dominants voisins.
TEND
La méthode Tensor deection (TEND) proposée par Lazar et al. [Lazar 2003]
génère un bon suivi des bres même dans des régions ayant une anisotropie basse et,
tend à pénaliser les trajectoires avec des courbes prononcées. L'algorithme dénit
la trajectoire du vecteur comme le produit du tenseur de diusion avec la direction
du vecteur d'entrée ; la progression en un point est donc faite en tenant compte de
la direction dominante du point précédent (gure 1.21(c)).
Cette technique a été utilisée dans l'étude de la connectivité. Dans le but de
minimiser les erreurs de trajectoires, l'utilisation du ltrage et la régularisation
permettent d'éviter des suivis de bres non conformes à la réalité cérébrale.
33
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion
EuDX
L'algorithme Euler integration avec interpolation trilinéaire (EuDX) proposé par
[Garyfallidis 2012b], est un algorithme déterministe général qui fonctionne bien sur
les croisements de bres. Il est basé sur une intégration d'Euler et une interpolation
trilinéaire qui utilise la totalité des informations sur les orientations des bres au
niveau des voxels, an de prendre en compte les croisements des bres.
Chaque voxel est représenté par un ou plusieurs vecteurs des maximas estimés
avec l'ODF. La méthode EuDX lance plusieurs tractes initialisés à partir d'un seul
point-germe si leurs valeurs d'anisotropie sont supérieures à un certain seuil, donc
l'algorithme est capable de générer diérents directions à partir du même point-
germe, ce qui lui permet de remédier au problème de croisement des bres comme
l'illustre la gure 1.22.
34
1.6. Tractographie des bres de la substance blanche
dans les régions de croisement des bres et héritent des limites classiques des algo-
rithmes déterministes telles que le choix de l'initialisation [Jones 2008], la sensibilité
lors de l'estimation de la direction de diusion et le manque des informations de
connectivité entre les régions du cerveau [Tuch 2002]. Pour surmonter ces limites,
des algorithmes probabilistes ont été proposés.
35
Chapitre 1. Anatomie cérébrale, les faisceaux de la substance blanche
et principes de l'IRM de diusion
1.7 Conclusion
Dans ce chapitre nous avons détaillé l'anatomie cérébrale tout en introduisant
la nomenclature des faisceaux de la SB. Nous avons ensuite abordé les bases de
l'IRM de diusion, qui mesure le déplacement moyen des molécules d'eau le long
de plusieurs directions et, sur la base de ces mesures, expliquer que les modèles de
diusion reconstruisent une estimation plus ou moins directe des orientations des
bres sous-jacentes. Les méthodes de tractographie utilisent l'orientation estimée des
bres pour tracer des trajectoires 3D représentant les voies de la SB. Les faisceaux
de bres résultants dépendent fortement de la qualité des données de diusion ainsi
que du modèle de diusion.
Les bases de données de tractographie sont utilisées pour étudier la connectivité
du cerveau, et en particulier, pour identier les faisceaux de bres de la SB exploités
dans la recherche et les études cliniques.
Dans le chapitre suivant nous aborderons ainsi l'état de l'art des méthodes de
clustering classiques, en nous focalisant sur les nouvelles approches distribuées basées
sur les systèmes multi-agents.
36
Chapitre 2
Approches de clustering et
systèmes multi-agents
Sommaire
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.2 Approches de clustering . . . . . . . . . . . . . . . . . . . . . 38
2.2.1 Dénition du clustering . . . . . . . . . . . . . . . . . . . . . 38
2.2.2 Les catégories de clustering . . . . . . . . . . . . . . . . . . . 39
2.3 Clustering distribué à base de multi-agents . . . . . . . . . . 45
2.3.1 Les agents informatiques . . . . . . . . . . . . . . . . . . . . . 45
2.3.2 Algorithmes d'intelligence en essaim . . . . . . . . . . . . . . 48
2.3.3 La méthode des colonies de fourmis . . . . . . . . . . . . . . 49
2.4 Evaluation du résultat de clustering . . . . . . . . . . . . . . 50
2.4.1 Indice de Rand . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.4.2 Indice Silhouette . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.4.3 Indice d'homogénéité . . . . . . . . . . . . . . . . . . . . . . . 52
2.4.4 Indice d'exhaustivité . . . . . . . . . . . . . . . . . . . . . . . 52
2.4.5 Indice de kappa . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Chapitre 2. Approches de clustering et systèmes multi-agents
2.1 Introduction
Le clustering consiste à partitionner un ensemble d'éléments en plusieurs groupes,
de manière à ce que les éléments d'un même groupe soient le plus proches possibles,
par rapport aux éléments des autres groupes, au vue d'une mesure de similarité don-
née. Autrement dit, les éléments d'un sous-ensemble partagent le plus grand nombre
de caractéristiques communes. Il existe trois raisons principales pour eectuer un
clustering. La première est de dévoiler la structure cachée des données permettant
ainsi d'émettre des hypothèses, de détecter des anomalies ou d'identier les carac-
téristiques importantes. La deuxième vise à identier le degré de corrélation entre
certaines données. La dernière est la compression, c'est-à-dire réduire la dimension
des données. L'embûche principale réside dans le fait que la dénition d'un groupe
est souvent oue et dépend de l'application.
Il existe un grand nombre d'algorithmes variés de clustering dans la littérature.
Dans ce chapitre, nous dénissons d'abord de manière formelle ce qu'est le cluste-
ring, puis nous classions les méthodes de clustering en plusieurs catégories, dont
on peut citer : le clustering hiérarchique, le clustering basé sur la densité, le clus-
tering basé sur les graphes, le clustering spectral, le clustering hybride et enn le
clustering distribué à base de multi-agents. Nous présentons ensuite, les avantages
et les inconvénients de chacune des méthodes de clustering.
Nous portons une attention particulière à la dernière catégorie de clustering, en
commençant par présenter les systèmes multi-agents puis, nous détaillons diérents
algorithmes de clustering bio-inspiré utilisant les systèmes multi-agents.
Dans ce chapitre, nous abordons également les métriques d'évaluation du clus-
tering, utilisées pour valider les résultats obtenus avec les méthodes proposées dans
cette thèse.
38
2.2. Approches de clustering
regroupements diérents. Cette notion de similarité est une première étape pour
dénir un algorithme permettant de regrouper les éléments, mais elle n'est pas suf-
sante. En eet, il est nécessaire de décrire la stratégie utilisant cette similarité et
permettant la construction explicite des clusters. Plusieurs stratégies peuvent être
mises en place en utilisant une même mesure de similarité.
Il existe de très nombreuses méthodes de clustering permettant de créer, de
manière automatique, ces clusters, chacune utilisant une stratégie et un objectif
propre, pour construire les clusters.
39
Chapitre 2. Approches de clustering et systèmes multi-agents
Le clustering K-means
L'algorithme k-moyennes ou k-means [Hartigan 1979] construit k classes à partir
d'un ensemble de n individus, tout en minimisant la quantité :
k X
(2.1)
X
(xi − gr )2
r=1 xi ∈Cr
où, Cr est la classe numéro r, xi est un individu dans une classe et gr est le centre
de la classe Cr .
Le principe de la méthode de clusteing K-means est le suivant :
1. Choisir aléatoirement K objets de la base qui formeront l'ensemble des cen-
troïdes initiaux représentant les k clusters recherchés ;
2. Assigner chaque objet au cluster dont le centroïde est le plus proche ;
3. Puis tant qu'au moins un objet change de cluster d'une itération à l'autre :
Mettre à jour les centroïdes des clusters en fonction des objets qui leur
sont associés.
Mettre à jour les assignations des objets aux clusters en fonction de leur
proximité aux nouveaux centroïdes.
Le clustering K-médoïdes
En statistiques, un médoïde est le représentant le plus central d'une classe. Dans
les méthodes k-médoïdes une classe est représentée par l'un de ses points. Ces al-
gorithmes sont ecaces puisqu'ils traitent n'importe quel type d'attributs et que
les médoïdes ont une résistance intégrée contre les données atypiques, les points
périphériques des clusters n'étant pas pris en compte. Quand les médoïdes sont sé-
lectionnés, les classes sont dénies comme des sous-ensembles de points proches des
médoïdes respectifs, et la fonction objective est dénie comme la distance moyenne
ou une autre mesure de dissimilarité entre un point et son médoïde.
40
2.2. Approches de clustering
41
Chapitre 2. Approches de clustering et systèmes multi-agents
42
2.2. Approches de clustering
43
Chapitre 2. Approches de clustering et systèmes multi-agents
clusters, il peut s'agir soit de supprimer les arcs les plus longs, soit de conserver les
arcs dont la valeur est inférieure à un seuil spécié.
La limite principale de ce type de clustering est la complexité de la méthode
utilisée pour former le graphe MST initial : en utilisant une méthode classique
de construction de MST, la complexité est en O(N 2 logN ). Diérentes techniques
utilisées pour réduire cette complexité peuvent être trouvées dans [Keim 1999], mais
celle-ci sera de toute façon au moins quadratique, dans le meilleur des cas.
44
2.3. Clustering distribué à base de multi-agents
45
Chapitre 2. Approches de clustering et systèmes multi-agents
Dénition 3 Agents réactifs. Les agents dits réactifs sont caractérisés par :
un mode de fonctionnement réactif basique de type stimulus-réponse,
une absence de représentation interne de l'environnement,
un mode d'interaction simple avec les autres agents et l'environnement,
une organisation de groupe et une dynamique collective en modalité multi-
agent qui en font un paradigme idéal pour l'étude des systèmes complexes.
Dénition 4 Un agent cognitif possède :
une représentation élaborée de son environnement,
des capacités de raisonnement sur les données dont il dispose,
d'un but explicite à atteindre,
46
2.3. Clustering distribué à base de multi-agents
d'une capacité à mémoriser ses actions passées, de planier ses actions fu-
tures,
des capacités de communication en utilisant un langage approprié.
On qualie de rationnel un agent qui agit en fonction d'un objectif à atteindre.
47
Chapitre 2. Approches de clustering et systèmes multi-agents
car la solution du problème émerge du travail collectif des agents. Une des sources
d'inspiration d'algorithmes montrant une intelligence en essaim est le déplacement
des animaux en groupe où aucun individu ne contrôle les autres. Néanmoins, des
formes et des comportements complexes peuvent apparaître lors de ces déplacements
comme dans les algorithmes d'optimisation par essaim particulaire [Kennedy 1995]
et les algorithmes de colonies de fourmis [Dorigo 1996], qui utilisent un ensemble de
particules caractérisées par leur position et leur vitesse pour maximiser une fonc-
tion dans un espace de recherche. Des interactions ont lieu entre les particules an
d'obtenir des comportements globaux ecaces. Ce principe a été appliqué en 1998
dans [Proctor 1998] pour la première fois, au problème du clustering automatique où
chaque agent représente une donnée se déplaçant vers les données qui lui sont le plus
similaires, permettant ainsi de créer des groupes de données similaires assimilables
aux classes de la partition.
V (k+1) = w.V (k) + c1 .rand1 (P best(k) − X (k) ) + c2 .rand2 .(Gbest(k) − X (k) ) (2.2)
48
2.3. Clustering distribué à base de multi-agents
49
Chapitre 2. Approches de clustering et systèmes multi-agents
50
2.4. Evaluation du résultat de clustering
Les vrais négatifs (VN) : les deux observations sont dans des clusters diérents
dans C et Ĉ ,
Les faux positifs (FP) : l'algorithme a classé les observations dans le même
cluster dans Ĉ alors qu'elles ne le sont pas dans C ,
Les faux négatifs (FN) : l'algorithme a classé les observations dans des clusters
diérents de Ĉ alors qu'elles sont dans le même C .
où ERI est la valeur de l'indice de Rand avec sa valeur attendue en cas d'indé-
pendance de la classe engendrée et de la classe retrouvée.
a(i) représente la distance moyenne qui sépare l'item i des autres items de la
classe à laquelle il appartient.
b(i) représente la distance moyenne qui sépare l'item i des items qui appar-
tiennent à la classe la plus proche.
51
Chapitre 2. Approches de clustering et systèmes multi-agents
Quand S(i) est proche de 1, l'item est bien classé : la distance qui le sépare
de la classe la plus proche est très supérieure à celle qui le sépare de sa classe. En
revanche, si S(i) est proche de -1, cela veut dire que l'item est mal classé. Mais si
S(i) est proche de 0, alors il pourrait également être classé dans la classe la plus
proche. L'indice Silhouette d'un cluster est calculé à partir de la moyenne entre les
indices de ses éléments.
où,
|K| |C|
X X ack ack
H(C|K) = − log P|C|
N
k=1 c=1 c=1 ack
52
2.4. Evaluation du résultat de clustering
répartition des aectations de cluster au sein de chaque classe. Dans une solution de
clustering parfaitement complète, chacune de ces distributions sera complètement
biaisée à un cluster unique. Nous pouvons évaluer ce degré d'inclinaison en calculant
l'entropie conditionnelle de la distribution de cluster proposée, compte tenu de la
classe des points de données des composants, H(K|C). Dans le cas d'une solution
de clustering parfaitement complète, H(K|C) = 0. Cependant, dans le pire des cas,
chaque classe est représentée par chaque cluster avec une distribution égale à la
distribution des tailles de clusters, H(K|C) est maximal et équivaut à H(K). Enn,
dans le cas dégénéré, lorsqu'il existe un cluster unique, où H(K) = 0, nous dé-
nissons l'exhaustivité comme valant 1. Par conséquent, de manière symétrique au
calcul ci-dessus, nous dénissons l'indice d'exhaustivité comme suit (équation 2.9) :
(
1 if H(K) = 0
(2.9)
1 − H(K|C)
H(K) else
où,
|C| |K|
X X ack ack
H(K|C) = − log P|K|
N
c=1 k=1 k=1 ack
Po − Pe
κ= (2.10)
1 − Pe
53
Chapitre 2. Approches de clustering et systèmes multi-agents
2.5 Conclusion
Ce chapitre a présenté diérentes techniques de clustering, en décrivant les prin-
cipes opératoires et leurs caractéristiques en terme d'avantages et d'inconvénients.
Il a aussi présenté les métriques utilisées pour apprécier la qualité d'un clustering.
La première catégorie présentée, regroupe les techniques traditionnelles, qui
sourent d'un manque de exibilité par rapport aux données complexes, notamment
concernant la prise en compte des aspects dynamiques. Par ailleurs, ces approches
sourent d'un problème de passage à l'échelle, face aux ensembles de données de
grande taille. La deuxième catégorie de techniques de clustering présentée corres-
pond à de nouveaux algorithmes de clustering inspirés de modèles biologiques tels
que les colonies de fourmis, les nuées d'oiseaux, et les essaims d'abeilles. Ces al-
gorithmes sont dotés de caractéristiques intéressantes telles que la distribution, la
dynamicité, la capacité d'adaptation, qui permettent de mieux répondre aux limita-
tions des approches traditionnelles. Ceci grâce à la notion d'intelligence collective,
incarnée par l'interaction d'un grand nombre d'agents informatiques qui suivent les
mêmes règles et présentent un comportement complexe émergent.
Dans le chapitre suivant, nous étudierons les principales méthodes de clustering
employées pour regrouper les bres dans une base de données de tractographie an
d'étudier la connectivité anatomique du cerveau.
54
Chapitre 3
One machine can do the work of fty ordinary men. No machine can
do the work of one extraordinary man. Elbert Hubbard.
Sommaire
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2 Le recalage inter-sujets . . . . . . . . . . . . . . . . . . . . . . 56
3.2.1 Le recalage linéaire et non linéaire . . . . . . . . . . . . . . . 56
3.2.2 La normalisation spatiale . . . . . . . . . . . . . . . . . . . . 58
3.3 La segmentation basée ROIs . . . . . . . . . . . . . . . . . . . 58
3.4 Le clustering basé similarité . . . . . . . . . . . . . . . . . . . 61
3.4.1 Les mesures de similarité . . . . . . . . . . . . . . . . . . . . 62
3.4.2 Le clustering intra-sujet . . . . . . . . . . . . . . . . . . . . . 68
3.4.3 Le clustering inter-sujets . . . . . . . . . . . . . . . . . . . . . 71
3.5 Le clustering hybride . . . . . . . . . . . . . . . . . . . . . . . 75
3.6 Les approches de détection des outliers . . . . . . . . . . . . 78
3.6.1 La détection des outliers basée sur la distribution . . . . . . . 79
3.6.2 La détection des outliers basée sur la distance . . . . . . . . . 79
3.6.3 La détection des outliers basée sur la densité . . . . . . . . . 80
3.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Chapitre 3. Clustering des bres neuronales et détection des outliers
3.1 Introduction
Comme nous l'avons relaté au premier chapitre, l'IRM de diusion permet, à
travers la tractographie, de reconstruire un million de tractes environ, pour le cer-
veau entier et ce, de façon non-invasive. Dans cette thèse, nous utilisons le terme
"streamlines" pour décrire un ensemble de points 3D représentant ces tractes neu-
ronaux.
En neuro-imagerie, en fonction de ce qui doit être étudié, deux modèles cou-
rants d'analyse de la base de données de tractographie, proposés dans la littérature,
permettent la modélisation des diérentes connexions de la SB cérébrale, avec dié-
rents objectifs. Le clustering des streamlines basé sur la similarité (que nous noterons
clustering basé similarité dans la suite), permet de reconstruire les faisceaux corres-
pondant aux divisions anatomiques de la SB. Cependant la segmentation basée sur
la détection de régions d'intérêt (que nous noterons dans la suite : segmentation
basée ROIs pour Regions Of Interest) divise la SB en faisceaux, en fonction des
régions corticales, où les n÷uds, qu'ils connectent permettant d'étudier le cerveau
comme un réseau de connexions.
Récemment, une troisième catégorie a été développée ; elle combine les aspects
de la segmentation basée ROIs et le clustering des streamlines basé similarité, pour
faire correspondre l'analyse de la connexion des structures à l'anatomie de la SB.
Cette thèse vise à regrouper les trajectoires putatives des streamlines en faisceaux
cohérents et anatomiquement signicatifs. An de situer notre travail, ce chapitre
présente un aperçu des méthodes de clustering des streamlines dans la littérature .
Nous nous focalisons sur la première catégorie, le clustering basé similarité, qui inclue
deux classes, le clustering intra-sujet et le clustering inter-sujets. Le clustering intra-
sujet permet de regrouper les streamlines au sein d'un seul sujet en s'appuyant sur la
mesure de similarité entre les streamlines. Nous décrivons également les principales
méthodes existantes de mesure de la similarité entre les streamlines. Cependant cette
classe de méthodes est limitée face à la variation de la SB cérébrale à travers les
sujets et sa complexité. Le clustering inter-sujets a été ainsi proposé an de remédier
à ce problème, permettant d'établir un modèle de faisceaux à travers une population
de sujets. Le clustering inter-sujets exige que toutes les images des sujets se trouvent
dans un référentiel commun, un recalage entre les sujets est donc nécessaire. Pour
cela, nous proposons de commencer par aborder les diérentes méthodes de recalage
inter-sujets.
56
3.2. Le recalage inter-sujets
Le recalage non-linéaire inclut des transformations plus exibles que les trans-
formations anes, permettant d'aner la mise en correspondance dans les cas où
des déformations non-linéaires entre les images sont présentes.
Ce recalage peut être paramétré de façon à ne permettre que des déformations
simples et grossières, ou de façon à autoriser l'application des déformations très ne-
ment, détaillées et complexes, an de tenter de faire correspondre l'image d'entrée
à l'image de référence aussi parfaitement que possible. Cette deuxième catégorie
de déformation doit être utilisée prudemment car les images peuvent être trop dé-
formées et qu'elles ressemblent presque exactement les unes aux autres, mais les
images peuvent ne pas avoir atteint l'homologie structurelle globale, c'est-à-dire la
préservation de la façon dont les diérentes caractéristiques se rapportent les unes
aux autres.
Le recalage non-linéaire peut être divisé en deux types, les approches géomé-
triques et les approches d'intensité.
Les approches géométriques construisent des modèles explicites d'éléments ana-
tomiques identiables dans chaque image. Ces éléments comprennent typiquement
des surfaces fonctionnellement importantes, des courbes et des repères ponctuels
qui peuvent correspondre à leurs contreparties dans la deuxième image. Ces cor-
respondances dénissent la transformation d'une image par rapport à une autre
[Crum 2004].
L'approche d'intensité est réalisée par optimisation, basée sur une mesure de
similarité d'image qui quantie le degré de similarité entre les motifs d'intensité
dans deux images. Le critère de similarité peut être la minimisation de la diérence
quadratique moyenne [Friston 1995], la maximisation de la corrélation croisée nor-
57
Chapitre 3. Clustering des bres neuronales et détection des outliers
58
3.3. La segmentation basée ROIs
Cette stratégie a été utilisée pour créer manuellement, des atlas de faisceaux de
la SB, à partir d'un seul sujet, comme celui de Mori et al. [Mori 2008, Lawes 2008]
ou extraire des longs faisceaux au sein de plusieurs sujets comme l'étude dans
[Maddah 2005a, Zhang 2008] et diérents faisceaux courts d'association, en utili-
59
Chapitre 3. Clustering des bres neuronales et détection des outliers
sant des données provenant d'un groupe de sujets [Oishi 2008, Zhang 2010].
Par exemple, les auteurs dans [Oishi 2008] ont fourni une parcellisation de la SB
supercielle (SWM), dénie comme la zone entre le cortex et la SB profonde. La
SWM a été extraite en utilisant des seuils appliqués à une carte probabiliste générée
de la SB. La SWM a été parcellée manuellement en neuf grandes structures appelées
pales (ou blades), qui ont été sous-parcellées encore en 23 régions en relation avec
les 24 régions corticales cérébrales et le cervelet. Les blades ont été utilisées comme
ROIs pour les sélections, lors du processus de tractographie. Quatre faisceaux courts
et un faisceau long inter-blade ont été trouvés. Voir la gure 3.2 (B-D) pour une vue
3D de la parcelle SWM et les faisceaux inter-blades identiés.
Figure 3.2 Une parcellisation SWM issue d'un étiquetage manuel basé sur les
ROIs. (A) Une vue en 3D de l'atlas ICBM-DTI-81, carte de parcelle de SB profonde
segmentée à la main (WMPM) [Mori 2008]. B-C La SWM obtenue dans [Oishi 2008].
(D) Résultats des neuf "blades" de SWM identiées manuellement pour un cerveau
individuel. (E) Les quatre faisceaux courts d'association identiés : frontal (jaune),
fronto-central (vert), centrale (rouge) et pariétale (bleu). Le faisceau d'association
longitudinal est représenté en violet (Source : [Oishi 2008]).
Les auteurs ont étendu cette méthode dans [Oishi 2009] en proposant une com-
binaison des atlas de plusieurs sujets basés sur le modèle DTI et, en utilisant des
méthodes de recalage non linéaires pour la segmentation automatisée de la SB.
Les auteurs ont créé trois types de cartes de parcellisation de la SB (WMPM)
dans l'espace "ICBM-152" (Atlas JHU-DTI-MNI) et l'espace "Talairach" (JHU-
DTI-Talairach atlas) contenant des régions anatomiques 3D prédénies. La mé-
thode non-linéaire "dual-channel Large Deformation Dieomorphic Metric Map-
ping" (LDDMM) [Huang 2008, Miller 2005] a été utilisée pour la normalisation.
Récemment, des approches automatiques pour la reconstruction des faisceaux,
basée sur les ROIs ont été proposées. Dans [Zhang 2008, Zhang 2010], les auteurs
60
3.4. Le clustering basé similarité
Avantages et inconvénients
Les méthodes de segmentation de la SB basées sur des ROIs se sont avérées
très puissantes mais elles reposent fortement sur la performance de la méthode de
recalage et nécessitent des connaissances approfondies sur la structure de la SB. En
plus, elles ne tiennent pas compte de la morphologie et de la position des streamlines
pour reconstruire un faisceau.
61
Chapitre 3. Clustering des bres neuronales et détection des outliers
62
3.4. Le clustering basé similarité
d'eectuer une analyse statistique des streamlines et des faisceaux. Ce modèle est
basé sur un mécanisme d'apprentissage qui inclut les informations de diusion et
relie chaque faisceau (ou streamline) à une région dans le volume. Il dénit un
degré d'appartenance de chaque voxel à un bundle appelé "Bundle blurred Indicator
Function (BIF)". Chaque streamline S est alors modélisée avec un BIF, Ys : p ∈
R3 → R représentant un niveau maximal qui correspond à S . Le BIF est ensuite
modélisé par un processus Gaussien (GP) déni par l'équation 3.1.
63
Chapitre 3. Clustering des bres neuronales et détection des outliers
en calculant la moyenne de tous les points d'une streamline. La distance est ensuite,
simplement dénie comme la distance euclidienne entre ces centres de masse. Bien
que cette mesure tienne implicitement compte de chaque point, elle n'est, en gé-
néral, pas assez juste pour permettre un bon clustering. En eet, deux streamlines
peuvent avoir un centre de masse très proche l'un de l'autre, mais avoir des formes
géométriques complètement diérentes. Cette mesure a été utilisée entre autres dans
[Corouge 2004].
La deuxième métrique utilise plutôt la comparaison point à point, ce qui im-
plique que les streamlines comparées doivent posséder le même nombre de points.
Une de ces mesures est la distance dénie par l'erreur quadratique moyenne (MSE
pour Mean Squared Error). Autrement dit, c'est la norme euclidienne moyenne des
diérences entre les streamlines, dénie par l'équation 3.4 :
E(k S A − S B k) (3.4)
Il faut également mentionner la distance MDF ou Minimum average Direct-Flip
[Visser 2010] qui a été reprise par [Garyfallidis 2012b], dénie par l'équation 3.5 et
illustrée par la gure 3.4.
1
df lipped (S A , S B ) = SiA − SN
B 2
P
N i=1 N (k −i k)
Figure 3.4 La distance minimum average direct-ip (MDF), une fonction de dis-
tance symétrique qui peut traiter le problème de bi-directionnalité des streamlines ;
les streamlines doivent avoir le même nombre de points.
Pour cette distance MDF, en plus d'exiger que les streamlines aient le même
nombre de points N , il faut que leurs points soient équidistants. Le premier avantage
des deux métriques précédentes, est leur rapidité d'exécution (complexité d'ordre
64
3.4. Le clustering basé similarité
O(n)), puisqu'elles ne reposent que sur une comparaison point à point directe. En
revanche, il est nécessaire d'eectuer en pré-traitement, une interpolation linéaire
(le sous-échantillonnage est privilégié pour un gain en rapidité), car les streamlines
ont rarement le même nombre de points.
Il existe aussi une catégorie de mesures où les streamlines n'ont pas besoin d'avoir
le même nombre de points. En revanche, leur temps d'exécution est plus long, et est
de l'ordre de O(NA ∗ NB ) où, NA , NB sont respectivement le nombre de points que
possèdent les streamlines SA et SB .
La distance minimale (Closest Distance) [Corouge 2004, Gerig 2004] en est une
et représente la plus petite distance séparant deux streamlines. Le principe de cette
mesure est illustrée par la gure 3.5(a) et elle est dénie par l'équation 3.6 suivante :
Cette mesure MCD permet entre autres d'éviter de pénaliser les faisceaux qui
se terminent en éventail comme c'est le cas pour le faisceau cortico-spinal. En eet,
la moyenne permet de réduire l'impact des points aux extrémités qui sont souvent
peu nombreux.
Zhang et al. [Zhang 2008] ont développé une métrique nommée la moyenne de
la distance la plus proche (Mean of Thresholded Closest Distance). Cette distance
reprend le concept de la distance minimale moyenne, mais permet d'éviter que des
points bruités puissent contribuer au résultat de la mesure. Avec cette mesure, un
faisceau comme le corticospinal (CST) sera pénalisé puisqu'une de ses extrémités se
termine en éventail, augmentant ainsi la distance entre deux streamlines contenues
dans le CST. Ceci étant dit, il se peut que ce soit une propriété désirable en fonc-
tion de l'objectif de la segmentation, par exemple pour séparer le corps calleux en
plusieurs sections.
Une troisième mesure dénit simplement la similarité entre deux streamlines
comme étant la distance entre leurs extrémités. Brun et al. [Brun 2004] utilise la
distance Euclidienne pour mesurer la similarité entre les extrémités des streamlines.
La gure 3.5(b) donne un aperçu de cette mesure. Mais, l'inconvénient est que deux
streamlines ayant des extrémités éloignées peuvent appartenir au même faisceau,
par exemple le corps calleux et le cortico-spinal.
Toutes ces métriques considèrent uniquement la position absolue des points dans
l'espace. Elles sont basées sur l'hypothèse que si des streamlines commencent au
65
Chapitre 3. Clustering des bres neuronales et détection des outliers
Figure 3.5 Illustration des diérentes mesures de distance calculées entre deux
courbes. Les segments de couleurs vertes représentent la valeur qui sera choisie par
l'algorithme de distances utilisé. Les autres couleurs représentent d'autres valeurs
(non exhaustives) calculées lors de l'application de l'algorithme.
même endroit, suivent le même chemin et terminent ensemble, alors elles doivent
appartenir au même faisceau. Or, ce n'est pas toujours le cas. Tel que mentionné,
le corps calleux est déni principalement par sa forme en "U". C'est pourquoi des
mesures dites locales existent. Il s'agit des mesures qui font appel à la position
relative des points par rapport aux points adjacents.
Ces mesures ne considèrent donc pas les caractéristiques géométriques des stream-
lines comme la courbure et la torsion. An de remédier à ces problèmes, de nouvelles
mesures de similarité de streamlines ont été proposées.
66
3.4. Le clustering basé similarité
dT CD (p, q) =k Gp − Gq k (3.9)
Pour n'importe quelle streamline S décrite par un ensemble de points P =
{p1 , p2 , ....pN } avec N ≥ 2. Le centroïde d'une streamline Gp est le centre de gravité.
Chaque ensemble de deux points pi et pi+1 successifs dénit un segment de
streamline, le centroïde et la longueur de chaque segment, notés respectivement par
gi et li . (équation 3.10, équation 3.11) :
pi + 1 − pi
gi = pi + (3.10)
2
67
Chapitre 3. Clustering des bres neuronales et détection des outliers
li =k pi+1 − pi k (3.11)
Le centre de gravité pour p points, peut être déni comme la longueur moyenne
pondérée de tous les segments centroïdes de p. Si Lp est la longueur du streamline,
alors Gp est donné par l'équation 3.12 :
N −1
1 X
Gp = gi × li (3.12)
Lp
i=1
PN −1
lp = i=1 li
~p • O
O ~q
dT OS (p, q) = arccos( ) (3.13)
~p k × k O
kO ~q k
~ p et O
O ~ q , vecteurs d'orientation, utilisent l'orientation du point nal de chaque
streamline :
~ p = p N − P1 ,
O
~ q = qM − q1 .
O
1
dDC − O(p, q) = (dT CD (p, q) + dT OS (p, q) + dT CD (p0 , q 0 ) + dT SS (p0 , q 0 )) (3.14)
4
Il est aussi utile de refaire ce calcul sur la streamline inversée q = qM , qM −1 , ..., q2 , q1 ,
ce qui donne dDC − R(p, q). La distance combinée entre les streamlines SA et SB est
alors le minimum entre dDC − O(p, q) et dDC − R(p, q) donné par l'équation 3.15 :
68
3.4. Le clustering basé similarité
Le clustering hiérarchique
Le clustering hiérarchique proposé dans [Corouge 2004, Ding 2003, Zhang 1998,
Zhang 2008, Guevara 2011b] est la première classe proposée des méthodes.
Par exemple, les auteurs dans [Corouge 2004] ont développé un algorithme ité-
ratif, pour regrouper les courbes de streamlines en faisceaux basés sur des mesures
de similarité, considérant la forme et la position des streamlines décrites dans la
section 3.4.1. La méthode proposée utilise un seuil de distance t, et un algorithme
de propagation de sorte que, pour chaque streamline Si dans une classe C , au moins
une streamline Sj , dans C est telle que d(Si , Sj ) < t.
Dans [Zhang 2008], les auteurs ont proposé une version améliorée de leurs tra-
vaux précédents [Zhang 2003, Zhang 1998] (gure 3.6). Initialement, les streamlines
courtes se trouvant dans le voisinage des streamlines longues sont éliminées. Les
streamlines issues de cette étape sont ensuite partitionnées en utilisant un regroupe-
ment hiérarchique (HC) à liaison unique, basé sur une distance qui détecte n'importe
quelle diérence entre les streamlines. Le nombre de clusters est déni préalablement
en utilisant un seuil approximatif, qui varie entre 0.1 et 10 mm. La limite de ce tra-
vail est l'hypothèse stipulant qu'il existe un seuil qui peut séparer un ensemble de
trajectoires signicatives anatomiquement, en clusters discrets.
69
Chapitre 3. Clustering des bres neuronales et détection des outliers
voxels puis, sur les extrémités pour former des sous-faisceaux. La distance d'Haus-
dor est alors utilisée an de fusionner les diérents sous-faisceaux.
Le clustering spectral
Brun et al. [Brun 2004] ont présenté le concept du pseudo-coloriage des stream-
lines pour améliorer la visualisation dans les bases de données de tractographie.
L'intégration spectrale a été utilisée pour cartographier chaque point de données
à un espace euclidien de faible dimension, en utilisant une distance qui considère
uniquement les points naux de chaque paire de streamlines.
O'Donnell et al. [O'Donnell 2005, O'Donnell 2006] ont ensuite utilisé le clustering
spectral pour regrouper les streamlines en faisceaux et trouver la correspondance
entre les sujets . Pour déterminer l'espace d'incorporation, les auteurs ont utilisé
une coupe normalisée avec la méthode de "Nistrom" [Fowlkes 2004]. Puis, au lieu
de calculer la matrice de similarité entière, un échantillon aléatoire de streamlines
(1500 streamlines) a été utilisé pour déterminer les vecteurs propres. La matrice de
similarité a été calculée à partir de la version symétrique de la distance moyenne la
plus proche [Corouge 2004] entre streamlines, décrite au paragraphe 3.4.1.
70
3.4. Le clustering basé similarité
71
Chapitre 3. Clustering des bres neuronales et détection des outliers
72
3.4. Le clustering basé similarité
être utilisés comme a priori pour regrouper (ou classier) des streamlines issues de
nouveaux sujets, avec la possibilité de créer de nouveaux clusters pour des structures
non observées dans les données d'apprentissage.
Cette méthode est basée sur des mesures de similarité entre les voxels, au lieu de
calculer les distances par paires entre les streamlines, ce qui permet d'analyser des
grands ensembles de données de tractographie, le plus grand ensemble de données
utilisé étant de 120 000 streamlines.
Cette méthode a été comparée à la méthode proposée dans [O'Donnell 2007].
Les résultats obtenus par Wang et al. dans [Wang 2011] montrent une meilleure
complétude et une meilleure exactitude pour le nombre de clusters déterminées
automatiquement par l'approche HDPM. Le concept de cette approche de clustering
est illustré à la gure 3.7.
Cette approche est très intéressante, mais certaines limitations peuvent exister
dues à l'utilisation uniquement d'une stratégie basée sur le voxel, qui peut dimi-
nuer la qualité des résultats lorsque les faisceaux se chevauchent, i.e. partageant un
nombre important de voxels.
Figure 3.7 Une méthode de clustering de la tractographie basée sur les voxels
utilisant le modèle de mélange de processus de Dirichlet hiérarchique. A : Étiquet-
tage anatomique de certains faisceaux générés par cette méthode. B : Exemple de
clustering multiscale. C : Erreurs de tractographie qui engendrent de courtes stream-
lines dans (C1) et des streamlines traversant deux faisceaux dans (C2) (Source :
[Wang 2011]).
73
Chapitre 3. Clustering des bres neuronales et détection des outliers
Cette méthode est basée sur l'algorithme des ensembles dominants (Dominants
Sets (DS)) qui est une méthode de théorie des graphes opérant sur deux niveaux :
le clustering intra- et, inter sujets.
Clustering intra-sujet Le clustering a d'abord été appliqué à la base de don-
nées de tractographie d'un seul sujet pour extraire un ensemble de faisceaux
homogènes. Ceci permet de réduire la dimensionalité des données et donc la
complexité informatique. Le cerveau a été divisé en trois ensembles de don-
nées plus petits : hémisphère gauche, hémisphère droit et streamlines inter-
hémisphériques, ce qui donne environ 15000 streamlines par sous-ensemble
de données ;
Clustering inter-sujets Dans l'approche proposée, les faisceaux récupérés pour
tous les sujets séparément sont regroupés dans une deuxième étape selon le
cadre des ensembles dominants (DS). À cette n, les clusters déterminés lors
de la première étape sont remplacés par leurs streamlines représentatives,
puis toutes les bases de données de tractographie sont regroupés en une seule
base de données, en éliminant les doublons issus des diérentes bases. De
cette façon, des clusters cohérents de faisceaux, n'incluant qu'un seul fais-
ceau représentatif de chaque base de données de tractographie, sont générés.
Le principe de cette méthode est illustré à la gure 3.8
74
3.5. Le clustering hybride
Figure 3.9 Les résultats du clustering basé sur les voxels à travers les sujets
décrits dans [Kouby 2005] obtenus pour deux sujets. Pour chaque sujet, deux vues
sont présentées. Chaque faisceau est désigné par une couleur diérente. (Source :
[Kouby 2005]).
Les auteurs dans [Li 2010] propose une approche hybride automatique pour le
clustering et l'étiquetage des streamlines de la SB, qui utilise à la fois la parcellisation
du cerveau et la mesure de similarité entre les streamlines.
La première étape est d'abord appliquée à l'ensemble de la tractographie. Il s'agit
d'un clustering guidé par l'anatomie, visant à regrouper des streamlines en se basant
sur les régions du cerveau qu'elles traversent ou touchent. L'atlas MNI a été utilisé
pour subdiviser les images DTI des sujets et étiqueter les structures de la substance
75
Chapitre 3. Clustering des bres neuronales et détection des outliers
blanche /grise. Cette étape basée sur le ROI extrait 9 faisceaux majeurs à partir
des données de tractographie, suivant un ordre spécié pour l'extraction de chaque
faisceau. Premièrement, les streamlines du corps calleux reliant les lobes frontaux,
pariétaux et occipitaux sont extraites, suivies par les streamlines de projection pé-
nétrant les mêmes lobes. Enn, le cingulum, la partie inférieure fronto-occipitale et
le faisceau inférieur longitudinale sont obtenus consécutivement.
La deuxième étape, utilisant un clustering basé sur la similarité, vise à séparer et
identier deux autres faisceaux (faisceau supérieur longitudinal et l'uncinate). Tout
d'abord, une méthode non linéaire d'analyse par composantes principales (PCA) est
utilisée pour projeter les streamlines dans un espace de PCA. Ensuite, un algorithme
de clusteringfuzzy c-mean est appliqué pour regrouper automatiquement les stream-
lines dans l'espace des caractéristiques. La distance de Hausdor [Corouge 2004] est
utilisée comme métrique de mesure de similarité entre streamlines, avec l'addition
de la longueur d'une streamline comme facteur. Une fois les clusters obtenus, un
algorithme de reconnaissance est appliqué, basé sur une méthode manuelle d'ex-
traction de faisceaux [Wakana 2007], pour la construction d'un histogramme des
points naux des streamlines.
76
3.5. Le clustering hybride
dénit un ensemble de régions de matière grise et blanche que le faisceau doit traver-
ser. Cette méthode réussit à bien extraire les faisceaux anatomiques les plus connus.
Finalement, les auteurs créent des cartes de probabilité moyenne de population pour
chaque faisceau identié (voir gure 3.10).
G. Prasad et al. dans [Prasad 2014] ont également utilisé l'étiquetage basé sur
l'atlas et les chemins de densité maximale pour construire les modèles de faisceaux.
Ils ont introduit un cadre pour l'analyse de la population des streamlines de
la SB basés sur des images pondérées en diusion du cerveau. La méthode permet
l'extraction de streamlines à partir d'images HARDI, le clustering des streamlines
basé en partie sur les connaissances a priori d'un atlas, le clustering des faisceaux de
streamlines de manière compacte en utilisant un chemin suivant les points de densité
les plus élevées (chemin de densité maximum - MDP) et, l'enregistrement de ces
chemins en utilisant la courbe géodésique correspondant à trouver des associations
locales à travers une population (gure 3.11).
77
Chapitre 3. Clustering des bres neuronales et détection des outliers
78
3.6. Les approches de détection des outliers
patient et au bruit lors de l'acquisition des données, ainsi qu'aux erreurs générées
par le processus de traitement (la reconstruction et la tractographie). Un mécanisme
de détection et d'élimination d'outliers est donc nécessaire dans le clustering des
streamlines de la SB, an d'éliminer les faux streamlines qui altèrent le résultat.
Actuellement, la détection et l'élimination des outliers suscite de l'intérêt et
quelques approches récentes de clustering des streamlines de la SB intègrent des mé-
canismes de détection des outliers [Ros 2013, Prasad 2014, côté 2015, Guevara 2011b]
an de garantir la robustesse des méthodes de clustering face au bruit et accroître
ainsi la précision du résultat.
Cependant, elles sourent d'un ou de plusieurs des inconvénients suivants : elles
supposent explicitement ou implicitement que les données suivent un modèle de dis-
tribution donné. Les résultats de nombreuses méthodes dépendent fortement d'une
paramétrisation appropriée (seuil d'outliers) et / ou leurs résultats sont diciles à
interpréter. En outre, la plupart des approches sont restreintes à une structure de
données et ne prennent pas en charge des données hiérarchiques complexes.
Les approches existantes en matière de détection des outliers dans le clustering
de la SB, peuvent être classées en trois catégories : la détection des outliers basée
sur la distribution, la distance et, la densité.
79
Chapitre 3. Clustering des bres neuronales et détection des outliers
3.7 Conclusion
Dans ce chapitre, nous avons présenté une analyse des approches les plus perti-
nentes du clustering des streamlines de la SB. Ces approches nécessitent l'utilisation
des algorithmes de clustering et des mesures de similarité entre les streamlines an
de regrouper ces derniers en faisceaux anatomiquement signicatifs. Pour l'identi-
cation des faisceaux anatomiques connus de la SB, l'addition d'informations ana-
tomiques peut également être nécessaire, étant la plupart du temps sous la forme
d'un atlas de la SB.
Le clustering et l'identication des faisceaux de la SB est une tâche compliquée
pour plusieurs raisons. Tout d'abord, ces faisceaux présentent des formes et des
tailles diérentes, de plus plusieurs faisceaux se chevauchent sur une partie non
négligeable de leur trajectoire. Et, même si la localisation relative des trajectoires
reste la même pour tous les sujets, la variabilité inter-sujets est très importante.
La forme et la taille de la SB varient selon les sujets, nécessitant l'utilisation de
méthodes sophistiquées pour l'alignement et l'identication des faisceaux. De plus,
le résultat du clustering dépend fortement de la qualité des images de diusion et
la capacité de la méthode à éliminer les outliers, causés par la qualité des images, le
mouvement du patient et les erreurs de tractographie.
Tous ces aspects imposent une méthode de clustering très robuste, ce qui est
rarement satisfait. De plus, les nouvelles images de diusion HARDI permettent
une meilleure précision mais génèrent de grandes bases de données de tractographie,
qui ne peuvent pas être analysées avec les méthodes classiques de clustering.
80
3.7. Conclusion
Par conséquent, nous avons concentré notre travail sur le développement de nou-
veaux algorithmes de clustering des streamlines, capable d'analyser de très grandes
bases de données de tractographie pour l'identication des faisceaux de la SB. Le
chapitre suivant décrira les stratégies que nous avons adoptées pour d'abord le clus-
tering intra-sujet.
81
Chapitre 4
Research is to see what everybody else has seen, and to think what
nobody else has thought. Albert Szent-Györgyi.
Sommaire
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.2 Travaux antérieurs et motivations . . . . . . . . . . . . . . . 84
4.3 Evaluation des méthodes de tractographie . . . . . . . . . . 87
4.3.1 Méthodologies de tractographie . . . . . . . . . . . . . . . . . 87
4.3.2 Expérimentations, résultats et discussion . . . . . . . . . . . 90
4.4 Clustering intra-sujet des bres neuronales . . . . . . . . . . 95
4.4.1 Une méthode de segmentation hybride . . . . . . . . . . . . . 95
4.4.2 Expérimentations, résultats et discussions . . . . . . . . . . . 98
4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
Chapitre 4. Clustering intra-sujet des bres neuronales
4.1 Introduction
La tractographie par IRM de diusion gagne de plus en plus d'importance car
elle est l'unique modalité d'imagerie en mesure de caractériser in vivo, l'architecture
et l'intégrité des streamlines de la SB. Toutefois, la disponibilité croissante de mo-
dèles de diusion et d'algorithmes de tractographie rend le choix d'une méthode de
reconstruction de bres dicile. Plus important encore, les performances de chaque
méthode peuvent varier, et il est dicile de garantir que les streamlines reconstituées
soient eectivement représentatives de la véritable organisation des streamlines, ou
représentatives d'artefacts simplement.
L'objectif de ce chapitre, en premier lieu, est l'étude de la précision des algo-
rithmes de tractographie basés sur les modèles DTI et HARDI. Nous avons implé-
menté plusieurs algorithmes déterministes et proposé une nouvelle approche adap-
tative, an de comparer leurs résultats. L'étude de la abilité a été eectuée sur des
données synthétiques de diusion, avec diérentes congurations de streamlines.
Cette étude nous a permis de choisir la meilleure méthode de tractographie
déterministe pour générer nos bases de données de tractographie. Ces dernières
vont être utilisées en entrée de toutes les approches de clustering proposées dans
cette thèse. Ensuite, nous avons proposé une méthode hybride de segmentation de
ces bases de données de tractographie, an de générer les principaux faisceaux de
bres qui constituent la connectivité de la SB cérébrale au sein d'un seul sujet.
84
4.2. Travaux antérieurs et motivations
gerie q-Ball (QBI). Ces modèles permettent par exemple une meilleure détection des
croisements entres réseaux de bres, et résolvent la principale diculté rencontrée
avec le modèle DTI classique, mais au prix d'une augmentation non négligeable du
temps de l'examen clinique.
Ces modèles locaux de diusion permettent d'extraire les directions les plus
probables de diusion des molécules d'eau. À l'aide de ces informations de direc-
tion, il sera alors possible de reconstruire le réseau des faisceaux de bres de la
SB avec un procédé nommé tractographie. La tractographie est une classe d'algo-
rithmes dont l'objectif est d'estimer la structure de la SB en suivant les orientations
cohérentes, obtenues de l'IRM pondérée en diusion, parmi les voxels voisins. Les
algorithmes de tractographie ont pour dé d'utiliser au mieux l'information présente
dans chaque voxel et de produire un résultat respectant les hypothèses de structure
et de connectivité du réseau d'axones du cerveau [Hagmann 2003, Tournier 2007].
La tractographie produit des courbes 3D, appelées tractes ou streamlines.
Les méthodes de tractographie sont généralement divisées en deux sous-catégories,
les approches déterministes et celles probabilistes. Une revue de ces méthodes peut
être trouvée au chapitre 1. Les performances de chaque algorithme peuvent varier,
d'où l'importance du choix de l'algorithme.
Les algorithmes déterministes orent des méthodes simples et rapides. Toutefois,
ils restent sensibles au bruit, notamment dans les régions de croisement des stream-
lines, même si les algorithmes basés sur les techniques de reconstruction HARDI
montrent que le suivi de streamlines est amélioré. La tractographie probabiliste gé-
nère plus de streamlines erronées, mais aussi des estimations de faisceaux plus riches
et complètes [côté 2013].
Pour notre part, nous nous intéressons aux méthodes déterministes basées sur
des critères locaux an de déterminer la trajectoire des faisceaux. La plupart de ces
algorithmes utilisent le vecteur propre principal comme information de base pour
le calcul des trajectoires, certains algorithmes tel que TEND [Lazar 2003] utilisent
l'information du tenseur tout entier ce qui répond modérément à certaines limites
des méthodes déterministes basées sur le modèle DTI que l'on verra dans ce cha-
pitre. Bien que les algorithmes déterministes puissent sembler sourir de nombreuses
limites liées au bruit [Basser 2000] et aux eets du volume partiel [Alexander 2001],
plusieurs études [Aymeric 2011, Clarisse 2008, Burak 2007, Mori 1999] ont montré
que ces algorithmes représentent la quasi-totalité des méthodes actuellement mises
à la disposition des cliniciens pour l'étude des maladies neurodégénératives et la
planication neurochirurgicale. Pour cela, la méthode Eudx [Garyfallidis 2012b],
l'algorithme d'Euler, une autre approche qui combine deux méthodes déterministes
(Streamline et TEND) [Lazar 2003] ont été mises en application, en nous basant
une fois sur le modèle DTI et une seconde fois sur le modèle HARDI.
An d'évaluer la reproductibilité puis, comparer et analyser ces méthodes de
tractographies, des données synthétiques modélisant le croisement de deux fais-
ceaux de bres ont été générées ; les streamlines générés par les algorithmes sont
ensuite comparés avec les trajets, idéaux, connus, des données synthétiques. En-
n, les avantages et les inconvénients de chaque algorithme sont présentés et les
85
Chapitre 4. Clustering intra-sujet des bres neuronales
86
4.3. Evaluation des méthodes de tractographie
87
Chapitre 4. Clustering intra-sujet des bres neuronales
Ces points-germes sont propagés vers une seule direction donnée par l'équation
4.3 :
Ils sont également propagés dans le sens inverse de cette direction −V (pn ). La
condition d'arrêt de suivi d'EuDX est établie. Elle prend comme entrée, un seuil pour
l'anisotropie Athr . Si A(pn ) < Athr , EuDX cesse de se propager. Sinon, il ajoute le
point à la streamline en cours. Cela peut être utile pour annuler les points-germes
qui se trouvent dans le fond ou dans des zones qui correspondent à l'absence de bre
où le suivi n'est pas recommandé.
Une interpolation trilinéaire est alors utilisée pour trouver la direction de propa-
gation suivante an de générer une tractographie lisse, selon les étapes suivantes :
Nous trouvons la direction la plus proche du point-germe de la direction
initiale V (pn ), pour chaque direction de crête ui , de chacun coin des 8 coins
du voisinage du point-germe.
Si arccos(xi , pn ) ≤ θthr , on compte le poids correspondant ; autrement conti-
nuer jusqu'au poids suivant et vérier simultanément la condition A(u) <
Athr .
Tous les poids adjacents contribueront à la nouvelle direction selon l'équation
4.4 suivante :
´ n) = (4.4)
X
V (p wm V (pm )
m
´
où V (pm ) = kVV (p´m )k est normalisé.
(pm )
Le point suivant est calculé avec l'équation 4.1. Le nouveau point de la streamline
est inséré et le suivi est perpétué jusqu'à ce que l'un des critères d'arrêt soit respecté.
Toutes ces étapes sont répétées dans la direction opposée de la direction de
propagation initiale V (p0 ).
Enn, la procédure est répétée pour le prochain point-germe, jusqu'à ce que tous
les points-germes soient visités. Lorsque toutes les points-germes auront été visitées,
nous obtiendrons la totalité de la base de données de tractographie.
88
4.3. Evaluation des méthodes de tractographie
La méthode d'interpolation par Euler Cette méthode est basée sur le dé-
veloppement de Taylor de premier ordre exploitée dans les travaux de [Mori 1999,
Alexander 2001]. Elle utilise l'équation 4.5 suivante :
´0 )(s1 − s0 ) + O(s1 + s0 )
r(s1 ) = r(s0 ) + r(s (4.5)
Avec r(s´0 ) tangente à la trajectoire r(s0 ) suivant le vecteur V1 , sachant que :
r(s0 ) = V1 (r(s0 )) et α = s1 − s0 qui est le pas de l'algorithme prenant ses valeurs
´
entre 0 et L (L étant la taille du voxel). On obtient donc l'équation 4.6 :
La méthode TEND Lazar et al. proposent dans [Lazar 2003] un modèle de suivi
de streamlines fondé sur une déexion des trajectoires, induite par tenseurs. Il s'agit
de la méthode TEND (TENsor Déexion). Lors de la propagation, la nouvelle di-
rection prend en compte le tenseur de diusion local D et la direction incidente Vin ,
tangente à la streamline. Ainsi, en notant Vout , la nouvelle direction dite sortante
par rapport au point courant, elle est donnée par l'équation 4.7 :
~out = D × V
V ~in (4.7)
La gure 4.1 illustre le comportement de l'algorithme pour diérentes formes du
tenseur local.
89
Chapitre 4. Clustering intra-sujet des bres neuronales
λ1 − λ2
Cl = (4.9)
λ1 + λ2 + λ3
g = W Paramètre de contrôle.
Nous avons fait varier le paramètre de contrôle W , qui prend les valeurs comprises
entre 0 et 1, an d'obtenir de meilleures précisions pour notre tractographie. Nous
remplacons la valeur Cl, dans l'équation 4.9 et nous obtenons l'équation 4.10 :
~out = ClV
V ~1 + (1 − Cl)((1 − w)V
~in + wD × V
~in ) (4.10)
La direction de propagation est une combinaison de trois vecteurs. Le vecteur
propre principal V~1 , le vecteur entrant V~in et le vecteur sortant V~out et cela an
de stabiliser la propagation tout en s'adaptant aux caractéristiques de la diusion
de la région. Pour l'implémentation de cet algorithme, nous avons utilisé la méthode
d'intégration d'Euler.
90
4.3. Evaluation des méthodes de tractographie
les streamlines à chaque voxel (gure 4.2(c)), un seul faisceau de streamlines incurvé
(gure 4.2(a)).
Nous avons créé deux types de données, le premier type en utilisant le tenseur de
diusion, calculé avec la méthode des moindres carrés pour chaque voxel, diagonalisé
pour obtenir les valeurs propres et les vecteurs propres. La carte de la fraction
d'anisotropie a été dérivée de ces données.
Le deuxième type de données est générée en utilisant un modèle de reconstruc-
tion HARDI appelé Constant Solid Deconvolution (CSD) [Aganj 2010] basé sur la
déconvolution sphérique (SD), qui fournit une estimation de la distribution d'orien-
tation des bres (FOD). La fonction de réponse a été estimée en utilisant des voxels
avec une valeur d'anisotropie fractionnaire (FA) supérieure à 0,7 et une harmonique
d'ordre maximale de 8.
91
Chapitre 4. Clustering intra-sujet des bres neuronales
(b) Euler sur DTI (c) Euler sur HARDI (d) Notre méthode sur
DTI
(e) Notre méthode sur (f) EuDX sur DTI (g) EuDX sur HARDI
HARDI
92
4.3. Evaluation des méthodes de tractographie
(b) Euler sur DTI (c) Euler sur HARDI (d) Notre méthode sur
DTI
(e) Notre méthode sur (f) EuDX sur DTI (g) EuDX sur HARDI
HARDI
4.3.2.3 Discussion
Ce travail met en lumière la limite principale du modèle tensoriel classique qui se
situe au niveau des croisements des streamlines. Nous avons obtenu avec toutes les
méthodes de tractographie basées sur le modèle DTI, des résultats non satisfaisants
dans les régions de croisement de streamlines, pour la raison évidente que dans les
régions où nous avons une diusion planaire, le vecteur principal n'est pas en mesure
93
Chapitre 4. Clustering intra-sujet des bres neuronales
(b) Euler sur DTI (c) Euler sur HARDI (d) Notre méthode sur
DTI
(e) Notre méthode sur (f) EuDX sur DTI (g) EuDX sur HARDI
HARDI
Figure 4.5 Deux faisceaux de streamlines qui se croisent avec diérentes angles.
94
4.4. Clustering intra-sujet des bres neuronales
95
Chapitre 4. Clustering intra-sujet des bres neuronales
96
4.4. Clustering intra-sujet des bres neuronales
97
Chapitre 4. Clustering intra-sujet des bres neuronales
d'atlas, conduisant à des seuils plus élevés pour les faisceaux longs et isolés.
98
4.4. Clustering intra-sujet des bres neuronales
Figure 4.7 Les résultats du clustering des streamlines. (a, b, c) illustrent l'atlas représentatif
des faisceaux construits. (d, e, f, g, h, i) illustrent les résultats obtenus avec notre méthode de
segmentation automatique, pour les deux sujets. (a, d, g) vues axiales du haut, (b, e, h) vues
sagittales gauches et (c, f, i) vues axiales du bas, des principaux faisceaux, distingués en couleur.
les faisceaux, supérieure à 0.70, ce qui conrme le grand accord entre les faisceaux
trouvés avec notre méthode et nos faisceaux de référence, démontrant ainsi la capa-
cité de la méthode proposée à extraire correctement des faisceaux cohérents.
La gure 4.9(a) montre les mesures de Kappa pour les faisceaux de deux en-
sembles de données. Les valeurs de Kappa sont ainsi assez élevées pour tous les
faisceaux. Le cortico-spinal droit obtient le plus petit indice d'accord (Kappa =
0,69), le corps calleux correspond au meilleur accord (Kappa = 0,95).
99
Chapitre 4. Clustering intra-sujet des bres neuronales
les voxels des cartes FA, parcourus par ces faisceaux spéciques. La corrélation
moyenne de FA de tous les 13 faisceaux obtenus est assez élevée (R = 0.94 ± 0.03),
ce qui indique que notre méthode de segmentation-classication génère des faisceaux
exacts et précis.
4.5 Conclusion
Dans ce chapitre, nous avons présenté d'une part, une étude comparative des
diérents algorithmes de tractographie déterministes d'abord, en nous basant sur
une reconstruction DTI puis, en utilisant une reconstruction HARDI et ce, sur des
données synthétiques. Cette étude nous a permis de choisir les meilleures méthodes
du pré-traitement pour générer une base de données de tractographie d'une bonne
qualité.
D'autre part, nous avons développé une approche hybride automatique puissante
de segmentation-classication intra-sujet des streamlines de la SB cérébrale. Cette
approche utilise d'un côté, l'algorithme "QB" qui permet de faire face à la grande
taille et à la complexité de l'ensemble de données et de l'autre côté, des connaissances
anatomiques fournies par un atlas, construit dans cette étude, an d'augmenter
l'ecacité et la précision des résultats de notre méthode.
Cependant, le clustering des données de la SB issues d'un seul sujet est in-
susant pour établir un modèle de faisceaux à travers une population, parce que
l'architecture de la SB est variable d'un sujet à l'autre et très complexe.
Dans les chapitres suivants, nous proposons une solution à ce problème de deux
manières diérentes, la première à travers un clustering statique et la deuxième avec
une méthode de clustering dynamique.
100
4.5. Conclusion
(a) La comparaison des valeurs kappa obtenues avec les faisceaux des deux sujets.
(b) La corrélation des valeurs FA des 13 faisceaux entre les deux sujets et l'atlas.
101
Chapitre 5
Sommaire
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
5.2 Travaux antérieurs et motivations . . . . . . . . . . . . . . . 104
5.3 Une méthode séquentielle basée sur la densité . . . . . . . . 105
5.3.1 Le clustering basé sur la densité . . . . . . . . . . . . . . . . 106
5.3.2 L'estimation et l'injection des représentants . . . . . . . . . . 109
5.4 Expérimentations, résulats et discussion . . . . . . . . . . . . 110
5.4.1 Expérimentation et résultats sur les données synthétiques . . 110
5.4.2 Expérimentation et résultats sur les données réelles . . . . . . 112
5.5 Avantages et limites de la méthode séquentielle basée sur
la densité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
5.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
Chapitre 5. Clustering inter-sujets statique des bres neuronales
5.1 Introduction
Nous avons présenté dans le chapitre précédent une méthode hybride de cluste-
ring intra-sujet robuste, capable d'analyser des jeux de données très grands, conte-
nant plus d'un million de streamlines par sujet. Elle permet d'obtenir pour chaque
sujet un ensemble de faisceaux principaux. Cependant, ces faisceaux sont diérents
d'un sujet à l'autre et ne considèrent pas la variation de la SB à travers une popu-
lation de sujets.
Pour surmonter ce problème, dans ce chapitre nous présentons une méthode
séquentielle de clustering inter-sujets basée sur la densité, qui permet une inférence
d'un modèle composé d'une liste de faisceaux génériques présents dans la plupart
des sujets.
Nous commençons par détailler le principe de cette méthode, les résultats obte-
nus sur des données réelles et synthétiques ainsi que leurs validations.
Nous nalisons par une conclusion, en discutant les avantages et les limites de
cette méthode.
104
5.3. Une méthode séquentielle basée sur la densité
105
Chapitre 5. Clustering inter-sujets statique des bres neuronales
106
5.3. Une méthode séquentielle basée sur la densité
La condition de maximum, i.e. tous les points qui se trouvent dans le voisinage
(ε − M inP oints) d'un point de la classe, doivent appartenir à cette classe.
Le bruit est déni comme un ensemble des points qui n'appartiennent à aucune
classe. Il y a deux points diérents qui sont pris en compte dans la classication :
Un point noyau : C'est le point qui a un voisinage (ε − M inP oints).
Un point non noyau : C'est celui qui n'a pas un tel voisinage.
Un point non noyau peut être un point de frontière ou bruit. L'algorithme commence
en prenant en compte un point arbitraire et cherche tous les points dense-accessibles .
S'il s'agit d'un point noyau, alors cette phase forme une classe. S'il s'agit d'un point
frontière et qu'il n'y a aucun point qui estdense-accessible depuis lui, alors c'est un
bruit, l'algorithme passe à un autre point.
107
Chapitre 5. Clustering inter-sujets statique des bres neuronales
conséquence, un appel récursif de DBSCAN peut se révéler nécessaire pour les clus-
ters détectés avec la plus haute valeur de M inP oints. Cela n'est pas forcément un
désavantage car l'application récursive de DBSCAN reste un algorithme basique, et
n'est nécessaire que sous certaines conditions.
Ainsi, pour chaque objet que l'on ajoute, on a une zone de croissance qui va
permettre d'étendre le cluster. Evidemment plus cette zone (sphérique) est grande
et plus le cluster aura de chances de s'étendre. La notion de voisinage est la clé de
cette méthode. On forme donc le cluster de proche en proche. La diculté que nous
pouvons rencontrer vient de la taille de la zone (rayon de la sphère) d'extension.
Le pseudo code 2 résume le principe de l'algorithme DBSCAN.
108
5.3. Une méthode séquentielle basée sur la densité
seuil est intéressante. DBSCAN a besoin des paramètres ε et M inP oints. Les expé-
riences ont montré que les graphes de distance k (k > 4) ne dièrent pas vraiment
des graphes de distance 4 mais nécessite des calculs bien plus important. Ainsi, nous
éliminons le paramètre M inP oints en le xant à 4 pour toutes les bases de données.
Il s'agit ensuite d'utiliser une approche interactive pour déterminer le paramètre ε
de DBSCAN :
Le système calcule et ache le graphe de distance 4 pour la base de données.
Si l'utilisateur peut estimer le pourcentage de bruit, ce pourcentage est entré
et le système en déduit une proposition pour le seuil de point.
L'utilisateur peut accepter ou non le seuil proposé ou sélectionner un autre
seuil qui est alors utilisé dans DBSCAN.
109
Chapitre 5. Clustering inter-sujets statique des bres neuronales
5.4.1.2 Expérimentations
Nous avons implémenté deux algorithmes de clustering de la SB : la méthode
hiérarchique QuickBundle (HQB) [Garyfallidis 2015] qui est une version améliorée
de l'algorithme QB [Garyfallidis 2012b] permettant l'élimination des outliers. Elle a
été appliquée en utilisant la distance MDF avec un seuil de 8 mm. La distance MDF
exige que les streamlines aient le même nombre de points, l'algorithme eectue un
échantillonnage automatique des streamlines pour n'avoir que 20 points et la mé-
thode V-Bundles [Reichenbach 1996] qui utilise une adaptation du champs vectoriel
de l'algorithme k-means pour le clustering des streamlines de la SB. Nous avons
choisi les mêmes paramètres adoptés dans [Reichenbach 1996] , le nombre maximal
d'itérations de k-means [Hartigan 1979] égal à 3, λ = 0, 001, γ = 0, 6, rv = 15mm
et rz = 9mm. Pour notre méthode basée-densité, nous avons déni les paramètres
110
5.4. Expérimentations, résulats et discussion
5.4.1.3 Résultats
Les résultats obtenus avec les trois méthodes (notre méthode basée densité, HQB,
V-Bundles) sont présentés à la gure 5.3.
Notre méthode a été capable de séparer les streamlines en 21 clusters signicatifs,
20 clusters représentant les faisceaux principaux et un cluster avec le label (-1),
regroupant les deux clusters d'outliers introduits (Figure 5.3 (b)). La méthode HQB
a réussi l'élimination des outliers, mais elle a confondu deux faisceaux principaux
dans un même et seul faisceau, le faisceau vert jaune et orange dans la gure 5.3 (c).
On obtient un total de 20 clusters : un cluster d'outliers et 19 clusters principaux.
La méthode V-bundles a été perturbée par les outliers, elle a extrait les 20
faisceaux principaux mais confondus avec les outliers (Figure 5.3 (d)).
Nous avons eectué une comparaison statistique robuste, en utilisant les indices
de Rand ajusté Adjusted Rand Index
, l'indice d'exhaustivité completeness
et l'indice
d'homogénéité homogeneity[Moberts 2005] pour évaluer l'exactitude et la perfor-
mance des trois méthodes.
L'indice de Rand ajusté est déni comme le nombre total de paires de faisceaux
en accord divisé par le nombre total de paires. Si les deux partitions concordent com-
plètement, l'indice Rand renvoie une valeur de 1, sinon la limite inférieure de cet
indice est 0. Une grande valeur de l'indice "completeness" signie que les streamlines
appartenant au même faisceau anatomique sont regroupées ensemble et l'indice d'ho-
mogénéité calcule le degré qu'un cluster contient uniquement les streamlines d'une
seule classe. Si l'indice Rand est égal à 1, il ya donc un accord parfait entre les deux
faisceaux. Une valeur de 0.7 est considérée comme susante pour dire que les deux
faisceaux sont assez en accord.
La table 5.1 et la gure 5.4 illustrent les résultats de cette analyse quantitative.
La table 5.1 présente les moyennes de chaque indice, calculées sur tous les faisceaux
obtenus avec chaque méthode et la gure 5.4 illustre les valeurs des indices de chaque
faisceau, obtenues avec les trois méthodes.
En comparaison avec les autres méthodes, notre méthode a montré des valeurs
supérieures d'exhaustivité, d'indice de Rand ajusté et d'homogénéité. Les résul-
tats de la méthode HQB ont démontré également un degré d'exhaustivité élevé,
mais une homogénéité plus faible, indiquant que les clusters sont complets, mais
ne contiennent pas uniquement les streamlines du même faisceau. La méthode V-
bundles a donné de mauvais résultats à la fois en ce qui concerne l'homogénéité
et l'exhaustivité par rapport aux autres approches, ce qui signie que les clusters
résultants ne sont généralement pas bien séparés.
111
Chapitre 5. Clustering inter-sujets statique des bres neuronales
Table 5.1 Comparaison quantitative des trois méthodes (Notre-méthode, HQB, V-bundles)
Méthode
XXX
Notre-Méthode HQB V-Bundles
XXX
Indice
XXX
XX
Adjusted Rand Index
X
0.897 0.838 0.791
Completeness 0.927 0.920 0.886
Homogeneity 0.927 0.899 0.816
112
5.4. Expérimentations, résulats et discussion
(a)
(b)
(c)
Figure 5.4 Evaluations quantitatives des faisceaux, obtenues avec les trois mé-
thodes (Notre-méthode, HQB, V-bundles). (a) Les indices de Rand ajusté. (b) L'in-
dice d'exhaustivité et (c) L'indice d'homogénéité.
113
Chapitre 5. Clustering inter-sujets statique des bres neuronales
5.4.2.2 Expérimentations
Nous avons comparé notre méthode en terme d'ecacité et de précision des
résultats avec une autre technique récente de la littérature, appelée MSQB (Multi-
subjects Clustering with QuickBundles), proposée dans [Garyfallidis 2015], qui est
basée sur l'algorithme QB. Nous avons implémenté cette méthode en suivant les
mêmes étapes que dans [Garyfallidis 2015]. Nous avons regroupé les streamlines en
faisceaux, en utilisant l'algorithme QB avec un seuil de distance de 20 mm et les
streamlines sont automatiquement échantillonnées, pour avoir 20 points équidis-
tants. Chaque cluster est représenté par une streamline virtuelle appelée streamline
centroïde. Ce processus est répété pour chaque sujet. Finalement, nous avons re-
groupé les streamlines centroïdes de chaque sujet pour obtenir des faisceaux repré-
sentant la variation de la SB à travers une population de sujets.
5.4.2.3 Résultats
Notre méthode a ainsi réussi à bien extraire 16 faisceaux neuro-anatomiques
majeurs à partir de la base de données de tractographie issue de 10 sujets de la
base HCP, Il s'agit du faisceau arqué (AF), du faisceau cortico-spinal (CST), du
faisceau cingulum (CG), du faisceau unciné (UNC), de la radiation optique (OR),
du faisceau longitudinal médian (MDLF), du faisceau longitudinal inférieur (ILF),
et du faisceau inférieur fronto occipital (IFO). La gure 5.5 illustre un exemple de
quelques faisceaux obtenus avec notre méthode.
1. http://nipy.org/dipy/
114
5.5. Avantages et limites de la méthode séquentielle basée sur la densité
Table 5.2 Valeurs de l'indice Silhouette de quelques faisceaux obtenus avec notre méthode et
avec celles de la méthode MSQB .
HH
HH CSTL CSTR UNCL UNCR IFOL IFOR ILFL ILFR SLFL SLFR
Notre-Méthode 0.751 0.788 0.811 0.808 0.722 0.754 0.790 0.787 0.841 0.825
MSQB 0.655 0.671 0.712 0.701 0.582 0.618 0.688 0.624 0.756 0.688
115
Chapitre 5. Clustering inter-sujets statique des bres neuronales
Une bonne ecacité sur les larges bases de données de tractographie, géné-
rées à partir de plusieurs sujets grâce à son concept d'exécution séquentielle,
permettant de traiter les données par partition.
La découverte de cluster de forme arbitraire car les faisceaux dans les bases de
données de tractographie peuvent avoir des formes U, S, L, hélice, rectiligne,
etc.
Un minimum de connaissances sur le domaine an de déterminer les para-
mètres d'entrée car les valeurs appropriées ne sont pas souvent connues à
l'avance lorsqu'on travaille avec des bases de données importantes.
Cependant, l'inconvénient de cette méthode est qu'elle donne des résultats variés
avec des conditions initiales diérentes, car l'ordre des sujets aecte le résultat nal,
à cause du caractère statique de la méthode. Une fois qu'une streamline est aectée
à un cluster elle reste dans ce dernier, et cela comme toutes les approches proposées
dans la littérature, en raison de leurs caractère statique, qui fait que le clustering
d'une streamline est dénitif dans une classe donnée. Par conséquent, toutes ces
méthodes sont limitées dans la considération dynamique de la variation des données
issues de plusieurs sujets.
5.6 Conclusion
Dans ce chapitre, une nouvelle approche de clustering multi-sujets de la SB est
présentée, utilisant une adaptation originale de l'algorithme de clustering basé sur
la densité "DBSCAN".
Notre méthode regroupe ecacement les streamlines similaires au sein d'un sujet
en cluster. Chaque cluster est représenté par des streamlines représentantes. Ces
streamlines sont injectées d'une manière entièrement automatique dans le clustering
du prochain sujet et considérées comme des connaissances issues de l'apprentissage
au sein du sujet précédent, ce qui permet de prendre en compte la variation de la
SB et augmenter la précision des résultats.
Notre méthode est ecace sur les grandes bases de données générées à partir
de diérents sujets grâce à son concept d'exécution séquentielle, permettant de ne
maintenir qu'une seule partition de données en mémoire. Elle a montré également
d'excellents résultats, car elle discerne parfaitement les principaux faisceaux de la
SB, tout en éliminant complètement les outliers.
Nous avons évalué la précision et l'ecacité de cette méthode sur des données
synthétiques et des données réelles, tout en comparant nos résultats meilleurs à ceux
obtenus par d'autres techniques de la littérature.
Néanmoins, notre méthode est dépendante des conditions initiales et fournit des
résultats diérents selon l'ordre des sujets car la méthode est statique ; une fois
qu'une streamline est assignée à un cluster, elle reste dans celui-ci.
Dans le chapitre suivant, nous allons présenter une solution possible à ce pro-
blème, en proposant une méthode de clustering inter-sujets dynamique.
116
Chapitre 6
Sommaire
6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
6.2 Travaux antérieurs et motivations . . . . . . . . . . . . . . . 118
6.3 Un mécanisme adaptatif de détection des outliers . . . . . . 120
6.4 Mesure de similarité . . . . . . . . . . . . . . . . . . . . . . . . 121
6.5 Les modèles de "ocking" . . . . . . . . . . . . . . . . . . . . 123
6.5.1 Règles de Reynolds . . . . . . . . . . . . . . . . . . . . . . . . 123
6.5.2 Le ocking d'espèces multiples (MSF) . . . . . . . . . . . . . 127
6.6 Potentiel du clustering basé sur les multi-agents . . . . . . . 127
6.7 L'algorithme 3D-SSF . . . . . . . . . . . . . . . . . . . . . . . 128
6.8 Expérimentations, résultats et discussion . . . . . . . . . . . 130
6.8.1 Expérimentations et résultats sur les données synthétiques . . 133
6.8.2 Expérimentations et résultats sur les données réelles . . . . . 136
6.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales
6.1 Introduction
Comme nous l'avons constaté au chapitre précédent, il y a un intérêt croissant
pour l'étude de la variation de la SB entre les sujets et en particulier, l'analyse
des faisceaux spéciques de la SB pour mieux comprendre le développement du
cerveau et le vieillissement, ainsi que pour améliorer la détection précoce de certaines
maladies neurodégénératives.
Plusieurs méthodes de clustering inter-sujets ont été proposées pour étudier les
faisceaux de la SB. Dans ce chapitre, nous commençons par résumer le principe
général de ces diérentes méthodes, tout en mettant en évidence leurs limites. Ces
méthodes ont été décrites plus en détail au chapitre 3.
Les méthodes proposées dans la littérature visent à surmonter la complexité du
problème, induite en partie par le volume important des données de tractographie,
générées à partir de plusieurs sujets, produisant ainsi des streamlines variées, avec
diérentes positions, longueurs et formes géométriques, ainsi que la présence des
streamlines outliers. Cependant, ces méthodes restent limitées en terme de exibilité
et dans leur capacité à prendre en compte l'ensemble de ces contraintes. La prise en
compte de ces limites a été une motivation majeure pour notre proposition d'une
nouvelle approche, comme nous l'exposerons plus loin dans ce chapitre.
Dans ce chapitre, nous présentons en détail un nouveau cadre de clustering,
dynamique incrémentale, inter-sujets, basé sur une implémentation multiagent dis-
tribuée du modèle MSF. Il s'agit de notre méthode que nous avons nommée 3D-SSF
(3D-Streamlines Stream Flocking), qui considère les streamlines de diérents sujets
comme un ux de données où, chaque streamline est aectée à un agent mobile. Les
agents travaillent ensemble en suivant les règles du ocking an de former un essaim.
Grâce à la fonction de similarité, les agents associés à des streamlines similaires for-
meront un essaim, tandis que les agents associés à des streamlines dissemblables
seront considérés comme des outliers.
Finalement, nous exposons les diérentes expériences réalisées sur des données
bruitées synthétiques et des données réelles de diusion du cerveau humain pour
valider notre méthode 3D-SSF et démontrer qu'elle est plus ecace et robuste aux
outliers, comparée aux autres approches classiques.
118
6.2. Travaux antérieurs et motivations
119
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales
pendant, avec l'algorithme Ant clustering les objets regroupés ne disposent pas de
mobilité par eux-mêmes. Le comportement des objets est implémenté à travers des
mouvements d'un petit nombre d'agents fourmis, ce qui ralentit la vitesse du clus-
tering. Chaque agent fourmi, portant un objet isolé ne communique pas avec les
autres agents fourmis ; il ne connaît donc pas la meilleure position pour supprimer
l'objet. L'agent fourmi doit se déplacer ou sauter aléatoirement dans l'espace de
grille jusqu'à ce qu'il satisfasse le critère de suppression d'objet, ce qui consomme
un temps d'exécution élevé.
Dans ce chapitre, nous présentons un nouvel algorithme de clustering inter-sujets
des streamlines basé sur le modèle MSF. Cet algorithme est également un algorithme
de partitionnement ne nécessitant pas de connaissances a priori sur le nombre de
clusters dans la base de données. L'avantage par rapport aux autres méthodes bio-
inspirées basées sur les systèmes multi-agents est que chaque objet dans la collection
est assigné à un agent eectuant des mouvements dans l'espace virtuel obéissant à
un mécanisme heuristique, contrairement aux autres méthodes où le mouvement est
aléatoire.
Calcul du médoïde
En statistiques, un médoïde est le représentant le plus central d'une classe. L'al-
gorithme des k-médoïdes est un algorithme de partitionnement plus robuste vis-à-vis
les données aberrantes (outliers) que celui des k-means (k-moyennes). L'algorithme
des k-médoïdes minimise l'erreur quadratique moyenne qui est la distance entre les
points de la classe et le point central (ou médoïde). Dans le cas des K-means, un
cluster est représenté par son centre, qui est une moyenne des streamlines aectée au
cluster. Soit K clusters (C1 , C2 , ...Ck ), un cluster étant composé de Sj streamlines,
tel que (1 ≤ j ≤ N ), la streamline médoïde des K clusters est dénie par l'équation
6.1 :
1
∀k, 1 ≤ k ≤ K, Rk = P Sj (6.1)
|Ck | j,Sj ∈Ck
Principe de la méthode
Un cluster est considéré comme un cluster d'outliers s'il satisfait aux deux condi-
tions suivantes :
120
6.4. Mesure de similarité
121
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales
Guevara et al. dans [Guevara 2011b], ont eectué une étude comparative entre ces
trois mesures de similarité. La gure 6.1 illustre les distances les plus proches entre
deux streamlines. La distance dc ne peut pas distinguer les diérentes formes de
streamlines, car elle prend en compte seulement des informations très grossières de
similarité et de proximité, contrairement à la distance dM qui fournit une mesure
de similarité globale intégrée tout au long de la courbe. La distance d'Hausdor dH
est la distance la plus favorable.
La gure 6.2 montre un exemple de comparaison de ces trois mesures de similarité
entre quatre streamlines.
Les distances entre la streamline en rouge et les autres streamlines (cyan, vert
et bleu) ont été calculées. Dans cet exemple, on peut voir que les streamlines en
bleu et vert ont une distance dc similaire, même si la streamline en vert est pourtant
plus similaire à la streamline en rouge. Pire, la streamline en cyan, qui présente une
forme géométrique un peu diérente, a une très petite distance dc . La distance dM
est plus appropriée pour une meilleure représentation de la similarité moyenne entre
les streamlines mais la distance dH semble plus précise si une mesure de similarité
stricte est requise. Ces distances peuvent traiter un degré variable de chevauchement
122
6.5. Les modèles de "ocking"
Figure 6.1 Illustration des distances basées sur les points les plus proches. Les
distances directes les plus proches entre deux points (seulement de la streamline i à
j ) sont représentées par des èches (d1 , d2 , ...d10 ). La distance du point le plus proche
est représentée par la èche verte (voir l'équation 6.3). La distance maximale directes
des distances les plus proches (dh ) est représentée par la èche rouge. La distance
d'Hausdor (dH ) est le maximum des deux distances directes dh (voir équation 6.5).
La moyenne directe des distances les plus proches (dm ) est la moyenne des distances
(d1 , ...d10 ). La moyenne des distances les plus proches (dM ) est la moyenne des deux
distances dm (voir l'équation 6.4) (Source [O'Donnell 2007].
partiel et ont été utilisées avec succès pour le clustering des streamlines de la SB du
cerveau entier.
En se basant sur cette étude, pour obtenir des résultats précis en matière de
clustering, dans notre contexte, nous avons opté pour la distance d'Hausdor pour
estimer la similarité entre les streamlines. Car l'étude dans [Guevara 2011b] dé-
montre que la moyenne des distances les plus proches (dM ) est plus appropriée pour
une bonne représentation de la ressemblance moyenne entre les streamlines.
123
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales
bio-inspiré du ocking.
Dans ce modèle, chaque individu (appelé boid) prend des décisions de mouve-
ment sans aucune communication explicite avec les autres. Les boids agissent selon
trois règles simples de base (alignement, séparation et cohésion) qui génèrent un
comportement global complexe pour la totalité de l'essaim. Ces règles décrivent
comment un boid réagit au mouvement d'autres boids dans son voisinage, local. Le
124
6.5. Les modèles de "ocking"
voisinage local est déterminé par le rayon de visibilité du boid ε. Un boid (agent)
ne réagit pas aux autres boids en dehors de son voisinage. Une distance minimale λ
doit également être maintenue entre les boids pour éviter la collision.
La règle d'alignement Comme illustré sur la gure 6.3, l'agent tend à se déplacer
dans le même sens que celui des agents voisins, c'est-à-dire à donner à un agent la
capacité d'aligner son vecteur de vélocité au vecteur de vélocité moyenne d'autres
agents voisins se trouvant dans sa plage de visibilité. Elle est décrite par la formule
6.6 suivante :
n
1X
Si (d(Fi , Ac ) ≤ ε) ∧ (d(Fi , Ac ) ≥ λ) ⇒ v~ar = v~i (6.6)
n
i
125
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales
La règle de cohésion Comme illustré sur la gure 6.5, le vecteur de vélocité d'un
agent est aligné avec la direction de la position spatiale moyenne des autres agents
dans sa plage de visibilité. Ce qui permet à l'agent de rester proche de ses voisins
en se rapprochant du centre d'essaim. Elle est décrite par la formule 6.8 suivante :
n
(6.8)
X
Si (d(Fi , Ac ) ≤ ε) ∧ (d(Fi , Ac ) ≥ λ) ⇒ v~cr = (Pi − Pc )
i
126
6.6. Potentiel du clustering basé sur les multi-agents
127
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales
La phase d'initialisation
Au début, lorsque la première partition du ux est introduite dans le système,
chaque streamline est associé à un agent appelé SimpleAgent . Les SimpleAgents
travaillent en parallèle pour un nombre prédéni d'itérations an de regrouper en-
semble des agents transportant des streamlines similaires, exploitant la fonction de
similarité (distance d'Hausdor). Chaque agent compare sa fonction de similitude
avec seulement ses agents voisins. L'agent est considéré comme un voisin d'un autre
agent s'il est dans son rayon de visibilité.
128
6.7. L'algorithme 3D-SSF
129
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales
130
6.8. Expérimentations, résultats et discussion
131
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales
thon. L'exécution a été eectuée sur le processeur Intel (R) Core (TM) i7 doté de 8
Go de mémoire.
6.8.1.2 Expérimentations
Nous avons implémenté deux autres méthodes de clustering des streamlines de
la SB : le clustering HQB [côté 2013], qui est une version améliorée de l'algorithme
QB [Garyfallidis 2012b], elle utilise un arbre probabiliste de clustering à partir des
applications multiples du clustering QB pour l'élimination les streamlines outliers et
la méthode V-Bundles [Reichenbach 1996]. Nous avons appliqué le clustering HQB
en utilisant la distance MDF, avec un seuil de 8mm. La distance MDF (détaillée au
paragraphe 3.4.1 du chapitre 3) exige que les streamlines comparées aient le même
nombre de points. A cet eet, les streamlines ont été automatiquement échantillon-
nées pour avoir seulement 20 points en se basant sur la méthode d'échantillonnage
détaillée dans [Garyfallidis 2012b].
La méthode V-Bundles est basée sur une adaptation du champ de vecteur de l'al-
gorithme k-means [Hartigan 1979] pour extraire les faisceaux de la SB. Nous avons
maintenu les mêmes paramètres adoptés dans la proposition originale [Reichenbach 1996] ;
le nombre maximal d'itérations des k-means = 3, λ = 0.001, γ = 0.6, rv = 15mm
et rz = 9mm.
Initialement, nous avons testé uniquement la phase d'initialisation avec l'en-
semble des données synthétiques pour évaluer la capacité du clustering dynamique
basée sur le modèle MSF à reproduire ecacement les faisceaux des données syn-
thétiques. Nous avons utilisé un certain nombre d'agents initiaux correspondant au
nombre total de streamlines dans les données Na = 947, pour assigner à chaque
agent une streamline, nous avons aussi xé le seuil de similarité à 8mm et le nombre
1. http://hardi.epfl.ch/static/events/2013_ISBI/
133
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales
d'itération maximale M axIterations = 100, qui se sont avérés des paramètres opti-
maux. Nous avons utilisé le concept d'élimination des outliers décrit au paragraphe
6.3 , avec une constante de degré d'isolement xée à une valeur de 1.5.
Nous avons ensuite exécuté les deux phases de notre méthode 3D-SSF, initialisa-
tion et maintenance des statistiques représentatives et du clustering, en utilisant les
mêmes paramètres spéciés ci-dessus, sauf la taille de l'échantillon, car nous avons
divisé la totalité des données en blocs de 100 streamlines, donc nous avons xé le
nombre d'agents initiaux à Na = 100.
134
6.8. Expérimentations, résultats et discussion
(c) Les résultats obtenus avec (d) Les résultats obtenus avec la
la méthode HQB. Elle a réussi à méthode V-Bundles. Les 20 prin-
éliminer les outliers, tout en mélan- cipaux faisceaux confondus par les
gant deux faisceaux initiaux dans le streamlines outliers en couleurs dif-
même faisceau en orange férentes.
135
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales
Les résultats obtenus avec la méthode V-bundle ont révélé des valeurs médiocres
en ce qui concerne à la fois l'homogénéité et l'exhaustivité par rapport aux autres
approches, et les clusters résultants ne sont généralement pas bien séparés.
136
6.8. Expérimentations, résultats et discussion
Ensuite, nous avons généré un atlas de tous ces faisceaux en utilisant la méthode
de segmentation décrite dans [Hua 2008]. Les faisceaux obtenus avec la segmentation
WMQL de chaque sujet ont été convertis en cartes binaires (1 : pixels qui contenaient
la rationalisation, 0 : pixels qui ne contenaient pas la rationalisation). Les cartes
binaires obtenues à partir des 10 sujets ont été moyennées pour produire une carte
probabiliste de la SB dans la norme MNI et ce, pour chaque faisceau.
Les cartes probabilistes des faisceaux de l'atlas ont été superposées aux cartes
binaires des faisceaux obtenus avec les méthodes de clustering an d'estimer le
degré de correspondance spatiales entre les faisceaux pour l'analyse statistique de
la reproductibilité comme indiqué dans [Wakana 2007].
6.8.2.3 Expérimentations
L'algorithme 3D-SSF a été testé sur les données réelles de diusion décrites ci-
dessus. Les paramètres de notre algorithme ont été choisis pour obtenir les meilleurs
résultats. Nous avons considéré les données des dix sujets comme un ux séquentiel
de streamlines. Ce ux a été divisé en partitions de 10000 streamlines par parti-
tion. Le nombre d'agents initiaux dénit à Na = 10000 (les mêmes résultats sont
obtenus avec diérentes tailles de partitions en raison de la nature dynamique de
notre approche), le seuil de similarité à 8mm, le nombre maximum d'itérations
M axIterations = 100 et les streamlines outliers ont été déterminés en utilisant le
concept décrit au paragraphe 6.3.
Nous avons comparé la précision du clustering et l'ecacité du temps de calcul de
notre méthode 3D-SSF avec d'autres techniques de la littérature, comme l'approche
la plus récente, "Multi-subjects Clustering with QuickBundles" (MSQB), propo-
sée dans [Garyfallidis 2015], qui est basée sur l'algorithme QB, considéré comme
l'algorithme le plus rapide dans la littérature [Garyfallidis 2012b].
Nous avons mis en oeuvre la méthode MSQB en suivant les mêmes étapes que
dans l'étude initiale [Garyfallidis 2015], détaillées au chapitre 3.
Les deux méthodes ont été également comparées à l'atlas de la SB construit dans
cette étude, qui est considéré comme notre référence.
137
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales
|Sa − Sm |
SM D(Ba , Bm ) = (6.14)
Sm
où Sa est la valeur moyenne d'une métrique DTI, telle que la FA ou l'ADC,
dans un faisceau obtenu par la méthode automatique proposée, et Sm est celui des
faisceaux obtenus par l'étiquetage manuel d'expert.
Cette étude a révélé une moyenne assez faible, ce qui indique que les faisceaux ob-
tenus par notre méthode sont exacts. La table 6.2 résume les valeurs SMD obtenues
avec les méthodes 3D-SSF et MSQB.
Ces résultats expérimentaux prouvent que la méthode 3D-SSF atteint une haute
qualité de clustering par rapport à celle de la méthode MSQB et arment la ca-
pacité de notre méthode à extraire correctement les principaux faisceaux de la
3. http://www.trackvis.org/
138
6.8. Expérimentations, résultats et discussion
(a)
(b)
(c)
Figure 6.8 Evaluation quantitative des faisceaux obtenus avec la méthode 3D-
SSF. (a) L'analyse Kappa . (b) Spatial matching ratio (SMR) et (c) Spatial volume
agreement (SVA).
139
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales
(a)
(b)
Table 6.2 les valeurs SMD obtenues avec les méthodes 3D-SSF et MSQB.
HH
HH CSTL CSTR CGL CGR IFOL IFOR ILFL ILFR ORL ORR SLFL SLFR
3D-SSF 0.142 0.121 0.129 0.142 0.285 0.341 0.028 0.052 0.147 0.05 0 0.22
MSQB 0.981 0.920 0.886 0.955 0.838 0.791 0.142 0.078 0.096 0.355 0.135 0.088
SB. La gure 6.10 présente quelques faisceaux principaux obtenus avec notre mé-
thode, comme le faisceau cortico-spinal gauche/droit (CST), le faisceau cingulum
gauche/droit (CG), le faisceau longitudinal inférieur gauche/droit (ILF), le faisceau
fronto-inférieur gauche/droit (IFO), le faisceau arqué gauche/droit (AF) et enn les
septs partitions du corps calleux (CC).
140
6.8. Expérimentations, résultats et discussion
(a) (b)
(c)
141
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales
nées. Par conséquent, nous avons choisi la méthode la plus rapide dans la littérature,
QB, pour la comparaison dans le clustering d'un seul sujet et la méthode MSQB
basé sur cette dernière, pour l'étude comparative du clustering inter-sujets, car la
QB est de complexité O(N ) dans le meilleur des cas, où N est le nombre total de
streamlines.
La gure 6.11(a) montre le temps requis pour regrouper un jeu de données réelles
d'un sujet contenant approximativement 800 000 streamlines par pas de 10 000
(la taille d'une partition). Les résultats de cette expérience montrent que notre
méthode nécessite un temps de calcul court pour terminer le clustering dans les
partitions initiales. Cependant, le temps de calcul augmente par la suite pour les
autres partitions, ce qui peut être expliqué par la taille des partitions qui augmente
après l'injection des streamlines représentatives issues du clustering des partitions
précédentes.
La gure 6.11(b) montre le temps requis par notre méthode pour eectuer un
clustering sur un ensemble de données composé des streamlines issues des dix sujets
par rapport à la méthode MSQB. Notre méthode nécessite 1027 secondes pour obte-
nir de bons résultats de clustering pour un seul sujet d'environ 800 000 streamlines,
alors que la méthode QB nécessite 370,3 secondes. Le temps requis pour chaque sujet
dépend du nombre de streamlines qui le constitue. Pour réaliser le clustering inter-
sujets des dix sujets, notre méthode nécessite 10 701 secondes (environ 3 heures),
alors que la méthode MSQB nécessite 5 257 secondes (approximativement une heure
et demie) pour regrouper les mêmes streamlines.
Les résultats de cette expérience démontrent que notre méthode présente des
performances de temps acceptables par rapport à la grande taille de l'ensemble de
données. Notre méthode nécessite un peu plus de temps, comparée à la méthode la
plus rapide dans la littérature, pour obtenir des résultats de clustering plus précis
que cette dernière, ce qui rend notre méthode scalable sur de très grands ensembles
de données.
142
6.8. Expérimentations, résultats et discussion
143
Chapitre 6. Clustering inter-sujets dynamique des bres neuronales
clustering comme l'indice de Rand ajusté pour évaluer les performances de chaque
cas. La table 6.3 présente les résultats de cette évaluation quantitative.
Les résultats obtenus en utilisant la distance d'Hausdor sont généralement
meilleurs pour les trois cas, ce qui coïncide avec l'hypothèse posée préalablement,
dans l'étude [Guevara 2011b]. Nous avons conrmé que la distance d'Hausdor est
plus précise que la distance MDF pour la mesure de similarité entre les streamlines.
Le premier et le troisième cas donnent les meilleurs résultats comparés au deuxième
cas pour tous les faisceaux. L'ajout de la règle de similarité améliore nettement la
précision des résultats de clustering et contribue à la formation rapide de clusters
composés uniquement de streamlines similaires. En revanche, dans le second cas,
dans lequel seules les trois règles de Reynolds ont été appliquées, la méthode de
clustering 3D-SSF devient limitée pour séparer correctement les streamlines en fais-
ceaux cohérents confondus par les ourliers. Le troisième cas atteint des résultats
presque identiques à ceux du premier cas.
Cette performance peut être expliquée par la capacité de la vélocité de similarité
à maintenir les agents similaires dans le même cluster et la capacité de la vélocité
de dissimilarité à repousser les autres agents portant des streamlines dierents.
Table 6.3 L'indice de Rand ajusté calculé entre quelques faisceaux obtenus avec l'algorithme
3D-SSSF et les faisceaux de l'atlas pour diérents cas de calcule du vecteur de vélocité.
H
HH CSTL CSTR CGL CGR IFOL IFOR ILFL ILFR ORL ORR SLFL
H
Case 1 (HD) 0.986 0.992 0.982 0.892 0.777 0.772 0.781 0.785 0.979 0.990 0.880
Case 1 (MDF) 0.899 0.923 0.844 0.782 0.728 0.713 0.689 0.699 0.800 0.885 0.752
Case 2 (HD) 0.561 0.586 0.450 0.488 0.299 0.332 0.388 0.395 0.411 0.513 0.355
Case 2 (MDF) 0.441 0.458 0.282 0.290 0.235 0.199 0.259 0.210 0.301 0.422 0.315
Case 3 (HD) 0.988 0.981 0.957 0.947 0.819 0.830 0.885 0.873 0.966 0.962 0.812
Case 3 (MDF) 0.948 0.955 0.899 0.821 0.730 0.754 0.738 0.785 0.857 0.911 0.795
6.9 Conclusion
Nous avons présenté dans ce chapitre une nouvelle méthode de clustering inter-
sujets ecace, capable d'analyser des jeux de données de tractographie de grande
taille, issus d'une population de sujets, tout en éliminant les outliers, an de déduire
un modèle des faisceaux génériques présents dans la plupart des sujets.
Cette approche dynamique utilise le modèle bio-inspiré MSF basé sur les sys-
tèmes multi-agents, lui permettant de bénécier des avantages oerts par les multi-
agents tel que l'adaptabilité, le parallélisme, l'asynchronisme et la décentralisation
pour faire face à la grande taille de la base de données de tractographie, sa com-
plexité et variabilité.
Nous avons testé la robustesse et la qualité des résultats de la méthode 3D-
SSF sur des données simulées et des données réelles. Les résultats obtenus ont été
comparés avec d'autres stratégies de la littérature. Un atlas multi-sujets de la SB a
été également construit automatiquement dans cette étude, pour valider les résultats
obtenus avec notre méthode.
144
Conclusion générale et
perspectives
Dans cette thèse, nous avons commencé par étudier et discuter les méthodes
proposées dans la littérature, pour la segmentation et le clustering des faisceaux
an de mettre en évidence les forces et les limites de ces méthodes et cerner ainsi
la problématique. Au passage, nous avons proposé une étude et une analyse com-
parative des diérentes méthodes de tractographie déterministe, an de selectioner
la meilleure méthode pour la génération de nos bases de données de tractographie
à partir des données IRMd. Tout au long de cette thèse, nous avons proposé des
nouvelles méthodes de clustering des jeux de données de tractographie massifs et
complexes, contenant plus d'un million de streamlines. Nos contributions principales
se composent de deux parties, un clustering intra-sujet et un clustering inter-sujets.
En premier lieu, nous avons développé une méthode hybride pour la segmentation
des streamlines intra-sujet, qui combine le clustering basé sur la similarité et la
segmentation qui utilise un a priori anatomique, donné par un atlas de la SB. Ceci
dans le but d'augmenter l'ecacité et la précision des résultats. Cette méthode a
réussi à extraire 13 faisceaux principaux de la SB avec une précision appréciable,
mesurée par une analyse Kappa qui a donné une moyenne supérieure à 0,70.
En deuxième lieu, nous avons développé deux nouvelles méthodes de clustering
inter-sujets, capable d'analyser des jeux de données de tractographie de très grande
taille à partir d'une population de sujets tout en éliminant les outliers, pour dé-
duire un modèle des faisceaux génériques présents dans la plupart des sujets. Une
approche statique basée sur la densité et une autre approche dynamique, qui uti-
lise les systèmes multi-agents basée sur le modèle bio-inspiré MSF, appelée 3D-SSF,
visant à surmonter les limites des méthodes de clustering statiques, tout en béné-
ciant des avantages oerts par les système multi-agents telles que l'adaptabilité, le
parallélisme, l'asynchronisme et la décentralisation.
Nous avons testé la robustesse et la qualité des résultats de la méthode 3D-SSF
sur des données synthétiques d'abord, en eectuant une comparaison statistique ro-
buste avec d'autres approches de la littérature. La méthode 3D-SSF a montré des
valeurs importantes d'exhaustivité, d'indice de Rand ajusté et d'homogénéité. Puis
sur des données réelles, armant la capacité de notre méthode à extraire correc-
tement presque tous les principaux faisceaux de la SB, avec une haute valeur de
Kappa qui atteint une moyenne de plus de 0,80. La méthode 3D-SSF a une com-
plexité d'ordre linéaire, avec des performances de temps acceptables par rapport à la
grande taille de l'ensemble de données, elle a nécessité environ 3 heures pour réaliser
le clustering inter-sujets des dix sujets.
Un atlas de la SB multi-sujets, considéré comme notre référentiel, a été également
construit automatiquement dans cette thèse, pour valider les résultats obtenus par
nos méthodes.
CONCLUSION
146
Bibliographie
[Ackerman 1999] M. Ackerman. Direct Calculation of the Information Matrix via
the EM Algorithm . J. R. Statistical Society, vol. 61, no. 2, pages 479482,
1999. (Cité en page 10.)
[Aganj 2009] I. Aganj, C. Lenglet, G. Sapiro, E. Yacoub, K. Ugurbil et N. Harel.
Multiple q-shell odf reconstruction in q-ball imaging
. In proceedings in MIC-
CAI, pages 423431, 2009. (Cité en page 29.)
[Aganj 2010] I. Aganj, C. Lenglet, G. Sapiro, E. Yacoub, K. Ugurbil et N. Harel.
Reconstruction of the orientation distribution function in single and multiple-
shell q-ball imaging within constant solid angle. Magnetic Resonance in Me-
dicine, vol. 64, no. 2, pages 554566, 2010. (Cité en pages 91 et 114.)
[Alexander 2001] A. L. Alexander, K. M. Hasan, M. Lazar, J. S. Tsuruda et D. L.
Parker. Analysis of partial volume eects in diusion-tensor MRI . Magn
Reson Med, vol. 45, no. 4, pages 770780, 2001. (Cité en pages 85 et 89.)
[Alexander 2002] D. Alexander, G. Barker et S. Arridge. Detection and Modeling of
Non Gaussian Apparent Diusion Coecient Proles in Human Brain Data.
Magnetic Resonance in Medicine, vol. 48, no. 2, pages 331340, 2002. (Cité
en page 27.)
[Alexander 2005] D. Alexander. Multiple-Fibre reconstruction algorithms for diu-
sion MRI . In Annals of the New York Academy of Sciences 1046, pages
113133, 2005. (Cité en page 36.)
[Aralasmak 2006] A. Aralasmak, J. L. Ulmer, M. Kocak, C. V. Salvan, A. E. Hillis
et D. M. Yousem. A diusion tensor imaging tractography atlas for virtual
in vivo dissections
. J Comput Assist Tomogr, vol. 30, no. 5, pages 695715,
2006. (Cité en page 11.)
[Arsigny 2006] V. Arsigny, P. Fillard, X. Pennec et N. Ayache. Log-Euclidean me-
trics for fast and simple calculus on diusion tensors . Magnetic resonance
in medicine, vol. 56, no. 2, pages 411421, 2006. (Cité en pages 22 et 32.)
[Ashburner 2007] J. Ashburner. A fast dieomorphic image registration algorithm.
Neuroimag, vol. 38, no. 1, pages 95113, 2007. (Cité en page 58.)
[Assaf 2004] Y. Assaf, R. Z. Freidlin, G. K. Rohde et P. J. Basser. New Modeling
and Experimental Framework to Characterize Hindered and Restrcited Water
Diusion in Brain White Matter. Magnetic Resonance in Medicine, vol. 52,
pages 965978, 2004. (Cité en page 26.)
[Assaf 2008] Y. Assaf, T. Blumenfeld-Katzir, Y. Yovel et P. J. Basser. AxCaliber :
a method for measuring axon diameter distribution from diusion MRI. Ma-
gnetic Resonance in Medicine, vol. 59, no. 6, pages 134754, 2008. (Cité en
page 26.)
Bibliographie
148
Bibliographie
149
Bibliographie
150
Bibliographie
151
Bibliographie
152
Bibliographie
153
Bibliographie
the human brain using diusion tensor tractography and comparison with
classical dissection. Neuroimage, vol. 39, no. 1, pages 6279, 2008. (Cité en
page 59.)
[Lazar 2003] M. Lazar, D. M. Weinstein, J. S. Tsuruda, K. M. Hasan, K. Arfana-
kis, M. E. Meyerand, B. Badie, H. Rowley, V. Haughton, A. Field et A. L.
Alexander. White matter tractography using diusion tensor deection
. Hu-
man Brain Mapping, vol. 18, no. 4, pages 306321, 2003. (Cité en pages 33,
34, 85, 88 et 89.)
[Lebart 1982] L. Lebart, A. Maurineau et M. Piron. Traitement des données statis-
tiques. In Dunod, Paris, 1982. (Cité en page 52.)
[Leemans 2009] A. Leemans et D. Jones. A new approach to fully automated ber
tract clustering using anity propagation. In In ISMRM, page 856, 2009.
(Cité en page 70.)
[Levitt 2003] M. Levitt. Spin dynamics : basics of nuclear magnetic resonance. In
Wiley New York, 2003. (Cité en page 17.)
[Li 2010] H. Li, Z. Xue, L. Guo, T. Liu, J. Hunter et S. T. C. Wong. A hybrid
approach to automatic clustering of white matter bers. Neuroimage, vol. 49,
no. 2, pages 12491258, 2010. (Cité en pages 75 et 86.)
[Lin 2001] C. P. Lin, W. Y. Tseng, H. C. Cheng et J. H. Chen. Validation of diusion
tensor magnetic resonance axonal ber imaging with registered manganese-
enhanced optic tracts. Neuroimage, vol. 14, no. 5, pages 103547, 2001. (Cité
en page 27.)
[Liu 2004] C. Liu, R. Bammer, B. Acar et M. E. Moseley. Characterizing Non-
Gaussian Diusion by Using Generalized Diusion Tensors. Magnetic Re-
sonance in Medicine, vol. 51, pages 924937, 2004. (Cité en page 27.)
[Maddah 2005a] M. Maddah, A.U. Mewes, S. Haker, W. Grimson et S. Wareld. Au-
tomated Atlas-Based Clustering of White Matter Fiber Tracts from DTMRI.
In In Proceedings of MICCAI 2005, LNCS 5762, Springer-Verlag, 2005. (Cité
en page 59.)
[Maddah 2005b] M. Maddah, W.Wells, S.Wareld, C.-F.Westin et W. Grimson.
Probabilistic Clustering and Quantitative Analysis of White Matter Fiber
Tracts. In In Proceedings of IPMI, 2005. (Cité en page 70.)
[Maddah 2008] M. Maddah, W. Grimson, S. Wareld et W. Wells. A Unied Frame-
work for Clustering and Quantitative Analysis of White Matter Fiber Tracts.
Medical Image Analysis, vol. 12, no. 2, pages 191202, 2008. (Cité en pages 70
et 76.)
[Maes 1997] F. Maes, A. Collignon, D. Vandermeulen, G. Marchal et P. Suetens.
Multimodality image registration by maximization of mutual information
.
IEEE Trans Med Imaging, vol. 16, no. 2, pages 187198, 1997. (Cité en
page 58.)
155
Bibliographie
156
Bibliographie
[O'Donnell 2005] L. O'Donnell et C.-F. Westin. White Matter Tract Clustering and
Correspondence in Populations . In In Proceedings of MICCAI 2005, LNCS
5762, Springer-Verlag. Palm Springs, CA, USA, pages 140147, 2005. (Cité
en page 70.)
[O'Donnell 2006] L. J. O'Donnell, M. Kubicki, M. E. Shenton, M. H. Dreusicke,
W. E. L. Grimson et C. F. Westin. A method for clustering white matter
ber tracts
. AJNR Am J Neuroradiol, vol. 27, no. 5, pages 10321036, 2006.
(Cité en pages 70 et 86.)
[O'Donnell 2007] L. O'Donnell et C. Westin. Automatic tractography segmentation
using a highdimensional white matter atlas . IEEE Transactions on Medical
Imaging, vol. 26, no. 11, pages 15621575, 2007. (Cité en pages 73, 97 et 123.)
[Oguz 2012] I. Oguz, A. Boucharin, W. Lu, C. Vachet, F. Budin, Y. Shi et M. Styner.
A Minimum Cost Approach to Connectivity from Orientation Distribution
Functions via Ecient Multi-directional Graph Propagation. In proceedings
in International Conference on Medical Image Computing and Computer As-
sisted Intervention (MICCAI'12)-Computational Diusion MRI Workshop,
2012. (Cité en page 29.)
[Oishi 2008] K. Oishi, K. Zilles, K. Amunts, A. Faria, H. Jiang, X. Li, K. Akh-
ter, K. Hua, R. Woods, A. W.Toga, G. B. Pike, P. Rosa-Neto, A. Evans,
J. Zhang, H. Huang, M. I. Miller, P. C. M. van Zijl, J. Mazziotta et S. Mori.
Human brain white matter atlas : Identication and assignment of common
anatomical structures in supercial white matter. NeuroImage, vol. 43, no. 3,
pages 447457, 2008. (Cité en pages 13, 60 et 97.)
[Oishi 2009] K. Oishi, A. Faria, H. Jiang, X. Li, K. Akhter, J. Zhang, J. T. Hsu, M. I.
Miller, P. C. M. van Zijl, M. Albert, C. G. Lyketsos, R. Woods, A. W. Toga,
G. B. Pike, P. Rosa-Neto, A. Evans, J. Mazziotta et S. Mori. Atlas-based
whole brain white matter analysis using large deformation dieomorphic me-
tric mapping : application to normal elderly and Alzheimer's disease partici-
pants. Neuroimage, vol. 46, no. 2, pages 486499, 2009. (Cité en pages 60
et 61.)
[Parker 2003] G. Parker et D. Alexander. Probabilistic Monte Carlo Based Mapping
of Cerebral Connections Utilising Whole-Brain Crossing Fibre Information.
In proceedings in IPMI, pages 684695, 2003. (Cité en page 29.)
[Pauli 1940] W. Pauli. The connection between spin and statistics. Physical Review,
vol. 58, no. 8, pages 716722, 1940. (Cité en page 17.)
[Peled 2006] S. Peled, O. Friman, F. Jolesz et C.-F. Westin. Geometrically constrai-
ned two-tensor model for crossing tracts in DWI. Magnetic Resonance Ima-
ging, vol. 24, pages 12631270, 2006. (Cité en page 25.)
[Perrin 2006] M. Perrin. Imagerie de diusion a haute resolution angulaire : étude
du modle q-ball par couplage simulations- fantomes et applications au suivi
de bres et a la parcellisation du cortex. PhD thesis, Ph.D. thesis, Université
Paris XI, France, 2006. (Cité en page 11.)
157
Bibliographie
158
Bibliographie
159
Bibliographie
160
Bibliographie
161
Annexe A
164
Table A.1 Les subdivisions du corps calleux dans le WMQL
Corpus callosum WMQL query
tract name
Rostrum CC_1= endpoints_in(orbitofrontal.left) and end-
points_in(orbitofrontal.right)
Genu CC_2= endpoints_in(prefrontal.left) and endpoints_in(prefrontal.right)
Rostral body CC_3 = endpoints_in(premotor.left) and endpoints_in(premotor.right)
Anterior midbody CC_4 = endpoints_in(motor.left) and endpoints_in(motor.right)
Posterior midbody CC_5 = endpoints_in(postcentral.left or posteriorcingulate.left or paracen-
tral.left) and endpoints_in(postcentral.right or posteriorcingulate.right or pa-
racentral.right)
Isthmus CC_6 = endpoints_in(superior_temporal_lobule.left or
posterior_parietal_lobule.left or isthmus cingulate.side)
and endpoints_in(superior_temporal_lobule.right or poste-
rior_parietal_lobule.right or isthmus cingulate.side)
Splenium CC_7 = endpoints_in(occipital.left or inferior_temporal_lobule.left) and
endpoints_in(occipital.right or inferior_temporal_lobule.right)
165
Annexe A. Atlas de la substance blanche
166
Contributions de l'auteur
Publication dans une revue internationale
Amira Chekir, Salima Hassas, Maxime Descoteaux, Marc-Alexandre Côté, Elef-
therios Garyfallidis and Fatima Oulebsir-Boumghar. 3D-SSF : A bio-inspired
approach for dynamic multi-subject clustering of white matter tracts. Ed.
Elsevier, Computers in Biology and Medicine, Vol. 83, N 1, pp.10-21, April 2017,
ISSN 0010-4825, DOI :10.1016/j.compbiomed.2017.01.016, https://www.ncbi.nlm.
nih.gov/pubmed/28188985
Communications internationales
Amira Chekir and Fatima Oulebsir Boumghar. Sequential Density-Based
Multi-Subject Clustering in Massive Tractography Dataset. 5th Interna-
tional Work-Conference on Bioinformatics and Biomedical Engineering (IWBBIO
2017)- Avril 26-28, Grenade, Espagne.,http://iwbbio.ugr.es/program.php).
Amira Chekir, Maxime Descoteaux , Eleftherios Garyfallidis , Marc-Alexandre
Côté and Fatima Oulebsir Boumghar. A Hybrid Approach for Optimal Au-
tomatic Segmentation of White Matter Tracts in HARDI. IEEE Enginee-
ring in Medicine and Biology and Humanity (IECBES'14) - DOI :10.1109/IECBES.
2014. 7047481, pp 177-180, INSPEC Accession Number 14950568. Publisher : IEEE.
Décembre 8-10, 2014, MIRI, Sarawak (Malaisie). http://ieeexplore.ieee.org/
document/7047481/.
167
169