Académique Documents
Professionnel Documents
Culture Documents
RAPPORT DE STAGE
Présenté par
Encadrants :
Rachid Gherbi et Malik Mallem
2005 - 2006
REMERCIEMENTS
Chapitre I
Introduction
Il est inutile de rappeler que l'informatique, phénomène montant de notre époque, intègre
presque toutes les disciplines, scientifiques ou autres. Cela va de la gestion de données en
tout genre à l'astronomie en passant par la médecine, alors pourquoi pas la biologie?
Mouna Essabbah 4
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
La biologie a d'abords attiré les informaticiens par les quantités astronomiques de données
à analyser soit par analyse de textes, par algorithmique ou autre. Plus tard, la volonté de
transformer les contraintes spatiales en modèles structuraux ont augmenté la présence de
l’informatique en biologie structurale. Cela attire les spécialistes de l’infographie et de la
modélisation. L’infographie moléculaire est née dans les années 60 pour visualiser les
structures résolues à cette époque.
N’oublions pas que nos connaissances sont limitées par la nature flexible et dynamique des
molécules. Ainsi, les données structurales sont floues et imparfaites. Nous devons souvent
nous baser sur des données locales ou partielles.
Dans notre cas, la modélisation de la molécule de l’ADN est fondée sur les données
structurales extraites des séquences, procédé assez difficile.
Il n’est pas exclu d’arriver à construire une structure qui ne se résolve pas facilement, voir
pas du tout avec les méthodes physiques actuelles.
Mouna Essabbah 5
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
A travers ce modeste travail de stage nous allons essayer de vérifier si le premier défi a bien
été remporté. En effet, il nous faudra mesurer l’exactitude de nos approximations pour la
modélisation 3D de l’ADN.
Mouna Essabbah 6
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
les contraintes sur les images, contraintes qui vont nous permettre d’affiner le modèle prédit
et le rapprocher le plus de la réalité.
Le choix de la position étant fixé, nous projetons le modèle 3D afin d’obtenir son modèle
2D équivalent.
L’étape suivante consiste alors à analyser les deux modèles 2D (prédit et réel) en les
comparant par des méthodes de recalage et de calcul de similarité.
Ce procédé semble être simple, sachant que notre but premier est de favoriser l’aspect 3D
de l'ADN.
De ce fait, une deuxième approche, voisine de la première vise à impliquer plus les
biologistes en leur facilitant la manipulation des molécules en milieu immersif, par le biais
de la réalité augmentée.
Pour cela nous procédons d’abord à la reconstruction 3D du modèle réel (par stéréoscopie).
Ensuite, la visualisation immersive grâce à ADN-Viewer de ces deux modèles permettra au
biologiste (par une manipulation manuelle) de les rapprocher au maximum.
La comparaison se fera donc, lorsque ce dernier l’aura décidé, grâce à une fonction de
comparaison de modèle 3D (3dPatternMatching).
Il semble que cette méthode se rapproche le plus de notre objectif premier qui est de
favoriser l'exploitation de la forme spatiale de l'ADN.
Toutefois, comme toute image microscopique, celles que nous allons traiter sont très
bruitées (milieux, techniques…). Ainsi, la première étape du travail consistera en un pré-
Mouna Essabbah 7
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
traitement qui va nous permettre de filtrer et de lisser l’image. Ceci nous amène à un
meilleur traitement (qui comportera une détection de primitives : contours, coins).
Le premier chapitre (État de l'art) replace le travail effectué lors de ce stage dans le contexte
actuel de la recherche en traitement d'image pour la bioinformatique. Nous décrivons
brièvement notre motivation, notre point de départ et notre but final.
Dans le troisième chapitre (Passage 3D – 2D: approche guidée par le modèle ) nous
présentons une méthode de comparaison entre le modèle réel et modèle prédit. Notre
référence étant le modèle prédit, le passage 3D-2D signifie que nous projetons le modèle
3D prédit par ADN-Viewer en 2D. Le recalage et l'étude de similarité se fera alors sur des
images bidimensionnelles.
Dans le quatrième chapitre (Passage 2D – 3D: approche guidée par les données ), nous
verrons comment, à partir d'une reconstruction 3D du modèle réel, il est possible de
confronter le modèle réel au modèle prédit. Il est impératif de souligner l'apport visuel de
cette approche.
Enfin, dans le cinquième chapitre, nous comparerons les apports de chaque solution, pour
justifier notre choix. Par la suite, nous présenterons l'outil logiciel que nous avons
développé et quelques résultats obtenus.
Mouna Essabbah 8
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Pour parachever ce travail, nous terminerons par une conclusion qui comprendra en premier
lieu une introspection des idées traitées et en second lieu des perspectives sur des
problèmes ouverts.
Mouna Essabbah 9
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Chapitre II
Réalité augmentée et virtuelle au service
de la biologie
Au tout début, un cliché à un instant donné ne servait que de support pour les
interprétations humaines. Peut de temps après la mauvaise qualité des images attire
naturellement l'attention des chercheurs qui tentent désormais de l'améliorer. Le traitement
d'images consiste, en premier lieu, à les restaurer en corrigeant les défauts d'acquisition.
Cependant le problème de la taille des images se pose, et le temps de traitement, très lent à
Mouna Essabbah 10
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
cet époque, suscite l'intérêt de certains. Le codage et la compression des images s'imposent.
Le traitement d'image vise à être « temps réel ».
Cette approche permet d’avoir une vision globale de la structure spatiale de l’ADN ainsi
que de percevoir les possibilités d’interactions avec d’autres molécules (protéines).
Mouna Essabbah 11
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Les projets de recherche dans ce domaine sont nombreux et beaucoup d’entre eux ont été
fructueux.
Plus généralement, la visualisation 3D offre une vision globale de la molécule étudiée. Elle
permet de modéliser un phénomène ou de simuler un mécanisme biologique.
Mouna Essabbah 12
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Figure 2. Séquence de 222 paires de bases. Chaque sphère de couleur correspond à un nucléotide.
Dans le même registre, nous avons décelé l'existence d'un autre logiciel crée par des
américains pour l'analyse, la reconstruction et la visualisation de la structure 3D des acides
nucléiques : 3DNA [5].
3DNA peut manipuler des doubles hélices non parallèles et parallèles, structures simples,
triplex, quadruplex et d'autres motifs complexes trouvés en structures d'ADN et d'ARN, et
cela à partir d'un dossier de coordonnés dans le format de la banque de données de protéine
(PDB). Le programme se sert d'une armature de référence récemment recommandée pour la
description de la géométrie de paire de base d'acide nucléique et d'un arrangement de
Mouna Essabbah 13
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Portant un regard plus biologique, nous avons observé d’autres travaux de recherche qui se
sont appuyés sur le modèle tridimensionnel. L'analyse structurale à haute résolution de la
transposition d'ADN Mu a été réussie par la reconstruction 3D des images obtenues en
balayant la microscopie électronique de transmission (TIGE) aux cryo-températures[2].
D'autre part, une structure tridimensionnelle a servi de modèle pour l'étude de la réplication
se basant sur l'analyse des degrés de recourbement le long de l'axe de l'ADN.
Ces recherches représentent une base structurale assez riche pour différents domaines tel
que la fonction biochimique, l'étude de différents phénomènes (réplication, transcription),
etc.
Mouna Essabbah 14
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Préparation de l'échantillon
Toute cette partie, de la préparation de l'échantillon à son observation en AFM, a été réalisé
par l'équipe du Laboratoire Multicouches Nanométriques [9] de l'université d'Evry-Val-
d'Essonne sous la direction du Professeur Alain ZOZIME.
5 μl ont été soigneusement pipé sur la surface d'un morceau de mica fraîchement fendu (le
mica rouge couvre des sciences de microscopie électronique). Après un temps d'adsorption
entre 1 - 20 mn, 5-6 gouttes d'eau doublement distillées et filtrées à 0.22 μm ont été
soigneusement placées sur la surface de mica, formant une grande baisse sur le mica,
stabilisé par la tension de la surface. Un papier filtre a été placé au bord du mica, enlevant
le liquide restant par force capillaire. On utilise le mica parce que c'est une molécule
facilement composable et il aisé de la reconstituer.
Une fois l'ADN extraite du noyau, on en a déposé sur l'échantillon. L'ADN se fixe au mica
à certains points d'ancrages. L'observation se fait à l'air après l'étape dite de séchage.
L'échantillon préparé a été examiné avec l'AFM dans les dix minutes suivantes.
Les deux images ont été prises dans les mêmes conditions, à savoir :
Mouna Essabbah 15
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Néanmoins, cette technique présente un problème. Il réside dans le fait que si la fixation de
l'ADN au mica est très forte cela pourrait changer la conformation de l'ADN sur la plaque.
Contrairement, si la fixation est trop faible la molécule risque d'être déplacée par la tige du
microscope AFM (Annexe 3), et elle sera donc non visible sur l'image.
Par conséquent, beaucoup de biologistes ont abandonné la microscopie à AFM pour cause
de modification de la conformation de l'objet à observer lors de son adsorption à la plaque.
Cela n'empêche pas notre intérêt à ce type de microscopie car malgré ces aspects négatifs,
l'AFM offre des images plus nettes que celle offertes par d'autres techniques comme les
micrographes à cryo-électron, or ce critère est prédominent dans le traitement d'image.
Mouna Essabbah 16
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Nous avons remarqué que les biologistes manipulaient ADN-Viewer, et les modèles prédits
en général, avec une certaine réserve, trouvant qu'il s'agit de prédictions locales qui ne
peuvent s'appliquer sur une structure entière (longue échelle). L'erreur serait cumulée, elle
serait évidement plus grande à plus grande échelle.
Par conséquent, nous avons décidé d'allier ces deux approches pour estimer l'exactitude de
notre logiciel et pouvoir ainsi lui apporter les améliorations nécessaires pour plus de
crédibilité.
Il faut donc confronter les deux modèles, réel et prédit, par une comparaison des trajectoires
d'ADN préalablement extraites.
Mouna Essabbah 17
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Chapitre III
Entre modèles prédits et données terrain
Mouna Essabbah 18
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Ensuite les biophysiciens utilisent la technique d'AFM (décrite dans 1.3) qui demande
l'adsorption de l'ADN sur la plaque de mica. Ceci entraîne potentiellement la modification
de la conformation de la molécule. Il est à noter que lors de l'observation, l'ADN n'est pas
écrasée avec une autre plaque (lamelle), par contre, la pointe du microscope ne détecte que
les formes à la surface et ne nous renseigne pas sur la profondeur. Ainsi, la forme spatiale
réelle est « aplatie ». Ce que nous observons alors n'est qu'une projection planaire de
l'ADN. Le point de vue de l'observateur (réel ou virtuel) influence la vue de la forme de la
trajectoire.
Ainsi, le premier problème commence dès la capture de la molécule car il est très difficile
de prétendre que la forme de sa trajectoire lors de l'observation est bien celle de sa
conformation au sein même du noyau (in vivo).
Ceci dit l'approche est intéressante car elle nous fournit des images traitables. De plus, on
peut espérer trouver des constantes de forme qui permettent de valider la méthode.
Le dispositif utilisé par les biologistes afin de fabriquer des images de séquences d’ADN,
influe énormément sur la qualité des images obtenues. Par dispositif, nous voulons parler
du type de microscope, du milieu de la culture et des conditions de la manipulation
Mouna Essabbah 19
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
(température, pression…). La complexité des images que nous allons traiter (Figure.5) est
due essentiellement à ces contraintes de capture.
Il faut aussi prendre en considération l’interprétation du cliché, car il peut s’avérer, pour un
simple informaticien, qu’un bout de séquence est bien déterminé par un début et une fin. En
revanche un biologiste considérera que la séquence est incomplète suite à des problèmes
d'occultation ou de coupure involontaires.
Il peut arriver que l’informaticien, par un surplus de traitement, supprime certains éléments
actifs de l’ADN croyant qu’il s’agissait de bruit.
Il est alors impératif de collaborer avec des biologistes pour un meilleur avancement du
travail. C'est pour cela que nous nous sommes rapproché de l'équipe du Prof. Alain Zozime
du LMN-Evry.
Mon travail consiste à exploiter les images AFM pour rendre le modèle plus global, et ainsi
corriger ses lacunes, espérant pouvoir affirmer la validité du modèle adopté par ADN-
Viewer.
Mouna Essabbah 20
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
À notre connaissance, ce sujet présente une problématique nouvelle avec une part de risque
quant aux résultat qu'on espère obtenir. Il s'agit d'une recherche dans un domaine récent
encore vierge. Rares sont les études qui ont été faites sur les images microscopiques d'ADN
dans un but informatique (comme une donnée brute à traiter grâce à un système
informatique). On ne se servait de ces images que pour observer l'ADN et ses interactions
avec certaines protéines. Par ailleurs, pour confronter ces images au modèle 3D il fallait
disposer d'un logiciel comme ADN-Viewer.
Notre étude se présente alors sous forme d'un sujet ouvert. Nous ne pouvons pas prédire les
résultats que nous allons obtenir, si toute fois nous arrivons à tirer des conclusions.
Comment peut on alors comparer un modèle figé à celui qui ne cesse de se modifier, aussi
infiniment que cela peut être?
Tant de questions qui se posent aux quelles nous allons essayer de répondre dans ce qui
suit.
Mouna Essabbah 21
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
pourrait imaginer une base de donnée regroupant toutes ces trajectoires comme les formes
possibles que peut prendre l'ADN.
A ce moment là, on cherchera le modèle 2D prédit dans cette BDD selon un certain
coefficient de ressemblance. Ce procédé est identique à celui de la reconnaissance d'écriture
manuscrite [16].
Les trajectoires les plus complexes représentant le plasmide entier sont plus longues (de
taille 3600pb) et tortueuse (Figure.6.a), ce qui crée une diversité non négligeable de formes.
Ces formes peuvent aussi s'entrelacer ce qui rend l'extraction des squelettes difficile. Nous
proposons alors d'extraire quelques trajectoires qui sont entièrement indépendantes.
Ensuite, nous les comparerons avec le modèle prédit par ADN-Viewer.
Cette approche sera globale et se fera de forme à forme. Elle nous permettra de déceler s'il
y a erreur de prédiction.
Les trajectoires les plus simples (fragments d'ADN), qui ne sont pas longues (de taille
1400pb) sont extraites de différentes parties du plasmide (Figure.6.b), ne peuvent pas nous
informer sur la trajectoire adoptée par le plasmide. Cependant, elles nous informent sur la
forme de portions constituant le plasmide. Nous allons exploiter cet aspect pour les utiliser
afin d'établir une analyse locale du modèle.
L'approche consiste à extraire tous les squelettes possibles afin de les regrouper en classes.
A ce moment là, nous allons moyenner chaque classe par un élu représentatif. Le squelette
élu sera alors comparé, point à point, avec le modèle correspondant, donné par ADN-
Viewer.
Mouna Essabbah 22
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Figure 6. Les deux étapes de l’appariement des modèles réel et prédit (a) globale, (b) locale.
Le travail se fera alors en deux étapes : La première est l'analyse globale (grossière) du
modèle qui permettra de dire si oui ou non le modèle prédit correspond au modèle réel. La
deuxième est l'analyse locale qui nous permettra de quantifier l'erreur de prédiction et
d'affiner par la suite le modèle prédit (développée dans le chapitre suivant).
Celle que nous avons mise de coté consiste à reconstruire la structure tridimensionnelle du
modèle réel de l’ADN. Sachant qu’il existe une technique de comparaison de modèles 3D,
développée au sein du laboratoire [1], il nous suffira de choisir les motifs à comparer et de
les confronter à l’aide de cette méthode. La suite est la même que pour la première
approche (plus de détails dans le chapitre 4).
Mouna Essabbah 23
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Chapitre IV
Passage 3D-2D : Une approche guidée par
le modèle
Le passage du modèle 3D au modèle 2D est naturellement plus évident. En effet, il est bien
plus difficile de reconstruire un modèle 3D à partir d'images 2D, que d'obtenir un modèle
2D à partir de sa reconstruction 3D.
Mouna Essabbah 24
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Cette approche est dite guidée par le modèle, car on fait l'hypothèse que le modèle 3D est la
référence qu'il faut comparer avec les trajectoires réelles.
Cette étape consiste à traiter les images réelles à notre disposition de sorte à en détecter les
différentes formes possibles que peut adopter l’ADN. Une sélection est ensuite faite pour
ne garder que les trajectoires complètes et indépendantes des autres. Ces dernières seront
traitées pour qu’au final nous obtenons pour chaque forme un seul brin continu sur un fond
unifié. Aussi, nous décomposons le processus suivant les sous étapes suivantes.
La méthode impose un pré traitement assez important, car, le plus souvent, les images à
traiter sont très bruitées et le travail demande énormément de précision. Nous isolons
d'abord la partie qui nous intéresse (Figure.7). La trajectoire de l'ADN est très fine et
souvent accompagnée de petites particules qui compliquent la recherche. Il faut donc
plusieurs filtrages et lissages avant de pouvoir appliquer une segmentation (binarisation)
qui puisse nous donner un résultat satisfaisant.
Mouna Essabbah 25
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Lecture et affichage
Après la lecture et l'affichage de l'image, deux étapes basiques avant tout pré traitement,
nous pouvons à priori estimer la qualité de l'image et ainsi juger du degré de pré traitement
à mettre en oeuvre.
Filtrage
Une large partie des images microscopique d’ADN que nous avons pu collectées ont été
observées dans un milieu liquide, malgré l’étape de séchage faite par les biologistes, elles
sont souvent très bruités. L’ADN est perçue à travers un bruit assez important : les images
contiennent donc un signal et du bruit (dont on veut éliminer la plus grande partie possible),
pour se faire nous procédons à un filtrage afin de lisser l’image et d’atténuer le bruit.
Dans cette optique différents types de filtre on été étudiés, en voici les plus importants :
Cette technique consiste à modifier la valeur d’un pixel en tenant compte de la valeur des
pixels voisins. Ceci est obtenu en appliquant une matrice de calcul appelée noyau de
convolution qui définit le nombre de voisins concernés et la pondération à appliquer sur
leur valeur.
Mouna Essabbah 26
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Pour supprimer encore plus de bruit, nous pouvons faire un filtrage passe-bas médian. Le
principe de ce filtre est d’affecter au pixel central la valeur médiane de la série constituée
par ce même pixel et ses voisins.
Cette technique, comme le filtre passe-bas, permet un lissage de l’image tout en préservant
un peu mieux les contours de ses éléments.
Filtre Gaussien
La largeur du filtre est fonction de σ. Il s'agit d'un filtre séparable car la gaussienne 2D n'est
que produit de deux gaussiennes 1D. Nous avons choisi d'utiliser ce filtre, malgré le gros
lissage qu'il engendre entraînant une délocalisation partielle des bords, pour son
implémentation efficace. Les résultats de ce filtre sont illustrés dans la figure suivante
(Figure.8).
(a) (b)
Figure 8. (a) Image initiale, (b) Filtre Gaussien appliqué
Binarisation
Cette image binaire nous permet de détecter les différents objets de l’image en séparant
l’image en deux classes de pixels : le fond (en noir) et la forme (en blanc), comme le
montre la figure ci-dessous (Figure.9).
Mouna Essabbah 27
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
(a) (b)
Cette étape réalise un filtrage qui rend l’analyse d’image moins sensible au bruit. Elle
consiste à supprimer tous les points isolés. Nous nous intéressons seulement à la forme du
brin et non de ce qu’il y a autour. Ce filtre étant appliqué nous obtenons les résultats de la
Figure.10.
Mouna Essabbah 28
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
de l’objet. Un point appartient au squelette si les deux points du fond dont il est le plus
proche sont situés à égale distance. Le squelette ainsi obtenu permet de reconstruire l’objet
et varie en fonction de l’épaisseur de celui-ci. Cependant, dans le contexte de la
reconnaissance de trajectoire d'ADN, ce type de squelette n’est pas le meilleur, car on voit
apparaître des pattes souvent dues aux irrégularités du contour de la forme. Nous adoptons
alors un algorithme inspiré des méthodes de Stentiford (1983) et de Zang-Suen (1984) [18]
qui consiste à former le squelette par érosions successives. Le squelette ainsi obtenu
représente le trait le plus fin permettant de tracer l’objet (Figure.11.b).
Traitement du squelette
Mouna Essabbah 29
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Calcul de paramètres
Les paramètres sur lesquelles nous allons nous baser dépendent exclusivement de la
technique de détection d'objets que nous allons utiliser.
Par exemple, la technique d'identification par ensemble de distances se base sur des points
caractéristiques, nous avons choisi comme points d'intérêt les coins (détecteur de Harris
[19]).
En revanche, la méthode des contours déformables prend pour primitives des contours
fermés (détecteur de Canny [21]).
L'extraction des primitives sera détaillée dans la suite du rapport (paragraphe 3.2.3.2).
Une fois les étapes précédentes réalisées, nous passons à l'identification même des objets.
Cependant, il faudrait que le modèle 2D prédit soit extrait de son modèle 3D, car ne
l'oublions pas, ce dernier constitue notre modèle de référence, lequel nous allons chercher
dans l'échantillon des différents spécimens de notre image.
La classification ne concernera pas les trajectoires réelles complètes, car nous allons les
comparer, une à une, à la trajectoire témoin prédite.
Par contre, les fragments de trajectoires seront classés selon leur ressemblance à un degré
donné. La comparaison se fera donc au sein même de la sélection de brins extraits de
l'image réelle. Une fois les classes formées, nous comparerons un représentant de chaque
classe au modèle prédit correspondant.
Mouna Essabbah 30
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Figure.12 Dispositif immersif Muse. Visualiser des chromosomes en stéréoscopie sur des
écrans de 2m×2m à angle droit permet de plonger l'utilisateur au cœur de l'ADN.
Pour les besoins de ce travail, une entête a été rajoutée au fichier .coords, elle renferme les
matrices de rotations et de translations (selon les 3 axes) juste avant la sauvegarde
(Figure.13).
Mouna Essabbah 31
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Nous pouvons ainsi restituer la position, jugée la plus proche du réel, pour la projeter et
obtenir le modèle 2D correspondant.
Mouna Essabbah 32
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Mouna Essabbah 33
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Dans notre cas l'objet à détecter est la molécule d'ADN dans un échantillon microscopique
et la détection sera en fait confondue avec une identification. En effet, nous ne cherchons
pas seulement à déceler les objets mais aussi à les assimiler à un modèle témoin afin d'en
étudier la similarité.
Afin de trouver ces objets, le système doit appliquer quelques techniques que nous citerons
dans les sections suivantes. Ces techniques sont conçues pour rechercher des objets
particuliers.
Une grande partie de la recherche en analyse de forme considère la forme comme une
caractéristique d'une région d'image binaire. De telles méthodes emploient le contour d'un
objet ou son intérieur pour constituer un descripteur de forme. Leur application est
envisagée principalement dans les situations dans lesquelles un objet binaire est déjà
disponible ou peut être calculé par certaines étapes de pré-traitement comme la
segmentation, la détection de contours, la squelettisation, etc. Il s'agit de méthodes de
comparaison globale, forme à forme.
Mouna Essabbah 34
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Aussi il nous a fallu nous intéresser aux techniques d'extraction de primitives pour les
besoins de comparaison de modèles. Les primitives d'une comparaison globale sont les
contours des objets, pour une comparaison locale se sont les points d'intérêt (coins) qui sont
utilisés.
Contours
Pour cette partie du traitement nous nous sommes penché sur les différentes techniques de
détection de contours. La méthode la plus simple est sans aucun doute celle du gradient.
1 0
1 0
Cependant il existe des filtres qui peuvent rehausser le contraste d’une image permettant
ainsi d’accentuer les contours des objets présents.
Le filtre pass-haut laisse passer les hautes fréquences afin d’accentuer les contours. Le filtre
de Sobel sert à l’extraction des contours, il extrait les hautes fréquences verticales.
1 0 1
2 0 2
1 0 1
1 0 1
1 0 1
1 0 1
Finalement notre choix à porté sur le détecteur de Canny [21] très utilisé en traitement
d'image, qui optimise la détection de contour en précision et en localisation.
Mouna Essabbah 35
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Suite aux étapes de pré-traitement citées auparavant, nous obtenons une image binaire
dépourvue de tout bruit. Pour ces images là, nous avons établi un détecteur de contour
spécifique qui se base simplement sur le passage du noir (fond) au blanc (l'ADN).
Le but étant de gagner en temps de calcul par rapport à la méthode de Canny qui elle est
coûteuse.
Points caractéristiques
Comme dans ce qui précède, nous nous sommes penchés sur les différents détecteurs de
coins qui existent se basant sur l'analyse faite pas Schmid et al. [20]. Cette étude nous a
permis d'opter pour les coins comme primitives et de considérer le détecteur d'Harris
comme celui qui répond le plus à nos attentes par sa forte invariance aux rotations,
changement d'échelle et présence de bruit [19].
Un code Matlab est écrit dans ce but. Nous l'appliquons donc sur les deux modèles 2D (réel
et prédit), en imposant d'obtenir le même nombre de primitives.
Mouna Essabbah 36
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Notons que l'invariance par rapport aux transformations géométriques (rotation, translation,
changement d'échelle, etc) est très importante pour les applications de reconnaissance
d'objet.
Un descripteur de forme doit être assez discriminant pour pouvoir déceler les
ressemblances entre deux objets similaires. Il doit aussi faire abstraction des détails (du
bruit le plus souvent) pour ne représenter que les caractéristiques intrinsèques d'une forme.
Le but de la technique de « pattern matching » est de trouver chaque occurrence d'un objet
spécifique dans la scène en appliquant un prototype spécial. Le prototype est une image de
l'objet d'intérêt. Ce prototype est défini par un regroupement de valeurs de pixels qui se
Mouna Essabbah 37
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
corrèlent avec l'objet d'intérêt. Dans notre exemple, l'utilisateur veut trouver toutes les
trajectoires d'ADN de même forme que le modèle témoin.
Pour accomplir cette tâche, le masque de la trajectoire d'ADN est appliqué à l'image de telle
manière que les groupements des pixels qui se corrèlent avec le prototype soient près du
blanc, tandis que les groupes de pixels qui ne se corrèlent pas avec le prototype seront près
du noir.
Nous nous sommes intéressés à cette technique car elle nous renseigne sur la position de la
forme correspondante au prototype dans l'image. Nous voulions exploiter cet aspect sélectif
de cette méthode qui nous éviterais une classification. Malheureusement, une telle
corrélation ne détecte que les objets quasiment identiques. De plus les objets doivent avoir
une taille assez importante et une forme plus au moins géométrique, pour avoir des résultats
satisfaisants, ce qui n'est pas le cas de l'ADN.
Mouna Essabbah 38
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Cette méthode manque parfois de précision (elle peut détecter la même forme mais dans
des sens différents). Une manière pour y remédier est d'augmenter le nombre de voisins
avant de comparer.
Dans certains cas, cette solution empêchera les points d'intérêt d'être distingués. C'est
particulièrement vrai quand les points ont les mêmes caractéristiques locales que le point
désiré, mais en fait ne le sont pas.
Des groupes de pixels sont testés respectant l'ensemble d'ensembles de distance (une
distance pour chaque point dans le prototype de forme) dans une image.
Cette technique a été utilisée par Grigorescu et al.[11] pour créer un filtre de forme basé sur
les ensembles de distances.
Cependant, avec assez de prototypes, cette méthode peut traiter l'occultation partielle de
l'objet aussi bien que des changements d'orientation et de rotation. En conclusion, cette
technique est plus robuste que l'identification de modèle par corrélation.
La performance de cette méthode vient du fait qu'elle est invariante selon l'orientation de la
forme, la méthode n'est pas affectée par une rotation de l'image.
Mouna Essabbah 39
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Toutefois, cette technique n'est pas adaptée à l'aspect global de la comparaison, car plus les
séquences d'ADN sont longues et plus leurs formes sont complexes. Le nombre de coins
risque d'augmenter exponentiellement entraînant ainsi un décuplement des ensembles de
distances. Le temps de calcul conséquent diminuera les performances de cette méthode.
Cependant, il est intéressant de l'appliquer pour une comparaison locale, avec des fragments
de trajectoires et des portions de séquences.
L'idée de cette technique repose sur un modèle de contour ou un prototype de l'objet que
l'on souhaite détecter. Un contour fermé définit une série de points. Dans l'image,
l'ensemble de points dans cet échantillon est comparé à d'autres contours fermés. Si ces
contours sont une déformation acceptable du contour du calibre alors il y a correspondance.
Nous retrouvons cette approche dans des travaux en bioinformatique où l'on devait déceler
les cellules pathologiques d'un échantillon de sang observé au microscope [22].
Mikolajczyk et al. ont mis en place un détecteur local basé sur les contours, invariable aux
transformations de similitude, pour identifier les objets peu texturés, qui peuvent contenir
Mouna Essabbah 40
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
des trous et des parties tubulaires, dans des scènes encombrées et dans des conditions
arbitraires de visionnement [26].
Un modèle d'objet est appris d'une seul image d'apprentissage. L'objet est alors reconnu
dans de nouvelles images dans une série de processus qui appliquent des restrictions
géométriques de manière progressive.
L'approche par contours peut nous informer sur la longueur du bord, sur sa courbure, et sur
sur l'aire de la région délimitée.
Il est possible d'utiliser des approximations polygonales [28,29] lorsque les contours portent
des informations superflues pour une application donnée. La méthode consiste à diviser
chaque segment de courbe en plus petites courbes jusqu'à pourvoir l'approximer par un
segment linéaire avec un taux d'erreur acceptable. Le signal (la forme) peut aussi être
représenté par un descripteur de Fourrier [23].
IV-3- Conclusion
L'intérêt de cette approche, dite approche guidée par le modèle, est de se baser sur le
modèle prédit, donnée par ADN-Viewer. Dans ce cas, nous nous référons à un modèle déjà
existant dans le but de simplifier le traitement et de s'assurer d'avoir, au moins, un point de
départ unique.
De plus, le passage du modèle 3D vers le modèle 2D, par projection géométrique, est
simple à mettre en place.
Nous avons alors privilégié l'analyse d'image et la reconnaissance de forme 2D car nous
avons une forme d'origine à retrouver parmi un ensemble de formes différentes. Par
ailleurs, l'étude que nous avons menée nous a révélé que ce domaine regorge de travaux
Mouna Essabbah 41
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Cette approche, guidée par le modèle, évite une trop grande dépendance des données
(images réelles) que nous ne maîtrisons pas totalement.
Toutefois, cela nous a permis d'aboutir à un premier résultat assez satisfaisant (chapitre5).
Mouna Essabbah 42
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Chapitre V
Passage 2D-3D : Une approche guidée par
les données
Le logiciel ADN-Viewer est dans ce sens un programme adapté à ces objectifs. Pour les
mêmes raisons pour lesquels ADN-Viewer repose sur la vison tridimensionnelle immersive
(décrites dans le chapitre 1), nous avons décidé de mettre en oeuvre une approche orientée
vers les modèles tridimensionnels.
Cette approche est dite guidée par les données car elle prend comme référence les images
réelles. L'origine étant les données, nous allons aboutir à un modèle 3D réel par
Mouna Essabbah 43
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
La démarche n'est pas simple d'autant plus que nous traitons des images différentes que
celles de la première approche. Pourtant, nous envisageons de poursuivre cette recherche
car ce cheminement est une continuité de l'outil à valider, il offre un aspect plus homogène
et une manipulation plus aisée.
Mais pour effectuer une reconstruction 3D, il est nécessaire de disposer d’au moins de deux
images décalées, en espace ou en temps, de la même molécule d’ADN. A partir de ces
deux images, on peut appliquer la technique de stéréovision pour calculer le relief et obtenir
ainsi un modèle 3D de la trajectoire de l’ADN.
« La stéréoscopie (du grec stéréo : solide, scope : vision) est l'ensemble des techniques
mises en œuvre pour reproduire une perception du relief à partir de deux images planes. »
Encyclopédie Wikipédia
Cette méthode est apparue presque en même temps que la photographie. Le procédé de la
stéréoscopie est calqué sur la perception humaine du relief grâce aux deux images planes
que l'on perçoit de chaque oeil.
La mise en correspondance peut se faire d’une part par une méthode orientée corrélation
qui engendrera une carte de disparité des pixels assez dense, et d'autre part, elle peut se
faire par une méthode orientée primitives qui générera une liste (moins dense) de points mis
en correspondance.
Mouna Essabbah 44
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
La rectification des images et la calibration de la (les) caméra(s) sont des étapes non pas
moins importantes mais « facultatives » engendrant une meilleure reconstruction.
Selon les connaissances a priori des paramètres du système stéréo, la reconstruction se fera
de plusieurs façons. Elle peut se faire par triangulation absolue dans le cas d'un système
stéréo totalement calibré, ou relativement à une transformation projective quand le système
ne dispose que des correspondances [33].
Sans s'attarder plus sur le sujet, nous passons à l'application de ces principes dans notre
projet.
Les données que nous allons traiter sont légèrement différentes de celles que nous avons
précédemment manipulées. Il s'agit, pour cette fois-ci, de séquences vidéo capturées à
l'AFM, plus précisément d'images AFM prises à un intervalle de temps donné (Figure.18).
Mouna Essabbah 45
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Nous ne retenons que deux de ces images en choisissant les moins bruitées et où la
trajectoire est plus nette.
À noter que la qualité des images est la même que celles de l'approche précédente, ainsi le
besoin en pré-traitement est tout aussi le même. Nous procédons alors au filtrage, à la
binarisation et à la suppression des points isolés comme décrits dans la partie 3.2.1.1. Le
même procédé sera appliqué sur les deux images.
Comme nous l'avons énoncé dans la premier chapitre, la forme tridimensionnelle de l'ADN
constitue un pôle d'intérêt assez conséquent dans le domaine de la bioinformatique.
L'approche guidée par les données a déjà été exploité par M. Jacob et al. [17] pour la
reconstruction de filaments d'ADN mais cette fois-ci les données étaient des images de
micrographe à cryo-électron. La qualité des images était bien médiocre par rapport à celles
à notre disposition.
Mouna Essabbah 46
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
L'équipe a voulu mettre l'accent sur l'aspect de la réalité augmentée pour faciliter aux
biologistes la visualisation et l'exploration de la forme spatiale de l'ADN.
Évidement, il est plus parlant de comparer deux modèles 3D car un expert (biologiste) a
plus de chance de retrouver des similarités ou des dissimilitudes rien qu'en visualisant et en
manipulant les deux modèles ensemble.
La reconstruction se base sur les deux images stéréo (Figure.19) que nous avons
préalablement traitées.
L'étape suivante est d'établir une correspondance entre les points d'intérêts des deux images,
points que nous avons obtenu grâce au détecteur de coin de Harris [21]. À ces données va
être appliqué la géométrie épipolaire [32] afin d'obtenir la matrice essentielle (et
fondamentale), retrouver les droites épipolaires et localiser les épipoles.
Les images ci-dessous (Figure.20) illustrent les résultats de la mise en correspondance des
points caractéristiques. Le matching des points va nous permettre de calculer la matrice
fondamentale et ainsi localiser les épipoles.
Mouna Essabbah 47
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Pour cet exemple de paire stéréo nous obtenons les résultats suivants, sachant que x1 et x2
sont les vecteurs de points corrélés, F la matrice fondamentale et e1 et e2 les deux épipoles
:
F= e1 = e2 =
Mouna Essabbah 48
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Malheureusement, ce travail n'a pas pu être mené à terme car arrivé à l'étape de la
calibration, nous nous sommes confronté à un manque de données sur le microscope utilisé.
La calibration est une étape délicate et qui peut facilement limiter la qualité de la
reconstruction d'un objet donné.
Dans notre cas, sans calibration nous n'avons pas pu obtenir de résultat ni pour une
rectification des images ni pour la reconstruction. En effet, les images que nous traitons ne
présentent pas différents points de vues de la trajectoire puisque ce n'est pas le microscope
qui change d'angle de capture, mais c'est l'ADN qui se déplace légèrement.
« cet outil a pour but d'apparier des motifs 3d de d'ADN proches ayant des séquences
nucléotidiques très différentes. » J. Herisson.
Mouna Essabbah 49
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Sachant que cette méthode a été conçue pour rechercher un motif dans une séquence plus
grande. La solution proposée est de pré-calculer la succession d'angles pour le motif,
ensuite calculer au fur et à mesure les angles de la séquence.
S'il n'y a pas d'égalité on avance le motif d'un nucléotide dans la séquence et on
recommence le calcul des angles pour la séquence, et ainsi de suite jusqu'à la fin de la
séquence.
Les angles sont calculés à priori pour les deux motifs (ie. la trajectoire 3D réelle et le
modèle 3D prédit). Donc, pour un nucléotide de départ (le même pour les deux séquences à
comparer), nous obtiendrons deux séries d'angles successifs. Il est certain que nous
n'obtiendrons pas des angles égaux pour les deux modèles suite aux erreurs de capture des
images et des pertes dues au traitement.
Nous accepterons donc « l'égalité » des angles (ie. similarité entre les motifs) à une erreur ε
donnée.
Mouna Essabbah 50
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
V-4- Conclusion
Malheureusement la contrainte du temps a fait que cette partie du projet n'a pas pu être
finalisée. Toutefois, il reste en cours de développement et fera l'objet de la suite du stage
car nous pensons que l'idée de visualiser ce type de recalage grâce à la réalité virtuelle est
enrichissante. Cette approche guidée par les données part de l'essence même de la réalité de
la molécule vers son modèle prédit.
Ainsi, une visualisation globale des deux modèles associés peut déjà nous renseigner sur le
degré de ressemblance ou de différence des deux trajectoires.
Il n’est pas exclu, bien au contraire, qu’une intervention humaine puisse aider à ce type de
recalage 3D. Ceci est rendu possible avec la plate-forme EVR@ du l'IBISC.
Nous prévoyons d'approfondir notre collaboration avec les biophysiciens (L'équipe du Prf.
Alain Zozime) qui nous ont fourni les images microscopiques dans le but d'avoir plus de
connaissance sur les paramètres du système de capture (ie. Le microscope AFM).
Mouna Essabbah 51
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Chapitre VI
Résultats et discussion
Nous avons utilisé l’outil de programmation Matlab afin d’implémenter notre solution.
N'ayant pas fini d'explorer la deuxième approche, dite guidée par les données, nous n'avons
donc pas obtenu de résultats finaux. Cependant, à chaque étape du développement de cette
approche nous avons essayé de valider notre technique, les résultats produits n'étant pas
nombreux nous les avons précédemment donné dans le chapitre 4 au fur et à mesure de la
description de l'approche.
Pour la première approche, dite guidée par le modèle, nous nous sommes intéressés
particulièrement à la détection de l'erreur, entre modèle réel et modèle prédit, et non à sa
quantification. C'est pourquoi nous avons réalisé une comparaison globale, de forme à
forme.
Mouna Essabbah 52
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Nous avons alors traité seulement l'image des plasmides entiers (donnée par la Figure.4
dans 1.3). Bien entendu, notre référence, le modèle prédit, est restitué par ADN-Viewer
sous forme d'un fichier de coordonnées 3D des nucléotides composant la séquence du
plasmide (ie. Plasmide Eshirechia Coli pBR322).
Nous reproduisons alors ce modèle avec notre application (illustration dans la Figure.14
dans 3.2.2). Trois types de projections géométriques ont été mises en place sur les 3 plans
XY, XZ et YZ, dans le but d'obtenir la forme 2D du modèle prédit (voir Figure.15 dans
3.2.2).
La trajectoire de référence étant extraite du modèle 3D, nous entamons la recherche d'un
correspondant dans l'image réelle. Nous parcourons alors l'image à la recherche d'une
trajectoire entière du plasmide qui soit indépendante des autres spécimens, le procédé est
décrit dans le paragraphe 3.2.1.1. Une petite base de formes de trajectoires est ainsi
constituée.
La technique d'identification adoptée se base sur les ensembles de distances (détaillée dans
le paragraphe 3.2.3.2). Pour le modèle de référence (ie. trajectoire prédite), une
comparaison forme à forme est appliquée à chaque trajectoire de la base. Le résultat de la
plus proche distance nous indique une correspondance, laquelle va nous informer sur le
degré de similarité des deux trajectoires (ie. réelle et prédite).
Mouna Essabbah 53
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Im5 Im7
Im6 Im8
Im10 Im11
Im9 Im12
VI-2- Résultats
Nous avons implémenté l'algorithme donnée par C. Grigorescu et al. pour la reconnaissance
de forme basé sur les ensembles de distance [11]. Le choix de cette méthode nous a été
imposé par le fait que nous voulions un descripteur de forme qui soit invariant par les
transformations spatiales et facile à implémenter. En effet, limité par le temps, notre
premier objectif était d'établir quelques résultats, certes prématurés, donnant une idée sur la
validité de l'approche (ie. Si l'on doit continuer sur cette voie ou pas).
L'algorithme des ensembles de distance est fondé sur trois étapes. Voici une brève
description de son fonctionnement.
Soit S = {p1, p2, ..., pn} l'ensemble des points d'intérêts d'une image. Pour un point p ЄS
donné et N<n son voisinage, di(p) ЄR est la distance (ie. distance euclidienne) entre p et
ses i-plus proches voisins de S, 1<i<N. On appelle descripteur local :
Mouna Essabbah 54
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Maintenant, étant donnés deux points p ЄS1 et q ЄS2 de deux images différentes et leurs
ensembles de distance associés DSS1,N1 (p) et DSS2,N2 (q). Nous choisissons le même
voisinage pour les deux images N = N1 = N2.
1<i,j<N
Soit π(i) la correspondance un à un dans {1, 2, ..., N}, Пest l'ensemble de tous les π(i).
La dissimilitude entre deux ensembles de distance DSS1,N1 (p) et DS S2,N2 (q) est donnée par :
Si DS1,N1,S2,N2 (p,q) = 0 alors les deux ensembles de distances sont identiques. De cette
façon, la quantité DS1,N1,S2,N2(p,q) indique la différence entre deux points (ie. plus elle
s'approche de 0 et plus les 2 trajectoires se ressemblent). L'ensemble de distance d'un point,
ainsi que la mesure de dissimilitude définie ci-dessus, sont des moyens efficaces pour la
discrimination des points selon leur similitude à un point donné.
Pour un premier test, nous avons choisi de prendre pour référence la projection sur le plan
XY de la séquence (Figure.24) et pour voisinage N = 5 pour tous les points caractéristiques
des deux images.
Le tableau suivant présente les valeurs de dissimilitude DS1,N1,S2,N2 (p,q) entre l'image de
référence (Figure.24) et chacune des 15 images de la base de données que nous avons
établi.
Mouna Essabbah 55
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
VI-3- Discussion
Les testes ont révélé différentes valeurs de la distance DS1,N1,S2,N2, elles varient entre 0.1165
et 0.1878.
Figure.25 l'algorithme des ensembles de distance nous donne les trajectoires les plus proches
Le classement donné par l'algorithme de reconnaissance de forme basé sur les ensembles de
distances correspond donc à notre choix visuel.
Cependant, nous remarquons que la troisième trajectoire classée la plus proche du modèle
(Im6) ne lui ai pas ressemblante, pourtant a une distance assez faible par rapport au reste
des trajectoires de la base. Elle est notable grâce à la figure.26.
Mouna Essabbah 56
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Nous pensons que le problème réside dans le fait que cet algorithme, bien qu'il soit
invariant aux transformations géométriques, ne peut pas déceler l'orientation de la
trajectoire. Nous présentons la figure.27 pour illustrer cette problématique.
Il est clair que ces deux trajectoires ont des formes différentes, pourtant la distance entre les
primitives de chacune est la même. La distance euclidienne ne prend pas en considération
la position des points dans le plan, c'est bien ce qui fait l'invariance de cet algorithme. En
plus d'être son point fort, cette propriété est aussi son point faible car elle limite ses
performances.
Mouna Essabbah 57
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Conclusion et perspectives
Nous avons d'abord développé une approche guidée par le modèle, qui partant de
coordonnées 3D d'une séquence d'ADN et d'une image AFM de la même séquence, nous
arrivons à comparer la trajectoire réelle et la trajectoire prédite à une échelle globale.
A cet effet, il nous a fallu mettre en oeuvre des algorithmes de pré-traitement (ie. sélection,
filtrage, binarisation, etc), d'autres pour le traitement des trajectoires (ie. squelettisation).
Nous avons puisé des algorithmes dans la littérature en traitement d'image pour l'extraction
des primitives (ie. détecteurs de harris et de Canny) ainsi que pour la reconnaissance de
forme (ie. approche par ensemble de distance).
Les tests effectués sur les données dont nous disposons ont révélé une correspondance entre
le modèle réel et le modèle prédit. Cependant certaines correspondances trouvées par le
programme ne sont visiblement pas possibles.
Parallèlement, nous avons mené une étude sur une autre approche possible, cette fois-ci
guidée par les données. Le principe est de partir de l'image réelle pour la reconstruction 3D
de la trajectoire, ensuite comparer les deux modèles tridimensionnels.
De plus, nous nous sommes confrontés à des contraintes biologiques non négligeables, à
chaque étape de la recherche. En effet, le sujet est étroitement lié à la biologie, un monde
incertain où les interactions entre les différents éléments de la nature ne sont pas forcément
Mouna Essabbah 58
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Par conséquent, la recherche est loin d'être finie. La suite du stage nous permettra, avant
tout, de faire plus de testes à différentes conformations. Ensuite, d'essayer d'autres
techniques aussi performante pour la reconnaissance de forme, tel que l'approximation
polygonale.
Les travaux effectués au cours de ces quatre mois de recherches méritent de perdurer au
delà du stage, à cause de l'enjeu de ce sujet et de l'étendu des possibilités de solutions qui
s'offrent à nous. C'est pourquoi nous envisageons de reprendre les recherches dans le cadre
d'une thèse de doctorat.
À ce moment là, nous espérons automatiser la détection des trajectoires réelles dans l'image
grâce à des algorithmes de contours actifs.
D'autre part, nous projetons une collaboration plus étroite avec l'équipe de biophysiciens
afin d'avoir plus de données dans l'espoir de calibrer notre caméra et mettre à l'oeuvre la
deuxième approche, dite guidée par les données. La reconstruction tridimensionnelle de la
trajectoire réelle nous permettra d'exploiter la capacité de la réalité virtuelle en terme de
comparaison de motifs 3D.
Mouna Essabbah 59
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Bibliogarphies
[1] Joan Herisson, “Représentation spatiale et exploration virtuelles des génomes: une
analyse globale pour les éléments architecturaux des séquences”, Thèse de Doctorat
Université Paris XI, 2004.
[2] Yuan JF, Beniac DR, Chaconas G, Ottensmeyer FP. 3D reconstruction of the Mu
transposase and the Type 1 transpososome: a structural framework for Mu DNA
transposition. Genes Dev. 2005 Apr 1;19(7):840-52. Epub 2005 Mar 17.
[3] Gomez-Lorenzo MG, Valle M, Frank J, Gruss C, Sorzano CO, Chen XS, Donate LE,
Carazo JM. Large T antigen on the simian virus 40 origin of replication: a 3D snapshot
prior to DNA replication. EMBO J. 2003 Dec 1;22(23):6205-13.
[4] Liu S, Weaver DL, Taatjes DJ, Three-dimensional reconstruction by confocal laser
scanning microscopy in routine pathologic specimens of benign and malignant lesions of
the human breast. Histochem Cell Biol. 1997 Apr; 107(4):267-78.
[5] Xiang-Jun Lu and Wilma K. Olson, 3DNA: a software package for the analysis,
rebuilding and visualization of three-dimensional nucleic acid structures, Nucleic Acids
Research, 2003, Vol. 31, No. 17 5108-5121
[6] Asmahan Abu-Arish, Daphna Frenkiel-Krispin, Tobin Fricke, Tzvi Tzfira§, Vitaly
Citovsky, Sharon Grayer Wolf and Michael Elbaum,”Three-dimensional Reconstruction of
Agrobacterium VirE2 Protein with Single-stranded DNA”, Vol. 279, No. 24, Issue of June
11, pp. 25359–25363, 2004.
[7] Ma, Soatto, Kosecka and Sastry, An Invitation to 3D Vision: From Images to Geometric
Models, Springer Verlag, 2003 ISBN 0-387-00893-4 (errata as of 22-Mar-04)
Mouna Essabbah 60
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
[10] Amit Yali, 2D Object Detection and Recognition: Models, Algorithms, and Networks,
2002 Massachusetts Institute of Technology, ISBN 0-262-01194-8.
[11] Cosmin Grigorescu, Nicolai Petkov: Distance sets for shape filters and shape
recognition. IEEE Transactions on Image Processing 12(10): 1274-1286 (2003)
[12] Krishnapuram, B., C. M. Bishop, and M. Szummer (2004). Generative models and
Bayesian model comparison for shape recognition. In F. Kimura and H. Fujisawa (Eds.),
Proceedings Ninth International Workshop on Frontiers in Handwriting Recognition,
IWFHR-9, Tokyo, Japan, pp. 20–25.
[13] Eric Pichon and Delphine Nain and Marc Niethammer, A Laplace Equation Approach
for Shape Comparison
[14] Isabelle Bellin, histoire du traitement d'images, interstices 2004, rubrique “C'etait
hier”.
[15] Mathews Jacob, Thierry Blu, Michael Unser, “3-D reconstruction of DNA filaments
from stereo cryo-electron micrographs”.
[16] Miguel Po-Hsien Wu, Hadwritten Character Recognition, 2003, The school of
information technology and electrical engineering, The University of Queensland.
[17] H. Blum. A transformation for extracting new descriptors of shape. Models for
Perception of Speech and Visual Form, pages 362–380, 1967.
[18] J R Parker, Algorithms for Image Processing end computer Vision, New York (USA)
1997.
[19] C. Harris and M.J. Stephens. A combined corner and edge detector. In Alvey Vision
Conference, pages 147–152, 1988.
Mouna Essabbah 61
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
[21] J. Canny, A. (1986). A computational approach to edge detection. IEEE Trans. PAMI,
8:769 - 698.
[22] K. Djemal, C. Chettaoui, H. Maaref, Shapes description for cells sickle illness
Recognition, LSC Université Evry val d'Essonne.
[23] Tomislav Petkovi´c, Josip Krapac, Technical report:Shape description with Fourier
descriptors, 2002.
[24] S. Loncaric, “A survey of shape analysis techniques,” Pattern Recognition, vol. 31, no.
8, pp. 983–1001, 1998.
[25] R. C. Veltkamp and M. Hagedoorn, “State of the Art in Shape Matching,” Utrecht
Univ., Tech. Rep. UU-CS-1999-27, 1999.
[27] Mathews Jacob, Thierry Blu, Michael Unser, Efficient Energies and Algorithms for
Parametric Snakes, IEEE Transactions On Image Processing, vol.13, no. 9, 2004
[28] U. Ramer, An iterative procedure for the polygonal approximation of plane curves,
Comput. Graphics Image Process. 1, 1972, 244–256.
[29] Longin Jan Latecki and Rolf Lak¨amper, Convexity Rule for Shape Decomposition
Based on Discrete Contour Evolution, Computer Vision and Image Understanding Vol. 73,
No. 3, March, pp. 441–454, 1999
[30] Richard Hartley, Andrew Zisserman, Multiple View Geometry in Computer Vision
Second Edition, Cambridge University Press, March 2004.
Mouna Essabbah 62
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Annexes
Mouna Essabbah 63
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Forme textuelle
de l'ADN
L'ADN observée
au microscope
Mouna Essabbah 64
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
L'AFM est basée sur la mesure des forces entre un fin stylet et la surface étudiée. Le
capteur de force est un ressort-lame (stylet) encastré à une extrémité et muni d'une pointe à
l'autre extrémité, il est encore appelé « cantilever ». Les forces d'interaction modifient la
déflection ou la torsion statique ou oscillante du stylet. La mesure des déformations du
« cantilever » dans les microscopes de force actuels s'effectue, le plus souvent, grâce à la
déviation d'un faisceau lumineux (« diode laser ») réfléchi par l'extrémité du stylet,
méthode proposée dès 1988 par G. Meyer et N. Amer.
Le développement de cette méthode de sonde locale a été rapide aussi bien dans les
laboratoires universitaires qu'en milieu industriel. Des tâches de contrôle sur des lignes de
production sont couramment effectuées à l'aide de ce dispositif relativement simple à mettre
en œuvre. La majorité des utilisateurs cherche à obtenir des formes ou des tailles
caractéristiques de la surface ; en balayant l'échantillon sous le « cantilever », on obtient
l'image AFM recherchée. Mais on s'est très vite aperçu qu'il était possible avec le même
instrument de proposer des situations originales de « physique au nanomètre ».
Dans une première partie, l'instrumentation est décrite et les différents modes de
fonctionnement (contact, résonnant, « tapping », frottement…) sont présentés de façon
générale. En insistant sur les potentialités de l'instrument, on explicite les fondements des
Mouna Essabbah 65
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
principales méthodes utilisées, sans être exhaustif. Dans une seconde partie, des
applications physiques dans divers domaines sont présentées.
Mouna Essabbah 66
M2 IPCC-Image Confrontation entre modèles et données réelles pour la structure
spatiale des molécules d’ADN par le biais de la réalité augmentée
Mouna Essabbah 67