Académique Documents
Professionnel Documents
Culture Documents
Problématique
Conception
Réalisation et tests
Conclusion et perspectives
2
Introduction
Emergence de la bioinformatique comme une jeune
science multidisciplinaire
Emergence des méthodes en biologie
o volume de données biologiques très important
o données difficiles à traiter manuellement ou par des
calculs simples.
• Exploitation par les moyens biochimiques et les analyses in
vitro très coûteuse en temps et en argent.
4
Problématique
Acide aminé Lettre
alanine A
cystéine C
acide aspartique D Ensemble
Ensemble d’atomes
d’atomes
acide glutamique E dans
dans l’espace
l’espace
phénylalanine F
glycine G
histidine H
isoleucine I Les
Les acides
acides aminés
aminés
lysine K
-- Constituants
Constituants des
des protéines
protéines
leucine L --Composés
méthionine m Composés d’atomes
d’atomes
--Représentés
Représentés par
par des
des lettres
lettres
asparagine n
proline P
glutamine Q
arginine R
sérine S
thréonine T
valine V
tryptophane W
tyrosine Y
5
Problématique
A G E T G A C T A
Structure
Structure primaire
primaire
-définie
-définie par
par lala connaissance
connaissance de
de la
la
nature
nature des
des acides
acides aminés
aminés et
et par
par
l'ordre
l'ordre de
de leur
leur enchaînement
enchaînement
-- Peut
Peut être
être présentée
présentée par
par une
une
chaine
chaine de
de caractères
caractères
6
Problématique
Structure
Structure secondaire
secondaire et
et tertiaire
tertiaire
-définie
-définie par
par la
la forme
forme géométrique
géométrique
de
de la
la chaîne
chaîne d'acides
d'acides aminés
aminés
-- Peut
Peut être
être présentée
présentée par
par un
un graphe
graphe
dans
dans l’espace
l’espace
7
Problématique
Les protéines contiennent des patterns ou motifs qui
ont été préservés tout au long de l'évolution.
8
Problématique
Taches à réaliser :
- Extraction des motifs à partir des graphes des
acides aminés
9
Méthode d’extraction des motifs
10
Méthode d’extraction des motifs
L’algorithme KMR
permet d’identifier les mots répétés dans des chaînes
de caractères, des arbres ou des tableaux.
11
Méthode d’extraction des motifs
13
Méthode d’extraction des motifs
Extension de l’algorithme pour les
graphes
Une relation d’équivalence Ek, 1≤k≤m, peut être représentée par un vecteur Vk[1.. m-
k+1], où chaque composante Vk[i], 1≤i≤m-k+1, de ce vecteur représente le numéro de
la classe d’équivalence à laquelle appartient la position i .
fusionner les nœuds ayant un voisin commun présent dans la séquence primaire.
Les positions i dans la description séquentielle sont placées dans les ensembles de
piles P et Q de la façon suivante :
Les positions i qui appartiennent à la même classe de E sont mises dans la
même pile P (V[i]).
On empile seulement les positions qui sont présents dans la séquence
primaire.
Chaque élément de P est dépilé et les numéros i ainsi obtenus sont placés
dans toutes les piles Q correspondantes aux classes de tous les successeurs
du nœud causant l’empilement de i vers la pile Q considérée.
Si la classe Va de chaque position déjà retirée est égale à la classe de la
position précédemment retirée. Sinon on a une nouvelle classe
Une classe est déclarée comme motif si elle n’est plus utilisée pour construire de
nouvelles classes d’ordre supérieur, autrement dit si les piles P et Q correspondantes
n’interviennent plus à la construction de nouvelles classes.
Méthode d’extraction des motifs
15
Algorithme d’extraction des motifs
Exemple
16
Algorithme d’extraction des motifs
Exemple
Description séquentielle globale
Initialisation
Classe1: Noeuds {G } - Arêtes {}
Classe2: Noeuds {A } - Arêtes {}
Classe3: Noeuds {C } - Arêtes {}
Classe4: Noeuds {V } - Arêtes {}
Classe5: Noeuds {T } - Arêtes {}
Classe6: Noeuds {F } - Arêtes {}
17
Algorithme d’extraction des motifs
Première itération
Empilement dans des piles Pi
Nouvelles classes
Noeuds {A, C } - Arêtes {0-1 }- positions: 2 , 12
Noeuds {A, T } - Arêtes {0-1 }- positions: 2 , 12
Fusion
Nœuds {A, C, T } - Arêtes {0-1 ,0-2 }- positions: 2 , 12
18
Algorithme d’extraction des motifs
Exemple
19
Algorithme d’extraction des motifs
Exemple
20
Algorithme d’extraction des motifs
21
Conception
22
Conception
23
Conception
Cas d’utilisation « Ajouter les protéines à
traiter »
24
Conception
Cas d’utilisation «Visualiser une protéine en 3D»
25
Conception
Cas d’utilisation «Extraire les plus longs motifs
communs»
26
Conception
27
Réalisation et tests
28
Réalisation et Tests
Environnement logiciel
◦ L’IDE NetBeans
◦ Librairie JMol
29
Réalisation et Tests
30
Réalisation et Tests
Données Réelles
101 protéines de la famille Actinobacteria
70 protéines de la famille Viridiplantae
Comparaison entre graphe et séquence primaire
31
Réalisation et Tests
32
Conclusion
33
Perspectives
Nous proposons
34
Merci de votre temps
35