Vous êtes sur la page 1sur 2

TD 3 Bioinformatique – M1 SPGF

Correction Alignements de séquences


Octobre 2007

Exercice 1 :
Séquence 1 : AAGTCATTCGCACATCG
Séquence 2 : AACACATCG
Solution :

A A G T C A T T C G C A C A T C G
A x x x x x
A x x x x x
C x x x x x
A x x x x x
C x x x x x
A x x x x x
T x x x x
C x x x x x
G x x x

Après application d’un filtre :


A A G T C A T T C G C A C A T C G
A
A x
C x x
A x x
C x x
A x x
T x x x
C x x
G x x

Exercice 7 :

Exemple d’alignement
Séquence 1: GENETICS
Séquence 2: GENESIS

Attention : Dans ces graphiques on montre


le sens des flèches pour « remonter » à la
première case en suivant les flèches
précédemment obtenues. Comme il a été vu
en TD, les flèches sont obtenues en
appliquant la formule de récurrence à
partir de la première case.

Score=31
Solution de l’exercice
Séquence 1: HEAGAWGHEE
Séquence 2: PGAWHEAE

Un chemin alternatif est représenté en


bleu. L’alignement correspondant est
celui-ci :
HEAGAWGHE-E
--PGAW-HEAE

Score=17

Exercice 8:
Calculez la E-value et la P-value des alignements obtenus précédemment avec les paramètres λ = 1 et K= 0,25 et sachant que la
base de données contient 1.106 acides aminés.
Exemple : Alignement deuxième série de séquence : score=17 séquence sonde : HEAGAWGHEE
E-value= 0,25x10x1.106 x e-17= 0,10