Académique Documents
Professionnel Documents
Culture Documents
BIOLÓGICAS
- A A G C T T C C G C - A C
G C A GG T - C C G C TA C
COMO ESCOLHER O MELHOR ALINHAMENTO?
SEQ1: ATCGGTCCAA
SEQ2: ATGGGACCAAAA
ATCGGTCCAA ATCGGTCC AA
ATGGGACCAAAA AT GGGACCAAAA
COMO ESCOLHER O MELHOR ALINHAMENTO?
C
PROBLEMAS
• Regiões repetitivas
• Orientação desconhecida das sequências
• Falta de cobertura da sequência original
• Erros de sequenciamento
• Tempo de execução para comparar todos os
fragmentos entre si
PROBLEMA 1: ERROS DE SEQUENCIAMENTO
• Tendo dois fragmentos R e T verificar se o sufixo
de R é igual ao prefixo de T e vice-versa
R R
T T
S S
R
A T G G C C G A A G G T T
A A G C T T C C G C A C
T
A A G C T T C C G C A C
G C A G G T - C
U
A T G G C C G A A G G T T C C G C A C
S
PROBLEMA 2: TEMPO DE EXECUÇÃO
• Testar todos os possíveis alinhamentos de duas
sequências de tamanho n é exponencial de n (nn)
• Supondo que o alinhamento de 2 sequências
com 100 bp leva 1 segundo o alinhamento de um
genoma de 1.000 bp levaria trilhões de anos
• Se quero buscar sobreposições entre 1.000.000
de fragmentos de cerca de 500 pb cada, quanto
tempo isso ia demorar???
• 1ª solução: programação dinâmica
PROGRAMAÇÃO DINÂMICA
ATGGG C
ALINHAMENTO GLOBAL
• Sequência 1: AGCC
• Sequência 2: AAACC
• Gap: -2
• Mismatch: -1
• Match: 1
ALINHAMENTO GLOBAL
- A G C C
- 0 -2 -4 -6 -8
A -2
A -4 G C
A ???? - -
-6
C -8
C -10
ALINHAMENTO GLOBAL
- A G C C
- 0 -2 -4 -6 -8
A -2 (i, j)
A -4 Máximo
(i-1, j) - 2 = -2 -2 = -4
A -6
(i, j-1) - 2 = -2 -2 = -4
C -8 (i-1, j-1) + p(i, j) = 0 + 1 = 1
C -10 Match: A e A
ALINHAMENTO GLOBAL
- A G C C
- 0 -2 -4 -6 -8
A -2 1
A -4
A -6
C -8
C -10
ALINHAMENTO GLOBAL
- A G C C
- 0 -2 -4 -6 -8
A -2 1 (i,j)
A -4 Máximo
(i-1, j) - 2 = -4 -2 = -6
A -6
(i, j-1) - 2 = 1 -2 = -1
C -8 (i-1, j-1) + p(i, j) = -2 - 1 = -3
C -10 Mismatch: A e G
ALINHAMENTO GLOBAL
- A G C C
- 0 -2 -4 -6 -8
A -2 1 -1
A -4
A -6
C -8
C -10
ALINHAMENTO GLOBAL
- A G C C
- 0 -2 -4 -6 -8
A -2 1 -1 -3 -5
A -4 -1 0 -2 -4
A -6 -3 -2 -1 -3
C -8 -5 -4 -1 0
C -10 -7 -6 -3 0
RECONSTRUÇÃO DO ALINHAMENTO
A -2 1 -1 -3 -5
A -4 -1 0 -2 -4
A -6 -3 -2 -1 -3
C -8 -5 -4 -1 0
C -10 -7 -6 -3 0
ALINHAMENTO GLOBAL
AGCC AG CC A GCC
• Matchs: 3
• Mismatches: 1
• Gaps: 1
• Score = 3 * 1 + 1 * (-1) + 1 * (-2) = 0
ALINHAMENTO LOCAL
ATCGGTCCAA
ATGGG C
ALINHAMENTO LOCAL
• Sequência 1: ACC
• Sequência 2: AAACCGT
• Gap: -2
• Mismatch: -1
• Match: 1
• Matriz de alinhamento do alinhamento global
com algumas adaptações
ALINHAMENTO LOCAL
- A A A C C G T
- 0 0 0 0 0 0 0 0
A 0
C G
C 0 ???? - -
C 0
ALINHAMENTO LOCAL
- A A A C C G T
- 0 0 0 0 0 0 0 0
A 0 (i,j) Máximo
0
(i-1, j) - 2 = 0 -2 = -2
C 0
(i, j-1) - 2 = 0 -2 = -2
(i-1, j-1) + p(i, j) = 0 + 1 = 1
C 0
Match: A e A
ALINHAMENTO LOCAL
- A A A C C G T
- 0 0 0 0 0 0 0 0
A 0 1
C 0
C 0
ALINHAMENTO LOCAL
- A A A C C G T
- 0 0 0 0 0 0 0 0
A 0 1 1 1 0 (i,j)
C 0 0 Máximo
(i-1, j) - 2 = 0 - 2 = -2
(i, j-1) - 2 = 0 - 2 = -2
C 0 (i-1, j-1) + p(i, j) = 0 - 1 = -1 Mismatch:
AeC
ALINHAMENTO LOCAL
- A A A C C G T
- 0 0 0 0 0 0 0 0
A 0 1 1 1 0 0
C 0
C 0
ALINHAMENTO LOCAL
- A A A C C G T
- 0 0 0 0 0 0 0 0
A 0 1 1 1 0 0 0 0
C 0 0 0 0 2 1 0 0
C 0 0 0 0 1 3 0 0
RECONSTRUÇÃO DO ALINHAMENTO
- A A A C C G T
- 0 0 0 0 0 0 0 0
A 0 1 1 1 0 0 0 0
C 0 0 0 0 2 1 0 0
C 0 0 0 0 1 3 0 0
ALINHAMENTO LOCAL
AAACC G T
ACC
SCORE DO ALINHAMENTO: 3
ALINHAMENTO SEMI-GLOBAL
CAGCATGGTGGATTCTCGC
ATTCAGCGTGG
ALINHAMENTO SEMI-GLOBAL
• Sequência 1: CGTAT
• Sequência 2: AACCGT
• Gap: -2
• Mismatch: -1
• Match: 1
• Matriz de alinhamento do alinhamento global
com algumas adaptações -> 1ª linha e coluna são
computadas com zero
ALINHAMENTO SEMI-GLOBAL
- A A C C G T
- 0 0 0 0 0 0 0
C 0
G 0
???? C G
T 0 - -
A 0
T 0
ALINHAMENTO SEMI-GLOBAL
- A A C C G T
- 0 0 0 0 0 0 0
C 0 (i,j) Máximo
(i-1, j) - 2 = 0 -2 = -2
G 0
(i, j-1) - 2 = 0 -2 = -2
T 0 (i-1, j-1) + p(i, j) = 0 - 1 = - 1
A 0 Mismatch: C e A
T 0
ALINHAMENTO SEMI-GLOBAL
- A A C C G T
- 0 0 0 0 0 0 0
C 0 -1
G 0
T 0
A 0
T 0
ALINHAMENTO SEMI-GLOBAL
- A A C C G T
- 0 0 0 0 0 0 0
C 0 -1 -1 (i,j)
G 0 Máximo
(i-1, j) - 2 = 0 -2 = -2
T 0 (i, j-1) - 2 = -1 -2 = -3
(i-1, j-1) + p(i, j) = 0 + 1 = 1
A 0
T 0 Match: C e C
ALINHAMENTO SEMI-GLOBAL
- A A C C G T
- 0 0 0 0 0 0 0
C 0 -1 -1 1
G 0
T 0
A 0
T 0
ALINHAMENTO SEMI-GLOBAL
- A A C C G T
- 0 0 0 0 0 0 0
C 0 -1 -1 1 1 -1 -1
G 0 -1 -2 -1 0 2 0
T 0 -1 -2 -3 -2 0 3
A 0 1 0 -2 -4 -2 1
T 0 -1 0 -1 -3 -5 -1
RECONSTRUÇÃO DO ALINHAMENTO
- A A C C G T
- 0 0 0 0 0 0 0
C 0 -1 -1 1 1 -1 -1
G 0 -1 -2 -1 0 2 0
T 0 -1 -2 -3 -2 0 3
A 0 1 0 -2 -4 -2 1
T 0 -1 0 -1 -3 -5 -1
MATRIZ ALINHAMENTO GLOBAL
- A A C C G T
- 0 -2 -4 -6 -8 -10 -12
C -2 -1 -3 -3 -5 -7 -9
G -4 -3 -2 -4 -4 -4 -6
T -6 -5 -4 -3 -5 -5 -3
A -8 -5 -4 -5 -4 -6 -5
T -10 -7 -6 -5 -6 -5 -5
GLOBAL X SEMI-GLOBAL
GLOBAL SEMI-GLOBAL
CGTA T CGTA T
AACCGT AACCGT
A T T A C G G T C C A G C T A
K = 10
BUSCAR ALINHAMENTOS PRÉVIOS
A T T A C G G T C C A G C T A
A T T A C G G T C C
T T A C G G T C C A
T A C G G T C C A G
A C G G T C C A G C
C G G T C C A G C T
G G T C C A G C T A
BUSCAR ALINHAMENTOS PRÉVIOS
o -> Tamanho
TACA ATTACGGTCC C GA da sobreposição
|| |||||||||| | ||
TAGT ATTACGGTCC CAGA
P -> % de bases
idênticas em o
2k 2k
k