Académique Documents
Professionnel Documents
Culture Documents
Bioinformtica
COMPANY
LOGO
Filogentica
1
Introduccin
rboles
Programas - Referencias
J. C. Carbajal L.
D.A.I. Bioinformtica
Introduccin
COMPANY
LOGO
D.A.I. Bioinformtica
Introduccin
COMPANY
LOGO
Introduccin
COMPANY
LOGO
J. C. Carbajal L.
D.A.I. Bioinformtica
Introduccin
COMPANY
LOGO
J. C. Carbajal L.
D.A.I. Bioinformtica
Introduccin
COMPANY
LOGO
Los rboles de
Haeckel ya incluyen
una raz
Su primer rbol
(1866) insina el
ancestro del
hombre .
Su segundo rbol
(1879) abandona el
antropocentrismo
D.A.I. Bioinformtica
J. C. Carbajal L.
D.A.I. Bioinformtica
J. C. Carbajal L.
23/06/2016
COMPANY
LOGO
Introduccin
Introduccin
J. C. Carbajal L.
D.A.I. Bioinformtica
rboles
rboles
D.A.I. Bioinformtica
rboles
rboles
Caractersticas
J. C. Carbajal L.
J. C. Carbajal L.
D.A.I. Bioinformtica
COMPANY
LOGO
Representa ancestros
hipotticos de los taxones
HTU: Hypothetical
Taxonomic Unit
Nodo raz: ltimo nodo
interno
Ancestro comn ms
reciente de todos los
taxones
COMPANY
LOGO
J. C. Carbajal L.
J. C. Carbajal L.
D.A.I. Bioinformtica
COMPANY
LOGO
rboles
COMPANY
LOGO
COMPANY
LOGO
fundamentales
J. C. Carbajal L.
23/06/2016
Tipos de rbol
rbol no escalado
La longitud de
las ramas es
constante
rbol escalado
COMPANY
LOGO
COMPANY
LOGO
Tipos de rbol
La longitud de
las ramas es
proporcional
al n de
cambios en la
secuencia
Tipos de rbol
COMPANY
LOGO
rboles y complejidad
J. C. Carbajal L.
COMPANY
LOGO
J. C. Carbajal L.
COMPANY
LOGO
Tipos de rbol
D.A.I. Bioinformtica
J. C. Carbajal L.
COMPANY
LOGO
Anlisis filogentico
N de posibles topologas
para n nodos finales:
Para rboles
enraizados:
= 2 5 !/23 3
Para rboles no
enraizados:
D.A.I. Bioinformtica
J. C. Carbajal L.
Anlisis filogentico
= 2 3 !/22 2
A partir de n=12, es
obligatorio usar
heursticas
Imposible calcular
todos los rboles
posibles
D.A.I. Bioinformtica
J. C. Carbajal L.
D.A.I. Bioinformtica
J. C. Carbajal L.
23/06/2016
Anlisis filogentico
D.A.I. Bioinformtica
COMPANY
LOGO
1.
2.
3.
4.
5.
J. C. Carbajal L.
D.A.I. Bioinformtica
COMPANY
LOGO
COMPANY
LOGO
Fases
J. C. Carbajal L.
COMPANY
LOGO
Modelos de sustitucin
Modelos de sustitucin
J. C. Carbajal L.
D.A.I. Bioinformtica
COMPANY
LOGO
Correccin de Jukes-Cantor
D.A.I. Bioinformtica
J. C. Carbajal L.
J. C. Carbajal L.
COMPANY
LOGO
=
ln 1
1
es una estimacin del nmero de cambios reales
Considera que la probabilidad de sustitucin es igual
para todas las combinaciones de nucletidos /
aminocidos
D.A.I. Bioinformtica
J. C. Carbajal L.
23/06/2016
Modelo de Kimura
D.A.I. Bioinformtica
COMPANY
LOGO
UPGMA
El proceso es el siguiente:
a) Calculamos la matriz de distancias, elegimos
la menor distancia: 1,2
b) Unimos las secuencias 1 y 2, siendo la
longitud de la rama la 0.5 1,2 Calculamos las
distancias al nuevo nodo (1,2) y
seleccionamos la menor distancia ahora: 4,5
c) Calculamos las distancias al nuevo nodo (4,5),
la longitud de las ramas, y elegimos de nuevo
la menor: 3,45
J. C. Carbajal L.
Mtodos
basados en
caracteres
D.A.I. Bioinformtica
COMPANY
LOGO
COMPANY
LOGO
J. C. Carbajal L.
Inferencia filogentica
J. C. Carbajal L.
Debido a la
diferencia en anillos
D.A.I. Bioinformtica
COMPANY
LOGO
Mtodos de distancia
J. C. Carbajal L.
D.A.I. Bioinformtica
Modelo Gamma
COMPANY
LOGO
Modelo de Kimura
D.A.I. Bioinformtica
COMPANY
LOGO
D.A.I. Bioinformtica
J. C. Carbajal L.
23/06/2016
COMPANY
LOGO
Neighbor joining
Se definen dos nodos como vecinos si
existe un nodo interno X que los
conecta directamente
Mtodo
COMPANY
LOGO
J. C. Carbajal L.
D.A.I. Bioinformtica
COMPANY
LOGO
UPGMA - Procedimiento
UPGMA - Algoritmo
J. C. Carbajal L.
COMPANY
LOGO
UPGMA -
COMPANY
LOGO
1
,
+
D.A.I. Bioinformtica
J. C. Carbajal L.
D.A.I. Bioinformtica
Donde = | | y = | |
D.A.I. Bioinformtica
Ejemplo 1
J. C. Carbajal L.
COMPANY
LOGO
conectoras y a () la longitud 2
.
Calculo de la distancia desde el nuevo cluster a todos los
otros clusters como un promedio de las distancias de sus
componentes.
, , =
+
+ ,
+ ,
Eliminar las columnas y filas en D y adicionar una columna y
una fila por cluster (), con ,
Realizar todo el procedimiento hasta que no queden clusters.
D.A.I. Bioinformtica
J. C. Carbajal L.
D.A.I. Bioinformtica
J. C. Carbajal L.
23/06/2016
Ejemplo 1 -
D.A.I. Bioinformtica
Ejemplo 1 -
D.A.I. Bioinformtica
Ejemplo 1 -
D.A.I. Bioinformtica
COMPANY
LOGO
J. C. Carbajal L.
COMPANY
LOGO
J. C. Carbajal L.
COMPANY
LOGO
J. C. Carbajal L.
Ejemplo 1 -
D.A.I. Bioinformtica
Ejemplo 1 -
D.A.I. Bioinformtica
Ejemplo 2
D.A.I. Bioinformtica
COMPANY
LOGO
J. C. Carbajal L.
COMPANY
LOGO
J. C. Carbajal L.
COMPANY
LOGO
J. C. Carbajal L.
23/06/2016
Ejemplo 2 -
D.A.I. Bioinformtica
Ejemplo 2 -
D.A.I. Bioinformtica
Ejemplo 2 -
COMPANY
LOGO
J. C. Carbajal L.
COMPANY
LOGO
J. C. Carbajal L.
COMPANY
LOGO
Ejemplo 2 -
D.A.I. Bioinformtica
Ejemplo 2 -
D.A.I. Bioinformtica
Ejemplo 1 y 2
COMPANY
LOGO
J. C. Carbajal L.
COMPANY
LOGO
J. C. Carbajal L.
COMPANY
LOGO
EJEMPLO2
EJEMPLO1
D.A.I. Bioinformtica
J. C. Carbajal L.
D.A.I. Bioinformtica
J. C. Carbajal L.
23/06/2016
Mxima parsimonia
COMPANY
LOGO
D.A.I. Bioinformtica
J. C. Carbajal L.
Mxima similitud
D.A.I. Bioinformtica
Mxima similitud
J. C. Carbajal L.
D.A.I. Bioinformtica
J. C. Carbajal L.
Mxima Parsimonia
J. C. Carbajal L.
COMPANY
LOGO
D.A.I. Bioinformtica
COMPANY
LOGO
12!
12!
12
=
=
=
= 495
4! 124
4! 8 !
4
4
Para cada cuarteto, se estima cul de las tres
topologas es mejor, y se le asigna
Los cuartetos se van ensamblando en el rbol final
D.A.I. Bioinformtica
COMPANY
LOGO
COMPANY
LOGO
J. C. Carbajal L.
COMPANY
LOGO
D.A.I. Bioinformtica
J. C. Carbajal L.
23/06/2016
COMPANY
LOGO
Mxima parsimonia
D.A.I. Bioinformtica
COMPANY
LOGO
D.A.I. Bioinformtica
J. C. Carbajal L.
J. C. Carbajal L.
J. C. Carbajal L.
COMPANY
LOGO
D.A.I. Bioinformtica
J. C. Carbajal L.
COMPANY
LOGO
Mxima parsimonia
D.A.I. Bioinformtica
J. C. Carbajal L.
COMPANY
LOGO
COMPANY
LOGO
D.A.I. Bioinformtica
J. C. Carbajal L.
10
23/06/2016
D.A.I. Bioinformtica
J. C. Carbajal L.
COMPANY
LOGO
COMPANY
LOGO
J. C. Carbajal L.
COMPANY
LOGO
Ciencias biolgicas
Desarrollo de nuevas vacunas
Ciencias de la computacin
El problema de MP es NP-completo
Equivale al problema del rbol de Steiner en hipercubos
[Garey and Johnson, 1977]
El nmero de rboles con raz para n secuencias es:
= 2 3 !/22 2 !
Para n=30 hay 4.95 1038 rboles (100 millones de
sol./seg 1.57 1021 siglos)
D.A.I. Bioinformtica
J. C. Carbajal L.
J. C. Carbajal L.
COMPANY
LOGO
D.A.I. Bioinformtica
J. C. Carbajal L.
D.A.I. Bioinformtica
D.A.I. Bioinformtica
COMPANY
LOGO
COMPANY
LOGO
J. C. Carbajal L.
11
23/06/2016
COMPANY
LOGO
COMPANY
LOGO
1, =
= ; =
0,
=1
D.A.I. Bioinformtica
J. C. Carbajal L.
D.A.I. Bioinformtica
COMPANY
LOGO
D.A.I. Bioinformtica
J. C. Carbajal L.
J. C. Carbajal L.
J. C. Carbajal L.
COMPANY
LOGO
D.A.I. Bioinformtica
D.A.I. Bioinformtica
J. C. Carbajal L.
COMPANY
LOGO
COMPANY
LOGO
D.A.I. Bioinformtica
J. C. Carbajal L.
12
23/06/2016
D.A.I. Bioinformtica
Mtodos Bayesianos
COMPANY
LOGO
D.A.I. Bioinformtica
J. C. Carbajal L.
COMPANY
LOGO
D.A.I. Bioinformtica
COMPANY
LOGO
COMPANY
LOGO
D.A.I. Bioinformtica
J. C. Carbajal L.
J. C. Carbajal L.
COMPANY
LOGO
J. C. Carbajal L.
COMPANY
LOGO
D.A.I. Bioinformtica
J. C. Carbajal L.
D.A.I. Bioinformtica
J. C. Carbajal L.
13