Vous êtes sur la page 1sur 5

Capitulo 9: Anlisis Filogentico.

Preguntas de discusin:
1. Explique tres causas que pueden producir resultados filogenticos errneos:
Billie -- Cuando en la construccin del alineamiento por ejemplo, no se ha tomado en cuenta los
criterios para la construccin del rbol como son: La distancia, Mxima Parsimonia y Mxima
Probabilidad.
VANESSA:
- La mayora de errores ocurren debido al no cumplimiento (o violacin) de las asunciones del
anlisis filogentico, especialmente:
Alineamientos incorrectos de secuencias
Falla del anlisis en no considerar la variacin sitio a sitio (un sitio corresponde a cada
posicin de bases individuales alineadas), donde un sitio evoluciona a una tasa diferentes de la
de otros sitios
Efectos de tasas desiguales: La mayora de algoritmos para la construccin de los rboles
filogenticos no son buenos cuando los genes provenientes de diferentes taxa evolucionan a
tasas diferentes.
Estos tres problemas producen el mismo artefacto: long branch attraction (atraccin de ramas
largas). En los rboles que muestran estos artefactos, las secuencias que evolucionan rpidamente
(con ramas largas) van a ser colocadas con otras secuencias que evolucionan rpidamente an
cuando las secuencias estn relacionadas slo distantemente.
Yanina: Los errores pueden ser atribuidos a violaciones de asunciones (errneas) establecidas por
los modelos filogenticos.
Algunas asunciones ( errneas ) de los modelos inherentes en los anlisis filognicos:
-Considerar que una secuencia es correcta y se origina desde una fuente especfica.
-La variabilidad de secuencia en la muestra contiene seales filognicas adecuadas para resolver el
problema de inters.
-Las secuencias son homlogas ( descienden de un ancestro comn ), ellos no son una mezcla de
diferentes formas intragenmicas divergentes de una secuencia que desciende desde una
duplicacin de un gen ancestral.
2. Cul cree Usted es la justificacin para la asuncin principal en un anlisis filogentico (la
divergencia evolutiva es estrictamente bifurcante), en otras palabras por qu obviar situaciones
de evolucin convergente?

Billie-- Pienso que la asuncin de que la divergencia es bifurcante est basado en que la evolucin
tiende a la especiacin de los organismos, asi, con una evolucin convergente las especies
tenderan a desaparecer.
VANESSA: Estoy de acuerdo con Billie. El proceso de especiacin involucra una ausencia de
flujo gnico entre dos poblaciones. Entonces, cuando ocurre un evento de especiacin se asume
que el ancestro desaparece dando lugar a la divergencia (cladognesis). Considero que tambin
podra deberse a que la divergencia evolutiva es indicativa de una similitud debida a la herencia a
partir de un ancestro comn (homologa), mientras que la consideracin de evolucin paralela y
convergente (homoplasa) puede causar que organismos relacionados distantemente se asemejen
unos a otros en algunas de sus caractersticas (que no es el resultado de un ancestro comn
inmediato).
Yanina: Coincido con las observaciones anteriores, la divergencia es caracterstica de la evolucin
en donde la variacin es dinmica debido a los mltiples entrecruzamientos de informacin que se
dan por lo tanto tiende ha ser difurcante y la convergencia no es opcin.
3. Por qu razn se considera que un alineamiento de acuerdo a estructura secundaria o terciaria,
es filogenticamente ms razonable?
Billie -- Debido a que la aproximacin en la confidencia en la homologa es ms grande en
comparacin de los caracteres complejos que los simples.
VANESSA -- Porque para un conjunto de protenas que son hipotetizadas de ser homlogas, sus
estructuras 3D son conservadas con un mayor grado en comparacin a sus estructuras primarias.
Debido a que los plegamientos estructurales son ms conservados que las secuencias, uno puede
identificar homlogos con poca similitud a nivel de secuencias. De esta manera, una aproximacin
estructural puede permitir el reconocimiento de sitios particulares con significancia funcional
evolutiva.
Yanina: Es filognicamente ms considerable porque la confianza en la valoracin de la homologa
es ms grande en las comparaciones de complejos ( estructuras ) que de simples caracteres
( nucleotidos, aminocidos). Adems, aproximaciones estructurales permiten el reconocimiento de
sitios particulares funcionales, consecuentemente evolucionales y no independientes.
4. Qu significa ...muchos mtodos de alineamiento mltiple alinean de acuerdo a criterios
filogenticos explicitos...?
Billie-- En el anlisis filogentico se asume a priori que los sites o caracteres de las
secuencias alineadas son genealgicamente homologas.
VANESSA -- SPor ej.: el algoritmo CLUSTAL W para el alineamiento mltiple de secuencias
parte de la asuncin de que el conjunto de secuencias ingresadas son homlogas y, que por
consiguiente, son alineables par a par.

Yanina: Posiciones en secuencias alineadas sujetas a anlisis filognicos representan una


conclusin filognica a priori, ya que los sitios por ellos mismos son asumidos efectivamente ser
homlogos genealgicamente.
5. De un ejemplo de una situacin en que puede ser incorrecto usar tasas de sustituciones hacia
delante y hacia atrs idnticas en un modelo de sustitucin? Qu dira Usted respecto al uso
de este mtodo, si es que por alguna razn, el contenido de GC en las secuencias de ADN
deberan verse incrementadas conforme transcurre el tiempo evolutivo?
Billie En el caso de secuencias de ADN codantes para proteinas , una variacin en la primera o
segunda posicin de la base podra generar divergencia . Por otro lado, si el contenido de GC se
va incrementando con el tiempo y al usar este mtodo en el cual la frecuencia de sustituciones
adelante y hacia atrs es de condicin noestacionaria, pienso que se generaran resultados
independientes, es decir, se obtendra diferentes estructuras filogenticas para una misma
secuencia.
VANESSALa variacin en las tasas de sustitucin entre distintos sitios en una secuencia puede
afectar profundamente los resultados de la construccin del rbol filogentico. El ejemplo ms
obvio de la tasa de variacin entre sitios (o heterogeneidad) es aquel evidente entre las 3
posiciones del codn en una secuencia codante. Como bien seala Billie, hay una seleccin ms
severa en la primera y segunda posicin del codn, siendo sta mayor en la segunda posicin.
Ciertas regiones del genoma pueden evolucionar a tasas muy altas o muy bajas como resultado,
principamente, de la presin de seleccin. De asumirse que las tasas de sustitucin hacia delante
y hacia atrs son idnticas, se estara asumiendo que cualquiera de estas mutaciones son
igualmente capaces de fijarse, es decir, que son neutrales. Pero hay que evaluar que la mutacin
sea viable (por ej.: un cambio de un aminocido que conserve la familia y, por consiguiente, no
altere la funcin). Pueden haber secuencias caracterizadas por altas tasas de evolucin, de manera
que muchos sitios sean ms probables de saturarse con mutaciones hacia delante y hacia atrs (ej.:
secuencias genmicas de retrovirus). Otro ejemplo de tasas de sustitucin distintas corresponde a
las secuencias de ADN que codifican para diferentes partes de la molcula de hemoglobina, las
que han evolucionado a tasas distintas en diferentes grupos de organismos, en relacin al rol
cambiante de esta protena durante el curso de la evolucin.
- El contenido de GC de una secuencia dada est determinado por el balance entre la tasa de
sustitucin de G C a T A, y la tasa de sustitucin en direccin opuesta. Ciertas especies
podran estar de alguna manera restringidas a evolucionar hacia un contenido ms balanceado de
GC en sus genomas. Al final, el patrn de sustitucin va a estar determinado por la presin de
seleccin contra ciertas mutaciones. La magnitud de la presin de mutacin puede estar sesgada
con respecto al contenido de GC y variar entre linajes filogenticos. Entonces, si el contenido de
GC en las secuencias de ADN debera verse incrementado conforme transcurre el tiempo
evolutivo, este mtodo estacionario (que asume mutaciones reversibles en el tiempo, sto es,
una situacin neutral, sin presin de seleccin) no permitira evaluar la presin mutacional sesgada
hacia sustituciones en GC y, por consiguiente, no se podra explicar las variaciones en el
contenido de GC durante el transcurso del tiempo evolutivo.
Yanina: Creo que el ejemplo dado por Billie y Vanesa es el ms acertado, ya que sustituciones en
otras secuencias dentro del ADN no tendran tanta repercusin respecto al anlisis filognico.

Respecto al incremento del contenido de GC con respecto al tiempo pienso que si se considera al
mtodo como estacionario, este incremento no tendra repercusin alguna mientras que si se le
considera como no estacionario ( tasa de variaciones diferidas ) podran tener importantes
implicancias en el anlisis filognico.
6. Por qu razn, la tercera posicin del codn debera considerarse como no-informativa (slo
introduce ruido), tal como explica el autor? (les recomiendo que revisen el artculo: Third
position, really that bad?, que lo tienen copiado en el CD del curso). Luego de leer el artculo,
sigue Usted estando de acuerdo con Baxevanis?
VANESSA -- Segn Baxevanis, en el caso de secuencias de ADN codantes, la tercera posicin del
codn tiende a ser ms variable que las primeras dos. Considera que el mayor nmero de
sustituciones en la tercera posicin implican una mayor cantidad de informacin engaosa (que
puede llevar a conclusiones errneas = ruido) en comparacin con la segunda y primera posicin
que evolucionan ms lentamente. Por esta razn, si hay diferentes frecuencias de bases en los
datos del anlisis filogentico, se tiende a remover los datos de la tercera posicin del codn.
Entonces, considera que, dependendiendo de la divergencia de las muestras, la variacin til es
esencialmente en la primera y segunda posicin del codn, con la tercera posicin siendo
randomizada a lo largo del conjunto de datos.
- Por otro lado, Mats Bjrklund, autor del artculo: Third position, really that bad?menciona que
en determinadas ocasiones, sitios altamente variables pueden ser tan informativos como los sitios
menos variables. As, ciertas 3 posiciones en codones fuertemente seleccionados pueden ser ms
informativas que 2 posiciones en codones menos fuerte seleccionados. La asuncin de que la
tercera posicin es neutral (mutacin silenciosa: no cambia el aminocido) no siempre se cumple.
Al respecto, se ha encontrado que ciertas sustituciones en la tercera posicin pueden estar
sesgadas y estar bajo considerable presin de seleccin. Estas 3 posiciones podran ser
evolutivamente inertes como las posiciones 1 y 2 y, por consiguiente, de valor considerable en
los estudios filogenticos. Por lo tanto, las 2 posiciones no siempre son superiores a las 3
posiciones en cuanto al contenido de informacin filogentica. Por otro lado, tiene que evaluarse
asimismo la cantidad de variacin entre y dentro de los sitios, a fin de determinar la congruencia
del patrn de sustitucin de nucletidos y la frecuencia de cambios en un sitio con respecto a la
historia evolutiva del taxn.
Estoy de acuerdo entonces con Bjrklund, de que a menos que se tenga evidencia slida de que
las 3 posiciones de codones son realmente engaosas, una exclusin indiscriminada, o la
consideracin de un menor peso (downweighting) de las 3 posiciones, no es apropiada a
priori.
Yanina: La tercera posicin en el codn debera considerarse como no informativa, por tender a
ser mucho ms variable que las dos primeras. En algunos casos, sin embargo los patrones de la
tasa de variacin son ms sutiles, por lo tanto es necesario contar con la mayor informacin
posible respecto a esta posicin para considerar su aporte.

7. Qu diri Usted si es que la tercera posicin del codn, ms que desinformativa, llevara algun
tipo de informacin, como por ejemplo un contenido de GC que se correlaciona con el tiempo

evolutivo? (asuma que mientras transcurre el tiempo evolutivo, el contenido de G y C, se


incrementa sistemticamente en la tercera posicin del codn).
Billie -- Si la tercera posicin llevara alguna informacin, con el tiempo se generara una especia
nueva con contenido alto de GC.
VANESSA -- Asumiendo que en la tercera posicin del codn se da un mayor cambio en el
contenido de GC, por tener una tasa mutacional ms rpida que la primera y segunda posicin del
codn, entonces, ante un mismo cambio en contenido de GC genmico se dara un mayor cambio
en el contenido de GC en la tercera posicin (porque el cdigo gentico es degenerado en la
tercera posicin). Organismos cercanamente relacionados van a mostrar patrones similares de
utilizacin de codones, de manera que el aumento en el contenido de GC en la 3 posicin puede
dar informacin til para el establecimiento de la filogenia entre taxa, la cual refleje realmente su
historia evolutiva.
Yanina: Yo considero que si la tercera posicin aporta informacin importante como el contenido
de GC, se podra establecer relaciones de filognia ms estrechas entre los miembros de un grupo.
8. Mencione una situacin en la que el uso del mtodo Maximum Likelihood podra dar un
resultado equivocado.
Billie -- Podra ser al momento en el que el mtodo busca optimizar el modelo de sustitucin .
VANESSA Como seala Billie, la determinacin de la probabilidad mxima conjunta de los
datos asociados con los rboles filogenticos va a estar influenciada por los parmetros del
modelo de sustitucin empleado. As, el rbol que produce la mayor probablidad bajo un modelo
de sustitucin dado podra dar una probabilidad mucho menor si se considera otro modelo, por lo
que debe optimizarse el modelo de sustitucin para ajustarse a los datos observados. De otro
lado, para un nmero pequeo de taxa, todos los rboles filogenticos pueden ser considerados,
pero para para un nmero grande de taxa, sto se vuelve impracticable. En este caso, el problema
principal est en el muestreo. Se tiene que seleccionar un subconjunto de todos los rboles
posibles, con el riesgo de que puedan obviarse clases completas de rboles. Asimismo, dado que
los datos son en s mismos una muestra, la probabilidad calculada por el mtodo de maximum
likelihood no es un nmero absoluto sino una estadstica, con su propia varianza. Esta puede ser
a veces grande, lo que indica la dificultad en decidir entre varias configuraciones de rboles.
Yanina: Cuando se realiza una completa bsqueda que simultneamente optimice el modelo de
substitucin y el rbol para un set de datos dados.

Vous aimerez peut-être aussi