Académique Documents
Professionnel Documents
Culture Documents
(Agosto 2004)
1. Introduccin
Presentacin
Qu es la microevolucin?
Variacin gentica
Marco histrico de referencia
Lecturas recomendadas
2. Equilibrio Hardy-Weinberg
El modelo poblacional de Hardy-Weinberg
Consecuencias del modelo Hardy-Weinberg
Homocigosis y heterocigosis esperadas
Aproximacin al equilibrio de Hardy-Weinberg
Lecturas recomendadas
3. Deriva gentica
La deriva gentica
Fluctuaciones de las frecuencias allicas
Formalizacin del modelo de Fisher-Wright
La distribucin binomial
Deriva gentica y heterocigosis
Ritmo de la deriva gentica y tamao poblacional efectivo
Lecturas recomendadas
4. Mutacin
Sesgo mutacional: diferencias entre los sexos
Sesgos mutacionales y modelos para mutaciones puntuales
Variabilidad del genoma mitocondrial
Loci hipervariables: los microsatlites
Mutaciones entre un nmero discreto de alelos
Modelo de mutacin irreversible
Modelo de mutacin reversible
Modelo de alelos infinitos
Equilibrio entre deriva gentica y mutacin
Lecturas recomendadas
5. Seleccin natural sobre caracteres mendelianos simples
Concepto de seleccin natural
Seleccin sobre caracteres mendelianos simples
Un ejemplo: anemia falciforme en humanos
El alelo C, y el carcter histrico del proceso selectivo
Principales tipos de seleccin natural
Imagen del paisaje adaptativo
Lecturas recomendadas
6. El coalescente
El coalescente: modelo estndar
Una aplicacin inmediata
El coalescente con ms de 2 alelos
Tiempos de espera
Antigedad esperada del ancestro comn a todos los alelos de la muestra
Variabilidad gentica en un contexto genealgico
El coalescente y los rboles de genes
Divergencia de las poblaciones en ausencia de seleccin
Lecturas recomendadas
Captulo 1: INTRODUCCIN
Presentacin
Esta es la tercera, pero todava incompleta versin de la gua. Se ha agregado
un captulo sobre el coalescente y las genealogas de alelos. Los estudiantes
del curso de Evolucin 2003 son los destinatarios de esta edicin. Espero que
les sea de utilidad pese a los captulos faltantes, a los ocasionales cuadros o
figuras prometidos en el texto pero que todava no existen, y a los inevitables
errores que seguramente contiene.
Espero tambin recibir crticas, sugerencias y comentarios de todo tipo, y muy
particularmente indicaciones de errores detectados, de parte de ustedes.
Pueden hacerlas llegar por correo electrnico (lessa@fcien.edu.uy), o hablando
directamente conmigo o con otros docentes del curso. Los estudiantes y
docentes de aos anteriores identificaron algunos problemas, ahora corregidos,
pero seguramente restan otros.
La idea de escribir una gua de estudio de la microevolucin, o ms
modestamente de su ncleo central, constituido por la gentica de poblaciones,
surgi de la experiencia de dictar el curso de Evolucin de la Licenciatura en
Biologa de la Facultad de Ciencias. No es una idea demasiado original, y de
hecho existen excelentes libros de texto, incluyendo algunos de carcter
introductorio en la materia, al menos en ingls, a los que un lector interesado
en profundizar deber dirigirse.
El propsito central de esta gua es ofrecer una muy breve introduccin, que
procura servir para un primer contacto con los conceptos centrales de la
gentica de poblaciones. He sido muy selectivo con las ecuaciones, y en
general las consideradas imprescindibles se presentan, ilustran, y discuten,
pero rara vez se demuestran. La gua busca acompaar las clases que sobre
el tema incluye el curso de Evolucin ya citado, pero puede tambin utilizarse
de modo independiente.
La gua asume un conocimiento bsico de gentica general, incluyendo
nociones de gentica mendeliana clsica, de organizacin de los genes en los
cromosomas (o en genomas de organelos como la mitocondria), de estructura
y funcin del ADN, y del cdigo gentico que relaciona ste con las secuencias
de protenas. No se asumen conocimientos de gentica de poblaciones ni de
probabilidad, lo que har que quienes poseen los fundamentos de estos temas
puedan hallar que parte del material es aburrido y detalla trivialidades. En
cambio, quienes no poseen nociones suficientes de probabilidad encontrarn
descripciones algo informales pero que presumo ayudarn a desarrollar una
cierta intuicin al respecto. En varias partes del texto, estas descripciones
contienen sugerencias de qu aspectos de la teora de probabilidades son
particularmente tiles y mereceran un estudio ms serio.
He optado por partir de los problemas genticos y desde ellos sealar la
existencia e importancia de algunas formulaciones de los modelos
Esta breve e informal introduccin a las mutaciones nos indica, en suma, que
en cada generacin surgen numerosas nuevas variantes genticas por
mutacin. Ingenuamente, podramos suponer que ello implica que la
diversidad gentica de una poblacin aumentar, gradual pero
inexorablemente, generacin tras generacin. Con igual simplismo cabra
pensar que la variacin en un sitio, gen, o regin cualquiera del genoma refleja
sencillamente la tasa de mutacin correspondiente. Pero pronto veremos que
el destino de las mutaciones involucra otros procesos, por lo que las dos
inferencias recin mencionadas son errneas. La seleccin natural, por
ejemplo, puede favorecer una nueva variante o, por el contrario, actuar en su
contra. Una mutacin nueva normalmente estar inicialmente representada por
una nica copia. Si el individuo que la porta no la transmite al menos a un
descendiente, esa variante desaparecer tan rpido como apareci,
simplemente por azar. Estos y otros posibles destinos de la variacin gentica
provista por las mutaciones son motivo de estudio de la gentica de
poblaciones.
Desarrollo
Darwin y Wallace formulan la teora de evolucin por seleccin
natural.
1860
1900
1910
1920
1920-1930
1940
1950
1960
1970
1980
Ntese, por ejemplo, que recin en la dcada del 1960 se cont con: a) una
idea clara de cmo estn formados los genes (al menos una clase importante
de ellos) y cmo codifican a las protenas; b) un conjunto mnimo de
secuencias de protenas que podan compararse entre las especies; c) una
tcnica de estudio emprico y sistemtico de variacin gentica (en sus
productos, las protenas) y de anlisis de frecuencias gnicas que no requera
Lecturas recomendadas
Provine, W. P. 1971. The origins of theoretical population genetics. Univ. of
Chicago Press, Chicago. Una excelente panormica histrica de la
gestacin de la gentica de poblaciones, desde la poca de Darwin y
Galton hasta la consolidacin de la teora sinttica.
Hartl, D. L. 2000. A primer of population genetics. Sinauer Assoc.,
Sunderland, MA. Un libro excelente en general. En particular, el
captulo 1 comienza con una concisa descripcin de la estructura del
ADN, el cdigo gentico, y de las principales tcnicas de estudio de
variacin gentica.
Avise, J. C. 1994. Molecular markers, natural history and evolution. Chapman
& Hall, New York. Un libro excelente en general, y en particular
recomendable por su descripcin de las principales tcnicas de estudio
de la variacin gentica y por contener una panormica de las mltiples
aplicaciones de la gentica de poblaciones experimental, desde el
estudio del parentesco hasta el de la evolucin.
=p
=q
= 0.376
= 0.624
= 37.6%
= 62.4%
Como sabemos, un gen diploide como el considerado, que cuenta con dos
variantes allicas, puede generar solamente tres genotipos diferentes. As, si
un individuo hereda dos copias del alelo V, una de cada progenitor, ser
homocigota VV. Existirn tambin homocigotas vv, y heterocigotas Vv.
La primera y ms obvia consecuencia del modelo es que estas frecuencias
permanecern estables a lo largo del tiempo. En efecto, no ocurre en el
modelo nada que pueda cambiarlas. El tamao infinito de la poblacin
previene fluctuaciones al azar de las frecuencias (no opera la llamada deriva
gentica, que consideraremos ms adelante), que en una poblacin de tamao
finito ocurrirn inevitablemente. No aparecen alelos nuevos, ni ocurren
mutaciones de uno a otro de los alelos presentes. Tampoco existen
inmigrantes que aporten nuevos alelos, o simplemente frecuencias distintas de
los ya existentes.
La segunda consecuencia del modelo es que existe una correspondencia
precisa y estable entre las frecuencias allicas (tambin llamadas frecuencias
gnicas) y las frecuencias genotpicas. Esta estabilidad surge de agregar, al
tamao infinito de la poblacin y a la ausencia de mutaciones y otras fuentes
de variacin, el sistema de apareamientos al azar. La poblacin, como suele
decirse, es panmctica.
Consideremos la probabilidad de obtener un individuo homocigota de tipo VV
en nuestra poblacin ideal. Este individuo proviene de la combinacin al azar
de dos alelos, uno legado por el padre (y presente en el espermatozoide) y otro
por la madre (en el vulo), en la formacin del cigoto. La probabilidad de que el
alelo paterno, que escogemos al azar de entre los disponibles en la poblacin,
sea V es
f(V)
= 0.376 = 37.6%
Como el segundo alelo se escoge con independencia del primero, es fcil ver
que, habiendo escogido el alelo V en primer lugar con una probabilidad de un
37.6%, tenemos ahora un 37.6% de posibilidades de escoger otra copia de ese
mismo alelo para completar el complemento gentico de nuestro nuevo
individuo. Por lo tanto, deducimos que la frecuencia esperada de homocigotas
VV ser
f(VV)
0.376 x 0.376
= 0.141 = 14.1%
= 0.141
= 0.470
= 0.389
Frecuencias genotpicas
absolutas observadas
298
MN
489
NN
213
Muestra total
1000
Frecuencias genotpicas
absolutas esperadas
1000
=
2
(obs esp )2
esp
E(G) = pi
E(H) = 1 E(G) = 1 pi
Recurriendo a la Figura 2.1, puede verse fcilmente que, para el caso de dos
alelos, la mxima heterocigosis esperada es de 50%, y ocurre cuando cada
alelo se encuentra a una frecuencia de 50%. El lector puede examinar la
Figura 2.3 y pensar qu combinacin de frecuencias allicas producir la mayor
heterocigosis esperada posible para tres o ms alelos.
Aproximacin al equilibrio Hardy-Weinberg
Hasta ahora hemos descrito el equilibrio Hardy-Weinberg, y tambin hemos
afirmado que las poblaciones naturales se aproximan al mismo con asombrosa
determinacin pese a que los supuestos del modelo son muy poco realistas.
Como ejercicio que puede permitir atisbar porqu ello ocurre, le proponemos al
lector el siguiente caso. Supongamos que partimos de una poblacin inicial
con un marcado sesgo en la representacin de los alelos en los dos sexos.
frecuencia en
hembras
1.00
0.00
frecuencia en
machos
0.00
1.00
frecuencia total
0.50
0.50
Lecturas recomendadas
Gillespie, J. H. 1998. Population geneticsa concise guide. Johns Hopkins
Univ. Press, Baltimore. Una excelente introduccin a la gentica de
poblaciones terica, reducida a su esencia. En particular, el captulo
sobre el modelo Hardy-Weinberg se recomienda para consolidar el
material cubierto en este captulo.
La deriva gentica
La modesta cuota de realismo introducida al pasar de una poblacin de tamao
infinito a una con un nmero finito de individuos tiene consecuencias de suma
Figura 3.1
cuando el alelo se fija (esto es, llega a ser el 100% de la poblacin) o bien
cuando se extingue (deja de existir, o sea llega a una frecuencia de 0).
Estas observaciones contienen, informalmente, lo esencial del proceso que
conocemos como deriva gentica. Partiendo, al igual que en el modelo HardyWeinberg, de una poblacin variable (con alelos de dos o ms tipos), la deriva
gentica produce evolucin. Dicho proceso consiste, generacin tras
generacin, en cambios de frecuencias gnicas, que constituyen la
consecuencia palpable, a corto plazo, de la deriva gentica. Aunque no hemos
precisado el concepto, sabemos ya que los cambios de frecuencias son
aleatorios en magnitud y signo, e intuimos tambin que aquella es funcin del
tamao poblacional o, de modo equivalente, del nmero de alelos. Finalmente,
vemos que la consecuencia a largo plazo de la deriva gentica es la
eliminacin de la variacin, por fijacin de alguno de los alelos que componan
la poblacin original, con lo que el proceso se agota a s mismo, ms tarde o
ms temprano. La evolucin, naturalmente, se detendra al llegar a este punto,
pero sabemos que esto es un artefacto de nuestra decisin de no permitir por
el momento que nuevas mutaciones aporten variacin fresca al proceso.
Antes de dar algo de formalidad y precisin al proceso de la deriva gentica,
observemos nuevamente uno de los paneles de la Figura 2.1. Ya hemos visto
que las diferentes curvas pueden representar experimentos independientes en
que se sigue la evolucin de un locus o gen partiendo de las mismas
condiciones (definidas por las frecuencias allicas y el tamao poblacional) y
llevados adelante siguiendo las reglas del modelo de Fisher-Wright. Otra
interpretacin igualmente vlida e instructiva es imaginar que cada curva
representa, en realidad, un locus diferente, cuya historia se traza en la misma
poblacin. Para que esta interpretacin sea vlida, debemos asumir que: a)
los loci son independientes, es decir no estn ligados en el sentido gentico del
trmino (por ejemplo, cada locus est en un cromosoma autosmico diferente);
y b) para cada locus, partimos de una idntica frecuencia inicial del alelo que
escogemos como marcador.
Nuestras dos interpretaciones se complementan para reflejar propiedades
tpicas de la deriva gentica, a saber que un mismo locus tendra una historia
particular cada vez que repitisemos un experimento siguiendo su evolucin, y
que en un mismo experimento, cada locus har lo propio describiendo su
propia trayectoria. Ambas cosas son ciertas pese a que en todos los casos el
punto de partida es el mismo y las reglas del proceso son idnticas.
Formalizacin del modelo de Fisher-Wright
En esta seccin, procederemos a formalizar algo ms el proceso a efectos de
consolidar las observaciones cualitativas ya realizadas y reafirmar, al hacerlo,
las conclusiones generales sobre el efecto de la deriva gentica en las
poblaciones. Lejos de agotar las posibilidades en este sentido, nos limitaremos
a examinar algunas propiedades del proceso en casos bien simples. Si estos
son bien comprendidos, las extensiones a situaciones ms complejas quedan
al alcance de la mano.
4A
3Ay1a
2Ay2a
1Ay3a
4a
Existe una nica forma de obtener A cuatro veces, ya que ello requiere
obtener dicho alelo en cada uno de los cuatro eventos. Como cada evento
de muestreo tiene una probabilidad p = 3/4 = 0.75 y es adems
independiente de los restantes, la probabilidad de obtener 4 A es:
pxpxpxp = p4 = 0.316
Seguimos aqu solamente las frecuencias allicas, pasando por alto algunas complicaciones respecto a la
exacta composicin de los individuos diploides de ambos sexos. Para un excelente uso de esta opcin
minimalista, se recomienda estudiar el curioso ejemplo seleccionado por Gillespie (1998), que discute el
caso de una poblacin formada por un nico individuo hermafrodita que se aparea consigo mismo al azar!
La distribucin binomial
n i
ni
p(i) = p (1 p) ,i = 0,1,..., n
i
donde
n
n!
=
i (n i)!i!
que representa las combinaciones de n=2N elementos tomados de a i.
El lector puede recurrir al ejemplo ms arriba para verificar cmo se obtienen
las probabilidades razonadas en el ejemplo con esta ecuacin. Adems, cada
parte de la ecuacin describe un aspecto del muestreo:
Aprovechemos este momento para insinuar apenas una descripcin del modelo
de Fisher-Wright como lo que se conoce como cadena de Markov. El tipo de
cadena que nos interesa es un proceso que:
tiene un nmero discreto de estados (0, 1, 2..., 2N copias del alelo que
usamos como marcador);
el estado que se alcanza en un tiempo cualquiera, digamos en nuestro caso
la dcima generacin (t10), depende nicamente del estado en el tiempo
inmediatamente precedente (la generacin t9) y de probabilidades de
transicin de un estado a otro, que son fijas.
t0
0
1
0
1
generaciones
t1
t2
1/4
1/2
1/4
1/4
1/2=0.5
0.25
t3
1/8
0.125
1 t
E(Ht ) = H0 1
2 N
Ne =
4Nm Nh
,
Nm + Nh
1 1 1
1
1
=
+
+ ... +
Ne t N0 N1
Nt1
El tamao efectivo en este caso es la media armnica de los tamaos de las
generaciones consideradas. Una propiedad de la media armnica es que
siempre resulta menor que la media aritmtica. De hecho, examinando
algunos ejemplos numricos el lector puede convencerse que el tamao
efectivo se ver ms afectado por un ocasional N pequeo que por un
ocasional N grande.
Estos ejemplos bastan para notar que, por lo general, el tamao poblacional
efectivo es notoriamente menor que el que un simple conteo de individuos (an
eliminando los que no son adultos reproductores) sugerira. Y esto tiene
sentido, ya que tanto el sesgo de composicin sexual como las fluctuaciones
demogrficas generan endocra, el primero porque unos pocos machos tienen
un gran efecto en la composicin gentica de la poblacin, y las segundas
porque las fases de tamaos poblacionales pequeos representan momentos
de gran impacto de la deriva gentica.
La tendencia de las poblaciones a tener tamaos poblacionales efectivos
menores a los que un simple censo de adultos sugerira es a veces sutil. Para
ilustrarlo, recordemos la recomendacin de comparar tres casos de deriva
ilustrados en Hartl y Clark (1997): una solucin basada en la distribucin
binomial, otra basada en la ecuacin de difusin, y otra obtenida
Lecturas recomendadas
Hartl, D. L., y A. G. Clark. 1997. Principles of population genetics. Sinauer
Assoc., Sunderland, MA. Un excelente libro de texto. Se recomienda el
captulo 7 sobre deriva gentica en general, y las explicaciones y
grficas sobre el proceso de deriva en particular. Este se presenta de
tres formas complementarias, que son el desarrollo binomial de un caso
simple, su aproximacin mediante la ecuacin de difusin utilizada por
Kimura, y un caso experimental.
Captulo 4: MUTACION
La mutacin es la fuente ltima de variacin y, por lo tanto, de la evolucin
biolgica. En este captulo vamos a realizar algunas consideraciones sobre la
mutacin, principalmente sobre el modo como se la incorpora a los modelos
gentico-poblacionales.
A comienzos del siglo XX, cuando se redescubrieron las leyes de Mendel, la
naturaleza discreta de los alelos mendelianos clsicos (las arvejillas eran
verdes o amarillas, sin intermedios, y los alelos mantenan su identidad a travs
de la herencia), los genetistas creyeron que esa discontinuidad entraba en
flagrante contradiccin con el darwinismo, que insista en la evolucin lenta y
gradual. Surgi as el mutacionismo, como una corriente de pensamiento
evolucionista que pensaba que el proceso estaba fundamentalmente dictado
por la naturaleza de las mutaciones.
Los trabajos de Fisher, Haldane, y Wright, entre otros, se ocuparon de asimilar
el mendelismo a la teora de la evolucin de Darwin. As, el aparente conflicto
fue resuelto al reconocer que el proceso evolutivo consta de dos etapas. La
gnesis de la variacin reside en el proceso mutacional, cuya diversidad ha
sido comprendida de modo creciente desde esa poca hasta nuestros das. El
destino de dicha variacin, sin embargo, se define en el juego genticopoblacional que incluye, por lo pronto, al proceso darwinista de la seleccin
natural, pero tambin otros como la deriva gentica, cuyo papel ha sido
esbozado en el captulo anterior. Fisher, particularmente, esboz de qu modo
caracteres fenotpicos continuos, como la altura o la masa corporal, pueden
tener sus bases genticas en alelos mendelianos discretos. La solucin, que
no consideraremos en detalle en este momento, reside en reconocer que un
carcter continuo puede reflejar los efectos acumulativos de variacin gentica
discreta en numerosos genes.
En una celebrada polmica que tuvo lugar en la poca de gestacin de la teora
sinttica, Ronald Fisher y Sewall Wright discreparon sobre la importancia de la
deriva gentica. Es que Wright, sin desconocer el papel de la seleccin
natural, insista en que la deriva gentica cumpla tambin un papel importante.
Esta visin fue la semilla de la teora neutralista de la evolucin molecular, que
Motoo Kimura desarroll en la dcada de 1960, y que consideraremos
brevemente ms adelante.
El reconocimiento de que los procesos mutacionales son muy variables tuvo
que esperar, en lo esencial, al advenimiento de la gentica molecular, aunque
los trabajos de Barbara McClintock sobre elementos transponibles se
adelantaron a ella, con mtodos clsicos, por dcadas. Las mutaciones ms
sencillas son los cambios puntuales en un nucletido, que si persisten
implicarn tambin un cambio en la hebra complementaria durante la
replicacin del ADN. Pero son tambin mutaciones los cambios cromosmicos,
como las inversiones y translocaciones, y las transposiciones como las
estudiadas por McClintock. Una importante clase de loci llamados
una tasa nica como aproximacin razonable. Pero las deleciones se rigen por
otras normas. Tienen, por ejemplo, una tendencia sistemtica a involucrar
ciertas regiones, en virtud de la estructura secundaria que tiende a adquirir el
ADN de hebra simple en el proceso de replicacin.
Sesgos mutacionales y modelos para mutaciones puntuales
En esta seccin examinaremos muy brevemente algunos modelos ms
complejos de cambio a nivel nucleotdico. A nivel filogentico, es decir cuando
se comparan los cambios acumulados entre las especies a lo largo de, por lo
general, escalas de tiempo de millones de aos, dichos cambios son
mayoritariamente sustituciones, trmino reservado para aquellas mutaciones
que se han fijado durante la historia de las especies. Varios de los modelos
que esbozaremos aqu son precisamente modelos de sustitucin, y no,
estrictamente, de mutacin. Pero para mutaciones no afectadas por la
seleccin natural, existe una estrecha relacin, que discutiremos ms adelante
al hablar de la teora neutralista, entre sustitucin y mutacin.
Ms all de estas importantes distinciones, presentaremos algunos de estos
modelos en trminos mutacionales para dejar sentado que, si bien muchos
trabajos gentico poblacionales usan modelos muy sencillos de mutacin, es
posible incorporar al anlisis situaciones ms complejas.
A nivel de ADN, el modelo ms sencillo de mutacin, con frecuencia tomado
como punto de partida, es llamado modelo de Jukes y Cantor, segn el cual
todos los tipos de cambio son igualmente probables. Este modelo puede
representarse por la siguiente matriz de transicin:
Nucletido
original:
G
A
T
C
G
1-3
Nucletido nuevo
A
T
1-3
1-3
1-3
Nucletido
original:
G
A
T
C
G
--12.5
3.3
4.6
Nucletido nuevo
A
T
20.4
--3.3
4.2
4.4
3.4
--20.7
C
4.9
4.5
13.8
---
Nucletido
original:
G
A
T
C
G
1--2
Nucletido nuevo
A
T
1--2
1--2
1--2
Cada locus de este tipo se caracteriza por contener una secuencia repetida
un cierto nmero de veces. Los motivos de repeticin pueden ser de un
slo nucletido (A), dinuclotidos (CT), trinuclotidos, y as sucesivamente.
Si bien los motivos de repeticin pueden ser comunes a muchos loci, stos
se distinguen por las regiones a ambos lados del motivo de repeticin, que
varan de un locus al siguiente.
Ello permite amplificar por PCR cada locus por separado, con
oligonucletidos que se asientan a ambos lados del motivo de repeticin.
Los alelos de un locus difieren en el nmero de copias del repetido. Las
mutaciones consisten, por tanto, en el agregado o eliminacin de uno o ms
motivos de repeticin durante la duplicacin del ADN.
En general, a mayor tamao del motivo de repeticin, menor variabilidad del
locus. Pero todos ellos son mucho ms variables que los loci comunes.
Se trata de una clase de loci ampliamente dispersa en el genoma, en el que
se encuentran miles de loci de este tipo.
102
104
100
100
104
108
Vemos en este ejemplo que el alelo 100, por lo pronto, ha surgido al menos
tres veces, de modo que su presencia en varios individuos no indica que lo han
heredado de un ancestro comn en alguna generacin precedente. Lo mismo
se aplica al alelo 104.
El problema se minimiza en el anlisis de parentesco al ampliar el nmero de
loci (para no basar las inferencias en un nico locus) y teniendo en cuenta una
cierta probabilidad de mutacin entre individuos emparentados.
Pero para estudios de la dinmica de la poblacin en general, o de variacin
geogrfica, es decir estudios en los que la escala de tiempo considerada es
mayor al simple paso de progenitores a descendientes, el ruido introducido por
la mutabilidad y convergencia a alelos de idntico estado (nmero de repetidos)
se vuelve importante.
Un modelo que intenta abordar este caso, pero que no desarrollaremos aqu,
es el llamado modelo de mutacin por pasos (stepwise). En este modelo, un
alelo tiene una probabilidad mayor de mutar a un alelo del que difiere
solamente por un repetido. Una versin simple del modelo solamente permite
cambios de este tipo. En versiones ms flexibles, las probabilidades de
transicin son funcin inversa del nmero de repetidos en que difieren dos
alelos.
Claramente, los microsatlites no se ajustarn bien a modelos ms sencillos,
como el de alelos infinitos, que sern considerados en lo que resta de este
captulo.
Mutaciones entre un nmero discreto de alelos
Muchos de los caracteres mendelianos estudiados en la primera parte del siglo
XX constaban de un nmero limitado de alelos. La razn es que solamente
aquellos alelos responsables de cambios fenotpicos visibles, como el color,
eran identificables en muchas especies. De esta poca datan dos modelos de
mutacin tendientes a dar cuenta del comportamiento de estos sistemas:
peq =
Este razonamiento llev a Kimura a pensar que era razonable admitir que si
dos alelos eran idnticos en su estado (su composicin aminoacdica), deban
ser idnticos por descendencia. Ello implicaba que alelos de similar
composicin eran descendientes de una nica mutacin que ocurri en un
ancestro comn. Dicha mutacin, en otras palabras, debi haber ocurrido, a
todos fines prcticos, una nica vez.
Estos razonamientos y propiedades definen el modelo de alelos infinitos, que
ha resultado de gran utilidad terica y prctica.
Equilibrio entre deriva gentica y mutacin
Haciendo uso del modelo de alelos infinitos, vamos finalmente a considerar
conjuntamente los efectos de la deriva gentica y los de la mutacin en una
poblacin. Lejos de representar un mero ejercicio tcnico, vale la pena notar
que estamos ahora considerando un modelo de tipo Fisher-Wright, permitiendo
(finalmente) la ocurrencia de mutaciones, pero sin admitir todava la accin de
la seleccin natural. Nuestro modelo implica evolucin, que puede sostenerse
porque la deriva no agotar definitivamente la variacin, que ser repuesta por
la mutacin. Y sin embargo, la ausencia de seleccin hace que ste sea un
modelo neutral de la evolucin de una poblacin. Precisamente, el considerar
este tipo de modelos fue uno de los aportes sustanciales de Kimura a la teora
moderna de la evolucin. Ms adelante veremos, sin embargo, que en la visin
de Kimura la seleccin natural no est ausente, sino que cumple un papel
diferente al clsico.
Recordemos que la endogamia se define como la probabilidad de que dos
alelos muestreados al azar en nuestra poblacin sean idnticos por
descendencia. En el captulo anterior hemos visto que la endogamia en una
poblacin aumenta por causa de la deriva. La ecuacin
Ft =
1
1
+ 1
Ft 1
2 N 2 N
da cuenta del proceso como resultado de dos efectos, cada uno representado
por un trmino a la derecha de la igualdad. El primero, 1/2N es la probabilidad
de que dos alelos deriven de un mismo alelo en la generacin precedente, y
resulta del sistema de muestreo con reposicin impuesto por el modelo de
Fisher-Wright. La segunda resulta de combinar la probabilidad de que ello no
ocurra (el complemento 1-1/2N), multiplicada por la endogamia que ya posea
la poblacin, y que es retenida. El segundo trmino nos da, por tanto, la
probabilidad de que dos alelos muestreados al azar en una poblacin sean
idnticos por descendencia por la endogamia ya existente en la poblacin.
En el modelo de alelos infinitos, toda mutacin resulta en un nuevo alelo,
previamente inexistente, de modo que el resultado es siempre el aumento de la
diversidad gentica de la poblacin. Entonces, la endogamia nueva aportada
por el primer trmino de la ecuacin, se realizar siempre que ninguna de las
dos copias del alelo ancestral sufra una mutacin. Como cada uno de ellos
tiene una probabilidad de mutar, la probabilidad de que ninguno de ellos lo
haga es (1-)2. Del mismo modo, la endogamia que proviene de generaciones
precedentes a t-1 en la ecuacin de ms arriba ser retenida si ninguno de los
dos alelos de la muestra que tomamos para medirla sufri una mutacin. Por
lo tanto, este componente de la endogamia tambin ser retenido, por ausencia
de nuevas mutaciones, con una probabilidad de (1-)2.
En resumen, podemos superponer el efecto de la mutacin al de la deriva
gentica, modificando la ecuacin de ms arriba del modo siguiente:
Ft =
1
1
(1 )2 + 1 Ft 1 (1 )2
2N
2N
Feq =
1
1
=
1 + 4 N 1 +
Aparece aqu por primera vez = 4N, uno de los parmetros fundamentales
de la gentica de poblaciones. En el caso de un modelo de Fisher-Wright y
para un locus diploide, el valor de es el sealado. Aunque no nos interesa
aqu detallar formulaciones alternativas, es bueno recordar que es 2 veces el
nmero efectivo de alelos de un locus multiplicado por la tasa de mutacin. En
nuestro caso, el nmero efectivo de alelos es 2N, como ya hemos visto. En
otras palabras, el tamao efectivo es igual en nuestro caso al nmero de alelos.
Un modelo Fisher-Wright sin sesgo en la proporcin sexual para un gen
mitocondrial, por ejemplo, tendr N/2 alelos, o sea que en este caso = N.
El parmetro tiene que ver con la variabilidad gentica de una poblacin, que
ser funcin tanto del tamao poblacional (la deriva gentica producir
fluctuaciones menores, en promedio, si el tamao poblacional es mayor) como
la tasa de mutacin (que, naturalmente, tendr una relacin positiva con la
variabilidad).
Entre los ingredientes de esta ltima ecuacin, algunos pueden estimarse de
modo sencillo, y otros son notoriamente difciles. Aceptando que estamos en
equilibrio, F es simplemente la probabilidad de que dos alelos tomados al azar
de una poblacin sean idnticos, y por tanto puede estimarse evaluando la
homocigosis en una muestra de individuos tomada de la poblacin. En otras
palabras, es fcil estimar F, aunque debemos asumir que estamos en equilibrio
para utilizar la estimacin en la ecuacin.
E(H) = 1 Feq =
1 +
AA
AS
SS
Total
Alelos
A
S
Total
O/E
0.983
1.119
0.154
s:
w:
eficacia
coef. de
relativa
seleccin
0.879
0.121
1.000
0.000
0.138
0.862
AA
AS
SS
AC
SC
CC
s:
w:
eficacia
coef. de
relativa
seleccin
0.9
0.1
1.0
0.0
0.1
0.9
0.9
0.1
0.7
0.3
1.3
-0.3
fenotipos
Susceptible a la malaria
Resistente a la malaria
Anmico
Susceptible a la malaria
Anmico
Resistente a la malaria
Est claro en la tabla 5.2 que los genotipos CC son ptimos. Diramos que
tienen todas las ventajas de los heterocigotas AS sin las desventajas de stos.
Y sin embargo el alelo C es raro. La solucin proviene de pensar en la
seleccin natural como un proceso, una historia particular que ocurre una vez
que aparecen mutaciones.
Consideremos por ejemplo un punto de partida en el que, a partir del alelo
comn A, aparecen mutaciones como C y S. Estas mutaciones tendrn
frecuencias de 1/2N y estarn, como ya vimos, representadas por un individuo
heterocigota en cada caso al comienzo del proceso. De hecho, ya discutimos
que la aparicin de homocigotas es improbable, a no ser que el proceso
conduzca a un aumento sustancial de las frecuencias de estos alelos.
El caso es que, mientras los heterocigotas AS cuentan con ventajas con
respecto a los homocigotas AA, los heterocigotas AC no tienen ventaja alguna
con respecto a stos. En suma, la seleccin natural favorece la combinacin
AS, y con ello tiende a elevar la frecuencia del alelo S, mientras que acta
consistentemente en contra de las combinaciones AC y AA. Pero A es comn,
mientras que C es raro, de modo que el sistema tiende a un equilibrio
exactamente como el descrito ms arriba entre A y S. Entretanto, nuestro alelo
ideal C es relegado a frecuencias nfimas, si no eliminado completamente de la
poblacin. Templeton (1982) discute otros detalles del caso de buena manera.
En suma, la seleccin natural acta contra el alelo ideal puesto que ste no se
presenta en su forma homocigtica. La seleccin lleva a la poblacin a un
ptimo relativo, el del equilibrio entre A y S ya descrito, y eso mismo previene el
alcance del ptimo absoluto, el de la fijacin de C.
Podemos imaginar ahora un punto de partida diferente, en el que solamente la
mutacin C aparece en la poblacin, sin la molesta presencia del alelo S. En
este caso, al comienzo del proceso no hay accin de la seleccin, puesto que
C aparece en individuos heterocigotas, fenotpicamente indistinguibles de los
homocigotas AA (Tabla 5.2). En estas condiciones, el alelo C bien puede
desaparecer por accin de la deriva gentica, en virtud de su baja frecuencia.
Si la deriva lo lleva en cambio a una frecuencia ms alta, y comienzan a
aparecer homocigotas CC, entonces la seleccin puede llevar rpidamente a la
fijacin de esta condicin.
Esta discusin ilustra algunos detalles importantes del modo como opera la
seleccin que permanecen en la penumbra en una versin trivializada, como la
que sugiere que los alelos son siempre favorables o deletreos, y que la
seleccin actuar en consecuencia fijando los primeros y eliminando los
segundos. Vemos en nuestra discusin que, an en casos en que los
genotipos estn asociados a coeficientes de seleccin tan contundentes que
nos eximen de preocuparnos por las interacciones complejas de los genotipos
de nuestro locus de inters con el resto del genoma, la seleccin es un proceso
ms sutil. Por lo pronto, y siempre:
p
seleccin direccional
p
seleccin equilibradora
p
seleccin disruptiva
Lecturas recomendadas
Endler, J. A. 1986. Natural selection in the wild. Princeton Univ. Press,
Princeton. Libro clsico que pas revista a la evidencia y criterios para
reconocer la accin de la seleccin natural, e inspir numerosos
trabajos hasta nuestros das.
Ridley, M. 1996. Evolution. Blackwell Science, New York. Este excelente
libro de texto incluye una discusin detallada del melanismo industrial
en la polilla Biston betularia.
Templeton, A.R. 1982. Adaptation and the integration of evolutionary forces.
En Perspectives on Evolution, R. Milkman, Sinauer (ed.), Sinauer
Assoc., Sunderand. Es optimizadora la seleccin natural? En este
captulo, que forma parte del paquete de lecturas del curso de
Evolucin, Templeton discute el problema sobre la base del clsico
caso de la variacin en el gen de la betaglobina ligada a la anemia
falciforme y a la resistencia a la malaria.
Captulo 6: EL COALESCENTE
En 1987, Rebeca Cann y colaboradores publicaron un influyente trabajo sobre
la evolucin humana, basado en el estudio de unos 150 genomas
mitocondriales de individuos de muy diversas procedencias geogrficas y
tnicas. El artculo giraba alrededor de un rbol filogentico que expresaba las
relaciones entre esos genomas. Usando estimaciones existentes de la tasa de
evolucin de esos genomas, estimaron que el ancestro comn a stos debi
haber vivido hace unos 150 000 aos. Como el genoma mitocondrial se
trasmite por va materna, sealaron que ese genoma ancestral debi haber
estado presente en una nica mujer de aquella poca. No hizo falta mucho
ms para que la prensa la llamase la Eva mitocondrial. La filogenia
mitocondrial mostraba dos ramas derivadas de dicho ancestro. Una de ellas
llevaba exclusivamente a genomas africanos, mientras que la restante
conduca a muy diversos genomas, incluyendo aquellos procedentes del resto
del mundo pero tambin, y eso es importante, varios africanos. Sobre estas
bases, los autores concluyeron que la especie humana moderna se origin en
Africa hace unos 150 000 aos. Finalmente, los autores observaron que el
rbol filogentico mostraba una rpida sucesin de ramificaciones cerca de su
base, mientras que las ramificaciones ms cercanas al presente estaban ms
espaciadas. Ello les llev a proponer que la poblacin humana haba sufrido
una rpida expansin inmediatamente despes de su origen y en conjuncin
con su expansin desde Africa. En contraste con esos tamaos poblacionales
relativamente grandes, propusieron que su origen pudo haber involucrado un
cuello de botella, es decir un periodo en el que la especie se caracteriz por
tamaos poblacionales muy pequeos.
En la Figura 6.1 se representa la filogenia mitocondrial de Cann y
colaboradores en forma esquemtica. Un examen de ese rbol plantea de
inmediato numerosas preguntas. Por lo pronto, estamos acostumbrados a ver
filogenias de especies, pero esta es una filogenia de genomas mitocondriales.
Debe interpretarse como una filogenia de individuos? Esto tiene poco
sentido, ya que no aparece aqu la contribucin paterna a la genealoga
humana. Refleja entonces la mitad materna de nuestra historia? Y la
existencia de un nico ancestro comn, implica que todos descendemos de
una Eva mitocondrial? Porqu se afirma que la forma general de la filogenia
apunta a un origen africano? De ms est decir que estas y otras preguntas
han sido discutidas intensamente desde la aparicin del trabajo de Cann y
colaboradores. Aunque las interpretaciones originales pecan de cierta
ingenuidad, tambin es cierto que los ms finos y completos anlisis de los
genomas mitocondriales humanos han producido, hasta hoy, resultados
asimilables al esquema de la Figura 6.1. En otras palabras, el rbol de Cann y
colaboradores ha resistido el anlisis crtico. En cambio su interpretacin dista
mucho de ser evidente. Ms importante para nuestros propsitos, las
inferencias propuestas no pueden resolverse mirando con detenimiento este
rbol filogentico o los datos en que se bas o aplicando las herramientas del
anlisis filogentico. El mejor abordaje es abandonar por el momento el
problema inmediato y recurrir a las herramientas conceptuales de la gentica
de poblaciones.
hace
150 000 aos
presente
ancestro
comn
africanos
no africanos
Figura 6.1. Representacin esquemtica de la filogenia mitocondrial humana de Cann
et al. (1987). Cada crculo en las ramas terminales representa el genoma de un
individuo. El largo de las ramas es proporcional al tiempo, y el ancestro comn tiene
unos 150 000 aos de antigedad.
Tiempo
pasado
presente
Fig. 6.2. Genealoga de 5 alelos tomados en el presente, trazada hacia sus sucesivos
ancestros en las generaciones precedentes. Ntese que solamente los alelos que se
encuentran en la lnea directa de ascendencia de los incluidos en la muestra estn
conectados por la genealoga. Los restantes alelos de la poblacin,
independientemente de sus estados, no forman parte de la genealoga. Mientras que
la gentica de poblaciones clsica sigue hacia adelante el curso de toda la poblacin,
el coalescente investiga las propiedades de una muestra de alelos. La historia de la
poblacin solamente ser accesible a travs de las propiedades de dicha muestra, y
de la genealoga que la vincula a sus ancestros.
n
2
P(coal n) =
2N
Esta es una aproximacin que funciona bien si n << 2N. Notemos que,
mientras tengamos n linajes, esta sigue siendo la probabilidad de observar un
coalescente en cualquier momento de nuestra incursin hacia el pasado. Ms
en general, si tenemos i linajes:
i
2
P(coal) =
2N
i = 2, 3...n
Tiempos de espera
Aceptemos que el tiempo de espera promedio para un evento infrecuente
(como un coalescente) es el inverso de la probabilidad de dicho evento.
Llamemos T al tiempo de espera, y coloqumosle un subndice para indicar
cuntos alelos estamos considerando (Ti para i alelos). Se deduce de la
seccin anterior que los valores esperados son:
E(T2 ) = 2N
E(T3 ) = 2N / 3
...
2N
4N
E(Ti ) =
=
i i(i 1)
2
1
E(TMRCA ) = 4N 1
n
Este resultado es importante, ya que nos dice que, aunque la antigedad de la
genealoga aumenta, como es natural, a medida que agregamos alelos a la
muestra, tiende rapidamente a 4N generaciones. Este valor debe leerse, en
primer lugar, como el doble del nmero efectivo de genes de la poblacin (2 x,
en nuestro modelo, 2N alelos), y esta lectura tiene un valor general.
Sustityase el 2N por el nmero efectivo de genes de un locus cualquiera, y el
resultado es vlido.
La segunda e importante lectura de este resultado es que la diversidad
gentica neutral de una poblacin cualquiera est acotada en promedio, a
aquella acumulada en unas 4N generaciones. El proceso de homogeneizacin
por deriva gentica, que subyace a todos nuestros razonamientos, ocurre a una
tasa de 1/2N por generacin y, en promedio, resulta en que todos los alelos de
una poblacin derivan de un nico ancestro comn en un tiempo de unas 4N
generaciones.
Ntese tambin que E(T2) = 2N. Es decir que: a) an una modesta muestra de
dos alelos tomados al azar tiene una historia prolongada subyacente hasta el
ancestro comn, y b) dicha historia es, en generaciones, aproximadamente la
mitad de la historia total, que va desde los alelos de una muestra grande hasta
tomada en el presente hasta su ancestro comn.
Puesto que no hemos invocado todava a la mutacin, estos resultados
genealgicos son la manifestacin de la deriva pura en las poblaciones, si la
variacin es neutral. Es natural, por tanto, que dependan del tamao
poblacional, y tambin que contengan factores de ajuste para el tamao
muestral.
Variabilidad gentica en un contexto genealgico
La variacin gentica neutral, adquirida por mutacin, se genera con una
probabilidad por generacin. Puesto que las ramas de nuestra genealoga
son, en realidad, generaciones transcurridas a travs de sucesivos ancestros,
es fcil entender que para calcular la variacin gentica esperada, basta sumar
todas las ramas y multiplicar el resultado por . En cada intervalo Ti hay i
ramas, de modo que, si llamamos TTOT al tiempo total contenido en la
genealoga, la suma de valores esperados es:
E(TTOT ) =
iE(Ti )
i =2
n 1
1
1
E(S) = 4N =
i =1 i
i =1 i
E( ) = 2E(T2 ) = 4N =
En la Figura 6.3 se presentan dos genealogas con longitudes de ramas
proporcionales a sus valores esperados, y algunas mutaciones adquiridas
durante el proceso genealgico.
T2
T3
T4
T5
D E
Figura 6.3. A la izquierda, una genealoga de cinco alelos, con intervalos de tiempo
proporcionales a sus valores esperados. Las barras horizontales representan algunas
mutaciones ocurridas en ciertas generaciones y ramas particulares de la genealoga.
A la derecha, lo mismo para una muestra de dos alelos. Ntese que el valor esperado
de T2 es idntico, ya sea para una muestra de dos alelos en el presente o para los dos
linajes ancestrales, luego de pasar, a partir de una muestra de cinco alelos, por T5, T4
y T3.
esperados de las ramas son tiles, pero para cada locus, muestra de alelos, y
poblacin variarn al azar.
En segundo lugar, nosotros no podemos observar la genealoga. Una
realizacin genealgica acumular un cierto nmero de mutaciones, producto
de los errores de replicacin del ADN de una generacin a la siguiente, y stas
se manifestarn en nuestra muestra como sitios variables en el ADN. Por
ejemplo, las genealogas de la Figura 6.3 y las mutaciones acumuladas sobre
su trayectoria resultarn en seis sitios variables para la muestra de cinco alelos
y en dos para la de dos alelos. En el primer caso, no hay mutaciones que
distinguan a los alelos A y B, como no las hay para D y E. Un estudio que
secuenciase estos cinco alelos revelara solamente tres secuencias diferentes,
es decir tres clases de alelos: (A, B), (C) , y (D, E). Como ejercicio, el lector
puede inferir de la Fig. 6.3 el nmero de diferencias que las secuencias
revelaran entre cada par de clases.
Recordemos que la Fig. 6.3 solamente muestra los valores esperados de los Ti,
pero que las ramas pudieron haber sido ms cortas o ms largas, y que an
mantenindolas fijas el proceso mutacional pudo haber producido nmeros
diferentes de sitios variables. En otras palabras, el coalescente nos permite
entender que una realizacin cualquiera de la historia de una muestra de alelos
tiene dos fuentes de variacin: 1) la demografa, que se manifiesta en
variaciones en la topologa y longitudes de ramas; y 2) la mutacin, que en
cada generacin tiene una probabilidad de aparecer sobre una rama cualquiera
de la genealoga. En un sistema neutral como el aqu considerado, la mutacin
no afecta el xito de los alelos, por lo que se acumula sobre la genaloga sin
afectarla.
Aunque, como es natural, la mutacin puede realizarse en el paso de un
ancestro a un descendiente con absoluta prescindencia del contexto
genealgico ms amplio, el patrn de variacin total de una muestra de alelos
est condicionado por la genealoga. Podemos pensar que la forma y longitud
de la genealoga es una realizacin del proceso demogrfico, y que las
mutaciones que podremos observar en la muestra estn condicionadas por
dicha realizacin. La razn es que solamente veremos las mutaciones
acumuladas sobre la genealoga.
En cuanto al rbol de genes, resulta de nuestra capacidad de usar las
mutaciones como caracteres para el anlisis filogentico. En la Figura 6.4 se
muestra en resultado de dicho ejercicio para el caso de la genealoga de cinco
alelos de la Fig. 6.3
La Fig. 6.4 permite entender que la filogenia de alelos contiene informacin
parcial sobre la genealoga. Nos es imposible discernir, por ejemplo, que D y E
tienen un ancestro comn ms cercano al presente que A y B. Sin embargo,
aunque los datos de este ejemplo simple no permiten establecerlo con certeza,
es razonable suponer que la raz del rbol podra estar en la rama que separa a
D y E. Con ms informacin (secuencias ms largas, para tener ms sitios
variables, una muestra ms grande, y tal vez un grupo externo) podramos
grupo
externo
grupo
externo
A
C
DE
Figura 6.6. Las relaciones genealgicas entre alelos de dos poblaciones progresan
desde la polifilia (izquierda) a la monofilia recproca (derecha), pasando por una fase
de parafilia (centro), a medida que transcurre el tiempo desde su separacin por una
barrera estricta (el tringulo del esquema).
Lecturas recomendadas
Nordborg, M. Coalescent theory. Pp. 179-212 en D. J. Balding, M. Bishop, y C.
Cannings (eds.), Handbook of statistical genetics. Wiley, West Sussex, 2001.
Una presentacin general del coalescente, bien escrita pero bastante difcil
para los estudiantes de biologa.
Pueden consultarse adems las breves descripciones de los ya citados libros
de Gillespie (1998) y Hartl (2000), aunque ellas no van ms all que este
captulo.