Vous êtes sur la page 1sur 12

Entender los patrones de la estructura de la población humana, donde las encuestas

regionales son clave para delinar la variación geográficamente restringida, es importante


para el diseño e interpretación de estudios genéticos médicos. En particular, esperamos que
las variantes genéticas raras, incluidos los sitios funcionalmente relevantes, presenten poca
participación entre poblaciones divergentes (1). Los nativos americanos muestran la menor
diversidad genética de cualquier grupo continental, pero hay una alta divergencia entre las
subpoblaciones (2). Como resultado, las poblaciones indígenas estadounidenses actuales (y
las personas con ascendencia indígena) pueden albergar alelos privados locales raros o
ausentes en otros lugares, incluyendo variantes funcionales y médicamente relevantes
(3, 4). México sirve como un importante punto focal para tales análisis porque alberga una
de las mayores fuentes de diversidad precolombina y tiene una larga historia de
civilizaciones complejas con diversas contribuciones a la población actual.
Las estimaciones previas de la diversidad genética nativa mexicana examinaron los loci
individuales o se limitaron a un número reducido de poblaciones o pequeños tamaños de
muestra (5–8). Examinamos los patrones locales de variación de casi 1 millón SNPs
autosómicos de todo el genoma para 511 individuos nativos mexicanos de 20 grupos
indígenas, cubriendo la mayoría de las regiones geográficas de todo México (tabla S1). El
análisis de componentes principales estándar (PCA) resume los ejes principales de la
variación genética en el DataSet (véase (9)). Mientras que PC1 y PC2 separan a los
africanos y europeos de los mexicanos nativos, PC3 diferencia a las poblaciones indígenas
dentro de México, siguiendo un claro noroeste-sureste de Cline (). Un total de 0,89% de la
variación se explica por PC3, casi tres veces más que la variación que representa el eje
norte-sur de diferenciación dentro de Europa (0,30%, in (10)). Las poblaciones más
septentrionales (Seri) y meridionales (Lacandón) definen los extremos de la distribución,
con un clustering muy claro de individuos por población, indicando altos niveles de
divergencia entre los grupos (Fig. S1). Seri y Lacandon muestran el nivel más alto de
diferenciación poblacional medido con FSt(0,136, , Tabla S4), superior A la FSt entre los
europeos y las poblaciones chinas en HapMap3 (0,11) (11). Otras poblaciones en México
también muestran extrema FSt valores por ejemplo, el Huichol y Tojolabal tienen un por
pares FSt de 0,068, similar a la observada entre los indios Gujarati y los chinos en HapMap3
(0,076).
Abrir en una ventana separada
Fig. 1
Diferenciación genética de poblaciones nativas mexicanas. (A) análisis de componentes principales
de mexicanos nativos con muestras HAPMAP YRI y CEU. Etiquetas de población como en la tabla
S1. (B) Pairwise FSt valores entre las poblaciones nativas mexicanas ordenadas geográficamente
(ver también tabla S4). (C) relacionamiento gráfico de individuos que comparten más de 13 cm del
genoma medido por el total de segmentos idénticos a descendientes (EII). Cada nodo representa un
genoma haploide y los bordes dentro de los clústeres atraen a los nodos proporcionalmente a la IBD
compartida. La propagación de cada conglomerado es, por lo tanto, indicativo del nivel de
parentesco en cada población determinado por un algoritmo dirigido por la fuerza. Solo el diseño de
los nodos dentro de cada clúster es el resultado del algoritmo, ya que las poblaciones se localizan en
sus ubicaciones de muestreo aproximadas para facilitar la interpretación. Los paréntesis indican el
número de individuos representados fuera del tamaño total de la muestra (2N). La gama completa
de umbrales IBD se muestra en la Fig. S8. (D) gráfico treemix representando patrones de división
de población de los 20 grupos nativos mexicanos estudiados. La longitud de la rama es proporcional
a la deriva de cada población. Se utilizaron muestras africanas, europeas y asiáticas como grupos
marginados para erradicar el árbol (Fig. S9).
El alto grado de diferenciación entre las poblaciones medidas por FSt argumenta que estas
poblaciones han experimentado altos grados de aislamiento. De hecho, cuando se infiere la
autocigosidad utilizando corridas de homocigosidad (ROH), todas las poblaciones en
promedio tienen largos tratados homocigósis, con los Huichol, Lacandón y Seri, todos con
un promedio de más del 10% del genoma en ROH (higos. S2, S3; (9)). estas poblaciones
son especialmente pequeñas, aumentando los efectos de la deriva genética y conduciendo
parte de la alta FSt Valores. En contraste, las poblaciones Maya y Nahuan tienen
proporciones mucho más pequeñas del genoma en ROH, consistentes con los niveles de
ROH encontrados en poblaciones del cercano Oriente en HGDP (12). Estas poblaciones
son descendientes de grandes civilizaciones mesoamericanas, y concordante con grandes
poblaciones históricas, tienen proporciones relativamente bajas de ROH. El alto grado de
varianza en ROH entre las poblaciones es un indicador adicional de subestructura entre las
poblaciones y sugiere una gran varianza en los tamaños de población
históricos. Comparando los patrones ROH observados con los derivados de simulaciones
coalescentes, encontramos que los grupos nativos americanos dentro de México se
caracterizan por pequeños tamaños efectivos de población bajo un modelo con un fuerte
cuello de botella, de acuerdo con otros estudios de Poblaciones nativas americanas (13). El
grado de recuperación del tamaño de la población hasta el día actual es consistente con el
grado de aislamiento de las poblaciones existentes, que van desde 1196 cromosomas (95%
CI 317 – 1548) para los Seri en el desierto de Sonora, hasta 3669 (95% IC 2588 – 5522)
para los mayas de Quintana Roo (higos. S4 – S6; (9)).
El aislamiento también se correlaciona con el grado de parentesco dentro y entre los grupos
étnicos, formando finalmente el patrón de las relaciones genéticas entre las
poblaciones. Construimos un gráfico de parentesco () de personas que compartan > 13 cM
del genoma idénticamente por descenso (IBD) (correspondientes a 3Rd/4TH primos o
parientes más cercanos). Casi todas las conexiones están dentro-vs. entre-población,
consistente con las poblaciones siendo discretos en lugar de exhibir flujo genético a gran
escala (ver figs. S7, S8, (9)). Como se ve en los cálculos de ROH, los grupos Maya y
Nahuan tienen menos conexiones internas. Las pocas conexiones entre-población aparecen
en poblaciones cercanas a cada litoral, como las conexiones entre los Mayans de Campeche
y las poblaciones al oeste a lo largo del Golfo de México.
Los análisis de ROH e IBD de largo tracto son especialmente relevantes para la historia
reciente de aislamiento de las poblaciones nativas americanas. Para modelar el orden de
ramificación y el flujo genético entre las poblaciones nativas americanas, ejecutamos
TreeMix (14) para generar un modelo probabilístico de divergencia y migración entre las
poblaciones nativas americanas (). El árbol inferido sin vías de migración recapitula los
gradientes norte/sur y este/oeste de la diferenciación de los análisis PCA e IBD, con
poblaciones con valores altos de ROH que también exhiben ramas de punta más largas. Las
ramas primarias dividen las poblaciones por geografía. Todas las poblaciones del norte
(azul oscuro) rama de la misma división inicial en la raíz. También encontramos dos clados
principales adicionales: una agrupación de poblaciones de los Estados meridionales de
Guerrero y Oaxaca (etiquetas verdes) y un "clado Maya" compuesto por poblaciones de
habla Maya de Chiapas y la península de Yucatán en el sureste (etiquetas naranjas). La
introducción de los bordes migratorios al modelo conecta a los mayas en Yucatán a una
rama que conduce al Totonac, cuyos antepasados ocuparon la gran ciudad precolombina de
el Tajin en Veracruz (15). Este resultado apunta a un corredor costero Atlántico de flujo
genético entre la península de Yucatán y el centro/norte de México (Fig. S9), consistente
con nuestro análisis IBD. De hecho, la única lengua maya fuera del territorio Maya es
hablada por los Huastec, cerca del norte de Veracruz, apoyando una historia compartida
(16).
Estas señales permanecen hoy como un legado de la diversidad precolombina de las
poblaciones mexicanas. En los últimos 500 años, la dinámica de la población ha cambiado
drásticamente. Hoy en día, la mayoría de los mexicanos son admirados y pueden rastrear su
ascendencia no sólo a los grupos indígenas, sino también a Europa y África. Para investigar
patrones de mezcla, combinamos datos de las poblaciones de origen continental (incluidos
los 20 grupos nativos mexicanos, 16 poblaciones europeas y 50 Yorubas de África
occidental) con 500 individuos mestizos de 10 estados mexicanos reclutados por el Instituto
Nacional de Medicina Genómica (INMEGEN) para este estudio, mexicanos de Guadalajara
en la colección POPRES (17) e individuos de ascendencia mexicana de los Angeles en el
proyecto HapMap fase 3 (tabla S1). Hemos ejecutado el algoritmo del modelo de mezcla no
supervisado ADMIXTURE (18) para estimar proporciones de ascendencia para individuos
en nuestro conjunto de datos combinado (, S10, tabla S5). A nivel continental de K = 3
cúmulos ancestrales, encontramos que la mayoría de las personas tienen una gran cantidad
de ascendencia nativa y Europea, con un pequeño (típicamente < 5%) cantidad de
ascendencia africana. En el modelo de mejor ajuste para K = 9, el cluster nativo americano
se descompone en seis componentes separados (Fig. 2B). Tres de estos se limitan en su
mayoría a poblaciones aisladas (Seri: azul marino, Lacandón: amarillo, y Tojolabal:
marrón). Los otros tres muestran una distribución más amplia pero geográficamente bien
definida: un componente del norte (azul claro) representado por Tarahumara, tepehuano y
Huichol, disminuye gradualmente hacia el sur. Correspondientemente, un componente del
Sur (azul), que incluye Triqui, Zapotec y Mazatec, disminuye gradualmente hacia el
norte. En la península de Yucatán y el estado vecino de Chiapas, encontramos lo que
denominamos el "componente Maya" (naranja en Fig. 2B, panel inferior), que se encuentra
principalmente en los grupos de habla Maya. Curiosamente, este componente Maya
también está presente en ~ 10 – 20% en los nativos mexicanos centrales, consistente con el
IBD y los bordes migratorios que conectan las regiones. Esta relación entre la península de
Yucatán y el centro de México, visto tanto en los recientes modelos IBD compartidos
basados en la deriva genética de las frecuencias de alelo (TreeMix, ADMIXTURE), sugiere
que el flujo genético entre las dos regiones ha estado en curso durante mucho tiempo. En
contraste, la mezcla Maya no se encuentra en niveles apreciables en los Highlanders del
estado meridional de Oaxaca (Triqui y zapoteco), donde las cordilleras pueden haber
actuado como barreras geográficas al flujo genético.
Open in a separate window
Fig. 2
Estructura de población mexicana. (A) mapa de poblaciones muestreadas (detalladas en la tabla S1)
y proporciones medias de mezcla (tabla S5). Los puntos corresponden a las poblaciones mexicanas
nativas codificadas por colores según K = 9 racimos identificados en B (abajo), y las áreas
sombreadas denotan Estados en los que se muestrearon las poblaciones cosmopolitas. Los gráficos
circulares resumen las proporciones medias por estado de muestras cosmopolitas en K = 3 (europeo
en rojo, africano occidental en verde y nativo americano en gris). Las barras muestran el total de
ascendencia nativa americana descompuesta en proporciones medias de los subcomponentes nativos
identificados en K = 9. (B) proporciones globales de Ancestry en k = 3 (arriba) y k = 9 (abajo)
estimadas con ADMIXTURE incluyendo muestras mexicanas africanas, europeas, nativas
mexicanas y cosmopolitas (tablas S1 – S2). De izquierda a derecha, las poblaciones mexicanas se
muestran de norte a sur. (C) mapas de interpolación que muestren la distribución espacial de los
seis componentes nativos identificados en K = 9. Las intensidades de contorno son proporcionales a
los valores de ADMIXTURE observados en muestras nativas mexicanas, con cruces que indican
ubicaciones de muestreo. Los trazados de dispersión con ajustes lineales muestran los valores de
ADMIXTURE observados en muestras cosmopolitas frente a una distancia métrica que resume la
latitud y la longitud (eje largo) de los Estados muestreados. De izquierda a derecha: Yucatán,
Campeche, Oaxaca, Veracruz, Guerrero, Tamaulipas, Guanajuato, Zacatecas, Jalisco, Durango y
sonora. Los valores se ajustan en relación a la ascendencia nativa americana de cada individuo (9).
Los patrones de la subestructura poblacional de los nativos americanos se recapitulan en los
genomas de los mestizos mexicanos de las poblaciones cosmopolitas de todo
México. Sonora y los Estados vecinos del norte muestran las proporciones medias más altas
del componente nativo del norte (15%, azul claro en , abajo), mientras que sólo se detectan
rastros en Oaxaca y la península de Yucatán. Por el contrario, el componente nativo del sur
es el más prevalente entre los Estados, alcanzando los valores máximos en Oaxaca y
disminuyendo hacia el norte. Las muestras cosmopolitas de la península de Yucatán tienen
fracciones nativas americanas del genoma dominado por el componente Maya, que
disminuye en las poblaciones del norte. Del mismo modo, los componentes locales
relacionados con los mayas, tojolabal y Lacandon, se detectan por encima del 1%
exclusivamente entre individuos de los Estados vecinos de la península de Yucatán. En
contraste, los mexicanos-estadounidenses muestreados en los Angeles (MXL) no muestran
un patrón homogéneo, consistente con sus diversos orígenes dentro de México. En general,
la distribución geográfica continua de cada componente nativo americano a través de
México (Fig. S12) demuestra una alta correlación de proporciones de mezcla individuales
con la geografía, incluso en individuos de ascendencia mixta (, La prueba F del eje NW-SE
para todos los clústeres nativos, p < 10−16).
Para seguir probando si la estructura de la población ancestral se recapitula en los genomas
de los mestizos, se utilizó un enfoque específico de Ancestry (ASPCA) (ver Fig. S13,
(9, 19)). Calculamos la ascendencia local usando PCAdmix (20) para identificar segmentos
del genoma pertenecientes a ancestros nativos americanos, europeos o africanos. Este
análisis es posible con cualquier componente de la ascendencia; aquí, nos centramos en
sólo los componentes europeos y nativos americanos de ascendencia dadas las bajas
proporciones de ascendencia africana en general. Cabe esperar que la historia de la
ocupación y la colonización españolas en México se refleje en los segmentos europeos de
los mestizos mexicanos, como se ha visto anteriormente (21). La ASPCA de los haplotipos
europeos en los mexicanos actuales lo confirma, ya que los individuos se agrupara
estrechamente con los actuales iberos incluso con un denso conjunto de poblaciones
europeas (17, 22) (Fig. S14).
En contraste, dada la compleja historia demográfica de los nativos americanos, el alto
aislamiento y la caracterización limitada de los patrones de ascendencia regional (23, 24),
sigue siendo desconocida si la correlación entre genes y geografía observada en Europa
(10) puede ser igualmente recapitulada dentro de México. Utilizamos ASPCA para
descubrir la estructura de población oculta dentro de ascendencia nativa americana más allá
de la que se encuentra únicamente en los grupos indígenas existentes (). De acuerdo con los
análisis previos de la PCA, observamos las poblaciones indígenas más divergentes que
definen los extremos de los PCs superiores debido a los altos niveles de deriva genética y
aislamiento. Sin embargo, incluyendo todos los grupos indígenas en la trama enmascara la
señal contenida en los segmentos indígenas de los mestizos mexicanos. Cuando se trazan
los valores de ASPCA sólo para las personas con aditivos, descubrimos una fuerte
correlación entre la ascendencia nativa americana y la geografía dentro de México (Fig.
3B), con ASPC1 representando una dimensión de oeste a este y ASPC2 una de norte a
sur. Ambas correlaciones son altamente significativas y predictivas linealmente de la
ubicación geográfica (Pearson R2 de 72% y 38% para ASPC1 y 2, respectivamente, ambos
valores p < 10− 5). La correlación es lo suficientemente fuerte como para que la distribución
general de los haplotipos indígenas de origen mestizo en el espacio ASPCA se asemeje a un
mapa geográfico de México (, S15). Este hallazgo sugiere que la composición genética de
los mexicanos actuales recapitula la antigua subestructura nativa americana a pesar del
efecto potencial de homogeneización de la mezcla post-colonial. La estructura de la
población a gran escala que se remonta siglos no es meramente una propiedad de
comunidades indígenas aisladas o rurales. Las poblaciones cosmopolitas siguen reflejando
la ascendencia genética subyacente de las poblaciones autóctonas locales, argumentando
una fuerte relación entre la población indígena y la mestiza mexicana, aunque sin la deriva
extrema expuesta en alguna corriente grupos indígenas.
Abrir en una ventana separada
Fig. 3
Ascendencia subcontinental de genomas mexicanos y implicaciones biomédicas. (A) PCA
(ASPCA) específico de ascendencia de segmentos nativos americanos de muestras cosmopolitas
mexicanas (círculos de colores) junto con 20 poblaciones indígenas mexicanas (etiquetas de
población). Las muestras con > 10% de la mezcla no nativa fueron excluidas del panel de
referencia, así como los valores atípicos de la población como Seri, Lacandon y Tojolabal. (B)
detalle ampliado de la distribución de la fracción nativa americana de muestras cosmopolitas en
todo México. Las poblaciones ancestrales nativas se utilizaron para definir el espacio de la PCA
(prefijado por NAT), pero se eliminaron del fondo para resaltar el origen subcontinental de los
genomas mezclados (prefijado por MEX). Cada círculo representa el conjunto combinado de
haplotipos llamados como nativos americanos a lo largo del genoma haploide de cada muestra con
> 25% de ascendencia nativa americana. El mapa inserto muestra el origen geográfico de muestras
cosmopolitas por estado codificadas por colores por región (9). (C) coeficientes y intervalos de
confianza del 95% para las asociaciones entre la función ASPC1 y pulmonar (FEV1) de los
participantes mexicanos de la genética del asma en Latino Americanos (GALA I) estudio, y el
estudio de la infancia de la ciudad de México (MCCAS), así como ambos estudios combinados
(tabla S6, Fig. S17) (9). (D) medios y intervalos de confianza del cambio pronosticado en el
FEV1por estado extrapolado del modelo en 3C.
Habiendo encontrado estos patrones ocultos de ascendencia en el componente nativo de los
mestizos mexicanos, investigamos si esta estructura podría tener aplicaciones biomédicas
potenciales. Durante la última década, la ascendencia genética se ha asociado con
numerosos puntos finales clínicos y riesgos de enfermedad en poblaciones mezcladas,
incluyendo recuentos de neutrófilos (25), niveles de creatinina (26) y susceptibilidad al
cáncer de mama (27 ). Del mismo modo, los antecedentes ancestrales son especialmente
importantes en la medicina pulmonar, donde se utilizan diferentes ecuaciones de referencia
para diferentes etnias definiendo volúmenes previstos normativos e identificando umbrales
para el diagnóstico de enfermedades en estándar práctica clínica (28). Es decir,
dependiendo del origen étnico de uno, el mismo valor de volumen espiratorio forzado en 1
segundo (FEV1, una medida estándar de la función pulmonar) podría ser dentro del rango
normal o indicativo de enfermedad pulmonar. El trabajo anterior ha demostrado que la
proporción de ascendencia africana y Europea se asoció con el FEV1 en afroamericanos
(29) y mexicanos (30), respectivamente, estableciendo la importancia de la ascendencia
genómica en las ecuaciones de predicción de la función pulmonar.
Para investigar posibles asociaciones entre la estructura ancestral en los mexicanos y el
FEV1, aplicamos nuestro enfoque ASPCA a dos estudios que miden la función pulmonar en
niños mexicanos o mexicanos-americanos: el estudio de asma infantil de la ciudad de
México (MCCAS) (31) y la genética del asma en los Latinos Americanos (gala I) study
(32). Debido a las diferencias en los protocolos y las plataformas de genotipado,
calculamos los valores ASPCA para los dos estudios independientemente (Fig. S17)
utilizando las mismas poblaciones de referencia descritas anteriormente, luego utilizó
metanálisis de efectos fijos para combinar los resultados (9).
En primer lugar, en GALA I buscamos diferencias significativas de ascendencia específica
entre la ciudad de México y el área de la bahía de San Francisco, los dos sitios de
reclutamiento. Los valores de ASPCA se asociaron con la ubicación de reclutamiento, con
la curva característica de operador receptor de las dimensiones de ascendencia nativa
americana que resultó en un área bajo la curva (AUC) de 80% (Fig S17). Después de
ajustamos para las proporciones de ascendencia general (aquí africano y nativo americano),
ambos ASPCs fueron significativos en una regresión logística: ASPC1 o por SD: 0,44
(95% CI 0,22 – 0,68), p = 3.8 × 10− 4, ASPC2 o por SD: 1,68 (95% CI 1.03 – 2.76), p =
0.039. Los ASPCs definieron ejes similares de este a oeste y norte-sur como en el análisis
anterior (Fig. S17) y demostrar que los mexicanos-americanos en el área de la bahía de San
Francisco tienden a tener un aumento de ascendencia nativa americana desde el noroeste de
México en comparación con individuos de la ciudad de México (prueba de relación de
probabilidad de regresión logística conjunta p = 6.4 × 10− 5).
A continuación, se utilizaron los valores ASPCA para ambos estudios para probar una
asociación con FEV1 transformado al percentil de la función "normal" pronosticada a través
del conjunto estándar de ecuaciones de referencia (28) para individuos de ascendencia
mexicana. Estas ecuaciones utilizan características demográficas específicas de la
población para tener en cuenta la edad, el sexo y la estatura en estimaciones de la función
pulmonar. Ajustándonos a las proporciones generales de ascendencia en regresiones
lineales, observamos una asociación significativa entre el FEV1 y el componente este-oeste
(ASPC1) en ambos estudios con un metaanálisis de valor p de 0,0045 (2,2% de
disminución en el FEV1por 1 SD, 95% CI 0,69 – 3.74). Los tamaños de los efectos fueron
homogéneos (Fig. 3C, Tabla S6) a pesar de las diferencias en la estrategia de reclutamiento,
la geografía y la plataforma de genotipos (9). Por el contrario, ASPC2 no mostró ninguna
asociación con el FEV1. Sorprendentemente, mientras que el FEV1se ha asociado
previamente con la ascendencia general en varias poblaciones, el efecto visto aquí no está
correlacionado con las proporciones generales de la mezcla, ya que ajustamos para aquellos
en el modelo de regresión. Los resultados combinados aquí indican que la ascendencia sub-
continental medida por ASPCA es importante para caracterizar las mediciones clínicas.
Para estimar cómo la variación en la ascendencia genética dentro de México puede afectar
al FEV1, usamos los resultados de GALA I y MCCAS para predecir los valores de los
rasgos por estado (Fig. 3D) para las muestras de INMEGEN mestizos. Descubrimos que la
diferencia en la ascendencia de los nativos americanos sub-continentales medida por
ASPC1 da como resultado un cambio esperado del 7,3% en el FEV1 pasando del estado de
Sonora en el oeste al estado de Yucatán en el este. Estos resultados sugieren que los
patrones de escala fina de ascendencia nativa solo podrían tener impactos significativos en
las mediciones clínicas de la función pulmonar en individuos con mezcla dentro de México.
Este hallazgo indica que los diagnósticos de enfermedades como el asma y la enfermedad
pulmonar obstructiva crónica (EPOC) que dependen de los umbrales específicos de la
función pulmonar pueden beneficiarse de tomar en consideración la ascendencia a escala
más fina. Estos cambios debidos a la ascendencia son comparables a otros factores que
afectan la función pulmonar. Comparando el efecto esperado de la ascendencia en todo
México con los efectos conocidos de la edad en las ecuaciones de referencia mexicanas-
americanas estándar (28), el cambio inferido del 7,3% en el FEV1 asociado con la
ascendencia subcontinental es similar a la disminución de la FEV1 que un individuo
mexicano-americano de 30 años de altura promedio experimentaría por envejecimiento
10,3 años si masculino y 11,8 años si hembra. Del mismo modo, comparando nuestros
resultados de los datos mexicanos con el modelo que incorpora ascendencia en
afroamericanos, una diferencia de 7,3% en FEV1 correspondería a una diferencia del 33%
en ascendencia africana (29). Es importante destacar que la asociación entre el FEV1 y
ASPC1 no es un indicador de deterioro de la función pulmonar por sí mismo-más bien,
contribuye a la distribución de FEV1 valores y modificaría los umbrales clínicos.
Una implicación importante de nuestro trabajo es que los esfuerzos de mapeo multi-y trans-
étnicos se beneficiarán de la inclusión de individuos de ascendencia mexicana ya que la
población mexicana alberga ricas cantidades de variación genética que pueden estar en la
base de importantes biomédicas Fenotipos. Una pregunta clave A este respecto es si los
catálogos existentes de variación del genoma humano capturan la variación genética
presente en las muestras analizadas aquí. Realizamos etiquetado SNP específico y análisis
de intercambio de haplotipos en todo el genoma dentro de ventanas correderas de 100-KB
para evaluar el grado en que la diversidad de haplotipo en las muestras de mestizos
mexicanos podría ser capturada por paneles de referencia existentes (ver figs. S18 – 20,
(9)). Aunque las muestras mexicanas-americanas (MXL) fueron incluidas en los catálogos
HapMap y 1000 Genomes, el uso compartido medio de haplotipo para las muestras de
mestizos INMEGEN se limita al 81,2% y al 90,5% cuando se combina con todas las
poblaciones continentales de HapMap. Es sólo después de incluir las muestras nativas
americanas genotipadas aquí que casi 100% de haplotipos son compartidos, maximizando
las posibilidades de capturar la mayor parte de la variación en México.
Se ha invertido mucho esfuerzo en la detección de variantes genéticas comunes asociadas
con enfermedades complejas y la replicación de asociaciones entre las poblaciones. Sin
embargo, la variación funcional y médicamente relevante puede ser rara o específica de la
población, requiriendo estudios de diversas poblaciones humanas para identificar nuevos
factores de riesgo (4). Sin un conocimiento detallado de la estratificación geográfica de la
variación genética, los resultados negativos y la falta de replicación probablemente
dominen el resultado de los estudios genéticos en poblaciones no caracterizadas. Aquí,
demostramos un alto grado de estructura genómica a gran escala en todo México, moldeado
por dinámicas poblacionales precolombinas e impactando los genomas actuales de los
mestizos mexicanos, que es tanto de relevancia antropológica como biomédica. Estudios
como este son cruciales para permitir la medicina de precisión, proporcionar nuevos
recursos de datos, potenciar la próxima generación de estudios genéticos y demostrar la
importancia de comprender y medir la estructura de la población a gran escala y
susasociaciones con rasgos biomédicos.
Vete a:

Material suplementario
Suppl
Haga clic aquí para ver.(8.2 M, pdf)
Vete a:

Reconocimientos
Agradecemos a todos los voluntarios por donar generosamente muestras de ADN y
participar en el estudio.Este proyecto fue posible con el apoyo conjunto de múltiples
instituciones en México y Estados Unidos. La Universidad de Stanford apoyó a BDC con
fondos del Departamento de genética. El Instituto Nacional de Medicina Genómica
(INMEGEN) recibió el apoyo del gobierno federal de México, en particular del Ministerio
de salud, la Fundación Mexicana de la salud (FUNSALUD) y la Fundación Gonzalo Río
Arronte. Los gobiernos estatales y universidades de Durango, Campeche, Guanajuato,
Guerrero, Oaxaca, Sonora, Tamaulipas, Veracruz, Yucatán y Zacatecas contribuyeron
significativamente a este trabajo. Esta investigación fue apoyada también por el George
Rosenkranz Prize de cuidado de la salud investigación en países en desarrollo a AM-
E; Beca de investigación UCSF Canciller, tesis año comunión y NIH formación GM007175
T32 de subvención (para el CRG); el Premio de desarrollo Fundación Amos Facultad de
medicina; la Fundación Sandler; la Fundación Americana de asma (para EGB); Beca
CONACYT 129693 (al HR-V); BBSRC Grant BB/I021213/1 (AR-L); y los institutos
nacionales de salud (5R01GM090087, 2R01HG003229, ES015794, GM007546,
GM061390, HL004464, HL078885, HL088133, RR000083, P60MD006902, ES49019
ZIA). Este trabajo fue financiado en parte por el programa de investigación intramuros de
la NIH, Instituto Nacional de Ciencias de salud ambiental (a SJL). Algunos cálculos se
realizaron utilizando el sistema de computación de UCSF Bioestadística alto
rendimiento. También agradecemos a B. Henn, grava de S. y J. Byrnes para discusiones
útiles; Gunter C. y M. carpintero para editar el manuscrito; y M. Morales para informática y
programación de apoyo. CDB está en el Consejo Asesor de un proyecto en 23andMe; y en
los consejos científicos de Personalis, Inc.; InVitae; Etalon, Inc.; y Ancestry.com. Las
colecciones y los métodos para la muestra de referencia de población (POPRES) se
describen por Nelson et al., (2008). Los conjuntos de datos POPRES utilizados para el
análisis aquí descrito se obtuvieron de dbGaP a través de phs000145.v1.p1 número de
adhesión. Acceso a la base de datos MCCAS se puede obtener bajo los términos de un
acuerdo de transferencia de datos con NIEHS; el contacto es SJL. Existen genotipos
individuales de nivel para los nuevos datos presentados en este estudio, a través de un
acuerdo de acceso de datos para respetar la privacidad de los participantes para la
transferencia de datos genéticos, poniéndose en contacto con CDB, AM-E y el INMEGEN
(http://www.inmegen.gob.mx/).