Académique Documents
Professionnel Documents
Culture Documents
autor Manuscrito
Ciencia. Autor manuscrito; disponible en PMC 2014 13 de diciembre.
Samuel Canizales-Quinteros 3,17, Hctor Rangel Villalobos 7, Irma Silva Zolezzi- 3, , Esteban Gonzalez Burchard 6,9,
, y Carlos D. Bustamante 1,
2 Programa en Ciencias Farmacuticas y Farmacogenmica, Universidad de California en San Francisco, CA, EE.UU.
5 Departamento de Gentica, Evolucin y Medio Ambiente, University College de Londres, Londres, Reino Unido
8 Instituto Nacional de Ciencias Mdicas y Nutricin Salvador Zubirn, Ciudad de Mxico, Mxico
9 Departamento de Bioingeniera y Ciencias Teraputicas de la Universidad de California en San Francisco, CA, EE.UU.
NIH-PA Autor Manuscrito
12 Sistema de Cuidado de la Salud de los Veteranos del Caribe, San Juan, Puerto Rico
NIH-PA Autor Manuscrito
diecisis Instituto Nacional de Ciencias de Salud Ambiental, Institutos Nacionales de Salud, Departamento de Salud y Servicios Humanos,
Abstracto
Mxico alberga gran diversidad cultural y tnica, sin embargo, los patrones a escala fina de la variacin de todo
el genoma humano de esta regin siguen siendo en gran medida sin caracterizar. Se estudi la variacin
genmica en Mxico de ms de 1.000 personas que representan a 20 indgenas y 11 poblaciones mestizas.
Encontramos la estratificacin gentica llamativa entre las poblaciones indgenas en Mxico en diversos grados
de aislamiento geogrfico. Algunos grupos eran tan diferenciada como europeos son de los asiticos del este.
NIH-PA Autor Manuscrito
La comprensin de los patrones de estructura de la poblacin humana, donde las encuestas regionales
son clave para delinear la variacin geogrfica restringida, es importante para el diseo y la
interpretacin de los estudios de gentica mdica. En particular, se espera que las variantes genticas
raras, incluidos los sitios funcionalmente relevantes, para exponer poco intercambio entre las
poblaciones divergentes (1). Los nativos americanos mostrar la diversidad gentica ms bajo de
cualquier grupo continental, pero hay un alto nivel de divergencia entre las subpoblaciones (2). Como
resultado, hoy en da las poblaciones indgenas americanos (e individuos con ascendencia indgena)
puede albergar alelos privadas locales rara o ausente en otros lugares, incluyendo las variantes
NIH-PA Autor Manuscrito
Las estimaciones previas de la diversidad gentica nativa mexicana examinaron loci individuales o estaban limitados a un nmero
reducido de poblaciones o tamaos de muestra pequeos (5-8). Examinamos los patrones locales de variacin de casi un milln
de SNPs autosmicos en todo el genoma de 511 individuos mexicanos nativos de 20 grupos indgenas, que cubre la mayora de
las regiones geogrficas a travs de Mxico (Tabla S1). anlisis de componentes principales Standard (PCA) resume los ejes
principales de la variacin gentica en el conjunto de datos (ver (9)). Mientras que PC1 y PC2 separan africanos y europeos de los
nativos mexicanos, PC3 diferencia a las poblaciones indgenas en Mxico, a raz de una clina clara noroeste-sureste (fig. 1A). Un
explicado por PC3, casi tres veces ms que la variacin explicada por el eje norte-sur de la diferenciacin dentro de
Europa (0,30%, en (10)). El ms septentrional (Seri) y sur (lacandonas) poblaciones definen los extremos de la
distribucin, con muy clara agrupacin de los individuos por la poblacin, lo que indica un alto nivel de divergencia
NIH-PA Autor Manuscrito
entre los grupos (Fig. S1). Seri y Lacandona muestran el mayor nivel de diferenciacin de la poblacin como se
mide con F ST ( 0,136, Fig. 1B, Tabla S4), superior a la F ST entre europeos y chinos en las poblaciones HapMap3
(0.11) (11). Otras poblaciones dentro de Mxico tambin muestran extrema F ST valores; Por ejemplo, el Huichol y
tojolabal tienen un F pairwise ST de 0,068, similar a la observada entre los indios de Gujarat y los chinos en HapMap3
(0.076).
El alto grado de diferenciacin entre las poblaciones medido por F ST sostiene que estas poblaciones han
experimentado un alto grado de aislamiento. De hecho, cuando autozygosity utilizando carreras de
homozygosity (ROH) se infiere, todas las poblaciones en promedio tienen tractos homocigotos de largo, con
el Huichol, Lacandona, y Seri todo teniendo en promedio ms de 10% del genoma en ROH (figs S2, S3.;
(9)). Estas poblaciones son especialmente pequea, el aumento de los efectos de la deriva gentica y la
conduccin de algunos de los altos F ST valores. Por el contrario, las poblaciones mayas y nahuas tienen
proporciones mucho ms pequeas del genoma en ROH, consistente con los niveles de ROH se encuentran
en las poblaciones del Este Cerca en HGDP (12). Estas poblaciones son los descendientes de las grandes
NIH-PA Autor Manuscrito
El aislamiento tambin se correlaciona con el grado de relacin dentro y entre los grupos tnicos, en ltima instancia, dar
forma al patrn de relaciones genticas entre poblaciones. Construimos un grfico de relacin (Fig. 1C) de individuos que
Casi todas las conexiones son vs. intra entre poblaciones, en consonancia con las poblaciones de ser discreta en lugar de
NIH-PA Autor Manuscrito
exhibir el flujo de genes a gran escala (ver figs. S7, S8, (9)). Como se ha visto con los clculos de ROH, los grupos mayas y
nahuas tienen menos conexiones internas. Las pocas conexiones entre la poblacin aparecen en las poblaciones cercanas a
cada costa, tales como las conexiones entre los mayas y las poblaciones de Campeche hacia el oeste a lo largo del Golfo de
Mxico.
Los anlisis del tracto largo de ROH y la EII son especialmente relevantes para la historia reciente de aislamiento de las
poblaciones nativas americanas. Para modelar el orden de ramificacin y el flujo de genes entre las poblaciones de nativos
americanos, nos encontramos TreeMix (14) para generar un modelo probabilstico de divergencia y la migracin entre las
poblaciones de nativos americanos (Fig. 1D). El rbol inferido sin rutas de migracin recapitula el norte / sur y este / oeste de
gradientes
diferenciacin de la PCA y IBD analiza, con poblaciones con altos valores de ROH tambin exhibir ramas de punta ms largos.
Las ramas primarias se dividen las poblaciones por la geografa. Todas las poblaciones del norte (azul oscuro) se ramifican
desde la misma divisin inicial en la raz. Tambin encontramos dos clados adicionales importantes: una agrupacin de las
NIH-PA Autor Manuscrito
poblaciones de los estados del sur de Guerrero y Oaxaca (etiquetas verdes) y un clado Maya, compuesto por las poblaciones
de habla mayas de Chiapas y la pennsula de Yucatn, en el sureste (etiquetas de naranja). La introduccin de bordes
migratorias al modelo conecta los mayas en Yucatn a una rama principal de los totonacas, cuyos antepasados ocupado la
gran ciudad prehispnica de El Tajn, en Veracruz (15). Este resultado apunta a un pasillo de la costa atlntica de flujo de
genes entre la pennsula de Yucatn y Centro / Norte de Mxico (fig. S9), consistente con nuestro anlisis de la EII. De hecho,
la nica lengua maya fuera del territorio maya se habla por el huasteco, cerca, en el norte de Veracruz, el apoyo a una historia
compartida (16).
Estas seales siguen siendo hoy en da como un legado de la diversidad precolombina de la poblacin mexicana. Durante los
ltimos 500 aos, la dinmica de poblacin han cambiado drsticamente. Hoy en da, la mayora de los mexicanos se mezclan
y se puede rastrear su ascendencia no slo a los grupos indgenas sino tambin a Europa y frica. Para investigar los patrones
de mezcla, se combinaron los datos de las poblaciones de origen continental (incluyendo los 20 grupos nativos de Mxico, 16
poblaciones europeas, y 50 yorubas de frica Occidental) con 500 individuos mestizos mezclados procedentes de 10 estados
NIH-PA Autor Manuscrito
mexicanos reclutados por el Instituto Nacional de Medicina Genmica (INMEGEN ) para este estudio, los mexicanos de
Guadalajara en la coleccin POPRES (17) y las personas de ascendencia mexicana de los ngeles en el proyecto HapMap
Fase 3 (Tabla S1). Nos encontramos con el modelo de mezcla ADITIVO algoritmo sin supervisin (18) para estimar
proporciones ascendencia para los individuos en nuestro conjunto de datos combinados (Figs. 2, S10, Tabla S5). A nivel
continental de K = 3 grupos ancestrales, nos encontramos con que la mayora de las personas tienen una gran cantidad de
ascendencia indgena y europea, con una pequea cantidad (tpicamente <5%) de ascendencia africana. En el modelo de
mejor ajuste para K = 9, el clster nativo americano se descompone en seis componentes separados (Fig. 2B). Tres de ellos
estn restringidos principalmente a las poblaciones aisladas (Seri: azul marino, lacandones: amarillo, y tojolabal: marrn). Los
otros tres muestran una distribucin ms amplia, pero geogrficamente bien definida: un componente norte (azul claro)
representado por tarahumaras, tepehuanos y huicholes, disminuye gradualmente hacia el sur. En correspondencia, un
componente sur (azul), que incluye triqui, Zapoteca, y mazateco, disminuye gradualmente hacia el norte. En la pennsula de
Yucatn y el vecino estado de Chiapas, encontramos lo que denominamos el componente maya (naranja en la Fig. 2B, panel
inferior), que se encuentra principalmente en los grupos de habla maya. Curiosamente, este componente maya tambin est
presente en ~ 10-20% en nativos del centro de Mxico, de acuerdo con la IBD y la migracin bordes de conexin de las
regiones. Esta relacin entre la pennsula de Yucatn y el centro de Mxico, se ve en ambos modelos basados en la deriva
NIH-PA Autor Manuscrito
gentica y la EII compartidos recientes de frecuencias de alelos (TreeMix, mezcla), sugiere que el flujo gentico entre las dos
regiones ha estado en curso desde hace mucho tiempo. En contraste, la mezcla maya no se encuentra en niveles apreciables
Los patrones de subestructura poblacin nativa americana se recapitulan en los genomas de los mestizos
mexicanos de las poblaciones cosmopolitas en todo Mxico. Sonora y estados del norte vecinos muestran las
componente (15%, azul claro en la figura 2B, parte inferior), mientras que slo trazas se detectan en
Oaxaca y la pennsula de Yucatn. Por el contrario, el componente nativo del sur es el ms frecuente
entre los estados, alcanzando valores mximos en Oaxaca y disminuyendo hacia el norte. muestras
NIH-PA Autor Manuscrito
cosmopolitas de la pennsula de Yucatn tienen fracciones de nativos americanos del genoma dominada
por el componente maya, que disminuye en las poblaciones hacia el norte. componentes locales
Asimismo, relacionados con maya, tojolabal y Lacandona, se detectan por encima de 1% exclusivamente
entre individuos de los estados vecinos de la pennsula de Yucatn. Por el contrario, los
mexicano-americanos muestreados en Los ngeles (MXL) no muestran un patrn homogneo, coherente
con sus diversos orgenes dentro de Mxico. En general, la distribucin geogrfica de cada componente
continua de nativos americanos a travs de Mxico (fig. -16).
Para promover prueba si estructura de la poblacin ancestral se recapitula en los genomas de mestizos, se
utiliz un enfoque de linaje especfico PCA (ASPCA) (ver fig. S13, (9, 19)). Estimamos ascendencia local
utilizando PCAdmix (20) para identificar los segmentos del genoma que pertenece a los nativos americanos,
europeo, o de ascendencia africana. Este anlisis es posible con cualquier componente de ascendencia;
Aqu, nos centramos en slo los componentes europeos y nativos de ascendencia dada la baja proporcin
NIH-PA Autor Manuscrito
Por el contrario, dada la historia demogrfica compleja de los nativos americanos, alto aislamiento y caracterizacin parcial de
los patrones regionales ascendencia (23, 24), que an se desconoce si la correlacin entre los genes y la geografa observados
en Europa (10) puede ser recapitulado similar dentro de Mxico . Utilizamos ASPCA para descubrir la estructura de poblacin
oculta dentro de ascendencia americana nativa ms all de la que se encuentra exclusivamente en los grupos indgenas
existentes (figura 3A). En consonancia con el PCA anlisis anteriores, se observan las poblaciones indgenas ms divergentes
que definen los extremos de los mejores PCs debido a los altos niveles de la deriva gentica y el aislamiento. Sin embargo,
incluso todos los grupos indgenas de las mscaras de la trama de seal contenida en los segmentos indgenas de los mestizos
mexicanos. Al trazar los valores ASPCA slo para los individuos mezclados, descubrimos una fuerte correlacin entre la
ascendencia indgena y la geografa dentro de Mxico (Fig. 3B), con AsPC1 que representa una dimensin de oeste a este y
ASPC2 uno de norte a sur. Ambas correlaciones son muy significativa y lineal predictiva de ubicacin geogrfica (Pearson r 2 de
NIH-PA Autor Manuscrito
72% y 38% para AsPC1 y 2, respectivamente, ambos valores de p <10 -5). La correlacin es tan fuerte que la distribucin general
de haplotipos indgenas mestizos derivado en el espacio ASPCA se asemeja a un mapa geogrfico de Mxico (Figs. 3B, S15).
Este hallazgo sugiere que la composicin gentica de los mexicanos de hoy en da recapitula antigua subestructura de nativos
americanos a pesar del potencial efecto homogeneizador de mezcla post-colonial. estructura de la poblacin a escala fina, que
se remonta siglos no es simplemente una propiedad de las comunidades indgenas aisladas o rurales. poblaciones cosmopolitas
todava reflejan la ascendencia gentica subyacente de las poblaciones nativas locales, argumentando a favor de una fuerte
relacin entre la
indgena y la poblacin mestiza mexicana, aunque sin la deriva extrema exhibida en algunos grupos indgenas
actuales.
NIH-PA Autor Manuscrito
Despus de haber encontrado estos patrones ocultos de ascendencia en el componente nativo de mestizos mexicanos, hemos
investigado si esta estructura podra tener potenciales aplicaciones biomdicas. Durante la ltima dcada, la ascendencia gentica se ha
asociado con numerosos criterios de valoracin clnicos y los riesgos de enfermedades en las poblaciones mezcladas, incluyendo el
recuento de neutrfilos (25), los niveles de creatinina (26), y la susceptibilidad al cncer de mama (27). Del mismo modo, el fondo
ancestral es especialmente importante en la medicina pulmonar, en donde se utilizan diferentes ecuaciones de referencia para los
diferentes grupos tnicos que definen volmenes normativo predichos y la identificacin de los umbrales para el diagnstico de
enfermedades en la prctica clnica estndar (28). Es decir, dependiendo del origen tnico de uno, el mismo valor del volumen espiratorio
forzado en 1 segundo (FEV 1, una medida estndar de la funcin pulmonar) podra ser bien dentro de la gama normal o indicativa de
enfermedad pulmonar. Trabajos anteriores han demostrado que la proporcin de africanos y descendientes de europeos se asoci con
FEV 1 en los afroamericanos (29) y mexicanos (30), respectivamente, estableciendo la importancia de la genmica en la ascendencia de
Para investigar las posibles asociaciones entre la estructura ancestral de los mexicanos y FEV 1, hemos aplicado nuestro enfoque ASPCA
a dos estudios de medicin de la funcin pulmonar en nios mexicanos o mexicano-estadounidense: la infancia Estudio del Asma la
Ciudad de Mxico (MCCAS) (31) y la Gentica del asma en los latinos estadounidenses (GALA I) Estudio (32). Debido a las diferencias en
los protocolos y las plataformas de genotipado, se calcularon los valores ASPCA para los dos estudios de forma independiente (fig. S17)
utilizando las mismas poblaciones de referencia descritos anteriormente, a continuacin, utilizamos efectos fijos meta-anlisis para
En primer lugar, en la gala que buscamos diferencias significativas-ascendencia especfica entre Ciudad de Mxico y el rea de la
Baha de San Francisco, los dos sitios de reclutamiento. valores ASPCA se asociaron con la ubicacin de reclutamiento, con la
curva caracterstica del receptor-operador de las dimensiones ascendencia nativos americanos que resulta en un rea bajo la
curva (AUC) de 80% (fig S17). Despus se ajust para las proporciones ascendencia generales (aqu tanto africano y nativo
americano), ambos ASPCs fueron significativas en una regresin logstica: AsPC1 OR por SD:
0,44 (95% CI 0,22-0,68), p = 3,8 10 -4, ASPC2 OR por SD: 1,68 (IC del 95% 1,03 a 2,76), p = 0,039. El ASPCs define ejes
este-oeste y norte-sur similares como en el anlisis anterior (fig. S17) y muestran que los mexicano-estadounidenses en la baha de
NIH-PA Autor Manuscrito
San Francisco tienden a tener una mayor ascendencia americana nativa del Noroeste de Mxico en comparacin con los individuos
de la Ciudad de Mxico (articulacin logstica probabilidad de regresin prueba de razn de p = 6,4 10 -5).
A continuacin, utiliza los valores ASPCA para ambos estudios para comprobar una asociacin con FEV 1 como transformado al percentil de
la funcin normal predicho a travs del conjunto estndar de ecuaciones de referencia (28) para los individuos de ascendencia mexicana.
Estas ecuaciones utilizan caractersticas demogrficas especficas de la poblacin para tener en cuenta la edad, sexo y altura en las
estimaciones de la funcin pulmonar. Ajuste para las proporciones ascendencia generales en regresiones lineales, se observ una
asociacin significativa entre el FEV 1 y el componente Este-Oeste (AsPC1) en ambos estudios con un meta-anlisis valor de p de 0,0045
(2,2% de disminucin en el FEV 1 por 1 SD, IC del 95% 0,69 a 3,74). Los tamaos del efecto fueron homogneos (Fig. 3C, Tabla S6) a pesar
estrategia, la geografa, y genotipado plataforma (9). En contraste, ASPC2 no mostr asociacin con FEV 1. Sorprendentemente,
mientras que el FEV 1 se ha asociado previamente con ascendencia general en varias poblaciones, el efecto se ve aqu no se
correlaciona con proporciones generales de mezcla, como hemos ajustado para aquellos en el modelo de regresin. Los resultados
NIH-PA Autor Manuscrito
combinados aqu indican que ascendencia sub-continental como se mide por ASPCA es importante para la caracterizacin de las
mediciones clnicas.
Para estimar la variacin en la ascendencia gentica en Mxico puede afectar FEV 1, se utilizaron los resultados de GALA I y MCCAS
para predecir los valores de rasgos por estado (Fig. 3D) para las muestras mestizos INMEGEN. Hemos encontrado que la diferencia
en el sub-continental de ascendencia nativa americana, medida por resultados AsPC1 en una variacin previsto hasta el 7,3% en el
FEV 1 pasar del estado de Sonora, en el oeste del estado de Yucatn, en el este. Estos resultados sugieren que los patrones a escala
fina de ascendencia indgena solos podran tener un impacto significativo en las mediciones clnicas de la funcin pulmonar en
Este hallazgo indica que los diagnsticos de enfermedades como el asma y la enfermedad pulmonar obstructiva crnica (EPOC) que
dependen de los umbrales de la funcin pulmonar especficos pueden beneficiarse de tomar ascendencia escala ms fina en consideracin.
Estos cambios debido a la ascendencia son comparables a otros factores que afectan a la funcin pulmonar. Al comparar el efecto
NIH-PA Autor Manuscrito
esperado de la ascendencia a travs de Mxico con los efectos conocidos de edad en las ecuaciones de referencia
mexicano-estadounidense estndar (28), el cambio inferido 7,3% en el FEV 1 asociado con ascendencia sub-continental es similar a la
disminucin de FEV 1 que un 30 aos de edad individuo mexicano-estadounidense de mediana estatura experimentara por el
envejecimiento 10,3 aos si los aos de sexo masculino y 11,8 si es mujer. Del mismo modo, la comparacin de nuestros resultados a partir
de los datos de Mxico con el modelo de incorporacin de ascendencia en los afroamericanos, una diferencia del 7,3% en el FEV 1 correspondera
a una diferencia de 33% en ascendencia africana (29). Es importante destacar que la asociacin entre el FEV 1 y AsPC1 no es un indicador
de deterioro de la funcin pulmonar en su propia - en vez, contribuye a la distribucin de la FEV 1 valores y modificaran los umbrales
clnicos.
Una implicacin importante de nuestro trabajo es que los esfuerzos multi y trans-tnicos de mapeo se beneficiarn de la inclusin
de las personas de ascendencia mexicana ya que la poblacin mexicana alberga ricos cantidades de variacin gentica que
puede ser la base de importantes fenotipos biomdicas. Una cuestin clave en este sentido es si los catlogos existentes de la
variacin del genoma humano captar la variacin gentica presente en las muestras analizadas aqu. Se realiz centramos SNP
etiquetado y anlisis de comparticin haplotipo de todo el genoma dentro de 100-Kb ventanas correderas para evaluar el grado
NIH-PA Autor Manuscrito
en que la diversidad de haplotipos en las muestras mestiza mexicana podra ser capturado por paneles de referencia existente
(ver figs. S18-20, (9)) . Aunque las muestras MexicanAmerican (MXL) se incluyeron en tanto el HapMap y 1000 catlogos de
genomas, el intercambio de medio de haplotipos para las muestras mestizos INMEGEN se limita a 81,2% y para
90,5% cuando se combina con todas las poblaciones HapMap continentales. Es slo despus de que incluye las muestras de nativos
americanos genotipo que aqu que casi el 100% de los haplotipos son compartidos, lo que maximiza las posibilidades de capturar la
Mucho esfuerzo se ha invertido en la deteccin de variantes genticas comunes asociadas con la enfermedad asociaciones y replicar
complejos a travs de las poblaciones. Sin embargo, la variacin funcional y mdicamente relevante puede ser estudios raras o
poblaciones humanas para identificar nuevos factores de riesgo (4). Sin un conocimiento detallado de la estratificacin
geogrfica de la variacin gentica, los resultados negativos y la falta de replicacin son propensos a dominar el resultado de los
estudios genticos en poblaciones no caracterizados. Aqu, se demuestra un alto grado de estructura genmica a escala fina a
NIH-PA Autor Manuscrito
travs de Mxico, en forma de por dinmica de la poblacin precolombinas e impactando los genomas actuales de mestizos
Mexicana, que es de relevancia tanto antropolgicos y biomdica. Estudios como ste son cruciales para hacer que la medicina
de precisin, proporcionando nuevos recursos de datos, se faculta a la prxima generacin de estudios genticos, y la
demostracin de la importancia de entender y medir la estructura de la poblacin a escala fina y sus asociaciones con rasgos
biomdicas.
Material suplementario
Expresiones de gratitud
We thank all volunteers for generously donating DNA samples and participating in the study. This project was possible with the joint support
from multiple Institutions in Mexico and the United States. Stanford University supported CDB with funding from the Department of Genetics.
The National Institute of Genomic Medicine (INMEGEN) received support from the Federal Government of Mexico, particularly the Ministry of
Health, the Mexican Health Foundation (FUNSALUD) and the Gonzalo Ro Arronte Foundation. State governments and universities of
NIH-PA Autor Manuscrito
Durango, Campeche, Guanajuato, Guerrero, Oaxaca, Sonora, Tamaulipas, Veracruz, Yucatan, and Zacatecas contributed significantly to this
work. This research was also supported by the George Rosenkranz Prize for Health Care Research in Developing Countries awarded to AM-E;
UCSF Chancellors Research Fellowship, Dissertation Year Fellowship, and NIH Training Grant T32 GM007175 (to CRG); the RWJF Amos
Medical Faculty Development Award; the Sandler Foundation; the American Asthma Foundation (to EGB); CONACYT Grant 129693 (to HR-V);
BBSRC Grant BB/I021213/1 (to AR-L); and the National Institutes of Health (5R01GM090087, 2R01HG003229, ES015794, GM007546,
GM061390, HL004464, HL078885, HL088133, RR000083, P60MD006902, ZIA ES49019). This work was supported in part by the Intramural
Research Program of the NIH, National Institute of Environmental Health Sciences (to SJL). Some computations were performed using the
UCSF Biostatistics High Performance Computing System. We also thank B. Henn, S. Gravel, and J. Byrnes for helpful discussions; C. Gunter
and M. Carpenter for editing the manuscript; and M. Morales for informatics and programming support. CDB is on the advisory board of a
project at 23andMe; and on the scientific advisory boards of Personalis, Inc.; InVitae; Etalon, Inc.; and Ancestry.com. The collections and
methods for the Population Reference Sample (POPRES) are described by Nelson et al. (2008). The POPRES datasets used for the analyses
described here were obtained from dbGaP through accession number phs000145.v1.p1. Access to the MCCAS dataset may be obtained under
the terms of a data transfer agreement with NIEHS; the contact is SJL. Individual level genotypes for new data presented in this study are
available, through a data access agreement to respect the privacy of the participants for transfer of genetic data, by contacting CDB, AM-E, and
INMEGEN ( http://www.inmegen.gob.mx/ ).
Referencias y Notas
NIH-PA Autor Manuscrito
1. Gravel S, et al. historia demogrfica y el intercambio alelo raro en las poblaciones humanas. Actas de la Academia Nacional de
Ciencias de los Estados Unidos de Amrica. Julio 19,2011 108: 11983. [PubMed: 21730125]
2. Wang S, et al. La variacin gentica y la estructura de la poblacin en los nativos americanos. PLoS Genet. 2007 3 de noviembre: e185.
[PubMed: 18039031]
3. Acua-Alonzo V, et al. Una variante del gen ABCA1 funcional est asociada con niveles bajos de colesterol HDL y muestra evidencia
de la seleccin positiva en los nativos americanos. Hum Mol Genet. Julio 15.2010 19: 2877. [PubMed: 20418488]
4. Williams AL, et al. Variantes en la secuencia SLC16A11 son un factor de riesgo comn para la diabetes tipo 2 en Mxico. Naturaleza. diciembre
25,2013
5. Lisker R, E Ramrez, la estructura gentica de las poblaciones de V. babinsky autctonos de Mesoamrica: Mxico.
Hum Biol. Jun.1996 68: 395. [PubMed: 8935320]
6. Sandoval K, et al. la diversidad del cromosoma Y en los nativos mexicanos revela transicin continental de la estructura gentica de
las Amricas. American Journal of Physical Anthropology. Jul.2012 148: 395. [PubMed: 22576278]
NIH-PA Autor Manuscrito
7. Gorostiza A, et al. La reconstruccin de la historia de las poblaciones mesoamericanas a travs del estudio de la regin de control del
ADN mitocondrial. Ms uno. 2012; 7: e44666. [PubMed: 23028577]
8. Reich D, et al. La reconstruccin de la historia de la poblacin nativa americana. Naturaleza. Julio 11,2012 488: 370. [PubMed: 22801491]
10. Novembre J, et al. Los genes que reflejan la geografa dentro de Europa. Naturaleza. Noviembre 06.2008 456: 98. [PubMed: 18758442]
11. Altshuler DM, et al. La integracin de la variacin gentica comn y raro en diversas poblaciones humanas. Naturaleza. Septiembre 2,2010
467: 52. [PubMed: 20811451]
12. Henn B, Hon L, J Macpherson, Eriksson N. Distant Relatives Cryptic son comunes tanto en muestras aisladas y
cosmopolita genticos. Ms uno. 2012
13. Hey J. En el nmero de fundadores del Nuevo Mundo: una poblacin retrato gentico de la poblacin de las Amricas. PLoS
Biology. Julio 01.2005 3: E193. [PubMed: 15898833]
14. Pickrell JK, Pritchard JK. Inferencia de divisiones de la poblacin y mezclas de datos de frecuencia de alelo de todo el genoma.
PLoS Genet. 2012; 8: e1002967. [PubMed: 23166502]
15. Pascual Soto, A. El Tajn. En Busca de los Orgenes De Una Civilizacin. UNAM-INAH; Mjico:
2006.
16. Campbell L, Kaufman T. Maya lingstica: Dnde estamos ahora? Revisin Anual de Antropologa. 1985;
NIH-PA Autor Manuscrito
14: 187.
17. Nelson MR, et al. La muestra de poblacin de referencia, POPRES: un recurso para la poblacin, la enfermedad y la investigacin gentica
farmacolgicos. Am J Hum Genet. Septiembre 01.2008 83: 347. [PubMed: 18760391]
18. Alexander DH, Novembre J, Lange K. rpida estimacin basado en un modelo de ascendencia en individuos no relacionados. Genome
19. Moreno-Estrada A, et al. La reconstruccin de la historia gentica de la poblacin del Caribe. PLoS Genetics. Nov.2013 9:
e1003925. [PubMed: 24244192]
20. Brisbin A, et al. PCAdmix: Asignacin basado en componentes principales de linaje A lo largo de cada cromosoma en
individuos con mezcla de linaje a partir de dos o ms poblaciones. Hum Biol. Aug.2012 84: 343. [PubMed: 23249312]
21. Johnson NA, et al. componentes ancestrales de los genomas mezclados en una cohorte mexicana. PLoS Genet. Dec.2011 7: e1002410.
[PubMed: 22194699]
22. Botigue LR, et al. El flujo de genes desde el norte de frica contribuye a la diferencia de la diversidad gentica humana en el sur de Europa.
Proc Natl Acad Sci EE.UU. A. julio 16,2013 110: 11791. [PubMed: 23733930]
23. Wang S, et al. patrones geogrficos de la mezcla del genoma en latn mestizos americanos. PLoS Genet. Abril 01,2008 4:
e1000037. [PubMed: 18369456]
24. Silva-Zolezzi I, et al. Anlisis de la diversidad genmica en poblaciones mestizas mexicanas para desarrollar la medicina genmica
NIH-PA Autor Manuscrito
en Mxico. Proc Natl Acad Sci EE.UU.. 2009; 21: 8.611-8.616. [PubMed: 19433783]
25. Nalls MA, et al. mapeo mezcla de recuento de glbulos blancos: locus gentico responsable de la baja cantidad de glbulos blancos en los
estudios de la salud del corazn ABC y Jackson. Am J Hum Genet. Jan.2008 82:81. [PubMed: 18179887]
26. Peralta CA, et al. La Asociacin de ascendencia africana y creatinina elevada en el desarrollo de la arteria del riesgo
coronario en adultos jvenes Estudio (cardias). Am J Nephrol. 2010; 31: 202. [PubMed: 20029176]
27. Fejerman L, et al. ascendencia gentica y el riesgo de cncer de mama entre las mujeres latinas en Estados Unidos. Investigacin sobre el cncer.
28. Hankinson JL, Odencrantz JR, Fedan KB. valores de referencia espiromtricos de una muestra de la poblacin general de Estados
Unidos. American Journal of Respiratoria y Medicina de Cuidados Crticos. Jan.1999 159: 179. [PubMed: 9872837]
29. Kumar R, et al. ascendencia gentica en las predicciones de la funcin pulmonar. New England Journal of Medicine. Julio 22,2010 363: 321.
[PubMed: 20647190]
30. Salari K, et al. la mezcla gentica y fenotipos relacionados con el asma en los asmticos mexicanos y puertorriqueos. Genet
NIH-PA Autor Manuscrito
31. Hancock DB, et al. estudio de asociacin de todo el genoma implica cromosoma 9q21.31 como un locus de susceptibilidad para el
asma en nios mexicanos. PLoS Genetics. Agosto 01.2009 5: e1000623. [PubMed: 19714205]
32. Torgerson DG, et al. mapeo de mezcla de casos y controles en poblaciones latinas enriquece para genes conocidos de asma
asociada. J Allergy Clin Immunol. mayo 12,2012
33. Mao X, et al. Un panel genoma cartografa mezcla para las poblaciones latinos / hispanos. Am J Hum Genet. Jun.2007
80: 1171. [PubMed: 17503334]
34. Precio AL, et al. anlisis de componentes principales corrige para la estratificacin en estudios de asociacin de todo el
genoma. Nat Genet. Agosto 01.2006 38: 904. [PubMed: 16862161]
35. Weir BS, Cockerham CC. La estimacin de F-Estadsticas para el Anlisis de la estructura de la poblacin. Evolucin. 1984; 38:
1358.
36. Weir BS, Colina WG. La estimacin de F-estadsticas. Revisin Anual de Gentica. 2002; 36: 721.
37. Wickham, H. Uso R. Springer; Nueva York: 2009. ggplot2: Grficos elegantes para el anlisis de datos; pag. VIIIp. 213
38. Purcell S, et al. PLINK: un conjunto de herramientas para la asociacin de todo el genoma y vinculacin basada en la poblacin analiza. Am J
39. Nalls MA, et al. Medidas de autozygosity en declive: la globalizacin, la urbanizacin y sus implicaciones para la gentica mdica.
NIH-PA Autor Manuscrito
40. Jobin M, J. Montaa de rechazo: Software para la Historia de la poblacin de inferencia a partir de datos genticos a travs de un algoritmo
de rechazo. Bioinformtica. 2008; 24: 2936-2937. [PubMed: 18936052]
41. Auton A, et al. La distribucin global de la diversidad genmica de relieve la compleja historia rica de las poblaciones humanas
continentales. Genome Res. Mar 13,2009: 1.
42. Henn BM, et al. Cazadores-recolectores diversidad genmica sugiere un origen africano sur de los humanos modernos. Procedimientos
de la Academia Nacional de Ciencias. Abril 29,2011 108: 5154.
43. Chen GK, Mejorana P, Wall JD. simulacin rpida y flexible de los datos de secuencia de ADN. La investigacin del genoma. Jan.2009
19: 136. [PubMed: 19029539]
44. Browning SR, Browning BL. El rpido y preciso ajuste de fase haplotipo y desaparecidos-datos inferencia para estudios de asociacin de todo el
genoma mediante el uso de la agrupacin haplotipo localizada. American journal of gentica humana. Noviembre 01.2007 81: 1084. [PubMed:
17924348]
45. SR Browning. Falta de imputacin de datos y la inferencia fase haplotipo para estudios de asociacin en todo el genoma.
Human Genetics. Diciembre 01,2008 124: 439. [PubMed: 18850115]
46. Gusev A, et al. Toda la poblacin, el mapeo en todo el genoma de relacin oculta. La investigacin del genoma. Mar 01.2009 19: 318.
[PubMed: 18971310]
47. Henn BM, et al. ascendencia genmica de los africanos del norte apoya el regreso a la frica migraciones. PLoS Genet. 2012 ene 8:
e1002397. [PubMed: 22253600]
NIH-PA Autor Manuscrito
48. Kidd JM, et al. Poblacin inferencia gentica a partir de datos del genoma personal: impacto de ascendencia y mezcla en la variacin
genmica humana. Am J Hum Genet. Octubre 5,2012 91: 660. [PubMed: 23040495]
49. Raiko T, Ilin A, Karhunen J. Anlisis de componentes principales para los problemas a gran escala con una gran cantidad de valores que faltan.
50. Tang H, Peng J, Wang P, Risch NJ. Estimacin de mezcla individual: consideraciones de diseo de anlisis y de estudio.
Epidemiologa gentica. Jun.2005 28: 289. [PubMed: 15712363]
51. Torgerson DG, et al. Meta-anlisis de los estudios de asociacin de genoma de asma en poblaciones tnicamente diversas de
Amrica del Norte. Nature Genetics. Sep.2011 43: 887. [PubMed: 21804549]
52. Burchard EG, et al. Menor capacidad de respuesta broncodilatadora en Puerto Rico que en los sujetos mexicanos con asma. Am J
Respir Crit Care Med. Febrero 1,2004 169: 386. [PubMed: 14617512]
53. Galanter JM, et al. replicacin Cosmopolitan y tnica especfica de factores de riesgo genticos para el asma en 2 poblaciones
latinas. El Diario de Alergia e Inmunologa Clnica. Jul.2011 128: 37. [PubMed: 21621256]
54. Bigham A, et al. La identificacin de las firmas de seleccin natural en tibetano y poblaciones andinas Uso denso Genoma datos
explorados. PLoS Genetics. Septiembre 09,2010 6: e1001116. [PubMed: 20838600]
55. Wu H, et al. Evaluacin de genes candidatos en un estudio de asociacin del genoma del asma infantil en los mexicanos.
NIH-PA Autor Manuscrito
56. Li JZ, et al. las relaciones humanas en todo el mundo inferidos a partir de patrones de todo el genoma de variacin. Ciencia. Mar
22,2008 319: 1100. [PubMed: 18292342]
57. McVean G. Una interpretacin genealgica de anlisis de componentes principales. PLoS Genetics. 2009 5 de octubre: e1000686.
[PubMed: 19834557]
58. Aguirre Beltran G. La trata de esclavos en Mxico. El hispana American Historical Review. 1944; 24: 412.
59. Lao O, et al. Correlacin entre la estructura gentica y geogrfica en Europa. Curr Biol. Ago
26.2008 18: 1241. [PubMed: 18691889]
60. Stephens M, Scheet P. Contabilidad para el decaimiento de desequilibrio de ligamiento en la inferencia de haplotipos y la imputacin-datos
que faltan. American journal of gentica humana. Abril 01,2005 76: 449. [PubMed: 15700229]
61. Stephens M, Smith NJ, Donnelly P. Un nuevo mtodo estadstico para la reconstruccin haplotipo a partir de datos de poblacin.
American journal of gentica humana. Mayo 01.2001 68: 978. [PubMed: 11254454]
62. Villarreal Molina-MT, et al. Asociacin de la casete de unin a ATP transportador variante A1 R230C con la diabetes de inicio temprano
de tipo 2 en una poblacin mexicana. Diabetes. Feb.2008 57: 509. [PubMed: 18003760]
63. Romeo S, et al. La variacin gentica en PNPLA3 confiere susceptibilidad a la enfermedad de hgado graso no alcohlico. Nature
NIH-PA Autor Manuscrito
64. Barrett JC, Fry B, Maller J, Daly MJ. Haploview: anlisis y visualizacin de mapas LD y haplotipos. Bioinformtica. Ene
15.2005 21: 263. [PubMed: 15297300]
NIH-PA Autor Manuscrito
Figura 1.
La diferenciacin gentica de las poblaciones nativas de Mxico. ( UN) Anlisis de componentes principales de los nativos mexicanos con
muestras HapMap YRI y CEU. Poblacin etiqueta como en la Tabla S1. ( SEGUNDO)
Por parejas F ST los valores entre las poblaciones nativas de Mxico ordenados geogrficamente (vase tambin la Tabla S4). ( DO) grfico
de relacin de las personas que comparten ms de 13 cm del genoma tal como se mide por el total de segmentos idnticos por
descendencia (IBD). Cada nodo representa un genoma haploide y los bordes dentro de los conglomerados atraer nodos
proporcionalmente a IBD compartido. La propagacin de cada grupo es por lo tanto indicativa del nivel de relacin en cada poblacin
como se determina mediante un algoritmo de la fuerza dirigida. Slo la disposicin de los nodos dentro de cada grupo es el resultado del
algoritmo, ya que las poblaciones se localizan en sus ubicaciones aproximadas de muestreo para facilitar la interpretacin. Los parntesis
tamao de la muestra total (2N). La gama completa de los umbrales de EII se muestran en la fig. S8. ( RE) TreeMix grfico que
representa patrones de desdoblamiento de la poblacin de los 20 grupos nativos mexicanos estudiados. La longitud de la rama es
proporcional a la desviacin de cada poblacin. frica, Europa, Asia y las muestras se utilizaron como grupos externos a raz del rbol
NIH-PA Autor Manuscrito
(fig. S9).
NIH-PA Autor Manuscrito
NIH-PA Autor Manuscrito
Figura 2.
NIH-PA Autor Manuscrito
estructura de la poblacin mexicana. ( UN) Mapa de poblaciones muestreadas (detallado en la Tabla S1) y mezcla proporciones
promedio (Tabla S5). Dots corresponden a las poblaciones nativas de Mxico de color-codificados de acuerdo con K = 9 grupos
identificados en B (parte inferior), y las reas sombreadas denotan estados en los que se muestrearon las poblaciones cosmopolitas.
Los grficos circulares resumen por estado proporciones medias de muestras cosmopolitas en K = 3 (Europea en rojo, frica Occidental
en verde, y nativos americanos en gris). Las barras muestran la ascendencia total de Native American descompone en proporciones
proporciones ascendencia Globales de K = 3 (arriba) y K = 9 (parte inferior) estimada con ADITIVO incluyendo frica,
Europa, Native mexicana, y las muestras de Mxico cosmopolitas (Tablas S1-S2). De izquierda a derecha poblaciones
mapas de interpolacin que muestran la distribucin espacial de los seis componentes nativos identificados en K = 9. intensidades de
muestras Mexicana, con cruces indican los lugares de muestreo. Grficos de dispersin con ajustes lineales muestran
valores mezcla observados en muestras cosmopolitas frente a una mtrica latitud resumir distancia y longitud (eje largo)
para los estados de la muestra. De izquierda a derecha: Yucatn, Campeche, Oaxaca, Veracruz, Guerrero, Tamaulipas,
NIH-PA Autor Manuscrito
Guanajuato, Zacatecas, Jalisco, Durango y Sonora. Los valores se ajustan en relacin con el total de ascendencia
Fig. 3.
ascendencia subcontinental de los genomas de Mxico mezclados e implicaciones biomdicas. ( UN)
-Linaje especfico PCA (ASPCA) de segmentos nativos americanos de muestras cosmopolitas de Mxico (crculos de color) junto
con 20 poblaciones indgenas de Mxico (etiquetas de poblacin). Las muestras con> 10% de mezcla no nativo fueron excluidos
del panel de referencia, as como los valores atpicos de poblacin, como Seri, Lacandona, y tojolabal. ( SEGUNDO) detalle
ampliada de la distribucin de la fraccin de nativos americanos de muestras cosmopolitas en todo Mxico. poblaciones
ancestrales nativas fueron utilizados para definir el espacio PCA (con el prefijo NAT), pero eliminan del fondo para resaltar el
origen sub-continental de los genomas mezclados (con el prefijo MEX). Cada crculo representa el conjunto combinado de
NIH-PA Autor Manuscrito
haplotipos llamados como americano nativo a lo largo del genoma haploide de cada muestra con> 25% de ascendencia de
nativos americanos. mapa El recuadro muestra el origen geogrfico de las muestras cosmopolitas por estado un cdigo de
colores por regin (9). ( DO) Coeficientes y los intervalos de confianza del 95% para las asociaciones entre AsPC1 y la funcin
pulmonar (FEV 1) de los participantes mexicanos de la Gentica del asma en los latinoamericanos (GALA I) de estudio, y la
Infancia Estudio del Asma la Ciudad de Mxico (MCCAS), as como los dos estudios combinados (Tabla S6, Fig. S17) (9). ( RE)
Medios e intervalos de confianza de cambio previsto en el FEV 1 por estado extrapolada a partir del modelo en 3C.