Vous êtes sur la page 1sur 14

¿QUÉ ES LA SECUENCIACIÓN DE NUEVA GENERACIÓN?

La secuenciación de nueva generación (NGS, por sus siglas en inglés) complementarios presentes en la placa. Tras la acción de la
se refiere a maneras nuevas y más rápidas de secuenciar el ADN y el polimerasa, que utiliza estos adaptadores como cebador, se
ARN que están revolucionando de manera eficaz la genómica y la sintetiza la cadena complementaria, quedando inmovilizada.
biología molecular. Seguidamente, tendrá un nuevo ciclo de desnaturalización,
La NGS, también llamada"secuenciación de alto rendimiento," es una provocando que las hebras desnaturalizadas formen puentes
colección de técnicas de secuenciación genética que mejoran el gracias a la unión de su extremo libre con otro de los
proceso de secuenciación original de Sanger. Entre diversos ejemplos adaptadores inmovilizados en la placa. Este proceso se repite
se incluyen la secuenciación Illumina (Solexa), la secuenciación varias veces, hasta formar lo que se conoce como clusters, una
Roche 454, la secuenciación Ion torrent: Proton/PGM y la agrupación de secuencias idénticas inmovilizadas sobre una
secuenciación SOLiD. Estos modos de secuenciación de ADN y ARN superficie sólida. Este mecanismo es propio de Illumina.
utilizan procesos paralelos masivos para trabajar de manera más
rápida y rentable que el método Sanger.
¿Por qué elegir la secuenciación de nueva generación?
Además de reducir los costes y el tiempo para la secuenciación de ADN
y ARN, la secuenciación de nueva generación también permite
secuenciar con muestras más pequeñas. El tiempo y el esfuerzo
necesarios para preparar las muestras también se reduce en
comparación con la secuenciación de Sanger.

En la PCR en emulsión (A), la mezcla de reacción consiste en una emulsión


aceite-agua creada para encapsular complejos entre el ADN y nanoesferas, dentro
El tamaño de lectura es muy importante a la hora de secuenciar, porque cuanto mayor sea de gotículas de agua. Tras la emulsión, se lleva a cabo la amplificación, de tal
la longitud de la secuencia, el fragmento del genoma cubierto es también más grande, manera que cada nanoesfera queda recubierta por varios miles de copias de la
por lo que, en el posterior análisis bioinformático, hay un menor número de lecturas que misma secuencia molde formando una polonia. En la PCR puente (B), la
solapar (A). En cambio, si las lecturas son más cortas, el fragmento del genoma cubierto secuenciación tiene lugar sobre una placa de vidrio, sobre la que están dispuestos
es más pequeño, y con ello el número de lecturas finales para tratar de cubrir el genoma adaptadores complementarios a los adaptadores anclados en las secuencias
completo será mucho mayor, hecho que dificultará el ensamblaje en el posterior análisis desnaturalizadas a secuenciar. Así, cada fragmento de ADN monocatenario se unirá
(B). por uno de sus extremos a uno de los oligonucleótidos complementarios presentes
en la placa. Tras la acción de la polimerasa, que utiliza estos adaptadores como
Las plataformas de secuenciación NGS son múltiples y cebador, se sintetiza la cadena complementaria, quedando inmovilizada.
Seguidamente, tendrá un nuevo ciclo de desnaturalización, provocando que las
variadas, cada una con sus respectivas particularidades, pero
hebras desnaturalizadas formen puentes gracias a la unión de su extremo libre con
todas ellas tienen en común que la detección del ácido nucleico
otro de los adaptadores inmovilizados en la placa. Este proceso se repite varias
no es aplicable a una única molécula, por lo que se requiere de veces, hasta formar lo que se conoce como clusters, una agrupación de secuencias
una previa amplificación del fragmento a secuenciar para poder idénticas inmovilizadas sobre una superficie sólida.
obtener lecturas secuenciadas del mismo. Este proceso puede
darse o bien mediante una ​PCR en emulsión o una PCR El inconveniente que supone la introducción de esta etapa, es la
puente​. En el primer caso, la mezcla de reacción consiste en posible incorporación de errores debidos a fallos en la
una emulsión aceite-agua creada para encapsular complejos polimerasa durante el proceso de síntesis de nuevas copias
entre el ADN y nanoesferas, dentro de gotículas de agua. Tras mediante PCR.
la emulsión, se lleva a cabo la amplificación, de tal manera que técnicas más anticuadas a más utilizadas, de las
cada nanoesfera queda recubierta por varios miles de copias de plataformas más comunes disponibles en la actualidad.
la misma secuencia molde formando una polonia (nombre que
recibe el conjunto de copias de la misma secuencia). 454 LIFE SCIENCES
Dependiendo de la plataforma NGS, estas nanoesferas se unen La tecnología 454 es la tecnología de secuenciación masiva
químicamente a la superficie de cristal (SOLID) o se depositan comercializada por la compañía Roche. Esta estrategia se
en los pocillos de las placas multipocillo empleadas en dicha fundamenta en la pirosecuenciación, una metodología que se basa
plataforma (454 Life Sciences y Ion Torrent). En el segundo en la detección quimioluminiscente del pirofosfato liberado durante
caso, la secuenciación tiene lugar sobre una placa de vidrio, la elongación de la cadena complementaria de ADN, lo que permite
sobre la que están dispuestos adaptadores complementarios a la rápida determinación de secuencias a tiempo real. A pesar de
los adaptadores anclados en las secuencias desnaturalizadas a que el coste por carrera es relativamente caro, es una tecnología
secuenciar. Así, cada fragmento de ADN monocatenario se capaz de ofrecer lecturas largas, de alrededor de 700 pares de
unirá por uno de sus extremos a uno de los oligonucleótidos bases (pb), en un período de tiempo más o menos corto. Sin
embargo, es poco sensible, en la detección de homopolímeros. A tecnológicos de los últimos 5 años han conducido al desarrollo
día de hoy, 454 es una plataforma prácticamente en desuso, ya de la secuenciación de nueva generación (next generation
que el resto de tecnologías disponibles ofrecen resultados de mejor sequencing [NGS]), también conocida como secuenciación
calidad y a un mejor precio. masiva paralela, del inglés massive parallel sequencing (MPS).
Esta «nueva generación» ha mejorado dramáticamente en los
SOLID (SUPPORT OLIGONUCLEOTIDE LIGATION DIRECTION) últimos años, logrando que el número de bases que se pueden
SOLID es la única estrategia que lleva a cabo una secuenciación por secuenciar por unidad de precio haya crecido
ligación. Tras su salida al mercado, captó la mirada de muchos exponencialmente. Por tanto las nuevas plataformas se
investigadores, pero su alta tasa de error y la generación de secuencias distinguen por su capacidad de secuenciar millones de
muy cortas, de unas 50 pb, provocó que, con el paso de los años, como fragmentos de ADN de forma paralela a un precio mucho más
en el caso de 454, sea una de las estrategias menos utilizadas. barato por base. Además la secuenciación masiva tiene el
potencial de detectar todos los tipos de variación genómica en
ION TORRENT SEQUENCING un único experimento, incluyendo variantes de nucleótido único
Ion Torrent Sequencing es una estrategia basada en el método de o mutaciones puntuales, pequeñas inserciones y deleciones, y
secuenciación mediante un ion semiconductor, de forma, que cada vez también variantes estructurales tanto equilibradas (inversiones
que se incorpora un nuevo nucleótido a la cadena, en síntesis, se libera y traslocaciones) como desequilibradas (deleciones o
un protón (H+), que modifica el pH, detectando la incorporación del duplicaciones).
mismo. Para discernir cuál de los nucleótidos se ha introducido, se
repiten varios ciclos, cada uno de ellos, con la adición de un único Las tecnologías de secuenciación implementadas en los
nucleótido. distintos instrumentos actualmente utilizados para la NGS
Aunque esta plataforma no está destinada para la secuenciación de difieren en varios aspectos, pero el esquema principal de trabajo
genomas completos, debido a que el resultado obtenido a esta escala es conceptualmente similar para todos ellos. El ADN se
no es el más aconsejable, es altamente competitivo en cuanto a precio, fragmenta y mediante ligación se le añaden secuencias
rapidez y calidad para paneles de genes pequeños y el análisis de adaptadoras a los extremos. Los fragmentos de ADN a
exomas. Además, por sus características de trabajo, es ideal para los continuación se amplifican clonalmente y se agrupan juntos
laboratorios de diagnóstico, ajustados a tiempos muy precisos. (clustering) para ser utilizados como entidades a secuenciar. La
secuenciación se realiza entonces alternando ciclos de
ILLUMINA terminación reversible cíclica (cyclic reversible termination
Illumina es la tecnología de secuenciación más utilizada hoy en día [CRT]) y de toma de imágenes (imaging). La reacción CRT
debido a que ofrece plataformas efectivas (MiniSeq o HiSeq XTen, utiliza terminadores reversibles para incorporar nucleótidos
entre otras) capaces de ofrecer resultados competentes a precios marcados fluorescentemente que a continuación son
razonables. Esta metodología se caracteriza por el uso de nucleótidos «fotografiados» en la toma de imágenes y posteriormente son
marcados con fluoróforos que bloquean de forma reversible la procesados. Las secuencias cortas producidas por el
elongación de la cadena. De este modo, tras la detección de la instrumento a partir de los extremos del ADN con los
incorporación del fluoróforo, y la eliminación del mismo, es posible adaptadores se denominan lecturas o reads. En general, los
continuar con un nuevo ciclo de adición de un nuevo nucleótido. Es lo nuevos secuenciadores generan lecturas a partir de cada uno
que se conoce como secuenciación por síntesis. Illumina ha permitido de los extremos de un fragmento de ADN (el inserto), dando
abaratar los costes y ofrecer lecturas más largas, sin embargo, se lugar a lecturas apareadas, y lo hacen usando dos estrategias
requiere de una gran inversión inicial y de mantenimiento, para poder diferentes. Los mate pairs se crean a partir de fragmentos de
adquirir y mantener uno de los equipos que ofrece. ADN de tamaño conocido (creando librerías con tamaños >600
pares de bases (pb) algunas librerías pueden alcanzar tamaños
Como se puede observar, cada una de las diferentes plataformas de inserto de 4kb), que se circularizan y se ligan usando un
descritas tienen sus propias ventajas y desventajas. Por ello, adaptador interno. Estos fragmentos circularizados se trocean al
actualmente, elegir la plataforma NGS que mejor se adecúe a la azar para luego purificar los segmentos que contienen el
necesidad del proyecto u actividad a desempeñar es una adaptador a partir del que se secuencia. Por contra, las lecturas
decisión crítica para los científicos y laboratorios de tipo paired end se generan mediante la fragmentación del
………………………………………………………………………………… ADN en pequeños segmentos (<300pb) de los cuales se
Aunque la tecnología convencional de secuenciación ideada secuencia el final de ambos extremos. Las lecturas paired end
por Sanger proporciona la resolución definitiva para detectar proporcionan rangos de tamaños de inserto más estrechos,
variantes genéticas de pequeño tamaño, tiene la limitación de mientras que las de tipo mate pair tienen la ventaja de cubrir
solo poder realizar 96 o 384 reacciones en paralelo. Esto tamaños mayores. Un aspecto importante en la NGS es el
propicia que la ejecución de experimentos de secuenciación número de veces que cada base del genoma está presente en
basados en esta técnica se prolongue mucho tiempo y que el los reads de secuenciación producidos. Este valor se denomina
precio por base secuenciada sea elevado. Los avances profundidad de cobertura (depth of coverage, o simplemente,
coverage) y es uno de los factores determinantes para evaluar errores se producen al azar, pero determinadas plataformas
la fiabilidad del nucleótido asignado a esa posición del genoma. parecen producir específicamente cierto tipo de errores. En la
plataforma Illumina, por ejemplo, los errores correlacionan con la
posición en el read, acumulándose estos con mayor frecuencia
hacia el final del mismo. Por el contrario, en la plataforma
Roche/454 los errores no dependen de la posición en el read
pero tienden a acumularse alrededor de secuencias de
homopolímeros (regiones de ADN con 6-7 o más nucleótidos
idénticos consecutivos).

Inserciones y deleciones ​La detección de pequeñas


inserciones y deleciones (indels) a partir de datos de NGS ha
demostrado ser más compleja de lo que inicialmente se podía
prever, sobre todo por culpa de la limitada longitud de los reads
que producen la mayoría de las plataformas. Las variantes de
ganancia o pérdida de una única base son especialmente
proclives a ser mal alineadas con el genoma de referencia,
produciendo una elevada tasa de falsos positivos. Un
alineamiento de novo regional, que requiere cálculos
computacionales elevados, contribuye a mejorar la detección de
indels aunque los niveles de sensibilidad y especificidad no
logran acercarse a los de la detección de SNV17

Variantes de número de copia e inversiones grandes


Los primeros métodos para identificar con precisión variantes
estructurales han empleado datos de secuenciación de
paired-reads y mate-pairs; parejas de reads que están
La detección de variantes genéticas a partir de datos de NGS
relacionadas aunque no son adyacentes ni complementarias
consiste en identificar diferencias en la secuencia de ADN de un
(para una explicación detallada, consultar la sección anterior).
individuo al compararlo con un ADN de referencia. Los
Estas aproximaciones son una extensión del trabajo seminal
resultados dependen forzosamente de la calidad del
realizado para caracterizar y posicionar los extremos de BAC y
alineamiento y ensamblaje respecto a la referencia ya que las
aprovechan el hecho que los reads de tipo mate-pair y
secuencias alineadas incorrectamente pueden producir falsos
paired-end se generan a una distancia más o menos conocida en
positivos, mientras que las secuencias no alineadas pueden ser
el genoma. Cuando los reads se alinean al genoma de referencia
fuente de falsos negativos. La NGS tiene el potencial de detectar
y sus «parejas» se alinean a una distancia sustancialmente
cualquier tipo de variante genómica en un único experimento,
diferente del tamaño esperado o con una orientación anómala
incluso puede detectar inversiones, una clase de variación cuyo
son indicativos de la presencia de variantes estructurales. Un
estudio resulta muy complicado para la mayoría de las otras
único mate-pair no es suficiente para predecir estas variantes
técnicas.
debido a varias razones: 1) el tamaño de inserto real solo se
conoce de forma aproximada, 2) mate-pairs incorrectamente
Variantes de nucleótido único
alineados pueden asemejar la apariencia de variantes
La detección de variantes de nucleótido único (single nucleotide
estructurales, 3) una pequeña parte de todos los mate-pairs es
variants [SNV]) ha demostrado ser factible con una gran precisión
quimérica. Para paliar todo esto se necesita un conjunto múltiple
cuando hay al menos una cobertura de 10-15 veces para la
de mate-pairs agrupados en torno a la región candidata que den
posición de la SNV y la tasa de error de secuenciación es
soporte a cada evento putativo. Los métodos para detectar
razonable. La mayoría de los algoritmos informáticos utilizados
variantes estructurales basados en mate-pairs no pueden
para detectar SNV emplean modelos bayesianos, calculando la
identificar inserciones de tamaño mayor al del inserto ni
probabilidad condicional de los nucleótidos en cada posición
identificar los límites exactos de la alteración.
según, por ejemplo, el número de reads independientes que
Un método alternativo para identificar deleciones y duplicaciones es
contienen la variante, la calidad en la asignación de la base y otros
a través del empleo de los valores de profundidad de cobertura de
parámetros.
las secuencias. Asumiendo que el proceso de secuenciación es
uniforme, el número de reads alineados a una región sigue una
Los errores en la secuenciación son más prevalentes en la NGS
distribución Poisson y se espera que sea proporcional al número
que con los métodos convencionales y pueden conducir a un
de veces que esa región aparece en el genoma. La hipótesis es
falso positivo en la asignación de la base. En general estos
que las secuencias obtenidas se distribuyen equivalentemente con la indicación de la prueba inicial. No obstante, al estar
sobre el genoma y por tanto aquellas regiones que contradigan la identificándose nuevos genes asociados con enfermedad, un
hipótesis son candidatas a presentar cambios en su número de diseño fijo podría necesitar ser actualizado frecuentemente para
copias. Un factor de confusión en esta estrategia es el sesgo en la introducir los nuevos descubrimientos. Además, para ser realmente
secuenciación que tienen las plataformas y específicamente el efectiva en costes, es necesario multiplexar muestras y
sesgo no lineal debido al contenido en GC. Además los reads secuenciarlas en un mismo experimento. Cuando se trata de una
«mal» alineados en regiones que por ejemplo son ricas en enfermedad relativamente rara esta puede no ser una opción
repeticiones o altamente homólogas (por ejemplo las duplicaciones válida u ocasionar retrasos largos antes de poder realizar la prueba
segmentarias) dificultan la identificación de variantes de número de para establecer un diagnóstico molecular.
copias (copy number variants [CNV]). Por tanto los métodos
basados en la profundidad de cobertura son más adecuados para Resecuenciación de exoma
detectar las CNV más grandes sobre las cuales los diferentes Secuenciar el exoma (la porción codificante del genoma humano)
sesgos posibles quedarían equilibrados al promediarse los valores. del paciente es otra estrategia utilizada con fines diagnósticos. A
En algunos estudios se han determinado las CNV mediante la pesar de que actualmente es más cara que secuenciar un grupo
comparación relativa de la cobertura entre dos genomas, de forma reducido y específico de genes, es también mucho más barata que
similar a los métodos de array-CGH. secuenciar un genoma completo. Una ventaja de la secuenciación
del exoma es que constituye una prueba única y similar para todos
Un tercer método emplea splits-reads para detectar los puntos de los pacientes, y que no necesitaría ser actualizada cada vez que
rotura de CNV25,39. Esta estrategia se basa en la idea de que se descubriera un nuevo gen como causa de una enfermedad
los reads que cubren un punto de rotura de una CNV no se van concreta. Esto es beneficioso para enfermedades raras ya que no
a alinear adecuadamente al genoma de referencia. Los reads es imprescindible un número mínimo de pacientes con una
que no pueden ser alineados se separan en dos partes de tal determinada enfermedad para reducir los costes de elaborar un
manera que cada parte se alinea a un locus diferente en el ensayo específico para esa enfermedad. También hay que tener
genoma. La distancia entre esas partes es indicativa de en consideración que los diagnósticos clínicos no son siempre
presencia de CNV o de inversiones. De forma similar a los correctos y que los fenotipos pueden variar sustancialmente, con lo
mate-pairs, un único evento no es suficiente para predecir un que la información generada en un único experimento podría ser
punto de rotura y la agrupación de múltiples eventos es la que revisitada si fuera necesario. La secuenciación de exoma permite
será más informativa. Para el empleo de este método es crítico una aproximación sin sesgos al diagnóstico genético que podría
el tamaño de los reads, ya que la probabilidad de que una revelar muchos casos en los que el fenotipo no se corresponde al
secuencia de nucleótidos sea única en el genoma disminuye de fenotipo clínico estándar asociado a la enfermedad. Una
manera drástica cuando su tamaño baja por debajo de los desventaja respecto a diseños dirigidos a genes específicos es que
25pb25. la secuenciación de exoma no permite mucha más optimización y
por lo tanto en algunos casos puede resultar muy difícil realizar el
Aplicaciones de la secuenciación de nueva generación en el diagnóstico con fiabilidad de un grupo completo de genes
diagnóstico molecular conocidos. Las regiones ricas en contenido de GC por ejemplo no
Actualmente la mayoría de las aplicaciones de la secuenciación están bien cubiertas en general, lo cual dificulta la identificación de
masiva están dirigidas a responder preguntas de investigación. No variantes en esas regiones.
obstante la tecnología NGS promete ser muy relevante en la
identificación de factores de susceptibilidad con finalidad Secuenciación de genoma completo
preventiva, en estudios de farmacogenómica para determinar La secuenciación de un genoma completo se implantará en el
respuesta a fármacos y en la realización de pruebas genéticas diagnóstico cuando su rendimiento, precisión y tiempo de
para diagnóstico y evolución de las enfermedades. En todas estas ejecución la hagan factible. Aunque el coste económico de la
áreas la tecnología NGS está siendo evaluada en infinidad de secuenciación en sí misma pueda ser asumible, el verdadero
estudios de prueba de concepto. reto es combinar la secuenciación del genoma humano con una
interpretación eficiente y fiable. Algunas opciones para paliar
Resecuenciación dirigida este hecho pueden ser 1) centrarse inicialmente solo en la
Se considera resecuenciación la aplicación en la que se secuencia interpretación de mutaciones conocidas, ya que el análisis de un
una porción del genoma conocida y los reads generados se genoma completo es muy laborioso; 2) concentrarse en el
alinean con un genoma de referencia conocido. Un ensayo dirigido análisis de genes conocidos solamente. Esta opción eludiría
a los loci de interés se puede optimizar para estudiar un único hallazgos de significado incierto, al mismo tiempo que se
trastorno causado por mutaciones en múltiples genes. Un diseño obtendría un gran rendimiento diagnóstico. No obstante esta
específico de este tipo puede optimizarse para mejorar la fiabilidad opción no tiene en cuenta posibles diagnósticos erróneos e
en la detección de variantes. Esta estrategia tiene la ventaja de impediría la identificación de nuevas variantes/regiones y
que minimiza la posibilidad de hallazgos que no estén relacionados nuevos mecanismos causantes de enfermedad. A tenor del
mayor coste, la complicación del análisis e interpretación, y de la están incorporados en hebras de plantilla de ADN. Como los
distribución conocida de las mutaciones causantes de cuatro dNTP reversibles vinculados al termociclador están
enfermedad, mayoritariamente localizadas en la porción presentes durante cada ciclo de secuenciación, la competencia
codificante del genoma, muy probablemente sea aconsejable natural minimiza el sesgo de la corporación y reduce en gran
empezar con estrategias de análisis dirigidas al principio. En el medida las tasas de error en bruto en comparación con otras
momento en que no se obtenga un resultado diagnóstico con tecnologías.
estrategias dirigidas podría estar justificado optar por continuar
el análisis con una aproximación no sesgada. Análisis de datos
Durante el análisis y la alineación de datos, las lecturas de la
Cada una de las estrategias mencionadas exhibe ventajas secuenciación recientemente identificadas se alinean con un
específicas. Una estrategia dirigida parece más apropiada en genoma de referencia. Después del alineamiento, es posible
enfermedades que están muy bien definidas clínicamente, para encontrar muchas variaciones de análisis, como el polimorfismo
las cuales además se conoce la mayoría de los genes implicados de nucleótido único (SNP) o la identificación por inserción /
y muestran heterogeneidad genética muy baja. La secuenciación eliminación (indel), el recuento de lectura para los métodos de
de exoma, al ser una aproximación no sesgada, es más ARN, el análisis filogenético o metagenómico, entre otros.
apropiada para enfermedades que tienen heterogeneidad _________________________________________________
fenotípica y genética mayores. Este es el método elegido en Secuenciación método de Sanger
muchos casos, hasta que la secuenciación de genoma completo ¿Qué es secuenciar?
sea más asequible como herramienta diagnóstica y se superen SECUENCIAR consiste en conocer la secuencia concreta de los
las limitaciones que supone la producción de secuencias a gran nucleótidos que componen cualquier ácido nucleico, por lo que,
escala y los desafíos bioinformáticos derivados. con las técnicas disponibles de hoy en día, es posible saber la
secuencia exacta de tanto ADN como ARN. Es cierto, que existen
FUNDAMENTO QUÍMICO muchas estrategias con diferentes características, precios y, por
El ADN polimerasa cataliza la incorporación de supuesto, tasas de error, pero nada de lo que conocemos
desoxirribonucleótidos trifosfatos (dNTP) marcados actualmente hubiera sido posible sin el esfuerzo de los
fluorescentemente en una cadena molde de ADN durante los ciclos investigadores de finales del siglo pasado que idearon diversas
secuenciales de síntesis de ADN. Durante todo el ciclo, en el punto formas de hacer de la secuenciación del genoma una realidad
de incorporación, los nucleótidos se identifican por excitación de palpable.
fluoróforo. La diferencia fundamental es que, en lugar de ¿Qué es la secuenciación?
secuenciar un solo fragmento de ADN, la NGS extiende este Tal vez hayas oído que se están secuenciando genomas. Por
proceso a través de millones de fragmentos en una paralelización ejemplo, el genoma humano se finalizó en 2003 después de un
masiva. esfuerzo internacional de muchos años. Pero, ¿qué significa
secuenciar un genoma o incluso un pequeño fragmento de
Preparación de la biblioteca ADN? La secuenciación de ADN es el proceso que determina la
La biblioteca de secuenciación se prepara por fragmentación secuencia de bases de los nucleótidos (As, Ts, Cs y Gs) de un
aleatoria de la muestra de ADN o ADNc, seguido de 5' y 3' de fragmento de ADN. Hoy en día, con el equipo y los materiales
unión de adaptador. Alternativamente, la "etiquetación" combina adecuados, secuenciar un fragmento pequeño de ADN es
la fragmentación y las reacciones de ligadura en un solo paso relativamente sencillo.
que aumenta en gran medida la eficiencia del proceso de Secuenciar un genoma completo (todo el ADN de un organismo)
preparación de la biblioteca. Los fragmentos adaptados se sigue siendo una tarea compleja. El proceso requiere romper el
amplifican por PCR y se purifican en gel. ADN del genoma en muchos pedazos más pequeños,
secuenciar dichos pedazos y ensamblar las secuencias en una
Generación de clusters única y larga "secuencia consenso". Sin embargo, gracias a
Para la generación de clúster, la biblioteca se carga en una nuevos métodos que se han desarrollado en las últimas dos
celda de flujo donde los fragmentos se capturan en oligos décadas, ahora secuenciar un genoma es mucho más rápido y
unidos a la superficie, complementarios a los adaptadores de la menos costoso de lo que resultó en el Proyecto Genoma
biblioteca. Cada fragmento se amplifica luego en clones de Humano
clusters distintos a través de la amplificación del puente. Cuando Secuenciación de Sanger: el método por terminación de
se completa la generación de clúster, las plantillas están listas cadena
para la secuencia. Rutinariamente se secuencian regiones de ADN de hasta
900900900 pares de bases con un método llamado secuenciación
Secuenciación de Sanger o método por terminación de cadena. Este método de
La tecnología Illumina utiliza un método patentado basado en secuenciación fue desarrollado por el bioquímico británico Fred
termociclador reversible que detecta bases individuales ya que Sanger y sus colegas en 1977.
En el Proyecto Genoma Humano, se utilizó la secuenciación de La muestra de ADN que se secuenciará se combina en un tubo
Sanger para determinar las secuencias de muchos fragmentos con el cebador, la ADN polimerasa y los nucleótidos del ADN
relativamente pequeños de ADN humano. (Estos fragmentos no (dATP, dTTP, dGTP y dCTP). También se añaden los cuatro
necesariamente eran de 900900900 pb o menos, pero los nucleótidos didesoxi terminadores de la cadena, marcados con
investigadores pudieron "recorrer" la longitud de cada fragmento su pigmento, pero en cantidades mucho más pequeñas que los
con múltiples rondas de secuenciación de Sanger). Los fragmentos nucleótidos normales.
se alinearon con base en porciones que se traslapaban para Primero se calienta la mezcla para desnaturalizar el molde de
ensamblar la secuencia de regiones más grandes de ADN y, al ADN (separar las cadenas) y luego se enfría para que el
final, cromosomas completos. cebador pueda unirse al molde de cadena sencilla. Una vez que
Aunque actualmente los genomas se secuencian con otros se ha unido el cebador, se eleva la temperatura para que la
métodos que son más rápidos y menos costosos, la secuenciación ADN polimerasa pueda sintetizar ADN nuevo a partir del
de Sanger todavía se usa ampliamente para secuenciar piezas cebador. La ADN polimerasa añadirá nucleótidos a la cadena
individuales de ADN, como los fragmentos utilizados en la hasta que aleatoriamente agregue un nucleótido didesoxi en
clonación de ADN o los generados a través de la reacción en lugar de uno normal. A partir de ese momento, no es posible
cadena de la polimerasa (PCR). agregar más nucleótidos y la cadena termina con el nucleótido
Ingredientes para la secuenciación de Sanger didesoxi.
La secuenciación de Sanger consiste en hacer muchas copias de Este proceso se repite cierto número de ciclos. Cuando los
una región blanco de ADN. Sus ingredientes son similares a los ciclos terminan, está prácticamente garantizado que se ha
necesarios para la replicación del ADN en un organismo o para la incorporado un nucleótido didesoxi en cada una de las
reacción en cadena de la polimerasa (PCR), que copia el ADN in posiciones del ADN blanco en al menos una reacción. Es decir,
vitro. Los ingredientes son: el tubo contendrá fragmentos de diferentes longitudes que
Una enzima ADN polimerasa terminan respectivamente en cada una de las posiciones de los
Un cebador, que es un fragmento pequeño de ADN monocatenario nucleótidos del ADN original (observa la siguiente figura). Los
que se une al molde de ADN y actúa como un "iniciador" de la extremos de los fragmentos tendrán el pigmento que indica su
polimerasa. nucleótido final.
Los cuatro nucleótidos del ADN (dATP, dTTP, dCTP, dGTP).
El molde de ADN que será secuenciado.
Sin embargo, una reacción de secuenciación de Sanger también
contiene un ingrediente único:
Versiones didesoxi, o terminadores de la cadena, de los cuatro
nucleótidos (ddATP, ddTTP, ddCTP, ddGTP), cada uno marcado
con pigmentos de color diferente.

Cuando la reacción termina, los fragmentos se hacen pasar a


través de un tubo largo y delgado que contiene una matriz de
gel en un proceso llamado electroforesis capilar en gel. Los
fragmentos cortos se mueven rápidamente a través de los poros
del gel, mientras que los fragmentos largos se mueven más
Los nucleótidos didesoxi son similares a los nucleótidos normales,
lentamente. Cuando cada fragmento cruza la "línea de meta" al
o desoxi, pero con una diferencia clave: no tienen grupo hidroxilo
final del tubo, un láser lo ilumina y permite la detección del
en el carbono 3' del anillo de azúcar. En un nucleótido normal, el
pigmento asociado.
grupo hidroxilo 3' actúa como un "gancho" que permite que un
El fragmento más pequeño (que termina justo un nucleótido
nuevo nucleótido se añada a una cadena existente.
después del cebador) es el primero que cruza la línea de meta,
Una vez que se añade a la cadena un nucleótido didesoxi, ya no
seguido por el próximo fragmento más pequeño (que termina justo
hay un hidroxilo sobre el que se puedan agregar más nucleótidos.
dos nucleótidos después del cebador) y así sucesivamente. De
La cadena termina con el nucleótido didesoxi, que está marcado
esta manera, se puede reconstruir nucleótido por nucleótido la
con pigmento de un color particular dependiendo de la base (A, T,
secuencia del fragmento de ADN original a partir de los colores de
C o G) que lleve.
los pigmentos registrados uno tras otro por el detector. Los datos
Método de secuenciación de Sanger
registrados por el detector consisten en una serie de picos en la
intensidad de la fluorescencia, como se muestra en el marcados con cuatro fluoróforos distintos, lo que favoreció que
cromatograma anterior. La secuencia del ADN se lee a partir de todo el proceso tuviera lugar en una única reacción en un mismo
los picos en el cromatograma. tubo, y no en cuatro distintos como en el método original. El
Usos y limitaciones segundo consiste en la utilización de la técnica PCR para llevar a
La secuenciación de Sanger arroja secuencias de alta calidad cabo la reacción de polimerización. Esto fue posible con el
para segmentos relativamente largos de ADN (de hasta descubrimiento de polimerasas resistentes a temperaturas más
aproximadamente 900900900 pares de bases). La técnica suele altas y que soportaran los cambios de temperatura existentes en
utilizarse para secuenciar fragmentos individuales de ADN, como los ciclos de la PCR. Por último, y no por ello el menos importante,
plásmidos bacterianos o ADN copiado en la PCR. la incorporación de la electroforesis capilar en un gel de
Sin embargo, la secuenciación de Sanger es costosa e ineficiente poliacrilamida. Esta nueva estrategia, permitió que cada
para proyectos a gran escala, como la secuenciación de un fragmento que acababa de ser secuenciado, tras ser interrumpido
genoma completo o un metagenoma (el "genoma colectivo" de por un ddNTP marcado por el correspondiente fluoróforo,
una comunidad microbiana). Para tareas como estas, las nuevas avanzara por el gel a través de un tubo capilar. Cuando dicho
técnicas de secuenciación a gran escala son más rápidas y fragmento pasaba a través de la cámara detectora, el fluoróforo
menos costosas. era excitado con un láser, emitiendo una fluorescencia de un color
Secuenciación de nueva generación determinado (como cada ddNTP estaba marcado por un fluoróforo
El nombre puede sonar como de Star Trek, ¡pero de verdad así se distinto, cada vez que pasaba un tipo de fragmento parado con un
llama! El conjunto más reciente de tecnologías de secuenciación ddNTP distinto emitía una fluorescencia difereía comparte un
de ADN se denominan secuenciación de nueva generación. conjunto común de características que las distinguen de la
Hay una variedad de técnicas de secuenciación de nueva secuenciación de Sanger:
generación que utilizan diferentes tecnologías. Sin embargo, la Altamente paralelas:​ ocurren muchas reacciones de
mayor de diferentes tamaños e interrumpidos por el ddNTP del secuenciación al mismo tiempo.
mismo tipo (en este caso ddATP). En el segundo tubo, habrá una Microescala:​ las reacciones son diminutas y se pueden hacer
mezcla de fragmentos secuenciados interrumpidos por otro muchas a la vez en un chip.
ddNTP (por ejemplo, ddGTP), en el tercero por otro (ddCTP) y en Rápidas:​ puesto que las reacciones se realizan en paralelo, los
el cuarto por el último (ddTTP). A continuación, el contenido de resultados están listos mucho más rápido.
cada uno de los tubos se corre en carreras diferentes de un gel de Bajo costo:​ secuenciar un genoma es más barato que con la
acrilamida. Finalmente, tras separar en función del tamaño, y secuenciación de Sanger.
gracias al cebador marcado radiactivamente, se van a poder Longitudes más cortas: ​típicamente, las lecturas se obtienen
contemplar diferentes bandas que van a poder ser traducidas en con fragmentos de entre 505050 -700700700 nucleótidos de
diferentes nucleótidos. longitud.
Conceptualmente, la secuenciación de nueva generación es
como hacer un número muy grande de pequeñas reacciones de
secuenciación de Sanger en paralelo. Gracias a esta
paralelización y a la pequeña escala, los métodos de última
generación permiten secuenciar grandes cantidades de ADN de
forma mucho más rápida y barata con que con la secuenciación
de Sanger.
¿Por qué es importante que la secuenciación sea rápida y
barata?​ La capacidad de secuenciar genomas de forma
rutinaria abre nuevas posibilidades en la investigación biológica
El método de Sanger se basa en sintetizar, de forma secuencial, una hebra de ADN
y en aplicaciones biomédicas. Por ejemplo, la secuenciación de
complementaria a una hebra de cadena simple (que se utiliza como molde), en presencia
de ADN polimerasa, los cuatro 2’-deoxinucleótidos que componen la secuencia del bajo costo es un paso hacia la medicina personalizada: un
ADN (dATP, dGTP, dCTP y dTTP) y cuatro dideoxinucleótidos (ddATP, ddGTP, tratamiento médico a la medida de las necesidades de un
ddCTP y ddTTP). individuo con base en las variantes génicas de su genoma.
Gracias a la incorporación de las técnicas fluorescentes, el diseño de Método de Sanger o de los dideoxinucleótidos
fluoróforos, el avance en enzimología y la introducción de la Esta estrategia se basa en sintetizar, de forma secuencial, una
electroforesis capilar, el método de Sanger aumentó su eficiencia, hebra de ADN complementaria a una hebra de cadena simple
pasando a ser conocido como el método de Sanger automatizado, y (que se utiliza como molde), en presencia de ADN polimerasa, los
marcando el inicio de las tecnologías de secuenciación de primera cuatro 2’-deoxinucleótidos que componen la secuencia del ADN
generación. (dATP, dGTP, dCTP y dTTP) y cuatro dideoxinucleótidos (ddATP,
ddGTP, ddCTP y ddTTP). Estos últimos nucleótidos “especiales” o
Esta modificación supuso mejorar la técnica en tres aspectos nucleótidos de parada, están diseñados para que carezcan del
principalmente. El primero de ellos, fue gracias al uso de ddNTPs grupo 3’-OH, que permite la adición del nucleótido consecutivo, de
forma que cuando uno de ellos es incorporado por la polimerasa de validación de resultados de las otras técnicas de secuenciación
se interrumpe la síntesis de la nueva hebra. Esto lleva a que se más novedosas​.
obtengan fragmentos secuenciados de diferente tamaño, según …………………………………………………………………
dónde se incorporen los dideoxinucleótidos. De este modo, y tras MÉTODO ENZIMÁTICO DE SANGER
una simple electroforesis, se va a poder dilucidar la secuencia. Se diseña un oligonucleótido sintético de unos 17-20 bases
complementario de la cadena de ADN que se quiere secuenciar y
De forma resumida, el proceso sería el siguiente. En primer lugar, situado a unos 20-30 bases de distancia del comienzo de la
se llevan a cabo cuatro reacciones distintas en tubos diferentes. secuencia que se quiere leer. Si este oligo se diseña fuera de la
Cada uno de los tubos va a contener una mezcla que contiene la región de clonaje de los plásmidos podrá emplearse el mismo
misma cadena molde (ADN de simple cadena, obtenido o no tras oligo para secuenciar distintos insertos.
una desnaturalización, o ADNc procedente de una
retrotranscripción de ARN), la ADN polimerasa, un cebador El dúplex formado entre el oligo y el ADN complementario de
marcado radiactivamente, los cuatro nucleótidos normales (dNTP) cadena sencilla se convierte en sustrato de la ADN polimerasa I
y uno de los cuatro dideoxinucleótidos (ddNTP). Así, el cebador, que va a extender la cadena desde grupo OH libre del extremo 3´
por complementariedad, se une a la hebra molde favoreciendo su del oligo, incorporando dNTPs y copiando el molde de ADN al
reconocimiento por la ADN polimerasa y el inicio de la síntesis de sintetizar la cadena complementaria. Como enzima se emplea el
la nueva hebra. La ADN polimerasa va añadiendo dNTPs hasta fragmento Klenow de la ADN polimerasa I que carece de actividad
que de forma aleatoria, incorpora el ddNTP, por ejemplo el ddATP exonucleasa 5´- 3. También pueden emplearse otras polimerasas
(cada uno de los tubos contiene un ddNTP distinto) y se como la Taq polimerasa o la polimerasa del fago T7.
interrumpe la síntesis. De esta forma, en el tubo van a aparecer Durante la secuenciación se llevan a cabo cuatro reacciones de
fragmentos secuenciadosnte). Con ello, la determinación del color síntesis separadas incluyendo en cada una de ellas pequeñas
permitía asignar el nombre de la base correspondiente y el orden cantidades de los dideoxinucleótidos (ddNTP: ddGTP; ddATP,
de las emisiones revelaba la secuencia del ADN. ddCTP, ddTTP) que carecen de extremo 3´ OH libre y que al
incorporarse en la cadena de ADN que se esta sintetizando
acaban con la elongación de la misma.

La incorporación al azar de un ddNTP en competición con el


dNTP correspondiente, implica la formación de una mezcla de
cadenas de distintas longitudes, todas ellas empezando en el
extremo 5´ y acabando en todas las diferentes posiciones
posibles donde un ddNTP puede incorporarse en lugar de un
El método de Sanger automatizado incorporaba ddNTPs marcados con cuatro dNTP. El promedio de longitud de las cadenas puede alterarse
fluoróforos distintos, la técnica PCR para llevar a cabo la reacción de modificando la relación dNTP/ddNTP en la mezcla de reacción.
polimerización, la electroforesis capilar en un gel de poliacrilamida para llevar a Por ejemplo, aumentando la concentración de ddNTP aumenta
cabo la detección de las bandas. el número de cadenas de pequeña longitud al aumentar la
El inconveniente de esta estrategia, venía tras el posterior análisis, frecuencia de incorporación de este tipo de nucleótidos.
cuando las señales fluorescentes requerían de una normalización
para tratar de corregir los posibles errores debidos a alteraciones en La sustitución de uno de los dNTPs por el mismo nucleótido
la movilidad o problemas en la intensidad de emisión. Tras la marcado radiactivamente permite la visualización de las bandas
normalización, la información de la secuencia que aportaba el de distinta longitud en un gel de poliacrilamida donde cada una de
software quedaba recogido en formato FASTA o bien, en formato las reacciones se carga en un carril. En el gel la separación de las
FASTQ, el cual también contenía la calidad de la secuencia. distintas bandas se produce en función de su tamaño y la
secuencia puede determinarse leyendo las bandas de los cuatro
Hasta hace relativamente poco, el método de Sanger ha sido la carriles. En este tipo de geles pueden leerse hasta 300 bases. En
técnica más empleada para abordar este tipo de estudios, ya que carreras más largas la lectura puede llegar a ser de hasta 500
permitía la obtención de lecturas (fragmentos de ácidos nucleicos bases.
secuenciados) de alrededor de 1 kb, y de buena calidad, con un ____________________________________________
error de menos de 1% por base. Sin embargo, no discernía en la MICROARREGLOS
detección de homopolímeros, y requería de unos costes que, por Un microarreglo de ADN(tam-bién denominado DNA chip,
entonces, muchos de los laboratorios no se podían permitir. oligo-nucleotide DNA chipo gene chip) consiste en múltiples
fragmentos de ADN complementario (cada uno de los cuales
En la actualidad, la secuenciación Sanger ha sido reemplazada representa un gen diferente) adheridos a un soporte físico concreto
para los grandes proyectos por las nuevas estrategias. Sin (vidrio, plástico, silicona, etc.) y agrupados de manera su función
embargo, sigue siendo utilizada a pequeña escala como método (receptores, hormonas, factores de transcripción, citocinas, etc.).
Los microarreglos de ADN hoy en uso incluyen entre 9 000 y 40 000 El microarreglo de ADNpropor-ciona información sobre los genes
frag-mentos de ADNc (genes) por cm2. Por tanto, disponen que han variado su expresión (tanto en el sentido de su
virtualmente de la expresión de todo el genoma en estudio. sobreexpresión como en el de su represión) en respuesta a unas
Utilidad de un microarreglo de ADN condiciones experimentales o fisiopatológicas determinadas. En
Un microarreglo de ADNsirve para determinar la expresión definitiva, el microarreglo de ADNproporciona el transcriptoma
gené-tica completa de un tejido en un momento determinado. Esta car-acterístico de dichas condiciones.
“foto genética transversal” de un tejido concreto se denomina
“transcrip-toma”. El transcriptoma, al con-trario que el genoma
(conjunto de todos los genes existentes en una célula), cambia
continuamente en respuesta a cambios en las condi-ciones
microambientales celulares o tisulares (temperatura, pH, PO2,
citocinas, hormonas, etc.). Por tanto, la interpretación del
transcriptoma objeto de estudio requiere necesa-riamente de su
comparación con el de un tejido control. El microarreglo de
ADNpermite esta comparación, que se conoce con el nombre de
di-fferentialdisplay.
Metodología del microarreglo de ADN
El procedimiento para comparar el transcriptoma del tejido o
cultivo celular objeto de estudio con el trans-criptoma control es
relativamente simple. En primer lugar, se debe aislar el ARNm de
ambos tejidos y, a partir de cada uno de ellos, obtener sus
correspondientes ADNc. Estas moléculas de ADNc deben
Sin embargo, hay que tener en cuenta que la alteración en la
marcarse con un compuesto fluorescente, que será diferente en
expresión de estos genes puede ser causa o consecuencia de la
los tejidos objeto de estudio y el control. En general, el ADNc del
enfermedad estudiada. El inves-nuevas hipótesis de trabajo para
tejido objeto de estudio se marca con el compuesto fluorescente
diferenciar ambas posibilidades. Por consiguiente, la tecnología
Cy3 (que emite fluorescencia a una longitud de onda de 588 nm,
del mi-croarreglo de ADNdebe considerarse como una tecnología
lo color cercano al rojo) y el del tejido control con el compuesto Cy
“generadora de hipótesis” y no como una tecnología capaz de
5 (que emite fluorescencia a una longitud de onda de 680 nm, lo
cerrar definitivamente cuestiones pendientes. No obstante,
que en el espectro correspondería a un color entre naranja y
permite que dichas hipótesis se con-creten sobre un número
amarillo).A continuación, se mezclan am-bos ADNc marcados y se
reducido de genes y, lo que es más importante, que dichas
incuban juntos en el microarreglo de ADN, para que cada especie
hipótesis se basen sobre datos objetivos (el transcriptoma
de ADNc hi-bride (se una) específicamente a su ADNc
específico para esas condiciones experimentales), y no sobre la
complementario inmovilizado en el microarreglo de ADN. Cuanto
inter-pretación de la bibliografía científica o en las preferencias
mayor sea la hibridación de una es-pecie determinada de ADNc
subjetivas de cada investigador.
marca-do con el ADNc del microarreglo de ADN, mayor será la
APLICACIONES POTENCIALES DEL MICROARREGLO DE
expresión tisular original del ARNm correspondiente (expresoma).
ADN EN ENFERMEDADES EN HUMANOS
Pero, ¿cómo se evalúa la cantidad de hibridación exis-tente? Se
Esta es una tecnología tan re-ciente que todavía se encuentra
calcula determinando la longitud de onda emitida por cada uno de
circunscrita al ámbito de la inves-tigación. Sus aplicaciones
los dos ADNc incubados. Para ello, el sistema lector del ADN
clínicas están en fase de desarrollo. Sin em-bargo, cabe especular
microarreglo de ADNasigna un código informático de colores a la
con algunas posibles aplicaciones futuras.
cantidad de fluorescencia emitida. Si hay mayor hibridación del
Cáncer
ADNc de la condición patológica (roja), el componente rojo de la
Uno de los campos de mayor aplicabilidad del microarreglo de
emisión pre-dominará, y viceversa, cuando sea mayor la
ADNes el estudio de las neoplasias en áreas tales como:a) La
hibridación del ADNc de la condición control, el componente
comprensión de las bases moleculares de la carcinogénesis: los
predomine (Fig. 1). Cuando la hibri-dación del ADNc de los dos
microarreglos de ADN han facilitado enormemente el estudio global
tejidos estudiados sea similar, el programa informático asignará
de los patrones de expresión génica que conducen a la pérdida de
un código de color verde (Fig. 1). Hay que tener en cuenta que
la regulación del ciclo de división celular y de la muerte celular
esta diferencia de emisión debe evaluarse en cada uno de los
progra-mada (apoptosis), como mecanismos esenciales de control
pocillos del microarreglo de ADN(es decir, para cada uno de los
involucrados en la transformación maligna. Particularmente, en
ADNc genes evaluados). De esta manera, se compara la
neoplasias inducidas por virus, los microarreglos de ADN han
expresión de todos los genes representados en el microarreglo de
permitido dilucidar algunas de las vías de señalización que ellos
ADN(hasta 40 000) en el tejido estudio frente al tejido control
emplean para inducir la transformación.4-5b) La clasificación y el
¿Cómo interpretar la infor-mación proporcionada por un
pronóstico: Las metodologías que existen actualmente para
microarreglo de ADN?
clasificar y establecer un pronóstico en muchos tipos de neoplasias
(por ejemplo leucemias) aún son de difícil interpretación y en Los microarreglos son una herramienta de la biología molecular y
algunos casos no ofrecen mayor información. El estudio y las ciencias genómicas con diversas aplicaciones, medir o
clasificación de estos tumores mediante el uso de micromatrices ha cuantificar la expresión génica o identificar mutaciones en
facilitado la definición de patrones de expresión diferenciales que genes específicos para el diagnóstico de enfermedades entre
hacen posible un acercamiento más profundo a su origen otras aplicaciones. Para el uso del microarreglo se utiliza ADNc o
molecular. La comparación de estos resultados con los obtenido ADN que se marcan con diferentes colores, esto para poder
citometría de flujo para marcadores de membrana y la citogenética, diferenciarlas, ya que se analizaran al mismo tiempo. Dentro del
han permitido establecer no sólo una excelente correlación microarreglo se unirán las secuencias de ADN de las dos
diagnóstica, sino que han impactado en aspectos como la muestras; a unas secuencias de ADN complementarias que se
clasificación, el tratamiento y el pronóstico. Se espera que esta encuentran adheridas a una superficie sólida generalmente
tecnología simplifique en tiempo y en costos el diagnóstico, el hechas de vidrio . Esta superficie, tiene impresas miles de
manejo y la determinación del pronóstico de muchos tipos de secuencias que representan todos los genes de un genoma, o las
neoplasias.Un marcador tumoral es cualquier indicador bioquímico mutaciones conocidas de genes, etc. y están perfectamente
cuya detección en tejido o líquido biológico pueda indicar la ordenadas en pequeños puntos formando una red a escala
presencia de un tumor. Las matrices también han permitido hallar milimétrica, donde cada punto contiene las secuencias de ADN
potenciales marcadores tumorales específicos. Las células en un que han de unirse. Cuando se unen o hibridan las secuencias de
tejido normal expresan diferentes genes cuya expresión es afectada las muestras, la fluorescencia emitida determinará la cantidad de
por el proceso de transformación maligna (antígeno asociado a secuencias que son complementarias y están presentes en la
tumor) que genera moléculas “únicas” en forma anómala. muestra que hibridó. Por ejemplo, tenemos una muestra control
Un ejemplo de ello es el cáncer de próstata en el cual el estudio (muestra sin enfermedad) de color rojo y una muestra problema
con micromatrices ha facilitado la iden-tificación de genes que se de color verde (muestra con enfermedad). Si se obtiene una
expresen sólo en próstata, pero que alteran su expresión coloración totalmente roja quiere decir que esta secuencia se
únicamente en el tejido neoplásico y no en otras alteraciones encuentra solo en el control y no en el problema, o bien si es solo
como hipertrofia prostática o pros-tatitis.c) Seguimiento de de color verde quiere decir que solo se encuentra en el problema
metástasis: en tumores tales como en el mela-noma se ha podido (enfermedad) y no en el control. Pero esto normalmente no es así
determinar la expresión diferencial negativa de genes y las tonalidades pueden variar y dar desde el naranja al
relacionados en la adhesión celular y con el complejo mayor de amarillo-verde, el cual quiere decir que si da un color hacia los
histocompatibilidad, que hacen po-sible diferenciar los melanomas tonos anaranjados estará más en el control (rojo) y si es amarillo
con potencial metastático. hacia el problema (verde). Existen programas computacionales
Inmunodeficiencias primarias que facilitan el análisis de tonalidades de color obtenidas. En la
En años recientes el estudio mo-lecular de las inmunodeficiencias investigación biomédica los microarreglos son utilizados para
primarias ha permitido conocer en detalle el funcionamiento de comparar los genes de enfermedades como el cáncer
múl-tiples componentes del sistema inmune. No obstante, el comparados con individuos sanos. A este proceso se le conoce
empleo del microarreglo de ADNpromete ofrecer una visión global como análisis de expresión génica.
de los trastornos celulares que resultan de la ausencia de un Entrada/Muestra​ Muestras de ADN o ADNc (sano vs. enfermo,
producto crítico para el adecuado funcionamiento del sistema control vs. problema)
inmune. En un estu-dio reciente con dos pacientes que sufrían Recursos/Material
inmunodeficiencia com-binada severa de origen molecular Muestras problemas: ​ácidos nucleicos (ADN o ARNm)
desconocido se trató de determinar el origen y consecuencia de la provenientes de muestras biológicas. Estas presentan
acti-vación defectuosa de los linfocitos T. Los resultados no sólo características similares o están expuestas a las mismas
permitieron establecer las posibles vías de acti-vación de los condiciones que se desean estudiar (edad, condiciones
linfocitos que estaban comprometidas sino que también lograron ambientales, enfermedades, etc). Dichas condiciones pueden
demostrar la complejidad y las posibilidades de cambios en la variar dependiendo del diseño experimental, tipo de muestreo y/o
expresión génica durante la acti-vación de las células T.En otro los criterios del investigador (un ejemplo de muestras problema es
estudio se comparó la expresión génica por medio de el ARN total de células sanguíneas de pacientes con diabetes).
mi-croarreglo de ADNde linfocitos B transformados provenientes Muestras control o silvestres: ​ácidos nucleicos provenientes de
de un paciente con gammaglobulinemia congénita y un control diferentes muestras biológicas que no presentan las
sano, se en-contró una expresión disminuida en 9 secuencias de características de una muestra problema (por ejemplo, ARN total
función descono-cida y expresión aumentada de los genes Fyn, de células sanguíneas de individuos sin diabetes). ​Reactivos de
Hck y Cyp1B1. Estos hallazgos demostraron la posibilidad de síntesis de ADNc​:
utilizar esta metodología para estudiar la influencia de las Espectrofotómetro:​ equipo que sirve para medir la concentración
muta-ciones del gen Btk en los linfoctios B de estos pacientes. de sustancias.
……………………………………………………………………… Reactivos para el marcaje de nucleótidos:​ generalmente se usan
unos reactivos llamados CY3 y CY5. Cy3 es una molécula de
color verde-amarillo fluorescente, mientras que Cy5 es rojo los valores de cada muestra del microarreglo. Esta información es
fluorescente. complementada con la base de datos que contiene el nombre del
Horno de hibridación:​ equipo que sirve para calentar y permite la gen y su función.
unión de las muestras con el microarreglo. ​Centrífuga de 6.Interpretación de los resultados:​ después de generar la tabla de
evaporación:​ equipo que ayuda a la eficiente separación de datos se requiere hacer el análisis e interpretación de los
disolventes mediante la evaporación con ayuda de una bomba de resultados. Para esto existen instituciones o empresas que
vacío; al mismo tiempo, la muestra se rota a altas velocidades por producen software de análisis de datos para microarreglos
centrifugación, evitando que ésta sea succionada. Salida/Resultado
Microarreglo:​ material de vidrio (generalmente) que tiene impreso Comparación de los cambios de la expresión génica entre una
de manera ordenada un conjunto de secuencias conocidas de muestra control y un problema, asociados a un fenotipo de estudio.
nucleótidos en una pequeña superficie. ​Lector de Microarreglos: Fuentes de error más frecuentes ​ Calidad de las muestras
aparato especializado que permite escanear y analizar el Calidad del ARN total Calidad del ADN Diseño del estudio Ruido de
microarreglo, detectando las moléculas marcadas con fondo de la imagen Tamaño insuficiente del muestreo Limitación
fluorescencia y almacenándolas como una imagen. tecnológica
Requisitos previos ​ Extracción de ADN o ADNc ​Procedimiento Métodos alternativos​ PCR en tiempo real o QPCR RNAseq
Este método puede utilizar ARNm o ADN como se describe a Secuenciación de alto rendimiento
continuación: Aplicaciones​ Transcriptoma Expresión génica Esplaisosoma
Método Extracción de ARN total:​ se obtiene el ARN total de las SNP Diagnóstico GWAS
muestras para después poder separar el ARNm . ……………………………………………………………………
1.1 Método de aislamiento ARNm y síntesis de ADNc:​ en este Tipos
paso se aíslan los ARNm de las muestras problemas y controles; Microarrays de dos canales
a cada muestra se le agrega un nucleótido modificado de color Diagrama de una experimento típico de chip de ADN con doble
(Verde-amarillo o rojo) para la síntesis de ADNc, lo que permite canal
obtener las muestras con diferentes colores y poder diferenciarlas En este tipo de chips de ADN (en inglés spotted microarrays), las
en los análisis. sondas son oligonucleótidos, ADN complementario (ADNc) o
2. Método de Extracción de ADN: ​se puede partir también de solo pequeños fragmentos de reacción en cadena de la polimerasa,
ADN. Este material se aísla y purifica al igual que en el ARN de que corresponden con ARN mensajero (ARNm). En este tipo de
ambas muestras (control y problema). chip de ADN se utilizan preparaciones de ADNc obtenido a partir
2.1 Método de PCR​: tras la extracción de ADN, se realiza una de dos muestras biológicas distintas; por ejemplo, de células
PCR con iniciadores aleatorios. Esto permite la amplificación de cultivadas en dos distintas condiciones. El ADNc de cada muestra
todos los fragmentos del ADN pero en presencia de un nucleótido se marca con un fluoróforo diferente, y las dos preparaciones de
modificados (Cy3 y Cy5) para obtener las muestras problemas y ADNc marcadas se mezclan e hibridan sobre el mismo chip de
los controles con diferentes colores. ADN. Una vez realizado este primer paso, se procede al escaneo
3. Hibridación del Microarreglo: ​una vez que se tiene marcado el del resultado y a la visualización del mismo. De esta forma se
ADNc o el ADN de muestras control y problema, se unen o pueden detectar genes que se activan o se reprimen en distintas
hibridan ambos tipos de muestra en la misma placa de condiciones. La contrapartida de estos experimentos es que no se
microarreglo. pueden observar niveles absolutos en la expresión y requieren
4. Lectura del microarreglo:​ con la ayuda de un láser que incide en qPCR para un análisis cuantitativo absoluto.
la placa de microarreglo permite observar las moléculas Chips de oligonucleótidos de ADN
fluorescentes unidas a cada secuencia del microarreglo. En los chips de oligonucleótidos de ADN o micromatrices de canal
Posteriormente se obtiene una imagen de cada una de las único, las sondas se diseñan a partir de una secuencia conocida o
muestras marcadas (control-problema), para posteriormente un ARNm predicho. Estos chips de ADNs dan estimaciones del
compararlas. Ej.: si en un experimento se marcó la muestra nivel de expresión, pero en una misma matriz no pueden
problema con rojo y el control con verde, se observarán observarse distintas condiciones, por lo que por cada condición se
tonalidades que van del rojo al verde. Si el punto que se observa debe utilizar un chip.
es amarillo, la cantidad de rojo y verde es proporcional, pero si No están basadas en la hibridación competitiva. Esto quiere decir:
tiende más al rojo o al verde será porque hubo más secuencias de un chip, una muestra. Las secuencias se construyen en la
una muestra: si tiende al rojo, hubo más secuencias de la muestra superficie del chip mediante el elongamiento secuencial de una
problema; si es verde, hubo más secuencias de la muestra cadena en crecimiento con un solo nucleótido utilizando
control. fotolitografía.
5. Cuantificación del microarreglo:​ para adquirir valores GeneChips de Affymetrix
cuantitativos de las señales de fluorescencia del microarreglo es Affymetrix es la compañía líder en este tipo de chips.
necesario analizar las imágenes con programas de computadora de Se denominan genéricamente "GeneChips".
uso comercial. Se genera una tabla de datos con las coordenadas y
Cada gen representado por un conjunto de secuencias cortas que técnica utilizada. Esto proporciona un patrón de bandas que es único
lo caracterizan. Algunos chips: genomas completos con más de para un ADN en particular debido a la diferencia en las secuencias
50.000 grupos de sondas. del ADN en los individuos donde los sitios de restricción varían.Por
Chips de ADN para genotipado tanto, se trata de un técnica codominante ya que nos permite
Los chips de ADN pueden utilizarse para "leer" las secuencias de distinguir individuos homocigotos de aquellos heterocigotos, es decir,
un genoma particular en determinadas posiciones. Los SNP nos permite observar cada uno de los alelos que estudiamos. En el
arrays son un tipo particular de matrices que se utilizan para gel podemos observar que hay dos alelos de distinto tamaño, y nos
identificar variaciones individuales y a través de poblaciones. Los permite distinguir entre ambos individuos. Las bandas pueden ser
oligonucleótidos pequeños son capaces de identificar transferidas por Southern Blot a una membrana donde se hibridan
polimorfismos de un sólo nucleótido (en inglés SNPs, single con una sonda que permite determinar la longitud y la separación de
nucleotide polymorphisms) que podrían ser los responsables de los fragmentos. En este paso las cadenas de ADN tienen que estar
variaciones genéticas dentro de una población, la fuente de desnaturalizadas, es decir, en forma de cadena sencilla para permitir
susceptibilidad a distintas enfermedades genéticas e incluso a la hibridación con las sondas específicas.
ciertos tipos de cáncer. En general, la aplicación de estas técnicas Las endonucleasas de restricción en su mayoría cortan el ADN de
de genotipado es forense, ya que son rápidas en descubrir o cadena doble en secuencias específicas y cada enzima reconoce un
medir la predisposición de enfermedades o incluso permitir el uso sitio en particular. Un ejemplo es la EcoRI: corta solamente cuando
de ciertos medicamentos para tratar ciertas enfermedades según encuentra la secuencia 5`…G/AATTC…3` en la doble hélice. Para
sea el ADN del enfermo o donante. Los chips de ADN de SNPs esta técnica, es importante seleccionar endonucleasas que corten en
también se utilizan para la identificación de mutaciones somáticas sitios específicos y no sea en secuencias degeneradas.
en cáncer, sobre todo la pérdida de heterocigosis, la amplificación …………………………………………………………………………….
o la deleción de regiones de ADN en el genoma individual de El polimorfismo de largo de fragmento de restricción (RFLP) es una
pacientes afectados, es decir, la detección de aberraciones técnica inventada en 1984 por el científico inglés Alec Jeffreys
cromosómicas. durante la investigación en enfermedades hereditarias. Se utiliza
_______________________________________________ para el análisis de configuraciones únicas en la DNA hace
POLIMORFISMOS DE LONGITUD DE FRAGMENTOS DE RESTRICCIÓN fragmentos para genético distinguir entre los organismos - estas
se refiere a secuencias específicas de nucleótidos en el ADN que son configuraciones se llaman Variable Number de las repeticiones en
reconocidas y cortadas por las enzimas de restricción (también tándem (VNTRs).
llamadas endonucleasas de restricción) y que varían entre individuos. El polimorfismo genético se define como las diferencias genéticas
En un cromosoma humano, una enzima de restricción puede producir heredadas entre individuos hacia adentro sobre el 1% de población
un gran número de cortes en los lugares donde reconozca la secuencia normal. La técnica del PTFR explota estas diferencias en series de la
específica para hacerlo. Las secuencias de restricción presentan DNA para reconocer y para estudiar la variación intraspecies e
usualmente patrones de distancia, longitud y disposición diferentes en interspecies.
el ADN de diferentes individuos de una población, por lo que se dice
que la población es polimórfica para estos fragmentos de restricción.
Los RFLP son marcadores genéticos del ADN y se pueden encontrar
en regiones que codifican proteínas o exones, en los intrones o en el
ADN que separa un gen de otro. Lo único que se necesita para que
puedan ser marcadores genéticos es que sean polimórficos teniendo
más de un alelo. La técnica RFLP se usa como marcador para
identificar grupos particulares de personas con riesgo a contraer ciertas
enfermedades genéticas, en ciencia forense, en pruebas de paternidad
y en otros campos, ya que puede mostrar la relación genética entre
individuos​.
Principio
Metodología​ Se extrae el ADN y se purifica. El ADN purificado
Los endonucleases de la restricción son las enzimas que cortan la
puede ser amplificado usando la técnica molecular Reacción en
DNA muy larga en pedazos cortos. Cada endonuclease de la
cadena de la polimerasa o PCR (del inglés Polymerase Chain
restricción apunta diversas series de nucleótido en un cabo de la
Reaction), luego tratado con enzimas de restricción específicas para
DNA y por lo tanto corta en diversos sitios.
producir fragmentos de ADN de diferentes longitudes. Estas enzimas
La distancia entre los sitios de la hendidura de cierto endonuclease
de restricción hacen un proceso de digestión restrictiva en el cual
de la restricción difiere entre los individuos. Por lo tanto, el largo de
reconocen cortas secuencias específicas en el ADN donde cortan
los fragmentos de la DNA producidos por un endonuclease de la
formando fragmentos de distintas longitudes. Los fragmentos de
restricción diferirá a través de ambos organismos y especies
restricción se separan mediante electroforesis en geles de agarosa a
individuales.
través del cual corren debido a un campo eléctrico y su disociación
¿Cómo trabaja?
obedece a la masa o a la carga eléctrica de las muestras según la
El PTFR se realiza usando una serie de pasos contorneados tales como polimerización en cadena pueden amplificar series de la
abreviadamente abajo: DNA del objetivo en un simple pocas horas.
Extracción de la DNA Además, el PTFR requiere una muestra grande de la DNA, el
Para comenzar con, la DNA se extrae de sangre, de saliva o de otras aislamiento cuyo puede ser un proceso laborioso y que toma
muestras y se purifica. tiempo. En cambio, la polimerización en cadena puede amplificar
Fragmentación de la DNA cantidades minuciosas de DNA en cuestión de horas.
La DNA purificada se digiere usando los endonucleases de la Debido a las razones numerosas tales como éstos, la técnica de la
restricción. Los sitios de reconocimiento de estas enzimas son polimerización en cadena ha reemplazado en gran parte el PTFR en
generalmente 4 a 6 pares bajos de largo. Cuanto más corta es la la mayoría de los usos que requerían la DNA que ordenaba por
serie reconocida, mayor es el número de fragmentos generados de ejemplo la prueba de la paternidad o el análisis forense de la
la digestión. muestra.
Por ejemplo, si hay una serie corta de GAGC que ocurra en varias Además, la identificación de los polimorfismos del único-nucleótido
ocasiones en una muestra de la DNA. El endonuclease de la en el proyecto del genoma humano casi ha reemplazado la
restricción que reconoce la serie de GAGC corta la DNA en cada necesidad del PTFR en análisis del estado de la enfermedaD
repetición de la configuración de GAGC. …………………………………………………………………………
Visualización del polimorfismo
Si una muestra relanza la serie de GAGC 4 veces mientras que otra Extracción del DNA
muestra la relanza 2 veces, el largo de los fragmentos generados por El paso inicial para la identificación del polimorfismo detectado
la enzima para las dos muestras será diferente. mediante RFLPs es la extracción del DNA, generalmente el DNA
Electroforesis del gel genómico total. Es necesario obtener gran cantidad de DNA, limpio
Los fragmentos de la restricción producidos durante la fragmentación y sin romper. Es importante cuantificar el DNA extraído , con objeto
de la DNA se analizan usando electroforesis del gel. de analizar aproximadamente la misma cantidad de DNA por
Los fragmentos están negativo - cargado y se pueden separar muestra.
fácilmente por la electroforesis, que separa las moléculas basadas Gel de agarosa para la cuantificación del DNA extraído, con siete
en su talla y carga. Las muestras hechas fragmentos de la DNA se muestras y dos controles (C) utilizados para la cuantificación.
colocan en la cámara que contiene el gel electroforético y dos Digestión del DNA extraído
electrodos. A continuación, se lleva a cabo la digestión del DNA, durante el
Cuando un campo eléctrico es aplicado, los fragmentos emigran tiempo suficiente para que se realice la digestión completa, con la
hacia el electrodo positivo. Fragmentos más pequeños se mueven enzima de restricción apropiada. Es conveniente comprobar
más rápidamente a través del gel que sale los más grandes d​etrás ​y mediante electroforesis,utilizando parte del producto de la digestión,
las muestras de la DNA se separan así en bandas distintas en el gel. si se ha completado la digestión correctamente Gel de agarosa para
Visualización de bandas la comprobación de la digestión de las muestras.
El gel se trata con los tintes luminiscentes para hacer las bandas de Transferencia
la DNA visibles. La trasferencia del contenido del gel a la membrana se realiza
Usos del PTFR mediante la técnica “Southern blot” . Se trata de disponer del DNA
-El PTFR se ha utilizado para varios usos genéticos del análisis en una superficie sólida que pueda ser sometida a hibridación. Los
desde su invención.-Algunos de éstos enchavietan usos del PTFR fragmentos de DNA, separados en el gel por su tamaño migran
son mencionados abajo:-Para determinar el estado de enfermedades verticalmente, sin variar su posición relativa, hasta una membrana.
genéticas tales como fibrosis quística en un individuo.-Para Las membranas que se utilizan son de nylon o nitrocelulosa. El DNA
determinar o confirmar la fuente de una muestra de la DNA por se fija a la misma, de forma que puede ser sometido a un proceso
ejemplo en pruebas o investigaciones penales de paternidad.-En la de hibridación.
correspondencia genética para determinar los regímenes de Hibridación
recombinación que muestran la distancia genética entre los lugares El paso siguiente es la hibridación con una sonda marcada. La
geométricos.-Para determinar una onda portadora de una mutación sonda puede tener distintos orígenes El marcaje de la sonda puede
enfermedad-que causa en una familia. realizarse también por distintos métodos, siendo los más frecuentes
Desventajas del PTFR el marcaje con radioactividad o con digoxigeninas. En cualquier
Desde su invención, el PTFR ha sido técnicas ampliamente caso, la sonda debe desnaturalizarse, para, a continuación, llevar a
utilizadas de un análisis del genoma empleadas en ciencia forense, cabo la incubación de la membrana. Es posible regular la
remedio, y estudios genéticos. Sin embargo, ha llegado a ser casi astringencia de la hibridación, de forma que, por ejemplo, en
obsoleto con la llegada DNA relativamente simple y de la menos condiciones muy astringentes, únicamente se producirá hibridación
costosa que perfilaba tecnologías tales como la reacción en cadena con las moléculas exactamente complementarias a la sonda.
de polimerasa (PCR). Detección
El procedimiento del PTFR requiere pasos numerosos y lleva La forma de visualización de los resultados dependerá del sistema
semanas los resultados del rendimiento, mientras que las técnicas de marcaje empleado. Como ejemplo, si la sonda se ha marcado con
radioactividad, la visualización se puede realizar por exposición de utilización de genotecas genómicas enriquecidas en cada especie,
una película fotográfica.. Si el marcaje se ha realizado con en las que los fragmentos utilizados para construir la genoteca ya
digoxigeninas, la detección se puede realizar añadiendo un sustrato son ricos en microsatélites. Con el avance de las nuevas tecnologías
que proporcione, bien una señal de color de secuenciación (NGS, Next Generation Sequencing,
_____________________________________________________ fundamentalmente las tecnologías, 454 y Illumina, que han llevado al
MICROSATELITES abaratamiento del proceso
Las secuencias de tipo microsatélite (SSR o STR, Simple Sequence de obtención de secuencias, actualmente se dispone de grandes
Repeats o Short Tandem Repeats), muy abundantes en los genomas colecciones de secuencias, tanto genómicas como de ESTs
de eucariotas y algunos procariotas, están constituidas por unidades (Expressed Sequence Tags) para muchas especies, lo que ha
cortas (motivos básicos) de 1 a 6 pares de bases, que se repiten en supuesto un incremento considerable del número de este tipo de
tándem un elevado número de veces. Cada secuencia SSR se marcadores, que son identificados in silico, mediante el empleo de
define por el tipo de unidad repetida (lo más frecuente mono, di, tri o distintos algoritmos informáticos, y después validados
tetra, aunque también penta o hexa nucleótidos) y por el sitio que experimentalmente. Las ventajas que ofrecen los microsatélites se
ocupan en el genoma (locus). Su frecuencia y tipo de repetición varía deben, en parte, al empleo de amplificación PCR con cebadores
en los genomas de distintas especies. Por ejemplo, se sabe que son largos, específicos de cada locus, ya que el tejido que se utiliza no
muy abundantes en peces, insectos himenópteros y mamíferos, y necesita ser de mucha calidad, e incluso ADN en estado avanzado
menos en los genomas de aves, en plantas y en lepidópteros).Se de degradación es suficiente para ser analizado. Su naturaleza
trata de secuencias altamente variables, entre y dentro de individuos. codominante, que permite la distinción de homocigotos y
La variación se manifiesta normalmente como diferencias en longitud heterocigotos, su amplia distribución en el genoma, su
entre los distintos alelos del mismo locus. Estas diferencias en reproducibilidad y su elevada variabilidad (multialélicos) los han
longitud surgen de la existencia de un número diferente de convertido en uno de los sistemas de marcadores genéticos más
repeticiones del motivo básico en cada caso. Se ha estimado que la informativos y empleados. A pesar de que los SNPs (Single
tasa de mutación en los microsatélites varía entre 10-2 y 10-5 por Nucleotide Polymorphism) están remplazando a los marcadores tipo
generación y el mecanismo que explica mejor su alto grado de SSR en estudios masivos, dado que pueden ser automatizados via
polimorfismo en tamaño es la acumulación de errores producidos por plataformas de genotipado de alto rendimiento, los microsatélites
el deslizamiento de la polimerasa durante la replicación del ADN. El siguen siendo marcadores muy empleados, especialmente en
uso de las secuencias microsatélites como marcadores genéticos se estudios con un menor número de individuos.
inicia con el desarrollo y generalización de la PCR (Polymerase
Chain Reaction). A pesar de que los microsatélites poseen altas
tasas de mutación, las regiones flanqueantes están más
conservadas y se emplean para la amplificación específica de los
alelos de cada locus. Al final de los 80 es cuando se publican los
primeros trabajos sobre el aislamiento y caracterización de
microsatélites. A partir de entonces su uso se ha difundido
rápidamente, revolucionando los campos de la biología molecular, la
genética cuantitativa y la genética de poblaciones. Los SSRs han
sido durante muchos años los marcadores preferidos para múltiples
objetivos, genética forense, test de paternidad, análisis
poblacionales, estudios de diversidad e identificación varietal,
construcción de mapas genéticos y estudios de asociación.
Su detección se basa en la amplificación por PCR de la región que
los contiene, empleando cebadores complementarios a las regiones
flanqueantes, y la posterior visualización de la diferencia de tamaño
de estos amplicones. Sin embargo, su desarrollo requiere
información de secuencia y por tanto, hasta hace poco tiempo, no
eran marcadores muy frecuentes en especies no modelo.
Inicialmente, para conocer la secuencia de las regiones flanqueantes
de los SSR se empleaban sondas de los motivos repetidos para
cribar genotecas completas, secuenciándose los clones positivos.
Esta estrategia de aislamiento era efectiva en taxones en los que la
cantidad de secuencias microsatélites era alta o cuando se requería
un número reducido de marcadores. Pronto se desarrollaron
métodos alternativos para aumentar la eficiencia en la identificación
de microsatélites. El método más ampliamente utilizado ha sido la

Vous aimerez peut-être aussi