Vous êtes sur la page 1sur 10

Cincia Rural, Santa Maria,

Sequenciamento
v.40, n.3,de
p.735-744,
DNA de nova
mar, 2010
gerao e suas aplicaes na genmica de plantas. 735
ISSN 0103-8478

Sequenciamento de DNA de nova gerao e suas aplicaes na genmica de plantas

Next generation DNA sequencing and its applications in plant genomics

Mayra Costa da Cruz Gallo de CarvalhoI Danielle Cristina Gregorio da SilvaII

- REVISO BIBLIOGRFICA -

RESUMO INTRODUO

As plataformas de sequenciamento de nova As novas tecnologias de sequenciamento,


gerao so uma alternativa poderosa para estudos de denominadas de tecnologias de sequenciamento de
genmica estrutural e funcional. Na genmica de plantas, os nova gerao, comearam a ser comercializadas em 2005
trabalhos com as novas plataformas tm sido destinados ao
e esto evoluindo rapidamente. Todas essas
sequenciamento de transcritos, ressequenciamento ou
sequenciamento de novo de genomas plastidiais. Neste trabalho,
tecnologias promovem o sequenciamento de DNA em
so detalhadas as tecnologias das plataformas mais utilizadas
plataformas capazes de gerar informao sobre milhes
atualmente, bem como revisada a aplicao dessas de pares de bases em uma nica corrida. Dentre as
tecnologias na genmica estrutural e funcional de plantas. novas plataformas de sequenciamento, duas j
possuem ampla utilizao em todo o mundo: a
Palavras-chave: leituras curtas, ressequenciamento, plataforma 454 FLX da Roche e a Solexa da Illumina.
sequenciamento de novo, genmica Outros dois sistemas de sequenciamento que comeam
estrutural de plantas, transcritmica de a ser utilizados so a plataforma da Applied Biosystems,
plantas, genmica funcional. denominada SOLiD System, e o HeliscopeTrue Single
Molecule Sequencing (tSMS), da Helicos. Essas novas
ABSTRACT plataformas possuem como caractersticas comuns um
poder de gerar informao muitas vezes maior que o
The next-generation DNA sequencing technologies
sequenciamento de Sanger, com uma grande economia
are a powerful alternative to studies in structural and functional
genomics. In plant genomics studies, the work with these new
de tempo e custo por base para o sequenciamento.
platforms has been used for the sequencing of transcripts, re-
Essa maior eficincia advm do uso da clonagem in
sequencing, and the de novo sequencing of plastid genomes. vitro e de sistemas de suporte slido para as unidades
This research details the technological principles of the next- de sequenciamento, no precisando mais do intensivo
generation DNA sequencing platforms most used and reviews trabalho laboratorial de produo de clones
its application in structural and functional plant genomics. bacterianos, da montagem das placas de
sequenciamento e da separao dos fragmentos em
Key words: short reads, res-sequencing, de novo sequencing, gis. A clonagem in vitro em suporte slido permite
plants structural genomics, plants transcriptomics, que milhares de leituras possam ser produzidas de uma
functional genomics. s vez com a plataforma 454, Solexa ou SOLiD.
I
Departamento de Cincias Biolgicas, Universidade Estadual Paulista (UNESP), Avenida Dom Antonio, 2100, 19806-900, Assis,
SP, Brasil. E-mail: mayra@assis.unesp.br. Autor para correspondncia.
II
Departamento de Biologia e Tecnologia, Universidade Estadual do Norte do Paran (UENP), Campus Luiz Meneghel, Bandeirantes,
PR, Brasil.

Recebido para publicao 23.03.09 Aprovado em 09.11.09 Cincia Rural, v.40, n.3, mar, 2010.
736 Carvalho & Silva.

Pirosequenciamento e a tecnologia 454 se inicia com a liberao de um pirofosfato, oriundo da


O sistema 454 foi a primeira plataforma de adio de um desoxinucleotdeo cadeia. Em seguida,
sequenciamento de nova gerao a ser comercializada. esse pirofosfato convertido para ATP, pela ATP
A plataforma 454 realiza o sequenciamento baseado sulfurilase, sendo este utilizado pela luciferase para
em sntese, o pirosequenciamento (RONAGHI et al., oxidar a luciferina, produzindo um sinal de luz (Figura
1998). A leitura da sequncia nesse sistema realizada 1) capturado por uma cmera CCD (charge-coupled
a partir de uma combinao de reaes enzimticas que device) acoplada ao sistema.

Figura 1 - Resumo ilustrativo do sequenciamento na plataforma 454. O sequenciamento dividido em


trs etapas: (a) preparo da amostra, (b) PCR em emulso e (c) Sequenciamento. (a) O DNA
fragmentado aleatoriamente e ligado a adaptadores A e B em suas extremidades. Os fragmentos
A/B so selecionados para o sequenciamento. (b) Os fragmentos so ligados s microesferas
magnticas por meio do pareamento com sequncias curtas complementares presentes na
superfcie da microesfera. Apenas um nico tipo de fragmento se liga a uma determinada
microesfera. As microesferas so capturadas individualmente em gotculas oleosas onde a
PCR em emulso ocorre. Milhares de cpias do fragmento alvo so produzidas nessa fase. (c)
As microesferas ligadas s sequncias alvo fita simples so capturadas individualmente em
poos no suporte de sequenciamento. So fornecidos os reagentes para a reao de
pirosequenciamento, e o sinal de luz emitido identificado a cada base incorporada, em cada
poo de sequenciamento.

Cincia Rural, v.40, n.3, mar, 2010.


Sequenciamento de DNA de nova gerao e suas aplicaes na genmica de plantas. 737

O sistema requer que o DNA seja o sinal de luz emitido pode ser diretamente utilizado
mecanicamente fragmentado em sequncias de 300 como informao de sequncia (RONAGHI, 2001).
800pb, transformado em fragmentos abruptos Os fragmentos sequenciados nessa
fosforilados e ligado a adaptadores de sequncia plataforma passam por sistemas de anlise de qualidade
especfica (Figura 1). A biblioteca de DNA da amostra em que sequncias distintas oriundas do
ligada a adaptadores A e B nas extremidades 3 e 5 dos sequenciamento de uma nica microesfera so
fragmentos, respectivamente, os quais so utilizados eliminadas, bem como as leituras em que a sequncia
nas etapas posteriores de isolamento dos fragmentos inicial TCGA (quatro primeiros nucleotdeos dos
(A-B) e amplificao e nas reaes de sequenciamento.
adaptadores) no aparece. As leituras produzidas
O adaptador B possui biotina ligada extremidade 5, o
possuem geralmente cerca de 250pb, o que representa
que permite o isolamento dos fragmentos ligados ao
um comprimento de leitura muito menor que o produzido
adaptador A na extremidade 3 e adaptador B na
extremidade 5 na amostra. Somente os fragmentos A- pelo sistema de Sanger (~700pb). A Roche divulgou
B so eludos na reao de purificao e so recentemente o lanamento da srie Titanium de
especificamente ligados s microesferas que carregam pirosequenciamento, em que leituras maiores que 400pb
vrias cpias da sequncia complementar exata ao so conseguidas. Esse aprimoramento das leituras
adaptador B de um nico fragmento (MARGULIES et advm de otimizaes nas reaes qumicas do
al., 2005). O outro adaptador utilizado no anelamento pirosequenciamento, as quais reduzem o rudo de fundo
do primer que inicia a reao de sequenciamento. As e aumentam o nmero de leituras por corrida, e do novo
microesferas ligadas aos fragmentos nicos de fita desenho do suporte de sequenciamento
simples so ento emulsionadas em uma mistura de (PicoTiterPlate), o qual agregou duas mudanas
gua e leo com reagentes de PCR para amplificao principais: o uso de uma estrutura metlica, permitindo
clonal do fragmento fita simples em cerca de 1 milho leituras mais acuradas, e esferas ainda menores,
de cpias. Na PCR em emulso, o leo em soluo aumentando, tanto o tamanho das leituras, quanto o
aquosa forma micelas, nas quais as microesferas so nmero de leituras por corrida (ROCHE, 2008). O maior
capturadas. Cada micela funcionar como um tamanho das leituras e a grande capacidade de gerar
microrreator, produzindo muitas cpias idnticas de um informao tornam o processo de montagem mais fcil
mesmo fragmento isoladamente em um microssuporte num projeto de sequenciamento de novo
(DRESSMAN ET AL., 2003). (sequenciamento de genomas desconhecidos) e
Aps a PCR de emulso, as microesferas permite trabalhar com coberturas genmicas mais
ligadas aos fragmentos de fita simples so depositadas amplas, favorecendo o processo de montagem. Alm
em poos distintos em uma placa de slica onde os disso, pelo fato de no envolver clonagem bacteriana,
reagentes para o sequenciamento so distribudos. As a representao do genoma bem mais fiel, de forma
reaes de sequenciamento ocorrem em cada poo, que sequncias difceis de clonar e manter em
para um nico tipo de fragmento ligado microesfera, bibliotecas genmicas podem ser acessadas.
no havendo, portanto, competio por reagentes com Genomas pequenos, como os de bactrias e
outros fragmentos da biblioteca. A placa de de alguns eucariotos, podem ser facilmente montados
sequenciamento dividida em 1,6 milhes de poos usando a plataforma 454. Com relao s demais
com dimetro suficiente para alojar uma nica tecnologias de sequenciamento da segunda gerao,
microesfera (Figura 1). a plataforma 454 a que produz as maiores leituras e
A placa de sequenciamento inserida junto por isso tem sido mais utilizada, inclusive para o
ao sistema ptico de leitura no equipamento. Os sequenciamento de genomas eucariotos (WICKER et
reagentes e as solues de sequenciamento so ento al., 2009). Outra limitao importante da plataforma 454
distribudos por toda a placa a cada ciclo para obteno a baixa eficincia na determinao de homopolmeros.
do sequenciamento paralelo dos 1,6 milhes de poos. Como a intensidade do sinal de fluorescncia relaciona-
O sequenciamento realizado em ciclos, e a cada ciclo se ao nmero de vezes que um determinado nucleotdeo
um tipo determinado de nucleotdeo adicionado foi incorporado sequncia, a determinao precisa
reao. Se o nucleotdeo adicionado for incorporado de sequncias em que um nico nucleotdeo repetido
sequncia em sntese, um sinal de luz emitido, sendo mais de trs vezes torna-se imprecisa. O custo do
a intensidade desse sinal um reflexo do nmero de sequenciamento com essa plataforma superior ao
nucleotdeos desse tipo especfico que foram custo das plataformas Solexa e SOLiD (Tabela 1), mas,
sucessivamente incorporados na molcula. Como o nos casos em que a produo de leituras maiores
nucleotdeo que adicionado a cada ciclo conhecido, necessria, a plataforma 454 deve ser a melhor opo.

Cincia Rural, v.40, n.3, mar, 2010.


738 Carvalho & Silva.

Tabela 1 - Resumo das principais caractersticas tcnicas das plataformas 454 GS-FLX, Solexa e SOLiD e laboratrios no Brasil que j
adquiriram essas novas plataformas. A durao da corrida inclui o tempo para o preparo, a leitura e o processamento das
amostras; o custo da corrida e o valor do equipamento so fornecidos na capacidade mxima do equipamento.

--------------------Corrida------------------- --------------Custo--------------
Plataforma Acurcia (%) Laboratrio**
Informao Equipamento
Durao (dias) Reads (pb) Base (U$)
(Gb) (U$)
- LNCC
GS-FLX Titanium 0,5 3a4 At 400 531.500 10.000 99,5
- IQ-USP
Genome analyzer
3 5 25-35 430.000 6.250 98,5 - Nenhum
(Solexa)
- Fiocruz
SOLiD System 25 4-12 35-50 599.000 10.000 99 - Instituto Ludwig
- UFPA

*Valores cotados em janeiro de 2009.


**Pesquisa realizada em janeiro de 2009.

Plataforma Solexa sequenciamento. Etapas de desnaturao so


O sequenciamento na plataforma Solexa, necessrias para a separao dos duplex formados e,
assim como o sequenciamento de Sanger, realizado nos prximos ciclos de amplificao, nucleotdeos
por sntese usando DNA polimerase e nucleotdeos terminadores marcados so fornecidos para as reaes
terminadores marcados com diferentes fluorforos. A de sequenciamento que ocorrem dentro de cada cluster.
inovao dessa plataforma consiste na clonagem in A alta densidade dos clusters de sequenciamento
vitro dos fragmentos em uma plataforma slida de vidro, possibilita que o sinal de fluorescncia gerado com a
processo tambm conhecido como PCR de fase slida incorporao de cada um dos nucleotdeos
(FEDURCO et al., 2006; TURCATTI et al., 2008). A terminadores tenha uma intensidade suficiente para
superfcie de clonagem (flow cells) dividida em oito garantir sua deteco exata. At 50 milhes de clusters
linhas que podem ser utilizadas para o sequenciamento podem ser produzidos por linha, correspondendo a uma
de at oito bibliotecas. Em cada linha, adaptadores so representao satisfatria da biblioteca. Aps a
fixados superfcie pela extremidade 5, deixando a incorporao de cada nucleotdeo no fragmento em
extremidade 3 livre para servir na iniciao da reao sntese, a leitura do sinal de fluorescncia realizada.
de sequenciamento dos fragmentos imobilizados no Em seguida, ocorre uma etapa de lavagem para remoo
suporte por hibridizao (Figura 2). dos reagentes excedentes e remoo do terminal 3
Os fragmentos de DNA da amostra so bloqueado e do fluorforo do nucleotdeo incorporado
tambm ligados aos adaptadores em ambas as no ciclo anterior para que a reao de sequenciamento
extremidades, o que permite sua fixao ao suporte de prossiga. A leitura das bases feita pela anlise
sequenciamento por hibridizao a um dos adaptadores sequencial das imagens capturadas em cada ciclo de
fixados (Figura 2). No primeiro ciclo de amplificao, sequenciamento. Em geral, leituras de 25-35 bases so
nucleotdeos no marcados so fornecidos para que obtidas de cada cluster (SHENDURE & JI, 2008).
haja a sntese da segunda fita do fragmento imobilizado
no suporte. A alta densidade de adaptadores no suporte Plataforma SOLiD (Sequencing by Oligonuclotide
facilita a hibridizao do adaptador livre dos fragmentos Ligation and Detection)
imobilizados a sua sequncia complementar fixa perto No sistema SOLiD (MCKERNAN et al.
do clone inicial durante o ciclo de anelamento. Aps o 2006), diferentemente dos demais processos, a reao
ciclo de anelamento, o fragmento forma uma estrutura de sequenciamento catalisada por uma DNA ligase, e
em ponte na superfcie de sequenciamento e a no uma polimerase. O DNA alvo mecanicamente
extenso ocorre, formando a fita complementar tambm fragmentado em um sonicador em fragmentos de 60-
em ponte. No ciclo de desnaturao, as fitas so 90pb, para as bibliotecas de tags nicas, ou 1-10Kb,
separadas e linearizadas. Esses ciclos so repetidos 35 para as bibliotecas de tags duplas (mate-pair). Os
vezes e assim as cerca de mil cpias geradas de cada fragmentos de 60-90pb so diretamente ligados a
fragmento nessa PCR de fase slida permanecem adaptadores universais (P1 e P2) em ambas as
prximas umas das outras, formando um cluster de extremidades. J nas bibliotecas mate-pair, a

Cincia Rural, v.40, n.3, mar, 2010.


Sequenciamento de DNA de nova gerao e suas aplicaes na genmica de plantas. 739

fragmentao resulta na produo


de um contnuo de fragmentos de 1
a 10Kb, que so visualizados em gel
para seleo da faixa de tamanho de
interesse. Uma vez selecionados, os
fragmentos so ligados aos mesmos
adaptadores P1 e P2, mas so
circularizados e clivados com uma
enzima de restrio que reconhece
seu stio no adaptador e cliva
adiante, liberando fragmentos
formados por: 27 bases de uma
regio, mais a sequncia dos
adaptadores e mais 27 bases
adicionais de outra regio que est
separada da primeira pela distncia
utilizada no intervalo de seleo dos
fragmentos.
O adaptador P1
utilizado no anelamento do primer
da PCR de emulso. A amplificao
da biblioteca na plataforma SOLiD
permite, da mesma forma que na
plataforma 454, a ligao dos
fragmentos por hibridizao com
sequncias complementares aos
adaptadores fixos a microesferas
metlicas que so capturadas nas
micelas da PCR de emulso (Figura
3). As bibliotecas resultantes contm
milhes de molculas nicas
representando a sequncia alvo
inteira. As esferas so ligadas
Figura 2 - Representao esquemtica do princpio tecnolgico da plataforma covalentemente a uma lmina de
Illumina. O DNA fragmentado aleatoriamente e ligado a adaptadores vidro com uma substncia
A e B em ambas as extremidades (A). As molculas de DNA fita desenvolvida pela Applied
simples so aderidas por afinidade ao suporte slido onde esto tambm
Biosystems que leva a ligao
aderidos em alta densidade oligonucleotdeos complementares aos
adaptadores A e B (B). Durante a etapa de anelamento (C), no primeiro covalente das microesferas. Em cada
ciclo de amplificao da PCR em fase slida, o adaptador da corrida, so utilizadas duas lminas
extremidade livre da molcula aderida ao suporte encontra seu ou chips, cada um com capacidade
oligonucleotdeo complementar no suporte, formando uma estrutura atual para 100 mil microesferas. Um
em ponte. Uma vez fornecidos os reagentes necessrios, a PCR
iniciada utilizando a extremidade 3 livre do oligonucleotdeo como aspecto interessante desse
primer (C e D). Na etapa de desnaturao (E), a ponte desfeita equipamento que, embora as
mediante elevao de temperatura. Repete-se a etapa de anelamento microesferas sejam aleatoriamente
(F), formando novas estruturas em ponte e iniciando um novo ciclo distribudas sobre o chip, cada chip
de amplificao. Aps uma srie desses ciclos, sero obtidos clusters
de molculas idnticas ligadas ao suporte (G). Com a incorporao de
pode ser dividido em oito reas, as
nucleotdeos terminadores marcados e excitao a laser (H), gerado quais podem ento ser utilizadas na
sinal, o qual captado por dispositivo de leitura e interpretado como anlise de oito bibliotecas diferentes.
um dos quatro possveis nucleotdeos componentes da cadeia (I). O Alternativamente, possvel adquirir
processo de incorporao de nucleotdeo marcado, excitao e leitura
o sistema de cdigo de barras da
repetido para cada nucleotdeo componente da sequncia (J, K). A
leitura feita de forma sequencial, o que permite a montagem da empresa que possibilita a
sequncia completa de cada cluster (L). identificao das diferentes

Cincia Rural, v.40, n.3, mar, 2010.


740 Carvalho & Silva.

Figura 3 - Plataforma SOLiD. Os fragmentos de DNA so gerados e ligados ao adaptador P1 que se liga especificamente a uma
microesfera. O sequenciamento ocorre por hibridizao de sondas fluorescentes com o alvo em cinco etapas distintas.
Na primeira etapa, o primer (n) utilizado, liberando as primeiras bases da sequncia alvo para hibridizao com a
sonda. Uma das sondas do pool encontrar similaridade ao alvo ligando-se a ele. O sinal de fluorescncia lido, e as trs
ltimas bases da sonda, incluindo o fluorforo, so removidas. Inicia-se o segundo ciclo de hibridizao e assim
sucessivamente, at que o alvo seja todo coberto (35pb). A sequncia fita dupla desnaturada, e uma nova etapa de
sequenciamento iniciada com o primer (n-1). Os ciclos de hibridizao so repetidos, fornecendo informao de
outras bases da sequncia alvo. Novas etapas de sequenciamento com os primers (n-2), (n-3), e (n-4) so realizadas para
que toda a sequncia alvo seja determinada. Todas as combinaes possveis de dinucleotdeos so marcadas nas sondas
com apenas quatro fluorforos. Assim, duas leituras so necessrias de cada base para que a sequncia do dinucleotdeo
da sonda seja resolvida. Esse processo inicia-se com a identificao da primeira base do alvo na segunda etapa de
sequenciamento (primer n-1), que libera para hibridizao com a sonda uma base j conhecida, a ltima base do
adaptador.

amostras distribudas sobre um mesmo chip no No analisador SOLiD, os moldes ligados s


dividido com base em cinco nucleotdeos especficos esferas so combinados aos primers universais de
(cdigo de barras) que so adicionados ao adaptador sequenciamento, a enzimas ligase e a sondas (1024
P2. Atualmente, so disponveis 20 cdigos distintos, sondas). O sequenciamento dividido em etapas
os quais, se usados em chips divididos, possibilitam a distintas pelo uso do primer universal que tem n bases
anlise simultnea de 320 amostras. na primeira etapa, n-1 bases na segunda etapa, e assim

Cincia Rural, v.40, n.3, mar, 2010.


Sequenciamento de DNA de nova gerao e suas aplicaes na genmica de plantas. 741

sucessivamente at a quinta etapa em que o primer bases. Os demais sinais de fluorescncia so


possui n-4 bases. So tambm utilizadas, nas reaes especificados pela nica combinao possvel de cores
de sequenciamento, sondas curtas (oito bases) que inclui a base conhecida. Esse sistema de leitura
randmicas marcadas com um entre quatro fluorforos muito eficiente na deteco de polimorfismos (SNPs),
possveis em funo do tipo de dinucleotdeo que os quais so facilmente confundidos com erros de
apresentam na sua extremidade 3 (Figura 3). sequenciamento em outras plataformas. Na plataforma
As nicas bases seletivas da sonda so a SOLiD, a presena de um SNP resulta sempre em uma
primeira e a segunda; a terceira, a quarta e a quinta das trs alteraes previstas de dois sinais de leitura,
base so degeneradas em todas as combinaes enquanto as demais seis alteraes possveis
possveis. As bases 6, 7 e 8 so inosinas que carregam representam erros de sequenciamento com alterao
o fluorforo marcador. Na primeira etapa, adicionado de um nico sinal. As leituras produzidas com o SOLiD
o primer universal completo que se anela exatamente apresentam acurcia muito superior s demais tcnicas,
na extremidade do adaptador P1. A sonda que for sendo perfeitamente adequadas identificao de
complementar sequncia alvo dentro do pool de polimorfismos genmicos reais.
sondas se hibridizar com a sequncia molde e ser As leituras curtas produzidas pela
ligada ao primer universal, pela ao da ligase. A plataforma SOLiD foram utilizadas no sequenciamento
fluorescncia da sonda ligada detectada, e o de novo somente no caso de bactrias e com a
fluorforo clivado, deixando um grupo 5 fosfato produo de bibliotecas mate-pair (DURFEE et al.,
disponvel para reaes adicionais. No prximo ciclo, 2008). No entanto, a alta eficincia e sensibilidade da
adicionam-se novamente as sondas e a ligase para a plataforma, aliadas possibilidade de analisar 320
leitura das prximas bases seletivas. Esses ciclos se amostras distintas em uma nica corrida, tornaram a
repetem at que toda a sequncia seja coberta. Na etapa plataforma SOLiD destinada principalmente aos
seguinte, o fragmento desnaturado e adiciona-se o estudos de transcritmica (CLOONAN et al., 2008;
segundo primer universal com n-1 bases, liberando PASSALACQUA et al., 2009; TANG et al., 2009).
desde a ltima base do adaptador para o
sequenciamento. Novamente todos os ciclos com as Genomas de plantas e as novas plataformas de
sondas so realizados e esse processo repetido sequenciamento
produzindo uma leitura de 35 pb nas bibliotecas de Para espcies vegetais com genomas
tags nicas ou de 50pb nas bibliotecas mate-pair. As desconhecidos, a utilizao das novas plataformas de
cinco etapas de sequenciamento so necessrias sequenciamento ainda limitada. O tamanho das
porque a cada ciclo de hibridizao da sonda apenas a leituras produzidas incompatvel com a montagem
sequncia do primer universal mais os grupos de dos genomas nucleares gigantescos e altamente
dinucleotdeos marcadores das sondas que repetitivos das plantas. Os poucos trabalhos realizados
hibridizaram so conhecidos. Para descobrir o restante tm sido destinados ao sequenciamento de transcritos,
da sequncia alvo, so necessrias, portanto, outras ressequenciamento e sequenciamento de novo de
quatro etapas de sequenciamento usando o primer genomas plastidiais, os quais so menores (~150Kb) e
universal para o adaptador com uma base a menos no contm pouca quantidade de DNA repetitivo.
seu terminal 5 a cada etapa (n-1, n-2, n-3 e n-4). Assim, A plataforma 454 a mais utilizada em
quando o primer n-1 for usado, por exemplo, a primeira plantas. O primeiro trabalho que utilizou essa plataforma
sonda a se hibridizar fornecer informao sobre a ltima teve como objetivo avaliar o seu potencial para a anlise
base da sequncia do adaptador e uma segunda de genomas repetitivos, comparando resultados do
informao da primeira base da amostra e assim por sequenciamento convencional com os obtidos para
diante. Esse complexo processo ocorre sucessivamente, quatro clones BACs de cevada (WICKER et al., 2006).
proporcionando dupla leitura para cada base e, como Os resultados mostraram que a plataforma 454 capaz
consequncia, reduzindo muito a chance de erros de de gerar a mesma quantidade de informao obtida com
sequenciamento (Figura 3). o sequenciamento de Sanger com alta qualidade. No
Como cada sinal de fluorescncia especifica entanto, as leituras curtas produziram de seis a nove
um dinucleotdeo e no uma nica base, a decodificao vezes mais gaps, principalmente devido a erros de
dos sinais de leitura feita combinando-se os dados sequenciamento observados em regies de
(Figura 3). As bases do adaptador P1 so conhecidas, homopolmeros. Para as regies repetitivas, as leituras
o que permite a identificao correta da primeira base curtas s apresentaram problemas de montagem
do fragmento durante a segunda etapa de quando presentes em mltiplas cpias em um nico
sequenciamento, quando se utiliza o primer com n-1 clone. Parte do genoma da cevada (~10% do genoma

Cincia Rural, v.40, n.3, mar, 2010.


742 Carvalho & Silva.

haploide) foi tambm sequenciada em uma nica corrida genes de interesse. J com o sequenciamento livre de
utilizando leituras ainda menores produzidas com a clonagem bacteriana, genes de clulas especficas
plataforma Solexa (WICKER et al., 2008). Muito podem ser facilmente identificados, como realizado para
importante nesse trabalho foi o desenvolvimento de as clulas meristemticas apicais do milho, que
um ndice matemtico para predio e excluso de compem apenas uma poro do pice da planta. Um
regies repetitivas. A aplicao desse ndice total de 400 novos genes foi identificado em uma nica
possibilitou a montagem de 5.500Mb do genoma da corrida na plataforma 454, sendo a maior parte deles
cevada e a identificao de regies desconhecidas. genes especificamente expressos nesse tecido
O problema de gaps em regies de (EMRICH et al., 2007).
homopolmeros foi relatado tambm no sequenciamento O ressequenciamento genmico em plantas
dos genomas plastidiais de Nandina e Platanus com tambm muito informativo para estudos de
as plataformas 454 e Solexa (MOORE et al., 2006). polimorfismo. Indivduos variantes de arabidopsis
Apesar disso, uma reduo considervel de custo foram sequenciados utilizando a plataforma Solexa para
(~$4.500 por genoma) e tempo (~2 semanas para buscar variaes genotpicas (OSSOWSKI et al., 2008).
finalizao dos dois genomas) foi conseguida utilizando A montagem das leituras curtas da plataforma Solexa
o sistema GS20 de pirosequenciamento para sequenciar foi auxiliada pela informao genmica disponvel para
99,75% de tais genomas. arabidopsis, e o sequenciamento de pequena cobertura
Um dos trabalhos que melhor ilustra o (11 vezes em uma nica corrida) utilizado nesse
potencial das novas plataformas de sequenciamento trabalho foi suficiente para deteco de delees,
foi o conduzido com o eucalipto (NOVAES et al., 2008), duplicaes e de SNPs com uma especificidade de 99%.
espcie para a qual pouca informao genmica A plataforma 454 foi tambm utilizada com sucesso na
disponvel. Nesse trabalho, 148,4Mb de ESTs de vrios identificao de SNPs em transcritos das clulas
gentipos e tecidos foram sequenciados com a meristemticas apicais de milho. Em uma nica corrida,
plataforma 454, gerando um nmero maior de genes do foi possvel identificar cerca de cinco mil SNPs vlidos
que o gerado por sequenciamento convencional, 23.742 entre os 2.472 genes identificados (BARBAZUK et al.,
SNPs altamente confiveis e, muito importante, o 2007).
enriquecimento de 37 vezes nas sequncias de ESTs As novas plataformas de sequenciamento,
disponveis para o eucalipto nos bancos de dados em um futuro bem prximo, revolucionaro o
pblicos. O sequenciamento de ESTs representa conhecimento sobre o genoma das plantas,
certamente uma estratgia de sucesso para obteno principalmente no que concerne ao estudo de variantes
de informao genmica das plantas a partir das novas allicas, SNPs, ao desenvolvimento de marcadores para
plataformas de sequenciamento. Ele reduz os problemas seleo assistida e clonagem baseada em mapeamento,
de montagem associados s leituras curtas (EMRICH representando uma importante ferramenta no
et al., 2007) e pode ser ainda mais informativo, uma vez melhoramento vegetal. Essa revoluo ser possvel
que mais informao produzida e sequncias de baixa com o avano tecnolgico das prprias plataformas de
expresso so tambm amostradas (no h efeito de sequenciamento, produzindo leituras maiores, avano
clonagem bacteriana). Alm disso, o custo do das ferramentas de anlise de leituras curtas e
sequenciamento de ESTs menor com as novas montagem de sequncias.
plataformas de sequenciamento, uma vez que no O que parece estar cada vez mais evidente
depende da construo de bibliotecas de cDNA para , na verdade, o potencial de uso imediato dessas
cada um dos tecidos amostrados. Alm do banco de tecnologias na genmica funcional com o estudo de
ESTs do eucalipto, os bancos de milho (EMRICH et al., transcritomas que vo desde organismos completos
2007), Medicago sp (CHEUNG et al., 2006) e arabidopsis at clulas individuais (ANDREAS et al., 2007; TANG
(WEBER et al., 2007) tambm esto sendo enriquecidos et al. 2009). Todas as plataformas de sequenciamento
com o pirosequenciamento. da segunda gerao podem ser utilizadas no
O potencial de identificao de novos genes sequenciamento de transcritomas ou RNA-seq. A maior
com os novos sistemas de sequenciamento parte dos estudos de transcritmica em plantas
especialmente importante quando se deseja conhecer realizada utilizando os microarranjos de DNA, os quais,
genes funcionais em tipos celulares restritos. Nesses alm de depender de um conhecimento genmico prvio
casos, utilizando os mtodos convencionais de e de serem influenciados pelo elevado rudo de fundo,
sequenciamento, um grande nmero de bibliotecas possuem ainda uma faixa de deteco de expresso
deve ser construdo e muitos ESTs devem ser limitada quando comparada s novas plataformas de
sequenciados para maximizar a chance de encontrar os sequenciamento (~100 vezes versus 9.000 vezes)

Cincia Rural, v.40, n.3, mar, 2010.


Sequenciamento de DNA de nova gerao e suas aplicaes na genmica de plantas. 743

(MARIONI et al., 2008; WANG et al., 2009). O grande BARBAZUK, W.B. et al. SNP discovery via 454 transcriptome
sequencing. The plant journal, v.51, p.910-918, 2007.
sucesso das novas tecnologias na transcritmica se
Disponvel em: <http://www.ncbi.nlm.nih.gov/ pmc/articles/
deve tambm ao fato de que estas possibilitam a PMC2169515/?tool=pubmed>. Acesso em: 5 jun. 2009. doi:
superao de uma das maiores limitaes dos projetos 10.1111/j.1365-313X.2007.03193.x.
ESTs a brusca reduo no nmero de sequncias
CHEUNG, F. et al. Sequencing Medicago trunculata expressed
novas amostradas com o aumento na quantidade de sequenced tags using 454 Life Sciences technology. BMC
informao sequenciada. No estudo do transcritoma genomics, v.7, p.272, 2006. Disponvel em: <http://
de plntulas de arabidopsis, ANDREAS et al. (2007) www.biomedcentral.com/1471-2164/7/272>. Acesso em: 5 jun.
2009. doi:10.1186/1471-2164-7-272.
identificaram 16.000 novos ESTs ainda no
caracterizados no dbESTs dos quais pelo menos 60 CLOONAN, N. et al. Stem cell transcriptome profiling via
representam genes ainda no anotados, conferindo massive-scale mRNA sequencing. Nature methods, v.5, n.7,
maior confiabilidade aos dados principalmente com p.613-619, 2008. Disponvel em: <http://www.nature.com/
nmeth/journal/v5/n7/abs/nmeth.1223.html>. Acesso em: 5 jun.
relao quantificao dos nveis de expresso gnica, 2009. doi:10.1038/nmeth.1223.
os quais dependem muito do efeito de amostragem.
Um exemplo interessante do efeito de DURFEE, T. et al. The complete genome sequence of Escherichia
coli DH10B: insights into the biology of a laboratory workhorse.
amostragem apresentado no estudo do transcritoma
Journal of bacteriology, v.190, n.7, p. 2597-2606, 2008.
de S. cerevisae com a plataforma Solexa Disponvel em: <http://www.ncbi.nlm.nih.gov/pmc/articles/
(NAGALAKSHMI et al., 2008). Um total de 66 ntrons PMC2293198/?tool= pubmed>. Acesso em: 5 jun. 2009. doi:
previamente identificados foram encontrados entre as 10.1128/JB.01695-07.
sequncias expressas na levedura, alguns dos quais EMRICH, S.J. et al. Gene discovery and annotation using LCM-
foram to expressos quanto seus xons adjacentes. 454 transcriptome sequencing. Genome research, v.17, n.1,
p.69-73, 2007. Disponvel em: <http://www.ncbi.nlm.nih.gov/
pmc/articles/PMC1716268/?tool=pubmed>. Acesso em: 5 jun.
CONCLUSES 2009. doi: 10.1101/gr.5145806.

As novas plataformas de sequenciamento FEDURCO, M. et al. BTA, a novel reagent for DNA attachment
on glass and efficient generation of solid-phase amplified DNA
apresentam a grande vantagem de permitir um colonies. Nucleic acids research, v.34, n.3, p.e22, 2006.
sequenciamento altamente representativo de genomas Disponvel em: <http://www.ncbi.nlm.nih.gov/pmc/articles/
PMC1363783/?tool= pubmed>. Acesso em: 5 jun. 2009. doi:
e/ou transcritomas em um nico passo, o que
10.1093/nar/gnj023.
extremamente relevante, em razo da grande reduo
de custo alcanada com essas metodologias. Seu PASSALACQUA, K.D. et al. Structure and complexity of a
bacterial Transcriptome. Journal of bacteriology, v.191,
emprego tem revolucionado a transcritmica com a n.10, p.3203-3211, 2009. Disponvel em: <http://
gerao de dados altamente reprodutveis e w w w. n c b i . n l m . n i h . g o v / p m c / a r t i c l e s / P M C 2 6 8 7 1 6 5 /
informativos e com preciso na quantificao de ?tool=pubmed>. Acesso em: 5 jun. 2009. doi:10.1128/
JB.00122-09.
transcritos. Em funo do problema da montagem das
leituras curtas produzidas por essas tecnologias, seu MARIONI, J.C. et al. RNA-seq: An assessment of technical
uso na genmica de plantas tem sido direcionado para reproducibility and comparison with gene expression arrays.
Genome research, v. 18, n.9, p.1509-1517, 2008. Disponvel
o sequenciamento dos genomas plastidiais, sequncias am: < http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2527709/
expressas, clones de interesse, ressequenciamento e ?tool=pubmed>. Acesso em: 5 jun. 2009. doi: 10.1101/
gr.079558.108.
deteco de variantes genotpicas. Uma combinao
de alguma dessas tecnologias tecnologia de Sanger MARGULIES, M. et al. Genome sequencing in open
poderia associar o baixo custo e a alta microfabricated high density picoliter reactors. Nature, v.437,
n. 7057, p. 376-380, 2005. Disponvel em: <http://
representatividade da primeira facilidade de montagem www.ncbi.nlm.nih.gov/pmc/articles/PMC1464427/>. Acesso
do genoma da segunda, facilitando seu emprego no em: 5 jun. 2009. doi: 10.1038/nature03959.
sequenciamento genmico de plantas.
MCKERNAN, K. et al. Reagents, methods, and libraries for
bead-based sequencing. US patent application 20080003571,
REFERNCIAS 2006.

ANDREAS, P.M. et al. Sampling the Arabidopsis transcriptome MOORE, M.J. et al. Rapid and accurate pyrosequencing of
with massively parallel pyrosequencing. Plant Physiology, v.144, angiosperm plastid genomes. BMC Plant Biology, v.6, n.1,
p.32-42, 2007. Disponvel em: <http://www.ncbi.nlm.nih.gov/ p.17, 2006. Disponvel em: <http://www.ncbi.nlm.nih.gov/pmc/
pmc/articles/PMC1913805/?tool=pubmed>. Acesso em: 5 jun. articles/PMC1564139/?tool=pubmed>. Acesso em: 5 jun. 2009.
2009. doi: 10.1104/pp.107.096677. doi: 10.1186/1471-2229-6-17.

Cincia Rural, v.40, n.3, mar, 2010.


744 Carvalho & Silva.

NAGALAKSHMI, U. et al. The transcriptional landscape of em: <http://www.nature.com/nmeth/journal/v6/n5/ abs/


the yeast genome defined by RNA sequencing. Science, v. nmeth.1315.html>. Acesso em: 5 jun. 2009. doi:10.1038/
320, p.1344-1349, 2008. Disponvel em: <http:// nmeth.1315.
www.sciencemag.org/cgi/content/full/320/5881/1344>. Acesso
em: 5 jun. 2009. doi: 10.1126/science.1158441. TURCATTI, G. et al. A new class of cleavable fluorescent
nucleotides: synthesis and optimization as reversible terminators
NOVAES, E. et al. High-throughput gene and SNP discovery in for DNA sequencing by synthesis. Nucleic acids research,
Eucalyptus grandis, an uncharacterized genome. BMC v.36, e25, 2008. Disponvel em: <http://www.ncbi.nlm.nih.gov/
genomics, v.9, p.312, 2008. Disponvel em: <http:// pmc/articles/ PMC2275100/?tool=pubmed>. Acesso em: 5 jun.
w w w. n c b i . n l m . n i h . g o v / p m c / a r t i c l e s / P M C 2 4 8 3 7 3 1 / 2009. doi: 10.1093/nar/gkn021.
?tool=pubmed>. Acesso em: 5 jun. 2009. doi: 10.1186/1471-
2164-9-312. WANG, Z. et al. RNA-seq: A revolutionary tool for
transcriptomics. Nature, v. 10, p.57-63, 2009. Disponvel
OSSOWSKI, S. et al. Sequencing of natural strains of Arabidopsis em: <http://www.nature.com/nrg/journal/v10/n1/abs/
thaliana with short reads. Genome research, v.18, p.2024 nrg2484.html>. Acesso em: 5 jun. 2009. doi:10.1038/nrg2484.
2033, 2008. Disponvel em: <http://www.ncbi.nlm.nih.gov/
pmc/articles/PMC2593571/?tool=pubmed>. Acesso em: 5 jun. WEBER, A.P. et al. Sampling the Arabidopsis transcriptome
2009. doi: 10.1101/gr.080200.108. with massively parallel pyrosequencing. Plant physiology,
v.144, n.1, p.32-42, 2007. Disponvel em: <http://
ROCHE 454 SEQUENCING. System features for GS FLX w w w. n c b i . n l m . n i h . g o v / p m c / a r t i c l e s / P M C 1 9 1 3 8 0 5 /
Titatnium series. (November 24, 2008). Disponvel em: <http:/ ?tool=pubmed>. Acesso em: 5 jun. 2009. doi: 10.1104/
/www.454.com/products-solutions/system-features.asp>. Acesso pp.107.096677.
em: 5 jun. 2009.
WICKER, T. et al. 454 sequencing put to the test using the
RONAGHI, M. et al. A sequencing method based on real-time complex genome of barley. BMC genomics, v.7, p.275, 2006.
pyrophosphate. Science, v.281, p.363365, 1998. Disponvel Disponvel em: <http://www.ncbi.nlm.nih.gov/pmc/articles/
em: <http://www.sciencemag.org/cgi/content/full/ 281/5375/ PMC1633745/?tool=pubmed>. Acesso em: 5 jun. 2009. doi:
363>. Acesso em: 5 jun. 2009. doi: 10.1126/ 10.1186/1471-2164-7-275.
science.281.5375.363.
WICKER, T. et al. Low-pass shotgun sequencing of the barley
RONAGHI, M. Pyrosequencing sheds light on DNA sequencing. genome facilitates rapid identification of genes, conserved non-
Genome research, v.11, p.3-11, 2001. Disponvel em: <http:/ coding sequences and novel repeats. BMC genomics, v.9,
/genome.cshlp.org/content/11/1/3.long>. Acesso em: 5 jun. p.518, 2008. Disponvel em: <http://www.ncbi.nlm.nih.gov/
2009. doi: 10.1101/gr.150601. pmc/articles/ PMC2584661/?tool=pubmed>. Acesso em: 5 jun.
2009. doi: 10.1186/1471-2164-9-518.
SHENDURE, J.; JI, H. Next-generation DNA sequencing.
Nature biotechnology, v.26, n.10, p.1135-1145, 2008. WICKER, T. et al. A whole-genome snapshot of 454 sequences
Disponvel em: <http://www.nature.com/nbt/journal/v26/n10/ exposes the composition of the barley genome and provides
abs/ nbt1486.html>. Acesso em: 5 jun. 2009. doi:10.1038/ evidence for parallel evolution of genome size in wheat and
nbt1486. barley. Plant journal, v.59, n.5, p.712-22, 2009. Disponvel
em: <http:// www3.interscience.wiley.com/cgi-bin/fulltext/
TANG, F. et al. mRNA-Seq whole-transcriptome analysis of a 122381633/PDFSTART>. Acesso em: 5 jun. 2009. doi:
single cell. Nature methods, v.6, p.377-382, 2009. Disponvel 10.1111/j.1365-313X.2009.03911.x.

Cincia Rural, v.40, n.3, mar, 2010.

Vous aimerez peut-être aussi