Académique Documents
Professionnel Documents
Culture Documents
Sequenciamento
v.40, n.3,de
p.735-744,
DNA de nova
mar, 2010
gerao e suas aplicaes na genmica de plantas. 735
ISSN 0103-8478
- REVISO BIBLIOGRFICA -
RESUMO INTRODUO
Recebido para publicao 23.03.09 Aprovado em 09.11.09 Cincia Rural, v.40, n.3, mar, 2010.
736 Carvalho & Silva.
O sistema requer que o DNA seja o sinal de luz emitido pode ser diretamente utilizado
mecanicamente fragmentado em sequncias de 300 como informao de sequncia (RONAGHI, 2001).
800pb, transformado em fragmentos abruptos Os fragmentos sequenciados nessa
fosforilados e ligado a adaptadores de sequncia plataforma passam por sistemas de anlise de qualidade
especfica (Figura 1). A biblioteca de DNA da amostra em que sequncias distintas oriundas do
ligada a adaptadores A e B nas extremidades 3 e 5 dos sequenciamento de uma nica microesfera so
fragmentos, respectivamente, os quais so utilizados eliminadas, bem como as leituras em que a sequncia
nas etapas posteriores de isolamento dos fragmentos inicial TCGA (quatro primeiros nucleotdeos dos
(A-B) e amplificao e nas reaes de sequenciamento.
adaptadores) no aparece. As leituras produzidas
O adaptador B possui biotina ligada extremidade 5, o
possuem geralmente cerca de 250pb, o que representa
que permite o isolamento dos fragmentos ligados ao
um comprimento de leitura muito menor que o produzido
adaptador A na extremidade 3 e adaptador B na
extremidade 5 na amostra. Somente os fragmentos A- pelo sistema de Sanger (~700pb). A Roche divulgou
B so eludos na reao de purificao e so recentemente o lanamento da srie Titanium de
especificamente ligados s microesferas que carregam pirosequenciamento, em que leituras maiores que 400pb
vrias cpias da sequncia complementar exata ao so conseguidas. Esse aprimoramento das leituras
adaptador B de um nico fragmento (MARGULIES et advm de otimizaes nas reaes qumicas do
al., 2005). O outro adaptador utilizado no anelamento pirosequenciamento, as quais reduzem o rudo de fundo
do primer que inicia a reao de sequenciamento. As e aumentam o nmero de leituras por corrida, e do novo
microesferas ligadas aos fragmentos nicos de fita desenho do suporte de sequenciamento
simples so ento emulsionadas em uma mistura de (PicoTiterPlate), o qual agregou duas mudanas
gua e leo com reagentes de PCR para amplificao principais: o uso de uma estrutura metlica, permitindo
clonal do fragmento fita simples em cerca de 1 milho leituras mais acuradas, e esferas ainda menores,
de cpias. Na PCR em emulso, o leo em soluo aumentando, tanto o tamanho das leituras, quanto o
aquosa forma micelas, nas quais as microesferas so nmero de leituras por corrida (ROCHE, 2008). O maior
capturadas. Cada micela funcionar como um tamanho das leituras e a grande capacidade de gerar
microrreator, produzindo muitas cpias idnticas de um informao tornam o processo de montagem mais fcil
mesmo fragmento isoladamente em um microssuporte num projeto de sequenciamento de novo
(DRESSMAN ET AL., 2003). (sequenciamento de genomas desconhecidos) e
Aps a PCR de emulso, as microesferas permite trabalhar com coberturas genmicas mais
ligadas aos fragmentos de fita simples so depositadas amplas, favorecendo o processo de montagem. Alm
em poos distintos em uma placa de slica onde os disso, pelo fato de no envolver clonagem bacteriana,
reagentes para o sequenciamento so distribudos. As a representao do genoma bem mais fiel, de forma
reaes de sequenciamento ocorrem em cada poo, que sequncias difceis de clonar e manter em
para um nico tipo de fragmento ligado microesfera, bibliotecas genmicas podem ser acessadas.
no havendo, portanto, competio por reagentes com Genomas pequenos, como os de bactrias e
outros fragmentos da biblioteca. A placa de de alguns eucariotos, podem ser facilmente montados
sequenciamento dividida em 1,6 milhes de poos usando a plataforma 454. Com relao s demais
com dimetro suficiente para alojar uma nica tecnologias de sequenciamento da segunda gerao,
microesfera (Figura 1). a plataforma 454 a que produz as maiores leituras e
A placa de sequenciamento inserida junto por isso tem sido mais utilizada, inclusive para o
ao sistema ptico de leitura no equipamento. Os sequenciamento de genomas eucariotos (WICKER et
reagentes e as solues de sequenciamento so ento al., 2009). Outra limitao importante da plataforma 454
distribudos por toda a placa a cada ciclo para obteno a baixa eficincia na determinao de homopolmeros.
do sequenciamento paralelo dos 1,6 milhes de poos. Como a intensidade do sinal de fluorescncia relaciona-
O sequenciamento realizado em ciclos, e a cada ciclo se ao nmero de vezes que um determinado nucleotdeo
um tipo determinado de nucleotdeo adicionado foi incorporado sequncia, a determinao precisa
reao. Se o nucleotdeo adicionado for incorporado de sequncias em que um nico nucleotdeo repetido
sequncia em sntese, um sinal de luz emitido, sendo mais de trs vezes torna-se imprecisa. O custo do
a intensidade desse sinal um reflexo do nmero de sequenciamento com essa plataforma superior ao
nucleotdeos desse tipo especfico que foram custo das plataformas Solexa e SOLiD (Tabela 1), mas,
sucessivamente incorporados na molcula. Como o nos casos em que a produo de leituras maiores
nucleotdeo que adicionado a cada ciclo conhecido, necessria, a plataforma 454 deve ser a melhor opo.
Tabela 1 - Resumo das principais caractersticas tcnicas das plataformas 454 GS-FLX, Solexa e SOLiD e laboratrios no Brasil que j
adquiriram essas novas plataformas. A durao da corrida inclui o tempo para o preparo, a leitura e o processamento das
amostras; o custo da corrida e o valor do equipamento so fornecidos na capacidade mxima do equipamento.
--------------------Corrida------------------- --------------Custo--------------
Plataforma Acurcia (%) Laboratrio**
Informao Equipamento
Durao (dias) Reads (pb) Base (U$)
(Gb) (U$)
- LNCC
GS-FLX Titanium 0,5 3a4 At 400 531.500 10.000 99,5
- IQ-USP
Genome analyzer
3 5 25-35 430.000 6.250 98,5 - Nenhum
(Solexa)
- Fiocruz
SOLiD System 25 4-12 35-50 599.000 10.000 99 - Instituto Ludwig
- UFPA
Figura 3 - Plataforma SOLiD. Os fragmentos de DNA so gerados e ligados ao adaptador P1 que se liga especificamente a uma
microesfera. O sequenciamento ocorre por hibridizao de sondas fluorescentes com o alvo em cinco etapas distintas.
Na primeira etapa, o primer (n) utilizado, liberando as primeiras bases da sequncia alvo para hibridizao com a
sonda. Uma das sondas do pool encontrar similaridade ao alvo ligando-se a ele. O sinal de fluorescncia lido, e as trs
ltimas bases da sonda, incluindo o fluorforo, so removidas. Inicia-se o segundo ciclo de hibridizao e assim
sucessivamente, at que o alvo seja todo coberto (35pb). A sequncia fita dupla desnaturada, e uma nova etapa de
sequenciamento iniciada com o primer (n-1). Os ciclos de hibridizao so repetidos, fornecendo informao de
outras bases da sequncia alvo. Novas etapas de sequenciamento com os primers (n-2), (n-3), e (n-4) so realizadas para
que toda a sequncia alvo seja determinada. Todas as combinaes possveis de dinucleotdeos so marcadas nas sondas
com apenas quatro fluorforos. Assim, duas leituras so necessrias de cada base para que a sequncia do dinucleotdeo
da sonda seja resolvida. Esse processo inicia-se com a identificao da primeira base do alvo na segunda etapa de
sequenciamento (primer n-1), que libera para hibridizao com a sonda uma base j conhecida, a ltima base do
adaptador.
haploide) foi tambm sequenciada em uma nica corrida genes de interesse. J com o sequenciamento livre de
utilizando leituras ainda menores produzidas com a clonagem bacteriana, genes de clulas especficas
plataforma Solexa (WICKER et al., 2008). Muito podem ser facilmente identificados, como realizado para
importante nesse trabalho foi o desenvolvimento de as clulas meristemticas apicais do milho, que
um ndice matemtico para predio e excluso de compem apenas uma poro do pice da planta. Um
regies repetitivas. A aplicao desse ndice total de 400 novos genes foi identificado em uma nica
possibilitou a montagem de 5.500Mb do genoma da corrida na plataforma 454, sendo a maior parte deles
cevada e a identificao de regies desconhecidas. genes especificamente expressos nesse tecido
O problema de gaps em regies de (EMRICH et al., 2007).
homopolmeros foi relatado tambm no sequenciamento O ressequenciamento genmico em plantas
dos genomas plastidiais de Nandina e Platanus com tambm muito informativo para estudos de
as plataformas 454 e Solexa (MOORE et al., 2006). polimorfismo. Indivduos variantes de arabidopsis
Apesar disso, uma reduo considervel de custo foram sequenciados utilizando a plataforma Solexa para
(~$4.500 por genoma) e tempo (~2 semanas para buscar variaes genotpicas (OSSOWSKI et al., 2008).
finalizao dos dois genomas) foi conseguida utilizando A montagem das leituras curtas da plataforma Solexa
o sistema GS20 de pirosequenciamento para sequenciar foi auxiliada pela informao genmica disponvel para
99,75% de tais genomas. arabidopsis, e o sequenciamento de pequena cobertura
Um dos trabalhos que melhor ilustra o (11 vezes em uma nica corrida) utilizado nesse
potencial das novas plataformas de sequenciamento trabalho foi suficiente para deteco de delees,
foi o conduzido com o eucalipto (NOVAES et al., 2008), duplicaes e de SNPs com uma especificidade de 99%.
espcie para a qual pouca informao genmica A plataforma 454 foi tambm utilizada com sucesso na
disponvel. Nesse trabalho, 148,4Mb de ESTs de vrios identificao de SNPs em transcritos das clulas
gentipos e tecidos foram sequenciados com a meristemticas apicais de milho. Em uma nica corrida,
plataforma 454, gerando um nmero maior de genes do foi possvel identificar cerca de cinco mil SNPs vlidos
que o gerado por sequenciamento convencional, 23.742 entre os 2.472 genes identificados (BARBAZUK et al.,
SNPs altamente confiveis e, muito importante, o 2007).
enriquecimento de 37 vezes nas sequncias de ESTs As novas plataformas de sequenciamento,
disponveis para o eucalipto nos bancos de dados em um futuro bem prximo, revolucionaro o
pblicos. O sequenciamento de ESTs representa conhecimento sobre o genoma das plantas,
certamente uma estratgia de sucesso para obteno principalmente no que concerne ao estudo de variantes
de informao genmica das plantas a partir das novas allicas, SNPs, ao desenvolvimento de marcadores para
plataformas de sequenciamento. Ele reduz os problemas seleo assistida e clonagem baseada em mapeamento,
de montagem associados s leituras curtas (EMRICH representando uma importante ferramenta no
et al., 2007) e pode ser ainda mais informativo, uma vez melhoramento vegetal. Essa revoluo ser possvel
que mais informao produzida e sequncias de baixa com o avano tecnolgico das prprias plataformas de
expresso so tambm amostradas (no h efeito de sequenciamento, produzindo leituras maiores, avano
clonagem bacteriana). Alm disso, o custo do das ferramentas de anlise de leituras curtas e
sequenciamento de ESTs menor com as novas montagem de sequncias.
plataformas de sequenciamento, uma vez que no O que parece estar cada vez mais evidente
depende da construo de bibliotecas de cDNA para , na verdade, o potencial de uso imediato dessas
cada um dos tecidos amostrados. Alm do banco de tecnologias na genmica funcional com o estudo de
ESTs do eucalipto, os bancos de milho (EMRICH et al., transcritomas que vo desde organismos completos
2007), Medicago sp (CHEUNG et al., 2006) e arabidopsis at clulas individuais (ANDREAS et al., 2007; TANG
(WEBER et al., 2007) tambm esto sendo enriquecidos et al. 2009). Todas as plataformas de sequenciamento
com o pirosequenciamento. da segunda gerao podem ser utilizadas no
O potencial de identificao de novos genes sequenciamento de transcritomas ou RNA-seq. A maior
com os novos sistemas de sequenciamento parte dos estudos de transcritmica em plantas
especialmente importante quando se deseja conhecer realizada utilizando os microarranjos de DNA, os quais,
genes funcionais em tipos celulares restritos. Nesses alm de depender de um conhecimento genmico prvio
casos, utilizando os mtodos convencionais de e de serem influenciados pelo elevado rudo de fundo,
sequenciamento, um grande nmero de bibliotecas possuem ainda uma faixa de deteco de expresso
deve ser construdo e muitos ESTs devem ser limitada quando comparada s novas plataformas de
sequenciados para maximizar a chance de encontrar os sequenciamento (~100 vezes versus 9.000 vezes)
(MARIONI et al., 2008; WANG et al., 2009). O grande BARBAZUK, W.B. et al. SNP discovery via 454 transcriptome
sequencing. The plant journal, v.51, p.910-918, 2007.
sucesso das novas tecnologias na transcritmica se
Disponvel em: <http://www.ncbi.nlm.nih.gov/ pmc/articles/
deve tambm ao fato de que estas possibilitam a PMC2169515/?tool=pubmed>. Acesso em: 5 jun. 2009. doi:
superao de uma das maiores limitaes dos projetos 10.1111/j.1365-313X.2007.03193.x.
ESTs a brusca reduo no nmero de sequncias
CHEUNG, F. et al. Sequencing Medicago trunculata expressed
novas amostradas com o aumento na quantidade de sequenced tags using 454 Life Sciences technology. BMC
informao sequenciada. No estudo do transcritoma genomics, v.7, p.272, 2006. Disponvel em: <http://
de plntulas de arabidopsis, ANDREAS et al. (2007) www.biomedcentral.com/1471-2164/7/272>. Acesso em: 5 jun.
2009. doi:10.1186/1471-2164-7-272.
identificaram 16.000 novos ESTs ainda no
caracterizados no dbESTs dos quais pelo menos 60 CLOONAN, N. et al. Stem cell transcriptome profiling via
representam genes ainda no anotados, conferindo massive-scale mRNA sequencing. Nature methods, v.5, n.7,
maior confiabilidade aos dados principalmente com p.613-619, 2008. Disponvel em: <http://www.nature.com/
nmeth/journal/v5/n7/abs/nmeth.1223.html>. Acesso em: 5 jun.
relao quantificao dos nveis de expresso gnica, 2009. doi:10.1038/nmeth.1223.
os quais dependem muito do efeito de amostragem.
Um exemplo interessante do efeito de DURFEE, T. et al. The complete genome sequence of Escherichia
coli DH10B: insights into the biology of a laboratory workhorse.
amostragem apresentado no estudo do transcritoma
Journal of bacteriology, v.190, n.7, p. 2597-2606, 2008.
de S. cerevisae com a plataforma Solexa Disponvel em: <http://www.ncbi.nlm.nih.gov/pmc/articles/
(NAGALAKSHMI et al., 2008). Um total de 66 ntrons PMC2293198/?tool= pubmed>. Acesso em: 5 jun. 2009. doi:
previamente identificados foram encontrados entre as 10.1128/JB.01695-07.
sequncias expressas na levedura, alguns dos quais EMRICH, S.J. et al. Gene discovery and annotation using LCM-
foram to expressos quanto seus xons adjacentes. 454 transcriptome sequencing. Genome research, v.17, n.1,
p.69-73, 2007. Disponvel em: <http://www.ncbi.nlm.nih.gov/
pmc/articles/PMC1716268/?tool=pubmed>. Acesso em: 5 jun.
CONCLUSES 2009. doi: 10.1101/gr.5145806.
As novas plataformas de sequenciamento FEDURCO, M. et al. BTA, a novel reagent for DNA attachment
on glass and efficient generation of solid-phase amplified DNA
apresentam a grande vantagem de permitir um colonies. Nucleic acids research, v.34, n.3, p.e22, 2006.
sequenciamento altamente representativo de genomas Disponvel em: <http://www.ncbi.nlm.nih.gov/pmc/articles/
PMC1363783/?tool= pubmed>. Acesso em: 5 jun. 2009. doi:
e/ou transcritomas em um nico passo, o que
10.1093/nar/gnj023.
extremamente relevante, em razo da grande reduo
de custo alcanada com essas metodologias. Seu PASSALACQUA, K.D. et al. Structure and complexity of a
bacterial Transcriptome. Journal of bacteriology, v.191,
emprego tem revolucionado a transcritmica com a n.10, p.3203-3211, 2009. Disponvel em: <http://
gerao de dados altamente reprodutveis e w w w. n c b i . n l m . n i h . g o v / p m c / a r t i c l e s / P M C 2 6 8 7 1 6 5 /
informativos e com preciso na quantificao de ?tool=pubmed>. Acesso em: 5 jun. 2009. doi:10.1128/
JB.00122-09.
transcritos. Em funo do problema da montagem das
leituras curtas produzidas por essas tecnologias, seu MARIONI, J.C. et al. RNA-seq: An assessment of technical
uso na genmica de plantas tem sido direcionado para reproducibility and comparison with gene expression arrays.
Genome research, v. 18, n.9, p.1509-1517, 2008. Disponvel
o sequenciamento dos genomas plastidiais, sequncias am: < http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2527709/
expressas, clones de interesse, ressequenciamento e ?tool=pubmed>. Acesso em: 5 jun. 2009. doi: 10.1101/
gr.079558.108.
deteco de variantes genotpicas. Uma combinao
de alguma dessas tecnologias tecnologia de Sanger MARGULIES, M. et al. Genome sequencing in open
poderia associar o baixo custo e a alta microfabricated high density picoliter reactors. Nature, v.437,
n. 7057, p. 376-380, 2005. Disponvel em: <http://
representatividade da primeira facilidade de montagem www.ncbi.nlm.nih.gov/pmc/articles/PMC1464427/>. Acesso
do genoma da segunda, facilitando seu emprego no em: 5 jun. 2009. doi: 10.1038/nature03959.
sequenciamento genmico de plantas.
MCKERNAN, K. et al. Reagents, methods, and libraries for
bead-based sequencing. US patent application 20080003571,
REFERNCIAS 2006.
ANDREAS, P.M. et al. Sampling the Arabidopsis transcriptome MOORE, M.J. et al. Rapid and accurate pyrosequencing of
with massively parallel pyrosequencing. Plant Physiology, v.144, angiosperm plastid genomes. BMC Plant Biology, v.6, n.1,
p.32-42, 2007. Disponvel em: <http://www.ncbi.nlm.nih.gov/ p.17, 2006. Disponvel em: <http://www.ncbi.nlm.nih.gov/pmc/
pmc/articles/PMC1913805/?tool=pubmed>. Acesso em: 5 jun. articles/PMC1564139/?tool=pubmed>. Acesso em: 5 jun. 2009.
2009. doi: 10.1104/pp.107.096677. doi: 10.1186/1471-2229-6-17.