Académique Documents
Professionnel Documents
Culture Documents
"Este ejercicio ha sido adaptado para el curso a partir del ejercicio elaborado por David J. Edwards,
Kathryn E. Holt, incluido en el artculo adicional 1 del artculo cientfico titulado Beginners guide
to comparative bacterial genome analysis using next-generation sequence data,
publicado en el journal Microbial Informatics and Experimentation 2013, 3:2".
Antes de tratar de armar un conjunto reads, es una buena prctica examinar los reads para ver si
son de buena calidad. Un paquete fcil de instalar y ejecutar para examinar es el FastQC.
Sitio web: Descargue e instale FastQC de
http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
La pgina web tambin cuenta con ejemplos de buena y mala calidad de reads para un nmero de
plataformas de secuenciamiento.
Input: archivos de secuencia, Fordward y Reverse de los reads (formato FASTQ)
Instrucciones: Una vez FastQC se ha instalado, abra el programa para comenzar. Entonces:
1. Para seleccionar la secuencia de archivos a comprobar, vamos a " File > Open " en el men
FastQC. Navegue a la carpeta en donde guardamos los reads de TY - 2482 y seleccionemos
el archivo 'SRR292770_1.fastq.gz'.
Cuando el anlisis haya finalizado, se les presentar con una serie de informes sobre las
secuencias. Seleccione 'Per base de la calidad de la secuencia 'Per base sequence quality'.
Se debe obtener este grfico:
Instrucciones:
The Velvet es un programa de ensamblaje de novo que se instal con un 'MAXKMERLENGTH' fij en
101 pb (hacer 'MAXKMERLENGTH=101') - vase el manual para ms detalles. Tenga en cuenta que
un mximo k-mer de 41 ser suficiente para este ejercicio, pero k-mers ms largos se requieren
cuando se trabaja con reads generados por HiSeq y MiSeq (que ahora son tpicamente > 100 pb).
Nota Tambin tendr que aadir el directorio ruta ($PATH=), o utilizar la ruta completa de los
ejecutables 'velvetg' y 'Velveth' en las lneas de comandos descritas ms adelantes.
1. Abra una sesin de terminal y cambie al directorio en el que se contienen los archivos
SRR292770:
cd Ensamblaje
Esto tomar ~1-2 minutos y se producir una tabla hash de reads utilizando el k-mer de
longitud especificado (k = 35), guardados en la carpeta 'Out_data_35'.
3. El siguiente paso del Velvet es ejecutar velvetg para construir el grfico.
velvetg out_data_35 -clean yes -exp_cov 21 -cov_cutoff
2.81 -min_contig_lgth 200
A continuacin, puede eliminar la carpeta de salida "fuera - de datos - 35 ', aunque es posible
que desee guardar o ver el archivo de estadsticas, 'stats.txt ', antes de hacerlo.
Mientras que proporcionamos valores "ptimos" para las tres opciones de Velvet (kmer=35, la cobertura esperada=20, la cobertura de corte de 2,81), estos se pueden cambiar
para examinar cmo cada uno afecta a los contigs producidos.
Nota: se puede volver a ejecutar el comando slo velvetg con nuevos valores si est
variando slo los dos ltimos y mantener el k-mer constante para mantener la carpeta de
salida de Velvet entre las corridas de velvetg.
7. Haga clic en "Align... para ejecutar la alineacin. Esto puede tardar una media hora ms
o menos. Una nueva ventana debe aparecer la indicacin Mauve Console, donde se
mostrar el progreso de la ejecucin, incluyendo cualquier mensaje de error.
Si encuentra errores, compruebe que ha especificado los archivos correctos para los
inputs - todos ellos deben ser fasta o mltiples-archivos de secuencias FASTA, y pueden
incluir hasta un genoma en formato GenBank (para proporcionar una anotacin).
8. Una vez finalizada la alineacin, aparecer la herramienta de visualizacin. Para
simplificar la imagen un poco, seleccione View Style uncheck LCB connecting
lines. Se debe tener este aspecto: