Bienvenue sur Scribd !

Workflow

Transféré par

100% ont trouvé ce document utile (2 votes)

31 vues2 pages

This document discusses the annotation and BLAST databases that will be produced for Project X. It describes 7 BLAST databases that will be generated from the project's reads, CDS, predicted proteins, and assemblies. It also provides guidelines for annotating reads, contigs, scaffolds and discussing what predicted proteins should be included in protein clusters. Finally, it discusses updating databases with a new termite gut metagenome project.

Description originale:

Copyright

Formats disponibles

DOC, PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Attribution Non-Commercial (BY-NC)

Formats disponibles

Téléchargez comme DOC, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

100% ont trouvé ce document utile (2 votes)

31 vues2 pages

Workflow

Transféré par

api-3855529

Droits d'auteur :

Attribution Non-Commercial (BY-NC)

Formats disponibles

Téléchargez comme DOC, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 2

Rechercher à l'intérieur du document

For project X - We get reads/assemblies (contigs/genome scaffolds) from genbank/Trace -

CDS and Proteins and ncRNAs are predicted from all these datasets.

For download from the publication page - we ONLY provide these Genbank-derived
datasets AND user-provided annotated data (if any), and other custom datasets provided
by the authors

For BLAST db, we produce

• (1) ProjectX: reads

• (2) Project X: CDS from reads
• (3) ProjectX : predicted Proteins from reads
• (4) Project X: Assemblies
• (5) Project X: CDS from Assemblies
• (6) ProjectX: Predicted proteins from Assemblies
• (7) Project X: ncRNAs
• We UPDATE : All metagenomics reads, All metagenomic CDS, ALL metagenomic
predicted proteins, and ALL metagenomic ncRNAs (NOTE here: I'm assuming that
this new annotation pipeline is doing something more sophisticated and
generating CDS and Predicted proteins as opposed to the 6-frame translation
ORFs and peptides we have now for GOS and HOT, if yes, we'll have to run the
GOS and HOT data through this pipeline as well and replace those datasets with
CDS and proteins)

Annotation
• All reads available (either via Genbank or the Trace Archive) that are longer than 250bp
on avg should be annotated - How well does the pipeline work for such short seqs? How
well does it work for Sanger seqs for that matter? What is the relative utility ? What to do
with ESTs? GSS?
• If annotation is available in Genbank, it should be retrieved and discussed - not available,
one exception is Leptospirillum assemly from AMD - 8 genome scaffold sequences with
predicted proteins have been deposited as a separate project from the metagenomic
projects.
• If an environmental dataset has scaffolds for organisms deposited in Genbank, should we
treat it like an organism? LIke an environmental set? As an environmnental set I think.
Depends on whether this data makes it into Genbank NR (and hence CAMERA nIAA) or not.
• Can we annotate contigs/scaffolds via our metagenomic annotation pipeline? Or should
we be using the prok pipeline?
• Which predicted proteins should be included in clusters?

Blastable Datasets
• reads should be added to All Metagenomic reads, same for ORFs, Peptides, ncRNAs
• Contigs and assemblies should be added to "All Metagenomic Assemblies" , no such db
presently since GOS is the only one with assemblies, when/if we DO provide this, it
should only contain "site-specific" assemblies.
• If available, mapping between reads and contigs should be absorbed

New datsets:
Only one new (CAMERA-relevant-maybe) project is available for update: Termite gut
metagenome - No traces deposited , data is 1337 fosmid clone seqs, and 1 WGS
entry (55,108 contigs) and 48 glycoside hydrolase family genes. Contacted JGI about
the
traces. http://www.ncbi.nlm.nih.gov/sites/entrez?db=genomeprj&cmd=Retrieve&dopt=Ove
rview&list_uids=19107?

Vous aimerez peut-être aussi

BLAST Guide
Document20 pages
BLAST Guide
Abdul Qadir
Pas encore d'évaluation
BLAST Program Selection Guide
Document20 pages
BLAST Program Selection Guide
Samarth Agarwal
Pas encore d'évaluation
Next Generation Sequencing
Document70 pages
Next Generation Sequencing
ARUN KUMAR
Pas encore d'évaluation
About Basic Local Alignment Search Tool
Document17 pages
About Basic Local Alignment Search Tool
saswati01
Pas encore d'évaluation
Next Generation Sequencing (NGS) - FAQS
Document9 pages
Next Generation Sequencing (NGS) - FAQS
hesham12345
Pas encore d'évaluation
FastQC TutorialAndFAQ
Document8 pages
FastQC TutorialAndFAQ
shail
Pas encore d'évaluation
Blast
Document21 pages
Blast
Sathish Kumar
Pas encore d'évaluation
Hoskins 2007
Document41 pages
Hoskins 2007
laciyeg352
Pas encore d'évaluation
AdamAmeur SciLife Bioinfo Course Nov2015
Document57 pages
AdamAmeur SciLife Bioinfo Course Nov2015
risa tri umami
Pas encore d'évaluation
Bioinformatics: ABE 2007 Kent Koster Group 3
Document43 pages
Bioinformatics: ABE 2007 Kent Koster Group 3
BUNDATIE
Pas encore d'évaluation
Unit 6 - Bioinformatics
Document41 pages
Unit 6 - Bioinformatics
Leon
Pas encore d'évaluation
Rnaseq and Chip-Seq Principles: A) Quantifying Against A Genome
Document7 pages
Rnaseq and Chip-Seq Principles: A) Quantifying Against A Genome
hesham12345
Pas encore d'évaluation
Same Nva Tting
Document22 pages
Same Nva Tting
Axelle Dupon
Pas encore d'évaluation
Factsheet: Eukaryotic Genome Annotation
Document2 pages
Factsheet: Eukaryotic Genome Annotation
thor888888
Pas encore d'évaluation
Software: Next-Generation Sequence Alignment Software
Document3 pages
Software: Next-Generation Sequence Alignment Software
dj tarp
Pas encore d'évaluation
Bioinformatics Day 5
Document6 pages
Bioinformatics Day 5
Aby Mathew
Pas encore d'évaluation
Illumina Idt Glossary 070 2017 019
Document8 pages
Illumina Idt Glossary 070 2017 019
Pratiksha
Pas encore d'évaluation
CRISPR 101 Ebook Final
Document125 pages
CRISPR 101 Ebook Final
xavikxavik
100% (3)
In Silico Genome Analysis-Inderjit (SoAB)
Document5 pages
In Silico Genome Analysis-Inderjit (SoAB)
tango0385
Pas encore d'évaluation
Bioinformatics Database and Applications
Document82 pages
Bioinformatics Database and Applications
Rekha Singh
100% (2)
Application Note - Whole Genome
Document3 pages
Application Note - Whole Genome
Raxter Er
Pas encore d'évaluation
Peerj 520 2 Rebuttal 1
Document7 pages
Peerj 520 2 Rebuttal 1
Alban Kuriqi
Pas encore d'évaluation
Package Biglasso': R Topics Documented
Document21 pages
Package Biglasso': R Topics Documented
nfbeusebio3962
Pas encore d'évaluation
GlOsario Bioinformatica
Document5 pages
GlOsario Bioinformatica
cristianojpp
Pas encore d'évaluation
Bioinformatics Pratical File
Document63 pages
Bioinformatics Pratical File
Sudheshna
Pas encore d'évaluation
Accessing Bibliographic Databases
Document25 pages
Accessing Bibliographic Databases
Nischith Rk
Pas encore d'évaluation
Agbt2012 Poster Final1.4 1
Document1 page
Agbt2012 Poster Final1.4 1
nav3700
Pas encore d'évaluation
pyPRADA 1.2 Manual
Document27 pages
pyPRADA 1.2 Manual
John Saxx
Pas encore d'évaluation
02 NGS Considerations
Document10 pages
02 NGS Considerations
Dethleff90
Pas encore d'évaluation
FPGA Based Parallel Computation Techniques For Bioinformatics Applications
Document5 pages
FPGA Based Parallel Computation Techniques For Bioinformatics Applications
Hugo Vinícius
Pas encore d'évaluation
Bs982 l08 Basic Blast
Document38 pages
Bs982 l08 Basic Blast
Narges Miri
Pas encore d'évaluation
Assembly of Large Genomes Using Second-Generation Sequencing
Document10 pages
Assembly of Large Genomes Using Second-Generation Sequencing
amar
Pas encore d'évaluation
Research Article: RECORD: Reference-Assisted Genome Assembly For Closely Related Genomes
Document10 pages
Research Article: RECORD: Reference-Assisted Genome Assembly For Closely Related Genomes
Gopal G
Pas encore d'évaluation
Genomic Library - Hongming Lam
Document72 pages
Genomic Library - Hongming Lam
Yixuan Zhu
Pas encore d'évaluation
Towards Error-Free, Gapless, Chromosome Scale, Haplotype Assemblies
Document27 pages
Towards Error-Free, Gapless, Chromosome Scale, Haplotype Assemblies
Tahir Ali
Pas encore d'évaluation
Open Source Proteomics Software
Document49 pages
Open Source Proteomics Software
ken tsai
Pas encore d'évaluation
Bioinformatics Tools For Nucleotide Sequence Analysis and Database Exploration
Document75 pages
Bioinformatics Tools For Nucleotide Sequence Analysis and Database Exploration
varijnayan1
Pas encore d'évaluation
HISAT2
Document35 pages
HISAT2
Jelena Nađ
100% (1)
SHARP
Document10 pages
SHARP
Shaban Ahmad
Pas encore d'évaluation
Construction of Genomic Library
Document16 pages
Construction of Genomic Library
sivagurunathan.P
80% (5)
Information Sciences: Doina Bucur
Document16 pages
Information Sciences: Doina Bucur
jkl316
Pas encore d'évaluation
Gene Expression RNA Sequence
Document120 pages
Gene Expression RNA Sequence
Mutsawashe Munetsi
Pas encore d'évaluation
GS FLX System Research Aplications Guide
Document20 pages
GS FLX System Research Aplications Guide
Juan Gomez
Pas encore d'évaluation
DNA Sequencing: Present Status and Future Challenges: Elaine Mardis Washington University Genome Sequencing Center
Document26 pages
DNA Sequencing: Present Status and Future Challenges: Elaine Mardis Washington University Genome Sequencing Center
m224550
Pas encore d'évaluation
Genome Res.-2004-Pop-149-59
Document12 pages
Genome Res.-2004-Pop-149-59
Loredana Veronica Zalischi
Pas encore d'évaluation
Database Dalam Bioinformatika
Document34 pages
Database Dalam Bioinformatika
Alda Ciptaningrum
Pas encore d'évaluation
Biological Databases Pharmamatrix Workshop 2010: - Philip - Ishwar V. Hosamani
Document28 pages
Biological Databases Pharmamatrix Workshop 2010: - Philip - Ishwar V. Hosamani
tri sutriani
Pas encore d'évaluation
Journal Pone 0081760
Document12 pages
Journal Pone 0081760
Indra Prakash Jha
Pas encore d'évaluation
Bioinformatics:: Guide To Bio-Computing and The Internet
Document34 pages
Bioinformatics:: Guide To Bio-Computing and The Internet
Zoran Bogoeski
Pas encore d'évaluation
Scaffolder - Software For Manual Genome Scaffolding: Article
Document7 pages
Scaffolder - Software For Manual Genome Scaffolding: Article
Ana Carolina Matiussi
Pas encore d'évaluation
FASTA
Document4 pages
FASTA
Dhakshayani G
Pas encore d'évaluation
Unit Iii
Document27 pages
Unit Iii
Dr. R. K. Selvakesavan PSGRKCW
Pas encore d'évaluation
KB File
Document18 pages
KB File
Kaushik Banik
Pas encore d'évaluation
2022 12 23 521809v1 Full
Document25 pages
2022 12 23 521809v1 Full
lbqurtfts
Pas encore d'évaluation
Metodi Bioinformatici Per L'analisi Del Genoma Umano
Document148 pages
Metodi Bioinformatici Per L'analisi Del Genoma Umano
paretini01
Pas encore d'évaluation
Next Generation Sequencing and Sequence Assembly: Methodologies and Algorithms
D'Everand
Next Generation Sequencing and Sequence Assembly: Methodologies and Algorithms
Ali Masoudi-Nejad
Pas encore d'évaluation
Introduction to Bioinformatics Using Action Labs
D'Everand
Introduction to Bioinformatics Using Action Labs
Jean-Louis Lassez
Pas encore d'évaluation
Large Scale Machine Learning with Python
D'Everand
Large Scale Machine Learning with Python
Bastiaan Sjardin
Évaluation : 2 sur 5 étoiles
2/5 (1)
Mastering Parallel Programming with R
D'Everand
Mastering Parallel Programming with R
Simon R. Chapple
Pas encore d'évaluation
Gene Expression Programming: Fundamentals and Applications
D'Everand
Gene Expression Programming: Fundamentals and Applications
Fouad Sabry
Pas encore d'évaluation
Arithmetic Progressons (Part-1)
Document16 pages
Arithmetic Progressons (Part-1)
shambhavi
Pas encore d'évaluation
Ss 2 2nd CA Physics Test First Term 2022 2023
Document2 pages
Ss 2 2nd CA Physics Test First Term 2022 2023
Akinola Olalekan
Pas encore d'évaluation
11 - An Implicit Mixed Enthalpy Temperature Method For Phase Change Problems
Document9 pages
11 - An Implicit Mixed Enthalpy Temperature Method For Phase Change Problems
Lucas Santos
Pas encore d'évaluation
Operation & Maintenance Manual For Hypercomp CNG Compressor Model 3W815
Document208 pages
Operation & Maintenance Manual For Hypercomp CNG Compressor Model 3W815
Asim Riaz
80% (5)
Permutation, Combination
Document32 pages
Permutation, Combination
Srinivasan Saai Mahesh 16BCE0559
Pas encore d'évaluation
ASIST Automated Water Billing System
Document6 pages
ASIST Automated Water Billing System
mao bah 8888
Pas encore d'évaluation
PDF Solution Manual For Gas Turbine Theory 6th Edition Saravanamuttoo Rogers Compress
Document7 pages
PDF Solution Manual For Gas Turbine Theory 6th Edition Saravanamuttoo Rogers Compress
Erickson Brayner MarBer
100% (1)
Dos Vs Linux Commands
Document23 pages
Dos Vs Linux Commands
Somasekhar Chowdary Kakarala
Pas encore d'évaluation
Calculating IPv4 Subnets - ANSWER - KEY
Document8 pages
Calculating IPv4 Subnets - ANSWER - KEY
Paul John Quiros
Pas encore d'évaluation
Virtual Memory and Demand Paging
Document50 pages
Virtual Memory and Demand Paging
Prakash Singh
Pas encore d'évaluation
Permanent Magnetic Lifter
Document2 pages
Permanent Magnetic Lifter
Phan Van Loi
Pas encore d'évaluation
A Presentation On ER-Diagram
Document9 pages
A Presentation On ER-Diagram
Lee Kally
100% (1)
HFDL Specification Item-1c
Document50 pages
HFDL Specification Item-1c
Bert Holtappels
100% (1)
Manual de Servicio Bomba de Infusion Bodyguard 323
Document50 pages
Manual de Servicio Bomba de Infusion Bodyguard 323
anayencyramos
Pas encore d'évaluation
BETL STR Offshore Wind E-Book - FINAL
Document9 pages
BETL STR Offshore Wind E-Book - FINAL
ir_zainal
Pas encore d'évaluation
Unit 6 Chapter 1 Parallel Programming Tools Cuda - Programming
Document28 pages
Unit 6 Chapter 1 Parallel Programming Tools Cuda - Programming
Pallavi Bharti
Pas encore d'évaluation
Step-by-Step Guide: How To Book An For: Appointment Tracker Exchange
Document4 pages
Step-by-Step Guide: How To Book An For: Appointment Tracker Exchange
James Ng
Pas encore d'évaluation
9) Locking in Mysql
Document15 pages
9) Locking in Mysql
Remote MySQL DBA
Pas encore d'évaluation
Differential Equation Evaluation (Quiz) : D. Fourth Order
Document3 pages
Differential Equation Evaluation (Quiz) : D. Fourth Order
Armenion Mark Allen
Pas encore d'évaluation
Deepwater Development Overview
Document11 pages
Deepwater Development Overview
Barry Hii
Pas encore d'évaluation
Beam Reinforcement Calculation
Document8 pages
Beam Reinforcement Calculation
Anish Kumar
Pas encore d'évaluation
Humanities Ii (Operations Research)
Document11 pages
Humanities Ii (Operations Research)
Swapan Dey
Pas encore d'évaluation
Rectangular Flange Design
Document6 pages
Rectangular Flange Design
TAHIR MAHMOOD
Pas encore d'évaluation
Cat Elc
Document17 pages
Cat Elc
Joel Cunha
100% (1)
Basic Aerodynamic Theory
Document24 pages
Basic Aerodynamic Theory
Oganga Jack
Pas encore d'évaluation
Hallogic Hall-Effect Sensors: Features
Document9 pages
Hallogic Hall-Effect Sensors: Features
Michel Moacir
Pas encore d'évaluation
Euler-Maclaurin Expansion and Woolhouse's Formula: A S. M Volume 2, Pp. 631-633 in
Document3 pages
Euler-Maclaurin Expansion and Woolhouse's Formula: A S. M Volume 2, Pp. 631-633 in
Ayu Nurul Atiqoh
Pas encore d'évaluation
AH Saphiro 3 RD Chapter PDF
Document26 pages
AH Saphiro 3 RD Chapter PDF
Rahul Roy
Pas encore d'évaluation
Parte1-Description Material and Conclusions
Document3 pages
Parte1-Description Material and Conclusions
Lisa
Pas encore d'évaluation
Ncsim Support
Document22 pages
Ncsim Support
Pramod Reddy R
Pas encore d'évaluation