Académique Documents
Professionnel Documents
Culture Documents
ndice
O objetivo O principal objetivo permitir integrar e consultar, de forma otimizada, dados de seqncias de DNA, padres de expresso de genes, estrutura de protenas, conseqncias clnicas, dentre outros elementos resultantes de pesquisas efetuadas em um projeto genoma*. *Projeto Genoma o nome de um trabalho conjunto realizado por diversos pases visando desvendar o cdigo gentico de um organismo (podendo ser animal, vegetal, de fungos, bactrias ou de um vrus) atravs do seu mapeamento. Seu marco inicial considerado o Projeto Genoma Humano. Projeto GMOD O Generic Model Organism Database Project um projeto open source, cujo objetivo desenvolver um conjunto completo de softwares para a criao e administrao de um banco de dados biolgico. GMOD (2004). Financiado pelo NIH (National Institute of Health) e pelo USDA Agricultural Research Service. Citrina: O Citrina consiste em uma ferramenta de gerncia que permite automatizar o espelhamento e processamento de bancos de dados que esto distribudos atravs de diversos servidores FTP. A mesma foi desenvolvida atravs da tecnologia Java Ant, o que a torna mais flexvel e portvel. Um exemplo de uso para o Citrina seria a transferncia de Chado SQL entre vrios sites de organismos e a populao automtica dos diversos bancos de dados PostgreSQL atravs dos recursos de SQL fornecidos pela tecnologia Java Ant. 3
BioMart: Sistema de Integrao de dados orientado a consultas, baseado na idia de data warehouse. Sistema de Consultas desenvolvido especificamente para uso de grandes bancos de dados. Simplifica a tarefa de integrao entre diferentes bancos de dados distribudos pela rede. Chado: Segundo Chado (2004), consiste em um ... conjunto de mdulos de um esquema destinados construo de um esquema de banco de dados biolgico relacional.... O Chado foi desenvolvido com o intuito de ser aplicado, especificamente, a um banco de dados open source, como o caso do PostGreSQL (PostgreSQL, 2004) e do MySQL (MySQL, 2004). Alm disso, outro pr-requisito para o funcionamento eficiente do Chado a configurao de diversos pacotes BioPerl (BioPerl, 2004). O Chado est sendo utilizado atualmente pelo FlyBase (FlyBase, 2004) e pelo Berkeley Drosophila Genome Project (BDGP, 2004). O Chado, o qual constitui um dos subprojetos do GMOD, apresenta-se como um esquema mais simples e genrico para a representao de dados biolgicos. Este esquema ainda se encontra em desenvolvimento, o que pode ser verificado na grande simplicidade nos mdulos responsveis pela representao de mapas genticos, interaes genticas e expresso gnica. Todos os dados resultantes das anlises de um projeto genoma so armazenados nos chamados bancos de dados biolgicos. Inicialmente, cada laboratrio desenvolveu o seu prprio banco de dados, contemplando somente as necessidades do projeto genoma por ele sendo executado. Um banco de dados genmico para os bilogos geralmente um web site que apresenta informaes que muitas vezes esto armazenadas em arquivos texto. Outras vezes, os dados podem at estar em SGBDs, mas isto s comeou a se tornar realidade h poucos anos. Por exemplo, o www.plasmodb.org, um "banco de dados genmico" do Plasmodium (causador da malria) usa dados armazenados tanto em arquivos texto quanto em Oracle. A migrao vem se dando h pouco tempo. O banco de dados biolgico mais famoso o GenBank.
XML (DTD) que permite converses entre bancos de dados que se utilizam de diferentes tecnologias de XML. A idia criar um banco de dados XML bem formulado capaz de integrar dano de dados diferentes, criando um repositrio de informao biolgica. O problema integrar diversas bases de dados XML cujos dados no possuem uma estrutura padro, podendo variar o tipo de uma base para outra. SGBD ad-hoc, um gerenciador de Baco de dados voltado especificamente para lidar com dados biolgicos. Um problema para esta aplicao o alto custo e pouca abrangncia, o que os torna economicamente inviveis.
Banco de Dados Biolgicos Exemplos e Softwares de bancos de dados pblicos para biologia molecular
1 - Bancos de dados primrios (seqncias de nucleotdeos) NCBI, EMBL, DDBJ Armazenam seqncias de nucleotdeos de todos os organismos Eles trocam informao e so fontes para outros bancos de dados. 2 - Meta-databases ENTREZ
Interface por meio da qual todos os seus BDs componentes podem ser acessados.
3 - Bancos de dados genmicos Ensembl, SGD, TAIR Ensembl fornece: - Genomas completos e diversos. - Anotao de SNPs - Alinhamento com seqncias homlogas de outros organismos. - Correlaes com outros bancos de dados. SGD (Saccharomyces Genome Database ) fornece: -Genoma completo -Fentipos de mutantes especficos para cada gene -Dados de expresso gnica 7 TAIR fornece: -Genoma completo -Localizao das inseres de T-DNA -Dados de expresso gnica
Anota, cataloga e distribui conjuntos de coordenada atmicas de macromolculas PDB (World Wide Protein Data Bank) fornece: - Detalhes experimentais sobre a gerao da estrutura. - Atribuies da estrutura - Coordenaes atmicas - Links para outros bancos de dados 6 - Bancos de domnios e motivos proticos PFAM, SMART, PROSITE, PRODOM, PRINTS
- Anotam e catalogam domnios ou motivos proticos. Fazem comparaes entre seqncia de consulta e banco de dados.
7 - Bancos de vias metablicas KEGG, BioCyc Kegg coleo de bancos de dados on-line que ligam genomas com vias enzimticas 8
Gene Ontology (GO) project, fornece um vocabulrio controlado para descrever genes e produtos gnicos de um organismo. Ontologias: Molecular Function (atividade enzimtica, funo biolgica) Biological process (processo em que a protena est envolvida), Cellular component (Compartimento onde a protena se localiza) As ontologias so estruturadas como grafos acclicos diretos. Parece uma Hierarquia, porm termos mais especializados (filhos) Podem ser relacionados a mais de um termo menos especializado (pai).
BIBLIOGRAFIAS:
http://imgproj.cs.man.ac.uk/tambis/ http://www.ncbi.nlm.nih.gov/Genbank/ III Congresso Cientfico do CEULP/ULBRA(PADRES DE TIPOS E MTODOS PARA BANCO DE DADOS EM BIOINFORMTICA.pdf)
10