Vous êtes sur la page 1sur 21

Bancos de Dados Biolgicos

Daniel Guariz Pinheiro


Laboratrio de Gentica Molecular e Bioinformtica ( http://lgmb.fmrp.usp.br ) Departamento de Gentica ( http://rge.fmrp.usp.br ) Faculdade de Medicina de Ribeiro Preto ( http://fmrp.usp.br ) Universidade de So Paulo ( http://www.usp.br )

Sumrio
Introduo Banco de Dados Dados Biolgicos Banco de Dados Biolgicos Reviso Histrica Principais Bases de Dados Bases de Dados de Expresso Gnica
NCBI GEO (Gene Expression Omnibus)

Referncias

Banco de Dados
A database is a collection of related data. By data, we mean known facts that can be recorded and that have implicit meaning. (R. Elmasri and S. B. Navathe) A database is a repository for a collection of computerized data files. (C.J.Date)

Abordagem utilizando Sistema de Arquivos


Cada usurio define e implementa os arquivos necessrios para uma aplicao especfica.
Gera redundncia na definio e no armazenamento dos dados; Possui estrutura especfica e dependente de determinada aplicao; No permite compartilhamento e acesso concorrente;

Abordagem utilizando Sistema de Banco de Dados


Utiliza um sistema de gerenciamento de bancos de dados para manter um nico repositrio de dados;
Evita redundncia; Contm em si a definio de sua estrutura (metadados); Possui restries implementadas que evitam inconsistncias nos dados; Soluo genrica para qualquer aplicao; Permite o acesso concorrente de mltiplos usurios; Permite diferentes vises dos dados; Independncia da aplicao; Permite representar relacionamentos complexos entre os dados; ...

Modelo de dados
Uma coleo de conceitos que podem ser usados para descrever a estrutura do banco de dados. Projeto de um Banco de Dados Relacional
Modelo de Dados Conceitual;
Modelo de Entidades e Relacionamentos (MER);
Entidades, atributos e relacionamentos; Diagrama de Entidades e Relacionamentos (DER);

Modelo de Dados de Implementao;


Modelo de Dados Relacional;
Detalhamento do Modelo Conceitual (MER) e adequao ao SGBDR; Modelo de Dados Baseado em Registros Representao atravs de estruturas de registros;

Modelo de Dados Fsico;


Detalhes internos de armazenamento;

Diagrama de Entidades e Relacionamentos


Notao Original
Peter Chen,1976.

Modelo diagramtico que descreve o modelo de dados de um sistema com alto nvel de abstrao. Ele a principal representao do Modelo de Entidades e Relacionamentos.
Notao IDEF1X

Chen, Peter P. English Sentece Structure and Entity-Relationship Diagrams, Elsevier Science Publishing Co,, Inc. 52 Vanderbilt Ave, New York, NY 10017

ERwin

Sistema de Gerenciamento de Banco de Dados


A database management system (DBMS) is a collection of programs that enables users to create and maintain a database. The DBMS is hence a general-purpose software system that facilitates the processes of defining, constructing, and manipulating databases for various applications. (R. Elmasri and S. B. Navathe)
Modelo de Dados Relacional (SGBDR) Inspirado na lgebra Relacional Organiza os dados em uma estrutura de tabelas Linguagem SQL (Structured Query Language) Modelo de Dados Orientado a Objetos (SGBDOO) Inspirado nos Paradigmas de Orientao a Objetos Permite a persistncia de objetos Linguagem OQL (Object Query Language) Modelo de Dados Objeto-Relacional (SGBDOR)
Extenso do Modelo Relacional incorporando algumas das funcionalidades do modelo Orientado a Objetos;

O2

Jasmine

Extenso da linguagem SQL (SQL3);

Ambiente Simplificado de um Sistema de Banco de Dados

Elmasri, R. A. and Navathe

Em que situaes a abordagem com arquivos indicada?


O banco de dados e as aplicaes so simples e bem definidas e no espera-se alteraes; H o requisito de tempo-real para alguns programas, no encontrado com o uso de SGBDs dada sua sobrecarga; No h necessidade de mltiplos acessos.

Banco de Dados Flat file


Abordagem utilizando arquivos
Arquivos que contm registros de dados que no esto estruturalmente relacionados.
Exemplo: Banco de Dados flat file de seqncias de nucleotdeos (nt) Possui um padro especfico de formatao
GenBank, Fasta, ASN.1 ...

necessrio um programa chamado de parser, que reconhece esses formatos especficos e conseguem extrair informao de forma automtica.
Ex.: Mdulos da BioPerl

Reviso Histrica
Leroy Hood Desenvolve o primeiro seqenciador automtico 1986

1977 Gilbert & Sanger Desenvolvem um mtodo para o seqenciamento de DNA

Sequenciamento de DNA
Sequenciamento manual x automtico

CCCAACT...

Reviso Histrica
Iniciativa pblica Projeto Genoma Humano

Cancer Genome Anatomy Project

Publicao do rascunho do Genoma Humano

1990

1996

1999 2001

1988
National Center for Biotechnology Information Rede Organization for Nucleotide Sequencing and Analysis

1997

2000

Genoma Xylella fastidiosa

E agora ?

Repositrios de Dados Biolgicos


1965 Atlas of Protein Sequences and Structure (Dayhoff et al.) - 1Mb 1982 GenBank 1988 NCBI National Center for Biotechnology Information

1997 EMBL European Molecular Biology Laboratory


1986 DDBJ DNA Data Bank of Japan

International Nucleotide Sequence Database Colaboration

100 Giga bases (Agosto de 2005)

Repositrios de Dados Biolgicos


PDB Protein Data Bank

UniProt Universal Protein Resource (Swiss-Prot, TrEMBL, and PIR)


KEGG Kyoto Encyclopedia of Genes and Genome

Bancos de Dados Flat files do NCBI


FASTA GenBank ASN.1

Referncias
Date, C. J. 2003. An Introduction to Database Systems. Addison-Wesley Longman Publishing Co., Inc. Elmasri, R. A. and Navathe, S. B. 2003. Fundamentals of Database Systems. Addison-Wesley Longman Publishing Co., Inc.

Perguntas...
Daniel Guariz Pinheiro

daniel@lgmb.fmrp.usp.br http://scarecrow.fmrp.usp.br/~daniel/

MUITO OBRIGADO !!!