Vous êtes sur la page 1sur 14

Institut des Sciences Vétérinaires, Cours de bio-informatique

Université de Blida 1 2020/2021


Cours 3

Bases et banques de données

1
Qu’est-ce qu’une banque/base de données?

Ensemble de données relatives à un domaine, organisées par


traitement informatique, accessibles en ligne et à distance.

Les données sont :

- Structurées.
- Indexées (table des matières).
- Périodiquement mises à jour.

2
Il existe un grand nombre de banques/bases de données d'intérêt
biologique. Il y a deux sortes :

Celles qui offrent des informations plutôt hétérogènes.

Banques de données Banques généralistes

Celles qui correspondent à des données plus homogènes


d'espèces précises.

Bases de données Banques spécialisées

3
Banques généralistes

Genbank (banque américaine créée en 1982) et EMBL


(European molecular biology laboratory, banque européenne
qui existe depuis 1980) sont les grandes banques de séquences
généralistes.

4
Banques spécialisées

De nombreuses banques de données spécifiques ont été créées


pour des besoins spécifiques liés à l'activité d'un groupe de
personnes.

5
Banques de séquences nucléiques :

GenBank : La banque américaine.

EMBL : La banque européenne.

DDBJ : La banque japonaise (DNA Data Bank of Japan).

Ces trois banques s'échangent systématiquement leur


contenu depuis 1987.

6
Banques de séquences protéiques:

Swiss Prot : Description de la fonction et structures des protéines.

TrEMBL : Données générées par traduction automatique des


informations génétiques de la banque de données EMBL (d’où
TrEMBL = Traduction EMBL).

Prosite : Base de données de familles et domaines de protéines.

Expazy : Base de données des protéines.


7
Banques de séquences protéiques:

Elles contiennent les protéines obtenues de plusieurs manières


différentes :

in silico : déduite à partir de la séquence nucléique, par


simple traduction.

Isolée à partir de la cellule.

Par génie génétique.

8
Autres types de banques / bases de données:

Banques de Structure:

Ex: la Protein Database PDB dédiée aux structures protéiques


déterminées expérimentalement.

Bases dédiées à un organisme particulier:

Ex: Arabidopsis thaliana (TAIR, ABRC….), Colibri (E. coli ),


Subtilis (Bacillus subtilis ), Flybase (Drosophile).

9
Bases de données bibliographiques:

MEDLINE :

est la banque de citations et de résumés biomédicaux.

Environ 4800 journaux recensés à partir de 1966.

10
Banques de données bibliographiques:

PubMed :

Le principal moteur de recherche de données bibliographiques de


l'ensemble des domaines de spécialisation de la biologie et de la
médecine.

Il a été développé par le Centre américain pour les informations


biotechnologiques (NCBI), et est hébergé par la Bibliothèque nationale
américaine de médecine.

PubMed est un moteur de recherche gratuit donnant accès à la base de


données bibliographique MEDLINE, rassemblant des citations et des
résumés d'articles de recherche biomédicale.

11
Bases de données bibliographiques:

12
NCBI : Le National Center for Biotechnology Information (NCBI, «
Centre américain pour les informations biotechnologiques ») est un
institut national américain pour l'information biologique moléculaire.

NCBI conduit des recherches dans la biologie informatique,


développe des logiciels pour analyser des données de génome et fournit
des informations biomédicales.

Ce n'est pas une banque de données, mais il développe aussi des banques
de données publiques telles que : GenBank - PubMed.

13
Bases de données bibliographiques:

14

Vous aimerez peut-être aussi