Vous êtes sur la page 1sur 21

LA 

GÉNOMIQUE

DR Chaoui N.
Département de Biologie Animale
Université Frères Mentouri Constantine
c
DEFINITION 
• La génomique est une technologie
récente qui étudie les génomes en leurs
totalité.
• l’Étude ne porte pas sur un seul gène
(génétique) mais porte sur un Σ de
gènes contenues dans un organisme =
génome.
• Étudie leur localisation, leur séquence,
leur fonctions et leurs interactions.
• Le génome d’un être vivant est
constitué d’ADN, molécule qui
comprend dans l’enchainement linéaire
de sa séquence en nucléotides la
totalité de l’information biochimique
vitale.

• L’unité fonctionnelle du génome est


donc le gène.
• Chaque protéine ₵aire est le fruit de
l’expression d’un gène.
• Σ des protéines est à la base de
l’édification et du maintien des cellules de
l’organisme.

• Pour une espèce donnée le génome est


globalement semblable pour tous les
individus.
• Il existe cependant des variations entre
génomes d’individus différents :
Polymorphisme.
HISTORIQUE
cette discipline a été facilité par le dvpt des
techniques de séquençage et la
bioinformatique.

• En 1972 premier véritable séquençage d’un


génome avec la lecture de la seq ARN du
génome du virus bactériophage MS2.

• En 1977 Sanger séquence le génome du virus


ΦΧ 174.

• En 1995, séquençage du génome de 1,8 Mb


de la bactérie Hemophilus influzae.
• En 1996 séquençage du génome de 12Mb de
Saccharomyces cerevisiae.

• En 1998 séquençage du génome de 100 Mb de C.


elegans.

• En 2000 séquençage du génome de 180 Mb de


Drosophila Melanogaster.

• Elle a été médiatisée à la fin du 20ème siècle avec la


compétition de plusieurs équipes de recherches pour
la publication de la 1ère carte du génome humain
annoncée le 26 juin 2000 par Bill Clinton et Tony Blair.
En 2001 la première ébauche de 3000 Mb du
génome humain .
Le chien en 2005
En septembre 2007 une équipe de recherche
menée par Craig Venter a publié le 1er
génome complet d’un individu celui de Craig
Venter
Dans la même période J. Watson (Co‐
découvreur de la structure de l’ADN) a publié
la séquence de son génome.
OBJECTIFS DE LA GÉNOMIQUE
• Déterminer les seq génomiques des organismes
• Définir la localisation de tout les gènes d’un
organisme
• Annoter l’Σ des gènes d’un génome : tout les gènes
qui codent un produit (protéines ou ARN ) (ORF :
début ATG ; fin TAA, TAG, TGA)
• Déterminer la Ft de l’ Σ de gènes d’un organisme
• Etablir les profils d’expression génique des cellules
dans différentes conditions (Etude de l’ Σ d’ARNm
transcrits à un moment donné = transcriptomique)
• Identifier toutes les protéines qui peuvent
être produites par un génome donné =
protéomique
• Comparer les gènes et les protéines entre les
organismes pour déterminer leur parenté.
DOMAINES DE LA GÉNOMIQUE 
La génomique structurale
Analyse de la structure des génomes par séquençage des
génomes, identification des gènes, des séq régulatrices, des
séq répétés

La génomique fonctionnelle
Etudie la ft des gènes , leurs régulations et leurs produits :
Σ d’ARNm présents dans une ₵ dans des conditions définies =
Transcriptome
Σ de protéines = protéome

La génomique comparative
Compare les seq de différents génomes pour comprendre leur
lien fonctionnel
Bioinformatique
C'est au début des années 80 que les premières banques de
séquences sont apparues. Grâce à un accord international, 3
groupes collaborent pour stocker les seq primaires d’ADN et
d’ARN de toutes les espèces :

 Le centre national pour l’information biotechnologique


(National Center for Biotechnology Information: NCBI)
Soutenue par le NIH (National Institute of Health) diffuse une
banque nucléique américaine nommée GenBank

 En Europe, l’institut européen de Bioinformatique (European


Bioinformatics Institute : EBI) diffuse la banque de données
du laboratoire européen de Biologie moléculaire (European
Molecular Biology Laboratory :EMBL data Library).
La collaboration entre ces deux banques a
commencé très tôt. Elle s'est étendue en 1987
avec la participation de la DDBJ (DNA Data
Bank of Japan) (diffusée par l’institut national
de la génétique au japon) pour donner
naissance finalement en 1990 à un format
unique dans la description des
caractéristiques biologiques qui
accompagnent les séquences dans les
banques de données nucléiques :
(The DDBJ/EMBL/GenBank )
• Les grandes banques de séquences telles que
GenBank ou l'EMBL sont des projets
internationaux.
• Elles sont maintenant devenues
indispensables à la communauté scientifique
car elles regroupent des données et des
résultats essentiels dont certains ne sont plus
reproduits dans la littérature scientifique.
• Leur principale mission est de rendre publique
les séquences qui ont été déterminées, ainsi
un des premiers intérêts de ces banques est la
masse de séquences qu'elles contiennent.
• On y trouve également une bibliographie et une
expertise biologique directement liées aux
séquences traitées.
• Pour que l'utilisateur puisse se repérer, toutes ces
informations sont mises à la disposition de la
collectivité scientifique selon une organisation en
rubriques ou en champs : une explication de cette
organisation est donnée comme suit : (voir fichier
joint bases de données).
Exp de sites importants
• NCBI http://www. Ncbi.nlm.nih.gov/
• NCBIhttp:// www.Ncbi.nlm.nih.gov/Genomes/
index
• NCBI‐Refseq http://
www.Ncbi.nlm.nih.gov/LocusLink/refseq.html
• Le site de Bioinformatique Génomique de UCSC
http://genome.ucsc.edu/
• EBI http:// www.Ebi.ac.uk/
• DDBJ http:// www.nig.ac.jp/
En ce qui concerne les protéines, deux banques
principales ont été créées :

• La première, sous l'influence du National Biomedical


Research Foundation (NBRF) à Washington. Elle se
nomme la Protein Identification Ressource (PIR‐NBRF)

La deuxième, Swissprot (Swissprot/TrEMBL) a été
constituée à l'Université de Genève à partir de 1986 et
regroupe entre autres des séquences annotées de la
PIR‐NBRF ainsi que des séquences codantes traduites
de l'EMBL .( http:// www. ebi.ac.uk/swissprot/)
• Les bases de données pour des domaines protéiques
( seq aa caractéristiques de protéines d’un type
particulier)
• InterPro http:// www. ebi.ac.uk/interpro/
• Pfamhttp://www.sanger.ac.uk/software/pfam/index.shtml
• PROSITE http:// www.Expasy.ch/prosite/
• PRINTS
• ProDom
• TiGRFAMs
• BLOCKS
• CDD
http:// www. Ncbi.nlm.nih.gov/Stucture/cdd/cdd/shtml
Bases de données pour la structure
tridimensionnelle des protéines
Banque de donnée des protéines (Protein
DataBase: PDB (http://www.rcsb.org/pdb/)
NCBI possède une application Cn3Dqui permet
de visualiser les données de PDB
Cn3D(http://www.Ncbi.nlm.nih.gov/Stucture/C
N3D/cn3d.shtml)
• Il existe des banques de données
spécialisées:
Bases de données génétiques spécifiques
d’organismes (MOD)

• SGD (Saccharomyces cerevisiae)

• WormBase (C. elegans)

• FlyBase (Drosophila Melanogaster) ect;;;;


 Bases de données de la génomique et de la génétique 
humaine
Exp:
Base de donnée des maladies génétiques humaines
appelée transmission mendeliennes en ligne chez
l’homme (Online Mendelian inheritance in Man OMIM)
Base de donnée brève description des gènes humains
GeneCards
Base de donnée des mutations dans les gènes humains
(Human Gene Mutation DataBase :HGMD)
Base de donnée de la carte actuelle de la séquence du
génome humain :GoldenPath
Base de donnée des maladies génétiques humaines
http://www.geneticalliance.org/
• Bases de recherche d’homologies: identification 
de similitudes entre deux séquences Blast (Basic 
Local Alignement Search Tool)
• NCBI‐Blast http://www. Ncbi.nlm.nih.gov/BLAST/