Vous êtes sur la page 1sur 22

Cours1

Introduction
à la Génomique

Dr Mesbah-Amroun hamida
Equipe cytokine et NOS/Immunité et pathogénie
LBCM, FSB, USTHB

Génomique et Bioinformatique
La Génomique
Définition de la Génomique

La génomique est l'étude des génomes, de


leur organisation et de leur évolution.
C'est l'étude de l'expression et de la
fonction de tous les gènes du génome.
Objectifs de la Génomique

1- Établir la cartographie des génomes


2- Séquencer les génomes
3- Déterminer la structure des gènes (signaux de gènes
chez les procaryotes/eucaryotes)
4- Déterminer la fonction des gènes par la recherche de
l'activité, de domaines fonctionnels ou de gènes
partenaires.
5- Établir les profils d'expression des gènes par
comparaison entre tissus sains et pathologiques.
Les objectifs 1,2,3 relèvent de la génomique structurale et
les objectifs 4,5 relèvent de la génomique fonctionnelle.

Génomique et Bioinformatique
Applications de la Génomique

1-La génomique est utilisée dans le cas de maladies infectieuses


*recherche de gènes de résistance aux antibiotiques
*recherche et identification de gènes impliqués dans la pathogénicité

2-La génomique est utilisée dans le cas de maladies génétiques


*recherche de gènes responsables de susceptibilité génétique aux maladies
*recherche de modifications de l'ADN à l'origine du cancer
*recherche de modification des profils d'expression des gènes, à l'origine de certains
disfonctionnements cellulaires.

3-La génomique est utilisée dans l'industrie


*recherche de gènes impliqués dans les pathologies (cibles pharmaceutiques, marqueurs
diagnostiques)
*recherche de gènes codant des molécules d'intérêt
*recherche de gènes responsables de résistances
*recherche de gènes permettant de comprendre les mécanismes clés (cancer,
vieillissement, etc..)

Génomique et Bioinformatique
Les débuts de la génomique

• 1953 : Watson et Crick découvrent la structure de l’ADN


• 1956 : F. Sanger élabore le protocole de séquençage
des protéines : Technique délicate à réaliser qui
nécessite un matériel cher.
• 1977 : F. Sanger élabore le protocole de séquençage de
l’ADN : Technique plus abordable et moins coûteuse.
• Années 80 :
• Technique de séquençage de l’ADN peu répandue,
• Détermination de la séquence d’un seul gène,
• Etude expérimentale et informatique de la fonction de la
protéine codée par ce gène.

Génomique et Bioinformatique
Développement de la génomique

• Automatisation des techniques expérimentales


• Mise au point de séquenceurs automatiques (le 1er en
1987). C'est le boom de la génomique qui a induit le
développement de la bioinformatique (création de
banques de données...)
• Création de laboratoires spécialisés en séquençage
• 1995 : Séquençage du 1er génome procaryote
Haemophilus influenzae (1,83 Mb)
• 1996 : Séquence du 1er génome eucaryote
Saccharomyces cerevisiae (12 Mb)
• 2001 : annonce du décryptage du génome humain
• 2005 : 1740 projets génomes existent parmi lesquels les
projets de génomes modèles
Génomique et Bioinformatique
Exemples de génomes modèles

Tableau 4 : principaux génomes modèles totalement séquencés

Organismes

Drosophila melanogaster (mouche du vinaigre, métazoaire, invertébré,


eucaryote)
Arabidopsis thaliana (plante, végétal,métazoaire, eucaryote)

Caenorhabditis elegans (ver nématode, métazoaire, eucaryote)

Sacharomyces cerevisiae (levure, eucaryote unicellulaire)

Escherichia coli (bactérie, procaryote unicelluaire)


Génomes modèles : définition

On appèle « génomes modèles » les organisme


appartenant à des espèces ayant :
- un génome de petite taille et totalement séquencé
- une facilité de reproduction au laboratoire et/ou une
facilité de mise en culture.
- des fonctions d'intérêt, partagées avec l'homme. Ils
peuvent être utilisés comme modèle pour étudier la
fonction de gènes chez l'homme.
Ainsi, toutes les connaissance structurales et fonctionnelles
acquises chez ces animaux modèles deviennent
applicables chez l'homme.

Génomique et Bioinformatique
Recherche de gènes d’intérêts chez les
génomes modèles
- Etude d’aspects particuliers du phénotype
- Observation d’une caractéristique particulière
- Recherche du gène correspondant
- Etude du gène et de la protéine
- Inactivation du gène et observation des
conséquences,
- Mutation de certains nucléotides,
- Expression dans un autre organisme, …

Génomique et Bioinformatique
Comment séquencer les génomes ?

• La technique de séquençage permet la


lecture de courtes séquences (en moyenne
500 nt)
• Besoin de fractionner le génome pour le
séquencer entièrement
• Techniques de Top-Down et Shotgun
• Reconstitution correcte du génome
Etape délicate et difficile

Génomique et Bioinformatique
Principe du séquençage
Le groupement OH des NTP est normalement utilisé
par une ADN polymérase pour allonger la chaîne.

Si ce groupement est absent, l'élongation ne se fera


pas. C'est le cas du ddNTP: nucléotide "terminateur".

dTTP ddTTP

Génomique et Bioinformatique
La réaction de séquençage de l’ADN

- L’ADN simple brin inconnu à séquencer,


- Une ADN polymérase qui initie la réplication à partir d'une
amorce complémentaire d'une partie de la séquence connue.
- La chaîne d’ADN nouvellement synthétisée par l'ADN
polymérase n'est autre que le brin complémentaire de l'ADN
inconnu à séquencer.
- Des nucléotides terminateurs (ddNTP) sont utilisés et vont
bloquer l’élongation de la nouvelle chaîne d’ADN.
(http://www.snv.jussieu.fr/vie/dossiers/sequencage/sequence.htm)

Génomique et Bioinformatique
La réaction de séquençage de l’ADN

L'utilisation d'un ddNTP permet d'obtenir un ensemble de fragments


d'ADN de différentes tailles, correspondant aux emplacements d'un
nucléotide donné.
(http://www.snv.jussieu.fr/vie/dossiers/sequencage/sequence.htm)
Le déroulement du séquençage
manuel, 1ère étape: la réaction
4 réactions en parallèle :
• Une par ddNTP terminateur :
ddATP, ddTTP, ddGTP, ddCTP
• Dans chaque réaction seront
mélangés les 4 NTP avec l’un
des 4 ddNTP
(ex : ATP + CTP + GTP + TTP +
ddATP)
• Ainsi, chaque réaction aboutira à
un mélange de chaînes de
différentes longueurs se
terminant toujours par le même
nucléotide.

Dénaturation et séparation par électrophorèse

Génomique et Bioinformatique
Le déroulement du séquençage
manuel, 2ème étape: l'électrophorèse
• Les chaînes obtenues sont triées d’après
leur taille à l’aide d’un gel d’électrophorèse.
• L’analyse du gel se fait visuellement

Génomique et Bioinformatique
Principe de l’électrophorèse

L’ADN est globalement chargé négativement


• Il peut migrer sous l’influence d’un champ électrique
• Les gels de séquences sont composés de
polyacrylamide
• Le gel constitue un « filet » en trois dimensions
• Plus le fragment d’ADN est long, moins il va migrer
• Les gels de polyacrylamide peuvent séparer des chaînes
d’ADN dont la longueur diffère d’un seul nucléotide.
• Visualisation de l’ADN sur le gel à l’aide de la
radioactivité ou de la fluorescence.

Génomique et Bioinformatique
Analyse du gel d’électrophorèse

Le gel est composé de 4 pistes.


G A T C
Chaque piste est attribuée à la lecture d'un
nucléotide:
G: guanine
A: adénine
G
T: thymine C
A
C: cytosine A
T
La lecture se fait horizontalement de bas en C
C
haut en passant d'une piste à une autre. T
A
G
A
A
G

Génomique et Bioinformatique
L’analyse par un séquenceur
automatique

• Les composés ddNTP sont fluorescents


• Les fragments de séquence sont soumis à une
migration qui se fait dans un appareil d’électrophorèse
capillaire.
• La détection est réalisée par un système optique.
• Les données sont enregistrées sur ordinateur
• Un logiciel analyse les données pour reconstituer la
séquence

Génomique et Bioinformatique
Exemple de séquenceur
automatique

un exemple de résultat de séquençage


automatique : les quatre courbes
correspondent à la détection de la
fluorescence des fragments d'ADN
obtenus. Un "pic" correspond donc à la
détection d'un nucléotide donné dans la
séquence : l'interprétation est donnée
sous les courbes.
En bleu : Adénine. En vert : Thymine.
En jaune : Guanine. En rouge : Cytosine.

Génomique et Bioinformatique
Limites de la technique de
séquençage
• La technique de séquençage n'autorise la lecture que de
séquences relativement courtes : 500 à 600 nucléotides
C’est très peu pas rapport à un chromosome entier !
• Besoin de couper les chromosomes en fragments puis
• de les reconstituer
• Différentes techniques sont utilisées
• Il peut y avoir des erreurs de lecture
• Oubli d’un nucléotide, inversion de l’ordre des
nucléotides, …
• Besoin de séquencer 8 à 10 fois un fragment pour obtenir
une séquence fiable.

Génomique et Bioinformatique
Principe du séquençage d’un
chromosome entier
• Amplification du chromosome
• Besoin de séquencer 8 à 10 fois le chromosome
• Les copies du chr sont cassées aléatoirement en fragments de
quelques milliers de nucléotides
• Séquençage des extrémités de certains des fragments obtenus
• Certaines séquences se chevauchent en partie

Génomique et Bioinformatique
Reconstruction des contigs

• Comparaison des séquences obtenues pour aligner les parties


• séquencées plusieurs fois
• Reconstitution d’enchaînements plus grands, appelés contigs
• Traitement informatique indispensable

un contig

Génomique et Bioinformatique

Vous aimerez peut-être aussi