Académique Documents
Professionnel Documents
Culture Documents
et de la Recherche Scientifique
Master 2021-2022
Historique de la Génomique
L'essor de la génomique a été facilité par le développement des techniques de séquençage des
génomes et de la bio-informatique.
En1972, le premier véritable séquençage d'un génome est publié, avec la lecture de la séquence
ARN du gène du virus bactériophage MS2.
Elle a été très médiatisée à la fin du xxe siècle avec la compétition entre différentes équipes
scientifiques pour la publication de la première carte du génome humain en 2000.
Depuis, un nombre croissant de génomes complets sont séquencés chez des espèces vivantes
très différentes espèces vivantes très différentes : le ver Caenorhabditis elegans en 1998,
la mouche drosophile et la plante Arabidopsis thaliana en 2000 ou encore, le chien en 2005.
En septembre 2007, une équipe menée par le biologiste et entrepreneur Craig Venter a publié le
premier génome complet d'un individu qui se trouve être Craig Venter lui-même. Le génome du
codécouvreur de la structure de l'ADN et ancien directeur du Projet génome humain, James
Watson, a aussi été séquencé dans son intégralité à la même période.
Utilité de la Génomique
Connaitre la séquence nucléotidique permet une multitude d'études :
Exploration des fonctions associées aux gènes, aux variations alléliques et au polymorphisme
génétique ;
Reconstruction d'arbres phylogénétique d’espèces vivantes ;
Analyse de l’histoire évolutive des êtres vivants en lien avec leur écosystème
Compréhension de maladies liées aux gènes.
Génomique Structurale
Cette branche de la génomique regroupe toutes les analyses de la structure des génomes
(Ici « structure » est entendu au sens « organisation des génomes »).
Les méthodes concernées sont donc le séquençage des génomes, l'identification des gènes, des
séquences régulatrices, des séquences répétées ….
Annotation des Génomes
L'annotation des génomes est une analyse informatique des séquences obtenues lors du séquençage
permettant d'identifier les séquences informatives des génomes. Ces séquences sont principalement
les gènes (on parle alors de prédiction de gènes). La plupart de ceux-ci sont identifiés soit par leur
similitude avec des gènes déjà connus, soit par une prédiction en fonction de la séquence (présence
d'un cadre de lecture ouvert caractérisé par un codon d'initiation de la traduction, puis au moins
100 codons et enfin un codon stop). Mais il existe aussi des « gènes morcelés » (contenant
des introns) ou codant des ARN fonctionnels, ceux-ci doivent être prédits par des algorithmes
différents.
Les gènes ne sont pas les seules cibles de l'annotation des génomes, il existe de nombreux autres
types de séquences importantes dans les génomes ; les séquences régulatrices, les éléments
transposables….
Génomique Fonctionnelle
Une fois les génomes annotés, l'étape suivante est la recherche de la fonction des séquences
informatives identifiées. La génomique fonctionnelle peut être considérée comme de la génétique à
« haut débit ». Les techniques utilisées seront comparables mais généralement appliquées à un
grand nombre de gènes en parallèle, cela peut par exemple être la création de mutants et l'analyse de
leurs phénotypes pour toute une famille de gènes, ou l'analyse de l’expression de tous les gènes
d’un organisme entier.
La Génomique Fonctionnelle analyse la fonction des gènes et autres parties du génome. Elle inclue
l'analyse du transcriptome (ARN messagers) ou transcriptomique. Elle contribue aussi très
largement à l'annotation des génomes et à l'identification des séquences informatives.
La Protéomique est l'analyse du protéome (ensemble des protéines d’un organisme). Elle contribue
aussi à l'annotation des génomes et à l'identification des séquences informatives.
- d’identifier des prédispositions génétiques d'une personne par rapport à une maladie;
- de mettre au point des traitements selon l'information génétique de chaque individu et, par
conséquent, de permettre l'avancement de la médecine personnalisée;
- de connaître les effets de nos modes de vie et de notre environnement sur notre génome et
notre santé.
Le Projet du Génome Humain
Résultat d’une coopération scientifique internationale sans précédent, le Projet du génome humain a
vu le jour officiellement en 1990. Evidemment, le but de ce projet était d’établir la séquence
complète du génome humain, ce qui aura pris près de 15 ans. Pour la communauté scientifique
médicale, le séquençage du génome humain revêt une grande importance puisqu’il permet, entre
autre, de déterminer quels gènes sont responsable de certaines maladies et d’en apprendre davantage
sur le fonctionnement des etres humains, en particulier sur les relations entre les gènes, les protéines
et les maladies.
I- Analyse de la Structure des Séquences Génomiques
Exercice 1
La séquence d’un ADN bicaténaire, correspondant à un gène, est partiellement reportée ci-dessous.
5’ ATACGGGATCCGAGCTCTCGATCGTCTGCAGAAATTCC 3’
Exercice 3
Oligo-1: 5’-CGGGCACCCGGGTTA-3’
Oligo-2: 5’-CCCGGGGATCCCGGG-3’
Oligo-3: 5’-GACTGATCTGACATG-3’
Oligo-4: 5’-GAGAAACTGACTGAC-3’
5’ATCGGTGATCTGCAGTCCCGATCGGGCACCCGGGTTAGCGATCGTTTAATGGGTCGG
CCCGGGGATCCCGGGCCTGGACTGATCTGACATGGTGTCAGTCAGTTTCTC 3’.
Vous réalisez un séquençage de ce fragment d’ADN par la méthode de Sanger avec l’amorce
oligonucléotidique simple brin suivante: 5’-TCAGATCAGTCCAGG-3’. Schématisez
l’autogradiographie du gel de séquençage que vous devriez obtenir.
Exercice n° 4
Exercice n° 5
Un fragment d’ADN HindIII-HindIII de 1kb est digéré par l’enzyme EcoRI en un fragment de 300
pb et un fragment de 700 pb. Si le fragment de 300 pb est purifié et digéré par l’enzyme PstI, il
donne deux fragments : l’un de 100 pb et l’autre de 200 pb. Si le fragment de 700 pb est traité de la
même façon, il produit deux fragments : l’un de 500 pb et l’autre de 200 pb. Lorsque le fragment
HindIII-HindIII est digéré directement par l’enzyme Pst1 on obtient trois fragments : 100, 200 et
700 pb. Expliquez ces résultats à l’aide de schémas. Qu’obtiendrait-on en effectuant la double
digestion EcoRI et PstI sur le fragment de 1kb ?
II- Séquençage
Exercice 6
Vous disposez d’un brin d’ADN à séquencer (matrice), d’une amorce, d’ADN polymérase, des
quatre 2’- désoxyribonucléotides (dXTP) et d’un jeu des différents 2’,3’-didésoxyribo-nucléotides
(ddXTP). L’amorce est radio-marquée par du phosphore radioactif 32P. L’ADN matriciel à
séquencer ACGTAATCGC---- comporte, à son extrémité 3’, une séquence supplémentaire
(représentée ici par un segment de droite en pointillé) sur laquelle l’amorce va s’hybrider, créant
ainsi le site d’initiation de l’ADN polymérase.
Exercice 7
Le présent gel représente le profil d'électrophorèse du contenu du tube dans un processus de
séquençage d’ADN d’une cellule.
1- Décrivez le contenu du tube en termes de nucléotides.
2- Ecrivez les quatre (4) réactions de polymérisation possible dans le tube en question.
3- GCGAATGCGTCCACAACGCTAC reporte la mutation suivante : c.10T>G. En
conservant le cadre des réactions de polymérisation plus haut mentionné, combien de
fragment d’ADN après le séquençage complet de l’ADN reporteront la mutation en
question ?
Exercice 8
L’acronyme ORF en anglais signifie Open Reading Frame (ouverture de séquence de lecture)
débute par la séquence ‘ATG’ du code génétique dans la molécule d’ADN pour s’achever avec un
codon de stop (Voir le tableau Code Génétique ci-dessous)
1- Indiquer le nombre maximum de séquence ORF de la présente molécule d’ADN et si
possible leur différente position.
2- Il existerait une séquence ORF en correspondance de la position 80 de la présente molécule
d’ADN.
a- Retrouver la première séquence de stop après la séquence ORF en correspondance de la
position 80.
b- D’après le code génétique (voir tableau ci-dessous) déterminez pour quelle protéine
code cette ORF.
ATGGCACATTACCAAAACCAGTACGCTGCACCTGCATCCCAAGTCGACGAATACGGCAACCCGATTCGCACGG
ACCAATATGGCAACACAATTCGCACGGACGAATATGGCAACCCGATTCGCACGGACGAATTTGGCAACCCGAT
CCACCACATGACCGGCACCGCCGGCAGCTACGGATCCGGTGGATACGACACCACCACTCTCCAAGGTATGAGT
CATGATGTAACGGGGACTGGCGCCCACGGCGTTTCTGGCAAGCTTCATCGCTCTGGAAGCTCAAGCTCTAGCT
CTTCGGAGGATGATGGGCATGGCGGGAGAAGGAAGAAGAAGGGGCTGACGGGGAAGATAAAGGAGAAGATAC
CTGGTGTTGGACACAAGGATCACCGTAGTAATACAAGTGCAACTACCCCATATGGTTACGATGAGGGGCAACT
ACACCATCAGGAGAAGAAGGGGGTGATGGAAAAGATCAAAGAGAAGCTTCCTGGCCACCACTAG
Exercice 9
Afin d'étudier par voie de la protéomique les changements affectant des cellules cancéreuses chez
l'Homme, des auteurs ont procédé à la préparation d'échantillons protéiques à partir de cellules
saines et de cellules malades.
Le tampon de lyse utilisé dans cette étude est constitué d'une solution contenant, entre autres,
CHAPS (détergent non ionique) 4% (p/v) et Tris-HCl (pH 7,8) 40 mM.
L'électrophorèse en première dimension est une isoélectrofocalisation sur un gradient de pH 4,7-
5,9 effectuée dans un tampon composé de l'urée 8 M, CHAPS 2% (p/v), Ampholyte 0,2% (p/v),
Dithiothreitol (DTT) 3,7% (p/v) et le bleu de Bomophénol 0,001% (p/v)
Avant la réalisation de l'électrophorèse SDS-PAGE (deuxième dimension), les gels de la première
électrophorèse ont subit l'équilibration dans deux tampons de compositions suivante :
1er tampon d'équilibration (pH 7,0): urée 6 M, Glycérol 20% (v/v), Tris-HCl 1,5 M, SDS 2% (p/v)
et DTT 130 mM.
2ième tampon d'équilibration (pH 7,8): urée 6 M, Glycérol 20% (v/v), Tris-HCl 1,5 M, SDS 2%
(p/v) et iodoacétamide 135 mM.
L'électrophorèse en SDS-PAGE a été réalisée sur un gradient 4-20% en polyacrylamide dans un
tampon de pH 8,3 contenant Tris 25 mM, Glycine 192 mM et SDS 0,1% (p/v).
Après coloration, trois protéines ; P1, P2 et P3 d'intensité variable selon l'état des cellules
(normales ou cancéreuses) apparaissent sur les gels de la deuxième dimension. Elles sont identifiées
par leurs coordonnées de points isoélectriques (PI) et de poids moléculaires (PM) qui sont (4,8, 20),
(5,3, 40) et (5,8, 80) pour P1, P2 et P3.
La figure suivante représente une zone du protéinogramme couvrant les PI de 4,7 à 5,9 et les PM de
20 Kd à 80 Kd. Les 3 protéines d'intérêt sont indiquées par une flèche.
Les protéinogrammes de la deuxième dimension ont été comparés à ceux de la base de données
SWISS-2-DPAGE (http://expasy.org/ch2d).
Après leur élution des gels, les protéines d'intérêt ont été soumises à une digestion par la trypsine
dans un mélange constitué de bicarbonate d'ammonium 25 mM et de la trypsine 0,02% (p/v).
Les peptides résultant de l'action de la trypsine sont identifiés par spectrométrie de masse MALDI-
TOF. Les empreintes peptidiques obtenues sont comparées à la base de données Suiss-Prot ave le
moteur de recherche MASCOT.
1- Préciser les quantités ou les volumes des réactifs nécessaires pour la préparation de :
- 70 ml du deuxième tampon d'équilibration
- 150 ml de tampon d'électrophorèse SDS-PAGE.
On donne les PM suivants : urée : 60,06, Tris : 121,14, iodoacétamide : 184,96, Glycine :
75,07
2- Rappeler le rôle du CHAPS et de l'iodoacétamide
3- Rappeler le mode d'action de la trypsine
4- Rappeler la signification d'une empreinte peptidique générée par spectromètrie de masse
MALDI-TOF.
5- Préciser sur l'électrophorégramme les protéines P1, P2 et P3. Justifier vos réponses