Vous êtes sur la page 1sur 11

Ministère de l’enseignement Supérieur

et de la Recherche Scientifique

Université Péléforo Gon


Coulibaly Korhogo

Unité de Formation et de Recherche (UFR) des Sciences Biologiques

Travaux Dirigés de Génomique

Master 2021-2022

Noel D. Dago, MS.c, Ph.D

Maitre-Assistant (Cames) de Biologie Moléculaire/Bio-informatique


https://www.researchgate.net/profile/Dougba_Dago
https://scholar.google.it/citations?user=sS1ir2cAAAAJ&hl=it#
Introduction
La génomique est une discipline de la biologie moderne. Elle étudie le fonctionnement d'un
organisme, d'un organe, d'un cancer à l'échelle du génome. La génomique se divise en deux
branches :

 La génomique structurale, qui se charge du séquençage du génome entier ;


 La génomique fonctionnelle, qui vise à déterminer l'expression et la fonction des gènes
séquencés en caractérisant le transcriptome et le protéome.

Historique de la Génomique
L'essor de la génomique a été facilité par le développement des techniques de séquençage des
génomes et de la bio-informatique.
 En1972, le premier véritable séquençage d'un génome est publié, avec la lecture de la séquence
ARN du gène du virus bactériophage MS2.
 Elle a été très médiatisée à la fin du xxe siècle avec la compétition entre différentes équipes
scientifiques pour la publication de la première carte du génome humain en 2000.
 Depuis, un nombre croissant de génomes complets sont séquencés chez des espèces vivantes
très différentes espèces vivantes très différentes : le ver Caenorhabditis elegans en 1998,
la mouche drosophile et la plante Arabidopsis thaliana en 2000 ou encore, le chien en 2005.
En septembre 2007, une équipe menée par le biologiste et entrepreneur Craig Venter a publié le
premier génome complet d'un individu qui se trouve être Craig Venter lui-même. Le génome du
codécouvreur de la structure de l'ADN et ancien directeur du Projet génome humain, James
Watson, a aussi été séquencé dans son intégralité à la même période.
Utilité de la Génomique
Connaitre la séquence nucléotidique permet une multitude d'études :

 Exploration des fonctions associées aux gènes, aux variations alléliques et au polymorphisme
génétique ;
 Reconstruction d'arbres phylogénétique d’espèces vivantes ;
 Analyse de l’histoire évolutive des êtres vivants en lien avec leur écosystème
 Compréhension de maladies liées aux gènes.
Génomique Structurale
Cette branche de la génomique regroupe toutes les analyses de la structure des génomes
(Ici « structure » est entendu au sens « organisation des génomes »).
Les méthodes concernées sont donc le séquençage des génomes, l'identification des gènes, des
séquences régulatrices, des séquences répétées ….
Annotation des Génomes

L'annotation des génomes est une analyse informatique des séquences obtenues lors du séquençage
permettant d'identifier les séquences informatives des génomes. Ces séquences sont principalement
les gènes (on parle alors de prédiction de gènes). La plupart de ceux-ci sont identifiés soit par leur
similitude avec des gènes déjà connus, soit par une prédiction en fonction de la séquence (présence
d'un cadre de lecture ouvert caractérisé par un codon d'initiation de la traduction, puis au moins
100 codons et enfin un codon stop). Mais il existe aussi des « gènes morcelés » (contenant
des introns) ou codant des ARN fonctionnels, ceux-ci doivent être prédits par des algorithmes
différents.

Les gènes ne sont pas les seules cibles de l'annotation des génomes, il existe de nombreux autres
types de séquences importantes dans les génomes ; les séquences régulatrices, les éléments
transposables….

Génomique Fonctionnelle

Une fois les génomes annotés, l'étape suivante est la recherche de la fonction des séquences
informatives identifiées. La génomique fonctionnelle peut être considérée comme de la génétique à
« haut débit ». Les techniques utilisées seront comparables mais généralement appliquées à un
grand nombre de gènes en parallèle, cela peut par exemple être la création de mutants et l'analyse de
leurs phénotypes pour toute une famille de gènes, ou l'analyse de l’expression de tous les gènes
d’un organisme entier.

La Génomique Fonctionnelle analyse la fonction des gènes et autres parties du génome. Elle inclue
l'analyse du transcriptome (ARN messagers) ou transcriptomique. Elle contribue aussi très
largement à l'annotation des génomes et à l'identification des séquences informatives.

La Protéomique est l'analyse du protéome (ensemble des protéines d’un organisme). Elle contribue
aussi à l'annotation des génomes et à l'identification des séquences informatives.

PS: La génomique structurale, la génomique fonctionnelle, la transcriptomique et la


protéomique sont des approches complémentaires.
Génomique et Santé
La génomique est une discipline nouvelle qui présente un potentiel énorme dans divers secteurs
d’activité. Et c’est en santé humaine que la génomique aura assurément le plus grand impact. En
perçant le mystère du génome les chercheurs sont en mesure d'étudier les maladies. La génomique
leur permet de mieux comprendre, notamment pourquoi certaines personnes deviennent malades
alors que d'autres demeurent en santé presque toute leur vie. Les scientifiques peuvent aussi mettre
au point des outils diagnostiques, des traitements et des programmes de prévention efficaces pour
certaines maladies comme les maladies cardiovasculaires ou certains cancers.

Dans la pratique médicale, la génomique permet :

- d'améliorer les diagnostics;

- d’identifier des prédispositions génétiques d'une personne par rapport à une maladie;

- de mettre au point des traitements selon l'information génétique de chaque individu et, par
conséquent, de permettre l'avancement de la médecine personnalisée;

- de connaître les effets de nos modes de vie et de notre environnement sur notre génome et
notre santé.
Le Projet du Génome Humain

Résultat d’une coopération scientifique internationale sans précédent, le Projet du génome humain a
vu le jour officiellement en 1990. Evidemment, le but de ce projet était d’établir la séquence
complète du génome humain, ce qui aura pris près de 15 ans. Pour la communauté scientifique
médicale, le séquençage du génome humain revêt une grande importance puisqu’il permet, entre
autre, de déterminer quels gènes sont responsable de certaines maladies et d’en apprendre davantage
sur le fonctionnement des etres humains, en particulier sur les relations entre les gènes, les protéines
et les maladies.
I- Analyse de la Structure des Séquences Génomiques

Exercice 1

1- Identifier les bases présentes dans les structures suivantes

2- Parmi ces bases, lesquelles :


a) contiennent du ribose.
b) contiennent du désoxyribose.
c) contiennent une purine.
d) contiennent une pyrimidine
e) contiennent de la guanine.
f) sont des nucléosides.
g) sont des nucléotides.
h) se trouvent dans l’ARN.
i) se trouvent dans l’ADN.
3- Indiquer les extrémités 5’ et 3’ de la molécule A
4- On suppose vouloir procéder à un séquençage en utilisant la molécule A comme amorce. La
réaction outre l’amorce, contient les mêmes concentrations des molécules suivantes :
dATP, dGTP, dTTP, dCTP et ddCTP.
a) Quelle est la différence entre les molécules dCTP et ddCTP
b) Ecrivez toutes les séquences possibles, suite à un processus de séquençage en présence
des éléments ci-dessus mentionnés.
Exercice 2

La séquence d’un ADN bicaténaire, correspondant à un gène, est partiellement reportée ci-dessous.
5’ ATACGGGATCCGAGCTCTCGATCGTCTGCAGAAATTCC 3’

1- Ecrire la séquence et l’orientation du second brin de ce fragment.


2- Donner le brin complémentaire d’ARN.
3- Soient les enzymes de restriction BamH I, Pst I, Xho I et Mbo I dont les sites reconnus sont :
BamH I : 5' G/GATCC 3' ; Pst I : 5' CTGCA/G 3' ; Xho I : 5' C/TCGAG 3' ; Mbo I : 5'
/GATC 3'. Recopier la séquence de l’ADN et encadrer les sites de restriction en indiquant la
position des coupures.
4- Pour chaque enzyme, écrire les séquences des extrémités des molécules d’ADN digérées et
préciser le type d’extrémités obtenu.
5- On mélange ce brin d’ADN apparié avec son brin complémentaire à un autre fragment
d’ADN double brin. La solution est portée à une température supérieure à leurs Tm
respectives, puis refroidie. Que peut-on attendre?
6- Voici la séquence d’une amorce (ou primer) : 5’ - TTTCTGCA- 3’. Où cette amorce se
fixera-t-elle sur la séquence d’ADN ? Quelle séquence obtiendra-t-on après élongation par la
DNA-polymérase ?

Exercice 3

Parmi les séquences oligonucléotidiques suivantes lesquelles vous paraissent susceptibles


d’hybrider avec le fragment d’ADN ci-après.

Oligo-1: 5’-CGGGCACCCGGGTTA-3’

Oligo-2: 5’-CCCGGGGATCCCGGG-3’

Oligo-3: 5’-GACTGATCTGACATG-3’

Oligo-4: 5’-GAGAAACTGACTGAC-3’
5’ATCGGTGATCTGCAGTCCCGATCGGGCACCCGGGTTAGCGATCGTTTAATGGGTCGG
CCCGGGGATCCCGGGCCTGGACTGATCTGACATGGTGTCAGTCAGTTTCTC 3’.

Vous réalisez un séquençage de ce fragment d’ADN par la méthode de Sanger avec l’amorce
oligonucléotidique simple brin suivante: 5’-TCAGATCAGTCCAGG-3’. Schématisez
l’autogradiographie du gel de séquençage que vous devriez obtenir.
Exercice n° 4

La séquence d’ADN ci-dessous vient de vous être fournie.


5’ATCGGTGATCTGCAGTCCCGATCGGGCACCCGGGTTAGCGATCGTTTAATGGGTCGG
CCCGGGGATCCCGGGCCTGGACTGATCTGACATGGTGTCAGTCAGTTTCTC 3’

1. Pouvez-vous fragmenter cette molécule avec les endonucléases de restrictions suivantes :


BamH1 (G/GATCC), HpaII (C/CGG), PvuI (CGAT/CG), Sau3A (/GATC), SmaI
(CCC/GGG), XbaI (T/CTAGA) ?
2. Placez les sites existants et schématisez les extrémités 5’ et 3’ après coupure pour chaque
enzyme.
3. Que deviennent ces extrémités lorsque les fragments obtenus après coupure sont incubés en
présence de l’ADN polymérase Klenow en présence de dNTPs ?
4. Après cette modification, vous faites agir une ligase. Avez-vous régénéré l’ensemble des
sites ?

Exercice n° 5

Un fragment d’ADN HindIII-HindIII de 1kb est digéré par l’enzyme EcoRI en un fragment de 300
pb et un fragment de 700 pb. Si le fragment de 300 pb est purifié et digéré par l’enzyme PstI, il
donne deux fragments : l’un de 100 pb et l’autre de 200 pb. Si le fragment de 700 pb est traité de la
même façon, il produit deux fragments : l’un de 500 pb et l’autre de 200 pb. Lorsque le fragment
HindIII-HindIII est digéré directement par l’enzyme Pst1 on obtient trois fragments : 100, 200 et
700 pb. Expliquez ces résultats à l’aide de schémas. Qu’obtiendrait-on en effectuant la double
digestion EcoRI et PstI sur le fragment de 1kb ?

II- Séquençage

Exercice 6

Vous disposez d’un brin d’ADN à séquencer (matrice), d’une amorce, d’ADN polymérase, des
quatre 2’- désoxyribonucléotides (dXTP) et d’un jeu des différents 2’,3’-didésoxyribo-nucléotides
(ddXTP). L’amorce est radio-marquée par du phosphore radioactif 32P. L’ADN matriciel à
séquencer ACGTAATCGC---- comporte, à son extrémité 3’, une séquence supplémentaire
(représentée ici par un segment de droite en pointillé) sur laquelle l’amorce va s’hybrider, créant
ainsi le site d’initiation de l’ADN polymérase.

1 - Résumez brièvement le principe de la méthode en indiquant le rôle du didésoxyribonucléotide.


2- Compléter un tableau en indiquant la composition des différents milieux réactionnels et, pour
chaque milieu, le type et la taille des fragments néo synthétisés.
3- Schématisez le résultat de la migration des produits obtenus pour chaque mélange réactionnel.
Utiliser une échelle un carreau pour une base.

5- Reporter, à droite, la séquence du brin synthétisé puis la séquence recherchée, en indiquant


le sens de lecture des séquences établies.

Exercice 7
Le présent gel représente le profil d'électrophorèse du contenu du tube dans un processus de
séquençage d’ADN d’une cellule.
1- Décrivez le contenu du tube en termes de nucléotides.
2- Ecrivez les quatre (4) réactions de polymérisation possible dans le tube en question.
3- GCGAATGCGTCCACAACGCTAC reporte la mutation suivante : c.10T>G. En
conservant le cadre des réactions de polymérisation plus haut mentionné, combien de
fragment d’ADN après le séquençage complet de l’ADN reporteront la mutation en
question ?

III- Analyse du Protéome

Exercice 8
L’acronyme ORF en anglais signifie Open Reading Frame (ouverture de séquence de lecture)
débute par la séquence ‘ATG’ du code génétique dans la molécule d’ADN pour s’achever avec un
codon de stop (Voir le tableau Code Génétique ci-dessous)
1- Indiquer le nombre maximum de séquence ORF de la présente molécule d’ADN et si
possible leur différente position.
2- Il existerait une séquence ORF en correspondance de la position 80 de la présente molécule
d’ADN.
a- Retrouver la première séquence de stop après la séquence ORF en correspondance de la
position 80.
b- D’après le code génétique (voir tableau ci-dessous) déterminez pour quelle protéine
code cette ORF.
ATGGCACATTACCAAAACCAGTACGCTGCACCTGCATCCCAAGTCGACGAATACGGCAACCCGATTCGCACGG
ACCAATATGGCAACACAATTCGCACGGACGAATATGGCAACCCGATTCGCACGGACGAATTTGGCAACCCGAT
CCACCACATGACCGGCACCGCCGGCAGCTACGGATCCGGTGGATACGACACCACCACTCTCCAAGGTATGAGT
CATGATGTAACGGGGACTGGCGCCCACGGCGTTTCTGGCAAGCTTCATCGCTCTGGAAGCTCAAGCTCTAGCT
CTTCGGAGGATGATGGGCATGGCGGGAGAAGGAAGAAGAAGGGGCTGACGGGGAAGATAAAGGAGAAGATAC
CTGGTGTTGGACACAAGGATCACCGTAGTAATACAAGTGCAACTACCCCATATGGTTACGATGAGGGGCAACT
ACACCATCAGGAGAAGAAGGGGGTGATGGAAAAGATCAAAGAGAAGCTTCCTGGCCACCACTAG

Exercice 9

Afin d'étudier par voie de la protéomique les changements affectant des cellules cancéreuses chez
l'Homme, des auteurs ont procédé à la préparation d'échantillons protéiques à partir de cellules
saines et de cellules malades.
Le tampon de lyse utilisé dans cette étude est constitué d'une solution contenant, entre autres,
CHAPS (détergent non ionique) 4% (p/v) et Tris-HCl (pH 7,8) 40 mM.
L'électrophorèse en première dimension est une isoélectrofocalisation sur un gradient de pH 4,7-
5,9 effectuée dans un tampon composé de l'urée 8 M, CHAPS 2% (p/v), Ampholyte 0,2% (p/v),
Dithiothreitol (DTT) 3,7% (p/v) et le bleu de Bomophénol 0,001% (p/v)
Avant la réalisation de l'électrophorèse SDS-PAGE (deuxième dimension), les gels de la première
électrophorèse ont subit l'équilibration dans deux tampons de compositions suivante :

1er tampon d'équilibration (pH 7,0): urée 6 M, Glycérol 20% (v/v), Tris-HCl 1,5 M, SDS 2% (p/v)
et DTT 130 mM.
2ième tampon d'équilibration (pH 7,8): urée 6 M, Glycérol 20% (v/v), Tris-HCl 1,5 M, SDS 2%
(p/v) et iodoacétamide 135 mM.
L'électrophorèse en SDS-PAGE a été réalisée sur un gradient 4-20% en polyacrylamide dans un
tampon de pH 8,3 contenant Tris 25 mM, Glycine 192 mM et SDS 0,1% (p/v).

Après coloration, trois protéines ; P1, P2 et P3 d'intensité variable selon l'état des cellules
(normales ou cancéreuses) apparaissent sur les gels de la deuxième dimension. Elles sont identifiées
par leurs coordonnées de points isoélectriques (PI) et de poids moléculaires (PM) qui sont (4,8, 20),
(5,3, 40) et (5,8, 80) pour P1, P2 et P3.

La figure suivante représente une zone du protéinogramme couvrant les PI de 4,7 à 5,9 et les PM de
20 Kd à 80 Kd. Les 3 protéines d'intérêt sont indiquées par une flèche.
Les protéinogrammes de la deuxième dimension ont été comparés à ceux de la base de données
SWISS-2-DPAGE (http://expasy.org/ch2d).
Après leur élution des gels, les protéines d'intérêt ont été soumises à une digestion par la trypsine
dans un mélange constitué de bicarbonate d'ammonium 25 mM et de la trypsine 0,02% (p/v).
Les peptides résultant de l'action de la trypsine sont identifiés par spectrométrie de masse MALDI-
TOF. Les empreintes peptidiques obtenues sont comparées à la base de données Suiss-Prot ave le
moteur de recherche MASCOT.

1- Préciser les quantités ou les volumes des réactifs nécessaires pour la préparation de :
- 70 ml du deuxième tampon d'équilibration
- 150 ml de tampon d'électrophorèse SDS-PAGE.
On donne les PM suivants : urée : 60,06, Tris : 121,14, iodoacétamide : 184,96, Glycine :
75,07
2- Rappeler le rôle du CHAPS et de l'iodoacétamide
3- Rappeler le mode d'action de la trypsine
4- Rappeler la signification d'une empreinte peptidique générée par spectromètrie de masse
MALDI-TOF.
5- Préciser sur l'électrophorégramme les protéines P1, P2 et P3. Justifier vos réponses

Vous aimerez peut-être aussi