Académique Documents
Professionnel Documents
Culture Documents
COURS DE
BIOLOGIE MOLECULAIRE
Module : M25
1
Chapitre I :
Introduction
2
A) Réplication de l’ADN chez les procaryotes
I- Caractéristiques générales de la réplication
Figure 1 : Brins originaux se déroulent par une rotation autour de l’axe de la double
hélice de l’ADN non encore répliqué. La séquence nucléotidique d’un brin impose la
séquence du brin complémentaire.
Les deux brins se séparent et chacun d’eux est copié pour former un brin complémentaire.
Chaque brin parental reste associé avec le brin complémentaire nouvellement synthétisé. Les
deux ADN bicaténaires contiennent donc un brin parental et un nouveau brin.
Les deux brins d’ADN antiparallèles sont répliqués simultanément. Toutes les ADN
polymérases connues ne peuvent allonger les brins d’ADN que dans le sens 5’ 3’.
En 1968, Reiji Okazaki a formulé le modèle de la réplication semi- discontinue. Les deux brins
parentaux sont répliqués de manière différente. Le brin d’ADN néosynthétisé qui s’allonge dans
la polarité 5’ 3’dans le sens de déplacement de la fourche de réplication est appelé le brin
3
avancé, il est synthétisé de façon continue de 5’ 3’ au fur et à mesure que la fourche de
réplication avance.
L’autre brin néosynthétisé s’appelle le brin retardé, il est aussi synthétisé de 5’ 3’ mais de
manière semi- discontinue sous forme de fragments d’Okazaki. Ces derniers ne sont reliés entre
eux que quelques temps après la synthèse par l’ADN ligase.
Toutes les ADN polymérases doivent disposer de la présence d’un groupement 3’OH libre pour
pouvoir allonger un brin d’ADN.
E. coli possède deux enzymes capables de catalyser la formation de ces amorces d’ARN :
l’ARN polymérase, enzyme multimérique d’environ 459 kDa responsable de la transcription et
une primase beaucoup plus petite (60 kDa), monomère produit par le gène DnaG.
La primase est insensible à la rifampicine, un inhibiteur de l’ARN polymérase. La rifampicine
n’inhibe que la synthèse du brin avancé, ce qui montre indirectement que la primase produit les
amorces pour la synthèse des fragments d’Okazaki.
Figure 2 : La synthèse d’ADN est amorcée par des petits fragments d’ARN.
La réplication de l’ADN est un processus complexe qui implique une assez grande variété de
molécules et d’enzymes.
L’ADN parental, où chacun des deux brins sert de matrice pour synthétiser le nouveau
brin.
La présence de nombreux enzymes (Topoisomérases, Hélicases, ADN polymérases,
ADN ligase...)
La présence d’une amorce d’ARN (synthétisée grâce à une ARN polymérase ou
primase).
La présence de nucléotides propres à l’ADN, c’est-à-dire contenant du 2’désoxyribose,
des bases A, T, G et C et sous forme de nucléosides triphosphates : dATP, dTTP, dCTP
et dGTP (on écrit souvent pour les dénommer dNTP).
Les ions Mg2+ qui stabilisent les dNTP en les protégeant d’une hydrolyse enzymatique.
Ils sont également importants pour l’ADN polymérase.
4
III- Mécanisme de la réplication
1) Notion de réplicon
L’unité d’ADN où se produit la réplication est appelée le réplicon. Ce réplicon a une origine
où est initiée la réplication et une terminaison où est arrêtée la réplication.
La réplication de l’ADN est un processus complexe qui implique une assez grande variété
d’enzymes.
a) L’ADN polymérase I
Arthur Kornberg en 1957, publie la découverte d’une enzyme catalysant la synthèse d’ADN
dans des extraits d’E. coli. Cette enzyme connue depuis comme l’ADN polymérase I, est un
monomère de 928 résidus d’acides aminés.
Le taux d’erreurs de l’ADN Pol. I par rapport à l’ADN copié est très faible. Il est de l’ordre
d’une base fausse pour 10 millions.
5
Le mécanisme catalytique de l’ADN polymérase met en jeu deux ions métalliques.
Les sites actifs des ADN polymérases contiennent deux ions Mg2+. Un ion Mg2+ active le
groupement 3’(OH) de l’amorce pour effectuer une attaque nucléophile directe sur un
phosphate du dNTP qui se présente.
L’autre ion Mg2+ a pour rôle l’orientation et la stabilisation électrostatique du groupement triP
porteur d’une charge négative, auquel il est lié et qui conduit à la libération de PPi.
Des protéases comme la trypsine coupent Pol. I en deux fragments : le grand fragment
« Klenow » (résidu 324 à 928) contient les activités de polymérase et d’exonucléase 3’ 5’, et
un fragment plus petit (résidu 1 à 323) contient l’activité exonucléase 5’ 3’.
6
4) La fonction physiologique exonucléasique 5’ 3’ de Pol. I est d’enlever les amorces
d’ARN (Nick- Translation).
La découverte de mutants d’E. coli se multipliant normalement avec très peu d’activité Pol. I a
évidemment encouragé la recherche d’une autre activité de polymérisation de l’ADN. Deux
enzymes nouvelles ont été découvertes (Pol. II et Pol. III).
Un mutant E. coli qui n’a pas d’activité détectable Pol. II se multiplie normalement. Ce produit
Pol. II est impliqué dans la réparation des lésions de l’ADN via la réponse S.O.S, tout comme
le sont les deux autres enzymes d’E. coli découvertes récemment : l’ADN pol. IV et l’ADN
pol. V.
7
L’exonucléase 5’ 3’ de Pol. III n’est active que sur un ADN simple brin, elle ne peut donc
pas catalyser la réaction de Nick- translation.
L’enzyme Pol. III a une processivité pratiquement illimitée sur plus de 5000 résidus
8
Figure 7 : Déroulement d’ADN sous l’action conjuguée des protéines DnaB et SSB.
e) L’ADN ligase
L’ADN Pol. I peut remplacer les amorces ARN des fragments d’Okazaki par de l’ADN par le
processus de déplacement de cassure. En effet, de cette activité de remplacement, il résulte des
cassures simple brin entre des fragments d’Okazaki adjacents. Celles- ci, de même celle
correspondant à la fin de réplication du brin avancé d’un ADN circulaire, sont ressoudés par
une réaction catalysée par l’ADN ligase. L’énergie libre demandée par cette réaction est fournie
selon les espèces en couplage avec une hydrolyse, soit de NAD+ en NMN+ + AMP, soit de
l’ATP en PPi + AMP.
L’enzyme d’E. coli est un monomère de 671 résidus, elle utilise NAD+ au cours d’une réaction
de 3 étapes. Dans le cas des ADN ligases eucaryotes ou de ligase T4, le NAD+ est remplacé par
l’ATP de telle manière que c’est du PPi plutôt que du NMN+ qui est éliminé au cours de la
première étape de la réaction.
L’ADN ligase catalyse la formation d’une liaison phosphodiester en accrochant le 3’ (OH) sur
le groupement 5’ phosphoryle, ce qui ligature la cassure et libère l’AMP. (Activation de
l’extrémité 5’ P à joindre).
9
brin retardé du duplex d’ADN dans le sens 5’ 3’, la primase doit se retourner par rapport à
sa direction de déplacement pour synthétiser une amorce ARN dans le sens 5’ 3’. La primase
d’E. coli peut synthétiser des amorces allant jusqu’à 60 nucléotides in vitro, bien qu’in vivo, les
amorces aient une longueur de 11 (plus ou moins 1) nucléotides. Comme la fourche de
réplication d’E. coli se déplace d’environ 1000 nucléotides/s et que les fragments d’Okazaki
ont une longueur d’environ 1000 nucléotides, la primase doit synthétiser environ une amorce
ARN/s.
g) Les topoisomérases :
Comme la réplication de l’ADN d’E. coli s’effectue à une vitesse proche de 1000 nucléotides
par seconde et qu’il y a environ 10 pb par tour d’hélice, le chromosome accumulerait 100
superenroulements par seconde.
Les topoisomérases de type I, modifient l’enlacement de l’ADN bicaténaire en introduisant une
coupure dans une liaison phosphodiester puis en la réparant. Pour les topoisomérases de la
classe II, elles coupent les deux brins au même temps et les réparent par la suite, elles sont
indispensables à la terminaison de la réplication. Les deux enzymes équilibrent le
superenroulement de l’ADN en le réduisant soit d’un tour (Top I), soit de deux tours (Top II)
par cycle de réaction.
a) Ori C.
L’origine de réplication pour le chromosome d’E. coli est un segment de 245 pb appelé locus
oriC. La séquence de ce segment est très conservée parmi les bactéries gram-.
Le site contient 4 répétitions de 9 pb (nonamères), dont la séquence consensus est
5’TTATCCACA3’et sur lesquelles se fixent spécifiquement les protéines DnaA. La protéine
DnaA est le facteur d’initiation de réplication de l’ADN. Cette protéine de 52 kDa (467 résidus),
se lie de façon coopérative. Le processus d’assemblage est facilité par la présence d’une
protéine de type histone HU. Le complexe final ressemble à un nucléosome, avec l’ADN d’oriC
formant un superenroulement autour d’un cœur constitué de protéines DnaA. Les protéines
DnaA favorisent alors la détorsion des brins de l’ADN bicaténaire par interaction avec 3
segments de 13 pb riches en AT (séquence consensus : 5’GATCTNTNTTNTT3’, dans laquelle
10
N représente toute base). Ces segments sont situés au voisinage de l’extrémité 5’ de la séquence
oriC. La formation par la protéine DnaA de ce complexe ouvert de 45 pb exige de l’ATP.
Dans ce complexe ouvert, entre la protéine DnaB apportée par le complexe DnaB- DnaC
formant un complexe de préamorçage. DnaC, une ATP ase qui aide la fixation de DnaB est
ensuite libérée.
La protéine DnaB qui est une hélicase déroule ensuite l’ADN dans les deux sens dans le
complexe de préamorçage en présence de SSB et de gyrase pour laisser entrer la primase et
l’ARN polymérase. Le stade qui permettra la réplication bidirectionnelle de l’ADN par la forme
holoenzyme de Pol. III est donc atteint.
11
c) La terminaison de la réplication.
La région où la réplication se termine est, chez E. coli, une région assez longue de 350 Kb
bordée par sept sites presque identiques, non palindromiques, de 23 pb environ appelés sites
terminateurs TerE, TerD et TerA d’un côté et TerG, TerF, TerB et TerC de l’autre. OriC est à
l’opposé de cette région dans le chromosome d’E. coli.
L’arrêt de la progression d’une fourche de réplication au niveau des sites Ter, requiert
l’intervention de la protéine Tus, monomère de 309 résidus, produit du gène tus. La protéine
Tus se lie spécifiquement à un site Ter et y empêche le déroulement des brins par l’hélicase
DnaB, ce qui arrête la progression de la fourche. La protéine Tus interagit avec la protéine
DnaB pour inhiber son action hélicase.
Il est cependant curieux de constater que ce système de terminaison n’est pas indispensable
pour que cette dernière ait lieu. Lorsque cette région « terminus » est perdue, la réplication
s’arrête tout simplement parce que les deux fourches opposées se rencontrent. Cependant, le
système d’achèvement est très conservé parmi les bactéries gram-.
Figure 11 : Carte du chromosome d’E. coli montrant la position des sites Ter.
d) Fidélité de la réplication.
Il faut assurer une fidélité presque parfaite de la réplication afin de préserver l’intégrité du
message génétique à transmettre de génération en génération.
Il n’arrive qu’un mésappariement par 108 à 1010 paires de bases répliquées. Une telle précision
dans la réplication est le résultat de quatre adaptations.
12
3) Les fonctions exonucléase 3’→5’ de Pol. I et de Pol. III permettent de détecter et
d’éliminer les erreurs qui restent encore après l’intervention de la fonction polymérase.
En effet, les mutations qui augmentent l’activité exonucléase de correction sur épreuve
d’une polymérase, font chuter le taux de mutations détecté sur d’autres gènes
marqueurs.
13
III. Enzymes et protéines eucaryotes
Les différentes enzymes et protéines intervenant dans la réplication eucaryote sont :
Les nucléosomes sont des structures composées de protéines basiques : les histones. L’ADN
est enroulé autour de ces histones, et enroulé sur lui-même, dans un état de condensation.
D’après les connaissances actuelles, la présence des nucléosomes ne semble pas affecter les
fourches de réplication.
Les génomes des cellules filles doivent être identiques au génome de la cellule mère, ce qui
concerne également les nucléosomes.
14
Les nucléosomes parentaux restent associés, puis une répartition équivalente se fait entre les
deux brins (brin parental et brin fils) de la molécule d’ADN. Pendant la phase S du cycle
cellulaire, de nouveaux nucléosomes sont synthétisés pour compléter les nucléosomes
parentaux dans les cellules filles. Chaque brin possède alors 50% de nucléosomes parentaux et
50% de nucléosomes néosynthétisés.
La présence de ces nucléosomes est à l’origine du fait que la réplication chez les eucaryotes est
beaucoup plus lente que chez les procaryotes.
Les télomères sont des séquences d’ADN situées aux extrémités des chromosomes. On y
retrouve une séquence répétée en tandem (chez l’homme : TTA GGG).
15
Figure 15 : Mécanisme de la télomérase
16
Chapitre II
Introduction :
17
I. Origine des altérations de l’ADN
I.1 Agents physiques
L’ADN peut être agressé par des agents physiques comme les rayons X, les rayons gamma, les
rayons ultra-violets (UV). Ces agents sont des agents mutagènes les plus anciennement connus
(mutagènes = qui provoquent des mutations dans l’ADN).
Les rayons UV provoquent la formation de dimères de thymine mais aussi de dimères de
thymine-cytosine. La présence de tels dimères entraîne un blocage de la réplication de l’ADN
et de la transcription. Sans réparation, leur présence serait donc létale pour la cellule
18
Figure 16 : Bases endommagées
d) Erreurs de la réplication
Nous avons vu qu’au cours de la réplication de l’ADN, les ADN polymérases présentent une
activité exonucléasique 3’→5’ qui leur permet de vérifier si la dernière base introduite
correspond bien aux conditions classiques d’appariement.
Au cours de la réplication, il a été estimé que l’ADN polymérase III introduit un nouveau
nucléotide avec un taux d’erreur de 1/104 à 1/105 nucléotides incorporés, mais avec la fonction
d’édition, finalement le taux d’erreur passe à 1/108 à 1/1010 nucléotides incorporés. Cette
différence considérable correspond à la fidélité de la réplication.
e) Formation de ponts entre les brins de l’ADN ou entre des protéines et l’ADN
Certains agents chimiques (psoralènes par exemple) ou physiques (UV, radiations ionisantes)
peuvent conduire à des interactions stables («crosslinks») entre les deux brins d’ADN.
19
III. Mécanismes de réparation de l’ADN
A) Restauration immédiate des lésions
L’irradiation par les UV de 200 à 300 nm provoque la formation d’un cycle cyclobutyle entre
les résidus de thymine adjacents d’un même brin d’ADN, pour former un dimère de thymine
dans le même brin. Ces dimères de thymine déforment localement la double hélice d’ADN de
telle façon qu’elle ne peut plus servir de matrice adéquate à la transcription ni à la réplication.
De fait, un simple dimère de thymine non réparé suffit à provoquer la mort d’E. coli.
Les dimères de pyrimidines peuvent être restaurés sous leur forme monomérique, grâce à
l’activité d’enzymes présentes chez de nombreux procaryotes et eucaryotes appelés ADN
photolyases. Les ADN photolyases se fixent avec une forte affinité sur l’ADN double ou simple
brin, mais sans spécificité de séquence.
Figure 17 : Absorption des UV par deux résidus de thymines adjacents d’un même
brin d’ADN aboutit à la formation d’un dimère de thymine.
Si l’ADN est exposé à des agents alkylants comme le N- méthyl- N’- nitro- N-nitrosoguanidine
(MNNG), il se forme, parmi d’autres produits, des résidus O6- alkyl- guanine. La formation de
tels dérivés est très mutagène .Chez toutes les espèces étudiées, les lésions de l’ADN sous forme
O6- méthyl guanine et O6- éthyle guanine sont réparées par une O6- méthyl guanine- ADN-
méthyle transférase, qui transfère directement le groupement alkyl lésionnel sur l’un de ses
propres résidus Cys. La réaction inactive cependant cette protéine, qui ne peut être qualifiée
d’enzyme (voir mode d’action).
Figure 18 : Formation de résidus O6- méthyle guanine, sous l’action d’agents alkylants
20
Figure 19 : Mode d’action de l’O6- méthyle - guanine- ADN- transférase.
* La réparation par excision de nucléotides (NER, pour nucleotide excision repair), qui sert à
réparer les lésions assez importantes de l’ADN.
* La réparation par excision de base (BER, pour base excision repair), qui répare les lésions
ponctuelles d’une seule base.
Le mécanisme NER chez les procaryotes est similaire à celui des eucaryotes.
Chez E. coli, la réparation NER est un processus dépendant de l’ATP et dû à l’action des
protéines UvrA, UvrB et UvrC, produits par les gènes uvrA, uvrB et uvrC.
Mécanisme NER : L’hétéro trimère (UvrA) 2 UvrB se fixe fortement mais de façon non
spécifique à l’ADN double brin. La présence d’une lésion active la fonction hélicase d’UvrB
qui déroule 5 pb autour de la lésion selon un processus nécessitant de l’ATP. Ce changement
de conformation induit la dissociation de UvrA qui quitte le complexe autorisant la fixation
d’UvrC. UvrB effectue alors une coupure du côté 3’ de la lésion, à la suite de quoi UvrC fait
une incision du côté 5’. UvrD se fixe au niveau des trous dans l’ADN et détache UvrC et
l’oligomère contenant la lésion. Ainsi, le site d’incision devient accessible à Pol.I qui comble
le trou et détache UvrB. Finalement, la ligature par l’ADN ligase restaure l’ADN.
21
Figure 20 : Mécanisme de réparation par excision de nucléotides.
Les bases de l’ADN peuvent être modifiées aussi bien par des réactions qui ont lieu dans des
conditions physiologiques normales que suite à l’action des agents présents dans
l’environnement. Par exemple, les résidus adénine et cytosine peuvent être spontanément
désaminés à un certain taux pour former respectivement des résidus hypoxanthine et uracile.
La S-adénosylméthionine (SAM), un agent méthylant normal du métabolisme, peut parfois
méthyler une base, sans l’aide d’enzyme, pour former des dérivés comme des résidus 3-méthyl
adénine et 7-méthyl guanine. Les radiations ionisantes peuvent provoquer des réactions
d’ouverture de cycle des bases. Ces changements modifient ou suppriment les propriétés
normales d’appariement des bases.
22
Figure 20 : Dommages subis spontanément par l’ADN : la désamination et la
dépurination.
L’ADN porteur d’une base endommagée peut être restauré dans son état initial grâce à la
réparation par excision de base (BER). Les cellules contiennent des ADN glycosylases variées
qui peuvent chacune cliver la liaison glycosidique correspondant à un nucléotide spécifique
altéré, laissant ainsi un résidu désoxyribose sans base dans la double hélice d’ADN. Ces sites
apuriques ou apyrimidiques (sites AP) sont aussi formés dans les conditions physiologiques
normales par l’hydrolyse spontanée d’une liaison glycosidique. Le résidu désoxyribose est alors
coupé d’un coté par une endonucléase apurique AP, le désoxyribose et quelques résidus
adjacents sont enlevés par une exonucléase cellulaire et le trou est comblé par une ADN
polymérase ; il y a ligature ensuite par l’ADN ligase.
23
Figure 21 : Les ADN glycosylases hydrolysent la liaison glycosidique de la base altérée
correspondante pour produire un site apurique (AP).
Les mésappariements post-réplicatifs qui ont échappé aux activités correctrices des ADN
polymérases, peuvent encore être corrigés par un processus appelé réparation des
mésappariements (NMR pour mismatch repair).
Puisque le système NMR est sensé corriger les erreurs réplicatives pour éviter qu’elles ne se
perpétuent, il lui faut discerner l’ADN parental, qui possède la séquence correcte, du brin fils,
qui renferme une base incorrecte.
Chez E. coli, cette distinction est possible car les palindromes GATC nouvellement répliqués
restent hémiméthylés jusqu’à ce que la Dam- méthylase ait eu le temps de méthyler le brin fils.
La réparation des mésappariements chez E. coli, requiert la participation de trois protéines et se
réalise de la façon suivante :
24
Figure 22 : Mécanisme de réparation des mésappariements d’E. coli.
25
Exemple de mutation : dimère T-T.
Au moment de la réplication, un tel dimère ne peut être copié par Pol.III, qui va passer ce site
endommagé sans le répliquer. Les deux molécules d’ADN issues de la réplication sont de nature
différente. Une avec le brin parental à défaut structural, apparié avec un brin synthétisé qui
présente une ouverture assez importante. L’autre molécule est normale. Le système de
rétablissement va profiter de l’existence de ce double brin d’ADN parfait. La région contenant
la lésion doit recevoir un brin complémentaire.
Le mécanisme de recombinaison utilise l’ADN homologue sur l’autre bras de la fourche de
réplication. Un échange des brins médié par la protéine RecA transfère un brin complémentaire
intact provenant de l’ADN homologue transformant la région contenant la lésion en un
hétéroduplex.
E) Réponse SOS
Lorsque les lésions de l’ADN sont importantes, la réparation devient beaucoup moins exacte et
l’on observe un taux de mutations élevé.
On parle de réparation sujette à erreur qui est une voie distincte et non usuelle nécessitant une
induction d’un certain nombre de protéines qui peut se résumer dans le schéma suivant :
26
Figure 25 : Schéma général résumant le passage de la réponse SOS de la situation de
répression à la situation d’induction des gènes intervenant dans la réponse SOS.
Les gènes S.O.S sont induits lorsque le chromosome bactérien est endommagé de façon
importante. Les éléments régulateurs sont :
- Le répresseur LexA: régule la transcription de tous les gènes S.O.S.
- La protéine RecA, ayant une activité de cooprotéase.
Des dommages importants de l’ADN entraînent la formation de nombreux « simple brin » dans
l’ADN. Ces brèches procurent le signal moléculaire qui active la protéine RecA entraînant la
coupure du répresseur LexA (autocoupure) et l’induction de réponse S.O.S.
LexA fonctionne comme un répresseur de 43 gènes participant à la réparation de l’ADN et au
contrôle de la division cellulaire.
L’analyse des séquences des gènes réprimés par LexA a montré la présence d’une séquence
homologue de 20 nucléotides appelée boite S.O.S. Pendant la croissance normale, LexA
réprime l’expression des gènes S.O.S en se fixant à leur boite S.O.S de façon à empêcher l’ARN
polymérase d’initier la transcription de ces gènes.
27
Figure 26 : LexA et RecA sont exprimées normalement à faible niveau. La quantité de
LexA disponible est suffisante pour réprimer complètement les autres gènes SOS. Quand
l’ADN est endommagé, la protéine RecA, en association avec de l’ADN simple brin,
entraîne la destruction du répresseur LexA. Cela permet la forte expression de RecA et
des autres gènes SOS, dont les produits sont nécessaires à la réparation de l’ADN.
Dans la réponse SOS, la synthèse des ADN polymérases de contournement est induite : l’ADN
polymérase IV et l’ADN polymérase V. Ces enzymes appartiennent à la famille des ADN
polymérases, dépourvus d’activité exonucléase 3’→.5’ de correction, et pour lesquelles la
réplication d’un ADN intact est à la fois peu fidèle et de faible processivité, c’est pourquoi, on
les appelle ADN polymérases productrices d’erreurs.
Pol.II est également induite lors de la réponse SOS et est capable de répliquer l’ADN au niveau
des lésions qui bloquent Pol.III. Comme un appariement correct de bases est souvent impossible
au niveau des lésions, cette réplication est souvent sujette à erreur.
Conclusion : La réparation par le système SOS provoque des erreurs et elle est donc mutagène,
c’est pourquoi ce processus de dernier recours ne se met en marche qu’environ 50 minutes après
l’induction de type SOS, et seulement si l’ADN n’a pas pu être réparé d’une autre façon. En
fait, la plupart des mutations d’E. Coli sont provoquées par le système SOS de réparation et
montrent qu’il vaut mieux survivre avec un risque de perte de fonction que de mourir, car ceci
donne une chance de gagner de nouvelles fonctions.
28
Chapitre III
Transcription génétique
Introduction
29
I. Introduction générale
La relation entre l’ADN, l’ARN et les protéines se résume dans un schéma d’enchaînement que
Francis Crick appela en 1958, le dogme central de la biologie moléculaire. L’ADN dirige sa
propre réplication et sa transcription en ARN qui, à son tour, dirige sa traduction en protéines.
La transcription constitue l’ensemble des mécanismes par lequel l’ARN messager (ARNm) est
synthétisé. L’ARNm est une copie d’une portion de l’ADN. Seules certaines portions de l’ADN
sont transcrites, ces séquences d’ADN sont appelées gènes. Enfin, seul l’un des deux brins
d’ADN est copié en ARNm. La transcription constitue l’étape préliminaire essentielle pour la
biosynthèse protéique (ou traduction).
La réplication et la transcription diffèrent sur un point important. La réplication est totale alors
que la transcription est sélective. Cette régulation met en jeu un grand nombre de protéines.
Trois principaux types d’ARN sont produits.
- L’ARNm porte la succession des bases qui codent pour la séquence d’acides aminés
d’un ou de plusieurs polypeptides, déterminés par un gène ou un ensemble de gènes
dans les chromosomes.
- L’ARN de transfert (ARNt) est un adaptateur qui reconnaît l’information codée dans
l’ARNm et transfère l’acide aminé approprié jusqu’à la chaîne polypeptidique en
croissance durant la synthèse protéique.
- Les ARN ribosomiques (ARNr) s’associent à des protéines pour former le ribosome,
une machinerie complexe de synthèse des protéines.
Par ailleurs, il existe de nombreux ARN spécialisés possédant des fonctions catalytiques ou
régulatrices.
30
II.3. Différentes étapes de la transcription
La transcription ne concerne qu’une portion de l’ADN. Il est bien évident qu’il faut définir le
début et la fin de la transcription et préciser les mécanismes par lesquels l’ARN-polymérase
reconnaît la portion d’ADN à transcrire. On parle également d’unité transcriptionnelle.
La synthèse de l’ARN messager comprend trois phases successives : l’initiation (ou début),
l’élongation de la chaîne polynucléotidique et enfin, la terminaison.
31
La chimie de base de la synthèse de l’ARN a beaucoup de choses en commun avec la synthèse
de l’ADN. L’ARN polymérase possède une activité polymérasique 5’→3’.
A la différence de l’ADN polymérase, l’ARN polymérase n’a pas besoin d’une amorce pour
commencer la synthèse. La synthèse de l’ARN débute en général par un GTP ou ATP dont le
groupement 5’ triP n’est pas clivé pour libérer du PPi, mais reste intact durant l transcription.
Chez les bactéries, un seul enzyme catalyse la synthèse de tous les ARN cellulaires.
L’holoenzyme de l’ARN polymérase d’E. coli est une protéine de 449 kDa environ qui présente
la composition en sous unités 2 ’ . Une fois que la synthèse d’ARN a été amorcée,
la sous unité ( 70, masse moléculaire est de 70 kDa) se dissocie du cœur de l’enzyme, 2
’ , qui assure le véritable processus de polymérisation.
Figure 30 : Structure des sous unités de l’ARN polymérase d’E. Coli. Les sous unités
, ' et forment le core enzyme. L e facteur 70, associé au core, forme
l’holoenzyme.
L’ARN polymérase possède une taille imposante caractéristique, qui résulte probablement de
diverses fonctions que doit accomplir l’enzyme.
1) la liaison à la matrice,
2) l’initiation de la chaîne d’ARN,
3) l’élongation de la chaîne,
4) la terminaison de la chaîne.
32
L’holoenzyme forme des complexes très stables avec les promoteurs. La région qui va de -20
à +20 environ se trouve très bien protégée contre une dégradation par l’ADNase I. La région
qui se trouve en amont jusqu’à environ -60 se trouve également protégée mais à un moindre
degré, sans doute parce qu’elle se lie moins fortement à l’holoenzyme.
La comparaison des séquences des promoteurs de nombreux gènes de procaryotes (E. coli) a
montré la présence de séquences nucléotidiques courtes présentant une grande similitude de
structure. Ainsi, deux séquences nucléotidiques sont remarquables :
Une séquence située entre -30 et -35 paires de bases environ en amont de l’origine de la
transcription est appelée séquence -35. Cette séquence -35 présente un motif de six bases
bien conservées : TTGACA.
Une autre, à environ 10 nucléotides (hexamère) en amont de l’origine de la transcription,
contenant motif TATAAT. Cette séquence dite séquence -10 est appelée également
boîte de PRIBNOW.
Le nucléotide +1 qui est presque toujours A ou G se trouve au centre d’une séquence faiblement
conservée CAT ou CGT.
Une mutation qui affecte l’une des régions partiellement conservées peut augmenter ou
diminuer fortement l’efficacité d’initiation d’un promoteur.
Certains gènes fortement exprimés contiennent un segment riche en A+T entre les positions
-40 et -60, appelé élément promoteur amont UP pour « upstream promoter element », qui se
fixe au domaine C-terminal des sous unités de l’ARN polymérase. Parmi les gènes
renfermant un élément UP, on trouve ceux des ARN ribosomaux, les gènes rrn, qui sont
responsables collectivement de 60% des ARN synthétisés par E. coli. Les vitesses de
transcription de ces gènes, qui varient d’un facteur 1000, sont directement proportionnelles à la
vitesse à laquelle leurs promoteurs forment des complexes d’initiation stables avec
l’holoenzyme.
33
2) L’initiation nécessite la formation d’un complexe ouvert
Des analyses montrent que la liaison de l’holoenzyme fait « fondre » le promoteur dans une
région d’environ 14 pb qui part du centre de la région -10 et va un peu au-delà du site
d’initiation.
Manifestement, la sous unité permet à l’holoenzyme de se lier au niveau d’un promoteur
correspondant. Une fois la transcription initiée et la sous unité dissociée, la liaison solide du
cœur de l’enzyme à l’ADN stabilise le complexe ternaire enzyme-ADN-ARN. Ainsi, L’enzyme
core se transforme en un simple catalyseur de la phase d’élongation.
Initiation de la chaîne :
La base en position 5’ terminale des ARN des procaryotes est presque toujours une base
purique, A étant plus fréquent que G. La réaction initiatrice de la transcription est le couplage
entre deux nucléosides triphosphates selon cette réaction :
3) Élongation de la chaîne :
L’allongement de la chaîne d’ARN se fait dans le sens 5’ 3’ à partir d’un brin d’ADN matrice
orienté de 3’ 5’. Cette conclusion a été confirmée par l’observation que l’antibiotique
cordycépine, un analogue de l’adénosine dépourvu de groupe 3’(OH), inhibe la synthèse
d’ARN chez les bactéries. Son incorporation à l’extrémité 3’(OH) de l’ARN, comme prévu
pour une croissance dans le sens 5’ 3’, empêche l’élongation ultérieure de la chaîne d’ARN.
La cordycépine n’aurait pas cet effet si la croissance de la chaîne se faisait en sens opposé, car
elle n’aurait pu s’incorporer à une extrémité 5’ d’ARN.
34
Figure 33 : Différentes étapes de la transcription par l’ARN polymérase d’E. coli.
Remarque :
La vitesse de transcription in vivo est de 20 à 50 nucléotides incorporés par seconde à 37°C.
L’ARN polymérase n’a pas d’activité exonucléase pour corriger ses erreurs. La fréquence d’erreurs
observée dans la synthèse d’ARN, est d’une base erronée pour environ 10 4 bases transcrites. Cette
fréquence est tolérable compte tenu des points suivants :
La transcription est répétée pour la plupart des gènes.
Le code génétique contient de nombreux synonymes.
Les substitutions d’acides aminés sont souvent sans incidence sur la fonction protéique.
De grandes parties de nombreux transcrits eucaryotes sont excisées lors de la maturation de
l’ARN.
35
4) Terminaison de la chaîne :
Figure 35 : Site de terminaison Rho indépendant chez E. coli. Les séquences riches en
A-T et en G-C sont représentées. La structure en épingle à cheveux et la queue poly (U)
déclenchent l’arrêt de la transcription.
36
Conclusion :
La queue oligo (U) fournit probablement un signal qui permet à l’ARN polymérase de se
dissocier de la matrice. L’importance de la répétition U est confirmée en effectuant des
délétions qui enlèvent certains résidus U : bien que la polymérase s’arrête toujours au niveau
de l’épingle à cheveux, elle ne termine plus la transcription.
37
II. Maturation post- transcriptionnelle des ARN chez les procaryotes
Les produits immédiats de la transcription, les transcrits primaires, ne sont pas nécessairement
des entités fonctionnelles. Pour devenir biologiquement actifs, beaucoup d’entre eux doivent
être modifiés de différentes façons :
Chez les procaryotes, les molécules d’ARNm ne subissent aucune modification après leur
synthèse par l’ARN polymérase. En fait, beaucoup d’entre elles sont traduites alors même
qu’elles sont en cours de transcription. A l’inverse, l’ARNt et les molécules d’ARNr sont
formés par clivage et modification des chaînes d’ARN naissantes.
Ces trois ARN polymérases ont été initialement distinguées par leur sensibilité à des inhibiteurs
tels que l’α-amanitine (isolé des champignons). Des trois ARN polymérases, l’ARN
polymérase II est la seule très sensible à l’α-amanitine. Ces ARN polymérases sont localisées
dans le noyau de la cellule.
La transcription par chacune des ces trois ARN-polymérases implique les trois étapes
suivantes :
1/La reconnaissance des séquences du promoteur et l’assemblage d’un complexe d’initiation
au point de départ de la transcription.
2/ L’élongation, c’est-à-dire la synthèse de l’ARN.
3/ La terminaison.
Toutes les ARN polymérases ont besoin de facteurs multiples pour se positionner au point de
départ de la transcription. Ainsi, il existe des facteurs qui contribuent à un niveau bas de
transcription et des facteurs additionnels (activateurs) qui augmenter la transcription au-delà du
niveau basal.
Toutes les ARN polymérases des eucaryotes sont des protéines constituées de nombreuses sous-
unités (typiquement de 8 à 14). La plus grande sous unité de l'ARN polymérase II a un domaine
C-terminal ("carboxy-terminal domain": CTD) qui consiste en une répétition d'une séquence
consensus de 7 acides aminés. Cette séquence répétitive est propre à l'ARN polymérase II. Chez
les mammifères, on dénombre environ 50 répétitions de cette séquence consensus. La portion
CTD peut être hautement phosphorylée sur des résidus sérine ou thréonine. Dans ce chapitre
nous nous intéresserons essentiellement à la synthèse des transcrits primaires des gènes des
eucaryotes par l'ARN polymérase II.
38
2. Structure des gènes chez les eucaryotes : les exons et les introns
Chez les eucaryotes, les gènes présentent une structure discontinue, comportant des exons et
des introns. Les exons sont par définition des séquences d’ADN qui seront traduites en
protéines (on dit aussi qu’elles seront exprimées). Les introns sont par définition des séquences
d’ADN intercalées entre les exons.
Figure 37 : Chromosome présentant des exons et des introns au niveau des gènes.
3.1. Copie d’un gène, formation d’un transcrit primaire (ou pré-mARN)
3.1.1. Promoteur et régions régulatrices
. Les promoteurs de l’ARN polymérase II (comme ceux de l’ARN polymérase des bactéries)
sont localisés en 5’ par rapport au site d’initiation de la transcription. Des régions situées en
amont du site d’initiation sont d’importance pour la transcription :
Tout d’abord, la boîte TATA : elle est située à environ -25 paires de bases de l’origine
de la transcription. C’est une séquence de six nucléotides riche en A et T. La séquence
dite consensus (statistiquement la plus rencontrée) est TATAAA. Une mutation dans
cette boîte altère fortement la transcription. Cette boîte fixe un facteur général de
transcription appelé TFIID (TF : facteur de transcription ; II pour l’ARN polymérase
II). Ce facteur est absolument nécessaire pour l’initiation de la transcription. Puis en
remontant en amont du site d’initiation, on trouve successivement :
La boîte GC (située le plus souvent dans la région entre -110 et -40). Elle peut se
présenter sous forme d’hexanucléotides : 5’-GGGCGG-3’. Le motif riche en bases G et
C peut être répété plusieurs fois.
La boîte CCAAT (souvent située dans la région entre -120 et -80). Cette
boîte peut être située avant ou après une boîte GC ou même entre deux
boîtes GC.
L’unité de transcription comporte une origine le point de départ de la transcription (ou site +1)
et un point de fin de la transcription (séquence de terminaison de la transcription). En d’autres
termes, une unité de transcription va de la première base transcrite à la dernière base transcrite.
39
L’ARN qui lui correspond s’appelle-le transcrit primaire ou pré-mARN. Il comprend non
seulement les régions codantes ou exons, mais aussi les introns et les portions 5’ et 3’ non
traduites (régions 5’-UTR et 3’-UTR, « UTR= untranslated regions »).
Le terminateur au niveau de l’ARN est constitué de la séquence CPSF (AAUAAA) suivie par
un site de poly-adénilation 20 nucléotides en aval (formation d’une structure tige-boucle) et
après laquelle il y aura clivage.
40
Figure 39a : Fixation du facteur de la transcription TFIID sur la boite TATA.
2/. Puis le facteur TFIIB se fixe sur le facteur TFIID fixé sur la boîte TATA (figure 39b).
3/. Le facteur de transcription TFIIB recrute l’ARN polymérase II et le facteur TFIIF (figure
39c)
41
4/. Les facteurs TFIIE et TFIIH se fixent, suivis par des facteurs supplémentaires complétant le
complexe de transcription (figure 39d).
Le facteur TFIIH présente une activité protéine kinase. En présence d’ATP, une
phosphorylation de l’ARN polymérase est réalisée sur la plus grosse sous-unité de l’enzyme
riche en sérine et en thréonine (partie C-terminale).
Le premier phosphate situé à l’extrémité 5’ du transcrit primaire va être éliminé au cours d’une
soudure (par une liaison anhydride d’acide) avec du GMP (guanosine monosphosphate)
provenant du GTP. Il y a donc constitution d’une liaison inhabituelle : 5’-5’ triphosphate. On
parle de coiffe ou « cap ». Ainsi, la coiffe correspond à l’ajout d’un groupement, dit « m7G »,
par une liaison 5’-5’ triphosphate. Ce groupement m7G correspond à l’addition de trois
groupements phosphates et d’une molécule de GTP au niveau de l’extrémité 5’ du transcrit
42
primaire grâce à l’énergie libérée par l’hydrolyse de la molécule de GTP. Le nucléotide G va
ensuite être méthylé sur le septième carbone (C7) pour donner la 7-méthyl-guanosine.
La coiffe est ajoutée grâce à un complexe protéique appelé « Cap-Binding-Complex » qui
possédant une activité triphosphatase, une activité guanylyl-transférase et une activité méthyl-
transférase. D’autres modifications peuvent se produire comme des méthylations en 2’ sur les
riboses situés sur les deux premiers nucléotides de l’extrémité 5’ du transcrit primaire. La coiffe
est indispensable pour protéger les mARN de l’attaque par des enzymes de dégradation.
Après synthèse, les ARN messagers sont clivés dans leur partie 3’ une vingtaine de bases en
aval d’une séquence spécifique : AAUAAA (signal de poly-adénilation). Cette coupure est
réalisée par une endonucléase. Après cette coupure, une enzyme la poly(A) polymérase en
présence d’ATP additionne un nombre variable d’Adénine (au moins 200-250 chez les
mammifères supérieurs). La plupart des ARNm synthétisés par l’ARN polymérase II possèdent
cette extrémité poly(A), à l’exception des ARN messagers d’histones. La présence de poly(A)
aurait également une fonction de protection des mARN sur leur extrémité 3’.
43
Le site de branchement (A) : un nucléotide à adénine, environ 40 nucléotides avant le
site 3’ d’épissage.
L’excision des introns (coupure) et l’épissage (liaison) des exons est l’étape la plus importante
de la maturation du transcrit dans le noyau cellulaire. C’est un mécanisme qui représente donc
l’action d’enzymes qui catalyse la coupure d’ARN (endoribonucléase) et la fermeture de la
brèche (RNA ligase).
Le mécanisme de l’excision-épissage fait intervenir deux réactions de transestérification :
44
3.2.3.1 Rôle des petits ARN nucléaires (snARN)
Chez les eucaryotes, il existe des petits ARN nucléaires (snARN). Ce sont des petites molécules
(100-300 nucléotides environ), riches en uracile. On les dénomme U1, U2, U4, U5 et U6.
Chaque snARN est associé à ses propres facteurs protéiques pour constituer un complexe appelé
snRNP.
Ces complexes (snRNP) se fixent au niveau de l’intron à éliminer constituant un complexe
appelé « spliceosome ». La constitution de ce « spliceosome » est nécessaire pour un
déroulement correct de l’excision-épissage.
La présence de ces « spliceosomes » au niveau des différents introns d’un transcrit primaire
permet le maintien de celui-ci dans le noyau dans l’attente de sa maturation en ARNm. Parmi
les snRNP, on peut distinguer :
U1: Permet la reconnaissance de la partie 5’ de l’intron à exciser par une
complémentarité de séquence avec ce dernier.
U2: S’associe au site A de branchement.
U5: Permet la reconnaissance de la partie 3’ de l’intron à exciser.
U4 et U6 interagissent entre eux. U6 possèderait l’activité catalytique.
45
3.2.3.2 Autres types d’épissage possibles
b) Le trans-épissage : l’épissage ne se produit pas au sein d’un même messager, mais entre
deux messagers différents. Ce type d’épissage a été décrit chez un parasite, le
trypanosome.
c) L’épissage utilisant une maturase : processus très complexe décrit chez la levure (gène
du cytochrome b) il y a traduction en protéine (ou maturase) à partir d’un premier intron,
puis cette protéine sert à épisser les transcrits des introns suivants.
Les progrès considérables dans le déchiffrage du contenu des génomes au cours des deux
dernières décennies ont notamment permis de révéler l’existence de multiples séquences
d’ADN non codant, aux rôles souvent mystérieux. Parmi elles, les « introns »
Le rôle des introns est encore discuté. Cependant, quelques idées semblent émerger. Les introns
pourraient faciliter l’élaboration de gènes complexes en délimitant des séquences codantes et
permettant ainsi la mobilité des exons dans le génome.
Une étude récente, publiée le 27 juillet 2017 dans la revue Molecular Cell, a montré que la
présence d’introns dans les génomes eucaryotes les protège de l’instabilité génétique. En effet,
La synthèse des ARN, indispensable au fonctionnement cellulaire, peut en effet s’avérer
délétère pour la stabilité du génome, notamment par la formation d’hybrides ARN-ADN, ou
« R-loops », dont la présence entraine l’apparition de dommages dans le matériel génétique.
Les chercheurs ont notamment exploré la possibilité que le recrutement sur les introns des
facteurs impliqués dans leur épissage puisse directement s’opposer à la formation des R-loops
(hybrides ARN-ADN).
Figure 43 : formation de R-loop (hybride ARN-ADN) sur les gènes sans introns.
46
Conclusion : une nouvelle fonction aux introns dans la protection contre ces structures
délétères, et améliore ainsi notre connaissance des mécanismes universels qui permettent de
coordonner l’expression des gènes avec le maintien de la stabilité du génome.
Quand un facteur trans-régulateur se fixe sur une séquence cis-régulatrice de l’ADN, la quantité
de mARN synthétisé est brusquement modifiée, soit augmentée, soit diminuée. Les séquences
activatrices (séquences « enhancer ») peuvent être situées à des distances très importantes du
promoteur du gène (jusqu’à quelques dizaines de kilobases) et ceci en amont ou en aval du
gène. Des séquences extinctrices (séquences « silencer ») ont un effet opposé aux séquences
activatrices. Elles peuvent être également situées très à distance du promoteur du gène. C’est
bien entendu la structure tridimensionnelle de l’ADN qui permet de rapprocher ces éléments
régulateurs du gène à transcrire.
Ainsi, pour nous limiter à quelques exemples, le facteur général de transcription TFIIID peut
être considéré comme un facteur trans-régulateur. Il se fixe sur un élément cis-régulateur qui
est la boîte TATA.
La boîte GC, élément cis-régulateur va fixer un facteur trans-régulateur, la protéine Sp1.
La boîte CCAAT, élément cis-régulateur va fixer le facteur CTF (« pour CCAAT binding
transcription factor »).
Les facteurs trans-régulateurs sont des protéines particulières produites par d’autres gènes. Ces
protéines présentent des caractéristiques structurales communes, avec au moins au minimum
deux domaines :
- Un autre domaine, dit d’action sur la transcription. On peut rencontrer : différents types
de domaines d’activation de la transcription. Des domaines riches en glutamine, des
47
domaines riches en proline et des domaines organisés en hélice alpha riches en résidus à
charge négative (hélice alpha-acide)
Certains facteurs trans-régulateurs possèdent un troisième domaine qui permet de fixer un
élément annexe permettant de réaliser l’action d’un message extérieur à la cellule, comme un
message hormonal. On a pu ainsi définir la superfamille des récepteurs nucléaires (stéroïdes,
vitamines D, hormones thyroïdiennes, acides rétinoïques, acides gras polyinsaturés...). Enfin,
l’action des facteurs trans peut être elle-même régulée par d’autres facteurs avec modification
des facteurs trans en réponse à une stimulation extérieure : phosphorylation, protéolyse etc...
5. Régulations post-transcriptionnelles
5.1. Régulations qualitatives
5.1.1. Épissage alternatif
Généralement, une cellule peut épisser le transcrit primaire de différentes façons, et donner
ainsi plusieurs protéines différentes à partir d’un seul gène. Ce processus est appelé épissage
alternatif ou épissage différentiel.
Ainsi dans l’exemple suivant, il existe une possibilité d’exon optionnel.
D’autres possibilités existent d’épissage alternatif (intron optionnel par exemple).Un exemple
d’épissage alternatif : l’exon optionnel.
48
lecture dans la succession des triplets (codons) nucléotidiques. Dès lors, on peut dire d’un gène
unique peut exprimer deux protéines différentes.
49
Chapitre IV
Introduction
50
I. Code génétique et synthèse protéique
Comment l’information génétique qui est codée sous forme d’un langage à 4 lettres dans les
acides nucléiques, est elle traduite dans un langage à 20 acides aminés, celui des protéines ?
Les 3 codons (UAA, UAG, UGA) parmi les 64 codons du dictionnaire génétique furent
identifiés comme des codons de terminaison, parce qu’ils interrompent le codage des acides
aminés, lorsqu’ils sont inclus dans la séquence d’un ARN. La séquence de base de tous les
triplets codant pour chacun des acides aminés fut établie en 1966. Le dictionnaire complet des
codons des acides aminés est donné dans la figure 45.
Le déchiffrage du code génétique est considéré comme l’une des plu grandes découvertes des
années 1960.
51
b) Notion du cadre de lecture
Un cadre de lecture qui consiste exclusivement en des triplets représentant des acides aminés
est appelé cadre ouvert de lecture ("open reading frame" ou ORF). Une séquence qui est traduite
en protéine a un cadre de lecture qui commence avec un codon d'initiation (AUG). Elle
comprend ensuite une série de triplets jusqu'à l'un des trois codons de terminaison possibles.
Un cadre de lecture qui ne peut pas être lu en protéine parce que les codons de terminaison se
présentent fréquemment est dit bloqué.
Le cadre de lecture doit être disposé correctement au commencement de lecture. Si le cadre de
lecture initial est déplacé d’un ou de deux nucléotides, ou si le ribosome saute accidentellement
un nucléotide, tous les codons suivants seront en dehors du cadre et aboutiront à la formation
d’une protéine dont la séquence des acides aminés est erronée. Plusieurs codons ont une
fonction particulière. Le codon d’initiation AUG signale le commencement d’une chaîne
polypeptidique. AUG est non seulement le codon d’initiation chez les procaryotes comme chez
les eucaryotes, mais code aussi pour les résidus méthionine en position interne des polypeptides.
Figure 45 : Dictionnaire des codons des acides aminés, tels qu’ils figurent dans l’ARNm.
Les codons sont écrits dans la direction 5’ 3’. La troisième base de chaque codon joue
un rôle moins important que les deux autres pour désigner un acide aminé.
52
c) Code universel
Le code génétique est le même dans tous les organismes aussi bien chez les
eucaryotes que chez les procaryotes. Cette notion n’est pas aussi vraie que
l’on pensait. En effet, dans l’ADN des mitochondries humaines, quelques
codons sont différents des codons dits universels.
d) Code dégénéré.
La particularité la plus intéressante du code génétique est son caractère dégénéré : un acide
aminé donné peut être désigné par plus d’un codon. Seuls la méthionine et le tryptophane
n’ont qu’un codon. Le code génétique n’est pas ambigu car aucun codon ne désigne plus d’un
acide aminé. La dégénérescence du code n’est pas uniforme.
Lorsqu’il existe des codons multiples pour un acide aminé, la différence entre ces codons réside
souvent dans la troisième base. Les deux premières lettres de chaque codon sont les
déterminants primaires de la spécificité.
Les ARNt reconnaissent les codons par appariement de bases entre le codon de l’ARNm et une
séquence de trois bases de l’ARNt qu’on appelle anticodon. Les deux ARNt sont appariés de
façon antiparallèle, la première base du codon (toujours lu de 5’ 3’), s’apparie avec la
troisième base de l’anticodon.
Le nombre d’ARNt différents pour chaque acide aminé n’est pas le même que le nombre de
codons correspondant à cet acide aminé. Certains ARNt contiennent le nucléotide inosinate qui
renferme une base non usuelle, l’hypoxanthine. Les modèles moléculaires montrent que
l’inosinate peut former des liaisons hydrogènes avec trois nucléotides différents U, C et A, mais
ces appariements sont assez faibles comparés à ceux de Watson et Crick G C et A= T. Par
exemple, un ARNtarg présente l’anticodon 5’ (ICG) peut reconnaître trois codons différents de
l’arginine, 5’CGA, 5’CGU et 5’CGC. Les deux premières bases de ces codons sont identiques
CG et forment des paires de bases solides avec les bases correspondantes de l’anticodon.
53
Anticodon (3’) G3 C2 I1 G3 C2 I1 G3 C2 I1 (5’)
Codon (5’) C1 G2 A1 C1 G2 U3 C1 G2 C3 (3’)
La troisième base des codons arginine (A, U et C) forme des liaisons hydrogènes relativement
faibles avec le résidu I situé au début de l’anticodon. La troisième base de la plupart des codons
s’apparie de façon relativement lâche avec la base correspondante de l’anticodon. La troisième
base de tels codons « tremble ». Crick proposa alors un ensemble de 4 règles connues sous le
nom de wobble hypothesis.
1. Les deux premières bases d’un codon s’apparient fortement avec les bases
correspondantes de l’anticodon, conférant ainsi la majeure partie de la spécificité du
codage ;
2. La première base de certains anticodons détermine le nombre de codons reconnus par
un ARNt donné.
3. Lorsqu’un acide aminé est désigné par plusieurs codons différents ; les codons qui
diffèrent par l’une ou l’autre des deux premières bases nécessitent des ARNt distincts.
4. Un minimum de 32 ARNt est nécessaire pour traduire les 61 codons.
La troisième base « wobble » permet une dissociation rapide de l’ARNt de son codon au cours
de la synthèse protéique et influence ainsi, la vitesse de la synthèse protéique. Les interactions
codon- anticodon permettent à la fois la précision et la vitesse.
54
II.2. Éléments nécessaires à la traduction
L’ARN messager.
Les acides aminés.
Les ARN de transfert.
Les aminoacyl-tARN synthétases.
Les ribosomes.
Les acides nucléiques sont incapables de se lier spécifiquement aux acides aminés. La
traduction se fait par l’intermédiaire des molécules adaptatrices.
Comme la reconnaissance des codons se fait par appariement complémentaire, l’adaptateur doit
obligatoirement contenir de l’ARN. Des recherches ont montré que les molécules adaptatrices
sont les ARNt.
Durant cette étape qui se déroule dans le cytosol, chacun des 20 acides aminés est attaché de
façon covalente à un ARNt spécifique, avec consommation d’ATP. Ces réactions sont
catalysées par un groupe d’enzymes d’activation Mg2+ dépendantes, appelées aminoacyl-ARNt
synthétases. Chacun de ces enzymes est spécifique d’un acide aminé et de l’ARNt
correspondant.
55
Watson et Crick. Cette partie de l’ARNt est appelée tige de l’acide aminé car le résidu d’acide
aminé porté par l’ARNt est lié à son groupe 3’-OH terminal.
- le bras D : une tige de 3 ou 4 pb se terminant par une boucle qui contient fréquemment la
base modifiée dihydrouracile.
- Le bras de l’anticodon : une tige de 5 pb se terminant par une boucle qui contient
l’anticodon, le triplet de base complémentaire du codon spécifiant l’ARNt.
-Le bras T C ou bras T : une tige de 5 pb se terminant par une boucle qui présente
généralement la séquence T C (où est le symbole de la pseudouridine).
- Tous les ARNt se terminent par la séquence CCA avec un groupe 3’-OH libre. Le CCA peut
être spécifié génétiquement ou greffé enzymatiquement à l’ARNt non mature.
Le site de plus grande variabilité parmi les ARNt connus se trouve dans ce qu’on appelle le
bras variable. Il est formé de 3 à 21 nucléotides et peut présenter une tige formée de 7 pb
maximum. La boucle D varie aussi en longueur de 5 à 7 nucléotides.
La structure tertiaire de l’ARNt a été établie indépendamment en 1974, par Alexander Rich en
collaboration avec Sung Hou Kim et par Aaron Klug. La molécule présente une conformation
en forme de L où l’une des jambes du L est formée par la tige acceptrice et la tige T qui forment
une double hélice continue. L’autre jambe étant pareillement constituée de la tige D et de la tige
de l’anticodon. Les sites anticodon et accepteur d’acide aminé sont aux extrémités opposées de
la molécule. La faible largeur de 20 à 25 amstrong de l’ARNt est essentielle à son rôle
biologique : lors de la synthèse protéique, deux molécules d’ARNt doivent se lier côte à côte
en face de codons adjacents de l’ARNm.
Figure 48 : Structure tertiaire d’un ARNt montrant comment les tiges appariées sont
disposées pour donner une molécule en forme de L.
56
Au cours de la première de ces étapes, catalysée par des enzymes spécifiques des acides aminés
appelées aminoacyl- ARNt synthétase (aaRS), un acide aminé est fixé au résidu ribose 3’
terminal de son ARNt spécifique pour former un aminoacyl- ARNt.
Cet anhydride mixte réagit ensuite avec l’ARNt pour donner l’aminoacyl- ARNt :
Les comparaisons détaillées des séquences et de structure des aaRS montrent que ces enzymes
forment deux familles non apparentées, appelées aaRS de Classe I et de Classe II, dont on
trouve les mêmes dix membres chez presque tous les organismes.
57
Figure 51 : Deux classes d’aminoacyl-ARNt synthètase.
Les ribosomes sont constitués d’ARN ribosomiques (ARNr) et de protéines et sont structurés
sous forme de deux sous-unités que ce soit chez les procaryotes ou chez les eucaryotes.
Chaque cellule E. coli contient 15 000 ribosomes ou plus, qui représentent presque un quart
de poids sec de la cellule. Les ribosomes bactériens renferment environ 65% d’ARNr et 35%
de protéines. Ils ont un diamètre d’environ 18 nm et un coefficient de sédimentation de 70S.
Les ribosomes du cytoplasme des cellules eucaryotes sont des complexes multienzymatiques
qui associent 82 chaînes d’acides aminés et 4 acides ribonucléiques. Ces molécules sont
associées entre elles pour former deux particules distinctes : la sous-unité 60S (Large = 2800000
daltons) et la sous-unité 40S (Small = 1400000 daltons) qui peuvent se dissocier facilement. Ce
ribosome a un coefficient de sédimentation de 80S.
58
Figure 52 : Composition d’un ribosome bactérien (à gauche) et d’un ribosome eucaryote
(à droite).
Chacune des protéines du ribosome bactérien possède un rôle dans la synthèse des polypeptides,
soit par son activité enzymatique, soit comme composant de structure. Cependant, seule la
fonction précise de quelques unes des protéines du ribosome est actuellement connue.
Les deux sous unités du ribosome ont des formes irrégulières. Les deux sous unités
s’assemblent de telle façon que se forme une fente à travers laquelle passe l’ARNm lors du
déplacement du ribosome au cours du processus de la traduction et dont émerge le polypeptide
nouvellement formé.
Chaque ribosome possède deux sites fonctionnels :
- Un site A ou aminoacyl (= site Acide-aminé) : fixation des acides aminés.
- Un site P ou peptidyl (= site Peptidique) : porteur de la chaîne peptidique en cours
d’élongation.
Figure 53 : Structure cristalline d’un ribosome avec l’ARNm associé à la sous unité 30S
59
- La traduction se réalise avec des polysomes. Un polysome correspond à un ensemble
comprenant le mARN et plusieurs ribosomes. Chaque mARN peut donc être décodé par
plusieurs ribosomes à la fois.
II.3.1. Initiation
Sur le mARN, il existe près de l’extrémité 5’ phosphate un codon initiateur. Ce codon est
presque toujours AUG, il code pour la méthionine. Ceci signifie que toutes les chaînes
polypeptidiques commencent par de la méthionine. Ce codon initiateur se rencontre aussi bien
chez les procaryotes que chez les eucaryotes. Cependant, chez les procaryotes, cet acide aminé
est modifié car il ne possède pas de fonction –NH2 (ou NH3+) libre. Il nécessite
une formylation sur l’extrémité NH2 (ajout d’un formyl) pour former la f-Met, c’est un
phénomène pré-traductionnel. Cette formylation est réalisée par un cofacteur, la vitamine B9
(ou tétrahydrofolate) qui reconnaît l’ARNt caractéristique et responsable du transport de la f-
Met. La particularité de conformation de cet ARNt lui permet d’être placé directement dans le
site P et non pas dans le site A.
L’initiation de la traduction nécessite la reconnaissance du codon AUG (codon initiateur). Il est
important de souligner que pour insérer des résidus de méthionine à l'intérieur d'une chaine
polypeptidique, l'ARN de transfert est différent, bien que le codon reconnu (AUG) soit le même
que le codon initiateur.
60
Figure 55 : Image d’un ribosome montrant les deux sites actifs du ribosome.
Au cours de la seconde étape du processus d’initiation, le complexe formé par la sous unité
30S, IF-3 et l’ARNm forme un complexe de plus grande taille encore en s’associant à IF-2 qui
est déjà lié au GTP et à l’ARNt initiateur. Au cours de cette étape, l’anticodon de l’ARNt
s’apparie de façon correcte avec le codon d’initiation.
Dans la troisième étape, dans un processus précédé par le départ de IF-1 et de IF-3, la sous unité
50S s’unit au complexe d’initiation 30S de façon à stimuler l’hydrolyse par IF-2 du GTP qui
lui est fixé, en GDP et Pi. Cette réaction irréversible modifie la conformation de la sous unité
30S et libère IF-2 qui pourra participer à d’autres réactions d’initiation.
L’initiation se traduit par la formation d’un complexe ribosome- ARNm- fMet tRNAfMet dans
lequel, le fMet tRNAfMet occupe le site P du ribosome tandis que son site A est prêt pour accepter
un aminoacyl- ARNt entrant.
61
Figure 56 : Formation du complexe d’initiation en trois étapes, en utilisant l’énergie
fournie par l’hydrolyse du GTP en GDP et Pi.
62
Figure 57 : Formation du complexe d’initiation avec l’intervention des facteurs
d’initiation chez les eucaryotes
Après l’activation de facteurs d’intiation eIF2 (eucaryotic initiation factor 2) par le facteur
eIF2B suite la fixation du GTP, le facteur eIF2 fixe l’ARNt chargé de méthionine. Ensuite, et
en présence de eIF4C, la petite sous-unité va fixer le facteur eIF3 et le facteur eIF2 activé qui
porte le tRNA chargé de la méthionine initiale. L’énergie de la formation de ce complexe a été
fournie par l’hydrolyse de la liaison riche en énergie du GTP porté par le facteur eIF2.
La séquence 5’ non traduite du RNA messager est reconnue par les cofacteurs eIF4A, eIF4B et
eIF4F qui s’y fixent. Ensuite, l’ARNm est alors transféré sur la petite sous-unité, en regard du
site P, de façon à hybrider les nucléotides du codon d’initiation avec ceux de l’anticodon de le
tRNA de la méthionine initiale. Enfin, et en présence du dernier cofacteur eIF5, le complexe va
se lier à une grande sous-unité pour constituer un ribosome fonctionnel. Les cofacteurs
d’initiation sont libérés et la traduction commence.
II.3.2. Élongation
L’élongation de la synthèse protéique est l’addition par étapes successives des acides aminés à
la chaîne polypeptidique.
1) Le décodage
Au cours de la première étape du cycle d’élongation, l’aminoacyl- tRNA suivant est d’abord lié
à un complexe entre EF-Tu et une molécule de GTP. Le complexe ternaire aminoacyl- tRNA-
EF-Tu- GTP ainsi formé s’associe ensuite au site A du complexe d’initiation 70S. Au cours
d’une réaction qui s’accompagne de l’hydrolyse du GTP en GDP + Pi, l’aminoacyl se lie grâce
au complexe codon- anticodon, au site A du ribosome avec libération du complexe EF-Tu- GDP
+ Pi. A la fin de cette étape, le GDP fixé sur EF-Tu est remplacé par du GTP. Cette réaction est
effectuée par le facteur d’élongation EF-Ts.
2) La transpeptidation.
Dans l’étape de transpeptidation du cycle d’élongation, la liaison peptidique est formée grâce
au déplacement nucléophile de l’ARNt du site P par le groupe amino de l’aminoacyl lié en 3’ à
l’ARNt du site A.
63
Figure 58 : Formation d’une liaison peptidique par la peptidyl- transférase.
3) La translocation
64
Les ribosomes initiés ont leur site A vacant. Le facteur d’élongation eEF1B catalyse
l’échange du GDP par un GTP sur le facteur eEF1A. Celui-ci, activé, va recevoir un
tRNA chargé qu’il viendra fixer sur ce site A, en hydrolysant le GTP en GDP. Dès que
le codon du messager au fond du site A a pu se lier complémentairement avec
l’anticodon du tRNA apporté, le facteur eEF1A est libéré avec son GDP.
Le ribosome catalyse alors le transfert du peptide situé sur le tRNA du site P sur la
fonction amine de l’acide aminé du tRNA du site A. Il utilise pour cela, l’énergie de
l’hydrolyse de la liaison ester riche en énergie entre le peptide et le tRNA du site P.
Enfin, grâce au facteur eEF2 et à l’hydrolyse d’un autre GTP, le tRNA du site P est
libéré, le messager, le tRNA restant et le peptide en cours de synthèse sont alors déplacés
(translocation) du site A vers le site P, sans qu’il y ait de séparation entre le codon et
l’anticodon.
Le site A est à nouveau libre pour recevoir le tRNA de l’acide aminé suivant.
65
Chapitre V
66
A) Notion de séquence signal, modifications post-traductionnelles
des protéines
I. Généralités
Les protéines synthétisées dans une cellule peuvent :
Rester dans le cytosol.
Intégrer la membrane plasmique ou/et les membranes d’organites intracellulaires.
Être sécrétées à l’extérieur de la cellule.
Une répartition s’effectue entre ces différentes destinations. Les protéines destinées à rester
dans le cytosol sont synthétisées par des ribosomes non liés à une membrane cellulaire. Les
protéines destinées à être sécrétées ou intégrées des membranes sont synthétisées par des
ribosomes liés : soit à la membrane plasmique chez les procaryotes, soit à la membrane
externe du réticulum endoplasmique chez les eucaryotes.
67
Figure 60 : Maturation de l’insuline : deux ponts disulfure INTER-chaînes de l'insuline
se forment dès la biosynthèse de la pro-insuline. La chaîne C de la pro-insuline a pour
rôle de positionner correctement les chaînes A et B. Quand la pro-insuline est
correctement repliée, le peptide C est éliminé et un pont disulfure INTRA-chaîne se
forme.
68
IV. Modifications post-traductionnelles des protéines
De nombreuses modifications sont possibles après la synthèse des protéines. Ces modifications
peuvent être réversibles ou permanentes.
La chaîne polypeptidique peut être clivée à son extrémité N-terminale (qui comporte de la
méthionine chez les eucaryotes). Ce résidu est en principe éliminé. Chez les procaryotes,
l’extrémité N-terminale qui correspond à la formyl-méthionine est en principe seulement
déformylée.
Les clivages par des enzymes de protéolyse des précurseurs de nombreuses protéines sécrétées
rentrent également dans ce cadre.
La formation de ponts disulfure entre deux résidus de cystéines est un événement majeur de la
formation de la structure des protéines.
IV.2.3. Hydroxylation des résidus proline et lysine dans le cadre du collagène (voir cours
correspondant)
La plupart des protéines sécrétées possèdent des structures oligosaccharidiques. Ce sont des
glycoprotéines. L’addition des structures oligosaccharidiques peut se réaliser soit sur des
résidus asparagine par des liaisons N-glycosidiques entre le -CO-NH2 de l’asparagine et un OH
69
de la chaîne oligosaccharidique, c’est une N-glycosylation, soit plus rarement entre l’OH de la
thréonine ou de la sérine et un OH de la chaîne oligosaccharidique c’est une O-glycosylation.
70
En absence de glucose dans le milieu de culture, il n’y a plus de multiplication des bactéries. Si
on introduit alors du lactose qui est un diholoside (à base de galactose et de glucose), les cellules
ne poussent toujours pas. Mais, après un temps de latence, elles reprennent leur croissance et
se divisent. Il semble logique de considérer que les colibacilles utilisent le lactose. Pour cela,
ces bactéries ont besoin de trois enzymes différentes :
2. Une transacétylase, cette enzyme transfère le groupe acétyl (CH3 CO-) de l’acétyl-
CoA aux β-galactosides. Cette acétylase est codée par un gène appelé lac A.
3. Une β-galactosidase. Cette enzyme permet de couper la liaison osidique entre les deux
molécules d’ose constituant le diholoside. Elle est codée par le gène appelé lac Z.
A l’intérieur de la cellule bactérienne, ces enzymes ne sont pas produites en permanence. Elles
sont présentes quand il est nécessaire de produire du glucose à partir du lactose. On dit par
définition que la production de ces enzymes a été induite par le lactose. Ce dernier est appelé
inducteur. Cependant, le lactose lui-même n’est pas le véritable inducteur, il doit être
préalablement transformé en un composé voisin appelé l’allolactose. L’1,6 allolactose est formé
à partir du lactose par Trans-glycosylation.
Par convention, on écrit les gènes correspondants en italique comme ci-dessus.
Les protéines sont dénommées en lettres droites, ainsi Lac Z est le produit protéique du gène
lac Z. Le produit protéique est la β--galactosidase.
71
Figure 61 : Structure de l’opéron lactose chez Escherichia coli
La cellule dispose de glucose dans le milieu de culture. Dans ces conditions, les trois enzymes
de l’opéron lactose ne sont pas produites. Les gènes correspondants ne s’expriment donc pas.
On dit par définition que la synthèse de ces trois enzymes est réprimée ou que les gènes
correspondants sont réprimés.
Le gène régulateur possède son propre promoteur qui est distinct de celui des gènes de structure.
Ce gène code pour une protéine : le répresseur. Le répresseur est un tétramère de sous-unités
identiques de 38 000 daltons chacune. Il possède une haute affinité pour l’opérateur. Dans ces
conditions, si le répresseur est fixé sur l’opérateur, l’ARN polymérase ne peut pas transcrire les
gènes de structure car elle ne peut pas progresser vers les gènes de structure à partir de son site
de fixation qui est le promoteur.
Dans ces conditions, l’ARN polymérase peut librement transcrire les trois gènes de structure
puisqu’elle peut se fixer sur le promoteur. Il est important de comprendre que les trois gènes de
structure appartiennent à un système polycistronique. Le mARN formé lors de la transcription
code pour les troisprotéines (perméase, transacétylase et β-galactosidase).
72
Figure 62 : présence de lactose dans le milieu : la fixation du lactose sur le répresseur
entraîne la dissociation du complexe répresseur-opérateur permettant à l’ARN
polymérase de transcrire les gènes de structure. Le lactose agit comme inducteur des
enzymes chargés de sa métabolisation.
73
protéine CAP (" catabolite gene activator protein " ou protéine activatrice des gènes soumis à
la répression par un catabolite). L’opéron lactose n’est pas le seul opéron dans E. coli sensible
à la répression par un catabolite (opérons galactose et arabinose).
En fait, pour que l’ARN polymérase puisse se fixer au site promoteur, il faut bien entendu que
le répresseur ne soit pas lié au site opérateur mais aussi que le complexe AMP cyclique-CAP
soit lié au promoteur. La bactérie privée de source de carbone accumule l’AMP cyclique. A
l’opposé en présence de glucose, la bactérie ne possède pas suffisamment d’AMP cyclique pour
lier la CAP. Dans ce dernier cas, le complexe AMP cyclique-CAP est en quantité insuffisante
et l’ARN polymérase ne peut pas commencer la transcription.
Par contre, en présence d’une quantité suffisante du complexe AMP cyclique-CAP sur le site
promoteur, la transcription peut se dérouler.
On sait (voir transcription chez les procaryotes) que l’ARN polymérase se lie au niveau du
promoteur par l’intermédiaire de sa sous-unité sigma. Cette fixation de la sous-unité sigma se
fait de manière spécifique et efficace dans le cas de l’opéron lactose si le complexe AMP
cyclique-protéine-CAP est fixé préalablement fixé en 5’ du promoteur.
En conclusion, le complexer AMP cyclique-CAP agit à la façon d’un régulateur positif car
sa présence est requise pour l’expression génique. Le répresseur codé par le gène régulateur
joue à l’opposé un rôle de régulateur négatif. Sa présence sur le site opérateur empêche la
transcription des gènes de structure correspondants.
Le tableau suivant résume le double contrôle de l’opéron lactose par le glucose et le lactose.
Tableau 2 : Double contrôle de l’opéron lactose par le glucose et le lactose
Glucose Lactose Opéron lactose
Présent Présent Inactif car CAP n’est pas fixée
Inactif car : CAP n’est pas fixée et le
Présent Absent
répresseur lactose est fixé
Absent Absent Inactif parce que le répresseur lactose est fixé
Absent Présent Actif
74
Figure 63 : Contrôle de l’expression de l’opéron lactose en présence de glucose et de
lactose.
75
II.1.2. Exemple de l’opéron tryptophane
Chez l’Homme, cet acide aminé est indispensable, il est apporté par l’alimentation. Chez les
colibacilles, il peut être synthétisé par une succession d’étapes catalysées chacune par une
enzyme. Les gènes de structure de ces différentes enzymes sont dénommées : trp A, trp B, trp
C, trp D et trp E. Ces gènes rentrent dans la constitution de l’opéron tryptophane (Figure 64).
76
Figure 64 : Contrôle de l’expression de l’opéron tryptophane chez E. coli
77
Chapitre VI
78
1. Technique d’Extraction et Purification de l’ADN
1.1. Extraction et purification de l’ADN
L’extraction de l’ADN est une technique permettant d'isoler l’ADN :
A partir de cellules (bactéries, levures, cellules sanguines…) ou de Tissus (végétal,
animal).
Ou encore à partir de la matière fraiche (feuilles de plantes…) ou de la matière sèche
(phanères…).
Cette extraction peut concerner soit l'ADN génomique (issu du ou des chromosomes des
cellules analysées), ou l'ADN plasmidique (provenant de plasmides portés le plus souvent par
des cellules bactériennes comme Escherichia coli).
Cette étape importante met en jeu un détergent (ex. SDS) qui désorganise la double couche de
phospholipides des membranes. Il faut noter toutefois que dans le cas des cellules végétales, la
lyse nécessite un broyage dans un mortier des tissus congelés dans l’azote liquide. Dans le cas
des bactéries, la lyse est facilitée par l’action du lysozyme qui hydrolyse le peptidoglycane.
Cette étape est réalisée en utilisant un détergent comme SDS ou/et en faisant agir une protéine
comme la protéinase K.
Protéines
Phase organique
Protéines et lipides
79
Le phénol est un déprotéinisant très puissant, c’est pourquoi toute trace de phénol doit été
éliminée pour permettre l’action ultérieure d’enzymes (enzymes de restriction, ligase...). Une
extraction au phénol doit être toujours suivie d’une extraction au chloroforme.
4. Précipitation de l’ADN
La précipitation de l’ADN se fait en général dans une solution finale d’éthanol à 67%. Cette
précipitation est accélérée par le froid (-20 à -70). Après centrifugation, l’ADN est récupéré
sous forme de culot au fond du tube. Le culot est ensuite lavé dans une solution d’éthanol à
70% pour éliminer les sels et ensuite séché pour éliminer toute trace d’éthanol. Les acides
nucléiques sont ensuite récupéré dans un tampon stérile à pH 7-8 additionné d’EDTA (tampon
TE) et conservé au froid (14°C à -20°C).
5. Élimination de l’ARN
L’ARN est éliminé par un traitement à la RNase.
L’électrophorèse sur gel d’agarose est une technique de base utilisée en biochimie et
en biologie moléculaire pour séparer l'ADN, l'ARN ou des protéines en fonction de leur masse
moléculaire.. Cette technique très sensible est rapide et simple à réaliser
2.2. Principe
La technique de l'électrophorèse sur gel d'agarose est basée sur la séparation des acides
nucléiques chargés négativement sous l'effet d'un champ électrique. Cette séparation s'effectue
à travers la matrice du gel d'agarose : les molécules de plus petites tailles se déplacent plus
rapidement et migreront plus loin que les molécules de tailles supérieures.
80
La détermination précise des tailles des fragments séparés par électrophorèse est effectuée en
faisant migrer des marqueurs de poids moléculaire en parallèle avec les échantillons à analyser.
La détection de l’ADN sur ce type de gel est réalisée par exposition aux rayons UV après
réaction avec un réactif spécifique (bromure d’éthidium par exemple, agent s’intercalant entre
les brins d’ADN).
L’électrophorèse des fragments d’ADN en gel d’agarose permet des séparations jusqu’à 20-25
kb (20000-25000 pb). Deux tampons de migration peuvent être utilisés : TAE (Tris Acétate
EDTA) et TBE (Tris Borate EDTA).
Des fragments d’ADN de taille restreinte (inférieure à 1000 paires de bases) peuvent être
séparés par électrophorèse sur gel de polyacrylamide.
Tableau 1 : Pouvoir de séparation d'ADN linéaire, double brin, selon la concentration d'agarose
du gel
0.3 5 – 60
0.6 1 – 20
0.7 0.8 – 10
0.9 0.5 – 7
1.2 0.4 – 6
1.5 0.2 – 3
2.0 0.1 – 2
81
Séparation de fragments ADN digérés avant Southern blot ou d'ARN dans le cas
de Northern Blot.
2.5. Avantages de l'électrophorèse en gel d'agarose sont
Préparation aisée, rapide, et peu coûteuse des gels d'agarose
Pas de dénaturation des échantillons
L'agarose plus ferme et moins toxique que le gel de polyacrylamide
Les échantillons peuvent être récupérés en vue d'analyses supplémentaires
82
Figure 67 : Électrophorèse en fonction de la forme : formes linéaire, relâchée, super-
enroulée.
3. Digestion enzymatique
3.1.Généralités
Les enzymes de restriction sont des outils utilisés au laboratoire pour cliver l’ADN. Ils
sont capables de reconnaître spécifiquement une courte séquence, de 4 à 10pb, et de
cliver l'ADN au site reconnu.
Ils permettent de fragmenter l'ADN en segments de taille réduite, ou de le couper à tel
ou tel site désiré.
Les enzymes de restriction appartiennent à la classe des endonucléases, c’est-à-dire des
enzymes capables de cliver les liaisons phosphodiester entre deux nucléotides à
l’intérieur d’un acide nucléique
Les endonucléases se différencient des exonucléases qui dégradent la molécule d’ADN
à partir de l’une de ses extrémités (3’ ou 5’).
Certains enzymes coupent le site en son milieu et produisent deux fragments dont les
extrémités sont franches. Cependant, la plupart réalisent une coupure dissymétrique : on
parle dans ce cas d'extrémités cohésives (chaque fragment possède une chaîne qui
dépasse l'autre de quelques bases).
83
3.3.Origine des enzymes de restriction
Les enzymes de restriction sont extraites de micro-organismes, le plus souvent des bactéries.
Les bactéries peuvent être parasitées par des virus à ADN. Les bactéries fabriquent des enzymes
de restriction qui sont capables de cliver les ADN étrangers. Pour éviter une auto-destruction
de leur propre ADN, elles se protègent contre leurs propres enzymes de restriction par une
modification des sites de restriction correspondants.
84
Figure 68 : Types de coupure des enzymes de restriction.
La méthylation de l’adénine (représentée sur le schéma associée avec un cercle) aboutit à une
absence de reconnaissance de ce site spécifique par l’enzyme Hind III et donc à une absence de
coupure enzymatique :
85
3.7.Utilisations des enzymes de restriction
Les utilisations des enzymes de restriction sont très nombreuses en biologie
moléculaire. Par exemple, elles permettent de fractionner l’ADN en multiples fragments
susceptibles d’être séparés par les techniques d’électrophorèse. Les enzymes de
restriction peuvent être utilisées pour préparer un fragment d’ADN d’un gène donné
(insert) à être inséré dans un vecteur comme un plasmide. Les enzymes de restriction
sont utilisées couramment pour rechercher des mutations dans le génome
Les enzymes de restriction sont utilisées pour rechercher dans l’ADN des cellules
eucaryotes les méthylations de bases. Ces méthylations ont une signification
complètement différente des méthylations de bases observées chez les procaryotes.
Elles sont en relation directe avec des modifications de l’expression des gènes des
eucaryotes. La méthylation provoque le verrouillage de l’expression de tel ou tel gène
dans un tissu. Les méthylations dans le génome des eucaryotes concernent les cytosines
impliquées dans les doublets dinucléotidiques CG. La recherche de ces doublets et de
la présence ou non d’une méthylation sur les cytosines est réalisée à l’aide de deux
enzymes de restriction, une enzyme insensible à la méthylation des cytosines et une
autre enzyme sensible à la méthylation des cytosines
Une notion importante pour l’utilisation des enzymes de restriction est la notion d’enzymes
compatibles. Deux enzymes de restriction sont dites compatibles quand elles génèrent après
digestion des fractions aux extrémités cohésives complémentaires. Ces fragments peuvent être
facilement ligaturés.
86
4. Technique d’amplification génique ou technique PCR («Polymerase
Chain Reaction»).
4.1.Principe
Cette technique décrite en 1985 (K. MULLIS et collaborateurs) permet d’amplifier des
séquences d’ADN de manière spécifique et d’augmenter de manière considérable la quantité
d’ADN dont on dispose initialement. Elle nécessite de connaître la séquence des régions qui
délimitent l’ADN à amplifier. Ces séquences serviront à synthétiser des amorces
oligonucléotidiques complémentaires (de longueur de 20 à 30 nucléotides en général). Ces
oligonucléotides serviront à délimiter la portion d’ADN à amplifier. L’ADN polymérase les
utilisera comme amorces
Ce sont des fragments courts d'ADN, capables de s'hybrider de façon spécifique, grâce à la
complémentarité des bases, sur l’un des deux brins d'ADN.
Les amorces sont choisies de façon à encadrer la séquence d'ADN à amplifier. La taille de ces
amorces est généralement d’une vingtaine de désoxyribonucléotides. De plus, les amorces sont
en très forte concentration par rapport à celle de l’ADN à amplifier.
4.2.3. dNTPS
87
La Taq polymérase extraite de Thermus aquaticus présente une activité exonucléasique 5→3’,
mais elle est dénuée d’activité exonucléasique 3’→5’, c’est-à-dire de la fonction d’édition. Elle
peut insérer des bases qui ne suivent pas la règle classique d’appariement et ceci au hasard. On
estime qu’elle réalise une mauvaise incorporation toutes les 104 à 105 bases.
Le milieu réactionnel de la PCR comporte l’ADN à amplifier, les dNTPs, les deux amorces, la
Taq polymérase, un tampon et des ions magnésium (MgCl2). Ces deux derniers composants
définissent un milieu avec un pH optimal et une concentration saline optimale pour le bon
fonctionnement de l’enzyme.
4.3.Réalisation pratique
La PCR est une technique automatisée. En effet, la réaction de PCR se fait dans un
thermocycleur. C’est un appareil qui contient un bloc chauffant où l’on insère les tubes
contenant notre mélange pour la réaction de PCR et où la température peut varier très
rapidement et très précisément de 0°C à 100°C.
Le thermocycleur est alors programmé pour effectuer les différents cycles de la PCR. Ainsi,
chaque cycle est composé d’une succession de paliers de température prédéterminée, et d’une
durée bien définie. Ces deux paramètres, température et temps, dépendent de la taille de la
séquence à amplifier de la taille et de la composition en désoxyribonucléotides des amorces.
La technique de PCR comporte des cycles successifs. Chaque cycle comprend une succession
de trois phases :
1. Une phase de dénaturation par la chaleur pour séparer les deux brins d’ADN (92-95°C)
(30 secondes-1 minute). A cette étape : l’ADN se dénature. En effet, l’ADN perd sa
structure caractéristique en double hélice, les liaisons hydrogène reliant les bases de
chaque brin d’ADN étant instables à cette température. L’ADN double-brin (2 brins)
est dénaturé en ADN simple brin (1 brin).
88
Figure 71 : Étape de dénaturation.
2. Une phase d’hybridation avec les deux amorces spécifiques entre 55-60°C. La première
amorce se fixe sur un brin d’ADN, l’autre sur le brin complémentaire (30 secondes-1
minute).
3. Une phase d’extension par l’ADN polymérase à partir des amorces à 70-72°C (1-2
minutes). Cette étape permet à la Taq polymérase de synthétiser le brin complémentaire
à l’ADN matrice, grâce aux dNTPs libres présents dans le milieu réactionnel. Au cycle
suivant, les nouveaux fragments synthétisés servent à leur tour de matrice pour la
synthèse de nouveaux fragments d’ADN. En théorie, à la fin de chaque cycle la quantité
d’ADN cible est doublée. Le premier cycle est fini et voilà qu’un nouveau cycle
recommence. Cela se reproduira 30 fois (en fonction du protocole de PCR).
89
La technique de PCR a pris un essor considérable avec l’introduction d’une ADN polymérase
résistante à la chaleur. Cette ADN polymérase ou Taq polymérase est extraite d’une bactérie
thermophile (Thermus aquaticus). Elle permet une automatisation des différents cycles dans
le thermocycleur.
Le nombre de cycles est généralement compris entre 30 et 40. Cette méthode permet d’amplifier
l’ADN compris entre les deux amorces d’un facteur de 105 à 106. Les résultats doivent être
optimisés en fonction d’un certain nombre de paramètres : concentration en MgCl2,
concentration en amorces, spécificité des amorces etc... Le choix des amorces est
particulièrement crucial pour obtenir des résultats satisfaisants (spécificité, taille, paramètres
physico-chimiques...). L’introduction de logiciels spécialisés et des bases de données
nucléotidiques a permis de réaliser des choix plus rationnels.
5. RT-PCR
La RT-PCR se déroule en deux phases. Une première phase correspond à la copie d’ARN
messager en ADN complémentaire (cADN) et une seconde phase correspond à une réaction
PCR classique sur le cADN synthétisé.
90
Dans la première phase, l’ARN messager à étudier est repéré en utilisant une sonde
oligonucléotidique spécifique (amorce 1 qui s’hybride à l’extrémité 3’ du seul mARN auquel
on s’intéresse), puis la transcriptase inverse (ou rétrotranscriptase) permet la synthèse du brin
complémentaire (sous une forme de cADN simple brin), une seconde amorce
oligonucléotidique spécifique (amorce 2) permettra la synthèse du second brin par extension.
L’ADN complémentaire synthétisé servira ensuite de matrice pour une réaction PCR classique.
La technique RT-PCR a permis de montrer que la transcription de tous les gènes s’effectuait
dans tous les tissus et ceci même pour les gènes qui présentent une très grande spécificité
tissulaire. On parle dans ces conditions de transcription illégitime. Il est évident qu’avant les
techniques d’amplification génique, la sensibilité des méthodes classiques n’avait pas permis
de mettre en évidence un tel phénomène.
6. Séquençage de l’ADN
5.1.1 Généralités
Le séquençage de l'ADN constitue une méthode dont le but est de déterminer l'ordre
d'enchaînement des nucléotides d’un fragment d’ADN donné.
La lecture de cette séquence permet d’étudier l’information génétique contenue en celle-
ci.
Le séquençage d’ADN est devenu un outil essentiel en biologie moléculaire tant en
médecine que dans de nombreuses autres disciplines des sciences de la vie.
Le séquençage a été décrit il y a environ 40 ans et n’a cessé d’évoluer depuis cette
période.
Les connaissances acquises grâce à cette méthode et la possibilité de séquencer des
génomes de grandes tailles, tel que le génome humain, ont amené les chercheurs à
développer des techniques de séquençage de plus en plus sophistiquées.
91
5.1.3.1 Méthode chimique ou méthode de Maxam et Gilbert
Cette méthode est pratiquement abandonnée de nos jours. Elle n’a plus guère qu’un intérêt
historique. Elle se fait selon les étapes suivantes :
1. Marquage de l'ADN en 5'. Il faut ici que l'ADN ne soit marqué qu'à une seule extrémité.
2. Coupure de l'ADN par des réactions spécifiques à certaines bases, par exemple après
toutes les guanosines. La coupure est partielle si bien qu'on obtient toute une série de
molécules dont l'extrémité 3' est un G, parmi celles-ci certaines d'entre elles sont
marquées en 5' par du 32P.
3. Dénaturation de l'ADN par la chaleur
4. Dépôt sur un gel électrophorèse en condition dénaturante (température haute et présence
d'urée dans le gel). Les fragments d'ADN migrent en fonction de leurs tailles et sous
forme simple brin.
5. Radioautographie, seuls les fragments marqués, c’est à dire seul ceux qui portent
l’extrémité 5’- et donc commencent au même endroit-, sont visualisables. Certaines
molécules s'arrêtent au premier G, d'autre au second etc...
Si au départ on a fait des coupures séparément et différentes avec plusieurs agents, on obtient
pour chaque tube, des molécules de taille correspondant à la séquence. On ne dispose pas de
schéma réactionnel permettant de couper après chacune des bases. Mais on dispose de moyens
pour couper après G, après A+G, après C+T et après A. Si on charge ces quatre séquences sur
le gel, on peut lire la séquence (Figure 75).
92
Soit l'ADN bicaténaire suivant dont la séquence doit être déterminée :
5’ G G T C A T C C A T G G A T T C G A 3’
3’ C C A G T A G G T A C C T A A G C T 5’
Les deux brins d'ADN sont préalablement séparés par fusion. Considérons le brin orienté 3'→5'
:
3’ C C A G T A G G T A C C T A A G C T 5’
On réalise une hybridation avec une amorce de séquençage1 : GGTCATCC, orientée 5'→3' :
5’ G G T C A T C C
3’ C C A G T A G G T A C C T A A G C T 5’
L'amorce 1 de séquençage pour simplifier l'exposé a été volontairement réduite
en nombre de nucléotides, ceci n'est pas le cas en pratique. L'exemple présenté
ci-dessus est bien entendu essentiellement à but didactique.
Puis, on réalise une réaction de séquençage avec des dNTPs (dATP, dTTP, dCTP et dGTP) et
de la Taq polymérase. On prépare quatre tubes identifiés : A, T, C et G.
Tube A T C G
Taq polymérase + + + +
dNTPs + + + +
ddNTPS ddATP ddTTP ddCTP ddGTP
93
Le même raisonnement s’applique aux tubes dénommés T, C et G. Après les réactions de
séquençage, on sépare sur les pistes électrophorètiques séparés les produits obtenus dans les
tubes A, T, C et G. Les produits migrents dans un gel de polyacrylamide vertical dans des
conditions dénaturantes (en présence d’urée). Leurs distances de migration par rapport à leurs
positions initiales varient à l’inverse de leurs tailles respectives. Après l’autoradiographie le gel
se présentera de la manière suivante
94
automatique qui permet de discriminer grâce à des fluorochromes différents les quatre bases A,
T, C ou G. L'utilisation de logiciels informatiques permet de fournir un tracé électrophorétique
avec des couleurs différentes pour chaque base élémentaire.
7. Hybridation moléculaire
7.1. Définitions
Hybrider : permettre la formation de liaisons hydrogène entre deux acides nucléiques
(AN) simples brins. Si deux AN simples brins partagent suffisamment de bases
complémentaires, ils formeront un complexe double brin. Hybrider est le contraire de
dénaturer.
Sonde (en biologie moléculaire) : séquence nucléotidique, généralement marquée,
complémentaire d'une séquence d'ADN ou d'ARN avec laquelle elle va s'hybrider. En
s’hybridant avec sa séquence cible, elle permet de la détecter.
Ribosonde : Sonde à ARN.
La technique de l’hybridation moléculaire repose sur le principe qu’un fragment ADN
simple brin s’apparie à un autre fragment ADN (ou ARN) en respectant rigoureusement
les règles de complémentarité.
L’hybridation est réalisée entre une sonde dont la séquence est connue et un segment
ADN monobrin obtenu après dénaturation.
Sous l’effet de la chaleur les liaisons hydrogène de l’ADN double brin s’ouvrent et les
deux brins se séparent. La température à laquelle 50% des molécules d’ADN sont
séparées est appelée température de fusion ou Tm (melting température). elle
correspondant au point situé à mi-chemin dans la transition entre la forme double brin
et la forme simple brin des acides nucléiques.
95
A l'inverse après séparation de brins par fusion, si la solution d'ADN est refroidie
lentement dans des conditions de milieu favorables, une réassociation des brins est
progressivement observée. Ce phénomène est appelé hybridation moléculaire. Cette
réassociation peut concerner deux séquences d'ADN ou une séquence d'ARN
complémentaire. Elle est donc d'une spécificité très grande.
Figure 78 : Formation d’hétéroduplex sonde/cible lors d’un test par hybridation d’AN. Un
échantillon test est composé d’un mélange complexe d’AN et d’une population de sondes
bien définies de composition connue. Ces deux populations sont transformées en simples
brins, puis mélangées pour, à nouveau, en permettre l’hybridation. Les séquences qui
avaient au préalable été appariées dans l’échantillon test et la sonde s’apparient à nouveau
pour former des homoduplex (en bas à gauche et à droite). De plus, de nouveaux
hétéroduplex se forment aussi entre la sonde et certaines séquences cibles ayant des
séquences complémentaires ou partiellement complémentaires (en bas, au centre). Les
conditions d’hybridation peuvent être ajustées pour favoriser la formation d’hétéroduplex.
De cette façon, les sondes se lient de façon sélective et permette d’identifier les AN
apparentés dans une population complexe d’AN.
96
7.2. Sondes moléculaire
Une sonde est une séquence nucléotidique simple brin, longue de quelque 10aines de pb (oligo-
sonde) à quelques Kb, généralement marquée, complémentaire d'une séquence d'ADN ou
d'ARN avec laquelle elle va s'hybrider.
Les sondes sont visualisées grâce à un marquage radioactif (32P, 35S, 3H), enzymatique ou
fluorescent.
97