Vous êtes sur la page 1sur 98

UNIVERSITÉ IBN ZOHR

FACULTÉ POLYDISCIPLINAIRE DE TAROUDANT


Département des Sciences et Techniques

COURS DE

BIOLOGIE MOLECULAIRE

Module : M25

Filière : AGRO (S4)

Responsable : Pr. M. SADIKI

Année Universitaire 2020-2021


Sommaire du cours
Chapitre I : Processus moléculaires de la réplication……………………………………….2
A) Réplication de l’ADN chez les procaryotes………………………………………….........3
B) Réplication de l’ADN chez les eucaryotes……………………………………………….13
Chapitre II : Systèmes de réparation de l’ADN : maintenance de l’ADN………………..17
Chapitre III : Transcription génétique……………………………………………………..29
A) Transcription génétique chez les procaryotes…………………………………………..31
B) Transcription génétique chez les eucaryotes……………………………………………38
Chapitre IV : Expression de l’information génétique : traduction……………………… 50
Chapitre V : Notion de séquence signal, modifications post-traductionnelles des protéines
et régulation de leur synthèse……………………………………………………………….66
A) Notion de séquence signal, modifications post-traductionnelles des protéines..............67
B) Régulation de la synthèse des protéines…………………………………………………70
Chapitre VI : Techniques de base de la biologie moléculaire…………………………….78

1
Chapitre I :

Processus moléculaires de la réplication

Introduction

Lors de la division cellulaire, quand une cellule-mère donne deux


cellules filles, il est essentiel que le matériel génétique, l’ADN, présent
dans les cellules-filles, soit la copie identique de l’ADN présent dans la
cellule-mère. Cette copie de l’ADN est indispensable à réaliser avant la
mitose (ou division cellulaire) on parle de réplication de l’ADN.
L’ADN possède une structure très stable. Néanmoins, des
modifications chimiques et des mutations peuvent avoir lieu dans la
molécule d’ADN, les cellules ont ainsi développé des mécanismes qui
assurent que le taux de mutations soit maintenu à un niveau minimal.
La réplication et la réparation de l’ADN sont donc deux processus
cellulaires régulés de manière stricte. Ils permettent le maintien de
l’intégrité de l’information génétique, laquelle est nécessaire à l’activité
cellulaire normale et à la mitose.

2
A) Réplication de l’ADN chez les procaryotes
I- Caractéristiques générales de la réplication

1) La réplication de l’ADN est semi- conservative

Figure 1 : Brins originaux se déroulent par une rotation autour de l’axe de la double
hélice de l’ADN non encore répliqué. La séquence nucléotidique d’un brin impose la
séquence du brin complémentaire.

En 1958, Matthew Meselson et Franklin Stahl ont démontré expérimentalement la validité du


modèle semi- conservatif de la réplication de l’ADN.

Les deux brins se séparent et chacun d’eux est copié pour former un brin complémentaire.
Chaque brin parental reste associé avec le brin complémentaire nouvellement synthétisé. Les
deux ADN bicaténaires contiennent donc un brin parental et un nouveau brin.

2) La réplication de l’ADN est bidirectionnelle

La réplication des molécules d’ADN commence à partir d’un (procaryotes) ou de plusieurs


(eucaryotes) site(s) appelé(s) origine(s) de réplication, et sauf pour la réplication du
chromosome de certains phages et plasmides, elle progresse dans les deux directions. Cela veut
dire que la réplication bidirectionnelle implique deux fourches de réplication qui avancent dans
deux directions opposées.

3) La réplication de l’ADN est semi- discontinue

Les deux brins d’ADN antiparallèles sont répliqués simultanément. Toutes les ADN
polymérases connues ne peuvent allonger les brins d’ADN que dans le sens 5’  3’.
En 1968, Reiji Okazaki a formulé le modèle de la réplication semi- discontinue. Les deux brins
parentaux sont répliqués de manière différente. Le brin d’ADN néosynthétisé qui s’allonge dans
la polarité 5’  3’dans le sens de déplacement de la fourche de réplication est appelé le brin

3
avancé, il est synthétisé de façon continue de 5’  3’ au fur et à mesure que la fourche de
réplication avance.
L’autre brin néosynthétisé s’appelle le brin retardé, il est aussi synthétisé de 5’  3’ mais de
manière semi- discontinue sous forme de fragments d’Okazaki. Ces derniers ne sont reliés entre
eux que quelques temps après la synthèse par l’ADN ligase.

4) Les amorces ARN

Toutes les ADN polymérases doivent disposer de la présence d’un groupement 3’OH libre pour
pouvoir allonger un brin d’ADN.
E. coli possède deux enzymes capables de catalyser la formation de ces amorces d’ARN :
l’ARN polymérase, enzyme multimérique d’environ 459 kDa responsable de la transcription et
une primase beaucoup plus petite (60 kDa), monomère produit par le gène DnaG.
La primase est insensible à la rifampicine, un inhibiteur de l’ARN polymérase. La rifampicine
n’inhibe que la synthèse du brin avancé, ce qui montre indirectement que la primase produit les
amorces pour la synthèse des fragments d’Okazaki.

Figure 2 : La synthèse d’ADN est amorcée par des petits fragments d’ARN.

II- Éléments nécessaire à la réplication

La réplication de l’ADN est un processus complexe qui implique une assez grande variété de
molécules et d’enzymes.
 L’ADN parental, où chacun des deux brins sert de matrice pour synthétiser le nouveau
brin.
 La présence de nombreux enzymes (Topoisomérases, Hélicases, ADN polymérases,
ADN ligase...)
 La présence d’une amorce d’ARN (synthétisée grâce à une ARN polymérase ou
primase).
 La présence de nucléotides propres à l’ADN, c’est-à-dire contenant du 2’désoxyribose,
des bases A, T, G et C et sous forme de nucléosides triphosphates : dATP, dTTP, dCTP
et dGTP (on écrit souvent pour les dénommer dNTP).
 Les ions Mg2+ qui stabilisent les dNTP en les protégeant d’une hydrolyse enzymatique.
Ils sont également importants pour l’ADN polymérase.

4
III- Mécanisme de la réplication

1) Notion de réplicon
L’unité d’ADN où se produit la réplication est appelée le réplicon. Ce réplicon a une origine
où est initiée la réplication et une terminaison où est arrêtée la réplication.

2) Les enzymes de réplication

La réplication de l’ADN est un processus complexe qui implique une assez grande variété
d’enzymes.

a) L’ADN polymérase I

Arthur Kornberg en 1957, publie la découverte d’une enzyme catalysant la synthèse d’ADN
dans des extraits d’E. coli. Cette enzyme connue depuis comme l’ADN polymérase I, est un
monomère de 928 résidus d’acides aminés.

1) Activité polymérasique 5’ → 3’ (voir figure 3).

Le taux d’erreurs de l’ADN Pol. I par rapport à l’ADN copié est très faible. Il est de l’ordre
d’une base fausse pour 10 millions.

Figure 3 : Réaction d’élongation d’une chaîne par l’ADN polymérase. En présence de


dNTP, l’ADN polymérase I catalyse la formation d’une liaison entre une unité
désoxyribonuléoside 5’ monophosphate et le 3’ (OH) de l’amorce. Une liaison
phosphodiester se forme suite de l’attaque nucléophile du groupe phosphoryle  du
dNTP entrant par le groupe 3’ (OH) et PPi est libéré.

5
Le mécanisme catalytique de l’ADN polymérase met en jeu deux ions métalliques.

Les sites actifs des ADN polymérases contiennent deux ions Mg2+. Un ion Mg2+ active le
groupement 3’(OH) de l’amorce pour effectuer une attaque nucléophile directe sur un
phosphate  du dNTP qui se présente.
L’autre ion Mg2+ a pour rôle l’orientation et la stabilisation électrostatique du groupement triP
porteur d’une charge négative, auquel il est lié et qui conduit à la libération de PPi.

2) ADN Pol. I peut corriger ses fautes.

En plus de l’activité polymérase, l’ADN Pol. I possède deux activités hydrolytiques


indépendantes :
a) Elle possède une activité exonucléasique 3’→5’.
b) Elle possède une activité exonucléasique 5’→3’.
La fonction exonucléasique 3’→5’ est activée par un nucléotide 3’terminal mal apparié ayant
son groupe OH libre. Si Pol. I incorpore un nucléotide erroné à l’extrémité croissante d’un brin
d’ADN, l’activité polymérase est inhibée et l’exonucléase 3’→5’ excise ce nucléotide.
L’activité polymérase reprend ensuite. L’ADN Pol. I a donc la capacité de relire le brin d’ADN
en cours de synthèse et de corriger ses fautes : ceci explique la haute fidélité de la réplication
par Pol. I.
L’exonucléase Pol. I 5’→3’se lie à l’ADN duplex à un site de coupure simple brin, sans
spécificité pour l’état du nucléotide en 5’ (5’OH ou 5’P, apparié ou non).

3) La fonction polymérase et les deux fonctions exonucléasiques correspondent


chacune à un site actif différent de Pol I.

Des protéases comme la trypsine coupent Pol. I en deux fragments : le grand fragment
« Klenow » (résidu 324 à 928) contient les activités de polymérase et d’exonucléase 3’  5’, et
un fragment plus petit (résidu 1 à 323) contient l’activité exonucléase 5’  3’.

Figure 4 : Digestion de l’ADN polymérase I par la trypsine

6
4) La fonction physiologique exonucléasique 5’  3’ de Pol. I est d’enlever les amorces
d’ARN (Nick- Translation).

L’exonucléase 5’  3’ enlève les amorces d’ARN aux extrémités 5’ de l’ADN néosynthétisé,


et la polymérase comble les trous simple brin qui en résultent. L’importance de cette fonction
montre le rôle indispensable de Pol I dans la réplication de l’ADN chez E. Coli.
En effet, ces deux réactions déplacent la cassure vers l’extrémité 3’ du brin cassé sans changer
le reste de la molécule. Ce mécanisme est utilisé sous le terme de Nick- translation pour aussi
préparer de l’ADN fortement radioactif en présence de dNTP marqués (on provoque d’abord
des cassures en traitant l’ADN avec une faible quantité d’ADN ase pancréatique).

Figure 5 : (a) L’activité 5’  3’ exonucléase de Pol. I peut élimer jusqu’à 10 nucléotides


dans la direction 5’ à partir d’un 3’ (OH) apparu après une coupure sur un seul brin.
(b) Si l’activité 5’  3’ polymérase comble ensuite l’espace vide, l’effet final est celui
d’une translation de la coupure par l’ADN polymérase.

b) L’ADN polymérase III

La découverte de mutants d’E. coli se multipliant normalement avec très peu d’activité Pol. I a
évidemment encouragé la recherche d’une autre activité de polymérisation de l’ADN. Deux
enzymes nouvelles ont été découvertes (Pol. II et Pol. III).
Un mutant E. coli qui n’a pas d’activité détectable Pol. II se multiplie normalement. Ce produit
Pol. II est impliqué dans la réparation des lésions de l’ADN via la réponse S.O.S, tout comme
le sont les deux autres enzymes d’E. coli découvertes récemment : l’ADN pol. IV et l’ADN
pol. V.

Pol III est la réplicase d’E. coli.


ADN Pol. III est 60 fois plus rapide qu’ADN Pol. I pour la polymérisation des nucléotides.
L’activité exonucléasique 3’  5’de Pol. III est la première correctrice des erreurs, au cours
même de la réplication, elle augmente la fidélité de la réplication par cette enzyme par un facteur
allant jusqu’à 200.

7
L’exonucléase 5’  3’ de Pol. III n’est active que sur un ADN simple brin, elle ne peut donc
pas catalyser la réaction de Nick- translation.
L’enzyme Pol. III a une processivité pratiquement illimitée sur plus de 5000 résidus

Figure 6 : Structure de l'holoenzyme d'ADN polymérase III, un complexe multimérique


comporte 3 sous unités et 10 polypeptides (2X5 sous unités protéiques).

c) Les hélicases hexamèriques (DnaB) provoquent la séparation de l’ADN


double brin en se déplaçant sur un des brins

Les protéines responsables du déroulement de l’hélice forment un groupe d’enzymes variées


qui permettent diverses fonctions dont la réplication de l’ADN, sa recombinaison et sa
réparation, mais aussi la terminaison de la transcription.
Il existe plusieurs modes de classification des hélicases ; selon leur polarité de déplacement
5’  3’ ou 3’  5’ le long du brin où elles se fixent ou selon leur mode de fonctionnement.
La protéine DnaB d’E. coli est une hélicase hexamèrique avec des sous unités identiques de
471 résidus. Elle sépare les brins d’ADN double brin en se déplaçant le long du brin retardé de
la matrice dans la direction 5’  3’tout en hydrolysant l’ATP (GTP ou CTP peuvent être
également utilisés).

d) La protéine affine de l’ADN simple brin empêche la renaturation de l’ADN


simple brin (SSBP: Single Stranded Binding Protein (ou SSB)

Laissés à eux-mêmes, les brins d’ADN séparés lors de la progression de l’hélicase se


réassocient rapidement derrière elle pour former l’ADN double brin. C’est la liaison de la
protéine affine de l’ADN simple brin (SSB) qui les en empêche. Elle empêche également
l’ADN simple brin de former des structures secondaires intramoléculaires et les protège contre
les nucléases. De nombreuses SSB se lient de façon coopérative à l’ADN simple brin pour le
maintenir sous forme non apparié. Cependant la réplication par l’holoenzyme Pol. III, nécessite
auparavant que les SSB soient enlevées de l’ADN simple brin.

8
Figure 7 : Déroulement d’ADN sous l’action conjuguée des protéines DnaB et SSB.

e) L’ADN ligase

L’ADN Pol. I peut remplacer les amorces ARN des fragments d’Okazaki par de l’ADN par le
processus de déplacement de cassure. En effet, de cette activité de remplacement, il résulte des
cassures simple brin entre des fragments d’Okazaki adjacents. Celles- ci, de même celle
correspondant à la fin de réplication du brin avancé d’un ADN circulaire, sont ressoudés par
une réaction catalysée par l’ADN ligase. L’énergie libre demandée par cette réaction est fournie
selon les espèces en couplage avec une hydrolyse, soit de NAD+ en NMN+ + AMP, soit de
l’ATP en PPi + AMP.
L’enzyme d’E. coli est un monomère de 671 résidus, elle utilise NAD+ au cours d’une réaction
de 3 étapes. Dans le cas des ADN ligases eucaryotes ou de ligase T4, le NAD+ est remplacé par
l’ATP de telle manière que c’est du PPi plutôt que du NMN+ qui est éliminé au cours de la
première étape de la réaction.
L’ADN ligase catalyse la formation d’une liaison phosphodiester en accrochant le 3’ (OH) sur
le groupement 5’ phosphoryle, ce qui ligature la cassure et libère l’AMP. (Activation de
l’extrémité 5’ P à joindre).

Figure 8 : Mécanisme de la réaction catalysée par les ligases. Il se forme un intermédiaire


covalent de l’enzyme dans lequel le groupe NH2 d’un résidu Lys de l’enzyme est adénylé.
f) La primase

Les primases de bactéries et de plusieurs bactériophages suivent le mouvement de la fourche


de réplication, en étroite association avec l’hélicase. Puisque l’hélicase se déplace le long du

9
brin retardé du duplex d’ADN dans le sens 5’  3’, la primase doit se retourner par rapport à
sa direction de déplacement pour synthétiser une amorce ARN dans le sens 5’  3’. La primase
d’E. coli peut synthétiser des amorces allant jusqu’à 60 nucléotides in vitro, bien qu’in vivo, les
amorces aient une longueur de 11 (plus ou moins 1) nucléotides. Comme la fourche de
réplication d’E. coli se déplace d’environ 1000 nucléotides/s et que les fragments d’Okazaki
ont une longueur d’environ 1000 nucléotides, la primase doit synthétiser environ une amorce
ARN/s.

g) Les topoisomérases :

Comme la réplication de l’ADN d’E. coli s’effectue à une vitesse proche de 1000 nucléotides
par seconde et qu’il y a environ 10 pb par tour d’hélice, le chromosome accumulerait 100
superenroulements par seconde.
Les topoisomérases de type I, modifient l’enlacement de l’ADN bicaténaire en introduisant une
coupure dans une liaison phosphodiester puis en la réparant. Pour les topoisomérases de la
classe II, elles coupent les deux brins au même temps et les réparent par la suite, elles sont
indispensables à la terminaison de la réplication. Les deux enzymes équilibrent le
superenroulement de l’ADN en le réduisant soit d’un tour (Top I), soit de deux tours (Top II)
par cycle de réaction.

Figure 9 : mode d’action des topoisomérases

IV- Initiation de la réplication chez E. coli.

a) Ori C.

L’origine de réplication pour le chromosome d’E. coli est un segment de 245 pb appelé locus
oriC. La séquence de ce segment est très conservée parmi les bactéries gram-.
Le site contient 4 répétitions de 9 pb (nonamères), dont la séquence consensus est
5’TTATCCACA3’et sur lesquelles se fixent spécifiquement les protéines DnaA. La protéine
DnaA est le facteur d’initiation de réplication de l’ADN. Cette protéine de 52 kDa (467 résidus),
se lie de façon coopérative. Le processus d’assemblage est facilité par la présence d’une
protéine de type histone HU. Le complexe final ressemble à un nucléosome, avec l’ADN d’oriC
formant un superenroulement autour d’un cœur constitué de protéines DnaA. Les protéines
DnaA favorisent alors la détorsion des brins de l’ADN bicaténaire par interaction avec 3
segments de 13 pb riches en AT (séquence consensus : 5’GATCTNTNTTNTT3’, dans laquelle

10
N représente toute base). Ces segments sont situés au voisinage de l’extrémité 5’ de la séquence
oriC. La formation par la protéine DnaA de ce complexe ouvert de 45 pb exige de l’ATP.
Dans ce complexe ouvert, entre la protéine DnaB apportée par le complexe DnaB- DnaC
formant un complexe de préamorçage. DnaC, une ATP ase qui aide la fixation de DnaB est
ensuite libérée.
La protéine DnaB qui est une hélicase déroule ensuite l’ADN dans les deux sens dans le
complexe de préamorçage en présence de SSB et de gyrase pour laisser entrer la primase et
l’ARN polymérase. Le stade qui permettra la réplication bidirectionnelle de l’ADN par la forme
holoenzyme de Pol. III est donc atteint.

Figure 10 : Initiation de la réplication au niveau d’ori C chez E. coli.

11
c) La terminaison de la réplication.

La région où la réplication se termine est, chez E. coli, une région assez longue de 350 Kb
bordée par sept sites presque identiques, non palindromiques, de 23 pb environ appelés sites
terminateurs TerE, TerD et TerA d’un côté et TerG, TerF, TerB et TerC de l’autre. OriC est à
l’opposé de cette région dans le chromosome d’E. coli.
L’arrêt de la progression d’une fourche de réplication au niveau des sites Ter, requiert
l’intervention de la protéine Tus, monomère de 309 résidus, produit du gène tus. La protéine
Tus se lie spécifiquement à un site Ter et y empêche le déroulement des brins par l’hélicase
DnaB, ce qui arrête la progression de la fourche. La protéine Tus interagit avec la protéine
DnaB pour inhiber son action hélicase.
Il est cependant curieux de constater que ce système de terminaison n’est pas indispensable
pour que cette dernière ait lieu. Lorsque cette région « terminus » est perdue, la réplication
s’arrête tout simplement parce que les deux fourches opposées se rencontrent. Cependant, le
système d’achèvement est très conservé parmi les bactéries gram-.

Figure 11 : Carte du chromosome d’E. coli montrant la position des sites Ter.

d) Fidélité de la réplication.

Il faut assurer une fidélité presque parfaite de la réplication afin de préserver l’intégrité du
message génétique à transmettre de génération en génération.
Il n’arrive qu’un mésappariement par 108 à 1010 paires de bases répliquées. Une telle précision
dans la réplication est le résultat de quatre adaptations.

1) Les cellules maintiennent des niveaux équilibrés en dNTP grâce à un mécanisme


régulateur. Si un des dNTP est présent à un niveau anormal par rapport aux autres, sa
probabilité d’incorporation erronée s’élève. Réciproquement, si un dNTP est présent en
trop faible quantité relative, sa probabilité d’être remplacé par un nucléotide présent en
quantité plus forte augmente.

2) La réaction de polymérisation a, pour elle-même une fidélité extraordinaire. Celle- ci


résulte de la conformation spécifique adaptée par la polymérase. Cette conformation est
possible s’il y a complémentarité, selon les règles d’appariement Watson- Crick. Le
changement de conformation constitue un contrôle de la conformité d’appariement.

12
3) Les fonctions exonucléase 3’→5’ de Pol. I et de Pol. III permettent de détecter et
d’éliminer les erreurs qui restent encore après l’intervention de la fonction polymérase.
En effet, les mutations qui augmentent l’activité exonucléase de correction sur épreuve
d’une polymérase, font chuter le taux de mutations détecté sur d’autres gènes
marqueurs.

4) Toutes les cellules contiennent une batterie de systèmes enzymatiques remarquables


permettant la réparation des erreurs qui restent encore dans l’ADN nouvellement
synthétisé, ainsi que la réparation des lésions diverses qui peuvent être produites après
la réplication, par des agents chimiques ou physiques (voir systèmes de réparation).

B) Réplication de l’ADN chez les eucaryotes


I. Caractéristiques générales
 La réplication de l’ADN chez les eucaryotes est tout à fait comparable à celle des
procaryotes. Elle est généralement bidirectionnelle et discontinue entre les deux brins
d’ADN.
 Des amorces d’ARN sont également nécessaires. Cette réplication est également
complémentaire, antiparallèle et ce fait dans le sens 5’→3’.

II. Caractéristiques particulières


 Chez les eucaryotes, il y a plusieurs origines de réplication : de 20 000 à 100 000 origines
de réplication par cellule. Ces origines de réplication ne sont pas toutes activées en
même temps, mais par petits groupes de 20 à 80 OR. Ces groupes constituent une unité
de réplication.
 Elle fait intervenir un nombre d’ADN polymérases plus important que chez les
procaryotes.
 De nombreuses protéines interviennent comme facteurs de réplication. Enfin, la
réplication de l’ADN des extrémités chromosomiques (ou télomères) commence à être
connue de manière plus approfondie

Figure 12 : Origines de réplication chez les eucaryotes

13
III. Enzymes et protéines eucaryotes
Les différentes enzymes et protéines intervenant dans la réplication eucaryote sont :

 La polymérase alpha/primase. Cette polymérase est impliquée dans l'initiation de la


réplication ("priming"). Elle intervient uniquement sur le brin retardé pour initier la
réplication.
 La polymérase béta et Pol epsilon sont impliquées dans la réparation de l’ADN.
 La polymérase gamma est impliquée dans la réplication de l’ADN mitochondrial
 La polymérase delta: c’est une ADN polymérase ADN-dépendante. C’est l’enzyme
principale de la réplication des deux brins fils.
 Elle réalise la réplication totale du brin avancé en 5’→3’ (initiation et élongation)
 Elle réalise la majorité de la réplication du brin retardé (élongation
 Elle a une fonction d’édition en 3’→5’.
 Protéine particulière nommée la PCNA (Proliferating Cellular Nuclear Antigen). Elle
régule la processivité de la polymérase.
 Les protéines RPA : pour maintenir les 2 brins séparés (ce sont les équivalents des
protéines SSB chez les procaryotes)

Figure 13 : Mécanisme de la réplication chez les eucaryotes

IV. Particularité eucaryote


 1ère particularité eucaryote : La présence de nucléosomes

Les nucléosomes sont des structures composées de protéines basiques : les histones. L’ADN
est enroulé autour de ces histones, et enroulé sur lui-même, dans un état de condensation.
D’après les connaissances actuelles, la présence des nucléosomes ne semble pas affecter les
fourches de réplication.
Les génomes des cellules filles doivent être identiques au génome de la cellule mère, ce qui
concerne également les nucléosomes.

14
Les nucléosomes parentaux restent associés, puis une répartition équivalente se fait entre les
deux brins (brin parental et brin fils) de la molécule d’ADN. Pendant la phase S du cycle
cellulaire, de nouveaux nucléosomes sont synthétisés pour compléter les nucléosomes
parentaux dans les cellules filles. Chaque brin possède alors 50% de nucléosomes parentaux et
50% de nucléosomes néosynthétisés.
La présence de ces nucléosomes est à l’origine du fait que la réplication chez les eucaryotes est
beaucoup plus lente que chez les procaryotes.

2ème particularité eucaryote : les télomères à l’extrémité des chromosomes

Les télomères sont des séquences d’ADN situées aux extrémités des chromosomes. On y
retrouve une séquence répétée en tandem (chez l’homme : TTA GGG).

Figure 14 : Télomère aux extrémités des chromosomes


La réplication du brin parental débute grâce à la primase qui synthétise pour amorce la séquence
CCC UAA, séquence complémentaire et antiparallèle de la séquence répétée (TTAGGG). En
fin de réplication, cette séquence va être éliminée par les RNases par hydrolyse. Ce n’est pas
un fragment d’Okasaki, donc une fois dégénérée, elle n’est pas remplacée par de l’ADN par
polymérisation.
En fin de réplication, on a donc le brin 3’ plus long que le brin 5’ (puisque l’on a une lacune au
niveau du brin fils).
Lorsque les cellules filles se divisent, les deux brins deviennent les brins parentaux. Le brin 5’
qui est alors répliqué a perdu 10 nt, qui correspondent à l’amorce d’ADN dans la génération
précédente. Donc sans aucun phénomène compensatoire, il y aurait une perte de nucléotides
(10 nt) à chaque cycle de réplication, et donc une perte d’information génétique.
Il existe cependant un phénomène compensatoire, réalisé par la télomérase. La télomérase
est une ribonucléoprotéine, c’est-à-dire qu’elle est constituée de protéines et d’ARN. La
fonction enzymatique portée par cette enzyme est une fonction ADN polymérase dans le sens
5’ 3’. C’est une enzyme ARN dépendante, qui utilise comme séquence matrice une séquence
d’ARN. Elle va utiliser comme matrice son ARN interne (endogène).
Le mécanisme qui vise à synthétiser de l’ADN à partir d’une molécule d’ARN est appelé
rétrotranscription (ou reverse transcription). La télomérase est donc reverse transcriptase (ou
retrotranscriptase).

 Mécanisme d’action de la télomérase :

15
Figure 15 : Mécanisme de la télomérase

Tout d’abord, la télomérase se positionne à l’extrémité 3’ et s’hybride (formation de liaisons


H) via sa séquence d’ARN à la séquence complémentaire sur le télomère.
Elle synthétise ensuite la séquence répétée de l’ADN de manière complémentaire et
antiparallèle à sa séquence d’ARN. La télomérase effectue ensuite une translocation, et
synthétise une nouvelle fois la même séquence.
Après l’action de la télomérase, on obtient l’extrémité 3’ des chromosomes simple brin plus
longue que l’extrémité 5’. Cette extrémité plus longue s’enroule vers l’arrière pour réaliser une
boucle T (repliement), grâce à des protéines spécialisées. Cette structure constitue un système
de protection des chromosomes, et participe donc à l’intégrité des chromosomes. Elle protège
les chromosomes de l’action de certaines enzymes.

16
Chapitre II

Systèmes de réparation de l’ADN :


maintenance de l’ADN

Introduction :

L’environnement dans lequel baignent les cellules, la présence


éventuelle de toutes sortes de substances toxiques, l’exposition aux UV
ou à des irradiations ionisantes, les soumettent à de nombreuses
agressions chimiques, pouvant exciser ou modifier les bases, ou altérer
les squelettes sucre- phosphate. Certaines de ces agressions arrivent en
fait très fréquemment.
La réplication d’ADN peut n’être pas parfaite. En effet, lorsque l’ADN
est endommagé ou répliqué de façon incorrecte, il en résulte que les
nucléotides situés sur les deux brins ne sont plus complémentaires (A-
T ou C-G). On dit qu’il y a le mésappariement entre les nucléotides.
Le message génétique ne peut conserver son intégrité que si toutes ces
lésions sont réparées. L’importance biologique de la réparation de
l’ADN est illustrée par l’identification d’au moins 130 gènes du
génome humain participant à la réparation de l’ADN et par l’abondance
de voies de réparation dont est pourvu un organisme relativement
simple tel qu’E. coli. En fait, les principaux systèmes de réparation sont
tout à fait semblables, quant à leurs aspects chimiques, entre E. coli et
les cellules d’eucaryotes.

17
I. Origine des altérations de l’ADN
I.1 Agents physiques
L’ADN peut être agressé par des agents physiques comme les rayons X, les rayons gamma, les
rayons ultra-violets (UV). Ces agents sont des agents mutagènes les plus anciennement connus
(mutagènes = qui provoquent des mutations dans l’ADN).
Les rayons UV provoquent la formation de dimères de thymine mais aussi de dimères de
thymine-cytosine. La présence de tels dimères entraîne un blocage de la réplication de l’ADN
et de la transcription. Sans réparation, leur présence serait donc létale pour la cellule

I.2. Agents chimiques


L’ADN peut être agressé par un nombre considérable de dérivés chimiques. Nous citerons plus
spécialement :
 Les agents alkylants : (comme la 2-méthyl nitrosamine) entraînent l’addition de groupes
alkyles aux bases (souvent des groupes -CH3).
 L’acide nitreux (produit dérivé des nitrates ou nitrites présents dans les produits
alimentaires ou dans les engrais). Cet agent chimique transforme par exemple, par
désamination oxydative, l’adénine en hypoxanthine.
 Certains composés chimiques ressemblent à des bases puriques ou pyrimidiques. Ils
peuvent être incorporés dans l’ADN à la place des bases normales (cas du 5
bromouracile qui ressemble à la thymine).
 Enfin, certains agents s’intercalent entre les deux brins d’ADN, ce sont des agents
intercalants. Ils perturbent ainsi la réplication. C’est le cas du révélateur de l’ADN
utilisé dans de nombreux laboratoires de biologie moléculaire : le bromure d’éthydium
ou B.E.T.

II. Types de dommage de l’ADN


a) Perte d’une base
La liaison glycosylique liant dans l’ADN les bases avec le désoxyribose est relativement labile
(instable) dans des conditions physiologiques. A l’intérieur d’une cellule de mammifère,
plusieurs milliers de bases puriques et plusieurs centaines de bases pyrimidiques sont
spontanément perdues dans le génome d’une cellule haploïde.
La perte d’une base purique ou pyrimidique crée un site appelé apurinique (sans purine) ou
apyrimidique (sans pyrimidine). Ils sont appelés site AP.

b) Modification d’une base


La désamination : les groupes -NH2 des bases peuvent être instables. Ils sont convertis en
groupes cétoniques =C=O. Ainsi, la cytosine désaminée est transformée en uracile, l’adénine
en hypoxanthines. Or, l’hypoxanthine est préférentiellement complémentaire de C plutôt que
de T. De même la méthylation des cytosines en 5-méthyl cytosine qui est le complément de A
plutôt que de G.
Les modifications chimiques : beaucoup d’agents chimiques (comme le peroxyde d’hydrogène,
les radicaux hydroxyles) peuvent réagir avec les bases des acides nucléiques :
 Ces espèces peuvent conduire à des hydroxylations sur les noyaux des bases (ajout de
groupes -OH).
 L’alkylation peut être facilement réalisée sur les bases de l’ADN par addition de groupes
méthyles ou alkyles par de très nombreux agents alkylants ou même par l’action de
simples donneurs de groupes méthyles présents dans la cellule.

18
Figure 16 : Bases endommagées

c) Action des rayons ultra-violets


La lumière UV est absorbée par les bases des acides nucléiques et des modifications chimiques
peuvent en résultent. Les produits les plus courants fournis par ces réactions photochimiques
sont surtout les dimères thymine-thymine (T-T), suivis des dimères thymine-cytosine (T-C) et
les dimères cytosine-cytosine. Il s’agit de structures stables entraînant une distorsion
considérable de la structure de l’ADN.

d) Erreurs de la réplication
Nous avons vu qu’au cours de la réplication de l’ADN, les ADN polymérases présentent une
activité exonucléasique 3’→5’ qui leur permet de vérifier si la dernière base introduite
correspond bien aux conditions classiques d’appariement.
Au cours de la réplication, il a été estimé que l’ADN polymérase III introduit un nouveau
nucléotide avec un taux d’erreur de 1/104 à 1/105 nucléotides incorporés, mais avec la fonction
d’édition, finalement le taux d’erreur passe à 1/108 à 1/1010 nucléotides incorporés. Cette
différence considérable correspond à la fidélité de la réplication.

e) Formation de ponts entre les brins de l’ADN ou entre des protéines et l’ADN
Certains agents chimiques (psoralènes par exemple) ou physiques (UV, radiations ionisantes)
peuvent conduire à des interactions stables («crosslinks») entre les deux brins d’ADN.

f) Coupures des brins d’ADN.


Les radiations ionisantes peuvent conduire à des coupures d’un brin d’ADN ou à des cassures
des deux brins d’ADN.

19
III. Mécanismes de réparation de l’ADN
A) Restauration immédiate des lésions

a) Les dimères de thymidine sont rompus par une photolyase

L’irradiation par les UV de 200 à 300 nm provoque la formation d’un cycle cyclobutyle entre
les résidus de thymine adjacents d’un même brin d’ADN, pour former un dimère de thymine
dans le même brin. Ces dimères de thymine déforment localement la double hélice d’ADN de
telle façon qu’elle ne peut plus servir de matrice adéquate à la transcription ni à la réplication.
De fait, un simple dimère de thymine non réparé suffit à provoquer la mort d’E. coli.
Les dimères de pyrimidines peuvent être restaurés sous leur forme monomérique, grâce à
l’activité d’enzymes présentes chez de nombreux procaryotes et eucaryotes appelés ADN
photolyases. Les ADN photolyases se fixent avec une forte affinité sur l’ADN double ou simple
brin, mais sans spécificité de séquence.

Figure 17 : Absorption des UV par deux résidus de thymines adjacents d’un même
brin d’ADN aboutit à la formation d’un dimère de thymine.

b) Les alkyltransférases désalkylent les nucléotides alkylés

Si l’ADN est exposé à des agents alkylants comme le N- méthyl- N’- nitro- N-nitrosoguanidine
(MNNG), il se forme, parmi d’autres produits, des résidus O6- alkyl- guanine. La formation de
tels dérivés est très mutagène .Chez toutes les espèces étudiées, les lésions de l’ADN sous forme
O6- méthyl guanine et O6- éthyle guanine sont réparées par une O6- méthyl guanine- ADN-
méthyle transférase, qui transfère directement le groupement alkyl lésionnel sur l’un de ses
propres résidus Cys. La réaction inactive cependant cette protéine, qui ne peut être qualifiée
d’enzyme (voir mode d’action).

Figure 18 : Formation de résidus O6- méthyle guanine, sous l’action d’agents alkylants

20
Figure 19 : Mode d’action de l’O6- méthyle - guanine- ADN- transférase.

B) Réparation par excision de nucléotides


Les cellules utilisent deux types de mécanismes de réparation par excision :

* La réparation par excision de nucléotides (NER, pour nucleotide excision repair), qui sert à
réparer les lésions assez importantes de l’ADN.

* La réparation par excision de base (BER, pour base excision repair), qui répare les lésions
ponctuelles d’une seule base.

a) La réparation par excision de nucléotides : NER

Le mécanisme NER chez les procaryotes est similaire à celui des eucaryotes.
Chez E. coli, la réparation NER est un processus dépendant de l’ATP et dû à l’action des
protéines UvrA, UvrB et UvrC, produits par les gènes uvrA, uvrB et uvrC.

Mécanisme NER : L’hétéro trimère (UvrA) 2 UvrB se fixe fortement mais de façon non
spécifique à l’ADN double brin. La présence d’une lésion active la fonction hélicase d’UvrB
qui déroule 5 pb autour de la lésion selon un processus nécessitant de l’ATP. Ce changement
de conformation induit la dissociation de UvrA qui quitte le complexe autorisant la fixation
d’UvrC. UvrB effectue alors une coupure du côté 3’ de la lésion, à la suite de quoi UvrC fait
une incision du côté 5’. UvrD se fixe au niveau des trous dans l’ADN et détache UvrC et
l’oligomère contenant la lésion. Ainsi, le site d’incision devient accessible à Pol.I qui comble
le trou et détache UvrB. Finalement, la ligature par l’ADN ligase restaure l’ADN.

21
Figure 20 : Mécanisme de réparation par excision de nucléotides.

Exemple : Chez l’homme, la maladie Xeroderma pigmentosum (XP) et le syndrome de


Cokayne (CS) sont dus à une NER génétiquement défectueuse.
XP : Incapacité des cellules de la peau de réparer les lésions induites par les UV. Maladie
récessive.
CS : Maladie héréditaire. Les personnes atteintes de CS sont hypersensibles aux UV,
grandissent mal et sont sujettes à des disfonctionnements neurologiques.

b) La réparation par excision de base : BER

Les bases de l’ADN peuvent être modifiées aussi bien par des réactions qui ont lieu dans des
conditions physiologiques normales que suite à l’action des agents présents dans
l’environnement. Par exemple, les résidus adénine et cytosine peuvent être spontanément
désaminés à un certain taux pour former respectivement des résidus hypoxanthine et uracile.
La S-adénosylméthionine (SAM), un agent méthylant normal du métabolisme, peut parfois
méthyler une base, sans l’aide d’enzyme, pour former des dérivés comme des résidus 3-méthyl
adénine et 7-méthyl guanine. Les radiations ionisantes peuvent provoquer des réactions
d’ouverture de cycle des bases. Ces changements modifient ou suppriment les propriétés
normales d’appariement des bases.

22
Figure 20 : Dommages subis spontanément par l’ADN : la désamination et la
dépurination.

L’ADN porteur d’une base endommagée peut être restauré dans son état initial grâce à la
réparation par excision de base (BER). Les cellules contiennent des ADN glycosylases variées
qui peuvent chacune cliver la liaison glycosidique correspondant à un nucléotide spécifique
altéré, laissant ainsi un résidu désoxyribose sans base dans la double hélice d’ADN. Ces sites
apuriques ou apyrimidiques (sites AP) sont aussi formés dans les conditions physiologiques
normales par l’hydrolyse spontanée d’une liaison glycosidique. Le résidu désoxyribose est alors
coupé d’un coté par une endonucléase apurique AP, le désoxyribose et quelques résidus
adjacents sont enlevés par une exonucléase cellulaire et le trou est comblé par une ADN
polymérase ; il y a ligature ensuite par l’ADN ligase.

23
Figure 21 : Les ADN glycosylases hydrolysent la liaison glycosidique de la base altérée
correspondante pour produire un site apurique (AP).

Remarque : Si l’uracile faisait partie de l’ADN, il serait fortement mutagène.

C) Réparation des mésappariements

Les mésappariements post-réplicatifs qui ont échappé aux activités correctrices des ADN
polymérases, peuvent encore être corrigés par un processus appelé réparation des
mésappariements (NMR pour mismatch repair).
Puisque le système NMR est sensé corriger les erreurs réplicatives pour éviter qu’elles ne se
perpétuent, il lui faut discerner l’ADN parental, qui possède la séquence correcte, du brin fils,
qui renferme une base incorrecte.
Chez E. coli, cette distinction est possible car les palindromes GATC nouvellement répliqués
restent hémiméthylés jusqu’à ce que la Dam- méthylase ait eu le temps de méthyler le brin fils.
La réparation des mésappariements chez E. coli, requiert la participation de trois protéines et se
réalise de la façon suivante :

24
Figure 22 : Mécanisme de réparation des mésappariements d’E. coli.

D) Recombinaison homologue est une importante voie de réparation de


l’ADN
Les différents modèles énoncés, portent sur la réparation fidèle de lésions de l’ADN qui survient
dans chaque cellule.
La recombinaison réparation entre en jeu lorsqu’une fourche de réplication rencontre une lésion
non réparée sur un des deux brins. Il faut noter que ce mécanisme ne répare pas réellement la
lésion simple brin à l’origine du problème, mais qu’il reconstitue la fourche de réplication de
sorte que les systèmes de réparation de l’ADN présentés précédemment puissent ensuite
éliminer la lésion.

 Mécanisme enzymatique de la recombinaison :


Les enzymes importantes de la recombinaison sont codées par les gènes recA, B, C et D et par
le gène ruvC. Les gènes recB, C et D codent pour l’enzyme RecBCD, qui peut initier la
recombinaison en déroulant l’ADN et le cas échéant en coupant un brin. La protéine RecA
favorise toutes les étapes majeures de ce mécanisme :

Figure 23 : Initiation de la recombinaison homologue par Rec BCD.

25
 Exemple de mutation : dimère T-T.

Au moment de la réplication, un tel dimère ne peut être copié par Pol.III, qui va passer ce site
endommagé sans le répliquer. Les deux molécules d’ADN issues de la réplication sont de nature
différente. Une avec le brin parental à défaut structural, apparié avec un brin synthétisé qui
présente une ouverture assez importante. L’autre molécule est normale. Le système de
rétablissement va profiter de l’existence de ce double brin d’ADN parfait. La région contenant
la lésion doit recevoir un brin complémentaire.
Le mécanisme de recombinaison utilise l’ADN homologue sur l’autre bras de la fourche de
réplication. Un échange des brins médié par la protéine RecA transfère un brin complémentaire
intact provenant de l’ADN homologue transformant la région contenant la lésion en un
hétéroduplex.

Figure 24 : Réparation post- réplicative faisant intervenir la recombinaison homologue.

E) Réponse SOS
Lorsque les lésions de l’ADN sont importantes, la réparation devient beaucoup moins exacte et
l’on observe un taux de mutations élevé.
On parle de réparation sujette à erreur qui est une voie distincte et non usuelle nécessitant une
induction d’un certain nombre de protéines qui peut se résumer dans le schéma suivant :

26
Figure 25 : Schéma général résumant le passage de la réponse SOS de la situation de
répression à la situation d’induction des gènes intervenant dans la réponse SOS.

 L’induction de la réponse S.O.S nécessite la destruction d’un répresseur

Les gènes S.O.S sont induits lorsque le chromosome bactérien est endommagé de façon
importante. Les éléments régulateurs sont :
- Le répresseur LexA: régule la transcription de tous les gènes S.O.S.
- La protéine RecA, ayant une activité de cooprotéase.
Des dommages importants de l’ADN entraînent la formation de nombreux « simple brin » dans
l’ADN. Ces brèches procurent le signal moléculaire qui active la protéine RecA entraînant la
coupure du répresseur LexA (autocoupure) et l’induction de réponse S.O.S.
LexA fonctionne comme un répresseur de 43 gènes participant à la réparation de l’ADN et au
contrôle de la division cellulaire.
L’analyse des séquences des gènes réprimés par LexA a montré la présence d’une séquence
homologue de 20 nucléotides appelée boite S.O.S. Pendant la croissance normale, LexA
réprime l’expression des gènes S.O.S en se fixant à leur boite S.O.S de façon à empêcher l’ARN
polymérase d’initier la transcription de ces gènes.

27
Figure 26 : LexA et RecA sont exprimées normalement à faible niveau. La quantité de
LexA disponible est suffisante pour réprimer complètement les autres gènes SOS. Quand
l’ADN est endommagé, la protéine RecA, en association avec de l’ADN simple brin,
entraîne la destruction du répresseur LexA. Cela permet la forte expression de RecA et
des autres gènes SOS, dont les produits sont nécessaires à la réparation de l’ADN.

 Gènes induits appartenant à la réponse S.O.S

• dinA (polB): Code pour l’ADN pol.II.


• dinB: code pour l’ADN pol IV.
• umuC+D: code pour pol.V.
• sulA: code pour une protéine qui bloque la division cellulaire pour permettre de
laisser le temps nécessaire à la réparation de l’ADN.
• dinD + dinF: gènes de fonction inconnue

 La réparation SOS fait des erreurs

Dans la réponse SOS, la synthèse des ADN polymérases de contournement est induite : l’ADN
polymérase IV et l’ADN polymérase V. Ces enzymes appartiennent à la famille des ADN
polymérases, dépourvus d’activité exonucléase 3’→.5’ de correction, et pour lesquelles la
réplication d’un ADN intact est à la fois peu fidèle et de faible processivité, c’est pourquoi, on
les appelle ADN polymérases productrices d’erreurs.
Pol.II est également induite lors de la réponse SOS et est capable de répliquer l’ADN au niveau
des lésions qui bloquent Pol.III. Comme un appariement correct de bases est souvent impossible
au niveau des lésions, cette réplication est souvent sujette à erreur.

Conclusion : La réparation par le système SOS provoque des erreurs et elle est donc mutagène,
c’est pourquoi ce processus de dernier recours ne se met en marche qu’environ 50 minutes après
l’induction de type SOS, et seulement si l’ADN n’a pas pu être réparé d’une autre façon. En
fait, la plupart des mutations d’E. Coli sont provoquées par le système SOS de réparation et
montrent qu’il vaut mieux survivre avec un risque de perte de fonction que de mourir, car ceci
donne une chance de gagner de nouvelles fonctions.

28
Chapitre III

Transcription génétique

Introduction

L’expression de l’information génétique contenue dans un segment


d’ADN passe toujours par la formation d’une molécule d’ARN qui
possède une diversité structurale supérieure à celle de l’ADN et peut
accomplir un large éventail de fonctions cellulaires.
Les molécules d’ARN peuvent non seulement véhiculer et exprimer
l’information génétique, mais elles peuvent aussi agir comme
catalyseurs.
L’ARN est la seule macromolécule connue ayant à la fois des fonctions
d’information et des fonctions catalytiques ; il s’agit d’un intermédiaire
chimique essentiel dans le développement de la vie sur notre planète.
Au cours d’un phénomène appelé transcription, un système
enzymatique convertit l’information génétique d’un segment d’ADN en
un brin d’ARN dont la séquence est complémentaire de celle d’un des
brins d’ADN.
La transcription de l’ADN est régulée de sorte que seule l’information
génétique nécessaire à la cellule à un moment donné soit transcrite.

29
I. Introduction générale
La relation entre l’ADN, l’ARN et les protéines se résume dans un schéma d’enchaînement que
Francis Crick appela en 1958, le dogme central de la biologie moléculaire. L’ADN dirige sa
propre réplication et sa transcription en ARN qui, à son tour, dirige sa traduction en protéines.

Figure 27 : Schéma résumant le dogme central de la biologie moléculaire.

La transcription constitue l’ensemble des mécanismes par lequel l’ARN messager (ARNm) est
synthétisé. L’ARNm est une copie d’une portion de l’ADN. Seules certaines portions de l’ADN
sont transcrites, ces séquences d’ADN sont appelées gènes. Enfin, seul l’un des deux brins
d’ADN est copié en ARNm. La transcription constitue l’étape préliminaire essentielle pour la
biosynthèse protéique (ou traduction).
La réplication et la transcription diffèrent sur un point important. La réplication est totale alors
que la transcription est sélective. Cette régulation met en jeu un grand nombre de protéines.
Trois principaux types d’ARN sont produits.
- L’ARNm porte la succession des bases qui codent pour la séquence d’acides aminés
d’un ou de plusieurs polypeptides, déterminés par un gène ou un ensemble de gènes
dans les chromosomes.
- L’ARN de transfert (ARNt) est un adaptateur qui reconnaît l’information codée dans
l’ARNm et transfère l’acide aminé approprié jusqu’à la chaîne polypeptidique en
croissance durant la synthèse protéique.
- Les ARN ribosomiques (ARNr) s’associent à des protéines pour former le ribosome,
une machinerie complexe de synthèse des protéines.
Par ailleurs, il existe de nombreux ARN spécialisés possédant des fonctions catalytiques ou
régulatrices.

II. Caractéristiques générales de la transcription


II.1. Règles de base
La synthèse d’un ARNm à partir d’ADN s’effectue toujours :
 Dans le sens 5’3’.
 De manière antiparallèle par rapport à la portion d’ADN copiée.
 De façon complémentaire (appariements G et C et A et U).

II.2. Éléments nécessaires à la transcription


La synthèse d’un ARNm nécessite :
 La présence de nucléotides propres au mARN, c’est-à-dire contenant du ribose, des
bases A, U, G et C et sous forme de nucléosides triphosphates : ATP, UTP, CTP et GTP
(on écrit souvent pour les dénommer NTP).
 La présence d’une enzyme : l’ARN-polymérase. Les sels de magnésium sont
indispensables à cette enzyme.
 Bien entendu, la présence d’une matrice d’ADN servant de modèle. Ce modèle est
indispensable à l’enzyme, on parle souvent d’ARN-polymérase ADN-dépendante.

30
II.3. Différentes étapes de la transcription
La transcription ne concerne qu’une portion de l’ADN. Il est bien évident qu’il faut définir le
début et la fin de la transcription et préciser les mécanismes par lesquels l’ARN-polymérase
reconnaît la portion d’ADN à transcrire. On parle également d’unité transcriptionnelle.
La synthèse de l’ARN messager comprend trois phases successives : l’initiation (ou début),
l’élongation de la chaîne polynucléotidique et enfin, la terminaison.

Figure 28 : Unité de transcription s’étend du site d’initiation au site de terminaison de la


transcription. L’ARN transcrit est une copie conforme du brin codant (sauf T est
remplacé par U), et est complémentaire du brin matrice.

A) Transcription génétique chez les procaryotes


I. L’ARN est synthétisé par des ARN polymérases

L’ARN polymérase, ADN dépendante, capable de former un polymère d’ARN à partir de


ribonucléosides 5’ triphosphate, fut isolé en 1959.

Figure 29 : Modèle courant de l’ARN polymérase bactérienne liée au promoteur.

31
La chimie de base de la synthèse de l’ARN a beaucoup de choses en commun avec la synthèse
de l’ADN. L’ARN polymérase possède une activité polymérasique 5’→3’.
A la différence de l’ADN polymérase, l’ARN polymérase n’a pas besoin d’une amorce pour
commencer la synthèse. La synthèse de l’ARN débute en général par un GTP ou ATP dont le
groupement 5’ triP n’est pas clivé pour libérer du PPi, mais reste intact durant l transcription.
Chez les bactéries, un seul enzyme catalyse la synthèse de tous les ARN cellulaires.
L’holoenzyme de l’ARN polymérase d’E. coli est une protéine de 449 kDa environ qui présente
la composition en sous unités  2   ’   . Une fois que la synthèse d’ARN a été amorcée,
la sous unité  (  70, masse moléculaire est de 70 kDa) se dissocie du cœur de l’enzyme,  2
  ’  , qui assure le véritable processus de polymérisation.

Figure 30 : Structure des sous unités de l’ARN polymérase d’E. Coli. Les sous unités 
 ,  ' et  forment le core enzyme. L e facteur  70, associé au core, forme
l’holoenzyme.

Les fonctions des sous unités de l’ARN polymérase sont :


 Alpha: 36 500: codée par le gène RpoA: Assemblage de l’enzyme.
 Béta: 150 000: codée par le gène RpoB: centre catalytique responsable de liaison des
rNTP et polymérisation de l’ARN.
 Béta’: 155 000: codée par le gène RpoC: reconnaissance et liaison avec l’ADN
 Oméga: 11 000: codée par le gène RpoZ: fonction inconnue?
 Sigma: 70 000 (32- 90 kDa): codée par le gène RpoD: permet à l’ARN pol de
reconnaitre le site du promoteur et initiation spécifique.

L’ARN polymérase possède une taille imposante caractéristique, qui résulte probablement de
diverses fonctions que doit accomplir l’enzyme.
1) la liaison à la matrice,
2) l’initiation de la chaîne d’ARN,
3) l’élongation de la chaîne,
4) la terminaison de la chaîne.

1) Liaison à la matrice : l’holoenzyme se lie spécifiquement aux promoteurs.

On donne par convention, le chiffre +1 au premier nucléotide à partir duquel la transcription


commence. Le chiffre -1 désigne le nucléotide qui le précède.
L’ARN polymérase se lie à des sites d’initiation par l’intermédiaire de séquences de bases
appelées promoteurs qui sont reconnus par le facteur  correspondant. Le promoteur
correspond à une séquence d’environ 40 pb située sur le côté 5’ du point de départ de la
transcription.

32
L’holoenzyme forme des complexes très stables avec les promoteurs. La région qui va de -20
à +20 environ se trouve très bien protégée contre une dégradation par l’ADNase I. La région
qui se trouve en amont jusqu’à environ -60 se trouve également protégée mais à un moindre
degré, sans doute parce qu’elle se lie moins fortement à l’holoenzyme.

Figure 31 : Principales régions d’un promoteur procaryotique.

La comparaison des séquences des promoteurs de nombreux gènes de procaryotes (E. coli) a
montré la présence de séquences nucléotidiques courtes présentant une grande similitude de
structure. Ainsi, deux séquences nucléotidiques sont remarquables :
 Une séquence située entre -30 et -35 paires de bases environ en amont de l’origine de la
transcription est appelée séquence -35. Cette séquence -35 présente un motif de six bases
bien conservées : TTGACA.
 Une autre, à environ 10 nucléotides (hexamère) en amont de l’origine de la transcription,
contenant motif TATAAT. Cette séquence dite séquence -10 est appelée également
boîte de PRIBNOW.
Le nucléotide +1 qui est presque toujours A ou G se trouve au centre d’une séquence faiblement
conservée CAT ou CGT.
Une mutation qui affecte l’une des régions partiellement conservées peut augmenter ou
diminuer fortement l’efficacité d’initiation d’un promoteur.

Figure 32 : Séquences consensus des régions -10 et -35.

Certains gènes fortement exprimés contiennent un segment riche en A+T entre les positions
-40 et -60, appelé élément promoteur amont UP pour « upstream promoter element », qui se
fixe au domaine C-terminal des sous unités  de l’ARN polymérase. Parmi les gènes
renfermant un élément UP, on trouve ceux des ARN ribosomaux, les gènes rrn, qui sont
responsables collectivement de 60% des ARN synthétisés par E. coli. Les vitesses de
transcription de ces gènes, qui varient d’un facteur 1000, sont directement proportionnelles à la
vitesse à laquelle leurs promoteurs forment des complexes d’initiation stables avec
l’holoenzyme.

33
2) L’initiation nécessite la formation d’un complexe ouvert

Des analyses montrent que la liaison de l’holoenzyme fait « fondre » le promoteur dans une
région d’environ 14 pb qui part du centre de la région -10 et va un peu au-delà du site
d’initiation.
Manifestement, la sous unité  permet à l’holoenzyme de se lier au niveau d’un promoteur
correspondant. Une fois la transcription initiée et la sous unité  dissociée, la liaison solide du
cœur de l’enzyme à l’ADN stabilise le complexe ternaire enzyme-ADN-ARN. Ainsi, L’enzyme
core se transforme en un simple catalyseur de la phase d’élongation.

 Initiation de la chaîne :

La base en position 5’ terminale des ARN des procaryotes est presque toujours une base
purique, A étant plus fréquent que G. La réaction initiatrice de la transcription est le couplage
entre deux nucléosides triphosphates selon cette réaction :

pppA + pppN  pppApN + PPi

Quand le complexe ouvert se forme, la synthèse continue de l’ARN commence. A ce stade, le


facteur  se dissocie du complexe cœur de l’enzyme ADN- ARN, pour s’associer à un autre
cœur de l’enzyme et former un autre complexe d’initiation.

 L’initiation de la transcription est régulée :

Trois types de protéines, au moins, régulent l’initiation de la transcription par l’ARN


polymérase :
* Des facteurs de spécificité.
* Des répresseurs.
* Des activateurs.

La transcription de chaque gène est soigneusement régulée de façon à procurer à la cellule


les protéines en quantités nécessaires. Un grand nombre de protéines se lient à des séquences à
l’intérieur ou autour du promoteur soit pour activer la transcription en facilitant la liaison de
l’ARN polymérase, soit la réprimer en bloquant son activité.
Comme la transcription est la première étape d’un chemin compliqué et gourmand en énergie
conduisant à la synthèse des protéines, une grande part de la régulation de l’abondance d’une
protéine, s’effectue au niveau de l’initiation de la transcription. De nombreux mécanismes
permettent cette régulation. (Voir cours sur la régulation des gènes).

3) Élongation de la chaîne :
L’allongement de la chaîne d’ARN se fait dans le sens 5’  3’ à partir d’un brin d’ADN matrice
orienté de 3’  5’. Cette conclusion a été confirmée par l’observation que l’antibiotique
cordycépine, un analogue de l’adénosine dépourvu de groupe 3’(OH), inhibe la synthèse
d’ARN chez les bactéries. Son incorporation à l’extrémité 3’(OH) de l’ARN, comme prévu
pour une croissance dans le sens 5’  3’, empêche l’élongation ultérieure de la chaîne d’ARN.
La cordycépine n’aurait pas cet effet si la croissance de la chaîne se faisait en sens opposé, car
elle n’aurait pu s’incorporer à une extrémité 5’ d’ARN.

34
Figure 33 : Différentes étapes de la transcription par l’ARN polymérase d’E. coli.

Figure 34 : Modèle d’une bulle de transcription au cours de l’élongation du transcrit de


l’ARN. Le brin matrice de l’ADN est celui dont la polarité est 3’  5’. Le duplex de
l’ADN est déroulé en avant de l’ARN polymérase et réenroulé en arrière. L’hélice
hybride ARN- ADN tourne de façon synchrone.

Remarque :
La vitesse de transcription in vivo est de 20 à 50 nucléotides incorporés par seconde à 37°C.
L’ARN polymérase n’a pas d’activité exonucléase pour corriger ses erreurs. La fréquence d’erreurs
observée dans la synthèse d’ARN, est d’une base erronée pour environ 10 4 bases transcrites. Cette
fréquence est tolérable compte tenu des points suivants :
 La transcription est répétée pour la plupart des gènes.
 Le code génétique contient de nombreux synonymes.
 Les substitutions d’acides aminés sont souvent sans incidence sur la fonction protéique.
 De grandes parties de nombreux transcrits eucaryotes sont excisées lors de la maturation de
l’ARN.

35
4) Terminaison de la chaîne :

La terminaison se fait lorsque l’enzyme arrive au niveau d’une séquence spécifique


appelée terminateur.
Le terminateur se présente sous la forme d’un palindrome. Ce dernier entraîne une
complémentarité de séquence au niveau de l’ARNm qui permet la mise en place d’une structure
en épingle à cheveux (ou tige-boucle) qui est un appariement intra-chaîne qui déstabilise
l’ARN-polymérase jusqu’à dissociation.

a) Terminateurs Rho- indépendant :

Il existe des sites spécifiques où s’arrête la transcription. Les séquences de terminaison de la


transcription de nombreux gènes d’E. coli ont deux caractéristiques communes :
* Une série de 4 à 10 A-T consécutifs, les A étant sur le brin matrice. L’ARN transcrit se
termine au niveau de cette séquence ou juste après.
* Une région riche en G+C ayant une séquence palindromique, juste avant la série de A-T.
Le transcrit d’ARN de cette région peut donc former une structure en « épingle à cheveux »
auto- complémentaire qui se termine par plusieurs résidus U.

Figure 35 : Site de terminaison Rho indépendant chez E. coli. Les séquences riches en
A-T et en G-C sont représentées. La structure en épingle à cheveux et la queue poly (U)
déclenchent l’arrêt de la transcription.

La stabilité de l’épingle à cheveux terminale riche en G+C et l’appariement fragile de sa queue


oligo (U) à la matrice d’ADN semblent être des facteurs importants pour que la terminaison de
la chaîne se fasse correctement.
Des études ont montré que l’oligo (dA-rU) forme une hélice hybride particulièrement instable.
La formation de l’épingle à cheveux riche en G+C entraîne l’arrêt de quelques secondes de
l’ARN polymérase au site de terminaison. Il s’ensuivrait un changement conformationnel de
l’ARN polymérase, permettant au brin non codant de l’ADN de détacher du brin matrice la
queue oligo (U), faiblement lié, d’où l’arrêt de la transcription.

36
Conclusion :
La queue oligo (U) fournit probablement un signal qui permet à l’ARN polymérase de se
dissocier de la matrice. L’importance de la répétition U est confirmée en effectuant des
délétions qui enlèvent certains résidus U : bien que la polymérase s’arrête toujours au niveau
de l’épingle à cheveux, elle ne termine plus la transcription.

b) Terminateurs Rho- dépendant : la terminaison nécessite l’aide du facteur Rho.


La moitié environ des sites de terminaison ne présentent pas des similitudes évidentes avec les
précédents et sont incapables de déclencher la terminaison ; ils nécessitent une protéine appelée
facteur Rho pour terminer la transcription. Ces terminateurs ont des épingles à cheveux et ne
possèdent pas de répétitions.
Plusieurs observations ont conduit au modèle de la terminaison Rho- dépendante :
 Le facteur Rho est une hélicase qui catalyse le déroulement des doubles hélices ARN-
ADN et ARN-ARN. Ce processus est entraîné par l’hydrolyse de nucléosides
triphosphates (NTP) en nucléosides diphosphates + Pi, sans beaucoup de préférence
quant à la nature de la base. L’activité NTPasique est indispensable pour la terminaison
Rho- dépendante.
 Des manipulations génétiques ont montré que la terminaison Rho- dépendante nécessite
la présence d’une séquence spécifique de reconnaissance sur l’ARN naissant en amont
du site de terminaison. La séquence de terminaison doit se trouver sur l’ARN
néosynthétisé. Les principales caractéristiques de ce site de terminaison ne sont pas
encore bien élucidées.

Figure 36 : Terminaison Rho dépendante chez E. coli. Après la pause de l’ARN


Polymérase, Rho la rattrape, et l’interaction des deux protéines
Libère l’ARN transcrit.

37
II. Maturation post- transcriptionnelle des ARN chez les procaryotes

Les produits immédiats de la transcription, les transcrits primaires, ne sont pas nécessairement
des entités fonctionnelles. Pour devenir biologiquement actifs, beaucoup d’entre eux doivent
être modifiés de différentes façons :

* Par élimination exo et (ou) endonucléasique de segments polynucléotidique.


* Par l’addition des séquences nucléotidiques à leurs extrémités 5’ et 3’.
* Par la modification de nucléosides spécifiques.

Chez les procaryotes, les molécules d’ARNm ne subissent aucune modification après leur
synthèse par l’ARN polymérase. En fait, beaucoup d’entre elles sont traduites alors même
qu’elles sont en cours de transcription. A l’inverse, l’ARNt et les molécules d’ARNr sont
formés par clivage et modification des chaînes d’ARN naissantes.

B) Transcription génétique chez les eucaryotes

1. Les ARN polymérases chez les eucaryotes


Contrairement aux procaryotes qui ne possèdent qu’une seule ARN polymérase, les eucaryotes
ont trois ARN polymérases qui assurent la synthèse des différents ARN. La transcription
implique donc :
 L’ARN polymérase I. Elle transcrit les rARN: 5,8 S, 18 S et 28 S, sauf le rARN 5 S.
 L’ARN polymérase II. Elle transcrit les précurseurs des mARN ou transcrits primaires,
la plupart des petits ARN nucléaires (snARNs).
 L’ARN polymérase III. Elle transcrit les tARN, les rARN 5 S et une faible fraction
des ARN nucléaires.

Ces trois ARN polymérases ont été initialement distinguées par leur sensibilité à des inhibiteurs
tels que l’α-amanitine (isolé des champignons). Des trois ARN polymérases, l’ARN
polymérase II est la seule très sensible à l’α-amanitine. Ces ARN polymérases sont localisées
dans le noyau de la cellule.
La transcription par chacune des ces trois ARN-polymérases implique les trois étapes
suivantes :
1/La reconnaissance des séquences du promoteur et l’assemblage d’un complexe d’initiation
au point de départ de la transcription.
2/ L’élongation, c’est-à-dire la synthèse de l’ARN.
3/ La terminaison.
Toutes les ARN polymérases ont besoin de facteurs multiples pour se positionner au point de
départ de la transcription. Ainsi, il existe des facteurs qui contribuent à un niveau bas de
transcription et des facteurs additionnels (activateurs) qui augmenter la transcription au-delà du
niveau basal.
Toutes les ARN polymérases des eucaryotes sont des protéines constituées de nombreuses sous-
unités (typiquement de 8 à 14). La plus grande sous unité de l'ARN polymérase II a un domaine
C-terminal ("carboxy-terminal domain": CTD) qui consiste en une répétition d'une séquence
consensus de 7 acides aminés. Cette séquence répétitive est propre à l'ARN polymérase II. Chez
les mammifères, on dénombre environ 50 répétitions de cette séquence consensus. La portion
CTD peut être hautement phosphorylée sur des résidus sérine ou thréonine. Dans ce chapitre
nous nous intéresserons essentiellement à la synthèse des transcrits primaires des gènes des
eucaryotes par l'ARN polymérase II.

38
2. Structure des gènes chez les eucaryotes : les exons et les introns
Chez les eucaryotes, les gènes présentent une structure discontinue, comportant des exons et
des introns. Les exons sont par définition des séquences d’ADN qui seront traduites en
protéines (on dit aussi qu’elles seront exprimées). Les introns sont par définition des séquences
d’ADN intercalées entre les exons.

Figure 37 : Chromosome présentant des exons et des introns au niveau des gènes.

3. Différentes phases de la transcription

3.1. Copie d’un gène, formation d’un transcrit primaire (ou pré-mARN)
3.1.1. Promoteur et régions régulatrices
. Les promoteurs de l’ARN polymérase II (comme ceux de l’ARN polymérase des bactéries)
sont localisés en 5’ par rapport au site d’initiation de la transcription. Des régions situées en
amont du site d’initiation sont d’importance pour la transcription :

 Tout d’abord, la boîte TATA : elle est située à environ -25 paires de bases de l’origine
de la transcription. C’est une séquence de six nucléotides riche en A et T. La séquence
dite consensus (statistiquement la plus rencontrée) est TATAAA. Une mutation dans
cette boîte altère fortement la transcription. Cette boîte fixe un facteur général de
transcription appelé TFIID (TF : facteur de transcription ; II pour l’ARN polymérase
II). Ce facteur est absolument nécessaire pour l’initiation de la transcription. Puis en
remontant en amont du site d’initiation, on trouve successivement :
 La boîte GC (située le plus souvent dans la région entre -110 et -40). Elle peut se
présenter sous forme d’hexanucléotides : 5’-GGGCGG-3’. Le motif riche en bases G et
C peut être répété plusieurs fois.
 La boîte CCAAT (souvent située dans la région entre -120 et -80). Cette
boîte peut être située avant ou après une boîte GC ou même entre deux
boîtes GC.

L’unité de transcription comporte une origine le point de départ de la transcription (ou site +1)
et un point de fin de la transcription (séquence de terminaison de la transcription). En d’autres
termes, une unité de transcription va de la première base transcrite à la dernière base transcrite.

39
L’ARN qui lui correspond s’appelle-le transcrit primaire ou pré-mARN. Il comprend non
seulement les régions codantes ou exons, mais aussi les introns et les portions 5’ et 3’ non
traduites (régions 5’-UTR et 3’-UTR, « UTR= untranslated regions »).
Le terminateur au niveau de l’ARN est constitué de la séquence CPSF (AAUAAA) suivie par
un site de poly-adénilation 20 nucléotides en aval (formation d’une structure tige-boucle) et
après laquelle il y aura clivage.

Figure 38 : Unité de transcription.

3.1.2. Formation de complexe d’initiation


A la différence de l’ARN polymérase des procaryotes, l’ARN polymérase II des eucaryotes ne
se fixe pas directement sur le promoteur. Elle se fixe par l’intermédiaire de facteurs généraux
de la transcription comprenant plusieurs protéines dénommées TF pour « transcription factor »
et II pour l’ARN polymérase II : TFIIA, TIIB., TFIID, TFIIE, TFIIF, TFIIH. Ces protéines
associées à l’ARN polymérase II constituent le complexe d’initiation de la transcription et
catalysent la formation de la première liaison phosphodiester entre les deux premiers
nucléotides du mARN. Lorsque le site promoteur est libéré par la progression de l’ARN
polymérase II sur l’ADN constituant la phase d’élongation, un autre complexe d’initiation peut
se mettre en place.
Une succession d’étapes met en jeu des éléments du promoteur, l’ARN polymérase II et des
facteurs protéiques généraux de la transcription pour initier la synthèse du transcrit primaire :

1/. La première étape est constituée par la fixation du facteur de transcription


TFIID sur la boîte TATA. Cette fixation est réalisée par l’intermédiaire d’un des
composants du facteur TFIID qui est appelé TBP (pour « TATA box binding
protein») (figure 39a).

40
Figure 39a : Fixation du facteur de la transcription TFIID sur la boite TATA.

Un facteur additionnel TFIIA stabilise l’association facteur TFIID et boîte


TATA. Il n’est pas représenté sur les schémas suivants. Le facteur TFIID
comporte des facteurs appelés TAFII (« transcription activating factors ») Ces
facteurs TAFII permettent l’interaction entre le facteur TFIIID et des éléments
activateurs situés en amont de la boîte TATA.

2/. Puis le facteur TFIIB se fixe sur le facteur TFIID fixé sur la boîte TATA (figure 39b).

Figure 39b : Fixation du facteur de la transcription TFIIB sur TFIID.

3/. Le facteur de transcription TFIIB recrute l’ARN polymérase II et le facteur TFIIF (figure
39c)

Figure 39c : Recrutement de l’ARN Pol II et le facteur TFIIF.

41
4/. Les facteurs TFIIE et TFIIH se fixent, suivis par des facteurs supplémentaires complétant le
complexe de transcription (figure 39d).

Figure 39d : Recrutement de l’ARN Pol II et le facteur TFIIF.

Le facteur TFIIH présente une activité protéine kinase. En présence d’ATP, une
phosphorylation de l’ARN polymérase est réalisée sur la plus grosse sous-unité de l’enzyme
riche en sérine et en thréonine (partie C-terminale).

5/. La phosphorylation sur sites spécifiques déclenche le début de la transcription :


De plus, arrivée au bout du promoteur, l’ARN polymérase II doit être libéré du complexe des
facteurs de transcription généraux pour démarrer la transcription.

Remarque : La phosphorylation d’une des sous-unités de l’ARN polymérase


est indispensable pour déplacer l’enzyme du complexe d’initiation de la
transcription.

3.2. Maturation des transcrits primaires

3.2.1. Addition de la coiffe (ou « cap ») à l’extrémité 5’


Le premier nucléotide du transcrit primaire commence par un groupement triphosphate. La base
correspondante est en principe une base purique (A ou G). L'extrémité 5" initiale du transcrit
primaire peut alors être représentée par : 5" pppA/GpNpNpNpN... avec p = groupement
phosphate et N = A,T,C ou G. En présence de GTP et d'une guanylyl transférase, on a la réaction
suivante :
Gppp+pppApNpNp...----->GpppApNpNp...+pp+p

Le premier phosphate situé à l’extrémité 5’ du transcrit primaire va être éliminé au cours d’une
soudure (par une liaison anhydride d’acide) avec du GMP (guanosine monosphosphate)
provenant du GTP. Il y a donc constitution d’une liaison inhabituelle : 5’-5’ triphosphate. On
parle de coiffe ou « cap ». Ainsi, la coiffe correspond à l’ajout d’un groupement, dit « m7G »,
par une liaison 5’-5’ triphosphate. Ce groupement m7G correspond à l’addition de trois
groupements phosphates et d’une molécule de GTP au niveau de l’extrémité 5’ du transcrit

42
primaire grâce à l’énergie libérée par l’hydrolyse de la molécule de GTP. Le nucléotide G va
ensuite être méthylé sur le septième carbone (C7) pour donner la 7-méthyl-guanosine.
La coiffe est ajoutée grâce à un complexe protéique appelé « Cap-Binding-Complex » qui
possédant une activité triphosphatase, une activité guanylyl-transférase et une activité méthyl-
transférase. D’autres modifications peuvent se produire comme des méthylations en 2’ sur les
riboses situés sur les deux premiers nucléotides de l’extrémité 5’ du transcrit primaire. La coiffe
est indispensable pour protéger les mARN de l’attaque par des enzymes de dégradation.

Figure 40 : Coiffe à l’extrémité 5’ du transcrit primaire

3.2.2. Addition de poly(A) à l’extrémité 3’

Après synthèse, les ARN messagers sont clivés dans leur partie 3’ une vingtaine de bases en
aval d’une séquence spécifique : AAUAAA (signal de poly-adénilation). Cette coupure est
réalisée par une endonucléase. Après cette coupure, une enzyme la poly(A) polymérase en
présence d’ATP additionne un nombre variable d’Adénine (au moins 200-250 chez les
mammifères supérieurs). La plupart des ARNm synthétisés par l’ARN polymérase II possèdent
cette extrémité poly(A), à l’exception des ARN messagers d’histones. La présence de poly(A)
aurait également une fonction de protection des mARN sur leur extrémité 3’.

3.2.3. Excision des introns et épissage des exons

Après l’addition de la coiffe et la poly-adénilation, le transcrit primaire est encore soumis à


l’excision des introns et l’épissage des exons ; les introns sont ainsi éliminés. Ceci est possible
par la présence de site donneur d’épissage (dinucléotide GU) à l’extrémité 5’ des introns et
de site accepteur d’épissage (dinucléotide CAG) à l’extrémité 3’ des introns.
Au niveau du transcrit primaire (figure 41) :
 La séquence des bases d’un intron commence par GU (un site donneur) et se termine
par AG (un site receveur).
 A l’extrémité 3’, la séquence consensus est un brin de dix pyrimidines (Py = U ou C)
suivie par n’importe quelle base N (A, U, G ou C) et se termine par la séquence
invariante AG.

43
 Le site de branchement (A) : un nucléotide à adénine, environ 40 nucléotides avant le
site 3’ d’épissage.

Figure 41 : Transcrit primaire

L’excision des introns (coupure) et l’épissage (liaison) des exons est l’étape la plus importante
de la maturation du transcrit dans le noyau cellulaire. C’est un mécanisme qui représente donc
l’action d’enzymes qui catalyse la coupure d’ARN (endoribonucléase) et la fermeture de la
brèche (RNA ligase).
Le mécanisme de l’excision-épissage fait intervenir deux réactions de transestérification :

 Dans la première étape : il y a formation d’un premier clivage en 5’ de l’intron. L’OH


situé en 2’ du ribose appartenant à l’A du branchement vient se souder à l’extrémité 5’-
phosphate de l’intron. Il y a formation d’une liaison 5’-2’ phosphodiester. Ce qui abouti
à la constitution d’une boucle appelée « Lasso ». L’extrémité 3’ de l’exon situé en amont
du clivage (exon 1) présente un OH (3’) libre :

 2) Une seconde étape correspond au deuxième clivage en 3’ de l’intron. Il y a


simultanément : soudure des deux exons avec formation d’une liaison phosphodiester
entre l’OH (3’) de l’exon 1 et le phosphate (5’) de l’exon aval (exon 2) et libération du
lasso qui sera ensuite dégradé.

44
3.2.3.1 Rôle des petits ARN nucléaires (snARN)

Chez les eucaryotes, il existe des petits ARN nucléaires (snARN). Ce sont des petites molécules
(100-300 nucléotides environ), riches en uracile. On les dénomme U1, U2, U4, U5 et U6.
Chaque snARN est associé à ses propres facteurs protéiques pour constituer un complexe appelé
snRNP.
Ces complexes (snRNP) se fixent au niveau de l’intron à éliminer constituant un complexe
appelé « spliceosome ». La constitution de ce « spliceosome » est nécessaire pour un
déroulement correct de l’excision-épissage.
La présence de ces « spliceosomes » au niveau des différents introns d’un transcrit primaire
permet le maintien de celui-ci dans le noyau dans l’attente de sa maturation en ARNm. Parmi
les snRNP, on peut distinguer :
 U1: Permet la reconnaissance de la partie 5’ de l’intron à exciser par une
 complémentarité de séquence avec ce dernier.
 U2: S’associe au site A de branchement.
 U5: Permet la reconnaissance de la partie 3’ de l’intron à exciser.
 U4 et U6 interagissent entre eux. U6 possèderait l’activité catalytique.

Figure 42 : Formation de spliceosome au niveau de l’intron.

45
3.2.3.2 Autres types d’épissage possibles

D’autres mécanismes d’épissage sont possibles tels que :

a) L’auto-épissage : certains ARN sont doués d’activité enzymatique permettant les


réactions de trans-estérifications. On les appelle des ribozymes.

b) Le trans-épissage : l’épissage ne se produit pas au sein d’un même messager, mais entre
deux messagers différents. Ce type d’épissage a été décrit chez un parasite, le
trypanosome.

c) L’épissage utilisant une maturase : processus très complexe décrit chez la levure (gène
du cytochrome b) il y a traduction en protéine (ou maturase) à partir d’un premier intron,
puis cette protéine sert à épisser les transcrits des introns suivants.

3.2.3.3 Rôle des introns

Les progrès considérables dans le déchiffrage du contenu des génomes au cours des deux
dernières décennies ont notamment permis de révéler l’existence de multiples séquences
d’ADN non codant, aux rôles souvent mystérieux. Parmi elles, les « introns »
Le rôle des introns est encore discuté. Cependant, quelques idées semblent émerger. Les introns
pourraient faciliter l’élaboration de gènes complexes en délimitant des séquences codantes et
permettant ainsi la mobilité des exons dans le génome.
Une étude récente, publiée le 27 juillet 2017 dans la revue Molecular Cell, a montré que la
présence d’introns dans les génomes eucaryotes les protège de l’instabilité génétique. En effet,
La synthèse des ARN, indispensable au fonctionnement cellulaire, peut en effet s’avérer
délétère pour la stabilité du génome, notamment par la formation d’hybrides ARN-ADN, ou
« R-loops », dont la présence entraine l’apparition de dommages dans le matériel génétique.

Comment la présence de ces séquences non codantes s’oppose-t-elle à l’hybridation de


l’ARN sur son ADN matrice et diminue ainsi l’incidence de ces structures génotoxiques ?

Les chercheurs ont notamment exploré la possibilité que le recrutement sur les introns des
facteurs impliqués dans leur épissage puisse directement s’opposer à la formation des R-loops
(hybrides ARN-ADN).

Figure 43 : formation de R-loop (hybride ARN-ADN) sur les gènes sans introns.

46
Conclusion : une nouvelle fonction aux introns dans la protection contre ces structures
délétères, et améliore ainsi notre connaissance des mécanismes universels qui permettent de
coordonner l’expression des gènes avec le maintien de la stabilité du génome.

4. Définition des facteurs Cis- et Trans régulateurs de la transcription


Il existe toute une série de séquences nucléotidiques comportant chacune un nombre limité de
nucléotides (6-8 nucléotides le plus souvent) et dispersées généralement en 5’ du gène, ces
séquences sont appelées éléments cis-régulateurs. Ces séquences sont remarquablement
conservées dans les gènes de nombreuses espèces. Elles vont fixer des facteurs dits trans-
régulateurs.

4.1. Facteurs cis-régulateurs de la transcription

Quand un facteur trans-régulateur se fixe sur une séquence cis-régulatrice de l’ADN, la quantité
de mARN synthétisé est brusquement modifiée, soit augmentée, soit diminuée. Les séquences
activatrices (séquences « enhancer ») peuvent être situées à des distances très importantes du
promoteur du gène (jusqu’à quelques dizaines de kilobases) et ceci en amont ou en aval du
gène. Des séquences extinctrices (séquences « silencer ») ont un effet opposé aux séquences
activatrices. Elles peuvent être également situées très à distance du promoteur du gène. C’est
bien entendu la structure tridimensionnelle de l’ADN qui permet de rapprocher ces éléments
régulateurs du gène à transcrire.

Ainsi, pour nous limiter à quelques exemples, le facteur général de transcription TFIIID peut
être considéré comme un facteur trans-régulateur. Il se fixe sur un élément cis-régulateur qui
est la boîte TATA.
La boîte GC, élément cis-régulateur va fixer un facteur trans-régulateur, la protéine Sp1.
La boîte CCAAT, élément cis-régulateur va fixer le facteur CTF (« pour CCAAT binding
transcription factor »).

4.2.Facteurs trans-régulateurs de la transcription

Les facteurs trans-régulateurs sont des protéines particulières produites par d’autres gènes. Ces
protéines présentent des caractéristiques structurales communes, avec au moins au minimum
deux domaines :

- Tout d’abord un domaine de fixation à l’ADN. Des motifs structuraux particuliers


ont été décrits avec :
 Les doigts de zinc. Ce type de protéine comporte des éléments répétitifs avec une forme
de doigt de gant. On peut retrouver de nombreux doigts. Ainsi, la protéine Sp1 qui se
fixe sur les boîtes GC possède trois doigts de zinc. L’ion Zn2+ sert à stabiliser le motif
sous forme de doigt.
 Les glissières à leucine. Les protéines avec glissière à leucine se fixent à l’ADN sous
forme de dimères. Elles possèdent deux régions importantes. Une région à base du
dimère, constituée par deux hélices alpha face à face riches en leucine et interagissant
par des liaisons de type hydrophobe. Une autre région riche en charges positives se fixe
sur les groupes phosphates de l’ADN.
 Les homéodomaines à charges positives avec des struchélice/boucle/hélice,
hélice/tour/hélice (voir cours sur les protéines).

- Un autre domaine, dit d’action sur la transcription. On peut rencontrer : différents types
de domaines d’activation de la transcription. Des domaines riches en glutamine, des

47
domaines riches en proline et des domaines organisés en hélice alpha riches en résidus à
charge négative (hélice alpha-acide)
Certains facteurs trans-régulateurs possèdent un troisième domaine qui permet de fixer un
élément annexe permettant de réaliser l’action d’un message extérieur à la cellule, comme un
message hormonal. On a pu ainsi définir la superfamille des récepteurs nucléaires (stéroïdes,
vitamines D, hormones thyroïdiennes, acides rétinoïques, acides gras polyinsaturés...). Enfin,
l’action des facteurs trans peut être elle-même régulée par d’autres facteurs avec modification
des facteurs trans en réponse à une stimulation extérieure : phosphorylation, protéolyse etc...

5. Régulations post-transcriptionnelles
5.1. Régulations qualitatives
5.1.1. Épissage alternatif

Généralement, une cellule peut épisser le transcrit primaire de différentes façons, et donner
ainsi plusieurs protéines différentes à partir d’un seul gène. Ce processus est appelé épissage
alternatif ou épissage différentiel.
Ainsi dans l’exemple suivant, il existe une possibilité d’exon optionnel.
D’autres possibilités existent d’épissage alternatif (intron optionnel par exemple).Un exemple
d’épissage alternatif : l’exon optionnel.

Un exemple d’épissage différentiel et constitué chez l’Homme par le gène de la


calcitonine. Dans certaines cellules de la glande thyroïde, le transcrit primaire
subit un épissage conduisant à un messager précurseur de la calcitonine. Par
contre, dans le cerveau, le même messager subit une maturation différente
avec un messager d’un neuromédiateur.
5.1.2. Edition
La correction (ou édition) d’un ARN concerne tout traitement du mARN par addition,
suppression, substitution d’un ou plusieurs nucléotides aboutissant à la formation d’un mARN
dont la séquence diffère de celle du brin d’ADN lu au cours de la transcription. De cette
définition est exclue bien entendu, l’excision des introns.

5.1.2.1. Edition par insertion d’une base et décalage du cadre de


lecture
Ce cas a été décrit pour une protéine du virus de la rougeole. Le gène P peut coder pour un
mARN lui correspondant exactement nucléotide à nucléotide. Mais on peut avoir également
une insertion d’un nucléotide supplémentaire (G) ce qui provoque un changement du cadre de

48
lecture dans la succession des triplets (codons) nucléotidiques. Dès lors, on peut dire d’un gène
unique peut exprimer deux protéines différentes.

5.1.2.1. Edition par insertion d’une base et décalage du cadre de


lecture
L’exemple typique est celui d’une apolipoprotéine B chez l’Homme (lipoprotéine) L’apparition
d’un codon stop dans le messager de cette apoliprotéine conduit à une protéine raccourcie du
fait de l’apparition prématurée de ce codon stop.
Ainsi, un même gène peut ainsi donner naissance à deux mARN différents, traduits en deux
protéines différentes, l’une dans le foie (apolipoprotéine B100), l’autre dans l’intestin
(apolipoprotéine B48).

5.2. Régulations quantitatives


Ces régulations font intervenir :
 La stabilité du mARN. Cette stabilité peut être très variable. Elle conditionne la durée
de vie. Elle fait intervenir des séquences non traduites situées en 5’ et en 3’ de la portion
codante (régions 5’-UTR et 3’-UTR).
 Le stockage de mARN non transcrits dans le noyau ou dans le cytoplasme.

49
Chapitre IV

Expression de l’information génétique :


traduction

Introduction

Les protéines sont les produits terminaux de la majorité des voies


d’information.
La synthèse des protéines est le plus complexe des mécanismes de
biosynthèse. La synthèse des protéines peut représenter jusqu’à 90% de
l’énergie chimique utilisée par une cellule pour la totalité de ses
réactions de biosynthèses. Chez E. coli, le nombre de différentes
molécules d’ARN ou de protéines impliquées dans la synthèse des
protéines est comparable à celui des eucaryotes.
Les protéines sont fabriquées à des vitesses élevées. Une chaîne
complète de polypeptides comprenant 100 résidus est synthétisée en 5
secondes environ, dans une bactérie E. coli, à 37°C. La synthèse de
milliers de protéines différentes dans chaque cellule est régulée de
façon étroite de sorte que seul le nombre nécessaire de molécules de
chaque sorte, soit produit pour un ensemble donné de conditions
métaboliques. Pour maintenir une répartition et une concentration
appropriée des protéines dans la cellule, les mécanismes de transport
orienté et de dégradation doivent aller de paire avec la synthèse.

50
I. Code génétique et synthèse protéique
Comment l’information génétique qui est codée sous forme d’un langage à 4 lettres dans les
acides nucléiques, est elle traduite dans un langage à 20 acides aminés, celui des protéines ?

Le codon génétique correspond à l’enchaînement ordonné de trois bases nucléotidiques (ou


triplet) permettant de définir un code d’un acide aminé. Ce codage suivant : séquence
nucléotidique_ séquence protéique est assuré par le système de traduction présent dans le
cytosol cellulaire. Il faut noter qu’il existe environ 20 acides aminés différents dans les protéines
et comme il existe quatre bases nucléotidiques différentes, on en déduit qu’il faut un
enchaînement au minimum de trois bases avec 43 = 64 triplets différents possibles ou codons
pour définir l’ensemble des acides aminés.
L’ARNt adaptateur « traduit » la séquence nucléotidique d’un ARNm en une séquence d’acides
aminés d’un polypeptide.

Figure 44 : Hypothèse de Crick concernant la fonction d’adaptateur de l’ARNt. L’acide


aminé est lié de façon covalente à l’extrémité 3’ de l’ARNt, et un triplet de nucléotides
spécifiques dans la molécule d’ARNt interagit avec un codon triplet spécifique de
l’ARNm.

1.1. Caractéristiques générales

a) Le code génétique est défini par trois lettres

Les 3 codons (UAA, UAG, UGA) parmi les 64 codons du dictionnaire génétique furent
identifiés comme des codons de terminaison, parce qu’ils interrompent le codage des acides
aminés, lorsqu’ils sont inclus dans la séquence d’un ARN. La séquence de base de tous les
triplets codant pour chacun des acides aminés fut établie en 1966. Le dictionnaire complet des
codons des acides aminés est donné dans la figure 45.
Le déchiffrage du code génétique est considéré comme l’une des plu grandes découvertes des
années 1960.

51
b) Notion du cadre de lecture

Un cadre de lecture qui consiste exclusivement en des triplets représentant des acides aminés
est appelé cadre ouvert de lecture ("open reading frame" ou ORF). Une séquence qui est traduite
en protéine a un cadre de lecture qui commence avec un codon d'initiation (AUG). Elle
comprend ensuite une série de triplets jusqu'à l'un des trois codons de terminaison possibles.
Un cadre de lecture qui ne peut pas être lu en protéine parce que les codons de terminaison se
présentent fréquemment est dit bloqué.
Le cadre de lecture doit être disposé correctement au commencement de lecture. Si le cadre de
lecture initial est déplacé d’un ou de deux nucléotides, ou si le ribosome saute accidentellement
un nucléotide, tous les codons suivants seront en dehors du cadre et aboutiront à la formation
d’une protéine dont la séquence des acides aminés est erronée. Plusieurs codons ont une
fonction particulière. Le codon d’initiation AUG signale le commencement d’une chaîne
polypeptidique. AUG est non seulement le codon d’initiation chez les procaryotes comme chez
les eucaryotes, mais code aussi pour les résidus méthionine en position interne des polypeptides.

Figure 45 : Dictionnaire des codons des acides aminés, tels qu’ils figurent dans l’ARNm.
Les codons sont écrits dans la direction 5’  3’. La troisième base de chaque codon joue
un rôle moins important que les deux autres pour désigner un acide aminé.

52
c) Code universel

Le code génétique est le même dans tous les organismes aussi bien chez les
eucaryotes que chez les procaryotes. Cette notion n’est pas aussi vraie que
l’on pensait. En effet, dans l’ADN des mitochondries humaines, quelques
codons sont différents des codons dits universels.

d) Code dégénéré.

La particularité la plus intéressante du code génétique est son caractère dégénéré : un acide
aminé donné peut être désigné par plus d’un codon. Seuls la méthionine et le tryptophane
n’ont qu’un codon. Le code génétique n’est pas ambigu car aucun codon ne désigne plus d’un
acide aminé. La dégénérescence du code n’est pas uniforme.

Lorsqu’il existe des codons multiples pour un acide aminé, la différence entre ces codons réside
souvent dans la troisième base. Les deux premières lettres de chaque codon sont les
déterminants primaires de la spécificité.

e) Le « wobble » permet à certains ARNt de reconnaître plus d’un codon

Les ARNt reconnaissent les codons par appariement de bases entre le codon de l’ARNm et une
séquence de trois bases de l’ARNt qu’on appelle anticodon. Les deux ARNt sont appariés de
façon antiparallèle, la première base du codon (toujours lu de 5’  3’), s’apparie avec la
troisième base de l’anticodon.

Figure 46 : Appariement entre codons et anticodons. L’alignement est antiparallèle.

Le nombre d’ARNt différents pour chaque acide aminé n’est pas le même que le nombre de
codons correspondant à cet acide aminé. Certains ARNt contiennent le nucléotide inosinate qui
renferme une base non usuelle, l’hypoxanthine. Les modèles moléculaires montrent que
l’inosinate peut former des liaisons hydrogènes avec trois nucléotides différents U, C et A, mais
ces appariements sont assez faibles comparés à ceux de Watson et Crick G  C et A= T. Par
exemple, un ARNtarg présente l’anticodon 5’ (ICG) peut reconnaître trois codons différents de
l’arginine, 5’CGA, 5’CGU et 5’CGC. Les deux premières bases de ces codons sont identiques
CG et forment des paires de bases solides avec les bases correspondantes de l’anticodon.

53
Anticodon (3’) G3 C2 I1 G3 C2 I1 G3 C2 I1 (5’)
        
Codon (5’) C1 G2 A1 C1 G2 U3 C1 G2 C3 (3’)

La troisième base des codons arginine (A, U et C) forme des liaisons hydrogènes relativement
faibles avec le résidu I situé au début de l’anticodon. La troisième base de la plupart des codons
s’apparie de façon relativement lâche avec la base correspondante de l’anticodon. La troisième
base de tels codons « tremble ». Crick proposa alors un ensemble de 4 règles connues sous le
nom de wobble hypothesis.

1. Les deux premières bases d’un codon s’apparient fortement avec les bases
correspondantes de l’anticodon, conférant ainsi la majeure partie de la spécificité du
codage ;
2. La première base de certains anticodons détermine le nombre de codons reconnus par
un ARNt donné.
3. Lorsqu’un acide aminé est désigné par plusieurs codons différents ; les codons qui
diffèrent par l’une ou l’autre des deux premières bases nécessitent des ARNt distincts.
4. Un minimum de 32 ARNt est nécessaire pour traduire les 61 codons.

La troisième base « wobble » permet une dissociation rapide de l’ARNt de son codon au cours
de la synthèse protéique et influence ainsi, la vitesse de la synthèse protéique. Les interactions
codon- anticodon permettent à la fois la précision et la vitesse.

Tableau 1 : La base wobble détermine le nombre de codons reconnu par un ARNt.

Base en 5’ de l’anticodon (ARNt) Base en 3’ du codon (ARNm)


A U (Watson et Crick)
C G (Watson et Crick)
G C ou U
U A ou G
I A ou C ou U

f) Code non chevauchant

Le code génétique est dit non chevauchant. La partie exprimée en protéine


d’un ADN est transcrite en mARN puis traduite régulièrement triplet par
triplet. Les triplets nucléotidiques sont donc lus d’un point de départ
(initiation de la synthèse protéique) jusqu’à un point de terminaison et ceci
sans chevauchement. Il faut bien distinguer le caractère non chevauchant du
code génétique et le fait que les gènes eux mêmes peuvent être des gènes
chevauchants.

II. Synthèse protéique


II.1. Localisation de la traduction

La traduction s’effectue dans le cytoplasme au niveau du ribosome. Le


ribosome sera donc l’usine à synthèse protéique de la cellule et recevra les
éléments nécessaires à la synthèse protéique : les tARNs et le mARN. Le
ribosome contient les éléments enzymatiques nécessaires pour la constitution
de la chaîne polypeptidique.

54
II.2. Éléments nécessaires à la traduction
 L’ARN messager.
 Les acides aminés.
 Les ARN de transfert.
 Les aminoacyl-tARN synthétases.
 Les ribosomes.

II.2.1. L’ARNt et son amino- acylation

Les acides nucléiques sont incapables de se lier spécifiquement aux acides aminés. La
traduction se fait par l’intermédiaire des molécules adaptatrices.
Comme la reconnaissance des codons se fait par appariement complémentaire, l’adaptateur doit
obligatoirement contenir de l’ARN. Des recherches ont montré que les molécules adaptatrices
sont les ARNt.
Durant cette étape qui se déroule dans le cytosol, chacun des 20 acides aminés est attaché de
façon covalente à un ARNt spécifique, avec consommation d’ATP. Ces réactions sont
catalysées par un groupe d’enzymes d’activation Mg2+ dépendantes, appelées aminoacyl-ARNt
synthétases. Chacun de ces enzymes est spécifique d’un acide aminé et de l’ARNt
correspondant.

a) Structure primaire et secondaire des ARNt


Tous les organismes contiennent de nombreuses sortes d’ARNt. Leur taille varie de 54 à 100
nucléotides (18- 28 kDa), la plupart ayant environ 76 nucléotides.
La majorité des ARNt connus, peuvent être disposés schématiquement selon la structure
secondaire dite en « feuille de trèfle ».

Figure 47 : Séquence de base d’un ARNt selon la représentation en feuille de trèfle.

Les ARNt présentent en commun :


- Un groupe phosphate 5’ terminal.
- une tige acceptrice ou tige de l’acide aminé : une tige de 7 pb qui comprend le nucléotide
5’ terminal et qui peut présenter des appariements de paires de bases différents de ceux de

55
Watson et Crick. Cette partie de l’ARNt est appelée tige de l’acide aminé car le résidu d’acide
aminé porté par l’ARNt est lié à son groupe 3’-OH terminal.
- le bras D : une tige de 3 ou 4 pb se terminant par une boucle qui contient fréquemment la
base modifiée dihydrouracile.
- Le bras de l’anticodon : une tige de 5 pb se terminant par une boucle qui contient
l’anticodon, le triplet de base complémentaire du codon spécifiant l’ARNt.
-Le bras T C ou bras T : une tige de 5 pb se terminant par une boucle qui présente
généralement la séquence T C (où  est le symbole de la pseudouridine).
- Tous les ARNt se terminent par la séquence CCA avec un groupe 3’-OH libre. Le CCA peut
être spécifié génétiquement ou greffé enzymatiquement à l’ARNt non mature.
Le site de plus grande variabilité parmi les ARNt connus se trouve dans ce qu’on appelle le
bras variable. Il est formé de 3 à 21 nucléotides et peut présenter une tige formée de 7 pb
maximum. La boucle D varie aussi en longueur de 5 à 7 nucléotides.

b) Structure tertiaire des ARNt

La structure tertiaire de l’ARNt a été établie indépendamment en 1974, par Alexander Rich en
collaboration avec Sung Hou Kim et par Aaron Klug. La molécule présente une conformation
en forme de L où l’une des jambes du L est formée par la tige acceptrice et la tige T qui forment
une double hélice continue. L’autre jambe étant pareillement constituée de la tige D et de la tige
de l’anticodon. Les sites anticodon et accepteur d’acide aminé sont aux extrémités opposées de
la molécule. La faible largeur de 20 à 25 amstrong de l’ARNt est essentielle à son rôle
biologique : lors de la synthèse protéique, deux molécules d’ARNt doivent se lier côte à côte
en face de codons adjacents de l’ARNm.

Figure 48 : Structure tertiaire d’un ARNt montrant comment les tiges appariées sont
disposées pour donner une molécule en forme de L.

II.2.2. Aminoacyl- ARNt synthétases

La traduction précise implique deux étapes de reconnaissance d’égale importance :


 Le choix de l’acide aminé correct qui va être lié par covalence à l’ARNt.
 La sélection de l’aminoacyl- ARNt spécifié par l’ARNm.

56
Au cours de la première de ces étapes, catalysée par des enzymes spécifiques des acides aminés
appelées aminoacyl- ARNt synthétase (aaRS), un acide aminé est fixé au résidu ribose 3’
terminal de son ARNt spécifique pour former un aminoacyl- ARNt.

Figure 49 : Formation de l’aminoacyl- adénylate en présence d’ATP

Cet anhydride mixte réagit ensuite avec l’ARNt pour donner l’aminoacyl- ARNt :

Aminoacyl- AMP + ARNt  aminoacyl- ARNt + AMP

Figure 50 : Aminoacyl- ARNt. Dans les aminoacyls- ARNt, le résidu aminoacide


estérifie l’hydroxyle en 2’ ou en 3’ du ribose de l’adénosine en 3’ terminal de l’ARNt.

On connaît deux classes d’aminoacyl- ARNt synthétases :

Les comparaisons détaillées des séquences et de structure des aaRS montrent que ces enzymes
forment deux familles non apparentées, appelées aaRS de Classe I et de Classe II, dont on
trouve les mêmes dix membres chez presque tous les organismes.

57
Figure 51 : Deux classes d’aminoacyl-ARNt synthètase.

Au cours de la seconde étape, le groupement aminoacyl est transféré à l’ARNt :


 Pour les aaRS de la classe I, le groupement aminoacyl est transféré d’abord sur le
groupement 2’- OH du résidu adénylate situé à l’extrémité 3’-OH, puis de là, au
groupement hydroxyle en 3’par une réaction de transestérification.
 Pour les enzymes de la classe II, le groupement aminoacyl est directement transféré sur
le groupement 3’-OH de l’adénylate terminal.

II.2.3. Le ribosome est une machine moléculaire complexe

Les ribosomes sont constitués d’ARN ribosomiques (ARNr) et de protéines et sont structurés
sous forme de deux sous-unités que ce soit chez les procaryotes ou chez les eucaryotes.
Chaque cellule E. coli contient 15 000 ribosomes ou plus, qui représentent presque un quart
de poids sec de la cellule. Les ribosomes bactériens renferment environ 65% d’ARNr et 35%
de protéines. Ils ont un diamètre d’environ 18 nm et un coefficient de sédimentation de 70S.

Les ribosomes du cytoplasme des cellules eucaryotes sont des complexes multienzymatiques
qui associent 82 chaînes d’acides aminés et 4 acides ribonucléiques. Ces molécules sont
associées entre elles pour former deux particules distinctes : la sous-unité 60S (Large = 2800000
daltons) et la sous-unité 40S (Small = 1400000 daltons) qui peuvent se dissocier facilement. Ce
ribosome a un coefficient de sédimentation de 80S.

58
Figure 52 : Composition d’un ribosome bactérien (à gauche) et d’un ribosome eucaryote
(à droite).

Chacune des protéines du ribosome bactérien possède un rôle dans la synthèse des polypeptides,
soit par son activité enzymatique, soit comme composant de structure. Cependant, seule la
fonction précise de quelques unes des protéines du ribosome est actuellement connue.
Les deux sous unités du ribosome ont des formes irrégulières. Les deux sous unités
s’assemblent de telle façon que se forme une fente à travers laquelle passe l’ARNm lors du
déplacement du ribosome au cours du processus de la traduction et dont émerge le polypeptide
nouvellement formé.
Chaque ribosome possède deux sites fonctionnels :
- Un site A ou aminoacyl (= site Acide-aminé) : fixation des acides aminés.
- Un site P ou peptidyl (= site Peptidique) : porteur de la chaîne peptidique en cours
d’élongation.

Figure 53 : Structure cristalline d’un ribosome avec l’ARNm associé à la sous unité 30S

II.3. Différentes étapes de la traduction


La traduction se déroule en trois étapes successives : l’initiation, l’élongation et la terminaison.
Il est important de connaître l’ordre des événements dans la traduction :
- La croissance d’une chaîne polypeptidique commence à l’extrémité N-terminale et
s’allonge par addition séquentielle des acides aminés à l’extrémité C-terminale.
- Les ribosomes lisent le mARN dans le sens 5’→3’.

59
- La traduction se réalise avec des polysomes. Un polysome correspond à un ensemble
comprenant le mARN et plusieurs ribosomes. Chaque mARN peut donc être décodé par
plusieurs ribosomes à la fois.

II.3.1. Initiation

Sur le mARN, il existe près de l’extrémité 5’ phosphate un codon initiateur. Ce codon est
presque toujours AUG, il code pour la méthionine. Ceci signifie que toutes les chaînes
polypeptidiques commencent par de la méthionine. Ce codon initiateur se rencontre aussi bien
chez les procaryotes que chez les eucaryotes. Cependant, chez les procaryotes, cet acide aminé
est modifié car il ne possède pas de fonction –NH2 (ou NH3+) libre. Il nécessite
une formylation sur l’extrémité NH2 (ajout d’un formyl) pour former la f-Met, c’est un
phénomène pré-traductionnel. Cette formylation est réalisée par un cofacteur, la vitamine B9
(ou tétrahydrofolate) qui reconnaît l’ARNt caractéristique et responsable du transport de la f-
Met. La particularité de conformation de cet ARNt lui permet d’être placé directement dans le
site P et non pas dans le site A.
L’initiation de la traduction nécessite la reconnaissance du codon AUG (codon initiateur). Il est
important de souligner que pour insérer des résidus de méthionine à l'intérieur d'une chaine
polypeptidique, l'ARN de transfert est différent, bien que le codon reconnu (AUG) soit le même
que le codon initiateur.

a) L’initiation d’une chaîne protéique chez les procaryotes.

La formation du complexe d’initiation se fait en trois étapes.


Dans la première étape, la sous unité 30S s’associe au facteur d’initiation 3 (IF-3) qui empêche
l’association prématurée des sous unités 30S et 50S. La liaison de l’ARNm à la sous unité 30S
est alors réalisée de façon que le codon d’initiation (AUG) soit fixé à un emplacement précis
de la sous unité 30S.
Le codon d’initiation AUG est guidé dans la position correcte de la sous unité 30S, par un signal
d’initiation appelé séquence de Shine- Dalgarno située sur l’ARNm, 8 à 13 bases avant le côté
5’ du codon d’initiation.

Figure 54 : Séquences d’ARNm qui servent de signal pour l’initiation de la synthèse


protéique chez les procaryotes.

Consistant en 4 à 9 résidus de purines, la séquence de Shine Dalgarno est reconnue et s’apparie


de façon antiparallèle, avec une séquence riche en résidus de pyrimidine, proche de l’extrémité
3’de l’ARNr 16S de la sous unité 30S. Cette interaction ARNm- ARNr fixe l’ARNm de telle
sorte que le codon AUG soit correctement positionné pour l’initiation de la traduction.
Les ribosomes possèdent deux sites qui lient les aminoacyl- tRNA, le site aminoacyl ou site A
et le site peptidyl ou site P.

60
Figure 55 : Image d’un ribosome montrant les deux sites actifs du ribosome.

Au cours de la seconde étape du processus d’initiation, le complexe formé par la sous unité
30S, IF-3 et l’ARNm forme un complexe de plus grande taille encore en s’associant à IF-2 qui
est déjà lié au GTP et à l’ARNt initiateur. Au cours de cette étape, l’anticodon de l’ARNt
s’apparie de façon correcte avec le codon d’initiation.

Dans la troisième étape, dans un processus précédé par le départ de IF-1 et de IF-3, la sous unité
50S s’unit au complexe d’initiation 30S de façon à stimuler l’hydrolyse par IF-2 du GTP qui
lui est fixé, en GDP et Pi. Cette réaction irréversible modifie la conformation de la sous unité
30S et libère IF-2 qui pourra participer à d’autres réactions d’initiation.
L’initiation se traduit par la formation d’un complexe ribosome- ARNm- fMet tRNAfMet dans
lequel, le fMet tRNAfMet occupe le site P du ribosome tandis que son site A est prêt pour accepter
un aminoacyl- ARNt entrant.

61
Figure 56 : Formation du complexe d’initiation en trois étapes, en utilisant l’énergie
fournie par l’hydrolyse du GTP en GDP et Pi.

b) L’initiation d’une chaîne protéique chez les eucaryotes


D’autre part, en 5’ du codon initiateur en règle AUG (codant pour la méthionine), il existe une
séquence retrouvée dans de nombreux mARN de vertébrés appelée séquence consensus de
KOZAK: CCA/GCCAUGG. Cette séquence facilite l’association entre la petite sous-unité du
ribosome et le mARN. Cette séquence consensus comporte le premier AUG, qui est le codon
le codon initiateur le plus fréquent chez les eucaryotes.
Ainsi, au début de l’initiation de la traduction, les deux sous-unités 30 S et 50 S du ribosome
sont dissociées. Puis, la petite sous-unité 30 S forme un complexe avec le mARN au niveau du
codon initiateur et le tARN portant la formylméthionine initiale (tARN initiateur). La grande
sous-unité 50 S va alors s’ajouter à cet ensemble. Le ribosome 70 S est alors complet.
Le complexe d’initiation chez les eucaryotes se fait comme le montre la figure 57 :

62
Figure 57 : Formation du complexe d’initiation avec l’intervention des facteurs
d’initiation chez les eucaryotes

Après l’activation de facteurs d’intiation eIF2 (eucaryotic initiation factor 2) par le facteur
eIF2B suite la fixation du GTP, le facteur eIF2 fixe l’ARNt chargé de méthionine. Ensuite, et
en présence de eIF4C, la petite sous-unité va fixer le facteur eIF3 et le facteur eIF2 activé qui
porte le tRNA chargé de la méthionine initiale. L’énergie de la formation de ce complexe a été
fournie par l’hydrolyse de la liaison riche en énergie du GTP porté par le facteur eIF2.
La séquence 5’ non traduite du RNA messager est reconnue par les cofacteurs eIF4A, eIF4B et
eIF4F qui s’y fixent. Ensuite, l’ARNm est alors transféré sur la petite sous-unité, en regard du
site P, de façon à hybrider les nucléotides du codon d’initiation avec ceux de l’anticodon de le
tRNA de la méthionine initiale. Enfin, et en présence du dernier cofacteur eIF5, le complexe va
se lier à une grande sous-unité pour constituer un ribosome fonctionnel. Les cofacteurs
d’initiation sont libérés et la traduction commence.

II.3.2. Élongation
L’élongation de la synthèse protéique est l’addition par étapes successives des acides aminés à
la chaîne polypeptidique.

a) Élongation chez les procaryotes


L’addition de chaque résidu aminoacide s’effectue en trois étapes et ce cycle est répété autant
de fois qu’il y a de résidus à ajouter

1) Le décodage

Au cours de la première étape du cycle d’élongation, l’aminoacyl- tRNA suivant est d’abord lié
à un complexe entre EF-Tu et une molécule de GTP. Le complexe ternaire aminoacyl- tRNA-
EF-Tu- GTP ainsi formé s’associe ensuite au site A du complexe d’initiation 70S. Au cours
d’une réaction qui s’accompagne de l’hydrolyse du GTP en GDP + Pi, l’aminoacyl se lie grâce
au complexe codon- anticodon, au site A du ribosome avec libération du complexe EF-Tu- GDP
+ Pi. A la fin de cette étape, le GDP fixé sur EF-Tu est remplacé par du GTP. Cette réaction est
effectuée par le facteur d’élongation EF-Ts.

2) La transpeptidation.

Dans l’étape de transpeptidation du cycle d’élongation, la liaison peptidique est formée grâce
au déplacement nucléophile de l’ARNt du site P par le groupe amino de l’aminoacyl lié en 3’ à
l’ARNt du site A.

63
Figure 58 : Formation d’une liaison peptidique par la peptidyl- transférase.

3) La translocation

Lors de l’étape de translocation du cycle d’élongation, l’ARNt du site P, qui se trouve


momentanément déchargé, est transféré au site E, son occupant précédent ayant été expulsé au
préalable. Simultanément, selon un processus appelé translocation, le peptidyl ARNt qui se
trouve au site A, en même temps que son ARNm lié se déplace au site P. Le ribosome se trouve
alors prêt pour un nouveau cycle d’élongation.
Le processus de translocation nécessite la participation d’un facteur d’élongation EF-G qui se
lie au ribosome avec du GTP et qui n’est libéré qu’après hydrolyse du GTP en GDP+ Pi. Le
départ de EF-G est indispensable pour que débute un nouveau cycle d’élongation car EF-G et
EF- Tu ont le même site de liaison sur le ribosome et leur liaison au ribosome est donc
mutuellement exclusive.

a) Élongation chez les eucaryotes


L’addition de chaque résidu aminoacide s’effectue chez les eucaryotes comme chez les
procaryotes se fait en trois étapes et ce cycle est répété autant de fois qu’il y a de résidus à
ajouter. Les facteurs protéiques intervenant dans l’étape d’élongation chez les eucaryotes sont
illustrés dans la figure 60 ci après :

Figure 59 : Étapes d’élongation de la synthèse protéique chez eucaryotes

64
 Les ribosomes initiés ont leur site A vacant. Le facteur d’élongation eEF1B catalyse
l’échange du GDP par un GTP sur le facteur eEF1A. Celui-ci, activé, va recevoir un
tRNA chargé qu’il viendra fixer sur ce site A, en hydrolysant le GTP en GDP. Dès que
le codon du messager au fond du site A a pu se lier complémentairement avec
l’anticodon du tRNA apporté, le facteur eEF1A est libéré avec son GDP.
 Le ribosome catalyse alors le transfert du peptide situé sur le tRNA du site P sur la
fonction amine de l’acide aminé du tRNA du site A. Il utilise pour cela, l’énergie de
l’hydrolyse de la liaison ester riche en énergie entre le peptide et le tRNA du site P.
 Enfin, grâce au facteur eEF2 et à l’hydrolyse d’un autre GTP, le tRNA du site P est
libéré, le messager, le tRNA restant et le peptide en cours de synthèse sont alors déplacés
(translocation) du site A vers le site P, sans qu’il y ait de séparation entre le codon et
l’anticodon.
 Le site A est à nouveau libre pour recevoir le tRNA de l’acide aminé suivant.

II.3.3. Terminaison de la synthèse protéique

La fin de la traduction se produit quand le ribosome se déplaçant sur le mARN se retrouve en


présence d’un codon-stop : UAG, UGA ou UAA. Ces trois codons ne codent pour aucun acide
aminé. Aucun tARN ne viendra se loger dans le site A. Il se produit une coupure entre le dernier
tARN et le dernier acide aminé de la chaîne polypeptidique. La chaîne polypeptidique est
libérée et les deux sous-unités du ribosome se dissocient.
Comme l’initiation et l’élongation, la phase de terminaison de la traduction fait intervenir des
facteurs protéiques dits de terminaison («releasing factors» RFs chez les procaryotes et
«eucaryotic releasing factors» eRFs chez les eucaryotes). Ces facteurs de terminaison
reconnaissent les codons de terminaison chez les eucaryotes et les procaryotes

65
Chapitre V

Notion de séquence signal,


modifications post-traductionnelles
des protéines et régulation de leur
synthèse

66
A) Notion de séquence signal, modifications post-traductionnelles
des protéines
I. Généralités
Les protéines synthétisées dans une cellule peuvent :
 Rester dans le cytosol.
 Intégrer la membrane plasmique ou/et les membranes d’organites intracellulaires.
 Être sécrétées à l’extérieur de la cellule.

Une répartition s’effectue entre ces différentes destinations. Les protéines destinées à rester
dans le cytosol sont synthétisées par des ribosomes non liés à une membrane cellulaire. Les
protéines destinées à être sécrétées ou intégrées des membranes sont synthétisées par des
ribosomes liés : soit à la membrane plasmique chez les procaryotes, soit à la membrane
externe du réticulum endoplasmique chez les eucaryotes.

II. Séquence signale


Les protéines sécrétées ou membranaires possèdent à leur extrémité N-terminale une séquence
courte d’acides aminés (une vingtaine en général) appelée séquence signal. Cette séquence est
particulièrement riche en acides aminés hydrophobes.
Chez les eucaryotes, au début de la synthèse de ce type de protéines, la chaîne polypeptidique
est insérée dès le commencement de sa synthèse dans la citerne du réticulum endoplasmique.
Cette opération complexe fait intervenir une reconnaissance spécifique de la séquence signal
par des récepteurs situés sur la membrane externe du réticulum endoplasmique. Après cette
reconnaissance, la séquence signal est à l’intérieur de la citerne et la phase d’élongation de la
synthèse protéique se poursuit. La séquence signal sera éliminée dans la protéine exportée de
la cellule par un clivage protéolytique produit par une enzyme située à la face interne de la
membrane du réticulum endoplasmique.

III. Exemple classique de protéine avec une séquence signal : l’insuline


L’insuline est une hormone polypeptidique produite par les cellules de Langerhans du pancréas.
Elle est synthétisée sous forme de pré-proinsuline avec une séquence signal à son extrémité
N-terminale. Cette séquence signal est ensuite clivée dans le réticulum endoplasmique pour
donner de la pro-insuline. Un peptide appelé peptide C sera ensuite clivé dans les granules de
sécrétion issus de l’appareil de Golgi et l’insuline active sera finalement produite sous forme
de deux chaînes polypeptidiques (A et B) unies par des ponts disulfure (-S-S-).

67
Figure 60 : Maturation de l’insuline : deux ponts disulfure INTER-chaînes de l'insuline
se forment dès la biosynthèse de la pro-insuline. La chaîne C de la pro-insuline a pour
rôle de positionner correctement les chaînes A et B. Quand la pro-insuline est
correctement repliée, le peptide C est éliminé et un pont disulfure INTRA-chaîne se
forme.

68
IV. Modifications post-traductionnelles des protéines

De nombreuses modifications sont possibles après la synthèse des protéines. Ces modifications
peuvent être réversibles ou permanentes.

IV.1. Modifications réversibles


Nous nous limiterons aux eucaryotes. Des groupements phosphates (phosphorylation) peuvent
être ajoutés sur des résidus sérine, thréonine ou tyrosine. Des groupements acétyles (CH3-CO)
peuvent être ajoutés par exemple sur des résidus lysine.

IV.2. Modifications permanentes

Ces modifications permanentes peuvent concerner :

IV.2.1. La chaîne polypeptidique

La chaîne polypeptidique peut être clivée à son extrémité N-terminale (qui comporte de la
méthionine chez les eucaryotes). Ce résidu est en principe éliminé. Chez les procaryotes,
l’extrémité N-terminale qui correspond à la formyl-méthionine est en principe seulement
déformylée.

Les clivages par des enzymes de protéolyse des précurseurs de nombreuses protéines sécrétées
rentrent également dans ce cadre.

IV.2.2. Formation de ponts disulfure

La formation de ponts disulfure entre deux résidus de cystéines est un événement majeur de la
formation de la structure des protéines.

IV.2.3. Hydroxylation des résidus proline et lysine dans le cadre du collagène (voir cours
correspondant)

 Le collagène est la protéine majeure de la plupart des tissus conjonctifs et la protéine


prépondérante chez les vertébrés (30% des protéines totales des Mammifères : peau, os,
tendons, vaisseaux sanguins).
 L'hydoxylation est la modification post-traductionnelle qui ajoute un ou
des groupement(s) hydroxyle (-OH) à une protéine.
 Les acides aminés hydroxylés sont : la proline (qui devient hydroxyproline),
la lysine (qui devient hydroxylysine), mais aussi l'acide aspartique, la tyrosine.
 L'hydroxyproline et l'hydroxylysine sont les acides aminés majoritaires du collagène.

 L'hydroxylation des lysines et des prolines, de même que la glycosylation des


hydroxylysines sont des modifications co-traductionnelles (pendant la synthèse des
chaînes de collagène) et post-traductionnelles (après que les chaînes de collagène aient
été relarguées des ribosomes).

IV. 2.4. Addition de lipides (voir cours correspondant)

IV. 2.5. Addition de sucres (voir cours correspondant)

La plupart des protéines sécrétées possèdent des structures oligosaccharidiques. Ce sont des
glycoprotéines. L’addition des structures oligosaccharidiques peut se réaliser soit sur des
résidus asparagine par des liaisons N-glycosidiques entre le -CO-NH2 de l’asparagine et un OH

69
de la chaîne oligosaccharidique, c’est une N-glycosylation, soit plus rarement entre l’OH de la
thréonine ou de la sérine et un OH de la chaîne oligosaccharidique c’est une O-glycosylation.

B) Régulation de la synthèse des protéines


I. Généralités
La régulation de la synthèse protéique est une absolue nécessité aussi bien chez les procaryotes
que chez les eucaryotes. Chez les procaryotes, le contrôle de l’expression des gènes permet
d’adapter la cellule d’une part à ses besoins nutritionnels et à son environnement, mais aussi de
lui assurer une croissance et une division cellulaire normales. Chez les eucaryotes, bien que les
cellules sont en général à l’abri des influences nutritionnelles, dans plusieurs organes (le foie
par exemple), la régulation de la synthèse protéique est indispensable. Dès lors, de nombreux
facteurs interviennent en particulier des facteurs hormonaux.

II. Régulation de la synthèse protéique chez les procaryotes


La régulation de la synthèse protéique peut s’effectuer : au niveau de la transcription, au niveau
de la traduction ou des deux.
II.1. Régulation au niveau de la transcription
II.1.1. Exemple de l’opéron lactose
II.1.1.1. Définitions
 L’opéron est une unité de régulation d’un ensemble de gènes qui seront transcrits à
l’aide d’un même promoteur sous forme d’1 seul ARNm traduit cependant en plusieurs
protéines différentes. Cette unité comprend les gènes de structure, 1 ou plusieurs gènes
régulateurs codant des protéines régulatrices et des éléments de contrôle présent dans la
séquence ADN.

 Il nous faut également introduire la notion d’induction, c’est-à-dire le déclenchement


de la synthèse d’une protéine. Le meilleur exemple est présenté par l’opéron lactose
chez les colibacilles (tel que E. coli) (Jacob et Monod, Prix Nobel de Médecine en
1965).

 Régulation positive et régulation négative

II.1.1.2. Expériences préliminaires


Si on introduit du glucose dans un milieu de culture contenant des colibacilles, les bactéries se
développent et se multiplient sans aucun problème.

70
En absence de glucose dans le milieu de culture, il n’y a plus de multiplication des bactéries. Si
on introduit alors du lactose qui est un diholoside (à base de galactose et de glucose), les cellules
ne poussent toujours pas. Mais, après un temps de latence, elles reprennent leur croissance et
se divisent. Il semble logique de considérer que les colibacilles utilisent le lactose. Pour cela,
ces bactéries ont besoin de trois enzymes différentes :

1. Une perméase qui permet le passage du lactose à travers la membrane bactérienne.


Cette perméase est une protéine membranaire codée par un gène appelé lac Y (lac pour
lactose).

2. Une transacétylase, cette enzyme transfère le groupe acétyl (CH3 CO-) de l’acétyl-
CoA aux β-galactosides. Cette acétylase est codée par un gène appelé lac A.

3. Une β-galactosidase. Cette enzyme permet de couper la liaison osidique entre les deux
molécules d’ose constituant le diholoside. Elle est codée par le gène appelé lac Z.

A l’intérieur de la cellule bactérienne, ces enzymes ne sont pas produites en permanence. Elles
sont présentes quand il est nécessaire de produire du glucose à partir du lactose. On dit par
définition que la production de ces enzymes a été induite par le lactose. Ce dernier est appelé
inducteur. Cependant, le lactose lui-même n’est pas le véritable inducteur, il doit être
préalablement transformé en un composé voisin appelé l’allolactose. L’1,6 allolactose est formé
à partir du lactose par Trans-glycosylation.
Par convention, on écrit les gènes correspondants en italique comme ci-dessus.
Les protéines sont dénommées en lettres droites, ainsi Lac Z est le produit protéique du gène
lac Z. Le produit protéique est la β--galactosidase.

II.1.1.3. Structure de l’opéron lactose


Au niveau de l’ADN bactérien, l’opéron lactose est défini par :
1. Les gènes de structure, représentés par les gènes lac Z, Y et A dans l’ordre 5’à 3’.
2. Le promoteur en 5’ des gènes de structure.
3. L’opérateur situé entre le promoteur et le premier gène de structure qui est le gène lac
Z.
4. Enfin en 5’ en amont de l’opéron lactose, on trouve le gène régulateur ou gène I. Ce
gène régulateur code pour une protéine appelée répresseur.

71
Figure 61 : Structure de l’opéron lactose chez Escherichia coli

II.1.1.4. Fonctionnement de l’opéron lactose

II.1.1.4.1. En présence de glucose

La cellule dispose de glucose dans le milieu de culture. Dans ces conditions, les trois enzymes
de l’opéron lactose ne sont pas produites. Les gènes correspondants ne s’expriment donc pas.
On dit par définition que la synthèse de ces trois enzymes est réprimée ou que les gènes
correspondants sont réprimés.
Le gène régulateur possède son propre promoteur qui est distinct de celui des gènes de structure.
Ce gène code pour une protéine : le répresseur. Le répresseur est un tétramère de sous-unités
identiques de 38 000 daltons chacune. Il possède une haute affinité pour l’opérateur. Dans ces
conditions, si le répresseur est fixé sur l’opérateur, l’ARN polymérase ne peut pas transcrire les
gènes de structure car elle ne peut pas progresser vers les gènes de structure à partir de son site
de fixation qui est le promoteur.

Le répresseur interagit spécifiquement avec l’opérateur par l’intermédiaire de structures hélice-


tour-hélice.

II.1.1.4.2. En présence de lactose

Dans ce cas, la bactérie doit impérativement synthétiser les enzymes susceptibles de


transformer le lactose en galactose et en glucose. L’introduction de lactose dans le milieu de
culture permet d’induire la production des trois protéines codées par les gènes lac Z, Y et A. Il
y a dérépression par le lactose. Le répresseur synthétisé par le gène régulateur est reconnu par
l’allolactose et s’associe avec lui. Il y a impossibilité de fixer du répresseur sur l’opérateur. Si
le répresseur est déjà fixé sur l’opérateur, il est décroché par l’inducteur (allolactose).

Dans ces conditions, l’ARN polymérase peut librement transcrire les trois gènes de structure
puisqu’elle peut se fixer sur le promoteur. Il est important de comprendre que les trois gènes de
structure appartiennent à un système polycistronique. Le mARN formé lors de la transcription
code pour les troisprotéines (perméase, transacétylase et β-galactosidase).

72
Figure 62 : présence de lactose dans le milieu : la fixation du lactose sur le répresseur
entraîne la dissociation du complexe répresseur-opérateur permettant à l’ARN
polymérase de transcrire les gènes de structure. Le lactose agit comme inducteur des
enzymes chargés de sa métabolisation.

II.1.1.4.3. En présence d’un mélange de glucose et de lactose

Cultivé en présence de lactose et de glucose comme source de carbone, E. coli métabolise


d’abord le glucose. La bactérie arrête ensuite temporairement sa croissance jusqu’à que les
gènes de l’opéron lactose subissent l’induction qui permettra le métabolisme du lactose. Même
si le lactose est présent depuis le début de la croissance bactérienne, la cellule ne commence
pas l’induction des enzymes nécessaires au catabolisme du lactose avant que tout le glucose
présent ne soit utilisé.
Initialement, ce phénomène a été attribué à la répression de l’opéron lactose par un catabolite
du métabolisme du glucose. On parle de répression par un catabolite d’où le nom donné à la

73
protéine CAP (" catabolite gene activator protein " ou protéine activatrice des gènes soumis à
la répression par un catabolite). L’opéron lactose n’est pas le seul opéron dans E. coli sensible
à la répression par un catabolite (opérons galactose et arabinose).
En fait, pour que l’ARN polymérase puisse se fixer au site promoteur, il faut bien entendu que
le répresseur ne soit pas lié au site opérateur mais aussi que le complexe AMP cyclique-CAP
soit lié au promoteur. La bactérie privée de source de carbone accumule l’AMP cyclique. A
l’opposé en présence de glucose, la bactérie ne possède pas suffisamment d’AMP cyclique pour
lier la CAP. Dans ce dernier cas, le complexe AMP cyclique-CAP est en quantité insuffisante
et l’ARN polymérase ne peut pas commencer la transcription.

Par contre, en présence d’une quantité suffisante du complexe AMP cyclique-CAP sur le site
promoteur, la transcription peut se dérouler.
On sait (voir transcription chez les procaryotes) que l’ARN polymérase se lie au niveau du
promoteur par l’intermédiaire de sa sous-unité sigma. Cette fixation de la sous-unité sigma se
fait de manière spécifique et efficace dans le cas de l’opéron lactose si le complexe AMP
cyclique-protéine-CAP est fixé préalablement fixé en 5’ du promoteur.
En conclusion, le complexer AMP cyclique-CAP agit à la façon d’un régulateur positif car
sa présence est requise pour l’expression génique. Le répresseur codé par le gène régulateur
joue à l’opposé un rôle de régulateur négatif. Sa présence sur le site opérateur empêche la
transcription des gènes de structure correspondants.
Le tableau suivant résume le double contrôle de l’opéron lactose par le glucose et le lactose.
Tableau 2 : Double contrôle de l’opéron lactose par le glucose et le lactose
Glucose Lactose Opéron lactose
Présent Présent Inactif car CAP n’est pas fixée
Inactif car : CAP n’est pas fixée et le
Présent Absent
répresseur lactose est fixé
Absent Absent Inactif parce que le répresseur lactose est fixé
Absent Présent Actif

74
Figure 63 : Contrôle de l’expression de l’opéron lactose en présence de glucose et de
lactose.

75
II.1.2. Exemple de l’opéron tryptophane

II.1.2.1. Bactéries (colibacilles) et le tryptophane : l’opéron tryptophane

Chez l’Homme, cet acide aminé est indispensable, il est apporté par l’alimentation. Chez les
colibacilles, il peut être synthétisé par une succession d’étapes catalysées chacune par une
enzyme. Les gènes de structure de ces différentes enzymes sont dénommées : trp A, trp B, trp
C, trp D et trp E. Ces gènes rentrent dans la constitution de l’opéron tryptophane (Figure 64).

II.1.2.2. Fonctionnement en l’absence de tryptophane

Le gène régulateur synthétise un répresseur. Ce répresseur se présente sous forme d’un


tétramère dont les 4 sous-unités sont identiques. Il possède une particularité essentielle. En effet,
il ne se fixe pas sur l’opérateur. On l’appelle apo-répresseur. Ce n’est qu’en présence d’un
co-répresseur que le répresseur se fixera sur l’opérateur. En absence de répresseur au complet
(aporépresseur et co-répresseur) fixé sur l’opérateur, l’ARN polymérase peut se fixer sur le
promoteur et commencer la transcription. Dans ces conditions, les gènes de structure seront
transcrits et les enzymes de synthèse du tryptophane seront synthétisées. Le tryptophane sera
produit (Figure 64).

II.1.2.3. Fonctionnement en présence de tryptophane


L’addition de tryptophane au milieu de culture entraîne un arrêt de la synthèse de tryptophane.
Cette synthèse est donc réprimée. Le tryptophane agissant comme un co-répresseur se lie
au répresseur inactif. Le complexe ainsi formé peut se fixer sur l’opérateur. Dans ces
conditions, l’ARN polymérase ne peut pas commencer la transcription. Cette dernière est donc
bloquée par le résultat final de l’action des gènes de structure.
En fait, le fonctionnement de l’opéron tryptophane est plus compliqué, il comporte également
des séquences appelées " leader " et " atténuateur " qui sont situées entre l’ensemble promoteur-
opérateur et les gènes de structure (Figure 64).

II.1.3. Induction et répression


En conclusion, l’induction et la répression sont deux mécanismes de régulation de la synthèse
de protéines par les bactéries. On peut finalement décrire un premier mécanisme de répression
permanente et qui peut être levée par la présence d’un inducteur. Le second mécanisme est un
mécanisme de synthèse permanente qui peut être arrêtée par le métabolite final lui-même (cas
de l’opéron tryptophane) (Figure 64).

II.2. Régulation au niveau de la traduction


La régulation de la synthèse protéique chez les procaryotes peut se réaliser au niveau de la
traduction. Un exemple typique est représenté par la régulation des protéines ribosomiales chez
les colibacilles. Les ribosomes résultent d’un assemblage complexe de protéines et d’ARN
ribosomiques. Si les rARN sont disponibles dans la cellule bactérienne, les protéines
ribosomiales (r-protéines) se fixent sur ces rARN et l’assemblage des ribosomes se poursuit.
Quand les r-protéines vont se trouver en excès, elles se fixent sur leurs propres mARNs et la
traduction s’arrête. Il est évident que ce mode de régulation sur la traduction est plus efficace
que le contrôle sur la transcription. Ce dernier contrôle pour être efficace nécessite la
dégradation des mARNs préexistants.

76
Figure 64 : Contrôle de l’expression de l’opéron tryptophane chez E. coli

77
Chapitre VI

Techniques de base de la biologie


moléculaire

78
1. Technique d’Extraction et Purification de l’ADN
1.1. Extraction et purification de l’ADN
L’extraction de l’ADN est une technique permettant d'isoler l’ADN :
 A partir de cellules (bactéries, levures, cellules sanguines…) ou de Tissus (végétal,
animal).
 Ou encore à partir de la matière fraiche (feuilles de plantes…) ou de la matière sèche
(phanères…).
Cette extraction peut concerner soit l'ADN génomique (issu du ou des chromosomes des
cellules analysées), ou l'ADN plasmidique (provenant de plasmides portés le plus souvent par
des cellules bactériennes comme Escherichia coli).

L’ADN doit impérativement être purifié à partir de matériels biologiques dans


des conditions optimales de qualité et de quantité. Il existe plusieurs
protocoles d’extraction d’ADN avec le même schéma de principe dont les
étapes sont suivantes :

1. Lyse des cellules

Cette étape importante met en jeu un détergent (ex. SDS) qui désorganise la double couche de
phospholipides des membranes. Il faut noter toutefois que dans le cas des cellules végétales, la
lyse nécessite un broyage dans un mortier des tissus congelés dans l’azote liquide. Dans le cas
des bactéries, la lyse est facilitée par l’action du lysozyme qui hydrolyse le peptidoglycane.

2. Dissociation des protéines

Cette étape est réalisée en utilisant un détergent comme SDS ou/et en faisant agir une protéine
comme la protéinase K.

3. Élimination des protéines et des lipides


Cette élimination est réalisée par traitement au phénol-chloroforme, solvants organiques qui
dénaturent les protéines. Ils sont non miscibles dans l’eau et de densité supérieure à celui-ci. De
plus, les acides nucléiques ne sont pas solubles dans une solution phénol et/ou chloroforme.
Ainsi, après mélange du lysat des cellules avec ces solvants et centrifugation, le profile suivant
est obtenu.

Phase aqueuse ADN (et ARN)

Protéines
Phase organique
Protéines et lipides

Figure 65 : Profile de l’extraction phénol chloroforme.

79
Le phénol est un déprotéinisant très puissant, c’est pourquoi toute trace de phénol doit été
éliminée pour permettre l’action ultérieure d’enzymes (enzymes de restriction, ligase...). Une
extraction au phénol doit être toujours suivie d’une extraction au chloroforme.

4. Précipitation de l’ADN

La précipitation de l’ADN se fait en général dans une solution finale d’éthanol à 67%. Cette
précipitation est accélérée par le froid (-20 à -70). Après centrifugation, l’ADN est récupéré
sous forme de culot au fond du tube. Le culot est ensuite lavé dans une solution d’éthanol à
70% pour éliminer les sels et ensuite séché pour éliminer toute trace d’éthanol. Les acides
nucléiques sont ensuite récupéré dans un tampon stérile à pH 7-8 additionné d’EDTA (tampon
TE) et conservé au froid (14°C à -20°C).

5. Élimination de l’ARN
L’ARN est éliminé par un traitement à la RNase.

1.2. Estimation des quantités d’ADN


Cette estimation est indispensable après extraction d’ADN à partir d’un matériel biologique.
Elle s’effectue par spectrophotométrie dans l’ultra-violet à 260 nm. Il est indispensable de
mesurer également l’absorption à 280 nm. Cette dernière longueur d’onde permet d’estimer la
contamination éventuelle de l’extrait par des protéines. L’absorption se définit par l’unité de
densité optique mesurée à 260 nm. Une unité de densité optique correspond à l’absorption d’une
solution d’ADN double brin à la concentration de 50 µg/ml ou à l’absorption d’une solution
d’ADN simple brin (ou d’ARN) à la concentration de 25 µg/ml.

1.3. Contrôle de la pureté d’ADN


Le contrôle de pureté de l’ADN extrait peut être réalisé en utilisant la spectrophotométrie. En
effet, le maximum d'absorption des acides nucléiques se situe à 260 nm. Les protéines absorbent
aussi à 260 nm alors que leur maximum se situe à 280 nm. Afin d’évaluer la pureté d’ADN on
détermine le rapport R = A260nm/ A280nm.
 Si 1,8 < R <2, l’ADN peut être qualifié de pur
 Si R < 1,7, contamination significative par les protéines
 Si R > 2, contamination par ARN.
 Remarque : le contrôle de pureté d’ADN peut également être réalisé par l’électrophorèse sur
gel d’agarose.
2. Technique de séparation des molécules d’ADN : électrophorèse
2.1. Définition

L’électrophorèse sur gel d’agarose est une technique de base utilisée en biochimie et
en biologie moléculaire pour séparer l'ADN, l'ARN ou des protéines en fonction de leur masse
moléculaire.. Cette technique très sensible est rapide et simple à réaliser

2.2. Principe

La technique de l'électrophorèse sur gel d'agarose est basée sur la séparation des acides
nucléiques chargés négativement sous l'effet d'un champ électrique. Cette séparation s'effectue
à travers la matrice du gel d'agarose : les molécules de plus petites tailles se déplacent plus
rapidement et migreront plus loin que les molécules de tailles supérieures.

80
La détermination précise des tailles des fragments séparés par électrophorèse est effectuée en
faisant migrer des marqueurs de poids moléculaire en parallèle avec les échantillons à analyser.
La détection de l’ADN sur ce type de gel est réalisée par exposition aux rayons UV après
réaction avec un réactif spécifique (bromure d’éthidium par exemple, agent s’intercalant entre
les brins d’ADN).
L’électrophorèse des fragments d’ADN en gel d’agarose permet des séparations jusqu’à 20-25
kb (20000-25000 pb). Deux tampons de migration peuvent être utilisés : TAE (Tris Acétate
EDTA) et TBE (Tris Borate EDTA).
Des fragments d’ADN de taille restreinte (inférieure à 1000 paires de bases) peuvent être
séparés par électrophorèse sur gel de polyacrylamide.

2.3.Électrophorèse sur gel d’agarose


L’agarose est un polymère facilement purifié extrait d’agar-agar. C’est une poudre blanche qui
se dissout dans l’eau après ébullition. Elle reste à l’état liquide tant la température est supérieure
à 40-45°C. Quand la température devient inferieure à 40°C, la solution se solidifié en un gel
stable.
La réticulation du gel dépend de sa concentration d’agarose : la taille des pores est d’autant plus
petite que la concentration de ‘agarose dans le gel est plus élevée. On utilise le plus souvent des
concentrations allant de 0,4 à 2%
Le gel est déposé dans une cuve d’électrophorèse est branché à un générateur du courant
électrique. La migration de l’ADN se fait du pole négatif au pole positif et la séparation des
fragments d’ADN se fait en fonction de leur taille : les fragments de petites tailles migrent
d’abord ensuite ceux de plus grandes tailles. Deux tampons de migration peuvent être utilisés :
TAE et TBE.

Tableau 1 : Pouvoir de séparation d'ADN linéaire, double brin, selon la concentration d'agarose
du gel

Concentration d'agarose (% en m/V) Gamme de tailles idéales (en kb)

0.3 5 – 60

0.6 1 – 20

0.7 0.8 – 10

0.9 0.5 – 7

1.2 0.4 – 6

1.5 0.2 – 3

2.0 0.1 – 2

2.4. Applications de l’électrophorèse sur gel d’agarose


Les applications de l’électrophorèse sont :
 Estimation de la masse moléculaire de fragment d'ADN après une digestion par
des enzymes de restriction.
 Analyse d'ADN après une amplification par PCR.

81
 Séparation de fragments ADN digérés avant Southern blot ou d'ARN dans le cas
de Northern Blot.
2.5. Avantages de l'électrophorèse en gel d'agarose sont
Préparation aisée, rapide, et peu coûteuse des gels d'agarose
Pas de dénaturation des échantillons
L'agarose plus ferme et moins toxique que le gel de polyacrylamide
Les échantillons peuvent être récupérés en vue d'analyses supplémentaires

2.6. Électrophorèse sur gel de polyacrylamide


L'acrylamide est le nom usuel du 2-propénamide (amide acrylique) de formule brute
C3H5NO. En biologie moléculaire, on utilise l'acrylamide polymérisé (polyacrylamide)
pour réaliser des électrophorèses.
Le polyacrylamide est utilisé à des concentrations de 4% à 20% (poids/volume) et
permet de séparer des molécules plus petites d'acides nucléiques.

2.7. Facteurs affectant la migration


La longueur de la molécule d'ADN : la séparation se fait en fonction du poids
moléculaire et donc de la taille de l'ADN.
La conformation de l'ADN : l'ADN plasmidique, non digéré par une enzyme de
restriction, migre à différentes vitesses (du plus lent au plus rapide) : ADN circulaire,
ADN linéaire et ADN superenroulé.
La concentration du gel : l'augmentation de la concentration réduit la vitesse de
migration et permet la séparation de fragment d'ADN de plus petite taille.
Le voltage : plus le voltage est important, plus la vitesse de migration augmente.
Toutefois le voltage est limité en intensité (5V/cm) : un fort voltage  augmentation de
température (fondre le gel).

Bande à moindre mobilité


 Forme relâchée

Bande à + forte mobilité


 Forme superenroulée.

Figure 66 : Électrophorèse de l’ADN plasmidique.

82
Figure 67 : Électrophorèse en fonction de la forme : formes linéaire, relâchée, super-
enroulée.

3. Digestion enzymatique
3.1.Généralités
Les enzymes de restriction sont des outils utilisés au laboratoire pour cliver l’ADN. Ils
sont capables de reconnaître spécifiquement une courte séquence, de 4 à 10pb, et de
cliver l'ADN au site reconnu.
Ils permettent de fragmenter l'ADN en segments de taille réduite, ou de le couper à tel
ou tel site désiré.
Les enzymes de restriction appartiennent à la classe des endonucléases, c’est-à-dire des
enzymes capables de cliver les liaisons phosphodiester entre deux nucléotides à
l’intérieur d’un acide nucléique
Les endonucléases se différencient des exonucléases qui dégradent la molécule d’ADN
à partir de l’une de ses extrémités (3’ ou 5’).
Certains enzymes coupent le site en son milieu et produisent deux fragments dont les
extrémités sont franches. Cependant, la plupart réalisent une coupure dissymétrique : on
parle dans ce cas d'extrémités cohésives (chaque fragment possède une chaîne qui
dépasse l'autre de quelques bases).

3.2.Séquences d’ADN reconnues par les enzymes de restriction


Les séquences de nucléotides reconnues par les enzymes de restriction sont habituellement des
séquences dites palindromiques. Les séquences palindromiques sont des séquences où la
succession des nucléotides lue dans le sens 5’→3’ (gauche-droite) pour le premier brin est
identique à la séquence lue dans le sens droite-gauche pour le second brin (sens 5’→3’).Ces
séquences palindromiques sont le plus souvent constituées de 4 ou 6 paires de bases. Il faut
remarquer que dans les ADN, on rencontre statistiquement des séquences reconnues par des
enzymes de restriction. Ainsi, la séquence GATC reconnue par l’enzyme Mbo I est présente
avec une fréquence statistique de 1/256 paires de bases (1/44). En effet, la fréquence de coupure
d’un ADN par une enzyme de restriction donnée peut être approchée statistiquement en
considérant le nombre de nucléotides de la séquence spécifique reconnue par l’enzyme. Ainsi,
par exemple, dans la séquence de six nucléotides : GGATCC reconnue par l’enzyme Bam HI,
on aura donc une fréquence de coupure statistique de 1 / 46, soit une coupure tous les 4096
nucléotides.

83
3.3.Origine des enzymes de restriction

Les enzymes de restriction sont extraites de micro-organismes, le plus souvent des bactéries.
Les bactéries peuvent être parasitées par des virus à ADN. Les bactéries fabriquent des enzymes
de restriction qui sont capables de cliver les ADN étrangers. Pour éviter une auto-destruction
de leur propre ADN, elles se protègent contre leurs propres enzymes de restriction par une
modification des sites de restriction correspondants.

3.4.Nomenclature des enzymes de restriction


Les enzymes de restriction présentent une nomenclature bien précise. Leur nom
comporte plusieurs lettres (3 ou 4).
La première lettre de dénomination de l’enzyme est écrite en majuscule, elle correspond
au genre de la bactérie d’où a été extraite l’enzyme. La seconde lettre et la troisième
lettre (en minuscules) correspondent à l’espèce de la bactérie d’où l’enzyme est extraite.
On peut avoir une quatrième lettre écrite en majuscule correspondant à la souche
bactérienne. Enfin pour terminer, un chiffre romain indique l’ordre de caractérisation
de ces enzymes.
• Exemples :
Eco RI Extraite de Escherichia coli RYB site reconnu : G / AATTC
Sma I Extraite de Serratia marcescens site reconnu : CCC / GGG
Pst I Extraite de Providencia stuartii site reconnu : CTGCA / G
Des enzymes de restriction différentes peuvent reconnaître des mêmes sites spécifiques, on les
appelle isoschizomères. Les isoschizomères fournissent souvent après clivage enzymatique des
fragments dont les extrémités sont différentes.

3.5.Types de coupures réalisées par les enzymes de restriction


Les enzymes de restriction peuvent donner deux types de coupures : la coupure à bouts francs
et la coupure à bouts collants. La coupure à bouts francs aboutit à une coupure au milieu de la
séquence palindromique. La coupure à bouts collants (ou à extrémités adhésives) correspond à
une coupure qui se fait de part et d’autre du centre de symétrie.
Les sites de restriction sont repérés dans l’ADN par l’enzyme de restriction qui coupe l’ADN
en principe autant que fois qu’il y a de sites de restriction. Ceci est valable pour une enzyme de
restriction donnée, pour une autre enzyme, la coupure se fera en une position différente sur
l’ADN. On voit tout de suite les possibilités considérables de ce type d’outils enzymatiques.
L’ADN est découpé en fragments variables et ceci aussi bien l’ADN circulaire des bactéries ou
des plasmides que l’ADN linéaire.

84
Figure 68 : Types de coupure des enzymes de restriction.

3.6.Méthylation des sites de restriction et inactivation des enzymes de restriction


L’ADN bactérien présente des sites de restriction susceptibles d’être repérés par les enzymes
de restriction que possède la bactérie. Pour éviter une autodestruction, les enzymes de
modification de l’ADN bactérien interviennent. Ces enzymes de modification sont des
méthylases bactériennes (ou enzymes de méthylation). La méthylation de la cytosine (sur le
carbone 5) ou de l’adénine (sur l’azote 6) appartenant à des sites de restriction aboutit à une
inactivation de l’enzyme de restriction correspondante. Cette méthylation peut se réaliser sur
une base ou sur plusieurs bases appartenant au site de restriction. Les méthylases bactériennes
sont très spécifiques. Prenons l’exemple de l’enzyme de restriction Hind III qui reconnaît la
séquence spécifique (et palindromique) suivante :

La méthylation de l’adénine (représentée sur le schéma associée avec un cercle) aboutit à une
absence de reconnaissance de ce site spécifique par l’enzyme Hind III et donc à une absence de
coupure enzymatique :

85
3.7.Utilisations des enzymes de restriction
 Les utilisations des enzymes de restriction sont très nombreuses en biologie
moléculaire. Par exemple, elles permettent de fractionner l’ADN en multiples fragments
susceptibles d’être séparés par les techniques d’électrophorèse. Les enzymes de
restriction peuvent être utilisées pour préparer un fragment d’ADN d’un gène donné
(insert) à être inséré dans un vecteur comme un plasmide. Les enzymes de restriction
sont utilisées couramment pour rechercher des mutations dans le génome
 Les enzymes de restriction sont utilisées pour rechercher dans l’ADN des cellules
eucaryotes les méthylations de bases. Ces méthylations ont une signification
complètement différente des méthylations de bases observées chez les procaryotes.
Elles sont en relation directe avec des modifications de l’expression des gènes des
eucaryotes. La méthylation provoque le verrouillage de l’expression de tel ou tel gène
dans un tissu. Les méthylations dans le génome des eucaryotes concernent les cytosines
impliquées dans les doublets dinucléotidiques CG. La recherche de ces doublets et de
la présence ou non d’une méthylation sur les cytosines est réalisée à l’aide de deux
enzymes de restriction, une enzyme insensible à la méthylation des cytosines et une
autre enzyme sensible à la méthylation des cytosines
Une notion importante pour l’utilisation des enzymes de restriction est la notion d’enzymes
compatibles. Deux enzymes de restriction sont dites compatibles quand elles génèrent après
digestion des fractions aux extrémités cohésives complémentaires. Ces fragments peuvent être
facilement ligaturés.

Exemple des enzymes compatibles : Les enzymes Bam HI (Bacillus amyloliquefaciens,(G /


GATCC) et Mbo I ( Moraxella bovis ) ( / GATC)

Après action de Bam HI:

Après action de Mbo I:

Ligatures possibles : 1+4 et 2+3.

86
4. Technique d’amplification génique ou technique PCR («Polymerase
Chain Reaction»).
4.1.Principe

Cette technique décrite en 1985 (K. MULLIS et collaborateurs) permet d’amplifier des
séquences d’ADN de manière spécifique et d’augmenter de manière considérable la quantité
d’ADN dont on dispose initialement. Elle nécessite de connaître la séquence des régions qui
délimitent l’ADN à amplifier. Ces séquences serviront à synthétiser des amorces
oligonucléotidiques complémentaires (de longueur de 20 à 30 nucléotides en général). Ces
oligonucléotides serviront à délimiter la portion d’ADN à amplifier. L’ADN polymérase les
utilisera comme amorces

4.2.Éléments nécessaire à la PCR


4.2.1. L’ADN
Avant la réaction de PCR, l’ADN est extrait à partir de l’échantillon que l’on veut analyser
(salive, cheveux, cellules, fossile…). Par la suite, cet extrait est purifié en ADN, contenant le
fragment d’ADN que l’on souhaite amplifier.

4.2.2. Deux amorces

Ce sont des fragments courts d'ADN, capables de s'hybrider de façon spécifique, grâce à la
complémentarité des bases, sur l’un des deux brins d'ADN.
Les amorces sont choisies de façon à encadrer la séquence d'ADN à amplifier. La taille de ces
amorces est généralement d’une vingtaine de désoxyribonucléotides. De plus, les amorces sont
en très forte concentration par rapport à celle de l’ADN à amplifier.

Figure 69 : Hybridation des deux amorces avec l’ADN à amplifier.

4.2.3. dNTPS

Les dNTPs (Désoxyribonucléotides-Tri-Phosphates) sont des molécules de


base, qui constituent l’ADN, utilisés par la Taq polymérase pour la synthèse
du nouveau brin d’ADN complémentaire.

4.2.4. Enzyme, Taq polymérase


L’enzyme utilisée est une polymérase, c'est-à-dire qu’elle peut synthétiser un nouveau brin
d’ADN à partir du brin d’ADN matrice après s’être fixée à une amorce.

87
La Taq polymérase extraite de Thermus aquaticus présente une activité exonucléasique 5→3’,
mais elle est dénuée d’activité exonucléasique 3’→5’, c’est-à-dire de la fonction d’édition. Elle
peut insérer des bases qui ne suivent pas la règle classique d’appariement et ceci au hasard. On
estime qu’elle réalise une mauvaise incorporation toutes les 104 à 105 bases.

4.2.5. Milieu réactionnel

Le milieu réactionnel de la PCR comporte l’ADN à amplifier, les dNTPs, les deux amorces, la
Taq polymérase, un tampon et des ions magnésium (MgCl2). Ces deux derniers composants
définissent un milieu avec un pH optimal et une concentration saline optimale pour le bon
fonctionnement de l’enzyme.

4.3.Réalisation pratique
La PCR est une technique automatisée. En effet, la réaction de PCR se fait dans un
thermocycleur. C’est un appareil qui contient un bloc chauffant où l’on insère les tubes
contenant notre mélange pour la réaction de PCR et où la température peut varier très
rapidement et très précisément de 0°C à 100°C.
Le thermocycleur est alors programmé pour effectuer les différents cycles de la PCR. Ainsi,
chaque cycle est composé d’une succession de paliers de température prédéterminée, et d’une
durée bien définie. Ces deux paramètres, température et temps, dépendent de la taille de la
séquence à amplifier de la taille et de la composition en désoxyribonucléotides des amorces.

Figure 70 : Appareil de la PCR : Thermocycleur.

La technique de PCR comporte des cycles successifs. Chaque cycle comprend une succession
de trois phases :
1. Une phase de dénaturation par la chaleur pour séparer les deux brins d’ADN (92-95°C)
(30 secondes-1 minute). A cette étape : l’ADN se dénature. En effet, l’ADN perd sa
structure caractéristique en double hélice, les liaisons hydrogène reliant les bases de
chaque brin d’ADN étant instables à cette température. L’ADN double-brin (2 brins)
est dénaturé en ADN simple brin (1 brin).

88
Figure 71 : Étape de dénaturation.

2. Une phase d’hybridation avec les deux amorces spécifiques entre 55-60°C. La première
amorce se fixe sur un brin d’ADN, l’autre sur le brin complémentaire (30 secondes-1
minute).

Figure 72 : Étape d’hybridation.

3. Une phase d’extension par l’ADN polymérase à partir des amorces à 70-72°C (1-2
minutes). Cette étape permet à la Taq polymérase de synthétiser le brin complémentaire
à l’ADN matrice, grâce aux dNTPs libres présents dans le milieu réactionnel. Au cycle
suivant, les nouveaux fragments synthétisés servent à leur tour de matrice pour la
synthèse de nouveaux fragments d’ADN. En théorie, à la fin de chaque cycle la quantité
d’ADN cible est doublée. Le premier cycle est fini et voilà qu’un nouveau cycle
recommence. Cela se reproduira 30 fois (en fonction du protocole de PCR).

Figure 73 : Étape d’élongation.

89
La technique de PCR a pris un essor considérable avec l’introduction d’une ADN polymérase
résistante à la chaleur. Cette ADN polymérase ou Taq polymérase est extraite d’une bactérie
thermophile (Thermus aquaticus). Elle permet une automatisation des différents cycles dans
le thermocycleur.
Le nombre de cycles est généralement compris entre 30 et 40. Cette méthode permet d’amplifier
l’ADN compris entre les deux amorces d’un facteur de 105 à 106. Les résultats doivent être
optimisés en fonction d’un certain nombre de paramètres : concentration en MgCl2,
concentration en amorces, spécificité des amorces etc... Le choix des amorces est
particulièrement crucial pour obtenir des résultats satisfaisants (spécificité, taille, paramètres
physico-chimiques...). L’introduction de logiciels spécialisés et des bases de données
nucléotidiques a permis de réaliser des choix plus rationnels.

Figure 74 : Réaction de PCR ; 1 : dénaturation, 2 : Hybridation, 3 : élongation.

4.4. Applications de la PCR


La PCR est très couramment utilisée dans de nombreux domaines :
• En médecine : pour diagnostiquer des maladies génétiques (myopathie, mucoviscidose,
etc), des infections virales (SIDA, Hépatite C), bactériennes (tuberculose) ou
parasitaires (toxoplasmose), mais aussi des cancers.
• En médecine légale : pour identifier une personne par son empreinte génétique dans le
cadre d’une enquête judicaire, pour un test de paternité.
• En agroalimentaire : pour identifier des variétés ou des espèces végétales et animales,
pour sélectionner de nouvelles variétés de fruits et légumes, comme la tomate pour le
contrôle de la qualité des produits agroalimentaires, détecter la présence d’OGM dans
un aliment par exemple.

5. RT-PCR
La RT-PCR se déroule en deux phases. Une première phase correspond à la copie d’ARN
messager en ADN complémentaire (cADN) et une seconde phase correspond à une réaction
PCR classique sur le cADN synthétisé.

90
Dans la première phase, l’ARN messager à étudier est repéré en utilisant une sonde
oligonucléotidique spécifique (amorce 1 qui s’hybride à l’extrémité 3’ du seul mARN auquel
on s’intéresse), puis la transcriptase inverse (ou rétrotranscriptase) permet la synthèse du brin
complémentaire (sous une forme de cADN simple brin), une seconde amorce
oligonucléotidique spécifique (amorce 2) permettra la synthèse du second brin par extension.

L’ADN complémentaire synthétisé servira ensuite de matrice pour une réaction PCR classique.
La technique RT-PCR a permis de montrer que la transcription de tous les gènes s’effectuait
dans tous les tissus et ceci même pour les gènes qui présentent une très grande spécificité
tissulaire. On parle dans ces conditions de transcription illégitime. Il est évident qu’avant les
techniques d’amplification génique, la sensibilité des méthodes classiques n’avait pas permis
de mettre en évidence un tel phénomène.

6. Séquençage de l’ADN
5.1.1 Généralités
 Le séquençage de l'ADN constitue une méthode dont le but est de déterminer l'ordre
d'enchaînement des nucléotides d’un fragment d’ADN donné.
 La lecture de cette séquence permet d’étudier l’information génétique contenue en celle-
ci.
 Le séquençage d’ADN est devenu un outil essentiel en biologie moléculaire tant en
médecine que dans de nombreuses autres disciplines des sciences de la vie.
 Le séquençage a été décrit il y a environ 40 ans et n’a cessé d’évoluer depuis cette
période.
 Les connaissances acquises grâce à cette méthode et la possibilité de séquencer des
génomes de grandes tailles, tel que le génome humain, ont amené les chercheurs à
développer des techniques de séquençage de plus en plus sophistiquées.

5.1.2 Applications de séquençage d’ADN


Les applications de séquençage d’ADN sont très variées, nous citerons
quelques exemples (cette liste n’est pas exhaustive) :
Diagnostique et traitements de nombreuses maladies humaines (exemples : cancer,
maladies infectieuses, maladies héréditaires…)
Permet d’avoir les informations sur le génome (structure, fonction, évolution, et étude
des variations du génome (polymorphisme d'alléliques, insertions, délétions,
réarrangements de gènes, variation de nombres de copies de gènes …)
Étudier les variantes génétiques associés à une pathologie (exemple le diabète)
Analyse microbiologiques (identification d’espèces, taxonomie, études
épidémiologiques, génotypage à but pronostique ou/et thérapeutique)
Test de paternité en médecine légale
Police scientifique
Pharmacogénétique
Études anthropologiques

5.1.3 Méthodes de séquençage d’ADN


Dans les années 1970, les deux premières méthodes de séquençage de l‘ADN ont été
développées indépendamment ;
 L‘approche de Sanger (Royaume-Uni) est une synthèse enzymatique.
 L’approche de Maxam et Gilbert (USA) est une dégradation chimique.

91
5.1.3.1 Méthode chimique ou méthode de Maxam et Gilbert
Cette méthode est pratiquement abandonnée de nos jours. Elle n’a plus guère qu’un intérêt
historique. Elle se fait selon les étapes suivantes :
1. Marquage de l'ADN en 5'. Il faut ici que l'ADN ne soit marqué qu'à une seule extrémité.
2. Coupure de l'ADN par des réactions spécifiques à certaines bases, par exemple après
toutes les guanosines. La coupure est partielle si bien qu'on obtient toute une série de
molécules dont l'extrémité 3' est un G, parmi celles-ci certaines d'entre elles sont
marquées en 5' par du 32P.
3. Dénaturation de l'ADN par la chaleur
4. Dépôt sur un gel électrophorèse en condition dénaturante (température haute et présence
d'urée dans le gel). Les fragments d'ADN migrent en fonction de leurs tailles et sous
forme simple brin.
5. Radioautographie, seuls les fragments marqués, c’est à dire seul ceux qui portent
l’extrémité 5’- et donc commencent au même endroit-, sont visualisables. Certaines
molécules s'arrêtent au premier G, d'autre au second etc...
Si au départ on a fait des coupures séparément et différentes avec plusieurs agents, on obtient
pour chaque tube, des molécules de taille correspondant à la séquence. On ne dispose pas de
schéma réactionnel permettant de couper après chacune des bases. Mais on dispose de moyens
pour couper après G, après A+G, après C+T et après A. Si on charge ces quatre séquences sur
le gel, on peut lire la séquence (Figure 75).

Figure 75 : Lecture de gel par Technique de Maxan et Gilbert.

5.1.3.2 Méthode de Sanger


5.1.3.2.1. Principe
Cette technique enzymatique est basée sur la copie d'un fragment d'ADN monocaténaire que
l'on désire séquencer par une ADN polymérase. On utilise des didésoxynucléosides
triphosphates (ddNTP). Ces dérivés ne possèdent pas d'OH en position 3' du désoxyribose.
L'incorporation de ce didésoxyribonucléotide par l'ADN polymérase bloque l'allongement de
la molécule d'ADN en cours de copie. En effet, l'allongement d'une chaîne polynucléotidique
par une ADN polymérase nécessite un groupement OH en 3'disponible.

92
Soit l'ADN bicaténaire suivant dont la séquence doit être déterminée :
5’ G G T C A T C C A T G G A T T C G A 3’
3’ C C A G T A G G T A C C T A A G C T 5’
Les deux brins d'ADN sont préalablement séparés par fusion. Considérons le brin orienté 3'→5'
:
3’ C C A G T A G G T A C C T A A G C T 5’
On réalise une hybridation avec une amorce de séquençage1 : GGTCATCC, orientée 5'→3' :
5’ G G T C A T C C
3’ C C A G T A G G T A C C T A A G C T 5’
L'amorce 1 de séquençage pour simplifier l'exposé a été volontairement réduite
en nombre de nucléotides, ceci n'est pas le cas en pratique. L'exemple présenté
ci-dessus est bien entendu essentiellement à but didactique.
Puis, on réalise une réaction de séquençage avec des dNTPs (dATP, dTTP, dCTP et dGTP) et
de la Taq polymérase. On prépare quatre tubes identifiés : A, T, C et G.

Tube A T C G
Taq polymérase + + + +
dNTPs + + + +
ddNTPS ddATP ddTTP ddCTP ddGTP

Dans le tube A : on introduit du ddATP. La synthèse d'ADN s'arrêtera au niveau de


chaque A avec les fragments suivants :
5'-GGTCATCCA-3' (9 nucléotides)
5'-GCTCATCCATGGA-3' (13 nucléotides)
5'-GCTCATCCATGGATTCGA-3' (18 nucléotides)
Dans le tube T : on introduit du ddTTP. La synthèse s'arrêtera au niveau de chaque T
avec les fragments suivants :
5'-GGTCATCCAT-3' (10 nucléotides)
5'-GGTCATCCATGGAT -3' (14 nucleotides)
5'-GGTCATCCATGGATT -3' (15 nucléotides)
Dans le tube C : on introduit du ddCTP. La copie d'ADN s'arrêtera au niveau de chaque
C avec le fragment unique suivant :
5'-GGTCATCCATGGATTC -3' (16 nucléotides)
Dans le tube G : on introduit du ddGTP. La synthèse s'arrêtera au niveau de chaque G
avec les fragments suivants :
5'-GGTCATCCATG-3' (11 nucléotides)
5'-GGTCATCCATGG-3' (12 nucléotides)
5'-GGTCATCCATGGATTC-3' (17 nucléotides).
• On voit facilement qu'avec cette technique, si l'amorce ajoutée est marquée en 5' par un
phosphate radioactif (32P), dans chaque tube, on aura différentes espèces qui
présenteront toutes un marquage en 5' au phosphate radioactif.

93
Le même raisonnement s’applique aux tubes dénommés T, C et G. Après les réactions de
séquençage, on sépare sur les pistes électrophorètiques séparés les produits obtenus dans les
tubes A, T, C et G. Les produits migrents dans un gel de polyacrylamide vertical dans des
conditions dénaturantes (en présence d’urée). Leurs distances de migration par rapport à leurs
positions initiales varient à l’inverse de leurs tailles respectives. Après l’autoradiographie le gel
se présentera de la manière suivante

nt = nucléotide (nombre de nucléotides)


La lecture de ce gel se fait de bas en haut (des fragments de petite taille aux fragments de grande
taille). On aura donc le résultat de séquençage suivant :

5.1.4 Appareils de séquençage automatique


La technique de Sanger s'est considérablement automatisée avec l'apparition des appareils de
séquençage automatique. On utilise des amorces ou des didésoxynucléosides triphosphates
marqués à des fluorochromes. La réaction de séquençage s'effectue comme décrite
précédemment dans la technique manuelle de Sanger. La lecture du gel se fait par un balayage

94
automatique qui permet de discriminer grâce à des fluorochromes différents les quatre bases A,
T, C ou G. L'utilisation de logiciels informatiques permet de fournir un tracé électrophorétique
avec des couleurs différentes pour chaque base élémentaire.

Figure 76 : Appareil de séquençage automatique LI-CORE 4200

7. Hybridation moléculaire
7.1. Définitions
 Hybrider : permettre la formation de liaisons hydrogène entre deux acides nucléiques
(AN) simples brins. Si deux AN simples brins partagent suffisamment de bases
complémentaires, ils formeront un complexe double brin. Hybrider est le contraire de
dénaturer.
 Sonde (en biologie moléculaire) : séquence nucléotidique, généralement marquée,
complémentaire d'une séquence d'ADN ou d'ARN avec laquelle elle va s'hybrider. En
s’hybridant avec sa séquence cible, elle permet de la détecter.
 Ribosonde : Sonde à ARN.
 La technique de l’hybridation moléculaire repose sur le principe qu’un fragment ADN
simple brin s’apparie à un autre fragment ADN (ou ARN) en respectant rigoureusement
les règles de complémentarité.
 L’hybridation est réalisée entre une sonde dont la séquence est connue et un segment
ADN monobrin obtenu après dénaturation.
 Sous l’effet de la chaleur les liaisons hydrogène de l’ADN double brin s’ouvrent et les
deux brins se séparent. La température à laquelle 50% des molécules d’ADN sont
séparées est appelée température de fusion ou Tm (melting température). elle
correspondant au point situé à mi-chemin dans la transition entre la forme double brin
et la forme simple brin des acides nucléiques.

95
 A l'inverse après séparation de brins par fusion, si la solution d'ADN est refroidie
lentement dans des conditions de milieu favorables, une réassociation des brins est
progressivement observée. Ce phénomène est appelé hybridation moléculaire. Cette
réassociation peut concerner deux séquences d'ADN ou une séquence d'ARN
complémentaire. Elle est donc d'une spécificité très grande.

Figure 77 : Hybridation moléculaire.

Figure 78 : Formation d’hétéroduplex sonde/cible lors d’un test par hybridation d’AN. Un
échantillon test est composé d’un mélange complexe d’AN et d’une population de sondes
bien définies de composition connue. Ces deux populations sont transformées en simples
brins, puis mélangées pour, à nouveau, en permettre l’hybridation. Les séquences qui
avaient au préalable été appariées dans l’échantillon test et la sonde s’apparient à nouveau
pour former des homoduplex (en bas à gauche et à droite). De plus, de nouveaux
hétéroduplex se forment aussi entre la sonde et certaines séquences cibles ayant des
séquences complémentaires ou partiellement complémentaires (en bas, au centre). Les
conditions d’hybridation peuvent être ajustées pour favoriser la formation d’hétéroduplex.
De cette façon, les sondes se lient de façon sélective et permette d’identifier les AN
apparentés dans une population complexe d’AN.

96
7.2. Sondes moléculaire
Une sonde est une séquence nucléotidique simple brin, longue de quelque 10aines de pb (oligo-
sonde) à quelques Kb, généralement marquée, complémentaire d'une séquence d'ADN ou
d'ARN avec laquelle elle va s'hybrider.
Les sondes sont visualisées grâce à un marquage radioactif (32P, 35S, 3H), enzymatique ou
fluorescent.

7.2.1. Types de sondes


 Sonde génomique : fragment obtenu par coupure de l’ADN génomique.
 Sonde ADNc : sonde ADN obtenue par transcription réverse d’un ARNm messager
(= séquence codante). (ADNc = ADN complémentaire)
 Sonde oligonucléotides : ADN (ou ARN) simple brin de 18 à 50 nucléotides synthétisé
chimiquement.

7.2.2. Agents de marquages


 Isotopes radioactifs : qui permettront de constituer des sondes chaudes : ex : le 32P
est le plus utilisé pour le marquage des nucléotides. Il émet des rayonnements β qui
vont impressionner des plaques photographiques lors de l'autoradiographie. Ces
isotopes radioactifs présentent les inconvénients suivants :
 Ils représentent un danger pour l'utilisateur.
 La durée de vie des marqueurs est faible (période ou ≪ demi-vie ≫ de
l'isotope utilisé), d'où besoin de marquer les sondes fréquemment.
 Avantage : grande sensibilité
 Marqueurs non-radioactifs : qui constitueront les sondes froides :
Ces marqueurs sont soit fluorescents soit non-fluorescents comme la biotine
(«sondes biotinylées»), la digoxigénine ou des enzymes (phosphatase alcaline par
exemple).
Ex. de fluorophores: La Fluorescéïne, le Vert Oregon, la Rhodamine, le Rouge
Texas, la Cyanine et ses dérivés (Cy 3.5).

7.2.3. Principales techniques d’hybridation


On distingue 2 types de techniques :
a) Techniques directes ou ≪ in situ ≫ : sans extraction de l'ADN= Hybridation in situ
(exemple : FISH = Fluorescence In Situ Hybridation) ; ces techniques sont utilisées dans le
but de localisation des gènes sur des chromosomes en métaphase (FISH) et la recherche des
bactéries qui ont intégré le plasmide ou le phage recombinant recherché (criblage de
banques de gènes).

b) Techniques indirectes : nécessite l'extraction de l'ADN. Ces techniques sont Southern


blot (le cible est l’ADN) et Northern blot (le cible et l’ARN).

97

Vous aimerez peut-être aussi