Vous êtes sur la page 1sur 59

La synthèse des protéines

٣٤٩ ‫أﻋﺠﺒﻨﻲ‬
Tweet Share

1. Présentation générale

a. Schéma des étapes de la synthèse des 4. Le noyau et les pores nucléaires


protéines chez les eucaryotes
b. Rappels sur les bases azotées, les 5. Les ribosomes
nucléosides et les nucléotides (et leurs
pendants désoxy-) a. Généralités
c. Représentations schématiques des b. La biosynthèse et la
chaînes d'acides ribonucléiques ou maturation des ARN
d'acides désoxyribonucléiques ribosomiques
c. Assemblage des sous-unités
2. La transcription ribosomiques

a. La transcription chez Escherichia coli 6. La traduction


(procaryotes)
b. La transcription chez les eucaryotes a. Initiation de la traduction
c. Addition de la coiffe des ARN b. Elongation de la traduction
d. La poly-adénylation des ARN c. Terminaison de la traduction
messagers  
e. Les rôles et la structure de la queue 7. Le réticulum endoplasmique
poly(A) des ARN messagers 8. Le canal de translocation des protéines
f. L'épissage alternatif des ARN ou translocon
messagers
g. Les "P-bodies" 9. Quelques notions sur le code génétique
h. Le spliceosome et les codons
3. Les ARN de transfert (ARNt) 10. La dégradation des protéines :
l'ubiquitine et le protéasome
a. Synthèse et maturation des ARNt
b. Bases modifiées dans les ARNt 11. Les protéines mal repliées : "Unfolded
c. Structure tridimensionnelle des ARNt Protein Response" - UPR
d. Les aminoacyl-ARNt synthétases
e. Les classes d'aminoacyl-ARNt 12. Liens Internet et références
synthétases bibliographiques
f. Activité d'édition de certaines
aminoacyl-ARNt synthétases

1. Présentation générale

a. Schéma des étapes de la synthèse des protéines chez les eucaryotes

1ère étape : la transcription des gènes de l'ADN en ARN prémessager a lieu dans le noyau.
Pour chaque gène, un seul brin de l'ADN est transcrit mais ce brin varie selon les gènes.

La synthèse de l'ARN est catalysée par l'ARN polymérase, une enzyme oligomérique. Il en existe 3
types chez les eucaryotes. La transcription s'effectue de l'extrémité 5' vers l'extrémité 3' des gènes.

2ème étape : la maturation de l'ARN prémessager a lieu dans le noyau

a. une coiffe de 7-méthylguanosine triphosphate est ajoutée à l'extrémité 5' de l'ARN


prémessager
b. une queue poly-A (50 à 250 nucléotides d'adénine) est ajoutée à l'extrémité 3' de l'ARN
prémessager

Ces modifications protégent l'ARN messager d'une dégradation trop rapide dans le cytoplasme.

c. excision des introns (les parties du gène qui ne codent pas un polypeptide) de l'ARN
prémessager
d. épissage des exons (les brins codant) de l'ARN pré-messager.

L'ARN pré-messager ainsi mature devient l'ARN messager (ARNm). L'ARNm est ensuite exporté
vers le cytoplasme via les pores nucléaires.

3ème étape : la traduction de l'ARNm en protéine a lieu dans le cytoplasme au niveau des
ribosomes et nécessite la présence d'ARN de transfert (ARNt) chargés avec les acides aminés
correspondants et d'énergie sous forme de GTP. Les ARNt sont synthétisés dans le noyau.

La synthèse peptidique s'effectue de l'extrémité N-terminale de la protéine vers l'extrémité C-


terminale.

4ème étape (protéines glycosylées et/ou sécrétées) : les modifications co-traductionnelles ou


post-traductionnelles comme la glycosylation (liaison covalente d'oses aux protéines) ont lieu dans
le réticulum endoplasmique et/ou dans l'appareil de Golgi.

Chez les procaryotes, la transcription et la traduction ont lieu dans le cytoplasme et peuvent être
simultanées.
b. Rappels sur les bases azotées, les nucléosides et les nucléotides (et leurs pendants désoxy-)

Les bases azotées constitutives des acides nucléiques


purine pyrimidine
adénine (A) - ADN & ARN cytosine (C) - ADN & ARN
guanine (G) - ADN & ARN thymine (T) - ADN
hypoxanthine - ARN uracile (U) - ARN

Voir ci-dessous la structure de ces bases azotées.

Remarque : la xanthine, la caféine, la théobromine, l'acide urique sont aussi des purines (mais qui
n'interviennent pas dans la structure des acides nucléiques).

Un nucléoside est une glycosylamine : une base azotée dont un groupement amine est lié à un
carbohydrate (ribofuranose) par une liaison β-N-osidique. Un désoxynucléoside utilise le 2-
désoxyribofuranose.

Un nucléotide résulte de la phosphorylation d'un groupement -OH du ribose du nucléoside. C'est un


ester-phosphate de nucléoside.

Les nucléosides diphosphates (NDP) ou les nucléosides triphosphate (NTP) sont des polyacides
forts qui peuvent libérer 3 ou 4 protons (acides polyprotiques).

L'ATP (adénosine 5'-triphosphate) est un NTP particulier puisque c'est la molécule réservoir
énergétique de la cellule (le GTP l'est aussi mais il est moins fréquemment utilisé).
c. Représentations schématiques des chaînes d'acides ribonucléiques ou d'acides
désoxyribonucléiques

Le ribofuranose (ARN) ou le 2-désoxyribofuranose (ADN) sont


les oses constitutifs des acides nucléiques.

La base azotée est représentée par la lettre correspondante.


Le ribofuranose (ARN) ou le 2-désoxyribofuranose (ADN) est
représenté par une ligne verticale.
La position médiane sur la ligne verticale représente le carbone
3' du ribofuranose lié au nucléotide suivant.
P représente le groupement phosphoryle lié au carbone 5 'du
ribofuranose.
3'-OH indique que le groupement OH du carbone 3' du dernier
ribofuranose est libre (il n'est pas impliqué dans une liaison
phosphodiester).

Pauling & Corey (1953) "Structure of the


nucleic acids" Nature 171, 346

Watson & Crick (1953) "Molecular structure


of nucleic acids; a structure for deoxyribose
nucleic acid" Nature 171, 737 - 738

ADN-Z (Wang et al., 1979) : le fragment


d'ADN d(CpGpCpGpCpG) cristallise sous
forme d'une molécule à double hélice
gauche avec des paires de bases de type
Watson-Crick et une organisation
antiparallèle des chaînes de sucre
phosphate. L'hélice possède 2 nucléotides
dans l'unité asymétrique et 12 paires de
bases par tour.

De gauche à droite, structures tridimensionnelles de


l'ADN A, B et Z.
Source : "DNA" (Wikipedia)

Différents
types de
visualisation
de l'ADN
double brin

wireframe
cartoons
spacefill
Rotation

L'ADN est employé comme molécule de stockage robuste et non modifiable (hormis les mutations)
de l'information génétique. La structure en double hélice de l'ADN, son empaquetage très dense
dans le noyau et son association étroite aux histones sont des éléments supplémentaires de
stabilité.

Pour que l'information passe de l'ADN aux protéines, la cellule utilise diverses classes de
molécules d'acides ribonucléiques ou ARN.
Les ARN de transfert (ARNt) qui apportent les acides aminés à la machinerie de traduction
des ARN messagers en protéines.
les ARN ribosomiaux (ARNr) qui constituent (avec des protéines) les ribosomes.
les ARN messagers (ARNm), découverts par J. Monod, F. Jacob et leurs collaborateurs.
des petits ARN ("small RNAs" : snRNA, snoRNA, siRNA ("small interfering RNA"), miRNA,
piRNA, ...) de faible taille (20 - 30 nucléotides). Ils participent à divers mécanismes
métaboliques dont la maturation des ARN. Ces petits ARN possèdent souvent une activité
catalytique.
des lncRNA ("long non-coding RNA") impliqués dans divers mécanismes de régulation
(exemple : les modifications épigénétiques).

Source : Amin et al. (2019)

Le groupement OH porté par le carbone 2 du ribofuranose rend les ARN plus sensibles à
l'hydrolyse de la liaison phosphodiester.

Les ARN sont donc des molécules moins stables que l'ADN, raison pour laquelle l'ADN est
employé comme molécule de stockage.
Parmi les ARN, l'ARN ribosomal est le plus stable (temps de demi-vie moyen : quelques jours)
car il est trés replié via de nombreux appariements intramoléculaires et son association à un
grand nombre de protéines.
Les ARN de transfert sont assez stables car repliés via de nombreux appariements
intramoléculaires.
Les ARN messagers sont les moins stables (temps de demi-vie moyen de quelques jours).

Voir un cours sur le monde ARN ("RNA world").

Codage de l'information numérique dans de l'ADN

La production de ressources numériques, la transmission de données et leur stockage ont


révolutionné notre vie moderne. Cependant, de manière parallèle, les tâches d'archivage actif et
d'entretien en continu des médias numériques sont de plus en plus complexes.

La molécule d'ADN s'avère un support particulièrement attractif pour le stockage de l'information.


C'est, peut-être, le support de l'avenir, du fait notamment de ses capacités d'encodage à haute
densité de l'information et de sa longévité dans des conditions de conservation faciles à mettre en
oeuvre.
En 2013, cinq formats de fichiers courants en informatique ont été codés sous la forme d'ADN
(Goldman et al., 2013) :

les 154 sonnets de Shakespeare : format texte ASCII


l'article original de Watson & Crick (structure de l'ADN) : format PDF
une photographie en couleur à une résolution moyenne : format JPEG 2000
un extrait de 26 secondes du discours de Martin Luther King en 1963 ("I have a dream") :
format MP3
le code de Huffman utilisé pour convertir les octets en digits en base 3 : format texte ASCII
voir la partie "Supplementary information" de l'article de Goldman et al. (2013)

Soit un total de codage dans une molécule d'ADN de l'équivalent de 739 kilo-octets de stockage sur
un disque dur avec un taux estimé d'informations de Shannon de 5.2 106 bits.

L'ADN a été synthétisé, puis séquencé et les fichiers d'origine ont été reconstruits avec une
précision de 100% !

L'analyse théorique indique que le stockage dans de l'ADN est : (i) une technologie d'archivage
numérique à long terme réaliste; (ii) applicable à une échelle bien au-delà des volumes actuels de
stockage de l'information

Voir un cours sur les méthodes de séquençage ADN et ARN.

2. La transcription

C'est la polymérisation de ribonucléosides triphosphates (NTP) catalysée par une ARN polymérase
:

ARNn-OH + NTP -> ARNn+1-OH + pyrophosphate inorganique (PPi)

L'hydrolyse ultèrieure du pyrophosphate inorganique (PPi) rend la réaction exergonique : ΔG°' = - 2,2
kcal.mol-1.

a. La transcription chez Escherichia coli (procaryote)

Chez Escherichia coli, l'ARN polymérase est une protéine oligomérique constituée de 6 sous-unités.
Cinq d'entre elles s'associent de manière stoechiomètrique : α2ββ'σ70 pour constituer l'holoenzyme
(figure ci-dessous).

Source : 3D structures - Darst Lab


Elle est de forme irrégulière et l'un des bords est creusé d'un sillon assez long pour adapter un ADN
bicaténaire de 16 paires de bases.

β' fixe l'ADN à l'holoenzyme.


β forme une partie du site actif. Elle est impliquée dans l'initiation et l'élongation.
σ70 joue un rôle primordial dans l'initiation de la transcription en dirigeant l'enzyme vers le
promoteur. Chaque cellule bactérienne peut contenir plusieurs éléments σ.
ω compte pour moins d'un exemplaire par molécule d'enzyme.

protomère masse molaire (Da) gène E. coli


β' 155 613 rpoC
β 150 618 rpoB
σ 70 263 rpoA
α70 36 512 rpoD
ω 10 105 rpoZ

Chez les procaryotes, la transcription a lieu dans le cytoplasme.

L'initiation de la transcription nécessite que la sous-unité σ de l'ARN polymérase se fixe sur


l'oligomère α2ββ' (appelé "core-enzyme") pour former l'holoenzyme α2ββ'σ.

Ce complexe se fixe de manière non-spécifique à l'ADN, via la sous-unité σ, et se déplace jusqu'au


promoteur situé en amont de la séquence codante entre deux types de séquences appelées
respectivement région -35 et "Pribnow box" ou "TATA box" ou région -10.

Voir les articles de D. Pribnow (1975) et de Schaller et al. (1975).

Source : M. Hunter (2009)

Ces séquences sont dites consensus car elles reflètent l'emploi le plus fréquent de certains
nucléotides à des positions précises par le plus grand nombre d'organismes pour lesquels on a ce
type de données.

Exemples de séquences consensus : région -35 = TTGACAT; région -10 = TATAAT


Source : "Biochemistry" - Garret & Grisham

σ70 est l'élément le plus fréquement trouvé chez Escherichia coli. Mais il existe d'autres types de
facteurs σ ce qui permet de réguler la transcription de différents gènes : σ28 reconnaît les
promoteurs des gènes de motilité et de chimiotaxie, σ32 ceux des gènes induits par le choc
thermique, σ38 ceux des gènes de la phase stationnaire et de réponse au stress, σ54 ceux des
gènes du métabolisme azoté.

La sous unité σ se détache et la sous unité β' assure la liaison avec l'ADN pour former le complexe
fermé. L'ADN est déroulé sur environ 17 paires de bases par l'ARN polymérase  : c'est le complexe
ouvert.

La phase de terminaison Rho-dépendante commence en remplaçant la sous unité σ par un facteur


de transcription appelé NusA. NusA fait partie d'une famille de facteurs d'élongation trés
conservés.

Chez Escherichia coli c'est une protéine de 495 acides aminés (55 kDa) constituée de 6 domaines.
Le domaine N-terminal (1 à 137) interagit avec l'ARN polymérase. Ce complexe enzymatique
synthétise le brin d'ARN complémentaire du brin d'ADN matrice.

Figure ci-dessous : les différents complexes d'élongation au cours d'un cycle de transcription chez
Escherichia coli.
Source : Burmann & Rösch (2011) - RNAP : ARN polymérase - NusB, NusG et NusE : autres facteurs
de transcription

Au cours de l'élongation, l'ARN polymérase ouvre une "bulle de transcription" de 12 -13 paires de
bases ouvertes.

L'ARN polymérase apparie les ribonucléotides avec les désoxyribonucléotides de l'ADN matrice et
elle établit les liaisons phosphodiester entre les ribonucléotides. Le brin d'ARN en cours de
biosynthèse reste apparié à l'ADN puis il y a désappariement.

La terminaison de la transcription se fait de 2 manières (50% pour chacune d'entre elles environ
chez Escherichia coli).
α. La terminaison de la transcription Rho-dépendante

Une courte séquence d'ADN, riches en paires G-C (3 liaisons hydrogènes donc plus fortement liées)
suivie de plusieurs U, est transcrite en "épingle à cheveux" ce qui stoppe la progression de l'ARN
polymérase.

Source : Pearson Education, Inc. (2009)

Une protéine de terminaison appelée Rho (une hélicase ARN-ADN / ATP-dépendante sous forme
d'homohexamère) se fixe sur l'ARN et le complexe d'élongation est dissocié. Le brin d'ARN néo-
synthétisé est libéré du brin d'ADN matrice.

Le site d'enroulement de l'ARN autour de Rho est une région d'environ 70 nucléotides (jusqu'à 100
nucléotides), riche en cytosine et pauvre en guanine, appelée "rho utilization site" située en amont
de la séquence appelée "terminateur".

β. La terminaison de la transcription Rho-indépendante (ou terminaison intrinsèque)

Elle a lieu au niveau d'une séquence répétée inversée (également riche en paires G-C) suivie de 6 A,
située après la séquence codante. La transcription de cette séquence inversée aboutit à la
formation d'une structure en "épingle à cheveux" dans l'ARN en cours de biosynthèse qui bloque le
complexe de transcription.
Source : Freeman & Co. (2005)

Les liaisons H entre la séquence poly A et le brin complémentaire poly-U néo-synthétisé sont
rompues et le brin d'ARN est dissocié du brin d'ADN matrice.

L'ARNm synthétisé peut être directement traduit. La transcription et la traduction se déroulant dans
le même compartiment, des ribosomes peuvent même commencer à traduire un ARN messager
avant que sa transcription ne soit finie.

Ce mécanisme de terminaison est en relation avec l'activité d'éléments régulateurs de l'ARN qui
agissent en cis comme les riboswitches.

Figure ci-dessous : une unité de gène ribosomal en action (Chrironumus pallidivitatus). De


nombreuses molécules d'ARN polymérase I (ARN Pol I) sont en train de transcrire le gène car
l'initiation est trés fréquente. Plus on s'approche de l'extrémité 5', plus les transcrits (ARNr) sont
longs.

Figure adaptée de Hans-Heinrich Trepte


b. La transcription chez les eucaryotes

Chez les eucaryotes, à chaque type d'ARN correspond une ARN polymérase.

ARN polymérase ARN transcrits


type I (Pol I) ARN ribosomique 5,8 S, 18 S et 28 S
type II (Pol II) ARN messagers et petits ARN nucléaires
ARN de transfert, ARN ribosomique 5 S et petits
type III (Pol III)
ARN nucléaires
des organites ARN mitochondriaux et chloroplastiques

L'ARN polymérase II est un énorme complexe protéique d'environ 550 kDa constitué de 12 sous-
unités.

Figures ci-dessous : structure de l'ARN polymérase II à une résolution de 2,8 Å.

En blanc : ARN polymérase II; en beu : double hélice d'ADN; en rouge : ARN en cours de formation;
en vert : structure qui fait avancer le brin d'ADN dans l'enzyme
Source des figures : R. D. Kornberg - "Nobel Lecture 2006" & "Cell Death and Differentiation 14"
L'ARN polymérase III

Ce n'est qu' en 2007 que sa structure tridimensionnelle a été obtenue par cryo-microscopie
électronique. L'échantillon et l'intérieur du microscope sont refroidis à -180° Celsius afin d'éviter
l'évaporation de l'eau contenue dans la structure de l'enzyme. Cela permet de figer l'enzyme dans
son état natif.

Source : G. Schoehn - CNRS 2007

Cette structure a permis de localiser cinq sous-unités supplémentaires impliquées dans les phases
initiale et finale de la transcription. Ces sous-unités permettent de reconnaître l'ADN et de fixer
différents facteurs de transcription.

L'initiation de la transcription chez les eucaryotes

Elle est plus complexe chez les eucaryotes car les ARN polymérases ne reconnaissent pas
directement leurs séquences promotrices : 5 facteurs de transcription généraux ("Transcription
Factor" : TFII-B, TFII-D, TFII-E, TFII-F et TFII-H) doivent d'abord médier la fixation des ARN
polymérases et l'initiation de la transcription.

Le complexe complet [ARN polymérase - facteurs de transcription - séquence ADN du promoteur]


est appelé complexe de pré-initiation de la transcription.

Ce complexe assure :

le chargement précis de l'ARN polymérase II (Pol II) sur le bon site de démarrage de la
transcription
la déshybridation (ouverture) de l'ADN au niveau du promoteur
le relarguage de Pol II du promoteur

Cependant, certains mécanismes moléculaires et certaines fonctions de ce complexe sont encore


inconnus, notamment par manque d'informations structuralles en raison de la taille gigantesque
du complexe de pré-initiation (2 millions Da).

Voir un cours sur les facteurs de transcription.

En 2013, un système a été reconstitué in vitro pour étudier, par cryo-microscopie électronique,
l'assemblage progressif de TBP ("TATA-Binding Protein"), Pol II et des facteurs de transcription
généraux (TFIIA, TFIIB, TFIIF, TFIIE et TFIIH) sur un promoteur.

Stratégie de reconstruction du complexe de pré-initiation humain par assemblage séquentiel.


Source : He et al. (2013)

(a) : schéma de l'ADN mentionnant les positions relatives des éléments fondamentaux du
promoteur utilisé et du site de restriction SalI.

(b) à (e) : intermédiaires de l'assemblage du complexe de pré-initiation [TBP - TFIIA - TFIIB - ADN -
Pol II] (b) puis addition de TFIIF (c) puis addition de TFIIE (d) puis addition de TFIIH (e).

Les modèles obtenus à différentes étapes de l'initiation de la transcription décrivent les


interactions entre les molécules de ce complexe :

ils expliquent comment TFIIF recrute Pol II et le promoteur pour stabiliser le complexe
"fermé" de pré-initiation et le complexe promoteur "ouvert".
ils montrent que la localisation des hélicases TFIIH XPD et TFIIH XPB est en faveur d'un
modèle de translocation de l'ADN et souligne le rôle essentiel de XPB dans l'ouverture du
promoteur.

Voir une vidéo du processus d'assemblage.

Structures cristallines : complexe [TBP - TFIIA - ADN] : 1NVP; complexe [TBP - TFIIB - ADN] : 1C9B;
complexe [Pol II - TFIIB] : 4BBR ; domaine de dimérisation RAP30/74 : 1F3U.

Visualisation du
complexe
[TFIIA/TBP/ADN]
de Homo sapiens

Code PDB :
1NVP.pdb
Rotation

Le médiateur

Le médiateur ("mediator") est un complexe protéique constitué de plusieurs dizaines de sous-


unités qui agit en tant que co-activateur en se fixant au complexe de préinitiation de la
transcription. Il régule ainsi l'activité de Pol II en communiquant les signaux de régulation des
divers facteurs de transcription liés à l'ADN à Pol II.

Le médiateur est impliqué dans la régulation de nombreux autres processus fondamentaux de la


transcription (l'initiation, l'allongement, l'architecture de la chromatine et la formation de la boucle
promoteur-activateur).

Source : Nozawa et al. (2017)

Le médiateur est composé de 31 sous-unités chez l'homme (21 sous-unités chez la levure). Les
sous-unités forment au moins trois modules distincts sur le plan structural. Les modules appelés
"tête" et "milieu / intermédiaire" interagissent directement avec Pol II, et le module appelés "queue"
interagit avec les protéines régulatrices.

Certaines sous-unités du médiateur sont caractérisées par une grande flexibilité structurale car
elles contiennent beaucoup de régions intrinsèquement non structurées.

La terminaison de la transcription chez les eucaryotes

Elle s'effectue selon différents processus, qui dépendent de la polymérase employée.

Dans le cas des gènes transcrits par Pol I, la transcription s'arrête avec un facteur de
terminaison, via un mécanisme semblable au mécanisme rho-dépendant chez les bactéries
(voir ci-dessus).

La transcription des gènes transcrits par Pol II peut continuer sur des centaines, voire des
milliers, de nucléotides au-delà de la fin de la séquence codante. Le brin d'ARN est alors
coupé par un complexe qui s'associe à la polymérase. Cette coupure, couplée semble-t-il à la
terminaison de la transcription s'effectue au niveau d'une séquence consensus. Les ARNm
matures transcrits par pol II sont polyadénylés à leur extrémité 3', formant la queue poly(A).

Dans le cas des gènes transcrits par Pol III, la transcription s'arrête après la transcription
d'une séquence de terminaison qui contient un segment polyuracile, via un mécanisme
semblable au mécanisme rho-indépendant chez les procaryotes.

Certains ARN des cellules eucaryotes, en particulier les ARN dits pré-messagers, subissent des
modifications post-transcriptionnelles, catalysées par plusieurs enzymes localisées dans le noyau.

l'addition d'une coiffe protectrice à l'extrémité 5'


une poly-adénylation à l'extrémité 3'
un épissage alternatif (excision des parties non codantes appelées introns)

c. Addition de la coiffe des ARN

C'est l'addition d'une 7-méthylguanosine (N7) sur le premier nucléotide de l'ARN, par une liaison
5'-5' triphosphate (notation : 7mGpppN). Cette modification est appelée la coiffe (ou "5'-cap").

Les ribofuranoses des deux premiers nucléotides de l'ARNm transcrit peuvent aussi être méthylés
en position 2'.

La coiffe :

Elle protège l'extrémité 5' des ARN contre la dégradation par des exonucléases 5' -> 3',
augmentant ainsi leur temps de demie-vie.
Elle participe au transport des ARN vers le cytoplasme : la coiffe est reconnue dans le noyau
par un complexe de fixation de la coiffe ("cap-binding complex"). Ce complexe est reconnu
par les pores nucléaires.
Dans le cas des ARNm, après qu'ils aient été exportés dans le cytoplasme, la coiffe est
reconnue par un complexe protéique spécifique, comprenant notamment le facteur
d'initiation eIF4E. eIF4E forme un complexe avec eIF4G qui recrute le ribosome via eIF3, qui
permet traduction en protéine.

Les enzymes ("mRNA-capping enzyme catalytic subunit") qui catalysent l'addition de la coiffe sont :

a. Une polynucléotide 5'-phosphatase (EC 3.1.3.33) qui libère le 5' diphosphate :

5'-phospho-polynucléotide + H2O <=> polynucléotide + phosphate inorganique.

b. Une ARNm guanylyl-transférase (EC 2.7.7.50) qui forme la liaison 5'-5' triphosphate avec le GTP
en tant que donneur de liaison à haut potentiel énergétique :

GTP + (5')pp-Pur-ARNm <=> G(5')ppp-Pur-ARNm + pyrophosphate inorganique.

c. Une ARNm [guanine-N(7)-]-méthyl-transférase (EC 2.1.1.56) qui ajoute les groupements méthyle
sur l'atome N7 de la guanosine et les deux nucléotides suivants. Le donneur de méthyle est la S-
adénosylméthionine.

Voir la "molécule du mois" - Janvier 2012 : "Messenger RNA Capping" / PDB 3KYH - PDB 1RI1.

Le système multi-enzymatique complexe qui dégrade les ARN qui ne sont plus utiles s'appelle
l'exosome - PDB 2NN6 (système qui est le pendant des protéasomes dans le cas des protéines).

Coiffe des ARN des bactéries

Chez les bactéries, le mécanisme d'addition de coiffe et la nature chimique de cette coiffe sont
différents de ceux des eucaryotes. En effet, chez les procaryotes, la coiffe est une molécule de
coenzyme (dans la figure ci-dessous, il s'agit du NAD+) ajoutée à l'ARN au cours de l'initiation de la
transcription.
Source : Hofer & Jaschke (2016)

Une partie de la structure du co-enzyme NAD+ entre en compétition avec l'ATP pour la position +1
de l'ADN (le site de début de transcription, en aval du promoteur) : le NAD+ est donc incorporé à
l'extrémité 5' de l'ARN par l'ARN polymérase (RNAP).

Le nucléoside en position -1 de l'ADN détermine l'efficacité de l'incorporation du coenzyme.

d. La poly-adénylation des ARN messagers

Figure ci-dessous : schéma simplifié d'un gène Eucaryote et d'un transcrit issu de ce gène.
Les régions non traduites ("UnTranslated Regions") en 5' (5'-UTR) sont davantage conservées entre
différentes espèces et ne changent pas beaucoup au sein d'une famille de gènes.

A l'inverse, les régions 3'-UTR sont caractérisées par une plus faible conservation entre différentes
espèces.

Voir un cours sur les facteurs de transcription et les éléments de régulation de la transcription.

Hormis les ARN messagers (ARNm) codant les histones, l’extrémité 3’ des ARNm des eucaryotes
comporte une série de 50 à 200 résidus adényliques qui constitue la queue "polyA".

elle stimule la terminaison de la transcription


elle participe à la migration des ARN messagers dans le cytoplasme
elle protége les ARN messagers de la dégradation
elle contribue à l'initiation de la traduction

L'étude des transcrits de 10 chromosomes humains a montré que prés de la moitié des transcrits
sont non polyadénylés [écrit poly(A)-] (Cheng et al., 2005) : 19,4% sont poly(A)+; 43,7% sont
poly(A)-, c'est-à-dire non polyadénylés; 36,/9% sont poly(A)+ et poly(A)-.

La polyadénylation alternative génère différents transcrits à partir d'un même gène (schéma ci-
dessous).

Source : D. Gautheret - INSERM ERM206


e. Les rôles et la structure de la queue poly(A) des ARN messagers

Rôles de la queue poly(A) des ARNm

Dans le noyau, les pré-ARNm sont transcrits par l'ARN polymérase II (Pol II) et traités : addition de
la coiffe en 5', épissage, clivage en 3' et polyadénylation en 3'.

Chez les eucaryotes, les queues poly(A) sont présentes sur presque tous les ARNm :

La protéine nucléaire de liaison au poly(A) ("nuclear Poly(A)-Binding Protein" - PABPN)


contrôle l'addition de la queue poly(A).
Les ARNm polyadénylés matures sont exportés vers le cytoplasme.

Source : Passmore & Coller (2021)


CPSF ("Cleavage and Polyadenylation Specificity Factor") : facteur de spécificité de clivage et de
polyadénylation; m7G, 7-méthylguanosine.

La protéine de liaison au polyadénylate cytoplasmique ("cytoplasmic PolyAdenylate-Binding Protein"


- PABPC) se fixe à la queue poly(A) de l'ARNm (y compris à celle de son propre transcrit) : elle
régule le métabolisme de l'ARNm (par exemple, l'épissage du pré-ARNm et la stabilité de l'ARNm)
et favorise la traduction par le ribosome 80S.

Les queues poly(A) et PABPC influencent la stabilité de l'ARNm : l'élimination ou le


raccourcissement de la queue poly(A) (processus appelé désadénylation) libère cPABP et
conduisent à la dégradation de l'ARNm.
Par ailleurs, la vitesse d'élongation lors de la traduction affecte la désadénylation.
Par conséquent, les inter-relations établies entre [interaction entre les queues poly(A) et
PABPC, traduction et dégradation de l'ARNm] ont un rôle majeur dans la régulation des
gènes.

Désadénylation et dégradation de l'ARNm chez les eucaryotes


Dans le modèle général de dégradation de l'ARNm, les évènements sont les suivants :

La queue poly(A) de l'ARNm est d'abord raccourcie à 10 - 12  nucléotides par :


Le complexe de désadénylation [PAN2 (sous-unité catalytique) - PAN3 (sous-unité
régulatrice)] (PAN : "poly(A)-nuclease").
Et/ou le complexe CCR4-NOT ("Carbon Catabolite Repression - Negative On TATA-less").
Caf1 ("Poly(A) ribonuclease pop2") est la sous-unité catalytique de ce complexe.
PABPC est libèrée et l'association au facteur d'initiation de la traduction des eucaryotes
(eIF4E) avec la coiffe 5' est affaiblie.
La coiffe en 5' est ensuite retirée : le complexe [LSM1 - LSM7] ("Sm-like protein") peut
s'associer aux queues poly(A) ou à des queues uridyle 3' pour recruter la machinerie de
décoiffage.
Le transcrit est alors dégradé dans la direction 5' -> 3' par l'exoribonucléase 1 5'-3' (XRN1) ou
dans la direction 3' -> 5' par le complexe exosome cytoplasmique.

Structure de l'ARN poly(A)

Le queue poly(A) possède des propriétés structurales uniques parmi les polyribonucléotides :
l'ARN poly(A) forme une hélice de type A monocaténaire dans laquelle les bases sont empilées les
unes sur les autres :

La structure hélicoïdale de type A permet la reconnaissance spécifique de l'ARN poly(A) par


la nucléase PAN2 (et probablement Caf1) via des interactions avec le squelette
ribophosphate du ribonucléotide.
L'empilement des bases est nécessaire pour l'activité de désadénylation de PAN2 et Caf1.
Les guanosines perturbent la structure de l'ARN poly(A) dans le site actif de PAN2 (PDB :
6R9J).

Méthode de séquençage des queues poly(A)

TAIL-Seq : séquençage des régions 3'-UTR et queue poly(A) des ARNm.


PAL-Seq : séquençage permettant de mesurer la longueur de la queue poly(A) par
incorporation d'étiquettes fluorescentes sur la désoxyuridine triphosphate (dUTP) biotinylée.
FLAM-seq ("Full-Length poly(A) and mRNA sequencing") : séquençage des ARNm pleine
longueur.
PAT-seq ("Poly(A)-Test RNA-sequencing") : séquençage permettant l'intégration de
l'expression des gènes à la dynamique de la longueur de la queue poly(A) et du site
d'adénylation.
Voir un cours sur le séquençage.

f. L'épissage alternatif

Les génes sont transcrits sous forme d'ARN messagers pré-matures (synonymes : transcrits
primaires - pré-ARNm) qui contiennent des introns (séquences de l'ARN non retenues dans la
séquence finale qui code la protéine ou l'ARN) et des exons qui sont assemblés selon différentes
combinaisons (épissage alternatif).

Les introns ont des tailles extrêmement variables : de plusieurs centaines de nucléotides à
plusieurs centaines de milliers de nucléotides.

L'épissage alternatif est le processus qui permet à un même gène de générer différents transcrits
selon la combinaison des exons qui formeront l'ARN messager mature.
L'épissage est effectué par deux réactions de trans-estérification au sein de complexes appelés
spliceosomes formés, entre autres, de 5 particules ribonucléoprotéiques appelées SnRNP ("Small
nuclear RiboNucleoProtein").

Ce sont des protéines associées à des petits ARN nucléaires ("small nuclear RNA" - snRNA) riches
en uracile (U1, U2, U4, U5 et U6).

Voir un cours sur l'épissage alternatif et le spliceosome.

Figure ci-dessous : Les 5 types d'épissage alternatif

1 : site d'épissage alternatif 5' / 2 : site d'épissage alternatif 3' / 3 : rétention d'intron / 4 : exclusion
mutuelle d'introns / 5 : exclusion - inclusion d'exon

Les répercutions de l'épissage sur les marqueurs de séquence exprimée ou " EST " ("expressed
sequence tags") que l'on peut obtenir sont les suivantes :
Quand différents exons d'un même gène sont attachés au même dernier exon en 3' dans une
collection d'EST, ils apparaissent comme des gènes distincts avant l'analyse.
S'il existe plusieurs sites d'initiation de la transcription, on aboutit à différents EST pour un
même gène.
La probabilité que l'extrémité 5' d'un ADNc corresponde effectivement au site d'initiation
décroît en fonction de la longueur du transcrit. En conséquence, les EST qui dérivent de
l'extrémité 5' correspondent souvent à des séquences internes du gène.
Des erreurs peuvent être observées également à l'extrémité 3' : délétions internes ou erreurs
d'épissage. Certains gènes possèdent plusieurs extrémités 3'.

g. Les P-bodies

Les granules de dégradation des ARN ("Processing bodies" ou "P-bodies") sont des structures
granulaires localisées dans le cytoplasme des cellules eucaryotes.

Elles contiennent un très grand nombre de protéines et de nucléases impliquées dans la


dégradation des ARNm, la répression traductionnelle, le "contrôle qualité" des ARNm, la
dégradation des fragments d'ARN (introns - interférence ARN).

Désadénylation : complexe PAN2 - PAN3 ou complexe CCR4-NOT.


Enlèvement de la coiffe en 5' :

DCP1 (sous-unité régulatrice) et DCP2 (sous-unité catalytique) : stimulée par EDC1/EDC2 et


EDC3 ("RNA-binding protein")
Dcs1 : enzyme de digestion de la coiffe (préférence pour les ARN courts)
Dcs2 : digestion de m7Gp et de ppN-. Clive m7GDP produit par DCP1/DCP2 en m7GMP et P.

Digestion exo-nucléolytique de l'extrémité 3' :

L'exosome : voir des structures 3D des exosomes par cryo-microscopie électronique (EM
DataBank).
Le complexe SKI ("SuperKIller") : il est composé de Ski3p, de Ski8p et de l'ATPase DEVH
Ski2p. C'est un élément central de la voie de dégradation des ARNm cytoplasmiques (à partir
de l'extrémité 3') chez la levure.

Digestion exo-nucléolytique de l'extrémité 5' : XRN1 : 5'-3' exo-ribonucléase 1 (dégradation dans le


sens 5' -> 3' des ARN en 5'-mononucléotides). Stimulée par Dcs1/Dcs2.

Exemples de quelques autres protéines et enzymes constitutives des granules de dégradation des
ARN chez l'homme : facteur d'initiation de la traduction eIF4E et de la répression de la traduction
eIF4E-T, enzymes de dégradation d'ARNm non sens, protéine Argonaute, désoxy-cytidine
désaminase, protéine FAST ("Fas-Activated Ser/Thr phosphoprotein"), ...

3. Les ARN de transfert (ARNt)

a. Synthèse et maturation des ARNt

Les ARNt sont des petits ARN de 75 à 95 nucléotides.

L'ARN polymérase Pol III transcrit les gènes codants les 32 ARNt. Les gènes codant les ARNt et les
ARN ribosomiques (ARNr) sont fortement transcrits : environ 3 millions d'ARNt et 300.000
ribosomes par génération chez la levure (et environ 60.000 ARNm).

Cela nécessite une grande coordination des activités de Pol III et de Pol I (pour les ARNr) et
l'existence de nombreux processus de signalisation pour adapter la biosynthèse de ces ARN à la
disponibilité des nutriments cellulaires et aux conditions environnementales.
Pol III est régulée négativement (répression) par la protéine Maf1 (forme déphosphorylée) : elle
inhibe le ré-assemblage du facteur de transcription général TFIII-B avec l'ADN.

La biosynthèse des ARNt implique :

la synthèse du transcrit initial


le clivage de l'extrémité 5′ par la composante ARN de la ribonucléoprotéine RNase P (bien
que la RNase P mitochondriale de l'homme ne possède aucun composant ARN)
le clivage de l'extrémité 3′ par l'endonucléase RNase E puis les 3′-exonucléases RNase PH,
RNase T, RNase II, PNPase, RNase BN et RNase Z
l'addition d'une séquence CCA à l'extrémité 3' (fréquemment après N73) par une nucléotidyl-
transférase (site de liaison covalente à l'acide aminé porté par l'ARNt)
l'épissage d'éventuels introns
la modification de plusieurs nucléosides
dans le cas des eucaryotes : l'export des ARNt dans le cytoplasme avant leur utilisation pour
la traduction

Les ARNm et les ARNr subissent des modifications qui semblent essentiellement co-
transcriptionnelles (exception faite de la maturation du pré-ARNr 20S en ARNr 18S).

A l'inverse, la transcription et les modification post-transcriptionnelles des ARNt se produisent


dans différents compartiments sub-cellulaires, y compris le nucléole, le nucléoplasme, la
membrane nucléaire interne (INM), le cytoplasme et la surface cytoplasmique des mitochondries.

Les pré-ARNt contenant des introns sont exportés vers le cytoplasme via l'exportine Los1 et au
moins une voie inconnue.

Après l'épissage du pré-ARNt à la surface cytoplasmique des mitochondries, les modifications


supplémentaires dans le cytoplasme et l'aminoacylation, l'ARNt chargé mature participe à la
synthèse des protéines.

Les ARNt cytoplasmiques peuvent être aussi rétro-importées dans le noyaux, directement ou
indirectement, par l'intermédiaire de Mtr10.
Le ré-export des ARNt nucléaires vers le cytoplasme est médiée par Los1 et Msn5.

Source : Phizicky & Hopper (2010)

Légende de la figure ci-dessus :

cercles rouges et verts : parties de l'ARNt conservées dans la forme mature / cercles rouges :
anticodon
cercles violets : extrémités 5′ ("5′ leader sequence") et 3′ ("3′ trailer sequence") clivées
cercles bleu foncé : introns
cercles bleu clair : CCA
cercles jaunes, orange et roses : modifications dans le nucléoplasme, dans l'INM et dans le
cytoplasme, respectivement

b. Bases modifiées dans les ARNt

Figure ci-dessous : exemples de bases azotées modifiées dans les ARNt.

La pseudouridine (Ψ) résulte d'une modification post-transcriptionnelle de l'uridine (isomérisation


par rotation de 180° du cycle pyrimidine). C'est la modification la plus fréquente des bases des
ARN et elle contribue à la stabilisation de la structure 3D des ARNt. La boucle TΨC comporte une
pseudouridine.

La ribothymidine (5-méthyluridine) est trouvée essentiellement dans la boucle T des ARNt à


laquelle elle donne son nom. Lors de la transcription, une uridine est incorporée en position 54
dans le précurseur de l'ARNt puis cette uridine est modifiée par l'ARNt (uracile(54)-C(5))-
méthyltransférase (EC 2.1.1.35) en ribothymidine. Elle joue un role important dans la stabilisation
de la structure 3D des ARNt.

La 5,6-dihydrouridine (boucle D) est non-plane. Elle perturbe les interactions d'empilement des
bases dans les hélices et déstabilise la structure des ARN. Cette particularité est utilisée par
certains organismes qui se développent à des températures trés basses et qui ont des ARNt riches
en 5,6-dihydrouridine. Leurs ARNt restent ainsi localement flexibles à ces températures.

L'inosine contient une purine particulière : l'hypoxanthine. L'inosine peut former des appariements
de type wobble ("appariement bancal") I-U, I-A et I-C. Ainsi, l'inosine est fréquemment en première
position de l'anti-codon des ARNt, permettant au même ARNt de s'apparier à plusieurs codons
synonymes. L'inosine résulte de la désamination de l'adénine par l'adénine désaminase (EC
3.5.4.2).
On trouve également : la 1-méthyladénosine, la 1-méthylguanosine, la 5-méthylcytidine, ...

c. Structure tridimensionnelle des ARNt

Les ARNt jouent un rôle capital dans la traduction. ils adoptent une structure repliée dans l'espace
(figure ci-dessous) caractéristique d'un grand nombre de liaisons hydrogène établies entre bases
distantes.

Adapté de "Transfer RNA" (Wikipedia)

L'extrémité 3' est appelée bras accepteur ("acceptor stem") : c'est là que se fixe l'acide aminé. Elle a
la séquence CCA. Les autres parties des ARNt sont : T : boucle TΨC; A : boucle qui porte l'anti-
codon; D : boucle D

Les ARN de transfert portent, à l'extrémité 3' (bras accepteur), l'un des 20 acides aminés fixé par
une liaison ester en 3'-OH ou en 2'-OH du ribofuranose de l'adénosine.

Les ARN de transfert contiennent une séquence particulière de 3 nucléotides, appelée anticodon,
qui est complémentaire des codons constitutifs de l'ARN messager.
Source : Structure des acides nucléiques

Les modifications post-transcriptionnelles (décrites ci-dessus) des ARNt jouent un rôle important
dans l'appariement  codon - anticodon.

Par exemple, la transformation de l'adénosine (en position 37 - adjacente à l'extrémité 3' de


l'anticodon) en 2-méthylthio-N6-threonyl carbamoyl adénosine (ms2t6A) est essentielle pour une
traduction efficace par les ribosomes.

Ces modifications post-transcriptionnelles jouent également un rôle important dans l'interaction de


l'ARNt avec son aminoacyl-ARNt synthétase, l'enzyme qui lie spécifiquement un acide aminé.

En apportant les 2 informations (anticodon et acide aminé) aux ribosomes, les ARNt établissent
ainsi le lien entre l'information contenue par l'ARN messager (l'information génétique portée par
leurs codons) et les acides aminés qui constituent la (ou les) protéine(s) codée(s) par cet ARN
messager.

Figure ci-dessous : ARNt-Gln à gauche de la figure (la glutamine est indiquée par la flèche rouge)
fixé à la glutaminyl-ARNt synthétase (en marron - transparent à droite de la figure).
Source : Wikipédia - structure PDB 1QRS

d. Les aminoacyl-ARNt synthétases ("ligases forming aminoacyl-tRNA" ou "Aminoacyl-tRNA


synthetase" - EC 6.1.1.-)

Elles constituent une famille d'enzymes qui activent les acides aminés et les transfèrent aux ARNt
spécifiques. Elles appartiennent à la classe 6 des ligases.

On dénombre plus de 103.000 aminoacyl-ARNt synthétases (tous organismes confondus)


dans la base de données Uniprot.
On dénombre presque 400 structures d'aminoacyl-ARNt synthétases dans la base de
données PDB.

La réaction générale qu'elles catalysent est : ATP + L-acide aminé + tRNAAA → AMP + diphosphate
+ L-acide aminé-tRNAAA

Réaction qui se décompose en :

ATP + L-acide aminé → L-acide aminé-AMP + pyrophosphate inorganique (PPi)


L-acide aminé-AMP + tRNAAA → L-acide aminé-tRNAAA + AMP
Chez les procaryotes, il existe au moins 20 types d'aminoacyl-ARNt synthétases : 1 pour chaque
acide aminé.

Chez les eucaryotes, il existe en général 2 aminoacyl-ARNt synthétases pour chaque acide aminé :
une forme cytosolique et une forme mitochondriale. Bien que ces aminoacyl-ARNt synthétases
aient des fonctions identiques, elles sont très différentes tant en terme de taille de leurs sous-
unités que de nombre (structure quaternaire).

Quand plusieurs codons traduisent le même acide aminé (le code génétique est dit "dégénéré"),
plusieurs ARNt (chacun avec un anticodon différent) portent le même acide aminé. Il n'existe que
20 aminoacyl-ARNt synthétases (pour les 20 acides aminés les plus fréquemment trouvés dans les
séquences polypeptidiques), donc plusieurs ARNt interagissent avec la même aminoacyl-ARNt
synthétase.

e. Les classes d'aminoacyl-ARNt synthétases

Il existe 2 classes d'aminoacyl-ARNt synthétases :

les aminoacyl-ARNt synthétases de classe I (subdivisée en classes Ia, Ib et Ic)


les aminoacyl-ARNt synthétases de classe II (subdivisée en classes IIa, IIb et IIc)

Différences entre les 2 classes d'aminoacyl-ARNt synthétases

Classe I Classe II
Acides aminés fixés : Arg - Cys - Glu - Gln - Leu - Ile - Acides aminés fixés : His - Pro - Ser - Phe -
Met - Tyr - Trp - Val Thr - Asp - Asn - Lys - Gly - Ala
Le site actif est constitué d'environ 250
Le site actif est constitué d'environ 170 acides aminés
acides aminés et inclue le domaine de
et n'inclue pas le domaine de fixation de l'extrémité 3'
fixation de l'extrémité 3' de l'ARNt (bras
de l'ARNt (bras accepteur CCA)
accepteur CCA)
Le site actif est localisé dans la partie N-terminale de Le site actif est localisé dans la partie C-
ces enzymes terminale de ces enzymes
Le site actif est formé par 1 feuillet β
Le site actif est formé par 5 ou 6 feuillets β parallèles
parallèle et 6 feuillets β anti-parallèles
entourés d'hélices α
entourés d'hélices α
Le site actif est constitué de 3 motifs :
Le site actif est un repliement basé sur un pli le motif 1 (hélice 1 et feuillet 1) est
Rossmann. Elles possèdent les séquences consensus impliqué dans la dimérisation et est
HIGH (début du site actif - 3 feuillets) et KMSKS (fin du toujours situé 50 acides aminés en
site actif - feuillet E) amont du motif 2
motifs 2 & 3 : site catalytique avec
Remarque : seules la première His et Gly sont une Arg totalement conservée
totalement conservées / seule la seconde Lys est (interaction avec l'ATP)
totalement conservée

Ces enzymes fixent les acides aminés volumineux et Ces enzymes fixent les petits acides
encombrants : poche du site de fixation ouverte et aminés : poche du site de fixation
accessible profondément enfouie
Ces enzymes fixent le bras accepteur CCA
Ces enzymes fixent le bras accepteur CCA via le petit
via le grand sillon ("major groove") de
sillon ("minor groove") de l'ARNt
l'ARNt
La structure du bras accepteur CCA reste
La structure du bras accepteur CCA est déformée lors
sous forme d'hélice lors de la fixation de
de la fixation de l'acide aminé
l'acide aminé
Elles attachent l'acide aminé au groupement 2'-
Elles attachent l'acide aminé au
hydroxyle de l'adénosine (dernier nucléotide de l'ARNt -
groupement 3'-hydroxyle de l'adénosine
figures ci-dessus)

f. Activité d'édition de certaines aminoacyl-ARNt synthétases

Les aminoacyl-ARNt synthétases doivent faire le minimum d'erreur dans le choix de l'acide aminé
qu'elles fixent à l'ARNt correspondant. La conséquence serait des protéines non fonctionnelles.

Les propriétés physico-chimiques des chaînes latérales des acides aminés sont suffisamment
différentes pour que les aminoacyl-ARNt synthétases n'aient pas de difficulté à reconnaître l'acide
aminé correct. De plus, différentes parties de chaque ARNt sont utilisées pour optimiser la
reconnaissance. En moyenne, elles font 1 erreur sur 10.000.

Cependant, pour certains acides aminés, cette reconnaissance peut -être difficile. C'est le cas en
particulier de l'isoleucine.

Elle est reconnue par une poche située dans la structure de l'isoleucyl-ARNt synthétase qui a une
forme complémentaire de celle de l'isoleucine. Cette poche est :

trop petite pour accommoder des acides aminés plus volumineux tels que la méthionine ou
la phénylalanine
trop hydrophobe pour fixer des acides aminés avec une chaîne latérale polaire

Mais la valine, acide aminé légèrement plus petit que l'isoleucine (il n'en diffère que par 1 groupe
méthyle), se fixe bien dans cette poche : 1 valine se fixe de manière erronée pour 150 isoleucines,
taux d'erreur qui est bien trop élevé.

Il existe donc une étape correctrice ("proofreading step"): l'isoleucyl-ARNt synthétase possède un
second site actif qui catalyse une réaction d'édition de l'acide aminé fixé. En effet, l'isoleucine ne
peut pas se fixer sur ce second site mais en revanche la valine peut s'y fixer : la liaison valine-ARNt
est hydrolysée et la valine est éliminée.

Cette étape correctrice diminue le taux d'erreur d'un facteur 3.000.


La pyrrolysine et la pyrrolysyl-ARNt synthétase

En 2002, on a découvert que le codon UAG (qui est usuellement un codon stop "ambre") présent
dans le gène de la monométhylamine méthyltransferase de Methanosarcina barkeri (une archée
méthanogènique) code pour un acide aminé modifié : la pyrrolysine (Pyl - O pour le code à 1 lettre).

La pyrrolysine est le 22ème acide aminé protéinogènique (c'est-à-dire qui entre dans la
composition des protéines).

La pyrrolysine se comporte comme un acide aminé "classique" et est chargée directement sur son
ARNt (ARNtPyl) par sa propre aminoacyl-ARNt synthétase : la pyrrolysyl-ARNt synthétase.

Le 21ème acide aminé protéinogènique est la sélénocystéine (Sec - U pour le code à 1 lettre -
codon UGA usuellement codon stop "opale").

La spécificité de reconnaissance de l'acide aminé correct par chaque ARNt est déterminée par un
ensemble de caractéristiques structurales ("identity set"), composé d'un nombre limité de
nucléotides, par exemple ceux de l'anticodon et du bras accepteur.

Dans le cas de l'ARNt-Ala de Escherichia coli, cette spécificité de reconnaissance est liée
uniquement à la seule paire de base G3-U70 située au milieu du bras accepteur.

Source : Naganuma et al. (2014)


Deux structures cristallines de l'alanyl-ARNt synthétase (de l'archée Archaeoglobus fulgidus) ont
été obtenues en 2014 :

La structure de l'alanyl-ARNt synthétase complexée à l'ARNt-Ala G3-U70 (appariement lâche


de type "wobble").
La structure de l'alanyl-ARNt synthétase complexée à l'ARNt-Ala A3-U70 (appariement fort de
type Watson–Crick).

Au sein de la paire G3-U70, G3 est décalée vers le petit sillon et les deux bases subissent une légère
rotation par rapport à la géométrie de type Watson-Crick de A3-U70.

Source : Naganuma et al. (2014)

Le domaine de reconnaissance de l'ARNt de l'alanyl-ARNt synthétase élargit le grand sillon et entre


ainsi en contact avec les deux sillons (petit et grand) du bras accepteur.

La comparaison des structures [alanyl-ARNt synthétase - ARNt-Ala/G3-U70] et [alanyl-ARNt


synthétase - ARNt-Ala/A3-U70] montre que la différence locale de géométrie entre G3-U70 et A3-U70
induit une orientation radicalement différente de la région CCA76, de sorte que l'extrémité 3' de A76
de l'ARNt-Ala/A3-U70 est maintenue éloignée (20 Å) du site actif où a lieu l'aminoacylation.

Ce mécanisme explique comment une différence mineure dans la séquence (G3 vs. A3) est
responsable de la sélection spécifique de l'ARNt-Ala : la différence de fixation du subtrat n'est que
d'un facteur 2 alors que la différence de la constante catalytique (kcat) est d'un facteur 100.

Voir un cours sur les paramètres cinétiques des enzymes.

4. Le noyau et les pores nucléaires

Le noyau est séparé du cytoplasme par une double membrane (externe et interne, espacées de 30
nm). Le contenu du noyau communique avec le cytosol via des pores nucléaires.
Adapté de "Biologie moléculaire de la cellule" Alberts et al. (1983)

Tout l'ADN chromosomique est contenu dans le noyau. L'ADN est super-enroulé et enveloppé dans
des fibres de chromatine associées à des protéines histones.

La synthèse des ARN ribosomiaux a lieu dans le nucléole qui est une structure nucléaire distincte
au sein du noyau. Il est dépourvu de membrane et on peut en trouver plusieurs dans un même
noyau.

La membrane externe est en continuité avec le réticulum endoplamique rugueux.


La membrane interne est associée à un réseau de protéines, la lamina nucléaire (entre la
membrane et la chromatine).

L'enveloppe nucléaire ne peut être franchie qu'au niveau des pores nucléaires (2000 à 4000 par
noyau).

Les pores contrôlent l'état des ARN qui sortent du noyau. Les pores ne laissent entrer dans le
nucléoplasme que les protéines qui possèdent une séquence signal qui les adresse au noyau
("nuclear localisation signal" - NLS). Ce filtrage des protéines est capitale pour la régulation de la
transcription et la régulation de la réplication de l'ADN.

Cette séquence signal est constituée d'acides aminés basiques qui forment des motifs du type
FKKKRKV ou KRFAATKKAGQAKKKK, reconnus par une protéine adaptatrice, l'importine α qui
interagit ensuite avec son récepteur, l'importine β.
Le pore nucléaire est un complexe protéique (une particule) de 1,2 108 Da : il est constitué de : 2
anneaux / 1 réseau central / 8 rayons / 8 filaments coté cytoplasme /8 filaments coté
nucléoplasme qui adoptent une disposition en panier ("basket") /1 anneau distal.

Les protéines et les ARN qui traversent le pore nucléaire se fixent aux filaments. L'essentiel des
protéines qui constituent le pore nucléaire sont des nucléoporines.

Voir un cours sur la composition et la structure des membranes.

5. Les ribosomes

a. Généralités

Les ribosomes sont des complexes ribonucléoprotéiques universels : ils sont présents dans les
cellules des eucaryotes et des procaryotes. Ils ont été découverts en 1955 par George Palade (Prix
Nobel en 1974).

Ils sont localisés dans le cytoplasme. Ches les eucaryotes, ils sont libres ou associés à la
membrane nucléaire ou à la membrane du réticulum endoplasmique.

Le génome de l'homme contient environ 200 gènes (sur 5 chromosomes) codant les ARN
ribosomiques.

Trois des ARN ribosomiques sont transcrits dans les zones fibrillaires du nucléole par l'ARN
polymérase I sous la forme d'un précurseur 35S d'environ 14.000 nucléotides. La séquence de ce
précurseur est hydrolysée en ARN ribosomique 5,8 S, 18 S et 28 S.
Le 4ème ARN ribosomique 5S (codé par un gène différent) est transcrit par l'ARN polymérase III
dans le nucléoplasme.

Les ARN ribosomiques s'associent à des protéines importées dans le nucléole et forment les deux
types de sous unités (petite et grande) des ribosomes. Les ribosomes sont donc des complexes
ribonucléoprotéiques colossaux (300.000 atomes).

Organisme ou
Caractéristiques Petite sous-unité Grande sous-unité
organite

1 ARN
ribosomique
1 ARN 5 S (120
procaryotes
30 ribosomique 21 50 nucléotides) 34
mitochondries 70 S
S 16 S (1540 protéines S 1 ARN protéines
chloroplastes
nucléotides) ribosomique
23 S (2300
nucléotides)

1 ARN
ribosomique
5 S (121
40 60 nucléotides)
S 1 ARN S 1 ARN
eucaryotes 80 S
ribosomique 33 ribosomique 49
(ribosome 1,4 18 S (1869 protéines 2,8
Ø 275 Å 5,8 S (156 protéines
cytoplasmique)
106 nucléotides) 106 nucléotides)
Da Da 1 ARN
ribosomique
28 S (5070
nucléotides)

S est le symbole du Svedberg, unité de mesure du taux de sédimentation (en l'honneur de T.


Svedberg, prix Nobel de chimie en 1926).

"The Rfam database" : base de données des familles d'ARN

b. La biosynthèse et la maturation des ARN ribosomiques

La biosynthèse puis le processus d'assemblage des ribosomes impliquent plus de 200 facteurs
protéiques non ribosomiques appartenant à différentes familles d'enzymes qui utilisent de
l'énergie :

des ARN hélicases ATP-dépendantes (hélicases "DExD/H-box" de la superfamille SF2)


des ATPases de type AAA ("ATPases Associated with diverse cellular Activities" - motifs
Walker A ("P-loop") et Walker B ("DExx-box"))
des GTPases
des kinases (qui ont essentiellement un rôle dans la formation du pré-ribosome 40S)
des transporteurs membranaires de la superfamille "ATP-Binding Cassette" (ABC) qui utilisent
l'énergie de l'hydrolyse de l'ATP (transport actif)
Environ 75 petits ARN nucléolaires ("small nucleolar RNAs" - snoRNAs) sont également requis pour
les modifications chimiques des ARN ribosomiques : 2'O-ribose-méthylation par les "C/D box
snoRNAs" et la pseudo-uridylation par les "H/ACA box snoRNAs".

Le précurseur des sous-unités est un complexe appelé "Small SubUnit processome" ou "SSU
processome" ou pré-ribosome 90S (complexe ribonucléoprotéique de 2.2 106 Da chez les
eucaryotes) qui contient, entre autres, plus de 20 facteurs protéiques non ribosomiques, la
particule sno-RNP ("sno-RiboNucléoProteic particle") U3 et le pré-ARNr 35S.

La biosynthèse des ARN des deux sous-unités ribosomiques débute dans le nucléole, par la
transcription par l'ARN polymérase I du précurseur commun : le pré-ARNr 35S.

Ce précurseur contient les séquences des ARNr mature 18S, 5,8S et 25S :

5' ETS et 3' ETS ("External Transcribed Sequence"). 5' ETS est un site d'hybridation des sno-
ribonucléoprotéines U3.
ITS ("Internal Transcribed Spacer") : ARN non fonctionnel entre les ARN ribosomiques
structuraux.

Figure ci-dessus : maturation du pré-ARNr 35S chez la levure (eucaryotes)

Sous-unité 40S

Dans le nucléole, le pré-ARNr 35S est clivé aux sites A0, A1, A2 formant le pré-ARNr 20S.
Il est exporté dans le cytoplasme. Il est clivé au site D par Nob1, formant l'ARNr mature 18S
qui entre dans la composition de la sous-unité 40S.

Sous-unité 60S

Dans le nucléole, le pré-ARNr 35S est clivé aux sites A2 et B2 formant le pré-ARNr 27SA2.
Soit il y a un clivage au site A3 par Nop4 : il y a formation du pré-ARNr 27SA3. Ce dernier est
clivé par les 5'-3' exo-ribonucléases Rat1, Rrp17 et Xrn1, formant le pré-ARNr 27SB1S, en
présence de Nop12, Nop7, Nop15 et Erb1.
Soit il y a un clivage au site B1L par Nop4 : il y a formation du pré-ARNr 27SB1L.
Les deux pré-ARNr 27SB sont ensuite clivés aux sites C1 et C2 formant le pré-ARNr 7S qui
subit un clivage exo-nucléolytique et un clivage endo-nucléolytique par Rrp6 et Rrp44 (2
composants de l'exosome).
Les pré-ARNr 5,8SS et 5,8SL sont exportés dans le cytoplasme et clivés par Ngl2.
Les ARNr matures 5,8S et 25S entrent dans la composition de la sous-unité 60S.

c. Assemblage des sous-unités ribosomiques

Les 2 types de sous-unités quittent séparément le nucléole et ensuite le noyau via les pores
nucléaires.

L'assemblage des 2 types de sous-unités est effectué dans le cytoplasme. Les ribosomes ne
peuvent pas revenir dans le noyau évitant ainsi toute synthèse protéique dans celui-ci.

Source figures : "Principes de Biochimie" Horton et al. (1994)

Figure ci-dessous : modèle de l'ARN de la grande sous-unité du ribosome.

Source : Armache et al. (2010)


Ce modèle est basé sur la carte électronique obtenue par cryomicroscopie électronique (à une
résolution de 5.5 Å) du ribosome 80S de Triticum aestivum en cours de traduction.

Voir 2 articles capitaux qui ont décrit la structure 3D des ribosomes et leur mode de
fonctionnement : Ban et al. (2000); Nissen et al. (2000).

Ensuite, les ribosomes sont :

associés à l'enveloppe nucléaire


sous forme libre dans le cytoplasme
associés à la membrane du réticulum endoplasmique (RE rugueux)
dans les mitochondries et certains plastes (ils traduisent les ARN messagers transcrits à
partir de l'ADN mitochondrial et chloroplastique) et leur structure ressemble aux ribosomes
des procaryotes
associés à la membrane interne de certaines bactéries (exemple : Escherichia coli)

La fonction des ribosomes est de synthétiser les protéines en décodant l'information contenue
dans les ARN messagers : c'est la traduction.

La petite sous-unité fixe l'ARN messager et la grande sous-unité fixe les ARN de transfert. Quand la
traduction est terminée, les deux sous-unités se dissocient.

Plusieurs ribosomes peuvent être associés à un même ARNm et chacun de ces ribosomes
synthètise une chaîne polypeptidique (photographie ci-dessous). Ces groupes de ribosomes sont
appelés polyribosomes.

Source : "Role of the Ribosome" University of Texas

Voir une trés belle animation du processus. (Source : Alberts et al., "Essential Cell Biology" (Second
Edition) - Ed. Garland Science Publishing)

6. La traduction

La traduction suit un ordre précis d'événements : initiation, élongation et terminaison de la


traduction. La traduction est un processus cyclique au cours duquel la terminaison suit l'élongation
qui elle-même suit l'initiation et ainsi de suite. Les sous-unités du ribosome sont dissociées à la fin
de la terminaison avant qu'un nouveau cycle ait lieu.

Ces événements requièrent un très grand nombre de protéines appelés facteurs.

La synthèse peptidique s'effectue de l'extrémité N-terminale vers l'extrémité C-terminale de la


chaîne polypeptidique : l'élongation s'effectue par addition séquentielle d'un acide aminé à
l'extrémité C-terminale de la chaîne polypeptidique liée au ribosome.

Figure ci-dessous : ensemble des processus de synthèse, de maturation et de dégradation des


ARNm chez Saccharomyces cerevisiae. Cette vision d'ensemble résulte de l'analyse par
apprentissage profond ("deep-learning") de plus de 100.000 séquences de gènes et des produits de
transcription de plus de 20.000 expériences RNA-seq de 7 organismes modèles (dont Homo
sapiens et Saccharomyces cerevisiae).

UTR : "UnTranslated Regions" - région non traduite; ORF : "Open Reading Frame" - phase de lecture
ouverte; CDS : "CoDing Sequence" - séquence codante; TFBS : "Transcription Factor Binding sites" -
site de fixation du facteur de transcription.

Source : Zrimec et al. (2020)

a. Initiation de la traduction

L'initiation de la traduction chez les procaryotes et les eucaryotes requiert un ARNt initiateur
particulier : le Met-ARNtiMet utilisé pour incorporer le résidu méthionine initial de toutes les
protéines.

Chez Escherichia coli, une forme spécifique de Met-ARNtiMet est nécessaire pour l'initiation : le N-
formylméthionine-ARNtifmet (fMet-ARNtifMet). La formylation s'effectue après que la méthionine
soit attachée à l'ARNt. Elle est catalysée par la methionyl-ARNt formyltransférase (E.C. 2.1.2.9):
10-formyltétrahydrofolate + Met-ARNtifMet => tétrahydrofolate + fMet-ARNtifMet

Le Met-ARNtiMet et le fMet-ARNtifMet reconnaissent le même codon d'initiation : 5'-AUG-3'.

Dans les ARN polycistroniques des procaryotes, le codon AUG est adjacent à un élément Shine-
Dalgarno. Cet élément est reconnu par complémentarité de séquences dans l'ARNr 16S de la petite
sous-unité.

Facteurs d'initiation de la traduction chez les eucaryotes et leurs fonctions

Sélection du site d'initiation


eIF-1 Repositionnement du met-ARNt pour faciliter la fixation de
l'ARNm

Formation d'un complexe ternaire : [eIF2-GTP-Met-


eIF-2 (protéine G) ARNtiMet]
Fixation à la sous-unité 40S ribosome

eIF-2B ou GEF ("Guanine


Nucleotide Exchange Factor") : 5 Echange GTP/GDP pendant le recylcage de eIF-2
sous-unités (α à ε)
eIF-3 (13 sous-unités : eIF-3A à
Empêche l'association des sous-unités du ribosome en se
eIF-3M / chez l'homme : p170,
fixant à la sous-unité 40S
p116, p110, ...)
eIF-4F : complexe d'initiation
composé de 3 sous-unités (eIF- Fixation de l'ARNm à la sous-unité 40S
4E, eIF-4A et eIF-4G) et d'au moins Activité hélicase ARN-ATPase-dépendante
2 facteurs additionnels (PABP, Interaction entre la coiffe et la queue poly-adénylée
Mnk1 ou Mnk2)
Se fixe à la queue poly-A des ARNm et fournit un site de fixation
PABP ("PolyA-Binding Protein")
à eIF-4G
MAP-kinases : phosphorylent eIF-4E ce qui accroit son
Mnk1 et Mnk2 : eIF-4E kinases
association avec la coiffe
Hélicase d'ARN ATPase-dépendante - "DEAD box helicase
eIF-4A
family"

Reconnaissance de l'extrémité m7GpppG-5' de la coiffe


eIF-4E Facilite la fixation du ribosome en déroulant les structures
secondaires de l'ARNm

La forme déphosphorylée de 4E-BP se fixe sur eIF-4E et


empêche son association avec eIF-4F
eIF4E-BP1 (ou 4E-BP ou PHAS-I),
4E-BP est phosphorylé en réponse à des stimuli ce qui
eIF4E-BP2 et eIF4E-BP3
entraîne la libération de eIF-4E et un accroissement de
l'initiation de la traduction

Echafaudage pour l'assemblage du complexe eIF-4F et


celui de eIF-4A
eIF-4G
Son interaction avec PABP permet aux extrémité 5' et 3'
des ARNm d'interagir
eIF-4B Fonctionne en étroite association avec eIF-4A et eIF-4F
Se fixe près de l'extrémité 5' de l'ARNm (coiffe) en
présence de eIF-4F et d'ATP : stimule l'activité hélicase
ARN ATPase-dépendante de eIF-4A et eIF-4F

Relarguage de eIF-2 et eIF-3


eIF-5 (GTPase) Catalyse l'hydrolyse du GTP lié au complexe d'initiation
40S : [40S-ARNm-Met-ARNtiMet-eIF-2-GTP]

Se fixe à la sous-unité 60S et empêche son association avec la


eIF-6 sous-unités 40S du ribosome (le complexe d'initiation 80S n'est
pas formé)

Figure ci-dessous : les toutes premières étapes de l'initiation de la traduction.

S'ensuivent :

l'inspection de l'ARNm de l'extrémité 5' vers 3'


la reconnaissance du codon d'initiation
l'hydrolyse du GTP (fixé à eIF-2) en GDP
la formation du complexe d'initiation 48S
la fixation de la sous-unité 60S + [eIF-5B - GTP]
le relarguage de eIF-1, [eIF-2-GDP], eIF-3 et eIF-5
l'hydrolyse du GTP (fixé à eIF-5B) en GDP
le relarguage de eIF-1A et eIF-5B
la formation du complexe d'initiation 80S avec le codon AUG dans le site P

Pour plus de détails, voir la figure 1 de la revue Jackson et al. (2010).


Figure ci-dessous : modèle d'une sous-unité 40S avec eIF-3 (magenta) fixé sur sa surface exposée
au solvant et eIF-4G (pourpre) attaché à eIF-3 près du site E. L'ARNm est en rouge et eIF-1 est en
vert.

5'm7G : reconnaissance de l'extrémité m7GpppG-5' de la coiffe.

Source : Jackson et al. (2010)

Le site A ou Aminoacyl est le site du ribosome le plus fréquemment occupé par l'aminoacyl-ARNt.
Dans le site A, l'aminoacyl-ARNt fonctionne comme accepteur lors de la formation de la liaison
peptidique.

Le site P ou Peptidyl est le site du ribosome le plus fréquemment occupé par le peptidyl-ARNt,
c'est-à-dire l'ARNt qui porte la chaîne polypeptidique en croissance. Le site P est aussi appelé le
site sensible à la puromycine, un antibiotique qui a des similitudes structurales avec une partie de
l'aminoacyl-ARNt. Quand la puromycine se trouve au site A, elle peut former une liaison peptidique
avec la chaîne polypeptidique en croissance.

Le site E ou Exit est le site du ribosome occupé par l'ARNt qui part du ribosome.
b. Elongation de la traduction

L'élongation nécessitent des facteurs d'élongation :

EF-Tu (appelé aussi EF1A ou EF1-α) : responsable de la sélection et de la liaison de


l'aminoacyl-ARNt apparenté au site A (site accepteur) du ribosome.
EF-Ts (ou EF1B ou EF1-β/γ/δ) : facteur d'échange de nucléotides qui régénère EF1A de sa
forme inactive (EF1A-GDP) en sa forme active (EF1A-GTP). EF-Ts est plus complexe chez les
eucaryotes que chez les bactéries.
EF2 (ou EF-G) : responsable de la translocation du peptidyl-ARNt du site A au site P (site
peptidyl-ARNt), libérant ainsi le site A pour l'aminoacyl-ARNt suivant.

EF-Tu et EF2 sont des petites protéines fixant le GTP ("small GTP-binding proteins").

Etape 1 : décodage

EF-Tu-GTP se fixe et délivre un aminoacyl-ARNt au site A du ribosome. EF-Tu reconnaît et fixe tous
les aminoacyl-ARNt avec à peu près la même affinité (quand chaque ARNt est lié à l'acide aminé
correct).

L'ARNt doit avoir l'anticodon correct pour interagir avec le codon de l'ARNm positionné sur le site A
pour établir une paire de bases avec la bonne géométrie. Les bases universellement conservées de
l'ARNr 16S (chez les procaryotes) interagissent avec et imprime la configuration du petit sillon
("minor groove") de la courte portion de double hélice formée par les 2 premières paires de bases
du complexe [codon/anticodon].

Une conformation particulière du ribosome est stabilisée par cette interaction, ce qui fournit un
mécanisme pour détecter si l'ARNt lié est correct. La relecture - correction (activité "proofreading")
implique en partie la libération de l'aminoacyl-ARNt avant la formation de la liaison peptidique, si la
conformation du ribosome générée par cette interaction n'est pas correcte.

Le changement de conformation du ribosome qui résulte de la formation du complexe [codon-


anticodon] correct entraîne un changement de conformation du site actif de EF-Tu fixé ce qui induit
l'apparition de son activité GTPase.

Quand EF-Tu délivre l'aminoacyl-ARNt au ribosome, l'ARNt possède initialement une conformation
déformée. Quand le GTP fixé sur EF-Tu est hydrolysé en [GDP + Pi], EF-Tu subit un grand
changement de conformation et se dissocie du complexe. La conformation de l'ARNt se relâche et
le bras accepteur est repositionnée pour favoriser la formation de la liaison peptidique. Ce
processus s'appelle l'accomodation.

L'accomodation inclue la rotation de l'extrémité 3' simple brin du bras accepteur de l'ARNt au site A
autour d'un axe qui traverse le centre peptidyl transférase de la grande sous-unité du ribosome.
Ceci positionne l'extrémité 3' avec son acide aminé attaché dans le site actif près de l'extrémité 3'
de l'ARNt au site P, et près de l'embouchure du tunnel par lequel le polypeptide naissant quitte le
ribosome.

Voir un site extrêmement détaillé sur ce processus.

L'interaction de EF-Ts avec EF-Tu libère le GDP de EF-Tu. Après dissociation de EF-Ts, EF-Tu fixe de
nouveau le GTP présent dans le cytosol à une concentration plus élevée que le GDP.

Etape 2 : formation de la liaison peptidique

La transpeptidation ou formation de la liaison peptidique implique une attaque nucléophile du


groupement aminé de l'acide aminé lié au groupement hydroxyle en 3' de l'adénosine terminale de
l'ARNt au site A sur le groupement carbonyle de l'acide aminé (auquel est attaché le polypeptide
naissant) lié par une liaison ester à l'ARNt au site P.

La formation de la liaison peptidique est catalysée par le ribosome lui-même : elle est favorisée par
la géométrie du "site actif" de l'ARNr 23S (chez les procaryotes) de la grande sous-unité
ribosomique.

L'ARNr 23S peut être considéré comme un ribozyme à activité peptidyl transférase.
Etape 3 : translocation

Le ribosome déplace un codon vers l'avant sur l'ARNm. Le codon suivant de l'ARNm est disponible
pour l'interaction avec un nouvel aminaoacyl-ARNt au site A.

Simultanément, l'ARNt "vide" est décalé du site P vers le site E et le peptidyl-ARNt est transloqué du
site A au site P. Le processus est facilité par le facteur d'élongation EF2 et le GTP.

c. Terminaison de la traduction

Ces étapes sont répétées jusqu'à ce que le ribosome rencontre un codon STOP dans le cadre de
lecture: UAG, UAA ou UGA. La traduction se termine quand l'un de ces codons occupe le site A.

Les codons STOP n'ont aucun ARNt correspondant. Au lieu de cela, les codons STOP sont
reconnus par la protéine RF1 ("Releasing Factor 1" - facteur de libération 1) ou eRF chez les
eucaryotes (il y a 2 facteurs de terminaison chez les procaryotes et un seul chez les eucaryotes).
L'activité de RF1 est stimulée par RF3 (une protéine fixant le GTP).

Le complexe [RF1 / RF3] se lie aux ribosomes qui ont un codon STOP au site A : il stimule le
clivage de la liaison ester entre le peptide et le peptidyl-ARNt, libérant ainsi la nouvelle protéine du
ribosome. Les facteurs sont libérés du ribosome après hydrolyse du GTP.

Le ribosome commence un nouveau cycle de traduction sur le même ARNm dans la plupart des
cas.

Quelques antibiotiques et toxines inhibiteurs de la traduction

Chloramphénicol Inhibe l'activité peptidyl transférase chez les procaryotes

Cycloheximide Inhibe l'activité peptidyl transférase chez les eucaryotes


Streptomycine / Inhibent l'initiation de la chaîne peptidique chez les procaryotes et induisent
Néomycine des erreurs de lecture des ARNm
Tétracycline Inhibe la liaison de l'aminoacyl-ARNt à la petite sous-unité du ribosome
Inhibe la translocation via la grande sous-unité du ribosome chez les
Erythromycine
procaryotes
Similaire à l'érythromycine en empêchant la dissociation de EFG de la grande
Acide fusidique
sous-unité du ribosome
Ressemble à un aminoacyl-ARNt : elle interfère avec le transfert de peptide
Puromycine entraînant une interruption prématurée de la terminaison chez les procaryotes
et les eucaryotes
Ricine (trouvée
Catalyse le clivage des ARNr de la grande sous-unité du ribosome chez les
dans les graines
eucaryotes
de ricin)
Protéine de Corynebacterium diphtheriae qui provoque la diphtérie : elle catalyse
l'ADP-ribosylation et l'inactivation de EF2
EF2 contient une histidine modifiée appelée diphthamide qui est la cible de la
toxine

Toxine
diphthérique

Voir un cours sur les métabolites secondaires.

Récemment, 16 structures cristallographiques de ribosomes 80S de Saccharomyces cerevisiae,


complexés avec 12 inhibiteurs spécifiques des eucaryotes et 4 inhibiteurs à large spectre, ont été
déterminées.

Tous les inhibiteurs étudiés se fixent exclusivement sur les sites de fixation de l'ARNm et de
l'ARNt des deux sous-unités.
Cette étude fournit un modèle d'action de la cycloheximide et de la lactimidomycine
(inhibiteur glutarimide - fixation sur le site E) et explique pourquoi la lactimidomycine affecte
particulièrement le premier cycle d'élongation.

Le schéma ci-dessous montre les étapes de la synthèse des protéines chez les Eukaryotes
inhibées par les petits inhibiteurs.
Source : Garreau de Loubresse et al. (2014)

7. Le réticulum endoplasmique (RE)

C'est une extension de la membrane du noyau. Le RE est divisé en RE lisse et RE rugueux (sa
surface est couverte de ribosomes), en fonction de son apparence au microscope.

La synthèse des protéines destinées à être modifiées par glycosylation et/ou sécrétées a lieu
dans le RE rugueux.
La synthèse des lipides a lieu dans le RE lisse.
Le stockage du calcium intracellulaire est une autre fonction assurée par le RE des muscles
striés.

Source : "L'organisation structurale de la cellule"

Lors de leur biosynthèse, environ un tiers des protéines d'une cellule sont dirigées vers le RE pour y
être repliées, y subir un contrôle de leur repliement correct et des maturations diverses.

Voir la réponse au stress lié à l'accumulation de protéines mal repliées dans le réticulum
endoplasmique : "Unfolded protein response" (UPR).

Voici quelques exemples de protéines acheminées vers le RE :

composants de la membrane externe : canaux ioniques, transporteurs, molécules


d'adhérence, récepteurs membranaires,…
composants de la matrice extracellulaire : protéoglycanes, fibronectines, laminine,
collagènes, protéases, …
hormones peptidiques : insuline
protéines du plasma sanguin : albumine, immunoglobulines, facteurs du complément,
facteurs de coagulation, fibrine, lipoprotéines, protéine C, …
facteurs de croissance impliqués dans la prolifération cellulaire
facteurs impliqués dans l'inflammation et la réponse immunitaire (interleukines)
composants des lysosomes : cathepsines, lipases, phospholipases, nucléases, glycosidases.
les protéines dites "chaperonnes" qui aident au repliement certaines protéines nouvellement
synthétisées
les enzymes des modifications post-traductionnelles : formation de ponts disulfure,
glycosylation (glysolyltransférases, glycosidases et protéines de transport nucléotide–
glucide)
les enzymes de protéolyse partielle (furines)
les récepteurs impliqués dans l'adressage des protéines aux différents compartiments sub-
cellulaires (récepteur du mannoside–6 phosphate, Sec24, récepteur KDEL, ....)

8. Le canal de translocation des protéines ou translocon

Le transit des protéines dans le réticulum endoplasmique s'effectue via un transporteur, situé dans
la membrane du RE, appelé canal de translocation des protéines ("Protein Conducting Channel" -
PCC) ou translocon (eucaryotes).

Source : Rapoport T.A. (2007)

Figure ci-dessus : structure 3D de SecYEG (PDB 2AKI)


Il est constitué de plusieurs protéines qui forment un pore (d'environ 4 nm de diamètre) qui permet
le passage de la chaîne polypeptidique en cours de biosynthèse, du ribosome vers la lumière du
RE.

Le canal de translocation est constitué de SecY ou Sec61α (selon le règne) qui est la sous-unité
principale avec 10 domaines transmembranaires et de plus petites sous-unités localisées en
périphérie de ce canal.

procaryotes : SecYEG/SecA/SecD-SecF
Archea : SecYEβ/SecD-SecF
eucaryotes : Sec61αβγ/Sec62,63

Les nomenclatures des sous-unités sont les suivantes :

SecYEG (SecY, SecE et SecG) : complexe hétérotrimérique de protéines membranaires


intégrales chez les procaryotes
Sec61αβγ : idem chez les eucaryotes
SecA : ATPase localisée du côté cytoplasmique, "moteur" énergétique du transfert des
chaînes polypeptidiques
SecB : protéine chaperonne
SecD et SecF : deux protéines membranaires qui relarguent la chaîne polypeptidique mature
dans le périplasme.

Figure ci-dessous : reconstruction du complexe [ribosome - chaîne polypeptidique en cours de


biosynthèse - translocon]. Les données structurales ont été obtenue par cryo-microscopie
électronique.

Source : Equipe Schaffitzel - EMBL

La sous-unité 30S est en jaune et la sous-unité 50S est en bleu clair.


Les sites ARN transfert A, P et E sont en magenta, vert et orange respectivement (au centre
de l'image).
L'ARNm est en cyan.
La chaîne polypeptidique en cours de biosynthèse au sortir du tunnel est en vert.
Le translocon actif à l'extrémité du tunnel est en bleu foncé.
Un second translocon, non-transloquant, fixé à l'ARNm est en rouge.
Visualisation du
canal de
translocation
des protéines de
Escherichia coli
obtenue par
cryo-
microscopie
électronique à
une résolution
de 14,9 Å (2005)

Code PDB : 2AKI

2 chaînes
"Protein-
export
membrane
protein
secG" : en
jaune et en
bleu
2 chaînes
"Preprotein
translocase
secY
subunit" :
en rouge et
en rose
2 chaînes Rotation
"Preprotein
translocase
secE
subunit" :
en orange
et en
magenta

Certaines chaînes polypeptidiques commencent par une séquence appelée peptide signal qui
indique à la cellule le compartiment vers lequel les adresser.

Chez les eucaryotes, un complexe ribonucléoprotéique [ARN 7S / 6 polypeptides] appelé "particule


de reconnaissance du signal" ("signal recognition particle" - SRP) se fixe au peptide signal qui
émerge du ribosome.

Il ralentit l'élongation de la chaîne polypeptidique en cours de biosynthèse ("elongation


arrest").
Le SRP se fixe au récepteur du SRP.
La chaîne polypeptidique en cours d'élongation emprunte le canal pour passer entièrement dans la
lumière du RE (dans le cas d'une protéine sécrétée, dirigée vers l'appareil de Golgi) ou pour être
intégrée à la membrane (dans le cas d'une protéine membranaire). Il s'agit donc d'un transport co-
traductionnel puisque l'élongation de la chaîne polypeptidique continue pendant le passage dans le
RE.

Le cycle SRP est un processus dont l'énergie est fournie par l'hydrolyse du GTP : le SRP et le
récepteur du SRP possèdent une acticité GTPase.

La chaîne polypeptidique transportée doit contenir au moins 70 acides aminés pour entrer : 40
acides aminés se trouvent au niveau du ribosome et 30 acides aminés sont dans le canal de
translocation.

Ce pore fonctionne dans l'autre sens pour éliminer les protéines mal repliées : c'est le transport
rétrograde.

Voir un cours sur les mécanismes de transport membranaires.

9. Quelques notions sur le code génétique et les codons

Le code génétique a été élucidé au cours des années 1960-1965.

Le code génétique est universel :

Il est le même dans tous les organismes aussi bien chez les eucaryotes que chez les
procaryotes.
Il existe des exceptions en particulier en ce qui concerne l'ADN des mitochondries humaines.

Il correspond à un ensemble d'entités structurales nucléotidiques appelés codons. Le codon


génétique correspond à l'enchaînement ordonné de 3 bases nucléotidiques (ou triplet) permettant
de définir le code d'un acide aminé.

Il existe 4 nucléotides dans l'ARN messager : U, C, A et G. Il y a donc 43 = 64 codons différents pour


définir l'ensemble des 20 acides aminés utilisés dans la synthèse des protéines. Le code génétique
est dit redondant ou dégénéré.

Le codon AUG code une méthionine : ce codon initie la traduction de toutes les chaînes
polypeptidiques. Il code aussi toute méthionine interne à la chaîne polypeptidique.

Trois codons (UAA, UAG, UGA) sont des codons qui ne peuvent pas être traduits en acides aminés :
ce sont des codons appelés non sens ou STOP. Leur rôle est d'arrêter la traduction.

nombre de
1 2 3 4 6
codons
Met & initiation - Lys - Asn - Gln - His - Glu Thr - Pro - Ala - Arg - Ser -
acide aminé Ile - STOP
Trp - Asp - Tyr - Cys - Phe Gly - Val Leu

2ème position
1ère 3ème
position position
U C A G

UUU UCU UAU UGU U


phenylalanine tyrosine cystéine
UUC UCC UAC UGC C
U sérine
UUA UCA UAA UGA STOP A
STOP
UUG UCG UAG UGG tryptophane G

CUU CCU CAU CGU U


leucine histidine
CUC CCC CAC CGC C
C proline arginine
CUA CCA CAA CGA A
glutamine
CUG CCG CAG CGG G

AUU ACU AAU AGU U


asparagine sérine
AUC isoleucine ACC AAC AGC C

A AUA ACA thréonine AAA AGA A

méthionine lysine arginine


AUG codon ACG AAG AGG G
initiation

GUU GCU GAU GGU U


aspartate
GUC GCC GAC GGC C
G valine alanine glycine
GUA GCA GAA GGA A
glutamate
GUG GCG GAG GGG G
Résultats du séquençage du génome humain

Pour chacun des 64 codons, sont montrés sur la figure ci-dessous :

Source : Lander et al. (2001)

l'acide aminé correspondant


la fréquence observée du codon considéré pour 10.000 codons employés
le codon
lignes noires : la prédiction d'appariement à l'anticodon porté par l'ARN de transfert. Règle du
"wobble" (ou "appariement bancal") - variabilité du 3è nucléotide du codon : un même ARNt
peut reconnaître plusieurs codons synonymes
une séquence non modifiée de l'anticodon
le nombre de gènes codant pour l'ARN de transfert trouvés pour cet anticodon

Exemple de la phénylalanine (Phe)

La fréquence de codage de cet acide aminé par les codons UUU et UUC est respectivement
de 171 et de 203 pour 10.000 codons.
Les 2 codons semblent décodés par un unique anticodon GAA qui utilise une règle du
"wobble" G/U.
14 gènes codant pour l'ARN de transfert ont été trouvés pour cet anticodon GAA.

Voir un cours sur les méthodes de séquençage de l'ADN et de l'ARN.

12. Liens Internet et références bibliographiques

"Principes de Biochimie" Horton, Moran, Ochs, Rawn et Scrimgeour (1994) - Ed. DeBoeck
Universités - ISBN : 2-8041-1578-X
Roger D. Kornberg - "The Molecular Basis of Eukaryotic Transcription" - Nobel Lecture
(2006) - Cell Death & Differentiation 14, 1989 - 1997
Article
Roger D. Kornberg - Prix Nobel de chimie 2006
Aller au site
Wang et al. (1979) "Molecular structure of a left-handed double helical DNA
Article
fragment at atomic resolution" Nature 282, 680 - 686
Article
He et al. (2013) "Structural visualization of key steps in human transcription initiation"
Nature 495, 481 - 486

Schaller et al. (1975) "Nucleotide sequence of an RNA polymerase binding site from
the DNA of bacteriophage fd" PNAS 72, 737 - 741
Article
Pribnow D. (1975) "Nucleotide sequence of an RNA polymerase binding site at an
early T7 promoter" PNAS 72, 784 - 788 Article

Burmann & Rösch (2011) "The role of E. coli Nus-factors in transcription regulation Article
and transcription:translation coupling. From structure to mechanism" Transcription 2,
130 - 134

Sarkar N. (1997) "Polyadenylation of mRNA in prokaryotes" Annual Rev. Biochem. 66,


173-197
Article
Cheng et al. (2005) "Transcriptional maps of 10 human chromosomes at 5-nucleotide
resolution" Science 308, 1149 - 1154 Article

Phizicky & Hopper (2010) "tRNA biology charges to the front" Genes Dev. 24, 1832 - Article
1860
Article
Goldman et al. (2013) "Towards practical, high-capacity, low-maintenance information
storage in synthesized DNA" Nature 494, 77 - 80

Bashkirov et al. (1997) "A mouse cytoplasmic exoribonuclease (mXRN1p) with


preference for G4 tetraplex substrates" J. Cell Biol. 136, 761 - 773
Article
Eulalio et al. (2007) "P bodies: at the crossroads of post-transcriptional pathways"
Article
Nature Rev. Mol. Cell Biol. 8, 9 - 22
Article
Parker, R. (2012) "RNA Degradation in Saccharomyces cerevisae" Genetics 191, 671 -
702

"Ribosome - Reference pathway" : document interactif qui décrit l'ensemble des ARN KEGG
et des protéines ribosomales eucaryotes et procaryotes.
Aller au site
"EMDataBank : The Unified Data Resource for 3-Dimensional Electron Microscopy"
Aller au site
"Overview and Structure of Aminoacyl-tRNA Synthetases"
Aller au site
"tRNA & Ribosomes"
Article
Fekner & Chan (2011) "The pyrrolysine translational machinery as a genetic-code
expansion tool" Curr. Opin. Chem. Biol. 15, 387 - 391
Un excellent descriptif des pores nucléaires et des complexes nucléoporines : "The
nuclear pore complex becomes alive: new insights into its dynamics and involvement
Aller au site
in different cellular processes"
Article
Alves & Doye (2003) "Assemblage des pores nucléaires en fin de mitose" M/S :
médecine sciences 19, 1193 - 1194

Ban et al. (2000) "The Complete Atomic Structure of the Large Ribosomal Subunit at
2.4 Å Resolution" Science 289, 905 -920
Article
Nissen et al. (2000) "The Structural Basis of Ribosome Activity in Peptide Bond
Synthesis" Science 289, 920 -930 Article

Rapoport T.A. (2007) "Protein translocation across the eukaryotic endoplasmic Article
reticulum and bacterial plasma membranes" Nature 450, 663 - 669
Article
Armache et al. (2010) "Localization of eukaryote-specific ribosomal proteins in a 5.5-
Å cryo-EM map of the 80S eukaryotic ribosome" PNAS 107, 19754 - 19759

Lander et al. (2001) "Initial sequencing and analysis of the human genome" Nature
409, 860 - 921
Article
Jackson et al. (2010) "The mechanism of eukaryotic translation initiation and
principles of its regulation" Nat. Rev. Mol. Cell Biol. 11, 113 - 127 Article

Garreau de Loubresse et al. (2014) "Structural basis for the inhibition of the Article
eukaryotic ribosome" Nature 513, 517 - 522
Article
Hofer & Jaschke (2016) "Molecular biology: A surprise beginning for RNA" Nature
535, 359 - 360

Kelleher et al. (1990) "A novel mediator between activator proteins and the RNA
polymerase II transcription apparatus" Cell 29, 1209 - 1215
Article
Allen & Taatjes (2015) "The Mediator complex: a central integrator of transcription"
Article
Nat. Rev. Mol. Cell Biol. 16, 155 - 166
Article
Nozawa et al. (2017) "Core Mediator structure at 3.4 Å extends model of transcription
initiation complex" Nature doi:10.1038/nature22328

Kim et al. (2018) "Integrative Structure and Functional Anatomy of a Nuclear Pore Article
Complex" Nature 555, 475 - 482
Article
Amin et al. (2019) "Evaluation of deep learning in non-coding RNA classification"
Nat. Machine Intell. 1 246 - 256 Article

Diemer et al. (2020) "A cysteine selenosulfide redox switch for protein chemical Article
synthesis" Nat. Commun. 11, 2558
Article
Zrimec et al. (2020) "Deep learning suggests that gene expression is encoded in all
parts of a co-evolving interacting gene regulatory structure" Nat. Commun. 11, 6141
Passmore & Coller (2021) "Roles of mRNA poly(A) tails in regulation of eukaryotic
gene expression" Nat. Rev. Mol. Cell Biol. doi: 10.1038/s41580-021-00417-y

Vous aimerez peut-être aussi