Vous êtes sur la page 1sur 92

Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Introduction
Il existe différents principes de vie qui régissent notre vision du vivant.

La Cellule

La cellule est l’unité fondamentale du vivant. La théorie cellulaire est le premier pilier de notre vision
du vivant. Schleiden parle de vitalisme, Schwann décrit les cellules du système nerveux périphérique
et invente le métabolisme. Aujourd’hui, on pense qu’il n’y a pas de force vitale mais que les cellules,
et donc les organismes, obéissent aux lois de la physique et de la chimie.

Virchow va apporter une nouvelle vision à la théorie cellulaire, en reprenant la formule « Omnis
cellula e cellula » (chaque cellule est produite par une autre cellule), en portant sa contribution de
dire que la maladie atteint un organisme et résulte de l’altération d’une cellule. Etant politicien, il a
mené une politique de santé préventive, en développant les égouts et l’eau potable.

La théorie de l’évolution est le deuxième pilier de la biologie évolutive. Darwin se base sur
l’observation d’organismes, la géologie et les fossiles pour éditer sa théorie. L’apparition de variantes
au cours de l’évolution existe, et les mutants sont sélectionnés par l’environnement, il s’agit de la
sélection naturelle. Un ancêtre commun est à l’origine du vivant. Les variations d’espèces reposent
sur les séquences d’acide nucléique, d’ADN ou encore d’ARN. La bioinformatique, qui permet de
comparer les séquences, contribue à la découverte de nouvelles classes d’organismes, les archées.

L’ARN ribosomal est présent dans toutes les cellules, il est apparu avant l’ADN et était présent chez
l’ancêtre commun. Plus le nombre de nucléotides est différent, plus les espèces sont éloignées.

La membrane cellulaire

La membrane sépare deux compartiments aqueux, elle est constituée de phospholipides, un côté
hydrophile (groupe phosphate) et un côté hydrophobe (la chaine aliphatique, composée de carbone
et d’hydrogène). Les membranes biologiques sont en forme de bicouche, avec les têtes hydrophiles à
l’extérieur, et les queues hydrophobes à l’intérieur.

1
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Les membranes ne sont pas complètement étanches, car il est impossible de vivre sans échanges.
Ainsi, la bicouche est une sorte de mer liquide où flottent les protéines, les protéines ayant le rôle du
transfert d’ions. Les protéines membranaires ont plusieurs fonctions : les canaux laissent passer les
ions selon le gradient de concentration, les pompes transportent les nutriments en utilisant de l’ATP.
Elles ont également le rôle de
résistance aux antibiotiques ou
aux agents de chimiothérapie.
Elles peuvent également servir à
la reconnaissance de molécules
(CPA, lymphocytes B ou T) et
peuvent être des marqueurs du
soi. Elles peuvent également avoir
la fonction d’adhésion tissulaire,
participant à la solidité de
l’accrochage des tissus. Les
protéines de membrane sont
d’une importance fondamentale,
une grande partie de notre génome code pour les protéines membranaires.

Hérédité

Le troisième pilier de la vie est la théorie de l’hérédité, qui étudie les facteurs de transmission des
gênes et des phénotypes. Mendel a étudié les caractères communs avec des caractères continus et
stables. Il invente ainsi le terme de phénotype. Il définit
également le génotype (ou gènes), qui reste une notion
abstraite. Grace aux propriétés des croisements, il développe
les notions de gène, d’allèle, et de cellule germinale. Le type
sauvage est défini arbitrairement. La plupart des descendants
sont identiques aux parents (s’ils sont homozygotes). Certains
individus sont différents, ils ont des caractères mutants, qui
sont stables dans le temps, car ils sont générés par un
changement de la séquence d’ADN. Ces mutations peuvent
être spontanées (erreur de réplication) ou induites par des
mutagènes (rayons X, rayons UV, …).

2
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Il y a deux types de caractère : le type sauvage, qui est l’organisme de référence choisi
arbitrairement, mais n’a pas de valeur intrinsèque. Il y a aussi le type mutant, qui représente une
variance, rare, ayant un phénotype stable dans le temps. Ces caractères mutants sont induits par un
changement de la séquence d’ADN. Il y a aussi des changements épigénétiques, qui ne change pas la
séquence d’ADN, mais modifie l’expression des gènes avec une modification covalente de l’ADN ou
de la chromatine.

On effectue des croisements entre des mutants qui permettent d’établir la deuxième loi de Mendel :
si deux mutations sont sur des chromosomes différents, ils ségrégent de façon indépendante. Si deux
mutations sont sur le même chromosome, on observe une « liaison » des mutations. Ce type
d’analyse permet d’établir une carte génétique où chaque locus est placé à un endroit sur le
chromosome. Ces cartes génétiques sont utilisées en médecine génétique.

Gènes et enzymes

Le gène est une idée abstraite car il n’y avait pas de support physique. Il y avait donc un vide entre les
notions de phénotype et génotype. Ce vide a été comblé en faisant le lien entre le gène et l’enzyme.

Les enzymes sont des catalyseurs, elles accélèrent les réactions sans modifier les équilibres. La
plupart des enzymes sont des protéines, mais peuvent également être des ARN, ce sont alors des
ribozymes. De nombreux petits ARN participent au contrôle de l’expression des gênes.

Dogme central : ADN, ARN, protéines

Le modèle en double hélice énoncé par Watson et Crick offre un modèle évident pour la réplication.
La transmission de l’information ADN-ADN et ADN-ARN implique l’appariement des bases (A et T, G
et C). L’ADN peut se répliquer, être transcrit en ARN (transcription) et l’ARN peut être traduit en
protéines (traduction).

Le dogme central est énoncé par Crick, après avoir énoncé le modèle de structure en double hélice
de l’ADN. Les acides nucléiques et les protéines sont des polymères linéaires. L’alphabet ADN-ARN
contient 4 bases et 20 acides aminés, toute l’information est dans la séquence. Ceci élimine le
problème tridimensionnel, étant donné que la séquence détermine la forme. Le transfert
d’information est déterminé selon l’appariement des bases et par le code génétique (un acide aminé
correspond à un groupe de trois bases).

3
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Il étudie également les réactions qui ont lieu entre les


macromolécules. Il établit que les réactions standard
sont la réplication (ADN-ADN), la transcription (ADN-
ARN) et la traduction (ARN-protéines). D’autres
réactions spéciales peuvent avoir lieu : la réplication de
l’ARN (réplication des virus à l’ARN), la synthèse d’ADN
à partir d’ARN (rétrovirus) et la synthèse de protéines à
partir d’ADN, bien qu’elle ne soit que observée en
laboratoire. Les réactions non-détectées n’ont encore
jamais été détectées, elles sont impossibles.

Clonage et génétique inverse

L’étude de l’ADN et de l’ARN permet le développement du génie génétique.

Le clonage est l’immortalisation d’une molécule d’ADN. Un gène humain est fonctionnel dans une
bactérie. Il faut pour cela des plasmides, soit des petits chromosomes, des enzymes de restriction,
pour « couper » l’ADN, et des enzymes pour « coller », l’ADN ligase. Il suffit d’introduire l’ADN dans
une bactérie, puis de sélectionner la bactérie, et de propager cette bactérie, soit de l’immortaliser.
Un gène humain est compatible avec une bactérie, car le code génétique est universel, ce qui permet
le clonage. L’enzyme qu’il code peut remplacer l’enzyme correspondant.

Les protéines recombinantes jouent un rôle important en médecine, elles sont un outil très puissant.
Elles permettent de bricoler l’ADN, soit de le couper et le coller, ce qui constitue une nouvelle
manière de faire de la génétique : de la génétique inverse. La génétique inverse permet d’aller d’un
gène, muté de manière définie, au phénotype. Grace à la transgénèse, on peut modifier ou
supprimer un gène chez la souris, donc on peut reproduire, comprendre une pathologie et ainsi
développer une thérapie.

Expression des gènes

La plupart de nos cellules contiennent toute l’information génétique, mais tous les gènes ne sont pas
exprimés de la même façon. Certains gènes « de ménage » sont exprimés dans la plupart des cellules.
D’autres gènes, plus spécialisés, sont exprimés uniquement dans un nombre restreint de types
cellulaires. Certains gènes sont exprimés à des taux variables suivant les conditions : lors du
développement, selon une physiologie normale, ou des conditions pathologiques, ou aux différentes
phases du cycle cellulaire.

4
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

L’ADN est constitué de 3 types d’éléments : des gènes de structure (enzymes et protéines
structurales), de gènes régulateurs (protéines régulatrices, répresseurs et activateurs) et de sites
(séquences où agissent les protéines régulatrices). Avec le dogme central et le code génétique, le
modèle de l’opéron, même s’il est incomplet, est au cœur théorique de la biologie moderne.

Dans l’exemple du lactose, sans lactose, la cellule ne contient pas d’enzyme capable de dégrader le
lactose en glucose et galactose. Si on ajoute du lactose, l’enzyme est synthétisé et peut agir. Il s’agit
de contrôle négatif, mais il existe également des gènes dont l’expression est réglée par un contrôle
positif.

Le lactose est à la fois inducteur et substrat. Un inducteur empêche la liaison du répresseur au site
opérateur. Le lactose est hydrolysé par le produit du gène Z en galactose et glucose : il est substrat.
Les sucres modifiés peuvent être inducteur et substrat, inducteur mais non-substrat, non-inducteur
mais substrat et non-inducteur et non-substrat (il est alors inhibiteur).

Génomes

Le séquençage du génome humain permet d’avoir une vision plus globale de la vie d’une cellule, car
on étudie plusieurs gènes à la fois comme un ensemble, et non pas chaque gène séparément. Encore
beaucoup de gènes restent inconnus, on les appelle ORFans (Open Reading Frame). Ils n’ont pas
encore de fonction définie et n’ont pas de gènes homologues dans les génomes cellulaires
séquencés. Les virus sont donc intéressants de par le réservoir de gènes qu’ils constituent.

Les bactéries deviennent souvent pathogènes par l’acquisition de plasmides ou de virus lysogènes. Le
transfert horizontal de gènes entre les espèces accélère l’évolution. Certaines maladies peuvent être
causées par des toxines sécrétées par des bactéries, par exemple des phages lysogènes. Certaines
toxines peuvent être de bons antigènes pour les vaccins, mais ils sont difficiles à mettre au point et à
breveter.

5
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

1. Nucléotides et ADN
Porteur de l’information génétique

L’ADN, un acide nucléique, trouvé dans le noyau, a été découvert par Friedrich Miescher. Il s’agit
d’une substance acide, riche en phosphore et d’une très grande molécule. Il l’a appelée « nuclein »,
et elle était différente des molécules connues.

L’ADN se trouve chez les bactéries, chez les archées et dans le noyau des cellules eucaryotes, mais
aussi dans les mitochondries et les chloroplastes, ainsi que dans certains virus.

L’ADN est composé de 4 bases azotées, et il porte l’information génétique, il est donc responsable de
la synthèse de protéines. Deux expériences viennent prouver le rôle de l’ADN.

Griffith et Avery montrent que le caractère du pneumocoque peut être transmis d’une souche
pathogène à une souche non pathogénique par transfert d’ADN (la forme virulente du pneumocoque
possède une capsule). Il s’agit du principe transformant.

Avery remarque qu’en injectant une bactérie pathogène inactivée (la fait bouillir) chez une souris, la
souris ne meurt pas. Il faut donc une bactérie vivante pour tuer, il ne s’agit pas d’un agent de la
bactérie qui tue.

De plus, les bactéries non


virulentes deviennent
virulentes, elles acquièrent
l’information génétique
nécessaire pour faire la
capsule. En introduisant le
matériel génétique dans la
bactérie, la bactérie non
pathogène est transformée
en bactérie pathogène.
C’est l’ADN purifié qui
porte le caractère
pathogène.

Composition

L’ADN est une chaine de


nucléotides, avec des bases
azotées, l’adénine (A), la
cytosine (C), la guanine (G)
et la thymine (T). Ces bases
sont liées entre elles par
paires (A-T et G-C). Par

6
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

convention, on écrit le brin du haut, car on peut en déduire le


brin du bas.

Il s’agit d’un polymère linéaire, composé de nucléotides. La chaine de base est composée d’un sucre,
le désoxyribose (ribose dans l’ARN) et d’un groupe phosphate. Les bases azotées sont liées au sucre,
sur le carbone 1’. C’est la séquence de bases azotées qui porte l’information génétique.

Le sucre est un désoxyribose. Il s’agit d’un sucre cyclique, avec 5 carbones. Le carbone 1’ accueille la
base azotée, le 2’ permet de faire la distinction entre ADN et ARN (désoxyribose ou ribose), et les
carbones 3’ et 5’ sont les carbones utilisés pour la chaine d’ADN.

Les quatre bases sont regroupées en deux groupes, les purines et les
pyrimidines. Les purines ont deux cycles azotés, ce sont l’adénine et la
guanine. Les pyrimidines n’ont qu’un cycle, il s’agit de la cytosine et de la
thymine.

Un nucléotide contient la base azotée, le sucre et un groupe phosphate. La base donne l’information,
alors que le sucre et le phosphate forment le brin. Le groupe phosphate est attaché au carbone 5’. Le
nucléoside est uniquement composé de la base et du sucre.

7
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Structure

Par convention, on dessine l’ADN du carbone 5’ au carbone 3’. Le phosphate se lie au carbone 3’, puis
au deuxième sucre sur le carbone 5’, etc. Le brin va donc de l’extrémité 5’ à l’extrémité 3’. La chaine
d’ADN possède une polarité, grâce à la charge négative sur le groupe phosphate. L’ARN a la même
polarité.

Les liaisons phosphates sont des liaisons covalentes, elles


sont très fortes et très stables. Il est possible de
dénaturer l’ADN (séparer les deux brins), mais pas de
rompre les brins.

L’ADN est en forme de double hélice, même s’il existe


des virus avec des ADN simple brin. Les deux brins sont
complémentaires et antiparallèles. Il y a autant de A que
de T, et autant de G que de C. Le rapport AT/GC est
important pour l’analyse génomique.

Comportement biochimique

Les brins sont antiparallèles. Alors que le brin supérieur


va généralement de l’extrémité 5’ à l’extrémité 3’, le brin
inférieur va dans les sens inverse. Les ponts hydrogène
assurent la complémentarité des bases, les liaisons ne
sont pas covalentes. Il y a deux ponts hydrogène entre
l’adénine et la thymine, et il y a trois ponts hydrogène
entre la glycine et la cytosine. Il est donc plus difficile de
séparer les paires G-C qu’A-T.

Utilisation en biologie
moléculaire

Les deux brins peuvent être


séparés. Les chaines de
nucléotides sont composées de
liaisons covalentes, elles
restent donc intactes. Les ponts
hydrogène A-T et G-C ne sont
cependant pas des liaisons
covalentes, on peut donc
dénaturer l’ADN en deux brins
en chauffant. Les deux brins
peuvent se remettre ensemble,
la renaturation est possible dès

8
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

le retour aux conditions normales. La renaturation n’est que possible si les deux brins sont
complémentaires. S’ils ne sont pas complémentaires, le double brin ne sera pas stable.

L’hybridation est possible, c’est-à-dire le changement d’un ou plusieurs nucléotides. On peut


déterminer l’hybridation selon l’énergie nécessaire à la séparation des brins. L’anémie falciforme est
due au changement d’un nucléotide.

La dénaturation et la renaturation sont utilisées en biologie moléculaire. Les enzymes de restriction


sont des outils indispensables en biologie moléculaire. Ces enzymes reconnaissent une séquence
d’ADN (quatre nucléotides ou plus), et coupent l’ADN à une région spécifique, lorsqu’elles
reconnaissent la séquence. La fréquence de coupure dépend du nombre de nucléotides impliqués
dans la reconnaissance d’une séquence spécifique par une enzyme de restriction.

On peut également effectuer du clonage en biologie moléculaire. Les interférons sont des protéines
qui informent notre organisme de la présence d’un intrus. Etant donné qu’on a peu d’interférons
dans notre sang, on peut introduire un interféron dans un plasmide, de sorte à avoir une bactérie
avec un ADN recombinant. Les bactéries jouent alors un rôle d’interféron.

La biologie moléculaire a donc permis de détecter des anomalies et des pathogènes à partir de
l’analyse de l’hybridation entre deux acides nucléiques. Les enzymes sont des outils importants, elles
ont transformé la recherche. Le clonage a aidé à produire de nouveaux médicaments.

9
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

2. La Réplication
La réplication de l’ADN consiste à synthétiser une molécule d’ADN à partir d’une molécule d’ADN. Ce
processus est fidèle, car la réplication est semi-conservatrice. La réplication a cependant besoin
d’être régulée, car une seule réplication d’ADN est nécessaire lors de la division cellulaire. Une
amorce est nécessaire au processus de réplication. C’est également un processus très utile en
biologie moléculaire, notamment pour la synthèse de nouveaux médicaments.

Complémentarité

Le phénomène de complémentarité est à la base de la réplication. Le principe est qu’une molécule


parentale, composée d’un brin en double hélice, soit séparé de son brin homologue. Les nucléotides
vont alors s’apparier selon les règles de complémentarité. Le résultat sera deux brins d’ADN
identiques, deux molécules identiques.

Le processus de réplication fait que ce soit un modèle semi-conservatif. Les deux ADN obtenus après
la réplication sont chacun composés d’un nouveau brin d’ADN, et d’un brin parental. Ce modèle ainsi
que la complémentarité des bases garantissent l’exactitude de la réplication.

Régulation

La régulation de la réplication se fait lors de l’initiation. Il ne doit y avoir qu’une seule réplication par
génération lors de la division cellulaire, même s’il peut y avoir des exceptions. Une grande quantité
d’énergie est nécessaire à la réplication, la régulation permet donc d’économiser de l’énergie. De
plus, la réplication se fait d’une traite, donc la régulation a lieu avant la réplication.

Il faut une origine et des protéines de régulation pour le processus de régulation. On doit avoir une
machinerie qui reçoit le signal de l’environnement pour la réplication, et la cellule doit être
suffisamment grande pour la division.

Origine de réplication

Une protéine spécifique va se fixer à un endroit pour séparer les brins. Cette dénaturation partielle
est l’origine de la réplication, la réplication va commencer à cet endroit. La réplication est
bidirectionnelle, les protéines responsables de la dénaturation se fixent sur l’origine de la réplication
(le lieu où les brins se séparent). Si l’ADN est circulaire, les deux fourches de réplication vont se
rejoindre.

10
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Le cycle cellulaire est composé de plusieurs phases. La phase de


réplication chez un eucaryote est la phase S. La phase G2 (gap) est une
phase de régénération, et la phase M correspond à la mitose, moment
de la division cellulaire. S’ensuit une nouvelle phase de gap, G1, pendant
laquelle la cellule grandit pour donner naissance à un nouveau cycle
cellulaire. La cellule n’entrera qu’en réplication si la taille est suffisante
pour entreprendre la division cellulaire.

Le cycle S commence par la reconnaissance de l’origine de réplication par une protéine ou un


complexe de protéines spécifiques. Le complexe se fixe sur
l’origine de réplication, et sépare les deux brins. L’ADN va se
dénaturer, et va induire une tension dans l’ADN, qui fera un
cycle supplémentaire. Etant donné que les deux brins ne
sont liés que par des ponts hydrogène, l’ADN se dénature
facilement en induisant une tension. Dès que l’origine de
réplication est dénaturée, les protéines peuvent entrer dans
l’ADN pour entreprendre la réplication. Une fois les deux brins d’ADN dénaturés, il faut que la
réplication puisse avancer le long de l’ADN à répliquer. Des hélicases utilisent de l’énergie pour
séparer les deux brins.

Initiation

L’initiation est faite par des protéines appelées primases. Les polymérases à ADN ont en effet besoin
d’une amorce. La primase est une polymérase à ARN, qui synthétise un brin d’ARN sur lequel la
polymérase se fixera pour commencer la réplication d’ADN. La synthèse est antiparallèle au brin
d’ADN, elle va dans le sens inverse de la matrice (5’ à 3’).

La réplication va de l’extrémité 5’ à l’extrémité 3’. La polymérase va tester les nucléotides. Si le


nucléotide est complémentaire, une liaison covalente entre le groupe 3’OH et le groupe phosphate
va se former (le groupe phosphate appartient à un triphosphate, la liaison libère donc un
diphosphate). Ce phénomène est appelé élongation.

Synthèse discontinue

L’un des deux brins pourra être synthétisé de manière continue, de l‘extrémité 5’ à l’extrémité 3’.
Cependant, l’autre brin ne pourra pas être synthétisé de manière linéaire, sa synthèse sera

11
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

discontinue. Les brins sont donc dénaturés au fur et à mesure, et il faut plusieurs amorces au cours
de la réplication pour la synthèse discontinue, qui synthétise à reculons. En effet, si le brin
synthétisait de l’extrémité 3’ à l’extrémité 5’, il serait impossible de réagir à une erreur de réplication,
car il n’y aurait plus de triphosphate pour créer la liaison covalente. La seule solution est donc de
synthétiser dans l’autre sens, avec plusieurs amorces.

Lors de la dénaturation, les primases vont entamer une amorce, à partir de laquelle la polymérase
pourra synthétiser l’ADN. Lors de la synthèse discontinue, la polymérase synthétise de l’extrémité 5’
à 3’, dans le sens inverse de la dénaturation. Une nouvelle amorce va alors être créée, à partir de
laquelle les polymérases pourront synthétiser un nouveau fragment d’ADN. Les fragments d’ADN
non-liés s’appellent fragments Okazaki. Le brin tardif va alors entrer en contact avec le fragment
Okazaki, sur lequel il va remplacer l’ARN par l’ADN pour lier les deux fragments.

La synthèse processive est plus rapide que la synthèse


discontinue. Le brin adopte alors une forme complexe, le
« réplisome complexe », pour répliquer les deux brins en même
temps. Une protéine, le « sliding camp », retiennent la
polymérase sur le brin et maintiennent les polymérases des
deux brins au même endroit.

12
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Cependant, répliquer une double hélice d’ADN pose un problème de contrainte. Il faut des
topoisomérases pour soulager la tension. Lors de la dénaturation, il y a une coupure sur un simple
brin, qui permet de relâcher un tour d’hélice et l’ADN revient à sa conformation, sans tension. Si on
veut garder la structure de l’ADN, il faut couper l’ADN pour relâcher la tension lors de la réplication
et séparer les deux molécules.

La topoisomérase I permet de couper un simple brin, de tourner et de rétablir la liaison afin de


relâcher la tension. La topoisomérase II coupe un double brin pour libérer deux molécules
entrelacées. Une cellule sans topoisomérase peut être considérée comme une cellule morte, car la
réplication de l’ADN est impossible. C’est pour cela que les topoisomérases sont des cibles
d’antibiotiques et d’agents anticancéreux. La molécule inhibitrice agit en inhibant la topoisomérase,
donc en empêchant la division cellulaire.

Télomérases

Lors de la réplication, l’amorce est nécessaire pour entreprendre la synthèse du brin par la
polymérase. A la fin, l’amorce, de l’ARN, est éliminée, ce qui constitue une perte de matériel
génétique, car la molécule est raccourcie.

La télomérase est une enzyme avec sa propre matrice d’ARN, qui permet d’allonger la séquence
d’ADN. La télomérase rallonge donc artificiellement l’ADN de l’extrémité 3’. Ainsi, l’amorce sera faite
plus loin, et l’amorce ne constituera plus une perte de séquence d’ADN, étant donné que la séquence
n’est pas codante. La télomérase est ainsi une transcriptase inverse, qui synthétise de l’ADN à partir
d’ARN. La longueur du télomère est régulée par des protéines, qui régulent la longueur de la matrice,
pour ne pas dépenser trop d’énergie.

Les cellules ont besoin de télomérase lorsqu’elles se multiplient beaucoup. Une cellule somatique n’a
pas besoin de télomérase. Ce sont également des substrats, qui sont des cibles pour les agents
anticancéreux. La sénescence est en partie due à un raccourcissement d’ADN.

13
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

3. Mutations et Réparation – Recombinaison


La fidélité de la réplication de l’ADN permet une constance dans la descendance en assurant une
descendance viable et fertile. D’un autre côté, les mutations entrainent des variations
phénotypiques, qui offrent la possibilité de s’adapter et d’évoluer. Dans l’évolution, les mutations
jouent un rôle important, les erreurs de réplication étant une source de variation. Or, il existe des
enzymes pour réparer l’ADN lors des mutations.

Types de mutations
Mutations ponctuelles

La substitution est un type de mutation ponctuelle, une mutation simple. Lors de la réplication d’un
brin d’ADN, une séquence pourra subir la substitution d’un nucléotide. La séquence codée sera alors
mutante, car un nucléotide diffère de la séquence d’origine. L’information est alors changée, le
message de cette séquence est modifié, mais la structure reste inchangée. L’autre brin aura la
capacité de reconnaitre la mutation, et les mutations ponctuelles peuvent être réversibles.

Il y a deux types de substitutions : les transitions et les transversions. Les transitions sont une
substitution entre le même type de base, on substitue donc une purine par une purine, soit G par A,
et une pyrimidine par une pyrimidine, soit C par T. Les transversions sont des substitutions lors
desquelles on change le type de base. On substitute donc une purine par une pyrimidine, et une
pyrimidine par une purine. On substitue donc entre G et C, G et T, A et C et A et T. Le type de
substitution est important pour la reconnaissance de la mutation.

La délétion et l’insertion sont deux autres types de mutations ponctuelles. Lors de la délétion, un
nucléotide de la séquence d’ADN est supprimé. Il n’y a cependant pas de trou dans la nouvelle
séquence d’ADN, car une DNA-lygase va rejoindre le groupe 3’OH au carbone 5’ libre, formant une
molécule continue. Lors de l’insertion, un nucléotide va s’ajouter à la séquence, modifiant la nouvelle
séquence d’ADN, plus longue. Dans les deux cas, l’information est changée, car le message est
différent. L’ajout ou la suppression d’un nucléotide va changer le cadre de lecture, qui reconnait une
séquence de trois nucléotides à laquelle il attribue un acide aminé.

14
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Les mutations grossières

Les mutations grossières diffèrent des mutations ponctuelles par la taille du changement de la
séquence d’ADN. Les délétions d’une mutation grossière peuvent être de plusieurs nucléotides. Une
séquence est alors coupée. L’ADN reste contigu, il n’y a pas de trou, si ce n’est un trou d’information.

Les insertions concernent également un groupe de plusieurs nucléotides insérés dans la séquence
d’ADN. La duplication est une répétition de certains triplets. S’il y a trop de triplets à la suite, la
personne risque de développer la maladie de Huntington.

Effet des mutations

Pas toutes les mutations n’ont le même effet. Certaines mutations sont néfastes, par exemple si une
mutation change un nucléotide et crée un codon stop dans un gène essentiel. De manière générale,
un gène codant pour une protéine spécifique ne pourra plus synthétiser la protéine après la
mutation.

Certaines mutations sont neutres, elles n’ont pas d’effet. En effet, certains codons codent pour le
même acide aminé, par exemple CTC et CTT codent pour la leucine. La mutation peut alors ne pas
changer l’acide aminé, ou elle peut se trouver en dehors du gène, dans une portion d’ADN qui ne
code par pour une protéine spécifique.

Finalement, les mutations peuvent également être bénéfiques, notamment pour les bactéries. Les
mutations bénéfiques sont difficiles à voir dans notre génération, qui est très longue, mais elles sont
importantes en microbiologie. Une mutation peut développer la résistance à un antibiotique de la
tuberculose, la rifampicine. La mutation altère le site d’interaction de l’antibiotique, donc la
rifampicine ne peut plus se fixer. La mutation est donc bénéfique pour la bactérie, qui deviendra
résistante et pourra proliférer et transmettre sa résistance.

15
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Sources de mutations

Chez l’homme, le risque d’avoir un cancer augmente avec l’âge, car la mutation des cellules mutées
entraine une augmentation du risque de développement d’un cancer. Chez les bactéries, lors ‘dune
irradiation, par UV par exemple, la réparation peut développer une résistance. Si l’on persiste avec
un traitement, sa survie diminuera, car le système de réparation devient peu efficace face à
l’irradiation. Les sources de mutations peuvent donc être sous forme d’erreurs de réplication, de
modifications chimiques, d’hydrolyses spontanées, ou encore sous forme d’une modification par
radiation. L’utilisation de nucléotides analogues peut également être une source de mutations.

Erreur de la réplication

Lors de la réplication, il se peut qu’une polymérase associe le mauvais nucléotide dans la séquence,
ne respectant ainsi pas la règle de l’appariement. Il existe alors un système pour éviter les erreurs de
réplication, nommé proofreading (ou correction sur épreuve). Si la polymérase associe un nucléotide
T à un nucléotide G, ceux-ci ne s’apparient pas correctement, et ils ne sont pas au bon endroit. Une
nucléase va alors retirer le dernier nucléotide en coupant l’ADN qu’elle vient de faire. Il y a deux
types de nucléases : les endonucléases coupent à ‘intérieur de l’ADN, alors que l’exonucléase coupe à
l’extérieur de celle-ci.

La DNA-polymérase synthétise dans le sens 5’à3’, l’exonucléase revient en arrière, dans le sens
3’à5’, et « mange » les derniers nucléotides. La fréquence d’erreur lors de la réplication est de 10-9
nucléotides. Ceci explique pourquoi la réplication du brin du bas se fait de manière discontinue, car la
lecture de correction sur matrice (proofreading) serait impossible sur un brin synthétisé 3’à5’, à
cause du triphosphate déjà consommé, qui empêcherait la correction.

Changement par modification de l’ADN

Parfois, la polymérase ne se rend pas compte de l’erreur, mais aussi des influences extérieures, telles
que la température, l’hydrolyse spontanée ou les modifications chimiques.

La base peut être modifiée. Par exemple, la déamination de la cytosine mène à la formation d’un
uracile. L’uracile doit être éliminé, sinon il y a mauvaise incorporation au prochain tour de
réplication. Un Uracile est forcément un signe de déamination, car il n’y a pas d’ARN dans le

16
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

chromosome. Si l’erreur n’est pas réparée tout de suite, l’erreur reste : deux nouveaux brins
différents sont alors créés, ce qui peut avoir des effets néfastes.

La modification de base entraine une modification du comportement de la base, ce qui mène à une
mutation. La modification change le comportement de complémentarité. Par exemple, l’adénine
peut être déaminée en hypoxanthine, et s’apparier avec la cytosine. La complémentarité veut que
l’adénine se lie à la thymine et la guanine avec la cytosine.

17
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Lors de la réplication, il peut aussi y avoir la


perte d’une base. Il s’agit d’une hydrolyse, qui
induit une perte d’information. Par exemple, la
réplication peut entrainer la perte d’une
purine. On estime la perte des purines à 5'000
par jour par cellule. La conséquence de la
dépurination est que, lors de la réplication, la
polymérase ne saura pas quoi mettre sur le
brin complémentaire, elle ne mettra donc rien,
ce qui entraine la perte d’un nucléotide. La
perte d’un nucléotide change le cadre de
lecture, les conséquences peuvent donc être
horribles.

Réparation par excisions d’une base ou d’un


nucléotide

La perte d’une base crée un trou d’une base dans la séquence


de nucléotides. Prenons l’exemple d’une séquence avec un
uracile, résultant de la déamination d’une cytosine. L’enzyme,
DNA-glucosylase, coupe le nucléotide contenant l’uracile,
formant ainsi un trou dans la séquence. Le système de
réparation va alors couper le sucre sans base (sous la catalyse
d’endonucléases), et la polymérase va remettre la bonne base
et la lygase va relier les fragments. L’ADN est alors réparé.

Mutation par radiation – UV

La mutation par UV va créer des dimères, soit la formation


d’une liaison covalente entre deux bases. La polymérase ne
peut lire cette séquence, car le nucléotide est trop gros. Ceci
va donc mener à des erreurs de réplication en copiant la
structure.

La réparation par excision d’un dimère TT consiste à exciser


le bout d’ADN contenant le dimère, puis de synthétiser le
nouveau brin. La nucléase va couper un bout de simple brin,
qui se détachera de l’ADN. L’ADN-polymérase va alors
resynthétiser le brin manquant par complémentarité. Il y
aura donc nouvelle synthèse et ligation.

18
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Radiation par rayon X

Lors de la radiation par rayon X, il y a scission de l’ADN. Un mécanisme permet alors de relier l’ADN
sans faute et de distinguer le bout libre d’un télomère. Il y a deux possibilités : soit l’enzyme lie les
bouts libres, soit il y aune copie sur le brin homologue. Lors d’une radiation par rayon X, le brin sera
fissuré, et la fissure sera suivie d’une perte de quelques nucléotides. Lors de la liaison des bouts
libres, il y aura un danger de délétions, à cause des nucléotides manquants. Si la cellule recole les
bouts ensemble, il n’y aura pas d’homologie, ce qui induit la délétion. A 70 ans, les cellules humaines
ont environ 2000 cicatrices de ce genre. Dans l’autre cas, le brin sera complété en copiant le brin
homologue, qui sera inséré dans le génome. Le double brin sera alors restauré, et il n’y aura pas de
délétion. Il faut un noyau plein de nucléases pour cette réparation.

Recombinaison
La définition de la recombinaison est une combinaison différente des brins d’ADN. La recombinaison
peut aussi s’appeler crossing over. La recombinaison est importante pour la variation dans une
population, la recombinaison méiotique favorisant la variation. Elle est également importante pour la
réparation et la variation d’expression (recombinaison somatique, variation antigénique, etc.). La
recombinaison homologue lors de la recombinaison méiotique augmente la diversité génétique, en
créant quatre molécules d’ADN à partir de deux ADN quasiment identiques.

19
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

L’alignement des chromosomes et la recombinaison homologue sont importants pour la fidélité de la


ségrégation. Lors de la division cellulaire, deux chromosomes sont alignés. Ils doivent être alignés
correctement pour être séparés correctement, pour avoir une répartition correcte des
chromosomes. Dans la méiose, il y a beaucoup d’événements de recombinaison.

La recombinaison homologue est initiée par une coupure accidentelle ou par une enzyme. Lorsque,
lors de la méiose, l’ADN est coupé par radiation ou par des enzymes, les chromosomes homologues
sont alignés, ils peuvent alors se recombiner.

Il y a une coupure double brin sur une des deux molécules, soit par accident, soit à cause d’une
enzyme, et l’exonucléase vient alors enlever des nucléotides et expose ainsi l’extrémité 3’OH.

Une protéine aide à trouver le même « endroit » (locus), et fait se rejoindre les chromosomes. L’ADN
polymérase remplit alors le trou pour relier les deux brins. Le tout est alors relié, mais les deux
molécules sont colées ensemble.

20
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Les endonucléases coupent les intersections, ce qui fait un mélange (crossing over). Si un nucléotide
est différent entre les deux brins, ici entre le rouge et le jaune, il y aurait une différence d’un
nucléotide, ce qui signifie une différence avec la molécule des parents. Normalement, il n’y a pas de
différence, donc on ne voit rien. Mais si on coupe à un autre endroit (modèle de droite), il y a un vrai
crossing over. Les flèches bleues indiquent le lieu de coupure par une endonucléase.

Les différentes étapes de la recombinaison homologue sont dont la coupure de l’ADN, l’appariement
par homologie, la synthèse et la ligation, et la résolution par coupure et religation.

Recombinaison illégitime – Duplication par recombinaison inégale

Est défini comme recombinaison illégitime tout ce qui n’est pas recombinaison basée sur une
homologie étendue, et tout ce qui implique des séquences spécifiques pour faire la recombinaison
(autre que la machinerie d’homologie).

Lors d’un mauvais alignement, la recombinaison sera de type homologue. Cependant, le mauvais
alignement va mener à la duplication d’un gène dans une copie, et à la délétion d’un gène dans une
autre copie. Ceci entraine donc une variation du nombre de gènes.

21
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Translocation

La translocation de gène consiste à un échange de parties de


chromosomes. Les conséquences peuvent être horribles, car cette
translocation peut dérégler un gène.

La recombinaison illégitime (ou non-homologue) peut aussi se faire


par des séquences mobiles (ou gènes « sauteurs »). Ces gènes sauteurs
sont présents chez une espèce de maïs muté, qui a des grains jaunes
et noirs. Ces gènes sauteurs causent cette différence de couleurs. Les
éléments sauteurs peuvent se dupliquer, sauter et s’insérer ailleurs.
Ceci mène à la duplication d’un gène, il s’agit donc d’une
recombinaison illégitime. La transposition peut être intramoléculaire
ou intermoléculaire. Elle peut favoriser la propagation de facteurs de
virulence, la plasticité des génomes. C’est un procédé utilisé chez les rétrovirus.

Certains éléments mobiles peuvent être transposés d’un endroit à un autre, par « couper-coller ». La
séquence d’ADN est coupée d’une séquence initiale, et introduite dans un autre chromosome.

Transposition par l’intermédiaire d’un ARN

Un rétrovirus est comme une séquence mobile. Lors de sa réplication, l’ARN est modifié pour donner
de l’ADN, qui est inséré dans le génome. Ensuite, l’ADN est utilisé pour synthétiser de l’ARN viral qui
va infecter d’autres cellules ou organismes, et recommencer le cycle. On parle alors de rétro
transposition, le VIH étant un exemple.

Recombinaison site spécifique

Les bactéries sont des exemples pour la recombinaison à site spécifique. La bactérie a besoin d’un
promoteur pour l’initiation de la traduction de l’ADN en protéines, moyennant la transcription d’ADN
en ARN. Il y a deux protéines avant la séquence d’ADN, qui ont le rôle de répresseurs. Lorsque ces
protéines se fixent à un autre endroit, elles bloquent la synthèse du flagelle H1. La recombinase
reconnait des séquences spécifiques, elle ne reconnait donc que ces deux séquences. Le changement
de flagelles est une manière d’échapper au
système immunitaire humain. En changeant
la protéine, elle échappe à la défense
immunitaire.

Une recombinase dédiée reconnait une


séquence spécifique et produit un crossing
over. La recombinase ne touchera aucune
autre séquence. Après l’inversion de la
boucle, le promoteur pointe dans la
mauvaise direction. La protéine H2 n’est
donc plus synthétisée, donc le répresseur
non plus, il y a donc synthèse de la protéine H1. La recombinaison permet donc de synthétiser H1 au
lieu de H2.

22
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

La recombinaison est importante dans les anticorps. On a environ 1015 anticorps différents. Dans une
cellule, les recombinases réarrangent l’ADN pour faire des protéines différentes. Cette énorme
variation d’anticorps est due à la recombinaison et à l’épissage. Le réarrangement permet d’énormes
variations avec des jonctions possibles. Pour ça, il faut des séquences spécifiques pour faire des
recombinaisons, qui entrainent des délétions. Le leucocyte aura une information, et va reproduire un
anticorps de ce genre, c’est ce qu’on appelle la maturation d’un leucocyte.

Les régions variables sont réarrangées avec la région constante. La délétion d’une bonne partie de
cette séquence d’ADN va donner la séquence codante pour un anticorps. C’est le réarrangement qui
permet cette diversité d’anticorps sans avoir trop de gènes spécifiques.

23
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

4. Génome
Introduction- Dogme central

Comment l’information génétique est-elle stockée et utilisée pour faire des protéines ? Nous avons
vu que l’ADN est le réservoir génétique, et nous avons étudié la réplication, la recombinaison et les
mécanismes pour préserver le génome intact. Pour la synthèse de protéines, une copie d’ARN est
faite à partir de l’ADN, il s’agit du mécanisme de transcription. Cette copie d’ARN est reconnue par
une machinerie complexe, dans laquelle les ribosomes jouent un rôle important, qui lit l’ARN et
produit les protéines. Ce processus s’appelle traduction. Les protéines sont elles-mêmes impliquées
dans ces processus chimiques, qu’elles contrôlent de manière précise et sélective. Les protéines sont
les molécules effectrices qui remplissent la plupart des fonctions nécessaires aux organismes vivants
pour subsister.

Génome
Le génome constitue la totalité de l’information génétique d’un organisme vivant. Le génome peut
être perçu de deux angles différents : il peut être perçu comme une entité physique, il s’agit de la
molécule d’ADN, mais aussi comme une entité fonctionnelle, il s’agit alors du contenu en
information, de l’ensemble des gènes.

La molécule d’ADN

L’ADN a une structure en double hélice formée de deux brins complémentaires et antiparallèles. La
séquence de nucléotides est composée d’une base, d’un désoxyribose et d’un phosphate. L’ADN
constitue une fraction mineure de la cellule humaine. La cellule est composée de 70% d’eau, et
d’environ 30% de macromolécules et d’ions. L’ADN ne constitue que 0.25% de la masse cellulaire,
mais sa fonction n’en demeure pas moins importante.

On ne peut pas déterminer la complexité d’un organisme selon la taille du génome. Même si dans de
nombreuses espèces cela semble le cas, il y a des exceptions, telles que les protozoaires. L’homme a
46 chromosomes (2n=46). Il n’y a aucune corrélation entre le nombre de chromosomes et la
complexité biologique de l’organisme.

Le génome fonctionnel contient l’information génétique permettant à un œuf fécondé de se


développer en organisme adulte, mais aussi l’information déterminant la spécificité de l’espèce
(hérédité) et l’information permettant le contrôle des interactions entre l’organisme et son
environnement. L’information génétique est fragmentée en unités, appelées gènes.

Par définition, un gène est l’unité de base de l’information génétique. Il s’agit de la région de l’ADN
qui contrôle un caractère héréditaire donné d’un organisme et qui permet, habituellement, la
synthèse d’un seul ARN et d’une seule protéine chez les eucaryotes.

Les virus ne sont pas considérés comme vivants, car ils ne sont pas capables de se reproduire et se
multiplier seuls. Ce sont des parasites obligatoires qui doivent pénétrer dans les cellules afin
d’exploiter la machinerie cellulaire pour répliquer leur génome et exprimer leurs gènes en protéines.
Cependant, ils obéissent aux lois du vivant et contiennent un génome. Les génomes viraux peuvent
être composés d’ADN ou d’ARN, et peuvent être monocaténaires ou bicaténaires.

24
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Les bactéries, des procaryotes, sont les cellules les plus simples et constituent un exemple de la vie
réduite à l’essentiel. Leur génome est constitué d’un seul chromosome, fait d’une molécule d’ADN
circulaire. Les levures ont une structure plus complexe que les bactéries, et les deux organismes sont
utilisés pour des analyses génétiques et biochimiques, et elles ont permis de comprendre beaucoup
de mécanismes de base opérant dans les cellules.

La drosophile est un organisme plus développé, qui a déjà un système nerveux. La drosophile est un
bon outil de recherche chez les organismes multicellulaires, elle permet des analyses génétiques. On
ne connait pas exactement combien de gènes à l’être humain, car il est difficile d’identifier les gènes
(le nombre de gènes a tendance à baisser). Il y a cependant une corrélation raisonnable entre la
complexité, la taille du génome et le nombre de gènes. Cependant, la grande différence en taille
entre le génome d’une bactérie et d’un Homme ne s’explique pas uniquement par la différence dans
le nombre de gènes. Cette différence ne s’explique pas non plus par une quantité différente
d’information génétique contenue dans chaque gène.

La taille du génome ne définit donc pas le nombre de gènes ni la taille du gène. L’entité physique
n’explique pas l’entité fonctionnelle.

Le génome comme entité fonctionnelle

Les éléments dont la fonction est connue (origines de réplication, télomères, centromères, autres
éléments structurels) ne représentent que 10% du génome humain. Afin qu’une copie de l’intégralité
de l’information génétique soit transmise à chaque cellule fille lors de la division cellulaire, chaque
chromosome doit être dupliqué, et les copies nouvellement dupliquées doivent être séparées et
réparties de façon équitable entre deux cellules filles. Ces étapes sont contrôlées par trois types de
séquences d’ADN spécialisées : les origines de réplication, les centromères et les télomères.

La réplication de l’ADN débute aux origines de réplication.

Les télomères, faits de courtes séquences nucléotidiques répétées en tandem, constituent


l’extrémité des chromosomes. Ils permettent aux extrémités d’être répliquées. Les télomères
forment aussi des structures qui protègent les extrémités de l’ADN contre la dégradation par des
nucléases.

Le centromère est le point d’attache des filaments du fuseau mitotique permettant à une copie de
chaque chromosome dupliqué d’être « tirée » dans chaque cellule fille lors de la division cellulaire.

25
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

55% de notre ADN sont des éléments sans fonction connue. Il y a des séquences uniques non-
géniques, conservées, et des séquences répétées (« junk DNA »). Ces séquences répétées sont plus
complexes et sont dispersées à travers tout le génome. Certaines de ces séquences répétées sont des
fossiles de génomes viraux qui se sont intégrés dans notre génome. D’autres séquences répétées et
dispersées dans le génome sont formés de répétitions très simples, le plus fréquent étant (CA)n. Le
nombre de ce type de répétitions est variable et a une forte probabilité de varier selon les individus.
Les séquences d’ADN répétées n’ont pas de fonction connue et ne constituent probablement pas un
réservoir d’information génétique.

Les séquences répétées sont dispersées dans le génome. L’information génétique est perdue dans
une masse de séquences répétées. Les séquences répétées se trouvent dans les régions séparant les
gènes, mais aussi dans les introns à l’intérieur des gènes.

Les gènes correspondent à 30% de notre ADN. Les gènes sont découpés en fragments, des exons, et
sont séparés par des segments d’ADN appelés introns. Les introns constituent une large majorité de
nos gènes, les exons n’étant que 1,5% de l’ADN. Seulement 1,5% de l’ADN est composé des portions
utiles pour synthétiser les protéines.

Le nombre d’introns, et donc d’exons, est très variable d’un gène à l’autre. Le nombre d’exons est
supérieur de 1 par rapport au nombre d’introns, car un gène commence et finit toujours par des
exons. La taille des introns est également variable selon l’organisme, le gène et l’intron examiné.
Chez l’Homme, les introns sont généralement plus grands que les exons. La taille moyenne des
introns varie selon les espèces.

26
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

La taille du génome ne dicte pas la complexité de l’organisme, tout comme elle ne corrèle pas avec le
nombre de gènes. Une grande partie du génome peut contenir autre chose que des gènes. Une
grande partie de l’ADN ne sert probablement à rien. La question sur son utilité reste ouverte.

Evolution du génome
Des comparaisons des génomes entièrement séquencés d’une levure, de la drosophile et de
l’Homme montrent que chacun des organismes possède des gènes qui lui sont uniques, c’est-à-dire
des gènes pour lesquels aucun équivalent, ou gène orthologue, n’a été identifié. Contrairement à ce
qu’on pourrait penser, l’accroissement de la complexité biologique au cours de l’évolution n’est pas
dû à l’accumulation progressive de gènes supplémentaires. Les différents organismes possèdent des
gènes communs, les gènes codant pour les fonctions essentielles.

Les mécanismes clefs pour l’évolution sont les mutations, la duplication de gènes et les nouvelles
combinaisons de fragments provenant de gènes différents. Ces mécanismes entrainent la divergence
des organismes. Ces différents mécanismes opèrent de façon aléatoire pour façonner le gène.

Mutations – divergence

Des mutations sont introduites dans le génome, à une vitesse très lente (1 à 5 nucléotides sur mille
sont mutés sur une période de 1 millions d’années. La plupart des changements génétiques résultent
du fait que les mécanismes responsables de la réplication de l’ADN et de la répartition de l’ADN sont
imparfaits. Même si les mutations sont très rares, elles s’accumulent avec le temps.

Des mutations aléatoires survenant dans un gène donné au sein d’une espèce vont donner lieu à des
versions ayant des séquences légèrement différentes. On nomme allèle une variante donnée d’un
gène au sein d’une espèce. Des gènes pour lesquels deux ou plusieurs allèles existent dans la
population sont appelés gènes polymorphes.

Les polymorphismes génétiques sont en grande partie responsables de la variabilité des traits
héréditaires existants entre individus différents d’une même espèce. La nature polymorphique de
certains gènes expliquent en partie pourquoi seulement personnes dans une population ont une
prédisposition génétique à développer certaines maladies. Les gènes les plus polymorphes chez
l’homme sont ceux codant les molécules CMH (complexe majeur d’histocompatibilité).

Le polymorphisme génétique est responsable de la variabilité des caractères héréditaires entre


individus.

L’accumulation de mutations intragéniques est en grande partie responsable de la divergence entre


espèces au cours de l’évolution. La divergence en séquence de gènes dans deux organismes
différents issus du même gène ancestral (gènes orthologues) tend à augmenter avec le temps. La
divergence en séquence de gènes orthologues s’accompagne en général d’une divergence
progressive dans leurs fonctions respectives.

Il y a une corrélation entre la divergence des gènes entre des organismes et l’époque pendant
laquelle leur ancêtre commun a vécu. La différence qui caractérise deux gènes doit être égale, car la
mutation se fait à la même vitesse. Ainsi, on peut retracer l’existence des ancêtres communs avec la
différence des gènes orthologues.

27
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Définition : Des gènes orthologues sont des gènes présents chez deux espèces différentes issus du
même gène ancestral. En règle générale, ces gènes remplissent la même fonction chez chaque
espèce.

Les mutations survenant dans les gènes sont soumises à une pression sélective qui tend à maintenir
la fonction optimale des gènes. Cette pression sélective entraine l’élimination des mutations nocives
qui conduisent à une perte de fonction partielle ou complète des gènes. Pour cette raison, les
mutations s’accumulent moins rapidement dans les régions portant l’information génétique (les
exons) que dans les séquences intervenantes (les introns).

L’accumulation de mutations dans des gènes orthologues, et la divergence en séquence et en


fonction qui en résulte, peut aboutir à des gènes tellement différents qu’il devient impossible
d’affirmer qu’ils sont issus d’un même gène ancestral commun. On a alors des gènes nouveaux,
différents des gènes d’origine, et la proportion de gènes orthologues diminue.

La similarité du génome de la souris et de celui de l’Homme fait de la souris un modèle utile pour
l’étude de maladies humaines, La souris est en effet utilisée comme modèle animal pour laboratoire
pour les maladies génétiques. La même mutation entraine la même maladie, les mêmes
conséquences.

Duplication

Lors de la méiose, une cellule diploïde va se diviser pour donner naissance à quatre cellules filles
haploïdes. Lors de la division
cellulaire, les chromosomes vont
s’apparier. Les éléments de
recombinaison contribuent é la
plasticité du génome. Au cours de
la méiose, un alignement mal fait
à cause de recombinaisons entre
séquences répétées aura comme
résultat la duplication d’un gène
(la délétion existe également).

28
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

La duplication de gènes au sein d’une espèce, suivie par leur divergence en séquence, donne lieu à
des gènes homologues, mais différents appelés gènes paralogues. Ce processus a été une source
importante d’innovation au cours de l’évolution. Les duplications peuvent concerner un seul gène, un
groupe de plusieurs gènes ou de grands segments du génome. L’accumulation de mutations dans des
gènes paralogues, et la divergence en séquence qui en résulte, peut aboutie à des gènes tellement
différents qu’il devient impossible d’affirmer qu’ils sont issus de la duplication d’un gène ancestral
commun.

Des cycles répétés de duplication génique, suivi de diversification des gènes dupliqués, a donné lieu à
de nombreuses familles de gènes dans les génomes eucaryotes. Près de la moitié des gènes humains
peuvent être regroupés en famille.

Définition :

Les gènes paralogues sont des gènes issus d’un événement de duplication survenu au sein d’une
même espèce.

Les gènes orthologues sont des gènes chez deux espèces différentes issus du même gène ancestral.

Les gènes homologues sont des gènes (orthologues ou paralogues) présentant une similarité de
séquence nucléotidique évidente.

Combinaison d’exons

Beaucoup de gènes actuels sont constitués d’un patchwork de segments géniques provenant de
plusieurs gènes ancestraux différents. Ces gènes mosaïques résultent d’événements de
recombinaison illégitimes entre gènes ancestraux différents, ou de la transposition d’une région d’un
gène à un autre.

Ce brassage de segments géniques a été grandement facilité par le morcellement de l’information


génétique sous la forme d’exons séparés par des introns. Des recombinaisons illégitimes survenant
au niveau des introns permettent de réuni des exons initialement séparés dans des gènes différents.
Comme pour la duplication de gènes, on pense que les recombinaisons illégitimes donnant lieu aux
brassages d’exons sont dues en partie à des recombinaisons entre séquences répétées.

29
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Organisation du matériel génétique


Le premier niveau d’organisation génétique est le noyau, qui n’existe que chez les eucaryotes. Le
génome est stocké dans le noyau. Chaque cellule contient 2 mètres d’ADN. Un être humain a 1013
cellules, contenant donc un total de 2x1013 mètres d’ADN, soit 20 milliards de kilomètres. La taille du
génome est donc un problème. La solution est d’empaqueter l’ADN sous forme de chromatine.

La chromatine est un complexe nucléoprotéique constitué d’ADN et de protéines, principalement des


histones. Les protéines histones constituent approximativement 50% de la masse totale de la
chromatine. La chromatine forme une structure complexe : elle compacte l’ADN, qu’elle enroule
autour de nucléosomes.

Le nucléosome est l’unité fondamentale de la chromatine, faite d’une courte longueur d’ADN
enroulée autour d’un noyau d’histones. L’ADN tourne autour du nucléosome, il est enroulé 1,6 fois
autour du noyau des histones. Le nucléosome est composé de 4 protéines, des histones, différentes.
Le nucléosome contient deux copies de chaque protéine.

Les histones H2A, H2B, H3 et H4 sont parmi les plus conservées de toutes les protéines eucaryotes.
Ce sont des petites protéines riches en acides aminés chargés positivement. Ces charges positives
permettent aux histones de se lier fortement au squelette sucre-phosphate de l’ADN, qui est chargé
négativement.

Les nucléosomes permettent de compacter 6 fois l’ADN. Les nucléosomes sont espacés le long de
l’ADN à des intervalles d’environ 200 paires de nucléotides, soit 146 paires de nucléotides pour l’ADN
enroulé autour du noyau d’histones plus environ 50 paires de nucléotides pour le segment d’ADN nu
faisant la liaison entre deux nucléosomes adjacents. La formation des nucléosomes transforme une
molécule d’ADN en un fil chromatinien (un collier de perles) d’environ un sixième de sa longueur
initiale, et elle constitue le premier niveau d’enroulement de l’ADN.

Le deuxième degré d’organisation s’appelle la fibre de 30 nanomètres. Les nucléosomes sont empilés
les uns sur les autres pour constituer une structure plus compacte, la fibre de 30 nm d’épaisseur,
contenant 6 nucléosomes par tour. La chromatine directement isolée d’un noyau interphasique se
trouve principalement sous cette forme. Cette structure permet de compacter 6 fois la structure en
collier de perles.

30
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Les histones possèdent des extrémités amino-terminales qui dépassent du nucléosome. Les
extrémités des histones composant un nucléosome peuvent de ce fait interagir avec les extrémités
des histones du nucléosome adjacent. Les extrémités des histones stabilisent la fibre de 30 nm.

La compaction des nucléosomes en fibre de 30 nm dépend aussi d’une cinquième histone appelée
H1. Une protéine H1 se lie à chaque nucléosome, contactant aussi bien l’ADN que le noyau des
histones. Cette liaison de H1 au nucléosome modifie le chemin que l’ADN suit à la sortie du
nucléosome (indiqué par les flèches). On pense que ce changement de conformation provoqué par la
liaison de H1 permet de maintenir ensemble les nucléosomes en rangée répétées régulières.

31
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

La fibre de chromatine de 30 nm peut être compactée encore plus. On pense que la fibre de 30 nm
est organisée en boucles émanant d’un axe central appelé la charpente chromosomique. La
charpente chromosomique est formée par les protéines non-histones. La formation en boucles
permet l’accessibilité à l’information, alors que l’ADN non-codant se pose sur la charpente
chromosomique. L’organisation en boucle permet donc un degré de compaction supplémentaire tout
en maintenant l’ADN accessible.

On pense que la structure en boucles émanant d’une charpente chromosomique subit encore au
moins un degré supplémentaire de condensation pour former le niveau de compaction le plus élevé
de la chromatine interphasique, appelé l’hétérochromatine. Chez les mammifères,
l’hétérochromatine est typiquement concentrée autour de la région centromérique et aux
extrémités (télomères) des chromosomes. Le chromosome X inactivé chez les mammifères femelles
est aussi presque entièrement sous forme d’hétérochromatine. L’hétérochromatine est inactive
transcriptionnellement. Les gènes qui s’y trouvent ne s’y trouvent pas exprimés. Le reste de la
chromatine interphasique existe sous une forme plus ou moins déroulée et est appelée
euchromatine. Les gènes qui sont activement transcrits se trouvent dans l’euchromatine.

32
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

L’hétérochromatine est
située principalement à la
périphérie, immédiatement
sous l’enveloppe nucléaire,
tandis que l’euchromatine
est répartie de manière
diffuse dans le noyau. La
réplication de l’ADN se fait
lors de la phase S
(synthèse) du cycle
cellulaire. L’ADN présent
dans l’euchromatine est
généralement répliqué avant l’ADN présent dans l’hétérochromatine. Le nucléole est le lieu de
synthèse des ARN ribosomiaux (ARNr) et l’assemblage des ribosomes.

Lors de la division cellulaire, les chromosomes


mitotiques sont constitués entièrement de
chromatine hautement compactée. La taille d’un
chromosome mitotique obtenu après condensation
maximale (plus de 10'000 fois plus court que l’ADN
empaqueté) est compatible avec la taille d’une
cellule en division. La division cellulaire (mitose) est
répartie en plusieurs phases. Au cours de
l’anaphase, les chromosomes sont tirés vers deux
pôles pour donner naissance aux deux cellules filles.

Len résumé, les niveaux de condensation caractéristique de l’euchromatine et de l’hétérochromatine


se retrouvent dans une cellule en interphase. Lors de la division cellulaire (mitose), tous les
chromosomes se trouvent sous forme de compaction maximale.

33
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

5. De l’ADN à l’ARN
Expression génique
Il y a deux définitions possibles pour l’expression génique.

L’expression génique est le processus par lequel un gène exerce son effet sur une cellule ou sur un
organisme.

L’expression génique est le processus par lequel une information génétique contenue dans un gène
est lue et une molécule effectrice correspondante est produite.

Les protéines sont fondamentales dans le processus d’expression génique. Une protéine effectrice
est une molécule ayant une fonction spécifique, alors que l’ARN transporte uniquement
l’information, il s’agit alors d’une molécule de transport. Si un gène est exprimé, cela signifie que la
protéine correspondante est présente dans la cellule.

L’expression génique repose sur le dogme central. Une copie de l’ADN sous forme d’ARN messager
est une étape indispensable pour l’expression génique, il s’agit du processus de transcription.
Ensuite, l’ARN contient les instructions qui seront lues par les ribosomes pour la synthèse des
protéines correspondantes. La traduction est une machinerie complexe étudiée plus tard.

Chez les procaryotes, la transcription et la traduction ont lieu dans le même compartiment cellulaire.
Il n’y a donc pas de séparation physique ou temporelle entre les deux événements que sont la
transcription et la traduction. Autrement dit, la traduction a lieu au même endroit que la
transcription. De ce fait, la transcription et la traduction peuvent être couplées, c’est-à-dire que la
traduction d’un ARN peut débuter avant que la synthèse de l’ARN ne soit terminée.

Chez les eucaryotes, la transcription et la traduction ont lieu


dans deux compartiments cellulaires différents (le noyau et le
cytoplasme) séparés par une membrane (l’enveloppe nucléaire).
Il y a donc une séparation physique et temporelle entre ces
deux processus. L’ADN doit quitter le noyau et aller dans le
cytoplasme pour la traduction. Le niveau de contrôle est alors
plus diversifié et plus fort.

34
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

La première étape du processus utilisé par une cellule pour lire les instructions génétiques contenues
dans son ADN consiste à copier les unités d’information – les gènes – dont elle a besoin sous la forme
d’une molécule d’ARN dont la nature chimique est très similaire à celle de l’ADN. L’ADN et l’ARN ont
le même « langage », elles ont une forme chimique similaire, voire identique à base de nucléotides
formés de bases azotées. Cette étape est appelée transcription, car l’information, bien que copiée
sous une forme chimique légèrement différente, est écrite dans le même langage – le langage des
nucléotides – que celui de l’ADN. La transcription est le processus par lequel l’information contenue
dans le génome (ADN) est copiée sous une forme (ARN) qui pourra être utilisée par la cellule. La
transcription a lieu sous l’activité enzymatique de l’ARN polymérase.

Il y a plusieurs avantages de faire une copie de l’information génétique sous forme d’ARN. La copie
sert à protéger le génome, qui reste dans le noyau, alors que l’information est transportée dans le
cytoplasme. Elle permet également de contrôler le nombre de copies en fonction des besoins de
l’organisme, L’utilisation d’ARN permet de produire plusieurs ARN différents à partir d’un même
gène en utilisant différentes combinaisons d’exons. La copie d’ARN permet aussi de localiser
l’information génétique à des endroits précis de la cellule.

Contrôle du nombre de copies

Un organisme vivant est une entité capable de perdurer et de se multiplier dans un environnement
changeant. Ceci relève d’un processus dynamique et exige une capacité à réagir. De plus, chez les
organismes multicellulaires, toutes les cellules partagent le même matériel génétique. Pourtant, des
cellules différentes peuvent avoir des fonctions très différentes, et une même cellule peut remplir
différentes fonctions selon son état de différentiation. C’est pour ces raisons que chaque cellule doit
impérativement pouvoir contrôler le niveau d’expression de ses gènes en fonction de son identité, de
sa fonction et de ses besoins du moment. La manière la plus simple et la plus économique de
contrôler l’expression génique consiste à contrôler le nombre de copies d’ARNm synthétisées.

Les cellules répondent à des stimuli extérieurs en modifiant le nombre d’ARNm synthétisés. Il y a
différents profils d’expression génétique. Certains gènes sont exprimés de la même façon dans
toutes les cellules, on les appelle cellules de ménage. Certains gènes ont une spécificité cellulaire, qui

35
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

entrainent des différences dans la synthèse cellulaire. Par exemple, le système nerveux a besoin de
neurotransmetteurs, alors que le système digestif doit synthétiser des enzymes de digestion. . Les
hormones jouent également un rôle important dans l’expression génique.

Il y a deux notions importantes dans l’expression génique. Tout d’abord, il y a une étape limitante. Si
on arrête la synthèse d’ARNm, on arrête également la synthèse de protéines, car les protéines sont
produites à la même quantité que l’ARNm (concept des deux vannes). Il existe aussi un système de
régulation de synthèse de protéines à partir de l’ARNm.

De plus, aucune molécule n’est éternelle. Pour les molécules, on parle de durée de demi-vie (durée
pour que la moitié des molécules meurent). La notion de demi-vie explique pourquoi on peut
diminuer la quantité d’un ARN dans une cellule en arrêtant sa production. Sans demi-vie, arrêter la
production d’un ARN conduirait à bloquer le niveau de protéines dans la cellule mais pas de diminuer
le nombre de protéines. La seule façon d’éliminer les protéines dans les cellules est de les détruire.

Ces deux raisons expliquent pourquoi tous les organismes vivants ont développé un système de
synthèse de protéines via l’ARNm.

Epissage alternatif

Chez les eucaryotes, l’information génétique réellement utile d’un gène est généralement découpée
en plusieurs segments, appelées exons, séparés entre eux par des régions de l’ADN appelés introns.
L’excision des introns suivi de la jonction des exons se fait au niveau des transcrits primaires (ou pré-
ARNm) et est appelée épissage. La production de plusieurs molécules d’ARNm différentes d’un
même gène par la sélection de différentes combinaisons d’exons s’appelle épissage alternatif.
L’épissage alternatif se limite à inclure ou non un exon dan l’ARNm mature. L’ordre des exons ne
peut pas être modifié. L’épissage alternatif est fréquent chez les eucaryotes supérieurs, ce qui
augmente de manière considérable le nombre de protéines différents pouvant être synthétisés. Les
différentes protéines synthétisées ont des régions, des fonctions et des propriétés différentes.

Localisation de l’information

Dans l’exemple des cellules nerveuses, les ARNm synthétisés dans le noyau sont transportés depuis
le corps cellulaire jusqu’aux extrémités des axones, l’endroit où il doit agir.

Nature biochimique de l’ARN


L’ADN et l’ARN ont une nature chimique très semblable. Les deux molécules sont des polymères
linéaires de polarité 5’-3’ constitués de quatre types de sous-unités nucléotidiques unies entre elles
par des liaisons phosphodiester identiques. Toutefois, l’ARN diffère chimiquement de l’ADN de deux
façons.

36
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Les deux molécules diffèrent par la nature du sucre. Les nucléotides de l’ARN sont des
ribonucléotides, c’est-à-dire qu’ils contiennent le sucre ribose à la place du désoxyribose trouvé dans
l’ADN. Le ribose diffère du désoxyribose par la présence d’un groupement hydroxylé (OH)
supplémentaire sur le carbone 2’.

Bien que l’ARN, comme l’ADN, contienne les bases adénine (A), guanine (G) et cytosine(C), il contient
de l’uracile (U) alors que l’ADN contient de la thymine (T). L’uracile diffère de la thymine seulement
par l’absence d’un groupement méthyle sur le carbone 5’. L’uracile a donc la même complémentarité
avec l’adénine que la thymine.

Les deux molécules diffèrent d’une façon majeure dans leur structure globale. Alors que l’ADN existe
toujours sous forme d’une hélice double brin, l’ARN nouvellement synthétisé est simple brin.

La nature monocaténaire de l’ARN permet à certaines molécules de se replier et d’acquérir des


structures essentielles à leur fonction. Ces molécules ont des segments qui sont complémentaires,
qui leur permet de s’apparier et faire des boucles, la forme tridimensionnelle complexe spécifique
étant fondamentale. La structure tridimensionnelle est déterminée par la séquence. Cette capacité
de se replier sur eux-mêmes pour former une structure tridimensionnelle permet à certains ARNs
(tels que les ARNs ribosomaux, les ARNs de transfert et les petits ARNs nucléaires) d’assurer des
fonctions structurales et mêmes catalytiques.

37
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Synthèse de l’ARN
La totalité de l’ARN présent dans une cellule est produite par transcription, processus qui présente
de grandes similitudes avec la réplication de l’ADN. Comme pour la réplication de l’ADN, la séquence
nucléotidique de la chaine d’ARN en croissance est déterminée par l’appariement complémentaire
des ribonucléotides nouveaux sur la matrice d’ADN. Suite à l’appariement du ribonucléotide
adéquat, une liaison covalente est créée entre ce dernier et la chaine d’ARN en croissance. Cette
réaction, une attaque nucléophile avec le groupe 3’OH du sucre, est catalysée de manière
enzymatique par une protéine appelée ARN polymérase. Ainsi, la chaine d’ARN s’allonge, nucléotide
après nucléotide, dans le sens 5’-3’. Les précurseurs utilisés pour la synthèse de l’ARN sont des
ribonucléotides triphosphates (ATP, CTP, UTP, GTP). L’hydrolyse des liaisons riches en énergie des
ribonucléotides triphosphates fournit l’énergie nécessaire à la réaction de polymérisation.

L’uracile possède les mêmes propriétés d’appariement de bases que la thymine. Ainsi, les paires de
bases U-A dans un hybride ARN-ADN ressemblent étroitement aux paires de bases T-A présents dans
l’ADN double brin. Ce qui distingue l’uracile de la thymine est éloigné des groupements chimiques
impliqués dans l’appariement des bases azotées. La seule différence réside dans la présence d’un H
au lieu d’un méthyle sur le carbone 5.

La transcription débute par l’ouverture et le déroulement d’une petite portion de la double hélice
d’ADN, afin d’exposer les bases de chaque brin d’ADN. Un des deux brins de l’ADN (brin matrice) sert
alors de matrice à la synthèse de l’ARN. Comme pour la réplication de l’ADN, la séquence
nucléotidique de la chaine d’ARN naissante est dictée par l’appariement complémentaire des
ribonucléotides nouveaux sur la matrice d’ADN. Par conséquent, la chaine d’ARN produite (le
transcrit) possède une séquence nucléotidique exactement complémentaire à celle du brin d’ADN
faisant office de matrice. Comme pour la synthèse de l’ADN, la synthèse de l’ARN se fait dans un sens
5’-3’.

38
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Un seul des deux brins d’ADN sert de matrice pour la synthèse de l’ARN. L’utilisation du brin
complémentaire comme matrice conduirait à la synthèse d’un ARN dont la séquence contiendrait
une information totalement différente et par conséquent inutile. Le début du gène est indiqué dans
la séquence. Cette séquence détermine quel brin d’ADN va être synthétisé.

Les ARN sont synthétisés par des ARN polymérases à une vitesse de 30 nucléotides par seconde.
L’ARN polymérase s’attache au début du gène, sépare les deux brins de la double hélice d’ADN,
créant ainsi une bulle, qui se déplace le long de l’ADN en déroulant l’hélice devant elle. La synthèse
se fait de l’extrémité 3’ à l’extrémité 5’. Dans sa progression, l’ARN polymérase ajoute des
nucléotides un par un à la chaine d’ARN naissante. Ce processus peut prendre du temps. Par
exemple, le gène de la dystrophie est long de 2 millions de nucléotides, et sa synthèse peut prendre
16 heures.

ARN polymérases

L’ARN polymérase est un ensemble de différentes protéines. Elle a un motif proche d’une bulle, la
bulle étant enfermée dans la polymérase. Le gouvernail a le rôle de pousser la bulle à s’ouvrir. L’ARN
polymérase ouvre la double hélice d’ADN et se déplace le long de l’ADN en déroulant l’hélice devant
elle. Dans sa progression, l’ARN polymérase ajoute les ribonucléotides un par un à la chaîne d’ARN
naissante au niveau de son site de polymérisation (site d’addition de nucléotides). Une courte région
duplexe ADN/ARN est formée transitoirement entre l’ARN et le brin matrice de l’ADN au niveau de
son site de polymérisation. Les deux brins d’ADN se réassocient à la sortie de l’ARN polymérase, de
sorte que l’ARN nouvellement formé est déplacé de l’hybride ARN/ADN.

39
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

L’ADN polymérase et l’ARN polymérase ont beaucoup de points en commun, et elles ont
probablement une origine commune lors de l’évolution. Les polymérases ont toutes besoin d’une
matrice sous forme de séquence dans l’ADN, ainsi que de sucres et de triphosphates.

Bien que les ARN polymérases catalysent essentiellement la même réaction chimique que les ADN
polymérases, elles diffèrent de ces dernières sur plusieurs points. La différence la plus évidente est
que les ARN polymérases catalysent la polymérisation de ribonucléotides, alors que les ADN
polymérases catalysent la polymérisation de désoxyribonucléotides.

Les ADN polymérases ont besoin d’amorces pour la synthèse sous forme d’une courte séquence
d’ARN. Les ARN polymérases n’ont pas besoin d’amorce pour la synthèse, car les primases pour la
réplication de l’ADN sont des ARN polymérases.

Les ARN polymérases possèdent une activité nucléolytique de correction sur épreuve (proofreading)
moins efficace que les ADN polymérases. Les ARN polymérases font par conséquent beaucoup plus
d’erreurs que les ADN polymérases. Une erreur dans la transcription entraine une protéine non
fonctionnelle, mais en petite quantité, les conséquences sont donc bien moins graves qu’une erreur
dans la réplication. L’ARN n’est pas utilisé comme forme de stockage permanent de l’information
génétique dans les cellules.

Certaines ARN polymérases virales, telles que celles du virus du SIDA possèdent une polymérase
constituée d’une seule protéine. Par contre, toutes les ARN polymérases cellulaires sont des enzymes
complexes formés de plusieurs protéines (sous-unités). Chez les bactéries, il existe une seule ARN
polymérase contenant quatre sous-unités. Chez les eucaryotes, il existe trois ARN polymérases
différentes, chacune faite de multiples sous-unités (10-12). Certaines de ces sous-unités sont
identiques pour les trois ARN polymérases. D’autres sous-unités sont uniques à chaque ARN
polymérase, mais elles sont néanmoins similaires et codées par des gènes homologues (paralogues =
issus d’une duplication génique). Certaines sous-unités des ARN polymérases eucaryotes sont des
homologues (orthologues) des sous-unités de l’ARN polymérase bactérienne. Une des sous-unités de
l’ARN polymérase II contient une extrémité, appelée CTD (pour C-terminal Domain en anglais), qui lui
est unique et qui jour un rôle important lors de la maturation des ARNs messagers.

Catégories d’ARN

40
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Il y a deux catégories d’ARN différentes : les ARNs fonctionnant comme effecteurs (non-codants) et
les ARNs portant une information génétique (codants). Les ARN effecteurs ont une fonction dans la
cellule autre que de transporter l’information génétique, il s’agit d’une molécule ouvrière. Cette
catégorie est composée des ARN ribosomaux, des ARN de transfert et des petits ARN. Ils ont une
structure bien définie et nécessaire à leur fonction. Les ARN codants sont les ARN messagers, ils
n’ont pas de structure globale précise. Les deux types d’ARN sont nécessaires pour la production de
protéines.

Les ARN non-codants remplissent plusieurs fonctions, dont une des plus importantes est la
traduction des ARNm en protéines. Les ARN ribosomaux (ARNr) constituent le noyau structurel des
ribosomes, qui sont de grandes machines moléculaires responsables de la traduction en protéines de
l’information contenue dans l’ARNm. Les ARN de transfert (ARNt) fonctionnent comme adaptateurs
en sélectionnant les acides aminés en les maintenant en place sur les ribosomes lors de la synthèse
de protéines. Les petits ARN sont impliqués dans diverses fonctions, notamment dans l’épissage des
transcrits primaires (pré-ARNm), le transport des protéines vers le réticulum endoplasmique (ER), la
régulation de la traduction, et la réplication des extrémités des chromosomes (télomérase).

Les trois ARN polymérases des eucaryotes assurent la transcription de différentes classes de gènes.
L’ARN polymérase I est responsable de la synthèse des ARN ribosomaux (ARNr). L’ARN polymérase II
synthétise tous els ARN messagers (ARNm). L’ARN polymérase III se charge de la synthèse des ARN
de transfert (ARNt) et d’autres petits ARN.

ARN ribosomaux

Les ARN ribosomaux (ARNr) constituent le noyau des ribosomes. Les ribosomes sont de grandes
machines moléculaires responsables de la traduction en protéines de l’information contenue dans les
ARNm. L’ARNr est fortement structuré. Il forme un échafaudage sur lequel viennent s’assembler de
nombreuses protéines ribosomales pour former le ribosome. La structure de l’ARNr est très
complexe, elle se développe grâce à de courtes séquences. Les appariements successifs lui confèrent
cette forme compliquée pour l’appariement. Un seul gène ne suffit pas pour les ARN ribosomaux.

Un nombre très important de ribosomes est nécessaire à la cellule pour assurer la traduction de
toutes les protéines dont elle a besoin. Comme chaque ribosome doit contenir un ARNr pour être
fonctionnel, les ARNr doivent être produits en grande quantité. C’est pourquoi les gènes ARNr sont
présents en de multiples copies dans le génome, et sont transcrits à un niveau très élevé. Les gènes
dirigeant la synthèse des ARNr sont transcrits dans un comportement spécialisé du noyau, appelé le
nucléole. L’assemblage des protéines ribosomales avec l’ARNr pour former les ribosomes commence
dans le nucléole.

L’ARN polymérase I produit un ARN précurseur, qui sera coupé en petits morceaux. Cette étape
s’appelle le clivage. Ces entités séparées seront incorporées dans l’ARN ribosomal. Les ARN
ribosomaux constituent 80% de la masse de l’ARN dans les cellules. Il y a environ 2,5 millions d’ARN
ribosomaux par cellule.

41
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

ARN de transfert (ARNt)

Les ARN de transfert (ARNt) fonctionnent comme adaptateurs en sélectionnant les acides aminés et
en les maintenant en place sur les ribosomes lors de la synthèse de protéines. Les ARNt ont une
structure typique, dite en feuille de trèfle, stabilisée par l’appariement de régions contenant des
bases complémentaires.

Les ARN de transfert sont de petite taille, mais ont un rôle déterminant. Les ARNt vont faire le lien
entre les informations de l’ARN et la nature des pièces détachées, soit les acides aminés. Il s’agit d’un
adaptateur entre les instructions et les produits de synthèse. Les ARN sont repliés sur eux-mêmes, le
nombre de gènes pour la synthèse de l’ARNt est très important. Les ARNt contiennent le code
génétique, qu’on étudiera lors de la traduction.

Les ARN de transfert constituent environ 10 à 15% de la masse totale d’ARN dans la cellule. Il y a
environ 20 millions d’ARNt par cellule.

Autres petits ARN

Les petits ARN sont impliqués dans des fonctions diverses, notamment dans l’épissage des pré-
ARNm, le transport des protéines vers le réticulum endoplasmique, la régulation de la traduction, et
la réplication des extrémités des chromosomes. Les petits ARN impliqués dans l’épissage s’appellent
snRNAa (small nuclear RNAs). Il y a environ 1000 gènes pour la synthèse de petits ARN.

Une autre catégorie d’ARN est constituée des « raising stars », dont le mode de fonctionnement n’est
pas connu. Les nouvelles stars sont des micro-ARN (~20 nucléotides), qui sont présents en grande
quantité dans l’organisme. Le nombre n’est pas encore déterminé, mais il a tendance à grandir. Le
grand nombre de micro-ARN suggère une fonction importante.

Il y a également des longs ARN non codants, qui ne contiennent pas d’instructions pour la synthèse
de protéines. Les ARN non-codants conservés entre les espèces suggèrent une fonction importante,
on pense qu’ils influent l’expression des gènes.

ARN messagers

Chez les eucaryotes, une molécule d’ARNm contient les instructions nécessaires à la synthèse d’une
seule protéine. La partie codante de l’ARNm, soit l’information
qui sera lue par les ribosomes lors de la synthèse de la protéine,
est bordée en 5’ et en 3’ par des régions non-codantes.
L’information génétique, la région codante, ne recouvre pas la
totalité de l’ARN. La région utilisée pour la synthèse n’est qu’une
partie de l’ARN. Le brin d’ARN a un début et une fin, qui
informent les polymérases du début et de la fin du gène. Il s’agit
des régions 5’ et 3’ non codantes.

La fonction des ARN messagers est de porter l’information


nécessaire à la synthèse de protéines du noyau au cytoplasme.
Elles n’ont pas de fonction particulière. Les ARN messagers
constituent 3 à 5% de la masse totale d’ARN. Cette petite masse

42
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

d’ARN est constituée d’un nombre important d’ARNm, soit d’environ 10'000 ARN messagers
différents, dont la taille varie beaucoup. Certains ARN n’ont qu’une copie dans la cellule, d’autres en
ont beaucoup. Le nombre total de molécules est d’environ 300'000 par cellule.

Maturation des ARNm


L’ARN transcrit par la polymérase ne peut pas directement être utilisé pour la synthèse de protéines,
une modification est nécessaire, appelée maturation. La maturation des ARNm se fait en trois
étapes : il y a ajout d’une coiffe à l’extrémité 5’ de l’ARNm et d’une queue poly(A) à l’extrémité 3’,
ainsi que l’élimination des introns.

Coiffe et queue poly(A) des ARNm

Les extrémités 5’ et 3’ des ARNm eucaryotes sont modifiées. L’extrémité 5’ des ARNm eucaryotes est
modifiée par l’ajout d’une coiffe. L’extrémité 3’ des ARNm eucaryotes est modifiée par l’addition
d’une queue poly(A), un processus appelé polyadénylation. La coiffe et la queue poly(A) augmentent
la stabilité de la molécule d’ARNm, aident à son transport du noyau vers le cytoplasme, et jouent un
rôle clé dans sa traduction.

L’extrémité 5’ des ARNm eucaryotes est modifiée lors de la transcription par l’addition d’un
nucléotide atypique – une guanine (G) – sur laquelle est fixé un groupement méthyle (CH3). Cette
liaison nécessite l’intervention de trois enzymes, ce qui montre que la coiffe est essentielle. La coiffe
est ajoutée juste après que l’ARN polymérase II ait synthétisé l’extrémité 5’ de l’ARN (environ 20
nucléotides). La coiffe est ajoutée non pas par l’ARN polymérase II, mais par l’intervention d’une
série de trois enzymes différentes. La coiffe est ajoutée juste quand l’ARNm sort du noyau, et elle
constitue un signal important lors de la synthèse de la protéine.

Queue poly(A) en 3’

Chez les eucaryotes, la synthèse des ARNm par l’ARN polymérase II ne se termine pas à un endroit
précis. Alors que le début est fixe, la fin peut être variable, car la longueur de l’extrémité peut
changer. Cependant, une extrémité 3’ commune est produite par clivage par une enzyme des ARN

43
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

nouvellement synthétisés juste après une séquence particulière appelée le signal de polyadénylation.
La partie 3’ ainsi libérée est inutile et sera dégradée (détruite) dans le noyau. Une seconde enzyme,
la Poly(A) polymérase, ajoute ensuite une série d’adénines (A) à l’extrémité nouvellement formée de
l’ARNm à la suite du signal de polyadénylation. La poly(A) polymérase n’est par une ARN polymérase
typique, car elle est capable d’ajouter la queue poly(A) en l’absence d’une matrice. La longueur de la
queue poly(A) est en général de 100 à 250 nucléotides.

Elimination des introns

Chez les eucaryotes, l’information génétique réellement utile d’un gène est généralement découpée
en plusieurs segments, appelés exons, séparés entre eux par des régions de l’ADN appelés introns.
Par définition, un exon est un segment d’un gène, dont la séquence se retrouve dans l’ARNm
mature.

Dans un premier temps, une longue molécule d’ARN comprenant tous les exons et introns et appelée
la transcrit primaire (ou pré-ARNm) est synthétisée par l’ARN polymérase II. Dans un deuxième
temps, et avant que l’ARNm ne quitte le noyau, toutes les séquences introniques sont excisées du
transcrit primaire, et les exons sont reliés entre eux par un processus appelé épissage. L’épissage de
tous les introns est une condition essentielle à l’export de l’ARNm du noyau dans le cytoplasme.

L’épissage est le processus par lequel les séquences introniques sont excisées des transcrits
primaires (ou pré-ARNm) dans le noyau, pour donner naissance aux ARN messagers matures.

Il faut faire une distinction entre les régions introniques éliminées par épissage et les régions non-
codantes présentes aux extrémités 5’ et 3’ des ARNm matures. Les régions codantes et non-codantes
n’ont une signification que lors de la traduction. Par définition, un exon est un segment d’un gène

44
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

eucaryote dont la séquence se retrouvera dans l’ARNm mature. Les régions non-codantes présentes
aux extrémités 5’ et 3’ des ARNm proviennent toujours d’exons. Un gène commence et finit toujours
par un exon, mais ces exons ne sont pas codants. Un exon peut donc se trouver dans un ARNm,
même s’il n’est pas codant.

Signaux d’épissage sur ARNm

Trois séquences nucléotidiques sont nécessaires pour permettre l’élimination d’un intron. Les trois
séquences indiquées sur le schéma sont des séquences dites « consensus », établies sur la base de
l’examen de nombreux introns différents. Une séquence « consensus » est une séquence idéalisée
d’une région donnée indiquant la base rencontrée le plus fréquemment à chaque position. R signifie
la présence d’une purine (G ou A) à cette position. Y signifie la présence d’une pyrimidine (C ou U) à
cette position. N signifie qu’à cette position aucune base n’est préférée. Les nucléotides les plus
conservés sont GU au début de l’intron et AG à la fin de l’intron. Les autres positions sont plus
variables. L’adénine (A) indiquée par une flèche rouge est un nucléotide clé dans la réaction
d’épissage. Ce A est situé typiquement à environ 30 nucléotides de l’extrémité 3’ de l’intron. Il
constitue le point de branchement du lasso produit dans la réaction d’épissage.

Les séquences sont donc impliquées dans le processus d’épissage. L’intron commence par GU et finit
par AG. Il contient une adénine (A) dans sa séquence qui a un rôle déterminant dans l’excision. Ces
séquences représentent les sites et l’information de l’épissage.

45
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Des mutations dans les séquences nécessaires à l’épissage d’un intron ont généralement des
conséquences très graves, les sites d’épissage mutés n’étant plus reconnus correctement par la
machinerie d’épissage. La mutation change la G du début de l’intron en A, le site n’est donc plus
reconnu. Il y a donc un épissage anormal et la protéine est anormale.

Le syndrome des lymphocytes nus en est un exemple. Chez ces malades, un gène contenant
l’information nécessaire à la synthèse d’un coactivateur est muté. La mutation remplace un G en A
au niveau du premier nucléotide d’un intron, conduisant à l’excision de l’exon précédent de
nucléotide muté comme si ce dernier faisait partie de l’intron. Or, cet exon contient une information
essentielle à la fonction normale du coactivateur.

Mécanisme de l’épissage

L’intron est excisé par deux réactions de trans-estérification successives.

Tout d’abord, une adénine (A en rouge) située dans l’intron réagit avec le site d’épissage 5’ et coupe
le squelette sucre-phosphate de l’ARN à ce niveau. La réaction est due à une attaque nucléophile par
le groupement hydroxyle (OH) situé en 2’ du ribose du A sur la liaison phosphodiester situé juste en
amont du premier nucléotide de l’intron. L’extrémité 5’ de l’intron devient ainsi liée de manière
covalente à l’adénine, formant une boucle aussi appelée lasso.

L’extrémité 3’ libérée du premier exon réagit alors avec le début du second exon, coupant l’intron à
son extrémité 3’ et joignant par la même occasion les deux exons ensemble. La réaction est due à
une attaque nucléophile par le groupement hydroxyle (OH) 3’ libre du premier exon sur la liaison
phosphodiester situé après le dernier nucléotide de l’intron.

Le lasso contenant l’intron, inutile, est dégradé dans le noyau.

46
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

L’épissage de l’ARN est assuré par un ensemble de petites particules nucléaires ribonucléoprotéiques
appelées snRNPs (de l’anglais, small nuclear RiboNucleoProtein particles), contenant des petits ARNs
associés à des protéines. Les petits ARN contenus dans les snRNPs sont appelés snRNAs. Les snRNPs
reconnaissent et se lient aux différents signaux d’épissage présents sur l’ARNm par appariement
complémentaires avec des séquences présentes dans les snRNAs.

Des interactions entre les différents snRNPs liés aux signaux d’épissage sur l’ARN permettent le
rapprochement de deux extrémités de l’intron, de sorte que la réaction d’épissage peut avoir lieu.
Les contacts sont déterminés par les séquences des protéines, qui permettent le clivage entre introns
et exons.

Le coiffage, l’épissage et la polyadénylation sont des modifications uniques aux ARN synthétisés par
l’ARN polymérase II. Ces modifications se font de manière co-transcriptionnelle, c’est-à-dire alors que
la synthèse des transcrits est en cours. Ces deux observations s’expliquent par le fait qu’une partie
des facteurs protéiques impliqués dans le coiffage, l’épissage et la polyadénylation voyagent avec
l’ARN polymérase II lors de la transcription. Ces facteurs s’attachent à une région, appelée CTD (de
l’anglais, C-Terminal Domain), située à l’extrémité C-terminale de la plus grande sous-unité de l’ARN
polymérase II. Le CTD est unique à l’ARN polymérase II. Les ARN polymérases I et III en sont
dépourvues.

Transport des ARNm

Une fois leur synthèse terminée, les ARNm matures doivent être transportés depuis le noyau
jusqu’au cytoplasme. Pour ce faire, les ARNm sont transportés à travers des pores dans la double
membrane constituant l’enveloppe nucléaire. L’enveloppe nucléaire est perméable, l’ARNm passe
par des pores nucléaires. Les pores nucléaires sont des structures très complexes formées par un
ensemble de protéines appelé le complexe du pore nucléaire. Chaque complexe est composé d’un

47
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

grand nombre de sous-unités protéiques distinctes. Des fibrilles protéiques font saillie à partir des
deux côtés du complexe. Du côté nucléaire, elles convergent pour réaliser une structure en forme de
cage.

Lors de sa synthèse, l’ARNm est « emballé » par des protéines pour former un complexe
ribonucléoprotéique, qui sera transporté à travers le complexe du pore nucléaire.

Différentes protéines se lient à des régions différentes des ARNm. Une des fonctions de certaines de
ces protéines est de permettre le transport de l’ARNm à travers le pore nucléaire. Une partie des
protéines restent liées à l’ARNm lors de son passage par le pore nucléaire, comme par exemple les
protéines se liant à la coiffe et à la queue poly(A), alors que d’autres protéines restent dans le noyau.

La fixation des protéines pour former un complexe nucléoprotéique constitue l’une des façons de
contrôler la viabilité de l‘ARNm. La présence des protéines et son repliement garantissent que
l’ARNm est mature.

48
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

6. Régulation de l’expression des gènes


L’expression génique est le processus par lequel un gène exerce son effet sur une cellule ou sur un
organisme. Il peut également être défini comme le processus par lequel une information génétique
contenue dans un gène est lue et une molécule effectrice correspondante (ARN ou protéine) est
produite.

La régulation des l’expression génique contrôle la production ou la non-production et les quantités


de production.

Un organisme vivant est une entité capable de se maintenir et de se multiplier dans un


environnement changeant. La régulation de l’expression des gènes permet donc de préserver
l’équilibre intérieur malgré les changements de l’environnement extérieur. La régulation de
l’expression génique permet donc d’exprimer davantage ou moins les gènes selon les facteurs
extérieurs.

La régulation implique donc une interaction dynamique de l’organisme avec son environnement, qui
exige une capacité de l’organisme à réagir et à s’adapter aux conditions dans l’environnement. Ceci
implique un changement dans l’utilisation de l’information génétique, c’est-à-dire d’adapter
l’expression des gènes, en fonction des besoins.

Chez les organismes multicellulaires, la régulation de l’expression génique est d’autant plus
importante. Le développement d’un œuf en un organisme adulte nécessite de nombreux
changements dans l’expression génique au cours du temps et dans différents tissus. Des cellules
différentes ont des fonctions différentes bien que partageant le même matériel génétique, par
exemple les neurones et les lymphocytes. Une même cellule peut remplir des fonctions différentes
selon son état de différentiation, comme les lymphocytes B, matures ou immatures.

Le développement embryonnaire est sous le contrôle de gènes exprimés en cascade à différents


stades du développement. Une régulation de l’expression génique au cours du développement peut
conduire à des anomalies.

Profils d’expression génique

Certains gènes remplissent des fonctions essentielles et doivent être exprimés en permanence et
dans toutes les cellules (gènes de ménage). Certains gènes doivent être exprimés uniquement dans
certains types de cellules (développement, spécificité cellulaire), c’est-à-dire que chaque type
cellulaire exprime aussi des gènes spécialisés responsables de ses propriétés distinctives. Certains
gènes doivent être exprimés différemment en réponse à des signaux intra-ou extracellulaires. C’est
l’expression d’une collection de gènes différents dans chaque type cellulaire qui entraine les grandes
différences dans la taille, la forme, le comportement et la fonction des cellules différenciées.

Il existe de nombreuses étapes dans l’expression génique, c’est-à-dire dans la voie conduisant de
l’ADN à une protéine fonctionnelle. Chacune de ces étapes peut être contrôlée. L’étape peut donc
être réalisée ou non selon la nature de la cellule, le stade de développement de l’organisme, ou en
réponse à un signal extracellulaire. Généralement, l’expression d’un gène est contrôlée au niveau de
la transcription, c’est-à-dire lors de la synthèse de molécules d’ARN, par l’ARN polymérase II.

49
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Chez les organismes multicellulaires, toutes les cellules partagent le même matériel génétique.
Pourtant, des cellules différentes peuvent avoir des fonctions très différentes, et une même cellule
peut remplir des fonctions distinctes selon son état de différentiation ou en fonction des signaux
qu’elle reçoit de son environnement. Il est donc impératif que chaque cellule puisse contrôler le
niveau d’expression de ses gènes, soit le nombre de copies d’ARN, qu’elle synthétise d’un gène
donné, en fonction de son identité, de sa fonction et de ses besoins du moment.

Le processus de la transcription comporte plusieurs étapes. Dans un premier temps, l’ARN


polymérase se lie au début du gène à transcrire, sur une courte région contenant le site d’initiation
de la transcription. Puis elle sépare les deux brins de la double hélice d’ADN et débute la
polymérisation de l’ARN. Ce faisant, elle quitte le début du gène, puis se déplace le long de l’ADN en
déroulant l’hélice devant elle et en rallongeant la chaine d’ARN naissante, y ajoutant des nucléotides
un par un. Le contrôle de la transcription s’exerce habituellement à la première étape, c’est-à-dire
lors de la liaison de l’ARN polymérase au site d’initiation de transcription.

La liaison de l’ARN polymérase est confrontée à deux problèmes majeurs : les gènes sont dispersés
dans le génome parmi une quantité énorme d’introns (séquences répétées et non-codantes), et
l’ADN est relativement inaccessible à l’ARN polymérase car il est organisé sous forme de chromatine
ayant une structure plus ou moins condensés. La liaison de l’ARN polymérase va donc nécessiter un
mécanisme rendant le début du gène plus accessible.

Il existe cependant des éléments sur la séquence d’ADN, qui indiquent à l’ARN polymérase où elle
doit commencer la réplication et le sens dans lequel elle doit aller. Le promoteur est une courte

50
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

région de l’ADN, typiquement de quelques dizaines de paires de bases, situé au début du gène et
incluant le site d’initiation de la transcription. Le promoteur indique à quel endroit et dans quel sens
la transcription doit démarrer. Les éléments régulateurs sont de courts éléments d’ADN, de 6 à 20
paires de bases, dont la séquence est très variable. Contrairement au promoteur, les éléments
régulateurs diffèrent d’un gène à l’autre et constituent des sites de liaison pour des facteurs
régulateurs. Ils augmentent l’accessibilité de la chromatine, et permettent à l’ARN polymérase
d’accéder à l’ADN. Ce processus permet de réguler la régulation.

Promoteur

Par définition, le promoteur est un court segment d’ADN localisé au début des gènes et contenant
des éléments de séquence permettant la liaison de l’ARN polymérase.

Les promoteurs contiennent souvent une séquence appelée TATA et une séquence appelée INR. La
séquence TATA est une courte séquence principalement composée de nucléotides T et A. Elle est
située à 25-30 nucléotides en amont du site d’initiation de la transcription. La séquence INR (de
l’anglais initiator) est une courte séquence riche en pyrimidines (C et T) située au point d’initiation de
la transcription.

Tous les éléments d’ADN qui constituent les sites de fixation fonctionnent comme des entités faites
de deux brins d’ADN. Par convention, on n’exprime que le brin 5’-3’ du haut. La séquence indiquée
représente une séquence consensus, il s’agit d’une séquence idéalisée dans laquelle chaque position
représente la base rencontrée le plus fréquemment. N signifie qu’à cette position aucune base n’est
privilégiée.

51
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Les ARN polymérases des eucaryotes sont incapables de reconnaitre un promoteur et de s’y lier sans
l’aide de protéines supplémentaires. Pour ce faire, elles ont besoin de l’aide d’un grand groupe de
protéines appelées facteurs généraux de transcription. Ces facteurs doivent s’assembler au niveau du
promoteur pour que l’ARN polymérase puisse s’y attacher et commencer la transcription. Ces
éléments vont diriger l’ARN polymérase II au début du gène et s’y lier.

Facteurs généraux de transcription

Par définition, les facteurs généraux de transcription sont des protéines venant s’assembler sur le
promoteur pour former un complexe d’initiation de transcription. Ces facteurs sont nécessaires à la
transcription de tous les gènes transcrits par l’ARN polymérase II. Ces protéines s’assemblent sur
tous les promoteurs transcrits par l’ARN polymérase II. Il existe un jeu de facteurs généraux de
transcription différent pour chacune des trois ARN polymérases I, II et III. Les facteurs généraux sont
parmi les protéines qui ont été les plus conservées lors de l’évolution.

Le facteur général de transcription TFIID (de l’anglais Transcription Factor D for RNA polymerase II)
joue un rôle essentiel dans la reconnaissance du promoteur. Le TFIID est un complexe constitué de
plusieurs sous-unités protéiques. Une de ces sous-unités, appelée TBP (de l’anglais TATA Binding
Protein), se lie à la boite TATA. Une autre sous-unité reconnait la séquence INR. LA boite TATA et le
promoteur étant asymétriques, la liaison de TFIID détermine aussi bien la position que le sens de la
transcription. La liaison de TFIID sur le promoteur conduit à l’assemblage d’un grand complexe
contenant les autres facteurs généraux de transcription et l’ARN polymérase II.

52
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

La liaison de TBP à la boite TATA provoque une déformation locale de l’ADN spectaculaire. Cette
déformation est due au fait que, contrairement à la plupart des facteurs de transcription régulateurs,
TBP se lie dans le sillon mineur de l’ADN. L’écartement du sillon mineur par l’insertion de TBP résulte
dans une forte tension de l’ADN.

TFIID sert de repère à l’assemblage sur le promoteur de plus de 100 protéines différentes, dont les
autres facteurs généraux de transcription (TFIIB, TFIIH, etc.) et l’ARN polymérase II. L’ensemble de
ces protéines forment un grand complexe appelé complexe d’initiation de transcription.

La séquence des événements conduisant à l’assemblage d’un complexe d’initiation de transcription


complet sur le promoteur n’est pas connue. Une hypothèse propose que le complexe se forme sur le
promoteur avec l’arrivée séquentielle des facteurs généraux et de l’ARN polymérase II. Une autre
hypothèse soutient que les facteurs généraux et la polymérase forment d’abord un grand complexe
avant de rejoindre le promoteur en une seule étape.

Les facteurs de transcription présents dans le complexe d’initiation de transcription ont plusieurs
fonctions distinctes. Ils sont nécessaires pour la transcription de tous les gènes transcrits par l’ARN
polymérase II. Les facteurs de transcription positionnent correctement l’ARN polymérase sur le
promoteur ; ils séparent les deux brins d’ADN afin de permettre à l’ARN polymérase de démarrer la
transcription ; enfin, ils aident l’ARN polymérase à quitter le promoteur une fois la transcription
commencée. Certains facteurs généraux sont aussi impliqués dans le couplage entre la transcription
et la maturation des transcrits primaires.

Un des facteurs généraux de transcriptions (TFIIH) est responsable de la phosphorylation du CTD (de
l’anglais, C-Terminal Domain) de l’ARN polymérase II. La phosphorylation du CTD crée des sites
d’ancrage pour certains facteurs protéiques impliqués dans le coiffage, l’épissage, et le clivage de
l’extrémité 3’ du transcrit primaire suivi de la polyadénylation. Ceci permet à ces facteurs de voyager
avec l’ARN polymérase II, de sorte qu’ils peuvent être transférés sur le transcrit primaire lors de sa
synthèse. La phosphorylation du CTD permet donc le couplage entre la transcription et la maturation
des transcrits primaires synthétisés par l’ARN polymérase II. Les ARN polymérases I et III ne
contiennent pas de CTD, ce qui explique pourquoi les ARN transcrits par ces enzymes ne sont pas
modifiés de la sorte.

Elements régulateurs

53
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Les éléments régulateurs sont des courts éléments d’ADN de séquence très variable, longs de 6 à 20
paires de bases. Ces éléments sont différents d’un gène à l’autre, et sont très souvent
palindromiques, c'est-à-dire que les deux séquences sont les mêmes, mais opposées. Elles se lisent
donc dans les deux sens. Ces éléments régulateurs ont comme fonction de faire en sorte que le
promoteur soit accessible à la polymérase en agissant sur la chromatine. Les éléments régulateurs
régulent ainsi le niveau d’expression, donc le nombre d’ARN synthétisés. Les éléments régulateurs
sont des sites de liaison pour les facteurs de régulation. Bien que la séquence des éléments
régulateurs usuellement indiquée corresponde à celle du brin d’ADN supérieur (brin complémentaire
au brin d’ADN matrice), ces éléments ne sont pas reconnus par les facteurs régulateurs que sous la
forme d’un ADN bicaténaire.

De manière générale, les facteurs régulateurs de transcription sont définis comme des protéines
capables de se lier spécifiquement à un élément régulateur donné d’un gène et de stimuler la
transcription démarrant au promoteur de ce gène.

Les éléments régulateurs ne fonctionnent pas par eux-mêmes, ils servent de site de fixation pour des
protéines appelées facteurs régulateurs de transcription ou « activateurs ». Une fois lié à son
élément régulateur, un activateur stimule la transcription démarrant au promoteur voisin. Chez
l’homme, il existe environ 1'500 gènes codant pour des activateurs, ce qui souligne l’importance de
la régulation de la transcription.

Les activateurs contiennent trois domaines. Le domaine de liaison à l’ADN permet la fixation de
l’activateur sur un élément régulateur donné. Différents activateurs se distinguent par le fait que
leurs domaines de liaison à l’ADN reconnaissent différents éléments régulateurs. Le domaine de
liaison à l’ADN fait toujours des contacts avec les deux brins de l’ADN. Le domaine de dimérisation
d’un activateur fonctionne comme site d’interaction et conduit deux molécules d’un activateur
donné à former une entité appelée un dimère. Le domaine d’activation permet à l’activateur, une
fois lié sur l’élément régulateur, de stimuler la transcription du gène dont il contrôle l’expression. Des
activateurs différents reconnaissent des éléments régulateurs différents. Des centaines de séquences
régulatrices ont été identifiées, et chacune est reconnue par un ou quelques activateurs.

54
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Contrairement aux promoteurs et aux facteurs généraux de transcription qui s’y lient, les séquences
régulatrices et leurs activateurs correspondants diffèrent d’un gène à l’autre.

Le domaine de dimérisation permet à deux protéines identiques ou similaires de se lier pour former
un dimère, ce qui augmente la force de liaison à l’ADN. Ceci explique la nature palindromique des
éléments régulateurs. La dimérisation double la surface de contact de contact entre l’activateur et
l’ADN, ce qui augmente la force et la spécificité de l’interaction.

Les domaines de liaison à l’ADN et d’activation de la transcription doivent être attachés ensemble
pour qu’un activateur puisse fonctionner. Un domaine de liaison à l’ADN sans domaine d’activation
peut se lier à l’élément régulateur d’un gène mais est incapable d’en stimuler la transcription. Un
domaine d’activation isolé ne peut pas se fixer sur l’élément régulateur d’un gène et par conséquent
est incapable d’en activer la transcription.

C’est le domaine de liaison à l’ADN qui dicte la spécificité de fonction d’un activateur. C’est lui qui
détermine à quel élément régulateur l’activateur va se lier et par conséquent quels gènes il va
activer. La spécificité d’action d’un activateur peut donc être modifiée simplement en changeant son
domaine de liaison à l’ADN. Les domaines d’activation de la transcription n’ont par contre pas de
spécificité pour un élément régulateur donné ou pour un gène particulier. Un domaine d’activation
peut activer la transcription de la plupart des gènes pour autant qu’il soit attaché à un domaine de
liaison à l’ADN approprié.

L’activité des activateurs peut être contrôlée de différentes façons en réponse à des signaux
spécifiques, souvent extracellulaires, tels que des hormones, des facteurs de croissance ou des
cytokines. L’activateur peut être séquestré dans le cytoplasme et ne peut ainsi plus aller dans le
noyau. Une dimérisation inhibe aussi l’activité des activateurs. Il est également possible de contrôler
le domaine d’activation. L’import nucléaire de certains activateurs ne se fait qu’en présence de
cytokines ou de facteurs de croissance. La dimérisation de certains activateurs ne se fait qu’en
présence de cytokines ou de facteurs de croissance. L’activité de certains activateurs peut dépendre
de la liaison d’un ligand, par exemple une hormone stéroïdienne (estrogènes, androgènes,
glucocorticoïdes). L’activité de certains activateurs peut être contrôlée par des modifications post-
traductionnelles telles que la phosphorylation par une kinase.

55
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Liaison des activateurs à l’ADN

L’ADN est une double hélice dont les deux squelettes sucre-phosphate sont à l’extérieur et les bases
complémentaires se font face à l’intérieur. Par conséquent, l’activateur doit pénétrer dans les sillons
de l’ADN pour pouvoir reconnaitre la séquence des paires de bases. Dix paires de bases
correspondent à un tour d’hélice. Les éléments régulateurs (6 à 20 bases) couvrent donc entre un
demi et deux tours d’hélice. Les activateurs doivent donc être capables de suivre le tour de l’hélice
pour reconnaitre leur site de fixation en entier. La forme hélicoïdale de l’ADN oblige les activateurs à
faire des contacts dans les sillons de l’ADN. Le grand sillon offre plus d’interaction que le petit sillon
et est plus spacieux, les activateurs se lient donc au grand sillon.

Une autre raison pour laquelle les activateurs se lient dans le grand sillon de ‘ADN est que la
discrimination entre des paires de base différentes y est beaucoup plus facile que dans le petit sillon.
Par exemple, un activateur peut distinguer entre les paires T=A et A=T dans le grand sillon (où la
répartition des points de contact est asymétrique) mais pas dans le petit sillon (où la disposition des
points de contact est symétrique. Les protéines forment des liaisons hydrogène, des liaisons ioniques
et des interactions hydrophobes avec les bases. L’oxygène et l’azote en rouge sont des accepteurs de
liaisons hydrogène. Les groupements méthyles en jaune sont hydrophobes.

56
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Il y a donc plus d’information dans le grand sillon. Les bases azotées ont des groupements qui
peuvent faire des interactions. Ces groupements one la même symétrie dans les groupes du petit
sillon, mais sont asymétriques dans le grand sillon. Les paires de bases ne se distinguent donc que
dans le grand sillon, car la discrimination entre les paires de bases est meilleure dans le grand sillon.
En effet, les quatre combinaisons possibles de paires de bases (A-T, T-a, G-C et C-G) se distinguent
dans le grand sillon, car elles ont quatre points de contact asymétriques. Par contre, dans le petit
sillon, A-T ressemble à T-A et G-C ressemble à C-G.

Les activateurs fonctionnent soit en activant directement la transcription via leur domaine
d’activation soit indirectement par l’intermédiaire du recrutement de coactivateurs. Les
coactivateurs sont définis comme des facteurs qui activent la transcription mais ne se lient pas
directement à l’ADN. Les coactivateurs sont amenés vers les séquences régulatrices des gènes par le
biais de leurs interactions spécifiques avec les activateurs liés à leurs éléments régulateurs respectifs.

Les activateurs et coactivateurs facilitent l’assemblage du complexe d’initiation de transcription par


deux mécanismes. Ils modifient la structure de la chromatine et rendent l’ADN du promoteur plus
accessible, et ils recrutent la machinerie de transcription. Les activateurs et coactivateurs
augmentent la transcription par deux mécanismes distincts. Certains activateurs et coactivateurs
augmentent l’accessibilité de l’ADN en amenant des modifications dans les nucléosomes et la
structure de la chromatine. Deux types d’activités enzymatiques, des acétylases des histones et des
complexes de remodelage des nucléosomes, sont recrutés par les activateurs et coactivateurs pour
modifier l’accessibilité de l’ADN empaqueté dans la chromatine. Certains activateurs agissent en
recrutant des composants du complexe d’initiation de transcription et facilitent ainsi son assemblage
sur le promoteur du gène.

Pour rendre l’ADN plus accessible, des complexes enzymatiques capables d’acétyler les extrémités N-
terminales des histones sont souvent recrutés par les activateurs. L’acétylation des histones

57
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

augmente, par un mécanisme encore incompris, l’accessibilité de l’ADN. L’accessibilité augmentée


favorise l’assemblage du complexe d’initiation de transcription sur le promoteur.

Certains activateurs recrutent des complexes enzymatiques qui utilisent l’énergie libérée par
l’hydrolyse de l’ATP pour remodeler les nucléosomes. Le remodelage des nucléosomes augmente
l’accessibilité de l‘ADN et favorise ainsi l’assemblage du complexe d’initiation de transcription sur le
promoteur.

Les domaines d’activation de certains activateurs et coactivateurs sont capables d’interagir


directement avec certains composants du complexe d’initiation de transcription, facilitant en cela
son assemblage sur le promoteur du gène. Un recrutement direct de la machinerie de transcription
dur le promoteur implique la formation d’un contact physique entre l’activateur attaché à sa séance
régulatrice et le complexe d’initiation de transcription assemblé sur le promoteur. Pour que ce
contact puisse se faire, l’ADN séparant la séquence régulatrice du promoteur doit former une boucle.

58
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Le contrôle combinatoire

Bien qu’une partie des gènes, notamment ceux qui remplissent des fonctions essentielles, soient
exprimés de manière constante dans toutes les cellules, l’expression de la grande majorité des autres
gènes est étroitement contrôlée en fonction de plusieurs paramètres, dont le type cellulaire, le stade
du développement, l’état de différentiation de la cellule, la quantité de protéine nécessaire et les
signaux que la cellule reçoit de son environnement.

Le génome humain contient environ 25’00 gènes, dont la plupart one des profils d’expression
uniques. Il n’est pas concevable que chacun de ces gènes soient contrôlés par un activateur qui lui
est propre. En effet, ce modèle impliquerait l’existence d’un nombre de gènes infini. Chaque
activateur doit donc contrôler plusieurs gènes. Les gènes contrôlés par le même activateur doivent
tous contenir l’élément régulateur reconnu par cet activateur. L’avantage d’utiliser un activateur
pour plusieurs gènes est que ces gènes peuvent être contrôlés de façon coordonnée en réponse aux
mêmes signaux. Par contre, ce système réduit le nombre de profils d’expression différents possibles,
car les gènes contrôlés par le même activateur ne peuvent pas être exprimés de manière différente.

La solution que la nature a sélectionnée est d’utiliser une combinaison d’activateurs différents pour
chaque gène. Ainsi, dans la plupart des cas, les activateurs contrôlant l’expression d’un gène
eucaryote donné forment un « comité » de protéines régulatrices, qui toutes sont nécessaires à une
expression appropriée du gène dans la bonne cellule, au bon moment et au taux adéquat. Le terme
« contrôle combinatoire » se rapporte à la façon dont des groupes d’activateurs travaillent ensemble
pour contrôler l’expression d’un gène. Ce contrôle combinatoire permet un grand nombre de profils
d’expression différents avec un nombre limité d’activateurs.

Le contrôle combinatoire explique le fait que la plupart des gènes eucaryotes possèdent des régions
de contrôle contenant de nombreux éléments régulateurs reconnus par des activateurs différents.
L’ensemble des éléments régulateurs s’appelle un amplificateur (enhancer en anglais). Un enhancer
est un segment d’ADN regroupant un ensemble de plusieurs éléments régulateurs reconnus par
différents activateurs et contrôlant l’expression d’un gène voisin. Bien que les gènes différents
puissent avoir des éléments régulateurs communs, la combinaison précise des éléments présents
dans l’amplificateur sera différente pour chaque gène.

59
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Le contrôle combinatoire permet l’intégration de plusieurs informations différentes, de telle sorte


qu’un gène donné sera exprimé uniquement dans la bonne cellule, au bon moment et à un taux
adéquat. Il permet aussi d’obtenir une spécificité tissulaire et cellulaire en utilisant une combinaison
de plusieurs activateurs différents qui ne sont pas eux-mêmes spécifiques à un tissu donné.

Il y a deux conditions essentielles au fonctionnement du contrôle combinatoire. Tout d’abord, seul


un jeu complet d’activateurs doit pouvoir stimuler efficacement la transcription. Ensuite, un seul
activateur, ou un jeu incomplet d’activateurs, ne doit pas être capable de stimuler la transcription de
manière optimale. Ceci tient compte de la synergie d’activation, le phénomène par lequel la
transcription n’est que activée de manière efficace si tous les éléments régulateurs sont
simultanément occupés par les activateurs correspondants.

Points de contrôle de l’expression génique post-transcriptionnels

Il existe de nombreuses étapes dans l’expression génique, c’est-à-dire dans la voie conduisant de
l’ADN à une protéine fonctionnelle. Chacune de ces étapes peut être contrôlée, c’est-à-dire qu’elle
peut se réaliser ou non, selon la nature de la cellule, le stade de développement de l’organisme, ou

60
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

en réponse à un signal extracellulaire. La régulation post-transcriptionnelle a surtout lieu dans les


étapes de maturation du transcrit et dans la stabilité de l’ARNm.

Par exemple, l’épissage alternatif peut entrainer des différences dans les protéines synthétisées
selon l’épissage subit. L’α-tropomyosine est une protéine contrôlant la contraction musculaire. Lors
de la synthèse du transcrit primaire du gène, l’épissage crée des protéines différentes. Le muscle lisse
est dû à l’épissage entre les exons 2 et 8, alors que les fibroblastes sont dus à l’épissage entre les
exons 3 et 7.

Il existe de nombreux exemples où le niveau d’expression d’un gène est contrôlé par un changement
dans la stabilité de son ARNm. Le contrôle de la stabilité de l’ARNm est généralement effectué par la
liaison d’une protéine régulatrice à une séquence située dans la région 3’ non-traduite de l’ARNm.
L’exemple le mieux connu est celui de l’ARNm pour le récepteur à la transferrine dont la fonction est
de permettre la pénétration du fer dans la cellule. Lors de carence en fer, cette structure est
reconnue par une protéine régulatrice. La liaison de cette protéine stabilise l’ARNm en empêchant sa
dégradation par une exonucléase. Le taux de synthèse du récepteur à la transferrine est ainsi
augmenté afin de rétablir la concentration intracellulaire du fer. Par contre, lorsque le fer est
abondant, il se lie à sa protéine régulatrice et de ce fait induit un changement dans la conformation
de cette dernière, de sorte qu’elle n’est plus capable de se lier é l’ARNm. Celui-ci devient instable car
il n’est plus protégé contre la dégradation. Le taux de synthèse du récepteur à la transferrine est ainsi
réduit pour éviter une surcharge en fer dans la cellule.

61
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

De nombreuses maladies résultent de défauts dans la régulation de l’expression génique, telles que
l’hémophilie B leyden, le nanisme, certains défauts de développement sexuel mâle, ainsi que le
syndrome des lymphocytes nus. En effet, celui-ci est dû à une mutation affectant un site d’épissage
du gène codant pour un coactivateur, l’empêchant d’être recruté par le enhancer d’une famille de
gènes cibles et par conséquent d’activer la transcription de ces gènes par acétylation des histones.

62
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

7. Protéines
Introduction - Protéines

Les gènes codent pour les protéines, mais également pour des ARNt, des ARNr, des miARN, et
d’autres ARN. Les protéines sont des polymères d’acides aminés, soit des polypeptides. Ces
molécules ont un grand nombre de fonctions : elles servent d’enzymes, ont des fonctions de
structure, de régulation, elles servent de pompes et canaux ioniques, servent d’hormones, de
toxines, d’anticorps.

La drépanocytose est la première maladie héréditaire liée à un changement d’un acide aminé. Cette
maladie a permis de faire le lien entre gène et protéine. La drépanocytose est due à une altération de
la globine β, qui entraine des érythrocytes en forme de faucilles. Un allèle muté HbS offre une
immunité contre le malaria. La drépanocytose est donc une maladie génétique provoquée par le
changement d’un acide aminé, qui change la protéine.

Les protéines sont des polymères d’acides aminés, qui ont une énorme variabilité de structures. La
structure d’une protéine est définie à quatre niveaux : la structure primaire, la structure secondaire,
la structure tertiaire et la structure quaternaire. La structure primaire est définie par la séquence
d’acides aminés le long de la chaine polypeptidique. Le repliement local des acides aminés en hélices,
feuillet, collagène ou autres détermine la structure secondaire. L’agencement stable de ces hélices et
feuillets en domaines correspond à la structure tertiaire, et l’agencement des chaines (sous-unités)
entre elles correspond à la structure quaternaire.

La structure primaire est définie par les gènes. Le dogme central prédit que la structure tertiaire
d’une chaine polypeptidique est déterminée par la séquence des acides aminés. Une protéine peut
être constituée d’un ou de plusieurs domaines. La structure quaternaire peut être formée de
plusieurs copies de la même chaine (homopolymère) ou par des chaines codées par des gènes
différents.

Les acides aminés

La formule générale des acides aminés est un groupement amino, un carbone α, une chaine latérale
(ou résidu R) et un groupement carboxyle. A ph 7, tous les acides aminés sont sous forme ionisée,
+ -
avec un groupement NH3 et COO . Les propriétés physicochimiques sont alors différentes.

Le carbone α est lié à quatre groupements différents, il est donc chiral. Ceci résulte dans le fait qu’un
acide aminé ait deux configurations optiques différentes, les isomères L et D, qui sont des
énantiomères. Dans les protéines, on ne trouve que l’énantiomère L. On trouve l’isomère D dans les

63
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

parois de certaines bactéries et dans certains antibiotiques. Parmi les 20 acides aminés du set
standard, seule la glycine est achirale.

Le volume d’une protéine est représenté par les modèles moléculaires. Dans le modèle éclaté, on
voit bien les atomes, qu’on voit moins bien dans le modèle 3D. Cependant, le modèle 3D donne une
meilleure représentation de la réalité.

La découverte de 20 acides aminés était une grande découverte, car on pensait avant qu’il y en avait
beaucoup. Watson et Crick cherchaient le code génétique et ont ainsi découvert le nombre d’acides
aminés. Ceux-ci peuvent être regroupés par leurs caractéristiques physicochimiques. Par exemple,
certains tableaux groupent les acides aminés par polarité, mais ils ne sont pas absolus.

Ce tableau regroupe les acides aminés par polarité. Les polaires se dissolvent facilement dans l’eau,
car ils ont une chaine latérale polaire soluble dans l’eau. Certains acides aminés sont polaires et
chargés, et d’autres sont polaires mais non-chargés, ils créent des liaisons hydrogène. Les acides
aminés non polaires n’ont ni de charge ni de capacité de créer des ponts hydrogène. Or, la cystéine
est classée dans les non-polaires, bien que le groupe SH puisse faire un pont hydrogène. De même, la
tyrosine est classée dans les polaires, et c’est l’acide aminé le moins soluble dans l’eau, et ceci bien
que le groupe OH soit polaire et puisse faire des liaisons hydrogène. Il est donc difficile de regrouper
les acides aminés dans de telles catégories.

La charge de l’acide aminé va dépendre du pH et de l’environnement de l’acide aminé. Par exemple,


à pH=6,5, dans l’eau, la moitié des histidines est chargée, la moitié est non-chargée. Pour un résidu
His donné dans une protéine, l’état d’ionisation dépendra essentiellement de l’environnement. La

64
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

notion de polaire est difficile à quantifier de façon absolue. L’hydrophobicité est le caractère
d’attraction et de répulsion pour l’eau, mais il s’agit d’un paramètre difficile à expliquer
physiquement, car il dépend de la mesure. Selon les échelles de mesure, l’hydrophobicité peut
changer, donc les valeurs représentent une façade de la réalité.

Certains acides aminés sont essentiels pour l’homme, car il est incapable de les synthétiser. Par
exemple, l’homme ne peut synthétiser la phénylalanine, mais il peut synthétiser la tyrosine à partir
de la phénylalanine. La phénylalanine de l’alimentation peut être incorporée dans les protéines, elle
peut également être transformée en tyrosine, qui sera incorporée dans les protéines, ou alors être
dégradée, ce qui aboutit au cycle de Krebs et à la synthèse de lipides. Pour les individus atteints de
phénylcétonurie et d’alcaptonurie, la dégradation de la phénylalanine n’a pas lieu et des résidus
toxiques restent dans le corps.

L’alcaptonurie est caractérisée par le manque d’une enzyme pour dégrader l’homogentistic acid, qui
précipite dans l’urine et crée un résidu noir. L’intermédiaire est éliminé dans l’urine et il y a peu de
conséquences. La phénylcétonurie est potentiellement très grave, car le défaut se situe dans la
première étape de la dégradation de la phénylalanine et tyrosine. La phénylcétonurie inactive la
première enzyme de la chaine, et la phénylalanine ne peut que devenir des corps cétoniques
toxiques. Il faut alors donner de la phénylalanine en petites quantités et de la tyrosine, acide aminé
essentiel pour ces patients.

Les acides aminés peuvent être modifiés post traduction. En modifiant les alcools, on obtient des
esters, et en modifiant des amines, on obtient des amides. La sérine, la thréonine et la tyrosine sont
les principaux résidus phosphorylés dans nos cellules pour la signalisation. L’acide aspartique est
phosphorylé dans la Na/K ATPase, ainsi que dans plusieurs protéines bactériennes qui intègrent les
signaux extracellulaires. La lysine subit une acétylation par les histones pour la transcription de la
chromatine. Les sucres procèdent à la glycosylation de nombreuses protéines sécrétées. La formyl-
méthionine est le marqueur d’une infection bactérienne, et les peptides contenant une fMEt sont de
puissants médiateurs de l’inflammation.

Structure primaire

Pour fabriquer une protéine, on doit faire une réaction pour former une liaison peptidique entre le
groupe amino et le groupe carboxyle, qui libère de l’eau. Cette liaison demande de l’énergie, il faut
donc fournir beaucoup d’énergie pour les protéines, c’est-à-dire que la rupture de la liaison devrait
également libérer de l’énergie. Or, la liaison peptidique est stable et ne se dégrade pas dans l’eau, il y

65
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

a une barrière cinétique pour rompre la liaison, même si thermodynamiquement la rupture est
favorable.

La polarité dans une protéine est la même que dans l’ADN. Dans l’ADN, la polarité est 5’-3’, dans la
protéine c’est N-C, c'est-à-dire qu’on synthétise dans le sens de N terminal à C terminal. Le sens de
lecture N vers C correspond à l’ordre dans lequel les acides aminés sont ajoutés lors de la traduction.
Il correspond à l’ordre d’addition des nucléotides durant la réplication et la transcription.

La liaison peptidique était une grande découverte. La structure de la liaison peptidique est rigide et
planaire, donc C-CO-N-C sont dans le même plan. Cependant, le premier et le dernier carbone, donc
les carbones α peuvent tourner autour de la liaison.

Structure secondaire

Les protéines, contrairement à l’ADN, sont flexibles. Elles sont caractérisées par des rotations des
liaisons peptidiques adjacentes, mais également par des liaisons non-covalentes faibles, telles que les

66
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

liaisons ioniques, des ponts hydrogène, des interactions van der Waals, et des distributions polaires
et non-polaires. Il y a également des interactions entre les acides aminés, qui sont parfois très
éloignés dans la structure primaire.

Les rotations autour du carbone α sont possibles, mais les angles ne sont pas distribués au hasard,
certaines régions sont riches et d’autres pauvres en liaisons, car pas tous les angles ne sont pas égaux
et certains sont même interdits. Par exemple, les atomes d’hydrogène ne peuvent pas être trop
proches, et les atomes d’oxygène encore moins. L’angle rapprochant les atomes d’oxygène est donc
impossible.

Dans les protéines, il y a des liaisons ioniques, qui sont les interactions non covalentes les plus fortes.
Elles peuvent être directes ou indirectes, médiées par les ions de la solution.

Les liaisons hydrogène nécessitent la présence d’un atome donneur et d’un atome receveur. Une
interaction se fait alors entre un atome légèrement positif, et l’autre légèrement négatif. L’intensité
de l’interaction dépend de la position des liaisons, les liaisons hydrogène étant les plus fortes quand
les atomes sont alignés.

Les forces van der Waals sont des attractions causées par des fluctuations temporaires des électrons
dans les atomes qui créent des dipôles instantanés qui s’attirent. L’attraction est limitée par la force
de répulsion des atomes. Leur somme fait un minimum d’énergie responsable des forces de van der
Waals, qui sont très faibles et ne s’exercent qu’à courte distance.

Les liaisons non covalentes font interagir des résidus qui peuvent être proches ou très éloignés dans
la structure primaire. Les forces de van der Waals font surtout intervenir les régions non polaires des
acides aminés. Elles sont faibles mais très nombreuses et jouent un rôle clé dans la structure des
protéines. Les interactions peuvent avoir lieu dans la même chaine ou dans des chaines différentes.

67
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

On parle souvent de « force hydrophobe ». Il s’agit de la « force » exercée par l’eau, qui a tendance à
créer des ponts hydrogène. Lorsqu’une molécule hydrophobe est dans l’eau, elle empêche la
formation de ponts hydrogène. En libérant la place, on aurait alors des ponts hydrogène possibles,
donc les molécules hydrophobes se rassemblent pour permettre la formation de ponts hydrogène
dans l’eau.

Une protéine peut avoir plusieurs conformations différentes. Le repliement des protéines place les
résidus non-polaires à l’intérieur et les résidus polaires à l’extérieur, car ceci augmente la solubilité et
libère des molécules d’eau. La région centrale hydrophobe contient les chaines latérales non polaires
et à l’extérieur, les liaisons hydrogène formées par les chaines latérales polaires stabilisent la
protéine. A l’intérieur, les forces de van der Waals ainsi que les ponts hydrogène avec l’eau des
résidus à l’extérieur solubilisent et stabilisent la protéine.

Les ponts disulfure sont également une liaison covalente stabilisante. En oxydant la protéine, on
obtient des ponts disulfure. Pour défaire ces ponts disulfure, il faut faire une réduction.

68
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

La séquence des acides aminés détermine la structure 3D, car les protéines dénaturées reprennent
leur conformation originelle après la dénaturation. Or, seules les petites protéines peuvent se
renaturer à une vitesse mesurable en solution. Dans la réalité, les chaperones aident les protéines
dans leur conformation tridimensionnelle.

La structure d’une protéine peut être étudiée à partir de protéines purifiées. On effectue une analyse
de cristaux (diffraction de rayons X), qui nous donne la conformation instantanée. On peut
également analyser en solution, par résonance magnétique nucléaire, ce qui donne la moyenne des
conformations.

Les principaux motifs de la structure secondaire sont l’hélice α, le feuillet β et l’hélice proline
(collagène). La structure secondaire est donc le repliement local des acides aminés en hélice α, en
feuillet β ou en d’autres formes. Il y a peu de motifs, mais que l’on retrouve dans toutes les
protéines.

Le motif le plus fréquent est l’hélice α. Cette structure est due à des ponts hydrogène qui se forment
dans l’axe de l’hélice, entre le NH et le O de 2 liaisons peptidiques. Les chaines latérales sont vers
l’extérieur de l’hélice, elles n’interagissent donc pas dans le motif de l’hélice α. Il faut 3,6 acides
aminés pour un tour d’hélice. Cette structure est donc compacte, mais elle n’est pas limitée dans
l’espace, donc elle peut être très longue.

La proline, dont l’atome d’azote du groupe amino est lié de façon covalente à la chaine latérale, est
une molécule rigide incapable de rotation autour du carbone α. On trouve très rarement des prolines
dans les hélices α. Les séquences riches en proline forment d’autres hélices, le collagène.

Les feuillets β représentent la deuxième structure. Les feuillets β peuvent être antiparallèles ou
parallèles. Les feuillets β sont plus souples que les hélices α. Les feuillets β font interagir les groupes
NH et O pour les ponts H, donc ils sont peu dépendants des chaines latérales. Les liaisons hydrogène
lient les brins du feuillet deux à deux, ces feuillets peuvent être à l’intérieur de la même chaine ou
dans des chaines différentes.

69
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Le long du feuillet, les liaisons covalentes de la chaine donnent une grande résistance. Des feuillets
peuvent s’empiler, dans ce cas les groupes R sont liés par des liaisons van der Waals, car les résidus
sont à l’extérieur des feuillets.

Structure tertiaire

Dans la structure tertiaire, on ne peut plus dessiner les atomes dans les protéines, car ce serait
illisible. La représentation de la structure tertiaire est donc une simplification. Les protéines sont des
mélanges de structures, d’hélices et de feuillets. Les hélices peuvent être tordues, et les feuillets
peuvent bouger, ils ne sont pas forcément à côté. Les autres zones sont des zones peu ou pas
structurées, qui n’ont pas de structure particulière. On ne voit pas ces structures en cristallographie,
donc on ne connait pas leur structure, mais plusieurs structures sont possibles.

La Src kinase est une protéine, un enzyme, impliquée dans le cancer, qui illustre bien l’assemblage
des domaines. L’assemblage de domaines fait aussi partie de la structure tertiaire, comme tout ce qui
concerne une organisation plus complexe que la structure secondaire. La Src kinase est la première
tyrosine kinase qui a été découverte. Elle peut donc ajouter un groupe phosphate à une tyrosine. Src

70
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

kinase a quatre domaines, qui peuvent indépendants. la dérégulation de la tyrosine kinase entraine
souvent des cancers. Le domaine SH3 est utilisé pour coller les protéines entre elles. Les domaines
SH2 reconnaissent la tyrosine phosphorisée, pour l’association sous forme de dimères. Le domaine
kinase a une molécule d’ATP, qui reconnait l’ARN. Ces kinases sont à la surface des cellules, elles sont
la cible d’agents thérapeutiques. Cette protéine a également permis le traitement contre certaines
protéines oncotiques.

La protéine Src est codée par 12 exons. Les exons correspondent aux domaines, un ou plusieurs
exons codent pour un domaine, mais il n’y a pas d’exons qui codent pour des domaines différents. Il
y a donc une relation entre la structure du gène et la fonction de la protéine.

La structure tertiaire est aussi caractérisée par un assemblage de domaines. Certains domaines se
retrouvent sur plusieurs protéines, ils sont donc communs à plusieurs protéines. En effet, certains
domaines communs et partagés se retrouvent sur des protéines différentes.

Le domaine EGF (facteur de croissance, vert) est présent dans l’urokinase et dans le facteur Ix mais
pas dans le plasminogène. Le domaine kringle (carré bleu) est présent à 5 copies dans le
plasminogène et aussi présent dans l’urokinase.

Au cours de l’évolution, on remarque que les structures tridimensionnelles sont mieux conservées
que les séquences. Par exemple, dans deux facteurs de transcription de deux organismes différents, il
y a trois hélices alpha et donc la même structure, mais il y a de grandes différences de séquence qui
ne modifient pas la structure tertiaire.

Certains changements sont dits discrets, c’est le cas lorsque les récepteurs peuvent changer de
forme. D’autres changements majeurs de forme plus rares ont lieu avec les prions. Les prions sont un

71
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

type de protéine qui peut changer de forme et induire des changements de la forme de la protéine
normale. La protéine différente se propage et remplace les autres protéines déjà synthétisées par
l’organisme. Ceci n’est pas en contradiction avec le dogme central, car le dogme central énonçait
l’exception de la vache folle. On peut maintenant dire que la structure détermine les structures, et
non pas la structure des protéines.

Structure quaternaire et machine moléculaires

La structure quaternaire est l’agencement des sous-unités entre elles, quand la protéine est
constituée de plusieurs sous-unités indépendantes. Par exemple, l’hémoglobine contient 4 chaines
protéiques, deux chaines α et deux chaines β. La myoglobine, qui fixe mieux l’oxygène et est
présente dans les tissus, n’est constituée que de structures α.

Le superenroulement est l’enroulement entre deux


hélices α qui augmente la résistance mécanique. Dans
une hélice α, les acides aminés se retrouvent
verticalement tous les 3,6 résidus, deux tours
constituent donc 7,2 résidus. Le bord de l’hélice α,
représenté en rouge, n’est pas droit mais il est
légèrement courbé. Lorsque ces résidus sont non-
polaires, ils vont développer une affinité pour un autre
bout non polaire. Deux hélices α s’enroulent alors
autour d’elles-mêmes pour suivre la ligne rouge et
former une structure super enroulée, plus résistante.
Cette structure est riche en cystéine, qui crée des
ponts disulfure entre les deux hélices α.

Le collagène est la structure la plus solide pour les vêtements, car l’hélice du collagène est dans l’axe
de la fibre. De plus, trois hélices s’enroulent entre elles-mêmes pour former la fibre.

La protéine Cro du virus λ se lie à l’ADN et réprime la transcription n’agit que sous la forme
dimérique. Le dimère est formé par un feuillet β et une poche hydrophobe dans laquelle se niche un
résidu Phe. Le dimère crée une distance idéale pour que chaque monomère se lie au sillon majeur de
l’ADN. Les hélices doivent donc être positionnées dans le bon sens et à la bonne distance pour se lier
à l’ADN. La phénylalanine est hydrophobe, elle se lie donc dans la poche hydrophobe, une poche de
protection.

72
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

L’actine est un polymère intracellulaire, responsable de la contraction musculaire et du squelette


cellulaire. Il s’agit d’un assemblage quaternaire homopolymère. Le virus de la polio est un polymère
sphérique. Le virus de la rougeole est un enroulement en hélice de la nucléocapside (ARN et
protéine).

Les protéines sont rarement toutes seules, le cytoplasme étant très


encombré, il n’y a pas la place pour bouger. Les protéines peuvent
donc interagir, et l’interaction aura lieu sous forme de machinerie, ce
qui nécessite un assemblage de protéines. La première machinerie
étudiée est le ribosome, constitué de deux sous-unités. Le ribosome
est un complexe d’ARN et de protéines. Lors de la traduction, c’est
l’ARN ribosomal qui est important, et non pas les protéines.

73
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

8. Synthèse de protéines – Traduction


La traduction est divisée en quatre étapes : il y a d’abord une liaison entre le ribosome et l’ARNm,
puis l’initiation de la traduction, qui sont les principales étapes de la régulation. Il y a ensuite les
processus l’élongation, qui correspond à la synthèse de la chaîne peptidique, et de terminaison, soit
le relâchement de la chaine peptidique.

Dans ce schéma, la petite sous-unité ribosomale reconnait le messager, elle se déplace ensuite pour
arriver au codon initial, et la grande sous-unité ribosomique va ensuite se lier au codon initial.
Finalement, il y a l’élongation de la chaine et la terminaison, lors de laquelle la machinerie relâche le
messager, les protéines et les sous-unités ribosomiques. Il est donc intéressant de voir que la liaison
de la petite sous-unité précède la reconnaissance du codon initial, et que la reconnaissance du codon
initial est l’élément crucial de la traduction.

Les différents acteurs de la traduction sont le ribosome, l’ARNm, l’ARNt et les synthétases, mais
également les facteurs d’initiation, les facteurs d’élongation et les facteurs de terminaison, qui sont
des protéines.

Le ribosome

Le ribosome est la machine moléculaire la plus importante de


la traduction. Celui-ci est composé de deux sous-unités
principales, la petite sous-unité et la grande sous-unité. Le ion
magnésium est responsable de la liaison des sous-unités, il
assemble et sépare les sous-unités des ribosomes. S est une
unité décrivant le coefficient de sédimentation (centrifugation)
qui intègre la masse, la densité et la forme de la particule. Il y a
différentes sous-unités ribosomales qui n’ont pas le même
rôle.

La grande sous-unité est responsable de la catalyse, donc de la formation de liaisons peptidiques. La


petite sous-unité est responsable de la reconnaissance de l’ARNm par les ARNt (codon-anticodon). Le
ribosome contient trois sites qui lient l’ARNt. Le site A, pour aminoacyl-ARNt, est le site où va se fixer
l’ARNt avec le nucléotide correspondant. Le site P, pour peptidyl-
ARNt, est le site de formation de la liaison peptidique. Le site S, pour
sortie, est le site de sortie du ribosome, où l’ARNt est relâché et le
peptide synthétisé reste lié aux acides aminés en cours de liaison. La
grande sous-unité sert à faire les liaisons entre les acides aminés, et
la petite à reconnaitre la séquence qui doit être assemblée.

74
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Chez les eucaryotes, l’ARNm est dit monocistronique, car il a une région codante et une région non-
codante. La région 5’ de l’ARNm a une coiffe, c’est une région qui est modifiée, en recevant un
groupe G méthylé. La région 3’ a une queue poly(A), faite de répétitions d’alanine (A). Il y a un site
sur lequel le ribosome va s’associer, qui est différent de la coiffe. Ce site est un codon initiateur. Les
ARNm eucaryotes codent pour une seule protéine : l’ARNm des eucaryotes est monocistronique, il a
un seul messager, alors que l’ARNm des procaryotes a plusieurs messagers et est donc
polycistronique. L’ARNm des procaryotes a plusieurs sites de liaison au ribosome, et le même ARNm
peut coder pour différentes protéines.

L’ARN de transfert (ARNt)

L’ARNt est nécessaire à la traduction, il joue le rôle d’adaptateur. Les acides aminés n’ont pas
d’affinité pour les bases de l’ARNm, d’où la notion d’adaptateur. Cette structure ressemble à une
feuille de trèfle à trois feuilles, car elle a une structure secondaire qui forme trois tiges, ou boucles.
La structure réelle est en forme de L. La structure tertiaire est plus complexe, et elle met en évidence
les doubles hélices antiparallèles. Les boucles rouge et jaune de la structure secondaire ont des
interactions dans la structure tertiaire, elles sont empilées. Les régions bleues et l’acide aminé se
distinguent dans la structure tertiaire et reflètent la forme de trèfle de la structure secondaire.

L’acide aminé est indirectement sélectionné par son codon. L’ARNt sert à adapter, l’acide aminé se
lie à l’ARNt avec une liaison covalente, et l’ARNt déchargé se lie à l’ARNm. La liaison covalente entre
l’acide aminé et l’ARNt a lieu sous l’action enzymatique de l’ARNt synthétase. La sélection du bon

75
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

codon permet la traduction de l’ARNm. Les ARNt sont les enzymes du codage et ils sont les gardiens
du code génétique. Il y a au moins 20 synthétases dans les cellules d’organismes multicellulaires, une
par acide aminé. Une fois l’acide aminé attaché à l’ARNt, il reconnaitra le codon correspondant,
même si on modifie chimiquement l’acide aminé.

Pour se lier à un ARNt, l’acide aminé doit être activé pour ensuite se lier é un ARNt. L’énergie pour
lier les acides aminés à l’ARNt est fournie par l’ATP. L’énergie des anhydrides est plus grande que
celle de l’ester, elle-même plus grande que celle du peptide (amide). Dans l’aminoacyl-ARNt, le
groupe COOH de l’acide aminé est estérifié à un groupe OH du ribose du nucléotide 3’ de l’ARNt.
L’acide aminé activé est un acide aminé adénylé, la transformation du groupe acide carboxylique en
éther se fait par plusieurs étapes, on n’utilise pas toute l’énergie d’un coup. La liaison peptidique se
fera ensuite sur le ribosome.

Les synthétases peuvent être considérées comme les gardiens du code génétique, elles sont très
fidèles lors de la traduction. Le taux d’erreur des synthétases est de 1 erreur sur 10'000. L’ARNt est
une grosse molécule, qui offre beaucoup de contact avec des éléments de reconnaissance.
Cependant, ces contacts dépendent de l’énergie. Les acides aminés polaires ou chargés sont capables
de faire des ponts hydrogène avec les ARNt, et offrent donc une fiabilité accrue. Les acides aminés
non polaires ne peuvent qu’interagir à travers les liaisons van der Waals, qui sont faibles. Les
interactions van der Waals offrent une fiabilité de 99%, mais cette précision est insuffisante pour la
discrimination des acides aminés.

Pour combler cette insuffisance lors de la discrimination des acides aminés, la plupart des
synthétases ont une fonction de relecture. Par exemple, l’Ile-ARNt synthétase a une poche de

76
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

synthèse et une poche de relecture. L’isoleucine est trop grande pour rentrer dans la poche de
relecture, alors que la valine est suffisamment petite pour y rentrer. Dans ce cas, la valine est
hydrolysée, et le processus recommence jusqu’à ce qu’il s’agisse de l’isoleucine.

Le code génétique
Le problème du code génétique réside dans le fait que 4 bases codent pour 20 acides aminés. Il faut
alors qu’une séquence d’au moins trois bases code pour un acide aminé. Le code génétique devait
être une suite de codons, où il y a trois bases par codon. Le code génétique doit être de type non
chevauchant, c’est-à-dire que n’importe quel codon peut être suivi de n’importe quel codon. Le code
génétique est universel, il y a plus de 240 dipeptides possible. Si le code était chevauchant, le
ribosome avançant une base à la fois, le nombre de dipeptides possibles serait restreint.

Cadres de lecture

L’ARNm est lu par codons, c'est-à-dire par groupe de trois bases azotées. L’insertion d’un ou deux
nucléotides ainsi que la délétion d’un ou deux nucléotides peut engendrer des mutations drastiques.
En effet, ces modifications modifient le cadre de lecture, c'est-à-dire que tous les codons en aval de
l’addition ou de la délétion sont décalés par rapport au type sauvage. On ne peut donc pas changer le
cadre de lecture dans les protéines, même s’il existe des exceptions.

Par exemple, chez les virus, il existe des déplacements viraux du cadre de lecture. Dans le gène Gag-
Pol, le ribosome recule la lecture d’une base et la séquence peut alors coder pour deux chaines
polypeptidiques. Pol est responsable de la copie de l’ARN viral en ADN complémentaire et de son
intégration dans le génome (HIV et autres rétrovirus).

77
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Le code génétique décrit le mécanisme de traduction. Un codon correspond à trois nucléotides et


détermine l’acide aminé choisi. Le code génétique est dit dégénérescent, deux codons différents
peuvent coder pour le même acide aminé. Par exemple, un seul codon est valable pour la
méthionine, qui est aussi le codon d’initiation (AUG), mais trois codons sont des codons stop (UAA,
UAG, UGA). Le codon AUG sert à la fois comme codon initial et pour insérer des résidus Met à
l’intérieur de la chaine polypeptidique.

Les changements de base peuvent avoir différents effets à cause du code génétique. Il peut s’agir
d’une substitution silencieuse, lorsque deux codons codent pour le même acide aminé (ex. AAC à
AAU). Il peut s’agir d’une substitution conservative : un acide aminé est remplacé par un acide aminé
du même genre, par exemple deux acides aminés non polaires (ex. AUA à UUA).La substitution peut
être plus sévère, lorsque l’on change les propriétés des acides aminés, comme par exemple un acide
aminé non polaire par un acide aminé polaire (ex. GAG à AAG). Il arrive que le remplacement d’un
Glu par une Lys n’ait pas d’effet sur le fonctionnement de la protéine, par exemple si le résidu est en
surface et n’intervient pas dans la formation de la structure tertiaire. On parle dans ce cas de
polymorphisme plutôt que de mutation. La substitution peut être drastique, dans le cas d’une
substitution par un codon stop, ce qui arrête la traduction (ex. UAC à UAG). Les insertions ou les
délétions peuvent avoir la conséquence d’inactiver le gène. D’autres mutations peuvent être plus
légères, on change alors le rôle de la protéine, qui a une fonction différente, mais ne perd pas sa
fonction.

Le code génétique n’est pas tout à fait universel, car il existe des différences pour le code génétique
mitochondrial par exemple. On parlera alors plutôt de code standard. Cependant, les codes
génétiques différents sont toujours
très semblables au code standard, et
les variations sont très petites. C’est
chez les protistes que l’on rencontre
le plus de variations par rapport au
code standard. Néanmoins, l’allure
générale du code reste conservée
dans les organismes caractérisés à
ce jour, ce qui est prédit par
l’hypothèse d’une évolution à partir
d’une cellule ancestrale.

Initiation, élongation et
terminaison

78
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Initiation

L’initiation est l’étape limitante de la traduction et l’étape majeure de la régulation. Celle-ci est
divisée en trois parties : il y a d’abord le recrutement de la sous-unité ribosomale (associés aux
facteurs d’initiation) sur l’ARN, puis la sélection du codon d’initiation, l’appariement avec l’anticodon
de l’ARNt initiateur méthionine, et enfin le relâchement des facteurs d’initiation et le recrutement de
la grande sous-unité ribosomale.

Le rectangle rouge est un facteur d’initiation lié à l’ARNt initiateur. Les boites rose et brune sont des
facteurs qui se lient à la coiffe. En principe, le premier AUG rencontré lors du balayage sert de codon
initial. Certains AUG ne sont pas dans un contexte favorable : les nucléotides qui les entourent les
défavorisent. Dans ces cas, la sous-unité 40S poursuit le balayage et initie quand elle rencontre son
premier AUG dans un contexte favorable. A la fin de l’initiation l’ARNt initiateur se trouve dans le site
P. Le site A est prêt à recevoir le 2e acide aminé, lié à son ARNt. Le facteur d’initiation est relâché sous
forme inactive.

Le recrutement est initié par la coiffe 5’, qui est reconnue et attire le complexe. Ce complexe descend
le long de l’ARNm jusqu’à ce qu’il rencontre une méthionine (codon AUG). Ce processus s’appelle
balayage. Il faut aussi que les bases à côté soient conformes pour que le complexe reconnaisse cet
endroit comme l’endroit d’initiation. Lorsque ce complexe trouve la méthionine, elle s’arrête et
l’ARNt se lie à l’ARNm, et la grande sous-unité se lie à la petite sous-unité, et la traduction
commence.

Chez les procaryotes, la liaison de la petite sous-unité et la sélection du codon initial ont lieu
simultanément. Il n’y a pas de balayage, le complexe se fixe tout de suite sur le site de liaison, où il
s’apparie avec AGGA. La petite sous-unité est liée aux facteurs d’initiation chez les procaryotes. La
suite de l’initiation, liaison de la grande sous-unité et départ des facteurs d’initiation, a lieu comme
chez les eucaryotes.

79
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Certains facteurs sont constitués d’une chaine polypeptidique. La plupart des facteurs eucaryotes
sont constitués par l’assemblage de plusieurs chaines. Un eucaryote contient environ 10 facteurs
d’initiation, appelés eIFx. Chaque facteur est composé d’environ 1 à 8 protéines. Les facteurs
d’initiation sont donc longs de 15'000 à 600'000 acides aminés. Chez les procaryotes, le nombre de
facteurs est de 3, qui sont appelés IFx. Il n’y a qu’une protéine par facteur, qui est d’une taille variant
de 9'000 à 120'000 acides aminés.

Elongation

Lors de l’élongation, la formation de la liaison peptidique et le déplacement de la grande sous-unité


ont lieu en même temps. L’élongation commence avec le produit de l’initiation. L’ARNt chargé
(aminoacyl-ARNt) s’insère dans le site A. La grande sous-unité se déplace alors, et un deuxième ARNt
s’insère dans le site A, poussant le premier ARNt dans le site P. La liaison peptidique se fait alors
entre les deux acides aminés de la chaine polypeptidiques. La grande sous-unité glisse alors à
nouveau, mettant le deuxième ARNt dans le site P et le premier dans le site S. Le premier ARNt est
libéré, et l’acide aminé auquel il était lié est cardé dans la chaine polypeptidique nouvellement
synthétisée. La petite sous-unité se déplace pour être en bonne position pour accueillir un nouvel
ARNt dans le site A et continuer la synthèse. Ce processus nécessite beaucoup d’étapes et ne va pas
aussi vite que la réplication de l’ADN. On pensait pendant longtemps que les protéines étaient
responsables de la formation des liaisons peptidiques, mais on a découvert que les ARN le faisaient,
même si on ne connait pas encore le processus exact. L’ARNr (ribozyme) catalyse la formation de la
liaison peptidique, les protéines aident é la synthèse et accélèrent le processus.

L’élongation est faite sous l’activité enzymatique des facteurs d’élongation. Les facteurs d’élongation
utilisent le GTP pour l’énergie, tout comme les sucres utilisent l’UTP et les lipides le CTP. Ces
molécules sont des modèles secondaires produits à partir de l’ATP. Le facteur EF-Tu permet une

80
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

relecture et une vérification que l’appariement entre le codon de l’ARNm et l’anticodon de l’ARNt
soit correct, donc que le bon acide aminé soit incorporé à cet endroit dans la protéine. Il permet
également à l’ARNt chargé de se lier au ribosome, étape nommée le chargement. Le Tu-GTP reste lié
à l’ARNt avant d’être hydrolysé en GDP, qui sort. Le temps pendant lequel le facteur EF-Tu est
attaché à l’ARNt permet de vérifier que le codon et l’anticodon sont bien liés.

Lors de la translocation, un
mécanisme semblable est
utilisé. La liaison d’EF-G aide
au déplacement de la grande
sous-unité. L’hydrolyse du
GTP fournit l’énergie
nécessaire pour le
déplacement de la petite
sous-unité. EF_G accélère la
translocation. La liaison d’EF-
G avec GTP permet de tirer la
petite sous-unité, pour
s’aligner avec la grande sous-
unité ribosomale qui est
décalée lors de la formation
de la liaison peptidique. L’hydrolyse retire le groupe GDP et la petite sous-unité reprend sa place. Il
faut ainsi une molécule de GTP pour EF-Tu et une molécule de GTP pour EF-G. Le processus
d’élongation nécessite alors l’hydrolyse de 2 molécules de GTP.

Terminaison

Les facteurs de terminaison se lient à un codon stop dans le site A vide. Leur structure est semblable
à celle d’un ARNt, on parle alors de mimétisme moléculaire. Cette protéine permet de casser la
liaison ester, en libérant un polypeptide. Ce processus fait intervenir une seule protéine. On pensait
qu’il fallait un ARNt spécifique, incapable d’être chargé pour la terminaison. Le mimétisme
moléculaire permet à cette protéine de ressembler à un ARNt, qui adopte la même forme pour une
fonction semblable.

81
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

9. Régulation
Il y a deux types de régulation de l’initiation : la régulation globale et la régulation d’ARNm
spécifique. La régulation globale cible les facteurs d’initiation et modifient leur activité par
phosphorylation.

Les eucaryotes effectuent une régulation globale. Un complexe de facteurs d’initiation inactif peut
être activé par la présence de facteurs de croissance, tels que les nutriments ou les hormones. Ce
complexe actif va alors activer l’initiation. Nous avons vu que le complexe de facteurs d’initiation est
relâché à la fin de l’initiation sous forme inactive. Il doit alors être réactivé pour participer à une
nouvelle initiation.

Le régulation globale dans un eucaryote se passe avec le facteur d’échange eIF-2B. Le facteur inactif
est lié à un GDP. Le facteur d’échange libère le GDP, eIF-2 reste vide. La liaison d’un GTP permet le
relâchement d’eIF-2 sous forme active. L’hydrolyse du GTP en GDP aura lieu lors de l’arrivée de la
grande sous-unité. Quand les conditions sont défavorables (carence), une kinase ajoute un
phosphate à eIF-2, ce qui empêche son recyclage. Le nucléotide nu après la libération du GTP peut
être habillé par un GTP ou un GDP. Ceci dépend de l’état énergétique de la cellule. L’état énergétique
de la cellule augmente le niveau d’ATP et donc de GTP, et on réactive le système de réaction. Le
rapport GTP/GDP contribue à l’activation ou à l’inactivation, car il détermine le niveau énergétique
de la cellule.

82
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

La plupart des initiations se font par l’initiation sur la coiffe. Certains virus parviennent à pirater la
machinerie d’initiation de l’hôte. Une de leur protéine, une protéase, inactive un facteur d’initiation
(eIF), ce qui empêche l’initiation sur la coiffe. Or, la coiffe et le balayage sont essentiels pour la
traduction des ARNm cellulaires eucaryotes. Les IRES (Internal Ribosome Entry Site) sont essentielles
pour la synthèse des protéines des virus comme polio. Une minorité des ARN, cellulaires utilisent un
IRES pour initier leur traduction. Lors d’une infection par polio, la synthèse de protéines de l’hôte
disparait, et il n’y a plus que la synthèse des protéines des virus car il n’y a plus assez de facteurs
d’initiation.

La ferritine est un exemple de régulation d’ARNm spécifique. Cette régulation est spécifique à un
gène et c’est une manière de réguler la synthèse de protéines. L’ARNm codant pour la ferritine forme
une structure en boucle qui mime la protéine. En absence de fer, la protéine empêche la traduction
en bloquant le balayage. En présence de
fer le blocage est supprimé. Quand il y a
assez de ferritine, il ne reste plus assez
de fer libre et le répresseur de la
traduction peut se lier à nouveau à
l’ARNm. La même protéine contrôle la
synthèse du récepteur à la transferrine
(fer circulant), en se liant à des tiges-
boucle semblables. Dans ce cas le
contrôle ne s’exerce pas au niveau de la
traduction mais à celui de la stabilité de
l’ARNm.

Les ARN interférents sont des petits ARN qui règlent de manière subtile et fine l’expression des
gènes. Certains ARN sont double brin (dsRNA), et d’autres sont des micro-ARN. Les micro-ARN
(miARN) sont codés par des gènes qui synthétisent des Pri-miARN, qui sont modifiés en Pré-miARN
pour donner finalement des miARN. Ces gènes sont très courts, ils font environ 20 nucléotides de
long. Si l’appariement avec l’ARNm est parfait (siRNA), le complexe RISC-AGO induit la dégradation
de l’ARNm. Si l’appariement est imparfait, le complexe bloque la traduction de son ou ses ARNm
cibles.

83
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Les protéines sont fabriquées sur des polyribosomes (polysomes). Les messagers eucaryotes ont une
coiffe et une queue poly(A), qui n’est pas codée par le gène mais est rajoutée par la polymérase- Le
début et la fin se touchent, car les polysomes peuvent avoir des structures pseudocirculaires. La
queue poly(A) et la coiffe sont donc en contact, et le dernier ribosome, côté 3’, contient la protéine
complète encore attachée à l’ARNt de l’acide aminé C terminal.

La protéine qui se fixe au poly(A) (poly-a-binding protein) est capable d’interagir avec une des
protéines qui se lient à la coiffe. Cette interaction indique que l’ARNm est intact et facilite l’activité
du facteur d’initiation. C’est une précaution que prend la coiffe de vérifier si l’extrémité 3’ est
toujours la pour commencer la traduction.

Repliement, chaperones & dégradation


Le repliement des protéines commence durant la traduction. Les protéines sortent du ribosome par
morceaux, et le repliement se fait bout par bout. La chaine polypeptidique terminale sort d’abord
des ribosomes, et peut se replier sur elle-même, il s’agit du repliement N-terminal. La protéine se
replie après le relâchement des facteurs de repliement, et le repliement C-terminal est indépendant
du repliement N-terminal.

En réalité, les protéines ne sont pas toujours bien repliées, car il y a souvent des accidents. La cellule
dispose d’une machinerie pour réparer ces accidents, il s’agit de la chaperone. Le repliement post-
traductionnel est effectué par une chaperone complexe. Plusieurs types de chaperones permettent
le repliement post-traductionnel. La plupart utilisent ‘énergie de l’ATP. La chaperone est formée de
14 sous-unités pour former deux compartiments, 7 sont dans la partie du haut et 7 dans la partie du

84
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

bas. Les protéines qui sont mal repliées entrent en haut, les chaperones se fixent dessus, et grâce à
l’ATP, on replie l’ADN pour obtenir le bon repliement. Le repliement a lieu dans la cavité.

Le repliement spontané est possible pour les petites protéines mais il est lent. Le repliement direct
passe par une étape intermédiaire, qui n’est pas structurée. Une protéine mal pliée peut avoir des
régions peu ou pas pliées, structurées. S’il y a un problème de repliage, la protéine passe alors par les
chaperones pour essayer de la structurer à la bonne place. Si on n’arrive pas à replier les protéines
ou si on n’a pas besoin de cette protéine, la protéine subira une dégradation intracellulaire. Ce
processus est assuré par un autre enzyme, le protéasome, qui s’occupe de la dégradation des
protéines et de la dégradation des acides aminés. Cet enzyme permet de « recycler » les acides
aminés, mais l’organisme aura dépensé de l’énergie, car il faut 3 ATP pour former une liaison
peptidique. Le protéasome ne fonctionne qu’avec de l’ATP, on parle donc de dégradation ATP-
dépendante. Le protéasome est formé de nombreuses sous-unités qui constituent le cœur et les
extrémités.

La dégradation commence avec un signal qui indique que le peptide doit être dégradé. Ce signal est
donné par l’ubiquitine, une petite protéine de 75 acides aminés. La première étape, l’activation de
l’ubiquitine (Ub) conjugue l’extrémité C de l’ubiquitine (76 acides aminés) au groupe SH de E1, ce qui
forme un thioester. La deuxième étape est l’étape de transfert sur la deuxième protéine E2. Elle a la
même structure qu’E1 et sert de donneur d’Ub au substrat. Cette étape est faite par les enzymes. Les
E3 ligases ciblent spécifiquement les protéines du cycle cellulaire, les protéines qui sont traduites
puis dégradées. Les nombreuses E3 ligases sont spécifiques d’un ou plusieurs substrats. La liaison
isopeptide utilise le groupe –NH2 ε d’une lysine. Certains substrats sont liés à plusieurs Ub. A ce
statut, le substrat est prêt pour la dégradation. Parfois, les substrats peuvent avoir plusieurs
ubiquitines, car certains substrats sont parfois dégradés par erreur. Il existe cependant un système
de récupération et de réparation, il s’agit du DUB. Ce sont des enzymes capables d’hydrolyser des
liaisons isopeptides. Le substrat ubiquiné va aller vers le protéasome qui a besoin d’ATP, et le DUB
coupe la liaison isopeptide. L’ubiquitine accélère la réaction et ressort à la fin, ce qui montre qu’il
s’agit d’un enzyme. Les DUB régénèrent Ub en rompant la liaison isopeptide. Ub dirige le substrat
vers le protéasome qui effectue la dégradation.

85
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Sécrétion et intégration dans la membrane


Les protéines synthétisées dans le cytoplasme s’accumulent dans différents compartiments. Les
protéines solubles restent dans le cytoplasme ou migrent vers le noyau (facteurs de transcription, …),
ou sont sécrétées vers l’extérieur de la cellule. Certaines protéines s’attachent aux membranes
lipidiques. Dans les cellules animales, environ 50% de la masse de la membrane plasmique est
constituée de protéines. Chez les bactéries, environ 20% des gènes codent pour des protéines de la
membrane plasmique. Une protéine doit traverser la membrane plasmique pour être sécrétée. Les
protéines sécrétées traversent une membrane durant leur synthèse, avant de rejoindre le milieu
extérieur.

Dans le noyau et le cytoplasme, il y a la même concentration de sodium (Na) et de potassium (K). A


l’extérieur de la cellule, il y a une différence de concentrations, il s’agit du gradient de concentration.
Les concentrations de Na et de K sont différentes que dans la cellule. La membrane cellulaire n’est
donc pas parfaitement imperméable, il s’agit d’une couche de lipides où flottent des protéines. Le
nombre de protéines de membrane est important. La membrane cellulaire est très dense, et la paroi
interne de la membrane mitochondriale encore plus.

Les protéines sécrétées par les ribosomes traversent la membrane d’une organelle cytoplasmique, le
réticulum endoplasmique. Les ribosomes peuvent être fixés au réticulum endoplasmique, ou être
libres dans le cytoplasme. Une fois cette étape effectuée, elles sont pratiquement dans l’espace
extracellulaire. Elles le rejoignent par transfert de vésicules dont la dernière finit par fusionner avec
la membrane plasmique. Les ribosomes s’échangent et peuvent passer de la membrane à des
protéines libres.

Le recrutement des ribosomes, et donc des ARNm en cours de traduction, se fait une fois que le
signal de sécrétion N-terminal sort du ribosome. Les extrémités terminales des protéines sécrétées
se collent sur la membrane. Cette extrémité est reconnue sur la membrane et s’y attache. La
protéine va à l’intérieur de la vésicule et reste dans le vésicule. Le ribosome continue à synthétiser la
protéine et relâche la protéine dans la vésicule. La protéine soluble est dans le milieu externe. La
vésicule va vers la membrane, elle fusionne avec la membrane et est ensuite relâchée vers
l’extérieur.

86
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Les protéines synthétisées sont sécrétées avec une région N-terminale, la séquence signal, coupée
durant l’export par une protéase, la signal peptidase. Les protéines en train d’être synthétisées
passent à travers le translocon, une machinerie qui aide la protéine à traverser la membrane. La
signal peptidase est une protéase qui coupe les protéines fonctionnelles et les aide à sortir dans la
membrane.

La protéine intégrale de la membrane est ancrée à la membrane par une région non polaire. La
protéine contient deux signaux, une dans la région jaune et l’autre dans la région rouge. Il s’agit
d’une séquence qui initie le transfert et une région qui arrête le transfert. Le signal rouge permet
l’attachement au translocon, la machine de passage à travers la membrane. Cette région est pleine
d’acides aminés non polaires, qui peuvent rester dans la membrane hydrophobe. Alors qu’une région
provoque la sortie vers l’extérieur, l’autre provoque le fait qu’elle reste dans la membrane. Le signal
jaune provoque l’ouverture du translocon et le relâchement de la protéine dans la membrane.

87
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Ces signaux jaunes sont des hélices α. Une protéine transmembranaire peut avoir une ou plusieurs
hélices α dans la membrane. Les différentes protéines peuvent s’associer avec les lipides de la
membrane.

Certaines protéines peuvent être périphériques, c'est-à-dire qu’elles sont liées aux protéines
membranaires. Ces protéines sont associées faiblement, elles sont facilement dissociables. Selon les
différences physico-chimiques, les protéines peuvent être modifiées, il n’y a pas besoin de les
dénaturer pour les dissocier. Ces protéines sont utilisées pour la communication entre l’intérieur et
l’extérieur de la cellule.

D’autres protéines sont intégrales : elles peuvent être transmembranaires ou liées aux lipides. Ras
est un exemple de protéine liée aux lipides. Ces protéines sont liées aux lipides de façon covalente.
Les tonneaux β sont d’autres exemples de protéines intégrales transmembranaires. Les tonneaux en
feuillets β forment de grandes cavités, on les trouve dans la membrane externe des bactéries
Gramm-. Ces bactéries ont de grands trous dans la membrane, qui laisse passer les macromolécules,
les ions et autres particules. Ces membranes sont perméables, et servent également à la
communication cellulaire, mais de façon différente, car elles n’ont pas de potentiel de membrane, ni
d’intégrité cellulaire. La majorité des protéines de membrane sont des hélices α. Les membranes
sont pleines d’hélices α, qui sont les principales protéines membranaires.

La prédominance des hélices α dans les protéines transmembranaires est due au fait que les
domaines transmembranaires ont beaucoup d’acides aminés non polaires. La partie non polaire, la
chaine latérale, est à l’extérieur de l’hélice, en contact avec les acides gras des phospholipides non
polaires. La partie hydrophile, les
liaisons peptidiques du squelette,
forme des ponts hydrogène dans
l’axe de l’hélice. Les hélices α sont
donc stabilisées par les ponts
hydrogène dans l’axe de l’hélice, et
les parties hydrophobes se lient aux
parties hydrophobes des
phospholipides.

La diffusion des ions, des sucres, des


acides aminées, des nucléotides, etc.

88
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

est trop lente, car leur concentration externe est trop faible. Les protéines de membrane servent
donc à la diffusion de ces particules, c’est la fonction transport facilité. Les protéines de membrane
servent aussi à l’ancrage des structures intracellulaires et intercellulaires. C’est ce qui forme les
tissus, et la rigidité des tissus. Lorsqu’on arrache de la peau, on arrache plus que ce qu’on veut, car
les cellules sont attachées ensemble et les tissus sont rigides. Les protéines de membrane servent
aussi de récepteurs de protéines du sang, telles que les hormones ou les facteurs de croissance. Les
récepteurs sont des protéines qui vont recevoir un signal, par exemple pour la division, la migration,
la sécrétion d’insuline, ou encore la maturation. Les signaux arrivent de l’extérieur et doivent aboutir
à un récepteur. Le récepteur est couplé au signal et attaché de façon covalente par un enzyme.
Souvent, les récepteurs et les enzymes sont liés. L’activité des enzymes répond aux variations des
conditions externes.

Fonction des protéines


Sites de liaison

Le repliement des protéines met en contact des résidus distants dans la séquence pour créer des
sites de liaison. Un ensemble de résidus qui forment un système de liaison constitue un site de
liaison. Après le repliement, la protéine a une structure spécifique, donc un site de liaison spécifique.
L’ensemble de liaisons non covalentes faibles permettent la liaison de la molécule sur la protéine
avec son site de liaison spécifique.

L’AMP cyclique est un messager dont la synthèse est stimulée par des hormones ou par l’adrénaline.
Elle représente un exemple de site de liaison spécifique. La protéine qui se lie à l’AMP cyclique est
constituée d’une adénine, d’un sucre et d’un phosphate, liés par deux groupes ester. La protéine a
quatre cycles, qui se lient par plusieurs liaisons faibles. Il y a des ponts hydrogène faisant intervenir
des groupes –OH ou une liaison peptidique, mais aussi une liaison ionique entre l’arginine (Arg) et le
phosphate. La liaison peptidique peut donc également stabiliser des molécules. La liaison de cette
protéine dépend de la structure du site de liaison, qui doit pouvoir faire toutes ces petites
interactions pour accueillir la protéine.

L’immunoglobine (IgG) est un anticorps qui constitue un autre exemple de combinaison de


domaines, de structure quaternaire et de ponts disulfure intra- et inter- chaîne. Les boucles de
chaîne variable contiennent des sites de liaison, qui
n’ont pas de structure définie. La structure devient
définie lorsqu’un antigène se lie à un site. Le site de
fixation de l’antigène est donc non-structuré en absence
d’antigène.

Enzymes

89
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Le principe d’une réaction enzymatique repose sur la régénération de l’enzyme. Un enzyme et un


substrat se reconnaissent et se lien. L’enzyme coupe donc la protéine et libère les fragments.
L’enzyme est recyclé à la fin de la réaction, il sort intact de la réaction. Les enzymes ne changent pas
l’équilibre, mais ils accélèrent les réactions en abaissant l’énergie d’activation nécessaire à la
réaction.

La réaction la plus efficace est celle qui a lieu sous l’activité enzymatique de la carbonic anhydrase,
qui peut être faite sans enzyme, mais qui est accélérée d’un million de fois. La durée de la réaction
est de l’ordre d’une microseconde. La réaction la plus stimulée par un catalyseur enzymatique est
celle de l’OMP décarboxylase. Une réaction qui prendrait un million d’années sans enzyme se fait
dans l’ordre de quelques millisecondes avec l’activité enzymatique. Les enzymes accélèrent donc de
manière très conséquente les réactions, l’accélération pouvant aller jusqu’à un facteur 1013.

Allostérie

Les protéines peuvent changer de forme, être différentes et avoir des fonctions différentes. Il s’agit
de l’allostérie, qui permet le mouvement. La liaison d’une petite molécule affecte à distance le site
actif de la protéine. Les gènes contrôles par le tryptophane sont soumis à une régulation négative,
par un facteur de transcription répresseur. La liaison du tryptophane change très légèrement la
forme de la protéine et lui permet de se lier à l’ADN.

Certains enzymes règlent l’activité d’autres enzymes. Ce concept est important pour comprendre le
métabolisme au niveau de l’activité des protéines. Le produit d’une chaîne métabolique peut inhiber
l’enzyme agissant au début de la chaîne. Dans le cas simplifié, quand il y a assez de Z, Z se lie à
l’enzyme qui convertit B en X, permettant ainsi de convertir plus de B en C. Si on prend l’exemple de
la régulation de l’aspartate, celui-ci est le précurseur de quatre acides aminés. Toutes les voies de
synthèse sont blocables, on peut donc contrôler et régler la synthèse de chaque acide aminé.

90
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

Beaucoup d’activités enzymatiques sont à l’origine de cette régulation. L’Asp kinase peut lier, à des
sites différents, lysine (Lys), thréonine (Thr) et Homosérine. Chaque molécule diminue un peu et
indépendamment l’activité de l’enzyme ; les 3 ensembles la rendent presque inactive. La méthionine
(Met) et l’isoleucine (Ile) agissent indirectement sur l’Asp kinase puisqu’ils provoquent, quand ils sont
présents en quantité suffisante, l’accumulation d’Homosérine ou de Thr.

Signalisation

Ras est une protéine liant le GTP, elle est appelée protéine G. Il existe un grand nombre de protéines
G, des grandes, comme celles impliquées dans la transmission des signaux extracellulaires, et des
petites, dont beaucoup participent aux mouvements de vésicules, par exemple dans la sécrétion des
protéines extracellulaires. Ras constitue un système de réponse aux hormones, et son cycle est
souvent associé dans les cancers pour activer le cycle de Ras. Le cycle repose sur le principe du GTP.
La protéine existe sous forme de GTP et de GDP. La protéine est active et liée à un GTP, qui est
désactivé en hydrolysant le GTP en GDP, qui entraine la libération d’un groupe phosphate. Ras peut
également se libérer du groupe GDP pour ensuite être associée à un GTP et redevenir active. Ce cycle
sert à répondre à des hormones, tels que des facteurs de croissance, mais il s’agit aussi d’un cycle
visé par les cancers pour changer le fonctionnement des cellules. Dans certains cas, l’hydrolyse est
bloquée, et Ras marche tout le temps.

Ras est une GTPase de signalisation qui est comparée à un interrupteur, de par la position de son
hélice α2 qui est très désorganisée. Le GTP a un phosphate de plus que le GDP, qui implique que
l’hélice α2 soit vers le haut. Lorsqu’un GDP est lié à Ras, l’hélice α2 est dirigée vers le bas. Par son
activité intrinsèque, Ras s’auto-inactive. Cependant, cette réaction est très lente.

91
Philippe Martins Gomes De l’ADN à la protéine 2014-2015

La phosphorylation est une modification post-traductionnelle covalente des protéines. La


phosphorylation est un moyen puissant pour régler l’activité cellulaire, toute la signalisation
intracellulaire. Il s’agit d’une modification covalente, on ajoute ou on enlève un groupe phosphate.
Les protéines peuvent être activées avec ou sans phosphate. La plupart des protéines cibles
contiennent plusieurs sites de phosphorylation : Ser, Thr ou Tyr (Asp, His). Certains activent, d’autres
répriment. La présence de plusieurs sites permet une intégration de signaux activateurs ou
inhibiteurs.

La voie Ras et la voie de phosphorylation sont deux types d’intégration de signaux qui proviennent de
l’extérieur et qui sont transmis. Ras est une voie de signalisation faisant intervenir des protéines qui
accélèrent l’hydrolyse ou l’échange. Ce système permet de vérifier l’état d’énergie de la cellule, car
l’état énergétique dépend de la présence d’ATP. S’il y peu d’énergie, il y aura une accumulation
d’ADP, et donc de GDP. La protéine Ras vide a le choix de se lier à un GTP ou à un GDP. Si elle se lie à
un GDP, on revient en arrière, si elle se lie à GTP, elle devient active. Ceci dépend du rapport
GTP/GDP dans la cellule, donc du rapport ATP/ADP. S’il y a beaucoup d’énergie, le GTP sera grand et
il y aura transmission du signal. Le réseau des interactions entre les protéines régule le métabolisme
de tout l’organisme.

92

Vous aimerez peut-être aussi