Vous êtes sur la page 1sur 33

B) L’ADN répétitif 

1. Séquences fonctionnelles :
Certaines unités génétiques fonctionnelles sont présentes en de multiples exemplaires. Elles
comprennent les classes suivantes :
* Famille de gènes dispersés
* Répétition en tandem des familles de gènes
* Séquences fonctionnelles non codantes

a) Séquences fonctionnelles codantes


*Famille de gènes dispersés :
De nombreux gènes codants des protéines appartiennent à des familles de gènes apparentés,
dispersés dans tout le génome . Le nombre de gènes dans une famille peut être limité ou très élevé :
- L’ovalbumine est codée par une famille de 3 gènes
- Les histones sont codées par des familles contenant de 100 à 1000 gènes
Les séquences exactes d’ADN des gènes à l’intérieur d’une m^me famille peuvent diverger. Ces
gènes homologues distincts peuvent remplir des fonction légèrement différentes les unes des autres
voire devenir nn fonctionnels pour certains, donnant naissances à des pseudogènes non transcrits.

* Répétition en tandem des familles de gènes :


Les cellules ont besoin de certains produits de gènes en grande quantité comme ceux des gènes
codant les composants de la transcription. Ces gènes ont évolués en famille répétées en tandem.
Exemples :
- Organisateur nucléolaire : répétitions en tandem des gènes d’ARN ribosomal atteignant
chez l’homme environs 250 copies.
- Gènes des ARNt : chez l’homme il existe environ 50 sites Kiique correspondant aux
différents types d’ARNt, chaque site contenant entre 10 et 100 copies
- Gènes des histones
Les multiples copies de ces répétitions en tandem sont identiques ce qui suggère la présence d’un
mécanisme de conservation des membres de la séquence.

b) Séquences fonctionnelles non codantes


Les télomères contiennent des répétitions en tandem de séquences simples d’ADN qui ne codent
aucun ARN ni prot mais ont néanmoins une fonction définie.
Les répétitions télomériques servent à résoudre un problème fonctionnel inhérent à la réplication
des molécules linéaires d’ADN. Au niveau du télomère, au-delà d’un certain endroit du brin retardé
(extrémité 3’) le système d’amorce d’ARN ne peut plus fonctionner. Il n’y a aucun moyen d’initier
la réplication au niveau du dernier fragment du brin tardif, ce qui laisse une région non répliquée
qui devrait conduire à un chromosome plus court, de 50 à 200 pb.

La réplication du brin tardif implique qu’une partie (en noir) soit absente du brin néosynthétisé.
Toutefois, une enzyme appelée télomérase ajoute des unités répétées simples aux extrémités. Chez
les vertébrés, il s’agit de la séquence (5’TTAGGG3’)n.
La longueur des télomères varie selon les chromosomes et l’espèce mais fluctue entre la centaine et
la dizaine de milllier de pb.
Les télomères vont permettre, outre d’assurer la réplication complète de l’ADN, de protéger
l’extrémité du chromosome en évitant qu’ils ne soient considérés comme des cassures d’ADN.
Plus spécifiquement, ceci évite la dégradation ou la fusion des extrémités des chromosomes. Ils
permettent également de positionner le K dans le noyau.

2. Séquences répétitives sans fonction connue :


Certains ADN répétés n’ont pas de fonction connue. Cet catégorie comporte des séquences d’ADN
qui ont en général un nombre de copies bien plus élévé que les familles de gènes fonctionnels.
La taille globale de cette classe est surprenante : environ 50 % du génome humain est constitué de
séquences répétitives non fonctionnelles d’un type ou d’un autre.

Différents types de répétitions existent dans le génome :


* Les répétitions en tandem en nombre variable :
- L’ADN hautement répétitif encadrant le contromère ou ADN satellite
- ADN minisatellite
- ADN microsatellite
* Les séquences transposées :
- Les transposon à ADN
- Les transposons à ARN ou rétrotransposons
*Les répétitions géantes :
- Les répétitions segmentaires
- Hyperploïdie et polyploïdie
* Les répétitions génériques :
- Les répétitions intrachromosomiques directes
- Les répétitions dispersées

a) Répétition en tandem en nombre variable :


Chez de nombreux organismes, certains segments d’ADN sont répétés en tandem à des positions
précises. Le génome humain comporte de nombreuses séquences courtes différentes dispersées dans
l’ensemble du génome, chacune étant réppétée de multiple fois en tandem.
Le nombre de ces unités répétées est variable, d’une dizaine à plus de cent, d’où l’appellation
VNTR pour « Variable Number of Tandem Repeats »
Ces répétitions de séquences courtes peuvent également être désignées sous le terme collectif de
répétitions de séquences simples, SSR pour "Simple Sequence Repeats". La densité des SSR est
plus élevée chez les eucaryotes.

Une des principales caractéristiques de ces SSR est leur taux élevé de modifications ou instabilité =
perte ou gain d'unité(s) conduisant a la contraction ou l'expansion de la séquence.

Ces répétitions sont très nombreuses et retrouvées dans tout le génome. Elles représentent environ
3% du génome humain, avec ne moyenne 1 SSR tous les 2 kpb, 0,5% provenant des répétitions de
dinucléotides (85% AC ou AT).

Ces répétitions multicopies en tandem (répétitions satellites) forment une super-famille de


répétitions où peuvent se dessiner au moins trois classes.

Ces dernières se distinguent par :


* la taille de l’unité répétée en tandem plusieurs fois,
* le nombre de répétitions du motif répété,
* la localisation sur le chromosome

Les 3 classes de répétitions :


* ADN satellite : longues séries de répétitions en tandem, région d’hétérochromatine G
* ADN minisatellite : séries de longueur modérée de répétitions en tandem sur
chromosomes autosomaux
* ADN microsatellite : segments de longueur courte (di-, tri- ou tétra- nucléotidiques),
très nombreux et retrouvés dans tout le génome. Le plus souvent : (A)n, (CA)n, (CT)n,
avec n = nombre de répétitions (5-20)

* L ‘ADN hautement  répétitif encadrant le centromère ou ADN satellite :


Lorsque l'ADN génomique est centrifugé dans un gradient de densité de chlorure de césium, une
bande "satellite" apparait souvent en une position différente de celle de la bande principale d'ADN.
Cet ADN satellite est constitué de multiples répétitions en tandem de courtes séquences
nucléotidiques de 14 a 500 pb, qui peuvent s'étendre sur des centaines de kilobases de long.
La majeure partie de cet ADN satellite se trouve dans les régions d'hétérochromatine qui sont des
régions très compactes encadrant les centromères.

* ADN minisatellite :
L'ADN minisatellite représente une classe particulière de répétitions en tandem qui est présente en
nombre variable au niveau de locus distincts ou d'organismes différents.
Chez l'homme, les locus de ces VNTR sont des séquences de 1 a 5 kb, comportant un nombre
variable d'unité d base longue de 15 a 100 nucléotides.
Il existe des minisatellites ayant la même unité répétée mais un nombre différent de répétitions.
Chez l'homme, la plupart des minisatellites sont situées dans les régions subtélomériques.
Le taux d'instabilité des minisatellites varie d'un génome a l'autre (ex : instabilité moins élevée dans
le génome de Mus musculus que dans celui de Homo sapiens).
Les minisatellites ne sont pas des répétitions strictes dune même unité.
Les multiples copies de l'unité de base constituant le minisatellite présentent des différences de
séquences.

*ADN microsatellite :
Les microsatellites sont les plus simples répétitions rencontrées dans les génomes.
Elles sont constituées d'un motif très simple, de 2 a 11pb, et sont répétées en tandem des dizaines de
fois, c'est-à-dire pour atteindre une séquence de quelques centaines de bases de bases de long. Le
plus souvent (A)n, (CA)n, (CT)n avec n = nombre de répétitions (5-20).
L'abondance des différents microsatellites est variable.

Les répétitions de dinucléotides sont beaucoup plus fréquentes que les répétitions trinucléotidiques.
Et parmi les répétitions de dinucléotides, certaines répétitions comme 5'-AC-3' ou 5'-AT-3' sont
beaucoup plus rependues que d'autres, tel que 5'-GC-3'.

Le polymorphisme porte sur la taille du microsatellite. Le modèle théorique le plus simple pour
expliquer le polymorphisme des microsatellites est d'envisager une variation de longueur par
addition ou délétion d'une ou de plusieurs unités de répétition ("stepwise mutation model") causée
par un dérapage réplicatif.

En raison de la variabilité du nombre de répétitions en tandem d'une personne a l'autre, le profil est
spécifique de chaque individu. Pour chaque individu, on peut donc établir un profil génétique qui
est l'ensemble des allèles présents aux différents locus étudiés.

On réalise ainsi le "génotypage d'un individu". Ces arrangements spécifiques a chaque individu
constituent des empreintes génétiques qui sont très utilisées en médecine légale (recherche de
paternité, criminologie ...).

Ces microsatellites on été utilisés comme marqueur a partir de 1989 du fait qu'ils sont hautement
polymorphes c'est-à-dire présentant une forte variabilité entre les individus. Du fait de cela, il n'est
pas rare de trouver plus de 30 allèle a un locus donné dans une population. Ces marqueurs
microsatellites ont d'ailleurs supplanté les marqueurs RFPL.

b) Séquences transposées :
Dans les années 1940, en étudiant la génétique de la bigarrure des grains de maïs, Barbara
McClintock a découvert un élément génétique mobile qui ne régule pas seulement la bigarrure mais
qui est aussi responsable de la cassure des chromosomes. Elle appela cet élément
Dissociation (Dis) = transposon.
Depuis cette découverte, de nombreux éléments transposables ont été identifiés et sont regroupés en
"familles" sur la base de leur similarité de séquence d'ADN.

Les génomes de la plupart des organismes contiennent des exemplaires multiples de plusieurs
membres de ces familles d'éléments transposables. Ils représentent environ :
- 27% du génome du poulet
- 45% du génome de l'Homme
- 60% du génome du maïs
- 99% du génome du Lys

Les éléments mobiles forment une famille particulière de séquences répétées qui se sont propagées
dans le génome, sautant d'un emplacement a autre au sein du génome. Ils constituent des éléments
produisant des duplications a longue distance.
Ces événements de duplication très élaborés, nommés transposition, ne sont possibles que pour des
séquences très particulières, les transposons.
Le phénomène de transposition conduit ces éléments a s'insérer dans une nouvelle région, la plupart
du temps la copie originale restant a son site initial, sans restriction spécifique de complémentarité.
Ces séquences se multiplient et s'accumulent partout dans le génome. Elles représentent 45% du
génome humain.
La transposition s'effectue par copie coupure du site cible puis insertion de l'élément transposable,
réaction catalysée par l'enzyme transposase. Chaque famille d'éléments transposable code sa propre
transposase qui se distingue par la distance séparant les 2 sites de coupure au sein de la séquence
cible. Cette distance varie de 1 a 12pb et détermine la longueur du site de duplication.
La cassure décalée du site cible produit des extrémités 3' débordantes de quelques nucléotides sur
chaque brin qui sont par la suite ligaturées aux extrémités 5' de l'élément transposable qui s'insère.
Une fois la jonction réparée par des enzymes spécialisées, l'insert se trouve bordé par une
duplication de la séquence cible. Certains éléments transposables transposent par un intermédiaire
ADN, d'autres par un intermédiaire ARN.

Le génome humain contient toutes catégories confondues environ 45% d'éléments transposables
* SINEs : 13,3%, seraient capable d'induire la traduction dans les conditions de stress
* LINEs : 20,4%, dont LINE1 en grande partie
*Eléments a LTR : 8,3% - Eléments a ADN : 2,8%, dont mariner (0,1%) - Non classés :
0,1%

Les différences importantes de séquences observées entre les copies de ces éléments prouvent que
la majorité des transposons du génome n'est plus capable de transposition. Une fois présents dans le
génome, ces éléments peuvent persister pendant des périodes très longues et subir des changements
mutationnels importants.
Les transposons jouent un rôle important dans l'adaptation, la régulation et le transfert de gène.
Son emploi en génomique fonctionnel est croissant (cancer ...).

c) Les répétitions géantes :


Il existe notamment dans les génomes eucaryotes, un certain nombre de répétitions de très
grande taille → répétitions géantes.
Ces répétition peuvent couvrir :
* De quelques dizaines a quelques centaines de kilobases → répétitions segmentaires.
* Des chromosomes entiers → hyperploïdie
* Des génomes entiers → polyploïdie

* Les répétitions segmentaires :


Les répétitions segmentaires sont des blocs de 1 a 200kb transférés entre différentes positions du
génome (inter ou intra-chromosomique).
Dans le génome humain, ces répétitions sont nombreuses.
Les répétitions de longueur supérieure a 10kb et d'identité supérieure a 98% représente 2,5% du
génome, et au total, elles représentent environ 3,6% du génome a un niveau > a 90% d'identité.

* L'hyperploïdie :
On appelle ploïdie le nombre de copies des différents chromosomes du génome nucléaire des
eucaryotes
La ploïdie chez les eucaryotes est en général égale à 1 (organismes haploïdes) ou 2 (organismes
diploïdes)
Si un organisme se reproduit de façon sexuée, plusieurs niveaux de ploïdies coexistent chez cet
organisme
Il existe différents types de changement du nombre de chromosomes : Le changement du nombre de
chromosomes peut concerner 1 ou quelques chromosomes = aneuploïdie ou le lot chromosomique
complet = euploïdie
L’euploïdie désigne le lot haploïde (n) complet de chromosomes à 1 ou plusieurs exemplaire(s).
L’euploïdie désigne donc une cellule ou un individu dont tous les jeux de chromosomes sont
complets
L’aneuploïdie désigne un écart à cet état cad jeux
chromosomiques incomplets
Dans ces 2 grandes catégories, il existe plusieurs types de
mutation
Tout changement du nombre de chromosomes sans
modification de structure est appelé mutation génomique ou
caryotypique

L’aneuploïdie

L’aneuploïdie désigne un changement du nombre de


chromosomes dû à une perte = aneuploïdie par défaut : 2n - a
ou à un gain = aneuploïdie par excès : 2n + a d’un ou de plusieurs chromosomes mais ne concerne
pas le lot entier de chromosomes
Les cellules humaines possèdent 46 chromosomes correspondant à 2 compléments de 23
chromosomes, l’un d’origine maternelle, l’autre d’origine paternelle. Chaque complément est
composé d’1 chromosome sexuel (X ou Y, la femme possédant 2 X, et l’Homme possédant 1 X et 1
Y) et de 22 autosomes, numérotés de 1 à 22
La formule chromosomique normale s’écrit selon la formule en vigueur : 46, XX chez la femme et
46, XY chez l’Homme
Un individu qui aurait perdu un chromosome et n’en posséderait que 45 serait dit monosomique
pour le chromosome en copie unique. S’il possède 47 chromosomes dont, par exemple, 3 copies du
chromosome 21, il sera dit trisomique pour le chromosome 21
La nullisomie désigne la perte de 2 chromosomes homologues (2n – 2)
La monosomie désigne la perte d’un chromosome (2n - 1 )
La trisomie ou la tétrasomie traduisent respectivement la présence de 3 (2n +1)
ou de 4 (2n + 2) chromosomes homologues
La disomie (n + 1 ) désigne une anomalie concernant un organisme haploïde
Les aneuploïdies résultent d’anomalies de ségrégation des chromosomes ou malségrégations

L’hyperploïdie est donc un type d’aneuploïdie par excès cad 1 ou plusieurs chromosomes en plus
L'un des exemples d'hyperploïdie le plus connu chez l'homme est la trisomie 21.
Dans certains cas, une mauvaise ségrégation peut conduire a une duplication complète d'un ou de
deux lots de chromosomes menant respectivement a des tri et tétraploïdes.

* La polyploïdie :
L’euploïdie
L’euploïdie désigne le lot haploïde (n) complet de chromosomes à 1 ou plusieurs
exemplaire(s)
La diploïdie désigne 2 lots de chromosomes (2n)
La polyploïdie désigne un nombre supérieur à 2 lots de chromosomes. Ainsi, on peut
observer une tri-, tétra-, penta-, hexa-, ou octoploïdie (3, 4, 5, 6 ou 8 lots haploïdes)
Les polyploïdies de rang impair (3, 5...) sont appelés périssoploïdies et les polyploïdies de
rang pair (4, 6, 8...), artioploïdies

Il existe deux types de polyploïdisation :


* L’allopolyploïdisation : qui résulte de la fusion de 2 génomes différents .
* L’autopolyploïdisation : qui consiste en la duplication interne de tous les chromosomes.
Chez les vertébrés, un des exemples de polyploïdie le plus spectaculaire est celui de la famille des
xénopes : la plupart d'entre elles présentent un caryotype de 36 chromosomes, mais certaines
possèdent 72 (tetraploïdes) voire 108 (hexaploïdes).

Concernant l’obtention de la polyploïdie ou ploïdisation, divers mécanismes peuvent être envisagés

La modalité la plus courante conduisant à cet état est une anomalie mitotique où à l’issue de la
mitose le noyau renferme 2 fois plus de chromosomes que le noyau originel par absence de
cytocinèse, les chromosomes dupliqués ne sont pas répartis dans 2 cellules filles
Ce mécanisme d’endoréplication ou endomitose, peut se produire spontanément ou être
provoqué expérimentalement par l’action de certains agents physiques comme le froid ou par
l’emploi d’agents chimiques comme la colchicine

De telles mutations conduisent au doublement du nombre de chromosomes cad à une polyploïdie de


rang pair
Ainsi, les cellules peuvent passer d’un état haploïde à un état diploïde, d’un état diploïde à
un état tétraploïde, d’un état tétraploïde à un état octaploïde…
On désigne par autopolyploïdie, un mécanisme d’endoréplication concernant le génome
d’un individu, et par allopolyploïdie ou amphiploïdie, un mécanisme d’endoréplication suivant
l’hybridation de 2 génomes différents

C) L’ADN non répétitif

1. ADN intercalaire
L’ADN intercalaire ou « spacer » pourrait avoir comme fonction de séparer des
séquences d’ADN mais à ce jour les informations le concernant demeurent faibles
L’existence d’ADN sans fonction connue ou ADN égoïste constitue une énigme pour les
généticien
L’ADN égoïste est une classe d’ADN qui n’existe que pour elle-même et qui n’est jamais
soumise à la pression de l’expression phénotypique
Il est possible que cet ADN joue un rôle indirect fournissant peut-être la masse critique
requise pour une ségrégation efficace lors de la division cellulaire
Il pourrait également servir à séparer les éléments fonctionnels (gènes) pour permettre une
régulation efficace

2. Les gènes fonctionnels à copie uniques (cf II)

D) Bilan

Bilan 1ère partie

L’analyse des génomes a permis de montrer que le génome doit être perçu comme un édifice
complexe, de gènes, de séquences régulatrices et, chez les eucaryotes, de régions non codantes et de
séquences répétées
L’origine des séquences d’ADN est variée : ADN étranger, séquences provenant des organites.…
Une petite proportion d’ADN est localisée dans le cytoplasme séquestrée dans les organites
Bien que de taille modeste, cet ADN fait partie du patrimoine génétique de l’individu
Aujourd’hui, nous pouvons donner comme définition du mot génome l’ensemble des séquences
d’ADN d’un individu ou d’une espèce
Au fur et à mesure des découvertes, la définition du gène comme étant initialement un fragment
d’ADN permettant la synthèse d’une protéine, a évolué
Le gène doit être considéré plutôt comme un concept et non comme un support matériel
Chaque gène a une fonction élémentaire permettant à l’organisme d’accomplir des fonctions
complexes et différentes, chaque fonction mobilisant un très grand nombre de gènes
Structure des gènes et expression géniques

I) Structure des gènes

A) Généralités :

1. Comment définir un gène ?


Classiquement, on sous-entend par gène une unité d’information qui peut être transmise pzr un
individu à sa descendance et qui correspond à une séquence d’ADN permettant de spécifier la
synthèse d’un ARN (ARNt, ARNr, …) ou d’une protéine.
Gène = séquence d’ADN produisant une molécules fonctionnelle

2. structure de base :

a) Le promoteur : C’est le lieu


de fixation du cmplx de
transcription (ARN
polymérase) qui permet de
définir le début de synthèse des ARN. Tous les gènes doivent posséder un promoteur pour être
transcrits.
b) L’unité de transcription : Elle définit les limites du fragment d’ADN qui sera transcrit en ARN
par l’ARN polymérase

c) Le site d’initiation de la transcription (site +1)  : Il définit le 1er ntd synthétisé par l’ARN
polymérase. Cela correspond à l’extrémité 5’P de l’ARN

d) Le terminateur de transcription (t) : Il situe le lieu où l’ARN polymérase va se dissocier de


l’ADN. Cela correspond à l’extrémité 3’ OH de l’ARN.
Il existe des différences importantes au niveau de l’extrémité 3’ OH des ARN procaryotes et
eucaryotes.

3. Structure des gènes régulés :


Il faut distinguer 2 catégories de gènes :
- Les gènes non régulés qui s’expriment dans tous les types cellulaires et tout au long de la
vie de la cellule = expression constitutive.
- Les gènes régulé qui s’expriment de manière différentes selon le type de tissus, selon la
période de dvlpmt ou la présence d’un stimulus = expression conditionnelle
Ces gènes ont besoin de régions supplémentaires permettant leur régulation

Dans l’ordre d’importance on trouve :


*La région de régulation en amont
Ellle se situe juste avant le promoteur. C’est la région que l’on trouve le plus fréquemment car elle
permet une interaction directe entre les facteurs de régulation qui se fixent dessus et le cmplx de
polymérisation (ARN polymérase)

* Les régions enhancer et silencer


Elles sont détectées dans de plus en plus de gènes.Ce sont des régions de régulation souvent
difficiles d’augmenter ou de diminuer le niveau de transcription

*Les autres régions de régulation


Dans certains cas, des régions de régulation peuvent se trouver à l’intérieur même du gène (dans un
intron par ex) ou en aval du gène

B) . Les gènes procaryotes


Les gènes présentent une structure différente selon le type d’ARN synthétisé :
* ARN codant des protéines : ARNm
* ARN de structure : ARNr et ARNt

1. Les gènes codants les ARNm


On trouve 2 types d’organisation de gènes indépendamment du fait qu’ils soient régulé ou non

a) Gènes monocistroniques
Ces gènes sont dits monocistroniques car ils permettent de synthétiser un seul type de
protéine à partir d’un type d’ARNm
C’est la structure la plus classique d’un gène qu’il soit
procaryote ou eucaryote
Dans l’ARN, on trouve une région codante
Cette région, délimitée par le codon AUG de début de
traduction et le codon STOP de fin de traduction, va définir la
zone de traduction de l’ARNm en protéine
Pour cette région codante, on utilise aussi le terme d’ORF
(Open Reading Frame) traduit par « cadre de lecture ouvert »

De part et d’autre de l’ORF, on trouve les régions qui


ont été transcrites par l’ARN polymérase mais qui ne sont pas
traduites en protéine
Ces régions sont appelées UTR (Untranslated Region)
(La 5’ UTR se trouve du côté 5’ et la 3’ UTR du côté 3’)

b) Gènes polycistroniques ou opérons


Ces gènes permettent de synthétiser plusieurs types de protéines à partir d’un seul type
d’ARNm. On trouve plusieurs ORFs sur un même ARN, chacune d’entre elles permet de
synthétiser une protéine différente
Parfois il y a un un chevauchement des ORFs dans lequel l’AUG d’une ORF se trouve dans l’ORF
qui précède
Intérêt de cette structure : mettre en place simultanément toutes les enzymes impliquées dans une
voie métabolique : expression simultanée et coordonnée
Parmi les opérons :
- certains permettent les dégradations = opérons cataboliques, comme des sources de
carbone (ex opéron lactose)
- et d’autres permettent des synthèses = opérons anaboliques, comme celles des acides
aminés (ex opéron tryptophane)

Les gènes polycistroniques sont généralement régulés


Leur expression est souvent induite en réponse à un stimulus
L’un des exemples les plus communément décrits est celui de l’opéron lactose
Dans cet exemple, le lactose, qui est une source de carbone, déclenche l’expression de l’opéron
Les protéines produites (β-galactosidase et lactose perméase) permettent à la bactérie d’assimiler
cette source de carbone.

2. Les gènes codant les ARNr et ARNt


Ces gènes permettent la synthèse des :
- ARN ribosomique (ARNr) impliqués dans la structure des ribosomes
- ARN de transfert (ARNt) qui portent les aa lors de la traduction des ARNm en protéines
La structure de ces gènes est particulière car l’unité de transcription permet la synthèse d’un ARN
précurseur qui sera clivé par la suite pour former les différents ARNr et ARNt nécessaires à la
cellule.
La classe des ARNr correspond chez les pk à l’ARN :
- 16S : petite ss-unité du ribosome
- 5S et 23 S : grande ss-unité

C) . Les gènes eucaryotes :


Selon le type d’ARN, on trouve chez les eucaryotes plusieurs types de gènes. Chacun de ces gènes
a une organisation différente

Chez les eucaryotes, il existe 3 types d’ARN polymérases associées à ces gènes :

1. les gènes codant les ARN ribosomiques 28S, 18S et 5,8S qui interviennent dans la
structure du ribosome sont transcrits par l’ARN polymérase I

2. les gènes codant les ARNm pour la synthèse des protéines seront transcrits par l’ARN
polymérase II
3. les gènes codant les ARN ribosomiques 5S et les ARN de transfert sont transcrits par
l’ARN polymérase III
Chacun de ces types de gènes possède un promoteur particulier reconnu par l’ARN polymérase qui
lui est associé

La classe des ARNr correspond chez les euk à l’ARN :


- 8S (pol I) : petite ss-unité du ribosome
- 5S (pol III), 5,8S (pol I) et 28S (polI) : grande ss-unité

1. Gènes codant les ARNr 28S, 18S et 5,8S (ARN polymérase I)


a) Structure des gènes
On retrouve pour ces gènes un principe analogue à celui des
procaryotes. Un gène va synthétiser un « grand » ARN
précurseur qui va ensuite être coupé en 3 ARNr de tailles
différentes.
Ribosomes, sous-unités et ARNr associés sont caractérisés par
leur indice de sédimentation évalué en unités Svedbeg, notées
S
La relation entre la taille de ces ARNr et leur coefficient de
sédimentation (S) est la suivante :
Selon les espèces, la taille des ARNr
reste constante mais celle de l’unité de
transcription est très variable
Ex chez l’Homme, le précurseur
(appelé 45S) mesure 13 kb alors que
chez la Drosophile, il ne mesure que 7,7 kb
La différence de taille vient des régions éliminées

b) Organisation dans le génome


Chez les eucaryotes, les gènes codant les ARNr sont localisés dans le nucléole, qui apparaît sous la
forme d’une région de forte densité dans le noyau
Une des nécessités de la cellule est de pouvoir doubler sa quantité de ribosomes lors d’un cycle
cellulaire. Les ARNr faisant partie de la structure du ribosome, il faut aussi doubler leur quantité
En terme de transcription, même si l’activité est maximale (en nombre d’ARN synthétisés par unité
de temps), elle sera insuffisante pour synthétiser la quantité d’ARNr nécessaire.
Afin d’obtenir une grande quantité d’ARN, on trouve une grande quantité de gènes
identiques dupliqués dans le génome. Cette quantité est variable selon les espèces mais s’élève
généralement à plusieurs centaines.
On trouve par exemple 250 gènes identiques pour les ARNr chez l’Homme et 400 chez la
Drosophile

2. Gènes codant les ARNm (ARN polymérase II)


a) Structure des gènes
Chez les eucaryotes, les gènes à l’origine de la synthèse
protéique sont dits morcelés : leur unité de transcription est
composée d’exons et d’introns
Lors de la transcription, il y a synthèse d’un ARN complet, l’ARN prémessager, qui subit une
maturation pour donner l’ARN messager (ARNm)
Les exons qui portent la séquence codante nécessaire à la synthèse de la protéine sont
conservés dans l’ARNm tandis que les introns sont éliminés = épissage
De plus, les extrémités de l’ARN sont modifiées (coiffe en 5’ et queue poly A en 3’)
La taille des gènes, le nombre d’exons et d’introns est assez variable d’un gène à l’autre
mais surtout d’une espèce à l’autre.
Dans certains cas (ex : Mammifères), la taille des introns est très importante par rapport à celle des
exons
Chez l’Homme, les introns représentent près de 90 % de la taille du gène
Les exons ne sont donc que des « îlots » dans un « océan d’introns » et dans le génome d’un point
de vue général : chez l’Homme, les exons correspondent seulement à 1,5 % de la taille du génome .
En tenant compte de ces proportions, la structure d’un gène de ce type est la suivante :

Quand on observe cette structure, on peut se poser la question : « A quoi servent les introns ? » De
manière simpliste, on pourrait répondre : « A rien car un procaryote fonctionne très bien sans
introns »
En fait, l’évolution moléculaire nous apprend que les introns ont eu et ont encore un rôle essentiel
dans la création de nouveaux gènes en permettant des remaniements (entre exons par exemple) qui
ne seraient pas possibles autrement
La présence d’introns a contribué à créer la grande variabilité génétique que l’on observe
aujourd’hui chez les eucaryotes

b) Organisation dans le génome


Les gènes codant les protéines ne représentent qu’une faible portion du génome
Chez l’Homme, on estime qu’il existe environ 25 000 gènes, représentant environ 30 % du génome
La majorité des gènes codant les protéines nécessaires au fonctionnement de la cellule sont
présents en copie unique (par génome haploïde) mais 10 à 15 % de ces gènes peuvent être présents
en plusieurs copies : on parle de gènes dupliqués
Ces gènes peuvent être l’un derrière l’autre (en tandem) ou bien répartis dans le génome
L’ensemble des copies d’un même gène forme une famille multigénique

3. Gènes codant les ARNr 5S et les ARNt (ARN polymérase III)


Rappel : ces gènes doivent posséder un promoteur spécifique leur permettant d’être reconnus par
l’ARN polymérase III
a) Les gènes des ARNr 5S
Les ARNr 5S synthétisés rentrent dans la structure du ribosome au même titre que les autres ARNr
Les gènes codant ces ARNr ne possèdent pas d’introns
Ils ne sont pas localisés dans le nucléole comme les autres ARNr mais sont aussi en grand nombre
de copies : on trouve 2 000 copies chez l’Homme et 330 copies chez la Drosophile
Enfin, pour ces gènes, il existe des mécanismes d’initiation de transcription particulièrement
efficaces leur permettant de synthétiser rapidement de grandes quantités de molécules
b) Les gènes des ARNt
Il existe plusieurs dizaines d’ARNt différents synthétisés (nombre variable selon les espèces)
Chaque type d’ARNt possède son gène spécifique
Certains ARNt possèdent des introns qui leur sont spécifiques et différents de ceux décrits
précédemment. Ils doivent donc subir des maturations
Les gènes des ARNt sont aussi en grande quantité dans le génome. Pour l’ensemble des ARNt, on
trouve 1 300 gènes chez l’Homme et 1 700 gènes chez la Drosophile
Comme ceux des ARNr 5S, les gènes des ARNt possèdent des mécanismes d’initiation de la
transcription particuliers.

II) Expression génique : transcription et traduction

A) .La transcription

1. Généralités
La transcription est l’étape qui consiste à « transformer » en ARN un fragment d’ADN contenant un
gène
Ce processus est généralisable à l’ensemble des gènes pour la synthèse des ARNr, ARNt et ARNm

a) Les éléments nécessaires


Pour transcrire un gène, il faut plusieurs éléments. Chacun de ces éléments sera détaillé plus loin

b) le principe générale 
La synthèse de l’ARN est réalisée par
des ARN polymérases qui utilisent
l’ADN comme matrice
La zone de transcription d’un gène
ou unité de transcription se situe
entre le site d’initiation de la
transcription (+1) et le terminateur de
transcription (t)
Le complexe de transcription (ARN polymérase + facteurs de transcription ) va se fixer sur la
région promotrice et choisir le brin matrice à transcrire
C’est le promoteur qui permet de déterminer le sens de transcription
2 gènes différents peuvent être transcrits dans 2 sens différents sur un même fragment
d’ADN :
La terminologie utilisée pour nommer le brin
lu cad le brin matrice peut varier selon les
ouvrages et les auteurs
Le plus simple est de nommer brin transcrit
le brin utilisé comme matrice et de nommer
brin non transcrit le brin complémentaire de
la molécule d’ADN

2 gènes différents peuvent être transcrits dans 2 sens différents sur un même fragment
d’ADN :
Au cours de la synthèse, l’ARN
polymérase « lit » la matrice d’ADN
(donc le brin transcrit) dans le sens 3’ 5’
et synthétise l’ARN dans le sens 5’ 3’
Les flèches indiquent le sens de
déplacement de 1’ARN polymérase,
donc l’orientation du gène. Quand 2
gènes sont en orientation opposée sur un même fragment d’ADN, le brin transcrit d’un gène
correspond au brin non transcrit de l’autre gène et réciproquement
A retenir : les synthèses d’acides nucléiques, réalisées par l’ADN polymérase (réplication)
ou par l’ARN polymérase (transcription), se font toujours par addition d’un (d)NTP sur une
extrémité 3’ OH libre
Il devient ainsi facile de retrouver les orientations. On commence par représenter la molécule en
cours de synthèse
Par exemple, si la synthèse d’un ARN se fait de la gauche vers la droite, il est orienté 5’ 3’. Il suffit
ensuite de situer les brins, transcrits et non transcrits par complémentarité (brins antiparallèles)

c) ARN polymérase(s)
L’ARN polymérase est l’enzyme qui permet de synthétiser la chaîne polynucléotidique
d’ARN
Chez les procaryotes, il n’existe qu’un seul type d’ARN polymérase pour tous les types de gènes :
codant les ARNr, ARNt et ARNm
Chez les eucaryotes, on trouve 3 types d’ARN polymérases associées à des types de gènes codant
des ARN différents
Toutes ces polymérases forment des très gros complexes constitués de plusieurs sous-unités

d) différentes étapes
La transcription des gènes en ARN se produit en 3 étapes
successives :
-initiation
-élongation
-terminaison

*Initiation :
Pour qu’un gène soit reconnu et qu’il soit transcrit, il doit obligatoirement posséder un
promoteur qui va fixer le complexe de polymérisation = facteurs de transcription + ARN
polymérase
Cette première étape est essentielle car elle va donner le point de départ de la transcription
Les facteurs de transcription reconnaissent des séquences nucléotidiques spécifiques ou boîtes (box)
sur le promoteur
La nature de ces boites et des facteurs étant différente entre procaryotes et eucaryotes, elles
seront décrites spécifiquement plus tard
C’est aussi l’initiation qui fixe le niveau d’expression du gène
En effet, chaque fois qu’il y a une initiation de transcription, il y a production d’une molécule
d’ARN . Donc plus cette initiation se reproduira souvent et plus il y aura de molécules d’ARN
synthétisées par unité de temps. La plupart du temps, les gènes sont régulés au niveau de 1’initiation
pour adapter la production d’ARN aux conditions environnementales
*Elongation :
L’élongation de la transcription débute dès que le premier nucléotide de l’ARN est synthétisé

Elle nécessite la présence de facteurs particuliers


appelés facteurs d’élongation
La synthèse de la chaîne d’ARN se fait toujours dans
le sens 5’ 3’
Ce processus est réalisé au cours de la transcription
par l’enzyme ARN polymérase
Le nouveau nucléotide est toujours ajouté à
l’extrémité 3’OH libre. Il arrive sous la forme NTP (UTP dans la figure) et s’associe à la base
complémentaire sur le brin matrice de l’ADN. L’énergie nécessaire à la formation de la liaison
phosphodiester est fournie par l’hydrolyse de 2 Ppi.

*Terminaison
Cette dernière étape permet à l’ARN polymérase de se décrocher de la matrice d’ADN et de libérer
l’ARN synthétisé
Cette dissociation se fait au niveau du terminateur de transcription (t). Les mécanismes de
terminaison procaryotes sont bien connus, contrairement à ceux des eucaryotes
II existe 2 différences fondamentales entre le génome des procaryotes et le génome nucléaire des
eucaryotes :
- la première est liée à la compartimentation de la cellule
-la seconde est associée à l’organisation des gènes
Il en résulte que l’expression génique, chez les procaryotes et les eucaryotes, repose sur des
mécanismes différenciés

2. Transcription chez les procaryotes


a) L’ARN polymérase :
L’ARN polymérase des procaryotes est un gros
complexe (385 kDa) constitué de 5 sous-unités
parfaitement bien caractérisées :

L’ARN polymérase ainsi constituée de ses 5 sous unités porte le nom de « core enzyme » que l’on
peut traduire par « cœur de l’enzyme »
Sa structure 3D est bien connue. L’enzyme adopte une structure en « pince de
crabe » qui va se refermer sur l’ADN
Sous cette forme, la polymérase est capable de synthétiser de l’ARN mais ne peut
pas reconnaître le promoteur d’un gène. Pour cela, il faut lui adjoindre le facteur
σ que l’on peut considérer comme une sous-unité de l’ARN polymérase
Ce facteur va reconnaître le promoteur et permettre à l’ARN polymérase
d’initier la transcription. Lorsque l’ARN polymérase est associée au
facteur σ, elle porte le nom d’holoenzyme
b) Inititiation :
*Structure du promoteur
Le promoteur d’un gène est par définition la région du gène reconnue par le complexe de
transcription cad par les facteurs de transcription associés à l’ARN polymérase
La comparaison de nombreuses séquences en amont du site d’initiation de la transcription (+1) fait
apparaître 2 séquences nucléotidiques conservées ou consensus :
- une séquence riche en A et T appelée boîte TATA (TATA box ou Pribnow box)
placée à environ -10 paires de bases du site +1
- une séquence appelée boîte -35 (-35 box) à environ -35 paires de bases du site +1

Les séquences consensus sont toujours données sur le brin non transcrit (orienté 5’ 3’
pour une lecture de gauche à droite) mais elles sont reconnues sous forme de double brin sur
l’ADN. De plus, leur position peut être légèrement variable d’un gène à l’autre
Ex : pour un gène donné, le premier T de la boite TATA box est exactement le 13ème nucléotide en
amont du + 1 alors que pour un autre gène ce même T est à la 11ème position.

Enfin, en examinant le pourcentage de conservation de chacun des nucléotides dans une même
boîte, on voit par exemple que le 3ème nucléotide de la TATA box n’est conservé qu’à 45 %, ce qui
signifie que seulement la moitié des gènes possède ce T.
Si l’on étend cette remarque aux autres nucléotides, on voit finalement que beaucoup de gènes ont
une séquence TATA qui diffère du consensus (TATAAT)
Ex : le gène lacI codant le répresseur LacR de l’opéron lactose possède la séquence CATGAT pour
boîte TATA et l’opéron lactose possède la séquence TATGTT à cette place

Ces différences peuvent influencer le niveau d’expression d’un gène


Ainsi, en dehors de toute régulation :
- un promoteur possédant des séquences proches des consensus aura une forte
transcriptionnelle, on parlera alors de promoteur fort
- tandis qu’un promoteur dont les boîtes ont des séquences éloignées des consensus aura un
niveau d’expression faible, on parlera alors de promoteur faible
*Facteur σ70

La reconnaissance du promoteur d’un gène se fait par association entre les boîtes TATA et -35 de
l’ADN et le facteur protéique σ

Chez les procaryotes, ce facteur est appelé σ70 (70 kDa). Il


possède 4 domaines différents (σ1 à σ4) pouvant interagir
avec les 2 boîtes. La région 2 s’associe à la boîte TATA
tandis que la région 4 s’associe à la boîte -35
C’est la position du facteur σ70 par rapport aux 2 boîtes qui détermine le brin matrice et permet de
faire la transcription dans la bonne orientation

*Etapes de l’initiation

La reconnaissance du promoteur par le complexe de


transcription est la 1ère étape essentielle dans l’expression
d’un gène
Diverses expériences ont montré comment l’ARN polymérase
se comportait vis-à-vis de l’ADN
Le « core ARN polymérase » (sans facteur σ70 ) a une forte
affinité pour l’ADN mais aucune spécificité de séquence
Cette forte affinité va limiter le déplacement de la polymérase
pour la transcription

Le facteur σ :
- va réduire cette affinité de l’ARN polymérase pour
l’ADN d’un facteur 10 000
- va permettre de reconnaître les séquences -35 et -10
spécifiques du promoteur
Le départ de la transcription pourra donc se faire au bon
endroit et dans la bonne direction

Lorsque l’ensemble ARN polymérase et facteur σ est stabilisé sur le promoteur, il y a formation
d’un complexe dit complexe fermé.
Le double brin d’ADN va s’ouvrir au niveau de la boîte TATA pour permettre le début de la
synthèse de l’ARN, ce complexe est alors appelé complexe ouvert (sur une longueur d’une
quinzaine de nt dans la région -10 qui étant riche en A et T s’ouvre plus facilement)
Les premiers NTP (nucléosides triphosphate) vont s’insérer pour former l’extrémité 5’ de
l’ARN
A ce stade, plusieurs essais de départ sont réalisés et une fois que la transcription est enclenchée, le
facteur σ se décroche pour permettre l’élongation de l’ARN.

*Les facteurs σ spécifiques


Le facteur σ reconnaît spécifiquement les gènes qui possèdent les boîtes TATA et -35
II existe d’autres gènes qui peuvent être exprimés dans certaines conditions particulières telles que
des carences en nutriments, des températures élevées, etc.
Ces gènes, qui ne sont pas utiles dans les conditions de vie « normale » de la cellule, doivent être
activés
Pour cela, ils doivent posséder des séquences de reconnaissance spécifiques et des facteurs σ qui
leur sont associés

Une bactérie comme E. coli possède 7 facteurs σ différents qui permettent d’initier la
transcription de gènes de manière contrôlée
Un exemple classique décrit dans la littérature est celui du choc thermique
Lorsque l’on soumet une culture bactérienne (E. coli) à une augmentation plus ou moins importante
de température, on voit apparaître de nouveaux facteurs σ (ex σ32)
Ces facteurs vont permettre l’expression de gènes spécifiques (heat shock genes) permettant de
lutter contre cette augmentation de température
Un autre exemple est celui de la carence en azote
Si l’on retire les sources d’azote dans un milieu de culture bactérien, on voit apparaître le facteur
σ54 qui va induire l’expression de gènes permettant de récupérer d’autres sources d’azote
Il est intéressant de remarquer que la plupart de ces nouveaux facteurs σ (sauf σ54) vont reconnaître
des boîtes positionnées au même endroit que les boîtes classiques (-10 et -35) mais avec des
séquences qui leur seront spécifiques

c) . Elongation
* Facteur d’élongation
Lorsque le facteur σ70 se dissocie, il doit être remplacé par un facteur d’élongation

*Synthèse de l’ARN

Le double brin d’ADN va s’ouvrir en suivant le déplacement


de l’ARN polymérase puis se refermer en double brin lorsque
l’ARN est synthétisé
On estime que l’ouverture du double brin se produit sur
environ 30 à 45 nucléotides et que la liaison ADN/ARN
persiste sur environ 15 nucléotides

*Contraintes topologiques et vitesse de transcription

Le double brin d’ADN va s’ouvrir devant l’ARN polymérase et se refermer derrière elle lorsque l’ARN
est synthétisé
Cette action va créer des contraintes dans la structure du double brin
En général, chez les procaryotes, l’ADN est circulaire et surenroulé, ce qui facilite l’ouverture de
l’ADN mais ce sont les topoisomérases qui contrôlent de manière précise ces contraintes
topologiques
La vitesse de transcription est estimée en moyenne à environ 40 nucléotides par seconde mais elle
peut être très variable
L’un des paramètres intervenant sur cette vitesse de déplacement est la conformation à la fois de
l’ARN (ex tige/boucle) et de l’ADN
On sait que la molécule d’ADN peut subir des torsions importantes
Ainsi, plus ces torsions seront importantes et plus l’ARN polymérase sera ralentie
*Erreurs de transcription

Il peut y avoir des erreurs d’insertion des nucléotides dans l’ARN cad une mauvaise
complémentarité avec les nucléotides de la matrice d’ADN
Ces erreurs sont estimées à environ 10-4 soit 1 erreur pour 104 nucléotides
Cette valeur est assez élevée en comparaison avec le taux d’erreur de l’ADN polymérase au cours
de la réplication : 10-9 à 10-10
Pourquoi est-il beaucoup plus important de corriger les erreurs de réplication plutôt que les erreurs
de transcription ?
Dans le cas de la réplication, on touche à l’intégrité même du génome. Une erreur dans la région
codante d’un gène modifiera la structure ou la fonction de la protéine et aura des conséquences
dramatiques (voire létales) sur le fonctionnement la cellule
De plus, si ces erreurs étaient si fréquentes, on serait face à une grande instabilité du génome avec
pour conséquence une instabilité des espèces. Dans la transcription, les conséquences sont moins
graves car sur un ensemble de molécules d’ARN issues d’un même gène, seules quelques molécules
mutantes apparaissent. La grande majorité des protéines produites sera de type sauvage et les
molécules mutantes (souvent tronquées) seront dégradées
d).Terminaison
La terminaison de la transcription va consister à dissocier de l’ADN, l’ARN et la
polymérase
La zone où se produit cette dissociation est appelée terminateur de transcription (t)

*Structure des terminateurs de transcription


La structure la plus simple que l’on puisse trouver est le terminateur dit rho indépendant
Il concerne la moitié des gènes chez E.coli
Ce terme vient de la comparaison avec un autre type de terminateur, dit rho dépendant, que nous
décrirons plus loin
L’élément important dans la structure d’un terminateur se trouve dans sa séquence nucléotidique
Sur la matrice d’ADN, on trouve 2 régions inversées répétées riches en GC suivies d’une succession
de A. Attention, à ne pas confondre cette succession de A avec le polyA des ARNm des eucaryotes.

Lors de la polymérisation, les 2 séquences inversées répétées vont pouvoir s’associer par
complémentarité et faire adopter à l’ARN une structure 3D en épingle à cheveux
Cette structure va interagir avec le complexe de polymérisation et créer une pause de transcription.
Pendant cette pause, l’ARN est associé à l’ADN dans la région riche en A (associations A-U)

2 éléments vont déstabiliser le complexe de transcription :


- l’association G-C (très stable) de l’épingle à cheveux qui favorise la pause
- l’association A-U entre ADN et ARN (peu stable) qui favorise la dissociation
On nomme terminateurs intrinsèques, les sites de terminaison qui ne font intervenir aucun facteur
supplémentaire pour assurer la terminaison
On nomme terminateurs rho-dépendants, les terminateurs ayant besoin de la présence du facteur rho
pour assurer la terminaison. Cet autre type de terminateur, dit rho dépendant, concerne l’autre
moitié des gènes chez E. coli
Il fonctionne sur un principe similaire avec une épingle à cheveux mais ne possède pas la séquence
riche en A qui fragilise l’association entre ADN et ARN
Pour favoriser cette dissociation, il faut la présence d’un facteur protéique appelé facteur rho qui
possède une activité hélicase (capable de dissocier les doubles hélices d’ADN)

3) Transcription chez les eucaryotes


Le mécanisme général de la transcription des eucaryotes est le même que celui décrit
chez les procaryotes
On observe aussi les 3 étapes d’initiation, d’élongation et de terminaison
Le promoteur est plus étendu que chez les procaryotes et comprend plusieurs centaines de
nucléotides
De plus, il existe plusieurs types de gènes codant différents types d’ARN cellulaires
La distinction entre ces différents gènes se fait au niveau des promoteurs qui possèdent
des signaux de reconnaissance spécifiques à certaines ARN polymérases :

Une autre différence importante concerne les gènes codant les protéines :
- chez, les procaryotes, les ARN messagers ne subissent pas de maturation car il sont traduits
presque instantanément
- chez les eucaryotes, le gène est transcrit en ARN prémessager dans le noyau, puis va subir
une maturation avant d’être exporté dans le cytosol
Par ailleurs, les ARN polymérases sont incapables à elles seules d’initier la transcription
Il faut pour cela tout un assortiment de protéines appelées facteurs de transcription généraux qui
vont se lier au promoteur
La présence de ces facteurs de transcription généraux est nécessaire au fonctionnement de l’ARN
polymérase

a) ARN polymérase I
* Initiation
Cette étape se fait par reconnaissance de 2 boites
spécifiques appelées UPE (Upstream
Promoter Element) et core positionnées entre les
nucléotides -180 et +20
La région UPE fixe le facteur de transcription UBF tandis que la région core fixe le facteur SL1
L’association UBF-SL1 permet ensuite la fixation de l’ARN polymérase I
*Elongation
La synthèse de l’ARN est du même type que celle des ARN décrite chez les procaryotes.
L’ARN polymérase synthétise l’ARN dans le sens 5’ 3’

*Terminaison
Le site de terminaison peut se trouver à plus de 1 kb après l’extrémité 3’ de l’ARNr mature
La polymérase fait sa synthèse jusqu’au terminateur et l’ARN est coupé par une endonucléase
Le mécanisme est analogue à celui de la polymérase II (que l’on verra plus tard) mais iln’y a pas de
polyadénylation. La structure du terminateur est encore mal connue

*Particularités des gènes transcrits pas l’ARN polymérase I


Il y a d’abord synthèse dans le nucléole d’un ARNr 45S précurseur qui va ensuite être clivé en 3
molécules d’ARNr différentes (28S, 18S et 5,8S).
D’un point de vue quantitatif, il faut synthétiser
beaucoup d’ARNr en peu de temps au cours d’un
cycle cellulaire. Pour y parvenir, ces gènes sont
présents sous forme de nombreuses copies en
tandem dans le génome
Mais il est aussi possible d’augmenter la quantité
d’ARN synthétisé en augmentant la vitesse de ré initiation de l’ARN polymérase
Les gènes étant organisés en tandem, il a été montré que les ARN polymérases qui terminent une
transcription peuvent « glisser» jusqu’au gène suivant sans se décrocher, de façon à reprendre
rapidement la synthèse

b) ARN polymérase II
* Initiation
L’initiation de ce type de gène est celle qui est le plus généralement décrite dans les ouvrages, et
l’on oublie souvent qu’ils ne concernent que les gènes codant les protéines
La structure de ces promoteurs est difficilement généralisable car selon les gènes, on peut trouver
des éléments spécifiques liés à leur régulation
On peut cependant citer les éléments d’un promoteur « minimal » qui pourrait être transcrits par
l’ARN polymérase II sans intervention de régulateurs
Les facteurs de transcription associés à l’ARN pol II sont appelés TFII (Transcription Factor)
Plusieurs types sont caractérisés par des lettres : TFII A, TFII B, etc.
Chaque facteur TFII va se fixer sur une région spécifique de l’ADN et aura un rôle spécifique dans
la transcription
Dans l’ordre de fixation sur l’ADN on trouve :
- TFIID : facteur principal pour la reconnaissance du promoteur. Il contient une
sous-unité appelée TBP (TATA Binding Protein) qui reconnaît la TATA box, et
plusieurs autres sous-unités appelées TAF (TBP Associated Factors)
TFIIA : permet de stabiliser le complexe formé entre TBP et l’ADN
TFIIB : s’associe à la boîte BRE et fait le lien entre TBP et l’ARN pol II
TFIIF : associé à l’ARN pol II. Il a plusieurs fonctions :
- stabilise le complexe d’initiation
- participe à la sélection du site +1
- stimule la dissociation de l’ARN pol II du promoteur avant l’élongation
TFIIE : interagit directement avec TFIIF et contribue avec ce dernier à l’ouverture du double brin
TFIIH : joue un rôle dans l’ouverture du double brin
Les facteurs de transcription vont se fixer sur des régions spécifiques du promoteur. On trouve 4
régions dont la plus conservée est la TATA box :

 La boîte BRE (TFIIB Recognition Element). Permet la fixation du facteur TFIIB

 La boîte TATA
Elle est la plus communément trouvée. Sa séquence peut légèrement varier comme chez les
procaryotes (on parle de promoteur fort ou faible)
Elle joue un rôle essentiel dans l’initiation car elle fixe le facteur TFIID via l’une des
protéines qui le compose, le facteur TBP (TATA Binding Protein)

 La boîte Inr (Initiator) Elle est peu conservée. Elle


reconnaît aussi le facteur TFIID

 La boîte DPE (Downstream Promoter Element)


Elle est aussi faiblement conservée et peut fixer TFIID en
l’absence de boîte TATA
La boîte TATA étant essentielle et (presque) toujours présente ; les
étapes de l’initiation des eucaryotes sont généralement décrites autour
de cette boîte
Les différents facteurs de transcription se fixent dans un ordre précis
pour amener à la formation du complexe de transcription. L’initiation
de la transcription telle qu’elle est connue aujourd’hui est très
complexe
*Elongation
La synthèse de l’ARN est du même type que celui décrit chez les procaryotes

* Terminaison

Le gène ne se termine pas par un terminateur, c’est-à-dire une séquence qui provoque le décrochage
de l’ARN polymérase
On retrouve en aval du codon stop une séquence de clivage/polyadénylation
Cette séquence une fois transcrite sera l’objet d’une maturation aboutissant à une coupure par une
endonucléase et à l’ajout d’une queue poly-adénosine par une polyA polymérase
Cette maturation provoque le décrochage de l’ARN polymérase de l’ADN et la séquence
correspondante limite donc le gène sur son versant 3’

c) . ARN polymérase III

L’ARN pol III permet la synthèse de plusieurs types d’ARN :


- les ARNr 5S,
- les ARNt,
- certains petits ARN nucléaires (ARNsn)

A chacun de ces types d’ARN correspond un type de promoteur


Nous décrirons ici seulement ceux qui synthétisent les ARNr 5S et les ARNt. Ces ARN ont des
caractéristiques communes :
- ils sont petits (une centaine de nucléotides),
- ils doivent être produits en grande quantité
* Initiation (ARNt)
Le promoteur des ARNt possède 2 boîtes (A et B) placées en aval du site +1 et fixant le facteur
TFIIIC.
Le facteur TFIIIB se fixera ensuite sur l’ADN pour
recruter l’ARN pol III

* Initiation (ARNr 5S)


Le promoteur des ARNr 5S possède aussi 2 boîtes (A et C) placées en aval du site +1 et fixant les
facteurs TFIIIA et TFIIIC
Le facteur TF IIIB se fixera ensuite sur l’ADN

* Elongation
La synthèse de l’ARN est du même type que celle des
ARN décrite chez les procaryotes

* Terminaison
Cette terminaison est différente des 2 précédentes car le gène est très court
Elle ressemble à celle des terminateurs rho indépendant des procaryotes

* Particularités des gènes transcrits par l’ARN polymérase III


Compte tenu de leur toute petite taille, la ré initiation de transcription peut se faire très
rapidement
En fin de transcription, la polymérase se trouve très proche de son promoteur et pourra donc refaire
un cycle de transcription
C’est donc la même polymérase qui tourne « en boucle » pour un même gène, ce qui augmente très
fortement l’efficacité de transcription

4. Comparaison de la transcription procaryote/ eucaryote

Que ce soit chez les procaryotes ou chez


les eucaryotes, deux événements sont
essentiels à l’initiation :
-la reconnaissance du promoteur
(qui n’est pas assurée par la
polymérase),
- la fixation de la polymérase qui
assure l’élongation

Les ARN polymérases sont positionnées


sur tous les promoteurs par un facteur :
le facteur protéique sigma chez les
procaryotes, un facteur de transcription
chez les eucaryotes contenant la
protéine de liaison (TBP)

Concernant l’initiation chez les procaryotes, le facteur sigma, « sous-unité » de la polymérase


indispensable, agit à l’instar d’un facteur de transcription d’eucaryote. C’est ce facteur qui reconnaît
le promoteur. De plus, contenant TBP, ce facteur assure la fixation de la polymérase

Chez les eucaryotes, un grand nombre de facteurs généraux de transcription


interviennent mais il n’existe qu’un seul facteur d’initiation qui contient TBP et qui
permet la fixation de la polymérase
Les autres facteurs sont des facteurs d’assemblage permettant la fixation de ce facteur
d’initiation
Concernant la terminaison, chaque type de polymérase (procaryote ou eucaryote) présente un
mécanisme qui lui est propre :
- chez les procaryotes, la terminaison de la transcription est un mécanisme bien défini,
- chez les eucaryotes, ce mécanisme n’apparaît pas essentiel dans certains cas du fait de
l’existence d’une étape supplémentaire de maturation

B) la Traduction
1) Généralités
La traduction concerne tous les gènes codant les protéines cad ceux qui sont transcrits en ARN
messager par l’ARN polymérase II
La traduction consiste à « lire le message » porté par l’ARN messager à l’aide du code génétique

a) . Eléments nécessaires
Le processus de traduction nécessite
plusieurs éléments qui peuvent être
regroupés dans le tableau ci-dessous.
Nous décrirons ensuite le rôle de chacun
de ces éléments
b) ARNm
* Région codante (ORF)
L’ARN messager peut être lu directement par le ribosome mais
seulement dans une portion appelée région codante ou ORF
(Open Reading Frame). Ce terme d’ORF est très largement
répandu et c’est celui qu’on utilise le plus souvent
L’ARNm est lu dans le sens 5’ → 3’ et la protéine synthétisée
dans le sens N-terminal → C-terminal

* Codons et phase de lecture


L’ORF est lue par triplet de nucléotides appelés codons. Chacun de ces codons spécifie un acide
aminé (code génétique) qui sera porté par l’ARNt
Le signal de départ de la région codante est donné par un triplet de nucléotides appelé codon start
(généralement AUG)
C’est ce premier codon qui va « caler » la lecture pour tous les codons suivants . Cet ordre de
lecture est appelé phase de lecture. La protéine va être synthétisée jusqu’à ce que le ribosome trouve
un codon stop qui constitue la fin de la région codante (UAA, UAG ou UGA)

c) Ribosomes
Le ribosome est le plus grand complexe ribonucléoprotéique connu
* Structure
Les ribosomes sont constitués de 2 sous-unités :
-une grosse,
-une petite
… contenant chacune des ARNr (ARN ribosomaux) et des protéines ribosomales
Les protéines sont situées à la périphérie du ribosome
Elles stabilisent l’assemblage et interagissent avec les facteurs de traduction
Que ce soit chez les procaryotes ou les eucaryotes, les sous unités ont un rôle équivalent :
- la petite sous-unité décode l’information portée par l’ARNm
- la grande sous-unité catalyse la formation de la liaison peptidique entre les acides aminés
portés par les ARNt

La structure 3D des ribosomes est parfaitement définie par celle des ARNr et des protéines qui leur
sont associés. Cette association ARN/protéine constitue une
ribonucléoprotéine
Rq : les gènes permettant la synthèse des ARNr sont spécifiques et
différents de ceux qui synthétisent les protéines ribosomales
(Une erreur fréquemment rencontrée est de penser que les ARNr
servent à la synthèse des protéines ribosomales !)
Entre procaryotes et eucaryotes, on ne trouve pas les mêmes ARNr ni
les mêmes protéines ribosomales et leurs lieux de synthèse sont aussi différents
*Rôle
Le premier rôle du ribosome est de reconnaître l’ARNm qui doit être traduit. Le ribosome permet la
synthèse de la protéine en associant l’ARNm avec les ARNt. L’ARNm trouve sa place dans le sillon
de la petite sous-unité dans lequel il peut glisser
A la jonction des 2 sous-unités du ribosome et de l’ARNm, on trouve 3 sites particuliers dans
lesquels peuvent s’insérer les ARNt :
Site A (Aminoacyl), site P (Peptidyl) et site E
(Ejection)
Chacun de ces sites a une fonction particulière
1) Site A (Aminoacyl)
Site dans lequel vient se placer un ARNt chargé avec un acide
aminé
2) Site P (Peptidyl)
Site portant la chaîne polypeptidique en cours d’élongation
C’est ici que l’on trouve l’activité peptidyl transférase permettant la formation de la
liaison peptidique
3) Site E (Ejection)
Site qui permet d’éjecter l’ARNt qui a cédé son acide aminé

d) ARNt
*Structure
L’ARNt est composé de nucléotides particuliers modifiés par rapport
aux nucléotides habituels A, C, G, U
Ainsi, on peut trouver des nucléotides du type pseudo-uridine (Ψ),
Dihydro-uridine (D), etc. qui ont des fonctions particulières que nous
ne décrirons pas ici
La structure 3D de l’ARNt va jouer un rôle essentiel dans la
traduction. La structure habituelle que l’on retient est celle de la «
feuille de trèfle » dans laquelle on observe des associations entre
bases complémentaires de l’ARN pour former des structures tige/boucle
De part et d’autre de l’axe central, les 2 tige/boucle vont s’associer pour former une
structure particulière en « L Inversé » . Cette forme est la plus importante car elle est reconnue au
niveau des sites du ribosome
La boucle inférieure (boucle anticodon) contient les 3 nucléotides qui s’associent à l’ARNm
(codon). La tige supérieure possède une extrémité 3’OH avec 3 nucléotides (CCA) permettant la
fixation de l’acide aminé à l’ARNt

*ARNt chargé
Dans la cellule les ARNt ne sont pas libres mais « chargés » (ARNt~AA) d’un acide aminé qui leur
est spécifique ; Il y a plus d’ARNt (~ 40) que d’acides aminés (20), ce qui signifie que des ARNt
différents peuvent porter le même acide aminé = isoaccepteurs ; Ceci a un lien avec le code
génétique (dégénérescence, redondance du code) (cf. après)
Lorsque l’ARNt~AA cède son acide aminé pour la synthèse protéique, il doit être « rechargé » dans
la cellule par un nouvel acide aminé = réaction
d’aminoacylation
C’est le rôle des aminoacyl ARNt synthétases ; Chaque
ARNt possède une aminoacyl ARNt synthétase qui lui est
spécifique et qui va permettre de lui accrocher le bon
acide aminé à son extrémité 3’OH
* Rôle
L’ARNt sert d’intermédiaire entre les codons de l’ARNm
et l’acide aminé . Lorsqu’il s’insère dans le ribosome,
l’ARNt se lie par sa boucle anticodon au codon de
l’ARNm . L’association se fait par des liaisons hydrogènes entre bases complémentaires, les 2 brins
étant associés de manière antiparallèle
Certains ARNt peuvent reconnaître plusieurs codons différents… ???
… car il y a moins d’ARNt (~ 40) que de codons (61)
Cela vient du fait qu’au niveau de l’association codon/anticodon, on peut observer des associations
dites « non canoniques » entre bases qui ne sont pas habituellement complémentaires
Au final, cela n’aura pas de conséquences sur la séquence de la protéine car ces codons spécifient le
même acide aminé
Les ARNm ont un rôle de matrice dans la synthèse des protéines des procaryotes et des eucaryotes5.

e) Code génétique
Le code génétique permet d’établir la correspondance entre
les codons et les acides aminés
La lecture se fait par triplet de nucléotides à partir de la
séquence présente sur l’ARNm dans le sens 5’→ 3’
A retenir :
On désigne par le terme codon un ensemble de trois
nucléotides, ou triplet, porté par un ARNm, chaque triplet
correspondant à un acide aminé ou à un signal de
terminaison
Le code génétique est la correspondance entre les codons et les acides aminés dans la protéine

*Dégénérescence du code
Le code génétique est composé de 64 codons :
- 61 codons spécifient un acide aminé,
- 3 codons stop ne correspondent pas à un acide aminé
Il n’y a pas non plus d’ARNt face aux codons stop (sauf dans les cas particuliers de suppresseurs de
non sens). L’une des remarques importantes concerne la présence de plusieurs codons pour un
même acide aminé. Ces codons sont appelés codons synonymes

On voit dans ce cas que la 3ème base du codon peut être


indifférente
Ex : pour sérine, on trouve 4 codons de type UC(N) où
N correspond à l’une des 4 bases de l’ARN. Cette 3ème
base peut être ainsi considérée comme une base «
flottante » cad inutile
La spécificité réduite de la troisième position est
nommée dégénérescence de la troisième base. De ce fait, on parle de dégénérescence ou de
redondance du code génétique
Nomenclature :
Afin de simplifier l’écriture des codons synonymes on utilise des symboles
conventionnels correspondant aux différents nucléotides :
- N pour des nucléotides inconnus cad A, U, G ou C
Ex : Pro codée par CCA, CCU, CCG ou CCC. On écrira CCN
- H pour les nucléotides A, U ou C
Ex : Ile codée par AUA, AUU ou AUC. On écrira AUH
- R pour des purines inconnues cad A ou G
Ex : Lys codée par AAA ou AAG. On écrira AAR
- Y pour des pyrimidines inconnues cad U ou C
Ex : Cys codée par UGU ou UGC. On écrira UGY
*Universalité du code
Le code génétique est dit universel car il peut s’adapter à tous les organismes vivants (procaryotes
et eucaryotes), ce qui permet par exemple de synthétiser des protéines eucaryotes chez un
procaryote
Il existe cependant quelques variations autour de ce code mais qui sont souvent des modifications
ponctuelles restreintes à certaines espèces Ex : chez les procaryotes, on peut trouver les codons
GUG et UUG comme codon start en plus de l’AUG
Chez Tetrahymena (eucaryote unicellulaire), les codons stop UAA et UAG sont lus comme des
acides glutamiques
D’autres modifications existent dans les mitochondries
Ex : les codons AGA, AGG (Arg) sont lus comme codon stop dans les
mitochondries de Mammifères et comme codon sérine chez la
Drosophile
La traduction
Image de microscopie électronique colorée montrant la synthèse de
protéines à partir d’un brin d’ARNm
A mesure que le ribosome avance le long de l’ARNm , une protéine
s’allonge à partir du ribosome
Agrandissement : x72 500 quand imprimé à 10 cm de largeur

2) Traduction chez les procaryotes


a) Transcription/traduction simultanées
Chez les procaryotes, il n’y a pas de compartimentation cellulaire, donc la transcription et la
traduction se font dans un même lieu
De plus, la transcription et la traduction se font de manière
simultanée : dès que l’ARNm commence à être synthétisé par
l’ARN polymérase il peut être traduit
Pendant la transcription, les brins complémentaires d’ARNm
sont synthétisés et immédiatement traduits par les ribosomes
Notion de polysome ou polyribosome = ensemble de ribosomes reliés entre eux par un ARN
messager.
Les réseaux de polysomes permettent à un seul brin d’ARNm de produire en peu de temps des
centaines d’exemplaires de la même molécule de polypeptide
Chaque polysome est constitué d’un brin d’ARNm que
plusieurs ribosomes sont en train de lire en même tempsLes
réseaux de polysomes permettent à un seul brin d’ARNm de
produire en peu de temps des centaines d’exemplaires de la
même molécule de polypeptide

b)Composition des ribosomes (cf. II.1.2)


Les ribosomes sont constitués de 2 sous-unités
contenant chacune des ARNr et des protéines
ribosomales mais la taille des ARNr et des protéines
diffèrent entre les procaryotes et les eucaryotes
Les ribosomes représentent jusqu’à 40 % de la masse
sèche d’un procaryote

c)Initiation : recherche du codon start et assemblage du ribosome


Cette étape d’initiation fait intervenir des facteurs d’initiation spécifiques appelés
facteurs IF (Initiation Factor). On en dénombre 3 : IF-1, IF-2 et IF-3 ; et chacun d’eux assure une
fonction particulière
La recherche du codon start constitue la première étape de l’initiation de la traduction car elle
permet de définir la phase de lecture cad quels triplets de nucléotides (ou codons) seront associés
Chez les procaryotes, les gènes peuvent être de type
monocistronique cad ne possédant qu’une seule ORF ou
polycistroniques (opérons) cad possédant plusieurs ORFs
On doit donc imaginer que si un ribosome ne prenait
systématiquement que le 1er AUG trouvé à partir de
l’extrémité 5’P, alors seule la 1ère ORF serait lue
De façon à distinguer les différents codons start des différentes ORFs, on trouve une courte
séquence nucléotidique juste en amont de l’AUG : 5’AGGAGG 3’
Cette séquence appelée séquence SD (Shine et Dalgarno) ou site RBS (Ribosome Binding Site) est
complémentaire à une séquence nucléotidique présente dans l’ARNr 16S de la petite sous-unité du
ribosome
L’interaction entre ces 2 ARN permet de localiser le « bon
» codon start de la traduction. Dans un opéron, on
trouvera une séquence SD pour chaque codon start (cf.
schéma)
Il est possible d’avoir des chevauchements de régions
codantes (ex ORF2 et ORF3)
Dans ce cas, le codon start de l’ORF3 qui possède sa
propre séquence SD définira une phase de lecture
différente de l’ORF2 cad décalée de ±1 nucléotide. Ainsi,
lorsque le ribosome arrivera sur le stop de l’ORF2, il ne le lira pas comme un stop puisqu’il sera
décalé
L’assemblage du ribosome est souvent décrit comme l’initiation proprement dite. Il fait
intervenir un ARNt particulier appelé ARNt initiateur qui est chargé avec de la formylméthionine.
Cet ARNt est nommé ARNt~fMet
Il est placé au niveau du site P de la petite sousunité 30S du ribosome et se lie au codon AUG de
l’ARNm
Quand l’ensemble ARNt~ARNm~ribosome 30S est stabilisé, la grosse sous-unité 50S s’associe à la
sous-unité 30S pour former le complexe d’initiation de la traduction
Même si le processus d’initiation est identique pour toutes les
protéines procaryotes,
l’acide aminé présent en N-
terminal de la protéine mature peut
être différent :
- pour certaines protéines,
le groupement formyl est enlevé,
le N-terminal sera donc une
méthionine,
- pour d’autres protéines,
c’est l’ensemble formylméthionine
qui est clivé, le N-terminal
correspondra donc au 2ème acide
aminé incorporé

d) Elongation : synthèse de la
protéine
Cette étape nécessite aussi la
présence de facteurs d’élongation
spécifiques appelés
facteurs EF (Elongation Factor) qui sont au nombre de 3 : EF-Tu, EF-Ts et EF-G
Elle nécessite aussi de l’énergie sous forme de GTP
Lorsque le complexe d’initiation et formé, le site E est libre, le site P est occupé par l’ARNt~fMet et
le site A est libre

Les étapes se déroulent dans l’ordre suivant :

1) Entrée de l’ARNt~AA2 spécifique du codon de


l’ARNm dans le site A

2) Transfert de la fMet (ou de la chaîne peptidique en


cours de synthèse) sur l’ARNt~AA2 du site A
Formation d’une liaison covalente entre les 2 aa par
l’activité peptidyl transférase donnée par l’ARNr 23S de
la grosse sous-unité

3) Déplacement du ribosome sur l’ARNm. Cette étape est


appelée translocation. L’ARNt déchargé qui était au site P
passe au site E. L’ARNt qui était au site A possède toute la
chaîne peptidique et passe au site P

4) Le cycle reprend à partir du 1) avec l’ARNt~AA3

e) Terminaison : fin de synthèse


Lorsque le site A du ribosome arrive face à un codon
stop il n’y a pas d’ARNt correspondant. C’est à ce
stade
qu’interviennent les facteurs de terminaison appelés
facteurs RF (Release Factor). Ils sont au nombre de 4 :
RF-1, RF-2, RF-3 et RRF. Chacun d’eux aura une
fonction spécifique dans la terminaison. Les 2 premiers
vont reconnaître les codons stop car ils peuvent entrer
dans le site A à la place d’un ARNt. Ces facteurs ont la
particularité, tout en étant des protéines, d’avoir une
structure 3D identique à celle d’un ARNt~AA
(en L inversé). En leur présence, l’élongation va s’arrêter
Les 2 autres facteurs vont servir à la dissociation complète de l’ensemble
ribosome~ARNt~ARNm~Protéine

3) Traduction chez les eucaryotes


a) Localisation
La compartimentation cellulaire des eucaryotes a pour conséquence de
séparer dans l’espace et le temps la transcription de la traduction
De plus, selon les gènes, les protéines synthétisées n’auront pas la même
destination
Les protéines qui doivent rejoindre un compartiment particulier possèdent
un signal d’adressage spécifique
De plus, il ne faut pas oublier que chez les eucaryotes, il existe une
machinerie de transcription et de traduction spécifique aux mitochondries
et aux chloroplastes
Dans ces organites, les protéines peuvent être synthétisées
directement dans le compartiment mais dans la plupart des
cas, la protéine est synthétisée dans le cytosol et ensuite
importée
L’exemple le plus caractéristique est celui de la Rubisco
végétale pour laquelle une sousunité est synthétisée dons le
cytosol et l’autre dans le chloroplaste

b) Composition des ribosomes (cf. II.1.3)


On retrouve ici des caractéristiques spécifiques des
ribosomes eucaryotes en termes de taille des ARNr et de
spécificité de protéines

c) Maturation des ribosomes


La fabrication des ribosomes eucaryotes est très
particulière. Elle se produit dans le nucléole du noyau de la cellule
Le nucléole
Image de microscopie électronique colorée montrant le nucléole , un composant du noyau de la
cellule
Le nucléole est responsable de la production des composants des ribosomes, les organites de
fabrication des protéines de la cellule
Les gènes servant à la synthèse des ARNr 28S + 18S + 5,8S
(ARN pol I) sont tous localisés dans le nucléole
Le gène de l’ARNr 5S (ARN pol III) se trouve dans une autre
région du noyau
Les protéines (82 au total) possèdent toutes un gène spécifique
et sont toutes traduites dans le cytosol puis réimportées dans le
noyau
L’assemblage de chacune des 2 sous-unités est réalisée dans le
nucléole. C’est pour cette raison que cette partie du noyau est
très dense en microscopie électronique
Les 2 sous-unités vont passer les pores nucléaires pour servir à
la traduction dans le cytosol
d) Initiation : le modèle « scanning »
Pour cette étape d’initiation la présence de facteurs d’initiation et aussi d’énergie sousforme d’ATP
et de GTP est nécessaire
L’initiation chez les eucaryotes est très complexe et fait intervenir plus de facteurs que
chez les procaryotes
On dénombre ainsi 5 facteurs d’initiation eIF (e pour eucaryote). Ces facteurs sont notés eIF-1 à
eIF-5. eIF-4 a un rôle essentiel dans l’initiation
La recherche du codon start est très différente de celle décrite chez les procaryotes car les gènes
eucaryotes étant majoritairement monocistroniques, il n’y a pas de recherche de codons start
multiples sur un même ARNm
Il existe cependant des gènes polycistroniques chez les eucaryotes (comme les
rétrotransposons) mais dans leur cas la recherche des codons start est encore différente de
celle des procaryotes
Le modèle pour rechercher le codon start est décrit sous le nom de modèle « scanning »
Les ARNm eucaryotes ont la particularité de posséder une coiffe en 5’(méthylguanine) et une
séquence polyadénylée en 3’
Le facteur de traduction eIF-4 reconnaît la coiffe et permet à la sous-unité 40S du ribosome de se
fixer
La sous-unité se déplace sur l’ARNm à la recherche du 1er
codon AUG
Cette étape nécessite de l’ATP
Le ribosome se stabilise sur ce codon s’il existe une séquence
spécifique dite séquence Kozak ACCAUGA
L’assemblage du ribosome se fait au niveau du codon AUG
L’ARNt initiateur est chargé avec de la méthionine (ARNt-Met)
et se fixe au site P de la petite sous-unité 40S
Lorsque l’ensemble est stable, la grosse sous-unité 60S se fixe
pour former le complexe d’initiation
Comme chez les procaryotes, dans la protéine mature, l’acide
aminé méthionine est souvent éliminée, ce qui fait que la
protéine aura l’acide aminé n°2 en position N-terminale

Chez les eucaryotes, la séquence polyadénylée en 3’ de l’ARNm


va jouer un rôle dans la ré-initiation de la traduction
Lorsqu’on observe des polysomes eucaryotes, on voit qu’ils sont
circularisés car le facteur eIF-4 peut aussi s’associer au polyA pour
refermer l’ARN sur lui-même
Cette structure présente un avantage particulier
Lorsque le ribosome a fini sa synthèse lors de la terminaison, il est
physiquement très proche de la coiffe et peut se réassocier très
rapidement pour refaire un cycle de synthèse
e) Elongation
Cette étape nécessite aussi la présence de facteurs d’élongation spécifiques appelés facteurs eEF (e
pour eucaryote) qui sont au nombre de 3 : eEF-1α, eEF-1βγ et eEF-2.
Elle nécessite aussi de l’énergie sous forme de GTP. Le mécanisme est très proche de celui qui a été
décrit chez les procaryotes
f) Terminaison
On retrouve ici aussi un mécanisme proche des procaryotes avec des facteurs de terminaison eRF (e
pour eucaryote) spécifiques appelés eRF : eRF-l et eRF-2

Vous aimerez peut-être aussi