1. Séquences fonctionnelles :
Certaines unités génétiques fonctionnelles sont présentes en de multiples exemplaires. Elles
comprennent les classes suivantes :
* Famille de gènes dispersés
* Répétition en tandem des familles de gènes
* Séquences fonctionnelles non codantes
La réplication du brin tardif implique qu’une partie (en noir) soit absente du brin néosynthétisé.
Toutefois, une enzyme appelée télomérase ajoute des unités répétées simples aux extrémités. Chez
les vertébrés, il s’agit de la séquence (5’TTAGGG3’)n.
La longueur des télomères varie selon les chromosomes et l’espèce mais fluctue entre la centaine et
la dizaine de milllier de pb.
Les télomères vont permettre, outre d’assurer la réplication complète de l’ADN, de protéger
l’extrémité du chromosome en évitant qu’ils ne soient considérés comme des cassures d’ADN.
Plus spécifiquement, ceci évite la dégradation ou la fusion des extrémités des chromosomes. Ils
permettent également de positionner le K dans le noyau.
Une des principales caractéristiques de ces SSR est leur taux élevé de modifications ou instabilité =
perte ou gain d'unité(s) conduisant a la contraction ou l'expansion de la séquence.
Ces répétitions sont très nombreuses et retrouvées dans tout le génome. Elles représentent environ
3% du génome humain, avec ne moyenne 1 SSR tous les 2 kpb, 0,5% provenant des répétitions de
dinucléotides (85% AC ou AT).
* ADN minisatellite :
L'ADN minisatellite représente une classe particulière de répétitions en tandem qui est présente en
nombre variable au niveau de locus distincts ou d'organismes différents.
Chez l'homme, les locus de ces VNTR sont des séquences de 1 a 5 kb, comportant un nombre
variable d'unité d base longue de 15 a 100 nucléotides.
Il existe des minisatellites ayant la même unité répétée mais un nombre différent de répétitions.
Chez l'homme, la plupart des minisatellites sont situées dans les régions subtélomériques.
Le taux d'instabilité des minisatellites varie d'un génome a l'autre (ex : instabilité moins élevée dans
le génome de Mus musculus que dans celui de Homo sapiens).
Les minisatellites ne sont pas des répétitions strictes dune même unité.
Les multiples copies de l'unité de base constituant le minisatellite présentent des différences de
séquences.
*ADN microsatellite :
Les microsatellites sont les plus simples répétitions rencontrées dans les génomes.
Elles sont constituées d'un motif très simple, de 2 a 11pb, et sont répétées en tandem des dizaines de
fois, c'est-à-dire pour atteindre une séquence de quelques centaines de bases de bases de long. Le
plus souvent (A)n, (CA)n, (CT)n avec n = nombre de répétitions (5-20).
L'abondance des différents microsatellites est variable.
Les répétitions de dinucléotides sont beaucoup plus fréquentes que les répétitions trinucléotidiques.
Et parmi les répétitions de dinucléotides, certaines répétitions comme 5'-AC-3' ou 5'-AT-3' sont
beaucoup plus rependues que d'autres, tel que 5'-GC-3'.
Le polymorphisme porte sur la taille du microsatellite. Le modèle théorique le plus simple pour
expliquer le polymorphisme des microsatellites est d'envisager une variation de longueur par
addition ou délétion d'une ou de plusieurs unités de répétition ("stepwise mutation model") causée
par un dérapage réplicatif.
En raison de la variabilité du nombre de répétitions en tandem d'une personne a l'autre, le profil est
spécifique de chaque individu. Pour chaque individu, on peut donc établir un profil génétique qui
est l'ensemble des allèles présents aux différents locus étudiés.
On réalise ainsi le "génotypage d'un individu". Ces arrangements spécifiques a chaque individu
constituent des empreintes génétiques qui sont très utilisées en médecine légale (recherche de
paternité, criminologie ...).
Ces microsatellites on été utilisés comme marqueur a partir de 1989 du fait qu'ils sont hautement
polymorphes c'est-à-dire présentant une forte variabilité entre les individus. Du fait de cela, il n'est
pas rare de trouver plus de 30 allèle a un locus donné dans une population. Ces marqueurs
microsatellites ont d'ailleurs supplanté les marqueurs RFPL.
b) Séquences transposées :
Dans les années 1940, en étudiant la génétique de la bigarrure des grains de maïs, Barbara
McClintock a découvert un élément génétique mobile qui ne régule pas seulement la bigarrure mais
qui est aussi responsable de la cassure des chromosomes. Elle appela cet élément
Dissociation (Dis) = transposon.
Depuis cette découverte, de nombreux éléments transposables ont été identifiés et sont regroupés en
"familles" sur la base de leur similarité de séquence d'ADN.
Les génomes de la plupart des organismes contiennent des exemplaires multiples de plusieurs
membres de ces familles d'éléments transposables. Ils représentent environ :
- 27% du génome du poulet
- 45% du génome de l'Homme
- 60% du génome du maïs
- 99% du génome du Lys
Les éléments mobiles forment une famille particulière de séquences répétées qui se sont propagées
dans le génome, sautant d'un emplacement a autre au sein du génome. Ils constituent des éléments
produisant des duplications a longue distance.
Ces événements de duplication très élaborés, nommés transposition, ne sont possibles que pour des
séquences très particulières, les transposons.
Le phénomène de transposition conduit ces éléments a s'insérer dans une nouvelle région, la plupart
du temps la copie originale restant a son site initial, sans restriction spécifique de complémentarité.
Ces séquences se multiplient et s'accumulent partout dans le génome. Elles représentent 45% du
génome humain.
La transposition s'effectue par copie coupure du site cible puis insertion de l'élément transposable,
réaction catalysée par l'enzyme transposase. Chaque famille d'éléments transposable code sa propre
transposase qui se distingue par la distance séparant les 2 sites de coupure au sein de la séquence
cible. Cette distance varie de 1 a 12pb et détermine la longueur du site de duplication.
La cassure décalée du site cible produit des extrémités 3' débordantes de quelques nucléotides sur
chaque brin qui sont par la suite ligaturées aux extrémités 5' de l'élément transposable qui s'insère.
Une fois la jonction réparée par des enzymes spécialisées, l'insert se trouve bordé par une
duplication de la séquence cible. Certains éléments transposables transposent par un intermédiaire
ADN, d'autres par un intermédiaire ARN.
Le génome humain contient toutes catégories confondues environ 45% d'éléments transposables
* SINEs : 13,3%, seraient capable d'induire la traduction dans les conditions de stress
* LINEs : 20,4%, dont LINE1 en grande partie
*Eléments a LTR : 8,3% - Eléments a ADN : 2,8%, dont mariner (0,1%) - Non classés :
0,1%
Les différences importantes de séquences observées entre les copies de ces éléments prouvent que
la majorité des transposons du génome n'est plus capable de transposition. Une fois présents dans le
génome, ces éléments peuvent persister pendant des périodes très longues et subir des changements
mutationnels importants.
Les transposons jouent un rôle important dans l'adaptation, la régulation et le transfert de gène.
Son emploi en génomique fonctionnel est croissant (cancer ...).
* L'hyperploïdie :
On appelle ploïdie le nombre de copies des différents chromosomes du génome nucléaire des
eucaryotes
La ploïdie chez les eucaryotes est en général égale à 1 (organismes haploïdes) ou 2 (organismes
diploïdes)
Si un organisme se reproduit de façon sexuée, plusieurs niveaux de ploïdies coexistent chez cet
organisme
Il existe différents types de changement du nombre de chromosomes : Le changement du nombre de
chromosomes peut concerner 1 ou quelques chromosomes = aneuploïdie ou le lot chromosomique
complet = euploïdie
L’euploïdie désigne le lot haploïde (n) complet de chromosomes à 1 ou plusieurs exemplaire(s).
L’euploïdie désigne donc une cellule ou un individu dont tous les jeux de chromosomes sont
complets
L’aneuploïdie désigne un écart à cet état cad jeux
chromosomiques incomplets
Dans ces 2 grandes catégories, il existe plusieurs types de
mutation
Tout changement du nombre de chromosomes sans
modification de structure est appelé mutation génomique ou
caryotypique
L’aneuploïdie
L’hyperploïdie est donc un type d’aneuploïdie par excès cad 1 ou plusieurs chromosomes en plus
L'un des exemples d'hyperploïdie le plus connu chez l'homme est la trisomie 21.
Dans certains cas, une mauvaise ségrégation peut conduire a une duplication complète d'un ou de
deux lots de chromosomes menant respectivement a des tri et tétraploïdes.
* La polyploïdie :
L’euploïdie
L’euploïdie désigne le lot haploïde (n) complet de chromosomes à 1 ou plusieurs
exemplaire(s)
La diploïdie désigne 2 lots de chromosomes (2n)
La polyploïdie désigne un nombre supérieur à 2 lots de chromosomes. Ainsi, on peut
observer une tri-, tétra-, penta-, hexa-, ou octoploïdie (3, 4, 5, 6 ou 8 lots haploïdes)
Les polyploïdies de rang impair (3, 5...) sont appelés périssoploïdies et les polyploïdies de
rang pair (4, 6, 8...), artioploïdies
La modalité la plus courante conduisant à cet état est une anomalie mitotique où à l’issue de la
mitose le noyau renferme 2 fois plus de chromosomes que le noyau originel par absence de
cytocinèse, les chromosomes dupliqués ne sont pas répartis dans 2 cellules filles
Ce mécanisme d’endoréplication ou endomitose, peut se produire spontanément ou être
provoqué expérimentalement par l’action de certains agents physiques comme le froid ou par
l’emploi d’agents chimiques comme la colchicine
1. ADN intercalaire
L’ADN intercalaire ou « spacer » pourrait avoir comme fonction de séparer des
séquences d’ADN mais à ce jour les informations le concernant demeurent faibles
L’existence d’ADN sans fonction connue ou ADN égoïste constitue une énigme pour les
généticien
L’ADN égoïste est une classe d’ADN qui n’existe que pour elle-même et qui n’est jamais
soumise à la pression de l’expression phénotypique
Il est possible que cet ADN joue un rôle indirect fournissant peut-être la masse critique
requise pour une ségrégation efficace lors de la division cellulaire
Il pourrait également servir à séparer les éléments fonctionnels (gènes) pour permettre une
régulation efficace
D) Bilan
L’analyse des génomes a permis de montrer que le génome doit être perçu comme un édifice
complexe, de gènes, de séquences régulatrices et, chez les eucaryotes, de régions non codantes et de
séquences répétées
L’origine des séquences d’ADN est variée : ADN étranger, séquences provenant des organites.…
Une petite proportion d’ADN est localisée dans le cytoplasme séquestrée dans les organites
Bien que de taille modeste, cet ADN fait partie du patrimoine génétique de l’individu
Aujourd’hui, nous pouvons donner comme définition du mot génome l’ensemble des séquences
d’ADN d’un individu ou d’une espèce
Au fur et à mesure des découvertes, la définition du gène comme étant initialement un fragment
d’ADN permettant la synthèse d’une protéine, a évolué
Le gène doit être considéré plutôt comme un concept et non comme un support matériel
Chaque gène a une fonction élémentaire permettant à l’organisme d’accomplir des fonctions
complexes et différentes, chaque fonction mobilisant un très grand nombre de gènes
Structure des gènes et expression géniques
A) Généralités :
2. structure de base :
c) Le site d’initiation de la transcription (site +1) : Il définit le 1er ntd synthétisé par l’ARN
polymérase. Cela correspond à l’extrémité 5’P de l’ARN
a) Gènes monocistroniques
Ces gènes sont dits monocistroniques car ils permettent de synthétiser un seul type de
protéine à partir d’un type d’ARNm
C’est la structure la plus classique d’un gène qu’il soit
procaryote ou eucaryote
Dans l’ARN, on trouve une région codante
Cette région, délimitée par le codon AUG de début de
traduction et le codon STOP de fin de traduction, va définir la
zone de traduction de l’ARNm en protéine
Pour cette région codante, on utilise aussi le terme d’ORF
(Open Reading Frame) traduit par « cadre de lecture ouvert »
Chez les eucaryotes, il existe 3 types d’ARN polymérases associées à ces gènes :
1. les gènes codant les ARN ribosomiques 28S, 18S et 5,8S qui interviennent dans la
structure du ribosome sont transcrits par l’ARN polymérase I
2. les gènes codant les ARNm pour la synthèse des protéines seront transcrits par l’ARN
polymérase II
3. les gènes codant les ARN ribosomiques 5S et les ARN de transfert sont transcrits par
l’ARN polymérase III
Chacun de ces types de gènes possède un promoteur particulier reconnu par l’ARN polymérase qui
lui est associé
Quand on observe cette structure, on peut se poser la question : « A quoi servent les introns ? » De
manière simpliste, on pourrait répondre : « A rien car un procaryote fonctionne très bien sans
introns »
En fait, l’évolution moléculaire nous apprend que les introns ont eu et ont encore un rôle essentiel
dans la création de nouveaux gènes en permettant des remaniements (entre exons par exemple) qui
ne seraient pas possibles autrement
La présence d’introns a contribué à créer la grande variabilité génétique que l’on observe
aujourd’hui chez les eucaryotes
A) .La transcription
1. Généralités
La transcription est l’étape qui consiste à « transformer » en ARN un fragment d’ADN contenant un
gène
Ce processus est généralisable à l’ensemble des gènes pour la synthèse des ARNr, ARNt et ARNm
b) le principe générale
La synthèse de l’ARN est réalisée par
des ARN polymérases qui utilisent
l’ADN comme matrice
La zone de transcription d’un gène
ou unité de transcription se situe
entre le site d’initiation de la
transcription (+1) et le terminateur de
transcription (t)
Le complexe de transcription (ARN polymérase + facteurs de transcription ) va se fixer sur la
région promotrice et choisir le brin matrice à transcrire
C’est le promoteur qui permet de déterminer le sens de transcription
2 gènes différents peuvent être transcrits dans 2 sens différents sur un même fragment
d’ADN :
La terminologie utilisée pour nommer le brin
lu cad le brin matrice peut varier selon les
ouvrages et les auteurs
Le plus simple est de nommer brin transcrit
le brin utilisé comme matrice et de nommer
brin non transcrit le brin complémentaire de
la molécule d’ADN
2 gènes différents peuvent être transcrits dans 2 sens différents sur un même fragment
d’ADN :
Au cours de la synthèse, l’ARN
polymérase « lit » la matrice d’ADN
(donc le brin transcrit) dans le sens 3’ 5’
et synthétise l’ARN dans le sens 5’ 3’
Les flèches indiquent le sens de
déplacement de 1’ARN polymérase,
donc l’orientation du gène. Quand 2
gènes sont en orientation opposée sur un même fragment d’ADN, le brin transcrit d’un gène
correspond au brin non transcrit de l’autre gène et réciproquement
A retenir : les synthèses d’acides nucléiques, réalisées par l’ADN polymérase (réplication)
ou par l’ARN polymérase (transcription), se font toujours par addition d’un (d)NTP sur une
extrémité 3’ OH libre
Il devient ainsi facile de retrouver les orientations. On commence par représenter la molécule en
cours de synthèse
Par exemple, si la synthèse d’un ARN se fait de la gauche vers la droite, il est orienté 5’ 3’. Il suffit
ensuite de situer les brins, transcrits et non transcrits par complémentarité (brins antiparallèles)
c) ARN polymérase(s)
L’ARN polymérase est l’enzyme qui permet de synthétiser la chaîne polynucléotidique
d’ARN
Chez les procaryotes, il n’existe qu’un seul type d’ARN polymérase pour tous les types de gènes :
codant les ARNr, ARNt et ARNm
Chez les eucaryotes, on trouve 3 types d’ARN polymérases associées à des types de gènes codant
des ARN différents
Toutes ces polymérases forment des très gros complexes constitués de plusieurs sous-unités
d) différentes étapes
La transcription des gènes en ARN se produit en 3 étapes
successives :
-initiation
-élongation
-terminaison
*Initiation :
Pour qu’un gène soit reconnu et qu’il soit transcrit, il doit obligatoirement posséder un
promoteur qui va fixer le complexe de polymérisation = facteurs de transcription + ARN
polymérase
Cette première étape est essentielle car elle va donner le point de départ de la transcription
Les facteurs de transcription reconnaissent des séquences nucléotidiques spécifiques ou boîtes (box)
sur le promoteur
La nature de ces boites et des facteurs étant différente entre procaryotes et eucaryotes, elles
seront décrites spécifiquement plus tard
C’est aussi l’initiation qui fixe le niveau d’expression du gène
En effet, chaque fois qu’il y a une initiation de transcription, il y a production d’une molécule
d’ARN . Donc plus cette initiation se reproduira souvent et plus il y aura de molécules d’ARN
synthétisées par unité de temps. La plupart du temps, les gènes sont régulés au niveau de 1’initiation
pour adapter la production d’ARN aux conditions environnementales
*Elongation :
L’élongation de la transcription débute dès que le premier nucléotide de l’ARN est synthétisé
*Terminaison
Cette dernière étape permet à l’ARN polymérase de se décrocher de la matrice d’ADN et de libérer
l’ARN synthétisé
Cette dissociation se fait au niveau du terminateur de transcription (t). Les mécanismes de
terminaison procaryotes sont bien connus, contrairement à ceux des eucaryotes
II existe 2 différences fondamentales entre le génome des procaryotes et le génome nucléaire des
eucaryotes :
- la première est liée à la compartimentation de la cellule
-la seconde est associée à l’organisation des gènes
Il en résulte que l’expression génique, chez les procaryotes et les eucaryotes, repose sur des
mécanismes différenciés
L’ARN polymérase ainsi constituée de ses 5 sous unités porte le nom de « core enzyme » que l’on
peut traduire par « cœur de l’enzyme »
Sa structure 3D est bien connue. L’enzyme adopte une structure en « pince de
crabe » qui va se refermer sur l’ADN
Sous cette forme, la polymérase est capable de synthétiser de l’ARN mais ne peut
pas reconnaître le promoteur d’un gène. Pour cela, il faut lui adjoindre le facteur
σ que l’on peut considérer comme une sous-unité de l’ARN polymérase
Ce facteur va reconnaître le promoteur et permettre à l’ARN polymérase
d’initier la transcription. Lorsque l’ARN polymérase est associée au
facteur σ, elle porte le nom d’holoenzyme
b) Inititiation :
*Structure du promoteur
Le promoteur d’un gène est par définition la région du gène reconnue par le complexe de
transcription cad par les facteurs de transcription associés à l’ARN polymérase
La comparaison de nombreuses séquences en amont du site d’initiation de la transcription (+1) fait
apparaître 2 séquences nucléotidiques conservées ou consensus :
- une séquence riche en A et T appelée boîte TATA (TATA box ou Pribnow box)
placée à environ -10 paires de bases du site +1
- une séquence appelée boîte -35 (-35 box) à environ -35 paires de bases du site +1
Les séquences consensus sont toujours données sur le brin non transcrit (orienté 5’ 3’
pour une lecture de gauche à droite) mais elles sont reconnues sous forme de double brin sur
l’ADN. De plus, leur position peut être légèrement variable d’un gène à l’autre
Ex : pour un gène donné, le premier T de la boite TATA box est exactement le 13ème nucléotide en
amont du + 1 alors que pour un autre gène ce même T est à la 11ème position.
Enfin, en examinant le pourcentage de conservation de chacun des nucléotides dans une même
boîte, on voit par exemple que le 3ème nucléotide de la TATA box n’est conservé qu’à 45 %, ce qui
signifie que seulement la moitié des gènes possède ce T.
Si l’on étend cette remarque aux autres nucléotides, on voit finalement que beaucoup de gènes ont
une séquence TATA qui diffère du consensus (TATAAT)
Ex : le gène lacI codant le répresseur LacR de l’opéron lactose possède la séquence CATGAT pour
boîte TATA et l’opéron lactose possède la séquence TATGTT à cette place
La reconnaissance du promoteur d’un gène se fait par association entre les boîtes TATA et -35 de
l’ADN et le facteur protéique σ
*Etapes de l’initiation
Le facteur σ :
- va réduire cette affinité de l’ARN polymérase pour
l’ADN d’un facteur 10 000
- va permettre de reconnaître les séquences -35 et -10
spécifiques du promoteur
Le départ de la transcription pourra donc se faire au bon
endroit et dans la bonne direction
Lorsque l’ensemble ARN polymérase et facteur σ est stabilisé sur le promoteur, il y a formation
d’un complexe dit complexe fermé.
Le double brin d’ADN va s’ouvrir au niveau de la boîte TATA pour permettre le début de la
synthèse de l’ARN, ce complexe est alors appelé complexe ouvert (sur une longueur d’une
quinzaine de nt dans la région -10 qui étant riche en A et T s’ouvre plus facilement)
Les premiers NTP (nucléosides triphosphate) vont s’insérer pour former l’extrémité 5’ de
l’ARN
A ce stade, plusieurs essais de départ sont réalisés et une fois que la transcription est enclenchée, le
facteur σ se décroche pour permettre l’élongation de l’ARN.
Une bactérie comme E. coli possède 7 facteurs σ différents qui permettent d’initier la
transcription de gènes de manière contrôlée
Un exemple classique décrit dans la littérature est celui du choc thermique
Lorsque l’on soumet une culture bactérienne (E. coli) à une augmentation plus ou moins importante
de température, on voit apparaître de nouveaux facteurs σ (ex σ32)
Ces facteurs vont permettre l’expression de gènes spécifiques (heat shock genes) permettant de
lutter contre cette augmentation de température
Un autre exemple est celui de la carence en azote
Si l’on retire les sources d’azote dans un milieu de culture bactérien, on voit apparaître le facteur
σ54 qui va induire l’expression de gènes permettant de récupérer d’autres sources d’azote
Il est intéressant de remarquer que la plupart de ces nouveaux facteurs σ (sauf σ54) vont reconnaître
des boîtes positionnées au même endroit que les boîtes classiques (-10 et -35) mais avec des
séquences qui leur seront spécifiques
c) . Elongation
* Facteur d’élongation
Lorsque le facteur σ70 se dissocie, il doit être remplacé par un facteur d’élongation
*Synthèse de l’ARN
Le double brin d’ADN va s’ouvrir devant l’ARN polymérase et se refermer derrière elle lorsque l’ARN
est synthétisé
Cette action va créer des contraintes dans la structure du double brin
En général, chez les procaryotes, l’ADN est circulaire et surenroulé, ce qui facilite l’ouverture de
l’ADN mais ce sont les topoisomérases qui contrôlent de manière précise ces contraintes
topologiques
La vitesse de transcription est estimée en moyenne à environ 40 nucléotides par seconde mais elle
peut être très variable
L’un des paramètres intervenant sur cette vitesse de déplacement est la conformation à la fois de
l’ARN (ex tige/boucle) et de l’ADN
On sait que la molécule d’ADN peut subir des torsions importantes
Ainsi, plus ces torsions seront importantes et plus l’ARN polymérase sera ralentie
*Erreurs de transcription
Il peut y avoir des erreurs d’insertion des nucléotides dans l’ARN cad une mauvaise
complémentarité avec les nucléotides de la matrice d’ADN
Ces erreurs sont estimées à environ 10-4 soit 1 erreur pour 104 nucléotides
Cette valeur est assez élevée en comparaison avec le taux d’erreur de l’ADN polymérase au cours
de la réplication : 10-9 à 10-10
Pourquoi est-il beaucoup plus important de corriger les erreurs de réplication plutôt que les erreurs
de transcription ?
Dans le cas de la réplication, on touche à l’intégrité même du génome. Une erreur dans la région
codante d’un gène modifiera la structure ou la fonction de la protéine et aura des conséquences
dramatiques (voire létales) sur le fonctionnement la cellule
De plus, si ces erreurs étaient si fréquentes, on serait face à une grande instabilité du génome avec
pour conséquence une instabilité des espèces. Dans la transcription, les conséquences sont moins
graves car sur un ensemble de molécules d’ARN issues d’un même gène, seules quelques molécules
mutantes apparaissent. La grande majorité des protéines produites sera de type sauvage et les
molécules mutantes (souvent tronquées) seront dégradées
d).Terminaison
La terminaison de la transcription va consister à dissocier de l’ADN, l’ARN et la
polymérase
La zone où se produit cette dissociation est appelée terminateur de transcription (t)
Lors de la polymérisation, les 2 séquences inversées répétées vont pouvoir s’associer par
complémentarité et faire adopter à l’ARN une structure 3D en épingle à cheveux
Cette structure va interagir avec le complexe de polymérisation et créer une pause de transcription.
Pendant cette pause, l’ARN est associé à l’ADN dans la région riche en A (associations A-U)
Une autre différence importante concerne les gènes codant les protéines :
- chez, les procaryotes, les ARN messagers ne subissent pas de maturation car il sont traduits
presque instantanément
- chez les eucaryotes, le gène est transcrit en ARN prémessager dans le noyau, puis va subir
une maturation avant d’être exporté dans le cytosol
Par ailleurs, les ARN polymérases sont incapables à elles seules d’initier la transcription
Il faut pour cela tout un assortiment de protéines appelées facteurs de transcription généraux qui
vont se lier au promoteur
La présence de ces facteurs de transcription généraux est nécessaire au fonctionnement de l’ARN
polymérase
a) ARN polymérase I
* Initiation
Cette étape se fait par reconnaissance de 2 boites
spécifiques appelées UPE (Upstream
Promoter Element) et core positionnées entre les
nucléotides -180 et +20
La région UPE fixe le facteur de transcription UBF tandis que la région core fixe le facteur SL1
L’association UBF-SL1 permet ensuite la fixation de l’ARN polymérase I
*Elongation
La synthèse de l’ARN est du même type que celle des ARN décrite chez les procaryotes.
L’ARN polymérase synthétise l’ARN dans le sens 5’ 3’
*Terminaison
Le site de terminaison peut se trouver à plus de 1 kb après l’extrémité 3’ de l’ARNr mature
La polymérase fait sa synthèse jusqu’au terminateur et l’ARN est coupé par une endonucléase
Le mécanisme est analogue à celui de la polymérase II (que l’on verra plus tard) mais iln’y a pas de
polyadénylation. La structure du terminateur est encore mal connue
b) ARN polymérase II
* Initiation
L’initiation de ce type de gène est celle qui est le plus généralement décrite dans les ouvrages, et
l’on oublie souvent qu’ils ne concernent que les gènes codant les protéines
La structure de ces promoteurs est difficilement généralisable car selon les gènes, on peut trouver
des éléments spécifiques liés à leur régulation
On peut cependant citer les éléments d’un promoteur « minimal » qui pourrait être transcrits par
l’ARN polymérase II sans intervention de régulateurs
Les facteurs de transcription associés à l’ARN pol II sont appelés TFII (Transcription Factor)
Plusieurs types sont caractérisés par des lettres : TFII A, TFII B, etc.
Chaque facteur TFII va se fixer sur une région spécifique de l’ADN et aura un rôle spécifique dans
la transcription
Dans l’ordre de fixation sur l’ADN on trouve :
- TFIID : facteur principal pour la reconnaissance du promoteur. Il contient une
sous-unité appelée TBP (TATA Binding Protein) qui reconnaît la TATA box, et
plusieurs autres sous-unités appelées TAF (TBP Associated Factors)
TFIIA : permet de stabiliser le complexe formé entre TBP et l’ADN
TFIIB : s’associe à la boîte BRE et fait le lien entre TBP et l’ARN pol II
TFIIF : associé à l’ARN pol II. Il a plusieurs fonctions :
- stabilise le complexe d’initiation
- participe à la sélection du site +1
- stimule la dissociation de l’ARN pol II du promoteur avant l’élongation
TFIIE : interagit directement avec TFIIF et contribue avec ce dernier à l’ouverture du double brin
TFIIH : joue un rôle dans l’ouverture du double brin
Les facteurs de transcription vont se fixer sur des régions spécifiques du promoteur. On trouve 4
régions dont la plus conservée est la TATA box :
La boîte TATA
Elle est la plus communément trouvée. Sa séquence peut légèrement varier comme chez les
procaryotes (on parle de promoteur fort ou faible)
Elle joue un rôle essentiel dans l’initiation car elle fixe le facteur TFIID via l’une des
protéines qui le compose, le facteur TBP (TATA Binding Protein)
* Terminaison
Le gène ne se termine pas par un terminateur, c’est-à-dire une séquence qui provoque le décrochage
de l’ARN polymérase
On retrouve en aval du codon stop une séquence de clivage/polyadénylation
Cette séquence une fois transcrite sera l’objet d’une maturation aboutissant à une coupure par une
endonucléase et à l’ajout d’une queue poly-adénosine par une polyA polymérase
Cette maturation provoque le décrochage de l’ARN polymérase de l’ADN et la séquence
correspondante limite donc le gène sur son versant 3’
* Elongation
La synthèse de l’ARN est du même type que celle des
ARN décrite chez les procaryotes
* Terminaison
Cette terminaison est différente des 2 précédentes car le gène est très court
Elle ressemble à celle des terminateurs rho indépendant des procaryotes
B) la Traduction
1) Généralités
La traduction concerne tous les gènes codant les protéines cad ceux qui sont transcrits en ARN
messager par l’ARN polymérase II
La traduction consiste à « lire le message » porté par l’ARN messager à l’aide du code génétique
a) . Eléments nécessaires
Le processus de traduction nécessite
plusieurs éléments qui peuvent être
regroupés dans le tableau ci-dessous.
Nous décrirons ensuite le rôle de chacun
de ces éléments
b) ARNm
* Région codante (ORF)
L’ARN messager peut être lu directement par le ribosome mais
seulement dans une portion appelée région codante ou ORF
(Open Reading Frame). Ce terme d’ORF est très largement
répandu et c’est celui qu’on utilise le plus souvent
L’ARNm est lu dans le sens 5’ → 3’ et la protéine synthétisée
dans le sens N-terminal → C-terminal
c) Ribosomes
Le ribosome est le plus grand complexe ribonucléoprotéique connu
* Structure
Les ribosomes sont constitués de 2 sous-unités :
-une grosse,
-une petite
… contenant chacune des ARNr (ARN ribosomaux) et des protéines ribosomales
Les protéines sont situées à la périphérie du ribosome
Elles stabilisent l’assemblage et interagissent avec les facteurs de traduction
Que ce soit chez les procaryotes ou les eucaryotes, les sous unités ont un rôle équivalent :
- la petite sous-unité décode l’information portée par l’ARNm
- la grande sous-unité catalyse la formation de la liaison peptidique entre les acides aminés
portés par les ARNt
La structure 3D des ribosomes est parfaitement définie par celle des ARNr et des protéines qui leur
sont associés. Cette association ARN/protéine constitue une
ribonucléoprotéine
Rq : les gènes permettant la synthèse des ARNr sont spécifiques et
différents de ceux qui synthétisent les protéines ribosomales
(Une erreur fréquemment rencontrée est de penser que les ARNr
servent à la synthèse des protéines ribosomales !)
Entre procaryotes et eucaryotes, on ne trouve pas les mêmes ARNr ni
les mêmes protéines ribosomales et leurs lieux de synthèse sont aussi différents
*Rôle
Le premier rôle du ribosome est de reconnaître l’ARNm qui doit être traduit. Le ribosome permet la
synthèse de la protéine en associant l’ARNm avec les ARNt. L’ARNm trouve sa place dans le sillon
de la petite sous-unité dans lequel il peut glisser
A la jonction des 2 sous-unités du ribosome et de l’ARNm, on trouve 3 sites particuliers dans
lesquels peuvent s’insérer les ARNt :
Site A (Aminoacyl), site P (Peptidyl) et site E
(Ejection)
Chacun de ces sites a une fonction particulière
1) Site A (Aminoacyl)
Site dans lequel vient se placer un ARNt chargé avec un acide
aminé
2) Site P (Peptidyl)
Site portant la chaîne polypeptidique en cours d’élongation
C’est ici que l’on trouve l’activité peptidyl transférase permettant la formation de la
liaison peptidique
3) Site E (Ejection)
Site qui permet d’éjecter l’ARNt qui a cédé son acide aminé
d) ARNt
*Structure
L’ARNt est composé de nucléotides particuliers modifiés par rapport
aux nucléotides habituels A, C, G, U
Ainsi, on peut trouver des nucléotides du type pseudo-uridine (Ψ),
Dihydro-uridine (D), etc. qui ont des fonctions particulières que nous
ne décrirons pas ici
La structure 3D de l’ARNt va jouer un rôle essentiel dans la
traduction. La structure habituelle que l’on retient est celle de la «
feuille de trèfle » dans laquelle on observe des associations entre
bases complémentaires de l’ARN pour former des structures tige/boucle
De part et d’autre de l’axe central, les 2 tige/boucle vont s’associer pour former une
structure particulière en « L Inversé » . Cette forme est la plus importante car elle est reconnue au
niveau des sites du ribosome
La boucle inférieure (boucle anticodon) contient les 3 nucléotides qui s’associent à l’ARNm
(codon). La tige supérieure possède une extrémité 3’OH avec 3 nucléotides (CCA) permettant la
fixation de l’acide aminé à l’ARNt
*ARNt chargé
Dans la cellule les ARNt ne sont pas libres mais « chargés » (ARNt~AA) d’un acide aminé qui leur
est spécifique ; Il y a plus d’ARNt (~ 40) que d’acides aminés (20), ce qui signifie que des ARNt
différents peuvent porter le même acide aminé = isoaccepteurs ; Ceci a un lien avec le code
génétique (dégénérescence, redondance du code) (cf. après)
Lorsque l’ARNt~AA cède son acide aminé pour la synthèse protéique, il doit être « rechargé » dans
la cellule par un nouvel acide aminé = réaction
d’aminoacylation
C’est le rôle des aminoacyl ARNt synthétases ; Chaque
ARNt possède une aminoacyl ARNt synthétase qui lui est
spécifique et qui va permettre de lui accrocher le bon
acide aminé à son extrémité 3’OH
* Rôle
L’ARNt sert d’intermédiaire entre les codons de l’ARNm
et l’acide aminé . Lorsqu’il s’insère dans le ribosome,
l’ARNt se lie par sa boucle anticodon au codon de
l’ARNm . L’association se fait par des liaisons hydrogènes entre bases complémentaires, les 2 brins
étant associés de manière antiparallèle
Certains ARNt peuvent reconnaître plusieurs codons différents… ???
… car il y a moins d’ARNt (~ 40) que de codons (61)
Cela vient du fait qu’au niveau de l’association codon/anticodon, on peut observer des associations
dites « non canoniques » entre bases qui ne sont pas habituellement complémentaires
Au final, cela n’aura pas de conséquences sur la séquence de la protéine car ces codons spécifient le
même acide aminé
Les ARNm ont un rôle de matrice dans la synthèse des protéines des procaryotes et des eucaryotes5.
e) Code génétique
Le code génétique permet d’établir la correspondance entre
les codons et les acides aminés
La lecture se fait par triplet de nucléotides à partir de la
séquence présente sur l’ARNm dans le sens 5’→ 3’
A retenir :
On désigne par le terme codon un ensemble de trois
nucléotides, ou triplet, porté par un ARNm, chaque triplet
correspondant à un acide aminé ou à un signal de
terminaison
Le code génétique est la correspondance entre les codons et les acides aminés dans la protéine
*Dégénérescence du code
Le code génétique est composé de 64 codons :
- 61 codons spécifient un acide aminé,
- 3 codons stop ne correspondent pas à un acide aminé
Il n’y a pas non plus d’ARNt face aux codons stop (sauf dans les cas particuliers de suppresseurs de
non sens). L’une des remarques importantes concerne la présence de plusieurs codons pour un
même acide aminé. Ces codons sont appelés codons synonymes
d) Elongation : synthèse de la
protéine
Cette étape nécessite aussi la
présence de facteurs d’élongation
spécifiques appelés
facteurs EF (Elongation Factor) qui sont au nombre de 3 : EF-Tu, EF-Ts et EF-G
Elle nécessite aussi de l’énergie sous forme de GTP
Lorsque le complexe d’initiation et formé, le site E est libre, le site P est occupé par l’ARNt~fMet et
le site A est libre