Vous êtes sur la page 1sur 17

lesquelles l’expression d’un gène peut être régulée.

De plus, l’épissage alternatif peut produire


CONTROLE DE L’EXPRESSION DES GENES une famille entière de protéines à partir d’un seul gène. Les protéines peuvent aussi être
modifiées de manière covalente après qu’elles aient été synthétisées.

La plupart des cellules spécialisées d’un organisme multicellulaire sont capables de


A. VUE D’ENSEMBLE DU CONTROLE DE L’EXPRESSION DES GENES modifier le profil d’expression de leurs gènes en réponse à des signaux extracellulaires. De
plus, différents types cellulaires répondent souvent de manières différentes à un même signal
Les différents types cellulaires d’un organisme multicellulaire diffèrent extracellulaire. Il y a néanmoins des caractéristiques du profil d’expression génique qui ne
structuralement et fonctionnellement. Ils diffèrent tellement qu’il est difficile d’imaginer changent pas et qui donnent ainsi à chaque cellule son caractère distinctif permanent.
qu’ils contiennent le même génome.
Si les différences parmi les types cellulaires variés d’un organisme dépendent des
Les différents types cellulaires d’un organisme multicellulaire deviennent différent les gènes particuliers que les cellules expriment, à quel niveau le contrôle de l’expression des
uns des autres car ils synthétisent et accumulent différents ensembles d’ARNs et de protéines, gènes peut-il être réalisé ? Il y a plusieurs étapes dans le long processus qui mène de l’ADN
et ce, sans généralement altérer la séquence de leur ADN. Ils renferment donc le même ADN. vers la protéine, et toutes peuvent en principe être régulée. Ainsi, la cellule peut contrôler les
protéines qu’elles produit en : (1) contrôlant quand et à quel niveau un gène donné est
Plusieurs processus sont communs à toutes les cellules, et les cellules d’un seul transcrit (contrôle transcriptionnel), (2) contrôlant comment le transcrit d’ARN est épissé ou
organisme ont ainsi beaucoup de protéines en commun, dont les protéines structurales des autrement modifié (contrôle des modifications de l’ARN), (3) sélectionnant quels ARNm
chromosomes les RNA polymérases, les enzymes de réparation de l’ADN, les protéines complets dans le nucleus de la cellule sont exportés vers le cytosol et en déterminant où ils
ribosomales, les enzymes impliquées dans les réactions centrales du métabolisme, et seront localisés dans le cytosol (contrôle du transport et de la localisation de l’ARN), (4)
beaucoup des protéines qui forment le cytosquelette. sélectionnant, dans le cytoplasme, quels ARNm sont traduits par les ribosomes (contrôle
traductionnel), (5) déstabilisant sélectivement certaines molécules d’ARNm dans le
Quelques protéines sont abondantes dans les cellules spécialisées dans lesquelles elles cytoplasme (contrôle de dégradation de l’ARNm), ou (6) activant, inactivant, dégradant ou
fonctionnent, et ne peuvent pas être détectées ailleurs. L’hémoglobine, par exemple, ne peut compartimentant sélectivement des molécules spécifiques de protéines une fois qu’elles ont
être détectée que dans les globules rouges. été produites (contrôle d’activité de la protéine) (Figure EXP-1).

Il a été estimé qu’à n’importe quel moment, une cellule humaine typique exprime Pour la plupart des gènes, les contrôles transcriptionnels sont ceux qui comptent le
approximativement 10.000-20.000 de ses 30.000 gènes. Si les profils des ARNm d’un plus. De tous les points de contrôle possibles, illustrés par la Figure EXP-1, seul le contrôle
ensemble de lignées cellulaires humaines différentes sont comparés, on constate que le transcriptionnel garantit que la cellule ne va pas synthétiser des intermédiaires superflus.
niveau d’expression de presque chaque gène actif varie d’un type cellulaire à l’autre. Peu de
ces différentes sont frappantes, la plupart étant beaucoup plus subtiles.

Bien que les différences d’ARNm parmi les types cellulaires spécialisés soient
frappantes, elles sous-estiment néanmoins le spectre total de différences du profil de
production des protéines. Il y a en effet beaucoup d’étapes après la transcription durant

1 2
B. MOTIFS DE LIAISON A L’ADN PORTES PAR LES PROTEINES 2. Les protéines régulatrices de gènes contiennent des motifs structuraux qui
REGULATRICES DE GENES peuvent “lire” (reconnaître) des séquences d’ADN

Comment une cellule peut-elle déterminer lesquels de ses milliers de gènes elle doit La reconnaissance moléculaire en biologie repose généralement sur l’ajustement exact
transcrire ? La transcription de chaque gène est contrôlée par une région d’ADN régulatrice entre les surfaces de deux molécules, et l’étude des protéines régulatrices de gènes a permis
relativement proche du site où la transcription démarre. Certaines régions régulatrices sont de rapporter quelques uns des exemples les plus clairs de ce principe. Une protéine régulatrice
simples et agissent comme des commutateurs à un seul signal. Beaucoup d’autres sont de gènes reconnaît une séquence d’ADN spécifique car la surface de la protéine est largement
complexes et agissent comme de minuscules microprocesseurs, répondant à une variété de complémentaire aux caractéristiques de surface particulières de la double hélice d’ADN dans
signaux qu’elles interprètent et intègrent pour être en mesure de commuter le gène voisin en cette région. Dans la plupart des cas, la protéine crée un grand nombre de contacts avec
on (activation) ou off (répression ou inactivation). Qu’ils soient simples ou complexes, ces l’ADN, comprenant des ponts hydrogène, des ponts ioniques et des interactions hydrophobes.
mécanismes de commutation contiennent deux types de composants fondamentaux : (1) une Bien que chaque contact individuel soit faible, l’ensemble des contacts formés à l’interface
courte étendue d’ADN de séquence définie, et (2) des protéines régulatrices de gènes, qui les protéine-ADN, s’ils sont rajoutés les uns aux autres, garantit que l’interaction est non
reconnaissent et s’y lient. seulement hautement spécifique, mais également très forte (Figure EXP-2). En effet, les
interactions ADN-protéine comprennent certaines des plus étroites et des plus spécifiques
1. De courtes séquences d’ADN sont l’un des composants fondamentaux des interactions moléculaires connues en biologie.
commutateurs génétiques
Bien que chaque exemple de reconnaissance ADN-protéine soit unique dans ses
Les protéines régulatrices de gènes doivent reconnaître des séquences nucléotidiques détails, les études par cristallographie aux rayons X et par spectroscopie NMR de plusieurs
spécifiques cachées dans la double hélice d’ADN. On a d’abord pensé que ces protéines centaines de protéines régulatrices de gènes ont montré que plusieurs de ces protéines
devaient avoir un accès direct aux ponts hydrogène entre les paires de bases, à l’intérieur de la contenaient des motifs structuraux de liaison à l’ADN. Ces motifs utilisent généralement leurs
double hélice, pour distinguer entre une séquence et une autre, mais on sait maintenant que hélices alpha ou leurs feuillets bêta pour se lier au sillon majeur de l’ADN. L’ajustement est
l’extérieur de la double hélice est parsemé d’informations sur la séquence en ADN, tel qu’il a été suggéré que les dimensions des unités structurales de base des acides nucléiques
informations que les protéines régulatrices de gène peuvent reconnaître sans avoir à ouvrir la et des protéines ont évolué ensemble pour permettre à ces molécules de s’imbriquer.
double hélice, et ce en se liant généralement au sillon majeur de l’ADN. Chaque séquence
nucléotidique crée dans l’ADN des irrégularités locales, et ces caractéristiques singulières Le premier motif d’une protéine se liant à l’ADN à avoir été identifié est celui hélice-
peuvent être reconnues par des protéines spécifiques qui se lient à l’ADN. tour-hélice. Décrit à l’origine dans les protéines bactériennes, ce motif a depuis été trouvé
chez des centaines de protéines se liant à l’ADN que ce soit chez les eucaryotes ou les
Ces séquences nucléotidiques particulières, ayant une longueur moyenne de moins de procaryotes. Il est composé de deux hélices alpha connectées par une courte chaîne d’acides
20 nucléotides, sont les composants fondamentaux des commutateurs génétiques. Ce sont eux aminés, qui constitue le “tour” (Figure EXP-3). Les deux hélices ont un angle fixe,
qui servent de sites de reconnaissance pour la liaison de protéines régulatrices de gènes principalement en raison des interactions entre elles. L’hélice du côté le plus C-terminal est
spécifiques. appelé “hélice de reconnaissance” car elle s’ajuste au sillon majeur de l’ADN; les chaînes en
acides aminés de ses flancs, qui diffère d’une protéine à une autre, jouent un rôle important
dans la reconnaissance de la séquence d’ADN spécifique à laquelle la protéine se lie.

3 4
En dehors de la région hélice-tour-hélice, la structure des protéines qui contiennent ce En outre, plusieurs protéines régulatrices de gènes peuvent aussi s’associer avec des
motif peut varier considérablement. Cependant, chaque protéine présente son motif hélice- partenaires non identiques, pour former des hétérodimères composés de deux sous-unités
tour-hélice à l’ADN d’une manière unique. Néanmoins, pour la plupart des protéines, des différentes, ce qui permet d’étendre encore plus le répertoire de spécificités de liaison à
parties de la chaîne polypeptidique à l’extérieur du domaine hélice-tour-hélice créent aussi l’ADN que ces protéines régulatrices apportent.
des contacts importants avec l’ADN, contribuant à ajuster avec précision l’interaction.

Le groupe des protéines hélice-tour-hélice se lie aux séquences d’ADN composées de


deux “demi-sites” similaires (eux-mêmes agencés symétriquement) sous forme de dimères
symétriques. Cette disposition permet à chaque monomère de protéine de faire un ensemble
de contacts presque identique et d’augmenter de beaucoup l’affinité de liaison.

Le motif hélice-tour-hélice est seulement composé d’acides aminés. Un second groupe


important de motifs de liaison à l’ADN ont en plus un ou plusieurs atomes de zinc comme
composants structuraux. Il y en a plusieurs groupes structuraux distincts, mais, tout comme
les protéines hélice-tour-hélice, ces protéines forment généralement des dimères qui
permettent à l’une des deux hélices alpha de chaque sous-unité d’interagir avec le sillon
majeur de la double hélice d’ADN (Figure EXP-4).

Bien que les hélices alpha soient les principales à interagir et à reconnaître des
séquences spécifiques d’ADN spécifiques, les feuillets bêta de certaines protéines peuvent
également assurer cette reconnaissance, la séquence d’ADN reconnue étant tributaire de la
séquence d’acides aminés qui constitue le feuillet bêta.

Etant donné que beaucoup de protéines régulatrices de gènes reconnaissent l’ADN


sous forme d’homodimères, la région de la protéine responsable de la dimérisation est
généralement distincte de celle qui est responsable de la liaison à l’ADN. Un motif combine
cependant ces deux fonctions : le motif “leucine zipper”, appelé ainsi en raison de
l’organisation particulière de ses deux hélices alpha (sous forme de fermeture à glissière) qui
sont collées par interactions des acides aminés hydrophobes des chaînes (souvent les
leucines). De l’autre côté de l’interface de dimérisation, les deux hélices alpha se séparent
l’une de l’autre pour former une structure en Y, qui permet à ces chaînes de se mettre en
contact avec le sillon majeur de l’ADN (Figure EXP-5).

5 6
C. FONCTIONNEMENT DES COMMUTATEURS GENETIQUES simplement une courte région d’ADN régulatrice de séquence nucléotidique définie, qui est
reconnue par une protéine répresseur, le répresseur du tryptophane, qui est un membre de la
Les composants basiques des commutateurs génétiques sont les protéines régulatrices famille des protéines hélice-tour-hélice (“helix-turn-helix”). Le promoteur et l’opérateur sont
de gènes et les séquences spécifiques d’ADN que ces protéines reconnaissent. Comment ces organisés de telle manière que lorsque le répresseur du tryptophane occupe l’opérateur, il
composants agissent pour “allumer” (activer) ou “éteindre” (réprimer) les gènes en réponse à bloque l’accès de la RNA polymérase au promoteur, empêchant ainsi l’expression des
une multitude de signaux ? enzymes de biosynthèse du tryptophane (Figure EXP-7).

Le concept majeur d’activation et de répression des gènes a été initialement découvert Pour se lier à son opérateur, la protéine répresseur nécessite d’être liée à deux
chez la bactérie E. coli lorsque l’on s’est intéressé à sa manière de s’adapter aux modifications molécules de l’acide aminé tryptophane. La liaison du tryptophane fait s’incliner le motif
de la composition de son milieu de culture. Des études parallèles sur le bactériophage lambda hélice-tour-hélice du répresseur de telle façon qu’il se présente correctement au niveau du
ont abouti à certaines conclusions identiques et ont contribué à en établir le mécanisme de sillon majeur de l’ADN. En l’absence de tryptophane, le motif se retourne à l’intérieur et la
base. Beaucoup de ces mêmes principes s’appliquent aussi aux cellules eucaryotes. protéine n’est pas capable de se lier à l’opérateur. Le répresseur du tryptophane et l’opérateur
Cependant, l’énorme complexité de la régulation des gènes chez les organismes supérieurs, forment un mécanisme simple qui commute (en activant et en réprimant) la production des
combinée à l’empaquetage de leur ADN en chromatine, apportent d’autres problèmes mais enzymes biosynthétiques du tryptophane selon la disponibilité de tryptophane libre. Puisque
aussi de nouvelles opportunités pour le contrôle. la forme de cette protéine active liée à l’ADN sert à réprimer les gènes, ce mode de régulation
génique est appelé contrôle négatif, et les protéines régulatrices des gènes impliquées dans
1. Le répresseur du tryptophane est un simple commutateur qui active et réprime cette régulation sont appelées répresseurs transcriptionnels ou protéines répresseurs de gènes.
des gènes chez les bactéries
2. Les activateurs transcriptionnels activent les gènes
Le chromosome de la bactérie E. coli est composé d’une molécule d’ADN circulaire
unique d’environ 4.6 x 106 paires de bases. Cet ADN code pour approximativement 4.300 Nous avons déjà vu qu’une RNA polymérase (et la sous-unité sigma) purifiée d’E. coli
protéines, quoique seule une fraction de ces protéines soient fabriquées au même moment. peut se lier à un promoteur et initier la transcription de l’ADN. Certains promoteurs
L’expression de plusieurs d’entre elles est régulée selon la disponibilité de nutriments dans bactériens, cependant, sont très peu fonctionnels par eux-mêmes, parce qu’ils sont faiblement
l’environnement. Cela est illustré par les cinq gènes d’E. coli qui codent pour les enzymes reconnus par la RNA polymérase ou alors parce que la polymérase trouve des difficultés à
impliquées dans la synthèse de l’acide aminé tryptophane. Ces gènes sont organisés en un ouvrir l’hélice d’ADN et à débuter la transcription. Dans les deux cas, ces promoteurs
opéron unique, c’est-à-dire qu’ils sont adjacents les uns aux autres sur le chromosome et sont faiblement fonctionnels peuvent être aidés par des protéines régulatrices qui se lient en un site
transcrits en une longue molécule d’ARNm à partir d’un promoteur unique (Figure EXP-6). voisin sur l’ADN et mettent en contact la RNA polymérase de telle façon que la probabilité
Lorsque le tryptophane est présent dans le milieu de culture et pénètre au sein de la cellule, d’initiation de la transcription y soit énormément augmentée. Etant donné que la forme d’une
elle n’a pas besoin de ces enzymes et réprime leur production. telle protéine liée à l’ADN active des gènes, de mode de régulation génique est appelé
contrôle positif, et les protéines régulatrices des gènes impliqués sont appelés activateurs
Le promoteur est une séquence d’ADN spécifique qui amène la RNA polymérase à s’y transcriptionnels ou protéines activatrices de gènes. Dans certains cas, les protéines
fixer, à ouvrir la double hélice d’ADN et à débuter la synthèse d’une molécule d’ARN. Au bactériennes activatrices de gènes aident la RNA polymérase à se lier au promoteur en
sein du promoteur responsable de la transcription des gènes de biosynthèse du tryptophane se fournissant uns autre surface de contact pour la polymérase. Dans d’autres cas, elles facilitent
trouve un élément régulateur appelé opérateur (voir Figure EXP-6). L’opérateur est

7 8
la transition de la conformation initiale de la polymérase liée à l’ADN vers une forme de alternatives de carbone tel que le lactose en absence de glucose. Il ne serait cependant pas
transcription active, probablement en stabilisant cet état transitionnel. rentable pour la protéine CAP d’induire l’expression de l’opéron lac si le lactose n’est pas
disponible : le répresseur de lac s’assure ainsi que l’opéron lac soit réprimé en absence de ce
Comme pour le contrôle négatif par un répresseur transcriptionnel, un activateur composé. Une telle organisation permet à la région de contrôle de l’opéron lac d’interagir et
transcriptionnel peut agir comme une partie d’un simple commutateur génétique on-off. Par d’intégrer deux signaux différents, de telle façon que l’opéron soit hautement exprimé
exemple, la protéine activatrice bactérienne CAP (pour “catabolite activator protein”) active seulement lorsque deux conditions sont réunies : le lactose doit être disponible et el glucose
des gènes qui permettent à E. coli d’utiliser des sources de carbone alternatives lorsque le doit être absent. N’importe laquelle des trois autres combinaisons de signaux possibles
glucose, sa source en carbone préférée, n’est pas disponible. Un niveau bas de glucose induit maintient le cluster de gènes à l’état off (Figure EXP-9).
une augmentation du niveau de la molécule de signal intracellulaire AMPc, qui se lie à la
protéine CAP, lui permettant de se lier à sa séquence spécifique d’ADN près des promoteurs 4. La régulation de la transcription dans les cellules eucaryotes est complexe
cibles, et active ainsi les gènes appropriés. De cette manière, l’expression d’un gène cible peut
être activée ou réprimée, selon que le niveau d’AMPc dans la cellule soit élevé ou bas. La Le mécanisme de commutation à deux signaux qui régule l’opéron lac est harmonieux
Figure EXP-8 résume comment le contrôle positif ou négatif peut être utilisé pour réguler les et simple. Cependant, il est difficile d’imaginer comment il pourrait gagner en complexité
gènes. pour permettre à un grand nombre de signaux de réguler la transcription de l’opéron : il n’y a
pas assez de place dans le voisinage du promoteur pour accueillir le nombre suffisant de
Sur bien des points, les activateurs et les répresseurs transcriptionnnels sont similaires séquences d’ADN régulatrices. Comment les eucaryotes surmontent-ils ces contraintes pour
dans leur “design”. Le répresseur du tryptophane et l’activateur transcriptionnel CAP, par créer leurs commutateurs génétiques beaucoup plus complexes ?
exemple, utilisent tous deux un motif hélice-tour-hélice, et nécessitent tous deux un petit co-
facteur pour se lier à l’ADN. La régulation de la transcription chez les eucaryotes diffère en trois points de celle
généralement trouvée chez les bactéries :
Certaines protéines bactériennes (dont CAP et le répresseur du bactériophage lambda)
peuvent agir aussi bien comme activateurs que comme répresseurs, selon l’emplacement exact - Primo, les eucaryotes utilisent des protéines régulatrices qui peuvent agir même
par rapport au promoteur de la séquence d’ADN qu’ils reconnaissent : si le site de liaison lorsqu’elles sont liées à l’ADN à plusieurs milliers de nucléotides du promoteur avec lequel
pour la protéine chevauche le promoteur, la polymérase ne peut pas se lier et la protéine agit elles interagissent, ce qui veut dire qu’un seul promoteur peut être contrôlé par un nombre
alors comme un répresseur. pratiquement illimité de séquences régulatrices éparpillées le long de l’ADN.

3. Un activateur transcriptionnel et un répresseur transcriptionnel contrôlent - Secundo, la RNA polymérase II eucaryote, qui transcrit tous les gènes codant pour
l’expression de l’opéron lac des protéines, ne peut pas initier la transcription par elle-même. Elle nécessite un ensemble de
protéines appelées facteurs de transcription généraux, qui doivent être assemblées au niveau
Des types plus compliqués de commutateurs génétiques combinent les contrôles positif du promoteur avant que la transcription ne débute. Ce processus d’assemblage offre, en
et négatif. Par exemple, l’opéron lac de E. coli, différemment de l’opéron trp du tryptophane, principe, de multiples étapes auxquelles le taux d’initiation de la transcription peut être
est sous contrôle transcriptionnel négatif et positif, par la protéine répresseur de lac et CAP accéléré ou ralenti en réponse à des signaux régulateurs.
respectivement. L’opéron lac code pour les protéines nécessaires au transport du disaccharide
lactose dans la cellule et à son hydrolyse. CAP permet à la bactérie d’utiliser des sources

9 10
- Tertio, l’empaquetage de l’ADN eucaryote en chromatine offre des possibilités de transcription généraux et la polymérase s’assemblent) et toutes les séquences régulatrices
régulation non disponibles chez les bactéries. auxquelles les protéines de régulation d’un gène se lient pour contrôler le taux du processus
d’assemblage au promoteur (Figure EXP-11). Chez les eucaryotes supérieurs, il n’est pas rare
5. Les protéines régulatrices des gènes eucaryotes contrôlent l’expression des gènes de trouver les régions régulatrices d’un gène à des distances aussi importantes que 50.000
à distance nucléotides. Bien qu’une grande partie de cet ADN serve de séquence “spacer” (= “espaceur”)
et n’est pas reconnu par les protéines régulatrices, il pourrait faciliter la transcription en
Tout comme les bactéries, les eucaryotes utilisent des protéines régulatrices de gènes apportant la flexibilité nécessaire pour la communication entre les protéines liées à l’ADN. Il
(activateurs et répresseurs) pour contrôler l’expression de leurs gènes, mais d’une manière faut aussi garder en mémoire que, comme les autres régions des chromosomes eucaryotes, une
quelque peu différente. Les sites d’ADN sur lesquels les activateurs de gènes eucaryotes se grande partie de l’ADN des régions de contrôle de gènes est empaqueté en nucléosomes et
lient ont d’abord été appelés “enhancers”, car leur présence accroît le taux de transcription de d’autres formes de chromatine d’ordre supérieur, réduisant cette distance.
manière importante. Grande a pourtant été la surprise lorsque l’on a découvert que les
protéines activatrices pouvaient se lier à des milliers de nucléotides loin du promoteur. De Bien que beaucoup de protéines régulatrices de gènes se lient aux séquences enhancers
plus, les activateurs eucaryotes pouvaient influer sur la transcription d’un gène lorsqu’ils et activent la transcription de gènes, beaucoup d’autres fonctionnent comme des régulateurs
étaient liés aussi bien en amont qu’en aval de celui-ci. Comment ces séquences enhancers et négatifs. Par contraste au petit nombre de facteurs de transcription généraux, il existe des
les protéines qui s’y lient fonctionneraient-elles à d’aussi grandes distances ? Comment milliers de protéines régulatrices de gènes différentes. Par exemple, sur les 30.000 gènes
feraient-elles pour communiquer avec le promoteur ? humains, 5-10 % coderaient pour des protéines régulatrices de gènes. Ces protéines
régulatrices varient d’une région de contrôle à une autre, et chacune est généralement présente
Plusieurs modèles d’ “action à distance” ont été proposés, mais le plus simple d’entre dans la cellule en très petite quantité (souvent moins de 0.01 % des protéines totales). La
eux semble survenir dans la plupart des cas : l’ADN entre l’enhancer et le promoteur fait une plupart d’entre elles reconnaissent leurs séquences spécifiques d’ADN en utilisant l’un de
boucle pour permettre aux protéines activatrices liées à l’enhancer de se mettre en contact leurs motifs de liaison à l’ADN, quoique certaines ne reconnaissent pas l’ADN directement
avec les protéines (RNA polymérase, facteurs de transcription généraux, ou d’autres mais s’associent plutôt à d’autres protéines liées à l’ADN.
protéines) liées au promoteur. L’ADN agirait comme une perche, aidant une protéine liée à un
enhancer, même à des milliers de nucléotides plus loin, à interagir avec le complexe des Les protéines régulatrices de gènes permettent à des gènes individuels d’un organisme
protéines liées au promoteur. Ce phénomène survient aussi chez les bactéries, quoique moins à être spécifiquement activé ou réprimé. Différents choix de protéines régulatrices sont
communément et sur des distances d’ADN plus courtes (Figure EXP-10). présents dans les différents types cellulaires, et dirigent ainsi les modes d’expression génique
qui donnent à chaque cellule ses caractéristiques propres. Chaque gène d’une cellule
6. Une région de contrôle des gènes eucaryotes comprend un promoteur et des eucaryote est régulé différemment des autres gènes. Compte tenu du nombre de gènes chez les
séquences d’ADN régulatrices eucaryotes et la complexité de leur régulation, il est difficile de formuler de simples règles de
régulation génique qui puissent s’appliquer dans tous les cas. L’on peut, tout de même, faire
Puisque les protéines régulatrices des gènes eucaryotes peuvent contrôler la des généralités sur la manière dont les protéines régulatrices de gènes, une fois liées à une
transcription lorsqu’elles se lient à l’ADN loin du promoteur, les séquences d’ADN qui région contrôle de l’ADN, influent sur le taux d’initiation de la transcription.
contrôlent l’expression d’un gène sont souvent éparpillées sur de longues étendues d’ADN.
Le terme de région de contrôle de gènes réfèrerait ainsi à toute l’étendue d’ADN impliquée
dans la régulation de la transcription d’un gène, incluant le promoteur (où les facteurs de

11 12
7. Les protéines activatrices des gènes eucaryotes favorisent l’assemblage de la RNA des gènes. Plusieurs protéines activatrices de gènes contribuent ainsi à recruter des histones
polymérase et des facteurs de transcription généraux au site d’initiation de la acétyl transférases et des complexes ATP-dépendants de remodelage de la chromatine au
transcription niveau de ces séquences, créant des altérations locales de la structure de la chromatine et
permettant alors une plus grande accessibilité à l’ADN. Cette accessibilité facilite
La plupart des protéines régulatrices de gènes qui activent la transcription des gènes, l’assemblage des facteurs de transcription généraux et de la RNA polymérase holoenzyme au
i.e. la plupart des protéines activatrices de gènes, ont une organisation modulaire avec au niveau du promoteur, et permet également la liaison de protéines régulatrices additionnelles à
moins deux domaines distincts. L’un des domaines contient généralement un des motifs la région contrôle du gène.
structuraux reconnaissant une séquence d’ADN régulatrice spécifique. Dans le plus simple
des cas, un deuxième domaine, souvent appelé domaine d’activation, accélère le taux 8. Les protéines régulatrices des gènes eucaryotes s’assemblent souvent à l’ADN
d’initiation de la transcription. sous forme de complexes

Une fois liées à l’ADN, les activateurs transcriptionnels ont pour fonction principale La plupart des protéines régulatrices des gènes eucaryotes s’assemblent sous forme de
d’attirer, de positionner, et d’assurer la modification des facteurs de transcription généraux et complexes de plusieurs polypeptides, chacun ayant une fonction distincte. De plus,
de la RNA polymérase II au niveau du promoteur de telle manière que la transcription puisse individuellement, une protéine régulatrice de gènes peut souvent faire partie de plus d’un type
démarrer. Ces activateurs agissent directement sur la machinerie trasncriptionnelle elle-même de complexes régulateurs. Elle peut, dans un cas, faire partie d’un complexe qui active la
ou bien modifient la structure chromatinienne au voisinage du promoteur. transcription, et, dans un autre cas, d’un complexe qui réprime la transcription. Ainsi,
individuellement, les protéines régulatrices des gènes eucaryotes ne sont pas nécessairement
Bien que les facteurs de transcription généraux et la RNA polymérase II s’assemblent consacrées activateurs ou répresseurs. Elles fonctionnent comme des unités de régulation qui
par étapes dans un ordre précis in vitro, certains peuvent parfois être ramenés au site sont utilisées pour générer des complexes dont la fonction dépend de l’assemblage final de
promoteur sous forme d’un grand complexe pré-assemblé qu’on appelle la RNA polymérase tous les composants individuels. L’assemblage final, par contre, dépend de l’arrangement des
II holoenzyme. L’holoenzyme contient (en plus de la RNA polymérase II et des facteurs de séquences d’ADN de la région contrôle et des protéines régulatrices présentes dans la cellule.
transcription généraux) un complexe protéique de 20 sous-unités nécessaire aux activateurs
pour la stimulation de l’initiation de la transcription. Beaucoup de protéines activatrices Les protéines régulatrices qui ne se lient pas à l’ADN par elles-mêmes, mais
interagissent avec ce complexe holoenzyme, rendant son assemblage sur le promoteur s’assemblent sur des protéines régulatrices déjà liées à l’ADN, sont appelées co-activateurs ou
énergétiquement plus favorable (Figure EXP-12). co-répresseurs, selon leur effet sur l’initiation de la transcription. Les deux portent
généralement de multiples fonctions, pouvant interagir avec les complexes qui re-modèlent la
L’effet des activateurs sur le complexe holoenzyme est probablement un mécanisme chromatine, les enzymes modificatrices des histones, la RNA polymérase holoenzyme et
très complexe. Par exemple, la plupart des formes de complexes holoenzymes n’ont pas plusieurs des facteurs de transcription généraux.
certains des facteurs de transcription généraux (TFIID et TFIAI entre autres), et ceux-ci
doivent être assemblés sur le promoteur séparément. Les activateurs pourraient contribuer à 9. Les bactéries utilisent des sous-unités de RNA polymérase interchangeables pour
accélérer ces étapes. contribuer à la régulation de la transcription des gènes

Les protéines activatrices de gènes favorisent en outre l’initiation de la transcription en Nous avons vu toute l’importance des protéines régulatrices de gènes lorsqu’elles se
modifiant la structure de la chromatine au niveau des séquences régulatrices et promotrices lient à des séquences régulatrices de l’ADN et qu’elles signalent à la machinerie

13 14
transcriptionnelle s’il faut ou pas démarrer la synthèse d’une chaîne d’ARN. Bien que ce soit D. CONTROLES POST-TRANSCRIPTIONNELS
le moyen principal de contrôler l’initiation de la transcription chez les eucaryotes et les
procaryotes, certaines bactéries et leurs virus utilisent une autre stratégie basée sur Beaucoup d’étapes de la voie qui mène un ARN à être traduit en protéine sont régulées
l’interchangeabilité des sous-unités de la RNA polymérase. Une sous-unité sigma est ainsi par les cellules pour contrôler l’expression des gènes. La plupart des gènes sont régulés à des
nécessaire pour que la RNA polymérase bactérienne puisse reconnaître un promoteur. niveaux multiples, quoique l’initiation de la transcription (contrôle transcriptionnel)
Beaucoup de bactéries synthétisent plusieurs types différents de sous-unités sigma, chacune prédomine généralement. Certains gènes, cependant, sont transcrits à un niveau constant et
pouvant interagir avec le cœur de la RNA polymérase et la diriger vers un ensemble différent activés/réprimés par des processus de régulation post-transcriptionnels. Ces processus peuvent
de promoteurs (Tableau EXP-1). Ce système permet à un ensemble de gènes d’être réprimé être l’atténuation du transcrit d’ARN par terminaison prématurée, la sélection de sites
ou désactivés, et à un autre ensemble de gènes d’être activés, simplement en remplaçant une d’épissage alternatifs, le contrôle de la formation de l’extrémité 3’ par clivage et addition de
sous-unité sigma par une autre. Cette stratégie est efficace car elle contourne la nécessité de la queue poly-A, le contrôle du transport des ARNm du nucleus vers le cytoplasme, la
composer avec les gènes un à un. Elle est souvent utilisée de manière subversive par les virus localisation des ARNm dans des compartiments particuliers de la cellule, le contrôle de
bactériens (bactériophages) pour prendre le contrôle de la polymérase hôte et activer leurs l’initiation de la traduction et la dégradation régulée des ARNm (Figure EXP-13). Dans la
gènes viraux rapidement et séquentiellement. suite de ce paragraphe, nous n‘en aborderons que quelques uns.

En un sens, les eucaryotes emploient une stratégie analogue étant donné qu’ils utilisent 1. L’atténuation de la transcription provoque la terminaison prématurée de
trois RNA polymérases distinctes (I, II et III) qui partagent entre elles certaines de leurs sous- certaines molécules d’ARN
unités. Les procaryotes, par contre, n’utilisent qu’un seul type de RNA polymérase, mais la
modifient avec différentes sous-unités sigma. Chez les bactéries, l’expression de certains gènes est inhibée par la terminaison
prématurée de la transcription, un phénomène appelé “atténuation de la transcription”. Dans
certains de ces cas, la chaîne d’ARN naissante adopte une structure qui fait qu’elle interagit
avec la RNA polymérase de manière telle que sa transcription avorte. Lorsque le produit du
gène est nécessaire, les protéines régulatrices se lient chaîne d’ARN naissante et interfère
avec l’atténuation, permettant la transcription d’une molécule d’ARN complète.

Chez les eucaryotes, l’atténuation de la transcription peur survenir selon plusieurs


mécanismes distincts. Un exemple bien étudié est celui trouvé chez HIV. Une fois que le virus
s’est intégré dans le génome hôte, l’ADN viral est transcrit par la RNA polymérase II.
Cependant, la polymérase hôte achève habituellement la transcription après synthèse de
transcrits de plusieurs centaines de nucléotides, et ainsi ne transcrit pas efficacement le
génome viral entier. Lorsque les conditions pour la croissance virale sont optimales, cette
terminaison prématurée est évitée grâce à une protéine codée par le virus, protéine Tat, et qui
se lie à une structure en boucle spécifique dans l’ARN naissant. Une fois liée à cette structure
spécifique d’ARN (appelée Tar), Tat rassemble plusieurs protéines cellulaires, ce qui permet à
la RNA polymérase de continuer à transcrire. Le rôle normal de certaines de ces protéines

15 16
cellulaires est d’empêcher les moments de pause ainsi que la terminaison prématurée de la Les ARNm des cellules eucaryotes sont plus stables. Certains ont des demi-vies de
RNA polymérase (qui ont alors lieu lorsqu’elle transcrit normalement des gènes cellulaires). plus de 10 heures. Cependant, beaucoup ont des demi-vies de 30 minutes ou même moins.
Les gènes eucaryotes contiennent souvent de grands introns : pour transcrire un gène Ces ARNm instables codent souvent pour des protéines régulatrices, tels que des facteurs de
efficacement, la RNA polymérase II ne peut pas se permettre de s’attarder à des séquences croissance et des protéines régulatrices de gènes, dont les niveaux de production doivent
nucléotidiques qui favorisent les pauses. Ainsi, un mécanisme cellulaire normal a rapidement changer dans la cellule.
apparemment été adapté par le virus HIV pour permettre à la transcription de son génome
d’être contrôlé par une protéine virale unique. Plusieurs modes de dégradation de ces ARNm eucaryotes peuvent survenir, et les
séquences portées par chaque molécule d’ARNm déterminent quel va être son mode et sa
2. L’épissage alternatif de l’ARN peut produire différentes formes d’une protéine à cinétique de dégradation. Le mode le plus courant implique le raccourcissement graduel de la
partir d’un même gène queue poly-A. Une fois dans le cytosol, les queues poly-A sont en effet graduellement
raccourcies par une exonucléase. Dès qu’une longueur critique de la queue est atteinte
Une proportion importante des gènes des eucaryotes supérieurs (au moins le tiers des (environ 30 A), la coiffe en 5’ est enlevé et l’ARN est rapidement dégradé. Presque tous les
gènes humains) produit des protéines multiples par le processus d’épissage alternatif. ARNm sont soumis à un raccourcissement de la queue poly-A, à l’élimination de la coiffe et à
une éventuelle dégradation, mais la vitesse à laquelle cela se produit diffère d’une espèce
Dans certains cas, l’épissage alternatif de l’ARN survient car il y a une ambiguïté dans d’ARNm à une autre. Par exemple, beaucoup d’ARNm portent dans leurs séquences 3’-UTR
la séquence intronique : le mécanisme d’élimination des séquences introniques est alors des sites de liaison pour des protéines spécifiques qui diminuent ou augmentent la vitesse de
incapable de délimiter clairement deux (ou plus) appariements des sites d’épissage 5’ et 3’, si raccourcissement de la queue poly-A.
bien qu’il fait différents choix générant ainsi différents transcrits.

Cependant, dans la plupart des cas, l’épissage alternatif d’ARN est régulé, plutôt que
constitutif. Dans le plus simple des exemples, l’épissage régulé peut être utilisé pour passer de
la production d’une protéine non fonctionnelle vers celle d’une protéine fonctionnelle. La
régulation de l’épissage d’ARN offre également l’avantage de générer différentes versions
d’une protéine dans différents types cellulaires, et ce selon les besoins de la cellule.

3. L’expression génique peut être contrôlée par la stabilité des ARNm

La grande majorité des ARNm d’une cellule bactérienne sont très instables, avec une
demi-vie d’environ 3 minutes. Les exonucléases, qui les dégradent dans le sens 3’ > 5’, sont
généralement responsables de cette rapide destruction. Etant donné que ses ARNm sont
rapidement synthétisés, mais également rapidement dégradés, les bactéries peuvent s’adapter
rapidement aux changements environnementaux.

17 18
Figure EXP-1. Six steps at which eucaryotic gene expression can be controlled. Controls Figure EXP-2. The binding of a gene regulatory protein to the major groove of DNA.
that operate at steps 1 through 5 are discussed in this chapter. Step 6, the regulation of protein Only a single contact is shown. Typically, the protein-DNA interface would consist of 10 to
activity, includes reversible activation or inactivation by protein phosphorylation as well as 20 such contacts, involving different amino acids, each contributing to the strength of the
irreversible inactivation by proteolytic degradation. protein-DNA interaction.

19 20
Figure EXP-3. The DNA-binding helix-turn-helix motif. The motif is shown in (A), where Figure EXP-4. One type of zinc finger protein. This protein belongs to the Cys-Cys-His-
each white circle denotes the central carbon of an amino acid. The C-terminal alpha helix His family of zinc finger proteins, named after the amino acids that grasp the zinc. (A)
(red) is called the recognition helix because it participates in sequence-specific recognition of Schematic drawing of the amino acid sequence of a zinc finger from a frog protein of this
DNA. As shown in (B), this helix fits into the major groove of DNA, where it contacts the class. (B) The three-dimensional structure of this type of zinc finger is constructed from an
edges of the base pairs (see also Figure 7-7). The N-terminal alpha-helix (blue) functions antiparallel bêta sheet (amino acids 1 to 10) followed by an alpha helix (amino acids 12 to
primarily as a structural component that helps to position the recognition helix. 24). The four amino acids that bind the zinc (Cys 3, Cys 6, His 19, and His 23) hold one end
of the alpha helix firmly to one end of the bêta sheet. (Adapted from M.S. Lee et al., Science
245:635–637, 1989.)

21 22
Figure EXP-5. A leucine zipper dimer bound to DNA. Two alpha-helical DNA-binding Figure EXP-6. The clustered genes in E. coli that code for enzymes that manufacture the
domains (bottom) dimerize through their alpha-helical leucine zipper region (top) to form an amino acid tryptophan. These five genes are transcribed as a single mRNA molecule, a
inverted Y-shaped structure. Each arm of the Y is formed by a single alpha helix, one from feature that allows their expression to be controlled coordinately. Clusters of genes
each monomer, that mediates binding to a specific DNA sequence in the major groove of transcribed as a single mRNA molecule are common in bacteria. Each such cluster is called
DNA. Each alpha helix binds to one-half of a symmetric DNA structure. The structure shown an operon.
is of the yeast Gcn4 protein, which regulates transcription in response to the availability of
amino acids in the environment. (Adapted from T.E. Ellenberger et al., Cell 71:1223–1237,
1992.)

23 24
Figure EXP-7. Switching the tryptophan genes on and off. If the level of tryptophan inside Figure EXP-8. Summary of the mechanisms by which specific gene regulatory proteins
the cell is low, RNA polymerase binds to the promoter and transcribes the five genes of the control gene transcription in procaryotes. (A) Negative regulation; (B) positive regulation.
tryptophan (trp) operon. If the level of tryptophan is high, however, the tryptophan repressor Note that the addition of an “inducing” ligand can turn on a gene either by removing a gene
is activated to bind to the operator, where it blocks the binding of RNA polymerase to the repressor protein from the DNA (upper left panel) or by causing a gene activator protein to
promoter. Whenever the level of intracellular tryptophan drops, the repressor releases its bind (lower right panel). Likewise, the addition of an “inhibitory” ligand can turn off a gene
tryptophan and becomes inactive, allowing the polymerase to begin transcribing these genes. either by removing a gene activator protein from the DNA (upper right panel) or by causing a
The promoter includes two key blocks of DNA sequence information, the -35 and -10 regions gene repressor protein to bind (lower left panel).
highlighted in yellow.

(Page suivante)

25 26
Figure EXP-9. Dual control of the lac operon. Glucose and lactose levels control the
initiation of transcription of the lac operon through their effects on the lac repressor protein
and CAP. Lactose addition increases the concentration of allolactose, which binds to the
repressor protein and removes it from the DNA. Glucose addition decreases the concentration
of cyclic AMP; because cyclic AMP no longer binds to CAP, this gene activator protein
dissociates from the DNA, turning off the operon. CAP is known to induce a bend in the DNA
when it binds; for simplicity, the bend is not shown here. LacZ, the first gene of the lac
operon, encodes the enzyme bêta-galactosidase, which breaks down the disaccharide lactose
to galactose and glucose. The essential features of the lac operon are summarized in the
figure, but in reality the situation is more complex. For one thing, there are several lac
repressor binding sites located at different positions along the DNA. Although the one
illustrated exerts the greatest effect, the others are required for full repression. In addition,
expression of the lac operon is never completely shut down. A small amount of the enzyme
bêta-galactosidase is required to convert lactose to allolactose thereby permitting the lac
repressor to be inactivated when lactose is added to the growth medium.

27 28
Figure EXP-10. Gene activation at a distance. NtrC is a bacterial gene regulatory protein Figure EXP-11. The gene control region of a typical eucaryotic gene. The promoter is the
that activates transcription by facilitating the transition between the initial binding of RNA DNA sequence where the general transcription factors and the polymerase assemble. The
polymerase to the promoter and the formation of an initiating complex (discussed in Chapter regulatory sequences serve as binding sites for gene regulatory proteins, whose presence on
6). As indicated, the transition stimulated by NtrC requires the energy produced by ATP the DNA affects the rate of transcription initiation. These sequences can be located adjacent to
hydrolysis, although this requirement is unusual for bacterial transcription initiation. the promoter, far upstream of it, or even within introns or downstream of the gene. DNA
looping is thought to allow gene regulatory proteins bound at any of these positions to interact
with the proteins that assemble at the promoter. Whereas the general transcription factors that
assemble at the promoter are similar for all polymerase II transcribed genes, the gene
regulatory proteins and the locations of their binding sites relative to the promoter are
different for each gene.

29 30
Figure EXP-12. Activation of transcription initiation in eucaryotes by recruitment of the Tableau EXP-1. Sigma Factors of E. coli
eucaryotic RNA polymerase II holoenzyme complex. (A) An activator protein bound in
proximity to a promoter attracts the holoenzyme complex to the promoter. According to this -----------------------------------------------------------------------------------------------------------------
model, the holoenzyme (which contains over 100 protein subunits) is brought to the promoter
separately from the general transcription factors TFIID and TFIIA. The “broken” DNA in this Sigma factor Promoters recongnized
and subsequent figures indicates that this portion of the DNA molecule can be very long and -----------------------------------------------------------------------------------------------------------------
of variable length. (B) Diagram of an in vivo experiment whose outcome supports the Sigma-70 most genes
holoenzyme recruitment model for gene activator proteins. The DNA-binding domain of a Sigma-32 genes induced by heat shock
protein has been fused directly to a protein component of the mediator, a 20-subunit protein Sigma-28 genes for stationary phase and stress response
complex which is part of the holoenzyme complex, but which is easily dissociable from the Sigma-28 genes involved in motility and chemotaxis
remainder of the holoenzyme. When the binding site for the hybrid protein is experimentally Sigma-54 genes for nitrogen metabolism
inserted near a promoter, transcription initiation is strongly increased. In this experiment, the
“activation domain” of the activator has been omitted, suggesting that an important function -----------------------------------------------------------------------------------------------------------------
of the activation domain is simply to interact with the RNA polymerase holoenzyme complex The sigma factor designations refer to their approximate molecular weights, in kilodaltons.
and thereby aid in its assembly at the promoter. The ability of gene activator proteins to
recruit the transcription machinery to promoters has also been demonstrated directly, using
chromatin immunoprecipitation. DNA-bound activator proteins typically increase the rate of
transcription by up to 1000-fold, which is consistent with a relatively weak and nonspecific
interaction between the activator and the holoenzyme.

31 32
Figure EXP-13. Possible post-transcriptional controls on gene expression. Only a few of
these controls are likely to be important for any one gene.

33