Vous êtes sur la page 1sur 66

Les Facteurs de Transcription

acteurs de la régulation génique


I- Généralités
Le dogme central de la biologie moléculaire

1The central dogma of molecular biology deals with the detailed residue-by-
residue transfer of sequential information. It states that such information
cannot be transferred from protein to either protein or nucleic acid.

Le dogme central de la biologie moléculaire traite du transfert d’information


séquentielle résidu-par-résidu. Il postule qu’une telle information ne peut
être transférée d’une protéine vers une protéine où un acide nucléique.

Il existerait 3 classes de transfert d’information

Générale Spéciale Inconnue


DNA → DNA RNA → DNA Protéine → DNA
DNA → RNA RNA → RNA Protéine → RNA
RNA → Protéine DNA → Protéine Protéine → Protéine

1 : Crick, F.H.C. (1958): On Protein Synthesis. Symp. Soc. Exp. Biol. XII, 139-163.
ADN
régulation transcriptionnelle

ARN transcrit
maturation de l'ARN

ARNm

transport
dégradation ARNm
régulation traductionnelle

protéine
régulation post-traductionnelle
dégradation
protéine active
Les -omics

Génome

Transcriptome

Protéome

METABOLOME
Métabolome
Les conséquences de la régulation

Cycle
Cellulaire

Mobilité
Pluricellularité

Etc …

Interaction avec l'environnement


Plusieurs types de facteurs de transcription

Facteur de transcription spécifique :


différents (ou pas) selon les gènes

liaison

Inhibition ou activation
action

DNA

II D

II A II B Pol II Séquence transcrite


TATA box

Région proximale
Facteurs de transcription généraux :
Presque toujours identiques
Le complèxe mediateur

Lewis B A , and Reinberg D J Cell Sci 2003;116:3667-3675


Plusieurs types de configurations

+/-

Plusieurs FT régulent un même gène


AGTTCGGTATTA… GTTAGATCGCTA

+/- +/-

Un FT régule plusieurs gènes


AGTTCGGTATTA AGTTCGGTATTA
Les réseaux de régulation

Organisation structurale des réseaux de régulation. L’unité de base comprend le FT,


le site de reconnaissance sur l’ADN et l’interaction régulatrice entre eux. Ces unités
sont organisés en réseaux parfois très complexes.

Babu et al., 2004; Current Opinion in Structural Biology


Les différentes catégories de FT

migrent dans le noyau


lors de l'activation du
récepteur
Architecture modulaire des facteurs de transcription

NLS NLS NLS NLS NLS Signal de localisation nucléaire

DNA-BD Oligo-D Reg-D

Domaine de régulation

Domaine d'oligomérisation

Domaine de liaison à l'ADN


Le domaine de liaison à l'ADN

Un facteur de transcription peut


se fixer sur l’ADN
Basic Helix-loop-helix proteins (bHLH)
"boucle"

La région C-terminale (acides aminés principalement


hydrophobes) est impliquée dans la dimérisation. Elle
forme 2 hélices α amphipathiques séparées par une
boucle de séquence et de longueur variables.

La région basique N-terminale (15


acides aminés) est impliquée dans la
liaison à l'ADN.
Famille Homeodomaine : helix-turn-helix
"coude"

- Di-hélice (HTH le plus simple)


- Tri-hélice (exemple : Myb)
- Tétra-helical qui possède une hélice α C-
terminale additionnelle (exemple : "LuxR-type
DNA-binding HTH domain" des bactéries,
répresseurs TetR)
Zinc finger : doigt de zinc

C H
Zn
C H

Structure et fonctions des doigts de zinc très variables :


-  liaison à l’ADN et ARN
-  interactions Prot-Prot
-  association avec membranes
1 Zinc finger domains C2H2

25 à 30 AA incluant le motif C-2-C-12-H-3-H

C--C------------H---H

AA souvent polaires et basiques

Zn

liaison

≈ 5 bp
2 Zinc finger domains C2C2 & C3H

Association protéine-ADN ou protéine-protéine

C--C…………………………..C--C

C--C………..…………………C--H

C2H2, C3H et C2C2 peuvent être répétés sur un même FT


La liaison Protéine - ADN

Structure tridimensionnelle : AA souvent neutres (G, P …)

Domaines de liaison : unique ou multiple; AA souvent basiques


Renforcé par d'autres AA basiques (≠ domaine liaison)

Agissent de manière coopérative ou via des spécificités


≠ pour chaque domaine répété

GT-2

GGTAAAT GGTAATT

GT-3 bx GT-2 bx
Le domaine d'oligomérisation

Beaucoup de FT sont des homo- ou hétéro-oligomères

Interactions par ponts -H entre feuillets béta ou structures coiled-coil (enroulés)

Domaines conservés caractérisant parfois la structure 3D (zipper)


Les structures « coiled-coil »

Structure en « bobine enroulée »


Des hélices α sont enroulées l'une dans l'autre.
Ces hélices contiennent 3,5 résidus d'acides aminés par tour.
Les dimères et les trimères d'hélices sont les types les plus courants.

Basic Leucine Zipper (bZIP)


Structure de type "coiled coil" : c'est une structure constituée de
deux hélices alpha parallèles enroulées l'une dans l'autre et
stabilisée par des résidus leucine.

http://gibk26.bse.kyutech.ac.jp/jouhou/image/dna-protein/all/all.html
Le domaine de régulation

Domaine important car il définit l’activité du FT


il active ou réprime la transcription

La répression peut se faire par


-  exclusion d'activateurs par compétition sur un même élément cis
-  masquage du domaine d'activation après interaction avec d'autres FT
EmBP1 (bZIP) ne se lie plus après association avec OsZIP-2 (bZIP)

Ces domaines sont assez divergents et peuvent être identifiés après fusion
avec GAL4 (DNA binding domain de levure)

Souvent riches en AA acides


Le signal de localisation nucléaire (NLS)

NLS NLS NLS NLS NLS

DNA-BD Oligo-D Reg-D

Adresse le FT dans le noyau

Riche en arginine et lysine


Nombre variable sur le FT et ayant une efficacité différente
Les NLS peuvent être simples (S), doubles (D) ou multiples (M).
Sont constitués de lysines et arginines groupés (continus : C) ou en 2 blocs (bipartites : B).

Exemples :

SC : KRIAEGSKKRRIKQD
SB : RKDKQRIEVGQKRRLTM

DB : KKCKEKFENVHKYYKRTK………………. KKCKEKWENINKYFKKVK
MC : ERSKKRSRE………. ERELKREKRKQ………. ARRSRLRKQ
MB : PAA-KRK----S—SP---VRVLRS ……………………AHKRS---H-------RKL
II- Les facteurs de transcription à l'échelle du génome
Représentation des FT se liant à l’ADN à l’échelle du génome

Nombre de transcrits Nombre de protéines avec un


Organisme (Taille du génome) domaine de liaison à l’ADN Pourcentage

E. coli 4280 (4,64 Mb) 267 6,2


S. cerevisiae 6357 (12 Mb) 245 3,9
C. elegans 31677 (100 Mb) 1463 4,6
H. sapiens 32036 (3400 Mb) 2604 8,1
A. thaliana 28787 (120 Mb) 1667 5,7
Exemple de représentation de quelques domaines de fixation à l’ADN
dans 5 génomes

Babu et al., 2004; Current Opinion in Structural Biology


Comparaison de génomes chez Arabidopsis, le riz et le peuplier

(a) Représentation des gènes uniques ou communs et des familles de gènes (b) chez
Arabidopsis, le riz et le peuplier (Sterck et al., 2007).

Ath : 28787 gènes Osa : 42546 gènes Ptr : 45407 gènes

Et les facteurs de transcription?


Chez Arabidopsis

16,9 %
Chez Arabidopsis

Les enseignements du séquençage d'Arabidopsis :

-  environ 2000 gènes codant des FT


-  45% sont spécifiques des plantes
-  les familles les plus représentées sont :
o- Myb
o- basic helix-turn-helix
= Drosophile, C. elegans et levure
o- basic leucine zipper
o- C2H2 zinc finger

Malgré tout, les séquences sont très divergentes entre les règnes
Chez Arabidopsis
Les spécificités des FT chez Arabidopsis

« Amplification » des familles classiques : Myb (150)

Absence de grandes familles connues chez les animaux et levures :


-  récepteurs hormonaux nucléaires
-  C6 zinc finger

Apparition de nouvelles familles comme par exemple :


AP2/EREBP (144), NAC (109), WRKY (72), Dof (41)

caractérisées par l'association de domaines déjà connues : HD-ZIP,


structures ZIP autres que dans les facteurs bZIP (WRKY)
Représentation des familles de FT (Arabidopsis/Riz/Peuplier)

ABI3/VP1 Alfin AP2/EREBP ARF ARID


(60/54/108) (7/10/9) (146/174/212) (23/24/37) (10/6/13)
AS2 AUX/IAA BBR/BPC BES1 bHLH
(42/43/57) (29/30/33) (7/4/16) (8/7/12) (127/157/148)
Ath : 125 Mb bZIP C2C2-CO-like C2C2-Dof C2C2-GATA C2C2-YABBY
(72/88/85) (37/34/39) (36/28/42) (26/28/32) (5/7/13)
Osa : 466 Mb
C2H2 C3H CAMTA CCAAT-Dr1 CCAAT-HAP2
Ptr : 550 Mb (134/94/81) (59/57/78) (6/7/7) (2/1/2) (10/10/11)
CCAAT-HAP3 CCAAT-HAP5 CPP E2F/DP EIL
(11/12/19) (13/14/19) (8/11/13) (8/9/10) (6/9/6)
FHA GARP-ARR-B GARP-G2-like GeBP GIF
(16/15/19) (10/9/15) (43/49/67) (21/12/7) (3/3/5)
Ath : 26481 genes GRAS GRF HB HMG HRT-like
(33/57/96) (9/12/9) (87/84/106) (11/12/12) (2/1/1)
Osa : 42546 genes HSF JUMONJI LFY LIM LUG
Ptr : 45407 genes (23/27/31) (17/17/20) (1/2/1) (13/10/21) (2/6/6)
MADS MBF1 MYB MYB-related NAC
(104/70/111) (3/4/3) (150/136/216) (49/64/84) (107/157/172)
Nin-like NZZ PBF-2-like PcG PHD
(14/12/18) (1/1/2) (2/2/2) (34/34/45) (56/61/86)
Nombre de PLATZ SAP S1Fa-like SBP SRS
(10/15/20) (1/0/1) (3/3/2) (16/18/29) (10/5/10)
facteurs conservé TAZ TCP Trihelix TUB ULT
(9/4/7) (23/22/34) (22/26/47) ( ?/13/ ?) (2/2/3)
VOZ WRKY ZF-HD ZIM
(2/2/4) (72/111/104) (16/14/25) (18/19/22)
III- Quelques exemples de familles de facteurs de transcription

MY bZ P WRKY DO
B WR Y K F
Les facteurs Myb chez les plantes

Historique :

-  c-Myb a été le 1er identifié chez le poulet (oncogène retroviral)


Myeloblast ---> MYB
-  C1 a été le 1er identifié chez les plantes (maïs).
Il est responsable de la pigmentation des grains

mutation C1 = violet
mutation P = rouge

A-maizing Mybs
Les facteurs Myb chez les plantes

Définition :

- FT portant 1 à 3 domaines "MYB" de liaison à l'ADN


-  Chaque domaine ≈ 50 AA et possède une structure HTH composé de
3 hélices dont la dernière interagit avec l'ADN (grand sillon)
Les facteurs Myb chez les plantes

Goicoechea et al., 2005


Les facteurs Myb chez les plantes

Structure :

MYB REPEATS
ACIDIC NEGATIVE REGULATION
R1 R2 R3
MYB3R
DNA Binding Transcriptional c-MYB
Activation
MYB REPEATS AMPHIPATHIC
ALPHA HELIX
R2 R3
MYBR2R3 ZmMYBC1
Transcriptional
DNA Binding Activation

R1/2
MYB1R StMYB1
Transcriptional
DNA Binding
Activation

proche d'une protéine télomérique humaine (hTRF1) : se fixe sur TTTAGGG


Les facteurs Myb chez les plantes

Interactions MYB - ADN :

Il existe une certaine souplesse dans la reconnaissance sur l'ADN.


L'interaction dépend aussi parfois d'autres protéines (par ex bHLH).

Les Myb mammifères/invertébrés et certaines MYBR2R3 :

MBS I : [T/C]AAC[G/T]G[A/C]T[A/C/T]

D'autres MYBR2R3 :

MBS II : TAACTAAC

Et encore…

MBS IIG : G[G/T]T[A/T]GGT[A/G]


Les facteurs Myb chez les plantes

Contrôle du
métabolisme IIaire Morphogenèse cellulaire Voies de transduction

•  Chez le pétunia, ils •  Réponse hormonale


• Métabolisme des interviennent dans le pendant le
phénylpropanoïdes développement de cellules développement de la
(modification des dérivés de
la phénylalanine) coniques dans l'épiderme des graine et la germination
pétales
• Une branche est •  Chez Arabidopsis et le
responsable de la •  Chez Arabidopsis, rôle dans la maïs, activation de
production d'anthocyanes différenciation de cellules de gènes en réponse à la
(groupe majeur de trichomes dans la feuille et et déshydratation et le
pigments) les tiges stress salin

Dans tous les cas : variations selon les espèces


Les facteurs Myb chez les plantes
Quelques exemples de fonctions… Phenylalanine
PAL MYB340 MYB305

Cinnamate

Espèces
p-coumarate

C1 Zea mays P-coumaroyl-CoA


CHS P C1 R/B MYB3
P Zea mays Chalcone
CHI P MYB340 MYB305
MYB3 Petunia hybrida
Flavanone
F3H MYB340 MYB305
MYB305 Anthirrhinum majus
Dihydroflavonol
DFR C1 R/B AN2
MYB340 Anthirrhinum majus
Leucoanthocyanidine
ANS C1 R/B AN2
R/B Zea mays
Anthocyanidine
UF3GT C1 R/B AN2

Anthocyanin
Métabolisme des phenylpropanoïdes
Les facteurs Myb chez les plantes

Quelques exemples de fonctions…

Formation de trichomes
Wild Type

Prom 35S AtMYB23

Surexpression AtMYB23
Zhang (2003). Cur Op Plant Biol, 6:430–440
Les facteurs Myb chez les plantes

Qui régule les régulateurs?

-  le potentiel Redox cellulaire

Les Myb doivent être sous forme réduite pour se lier à l'ADN. Une Cys (C130 chez c-
MYB) joue le rôle de détecteur

-  la phosphorylation
Augmente l'affinité pour l'ADN

-  les interactions
Avec les facteurs MYC ou bHLH

-  la compétition
Même affinité de ≠ MYB pour un même site
Les facteurs bZIP
Les facteurs bZIP chez les plantes

Facteur de transcription bipartite composé de 2 hélices

Charnière

NLS ADN Dimérisation


(zone hydrophobe : Phe, Ile, Val…)

Hétéro- ou Homo- dimères

Jakoby et al., 2002


Les facteurs bZIP chez les plantes

Association avec l'ADN

core central

T ACGTA A-Box
GACGTC C-Box

CACGTG G-Box
AAC G T T T-Box
Relation structure/fonction des facteurs bZIP

Nb Seq
Angiospermes Fonction
Consensus

3 Signalisation ABA ou stress

7 ?

1 Protéines de réserve

2 Développement et défense
2 ?

1 ?

3 Réponse aux UV et lumière bleue

1 ?

1 Développement vasculaire

1 ?

1 ?

2 ?

0 Autres

Guedes Corréa et al., 2008


Les facteurs WRKY

-  Spécifiques des végétaux (présents aussi chez levures)

-  75 membres chez A. thaliana : distribution homogène sur 5K

-  Se lient à une W-Box

-  Domaine WRKY : WRKYGQK

-  Facteurs à 1 ou 2 domaines
Les facteurs WRKY

zinc-finger motif : C-2-C-(22-23)-H-1-H

Domaine WRKY
≈ 60 AA
Les facteurs WRKY

C2-HC

LeuZIP

Eulgem et al., 2000


Les facteurs WRKY

W-box : (T)(T)TGAC[C/T]

• En général, on les retrouve groupés dans une petite portion du promoteur

La liaison WRKY - W-box


• Dépend de modifications post-traductionnelles (activation rapide)
• [-] phosphatase alcaline et staurosporine
• La spécificité de liaison peut dépendre
-  des nt autour de TGAC
-  structure 3D
Les facteurs WRKY

What's WRKYs work ?

Processus "plante spécifiques"

-  défense (pathogènes)
-  sénescence
-  trichomes
-  métabolites IIaires
Les facteurs WRKY

mutant ttg2 (AtWRKY44)


(=transparent testa glabra2)

- phénotype glabre (sans trichomes)


- réduction de la pigmentation
Les facteurs DOF

-  DNA-binding with One Finger

-  Spécifiques des végétaux (mais fonctionnels chez animaux et levures)

-  37 membres chez A. thaliana

-  Liaison à l'ADN par un Zn finger particulier (C2-C2)

-  Un seul domaine de liaison situé côté N-term

-  Domaine d'activation d'environ 44 AA côté C-term

-  Charnière riche en sérine


Les facteurs DOF

bZIP

DOF
Les facteurs DOF

• Liaison à l'ADN

- [T/A]AAAG : liaison peu affectée par nt environnants

-  Inhibée par une mutation sur un C et par EDTA

-  Probablement dépendante d'interactions Prot - Prot (bZIP)

• Rôles très divergents

- Processus "plante spécifiques"


Les facteurs DOF
Les facteurs WRKY et DOF dans la signalisation de l’ABA

La régulation de la germination chez les


céréales se fait par un antagonisme entre des
gibbérillines (GA) et l’acide abscissique (ABA).

enhanceosome RAMY : Zinc finger


SAD : facteurs DOF
GAMYB, MYBS3 : MYB

(=Albumen)

repressosome

Exemple chez l’orge WRKY38 homo ou hétérodimère (BPBF)


BPBF & HRT : facteurs DOF
MCB1 : MYB
Rushton et al., 2011
IV- Caractérisation des binômes FT-ADN
Comment déterminer les gènes-cible d'un FT?

1. Trouver l’élément cis reconnu par le facteur de transcription

2. Rechercher cette signature sur le génome

3. Cribler la région pour des séquences codantes

TAACTAAC

TAACTAAC

… mais cela reste encore hypothétique


Comment déterminer les gènes-cible d'un FT?

1. Trouver l’élément cis reconnu par le facteur de transcription


Immuno-précipitation de la chromatine

Coupure de l’ADN

ATAGTAAGTAAGCAGCT
GGCGTAACTAAGCATTT
TCGCTAAGTAACCAACT
AGTTTAACTAACCGATT
ACCCTAACTAACCATCT Séquençage
PCR
…………*** *** *……………

Consensus : TAA[C/G]TAA[G/C]C
Comment déterminer les gènes-cible d'un FT?

2. Rechercher cette signature sur le génome

Chaque TAA[C/G]TAA[G/C]C est un site de fixation pour ce FT ?

Le site peut par exemple être masqué

TAA[C/G]TAA[G/C]C : ¼ x ¼ x ¼ x ½ x ¼ x ¼ x ¼ x ½ x ¼ = 1 chance sur 65536


Combien de possibilités dans le génome humain (3400 Mbases)?
Et puis la main à la pâte …

« Promoteur » Gène rapporteur

Gels retards

DNA
footprinting
Analyse fonctionnelle d’un promoteur de ß-phaseolin

U: upper hypocotyl
C: cotyledon
H: hypocotyl L: lower hypocotyl
P: procambium S: cotyledon surface
R: radicle
I: cotyledon inner regions

NE : no effect

upregulated

downregulated

The Plant Journal, (2003), 33, 853–866


Caractérisation du domaine d’activation

Le double hybride DA2


Proie Y
DA4 DA5
Proie Y Proie Y

DA DA3
Proie Y Proie Y

Appât X
DF
Gène rapporteur

Levure
DF = Domaine de fixation
DA = Domaine d’activation

Vous aimerez peut-être aussi