Vous êtes sur la page 1sur 33

LES DOMAINES PROTEIQUES

Pr.EL AKIL
Domaines protéiques

▪ De point de vue structural:


Un domaine est une unité structurale capable de se replier
indépendamment du reste de la protéine

▪ En biochimie:
les domaines sont fréquemment décrits comme des régions protéiques
dont la fonction a été expérimentalement caractérisée (indépendamment
de la structure).

▪ En génomique comparative:
les domaines sont considérés comme des séquences homologues que l’on
peut rencontrer dans des contextes moléculaires différents

Pr.EL AKIL
D’où

•Un domaine est un fragment de séquence conservé dans une ou


plusieurs familles de protéines.

•Un domaine se replie indépendamment.

•les domaines varient en longueur entre environ 50 acides aminés et


250 acides aminés en longueur

Ex. de banque de domaines: BLOCKS, PROSITE, ProDom

Pr.EL AKIL
Exemple de domaines protéiques
Pr.EL AKIL
Exemple de domaine répété dans plusieurs protéines

Pr.EL AKIL
Représentation des domaines sur les
bases de données

La plupart du temps, les domaines sont représentés par des


séquences consensus.

▪ Pour ProDom database (Bru et al., 2005): la représentation


des domaine se fait par séquence consensus

▪ Pour PROSITE (Hulo et al., 2006), il s’agit d’un motif


représenté sous la forme d’une expression régulière

▪ Pour BLOCKS (Henikoff et Henikoff, 1994) représente ce


consensus à l’aide d’alignements sans trou

Pr.EL AKIL
En général, les domaines se forment de répétitions contiennent
de 30 à 40 résidus qui peuvent prendre une forme particulière, en
particulier solénoïdale

On peut trouver des répétitions plus courtes, mais ont une structure
désordonnée.

➢ Exemple: la sous-unité RPB1 de l'ARN polymérase II, Tyr–Ser–Pro–Thr–


Ser–Pro–Ser, essentiels à l'activité polymérase

Certaines répétitions ordonnées sont courtes comme :

•dans les répétitions de trois résidus du collagène (collagen repeat),


•dans les répétitions pentapeptidiques formant les structures en hélice β.

Pr.EL AKIL
Triple hélice du collagène: tissu conjonctif peau, os cartilage……

Pr.EL AKIL
Repliement protéique secondaire

Hélice alpha

Elle est formée par l'enroulement


régulier sur elle-même d'une chaîne
polypeptidique de forme hélicoïdale
avec un pas de rotation droit dans
laquelle chaque groupe N-H de la
chaine principale d'un acide
aminé forme une liaison
hydrogène avec le groupe C=O de la
chaine principale du quatrième acide
aminé le précédant.
Repliement protéique secondaire
Feuillets β
▪ C’ est la deuxième forme
de structure
secondaire régulière observée
dans les protéines, avec une
fréquence de présence plus
faible que les hélices α

▪ Les feuillets β sont constitués


de brins bêta (brins β) reliés
latéralement par au moins
deux ou trois liaisons
hydrogène entre des atomes
du squelette carboné de la
chaine polypeptidique pour
former un plan plissé.
Repliement protéique secondaire
Hélice β

▪ Formé par l'association de brins β


parallèles disposés de manière hélicoïdale.

▪ Il s'agit d'un type de domaine protéique


en solénoïde. La structure est stabilisée
par des liaisons hydrogène inter-brins

Pr.EL AKIL
Repliement protéique secondaire

Tonneau β

C’ est une structure


protéique constituée d'un
grand feuillet β qui se tord et
s'enroule pour former une structure
quasi-cylindrique fermée par
des liaisons hydrogène.

Les feuillets bêta sont généralement


arrangés de façon antiparallèle, le
premier brin étant lié au dernier par
liaisons hydrogène.
Les domaines protéiques en solénoïdes

Les domaines protéiques en


solénoïdes se présentent sous
deux formes :

•les solénoïdes linéaires, ou ouverts,


plus ou moins hélicoïdaux,

•les solénoïdes circulaires, ou


fermés.

Pr.EL AKIL
Pr.EL AKIL
Solénoïde ouvert
• structure protéique dont les répétitions N- et C-terminales n'entrent pas en
interaction.
• nombre de répétition varie entre 2 à plus de 50

On retrouve ces structures dans :


• les récepteurs membranaires,
• les protéines d'adhérence cellulaire.

Protéines comportant des répétitions contiennent :

• des répétitions riches en leucine (LRR : leucine-rich repeat ), en forme de fer


à cheval,
• des répétitions d'ankyrine (ANK),
• des répétitions armadillo ou tatou (ARM)
• des répétitions HEAT
• des répétitions tétratricopeptide (TRP : tetratricopeptide repea)
• des répétitions cadhérine
Pr.EL AKIL
Solénoïdes circulaires (fermés)

Un solénoïde fermé est une structure protéique dont les répétitions N-


et C-terminales entrent en interaction.
•Ces solénoïdes sont circulaires, en forme de roue.
•Ce nombre varie entre 4 et 75.

Ces répétitions comprennent :

•les répétitions WD40 ou répétition β-transducine


•les motifs Kelch
•les tonneaux β (β barrel)
•le trèfle β (β trefoil fold)

Pr.EL AKIL
Pr.EL AKIL
Qu'est-ce qu’un Motif?

▪ Les motifs décrivent les modèles de pliage des éléments structurels


secondaires et leurs interactions.
▪ Sont des combinaisons de structures secondaires de protéines.
▪ le Motif n'est pas stable par lui-même.
▪ les motifs expliquent la structure d'une protéine mais ne prédisent pas la
fonction d'une protéine
▪ Ces résidus ne sont pas nécessairement consécutifs (ils peuvent même
être très éloignés dans la séquence), mais on s'attend à les trouver assez
proches dans la structure 3D, car ils participent à la même fonction (par
exemple formation d'un site actif).
▪ Un motif ne se replie pas indépendamment

▪ Ex. de banque de motifs: PROSITE

Pr.EL AKIL
Pr.EL AKIL
Pr.EL AKIL
Le motif protéique ZF (doigts de zinc)
▪ Les protéines possédant des motifs de liaison à l’ADN de type doigts de zinc (zinc
finger, ZF) sont connues depuis environ 25 ans.
▪ leur système de reconnaissance de l’ADN est utilisé pour cibler spécifiquement
l’action activatrice ou inhibitrice d’un facteur de transcription, et également pour
réaliser le remplacement spécifique de gènes.
▪ L’utilisation de ces protéines zinc finger (ZFP) pour réaliser la correction de
l’expression défectueuse de certains gènes et pour modifier un gène impliqué dans une
maladie génétique est donc très prometteuse.

Les ZF Cys2His2 : structure et interaction avec l’ADN


▪ Les protéines possédant des domaines ZF sont impliquées dans la régulation de la
transcription de très nombreux gènes.
▪ Il existe différents types de domaines ZF dont celui de type Cys2His2, qui est présent
dans environ 900 facteurs de transcription sur les 2 000 recensés dans le génome
humain

Le motif protéique ZF Cys2His2 est constitué d’environ 30 acides aminés avec une
séquence consensus YF-X-C-X2-5-C-X3-YF-X5-L-X2-H-X3-5-H

Pr.EL AKIL
Pr.EL AKIL
Pr.EL AKIL
Qu'est-ce qu’un domaine?

▪ Le domaine est une unité fondamentale, fonctionnelle et


tridimensionnelle d'une protéine.
▪ Il remplit une fonction particulière.
▪ Une seule protéine peut avoir plusieurs domaines distincts.
▪ Chaque domaine est une unité indépendante.
▪ Il est responsable d'une fonction ou d'une interaction spécifique.
▪ Les domaines peuvent être utilisés pour émettre des hypothèses sur la
fonction d'une protéine non caractérisée.
▪ Lors de l'analyse d'une protéine, il est essentiel d'en tenir compte
puisque les domaines sont les unités fonctionnelles de la protéine.

Pr.EL AKIL
▪ Les domaines sont des structures très
stables et compactes.

▪ Ils peuvent être facilement distingués


des autres régions.

▪ Plusieurs domaines forment


collectivement la structure tertiaire
d'une protéine

Ex: pyruvate kinase a trois domaines


distincts

Pr.EL AKIL
Domaines structuraux et domaines fonctionnels.

▪ Un domaine structural est une partie de la chaîne


polypeptidique qui se replie indépendamment.

▪ Un domaine fonctionnel est une région de la protéine qui


présente une conservation de séquence mise en évidence
par alignement multiple auquel on peut associer une
fonction.

▪ Les deux classifications des domaines fonctionnels et


structuraux coïncident assez souvent.

▪ Les domaines fonctionnels peuvent contenir des motifs (ou


pattern) fonctionnels.
Pr.EL AKIL
Les logiciels de recherche des motifs consensus

▪ Si le motif est défini par une séquence consensus, il existe


des méthodes et logiciels pour rechercher dans une
séquence personnelle la présence de tel ou tel motif.

▪ C'est le cas du logiciel ScanProsite qui permet de


rechercher la présence dans une séquence d'un motif
défini dans la banque PROSITE.

▪ Pour les domaines protéiques définis dans PRODOM, le


logiciel de recherche proposé est Blast.

Pr.EL AKIL
Banque de données Prosite

Prosite consiste en un ensemble d’entrées décrivant les


domaines protéiques et les motifs caractéristiques de fonctions
ou de familles protéiques.

Une entrée Prosite est constituée de deux parties :

• Une fiche décrivant le motif ou le domaine qui a un préfixe PS


(exemple PS50893)

• une fiche qui fournit une description des domaines et des


motifs fonctionnels et renseigne sur la fonction associée au
domaine ou motif. Cette fiche a un préfixe PDOC (exemple :
PDOC00185)
Pr.EL AKIL
Pr.EL AKIL
Pr.EL AKIL
Pr.EL AKIL
Pr.EL AKIL
Exemple de bases de recherche de domaine conservés

• Prosite
• CDART: Conserved Domain Architecture Retrieval
• Base (conserved domaine de NCBI)
• SMART/ recherche de séquence consensus

Pr.EL AKIL

Vous aimerez peut-être aussi