Vous êtes sur la page 1sur 4

Développement de potentiels statistiques pour l'étude in silico de protéines et analyse de

structurations alternatives. Dehouck Yves. Mai 2005.

Chapitre 7

Conclusion générale

L’évolution a sans doute quelque peu facilité la tâche aux scientifiques en concevant
des protéines qui, pour la plupart, se reploient en une structure tertiaire unique
correspondant au minimum global d’énergie libre (situé au fond d’un paysage énergétique
en forme d’entonnoir), et sont fort tolérantes envers les mutations de leur séquences.
L’élucidation des mécanismes qui lient la séquence d’une protéine à sa structure tri-
dimensionnelle et à sa fonction biologique reste pourtant un problème complexe dont la
solution ultime est encore fort éloignée, malgré les multitudes de travaux dévoués à cette
question.
Un aspect crucial du développement de méthodes destinées à l’étude in silico des
protéines concerne la mise au point de fonctions énergétiques permettant d’évaluer
l’adéquation entre une séquence et une structure données. Ces fonctions doivent être suf-
fisamment précises pour reproduire la délicate balance entre d’importantes contributions
enthalpiques (résultant des nombreuses interactions non-covalentes établies et brisées
lors du reploiement ou de structurations alternatives) et entropiques (liées au nombre
considérable de conformations accessibles aux protéines ainsi qu’à l’organisation des
molécules d’eau avoisinantes). Elle doivent également être suffisamment simplifiées pour
permettre la réalisation de simulations et/ou de prédictions en un temps raisonnable.
Malgré qu’ils ne constituent certainement pas une réponse parfaite à ces deux
exigences contradictoires, les potentiels statistiques, dérivés des fréquences d’observation
de petits éléments de séquence et de structure dans des bases de données de structures
protéiques, ont prouvé leur efficacité dans de nombreuses applications liées à l’étude in
silico des protéines. Au cours du Chapitre 2, nous avons cherché à clarifier les fondements
théoriques de la dérivation de ces potentiels et à mettre en évidence les limitations
résultant des diverses hypothèses qui doivent être posées. Nous avons vu que la nature de
ces hypothèses et de leurs impacts sur les fonctions énergétiques mises au point est parfois
assez floue. Il est donc crucial d’approfondir ces aspects de la dérivation des potentiels
de force moyenne, afin d’apporter quelques réponses aux questions légitimes qui peuvent
se poser quant à leur signification physique, mais aussi d’améliorer les performances
obtenues avec de tels potentiels.
C’est dans cet état d’esprit que nous avons abordé, au Chapitre 3, l’analyse de
l’influence de la taille des protéines incluses dans la base de données sur les potentiels qui
en sont dérivés. Plusieurs travaux antérieurs ont évoqué ce sujet, mais leurs conclusions
sont fort contradictoires. Nous avons profité de l’augmentation du nombre de structures
protéiques disponibles pour entreprendre une étude plus détaillée de ce problème. En

214
CHAPITRE 7. CONCLUSION GÉNÉRALE 215

pratique, nous avons défini six bases de données comprenant des protéines de tailles
différentes et dérivé un potentiel de distance à partir de chacune d’entre elles. Ceci
nous a permis de mettre en évidence une dépendance générale des potentiels en la
taille des protéines qui, en moyenne, consiste en une diminution des valeurs absolues
des énergies calculées lorsque la taille de protéines augmente. Outre cette dépendance
générale, il est apparu que l’influence de la taille des protéines se fait également sentir de
manière spécifique à chaque paire d’acides aminés. La répartition inhomogène des résidus
hydrophobes et hydrophiles entre le coeur et la surface des protéines, et le fait que le
rapport surface/volume est plus faible dans de grandes protéines, semblent avoir une
importance prédominante à ce niveau. Nous avons également étudié le comportement
à longue distance des potentiels de distance en fonction de la taille des protéines dont
ils sont dérivés, et mis en évidence un accord qualitatif assez remarquable avec des
travaux théoriques antérieurs concernant les potentiels de force moyenne dans le cadre
de systèmes nettement plus simples que les protéines. Bien que cet accord n’ait a priori
pas d’implications pratiques majeures, il renforce néanmoins la confiance que l’on peut
avoir dans l’adaptation du formalisme issu de systèmes simples au cas des protéines.
Finalement, sur la base de ces divers résultats, nous avons défini des fonctions correctives
qui permettent de prendre en compte la taille des protéines lors de la dérivation
des potentiels, et montré que l’utilisation de ces fonctions correctives résulte en une
amélioration notable de leur pouvoir prédictif.
Le Chapitre 4 décrit la mise au point d’une procédure générale de dérivation
de fonctions énergétiques statistiques basées simultanément sur plusieurs descripteurs
conformationnels. Cette procédure repose sur la décomposition de la fonction énergétique
en une somme de potentiels de base et de termes de couplage. L’avantage de notre
démarche est double. D’une part, la prise en compte simultanée de plusieurs descripteurs
conformationnels permet de gérer efficacement l’interdépendance de ces différents aspects
d’une même structure, et de disposer de potentiels plus spécifiques, qui tiennent compte
des différences d’environnement que peut ressentir un résidu particulier (selon qu’il soit
localisé en surface ou dans le coeur de la protéine, dans une hélice α ou un feuillet
β, . . .). D’autre part, le problème de la taille limitée de la base de données, qui empêche
le calcul d’énergies effectives représentatives pour toutes les combinaisons possibles des
descripteurs de séquence et de structure, est résolu grâce à la décomposition en potentiels
de base et en termes de couplage et à l’application d’une correction individuelle sur
chacun de ces termes. En conséquence, lorsque le nombre d’observations dans la base
de données est suffisant, la fonction énergétique prend en compte les couplages entre
les différents descripteurs. Si ce n’est pas le cas, elle se limite automatiquement aux
contributions plus basiques. La fonction énergétique que nous avons mise au point tient
compte des corrélations existant entre la nature, la conformation et l’accessibilité au
solvant des résidus, en fonction de leur séparation dans l’espace et dans la séquence. Nous
avons montré, à l’aide de plusieurs mesures relevées dans différents ensembles de leurres,
que les performances obtenues sont nettement supérieures à celles des potentiels basiques
communément utilisés ainsi qu’à celles d’autres potentiels décrits dans la littérature (à
un niveau de détail équivalent du point de vue de la représentation des structures).
Nos travaux sur l’influence de la taille des protéines et sur la mise au point de termes
de couplage devrait permettre d’améliorer sensiblement les performances de programmes
destinés à l’étude in silico des protéines, tels que Fugue ou PoPMuSiC (Annexes C et
CHAPITRE 7. CONCLUSION GÉNÉRALE 216

D). Plusieurs voies susceptibles de mener à l’élaboration de potentiels de force moyenne


présentant un pouvoir prédictif encore meilleur subsistent néanmoins. Ainsi une étude
approfondie de la pertinence du choix d’un état de référence ou d’un autre, ou de l’impact
de l’hypothèse selon laquelle les petits éléments de séquence et de structure suivent
une distribution de Boltzmann au sein des protéines, sont des exemples de travaux
qui devraient permettre une meilleure compréhension des potentiels de force moyenne
dérivés dans le cadre des protéines. D’un point de vue plus pratique, l’adaptation de la
procédure décrite au Chapitre 4 à une représentation plus détaillée (au niveau atomique
par exemple) des protéines induirait probablement une amélioration des performances,
au prix d’un besoin plus important en temps de calcul.
Le décryptage des liens qui unissent les séquences des protéines à leurs structures
tridimensionnelles a gagné à la fois en intérêt et en complexité lorsqu’il s’est avéré que
de multiples protéines peuvent faire preuve d’une grande plasticité conformationnelle, que
ce soit dans le cadre de leur activité biologique normale ou dans des conditions menant au
développement de maladies. En parallèle aux travaux concernant les potentiels de force
moyenne, nous nous sommes également intéressés à l’étude de telles protéines, sujettes à
des réarrangements structuraux.
En particulier, il a été observé que plusieurs protéines existant sous forme mo-
nomérique peuvent également adopter un état oligomérique caractérisé par l’échange
d’un même élément structural entre monomères identiques. Ce phénomène affecte des
protéines de séquences et structures très diverses, et joue probablement un rôle important
au niveau de l’évolution, de la régulation de l’activité biologique des protéines, et du
développement de certaines maladies. Afin de mieux cerner ce processus encore mal
compris, nous avons tenté de mettre en évidence des régions protéiques particulières
qui pourraient revêtir une importance cruciale lors de la transition entre monomères et
oligomères. L’application de deux programmes basés sur des potentiels de force moyenne
(Fugue et PoPMuSiC, voir Annexes C et D) à un ensemble de protéines affectées par
la permutation de domaines nous a permis d’y détecter des (( faiblesses structurales )),
c’est-à-dire des régions qui semblent ne pas être optimales vis-à-vis de la stabilité ou des
mécanismes de reploiement de la protéine. Les résultats présentés au Chapitre 5 montrent
que la plupart de ces faiblesses sont localisées dans des régions critiques par rapport à
la permutation de domaines, notamment au niveau de la boucle charnière, et qu’elles
pourraient jouer un rôle important dans ce processus : en déstabilisant une conformation
par rapport à l’autre, en diminuant la barrière énergétique qui sépare les deux états
et en accélérant ainsi leur interconversion, ou encore en ralentissant le reploiement
et en facilitant ainsi la création de contacts intermoléculaires. Nous avons également
observé la présence de nombreuses interactions de type cation-π dans les régions clés
de la permutation de domaines. Ces interactions favorables et spécifiques semblent donc
également être impliquées dans ce processus. Il reste néanmoins difficile d’établir avec
certitude et précision le rôle joué par les faiblesses structurales et les interactions de
type cation-π dans la permutation de domaines. Afin de valider, ou de raffiner, les
hypothèses que nous avons émises à ce sujet, nous avons sélectionné plusieurs mutations
susceptibles d’avoir un impact notable sur la propension des protéines à permuter. Une
étude expérimentale de l’effet de ces mutations sur la permutation de domaines devrait
se révéler riche d’intérêt et permettre de mieux comprendre les mécanismes qui régissent
ce phénomène dont les implications sont multiples.
CHAPITRE 7. CONCLUSION GÉNÉRALE 217

L’α1 -antitrypsine est un autre exemple de protéine sujette à d’importantes mo-


difications structurales. Comme plusieurs autres protéines de la famille à laquelle
elle appartient, l’α1 -antitrypsine accomplit sa fonction biologique d’inhibiteur grâce
à l’insertion de la boucle qui contient son site actif dans un de ses feuillets β.
Malheureusement, sous certaines conditions, cette propriété particulière peut avoir des
conséquences assez désastreuses : la formation de polymères insolubles caractérisés par
l’insertion de la boucle d’une protéine dans le feuillet β de la suivante, qui est à l’origine
de diverses maladies. Les travaux décrits au Chapitre 6 ont été réalisés dans le but de
concevoir rationnellement des mutations ponctuelles dans la séquence de l’α1 -antitrypsine
afin de contrôler sa propension à polymériser. Pour ce faire, nous avons sélectionné, à
l’aide du programme PoPMuSiC (voir Annexe D), des mutations qui stabilisent la forme
active de cette protéine et déstabilisent simultanément la forme insérée, ou inversément.
L’étude expérimentale des propriétés de cinq parmi ces protéines mutantes, réalisée par
le groupe du Professeur S.P. Bottomley, a permis de valider nos prédictions de manière
assez remarquable : quatre mutations sur cinq ont l’influence prévue sur le comportement
de l’α1 -antitrypsine vis-à-vis de la polymérisation.
En conclusion, nous avons montré que l’analyse détaillée des hypothèses sous-jacentes
à la dérivation des potentiels de force moyenne dans le cadre des protéines permet d’y
apporter certaines améliorations, et d’augmenter sensiblement leur pouvoir prédictif. En
outre, la mise en oeuvre de méthodes qui reposent sur de telles fonctions énergétiques
simplifiées peut se révéler fort utile pour l’étude de protéines qui adoptent des structures
alternatives. En particulier, nos résultats suggèrent une importance cruciale des régions
protéiques qui ne semblent pas optimales en regard de la stabilité ou du processus
de reploiement, et constituent donc en quelque sorte des (( défauts )) vis-à-vis de
l’image, intéressante mais sans doute trop simpliste, de protéines dont les paysages
énergétiques ressemblent à des entonnoirs parfaits. Il est indispensable de poursuivre
la quête d’une meilleure compréhension de la nature et du rôle de ces régions protéiques
particulières. Au-delà de l’apport à la connaissance fondamentale, de nombreuses
applications pratiques en dépendent, notamment dans le domaine pharmaceutique. A
cette fin, une approche intégrant prédictions et validations expérimentales devrait se
révéler particulièrement fructueuse. Une possibilité que nous avons exploré, et dont
nous avons démontré l’intérêt, est incarnée par la conception rationnelle de protéines
mutantes supposées présenter des propriétés modifiées et par l’étude expérimentale de
leurs caractéristiques.

Vous aimerez peut-être aussi