Chapitre 7

Développement de potentiels statistiques pour l'étude in silico de protéines et analyse de
structurations alternatives. Dehouck Yves. Mai 2005.
Chapitre 7
Conclusion générale
L’évolution a sans doute quelque peu facilité la tâche aux scientifiques en concevant
des protéines qui, pour la plupart, se reploient en une structure tertiaire unique
correspondant au minimum global d’énergie libre (situé au fond d’un paysage énergétique
en forme d’entonnoir), et sont fort tolérantes envers les mutations de leur séquences.
L’élucidation des mécanismes qui lient la séquence d’une protéine à sa structure tri-
dimensionnelle et à sa fonction biologique reste pourtant un problème complexe dont la
solution ultime est encore fort éloignée, malgré les multitudes de travaux dévoués à cette
question.
Un aspect crucial du développement de méthodes destinées à l’étude in silico des
protéines concerne la mise au point de fonctions énergétiques permettant d’évaluer
l’adéquation entre une séquence et une structure données. Ces fonctions doivent être suf-
fisamment précises pour reproduire la délicate balance entre d’importantes contributions
enthalpiques (résultant des nombreuses interactions non-covalentes établies et brisées
lors du reploiement ou de structurations alternatives) et entropiques (liées au nombre
considérable de conformations accessibles aux protéines ainsi qu’à l’organisation des
molécules d’eau avoisinantes). Elle doivent également être suffisamment simplifiées pour
permettre la réalisation de simulations et/ou de prédictions en un temps raisonnable.
Malgré qu’ils ne constituent certainement pas une réponse parfaite à ces deux
exigences contradictoires, les potentiels statistiques, dérivés des fréquences d’observation
de petits éléments de séquence et de structure dans des bases de données de structures
protéiques, ont prouvé leur efficacité dans de nombreuses applications liées à l’étude in
silico des protéines. Au cours du Chapitre 2, nous avons cherché à clarifier les fondements
théoriques de la dérivation de ces potentiels et à mettre en évidence les limitations
résultant des diverses hypothèses qui doivent être posées. Nous avons vu que la nature de
ces hypothèses et de leurs impacts sur les fonctions énergétiques mises au point est parfois
assez floue. Il est donc crucial d’approfondir ces aspects de la dérivation des potentiels
de force moyenne, afin d’apporter quelques réponses aux questions légitimes qui peuvent
se poser quant à leur signification physique, mais aussi d’améliorer les performances
obtenues avec de tels potentiels.
C’est dans cet état d’esprit que nous avons abordé, au Chapitre 3, l’analyse de
l’influence de la taille des protéines incluses dans la base de données sur les potentiels qui
en sont dérivés. Plusieurs travaux antérieurs ont évoqué ce sujet, mais leurs conclusions
sont fort contradictoires. Nous avons profité de l’augmentation du nombre de structures
protéiques disponibles pour entreprendre une étude plus détaillée de ce problème. En
214
CHAPITRE 7. CONCLUSION GÉNÉRALE 215
pratique, nous avons défini six bases de données comprenant des protéines de tailles
différentes et dérivé un potentiel de distance à partir de chacune d’entre elles. Ceci
nous a permis de mettre en évidence une dépendance générale des potentiels en la
taille des protéines qui, en moyenne, consiste en une diminution des valeurs absolues
des énergies calculées lorsque la taille de protéines augmente. Outre cette dépendance
générale, il est apparu que l’influence de la taille des protéines se fait également sentir de
manière spécifique à chaque paire d’acides aminés. La répartition inhomogène des résidus
hydrophobes et hydrophiles entre le coeur et la surface des protéines, et le fait que le
rapport surface/volume est plus faible dans de grandes protéines, semblent avoir une
importance prédominante à ce niveau. Nous avons également étudié le comportement
à longue distance des potentiels de distance en fonction de la taille des protéines dont
ils sont dérivés, et mis en évidence un accord qualitatif assez remarquable avec des
travaux théoriques antérieurs concernant les potentiels de force moyenne dans le cadre
de systèmes nettement plus simples que les protéines. Bien que cet accord n’ait a priori
pas d’implications pratiques majeures, il renforce néanmoins la confiance que l’on peut
avoir dans l’adaptation du formalisme issu de systèmes simples au cas des protéines.
Finalement, sur la base de ces divers résultats, nous avons défini des fonctions correctives
qui permettent de prendre en compte la taille des protéines lors de la dérivation
des potentiels, et montré que l’utilisation de ces fonctions correctives résulte en une
amélioration notable de leur pouvoir prédictif.
Le Chapitre 4 décrit la mise au point d’une procédure générale de dérivation
de fonctions énergétiques statistiques basées simultanément sur plusieurs descripteurs
conformationnels. Cette procédure repose sur la décomposition de la fonction énergétique
en une somme de potentiels de base et de termes de couplage. L’avantage de notre
démarche est double. D’une part, la prise en compte simultanée de plusieurs descripteurs
conformationnels permet de gérer efficacement l’interdépendance de ces différents aspects
d’une même structure, et de disposer de potentiels plus spécifiques, qui tiennent compte
des différences d’environnement que peut ressentir un résidu particulier (selon qu’il soit
localisé en surface ou dans le coeur de la protéine, dans une hélice α ou un feuillet
β, . . .). D’autre part, le problème de la taille limitée de la base de données, qui empêche
le calcul d’énergies effectives représentatives pour toutes les combinaisons possibles des
descripteurs de séquence et de structure, est résolu grâce à la décomposition en potentiels
de base et en termes de couplage et à l’application d’une correction individuelle sur
chacun de ces termes. En conséquence, lorsque le nombre d’observations dans la base
de données est suffisant, la fonction énergétique prend en compte les couplages entre
les différents descripteurs. Si ce n’est pas le cas, elle se limite automatiquement aux
contributions plus basiques. La fonction énergétique que nous avons mise au point tient
compte des corrélations existant entre la nature, la conformation et l’accessibilité au
solvant des résidus, en fonction de leur séparation dans l’espace et dans la séquence. Nous
avons montré, à l’aide de plusieurs mesures relevées dans différents ensembles de leurres,
que les performances obtenues sont nettement supérieures à celles des potentiels basiques
communément utilisés ainsi qu’à celles d’autres potentiels décrits dans la littérature (à
un niveau de détail équivalent du point de vue de la représentation des structures).
Nos travaux sur l’influence de la taille des protéines et sur la mise au point de termes
de couplage devrait permettre d’améliorer sensiblement les performances de programmes
destinés à l’étude in silico des protéines, tels que Fugue ou PoPMuSiC (Annexes C et
D). Plusieurs voies susceptibles de mener à l’élaboration de potentiels de force moyenne

présentant un pouvoir prédictif encore meilleur subsistent néanmoins. Ainsi une étude
approfondie de la pertinence du choix d’un état de référence ou d’un autre, ou de l’impact
de l’hypothèse selon laquelle les petits éléments de séquence et de structure suivent
une distribution de Boltzmann au sein des protéines, sont des exemples de travaux
qui devraient permettre une meilleure compréhension des potentiels de force moyenne
dérivés dans le cadre des protéines. D’un point de vue plus pratique, l’adaptation de la
procédure décrite au Chapitre 4 à une représentation plus détaillée (au niveau atomique
par exemple) des protéines induirait probablement une amélioration des performances,
au prix d’un besoin plus important en temps de calcul.
Le décryptage des liens qui unissent les séquences des protéines à leurs structures
tridimensionnelles a gagné à la fois en intérêt et en complexité lorsqu’il s’est avéré que
de multiples protéines peuvent faire preuve d’une grande plasticité conformationnelle, que
ce soit dans le cadre de leur activité biologique normale ou dans des conditions menant au
développement de maladies. En parallèle aux travaux concernant les potentiels de force
moyenne, nous nous sommes également intéressés à l’étude de telles protéines, sujettes à
des réarrangements structuraux.
En particulier, il a été observé que plusieurs protéines existant sous forme mo-
nomérique peuvent également adopter un état oligomérique caractérisé par l’échange
d’un même élément structural entre monomères identiques. Ce phénomène affecte des
protéines de séquences et structures très diverses, et joue probablement un rôle important
au niveau de l’évolution, de la régulation de l’activité biologique des protéines, et du
développement de certaines maladies. Afin de mieux cerner ce processus encore mal
compris, nous avons tenté de mettre en évidence des régions protéiques particulières
qui pourraient revêtir une importance cruciale lors de la transition entre monomères et
oligomères. L’application de deux programmes basés sur des potentiels de force moyenne
(Fugue et PoPMuSiC, voir Annexes C et D) à un ensemble de protéines affectées par
la permutation de domaines nous a permis d’y détecter des (( faiblesses structurales )),
c’est-à-dire des régions qui semblent ne pas être optimales vis-à-vis de la stabilité ou des
mécanismes de reploiement de la protéine. Les résultats présentés au Chapitre 5 montrent
que la plupart de ces faiblesses sont localisées dans des régions critiques par rapport à
la permutation de domaines, notamment au niveau de la boucle charnière, et qu’elles
pourraient jouer un rôle important dans ce processus : en déstabilisant une conformation
par rapport à l’autre, en diminuant la barrière énergétique qui sépare les deux états
et en accélérant ainsi leur interconversion, ou encore en ralentissant le reploiement
et en facilitant ainsi la création de contacts intermoléculaires. Nous avons également
observé la présence de nombreuses interactions de type cation-π dans les régions clés
de la permutation de domaines. Ces interactions favorables et spécifiques semblent donc
également être impliquées dans ce processus. Il reste néanmoins difficile d’établir avec
certitude et précision le rôle joué par les faiblesses structurales et les interactions de
type cation-π dans la permutation de domaines. Afin de valider, ou de raffiner, les
hypothèses que nous avons émises à ce sujet, nous avons sélectionné plusieurs mutations
susceptibles d’avoir un impact notable sur la propension des protéines à permuter. Une
étude expérimentale de l’effet de ces mutations sur la permutation de domaines devrait
se révéler riche d’intérêt et permettre de mieux comprendre les mécanismes qui régissent
ce phénomène dont les implications sont multiples.
L’α1 -antitrypsine est un autre exemple de protéine sujette à d’importantes mo-

difications structurales. Comme plusieurs autres protéines de la famille à laquelle
elle appartient, l’α1 -antitrypsine accomplit sa fonction biologique d’inhibiteur grâce
à l’insertion de la boucle qui contient son site actif dans un de ses feuillets β.
Malheureusement, sous certaines conditions, cette propriété particulière peut avoir des
conséquences assez désastreuses : la formation de polymères insolubles caractérisés par
l’insertion de la boucle d’une protéine dans le feuillet β de la suivante, qui est à l’origine
de diverses maladies. Les travaux décrits au Chapitre 6 ont été réalisés dans le but de
concevoir rationnellement des mutations ponctuelles dans la séquence de l’α1 -antitrypsine
afin de contrôler sa propension à polymériser. Pour ce faire, nous avons sélectionné, à
l’aide du programme PoPMuSiC (voir Annexe D), des mutations qui stabilisent la forme
active de cette protéine et déstabilisent simultanément la forme insérée, ou inversément.
L’étude expérimentale des propriétés de cinq parmi ces protéines mutantes, réalisée par
le groupe du Professeur S.P. Bottomley, a permis de valider nos prédictions de manière
assez remarquable : quatre mutations sur cinq ont l’influence prévue sur le comportement
de l’α1 -antitrypsine vis-à-vis de la polymérisation.
En conclusion, nous avons montré que l’analyse détaillée des hypothèses sous-jacentes
à la dérivation des potentiels de force moyenne dans le cadre des protéines permet d’y
apporter certaines améliorations, et d’augmenter sensiblement leur pouvoir prédictif. En
outre, la mise en oeuvre de méthodes qui reposent sur de telles fonctions énergétiques
simplifiées peut se révéler fort utile pour l’étude de protéines qui adoptent des structures
alternatives. En particulier, nos résultats suggèrent une importance cruciale des régions
protéiques qui ne semblent pas optimales en regard de la stabilité ou du processus
de reploiement, et constituent donc en quelque sorte des (( défauts )) vis-à-vis de
l’image, intéressante mais sans doute trop simpliste, de protéines dont les paysages
énergétiques ressemblent à des entonnoirs parfaits. Il est indispensable de poursuivre
la quête d’une meilleure compréhension de la nature et du rôle de ces régions protéiques
particulières. Au-delà de l’apport à la connaissance fondamentale, de nombreuses
applications pratiques en dépendent, notamment dans le domaine pharmaceutique. A
cette fin, une approche intégrant prédictions et validations expérimentales devrait se
révéler particulièrement fructueuse. Une possibilité que nous avons exploré, et dont
nous avons démontré l’intérêt, est incarnée par la conception rationnelle de protéines
mutantes supposées présenter des propriétés modifiées et par l’étude expérimentale de
leurs caractéristiques.

Chapitre 7

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Chapitre 7

Transféré par

Droits d'auteur :

Formats disponibles

Développement de potentiels statistiques pour l'étude in silico de protéines et analyse de

structurations alternatives. Dehouck Yves. Mai 2005.

D). Plusieurs voies susceptibles de mener à l’élaboration de potentiels de force moyenne

L’α1 -antitrypsine est un autre exemple de protéine sujette à d’importantes mo-

Vous aimerez peut-être aussi