Académique Documents
Professionnel Documents
Culture Documents
INTRODUCTION
Parmi les protéines distinctes codées par le protéome humain, on a estimé que seulement 3
000 environ appartiennent à des familles structurelles pour lesquelles des molécules de petite
molécule (c'est-à-dire organiques synthétiques) ont été développées1. Preuve empirique de
principe qu'ils peuvent être inhibés par de petites molécules drogues. Par conséquent, des
approches permettant d'évaluer l'aptitude à la drogue de cibles potentielles de médicament -
c'est-à-dire la probabilité de pouvoir identifier un petit ligand pharmacologique qui peut
moduler l'activité de la cible - sont apparues comme un outil important pour la découverte de
médicaments ciblés. Nous notons que dans le présent article, nous appelons un petit composé
«analogue à un médicament» s'il satisfait la règle de cinq de Lipinski (pas plus de 5 donneurs
de liaison hydrogène, pas plus de 10 accepteurs de liaison hydrogène, une masse moléculaire
inférieure à 500 g / Un coefficient de partage octanol-eau non supérieur à 5) 2. Il existe deux
approches majeures pour déterminer l'aptitude à l'emploi d'une protéine. L'une repose sur une
analyse empirique des associations cible / médicament connues 1, 3, 4 qui ne peut être
appliquée que lorsque la protéine en question appartient à une famille bien étudiée qui
comprend des homologues proches pour lesquels des informations fiables sur la drogue sont
disponibles. L'autre est basée uniquement sur l'analyse de la structure de la protéine cible5-17.
Pour les nouvelles cibles, pour les familles pour lesquelles on ne connaît pas de médicaments
ou de candidats médicaments avancés, il faut s'appuyer sur cette dernière méthode de modèles
prédictifs basés sur la structure. Cette approche a été mise au point par Hajduk et al. 7, qui ont
réexaminé les résultats du criblage de fragments à base de RMN pour un ensemble diversifié
de 23 protéines et ont observé une corrélation élevée entre le taux de succès des fragments et
la capacité d'identifier une affinité élevée ( KD <300 nM). Ils ont utilisé ces données pour
dériver un modèle basé sur la régression pour prédire le taux probable de succès des
fragments pour les cibles non testées, basé sur les propriétés structurales du site de liaison des
protéines telles que la surface totale et apolaire et la compacité de la poche, "Définie comme
le logarithme du taux de succès de RMN prédit. La formule de régression fournissait une
bonne approximation des taux de succès initiaux et, comme nous le verrons, a donné lieu à
une prédiction assez exacte de la possibilité de fraude. Une autre contribution importante est
venue de Cheng et coll. 8, qui ont utilisé la courbure et la surface lipophile des poches pour
prédire l'affinité maximale pouvant être obtenue par des médicaments passivement absorbés.
Malgré sa simplicité, le modèle a également fourni une bonne discrimination des sites de
liaison druggable de ceux étiquetés comme difficiles ou non transférables, mais n'a été testé
que sur un nombre limité de protéines.
Afin d'améliorer encore la prédiction de l'exploitabilité, une variété de méthodes ont été
publiées au cours des six dernières années, la plupart d'entre eux formés sur le nombre
croissant de protéines cibles avec un certain niveau de drogue informations disponibles. 5, 10,
12, 14, 16 Pour la validation de la méthode, Schmidtke et Barril ont compilé un grand nombre
de cibles protéiques avec des degrés associés de drogue. 11 Krasowski et al.12 ont ajouté
d'autres protéines à l'ensemble d'entraînement et développé le score Drugugg. Toutes ces
méthodes sont basées sur l'analyse de diverses propriétés de poche, y compris
l'hydrophobicité, la taille, la compacité, les surfaces de donneur et d'accepteur de liaison
hydrogène et la composition d'aminoacides dans les poches. Ainsi, l'évaluation de l'aptitude à
l'administration de protéines par rapport aux composés classiques de médicament est
maintenant une technologie mature qui peut effectuer ces évaluations avec une certaine
fiabilité. Cependant, cette technologie présente des limites considérables. Hajduk et al. 7,
toutes les méthodes corrélent les propriétés de poche avec les données d'aptitude à l'emploi
disponibles pour les cibles traditionnelles et, par conséquent, essaient simplement d'évaluer si
la nouvelle cible en question contient une poche liante qui ressemble en quelque sorte à des
poches sur Des cibles druggables connues qui lient des ligands conventionnels de type
médicament. De plus, les méthodes fournissent une échelle unique de manipulation qui tente
de capturer à la fois l'affinité attendue qui peut être obtenue, ainsi que la similitude de
médicament - et implicitement, le potentiel de biovalabilité orale - des ligands qui se lieront
potentiellement au site. Un défaut général de toutes ces méthodes est donc qu'elles sont mal
équipées pour évaluer l'aptitude à l'emploi de protéines avec des topologies de surface qui
diffèrent sensiblement du nombre relativement faible de familles de protéines pour lesquelles
existent des médicaments ou des ligands semblables à des médicaments à haute affinité,
Protéine (IPP), ou pour évaluer le potentiel de n'importe quelle cible pour lier des ligands qui
ne sont pas conformes aux définitions classiques de la similarité de médicament. En outre,
comme ces méthodes sont paramétrées plutôt que basées sur des principes biophysiques et ne
renvoient qu'une mesure monolithique de l'aptitude à la manipulation, elles fournissent peu
d'indications sur la raison pour laquelle une cible particulière est ou non exploitable et donc
sur la possibilité d'une liaison forte Par un chimiotide de médicament non traditionnel choisi
de manière appropriée tel qu'un produit naturel, un composé macrocyclique, 18-21 un
inhibiteur covalent, 22-24 ou un pluriel dérivé de peptide.25-28
Il est en outre remarquable que parmi les méthodes ci-dessus, Seo et al.9 tiennent
explicitement compte du potentiel de flexibilité conformationnelle de la protéine pour affecter
l'aptitude à la drogue d'un site de liaison. Les autres méthodes basent leur analyse sur des
structures cristallines à rayons X statiques. Plusieurs des études ont toutefois testé la
robustesse de leurs résultats sur les variations de conformation des protéines en comparant les
résultats obtenus après perturbation computationnelle de la structure10 ou en comparant les
résultats obtenus pour différentes structures cristallines de la même protéine cible5,8,11 , 12
et généralement rapporté que la capacité à identifier les sites droguables n'était pas très
sensible aux effets conformationnels. Cependant, d'autres travaux ont suggéré que
l'adaptabilité conformationnelle au site de liaison peut affecter substantiellement la capacité
de production, dans les cas où les conformations alternatives qui sont échantillonnées par des
mouvements thermiques persistent pendant une période de temps suffisante.29
Dans cette perspective, nous discutons d'abord les avantages de l'approche de filtrage de
fragments utilisée par Hajduk et al. 7 et introduisons un analogue de la méthode qui utilise un
algorithme de calcul plutôt que des données RMN expérimentales pour le criblage de
fragments. L'approche computationnelle a été utilisée pour évaluer certains des résultats
«historiques» de la drogue publiés au cours de la dernière décennie, y compris les 23
protéines considérées dans l'étude de dépistage par RMN 6,7 et l'ensemble additionnel de 72
protéines précédemment étudiées par le modèle de régression, Sur la base des résultats de la
RMN et développés par les mêmes auteurs.7 Nous avons également étudié l'ensemble de
protéines choisi par Cheng et al. 8 et certains des résultats les plus controversés de
l'algorithme DrugPred de Krasowski et coll.12 Comme on le verra, Peut reproduire de
manière fiable des résultats de manipulation antérieurs. En outre, l'évaluation du petit nombre
de cas dans lesquels l'évaluation initiale était incertaine ou a été ultérieurement prouvée
incorrecte montre que la méthode présentée ici peut en fait fournir une évaluation encore plus
significative de la droguabilité. Nous montrons en outre que les approches computationnelles
basées sur la biophysique (par opposition aux approches empiriques qui sont paramétrées par
rapport à un ensemble d'entraînement de complexes protéine-ligand) sont maintenant
suffisamment fiables pour pouvoir traiter le potentiel de cibles médicamenteuses hautement
stimulantes ou atypiques Comme des interfaces protéine-protéine, à traiter en utilisant des
chimiotides non canoniques tels que des macrocycles synthétiques. Ces méthodes indiquent
donc la voie à l'élargissement de la gamme de cibles médicamenteuses qui peuvent être
abordées, en utilisant des chimiotides qui sont connus pour être pharmaceutiquement
pertinents mais qui tombent en dehors de l'espace chimique traditionnel semblable à un
médicament. Nous fournissons également des discussions détaillées sur la possibilité
d'atteindre six cibles d'intérêt pharmaceutique élevé pour lesquelles les perspectives de succès
ont été controversées.
Analyse expérimentale de l'aptitude à la manipulation
Comme nous l'avons déjà mentionné, Hajduk et ses collègues 7 ont révisé les résultats des
expériences de criblage de fragments à base de résonance magnétique nucléaire et ont observé
une forte corrélation entre le taux de succès des fragments et le taux de succès des fragments
Pouvoir identifier des inhibiteurs de la drogue de haute affinité. Cette première méthode
présente deux avantages majeurs Sur des approches plus récentes. Tout d'abord, en
déterminant les emplacements de liaison des composés de taille de fragment, la méthode
basée sur le criblage identifie automatiquement le site de liaison. En revanche, les méthodes
de prédiction décrites dans l'introduction sont basées sur l'analyse des propriétés de poche,
principalement la taille, la forme, la complexité et l'hydrophobie, et ont donc d'abord
sélectionner les résidus du site de liaison. Comme l'ont remarqué Rarey et ses collègues, 17
descripteurs de poche dépendent fortement de la sélection correcte de la région de la surface
de la protéine qui est le plus susceptible de former un site de liaison. Ce
Est une tâche non triviale pour une protéine sans ligand, et est également compliquée par des
différences de conformation potentielles entre des structures liées au ligand et sans ligand.
Deuxièmement, comme le savaient Hajduk et al.7, leur méthode identifie effectivement les
points chauds de liaison, c'est-à-dire les régions du site de liaison qui contribuent à une
quantité disproportionnée de l'énergie libre de liaison 30,31 et sont donc principalement
responsables de la liaison du ligand, Contrairement à d'autres méthodes qui fondent leurs
prédictions sur les propriétés de poche globa sans tenir compte de la mesure dans laquelle les
sites dans la poche peuvent contribuer une énergie de liaison significative.
(1) Druggable. Un site de liaison est catégorisé comme «Druggable» par rapport aux
composés classiques, semblables à des médicaments (par ex. Règle 5) s'il remplit les critères
suivants: (a) Il comprend un point chaud primaire primaire avec au moins 16 groupes de
sondes, S ≥ 16. (b) Un ou plusieurs points chauds secondaires sont connectés au point chaud
primaire avec une distance de centre à centre (CD) <8 Å. (C) La dimension maximale (MD)
du groupe de points chauds connectés est d'au moins 10 Å, c'est-à-dire MD ≥ 10 Å (Tableau
1).
(2) Pas druggable. Si le point chaud primaire est très faible (S <13), ou si l'ensemble du point
chaud est très petit (MD <7 Å), un site n'est pas exploitable indépendamment des composés
utilisés.
(3) Non canoniquement Druggable - Grand. Si un nombre suffisant de points chauds
suffisamment puissants est présent (S ≥ 16) mais que l'ensemble du point chaud est trop
clairsemé, nécessitant une distance centre à centre supérieure à 8 Å pour atteindre un point
chaud secondaire à partir du primaire, Les composés ne peuvent pas se lier avec une affinité
suffisante. Cependant, la preuve indique que de tels sites peuvent généralement se lier
fortement à des composés plus importants mais encore pharmaceutiquement pertinents tels
que des macrocycles61, 62 ou des peptidomimétiques 35. Comme on le verra, un sous-
ensemble de points chauds peut satisfaire la Conditions CD <8 Å, S ≥ 16 et MD ≥ 10 Å, mais
il existe des points chauds forts supplémentaires au-delà de l'ensemble. Dans de tels cas, la
cible peut être manipulée en utilisant des molécules analogues à des médicaments, mais il est
possible que l'affinité de liaison soit améliorée si la taille des composés est augmentée pour
atteindre tous les points chauds, bien que cela nécessite probablement l'utilisation de
composés importants En dehors de l'espace chimique conventionnel.
(4) Non-canoniquement Druggable - Petit. Une autre classe de sites est rencontrée lorsque
l'ensemble du point chaud est petit, mais pas très petit (7 Å ≤ MD <10 Å). De tels sites
peuvent être exploitables en utilisant des ligands avec un groupe chargé qui n'est pas
totalement désolvaté lors de la liaison. En variante, l'aptitude à la drogue peut être obtenue par
des composés importants et donc non analogues à des médicaments (peptides, 65
peptidomimétiques, 64 ou macrocycles61) qui s'étendent au-delà du petit ensemble de points
chauds pour interagir avec de grandes régions superficielles sans point chaud fort. Comme il
sera démontré, alors que de telles interactions sont faibles, ils contribuent encore à l'énergie
libre de liaison.
Il est important de noter que la droguabilité n'est pas une propriété on-off. En particulier, pour
les catégories (1), (3) et (4), un site où le point chaud primaire est un peu plus faible que le
seuil (S ≤ 13 <16), nous utilisons le terme «borderline» druggable (Tableau 1). Pour de tels
sites, on peut trouver des ligands qui se lient à une affinité micromolaire, mais les tentatives
pour augmenter la puissance échouent habituellement. Plus généralement, les points forts et
l'agencement des points chauds fournissent des informations au-delà des quatre catégories ci-
dessus. A titre d'exemple, nous discutons ici de l'analyse de l'aptitude à l'emploi pour la
FKBP, qui se lie à la 8-éthyl-8- [but-3-ényl] -ascomycine (FK506), un composé
macrocyclique de poids moléculaire ) De 804 g / mol (figure 1A) 66. Plus tard, nous
étudierons également l'ABT737, un régulateur bien connu de l'apopotose en inhibant
l'interaction entre la protéine Bcl-xL et le peptide BAK (figure 1B) 67. Résultats de la
cartographie d'une structure sans ligand de FKBP (PDB ID 2ppn). Comme mentionné, chaque
point chaud est identifié par un groupe consensus (CC). Dans toutes nos figures, chaque sonde
contenue dans un CC est représentée par la structure de la sonde d'énergie la plus basse pour
éviter la surpopulation de la figure. Toutes les sondes dans un CC ont la même couleur, en
utilisant le code de couleur comme suit: CC1 cyan, CC2 magenta, CC3 jaune, CC4 salmon,
CC5 blanc, CC6 bleu, CC7 orange et CC8 vert. La figure 1C montre également
l'emplacement de la FK506 liée (prise à partir de la structure 1fkj) superposée pour référence.
Le site de liaison au ligand contient trois points chauds connectés. Il s'agissait du point chaud
le plus élevé, CC1, qui contenait 18 clusters de sonde, plus deux CC secondaires, CC3 (14
clusters de sonde) et CC6 (7 clusters de sonde). La distance de centre à centre (CD) entre CC1
et CC3 est de 6,3 Å, et la dimension maximale de l'ensemble avec les deux points chauds est
de 10,6 Å. Ainsi, selon notre condition, le site serait druggable en utilisant un médicament qui
se lie seulement à ces deux points chauds. Cependant, étant donné que CC1 n'est pas
beaucoup plus fort que le S = 16 requis, et que la valeur MD est proche du seuil requis de 10
Â, l'affinité serait modérée. Puisque la distance du CD entre CC1 et CC6 est de 7,2 Å, CC6
peut également être ajouté à l'exemple de point chaud utilisé pour la liaison. L'ajout du
troisième point chaud CC6 (7 clusters de sonde) augmente la MD à 12,3 Å. Selon le tableau 1,
les trois points chauds de cet ensemble étendu peuvent toujours être atteints en utilisant des
composés de type médicament. En fait, la FKBP a été co-cristallisée avec des inhibiteurs plus
petits mais encore puissants.
Les inhibiteurs qui atteignent les trois points chauds sont assez longs et relient le récepteur à
l'air. Les inhibiteurs qui atteignent les trois points chauds sont assez longs et relient l'extrémité
PDB ID 1fkh (MW = 453, Ki = 7 nM), 68 et PDB ID 1f40 (PM = 360,5, Ki = 7,5 nM) Deux
extrémités lointaines en formant un macrocycle dans FK506 améliore l'affinité pour Ki = 0,2
nM.66 Cet exemple démontre également que, si l'analyse de l'aptitude à la manipulation peut
être simplifiée en intégrant les trois exigences différentes dans une mesure unique
d'ergonomie, Montrent plus explicitement les problèmes qui peuvent conduire à l'absence de
droguabilité, ainsi que d'explorer les possibilités d'utiliser des composés non canoniques
comme médicaments.
Si plusieurs structures d'une cible sont disponibles, une question importante est la structure à
utiliser pour l'analyse. Souvent, il faut établir l'aptitude à la drogue avant de découvrir un
ligand, ce qui motive la préférence pour les structures non liées. Si plusieurs structures non
liées sont disponibles, il est utile de cartographier tous, et considérer celui qui entraîne le plus
haut niveau de druggability, en supposant que les ligands peuvent être optimisés pour tirer
parti des points chauds disponibles. Bien que la liaison au ligand puisse affecter leur
localisation et leur force relative, 70,71 points chauds sont généralement moins sensibles aux
changements conformationnels que les sites de liaison 48, et l'analyse des structures exemptes
de ligand fournit une évaluation valide pour la plupart des cibles. Cependant, les sites de
liaison dans les structures non ligaturées de certaines protéines peuvent être complètement
fermés, ou la liaison de ligand peut créer de nouveaux points chauds, et il est donc
généralement conseillé de cartographier également des structures liées au ligand lorsqu'elles
deviennent disponibles dans le processus de découverte de médicament. Cette information
supplémentaire montre fréquemment s'il existe un choix entre un ligand important et donc non
médicamenteux qui atteint tous les principaux points chauds, ou un ligand plus petit et moins
puissant, qui peut tirer profit du seul point chaud principal et d'un ligand plus faible Taches
autour de lui.