Vous êtes sur la page 1sur 4

INF8000 - Resume d’article

INF8000

Adekoudjo Ade-Dayo Nassir

ADEA04089904

Recommande par: Vladimir Reinharz

Mars 2023
1 Résumé
La formation de complexes stables entre protéines est cruciale pour de nombreux processus biologiques
et a été étudiée à travers de nombreuses expériences. L’énorme quantité d’informations sur ces interac-
tions, contenue dans l’interactome structurel des protéines de la Protein Data Bank, peut désormais être
exploitée grâce à ARCTIC-3D, un logiciel convivial d’exploration et de regroupement de données.

Ce logiciel facilite la récupération et la rationalisation des informations sur les interfaces associées aux pro-
téines, illustré par divers exemples. Dans le contexte de la modélisation des assemblages biomoléculaires,
il introduit le concept d’"entropie de reconnaissance", lié à la capacité d’interaction entre les protéines
et les interfaces, qui est corrélée avec la difficulté de modélisation dans les approches d’amarrage classiques.

Les groupes d’interfaces identifiés peuvent être utilisés pour générer diverses combinaisons de contraintes
spécifiques aux interfaces pour la modélisation intégrative. ARCTIC-3D est disponible gratuitement sur
GitHub et en tant que service web.

Les interactions protéines-protéines sont nécessaires en biologie car impliqués dans dans bon nombre de
processus cellulaires.L’interface d’un complexe protéine-protéine est cruciale, définie comme les acides
aminés de chaque protéine à une distance de 5A du partenaire. Biologiquement, les interfaces sont con-
stituées d’acides aminés clés, essentiels à l’interaction, tandis que d’autres sont moins importants.

Des informations peuvent etre extraites de la proteine sur la PDB, ce qui n’est pas facile.La base de
donnees PDBe-graph3-7 peut etre uilisee pour realiser cette tache.L’graph-API5 effectue une extraction
rapide des donnees et offre un acces tout aussi rapide a toute interface constitué entre les protéines.

ARCTIC-3D est un logiciel qui explore et regroupe toutes les interfaces disponibles formées par une pro-
téine de référence. Pour quantifier différemment ces interfaces, une exploitation de l’équivalence formelle
entre les groupes de résidus constituant les interfaces et les cartographies à gros grain, qui sont des
descriptions réduites des protéines est faite. En utilisant des outils mathématiques pour évaluer les simil-
itudes entre ces représentations à gros grain, les différentes interfaces peuvent etre comparées.

ARCTIC-3D a des applications potentielles en bioinformatique structurelle et en modélisation moléculaire


guidée par l’information. Son utilisation est illustrée avec divers exemples, de l’analyse des interfaces à
l’échelle protéomique à l’utilisation pour guider l’amarrage protéine-protéine en appliquant des contraintes
spécifiques à l’interface.

ARCTIC-3D a été évalué sur le jeu de données Docking Benchmark 5, reconnu comme une référence
pour le docking protéine-protéine. Un sous-ensemble de 86 complexes de ce jeu de données a été analysé
après exclusion de ceux impliquant des ligands, des anticorps et comportant plus de deux partenaires
en interaction. Bien qu’ARCTIC-3D soit capable de gérer tout nombre de partenaires en interaction, ce
sous-ensemble a été choisi pour simplifier l’analyse.

Pour chaque complexe, ARCTIC-3D a été utilisé sur les deux protéines en interaction. En utilisant les
paramètres par défaut, il a en moyenne identifié 50,9 interfaces et 2,9 clusters d’interfaces parmi 157
ID UNIPROT uniques. Dans la plupart des cas, la véritable interface avec la protéine partenaire a
été retrouvée parmi les interfaces existantes, à l’exception de quelques cas (6 instances) où cela n’a pas
été possible en raison de prétraitements ayant entraîné l’absence de coordonnées pour certaines interfaces.

Le seul cas où ARCTIC-3D n’a pas réussi à récupérer de données d’interface concernait l’ID UNIPROT
O09130, car aucune information d’interface n’était disponible dans l’API RESTful de PDBe.

L’étude a évalué les performances de diverses méthodes de docking sur 55 nouvelles structures protéiques.

Les analyses n’ont révélé aucune corrélation significative entre les difficultés de docking et des mesures
telles que la RMSD de l’interface, la surface enfouie et l’énergie libre de liaison. Une hypothèse a été
avancée concernant la présence de multiples surfaces de liaison. Une entrée a été exclue de l’analyse en
raison du manque d’informations sur l’interface.

2
Analyse à l’échelle de l’UNIPROT. Dans une seconde expérience de calibrage, ARCTIC-3D a été appliqué
à l’examen d’un vaste ensemble de données protéiques, soit l’intégralité des 569 213 (au 9/3/2023) pro-
téines curatées répertoriées dans la base de données UNIPROT Swiss-Prot. L’exécution d’ARCTIC-3D
avec les paramètres par défaut sur cet ensemble considérable d’identifiants UNIPROT a requis 11,08
heures de CPU sur un ordinateur équipé de 50 AMD EPYC.

Les performances de l’outil ARCTIC-3D varient en fonction de la protéine étudiée. Les protéines sans in-
formation d’interface nécessitent moins de temps d’exécution, tandis que celles avec une longue séquence
exigent davantage de temps en raison du téléchargement des fichiers PDB associés. Par exemple, l’analyse
de la glycoprotéine de pointe du SARS-CoV-2 a pris plus d’une demi-heure. Sur l’ensemble des entrées
analysées, ARCTIC-3D a pu récupérer des informations pour 4,12 des cas, dont 59,73 des protéines
présentaient une seule surface d’interaction et 14,75 en avaient plus de trois.

Dans cette étude, les auteurs ont utilisé ARCTIC-3D, un outil de modélisation moléculaire, pour générer
des contraintes d’amarrage basées sur des données. Ils ont appliqué cette méthode à un scénario
d’amarrage réel en utilisant deux structures cristallines : la trypsine bêta porcine et l’inhibiteur de
trypsine de soja de type Kunitz.

Les résultats ont montré que l’amarrage entre ces deux composants était relativement facile, avec un
RMSD de 0,47 Å entre la structure liée et la structure non liée. ARCTIC-3D a été exécuté sur les ID
UNIPROT correspondant à ces deux composants, en excluant la structure du complexe liant.

Les résultats ont révélé une interface retrouvée dans une autre structure avec une grande similarité avec
l’interface réelle de l’amarrage. Pour un autre composant, ARCTIC-3D a retrouvé 43 interfaces poten-
tielles en utilisant une autre structure de référence. Cette étude démontre l’efficacité d’ARCTIC-3D pour
générer des contraintes d’amarrage basées sur des données.

HADDOCK3 représente une nouvelle version modulaire de HADDOCK33, offrant un workflow rapide et
économique en termes d’échantillonnage pour le docking moléculaire. Ce workflow comprend cinq étapes
: une minimisation de l’énergie du corps rigide, un raffinement flexible des modèles, une minimisation
finale de l’énergie, un regroupement des contacts communs, et une notation basée sur les grappes.

L’idée sous-jacente de ce protocole est que la présence d’informations de qualité dans une partie des
données d’entrée devrait permettre d’obtenir des solutions d’amarrage acceptables, même en limitant
l’échantillonnage. Lors des tests effectués, HADDOCK3 a identifié cinq poses d’amarrage de qualité
moyenne parmi les 100 échantillonnées.

Une corrélation a été observée entre la qualité des modèles d’amarrage et le score HADDOCK. Le premier
modèle de qualité moyenne s’est classé en première position, et le cluster quasi-natif a été identifié comme
le plus important. Cette exécution de HADDOCK3 a duré environ 13 minutes et 12 secondes.

2 Discussion
Dans ce travail, ARCTIC-3D, un nouvel outil, est présenté pour extraire et classifier les interfaces de pro-
téines à partir de la base de données PDB. En interrogeant la base de données PDBe-graph6, ARCTIC-3D
récupère les informations sur les protéines d’intérêt.

En utilisant une représentation réduite à gros grain, il établit une similarité entre différentes interfaces
de protéines pour identifier les surfaces de liaison de la structure étudiée.

Les tests sur des ensembles de données de référence et la base de données Uniprot Swiss-Prot démontrent
la fiabilité d’ARCTIC-3D dans l’analyse des interfaces de protéines annotées. De plus, ARCTIC-3D in-
troduit le concept d’entropie de reconnaissance pour expliquer la difficulté de modélisation des complexes
protéine-protéine en fonction du nombre de surfaces de liaison potentielles.

Les contraintes spécifiques générées par ARCTIC-3D peuvent être utilisées par d’autres logiciels de mod-
élisation pour créer des modèles. Enfin, ARCTIC-3D permet également l’analyse des surfaces de liaison

3
en fonction des protéines avec lesquelles elles interagissent.

Vous aimerez peut-être aussi