Vous êtes sur la page 1sur 23

Abonnez-vous à DeepL Pro pour éditer ce document.

Visitez www.DeepL.com/pro pour en savoir plus.

Epub : No
5589 Papier sous presse
https://doi.org/10.18388/abp.2020_5589

Consultez le site

Sept conseils rapides pour les débutants en cristallographie


des protéines
Katarzyna Kurpiewska1✉, Ewa Kot2 et Tomasz Borowski2✉
de chimie des cristaux et de physique des cristaux, Faculté de chimie, Université Jagiellonian, Cracovie, Pologne ; 2Institut Jerzy Haber de catalyse
1D épartement

et de chimie des surfaces, Académie polonaise des sciences, Cracovie, Pologne.

L'objectif de cette brève revue est de fournir une Dédicace : Cet article fait partie du numéro spécial de l'ABP
feuille de route aux cristallographes débutants qui dédicacé au Prof. Władek Minor. Tous nos vœux pour votre 75e
anniversaire, Władek. Profitant de cette occasion, Tomasz
ont peu ou pas d'expérience en biologie structurale Borowski aimerait exprimer sa gratitude pour l'hospitalité de
et qui souhaitent pourtant produire des cristaux de Władek Minor envers lui et ses étudiants à chaque occasion,
protéines et analyser leurs structures 3D pour mais surtout pour les avoir accueillis dans le laboratoire de
comprendre leurs rôles biologiques. Pour atteindre Władek à UvA.
cet objectif, il est essentiel de procéder à la Abréviations :
cristallisation, à la détermination de la structure, à la
visualisation et à l'analyse des caractéristiques INTRODUCTION
structurelles de la protéine liées à sa fonction
biologique. En gardant cet objectif à l'esprit, les La cristallographie macromoléculaire aux rayons X
conseils présentés ici couvrent les étapes les plus est au service de diverses disciplines scientifiques et
importantes d'une tentative de cristallographie et accélère considérablement les découvertes dans de
présentent une sélection de bases de données et de nombreux domaines de recherche, notamment les études
logiciels qui peuvent aider et accélérer l'ensemble du sur la fonction biologique des protéines, le dépistage et
processus. Nous espérons que ce bref aperçu aidera le dé- signe des médicaments, ainsi que la santé et les
les novices issus de différentes disciplines à maladies humaines. Au fil des décennies, la
s'orienter dans un projet de cristallographie des biocristallographie a évolué parallèlement aux
protéines et, espérons-le, permettra d'éviter développements de l'informatique, qui ont permis une
certaines erreurs coûteuses, même si être détermination plus rapide des structures. En
cristallographe signifie apprendre par essais et conséquence, on observe une croissance spectaculaire
erreurs. du nombre de nouveaux logiciels, de bases de données
avancées et de serveurs bio-informatiques. L'ampleur de
Mots clés : biocristallographie, logiciel de cristallographie, l'intérêt croissant pour la biologie structurale, et donc
détermination de la structure, outils bioinformatiques, base de aussi pour la biocristallographie, est démontrée par le
données.
trafic sur la base de données centrale Protein Data Bank
Reçu : 10 janvier 2021 ; révisé : 28 février 2021 ; accepté : (Berman et al., 2000). Dans le monde entier, plus d'un
31 mars 2021 ; disponible en ligne le 11 août 2021.
million d'utilisateurs visitent la banque de données sur
les protéines chaque année, si l'on en juge par le nombre
✉e-mail : katarzyna.kurpiewska@uj.edu.pl (KK) ; d'adresses IP uniques. Ils effectuent plus de 1,5 million
tomasz.borowski@ ikifp.edu.pl (TB)
Remerciements pour le soutien financier : T.B. reconnaît le de chargements descendants de structures chaque jour,
soutien financier partiel du projet par le fonds de recherche soit plus de 500 millions par an (Bruno et al. , 2017).
statutaire de l'ICSC PAS. Au-delà du résultat final
Figure 1. Feuille de route pour l'expérience biocristallographique.
2 K. Kurpiewska et autres Article sous
presse
Depuis l'expérience cristallographique, on peut se sentir que l'on peut ensuite aligner en utilisant le programme
perdu dans l'écosystème diversifié et florissant des Clustal Omega (Sievers et al. , 2011) disponible sur le
logiciels utilisés au cours du processus de détermination serveur.
et d'analyse de la structure. Nous tentons ici de créer une Des informations sur les domaines protéiques et leur
feuille de route (Fig. 1) pour les débutants en organisation au sein d'une protéine donnée, ainsi que sur
cristallographie des protéines sous la forme d'un la famille de protéines à laquelle la protéine appartient,
ensemble de conseils comprenant une modeste sélection peuvent être recherchées dans la base de données Pfam
de logiciels de cristallographie macromoléculaire et (http://pfam.xfam.org/) (El-Gebali et al., 2019). Cette
d'outils bioinformatiques essentiels pour le voyage d'un base de données dispose d'un moteur de recherche
cristallographe. Toutefois, il ne s'agit pas d'une revue convivial qui accepte, entre autres, les identifiants
exhaustive des progiciels, services ou produits UniProt et PDB. L'entrée pour chaque famille de
commerciaux disponibles gratuitement. Cet aperçu protéines fournit des informations très utiles sur les
subjectif réalisé par les auteurs comprend des ressources architectures des protéines, les structures disponibles
bien connues de la communauté et actuellement déposées dans la PDB, les espèces et les arbres
disponibles. Nous espérons que les "sept conseils" phylogénétiques et, surtout, elle permet de visualiser ou
pourront servir de point de départ, notamment pour les de télécharger les alignements de séquences stockés
jeunes chercheurs, et qu'ils inciteront les lecteurs à pour la famille. Un logo de profil disponible pour la
approfondir leurs connaissances cristallographiques. famille aide à identifier les résidus con- servés et les
positions variables.
CONSEIL 1 : APPRENEZ CE QUE L'ON SAIT SUR VOTRE
La solubilité des protéines dans E. coli peut être
PROTÉINE
prédite sur la base de la séquence d'acides aminés des
protéines à l'aide du serveur SoluProt
(https://loschmidt.chemi.muni.cz/solu- prot/) (Hon et
Un bon point de départ pour recueillir des al., 2020), qui utilise des techniques d'apprentissage
informations sur la protéine choisie est le serveur automatique formées sur des bases de données
UniProt (https://www. uniprot.org/) (Bateman, 2019). Il expérimentales sélectionnées.
offre un moteur de recherche avancé qui accepte, entre Avant de commander ou de cloner un gène pour la
autres, le nom de la pro- teine, le numéro CE ou, via une protéine à cristalliser, il est conseillé d'examiner les
option de recherche BLAST (Zhang & Madden, 1997), résultats du serveur XtalPred
sa séquence d'acides aminés. L'entrée UniProt fournit (https://xtalpred.godziklab.org/Xtal- Pred-cgi/xtal.pl)
des informations clés sur la fonction de la protéine, son (Slabinski et al. , 2007). En utilisant la séquence
nom et sa taxonomie, sa localisation subcellulaire, ses d'acides aminés comme entrée, le serveur prédit une
modifications post-traductionnelles, ses interactions série de propriétés physico-chimiques et, sur la base de
avec elle-même ou avec d'autres protéines, sa similarité celles-ci, en utilisant la méthode d'apprentissage
avec d'autres protéines et domaines présents dans la automatique (forêt aléatoire), prédit la cristallisabilité
protéine et sa séquence d'acides aminés. Des références des protéines. Des rapports détaillés sur les valeurs des
bibliographiques aux sources d'information sont caractéristiques cibles calculées par rapport aux
fournies, ainsi qu'une riche sélection de références distributions des succès et des échecs de cristallisation
croisées avec d'autres bases de données. L'une des permettent de juger quelle caractéristique peut
fonctions très utiles du serveur est l'option "Ajouter au potentiellement être un obstacle majeur à la
panier" disponible dans la section Séquence. Son cristallisation. Les caractéristiques de la séquence
utilisation permet de rassembler un ensemble de prédite, avec la séquence d'acides aminés, peuvent aider
protéines. à la conception de la construction, par exemple en
suggérant d'enlever un peptide signal ou un long
fragment désordonné.
Figure 2. Détermination de la structure cristalline.
Article dans la presse Sept conseils rapides pour les débutants en cristallographie des protéines 3

aux extrémités de la protéine. Les résultats de XtalPred, Il est recommandé d'utiliser une concentration de 1 à 25
combinés avec les informations extraites de la base de mg/ml (10 à 15 mg/ml en général). Les protéines
données Pfam, peuvent également aider à décider si la eucaryotes ont tendance à être moins solubles que les
protéine multi-domaines doit être cristallisée en tant que protéines bactériennes. Toutes les autres approches
telle ou en tant que fragments séparés. La section dépendent fortement de la quantité de l'échantillon de
"homologues" des résultats fournit, entre autres, une protéines, de l'équipement disponible et des ressources.
liste d'homologues de structure connue déposés dans la Comme nous l'avons déjà mentionné, la recherche des
base de données PDB, ce qui constitue une information conditions optimales de cristallisation est encore un
précieuse quant à la faisabilité de la résolution de la processus d'essais et d'erreurs, renforcé par l'utilisation
structure par une méthode de remplacement de cribles disponibles dans le commerce. Cependant, il
moléculaire, qui est actuellement le moyen le plus existe quelques approches rationnelles basées sur des
courant de résoudre la structure cristalline. Pour être preuves qui sont très susceptibles d'améliorer les
utile à cette fin, l'homologue doit avoir une séquence chances d'obtenir des cristaux de protéines. Outre la
d'acides aminés qui est au moins 20-25% identique à pureté de l'échantillon de protéine, le deuxième aspect
celle de la protéine cible. Les homologues peuvent très important est basé sur les observations selon
également être recherchés directement sur le serveur lesquelles le pH de la solution de cristallisation a un
PDB (https://www.rcsb.org/) en utilisant une option de impact significatif sur la croissance des cristaux. Il a été
recherche avancée et la séquence d'acides aminés suggéré que le pH devrait s'écarter du pI de la protéine
comme entrée. Si des homologues suffisamment jusqu'à 3 unités de pH et que le pH de la solution
proches et dont la structure est connue ne sont pas protéique devrait être "aussi bas, aussi élevé ou aussi
disponibles, il faut alors envisager un phasage divergent du pI que possible pour les protéines basiques,
expérimental, parmi lequel la méthode de diffraction acides ou neutres, respectivement, dans leur gamme de
anormale à une seule longueur d'onde (SAD) est la plus pH stable" (Zhang et al., 2013). Ainsi, le criblage initial
courante. La SAD utilise un signal anormal provenant des conditions de cristallisation doit explorer le plus
soit de composants naturels de la protéine étudiée (par large ensemble de pH/précipitants/tampons/additifs, ce
exemple Zn, Cu, Fe, Mn, Ni, ou dans les cas les plus qui peut être facilement réalisé à l'aide de kits de
courants S), soit de la sélénométhionine (Se- Met), cristallisation fournis par de nombreux fournisseurs. La
introduite dans la protéine (par le biais d'un milieu de meilleure façon d'augmenter le succès de la
croissance bactérien ou de levure) pendant la production cristallisation macromoléculaire est d'initier une
de la protéine. collaboration avec un groupe de biologie structurale ou
Puisque tout le processus de détermination de la avec des installations centrales dédiées équipées de
structure commence à partir d'un échantillon de protéine robots de cristallisation, de chambres froides et/ou
(Fig. 2), après avoir rassemblé toutes les informations d'hôtels à cristaux. Un certain nombre d'initiatives de ce
disponibles sur la macromolécule étudiée, le chercheur type, qui soutiennent leurs utilisateurs tout au long du
doit répondre à quelques questions supplémentaires processus de cristallisation, se sont rapidement
concernant la source de la protéine ou sa production. multipliées au cours des dernières années dans le monde
Une bonne procédure de planification à cette étape, qui entier. Ce qui est encourageant dans la manipulation ro-
comprend des décisions concernant le travail avec des botique des plaques de cristallisation, c'est la quantité
domaines multiples ou uniques de la molécule étudiée et substantiellement plus petite de l'échantillon utilisé par
la troncature éventuelle des parties flexibles, ainsi que la les ro- bots de cristallisation par rapport au chemin
connaissance d'un large éventail de méthodes utilisées traditionnel avec des gouttes de cristallisation
pour résoudre les structures basées sur les configurées manuellement où un volume d'échantillon
caractéristiques intrinsèques de la macromolécule (c'est- entre 1 μL et 5 μL est utilisé. Par exemple, pour mettre
à-dire la teneur en métaux, les dérivés de SeMet, etc. Il en place 10 écrans (96 conditions chacun), il faut
est bon de se rappeler que le stockage de l'échantillon de préparer 150-200 microlitres de protéines à la
protéine peut être critique. Toutes les protéines ne concentration appropriée. La discussion des principes
supportent pas la congélation à -20°C, la plupart des théoriques qui sous-tendent la cristallisation (McPherson
échantillons sont donc conservés à 4°C ou -80°C, mais et Gavira, 2014 ; Russo Krauss et al. , 2013), la
l'activité et la stabilité doivent être régulièrement description des stratégies concernant les
vérifiées. En outre, en règle générale, il est préférable de expérimentations (Cheraghian Radi et al. , 2021) et la
stocker les protéines concentrées plutôt que diluées. manière de procéder à l'optimisation (He et al. , 2020)
dépassent le cadre de cette revue. Cependant, dans le
CONSEIL 2 : LA CRISTALLISATION EST UN ART, MAIS
prolongement de ce conseil, nous aimerions signaler une
LA PLANIFICATION EST CONSEILLÉE
autre approche rationnelle permettant d'améliorer les
chances de cristallisation - la réduction de l'entropie de
la surface des protéines, qui peut être planifiée à l'aide
Avant de planifier les expériences de cristallisation, il du serveur SERp (http://services.mbi.ucla.edu/SER/)
est important de réaliser quels sont les facteurs qui (Gold- schmidt et al. , 2007). Le serveur identifie les
influencent la croissance des cristaux (Tableau 1).
Toutes ces variables, catégorisées comme physiques, régions de la surface de la protéine caractérisées par une
grande liberté de con- formation de la chaîne latérale (et
chimiques ou biochimiques, peuvent fortement impacter donc, l'entropie) et, sur la base des résultats de la
le processus de formation des cristaux. Les détails de prédiction de la structure secondaire (les régions de
ces différents paramètres ont été largement décrits dans bobine sont préférées) et de l'alignement de la séquence
la littérature (Abdalla, 2016 ; Bhat et al , 2018). En
pratique, la puri- té, l'homogénéité et la stabilité de sur des protéines homologues (analyse de conservation
des acides aminés), il suggère les meilleurs candidats
l'échantillon de protéines sont les tout premiers facteurs
à prendre en compte. La concentration en protéines (jusqu'à trois résidus consécutifs) pour la mutation. On
dépend toujours de chaque cas, mais pour les ini- s'attend à ce que le mutant qui en résulte ait un faible
taux d'alcoolémie.
Tableau 1. Paramètres affectant la cristallisation des
protéines.
Facteurs physiques Facteurs chimiques Facteurs biochimiques
• Température • Concentration de l'échantillon • Pureté de l'échantillon
• Pression
• Temps • Type de mémoire tampon • Homogénéité de l'échantillon
• pH • pI de l'échantillon
• Viscosité • La force ionique • Modifications de la séquence (réduction de
• Champs magnétiques ou • Type de précipitant
électriques l'entropie de la surface des protéines,
• Vibrations et sons • Concentration du précipitant utilisation de codons à traduction rapide ou
• Additifs : ions lourds, ions lente, mutants d'interface).
• Méthode de cristallisation métalliques, polyions, • Modifications post-traduction
• Surface de la goutte de
cristallisation détergents. • Modifications chimiques
• Nucléants • Ligands, cofacteurs, inhibiteurs • Protéolyse
• Taux d'équilibrage
4 K. Kurpiewska et autres Article sous
presse
er la pénalité entropique pour la transition de l'état en urements et capillaires. Avec l'utilisation de la boucle
solution qui est un peu plus grande que le cristal, après l'avoir
à l'état de cristal. repêché, le cristal peut être transféré par étapes dans des
En supposant que les cristaux de protéines peuvent so- lutions de cryoprotection avec une concentration
être vus dans la goutte, il faut maintenant se poser la progressivement accrue du cryoprotecteur ou peut être
question "quelle est la suite ?". Comment manipuler les immédiatement trempé dans la solution de
cristaux ? Comment préparer les échantillons pour leur cryoprotection finale déjà établie (Vera & Stura, 2014).
voyage vers le synchrotron et pour la collecte des Dans les deux cas, l'étape suivante nécessite le transfert
données ? Les cristaux qui ont un bel aspect au du cristal dans l'azote liquide. Après le refroidissement
microscope ne sont qu'un début prometteur. Travailler rapide, les cristaux doivent être directement montés sur
avec des cristaux de protéines n'est pas le plus facile. le diffractom- teur de rayons X ou placés dans un
Avant les mesures, il faut les récolter et les protéger de Dewar, où les échantillons peuvent être conservés aussi
la destruction. Comme les cristaux sont formés à partir longtemps que nécessaire. Une fois congelés, les
de solutions à base d'eau, une grande partie de leur cristaux sont transportés dans des conditions
réseau cristallin est composée d'eau (Chayen & cryogéniques, généralement à l'aide de dewars à
Saridakis, 2008). La présence d'une grande quantité de expédition sèche.
liqueur mère dans les cristaux garantit que les molécules
de protéines adoptent une conformation native similaire CONSEIL 3 : PRÉVOYEZ UN PLAN POUR LA COLLECTE DES
à celle observée dans des conditions physiologiques. De DONNÉES
plus, la présence de canaux d'eau permet d'introduire
facilement des composants de faible poids moléculaire La partie la plus importante de ce conseil pourrait être
dans les cristaux de protéines, par exemple des ions résumée en une phrase : la collecte de données est la
d'éléments lourds, des inhibiteurs ou des ac- tivateurs dernière expérience dans le cadre d'une détermination de
(Gnesi & Carugo, 2017). D'autre part, la présence d'eau structure et elle exige des compromis (Fig. 3). La
dans les cristaux a également un côté négatif. Lors des collecte de mauvaises données peut malheureusement
expériences de diffraction avec des rayons X intenses, ruiner tous les efforts précédents et influencer
des radicaux libres sont produits par le rayonnement considérablement les résultats attendus. Pour éviter cette
ionisant. Malheureusement, la présence de canaux d'eau situation, l'expérience de fractionnement doit être
permet à ces molécules très dangereuses de se propager préparée et réalisée après une planification minutieuse.
rapidement, et lorsqu'elles atteignent les molécules de La grande majorité des structures cristallines à rayons X
protéines, elles provoquent la destruction et la
dégradation du cristal. Pour atténuer ce processus, une de la Banque de données sur les protéines est basée sur
des données synchro- tron. Les sites synchrotron de
méthode de cryoprotection est appliquée (Pellegrini et pointe dédiés aux études structurelles d'échantillons
al., 2011). Cette étape est profondément liée à la biologiques offrent des faisceaux de petite taille et
suivante - la manipulation du cristal. Trouver le bon focalisés, qui permettent des mesures de diffraction de
agent cryoprotecteur et sa concentra- tion est une étape routine pour des échantillons de microcristaux. En outre,
cruciale pour préserver la bonne condi- tion des les collectes de données de diffraction des rayons X, y
cristaux. La sélection du cryoprotecteur reste un compris l'identification d'éléments à dispersion
exercice d'essai et d'erreur, où la première combinaison anormale optimisée ou la mise en phase, les expériences
qui "fonctionne" est acceptée. Au cours de cette étape, il avec des cristaux présentant de grandes cellules
faut se rappeler qu'une solution cryoprotectrice efficace
doit d'abord stabiliser le cristal, mais l'ajout d'un unitaires, ainsi que les mesures à haute résolution sont
désormais possibles avec des temps de mesure réduits.
cryoprotecteur doit aussi empêcher la formation de Les sources internes intenses du laboratoire servent
glace à la surface de l'échantillon pendant le également d'outils pour la collecte de données de
refroidissement rapide. A ce stade, nous devons diffraction à une seule longueur d'onde, ce qui permet
mentionner que le trempage dans une solution même d'obtenir des données adaptées à la mise en phase
cryoprotectrice n'est pas la seule méthode de protection efficace du S-SAD, mais elles sont limitées au
des cristaux de protéines contre les dommages. La rayonnement caractéristique du matériau de l'anode à
déshydratation, le refroidissement cryogénique à haute rayons X. Le processus d'enregistrement des
pression ou le recuit des cristaux peuvent également être diffractogrammes est un processus de longue haleine. Le
appliqués (Huang & Szebenyi, 2016). Les cristaux processus d'enregistrement des diffractogrammes repose
doivent être manipulés un par un et aussi rapidement
sur plusieurs principes qui doivent être pris en compte
que possible, sinon le cristal et la goutte peuvent sécher avant la collecte des données :
(en conséquence, les autres cristaux de la même goutte - Le premier paramètre important est la longueur
seront perdus). De nombreux outils pour la manipulation d'onde des rayons X qui vont frapper le cristal. Les
et le montage des cristaux peuvent être trouvés sur le rayons X sont de même nature que la lumière visible ou
marché : une grande variété de boucles (de différentes les ondes radio, la seule différence est leur longueur
formes et tailles), des micro-outils, des sets pour la d'onde, qui est très courte (environ 1Å). Un phénomène
mesure à température ambiante.... provoqué par l'interaction des ondes électromagnétiques
avec la matière à l'intérieur du cristal (notamment avec
les électrons) dépend de la longueur d'onde du
rayonnement.
Figure 3. Expérience de diffraction des rayons X.
Article dans la presse Sept conseils rapides pour les débutants en cristallographie des protéines 5
ont été réalisées au cours des dernières décennies, mais
Le choix de la longueur d'onde des rayons X utilisée il est fortement recommandé de comprendre les
pendant la collecte des données dépend de la stratégie fondements des protocoles appliqués mis en œuvre dans
qui sera utilisée pendant la détermination de la structure, le logiciel choisi (Powell, 2017).
et les approches les plus courantes sont le remplacement – La détermination de la stratégie apportera
moléculaire et les méthodes de signaux anormaux. Dans également des informations sur la plage d'oscillation et
le cas du remplacement moléculaire, qui est viable le temps d'exposition. Pour collecter des données de
lorsque la structure de la pro- teine modèle est connue, haute qualité, il faut également tenir compte de la durée
une seule longueur d'onde sans considération de vie prévue du cristal, car les dommages dus aux
particulière des données anormales suffit. Les méthodes rayonnements limitent la résolution et la qualité des
de mise en phase des signaux anormaux nécessitent la données. Ce site
collecte de données anormales à une seule longueur
d'onde (SAD) pour des éléments marqueurs sélectionnés
(également possible pour le soufre natif (S-SAD) et le
phosphore natif (P-SAD)) ou de données de diffraction
anormales multiples (MAD). Dans ces cas, après la
détermination du spectre du bord d'absorption pour le(s)
marqueur(s) anormal(s), des ensembles de données sont
collectés à une ou plusieurs longueurs d'onde
sélectionnées afin d'obtenir le signal anormal maximal.
De même, lorsque des atomes métalliques sont déjà
présents dans la structure, il est conseillé de collecter le
spectre de fluorescence des rayons X, qui peut être
collecté dans la plupart des lignes de faisceaux
synchrotron. L'enregistrement des spectres de
fluorescence aux rayons X et la collecte d'ensembles de
données dif- férents au-dessus et au-dessous des bords
d'absorption correspondants du métal permettent, dans
la plupart des cas, de rassembler suffisamment de
preuves pour déterminer sans ambiguïté l'identité et
l'emplacement du métal d'intérêt, ainsi que pour
caractériser avec précision les ligands de coordination
dans l'environnement de liaison du métal au sein de la
protéine.
– En gardant à l'esprit que la structure cristalline est
codée dans les rayons X diffractés, où l'orientation du
cristal, la forme et la symétrie de la cellule unitaire
définissent les directions des faisceaux diffractés, tandis
que les positions de tous les atomes dans la cellule
unitaire définissent leurs intensités, quelques autres
aspects importants doivent être pris en compte pour une
collecte de données réussie, y compris l'inspection de la
première image de diffraction et la détermination de la
stratégie. L'examen visuel du premier diffractogramme
permet de distinguer facilement les échantillons de sel et
de protéines. En outre, pour les échantillons cryo-
refroidis, l'inspection de l'image collectée pour la
présence et la force des anneaux de diffraction causés
par la glace, révélera si le choix de l'agent
cryoprotecteur était approprié. Les logiciels modernes
peuvent traiter les régions qui doivent être exclues du
traitement des données dans les cas où de tels "anneaux
de glace" sont présents sur les images. L'observation de
taches fortes, bien formées et résolues jusqu'à une
région à haute résolution suggère que la collecte de
données de bonne qualité est possible. Néanmoins, il
n'est pas rare que la diffraction soit anisotrope. Pour
vérifier si l'intensité de la diffraction ne varie pas trop
avec l'orientation du réseau cristallin, une deuxième
image du cristal tourné de 45 ou 90 degrés doit
également être enregistrée et inspectée. L'expérience
préliminaire permet de tester la qualité du cristal et de
décider de la stratégie de collecte des données de
diffraction XRD, car la symétrie du cristal influence la
symétrie de la distribution des taches sur les images. Il
est donc crucial à ce stade de déterminer le groupe
d'espace et les dimensions de la cellule unitaire, ce qui
permettra d'obtenir des informations sur le nombre
d'images de diffraction à enregistrer. De plus,
l'évaluation de la résolution maximale aidera à prendre
la décision concernant la distance du détecteur par
rapport à l'échantillon. Des avancées majeures dans le
domaine du traitement automatisé des données en
termes d'indexation, d'intégration et de mise à l'échelle
https://www.diamond.ac.uk/
peut être réalisée par exemple avec les logiciels BEST • Elettra (Trieste, Italie) https://www.elettra.trieste.it/
(Bourenkov & Popov, 2010) ou RADDOSE • L'Installation européenne de rayonnement
(http://www.raddo.se/) (Garman, 2014). La stratégie synchrotron (ESRF ; Grenoble, France)
finale ap- pliquée dans la collecte des données dépend https://www.esrf.eu/
également de la géométrie disponible du goniostat. Plus • SOLEIL (Saint-Aubin, France) https://www.synchro-
le degré de liberté de l'orientation du cristal est élevé, tron-soleil.fr/en
mieux c'est. Les installations synchrotron les plus • Max IV (Lund, Suède) https://www.maxiv.lu.se/
courantes permettent de faire tourner les cristaux autour • Source lumineuse suisse (SLS ; Villigen PSI, Suisse)
d'un seul axe (phi), tandis que les diffractomètres https://www.psi.ch/en/sls
internes comportent des goniostats à 3 ou 4 axes, mais un
nombre croissant de lignes de faisceaux de
cristallographie macromoléculaire permettent également
de faire tourner l'échantillon autour de plus d'un axe. En
utilisant des détecteurs à grande surface, la rotation
autour d'un seul axe permet dans la plupart des cas
d'obtenir des données complètes, quelle que soit
l'orientation initiale du cristal. Les derniers logiciels
disponibles sur les sites synchrotron et les machines
internes aident grandement à prédire et à collecter les
données et supportent les méthodes de mise en phase les
plus populaires, néanmoins les décisions doivent être
prises par le cristallographe en fonction de toutes les
informations disponibles et précédemment recueillies.
L'expérience de collecte des données doit être menée
correctement afin d'obtenir des données complètes. Si la
stratégie a été mal planifiée ou si la puissance de
diffraction diminue rapidement, certaines réflexions
peuvent ne pas être mesurées du tout et les données
peuvent ne pas être complètes. Un certain nombre de
sites synchrotron pour la cristallographie
macromoléculaire en Europe fonctionnent avec
MXCuBE (Gabadinho et al. , 2010) et la dernière
version MXCuBE3 (Mueller et al. , 2017)
(https://mxcube.github.io/mxcube/), qui aide les
utilisateurs à prendre des décisions raisonnables pendant
la collecte des données. Un autre aspect important pour
tirer le meilleur parti du temps du faisceau est la
possibilité de pro- cesser vos données pendant ou juste
après la collecte des données. Un examen rapide des
statistiques finales sera bénéfique dans les situations où,
pour une raison quelconque, les mesures se sont mal
déroulées et où la collecte de données doit être répétée.
- Pour conclure ce conseil, n'oubliez pas que
l'élaboration d'un bon plan de collecte de données est un
effort qui portera ses fruits lors de l'étape de
détermination de la structure. Perdre une chance
d'obtenir de bonnes données pour des cristaux qui
n'étaient pas faciles à obtenir ou qui ne peuvent pas être
facilement reproduits peut être fatal pour le projet
scientifique.
En outre, une bonne pratique consiste à sauvegarder
les images brutes et à en conserver une copie au moins
jusqu'à ce que le travail comportant des résultats
structurels ait été accepté pour publication. Les
processus de validation de la structure et de révision du
manuscrit peuvent nécessiter la répétition de l'inspection
des données, voire la reproduction des données. En
outre, il est fortement conseillé de déposer les images
brutes dans un dépôt de données ouvert une fois que la
publication a été acceptée (voir ci-dessous).
Enfin, la plupart des faisceaux synchrotron européens
dédiés à la cristallographie macromoléculaire proposent
des conseils d'utilisation, l'accès à un système de gestion
(ISPyB) (De- lagenière et al. , 2011) et des directives
pour la collecte de données qui peuvent être trouvées sur
les sites web respectifs :
• ALBA (Barcelone, Espagne) https://www.cells.es/en/
contact-info/
• BESSY (Berlin, Allemagne) https://www.helmholtz-
berlin.de/forschung/quellen/bessy/index_en.html
• DESY (Hambourg, Allemagne) https://www.desy.de/
• Diamond Light Source (Oxfordshire, Royaume-Uni)
6 K. Kurpiewska et autres Article sous
presse
CONSEIL 4 : COMPRENDRE LE TRAITEMENT DES spécialisée. Il est de la responsabilité de l'auteur de recueillir
DONNÉES et de fournir des informations précises sur la qualité des
données qui répondent aux normes établies par la
Avant d'aborder les questions les plus importantes du communauté cristallographique. Les paramètres les plus
traitement des données, il convient de rappeler une importants concernant les résultats du traitement des
partie minimale de la théorie concernant l'expérience de données sont mentionnés ici. Le premier paramètre est la
diffraction. Chaque rayon derrière les réflexions qui résolution, qui limite l'ensemble des résultats réalisables.
peut être vu sur les images collectées est caractérisé par
son amplitude et sa phase. Cependant, seules les
amplitudes de réflexion, qui sont proportionnelles au
module du facteur de structure F, qui à son tour est une
somme des contributions de tous les atomes de la cellule
unitaire :

peut être obtenue à partir des intensités mesurées :

mais aucune information directe sur les phases de


réflexion n'est fournie par l'expérience de diffraction. La
fonction de la densité électronique définie en chaque
point de la cellule unitaire, qui est reconstruite à partir
des amplitudes des facteurs de structure mesurés et de
leurs phases, doit être calculée :

Par conséquent, le traitement des données visant à


extraire les intensités relatives des faisceaux de rayons
X diffractés est une étape très importante des projets de
cristallographie des protéines après la collecte des
données de diffraction. Tout d'abord, les points de
diffraction enregistrés doivent être indexés, puis les
intensités brutes respectives des pixels doivent être
correctement intégrées et mises à l'échelle après la
soustraction du bruit et du fond. Plusieurs programmes
informatiques différents existent et peuvent être utilisés
à cette fin. Parmi ceux-ci, citons :
• XDS (http://xds.mpimf-heidelberg.mpg.de/) (Kabsch,
2010)
• HKL (https://www.hkl-xray.com/) (Otwinowski &
Minor, 1997)
• DIALS (https://dials.github.io/) (Winter et al. , 2018)
• XIA2 (https://xia2.github.io/) (Hiver, 2010)
• Mosflm(https://www.mrc-lmb.cam.ac.uk/mosflm/
mosflm/) (Battye et al. , 2011).
Une attention particulière doit être accordée à l'étape
de l'attribution des groupes spatiaux. Un choix erroné de
la symétrie peut entraîner des problèmes pour trouver la
position correcte du modèle pendant le remplacement
moléculaire, ainsi que des difficultés dans le phasage
effectué avec l'utilisation d'autres méthodes. Lorsque le
raffinement semble poser problème, il n'est pas
inhabituel de rechercher la solution après retraitement
des données et de sélectionner un groupe spatial
différent. Si nécessaire, cette procédure peut être
effectuée à l'aide d'outils mis en œuvre dans les
progiciels cristallographiques mentionnés ci-dessus.
Comme mentionné précédemment, les données
collectées peuvent être aniso- tropiques. Dans le cas de
données anisotropes, il est maintenant possible de traiter
la signification statistique des données d'intensité après
fusion avec StarAniso (http://staraniso.global-
phasing.org/cgi-bin/staraniso.cgi) (Tickle et al. , 2018).
A ce stade, nous aimerions encourager les
scientifiques qui débutent dans la cristallographie des
protéines à étendre leurs connaissances sur les
statistiques de collecte de données en lisant la littérature
des informations sur la structure. Le second est le en utilisant uniquement les intensités expérimentales
rapport signal/bruit, qui concerne la qualité des comme source d'information sur la phase. Ici, SnB
données. Le rapport I/σ(I) est le paramètre le plus (Miller et al., 1994), SHELXD et phenix.hyss mis en
reconnaissable qui prouve l'intensité du signal, mais œuvre dans PHENIX (Adams et al., 2002 ; Adams et al.,
un indicateur particulièrement informatif de la 2010) peuvent être appliqués. Souvent, les phases de
cohérence interne des données, outre les populaires départ peuvent être améliorées en modifiant les phases en
Rmerge, Rmeas et Rp.i.m. (Evans & Murshudov, tenant compte de toutes les informations de phase
2013) utilisés de nos jours, est le coefficient de disponibles qui proviennent d'une combinaison des
corrélation entre des demi-ensembles de données magnitudes des fac- teurs de structure connus, des
choisis au hasard, CC1/2 (Karplus & Diederichs, estimations de phase actuelles et des informations
2012). De plus, Isa, un asymptotique I/σ(I), le stéréochimiques. Un large éventail de logiciels peut être
paramètre utilisé pour l'identi- fication des erreurs utilisé à cette fin : DM (Cowtan, 2010), SOLOMON
aléatoires et systématiques associées à chaque (Abrahams et Leslie, 1996), RESOLVE (Terwilliger,
ensemble de données devrait être évalué 2004) et PIRATE (Cowtan, 2010).
(Diederichs, 2010). Afin d'estimer la "résolution"
utile des données, CC1/2 est une meilleure mesure
que Rmerge ou Rmeas (Evans et Murshudov,
2013). Une autre question importante est la
complétude des données, définie comme la
couverture de toutes les réflexions uniques
théoriquement possibles dans l'ensemble des
données mesurées. La complétude des données
influence remarquablement le processus de
détermination de la structure et ne devrait pas être
inférieure à 95 % (Dauter, 2017). Gardez à l'esprit
que la complétude peut et dépend souvent de la
plage de résolution et peut être plus faible dans la
coquille de résolution la plus élevée. Si des valeurs
inférieures sont observées dans les plages de
résolution moyennes, les données doivent être
soigneusement inspectées. Le dernier paramètre à
mentionner dans notre feuille de route est la
redondance (multiplicité), qui se réfère au fait que
chaque réflexion est mesurée avec un certain degré
d'erreur aléatoire (Bourenkov et
Popov, 2006), donc plus la redondance est élevée, plus la
plus précise l'estimation finale de l'intensité
moyenne de la réflec- tion.

CONSEIL 5 : LE PHASAGE EST SYNONYME DE


RÉFLEXION, LE RAFFINEMENT A BESOIN DE
TEMPS, LA VALIDATION EST UNE NÉCESSITÉ, LE
DÉPÔT EST UN ÉTALON-OR

Plusieurs programmes ont évolué à partir du


concept original de remplacement moléculaire pour
permettre des recherches plus rapides et plus
sophistiquées. Les plus populaires, MOLREP (Vagin
& Teplyakov, 1997) et Phaser (McCoy et al. , 2007),
sont inclus dans MrBUMP (Keegan and Winn,
2007) et BALBES (Long et al. , 2007), deux
pipelines automatisés de remplacement moléculaire.
MoRDa est également un choix intéressant parmi les
pipelines disponibles pour la solution automatisée de
la structure des protéines par remplacement
moléculaire, en se basant sur sa propre base de
données de domaines dérivée de la PDB (Vagin &
Lebedev, 2015). Les modèles très éloignés ou même
les éléments de structure secondaires peuvent
également conduire à une solution ab initio réussie
de structures macromoléculaires avec Arcimboldo
(Rodríguez et al., 2012). Plusieurs méthodes de mise
en phase sont disponibles (MIR, MAD, SAD et MR)
et elles reposent toutes sur le principe que les
informations de phase peuvent être obtenues si les
positions des atomes marqueurs dans la structure
cristalline inconnue sont connues. Le module
SHELXD (Sheldrick, 2010) de la "Suite" SHELX
(http://shelx.uni-ac.gwdg.de/SHELX) et SOLVE
(Terwilliger & Berendzen, 1999) sont largement
utilisés pour localiser les sites d'atomes lourds. Les
méthodes directes sont une classe de techniques de
résolution qui génèrent de bonnes phases de départ
Article dans la presse Sept conseils rapides pour les débutants en cristallographie des protéines 7

Tableau 2. Termes et paramètres cristallographiques importants


Termes et paramètres cristallographiques importants
La cellule unitaire est le parallélépipède construit sur les vecteurs, a, b, c, d'une base cristallographique du
Cellule unitaire* réseau direct. Son volume est donné par le triple produit scalaire, V = (a, b, c) et correspond à la racine
carrée du déterminant du tenseur métrique.

Groupe d'espace Le groupe de symétrie d'un motif cristallin tridimensionnel est appelé son
groupe spatial. Pour les macromolécules (chirales), il existe 65 symétries de
* groupe spatial possibles.
Les ondes diffractées par une distribution périodique de diffuseurs simples obéissent à la loi de Bragg, ce qui
permet de déterminer facilement les distances interplanaires et donc de retrouver aisément une description
de la structure cristalline. Lorsque les objets diffusants sont complexes (par exemple, dans les cristaux
Problème de moléculaires), le rayonnement diffracté subit un déphasage dû à la distribution spatiale des diffuseurs individuels.
phase * Les amplitudes des facteurs de structure résultants peuvent être directement dérivées des intensités mesurées
expérimentalement des faisceaux diffractés, mais pas les phases. Sans la connaissance des phases, il n'est
pas possible de reconstruire les positions atomiques individuelles. L'estimation des phases est une étape
essentielle pour une détermination de structure réussie.
Le facteur de structure Fhkl est une fonction mathématique décrivant l'amplitude et la phase d'une onde
Facteur de diffractée à partir de plans de réseau cristallin caractérisés par les indices de Miller h,k,l.
structure*.
MAD* Une approche pour résoudre le problème de phase dans la détermination de la structure des protéines en
comparant les facteurs de structure collectés à différentes longueurs d'onde, y compris le bord
d'absorption d'un diffuseur d'atomes lourds.
Une approche pour résoudre le problème de phase en se concentrant sur les relations de phase qui
MR* apparaissent par la diffraction des rayons X à partir de composants moléculaires similaires. Les composants
peuvent être des fragments moléculaires liés par une symétrie non cristallographique (par exemple, les
sous-unités icosaédriques d'un virus) ou une molécule similaire telle qu'une protéine homologue avec une
identité de séquence élevée.
La méthode de dispersion anormale à une seule longueur d'onde utilisée pour résoudre le problème de
SAD phase, utilise des données collectées à une seule longueur d'onde, généralement au niveau du pic
d'absorption ou de la distance à haute énergie. Elle minimise les problèmes de dommages dus au
rayonnement et de non-isomorphisme, mais nécessite des mesures très précises.
MIR Dans la méthode de remplacement isomorphe multiple, les effets d'interférence sur les intensités des
faisceaux diffractés causés par l'ajout d'atomes lourds à la protéine fournissent les estimations des angles
de phase.
Dans la détermination de la structure cristalline, le terme résolution est utilisé pour décrire la capacité de
Résolution* distinguer les caractéristiques voisines dans une carte de densité électronique. Par convention, elle est
définie comme l'espacement minimal des plans donné par la loi de Bragg pour un ensemble particulier
d'intensités de diffraction des rayons X. La résolution s'améliore avec l'augmentation de la valeur maxi- mum
de (sinθ)/λ à laquelle les réflexions sont mesurées.
Rmerg est une mesure de l'incertitude pour les réflexions non immergées :

Rmerge Où :
Ii(hkl) = intensité d'une réflexion individuelle avec les indices (hkl)
I(hkl= valeur moyenne de l'intensité pour toutes les réflexions d'indices (hkl), y compris celles qui sont
équivalentes par symétrie.
Rmeas est une mesure de l'incertitude pour les réflexions non immergées :

Rmeas
Où :
Ii(hkl) = intensité d'une réflexion individuelle avec les indices (hkl)
I(hkl= valeur moyenne de l'intensité pour toutes les réflexions d'indices (hkl), y compris celles qui sont
équivalentes par symétrie.
Rp.i.m. fournit une estimation de la qualité des données après la fusion de plusieurs observations :
Rp.i.m.

Le CC1/2 est un cas particulier du coefficient de corrélation de Pearson (CC) :

CC1/2
un seul jeu de données est divisé aléatoirement en deux sous-ensembles (la moitié des réflexions non
fusionnées avec les indices (hkl) sont placées dans le sous-ensemble x, et l'autre moitié dans le sous-
ensemble y dans la formulation ci-dessus) et CC est calculé entre ceux-ci.
Le terme "facteur R" en cristallographie, généralement utilisé pour désigner le facteur R "conventionnel",
est une mesure de concordance entre les amplitudes des facteurs de structure calculés à partir d'un
modèle cristallographique et celles des données originales de diffraction des rayons X (Fobs). Le facteur R est
R (Rwork)* calculé (Fcalc) pendant chaque cycle de raffinement de la structure par la méthode des moindres carrés afin
d'évaluer les progrès réalisés. Le facteur R final est une mesure de la qualité du modèle.

Une fonction résiduelle calculée pendant le raffinement de la structure de la même manière que le facteur
Rfree* R conventionnel (voir plus haut), mais appliquée à un petit sous-ensemble de réflexions qui ne sont pas
utilisées dans le raffinement du modèle structurel. Le but est de suivre l'évolution du raffinement et de
vérifier que le facteur R n'est pas réduit artificiellement par l'introduction d'un trop grand nombre de
paramètres.

*Dictionnaire en ligne de la cristallographie (Union internationale de cristallographie)


8 K. Kurpiewska et autres Article sous
presse
Indépendamment de la méthode de mise en phase, le molécules et les ligands sont abondamment représentés dans
but de la construction d'un modèle cristallographique est la PDB, près de 80 % des dépôts contiennent des substances
de construire un modèle qui explique les données chimiques qui n'appartiennent pas aux protéines ou aux
expérimentales à condition qu'il ait un sens physique et acides nucléiques. La qualité des modèles de petites mol-
chimique. La dernière tendance en matière d'outils ecules peut être améliorée par l'utilisation de contraintes
informatiques en cristallographie des protéines est le géométriques. Cette technique courante d'affinement et de
développement de pipelines tout intégrés. Des exemples validation des sites de liaison des petites molécules dans les
de ces derniers sont ARP/wARP (Macromolecular complexes pro- teine-petite molécule bénéficie de
Model Building for Crystallography and Cryo-EM ; paramètres géométriques dérivés des structures à très haute
http://www. embl-hamburg.de/ARP/) (Chojnowski et al. résolution de la Cambridge Structure Database (CSD) (htt-
, 2019), RE- SOLVE (Terwilliger, 2001) et ps://www.ccdc.cam.ac.uk/) (Groom et al. , 2016) qui
BUCCANEER (Potter- ton et al. , 2004) (Cowtan, peuvent
2006).
La construction du modèle est généralement effectuée
simultanément avec le processus de raffinement. En
d'autres termes, après avoir résolu le problème de la phase
cristallographique, le modèle initial est affiné et, par
conséquent, les paramètres du modèle (valeurs de la
géométrie et du facteur B) sont optimisés pour s'adapter
aux observations à l'aide d'une fonction d'affinement.
Différents programmes, fournis par des progiciels
cristallographiques tels que CCP4 (Winn et al. , 2011),
SHELX (Sheldrick, 2008) ou PHE- NIX (Adams et al. ,
2010) peuvent être utilisés à cette fin. Les programmes
de raffinement de modèle sont couplés avec les
programmes d'affichage graphique, par exemple avec le
plus populaire COOT (Emsley & Cowtan, 2004), qui
permet de reconstruire le modèle et d'interpréter les
régions de la carte de Fourier de différence (inexpliquées
par le modèle). Le modèle est raffiné jusqu'à ce qu'il soit
complet et que d'autres améliorations de la structure ne
soient plus possibles. Cela se fait de manière itérative
jusqu'à ce que la convergence soit atteinte, contrôlée par
les valeurs des facteurs R et Rfree (tableau 2). Le facteur
R
Les facteurs mesurent la qualité du modèle de diffraction
simulé.
correspond au schéma de diffraction observé
expérimentalement. Rfree est basé sur un ensemble de
test constitué d'un petit pourcentage (généralement ~5-
10%) de réflexions exclues d'un raffinement de structure.
Un autre aspect important qu'il faut garder à l'esprit est le
fait que l'apparence des cartes de Fourier dépend plus des
phases que des amplitudes. Par conséquent, même si les
amplitudes correctes sont connues à partir de la carte de
Fourier, elles ne peuvent pas être utilisées.
une expérience de diffraction bien menée, des phases
inexactes peuvent introduire un biais dans la carte, qui
peut être difficile à éliminer au cours du processus de
raffinement et de modélisation.
Pour effectuer la détermination automatisée de la
structure cristalline, des plateformes sophistiquées
peuvent être utilisées. En exécutant en cascade un
certain nombre de programmes cristallographiques
macromoléculaires, on obtient des pipelines efficaces.
Une nouvelle version de HKL, HKL3000 (Minor et al.,
2006) comprend toutes les étapes de la collecte des
données, du traitement et de la détermination de la
structure dans une seule interface avec les
caractéristiques graphiques traditionnelles de HKL. Une
fonctionnalité similaire est offerte par Auto-Rickshaw
(Panjikar et al. , 2005). Ces dernières années ont vu
l'apparition de nouveaux systèmes qui facilitent le
processus de détermination de la structure, par exemple
XChemEx- plorer (XCE), qui offre une interface
graphique intuitive qui guide l'utilisateur depuis le
traitement des données, le calcul initial des cartes,
l'identification des ligands et le raffinement jusqu'à la
diffusion des données (Krojer et al., 2017). De plus, la
demande d'un nombre croissant d'expériences de
criblage de fragments a conduit au développement de
Pan-DDA (https://pandda.bitbucket.io/) (Pearce et al. ,
2017) qui permet l'analyse de ces données. Les petites
être utilisés comme contraintes dans le raffinement xtallographie macromoléculaire
des petites molécules. L'identification du site de (https://mxrdr.icm.edu.pl/) sont de bons exemples de ces
liaison du ligand, la description du ligand et la initiatives qui comprennent un système de dépôt.
génération du conformère, l'ajustement du ligand, le
raffinement et la validation de la sous-séquence CONSEIL 6 : ANALYSER ET VISUALISER À L'AIDE
peuvent être réalisés avec succès à l'aide d'un D'OUTILS GRAPHIQUES
ensemble de logiciels spécialisés : eLBOW (qui fait
partie de la suite PHENIX) (Moriarty et al., 2009), Un modèle de structure protéique en 3D est une
JlLgand (mis en œuvre dans le projet CCP4) source d'informations très riche qui peut être analysée au
(Lebedev et al., 2012) et Grade (qui fait partie de mieux à l'aide d'un logiciel de visualisation avancé. Il
BUSTER) (http://grade.globalphasing.org). existe actuellement de nombreux programmes
L'objectif premier des bases de données graphiques adaptés à la visualisation et à l'analyse des
structurelles est de fournir des données hautement structures protéiques, dont la plupart sont les suivants
fiables, la "fiabilité" étant définie par des stratégies
de validation et des indicateurs de qualité rigoureux.
Ainsi, par exemple, PDB travaille activement avec
les journaux et les déposants pour fournir un retour
d'information à un stade précoce, ce qui permet
souvent d'améliorer la qualité des données à
déposer. Ce dernier point a motivé une initiative
indépendante, en cours depuis plusieurs années, à
savoir le projet PDB REDO (https://pdb-redo.eu/)
(Joosten et al., 2009). Ce serveur fournit une
structure redéfinie avec des améliorations
suggérées, c'est-à-dire un nouvel ensemble de
coordonnées pour chaque dépôt PDB. Il offre
également un serveur utile pour aider les déposants,
avant leur dépôt, à consulter la version PDB REDO
de leur cycle actuel de raffinement du modèle.
La validation du modèle sur la chaîne
polypeptidique d'une protéine peut être effectuée à
l'aide de plusieurs programmes qui fournissent une
évaluation statistique des paramètres géométriques
de la structure. Pour la validation, les scientifiques
peuvent se référer à MolProbity (Chen et al. , 2010),
PROCHECK (Laskowski et al. , 1993), WHAT_IF
(Vriend, 1990) et SFCHECK (Vaguine et al. , 1999).
Après une inspection minutieuse des résultats de la
validation, qui peut également être effectuée avec
wwPDB OneDep System (https://validate-rcsb-
2.wwpdb.org/) et la résolution des problèmes
identifiés, les auteurs peuvent déposer leurs structures
dans la PDB. Cette dernière étape, qui conduit à la
publication des données via le dépôt public, est une
condition préalable à la publication des rapports
structurels et, en révélant les dé- tails expérimentaux,
elle soutient également l'idée d'une science
reproductible.
Même si le système de validation est aujourd'hui
une procédure ef- f icace, il faut se rappeler qu'une
évaluation réelle et critique des structures
macromoléculaires, en termes de qualité et de
fiabilité, avant de se référer aux dé- posits existants
(modèles MR, homologues, orthologues) et pendant
la soumission est cruciale (Dauter et al. , 2014).
En outre, les outils de dépôt et d'annotation mis en
œuvre dans la base de données PDB exigent des
déposants qu'ils soumettent les coordonnées
atomiques et les données expérimentales primaires
ainsi que les métadonnées associées. La facilité
d'archivage des ensembles de données brutes de
diffrac- tion est un développement remarquable de
ces dernières années. En outre, le désir de maximiser
la disponibilité des données de re- cherche
conformément aux principes dits FAIR - Findable,
Accessible, Interoperable, and Re-usable
(https://www.force11.org/group/fairgroup/fairprinci
ples) (Wilkinson et al. , 2016), encourage les
cristallographes à déposer et à partager les données
brutes. La ressource intégrée pour la reproductibilité
en cristallographie macromoléculaire
(https://proteindiffraction.org/) (Grabowski et al. ,
2019) et le dépôt de données brutes de la
Article dans la presse Sept conseils rapides pour les débutants en cristallographie des protéines 9
domaines ou multi-chaînes peuvent donner des
), d'appliquer différents schémas de coloration (par : structures correspondant à différents états
type d'atome, valeur du facteur B, structure secondaire, conformationnels de la macromolécule, par exemple
etc.), de mesurer les paramètres géométriques du une conformation fermée ou ouverte. Dans un tel cas, le
modèle, d'identifier les collisions stériques, d'afficher les pro- gramme ou le serveur DynDom
cartes de densité électronique et de sauvegarder des (http://dyndom.cmp.uea.ac.uk/dyndom/) peut s'avérer
graphiques de haute qualité. La majorité des très utile pour identifier les résidus charnières et les
programmes disposent également d'une interface de domaines mobiles, ainsi que les axes par lesquels les
script, qui est très utile pour automatiser les procédures
de routine et également pour sauvegarder et restaurer le
travail. Un examen complet des progiciels graphiques
disponibles dépasse largement le cadre de cette brève
revue, c'est pourquoi nous nous contentons ici
d'énumérer quelques progiciels populaires et librement
disponibles avec des liens vers leurs sites Web.
Outils graphiques sélectionnés pour la
cristallographie macromoléculaire (par ordre
alphabétique) :
• Foulque (https://www2.mrc-lmb.cam.ac.uk/personal/
pemsley/coot/) (Emsley & Cowtan, 2004)
• Jmol (http://jmol.sourceforge.net/) [Jmol : un
visualisateur Java open source pour les structures
chimiques en 3D].
• MolMol (https://sourceforge.net/projects/molmol/)
(Koradi et al. , 1996)
• Molscript (https://kraulis.se/MolScript/) (Kraulis,
1991)
• PyMOL (https://pymol.org/2/ ou https://github.
com/schrodinger/pymol-open-source) (DeLano,
2002)
• UCSF ChimeraX (https://www.cgl.ucsf.edu/chime-
rax/features.html) (Pettersen et al. , 2004)
• VMD (https://www.ks.uiuc.edu/Research/vmd/)
(Humphrey et al. , 1996)

CONSEIL 7 : L'ANALYSE DES CARACTÉRISTIQUES


STRUCTURELLES PLACERA VOTRE STRUCTURE DANS
UN CONTEXTE PLUS LARGE

L'analyse des structures des protéines et de leurs


interactions avec d'autres molécules est souvent très
utile pour élucider leurs fonctions cellulaires et leurs
mécanismes d'action. Ainsi, les méthodes structurelles
de XRD font partie des principales stratégies
scientifiques pour l'identification de la pertinence
biologique et biochimique des protéines.
L'analyse des interfaces macromoléculaires, y
compris la prédiction de l'état oligomère probable et la
génération de ses co-ordonnées, les calculs de la surface
de l'interface et l'estimation de l'énergie libre de
dissociation de l'assemblage ne sont que quelques-unes
des capacités offertes par le serveur PDBePISA (https://
www.ebi.ac.uk/msd-srv/prot_int/pistart.html) (Krissi-
nel & Henrick, 2007). Le serveur dresse également la
liste des acides aminés composant les interfaces, évalue
l'importance de certains résidus pour les contacts
macromoléculaires et offre un moteur de recherche
avancé pour les interfaces biologiques parmi les
structures déposées dans la PDB.
Le serveur DALI (http://ekhidna2.biocenter.helsinki.
fi/dali/) (Holm, 2020) permet d'effectuer une
comparaison de protéines basée sur la structure 3D. Le
serveur offre plusieurs options, dont la recherche de
structures 3D similaires dans la base de données PDB,
la comparaison par paires entre des structures
sélectionnées (ou des chaînes individuelles) et la
comparaison structurelle "tout contre tout" pour un
maximum de 64 structures. Plusieurs modes de
visualisation des résultats, y compris des arbres
structuraux, des logos de séquences alignées
structurellement et des modèles 3D avec des variations
de structure ou de séquence cartographiées, facilitent
l'analyse des résultats.
Les études structurales sur les protéines multi-
(composantes du) mouvement (Poornam et al., 2009). Le
site Web de DynDom héberge également plusieurs bases
de données consultables contenant les résultats de
l'analyse du mouvement des domaines protéiques.
Les structures des complexes protéine-ligand
fournissent des informations précieuses sur les
interactions entre une petite molécule, qui peut être par
exemple un inhibiteur, un médicament ou un réactif, et la
macromolécule hôte. La classification de ces interactions
est grandement améliorée par le programme ou serveur
Arpeggio (http://biosig.unimelb.edu.au/arpeggioweb/)
(Jubb et al., 2017), qui identifie le type d'interaction
entre les paires d'atomes ligand-protéine (au-dessus d'une
douzaine de types différents) et génère un fichier de
session PyMOL, qui peut être utilisé pour visualiser les
résultats en 3D. Pour un exemple d'une telle analyse,
voir la figure 4, où la structure globale de la
hyoscyamine 6β-hydroxylase (H6H, PDB : 6ttm) (Kluza
et al. , 2020) est représentée (panneau A), la structure
secondaire est mise en évidence (panneau B) et les
interactions interatomiques clés engagées dans la
reconnaissance enzyme-substrat sont présentées
(panneau C).
Le serveur PDBSum mérite également d'être
mentionné ici, car il fournit un résumé succinct mais
richement illustré de la structure des protéines (3D,
secondaire et primaire), de leurs interactions avec les
ligands et les ions métalliques analysés et illustrés par
LIGPLOT (Wallace et al., 1995), ainsi qu'une
visualisation 3D des fentes et des cavités dans la
molécule de protéine. Le rapport d'évaluation de la
qualité généré par PROCHECK est

Figure 4. Visualisation de la structure et des principales in-


teractions interatomiques de l'hyoscyamine 6beta-hydroxylase
(H6H) en complexe avec son substrat - l'hysoscyamine (PDB :
6ttm).
(A) Structure globale de H6H complexé avec Ni2+ (sphe- re
cyan), hyoscyamine (bâtons, atomes de C en saumon), co-
substrat mi- mic - N-oxalylglycine (bâtons, atomes de C en
rouge). Deux histidines et un aspartate qui coordonnent le
métal sont également représentés (bâtons, atomes de carbone
en vert). (B) Une vue d'ensemble de H6H avec la structure
secondaire mise en évidence - hélices en rouge, β-brins en
jaune, boucles et régions de bobine en vert. (C) Vue
rapprochée de la poche de liaison de l'hyoscyamine (bâtons
avec les atomes de C en vert) avec les interactions clés
représentées entre le substrat et la protéine qui ont été
identifiées par le serveur Ar- peggio. Les liaisons hydrogène
sont représentées par des disques rouges, les interactions C-
H...π par des disques blancs, les interactions donneur...π par
des disques bleus, les in- teractions polaires faibles par des
disques orange. Les graphiques ont été générés avec PyMOL.
10 K. Kurpiewska et autres Article sous
presse
également disponibles pour chaque entrée PDB. Ces Cheraghian Radi H, Hajipour-Verdom B, Molaabasi F (2021) Mac-
rapports, qui sont compilés et stockés sur le serveur romolecular crystallization : basics and advanced methodologies.
[document WWW]. J. Iran. Chem. Soc. 18 : 543-565. https://doi.
pour les entrées PDB, peuvent également être générés org/10.1007/s13738-020-02058-y
pour les fichiers PDB téléchargés par l'utilisateur. Chojnowski G, Pereira J, Lamzin VS (2019) Sequence assignment for
low-resolution modelling of protein crystal structures. Acta Crys-
tallogr. Sect. D Struct. Biol. 75 : 753-763. https://doi.org/10.1107/
OBSERVATIONS FINALES S2059798319009392
Cowtan K (2006) The Buccaneer software for automated model build-
ing. 1. Tracer les chaînes de protéines. Acta Crystallogr. Sect. D Biol.
La cristallographie des protéines, la cryo-EM et la Crystallogr. 62 : 1002-1011.
RMN sont les techniques les plus puissantes pour la https://doi.org/10.1107/S0907444906022116
détermination de la structure des macromolécules, ainsi Cowtan K (2010) Recent developments in classical density modifica-
que pour l'analyse des mécanismes d'action et tion. Acta Crystallogr. Sect. D Biol. Crystallogr. 66 : 470-478. https://
doi.org/10.1107/S090744490903947X
d'interaction des protéines au niveau atomique. Les Dauter Z, Wlodawer A, Minor W, Jaskolski M, Rupp B (2014) Avoid-
algorithmes et les méthodes de détermination de la able errors in deposited macromolecular structures : An
structure initialement formulés il y a plusieurs dizaines impediment to efficient data mining. IUCrJ 1 : 179-193.
d'années sont aujourd'hui de plus en plus élaborés, mais https://doi.org/10.1107/ S2052252514005442
Dauter Z (2017) Collection de données de diffraction des rayons X de
heureusement, les outils informatiques qui entourent ces cristaux macromo- leculaires. [Document WWW]. Methods Mol. Biol.
méthodes avancées ont évolué vers des progiciels et des 165-184. Hu- mana Press Inc. https://doi.org/10.1007/978-1-4939-
interfaces Web plus simples et plus conviviaux. Cette 7000-1_7
évolution, combinée à l'abondance de didacticiels, de Delagenière S, Brenchereau P, Launer L, Ashton AW, Leal R, Veyrier
S, Gabadinho J, Gordon EJ, Jones SD, Levik KE, Mcsweeney SM,
chaînes YouTube, de manuels, de données déposées Monaco S, Nanao M, Spruce D, Svensson O, Walsh MA, Leonard
dans des dépôts ouverts et d'autres matériels GA (2011) ISPyB : An information management system for
pédagogiques disponibles gratuitement sur Internet, synchro- tron macromolecular crystallography. Bioinformatics 27 :
réduit la "barrière d'activation" pour un novice dans le 3186-3192. https://doi.org/10.1093/bioinformatics/btr535
DeLano WL (2002) The PyMOL Molecular Graphics System, Version
domaine désireux d'apprendre les méthodes de 0,99 Schrödinger, LLC. [Document WWW]. Schrödinger LLC
cristallographie des protéines. Nous espérons que cette Version 1. : http://www.pymol.org. https://doi.org/citeulike-article-
brève revue sera une aide utile dans ce voyage fasciant. id:240061 Diederichs K (2010) Quantifying instrument errors in
macromolecular X-ray data sets. Acta Crystallogr. Sect. D Biol.
Crystallogr. 66 : 733-740.
RÉFÉRENCES https://doi.org/10.1107/S0907444910014836
El-Gebali S, Mistry J, Bateman A, Eddy SR, Luciani A, Potter SC,
Abdalla M (2016) Facteurs importants influençant la cristalli- zation Qureshi M, Richardson LJ, Salazar GA, Smart A, Sonnhammer
des protéines. Glob. J. Biotechnol. Biomater. Sci. 2 : 025-028. ELL, Hirsh L, Paladin L, Piovesan D, Tosatto SCE, Finn RD
https://doi. org/10.17352/gjbbs.000008 (2019) The Pfam protein families database in 2019. Nucleic Acids
Abrahams JP, Leslie AGW (1996) Methods used in the structure Res. 47 : D427-D432. https://doi.org/10.1093/nar/gky995
determination of bovine mitochondrial F1 ATPase. Acta Crystal- Emsley P, Cowtan K (2004) Coot : Model-building tools for molecu-
logr. Sect. D Biol. Crystallogr. 52 : 30-42. https://doi.org/10.1107/ lar graphics. Acta Crystallogr. Sect. D Biol. Crystallogr. 60 : 2126-
S0907444995008754 2132. https://doi.org/10.1107/S0907444904019158
Adams PD, Grosse-Kunstleve RW, Hung LW, Ioerger TR, McCoy Evans PR, Murshudov GN (2013) How good are my data and what is
AJ, Moriarty NW, Read RJ, Sacchettini JC, Sauter NK, Terwilliger the resolution ? Acta Crystallogr. Sect. D Biol. Crystallogr. 69 : 1204-
TC (2002) PHENIX : Building new software for automated crystal- 1214. https://doi.org/10.1107/S0907444913000061
lographic structure determination. [Document WWW]. In : Acta Gabadinho J, Beteva A, Guijarro M, Rey-Bakaikoa V, Spruce D,
Crys- tallogr. Sect. D Biol. Crystallogr. 1948-1954. Bowler MW, Brockhauser S, Flot D, Gordon EJ, Hall DR, Lavault
https://doi.org/10.1107/ S0907444902016657 B, Mc- Carthy AA, McCarthy J, Mitchell E, Monaco S, Mueller-
Adams PD, Afonine P V, Bunkóczi G, Chen VB, Davis IW, Echols N, Dieckmann C, Nurizzo D, Ravelli RBG, Thibault X, Walsh MA et
Headd JJ, Hung L-W, Kapral GJ, Grosse-Kunstleve RW, Mc- Coy al. (2010) MxCuBE : un environnement de contrôle de ligne de
AJ, Moriarty NW, Oeffner R, Read RJ, Richardson DC, Rich- faisceau synchrotron personnalisé pour les expériences de
ardson JS, Terwilliger TC, Zwart PH (2010) PHENIX : a compre- cristallographie macromoléculaire. J. Synchrotron Radiat. 17 : 700-
hensive Python-based system for macromolecular structure 707. https://doi.org/10.1107/S0909049510020005
solution. Acta Crystallogr. Sect. D Biol. Crystallogr. 66 : 213-221. Garman EF (2014) Developments in X-ray crystallographic structure
https://doi. org/10.1107/S0907444909052925 determination of biological macromolecules. [Document WWW]. Sci-
Bateman A (2019) UniProt : Un hub mondial de la connaissance des ence (80-.) 343 : 1102-1108. https://doi.org/10.1126/science.1247829
protéines. Nucleic Acids Res. 47 : D506-D515. Gnesi M, Carugo O (2017) How many water molecules are detected in
https://doi.org/10.1093/nar/ gky1049 X-ray protein crystal structures ? J. Appl. Crystallogr. 50 : 96-101.
Battye TGG, Kontogiannis L, Johnson O, Powell HR, Leslie AGW https://doi.org/10.1107/S1600576716018719
(2011) iMOSFLM : a new graphical interface for diffraction-image Goldschmidt L, Cooper DR, Derewenda ZS, Eisenberg D (2007) To-
processing with MOSFLM. Acta Crystallogr. Sect. D Biol. Crystallogr. ward rational protein crystallization : Un serveur Web pour la
67 : 271-281. https://doi.org/10.1107/S0907444910048675 conception de variantes de protéines cristallisables. Protein Sci. 16 :
Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN, Weissig H, 1569-1576. https://doi. org/10.1110/ps.072914007
Shindyalov IN, Bourne PE (2000) The Protein Data Bank. Nucleic Grabowski M, Cymborowski M, Porebski PJ, Osinski T, Shabalin IG,
Acids Res. 28 : 235-242. Cooper DR, Minor W (2019) The Integrated Resource for Repro-
Bhat E, Abdalla M, Rather I (2018) Facteurs clés pour une purification ducibility in Macromolecular Crystallography : Expériences des
et une cristallisation réussies des pro- teines. Glob. J. Biotechnol. quatre premières années. Struct. Dyn. 6:
Biomater. Sci. 4 : 001-007. https://doi.org/10.17352/gjbbs.000010 https://doi.org/10.1063/1.5128672
Bourenkov GP, Popov AN (2006) A quantitative approach to data-col- Groom CR, Bruno IJ, Lightfoot MP, Ward SC (2016) The Cambridge
lection strategies. [document WWW]. In : Acta Crystallogr. Sect. D structural database. Acta Crystallogr. Sect. B Struct. Sci. Cryst. Eng.
Biol. Crystallogr. 58-64. Union internationale de cristallographie. Ma- ter. 72 : 171-179. https://doi.org/10.1107/S2052520616003954
https:// doi.org/10.1107/S0907444905033998 He Y, Gao Z, Zhang T, Sun J, Ma Y, Tian N, Gong J (2020) Seeding
Bourenkov GP, Popov AN (2010) Optimization of data collection tak- techniques and optimization of solution crystallization processes.
ing radiation damage into account. Acta Crystallogr. Sect. D Biol. [Document WWW]. Org. Process Res. Dev. 24 : 1839-1849.
Crys- tallogr. 66 : 409-419. https://doi. org/10.1021/acs.oprd.0c00151
https://doi.org/10.1107/S0907444909054961 Holm L (2020) DALI et la persistance de la forme des protéines. Protein Sci.
Bruno I, Gražulis S, Helliwell JR, Kabekkodu SN, McMahon B, 29 : 128-140. https://doi.org/10.1002/pro.3749
West- brook J (2017) Crystallography and Databases. Data Sci. J. Hon J, Marusiak M, Martinek T, Kunka A, Zendulka J, Bednar D,
16 : 1-17. https://doi.org/10.5334/dsj-2017-038 Damborsky J (2020) SoluProt : Prédiction de l'ex- pression des
Chayen NE, Saridakis E (2008) Protein crystallization : De la protéine protéines solubles chez Escherichia coli. Bioinformatics 37 : 23-28.
purifiée au cristal de qualité diffraction. Nat. Methods 5 : 147-153. https://doi. org/10.1093/bioinformatics/btaa1102
htt- ps://doi.org/10.1038/nmeth.f.203 Huang Q, Szebenyi DME (2016) Improving diffraction resolution us-
Chen VB, Arendall WB, Headd JJ, Keedy DA, Immormino RM, Ka- ing a new dehydration method. Acta Crystallogr. Sect. Struct. Biol.
pral GJ, Murray LW, Richardson JS, Richardson DC (2010) Mol- Com- mun. 72 : 152-159.
Probity : All-atom structure validation for macromolecular https://doi.org/10.1107/S2053230X16000261
crystallog- raphy. Acta Crystallogr. Sect. D Biol. Crystallogr. 66 : 12- Humphrey W, Dalke A, Schulten K (1996) VMD : Visual molecular
21. https://doi. org/10.1107/S0907444909042073 dynamics. J. Mol. Graph. 14 : 33-38. https://doi.org/10.1016/0263-
7855(96)00018-5
Joosten RP, Salzemann J, Bloch V, Stockinger H, Berglund AC,
Blan- chet C, Bongcam-Rudloff E, Combet C, Da Costa AL,
Deleage G,
Article dans la presse Sept conseils rapides pour les débutants en cristallographie des protéines 11
méthode multi-cristaux pour extraire les états cristallographiques
Diarena M, Fabbretti R, Fettahi G, Flegel V, Gisel A, Kasam V, obscurs.
Kervinen T, Korpelainen E, Mattila K, Pagni M et al. (2009) PDB-
REDO : Automated re-refinement of X-ray structure models in the
PDB. J. Appl. Crystallogr. 42 : 376-384. https://doi.org/10.1107/
S0021889809008784
Jubb HC, Higueruelo AP, Ochoa-Montaño B, Pitt WR, Ascher DB,
Blundell TL (2017) Arpeggio : Un serveur Web pour calculer et
visualiser les interactions interatomiques dans les structures
protéiques. J. Mol. Biol. 429 : 365-371.
https://doi.org/10.1016/j.jmb.2016.12.004
Kabsch W (2010) XDS. Acta Crystallogr. Sect. D Biol. Crystallogr. 66 :
125- 132. https://doi.org/10.1107/S0907444909047337
Karplus PA, Diederichs K (2012) Linking crystallographic model and
data quality. Science (80-.) 336 : 1030-1033.
https://doi.org/10.1126/ science.1218231
Keegan RM, Winn MD (2007) Automated search-model discovery
and preparation for structure solution by molecular replacement.
Acta Crystallogr. Sect. D Biol. Crystallogr. 63 : 447-457.
https://doi. org/10.1107/S0907444907002661
Kluza A, Wojdyla Z, Mrugala B, Kurpiewska K, Porebski PJ, Nied-
zialkowska E, Minor W, Weiss MS, Borowski T (2020) Regiose-
lectivity of hyoscyamine 6β-hydroxylase-catalysed hydroxylation
as revealed by high-resolution structural information and QM/MM
calculations. Dalt. Trans. 49 : 4454-4469. https://doi.org/10.1039/
d0dt00302f
Koradi R, Billeter M, Wüthrich K (1996) MOLMOL : A program for
display and analysis of macromolecular structures. J. Mol. Graph.
14 : 51-55. https://doi.org/10.1016/0263-7855(96)00009-4
Kraulis PJ (1991) MOLSCRIPT. A program to produce both detailed
and schematic plots of protein structures. J. Appl. Crystallogr. 24 :
947-950. https://doi.org/10.1107/s0021889891004399
Krissinel E, Henrick K (2007) Inference of macromolecular assem-
blies from crystalline state. J. Mol. Biol. 372 : 774-797. https://doi.
org/10.1016/j.jmb.2007.05.022
Krojer T, Talon R, Pearce N, Collins P, Douangamath A, Brandao-
Neto J, Dias A, Marsden B, Von Delft F (2017) The XChemEx-
plorer graphical workflow tool for routine or large-scale protein-
ligand structure determination. Acta Crystallogr. Sect. D Struct. Biol.
73 : 267-278. https://doi.org/10.1107/S2059798316020234
Laskowski RA, MacArthur MW, Moss DS, Thornton JM (1993)
PRO- CHECK : a program to check the stereochemical quality of
protein structures. J. Appl. Crystallogr. 26 : 283-291.
https://doi.org/10.1107/ s0021889892009944
Lebedev AA, Young P, Isupov MN, Moroz O V., Vagin AA, Murshu-
dov GN (2012) JLigand : Un outil graphique pour la bibliothèque de
modèles et de contraintes CCP4. Acta Crystallogr. Sect. D Biol.
Crystallogr. 68 : 431-440.
https://doi.org/10.1107/S090744491200251X
Long F, Vagin AA, Young P, Murshudov GN (2007) BALBES : A
mo- lecular-replacement pipeline. [document WWW]. Acta
Crystallographi- ca Section D : Biological Crystallography. 125-132.
Union internationale de cristallographie.
https://doi.org/10.1107/S0907444907050172
McCoy AJ, Grosse-Kunstleve RW, Adams PD, Winn MD, Storoni
LC, Read RJ (2007) Phaser crystallographic software. J. Appl.
Crystallogr. 40 : 658-674.
https://doi.org/10.1107/S0021889807021206
McPherson A, Gavira JA (2014) Introduction à la cristallisation des
protéines. Acta Crystallogr. Sect. FStructural Biol. Commun. 70 : 2-
20. https://doi. org/10.1107/S2053230X13033141
Miller R, Gallo SM, Khalak HG, Weeks CM (1994) SnB : crystal
struc- ture determination via shake-and-bake. J. Appl. Crystallogr.
27 : 613- 621. https://doi.org/10.1107/S0021889894000191
Minor W, Cymborowski M, Otwinowski Z, Chruszcz M (2006) HKL-
3000 : The integration of data reduction and structure solution -
From diffraction images to an initial model in minutes. Acta
Crystal- logr. Sect. D Biol. Crystallogr. 62 : 859-866.
https://doi.org/10.1107/ S0907444906019949
Moriarty NW, Grosse-Kunstleve RW, Adams PD (2009) Electron- ic
ligand builder and optimization workbench (eLBOW) : A tool for
ligand coordinate and restraint generation. Acta Crystallogr. Sect.
D Biol. Crystallogr. 65 : 1074-1080. https://doi.org/10.1107/
S0907444909029436
Mueller U, Thunnissen M, Nan J, Eguiraun M, Bolmsten F, Milàn-
Otero A, Guijarro M, Oscarsson M, de Sanctis D, Leonard G
(2017) MXCuBE3 : Une nouvelle ère de contrôle des faisceaux
MX commence. Syn- chrotron Radiat. News 30 : 22-27.
https://doi.org/10.1080/08940886.
2017.1267564
Otwinowski Z, Minor W (1997) Processing of X-ray diffraction data
collected in oscillation mode. [Document WWW]. Méthodes
Enzymol. 307–326. https://doi.org/10.1016/S0076-6879(97)76066-
X
Panjikar S, Parthasarathy V, Lamzin VS, Weiss MS, Tucker PA
(2005) Auto-Rickshaw : An automated crystal structure
determination plat- form as an efficient tool for the validation of an
X-ray diffraction experiment. Acta Crystallogr. Sect. D Biol.
Crystallogr. 61 : 449-457. htt-
ps://doi.org/10.1107/S0907444905001307
Pearce NM, Krojer T, Bradley AR, Collins P, Nowak RP, Talon R,
Marsden BD, Kelm S, Shi J, Deane CM, Von Delft F (2017) Une
à partir d'une densité électronique conventionnellement
ininterprétable. Nat. Commun.
8 : 1-8. https://doi.org/10.1038/ncomms15123
Pellegrini E, Piano D, Bowler MW (2011) Refroidissement
cryogénique direct de cristaux nus : Les agents de cryoprotection
sont-ils toujours nécessaires ? Acta Crystal- logr. Sect. D Biol.
Crystallogr. 67 : 902-906. https://doi.org/10.1107/
S0907444911031210
Pettersen EF, Goddard TD, Huang CC, Couch GS, Greenblatt DM,
Meng EC, Ferrin TE (2004) UCSF Chimera - a visualization system
for exploratory research and analysis. J. Comput. Chem. 25 : 1605-
12. https://doi.org/10.1002/jcc.20084
Poornam GP, Matsumoto A, Ishida H, Hayward S (2009) A method for
the analysis of domain movements in large biomolecular com-
plexes. Proteins Struct. Funct. Bioinforma. 76 : 201-212. https://doi.
org/10.1002/prot.22339
Potterton L, McNicholas S, Krissinel E, Gruber J, Cowtan K, Emsley
P, Murshudov GN, Cohen S, Perrakis A, Noble M (2004) Devel-
opments in the CCP 4 molecular-graphics project. Acta Crystallogr.
Sect. D Biol. Crystallogr. 60 : 2288-2294. https://doi.org/10.1107/
S0907444904023716
Powell HR (2017) Traitement des données radiologiques. [Document
WWW]. Biosci.
Rep. 37 : 20170227. https://doi.org/10.1042/BSR20170227
Rodríguez D, Sammito M, Meindl K, De Ilarduya ĨM, Potratz M,
Sheldrick GM, Usón I (2012) Practical structure solution with AR-
CIMBOLDO. Acta Crystallogr. Sect. D Biol. Crystallogr. 68 : 336-343.
https://doi.org/10.1107/S0907444911056071
Russo Krauss I, Merlino A, Vergara A, Sica F (2013) An Overview of
Biological macromolecule crystallization. Int. J. Mol. Sci. 14 :
11643- 11691. https://doi.org/10.3390/ijms140611643
Sheldrick GM (2008) Une brève histoire de SHELX. Acta Crystallogr.
Sect. A Found. Crystallogr. 64 : 112-122. https://doi.org/10.1107/
S0108767307043930
Sheldrick GM (2010) Experimental phasing with SHELXC/D/E :
Combining chain tracing with density modification. Acta Crystal-
logr. Sect. D Biol. Crystallogr. 66 : 479-485.
https://doi.org/10.1107/ S0907444909038360
Sievers F, Wilm A, Dineen D, Gibson TJ, Karplus K, Li W, Lopez R,
McWilliam H, Remmert M, Söding J, Thompson JD, Higgins DG
(2011) Fast, scalable generation of high-quality protein multiple se-
quence alignments using Clustal Omega. Mol. Syst. Biol. 7 : https://
doi.org/10.1038/msb.2011.75
Slabinski L, Jaroszewski L, Rychlewski L, Wilson IA, Lesley SA,
Godzik A (2007) XtalPred : a web server for prediction of pro- tein
crystallizability. Bioinformatics 23 : 3403-3405. https://doi.
org/10.1093/bioinformatics/btm477
Terwilliger T (2004) SOLVE et RESOLVE : Automated structure so-
lution, density modification, and model building. J. Synchrotron
Ra- diat. 11 : 49-52. https://doi.org/10.1107/S0909049503023938
Terwilliger TC, Berendzen J (1999) Automated MAD and MIR struc-
ture solution. Acta Crystallogr. Sect. D Biol. Crystallogr. 55 : 849-861.
https://doi.org/10.1107/S0907444999000839
Terwilliger TC (2001) Maximum-likelihood density modification us-
ing pattern recognition of structural motifs. Acta Crystallogr. Sect.
D Biol. Crystallogr. 57 : 1755-1762. https://doi.org/10.1107/
S0907444901013737
Tickle IJ, Flensburg C, Keller P, Paciorek W, Sharff A, Vonrhein C,
Bricogne G (2018) STARANISO. Cambridge, Royaume-Uni Glob.
Phasing Ltd.
Vagin A, Teplyakov A (1997) MOLREP : An automated program for
molecular replacement. J. Appl. Crystallogr. 30 : 1022-1025.
https:// doi.org/10.1107/S0021889897006766
Vagin A, Lebedev A (2015) MoRDa , an automatic molecular replace-
ment pipeline . Acta Crystallogr. Sect. A Found. Adv. 71 : s19-s19.
htt- ps://doi.org/10.1107/s2053273315099672
Vaguine AA, Richelle J, Wodak SJ (1999) SFCHECK : A unified set
of procedures for evaluating the quality of macromolecular
structure- factor data and their agreement with the atomic model.
Acta Crystal- logr. Sect. D Biol. Crystallogr. 55 : 191-205.
https://doi.org/10.1107/ S0907444998006684
Vera L, Stura EA (2014) Stratégies pour la cryocristallographie des
protéines. Cryst. Growth Des. 14 : 427-435.
https://doi.org/10.1021/cg301531f Vriend G (1990) WHAT IF : Une
modélisation moléculaire et la conception de médicaments.
programme. J. Mol. Graph. 8 : 52-56. https://doi.org/10.1016/0263-
7855(90)80070-V
Wallace AC, Laskowski RA, Thornton JM (1995) LIGPLOT : a pro-
gram to generate schematic diagrams of protein-ligand interactions.
Protein Eng. Des. Sel. 8 : 127-134. https://doi.org/10.1093/pro-
tein/8.2.127
Wilkinson MD, Dumontier M, Aalbersberg IJ, Appleton G, Axton M,
Baak A, Blomberg N, Boiten JW, da Silva Santos LB, Bourne PE,
Bouwman J, Brookes AJ, Clark T, Crosas M, Dillo I, Dumon O,
Edmunds S, Evelo CT, Finkers R, Gonzalez-Beltran A, Gray AJ,
Groth P, Goble C, Grethe JS, Heringa J, 't Hoen PA, Hooft R, Kuhn
T, Kok R, Kok J, Lusher SJ, Martone ME, Mons A, Packer AL,
Persson B, Rocca-Serra P, Roos M, van Schaik R, Sansone SA,
Schultes E, Sengstag T, Slater T, Strawn G, Swertz MA, Thomp-
son M, van der Lei J, van Mulligen E, Velterop J, Waagmeester A,
12 K. Kurpiewska et autres Article sous
presse
Wittenburg P, Wolstencroft K, Zhao J, Mons B (2016) Comment : Winter G, Waterman DG, Parkhurst JM, Brewster AS, Gildea RJ, Ger-
Les principes directeurs FAIR pour la gestion et l'intendance des stel M, Fuentes-Montero L, Vollmar M, Michels-Clark T, Young
données scientifiques. Sci. Data 3 : 1-9. ID, Sauter NK, Evans G (2018) DIALS : Mise en œuvre et évalua-
https://doi.org/10.1038/sdata.2016.18 Winn MD, Ballard CC, Cowtan tion d'un nouveau paquet d'intégration. Acta Crystallogr. Sect. D
KD, Dodson EJ, Emsley P, Evans PR, Keegan RM, Krissinel EB, Struct. Biol. 74 : 85-97.
Leslie AGW, McCoy A, McNicholas SJ, Murshudov GN, Pannu NS, https://doi.org/10.1107/S2059798317017235
Potterton EA, Powell HR, Read RJ, Vagin A, Wilson KS (2011) Zhang CY, Wu ZQ, Yin DC, Zhou BR, Guo YZ, Lu HM, Zhou R Bin,
Overview of the CCP4 suite and cur- rent developments. Acta Shang P (2013) A strategy for selecting the pH of pro- tein
Crystallogr. D. Biol. Crystallogr. 67 : 235-42. solutions to enhance crystallization. Acta Crystallogr. Sect. F
https://doi.org/10.1107/S0907444910045749 Struct. Biol. Cryst. Commun. 69 : 821-826. https://doi.org/10.1107/
Winter G (2010) Xia2 : An expert system for macromolecular crystal- S1744309113013651
lography data reduction. J. Appl. Crystallogr. 43 : 186-190. https:// Zhang J, Madden TL (1997) PowerBLAST : A new network BLAST
doi.org/10.1107/S0021889809045701 application for interactive or automated sequence analysis and
anno- tation. Genome Res. 7 : 649-656.
https://doi.org/10.1101/gr.7.6.649

Vous aimerez peut-être aussi