Académique Documents
Professionnel Documents
Culture Documents
Epub : No
5589 Papier sous presse
https://doi.org/10.18388/abp.2020_5589
Consultez le site
L'objectif de cette brève revue est de fournir une Dédicace : Cet article fait partie du numéro spécial de l'ABP
feuille de route aux cristallographes débutants qui dédicacé au Prof. Władek Minor. Tous nos vœux pour votre 75e
anniversaire, Władek. Profitant de cette occasion, Tomasz
ont peu ou pas d'expérience en biologie structurale Borowski aimerait exprimer sa gratitude pour l'hospitalité de
et qui souhaitent pourtant produire des cristaux de Władek Minor envers lui et ses étudiants à chaque occasion,
protéines et analyser leurs structures 3D pour mais surtout pour les avoir accueillis dans le laboratoire de
comprendre leurs rôles biologiques. Pour atteindre Władek à UvA.
cet objectif, il est essentiel de procéder à la Abréviations :
cristallisation, à la détermination de la structure, à la
visualisation et à l'analyse des caractéristiques INTRODUCTION
structurelles de la protéine liées à sa fonction
biologique. En gardant cet objectif à l'esprit, les La cristallographie macromoléculaire aux rayons X
conseils présentés ici couvrent les étapes les plus est au service de diverses disciplines scientifiques et
importantes d'une tentative de cristallographie et accélère considérablement les découvertes dans de
présentent une sélection de bases de données et de nombreux domaines de recherche, notamment les études
logiciels qui peuvent aider et accélérer l'ensemble du sur la fonction biologique des protéines, le dépistage et
processus. Nous espérons que ce bref aperçu aidera le dé- signe des médicaments, ainsi que la santé et les
les novices issus de différentes disciplines à maladies humaines. Au fil des décennies, la
s'orienter dans un projet de cristallographie des biocristallographie a évolué parallèlement aux
protéines et, espérons-le, permettra d'éviter développements de l'informatique, qui ont permis une
certaines erreurs coûteuses, même si être détermination plus rapide des structures. En
cristallographe signifie apprendre par essais et conséquence, on observe une croissance spectaculaire
erreurs. du nombre de nouveaux logiciels, de bases de données
avancées et de serveurs bio-informatiques. L'ampleur de
Mots clés : biocristallographie, logiciel de cristallographie, l'intérêt croissant pour la biologie structurale, et donc
détermination de la structure, outils bioinformatiques, base de aussi pour la biocristallographie, est démontrée par le
données.
trafic sur la base de données centrale Protein Data Bank
Reçu : 10 janvier 2021 ; révisé : 28 février 2021 ; accepté : (Berman et al., 2000). Dans le monde entier, plus d'un
31 mars 2021 ; disponible en ligne le 11 août 2021.
million d'utilisateurs visitent la banque de données sur
les protéines chaque année, si l'on en juge par le nombre
✉e-mail : katarzyna.kurpiewska@uj.edu.pl (KK) ; d'adresses IP uniques. Ils effectuent plus de 1,5 million
tomasz.borowski@ ikifp.edu.pl (TB)
Remerciements pour le soutien financier : T.B. reconnaît le de chargements descendants de structures chaque jour,
soutien financier partiel du projet par le fonds de recherche soit plus de 500 millions par an (Bruno et al. , 2017).
statutaire de l'ICSC PAS. Au-delà du résultat final
Figure 1. Feuille de route pour l'expérience biocristallographique.
2 K. Kurpiewska et autres Article sous
presse
Depuis l'expérience cristallographique, on peut se sentir que l'on peut ensuite aligner en utilisant le programme
perdu dans l'écosystème diversifié et florissant des Clustal Omega (Sievers et al. , 2011) disponible sur le
logiciels utilisés au cours du processus de détermination serveur.
et d'analyse de la structure. Nous tentons ici de créer une Des informations sur les domaines protéiques et leur
feuille de route (Fig. 1) pour les débutants en organisation au sein d'une protéine donnée, ainsi que sur
cristallographie des protéines sous la forme d'un la famille de protéines à laquelle la protéine appartient,
ensemble de conseils comprenant une modeste sélection peuvent être recherchées dans la base de données Pfam
de logiciels de cristallographie macromoléculaire et (http://pfam.xfam.org/) (El-Gebali et al., 2019). Cette
d'outils bioinformatiques essentiels pour le voyage d'un base de données dispose d'un moteur de recherche
cristallographe. Toutefois, il ne s'agit pas d'une revue convivial qui accepte, entre autres, les identifiants
exhaustive des progiciels, services ou produits UniProt et PDB. L'entrée pour chaque famille de
commerciaux disponibles gratuitement. Cet aperçu protéines fournit des informations très utiles sur les
subjectif réalisé par les auteurs comprend des ressources architectures des protéines, les structures disponibles
bien connues de la communauté et actuellement déposées dans la PDB, les espèces et les arbres
disponibles. Nous espérons que les "sept conseils" phylogénétiques et, surtout, elle permet de visualiser ou
pourront servir de point de départ, notamment pour les de télécharger les alignements de séquences stockés
jeunes chercheurs, et qu'ils inciteront les lecteurs à pour la famille. Un logo de profil disponible pour la
approfondir leurs connaissances cristallographiques. famille aide à identifier les résidus con- servés et les
positions variables.
CONSEIL 1 : APPRENEZ CE QUE L'ON SAIT SUR VOTRE
La solubilité des protéines dans E. coli peut être
PROTÉINE
prédite sur la base de la séquence d'acides aminés des
protéines à l'aide du serveur SoluProt
(https://loschmidt.chemi.muni.cz/solu- prot/) (Hon et
Un bon point de départ pour recueillir des al., 2020), qui utilise des techniques d'apprentissage
informations sur la protéine choisie est le serveur automatique formées sur des bases de données
UniProt (https://www. uniprot.org/) (Bateman, 2019). Il expérimentales sélectionnées.
offre un moteur de recherche avancé qui accepte, entre Avant de commander ou de cloner un gène pour la
autres, le nom de la pro- teine, le numéro CE ou, via une protéine à cristalliser, il est conseillé d'examiner les
option de recherche BLAST (Zhang & Madden, 1997), résultats du serveur XtalPred
sa séquence d'acides aminés. L'entrée UniProt fournit (https://xtalpred.godziklab.org/Xtal- Pred-cgi/xtal.pl)
des informations clés sur la fonction de la protéine, son (Slabinski et al. , 2007). En utilisant la séquence
nom et sa taxonomie, sa localisation subcellulaire, ses d'acides aminés comme entrée, le serveur prédit une
modifications post-traductionnelles, ses interactions série de propriétés physico-chimiques et, sur la base de
avec elle-même ou avec d'autres protéines, sa similarité celles-ci, en utilisant la méthode d'apprentissage
avec d'autres protéines et domaines présents dans la automatique (forêt aléatoire), prédit la cristallisabilité
protéine et sa séquence d'acides aminés. Des références des protéines. Des rapports détaillés sur les valeurs des
bibliographiques aux sources d'information sont caractéristiques cibles calculées par rapport aux
fournies, ainsi qu'une riche sélection de références distributions des succès et des échecs de cristallisation
croisées avec d'autres bases de données. L'une des permettent de juger quelle caractéristique peut
fonctions très utiles du serveur est l'option "Ajouter au potentiellement être un obstacle majeur à la
panier" disponible dans la section Séquence. Son cristallisation. Les caractéristiques de la séquence
utilisation permet de rassembler un ensemble de prédite, avec la séquence d'acides aminés, peuvent aider
protéines. à la conception de la construction, par exemple en
suggérant d'enlever un peptide signal ou un long
fragment désordonné.
Figure 2. Détermination de la structure cristalline.
Article dans la presse Sept conseils rapides pour les débutants en cristallographie des protéines 3
aux extrémités de la protéine. Les résultats de XtalPred, Il est recommandé d'utiliser une concentration de 1 à 25
combinés avec les informations extraites de la base de mg/ml (10 à 15 mg/ml en général). Les protéines
données Pfam, peuvent également aider à décider si la eucaryotes ont tendance à être moins solubles que les
protéine multi-domaines doit être cristallisée en tant que protéines bactériennes. Toutes les autres approches
telle ou en tant que fragments séparés. La section dépendent fortement de la quantité de l'échantillon de
"homologues" des résultats fournit, entre autres, une protéines, de l'équipement disponible et des ressources.
liste d'homologues de structure connue déposés dans la Comme nous l'avons déjà mentionné, la recherche des
base de données PDB, ce qui constitue une information conditions optimales de cristallisation est encore un
précieuse quant à la faisabilité de la résolution de la processus d'essais et d'erreurs, renforcé par l'utilisation
structure par une méthode de remplacement de cribles disponibles dans le commerce. Cependant, il
moléculaire, qui est actuellement le moyen le plus existe quelques approches rationnelles basées sur des
courant de résoudre la structure cristalline. Pour être preuves qui sont très susceptibles d'améliorer les
utile à cette fin, l'homologue doit avoir une séquence chances d'obtenir des cristaux de protéines. Outre la
d'acides aminés qui est au moins 20-25% identique à pureté de l'échantillon de protéine, le deuxième aspect
celle de la protéine cible. Les homologues peuvent très important est basé sur les observations selon
également être recherchés directement sur le serveur lesquelles le pH de la solution de cristallisation a un
PDB (https://www.rcsb.org/) en utilisant une option de impact significatif sur la croissance des cristaux. Il a été
recherche avancée et la séquence d'acides aminés suggéré que le pH devrait s'écarter du pI de la protéine
comme entrée. Si des homologues suffisamment jusqu'à 3 unités de pH et que le pH de la solution
proches et dont la structure est connue ne sont pas protéique devrait être "aussi bas, aussi élevé ou aussi
disponibles, il faut alors envisager un phasage divergent du pI que possible pour les protéines basiques,
expérimental, parmi lequel la méthode de diffraction acides ou neutres, respectivement, dans leur gamme de
anormale à une seule longueur d'onde (SAD) est la plus pH stable" (Zhang et al., 2013). Ainsi, le criblage initial
courante. La SAD utilise un signal anormal provenant des conditions de cristallisation doit explorer le plus
soit de composants naturels de la protéine étudiée (par large ensemble de pH/précipitants/tampons/additifs, ce
exemple Zn, Cu, Fe, Mn, Ni, ou dans les cas les plus qui peut être facilement réalisé à l'aide de kits de
courants S), soit de la sélénométhionine (Se- Met), cristallisation fournis par de nombreux fournisseurs. La
introduite dans la protéine (par le biais d'un milieu de meilleure façon d'augmenter le succès de la
croissance bactérien ou de levure) pendant la production cristallisation macromoléculaire est d'initier une
de la protéine. collaboration avec un groupe de biologie structurale ou
Puisque tout le processus de détermination de la avec des installations centrales dédiées équipées de
structure commence à partir d'un échantillon de protéine robots de cristallisation, de chambres froides et/ou
(Fig. 2), après avoir rassemblé toutes les informations d'hôtels à cristaux. Un certain nombre d'initiatives de ce
disponibles sur la macromolécule étudiée, le chercheur type, qui soutiennent leurs utilisateurs tout au long du
doit répondre à quelques questions supplémentaires processus de cristallisation, se sont rapidement
concernant la source de la protéine ou sa production. multipliées au cours des dernières années dans le monde
Une bonne procédure de planification à cette étape, qui entier. Ce qui est encourageant dans la manipulation ro-
comprend des décisions concernant le travail avec des botique des plaques de cristallisation, c'est la quantité
domaines multiples ou uniques de la molécule étudiée et substantiellement plus petite de l'échantillon utilisé par
la troncature éventuelle des parties flexibles, ainsi que la les ro- bots de cristallisation par rapport au chemin
connaissance d'un large éventail de méthodes utilisées traditionnel avec des gouttes de cristallisation
pour résoudre les structures basées sur les configurées manuellement où un volume d'échantillon
caractéristiques intrinsèques de la macromolécule (c'est- entre 1 μL et 5 μL est utilisé. Par exemple, pour mettre
à-dire la teneur en métaux, les dérivés de SeMet, etc. Il en place 10 écrans (96 conditions chacun), il faut
est bon de se rappeler que le stockage de l'échantillon de préparer 150-200 microlitres de protéines à la
protéine peut être critique. Toutes les protéines ne concentration appropriée. La discussion des principes
supportent pas la congélation à -20°C, la plupart des théoriques qui sous-tendent la cristallisation (McPherson
échantillons sont donc conservés à 4°C ou -80°C, mais et Gavira, 2014 ; Russo Krauss et al. , 2013), la
l'activité et la stabilité doivent être régulièrement description des stratégies concernant les
vérifiées. En outre, en règle générale, il est préférable de expérimentations (Cheraghian Radi et al. , 2021) et la
stocker les protéines concentrées plutôt que diluées. manière de procéder à l'optimisation (He et al. , 2020)
dépassent le cadre de cette revue. Cependant, dans le
CONSEIL 2 : LA CRISTALLISATION EST UN ART, MAIS
prolongement de ce conseil, nous aimerions signaler une
LA PLANIFICATION EST CONSEILLÉE
autre approche rationnelle permettant d'améliorer les
chances de cristallisation - la réduction de l'entropie de
la surface des protéines, qui peut être planifiée à l'aide
Avant de planifier les expériences de cristallisation, il du serveur SERp (http://services.mbi.ucla.edu/SER/)
est important de réaliser quels sont les facteurs qui (Gold- schmidt et al. , 2007). Le serveur identifie les
influencent la croissance des cristaux (Tableau 1).
Toutes ces variables, catégorisées comme physiques, régions de la surface de la protéine caractérisées par une
grande liberté de con- formation de la chaîne latérale (et
chimiques ou biochimiques, peuvent fortement impacter donc, l'entropie) et, sur la base des résultats de la
le processus de formation des cristaux. Les détails de prédiction de la structure secondaire (les régions de
ces différents paramètres ont été largement décrits dans bobine sont préférées) et de l'alignement de la séquence
la littérature (Abdalla, 2016 ; Bhat et al , 2018). En
pratique, la puri- té, l'homogénéité et la stabilité de sur des protéines homologues (analyse de conservation
des acides aminés), il suggère les meilleurs candidats
l'échantillon de protéines sont les tout premiers facteurs
à prendre en compte. La concentration en protéines (jusqu'à trois résidus consécutifs) pour la mutation. On
dépend toujours de chaque cas, mais pour les ini- s'attend à ce que le mutant qui en résulte ait un faible
taux d'alcoolémie.
Tableau 1. Paramètres affectant la cristallisation des
protéines.
Facteurs physiques Facteurs chimiques Facteurs biochimiques
• Température • Concentration de l'échantillon • Pureté de l'échantillon
• Pression
• Temps • Type de mémoire tampon • Homogénéité de l'échantillon
• pH • pI de l'échantillon
• Viscosité • La force ionique • Modifications de la séquence (réduction de
• Champs magnétiques ou • Type de précipitant
électriques l'entropie de la surface des protéines,
• Vibrations et sons • Concentration du précipitant utilisation de codons à traduction rapide ou
• Additifs : ions lourds, ions lente, mutants d'interface).
• Méthode de cristallisation métalliques, polyions, • Modifications post-traduction
• Surface de la goutte de
cristallisation détergents. • Modifications chimiques
• Nucléants • Ligands, cofacteurs, inhibiteurs • Protéolyse
• Taux d'équilibrage
4 K. Kurpiewska et autres Article sous
presse
er la pénalité entropique pour la transition de l'état en urements et capillaires. Avec l'utilisation de la boucle
solution qui est un peu plus grande que le cristal, après l'avoir
à l'état de cristal. repêché, le cristal peut être transféré par étapes dans des
En supposant que les cristaux de protéines peuvent so- lutions de cryoprotection avec une concentration
être vus dans la goutte, il faut maintenant se poser la progressivement accrue du cryoprotecteur ou peut être
question "quelle est la suite ?". Comment manipuler les immédiatement trempé dans la solution de
cristaux ? Comment préparer les échantillons pour leur cryoprotection finale déjà établie (Vera & Stura, 2014).
voyage vers le synchrotron et pour la collecte des Dans les deux cas, l'étape suivante nécessite le transfert
données ? Les cristaux qui ont un bel aspect au du cristal dans l'azote liquide. Après le refroidissement
microscope ne sont qu'un début prometteur. Travailler rapide, les cristaux doivent être directement montés sur
avec des cristaux de protéines n'est pas le plus facile. le diffractom- teur de rayons X ou placés dans un
Avant les mesures, il faut les récolter et les protéger de Dewar, où les échantillons peuvent être conservés aussi
la destruction. Comme les cristaux sont formés à partir longtemps que nécessaire. Une fois congelés, les
de solutions à base d'eau, une grande partie de leur cristaux sont transportés dans des conditions
réseau cristallin est composée d'eau (Chayen & cryogéniques, généralement à l'aide de dewars à
Saridakis, 2008). La présence d'une grande quantité de expédition sèche.
liqueur mère dans les cristaux garantit que les molécules
de protéines adoptent une conformation native similaire CONSEIL 3 : PRÉVOYEZ UN PLAN POUR LA COLLECTE DES
à celle observée dans des conditions physiologiques. De DONNÉES
plus, la présence de canaux d'eau permet d'introduire
facilement des composants de faible poids moléculaire La partie la plus importante de ce conseil pourrait être
dans les cristaux de protéines, par exemple des ions résumée en une phrase : la collecte de données est la
d'éléments lourds, des inhibiteurs ou des ac- tivateurs dernière expérience dans le cadre d'une détermination de
(Gnesi & Carugo, 2017). D'autre part, la présence d'eau structure et elle exige des compromis (Fig. 3). La
dans les cristaux a également un côté négatif. Lors des collecte de mauvaises données peut malheureusement
expériences de diffraction avec des rayons X intenses, ruiner tous les efforts précédents et influencer
des radicaux libres sont produits par le rayonnement considérablement les résultats attendus. Pour éviter cette
ionisant. Malheureusement, la présence de canaux d'eau situation, l'expérience de fractionnement doit être
permet à ces molécules très dangereuses de se propager préparée et réalisée après une planification minutieuse.
rapidement, et lorsqu'elles atteignent les molécules de La grande majorité des structures cristallines à rayons X
protéines, elles provoquent la destruction et la
dégradation du cristal. Pour atténuer ce processus, une de la Banque de données sur les protéines est basée sur
des données synchro- tron. Les sites synchrotron de
méthode de cryoprotection est appliquée (Pellegrini et pointe dédiés aux études structurelles d'échantillons
al., 2011). Cette étape est profondément liée à la biologiques offrent des faisceaux de petite taille et
suivante - la manipulation du cristal. Trouver le bon focalisés, qui permettent des mesures de diffraction de
agent cryoprotecteur et sa concentra- tion est une étape routine pour des échantillons de microcristaux. En outre,
cruciale pour préserver la bonne condi- tion des les collectes de données de diffraction des rayons X, y
cristaux. La sélection du cryoprotecteur reste un compris l'identification d'éléments à dispersion
exercice d'essai et d'erreur, où la première combinaison anormale optimisée ou la mise en phase, les expériences
qui "fonctionne" est acceptée. Au cours de cette étape, il avec des cristaux présentant de grandes cellules
faut se rappeler qu'une solution cryoprotectrice efficace
doit d'abord stabiliser le cristal, mais l'ajout d'un unitaires, ainsi que les mesures à haute résolution sont
désormais possibles avec des temps de mesure réduits.
cryoprotecteur doit aussi empêcher la formation de Les sources internes intenses du laboratoire servent
glace à la surface de l'échantillon pendant le également d'outils pour la collecte de données de
refroidissement rapide. A ce stade, nous devons diffraction à une seule longueur d'onde, ce qui permet
mentionner que le trempage dans une solution même d'obtenir des données adaptées à la mise en phase
cryoprotectrice n'est pas la seule méthode de protection efficace du S-SAD, mais elles sont limitées au
des cristaux de protéines contre les dommages. La rayonnement caractéristique du matériau de l'anode à
déshydratation, le refroidissement cryogénique à haute rayons X. Le processus d'enregistrement des
pression ou le recuit des cristaux peuvent également être diffractogrammes est un processus de longue haleine. Le
appliqués (Huang & Szebenyi, 2016). Les cristaux processus d'enregistrement des diffractogrammes repose
doivent être manipulés un par un et aussi rapidement
sur plusieurs principes qui doivent être pris en compte
que possible, sinon le cristal et la goutte peuvent sécher avant la collecte des données :
(en conséquence, les autres cristaux de la même goutte - Le premier paramètre important est la longueur
seront perdus). De nombreux outils pour la manipulation d'onde des rayons X qui vont frapper le cristal. Les
et le montage des cristaux peuvent être trouvés sur le rayons X sont de même nature que la lumière visible ou
marché : une grande variété de boucles (de différentes les ondes radio, la seule différence est leur longueur
formes et tailles), des micro-outils, des sets pour la d'onde, qui est très courte (environ 1Å). Un phénomène
mesure à température ambiante.... provoqué par l'interaction des ondes électromagnétiques
avec la matière à l'intérieur du cristal (notamment avec
les électrons) dépend de la longueur d'onde du
rayonnement.
Figure 3. Expérience de diffraction des rayons X.
Article dans la presse Sept conseils rapides pour les débutants en cristallographie des protéines 5
ont été réalisées au cours des dernières décennies, mais
Le choix de la longueur d'onde des rayons X utilisée il est fortement recommandé de comprendre les
pendant la collecte des données dépend de la stratégie fondements des protocoles appliqués mis en œuvre dans
qui sera utilisée pendant la détermination de la structure, le logiciel choisi (Powell, 2017).
et les approches les plus courantes sont le remplacement – La détermination de la stratégie apportera
moléculaire et les méthodes de signaux anormaux. Dans également des informations sur la plage d'oscillation et
le cas du remplacement moléculaire, qui est viable le temps d'exposition. Pour collecter des données de
lorsque la structure de la pro- teine modèle est connue, haute qualité, il faut également tenir compte de la durée
une seule longueur d'onde sans considération de vie prévue du cristal, car les dommages dus aux
particulière des données anormales suffit. Les méthodes rayonnements limitent la résolution et la qualité des
de mise en phase des signaux anormaux nécessitent la données. Ce site
collecte de données anormales à une seule longueur
d'onde (SAD) pour des éléments marqueurs sélectionnés
(également possible pour le soufre natif (S-SAD) et le
phosphore natif (P-SAD)) ou de données de diffraction
anormales multiples (MAD). Dans ces cas, après la
détermination du spectre du bord d'absorption pour le(s)
marqueur(s) anormal(s), des ensembles de données sont
collectés à une ou plusieurs longueurs d'onde
sélectionnées afin d'obtenir le signal anormal maximal.
De même, lorsque des atomes métalliques sont déjà
présents dans la structure, il est conseillé de collecter le
spectre de fluorescence des rayons X, qui peut être
collecté dans la plupart des lignes de faisceaux
synchrotron. L'enregistrement des spectres de
fluorescence aux rayons X et la collecte d'ensembles de
données dif- férents au-dessus et au-dessous des bords
d'absorption correspondants du métal permettent, dans
la plupart des cas, de rassembler suffisamment de
preuves pour déterminer sans ambiguïté l'identité et
l'emplacement du métal d'intérêt, ainsi que pour
caractériser avec précision les ligands de coordination
dans l'environnement de liaison du métal au sein de la
protéine.
– En gardant à l'esprit que la structure cristalline est
codée dans les rayons X diffractés, où l'orientation du
cristal, la forme et la symétrie de la cellule unitaire
définissent les directions des faisceaux diffractés, tandis
que les positions de tous les atomes dans la cellule
unitaire définissent leurs intensités, quelques autres
aspects importants doivent être pris en compte pour une
collecte de données réussie, y compris l'inspection de la
première image de diffraction et la détermination de la
stratégie. L'examen visuel du premier diffractogramme
permet de distinguer facilement les échantillons de sel et
de protéines. En outre, pour les échantillons cryo-
refroidis, l'inspection de l'image collectée pour la
présence et la force des anneaux de diffraction causés
par la glace, révélera si le choix de l'agent
cryoprotecteur était approprié. Les logiciels modernes
peuvent traiter les régions qui doivent être exclues du
traitement des données dans les cas où de tels "anneaux
de glace" sont présents sur les images. L'observation de
taches fortes, bien formées et résolues jusqu'à une
région à haute résolution suggère que la collecte de
données de bonne qualité est possible. Néanmoins, il
n'est pas rare que la diffraction soit anisotrope. Pour
vérifier si l'intensité de la diffraction ne varie pas trop
avec l'orientation du réseau cristallin, une deuxième
image du cristal tourné de 45 ou 90 degrés doit
également être enregistrée et inspectée. L'expérience
préliminaire permet de tester la qualité du cristal et de
décider de la stratégie de collecte des données de
diffraction XRD, car la symétrie du cristal influence la
symétrie de la distribution des taches sur les images. Il
est donc crucial à ce stade de déterminer le groupe
d'espace et les dimensions de la cellule unitaire, ce qui
permettra d'obtenir des informations sur le nombre
d'images de diffraction à enregistrer. De plus,
l'évaluation de la résolution maximale aidera à prendre
la décision concernant la distance du détecteur par
rapport à l'échantillon. Des avancées majeures dans le
domaine du traitement automatisé des données en
termes d'indexation, d'intégration et de mise à l'échelle
https://www.diamond.ac.uk/
peut être réalisée par exemple avec les logiciels BEST • Elettra (Trieste, Italie) https://www.elettra.trieste.it/
(Bourenkov & Popov, 2010) ou RADDOSE • L'Installation européenne de rayonnement
(http://www.raddo.se/) (Garman, 2014). La stratégie synchrotron (ESRF ; Grenoble, France)
finale ap- pliquée dans la collecte des données dépend https://www.esrf.eu/
également de la géométrie disponible du goniostat. Plus • SOLEIL (Saint-Aubin, France) https://www.synchro-
le degré de liberté de l'orientation du cristal est élevé, tron-soleil.fr/en
mieux c'est. Les installations synchrotron les plus • Max IV (Lund, Suède) https://www.maxiv.lu.se/
courantes permettent de faire tourner les cristaux autour • Source lumineuse suisse (SLS ; Villigen PSI, Suisse)
d'un seul axe (phi), tandis que les diffractomètres https://www.psi.ch/en/sls
internes comportent des goniostats à 3 ou 4 axes, mais un
nombre croissant de lignes de faisceaux de
cristallographie macromoléculaire permettent également
de faire tourner l'échantillon autour de plus d'un axe. En
utilisant des détecteurs à grande surface, la rotation
autour d'un seul axe permet dans la plupart des cas
d'obtenir des données complètes, quelle que soit
l'orientation initiale du cristal. Les derniers logiciels
disponibles sur les sites synchrotron et les machines
internes aident grandement à prédire et à collecter les
données et supportent les méthodes de mise en phase les
plus populaires, néanmoins les décisions doivent être
prises par le cristallographe en fonction de toutes les
informations disponibles et précédemment recueillies.
L'expérience de collecte des données doit être menée
correctement afin d'obtenir des données complètes. Si la
stratégie a été mal planifiée ou si la puissance de
diffraction diminue rapidement, certaines réflexions
peuvent ne pas être mesurées du tout et les données
peuvent ne pas être complètes. Un certain nombre de
sites synchrotron pour la cristallographie
macromoléculaire en Europe fonctionnent avec
MXCuBE (Gabadinho et al. , 2010) et la dernière
version MXCuBE3 (Mueller et al. , 2017)
(https://mxcube.github.io/mxcube/), qui aide les
utilisateurs à prendre des décisions raisonnables pendant
la collecte des données. Un autre aspect important pour
tirer le meilleur parti du temps du faisceau est la
possibilité de pro- cesser vos données pendant ou juste
après la collecte des données. Un examen rapide des
statistiques finales sera bénéfique dans les situations où,
pour une raison quelconque, les mesures se sont mal
déroulées et où la collecte de données doit être répétée.
- Pour conclure ce conseil, n'oubliez pas que
l'élaboration d'un bon plan de collecte de données est un
effort qui portera ses fruits lors de l'étape de
détermination de la structure. Perdre une chance
d'obtenir de bonnes données pour des cristaux qui
n'étaient pas faciles à obtenir ou qui ne peuvent pas être
facilement reproduits peut être fatal pour le projet
scientifique.
En outre, une bonne pratique consiste à sauvegarder
les images brutes et à en conserver une copie au moins
jusqu'à ce que le travail comportant des résultats
structurels ait été accepté pour publication. Les
processus de validation de la structure et de révision du
manuscrit peuvent nécessiter la répétition de l'inspection
des données, voire la reproduction des données. En
outre, il est fortement conseillé de déposer les images
brutes dans un dépôt de données ouvert une fois que la
publication a été acceptée (voir ci-dessous).
Enfin, la plupart des faisceaux synchrotron européens
dédiés à la cristallographie macromoléculaire proposent
des conseils d'utilisation, l'accès à un système de gestion
(ISPyB) (De- lagenière et al. , 2011) et des directives
pour la collecte de données qui peuvent être trouvées sur
les sites web respectifs :
• ALBA (Barcelone, Espagne) https://www.cells.es/en/
contact-info/
• BESSY (Berlin, Allemagne) https://www.helmholtz-
berlin.de/forschung/quellen/bessy/index_en.html
• DESY (Hambourg, Allemagne) https://www.desy.de/
• Diamond Light Source (Oxfordshire, Royaume-Uni)
6 K. Kurpiewska et autres Article sous
presse
CONSEIL 4 : COMPRENDRE LE TRAITEMENT DES spécialisée. Il est de la responsabilité de l'auteur de recueillir
DONNÉES et de fournir des informations précises sur la qualité des
données qui répondent aux normes établies par la
Avant d'aborder les questions les plus importantes du communauté cristallographique. Les paramètres les plus
traitement des données, il convient de rappeler une importants concernant les résultats du traitement des
partie minimale de la théorie concernant l'expérience de données sont mentionnés ici. Le premier paramètre est la
diffraction. Chaque rayon derrière les réflexions qui résolution, qui limite l'ensemble des résultats réalisables.
peut être vu sur les images collectées est caractérisé par
son amplitude et sa phase. Cependant, seules les
amplitudes de réflexion, qui sont proportionnelles au
module du facteur de structure F, qui à son tour est une
somme des contributions de tous les atomes de la cellule
unitaire :
Groupe d'espace Le groupe de symétrie d'un motif cristallin tridimensionnel est appelé son
groupe spatial. Pour les macromolécules (chirales), il existe 65 symétries de
* groupe spatial possibles.
Les ondes diffractées par une distribution périodique de diffuseurs simples obéissent à la loi de Bragg, ce qui
permet de déterminer facilement les distances interplanaires et donc de retrouver aisément une description
de la structure cristalline. Lorsque les objets diffusants sont complexes (par exemple, dans les cristaux
Problème de moléculaires), le rayonnement diffracté subit un déphasage dû à la distribution spatiale des diffuseurs individuels.
phase * Les amplitudes des facteurs de structure résultants peuvent être directement dérivées des intensités mesurées
expérimentalement des faisceaux diffractés, mais pas les phases. Sans la connaissance des phases, il n'est
pas possible de reconstruire les positions atomiques individuelles. L'estimation des phases est une étape
essentielle pour une détermination de structure réussie.
Le facteur de structure Fhkl est une fonction mathématique décrivant l'amplitude et la phase d'une onde
Facteur de diffractée à partir de plans de réseau cristallin caractérisés par les indices de Miller h,k,l.
structure*.
MAD* Une approche pour résoudre le problème de phase dans la détermination de la structure des protéines en
comparant les facteurs de structure collectés à différentes longueurs d'onde, y compris le bord
d'absorption d'un diffuseur d'atomes lourds.
Une approche pour résoudre le problème de phase en se concentrant sur les relations de phase qui
MR* apparaissent par la diffraction des rayons X à partir de composants moléculaires similaires. Les composants
peuvent être des fragments moléculaires liés par une symétrie non cristallographique (par exemple, les
sous-unités icosaédriques d'un virus) ou une molécule similaire telle qu'une protéine homologue avec une
identité de séquence élevée.
La méthode de dispersion anormale à une seule longueur d'onde utilisée pour résoudre le problème de
SAD phase, utilise des données collectées à une seule longueur d'onde, généralement au niveau du pic
d'absorption ou de la distance à haute énergie. Elle minimise les problèmes de dommages dus au
rayonnement et de non-isomorphisme, mais nécessite des mesures très précises.
MIR Dans la méthode de remplacement isomorphe multiple, les effets d'interférence sur les intensités des
faisceaux diffractés causés par l'ajout d'atomes lourds à la protéine fournissent les estimations des angles
de phase.
Dans la détermination de la structure cristalline, le terme résolution est utilisé pour décrire la capacité de
Résolution* distinguer les caractéristiques voisines dans une carte de densité électronique. Par convention, elle est
définie comme l'espacement minimal des plans donné par la loi de Bragg pour un ensemble particulier
d'intensités de diffraction des rayons X. La résolution s'améliore avec l'augmentation de la valeur maxi- mum
de (sinθ)/λ à laquelle les réflexions sont mesurées.
Rmerg est une mesure de l'incertitude pour les réflexions non immergées :
Rmerge Où :
Ii(hkl) = intensité d'une réflexion individuelle avec les indices (hkl)
I(hkl= valeur moyenne de l'intensité pour toutes les réflexions d'indices (hkl), y compris celles qui sont
équivalentes par symétrie.
Rmeas est une mesure de l'incertitude pour les réflexions non immergées :
Rmeas
Où :
Ii(hkl) = intensité d'une réflexion individuelle avec les indices (hkl)
I(hkl= valeur moyenne de l'intensité pour toutes les réflexions d'indices (hkl), y compris celles qui sont
équivalentes par symétrie.
Rp.i.m. fournit une estimation de la qualité des données après la fusion de plusieurs observations :
Rp.i.m.
CC1/2
un seul jeu de données est divisé aléatoirement en deux sous-ensembles (la moitié des réflexions non
fusionnées avec les indices (hkl) sont placées dans le sous-ensemble x, et l'autre moitié dans le sous-
ensemble y dans la formulation ci-dessus) et CC est calculé entre ceux-ci.
Le terme "facteur R" en cristallographie, généralement utilisé pour désigner le facteur R "conventionnel",
est une mesure de concordance entre les amplitudes des facteurs de structure calculés à partir d'un
modèle cristallographique et celles des données originales de diffraction des rayons X (Fobs). Le facteur R est
R (Rwork)* calculé (Fcalc) pendant chaque cycle de raffinement de la structure par la méthode des moindres carrés afin
d'évaluer les progrès réalisés. Le facteur R final est une mesure de la qualité du modèle.
Une fonction résiduelle calculée pendant le raffinement de la structure de la même manière que le facteur
Rfree* R conventionnel (voir plus haut), mais appliquée à un petit sous-ensemble de réflexions qui ne sont pas
utilisées dans le raffinement du modèle structurel. Le but est de suivre l'évolution du raffinement et de
vérifier que le facteur R n'est pas réduit artificiellement par l'introduction d'un trop grand nombre de
paramètres.