Vous êtes sur la page 1sur 31

La structure 3D des protéines

L’approche bioinformatique

BENTAHAR M-C
Physiopathologie cellulaire, biotherapies & innovation
Déroulement des séances cours:

 10 séances de cours + 3 TP sur l'ensemble.

 Introduction
 Banques de données
 Séquençage et cartographie
 Comparaison de séquences
 Prédiction de gènes
 Annotation des protéines
 Applications
Objectifs du cours

 • Importance de la structure 3D

 • Intérêt des méthodes bioinformatiques

 • Plus-value relative du modèle théorique

 • Méthodologie générique pour obtenir un modèle


Les protéines :

véritables actrices de la vie cellulaire


Les acides aminés…
La structure des protéines
L’univers protéique
La structure 3D régit les interactions
Cristallographie aux rayons X
Résonance Magnétique Nucléaire
Techniques expérimentales limitées
Le paradoxe de Levinthal
L’alternative bioinformatique
Les méthodes prédictives
Modélisation comparative :
méthodologie

 Recherche d’homologues avec structure 3D connue


(Blastp vs. PDB)
 [ Recherche de structures à la topologie similaire
(threading par PSIPRED) ]
 Sélection de template(s)
 Alignement cible/template (Modeller + Seaview)
 Calcul du modèle théorique (Modeller)
 Evaluation et visualisation
Principe de la modélisation par homologie

 Structures mieux conservées que séquences !


 Si  homologie entre séquences
=>  homologie entre structures
=> prédiction modèle 3D par homologie possible
Principe de la modélisation par homologie
Protéine homologue dans la PDB ???

Si identité > 30% => OK


Si 20% < identité < 30 % => + difficile / risqué
Si identité < 20% => +++ difficile / impossible

 Estimation :

28% des séquences ont au moins 25% ID avec une protéine de structure
connue (PDB)
Modélisation « safe »
Les bases de données du TD

 PDB (Protein Data Bank) : données expérimentales sur


les structures 3D connues
=> coordonnées atomiques

 Pfam (Protein Family) : familles de protéines ayant des


domaines structuraux en commun
1. Recherche de séquence(s) homologue(s) dans
la PDB
Cfr. cours sur les méthodes d’alignement.

 Utilisation d’un algorithme pour chercher des protéines


de structure connue qui ont une séquence homologue à
notre séquence target et qui pourront ainsi être utilisées
comme template.
Alignements

Comparaison de séquences : les alignements


= une des premières étapes dans l’analyse des séquences

= comparaison de séquences dans le but de repérer les endroits où se trouvent


des régions identiques ou très similaires entre des séquences et d’en déduire
celles qui sont significatives et qui correspondent à un sens biologique de celles
qui sont observées par hasard.
Séquence1 LRTMPDSYGWPLVGPLSDRLDYFFFQITRAEKNIPPTFGN
..***.
*** ** .. * . * . .*
* . .*
* .*
* **
Séquence2 IKTMPERYGSEIISPGDEGWLYLYHNIEHFQKYLPIYLGN

% identité = 30% % similarité = 57%

similarité  homologie
 homologie si ancêtre commun
 homologie mesurée par similarité
Alignements

Objectif :

Révéler des informations importantes sur


• la structure,
• la fonction
• l’évolution
de ma(mes) séquence(s) d’intérêt

Quelqu'un a t-il déjà rencontré ce type de séquences ?


Si oui, je vais pouvoir avoir rapidement accès à toutes ses
connaissances !!
Modeler
- séquence Target
- structure Template
- alignement

 modèle 3D

Comment ?

=> Contraintes spatiales


= fonction de densité
de probabilité (pdf)

Contraintes :
- basées sur l’alignement
- stéréochimiques
- utilisateur éventuelles
Principe de développement de Modeller

Utilisation d’une base de données de protéines de structure connue correspondant à


des protéines homologues réparties en familles.

Cette base de donnée sert à déterminer :


- les paramètres (caractéristiques) relevants à utiliser lors de la prédiction
- comment utiliser ces paramètres

Les paramètres relevants sont déterminés par des méthodes statistiques (sans à
priori).

Une fois les paramètres relevants déterminés, la base de données est utilisée pour
déterminer les fonctions de densité de probabilité qui décrivent le lien entre les
paramètres.
Swiss Model & Swiss PDB Viewer

Serveur de modélisation par homologie automatisée accessible à l’adresse :


http://swissmodel.expasy.org/
ou via Swiss PDB Viewer (Deep View)
Swiss Model & Swiss PDB Viewer
Modeller  Swiss Model

Modeller :

L’entièreté de la structure de la protéine est modélisée en utilisant des


contraintes dérivées des structures templates.

Swiss Model :

La prédiction de la structure de la protéine se base sur un découpage


de la protéine en des régions conservées et des régions variables qui
sont modélisées séparément.

=> assemblage de fragments basés sur les structures templates.


FOLD
=
Type de repliement

Certaines protéines (même non-


homologues) adoptent le même fold.

La PDB regroupe environ 30.000


structures, ce qui fait environ 4.000
folds.
Pymol

Vous aimerez peut-être aussi