Vous êtes sur la page 1sur 55

Drug Design

• Généralités sur le drug discovery,


•contexte industriel
• Petites molécules / macromolécules
• Types atomiques, types d'interaction
• Acides aminés
• Energie et molécules
• Analyse conformationnelle
• Énergie libre
• Structure(s) 3D de la cible : Docking, SBDD
•Rigide
•Flexible
•molécules actives : Pharmacophores, QSAR
•pas de structure 3D de la cible,
pas de molécules actives : diversité
Modélisation moléculaire et recherche
Pharmaceutique (RDD,CADD, SBDD…)
Target Sélection
Structure 3D de la cible connue, faisabilité ?
ligands connus, pharmacophore ?
Recherche Hit finding
Virtual screening, database filtering
Hit to lead
docking, sélectivité
Lead Optimisation
virtual ADMET, chemogenomics

Développement
Evolution de la recherche en Drug discovery
Nouvelles technologies et nouvelles limitations
  70s
– Leads = produits naturels, hazard
– Optimisation tributaire de la chimie, fondée sur hypothèses
– Limitations : expérimentation animale

  90s
– Modélisation moléculaire
– Tests in-vitro ( inhibition d'enzymes, liaison au récepteur)
– Limitations : synthèse chimique

  2000
– Genie génétique (production de proteines)
– Structure-based drug design
– Chimie conbinatoire (mélanges)
– High-throughput screening (HTS)
– Limitations : propriété ADMET des leads

• 2000 
– Genomique, proteomique, pharmacogenomique, bioinformatique
– Animaux transgéniques proof of concept (POC)
– Chimie combinatoire (1 composé par puit, librairies focalisées ou diverses)
– Structure-based drug design
– Data mining (screening virtuel de très grande librairie)
– ADMET profiling (HTS et virtual ADMET, chemo-génomique)
– data pipelining
– Limitations : validation de cible, déluge de données
Causes des échecs en Drug Discovery

• mauvaise pharmacocinetique (mauvais profile ADME chez


l'homme, métabolites problématiques)

• Faibles activités cliniques

• Effets secondaires, toxicité (métabolites, sélectivité)

• Stratégie marketing

• Plus l'échec est tardif plus il coûteux !


Nouvelles Stratégies en Drug Design

• Conception d'inhibiteurs à partir de la structure du substrat

• Identification de Pharmacophores

• peptidomimétiques

• Structure-based drug design


Meilleure prise en compte de l'Affinité, de la sélectivité

• Computer-aided drug design

• Combinatorial drug design

• caratère drug-like, biodisponibilité (e.g., Lipinski’s Rule of Five)


Petites molécules / Macro-molécules
•Distinction en fonction de la chimie et de la complexité de la molécule,
cible ligand

•Distinction en terme d’accessibilité de la structure 3D par le calcul

•Similarité pour les interactions

N N

12,5 N
N
O
N
O
S
N
O N
O
O
O
H N
N
H H
N HRWM
O

O
Progestérone
COOH

O
O

PGF2a
Petites molécules / Macro-molécules

D’un point de vue computationnel,


une petite molécule est une molécule
N N pour laquelle on peut énumérer
N O
O
toutes ses conformations :
N N S
N
O N
O
O
O H
N
N H H

N O

20 liaisons sp3-sp3 incrémént 120° Cycles saturés fusionnés


Nconformations = 320 = 3.5 109

Pour une petite molécule, par analyse conformationnelle on peut calculer les
conformations d’énergies minimales (énumération)
(la conformation active implique l’énergie du complexe proteine-ligand !)
Petites molécules / Macro-molécules
Les différentes conformations des
macromolécules protéiques ne RFGENHAIMGVAFT
peuvent être WVMALACAAPPLV
recherchées exhaustivement. ARVSVARARLALA
AVAAVALAVALLPL
AVASQRRAWATVG
On ne peut déduire la structure 3D LVWAAALALGLLPL
d’une protéine à partir de sa seule TKITSKHVKMMLSG
VCLFAVFIALLPILG
séquence (protein folding).

L’information structurale fiable est


principalement expérimentale
par cristallographie ou RMN .

En revanche, ces polymères sont


simples au niveau de leur séquence
primaire (analyse de séquences et
obtention de modéles approximatifs
par homologie au sein de protéines
de la même famille)
Interactions moléculaires

Les interactions inter et intra-moléculaires sont de


plusieurs types

Interactions polaires
liaisons hydrogènes
interactions électrostatiques, pont salins
dipoles-dipoles

Interactions hydrophobes
aromatiques
aliphatiques
Interactions moléculaires

Les interactions polaires proviennent de la distribution inégales des charges dues aux
associations chimiques entre atomes d'électronégativités différentes
 fonctions chimiques

R
Liaison-H :
"Partage" un H
A -
D - H +

R
Energie ~ 5Kcal/mol
Liaisons H
Interactions électrostatiques
Interactions électrostatiques
Interactions hydrophobes
Des molécules, (fragments) apolaires ont tendance à s'associer avec des parties
Également apolaire  entropie

LogP = Log du coefficient de partition entre le 1-octanol et l'eau (logKO/W)

Biodisponibilité et LogP

• Le logP mesuré ou calculé (clogP) est un descripteur fondamental pour


estimer la biodisponibilité des molécules.
– Bonne balance hydrophobe/hydrophile
– Suffisamment hydrophile pour être soluble dans les milieux aqueux
(sang, liquide intersticiel, cytoplasme ...)
– Suffisamment hydrophobe pour traverser les membranes

• Valeurs typiques varient de -3 (très hydrophile) à +7 (très hydrophobe)

• La plupart des molécules Drug like ont des logP dans la gamme 2-5.
CH3
N
H CH3 O
CH3
N O
OH
O
O
O
OH H

Morphine (clog P = 0.24) Cocaine (clog P = 2.72)

N N OH H OH
N N CH3
N N
H O CH3
N O

Indinavir (clog P = 2.78) Imipramine (clog P = 4.49)


CARACTERE DRUG-LIKE
(1)
Lipinski “Rule of Five”

 MW  500 (opt = ~350)


 # accepteurs de liaison-H 10 (opt = ~5)
 # donneurs de liaison-H  5 (opt = ~2)
 -2 < cLog P < 5 (opt = ~3.0)
 # Flexibilité : rotules  5

1: C. Lipinski et al, Adv. Drug. Del. Rev, 23, 3-25 (1997)


Acides aminés
O
O

amine Ac carboxylique +
H3N C
H2N C CH O
-

CH OH

Carbonne R

R
alpha
A PH 7 : le groupe amino est ionisé NH3+
Chaine Et le groupe ac. Carboxylique aussi COO-
latérale
O R2

H2N C CH OH
Les acides aminés s'associent
Par liaison peptidique CH N C
(fonction amide polaire)   

R1 H O
Les chaines latérales, R, déterminent les differences dans les propriétées
structurales et chimiques des 20 acides aminés naturels .

classifications

•Aliphatiques/hydrophobes Ala, Leu, Ile, Val


•Polaires Asn, Gln
•Fonction Alcool Ser, Thr, (Tyr)
•Souffrés Met, Cys
•Aromatique Phe, Tyr, Trp, (His)
•Chargés Arg, Lys, Asp, Glu, (His)
•Speciaux
Gly (pas de R)
Pro (cyclic, imino-acid)
Les 20 acides aminés naturels
Petits Acides aminés

A Ala Alanine C Cys Cysteine


P Pro Proline

peu chargé, hydrophobe


Ponts SS
Imino acid
Petit, hydrophobe chélate les métaux Rigidité
Hélice alpha SH très réactif hydrophobe

G Gly Glycine S Ser Serine T Thr Threonine

Pas de R Petit, polaire Petit,


Très flexible Fonction Alcool hydrophobe
Hydrophobicité HBD, HBA Fonction Alcool
indéterminée HBD, HBA
H His Histidine K Lys Lysine R Arg Arginine

Gros,
Long, flexible
guanidine rigide
Neutre ou chargé + Hydrophile
Chargé +, HBD
Aromatique, HBD, HBA Chargé +, HBD

D Asp Aspartic acid E Glu Glutamic acid

Acides aminés
Hydrophile, Hydrophile,
Polaires
Chargé – , HBA Chargé – , HBA ou chargés
Taille
N Asn Asparagine Q Gln Glutamine
moyenne

Polaire, neutre Polaire, neutre


HBD, HBA HBD, HBA
Hydrophobes aliphatiques

M Met Methionine
V Val Valine

souffré Beta branché

L Leu Leucine I Ile Isoleucine

Beta branché
Hydrophobes aromatiques
F Phe Phenylalanine Y Tyr Tyrosine

F Phe Phenylalanine

Grand, hydrophobe Hydrophobe,


Phenol, HBD et HBA

W Trp Tryptophan

Grand, hydrophobe,
HBD
Energie et molécules

Les structures moléculaires et les interactions moléculaires sont gouvernées


Par des considérations énergétiques.

Les calculs d’énergies peuvent être effectués avec différents modèles

Au niveau de la mécanique quantique l’énergie de la molécule est calculée


À partir des interactions explicites entre les électrons et les noyaux.
méthodes ab-initio
méthodes semi-empiriques

Intérêt : précision Problèmes : temps de calcul 10-100s atomes

La mécanique moléculaire est une méthode empirique permettant de reproduire


raisonnablement des résultats expérimentaux à partir de modèles mathématiques
simples des interactions. Ces modèles sont paramétrés pour les principaux types
atomiques qui servent à décrire les molécules d’intérêt. L’ensemble fonction
mathématique + paramètres est appelé champ de force.

Intérêt : rapidité, taille Problèmes : paramétrisation, précision.


différences chimie quantique / mécanique
moléculaire
Méthodes quantiques
On distingue les noyaux et les électrons
Les interactions électrons-électrons et électrons-noyaux sont explicites.
Les interactions sont régies par les charges électroniques et nucléaires
(énergie potentielle) et les mouvements électroniques.
Les interactions déterminent la distribution spatiale des électrons et des noyaux
Ainsi que leurs énergies

Mécanique moléculaire
Noyaux et électrons sont modélisés en une seule particule
Particules sont sphériques (rayons atomiques expérimentaux ou théoriques)
et possède une charge nette (théorique)
Les interactions sont modélisées par des ressorts et des potentiels classiques
Les interactions doivent être préassignées à un jeu spécifique de type d’atomes
Les interactions déterminent la distribution spatiale des particules atomique et leurs
énergies
Energie et molécules

Energy =
Stretching Energy + Bending Energy +
Torsion Energy + Non-Bonded Interaction Energy
"K " contrôle la pente de la parabole
"K " contrôle la pente de la parabole
"A" contrôle l'amplitude et "n" la périodicité "phi" est la phase
"A" et "B" controlent la profondeur et la position du puit pour i et j
# Code Definition # Code Definition
1 C.3 carbon sp3 12 P.3 phosphorous sp3
2 C.2 carbon sp2 13 H hydrogen
hydrogen in Single
4 C.1 carbon sp 13 H.spc Point Charge (SPC)
water model
hydrogen in
Transferable
3 C.ar carbon aromatic 13 H.t3p intermolecular
Potential (TIP3P) water
model
carbocation (C+) used
33 C.cat only in a guadinium 16 F fluorine
group
5 N.3 nitrogen sp3 15 Cl chlorine
6 N.2 nitrogen sp2 14 Br bromine
7 N.1 nitrogen sp 17 I iodine
11 N.ar nitrogen aromatic 27 Si silicon

28 N.am nitrogen amide 20 LP lone pair


nitrogen trigonal
19 N.pl3 26 Du dummy
V k b  b 
bonds
b 0
2
  k    
angles
0
2

N
   K 1  cos n       K    
dihedrals n 1
 n
impropers
0
2

  12   6   qi q j 
  4 ij         
ij ij

  r   r    Dr 
i, j
 ij   ij   i , j  ij 

Importance de la consistance du champ de force.


Cohérence des paramêtres avec les charges partielles
MINIMISATION d’ENERGIE et DYNAMIQUE MOLECULAIRE

Initial
Trajectoire

final

Notion de Surface d’énergie potentielle


Notion de surface d’énergie potentielle
Minimisation

Les algorithmes de minimisation d’énergie mesurent l’énergie le long de


la surface de façon incrémentale pour déterminer des directions qui
mènent a un minimum.

Algorithmes incapables de changer de vallée.


Minima locaux
Steepest Descent

Suit le gradient de la fonction énergie à chaque pas.


Peut conduire à des oscillations
Mauvaise convergence à l’approche du minimum.

Conjugate Gradients Tient compte des gradients calculés aux étapes précedentes
Pour éviter les oscillations.
Peut rencontrer des problèmes quand conformations initiales sont très distordues

Newton-Raphson
Prédit la position du minimum
Dynamique moléculaire, simulation

Comme pour la minimisation d’énergie, la dynamique moléculaire change les


degrés de liberté du système pas à pas.
Mais les pas en dynamique moléculaire, représentent les changement des
positions atomiques, ri, en fonction du temps (i.e. vitesses).

La dynamique moléculaire utilise l’équation du mouvement de Newton


pour simuler les mouvements atomiques

La force exercée sur un atome peut être calculée à partir de la variation d’énergie
entre deux positions.

L’énergie E est obtenue par mécanique moléculaire


Connaissant les forces et les masses on peut ensuite résoudre les positions de chaque
atome le long d’une série de pas de temps de l‘ordre de la femtoseconde (10-15 secondes
La série de positions instantanés obtenue constitue une trajectoire.

En pratique les accélérations atomiques sont calculées


À partir des forces et des masses

Les vitesses sont calculées à partir des accélérations

Les positions sont calculées à partir des vitesses

On assigne des vitesses initiales aux atomes en fonction de


l’énergie cinétique totale elle-même fonction de la température de simulation.

Le pas de calcul limite la durée des trajectoires calculables de l’ordre de


Quelques picosecondes (10-12 secondes)
Analyse conformationnelle

Passage de 1D ou 2D à 3D

Programmes :
Corina, Concord, Converter …

Problèmes :
stéréochimie non définie
formes tautomères
état d’ionisation (représentation différente)
aromaticité
macro-cycles, cycles branchés

multiplicité des formats de fichier texte (sdf, mol, mol2, smile) ou binaire

Solution : data pipelining


Tautomérie

Amino form Adenine

Imino form

Thymine
Keto form
Enol form

Format smile du benzène C1:C:C:C:C:C1


Format mol2
# Name: benzene
# Creating user name: tom
# Creation time: Wed Dec 28 00:18:30 1988

# Modifying user name: tom


# Modification time: Wed Dec 28 00:18:30 1988

@<TRIPOS>MOLECULE
benzene
0 12 12 1 0 0
1 SMALL
2 NO_CHARGES
3
4
5 @<TRIPOS>ATOM
6 1 C1 1.207 2.091 0.000 C.ar 1 BENZENE 0.000
7 2 C2 2.414 1.394 0.000 C.ar 1 BENZENE 0.000
8 3 C3 2.414 0.000 0.000 C.ar 1 BENZENE 0.000
9 4 C4 1.207 -0.697 0.000 C.ar 1 BENZENE 0.000
0 5 C5 0.000 0.000 0.000 C.ar 1 BENZENE 0.000
1 6 C6 0.000 1.394 0.000 C.ar 1 BENZENE 0.000
2 7 H1 1.207 3.175 0.000 H 1 BENZENE 0.000
3 8 H2 3.353 1.936 0.000 H 1 BENZENE 0.000
4 9 H3 3.353 -0.542 0.000 H 1 BENZENE 0.000
5 10 H4 1.207 -1.781 0.000 H 1 BENZENE 0.000
6 11 H5 -0.939 -0.542 0.000 H 1 BENZENE 0.000
7 12 H6 -0.939 1.936 0.000 H 1 BENZENE 0.000
8 @<TRIPOS>BOND
9 1 1 2 ar
0 2 1 6 ar
1 3 2 3 ar
2 4 3 4 ar
3 5 4 5 ar
4 6 5 6 ar
5 7 1 7 1
6 8 2 8 1
7 9 3 9 1
8 10 4 10 1
9 11 5 11 1
0 12 6 12 1
1 @<TRIPOS>SUBSTRUCTURE
2 1 BENZENE 1 PERM 0 **** **** 0 ROOT
Analyse conformationnelle

Génération des conformères et évaluation des énergies

- énumération exhaustive
- Algorithme + élaboré : arborescence  élagage de l'arbre
- Procédure d'échantillonnage suivi de minimisation
- dynamique a haute température + minimisation

Différent programmes :
Clustering
Diversité des conformères
Contraintes (pharmacophores, données expérimentales, statistiques
(CCDC, PDB)
Arborescence de l’échantillonnage
élagage

Echantillonnage systématique et surface


D’énergie potentielle
Minimisation de l’énergie
Analyse statistique de la CSD
Analyse statistique de la CSD
Analyse statistique de la CSD
Des informations sur la structure 3D
de la cible sont disponibles

Expérimentale 3D Cristallographie, RMN, Microscopie électronique.


Précision atomique (résolution !)
Les structures expérimentales ne sont pas forcément
dans la conformation recherchée !

Apo proteine, complexe avec agoniste alors qu’on cherche un antagoniste

Expérimentale 1D mutation + effet biologique … mutagénèse dirigée

Modèles par homologie la séquence de la cible est connue et


La structure 3D d’au moins une protéine homologue (template) est connue.
Construction de la structure 3D de la cible calquée et adaptée à partir
Des templates expérimentales homologues.
Modélisation par homologie : modeller

1 Les templates 3D sont alignées avec la séquence cible


2 Des caractéristiques spatiales (distances Ca-Ca, dihèdres du squelette et des
chaines latérales …) sont transférées sous forme de contraintes spatiales sur la cible.
La forme des contraintes sont dérivées de l’analyse statistique de proteines homologues.
3 Ces contraintes sont combinées avec le champ de force CHARMM pour donner
une fonction objectif à minimiser par dynamique moléculaire et minimisation.
Modélisation par homologie modeller

La qualité de l’alignement initial est le paramêtre principal de la méthode sur lequel


On peut jouer.
Alignement de familles + ajustement manuel.
Le degré d’homologie détermine la qualité de la structure 3D que l’on peut obtenir.
La distribution de la similarité sur les séquences a aussi son importance.

MODELLER implemente une automatisation de la modélisation par homologie


En incorporant des contraintes dérivées empiriquement d’une analyse statistique
des relations entre un grand nombre de paires de structures homologues.
Cette analyse repose sur une base de données de 105 familles d’alignement incluant
416 proteines de structures 3D connues.
En pratique, des contraintes plus compliquées (probabilités conditionnelles) sont utilisées
qui dépendent d’informations comme l’accessibilité au solvent et les distances par
rapport aux gaps.
Modélisation par homologie modeller

Par analogie avec la RMN, modeller proposes différentes solutions avec


des énergies voisines qui satisfont plus ou moins les contraintes.
L’analyse et la validation des modèles générées sont essentielles.

distribution des violations de contraintes sur la séquence.


Validation empirique par satisfaction de contraintes expérimentales
Sélection des modèles qui rendent le mieux compte des relations
structures activités …

La modélisation par homologie reste une science approximative !


On reste à proximité de la structure 3D template.
Problèmes spécifiques avec les boucles, gaps

Autres programmes d’intérêt : Composer, Fugue


Il existe de nombreux serveurs qui combinent l’étape d’analyse de séquence
Et de construction des modèles ex : http://swissmodel.expasy.org
Différents types de cibles
Acides nucléiques
triples hélices , ARN antisens

Protéines
Canaux ioniques
transporteurs
Enzymes : protéases, kinases, caspases …
Récepteurs : nucléaires, trans-membranaires GPCR
Récepteurs de petites molécules ou interactions protéines-protéines
Différents types d’interactions
Enzymes : inhibiteurs compétitifs, non compétitifs, allostériques
Récepteurs : agonistes, antagonistes, agonistes inverses

Les modèles moléculaires doivent rendre compte des mécanismes


d’interaction !
Energie libre de liaison
effets protéine
entropiques Interactions
polaires avec le
solvant

k1 [C ]
 
Interactions
K bind non-polaires
k 1 [ P ][ L] ligand
k1
avec le solvant
k-1

ΔGbind   RT ln K bind Interactions


polaires avec le
ligand

eau
interactions
complexe protein-ligand
non-polaires
Thermodynamique de la liaison récepteur-ligand

G = H – T(S)
Pour un processus spontané, G doit être négatif

4 scénarios sont possibles


 H S G négatif? Pronostic
1) (-) (+) toujours toujours spontané
2) (+) (-) jamais jamais spontané
3) (+) (+) si T(S) > H favorable si T élevée
4) (-) (-) si T(S) < H favorable si T basse
Thermodynamique de la liaison récepteur-ligand

Décomposition du processus en plusieurs étapes


Ligand (aq) + Recepteur (aq)  Ligand-Recepteur (aq)
etapes H S

Desolvatation du ligand défavorable favorable

Desolvatation du récepteur défavorable favorable

Ligand  conformation active en général défavorable défavorable

Récepteur  conformation de liaison défavorable défavorable

Liaison ligand récepteur doit être favorable ! défavorable

Maximiser les étapes favorables et minimiser les étapes


défavorables
Thermodynamique de la liaison récepteur-ligand
comment ?
• Minimiser l'enthalpy de désolvatation
 Le Ligand ne doit pas être trop hydrophile
 Pas trop de groupes pour faire des liaisons Hydrogène (Rêgles de Lipinski)

• Maximiser l'entropie de désolvatation


 Le ligand doit remplir toue la cavité  déplacer toutes les molécules d'eau

• Minimiser le coût enthalpique pour adopter une conformation active


 La conformation active doit être de basse énergie

• Minimiser le coût entropique pour adopter une conformation active


 Le ligand doit être assez rigide (pas trop, la plupart de drogues sont semi-rigides)

• Maximiser l'enthalpie de liaison ligand-récepteur


 surfaces Hydrophobes du ligand en regard des surfaces hydrophobes du récepteur
 surfaces Hydrophiles du ligand en regard des surfaces hydrophiles du récepteur
 Complémentarité des liaisons H entre récepteur et ligand

Vous aimerez peut-être aussi