Vous êtes sur la page 1sur 130

APLICACIONES DE LA BIOINFORMTICA

AL DISEO DE FRMACOS
Diseo basado en estructura

Hugo Gutirrez de Tern


Fundacin pblica Galega de Medicina Xenmica - SERGAS

Guin de las sesiones

Sesin 1 (1.15h)

Introduccin a estructura de protenas

Modelizacin de macromolculas (protenas)

Sesin 2 (1.45h)

Simulaciones moleculares

Diseo de frmacos asistido por ordenador

Prctica (2.30h)

Interaccin frmaco-protena

Guin Sesin 1

Introduccin: Biologa y bioinformtica estructurales

Estructura de protenas

Estructura primaria, secundaria y terciaria

Mtodos experimentales de determinacin de estructuras

Bases de datos estructurales

Alineamientos estructurales

Modelado computacional de protenas

Modelado por homologa

Criterios de calidad de las estructuras

El concurso CASP

Estructuras supramoleculares

Interacciones protena-protena

Programas de docking protena-protena y el concurso CAPRI

Guin Sesin 1

Introduccin: Biologa y bioinformtica estructurales

Estructura de protenas

Estructura primaria, secundaria y terciaria

Mtodos experimentales de determinacin de estructuras

Bases de datos estructurales

Alineamientos estructurales

Modelado computacional de protenas

Modelado por homologa

Criterios de calidad de las estructuras

El concurso CASP

Estructuras supramoleculares

Interacciones protena-protena

Programas de docking protena-protena y el concurso CAPRI

GENMICA ESTRUCTURAL

INTRODUCCIN

GENMICA ESTRUCTURAL

INTRODUCCIN

GENMICA ESTRUCTURAL

INTRODUCCIN

Por qu necesitamos conocer su estructura?

Evolucin molecular

Predecir la estructura de otras protenas

Disear e interpretar experimentos de biologa molecular

Prediccin del plegamiento (folding)

Conocer y predecir la funcin de las protenas

Ingeniera de protenas

Diseo de frmacos basado en estructura de diana

GENMICA ESTRUCTURAL

INTRODUCCIN

Evolucin molecular

Aspartil proteasas de P. falciparum (degradacin hemoglobina)

INTRODUCCIN

GENMICA ESTRUCTURAL

Prediccin de estructura de protenas

GPCR (A1AR) modelado a partir


de rodopsina bovina (1F88)

INTRODUCCIN

GENMICA ESTRUCTURAL

Biologa molecular

GPCR (5-HT2A) estdios de mutagnesis


dirigida

GENMICA ESTRUCTURAL

INTRODUCCIN

Plegamiento de protenas

Annu. Rev. Biophys. Biomol. Struct. 1999. 28:31965

INTRODUCCIN

GENMICA ESTRUCTURAL

Inferir Funcin a partir de estructura

Phosphoglycerate kinasa: Por qu es una kinasa?

http://www.ebi.ac.uk/thornton-srv/databases/CSA/

GENMICA ESTRUCTURAL

INTRODUCCIN

Inferir Funcin a partir de estructura

Hemoglobina, misma funcin


Pero diferente secuencia (8% seq ID)
P. marinus
V. stercoraria

PROTEOMA

GENMICA ESTRUCTURAL

Ingeniera de protenas

PROTEOMA

GENMICA ESTRUCTURAL

Diseo de frmacos a partir de estructura

Diseo de antagonistas de plasmepsina IV como antimalricos

Guin Sesin 1

Introduccin: Biologa y bioinformtica estructurales

Estructura de protenas

Estructura primaria, secundaria y terciaria

Mtodos experimentales de determinacin de estructuras

Bases de datos estructurales

Alineamientos estructurales

Modelado computacional de protenas

Modelado por homologa

Criterios de calidad de las estructuras

El concurso CASP

Estructuras supramoleculares

Interacciones protena-protena

Programas de docking protena-protena y el concurso CAPRI

INTROODUCCIN
ESTRUCTURA

ESTRUCTURA PRIMARIA DE PROTENAS

Clasificacin de aminocidos:

Polares: S, T, N, Q

Hidrofbicos: C, M, V, A, L, I, F, Y, W

Bsicos: H, K, R

Acidos: E, D

Kink: G, P

ESTRUCTURA

ESTRUCTURA PRIMARIA

Secuencia polipeptdica y enlace peptdico:

Aminocido: amino + Ca + cido

Enlace peptdico: rgido (180)

R1
OH
NH2

R2

H2N

OH
NH2

R1

3D

R2
OH

N
H
O

ESTRUCTURA

ESTRUCTURA SECUNDARIA

Secuencia polipeptdica se ha de plegar para:

Encontrar conformaciones de baja energa para las cadenas laterales

Satisfacer puentes de hidrgeno (HB) para las cadenas polares

Estructuras compactas, bien empaquetadas


Hlices

hojas-
Paralela
Antiparalela
-Barrel

- hlice: NHi O=i+4


hlice 310:NHi O=i+3
hlice : NHi O=i+5

Loops

ESTRUCTURA

ESTRUCTURA SECUNDARIA

-Hlices

ESTRUCTURA

ESTRUCTURA SECUNDARIA

Hojas-

loop

ESTRUCTURA SECUNDARIA

ESTRUCTURA

Prediccin de estructura secundaria

Topologa: TMHMM, TMAP

Estructura secundaria: PHD, Jpred

ESTRUCTURA

Superficie (surface)

ESTRUCTURA TERCIARIA

Ribbon / Cartoon

ESTRUCTURA

ESTRUCTURA TERCIARIA

Estructura SECUNDARIA

Estructura PRIMARIA
Lig

an

G-prot

Estructura CUATERNARIA

Estructura TERCIARIA

ESTRUCTURA

MOTIVOS

Regiones conservadas en protenas de una familia,


asociadas a la funcin (Ej., stios catalticos)

La conservacin no es perfecta, no se detecta en BLAST

Se mantienen a grandes distancias evolutivas

Bases de datos: PROSITE

[LIVMFGAC]-[LIVMTADN]-[LIVFSA]-D-[ST]-G-[STAV]-[STAPDENQ]-{GQ}[LIVMFSTNC] - {EGK} - [LIVMFGTA]

Expresiones Regulares

[LI]
{GQ}
x
S(2)

Lys Ile
NO Gly Gln
Cualquiera
Ser-Ser

Patterns
Pattern/motif in sequence regular expression
Can define important sites
EXAMPLE:

Insulin

Enzyme catalytic site


B chain xxxxxxCxxxxxxxxxxxxCxxxxxxxxx
Prosthetic group attachment
A chain xxxxxCCxxxCxxxxxxxxCxMetal ion binding site
|
|
Cysteines for disulphide bonds
Protein or molecule binding

From Jennifer McDowal, EBI

Patterns
Pattern/motif in sequence regular expression
Can define important sites
EXAMPLE: PS00262 Insulin family signature
B chain xxxxxxCxxxxxxxxxxxxCxxxxxxxxx
A chain xxxxxCCxxxCxxxxxxxxCx
|
|
MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHLV
EALYLVCGERGFFYTPKTRREAEDLQVGQVELGGGPG
AGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN

From Jennifer McDowal, EBI

Patterns
Pattern/motif in sequence regular expression
Can define important sites
EXAMPLE: PS00262 Insulin family signature
B chain xxxxxxCxxxxxxxxxxxxCxxxxxxxxx
A chain xxxxxCCxxxCxxxxxxxxCx
|
|
MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHLV
EALYLVCGERGFFYTPKTRREAEDLQVGQVELGGGPG
AGSLQPLALEGSLQKRGIVEQ CCTSICSLYQLENYC N

From Jennifer McDowal, EBI

Patterns
Pattern/motif in sequence regular expression
Can define important sites
EXAMPLE: PS00262 Insulin family signature
B chain xxxxxxCxxxxxxxxxxxxCxxxxxxxxx
A chain xxxxxCCxxxCxxxxxxxxCx
|
|
MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHLV
EALYLVCGERGFFYTPKTRREAEDLQVGQVELGGGPG
AGSLQPLALEGSLQKRGIVEQ CCTSICSLYQLENYC N
Regular expression

C-C-{P}-x(2)-C-[STDNEKPI]-x(3)-[LIVMFS]-x(3)-C

From Jennifer McDowal, EBI

Patterns
Sequence alignment
Insulin family
motif

Define pattern

xxxxxx
xxxxxx
xxxxxx
xxxxxx

Extract pattern sequences

Build regular
expression

C-C-{P}-x(2)-C-[STDNEKPI]-x(3)-[LIVMFS]-x(3)-C

Pattern signature

PS00000

From Jennifer McDowal, EBI

Guin Sesin 1

Introduccin: Biologa y bioinformtica estructurales

Estructura de protenas

Estructura primaria, secundaria y terciaria

Mtodos experimentales de determinacin de estructuras

Bases de datos estructurales

Alineamientos estructurales

Modelado computacional de protenas

Modelado por homologa

Criterios de calidad de las estructuras

El concurso CASP

Estructuras supramoleculares

Interacciones protena-protena

Programas de docking protena-protena y el concurso CAPRI

ESTRUCTURA

MTODOS EXPERIMENTALES

Cristalografa de rayos X

Resolucin (1-3 )

Estructura esttica

Cristalizacin?

Resonancia Magntica Nuclear (RMN)

Naturaleza dinmica de la protena

Pptidos y pequeas protenas

Criomicroscopa electrnica
Grandes protenas (<= 1500 de dimetro)

Baja resolucin

ESTRUCTURA

MTODOS EXPERIMENTALES

Cristalografa de rayos X

Se apoya en programas de mecnica molecular

Resonancia Magntica Nuclear (RMN)


!!

Criomicroscopa electrnica

LO
E
Se apoya en programas de dinmica
OD
molecular
M
n
su
e
o
d
o
T

Sirve como soporte para hacer un modelo

Se ha de validar (simulacin molecular)

PROTEOMA

GENMICA ESTRUCTURAL

Secuencia y estructura de las protenas codificadas:


Finding a resolved structure for a protein is the
exception rather than the rule (LJ Mullan)

N secuencias de proteinas
potenciales
(TrEMBL)
N secuencias de proteinas
(Swiss-prot)
N estructuras 3D de
protenas conocidas exp.

(PDB)

Mayo 2009
< 7,600,000

>450.000
> 65,000

ESTRUCTURA

MTODOS EXPERIMENTALES

Bookhaven Protein Data Bank (PDB) http://www.rcsb.org

ESTRUCTURA

MTODOS EXPERIMENTALES

Formato PDB
N seq
cadena
Reiduo

HEADER

Atom Type
N tomo
ATOM/HETATM

COORDINATES

Factor

Protein Structure Classification


CATH - Protein Structure Classification
[ http://www.biochem.ucl.ac.uk/bsm/cath_new/ ]

UCL, Janet Thornton & Christine Orengo


Class (C), Architecture(A), Topology(T), Homologous superfamily (H)

SCOP - Structural Classification of Proteins


MRC Cambridge (UK), Alexey Murzin, Brenner S. E., Hubbard T., Chothia C.
created by manual inspection
comprehensive description of the structural and evolutionary relationships

[ http://scop.mrc-lmb.cam.ac.uk/scop/ ]

MODELIZACIN DE PROTEINAS

ESTRUCTURA

La importancia del alineamiento

El major alineamiento?

El del score ms alto (Aln1)


El que corresponde a un alineamiento
estructural (Aln2)

Edicin manual !!

MODELIZACIN DE PROTEINAS

ESTRUCTURA

Alineamiento estructural

STAMP(http://www.compbio.dundee.ac.uk/Software/Stamp/stamp.html)

PyMol

(http://pymol.sourceforge.net/)

Guin Sesin 1

Introduccin: Biologa y bioinformtica estructurales

Estructura de protenas

Estructura primaria, secundaria y terciaria

Mtodos experimentales de determinacin de estructuras

Bases de datos estructurales

Alineamientos estructurales

Modelado computacional de protenas

Modelado por homologa

Criterios de calidad de las estructuras

El concurso CASP

Estructuras supramoleculares

Interacciones protena-protena

Programas de docking protena-protena y el concurso CAPRI

ESTRUCTURA

MODELIZACIN DE PROTENAS

Mtodos ab initio

Toda la informacin est en la secuencia

Representacin simplificada de la protena (simulacin molecular)

Vlido para folding: ROSETA

Reconocimiento del plegamiento

Similaridad en secuencia

Prediccin plegamiento (simulacin molecular)

Threading: THREADER

Modelado por homologa


Se identifica un patrn (template) con homologa > 30%

Se parte de la estructura del template, y se muta a la protena problema

Se refina (simulacin molecular)

Modeller, Sybyl (Tripos), InsightII


(Accelerys), Swiss-Model (www)

ALINEAMIENTO

BSQUEDA DE HOMLOGOS

Homologa

mbito de bsqueda: familia, suprafamilia, inter/intra


especie, base de datos local/internet
Alineamiento Local y Global

Global: Secuencia 1 vs secuencia 2 (Needleman-Wunsch)


Local: Encontrar la mayor similaridad para fragmentos
de secuencia 1 en secuencia x (Smith-Waterman)

motivos

genes

ALINEAMIENTO

BSQUEDA DE HOMLOGOS

BLAST

Basic Local Alignment Search Tool

Velocidad:

Modificacin del algoritmo Smith-Waterman

HSP (high Scoring segment pair), evita gaps

Estadsticos:

Score (S)
Parmetro E (expectation), nmero de alineamientos con el score S
esperable por casualidad en la Db utilizada

Versatilidad:

Base de datos a buscar

Cliente web / instalacin local

Secuencia (nucletido, proteina)

INTROODUCCIN

Bsqueda de homlogos

Secuencia consenso
(+) conservativa

MODELADO POR HOMOLOGA

MODELIZACIN

Modeller

(http://salilab.org/modeller/)

El programa ms popular y utilizado

Protocolo automatizado + flexibilidad y uso avanzado


1.

Alineamiento con base de datos de protenas de estructura conocida

2.

Seleccin del mejor template

3.

Construccin de varios modelos

4.

Refinamiento energtico y validacin

MODELADO POR HOMOLOGA

MODELIZACIN

MODELADO POR HOMOLOGA

MODELIZACIN

MODELIZACIN DE PROTEINAS

ESTRUCTURA

Calidad estereoqumica
-sheet

-helix

3D

Protein-Protein Complexes: Biology

Docking Predictions of Protein-Protein Interactions

- Life 50.000 protein-protein interactions


- Pivotal role in communication on molecular level
- Protein complexes:
Immune system
Nano-machines
Membrane
Cancer...
Schwikowski, Uetz, Fields, Nature
Biotech. 18, 1257 (2001)

Lysozime-Ab (Fv)

Protein-Protein Complexes: Interface

Docking Predictions of Protein-Protein Interactions

PACKING, CAVITIES AND SHAPE COMPLEMENTARITY

- Molecular surfaces buried in the


contact have complementary shapes.

- Interior of proteins must be tightly


packed in spite of occasional cavities
- Packing is less tight on the protein
surface

Protein-Protein Complexes: Interface

Docking Predictions of Protein-Protein Interactions

CHEMICAL AND CHEMICAL-PHYSICAL


PROPERTIES

- Chemical and amino acid composition:


interfaces have less charged groups
compared to the surface of the protein.
- Hydrophobicity: one of the most
relevant issue to the propensity of a
protein surface to interact with a ligand
(groups get dehydrated, increasing
water's contribution to entropy, and finally
favouring association).
- Polar interactions and hydration: longrange electrostatic interactions may play
an active part in the kinetics of
association (take care, specially with
simplified force fields!)... and water is
also part of interfaces!

Guin de las sesiones

Sesin 1 (1.15h)

Introduccin a estructura de protenas

Modelizacin de macromolculas (protenas)

Sesin 2 (1.45h)

Simulaciones moleculares

Diseo de frmacos asistido por ordenador

Prctica (2.30h)

Interaccin frmaco-protena

INTROODUCCIN

Bioinformtica: conceptor bsicos

Diseo basado en estructura

Estructura terciaria de protenas

Simulacin molecular:

Forcefield o campo de fuerzas

Optimizacin geomtrica/minimizacin energtica

Dinmica molecular

Anclaje de ligandos (docking)

Evaluacin de afinidades (binding)

ESTRUCTURA

MTODOS TERICOS

H2N

3
2

O
OH

CH3
Valina
2

2
3

Interacciones ENLAZANTES

Distancia de equilibrio 1-2


ngulo de equilibrio 1-2-3
Torsional de equilibrio 1-2-3-4

ESTRUCTURA

MTODOS TERICOS

Naturaleza de la estructura molecular y campos de fuerzas

ESTRUCTURA

MTODOS TERICOS

Tipo de tomo y carga parcial

Interacciones NO
ENLAZANTES

O=-0.5
C=0.5

Fuerzas de Van der Waals


Interaccin electrosttica

H=0.2

CT=0.14
N=-0.5

HC=0.06

HC=0.06
H

HO=0.418

OH=-0.683
CT=0.145

OH

HC=0.06

H
N

Serina

ESTRUCTURA

MTODOS TERICOS

Naturaleza de la estructura molecular y campos de fuerzas

ESTRUCTURA

MTODOS TERICOS

Naturaleza de la estructura molecular y campos de


fuerzas

Aplicaciones:

Optimizacin geomtrica (minimizacin energtica)

Bsqueda de conformaciones (bioactivas)

Evaluacin de energa de interaccin entre dos


molculas (scoring)

Dinmica molecular

ESTRUCTURA

MTODOS TERICOS

Bsqueda de conformaciones (bioactivas)

Bsqueda sistemtica (tree search)

O
N
N

OH

ESTRUCTURA

MTODOS TERICOS

Optimizacin geomtrica (o minimizacin energtica)

Diferentes algoritmos para buscar la estructura ms estable


(steepest descendent, congugate gradients)

1.

Variacin geomtrica del sistema (perturbacin)

2.

Evaluacin energtica (Force field)

3.

Aceptacin o rechazo de la perturbacin (direccin)

4.

STOP: si encontramos un mnimo local


Convergencia en mnimo global?

dE
@0
dr

DINAMICA MOLECULAR

ESTRUCTURA

Esta estructura est minimizada (complejo receptor-ligando)


EST CONGELADA ????

MOLECULAR DINAMICS

SIMULATION
t (1fs)

[]
T=0

T=1 fs

T=(t+t) fs

CAMPO DE FUERZAS!

Posiciones (r):

Velocidades
(v):

MOLECULAR DINAMICS

SIMULATION

Modelos de solvatacin
Dielctrico

Esferico

=2

= 80
Vel =

qi q j
r ( r )
Calidad

Velocidad

PBC

MOLECULAR DINAMICS

SIMULATION

Protenas de membrana?
Mecanismo de permeacin de iones en canal de potasio

qvist & Luzhkov, Nature (2000) 404:881

Roux, Biophys. J (2000) 78:2900

Herramientas informticas en el I+D


de medicamentos
Identificacin
de la diana
biolgica

Validacin
de la diana
biolgica

Modelizacin de protenas

Obtencin
de posibles
nuevos
frmacos

Diseo de
frmacos
asistido por
ordenador

Ensayos
clnicos

Control
postlanzamiento

Clculo de propiedades moleculares


QSAR

Simulaciones de molculas biolgicas

Docking protena-ligando

Evaluacin
preclnica

INTROODUCCIN

Diseo de Frmacos Asistido por Ordenador (CADD)

INTROODUCCIN

Diseo de Frmacos Asistido por Ordenador (CADD)

Modelos moleculares

Mecnica molecular

Mecnica cuntica

INTROODUCCIN

Diseo de Frmacos Asistido por Ordenador (CADD)

Propiedades moleculares

Mecnica molecular

Mecnica cuntica

Optimizacin geomtrica
Bsqueda conformacional
Clculos energticos
Dinmica molecular (MD)

Propiedades electrnicas
Reactividad Qumica
Reactividad enzimtica
Clculo cargas parciales
Propiedades electrnicas

INTROODUCCIN

2 grandes grupos de CADD

PH

PROTEOMA

GENMICA ESTRUCTURAL

Por qu necesitamos conocer su estructura?

Predecir la estructura de otras protenas

Disear e interpretar experimentos de biologa molecular

Prediccin del plegamiento (folding)

Conocer y predecir la funcin de las protenas

Evolucin molecular

Ingeniera de protenas

Diseo de frmacos basado en estructura de diana

INTROODUCCIN

Diseo de Frmacos Asistido por Ordenador (CADD)

Y RALENZA (Glaxo)

INTROODUCCIN

Bioinformtica: conceptor bsicos

Diseo basado en estructura

Estructura terciaria de protenas

Anclaje de ligandos (docking)

Definicin del sitio de unin

Definicin del modo de unin

Evaluacin de afinidades relativas (scoring)

Evaluacin de afinidades (binding)

CADD

STRUCTURE-BASED

Concepts and computational techniques

Protein-Ligand docking

Binding free energy predictions

Molecular simulations (MD, MC)

From qvist group web page


http://xray.bmc.uu.se/~aqwww

DETERMINAR EL MODO DE UNIN

DOCKING

Docking: modo de anclaje


de un ligando en una
macromolcula biolgica

DOCKING

INFORMACIN DE PARTIDA (ESCENARIOS)

(A) Estructura holo de la diana

Varios complejos diana-ligando?


Uno slo?
Naturaleza qumica de ligando
Cavidad / sitio de unin explorado por el ligando
Interacciones dominantes en unin ligando-receptor
Naturaleza qumica de nuestro/s ligandos problema

Docking manual exploracin sistemtica (algoritmos automticos)

DOCKING

INFORMACIN DE PARTIDA (ESCENARIOS)

(B) Estructura apo de la diana

Flexibilidad del sitio de unin?


Posibilidad de explicar docking de un ligando-tipo?
Tipo de cavidad (hidrofbica, polar)
Naturaleza qumica de nuestro/s ligandos problema

Exploracin sistemtica (algoritmos automticos)

DOCKING

INFORMACIN DE PARTIDA (ESCENARIOS)

(C) Modelo por homologa

Calidad del modelo?


Posibilidad de explicar docking de un ligando-tipo?
Datos experimentales (mutagnesis)
Tipo de cavidad (hidrofbica, polar)
Modelos farmacofricos
Naturaleza qumica de nuestro/s ligandos problema
Exploracin sistemtica (algoritmos automticos)
Simulaciones del modelo / complejos
Mtodos indirectos (QSAR, LBVS)

DETERMINAR EL MODO DE UNIN

DOCKING

2 fases (problemas a resolver)


Bsqueda: exahustiva, considerar todas las
opciones plausibles de unirse el ligando a la
protena
Definir la zona de bsqueda
Definir la dimensionalidad del problema
Evaluacin: Qu solucin es la mejor?
Prisma: la naturaleza de asociacin molecular
Margen de error (RMSD, G)

DETERMINAR EL MODO DE UNIN

DOCKING

DETERMINAR EL MODO DE UNIN

DOCKING

Zona de bsqueda
Acotada por datos experimentales: binding site, mutagnesis,
X-ray
El resto de la protena no existe
Si bscamos la zona de unin: blind docking

DETERMINAR EL MODO DE UNIN

DOCKING

Mtodos de bsqueda
Flexibilidad de ligando?
Flexibilidad de protena?

Casi siempre
Casi nunca

Tres tipos de algoritmos:


Construccin incremental
FlexX, DOCK
Monte Carlo (estocstica)
QXP, Autodock2,
ICM
Algoritmos Genticos

Autodock4, GOLD

DOCKING

Construccin incremental DOCK (UCSF)

O
N
N

DOCKING

Esferas de cavidad
(imagen negativa del ligando)

Construccin incremental DOCK (UCSF)

Evaluacin energtica
(grid points)

Posicinado y evaluacin
del ligando

Algoritmos genticos: AutoDOCK (UCSD) y GOLD


CCDC)

DOCKING

Dimensionalidad
Posicin (x, y, z)
Orientacin (qx,qy,qz,qw)
Enlaces rotables (torsional):
Dimensionalidad:
x
z
y

3D
3D
nD
D = 3 + 3 + n; D~10 20

qw = valor
qx rotacin
qz
qy

Y si anotamos cada valor de D en un gen? Creamos un individuo

(Algoritmos genticos)

DOCKING

Algoritmos genticos: AutoDOCK (UCSD) y GOLD


CCDC)

Algoritmos genticos? Dnde estn los genes?


1. Definimos una poblacin aleatoria (50 300 individuos)
2. Existen una serie de GENES: variables de estado (D)
3. Operaciones genticas permitidas:
1. Entrecruzamiento (ABC + abc -> AbC + aBc
2. Mutacin (A -> A*)
4. Evaluar la bondad de cada individuo generado
5. Seleccin (elitismo)

GOLD: Fitness function

DOCKING

1. Definir zona de bsqueda (centro y radio)


2. Deteccin de cavidad
3. Identificacin tomos: HBD, HBA, hidrofbicos (Sybyl atom types)
4. Posiciones iniciales: Posibles satisfacciones HB ligando/receptor
5. Algoritmo gentico + scoring: Determinar la/s solucin/es

Autodock: Grid mapping

DOCKING

1. Ligando: cuntos tipos de tomo tiene? C, A, OA, ND


2. Generamos un mapa de la cavidad con cada uno (map.A, )
3. Mapas extra: cavidad + electrosttico

Autodock: Docking search

DOCKING

N bsquedas independientes = N soluciones


Agrupacin en clusters: criterio de RMSD
Atender a:
Energa ms favorable para unin (menor Gbind)
Poblacin del cluster (probabilidad de encontrar esa
solucin)

CALCULAR LA ENERGA DE UNIN

DOCKING

Kd

CALCULAR LA ENERGA DE UNIN

DOCKING

DETERMINAR EL MODO DE UNIN

DOCKING

Funciones de scoring
Basadas en Force Fields

Autodock

DETERMINAR EL MODO DE UNIN

DOCKING

Funciones de scoring
Basadas en estadstica

Chemscore

DETERMINAR EL MODO DE UNIN

DOCKING

Funciones de scoring
Basadas en conocimiento (knowledge based)

PMF

MD simulations can be used: during the preparation of the protein receptor before docking, to
optimize its structure and account for protein flexibility; for the refinement of docked
complexes, to include solvent effects and account for induced fit; to calculate binding free
energies, to provide an accurate ranking of the potential ligands; and in the latest
developments, during the docking process itself to find the binding site and correctly dock the

ligand
a priori

INTROODUCCIN

Bioinformtica: conceptor bsicos

Diseo basado en estructura

Estructura terciaria de protenas

Anclaje de ligandos (docking)

Evaluacin de afinidades (binding)

CALCULAR LA ENERGA DE UNIN

BINDING

Scoring Functions:

G = GpolarNpolar + GlipoNlipo + GrotNrot + G 0

(AUTODOCK)

LIE:
(qvist et al.
Protein Eng 1994;7:385)

G = Vl vdW
s

Vl vdW
s

)+ ( V

el
l s p

Vl el s

)+

FEP:

( L L ')
p
w
Gbind
= Gbind ( L ) Gbind ( L') = Gsol
Gsol

BINDING

LINEAR INTERACTION ENERGY

The Theory: Semiempirical method with strong Physical basis

polar
polar

Gbind = Glnon
+

G
s
l s

Binding calculations

Linear Interaction Energy (LIE)


Methods: Linear Interaction Energy

G = Vl vdW
s

Vl vdW
s

Vl vdW
s

Vl els

)+ ( V

el
l s p

= 0.18

= 0.33/0.37

Vl el s

Vl vdW
s

Vl els

)+

Vl el s
Vl vdW
s

Velocidad vs eficacia
n molculas procesadas

Anlisis basado en ligando


Anlisis quimioteca
(pblica, privada o de
grupo colaborador)

104 - 106

103 - 104

Docking y scoring
Modo de unin

10 - 103

Primer ranking

Dinmicas moleculares
Clculos de G
G = -RTln Ki

Modificacin qumica
(hit lead)

HIT

Experimentacin bioqumica
(afinidad, mutagnesis)

Deteccin
de scaffolds

Primer filtrado

Ranking de
compuestos
SAR (relaciones
estructura-actividad)
Identificacin de residuos
del receptor claves para
interaccin con ligando

EJEMPLOS
1) Localizar el sitio de unin
(Adenosina en receptores de adenosina)

2) Determinar el modo de unin


(peptidomimticos cclicos en proteasa)

3) Evaluar la afinidad relativa


(peptidomimticos en proteasa)

EJEMPLOS
1) Localizar el sitio de unin
(Adenosina en receptores de adenosina)

2) Determinar el modo de unin


(peptidomimticos cclicos en proteasa)

3) Evaluar la afinidad relativa


(peptidomimticos en proteasa)

Location of the binding site


NH2

Adenosine = adenine

N
N

CH2OH

N
N

+ ribose

HO

OH

GRID (GROUP module): rigid body docking of ribose


Grid spacing: 1

Grid probes: H (hydrogen), OH2 (water), O1 (hydroxyl O), OC2 (ether O)

polar
acidic
basic

Location of the binding site


Feasibility of the proposed binding site?

Comparison with experimental data:


ribose-enzime complexes from the PDB

Description of each binding site: GRID Independent Descriptors:


O (Hbond acceptor) and N1 (Hbond donor) probes
ALMOND software: correlogram

Comparison of correlograms: Hodgkin similarity index

EJEMPLOS
1) Localizar el sitio de unin
(Adenosina en receptores de adenosina)

2) Determinar el modo de unin


(peptidomimticos cclicos en proteasa)

3) Evaluar la afinidad relativa


(peptidomimticos en proteasa)

Plm IV structure
Plm IV has xray deposited structure (PDB code 1LS5)

What are the new features of the Plm IV binding site?


How can be this exploited for the lead optimization process?

flexible-loop
flap-loop

Pro-loop

Plm IV / II : conformationaly constrained ligands

Macrocyclic ligands

Cyclic from P1 to P2'

and from P1 to P2

making 17 and 13 member rings

total of four ligands

HO

N
H

OH O
O

H
N

N
H

OH O

68

OH O

OH O

67

H
N

OH

Plm IV / II : conformationaly constrained ligands


Compound design & synthesis
Evaluation of affinities (PMII & PMIV)
Automatic docking:
4 comp*2 proteins: CONSENSUS!
MD simulations & computation of affinities
SAR, selectivity, drug design

HO

N
H

OH O
O

H
N

N
H

OH O

68

OH O

OH O

67

H
N

OH

PROTEOMA

GENMICA ESTRUCTURAL

Diseo de frmacos a partir de estructura

Diseo de antagonistas de plasmepsina IV como antimalricos

Plm IV / II : conformationaly constrained ligands

OH O

O
N
H

H
N

OH

OH O

67

Compound 6: Ki (PMIV)= 200 nM


Compound (E) 5: Ki (PMIV)= 6.2 M

This
was not observed in PM II !

Nor experimentally, neither in MD

EJEMPLOS
1) Localizar el sitio de unin
(Adenosina en receptores de adenosina)

2) Determinar el modo de unin


(peptidomimticos cclicos en proteasa)

3) Evaluar la afinidad relativa


(peptidomimticos en proteasa)

9 compounds
9 activities

flexible-loop

Same binding mode?


SAR?
Selectivity PMII/PMIV?

PROTEASES

Diol-like Plm IV inhibitors

flexible-loop

PlmII PlmIV selectivity

Gutirrez de Teran et al, Biochemistry, 2006, 45:10529

INTROODUCCIN

2 grandes grupos de CADD

PH

Computacin molecular en I+D de medicamentos

Mtodos
indirectos

(x semejanza)

Potenciales de Interaccin Molecular

DESCRIPTORES

Lo potenciales de interaccin molecular (MIP) constituyen herramientas


tiles para el estudio de las capacidades de interaccin de
biomolculas (no requieren conocimiento explicito sobre la contraparte
biolgica).
Se definen como energas de
interaccin entre la molcula
estudiada y sondas qumicas
apropiadas. Dichas energas se
acostumbran a calcular en los
nodos de una red 3D definida
alrededor de la molcula
generando distribuciones/campos
de MIPs (MIF)

Eijk = E EL + E LJ + ( E HB )

Potenciales de Interaccin Molecular

DESCRIPTORES

Sondas habituales en el clculo de MIPs


DRY. Indica las capacidades de interaccin hidrofbica

O. Oxigeno carbonilico que indica las capacidades


de donar puentes de H

N1. Nitrgeno amdico que indica las capacidades de


aceptar puentes de H

Modelos 3D-QSAR

DESCRIPTORES

axb

axb

axb

axbxc

Actividades
biolgicas

MIPcalculadosenm
puntosconlasondaX

MIPcalculadosenlosm
puntosconotrasonda

MIPcalculadosenlosm
puntosconlaltimasonda

X1X2Xm

Z1Z2Zm

Compuesto1
Compuesto2
Compuesto3

Compueston

Y1
Y2
Y3

Yn

X11X21Xm1

X1nX2nXmn

Z11Z21Zm1

Z1nZ2nZmn

Mediante anlisis PLS se obtienen modelos 3D-QSAR

Potenciales de Interaccin Molecular

DESCRIPTORES

Relaciones estructura-actividad basadas en


descriptores MIP

CoMFA (Tripos Inc.)

GRID-GOLPE (MIA srl)

El problema del alineamiento molecular:


los modelos obtenidos son muy sensibles a la posicin relativa
de las molculas estudiadas en la caja en la que se calculan
los MIPs.

Similaridad molecular

DESCRIPTORES

El problema del alineamiento molecular


Se puede abordar cuando:
- las molculas estudiadas comparten un esqueleto
comn y incorporan slo sustituyentes
relativamente pequeos
- se dispone de las conformaciones y posiciones
relativas que las molculas estudiadas adoptan al
acoplarse en la diana biolgica que comparten

Similaridad molecular

DESCRIPTORES

Molculas con un esqueleto comn

Modelos 3D-QSAR

DESCRIPTORES

Anlisis estadstico multivariante: PLS (Partial Least Squares)


Correlacin descriptores vs actividad experimental (modelos explicativos)
Clculo de nuevas actividades a partir de descriptores (modelos predictivos)
MOL

Ki(obs) Ki(calc)

d1 d945

C1

C283

Similaridad molecular

DESCRIPTORES

Independencia de alineamiento

DESCRIPTORES

Relaciones estructura-actividad
basadas en descriptores MIP

CoMFA (Tripos Inc.)

GRID-GOLPE (MIA srl)

Un problema crucial: el alineamiento molecular

Una posible solucin: la aproximacin GRIND/ALMOND

Independencia de alineamiento

DESCRIPTORES

Los correlogramas de GRIND son representaciones 2D en las que a


cada distancia se le asocia el mayor producto de MIPs favorables que
se hallan a dicha distancia.
Cada fila
corresponde a
uno de los
compuestos y
contiene los
productos de
MIPs ordenados
por distancias y
sondas

auto-correlograma

cross-correlogram

N1-O

compuestos

N1-N1

Independencia de alineamiento

DESCRIPTORES

Si se usan 3 sondas se obtienen 6 correlogramas para cada compuesto:

DRY-DRY

O-O

N1-N1

DRY-O

DRY-N1

O-N1

Estos espectros o vectores son independientes de la posicin de cada


compuesto en la caja en la que se calculan los MIFs

Independencia de alineamiento

DESCRIPTORES
Feasibility of the proposed binding site?

Comparison with experimental data:


ribose-enzime complexes from the PDB

Description of each binding site: GRID Independent Descriptors:


O (Hbond acceptor) and N1 (Hbond donor) probes
ALMOND software: correlogram

Comparison of correlograms: Hodgkin similarity index

Quimiogenmica

Enfermedad
Informacin
clnica

Sistemas

Dianas

Frmacos

Estrategias

Informacin
mica quimiogenmicas
Informacin
qumica

Bsqueda de ligandos y de dianas

VIRTUAL SCREENING

Traditional Medicinal Chemistry


Target

Bibliography
Docking

Lead compound

T.O.
Synthesis

Pharmacophore
(...)

Library
Actives / Inactives

Chemogenomics approach
1. Virtual Screening
COMPOUND

HIT
GPCR (1)

GPCR (...)

A1 AR

H3_R

AA2 R

5HT3_R

GPCR (86)

Chimiotheque_1
Chimiotheque_2
Chimiotheque_(...)
Chimiotheque_10 x

2. (High Throughput) Screening


3. Medicinal Chemistry

LEAD
Lead optimization

LIGAND-BASED

VIRTUAL SCREENING

Similarity of database molecules with a reference ligand


Good discrimination actives/decoys
Poor Ranking
2D or 3D similarity based methods (J Chem Inf Model, 2007, 47:1504)
3D-based: Openeye pipeline (www.eyesopen.com)
database (2D)
conformers (3D)
Overlay with
Reference compound

Rank (shape
and electrostatics)

LIGAND-BASED

VIRTUAL SCREENING

Nuevos esqueletos con afinidad por receptor 5-HT2A

pKi = 5.8

pKi = 8.3