Vous êtes sur la page 1sur 46

Bioinformtica

y Biologa molecular
Bioinformtica
10-2-16
Elvira Mayordomo
En los peridicos
La biotecnologa, gentica y bioinformtica en
primera plana
Todo empez con el descubrimiento de la
estructura del DNA por Watson y Crick en 1953
En los 90 se inici el proyecto del genoma
humano y se clon a la oveja Dolly
En el 2000 se anunci la secuenciacin
completa del genoma humano
En el 2008 comenz el proyecto de los 1000
genomas
Ya hemos llegado al $1000 genome?
Secuenciando DNA
El objetivo es determinar una secuencia de nucletidos
que son las piezas que forman el DNA humano, es
decir, la molcula que guarda nuestra informacin
gentica
Desde el punto de vista informtico buscamos un string
hecho con las letras que representan los nucletidos
Conocemos mtodos para leer estas secuencias desde
los 80, pero con longitudes muy restringidas (hoy unos
1000 nucletidos)
Nos interesan molculas de DNA con cientos de miles
Secuenciando DNA Cmo?
Se generan muchas copias de la molcula de DNA que
nos interesa
Rompemos aleatoriamente esas copias en trozos,
idealmente pequeos
Con alta probabilidad esos trozos se solapan entre s
Leemos (secuenciamos) los trozos
Nos quedan muchos (miles de) trozos que son
subsecuencias de la que buscamos, con solapamientos
No tenemos idea de cmo combinarlos, el orden se ha
perdido
Aqu entra la informtica
mtodos next generation
Detalles con mucha importancia
Queremos derivar modelos formales de
problemas biolgicos para encontrarles
soluciones algortmicas
Pero es imposible olvidarnos del problema
biolgico original porque la formalizacin
siempre es burda
Todos los datos biolgicos son
inherentemente inexactos
Mtodos computacionales en
bioinformtica
Gestin de bases de datos
Estadstica
Algortmica

En este curso sobre todo algortmica. La primera


parte y algo del resto de
Algorithmic Aspects of Bioinformatics.
Bockenhauer, Bongartz. Springer 2008
Biologa molecular Para qu?

Necesitamos conocimientos bsicos de


Biologa molecular para poder desarrollar
y evaluar modelos abstractos y tcnicas
para manejarlos
Trataremos las protenas y los cidos
nucleicos
Protenas
La clase de molculas ms importantes de
los seres vivos
Funciones: como encimas (catlisis de
procesos metablicos), en transmisin de
seal, mecanismos de defensa, transporte
de molculas, material de construccin
Los aminocidos forman las
protenas
Una protena es una cadena de aminocidos
Un aminocido:
20 aminocidos
Ala Val Leu Ile Phe
Segn R aparecen 20 A V L I F
(H) (H) (H) (H) (H)
aminocidos distintos Pro Met Ser Thr Cys
que forman parte de P M S T C
(H) (H) (P) (P) (P)
las protenas Trp Tyr Asn Gln Asp
W Y N Q D
(H) (P) (P) (P) (P)

Glu Lys Arg His Gly


E K R H G
(P) (P) (P) (P) (P)
Protenas = cadenas de
aminocidos
Los aminocidos se unen mediante
enlaces peptdicos
Podemos representar una protena como
una cadena leda de (H2N a COOH)
VHLTPEEK
Esto es mucho simplificar, ignorando la
estructura espacial
cidos nucleicos
Las molculas ms importantes despus de las
protenas
En todos los seres vivos, son las responsables
de codificar y almacenar la informacin gentica
Permiten la transmisin de informacin gentica
de una generacin a otra
Tienen una estrecha conexin con las protenas:
los cidos nucleicos sirven como mapas para la
construccin de las protenas
cido nucleico= cadena de
nucletidos
Cada cido nucleico est formado por
nucletidos encadenados
5 3
P
S
1
5 3

B

Cadenas
La B (base) caracteriza al nucletido
Podemos escribir un cido nucleico como
una secuencia de nucletidos
Gran simplificacin
DNA y RNA
Los dos tipos de cidos nucleicos son
DNA y RNA
Se diferencian por los azcares (S)
DNA usa cuatro bases A, C, G, T
RNA usa cuatro bases A, C, G, U
DNA
Est formado por dos cadenas de
nucletidos
Complementarias (A-T y C-G)
Se leen en direcciones opuestas
En forma de hlice
DNA
RNA
Normalmente una
sola cadena
Trozos de la misma
molcula se unen con
otros
complementarios lo
que da formas
diversas
Triple estructura
Primaria: cadena de nucletidos
Secundaria: describe los trozos
complementarios que estn unidos
Terciaria: cmo est doblada en el
espacio
Cmo escribimos DNA
Usamos la direccin de lectura de la
cadena de arriba (de 5 a 3)
Ejemplo: s=AGACGT es:

s: 5 AGACGT 3
s: 3 TCTGCA 5
Longitudes
Se mide la longitud en pares de bases
(bp)
Se usan las unidades kbp (1000 bp) y
mbp (1000 kbp)

AGACGT tiene 6 bp
Tambin se usan para RNA
Informacin hereditaria
Una regin de DNA que codifica una protena se
llama gen
Una molcula de DNA que tiene varios genes se
llama cromosoma
Los cromosomas suelen aparecer en pares:
cromosomas homlogos (uno materno y uno
paterno)
Las clulas humanas tienen 46 cromosomas
Toda la informacin hereditaria de una clula se
llama genoma
23 pares de cromosomas humanos
Sntesis de protenas
El DNA est en el ncleo y las protenas
se sintetizan fuera (en los ribosomas)
Hay dos pasos: copia y traduccin
Transcripcin o copia
Se separan las dos copias de DNA

Se sintetiza una copia


complementaria de RNA (amarillo)
sustituyendo T por U

Slo se copian algunas zonas (los


exones) y no los intrones (no
relevantes?)

El resultado es el mRNA (RNA


mensajero)
Traduccin
La informacin del mRNA se convierte en
una secuencia de aminocidos
Un codn son 3 bases. Cada codn
codifica un aminocido
Tambin hay codones que codifican
STOP
Traduccin
Codn-aminocido
Aminocido-codn
Algunos datos
En los humanos el DNA cromosmico es de
3.000 millones de bp (pares de bases)
Contiene relativamente poca informacin (10-
20%)
Se dice que se ha secuenciado el DNA de un
individuo cuando se conocen las zonas que
se consideran relevantes (genes y otras)
Tambin hay DNA mitocondrial
Tcnicas experimentales
Leer la seccin 2.4
Tcnicas experimentales
Denaturation: separar las dos hebras del DNA
por calor
Hibridizacin: asociar bases complementarias o
hebras complementarias
Se puede cortar una doble hebra por un sitio
concreto (encimas de restriccin)
Se pueden reunificar despus los trozos (ligasa)
Duplicacin de DNA: cloning
Para los experimentos una sola molcula de
DNA no es suficiente, es necesario un gran
nmero de copias idnticas
Cloning: se inserta el fragmento a copiar en un
organismo host (anfitrin) , se replica con la
reproduccin natural y luego se vuelve a extraer
Los host son muy variados, pueden copiar
desde 15-50 kbp (bacteria) a varios millones
(insercin de cromosomas artificiales)
Problemas del cloning
Contaminacin con el DNA del host
Prdida de fragmentos completos, cuando
la insercin tiene efectos letales en el host
Dos fragmentos no consecutivos pueden
unirse en la clonacin (clon quimrico)
Duplicacin de DNA: PCR
Polymerase chain reaction
Necesitamos conocer un fragmento inicial
y otro final
En cada paso duplica el nmero de copias
Los errores al principio son muy
peligrosos
Gel electrophoresis
Se trata de separar los fragmentos por tamao
Se meten en gel y se aplica un campo elctrico,
la velocidad es inversamente proporcional al
tamao
Se separan as por longitudes
Usando trozos de referencia se puede usar para
medir la longitud
Secuenciar DNA: chain termination
method
El chain termination method se basa en
el anterior (gel electrophoresis)
Tenemos un fragmento de DNA
desconocido s, hacemos muchas copias
Paso 1: conseguir que haya 4 tubos de
ensayo A, C, G, T cada uno conteniendo
los prefijos de s que terminan en A
(C,G,T)
chain termination method (2)
Paso 2: Colocamos
los cuatro tubos de
ensayo en paralelo y
ordenamos por
longitud como antes

Chain termination method (3)
Slo sirve para fragmentos de hasta 1000
bp (ms da demasiados errores)
Puede dar errores de lectura del resultado
(llamados errores de secuenciacin):
Insercin
Borrado
Sustitucin
Experimentos de hibridizacin
Para averiguar si un fragmento
desconocido s contiene una secuencia t
Sintetizamos t la complementaria de t
Testeamos si s y t se unen (hibridizan)
DNA chips
Para hacer varios experimentos de hibridizacin
en paralelo
Si queremos saber si s contiene t1, , tn:
Colocamos t1, , tn en sitios fijos (DNA chip)
Hacemos copias etiquetadas de s
Dejamos que se unan al chip
Lavamos las copias de s sueltas y averiguamos las
posiciones de hibridizacin con las etiquetas
DNA chips: errores
Falsos positivos
Falsos negativos

Se pueden usar los DNA chips para RNA



Premios nbel
Watson, Crick y Wilkins por el
descubrimiento de la estructura del DNA,
Medicina 1962
Mullis por el mtodo PCR, Qumica 1993
El prximo tema
Notacin bsica para strings
El problema de string matching

Vous aimerez peut-être aussi