Vous êtes sur la page 1sur 84

Materia: Biologa Molecular

Carrera: Qumico Bacterilogo y Parasitlogo


Escuela Nacional de Ciencias Biolgicas
2012

Autores:
M. en C. Addy Cecilia Helguera Repetto

M. en C. Lizbel Esperanza Len Sols


Dr. Jorge Francisco Cerna Corts
M. en C. Juan Arturo Casteln Vega

En este tutorial se hacen sealamientos


importantes mediante el uso de flechas,

crculos y letras de colores.

Empleando la base de datos ENTREZ, obtener la secuencia


nucleotdica del gen aerA de Aeromonas hydrophila (Cdigo de
acceso: DQ186611) y realizar los siguientes anlisis
bioinformticos:

1- Obtener 5 secuencias homlogas al gen y delimitar las


secuencias codificantes de los genes.

2- Realizar el alineamiento de las secuencias mediante el


programa ClustalX.
3- Elaborar el rbol filogentico con los datos obtenidos en el
punto anterior.

Obtencin de las secuencias homologas a aerA de Aeromonas hydrophila

1.- Entrar a la pgina del


NCBI.
2.- Seleccionar
nucleotide
(nucletido) y escribir el
cdigo de acceso del
gen a buscar (en este
caso se seguir
estudiando el mismo
que para la prctica de
Bioinformtica I).

Para guardar la
secuencia en formato
de texto se tiene que
seleccionar la opcin
FASTA (1).

1
2

Se muestra una
pgina en la cual
aparece la
secuencia
completa del gen,
la cual se guarda
como File (1) en
formato FASTA (2).

Con la secuencia anterior


se procede a realizar la
bsqueda de secuencias
homlogas, para lo cual
se utiliza la herramienta
Blast. En la pgina
inicial del NCBI
seleccionar Blast.

Seleccionar la
opcin
Nucleotide
blast.

Se puede escribir
el nmero de
acceso de la
secuencia en
estudio o bien la
secuencia en
formato FASTA.

2
Escoger la base de datos en
donde queremos realizar la
bsqueda (others).
Dar la orden BLAST.

Aparece una pantalla en la que


se muestran los alineamientos.

Elegir seis secuencias.


Al final de esta pantalla
presionar el botn Get
selected sequences
(obtener la secuencia
seleccionada).

Seleccionar los 6 recuadros


NO SELECCIONAR LAS
SECUENCIAS DE
GENOMA COMPLETO Y
GUARDARLO COMO
FORMATO DE TEXTO.

Una vez que se guardaron en


formato FASTA es
importante cambiarles el
nombre a uno ms pequeo.
Se guardan los cambios
hechos.

Alineamiento de las secuencias por medio del programa ClustalX

Abrir el programa ClustalX y en


File (Archivo) dirigirse a
Load sequences (cargar
secuencias). Seleccionar el
archivo guardado
anteriormente.

Seleccionar multiple
alignment mode (modo de
alineamiento mltiple).

En alignment
(alineamiento) (1)
seleccionar Do
Complete alignment
(Hacer el alineamiento
completo) (2).

4
Posteriormente aparece un recuadro
en el cual se indica en donde y con
que extensiones se guarda el
dendrograma (*.dnd) (3) y el
alineamiento *.aln) (4) y finalmente
seleccionar align (alineamiento)
(5).

Construccin del rbol filogentico empleando el programa MEGA 2.1


Al abrir el programa dirigirse a
File (Archivo) para seleccionar
Convert to MEGA format.
Convertir el archivo
obtenido del programa
CLUSTALX.

Se muestra un cuadro en el cual se


selecciona la ubicacin del archivo
generado en CLUSTALX con
extensin .aln (flecha) y seleccionar
OK.

Posteriormente
aparece una
pantalla con las
secuencias del
alineamiento.

1- Cerrar archivo
del alineamiento.

2- Se muestra una
ventana en la cual se
aceptan los cambios
Hechos.

1- Abrir el archivo
convertido a formato
MEGA.

2- Seleccionar la secuencia codificante.

Seleccionar el
cdigo gentico
standard (1) y
cerrar la ventana (2).

Se realiza el estudio
filogentico por medio
del mtodo del vecino
ms cercano.

Primero se va a la opcin
de Phylogeny
(Filogenia) (1) y despus
se selecciona el modelo
Neighbor-Joining
(vecino ms cercano) (2).

Una vez seleccionado el tipo


de anlisis, se procede a

determinar el nmero de

diferencias. Aparece una


pantalla donde se
selecciona: Models (1)
(Modelos), Nucleotide
(Nucletido) (2) y finalmente
No. of Differences (No. De
diferencias) (3).

Se muestra un rbol con


las distancias (con
respecto al nmero de
secuencias
nucleotdicas) entre
cada secuencia en
estudio.

Para poder guardar


este rbol se va a
File (Archivo) y se
selecciona Export
current tree (Exportar
el rbol).

Posteriormente se elige Image


(Imagen) (1) para guardar la imagen
(y ser visualizada en otro programa)
escoger la opcin marcada con la
flecha (2).

Se realiza otro estudio


filogentico basado
en la distancia evolutiva.
Se selecciona Models
(Modelos) (1), Nucleotide
(Nucletido) (2) y finalmente
p-distance (Distancia P) (3).

Se muestra el rbol con las


distancias evolutivas, en
donde cero significa que no
hay diferencias entre las
secuencias.

Empleando la base de datos ENTREZ, obtener la secuencia


nucleotdica de aerA de Aeromonas hydrophila (Cdigo de
acceso: DQ186611).
Delimitar la secuencia codificante del mismo y realizar una
bsqueda de protenas relacionadas empleado la
herramienta PSI-BLAST.

Se requiere bajar
la secuencia del
gen, como ya se
ha hecho con
anterioridad.

En esta
informacin se
puede observar
que el gen
completo consta
de 2526 pb.
Se muestra como
resultado una hoja que se
proporciona informacin
general de la secuencia,
es importante seleccionar
la regin codificante
marcada como CDS.

Una vez que se


selecciona la
secuencia
codificante, sta
posee un tamao
de 1482 pb.

La secuencia se
guarda en los
formatos FASTA.

La secuencia
se guarda en
los formatos
FASTA
y texto .

Para llevar a cabo la


bsqueda de protenas se
requiere tener la secuencia en
Aminocidos (aa), para
obtenerla se selecciona
protein id (No. de acceso de
la protena).

Aparece una pgina que


contiene informacin
general, como el No. de aa.
Cambiar a formato fasta (1) y
Guardar como texto (2).

Una vez que se obtiene la secuencia


se guarda como archivo de FASTA (text).

Bsqueda de protenas relacionadas utilizando PSI-BLAST

Para hacer este


anlisis se ingresa
primero a la pgina
NCBI-BLAST y se
selecciona protein blast.

Se inserta el nmero de
acceso o la secuencia de
aminocidos.

Elegir el algoritmo PsiBlast (1) y posteriormente


ejecutar BLAST (2).

Aparece una pantalla en


la que se muestra el
dominio presente en
la protena, indicado
dentro del
valo.

La pantalla se actualiza
automticamente para
mostrar las protenas
relacionadas.

En esta pantalla se
observan los
alineamientos
significativos con
las diferentes
protenas.

Hacer una bsqueda en Internet de sitios donde se


puedan realizar los siguientes anlisis
bioinformticos: determinacin de peso molecular y
punto isoelctrico de protenas y
modelamiento de protenas.

http://expasy.org/

Ir a
proteomics

Determinar las propiedades fisicoqumicas de la protena.

En la pgina
de Proteomics:
1- Seleccionar
Protparam.

1- Pegar la secuencia
de la protena.
2- Elegir compute parameters.

2
3

Resultado: Aparece una


pantalla en donde se
muestran algunas
propiedades tales como el
punto isoelctrico (1), peso
molecular (2) y composicin
atmica (3), entre otras.

Bsqueda de pptidos seal

Ir a proteomics (1) y
seleccionar protein
sequences and
identification (2).

Ir a PeptideCutter

Identificacin de
potenciales sitios
de corte

Pegar la secuencia
de la protena (1).
Presionar perform (3).

Seleccionar la (s)
enzimas y/o los
qumicos que deseamos
probar (2).

Elaborar un modelo de estructura terciara de una protena


con base en homologa a protenas reportadas

Ir a
1. Proteomics

2. Protein structure

3. Ir a swiss-model repository

Pegar la secuencia
de la protena.

Protena

Estructura
terciaria

Elaborar un modelo de estructura


terciara de una protena

1. proteomics
3. Ir a swiss model
Workspace
2. Protein structure

Trabajar en
Automated mode

1.
2.
3.

Poner la direccin electrnica


Titulo del proyecto
Pegar la secuencia de la protena

Bsqueda de promotores en aerA de


Aeromonas hydrophila.

Es necesario contar con la secuencia de aerA en formato FASTA.

Ir a http://www.fruitfly.org/

En el inferior de
la pagina seleccionar
Analysis Tools
(herramientas de anlisis).

Aparece una pgina que muestra las herramientas para el anlisis


(Analysis tools).

Elegir Promoter Prediction


(prediccin del promotor).

Para la obtencin de la secuencia del promotor realizar lo siguiente:

Seleccionar las opciones:


1. prokaryote (procarionte).
2. no.
3. Ingresar en minimum
promoter score (puntuacin
mnima para el promotor) el
valor de 0.9.
4. Pegar la secuencia del gen.

5. Dar click a submit


(procesar).

Aparece la pgina con el resultado

Punto de inicio
de la transcripcin.

Convertir una secuencia


de DNA a RNA.

El programa que se utiliza es el DNAMAN

Pgina principal del programa DNAMAN.

Para la conversin de la secuencia de DNA a RNA, realizar lo siguiente:


1. Seleccionar file (archivo).
2. Elegir new (nuevo).

3. Introducir la secuencia
del gen.
4. Seleccionar la secuencia.

5- Ir a Sequence (secuencia).
6. Seleccionar load DNA1
(descargar DNA1).
7. Elegir from selection
(desde seleccin).

8- Aparece un recuadro.
Oprimir el botnaceptar.

9- Ir a DNA1.

10- Elegir RNA sequence


(Secuencia de RNA).

Aparece un recuadro que contiene el resultado

Secuencia de RNA.

Bsqueda de estructuras secundarias


relevantes para la secuencia del RNA.

El programa que se utiliza es el Rnadraw.

Pgina principal del programa.

La bsqueda de estructuras secundarias relevantes para la secuencia


del RNA se realiza de la siguiente manera:

1- Colocarse en el espacio
en blanco y presionar el
botn derecho del ratn.
Aparece un cuadro.
2- Seleccionar New file
(Archivo nuevo).

3- Aparece un cuadro, donde


hay que seleccionar la
opcin de import text file
(importar archivo de texto).
4- Seleccionar OK.

5- Aparece un recuadro donde


se debe seleccionar
el archivo del gen en estudio,
el cual puede ser de DNA o RNA.
6- Elegir abrir.

Se muestra el archivo.

7- Colocar el ratn sobre la


secuencia y presionar el botn
Derecho. Aparece un recuadro.
8- Seleccionar calculate
(calcular) y se muestra otro
recuadro.

9- Elegir structure(s)
(estructura(s)).

10- Aparece un recuadro y


se presiona calculate
(calcular).

Comienza a calcular
la estructura.

El programa termina de calcular


la estructura secundaria del RNA.

11- Presionar en el signo +.

12- Elegir 2D radial drawing.

Resultado

Estructura secundaria
del RNA.