Académique Documents
Professionnel Documents
Culture Documents
2. Bases de Qumica.
Qumica: Estudio de la materia. La materia est hecha de tomos
Qumica (palabra que podra provenir de los trminos griegos o ,
quemia y quemeia respectivamente). Es la ciencia que estudia tanto la
composicin, estructura y propiedades de la materia como los cambios que sta
experimenta durante las reacciones qumicas y su relacin con la energa. Es
definida, en tanto, por Linus Pauling, como la ciencia que estudia las sustancias,
su estructura (tipos y formas de acomodo de los tomos), sus propiedades y las
reacciones que las transforman en otras sustancias con referencia al tiempo.
La qumica moderna se desarroll a partir de la alquimia, una prctica
protocientfica de carcter filosfico, que combinaba elementos de la qumica, la
metalurgia, la fsica, la medicina, la biologa, entre otras ciencias y artes.
6
Bases de biologa.
Biologa: Ciencia que estudia los seres vivos.
Ser vivo: Es todo lo que es capaz de reproducirse.
La biologa tiene las siguientes caractersticas:
1. Universalidad: Las reacciones qumicas bsicas son las mismas en todos los
seres vivos.
2. Evolucin: Todos los organismos se evolucionaran de un nico ancestro comn.
3. Taxonoma: Todos los seres se dividen en una categora y subcategoras.
Encontramos tres (3) niveles:
Orgnico: Tejidos, agregaciones de clula.
Biologa Celular: Estudio sobre las clulas. Esto incluye su anatoma, su fisiologa,
las interacciones de sta con el medio, su ciclo vital, y su divisin y muerte.
Biologa Molecular: Estudio de las molculas. La biologa molecular concierne
principalmente al entendimiento de las interacciones de los diferentes sistemas de
la clula, lo que incluye muchsimas relaciones, entre ellas las del ADN con el
ARN, la sntesis de protenas, el metabolismo, y el cmo todas esas interacciones
son reguladas para conseguir un correcto funcionamiento de la clula.
Clula: Unidad funcional de todo ser vivo. Encontramos dos categoras de clulas:
Procariotas: No tienen ncleo.
Eucariotas: Tienen ncleo.
Entre
las
clulas
eucariotas
encontramos la vegetal y animal,
estas poseen diferencias que las
podemos observar en la figura donde
ilustra las estructuras que son
comunes en las clulas animales y
vegetales, as como las estructuras
que les son nicas. Las estructuras
que son comunes a plantas y
animales, estn en medio de la
imagen. Las estructuras propias de
las plantas, a la izquierda y las
animales a la derecha.
7
Nutricin.
Crecimiento.
Multiplicacin.
Diferenciacin.
Sealizacin.
Evolucin
3. Bases de gentica
4.1 Gentica
La gentica estudia los genes que determinan nuestras caractersticas.
Hay cuatro (4) tipos de gentica:
a) Gentica Clsica: trata de cromosomas y genes.
Cromosomas: Es como el ADN se empaqueta.
Genes: Secuencia larga (3Gb) en el genoma humano cada gen codifica las
protenas que dan nuestras caractersticas fsicas. Los genes estn dentro de
los cromosomas. En nuestro cuerpo hay 33.000 caractersticas.
b) Gentica Cuantitativa: Estudia el impacto de los fenotipos.
c) Gentica Evolutiva: Estudia como los genes se vuelven a travs del tiempo en
determinada poblacin.
d) Gentica Molecular: Estudia lo mismo que la gentica clsica, cuantitativa y
evolutiva pero a nivel molecular.
4.6 Protenas.
Las protenas son biomolculas formadas por cadenas lineales de aminocidos. El
nombre protena proviene de la palabra griega ("proteios"), que significa
"primario" o del dios Proteo, por la cantidad de formas que pueden tomar.
Las protenas desempean un papel fundamental para la vida y son las
biomolculas ms verstiles y ms diversas. Son imprescindibles para el
9
Las protenas estn formadas por aminocidos. Las protenas de todos los seres
vivos estn determinadas mayoritariamente por su gentica (con excepcin de
algunos pptidos antimicrobianos de sntesis no ribosomal), es decir, la
informacin gentica determina en gran medida qu protenas tiene una clula, un
tejido y un organismo.
Las protenas se sintetizan dependiendo de cmo se encuentren regulados los
genes que las codifican. Por lo tanto, son susceptibles a seales o factores
externos. El conjunto de las protenas expresadas en una circunstancia
determinada es denominado proteoma.
4. NCBI ENTREZ
Entrez es un portal y un buscador que permite acceder a la base de datos del
National Center forBiotechnologyInformation (NCBI). NCBI es una parte de la
National Library of Medicine (NLM), as como un departamento de
NationalInstitutes of Health (NIH) del Gobierno de los Estados Unidos. Aqu toda la
informacin biolgica es de dominio pblico. No se puede patentar la informacin
gentica.
10
2. Alineamiento de Secuencias.
Alinear: Comparar dos (2) secuencias. Resaltar sus similitudes y diferencias.
Cuando se analizan secuencias es comn utilizar los trminos similitud y
homologa de forma indiscriminada, pero estos dos trminos hacen referencia a
conceptos distintos.
3. BLAST
El algoritmo y el programa de computadora que lo implementa fueron
desarrollados por: Stephen Altschul, Warren Gish, David Lipman en el Centro
Nacional de Informacin Biotecnolgica (NCBI, por sus siglas en ingls), Webb
Millar en la Universidad estatal de Pennsylvania, y Gene Myers en la Universidad
de Arizona. Tambin es basado en el algoritmo Smith-Waterman y es local,
bastante rpido pero no garantiza el mejor resultado solo el mejor alineamiento. Es
usado para encontrar probables genes homlogos, es decir con funciones
similares.
Para ejecutarse, BLAST requiere dos secuencias como entrada: una secuencia de
consulta (tambin llamada secuencia blanco) y una base de datos de secuencias.
BLAST encontrar subsecuencias en la consulta que son similares a
subsecuencias de la base de datos. En el uso tpico, la secuencia de consulta es
mucho ms pequea que el banco de datos, por ejemplo, la consulta puede ser de
mil nucletidos mientras que la base de datos es de varios miles de millones de
nucletidos. BLAST busca alineamientos de secuencias de alto puntaje entre la
secuencia de consulta y las secuencias en el banco de datos usando un enfoque
heurstico. La velocidad y la relativamente buena precisin de BLAST son la clave
de la innovacin tcnica de los programas BLAST y probablemente el porqu es la
herramienta de bsqueda ms popular en bioinformtica.
11
3.1 Etapas
a) Asemilladlo (Seeding): BLAST busca coincidencias exactas de una
pequea longitud fija W entre la secuencia de consulta y las secuencias de
la base de datos. Por ejemplo, dadas las secuencias AGTTAC y ACTTAG y
el largo de palabra W = 3, BLAST podra identificar la subcadena
coincidente TTA que es comn en ambas secuencias. Por defecto, W = 11
para "semillas" nucleicas.
b) Extensin: BLAST trata de extender la coincidencia en ambas direcciones,
comenzando por la semilla. El proceso de alineamiento sin huecos,
extiende la coincidencia de la semilla inicial de longitud W en cada direccin
en un intento de estimular el puntaje de alineacin. Inserciones y
eliminaciones no son consideradas durante esta etapa. Para nuestro
ejemplo, el alineamiento sin huecos entre las secuencias AGTTAC y
ACTTAG centrado alrededor de la palabra en comn TTA podra ser: Si es
encontrado un alineamiento sin huecos de alto puntaje, la base de datos de
secuencias pasa a la tercera etapa.
c) Evaluacin: BLAST realiza un alineamiento con huecos entre la secuencia
de consulta y la secuencia de la base de datos usando una variacin del
algoritmo de Smith-Waterman. Entonces los alineamientos relevantes
estadsticamente son mostrados al usuario.
3.2 Familia Blast.
BLAST no garantiza que las secuencias que alinea sean homlogas y mucho
menos que tengan la misma funcin, simplemente provee posibles candidatos.
12
El cdigo gentico nos indica que aminocido corresponde a cada triplete o codn del ARN
mensajero.
1.1
14
1.2 Splicing
En el caso de los organismos Eucariotas el ADN no se transcribe completamente
sino solo por partes; Las secciones que no se transcriben se llaman Intrnes, los
cuales son regiones del ADN que debe ser eliminada del transcrito primario de
ARN, y las secciones que se trascriben se llaman Exones, los cuales son regiones
que codifican para una determinada protena.
15
3. Modelos Estocsticos
Estocstico: Utiliza probabilidad. un proceso estocstico es un concepto
matemtico que sirve para caracterizar una sucesin de variables aleatorias
(estocsticas) que evolucionan en funcin de otra variable, generalmente el
tiempo. Cada una de las variables aleatorias del proceso tiene su propia funcin
de distribucin de probabilidad y, entre ellas, pueden estar correlacionadas o no.
3.1. Modelo Oculto de Markov.
Un mtodo de previsin muy fiable sera aquel que analizase la evolucin de
distintos desarrollos teniendo en cuenta las interrelaciones entre dichos
desarrollos e introdujese la variable tiempo.
Este modelo se caracteriza por el desarrollo secuencial tecnolgico mediante dos
parmetros probabilsticos: la secuencia de los desarrollos y el tiempo entre
desarrollos sucesivos. Estos dos parmetros se pueden representar con los
conceptos transicin de estados y tiempo de permanencia en el estado.
Se dice que un proceso es de Markov cuando verifica la propiedad de Markov: la
evolucin del proceso depende del estado actual y del prximo, y no de anteriores
o posteriores.
4. GENSCAN
GENSCAN fue desarrollado por Chris Burge en el grupo de investigacin de
Samuel Karlin, Departamento de Matemticas de la Universidad de Stanford. El
programa y el modelo que subyace en ella se describen en: Burge, C. y Karlin, S.
(1997) Prediccin de la estructura de los genes completos en ADN genmico
humano. J. Mol. Biol. 268, 78-94.
16
CAPITULO IV
PROTENAS
ALINEAMIENTO
DE
SECUENCIAS
1. Alineamiento de Secuencias
1.1 Alineamiento mltiple de Secuencias Un mtodo de alineamiento mltiple
verdadero, alinea todas las secuencias al mismo tiempo.
Pero no existe un mtodo computacional que pueda realizar esto en tiempo
razonable para ms de 3 secuencias cortas.
17
Todos los seres vivos comparten su origen: todos provienen del reino mneras.
Este reino abarca los seres unicelulares procariotas, que carecen de ncleo
celular. Son las arqueo bacterias y las eubacterias.
De los mneras surgieron los protoctistas. Este reino rene seres eucariotas
unicelulares hetertrofos y con digestin interna (protozoos), y eucariotas
unicelulares o pluricelulares sin tejidos, auttrofos fotosintticos (algas).
El reino de los hongos comprende seres eucariotas, unicelulares o pluricelulares,
sin tejidos, hetertrofos y con digestin externa. Las metfitas o plantas son
eucariotas pluricelulares con tejidos y nutricin auttrofa.
Estudiando los cidos nucleicos, especialmente el ARN ribosmico, se ha
comprobado que se pueden clasificar los seres vivos en solo tres grandes grupos
o dominios. Esta tcnica se denomina filogenia molecular y tiene una gran utilidad
para establecer las relaciones de parentesco entre taxones de seres vivos,
basndose en la similitud gentica existente entre stos.
Los rboles filogenticos son una representacin grfica de las similitudes y
diferencias entre unas secuencias determinadas . Habitualmente, las secuencias
de los genes y las protenas son ms parecidas entre organismos ms cercanos
evolutivamente. Los organismos que hace ms tiempo que se separaron en la
evolucin suelen tener ms diferencias en las secuencias de sus respectivos
genes, y, por lo tanto, cuando se realiza un rbol filogentico, aparecen ms
alejados entre s
18
2. ClustalWJalview
2.1 Clustal.
CLUSTAL es un programa que permite hacer alineamientos globales de protenas
y cidos nucleicos y que adems tiene un algoritmo heurstico progresivo,
bastante rpido, para calcular alineamientos mltiples. En combinacin con
herramientas como BLAST, CLUSTAL es muy til para definir familias de protenas
y de cidos nucleicos.
Al igual que BLAST, tambin hay servidores web para correr CLUSTALW sin
necesidad de instalar software, pero asimismo tiene ventajas instalarlo localmente,
sobre todo para correr trabajos de alineamiento mltiple a gran escala y tener todo
el proceso bajo control.
2.2 Jalview
JalView es un editor de alineamiento mltiple por escrito en Java. Se utiliza
ampliamente en una variedad de pginas web (por ejemplo, el servidor de EBI
Clustalw y la base de datos de protenas Pfam dominio), pero est disponible
como un editor de propsito general, la alineacin y banco de trabajo de anlisis.
3. Protenas y Protemica
3.1 Protenas
Es una macromolcula -> Cadena muy larga de aminocidos. Los tipos principales
de macromolculas son las protenas, formadas por cadenas lineales de
aminocidos; los cidos nucleicos, DNA y RNA, formados por bases nucleotdicas
(purinas y pirimidinas), los polisacridos, formados por subunidades de azcares y
los lpidos formados por glicerol, cidos grasos o colesterol. Los aminocidos de
las protenas estn unidos por enlaces peptdicos, los carbohidratos de los
polisacridos por enlaces glucosdicos o peptdicos y los lpidos y cidos nucleicos
por enlaces ster.
Nuestro cuerpo posee 500.000 protenas.
El estudio de las protenas permite estudiar:
* Su Estructura: Es la manera como se organiza una protena para adquirir cierta
forma. Se puede estudiar su forma:
3D: Se realiza Experimentalmente (Rayos X, etc.) o Matemticamente.
Dominios Funcionales: Subsecuencia que desarrolla una funcin especfica.
3.2 Protema
Es el conjunto de todas las protenas producidas por una clula en un instante de
tiempo. El trmino proteoma se utiliz por primera vez en 1995 y ha sido aplicado
a diferentes escalas en los sistemas biolgicos. El proteoma celular es la totalidad
de protenas expresadas en una clula particular bajo condiciones de
medioambiente y etapa de desarrollo, (o ciclo celular) especficas, como lo puede
ser la exposicin a estimulacin hormonal. Tambin se puede hablar del proteoma
completo de un organismo que puede ser conceptualizado como las protenas de
19
3.3 Protemica
Ciencia que estudia el Proteoma. estudios que se han realizado tradicionalmente
mediante la tcnica de electroforsis en gel de dos dimensiones. En la primera
dimensin las protenas se separan por isoelectroenfoque, que separa las
protenas con base en su carga elctrica. En la segunda dimensin, las protenas
se separan por peso molecular utilizando SDS-PAGE.
20
La
22
23
24
Descomposicin y Normalizacin
Siempre que un analista de sistemas de base de datos arma una base de datos,
queda a su cargo descomponer dicha base en grupos y segmentos de registros.
25
26
27
28
29
31
Adenina y guanina son purinas; citosina y uracilo son pirimidinas. Las bases
pueden formar enlaces de hidrgeno entre la citosina y guanina, entre adenina y
uracilo y entre guanina y uracilo.
A diferencia de ADN que contiene slo cuatro bases A, T, G y C, RNA maduro
puede contener bases modificadas y azcares.
Pseudouridina (), en el que la vinculacin entre uracilo y ribosa se cambia de un
bono CN a un enlace CC y ribothymidine (T), se encuentran en varios lugares.
Otra notable base modificada es hipoxantina, una base de adenina desaminada
cuyos anlogos de los nuclesidos se llaman inosina (I).
2.2 Grupo hidroxilo de RNA
Hay presencia de un grupo hidroxilo en la posicin 2' del azcar ribosa. Esto
diferencia a RNA de ADN y hace el ARN adopte una geometra de un formulario en
lugar de la forma B ms comnmente observados en el ADN. Esto significa que
hay un surco mayor muy profundo y estrecho y un surco poco profundo y ancho
menor.
El grupo hidroxilo en 2' significa que en las regiones flexibles de una molcula de
ARN productos qumicos pueden atacar el enlace fosfodiester adyacentes para
romper la columna vertebral.
2.3 Grupo de fosfato de RNA
Un grupo fosfato est unido a la posicin 3' de una ribosa y la posicin 5' del
siguiente.
Los grupos fosfato tienen una carga negativa. Esto hace que el ARN una molcula
cargada (polyanion).
2.4 Estructura terciaria de RNA
Una vez que se forma el ARN, como las protenas requiere someterse a cambios
para formar una estructura terciaria especfica. El andamio para esta estructura es
proporcionado por elementos estructurales secundarios que son enlaces de
hidrgeno en la molcula. El filamento forma bucles de horquilla, bultos y bucles
internos. Ya est cargada RNA, iones metlicos como Mg2 + son necesarios para
estabilizar muchas estructuras secundarias y terciarias. Las estructuras terciarias
de ARN se determinan usando asignacin de interferencia de sondeo y
modificacin qumica, cristalografa de rayos x y resonancia magntica nuclear
(RMN), criomicroscopa electrnica.
3. Estructura de Protenas
32
34
5. Folding de Protenas
Las protenas para llevar a cabo sus funciones deben alcanzar una forma
determinada, conocida como Pliegue, en otras palabras, antes de realizar su
trabajo tienen que ensamblarse a s mismas. Este proceso de auto ensamblaje se
le llama Plegamiento.
Las protenas plegadas incorrectamente por lo general carecen de actividad
biolgica, pero en algunos casos pueden estar asociadas con enfermedades.
Para esto las clulas tienen sistemas que reducen las posibilidades de que las
protenas estn mal plegadas, adems cualquier protena de este tipo son
degradados por grupos celulares especializados del sistema de eliminacin.
cadenas recin formadas que emergen de los ribosomas. En tanto que otras guan
en las etapas posteriores del plegado.
5.1.2 Chaperoninas
Las chaperoninas utilizan su estructura para ayudar en el plegamiento de muchas
protenas mediante un mecanismo muy general pero poco eficiente, que se basa
en el aislamiento de la protena a plegar. En los organismos eucariotas esta
arquitectura ha generado la chaperonina CCT, que pliega eficientemente un
reducido nmero de protenas.
6. Alineamiento de Estructuras
Un alineamiento estructural es un tipo de alineamiento de secuencias basado en la
comparacin de la forma. Estos alineamientos intentan establecer equivalencias
entre dos o ms estructuras de polmeros basndose en su forma y conformacin
tridimensional. El proceso se aplica normalmente a las estructuras terciarias de las
protenas, pero tambin puede usarse para largas molculas de ARN. En
contraste a la simple superposicin estructural, donde al menos se conocen
algunos residuos equivalentes de las dos estructuras, el alineamiento estructural
no requiere un conocimiento previo de posiciones equivalentes. Es una valiosa
herramienta para la comparacin de protenas con baja similitud entre sus
secuencias, en donde las relaciones evolutivas entre protenas no pueden ser
fcilmente detectadas por tcnicas estndares de alineamiento de secuencias. El
alineamiento estructural puede usarse, por lo tanto, para sugerir relaciones
evolutivas entre protenas que comparten una secuencia comn muy corta. Sin
embargo, el uso de los resultados como evidencia de un ancestro evolutivo comn
debe realizarse con cautela dados los posibles efectos de confusin con la
evolucin convergente, segn la cual mltiples secuencias de aminocidos sin
relacin filogentica entre si convergen a una misma estructura terciaria."
36
CONCLUSIN
37
BIBLIOGRAFA.
Apuntes de Clase de Bioinformtica. Ingeniera Telemtica. Docente Marco
Regalia. Universidad Distrital Francisco Jos de Caldas. 2011
http://www.aulaclic.es/sqlserver/b_1_1_4.htm
http://www.monografias.com/trabajos5/norbad/norbad.shtml#ixzz3l0CPoRmD
https://adnestructurayfunciones.wordpress.com/2008/08/15/adn/
http://biology.kenyon.edu/courses/biol63/watson_06.pdf
http://www.news-medical.net/health/RNA-Structure-(Spanish).aspx
http://tecnologica.udistrital.edu.co/moodle/course/view.php?id=36
http://www.um.es/molecula/anucl03.htm
http://scielo.sld.cu/scielo.php?pid=S1024-94352004000600002&script=sci_arttext
38