Vous êtes sur la page 1sur 167

INTRODUCCIÓN A LA

BIOINFORMÁTICA
La bioinformática es un campo interdisciplinar que está revolucionando la
comprensión en las ciencias biológicas, donde se emplea el computador como
herramienta experimental. La bioinformática está contribuyendo al proceso de
innovación tecnológica así como a descifrar la historia origen del ser humano
gracias a la utilización de tecnologías computacionales que permiten ampliar la
comprensión del mundo en el que vivimos.
Especial agradecimiento al promotor del proyecto
y a los compañeros de Ingeniería Telemática,
que con el paso de cada semestre han ido enriqueciendo el presente libro.

Promotor del proyecto


Marco Regalia

Editores Versiones Anteriores:


Jennifer Medina Walteros
Fabrizzio Garzon Urrego
Pablo Tafurth Montoya
Juan Barbosa Suarez
York Williams Gonzalez
Mayra Alexandra Perdomo Ramirez

Bogotá D.C. Marzo de 2015


INTRODUCCIÓN

Vivimos un momento de la historia en el cual la tecnología avanza


rápidamente. Una muestra de ello son los descubrimientos y las
innovaciones en el campo de la genética, que han aportado sin duda al
desarrollo de la biología, la medicina y la agricultura.

Los procesos biológicos y genéticos se desarrollan de manera


incontrolable, al punto que se ha llegado a crear bancos que albergan
genes y secuencias de proteínas e incluso desarrollar software
encargados de organizar, analizar y distribuir grandes cantidades de
información biológica y genética complejas codificadas en las moléculas
del ADN. Esto es lo que se conoce como Bioinformática o la evolución de
la Biología como una disciplina que une a la computación y la información
para crear indicios, a través de experimentos y simulaciones, de nueva
información biológica que permite entender mejor a los organismos vivos.

La bioinformática se ha convertido en una ciencia que está entrando en


auge en Latinoamérica debido a que la tecnología ha tenido un gran
desarrollo y ha permitido unir la informática con otras ciencias como la
biología y la genética.

La secuenciación de genomas lleva la necesidad de obtener conclusiones


de la lectura de esos millones de pares de bases, saber qué codifican,
cómo se relacionan y regulan la expresión de los distintos productos
génicos, además de encontrar la función de proteínas desconocidas y de
generar modelos que permitan estudiar mutaciones puntuales. La rapidez
y eficacia de esas conclusiones se ha generado gracias al desarrollo de
la Bioinformática.

Este libro tiene por objetivo entregar una descripción básica de la


recopilación de información acerca de las temáticas tratadas en clase de
Bioinformática, su relación con la Informática Médica, sus principales
herramientas, bases de datos y funciones en la Medicina Molecular y
Biotecnología, en el canal de YouTube se encuentran las clases a las
cuales se hace referencia.
Contenido
INTRODUCCIÓN A LA BIOINFORMÁTICA ........................................................................... 1
INTRODUCCIÓN ......................................................................................................................... 4
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA .................................................. 1
1.1 Qué es la Bioinformática ................................................................................................. 1
BIOINFORMATICA ................................................................................................................. 4
Breve historia ............................................................................................................................. 6
Definición: ................................................................................................................................. 6
Objetivo: .................................................................................................................................... 6
1.2 Aplicaciones de la Bioinformática ...................................................................................... 7
1.2 Nociones de Química .................................................................................................... 10
1.4 Bases de Biología ............................................................................................................... 15
1.5 Bases de Genética .............................................................................................................. 19
1.5.1 Genética .......................................................................................................................... 19
1.5.2 Dogma Central De La Biología Molecular ..................................................................... 21
1.5.3 Ácido Desoxirribonucleico (ADN) ................................................................................. 23
1.5.4 Traducción y Transcripción Genética ............................................................................. 26
1.5.5 Código Genético ............................................................................................................. 32
1.5.6 Proteínas.......................................................................................................................... 37
1.6 NCBI Entrez....................................................................................................................... 40
CAPITULO II - SECUENCIAS DE ADN .................................................................................. 42
2.1 Formato FASTA ................................................................................................................ 42
2.2 Alineamiento de Secuencias ............................................................................................. 44
2. 3 Algoritmos de Búsqueda de ADN .................................................................................... 45
2.5.1 FASTA ............................................................................................................................ 47
2.5.2 BLAST ............................................................................................................................ 48
CAPITULO - III GENES............................................................................................................. 51
3.1 Código Genético ................................................................................................................ 51
3.2 Open Reading Frames (ORF) ............................................................................................ 56
3.3 Modelos Estocásticos ......................................................................................................... 61
3.4 GENSCAN......................................................................................................................... 64
CAPITULO IV - ALINEAMIENTO DE SECUENCIAS Y PROTEÍNAS ................................ 67
4.1 Alineamiento de Secuencias .............................................................................................. 67
4.1.1 Método Global ............................................................................................................ 68
4.1.2 Programación Dinámica.............................................................................................. 69
4.1.3 Árbol Filogenético ...................................................................................................... 69
4.2 Clustal Y JalView .............................................................................................................. 72
4.2.1 Clustal ............................................................................................................................. 72
4.2.2 Jalview ........................................................................................................................... 76
4.3 Proteínas y Proteómica ...................................................................................................... 78
4.3.1 Proteínas.......................................................................................................................... 78
4.3.2 Proteóma ......................................................................................................................... 79
4.3.3 Proteómica ...................................................................................................................... 81
4.4 Análisis Comparativo de Proteínas .................................................................................... 82
4.5 Bases de Datos de Familias de Proteínas PROSITE, PRINTS, Pfam, InterPro ................ 84
4.5.1 PROSITE ........................................................................................................................ 84
4.5.2 PRINTS ........................................................................................................................... 87
4.5.3 Pfam ................................................................................................................................ 92
CAPITULO V - BASES DE DATOS ......................................................................................... 97
5.1 Introducción ....................................................................................................................... 97
5.2 Modelos de Base de Datos ................................................................................................. 98
5.2.1 Modelo jerárquico. .......................................................................................................... 98
5.2.2 Modelo en red. ................................................................................................................ 99
5.2.3 Modelos Avanzados ...................................................................................................... 100
5.2.4 Modelo orientado a objetos. .......................................................................................... 101
5.2.5 Modelo declarativo. ...................................................................................................... 102
5.3 Estructura de Bases de Datos Relacionales ..................................................................... 104
5.3.1 Descomposición y Normalización ................................................................................ 104
5.3.2 Normalización ............................................................................................................... 104
5.3.3 Biología de Visualización de Datos .............................................................................. 105
5.4 Base de Datos Biológicas................................................................................................. 106
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS.................................................................. 109
6.1 Estructura ADN ............................................................................................................... 109
6.1.1 Estructura Primaria: .................................................................................................. 110
6.1.2 Estructura Secundaria: .............................................................................................. 111
6.1.3 Estructura Terciaria:.................................................................................................. 111
6.2 Estructura ARN ................................................................................................................ 112
6.2.1 Estructura Primaria del ARN .................................................................................... 114
6.2.2 Estructura Secundaria del ARN ................................................................................ 114
6.2.3 Estructura Terciaria del ARN ................................................................................... 115
6.3 Estructura de Proteínas .................................................................................................... 116
6.3.1 Estructura Primaria ................................................................................................... 117
6.3.2 Estructura Secundaria ............................................................................................... 118
6.3.3 Estructura Terciaria ................................................................................................... 119
6.3.4 Estructura Cuaternaria .............................................................................................. 119
6.4 Protein Data Bank ............................................................................................................ 120
6.5 Folding de Proteínas ........................................................................................................ 124
6.5.1 Proceso De Folding ....................................................................................................... 125
6.6 Alineamiento de Estructuras ............................................................................................ 127
CONCLUSIONES ..................................................................................................................... 131
BIBLIOGRAFÍA E INFOGRAFÍA ........................................................................................... 160
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

1.1 Qué es la Bioinformática

Para definir bioinformática es necesario tener en cuenta algunas palabras claves, que
serán de ayuda a lo largo del contenido de este libro.

• ADN (Ácido desoxirribonucleico)

Es un tipo de ácido nucleico, una macromolécula


que forma parte de todas las células. Se encuentra
situado en el núcleo de la célula y contiene la
información genética de todos los seres vivos.

• ARN (Ácido Ribonucleico)

Es un ácido nucleico de cadena sencilla compuesto por los nucleótidos Adenina


(A), Uracilo (U), Guanina (G) y Citosina (C). En las células sirve como
intermediario de la información genética ya que copia ésta del ADN y en el
citoplasma dirige la síntesis de proteínas según su secuencia de nucleótidos.

¿Sabías Que?
Aunque todos tenemos la idea del
ADN de doble hélice, lo cierto es que existen
muchos tipos de ADN con formas variadas y
extrañas: desde una triple hélice hasta cualquier
forma que se te pueda ocurrir.

1
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

• PROTEINA

Las proteínas son moléculas de un enorme tamaño


formadas por aminoácidos, que tienen diversas
funciones, desde estructurales como el colágeno en
nuestra piel, funciones metabólicas como la
insulina, que regula los niveles de azúcar en
nuestra sangre, también existen proteínas que
presentan una función de transporte como la
hemoglobina, la cual transporta el oxígeno que
respiramos a todo nuestro cuerpo.

• GEN
Un gen es un trozo de ADN que lleva la
información para que se fabrique una proteína.
Desde el punto de vista de la genética, podemos
decir que un gen es una porción de cromosoma
que lleva la información para que se manifieste
un carácter.

• GENOMA: Un genoma es una colección completa de ácido desoxirribonucleico


(ADN) de un organismo, o sea un compuesto químico que contiene las
instrucciones genéticas necesarias para desarrollar y dirigir las actividades de
todo organismo.

¿Sabías Que?
Compartimos el 99.9% de nuestros genes
Cada ser humano comparte el 99.9% de su ADN
con cualquier otro ser humano, mientras que con los
chimpancés compartimos el 98% de los genes. Un
dato básico para los amantes de la discriminación.

2
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

• GENOMICA

Ciencia que estudia el genoma (conjunto de


todos los genes de un organismo).

• SECUENCIA

Es una sucesión de letras representando la estructura primaria de una molécula


real o hipotética de ADN o banda, con la capacidad de transportar información.
Las posibles letras son A, C, G, y T.

• ESTRUCTURA
La estructura tridimensional de una proteína es un factor determinante en su
actividad biológica. Tiene un carácter jerarquizado, es decir, implica unos
niveles de complejidad creciente que dan lugar a 4 tipos de estructuras:
primaria, secundaria, terciaria y cuaternaria.

3
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

• ALINEAR
Comparar dos secuencias para ver similitudes y diferencias entre ellas.

BIOINFORMATICA
La bioinformática es una ciencia muy joven, si miramos a través del tiempo algunos
descubrimientos fueron de la siguiente manera:

Año Hechos
1933 Tiselius introduce una nueva técnica (electroforesis) para la separación
de proteínas.
1951 Pauling y Corey proponen la estructura para la α-hélice y las hojas-β. Se
reporta la secuencia de la proteína de la insulina.

1953 Watson y Crick proponen el modelo de doble hélice para el DNA


basándose en los datos de rayos X obtenidos por Franklin y Wilkins.

1954 El grupo de Perutz desarrolló el método de átomos pesados para aplicarlo


en cristalografía de proteínas
1955 Se analiza la primera secuencia de proteína, insulina bovina por F.
Sanger.
1969 Se crea ARPANET (Advanced Research Projects Agency Network, red
dedatos gubernamental) a través de la unión de computadores de las
universidades de UCLA y Stanford.
1970 Se publican los detalles del algoritmo de Needleman-Wunsh para
comparación de secuencias
1972 Paul Berg y su grupo crean la primera molécula de DNA recombinante.
Se crea la colección de rayos X por cristalografía de 10 proteínas.
1973 Se anuncia la creación del Banco de Datos de Proteínas de Brookhaven
1974 Vint Cerf y Robert Kahn desarrollan el concepto de redes de
computadores conectados en una “internet” y el desarrollo del Protocolo
de Control de Transmisión (TCP).
1975 P.H.O´Farrel anuncia el desarrollo de la electroforesis en dos
dimensiones, donde se combina la separación de proteínas en geles de
poliacrilamida con la separación por puntos isoeléctricos.

4
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

E.M. Southern publica los detalles para la técnica de Southern Blot.


1977 La descripción completa de la PDB de Brookhaven (www.pdbl.bnl.gov)
1980 La secuencia completa del primer genoma: bacteriófago FX174 (5.368
kb). Un gen de 5.368 para de bases que codifica nueve proteínas.

Se funda en California IntelliGenetics.Inc. Que comercializa investigación


académica en bioinformática. Es el primer desarrollador de software para
análisis de DNA y proteínas en el mundo.
1981 Se publica el algoritmo para alineamiento de secuencias de Smith-
Waterman.
1982 Se crea Genetics Computer Group (GCG) como parte del Centro de
Biotecnología de la Universidad de Wisconsin
1985 Se publica el algoritmo FAST. El algoritmo es diseñado para identificar
secuencias de proteínas que descienden de un antecesor común.

Kary Mullis y colaboradores describen la reacción de PCR


1986 Thomas Roderick acuña el término “genómica” para describir la disciplina
del mapeo, secuenciamiento y análisis de genes.

Se crea la base SWISS-PROT por el Departamento de Bioquímica de la


Universidad de Genova y el Laboratorio Europeo de Biología Molecular
(EMBL)
1987 Se describe el uso de cromosomas artificiales de levaduras (YACs). Se
publica el mapa físico de E. coli.

Larry Wall publica Perl (Practical Extraction Report Language)


1988 Se establece el National Center for Biotechnology Information (NCBI)

Se da comienzo a la “la iniciativa del genoma humano”.

Pearson y Lupman publican el algoritmo FASTA para la comparación de


secuencias.
1990 Se implementa el programa BLAST
1992 Mel Simons y colaboradores anuncian el uso de BACs para clonación
1995 Se secuencia el genoma de Haemophilus influenza (1.8 Mb)
y Micoplasma genitalium
1996 Se secuencia el genoma de Saccharomyces cerevisiae (12.1 Mb).
Affymetrix produce el primer chip de DNA comercial.
1997 Se publica el genoma de E. coli (4.7 Mb)
1998 Se publica el genoma de Caenorhabditis elegans.
1999 Secuencia completa del primer cromosoma humano, el cromosoma 22,
por investigadores del proyecto Genoma humano
2000 Se publica el genoma de Pseudomona aeruginosa (6.3 Mb),
de Arabidopsis thaliana (100 Mb) y Drosophila melanogaster (180 Mb).

Se publica la secuencia de otro cromosoma humano, el cromosoma 21.


El presidente nortemericano Cinton anuncia grandes avances en el
proyecto Genoma humano
2001 Se publica el genoma human (3.000 Mb)
2002 Surgimiento de la bioinformática estructural

5
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

El consorcio internacional para el genoma del ratón publica el borrador


del genoma completo de ratón.
2003 Se completa el proyecto genoma humano en abril de 2003

Se crea el consorcio UniProt


2004 El consorcio del genoma de rata publica el borrador de la secuencia
deRattus norvegicus

Breve historia

En 1865 Gregor Mendel llevo a cabo su famoso experimento con flores, aunque por
muchos años, este trabajo fue ignorado. El experimento fue muy simple pero de un gran
significado. Mendel registro los diferentes colores de flores en varias generaciones, noto
como algunos colores pasaban de una generación a la siguiente, mientras que otros no.
De allí empezó a desarrollar la idea de la herencia.

En el lenguaje de los primeros años del siglo XX, los científicos eran capaces de explicar
el trabajo de Mendel. Se describía a través de los llamados “factores controlados” que
pasan de generación a generación.

Actualmente, con los desarrollos en el campo de la tecnología médica, el cuerpo


humano está siendo explorado. Los investigadores han determinado que cada célula
del cuerpo humano contiene 23 pares de cromosomas. La investigación en este campo
ha descubierto alrededor de 30.000 genes, donde cada gen contiene cerca de 3 billones
de pares de bases de ácido desoxiribonucleico (DNA).

Obviamente, con estos números asombrosos, existe una cantidad asombrosa de datos
que se producen día a día y que requieren análisis. En los últimos años el desarrollo
de las ciencias y tecnologías computacionales y en particular, la tecnología de Internet,
han permitido que el trabajo de análisis se pueda desarrollar a través de software de
Internet. Aquí es donde la ciencia de la bioinformática empieza a crecer rápidamente
en los últimos años, sin signos de que este crecimiento se detenga.

Definición:
Es la disciplina científica que combina biología, computación y tecnologías de la
información.

Objetivo:
El objetivo de esta disciplina es facilitar nuevas percepciones biológicas y crear una
perspectiva global que permita identificar los principios unificadores de la biología.
Inicialmente, la bioinformática se ocupaba sobre todo de la creación de bases de datos
de información biológica, especialmente secuencias, y del desarrollo de herramientas
para la utilización y análisis de los datos contenidos en esas bases de datos.

6
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

La bioinformática en el campo de los sistemas es análoga a la Minería de Datos de:

➢ ADN (Ácido Desoxirribonucleico)


➢ Proteínas
➢ Genómicas
➢ Mutación /Polimorfismo

Podemos encontrar tres actividades principales:

➢ Adquisición y organización de datos biológicos.


➢ Concepción de lógicas para el análisis, comparación y la modelación de datos.
➢ Análisis de resultados producidos por estas lógicas.

1.2 Aplicaciones de la Bioinformática


La bioinformática abarca distintas áreas como:

➢ Genómica: Ciencia que estudia el genoma y de igual forma aspectos


de los genes como la estructura, funcionamiento, evolución.
➢ Transcriptómica: Transferencia genoma a proteína.
➢ Proteómica: Estudio de Proteínas.
➢ Metabolismo: Procesos físico - químicos como la respiración, etc.
➢ Genómica Comparativa: Compara genomas de varios individuos, especies.
➢ Genómica Funcional: Estudia la función del gen. Saber qué hace el gen.
➢ Análisis Filogenéticos: Trata acerca de los árboles basados en la
genética de las especies.

Las principales áreas de la Bioinformática y de la Biología Computacional son:


1) El desarrollo de herramientas que permitan el acceso, uso y actualización de
distintos tipos de información biológica;
2) El desarrollo de nuevos algoritmos y soluciones estadísticas para analizar
grandes conjuntos de datos y resolver problemas biológicos complejos, tales como
predecir la estructura de un gen en una secuencia genómica, predecir la estructura
de proteínas, identificar familias de proteínas por su similitud de secuencia, etc.

7
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

EVENTOS IMPORTANTES DE LA BIOINFORMÁTICA

1er gen ARN Primer


Tecnica de secuenciador
Maxam Gilbert aplicado de
para el ADN biosistemas

Tecnica de F. Sanger para el ADN Primer virus Phi

1er
1er bacteria pluricelular
Secuencia masiva
100mb.
1.83mb y paralela

1er eucariota
12 mb.

8
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

La bioinformática ha tenido especial desarrollo en el área de la medicina en donde se


ha buscado la obtención de curas para enfermedades como el cáncer, aquellas que son
de carácter hereditario, enfermedades derivadas de mutaciones, entre otras.

Actualmente, la bioinformática aplicada a la biodiversidad permite llevar un control y


descubrir variedades de animales y plantas.

Para tener en cuenta


Antes de la era de la bioinformática, solo existían dos
caminos para desarrollar experimentos biológicos: el
primero involucra organismos vivos (llamado in vivo) y el
otro implica un ambiente artificial (llamado in Vitro, que
proviene del Latín en vidrio).

9
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

1.2 Nociones de Química


Conceptos principales:

Química: es la ciencia que estudia tanto la composición,


estructura y propiedades de la materia como los cambios
que ésta experimenta durante las reacciones químicas y su
relación con la energía, esta se centra principalmente
átomo.

El átomo: Es la unidad más pequeña de un elemento


químico, que mantiene sus propiedades y no es posible dividir
por procesos químicos. Un átomo cuando pierde un protón se
llama ión.

Tabla periódica: es el recetario de la química donde todos los posibles


ingredientes de cualquier sustancia o compuesto químico está relacionado según
sus propiedades físicas y químicas.

10
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

Explicación de partes de los elementos de la tabla periódica:

Modelo atómico: Es la representación estructural de un átomo,


que trata de explicar su comportamiento y sus propiedades.

Modelo atómico de Rutherford, mostraba que el átomo estaba


compuesto por un núcleo de carga positiva (protón) y alrededor
carga negativa (electrones).

El número atómico: es la cantidad de protones que


posee el átomo.

¿Sabías que?
Los átomos se combinan entre sí para formar
distintas sustancias. Por ejemplo, dos átomos de
hidrógeno con uno de oxígeno son agua.

11
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

Ión Positivo: Cuando se pierde un electrón.

Ión Negativo: Cuando se ganan electrones.

Neutrón: Hace que el peso aumente.

Isotopo: Tienen dos átomos, el mismo número cantidad de neutrones.

Isotopos del carbono

Deuterio: dos neutrones.

Tripcio: tres neutrones.

Molécula: Conjunto de átomos. Las moléculas se dibujan con


ángulos disminuyo la energía potencial.

Enlace Químico: Fuerza de atracción por fuerza electromagnética. Ahí se


intercambian electrones.

12
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

Bioquímica: Química relacionada con los seres vivos. Los átomos que componen
nuestro cuerpo fundamentalmente son cuatro:
➢ Hidrógeno
➢ Carbono
➢ Nitrógeno
➢ Oxígeno

Compuesto Orgánico: Todas las moléculas que contienen carbono. Podemos


encontrar cuatro (4) clases de compuesto orgánico que son:

➢ Carbohidratos o Glúcidos: Son los que dan energía


a nuestro cuerpo.

➢ Lípidos: Grasas, no son solubles en el agua. Sirven para


reserva de energía.

➢Proteínas: Determinan nuestras características (piel,


ojos, cabello, etc.).

➢ Ácidos nucleicos: ADN, ARN, ATP. Son formados por los


nucleótidos Timina, Guanina, Adenina y Citosina.

¿Sabías que?
Las moléculas más grandes de la Naturaleza viven
dentro del cuerpo. Se trata del cromosoma 1. De entre
los 23 pares de cromosomas que existen en los núcleos
de nuestras células, el 1 es el más grande, pues contiene
10 mil millones de átomos.

13
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

Con esta base surgen algunas preguntas.

➢ ¿Se pueden entender la estructura y las propiedades de las cosas antes de hacer
experimentos?
➢ ¿Puede una simulación matemática predecir comportamientos de la realidad
material?

La respuesta la proporciona: La química computacional.

La química computacional introduce la mayor complejidad posible en sus cálculos e


intenta pre-decir los valores de propiedades observadas experimentalmente. Es decir,
procura obtener resultados con valor predictivo. En algunas situaciones ese camino es
mejor que realizar un experimento, dado que puede resultar imposible o muy arduo de
realizar, o las propiedades de interés pueden ser muy difíciles de medir.

Para tener en cuenta


El filósofo griego Aristóteles pensaba que las sustancias
estaba formada por cuatros elementos: tierra, aire, agua y
fuego. Paralelamente discurría otra corriente paralela, el
atomismo, que postulaba que la materia estaba formada de
átomos, partículas indivisibles que se podían considerar la
unidad mínima de materia.

14
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

1.4 Bases de Biología

Biología: Ciencia que estudia los seres vivos.

Ser vivo: Ser que es capaz de reproducirse por sí mismo.

La biología tiene las siguientes características:

1. Universalidad: Las reacciones químicas básicas son las mismas en todos los
seres vivos.
2. Evolución: Todos los organismos se evolucionaran de un único ancestro común.

• La evolución explica el primer principio, como la vida viene de un


antepasado común y heredaron los procesos básicos.
• La evolución no acontece por escalones sino de forma continua.
• Todavía hay evolución o mutación pero es aún muy lenta.
• Las especies más aptas sobreviven no muere sino vive para crear más
hijos.

¿Sabías que?
Aunque son minoría, hoy abundan quienes tienen ojos
claros. Muchas personas tienen ojos de distintas tonalidades
de azules, sin embargo, esto no siempre fue así. Según el
trabajo del genetista Hans Eiberg, el origen de los ojos
celestes en humanos estaría en una extraña mutación del gen
OCA2 hace miles de años, entre 6.000 y 10.000
aproximadamente.

15
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

3. Taxonomía: Todos los seres se dividen en una categoría y subcategorías.

Encontramos tres (3) niveles:

Orgánico: Tejidos, agregaciones de célula. Estructura o


compartimento subcelular, análoga a los órganos de seres
vivos pluricelulares, que desempeña una función
concreta.

Biología Molecular: Estudio de las moléculas. La


biología molecular concierne principalmente al
entendimiento de las interacciones de los diferentes
sistemas de la célula, lo que incluye muchísimas
relaciones, entre ellas las del ADN con el ARN, la síntesis
de proteínas, el metabolismo, y el cómo todas esas
interacciones son reguladas para conseguir un correcto
funcionamiento de la célula.
16
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

Biología Celular: Estudio sobre las células. Esto incluye su


anatomía, su fisiología, las interacciones de ésta con el
medio, su ciclo vital, y su división y muerte. La célula es la
más pequeña entidad viva.

Las células hacen parte de dos clases de organismos: Pluricelulares y Mono celulares
por ejemplo la célula animal es pluricelular y las bacterias mono celulares.

Funciones de la célula.

Célula: La célula es la estructura más pequeña capaz de realizar por sí misma las tres funciones
vitales: nutrición, relación y reproducción.

➢ Nutrición: comprende la incorporación de los


alimentos al interior de la célula, la
transformación de los mismos y la asimilación de
las sustancias útiles para formar así la célula su
propia materia.

➢ Crecimiento: El crecimiento es el aumento de


tamaño y volumen del organismo; se debe al
incremento en el número de sus células o a
que éstas se hacen más grandes.

➢ Multiplicación: es el proceso de formación de nuevas células, o células hijas, a


partir de una célula inicial, o célula madre.

17
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

➢ Diferenciación: La diferenciación
celular es el proceso por el cual las células de
un linaje celular concreto (el linaje celular se
determina en el momento de la formación del
embrión) sufren modificaciones en su expresión
génica, para adquirir la morfología y las
funciones de un tipo celular específico y
diferente al resto de tipos celulares del
organismo.

➢ Señalización: comunicación mediante


compuestos (señales) que generan
respuestas determinadas en células Diana.

➢ Evolución: capacidad de transformación y


adaptación según las necesidades.

¿Sabías que?
Cuando una célula se vuelve demasiado vieja, es capaz de
destruirse a sí misma.
Al final del ciclo vital de una célula, cuando esta ya no puede
reproducirse más, esta inicia un proceso mediante el cual
fagocita, es decir, se come, sus propios orgánulos, incluyendo
mitocondrias y cloroplastos. Aunque esto produce la muerte
celular, las moléculas de esta célula pueden servir como
nutrientes a las de alrededor. 18
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

1.5 Bases de Genética

1.5.1 Genética

La genética (del griego antiguo γενετικός, genetikos genetivo y este de γένεσις génesis,
"origen") es el campo de la biología que busca comprender la herencia biológica que se
transmite de generación en generación.

La genética estudia los genes que determinan nuestras características. Hay cuatro (4)
tipos de genética:

Una molécula de ADN:


las dos cadenas se
componen de
nucleótidos, cuya
secuencia es la
información
genética.

¿Sabías que?
2.1 de cada 180 niños nace con una enfermedad provocada
por defectos genéticos

Existen enfermedades que, si bien no son hereditarias, si


son genéticas, provocadas por defectos en las
mitocondrias, ya sea estén presentes en el ovulo materno o
manifestándose en la etapa embrionaria. La enfermedad
mitocondrial más común es el síndrome de Down.
19
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

✓ Genética Clásica: estudio de cromosomas y genes y como se heredan.

Cromosomas: Es como el ADN se empaqueta.

✓ Genética Cuantitativa: Estudia el impacto de los genes sobre una característica


física(fenotipos).

✓ Genética Evolutiva: Estudia como los genes se vuelven a través del tiempo
en determinada población.

20
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

✓ Genética Molecular: Estudia lo mismo que la genética clásica, cuantitativa y


evolutiva pero a nivel molecular.

La genética molecular tiene un dogma denominado:

1.5.2 Dogma Central De La Biología Molecular

Es un concepto que ilustra los mecanismos de transmisión y expresión de la herencia


genética tras el descubrimiento de la codificación de ésta en la doble hélice del ADN. El
cual en definitiva postulaba que el ADN generaba una copia similar a él la cual era
transportada hacia el citoplasma y ahí daba origen a las proteínas.

21
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

Genotipo: Conjunto de toda nuestra información genética


(Nuestro Disco Duro).

Fenotipo: Conjunto de características Físicas.

Para tener en cuenta


Diferencias clave entre fenotipo y genotipo:
• El genotipo tiene que ver con la genética y los rasgos
heredados de un organismo, mientras que el fenotipo se
refiere a las características físicamente observables de
dicho organismo y también tiene que ver con los
factores ambientales.
• El genotipo determina en gran medida cuál es el
fenotipo final de un organismo.
• El genotipo trabaja de manera interna, mientras que el
fenotipo es la expresión externa del proceso interno (y
de los factores ambientales que se presenten).

22
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

La replicación consiste en la copia del ADN de una célula, antes de la división celular,
para que la célula hija tenga el mismo ADN que la madre.

La transcripción consiste en convertir la información contenida en el ADN en un


formato “legible” para la maquinaria celular de síntesis de proteínas, el ARN.

La traducción es el mecanismo por el que el mensaje que lleva el ARN se utiliza para
sintetizar proteínas.

Con estos tres mecanismos conseguimos extraer de la información genética (ADN) los
materiales (proteínas) necesarios tanto funcional como estructuralmente para que una
célula funcione. La copia de trabajo es sobre un gen (de un archivo a la vez). El sistema
es universal.

1.5.3 Ácido Desoxirribonucleico (ADN)

23
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

El ADN es una doble hélice de 2 cadenas de núcleo y nucleótidos y cada uno contiene:
1. Grupo fosfato
2. Pentosa (azúcarde 5 carbonos)
3. Bases nitrogenadas ya sean Adenina, Guanina, Citosina y Timina

Hay 4tipos de nucleótidos ya que hay 4 tipos de bases nitrogenadas, estas diferencian a cada uno de los
nucleótidos.

Contiene la información genética. Es una molécula (conjunto de átomos con estructura


tridimensional). Se puede afirmar que el ADN es un poli nucleótido el cual es una cadena
de moléculas pequeñas.

Nucleótido: Compuesto (Azúcar, base, fosfato).

➢ Azúcar: cumple la función de estructura, es como la columna vertebral (siempre


igual).

➢ Fosfato: Cumple la función de enlace (se mantiene siempre igual).

➢ Base: Da estabilidad a la molécula. Esta cambia encontramos cuatro tipos de


bases:

Adenina Timina
Citosina Guanina

El cuerpo humano trabaja en código (ATCG) base 4:

Símbolo Par de bits


0 A 00
1 T 01
2 C 10
3 G 11

Nuestro ADN codifica nuestra información en cuatro (4) bits. El ADN codifica la
información en ATCG.

Genoma Humano: Se realizó en el 2001. Es una secuencia de caracteres.

Encontramos que el ADN cuando codifica tiene una regla básica es ahí donde se habla
de Bases Complementarias estos son:

A<- ->T (Solo se enlaza A con T y viceversa)


G<- ->C (Solo se enlaza G con C y viceversa)
24
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

Situación del ADN


dentro de una célula.

El ADN tiene mecanismos de Reparación Recuperación, por esto debemos saber tres
niveles de Estructura que son:

✓ Estructura Primaria: Secuencia de decir (ATCG).

✓ Estructura Secundaria: Doble hélice, estructura tridimensional.

✓ Estructura Terciaria: Se compacta, como madeja y forma nucleosomas y


cromosomas. Esto se compacta por protección. El ser humano posee 46
cromosomas.

25
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

Hebra: Es la doble hélice o doble cadena.

¿Sabías que?
Las bases llamadas adenina, citosina, guanina y timina,
siempre están en pares y solo hay dos tipos de pares:
adenina-timina, y citosina-guanina. EL ser humano tiene
entre 2.8 y 3.5 millones de pares de bases.

1.5.4 Traducción y Transcripción Genética

La TRADUCCIÓN es el proceso de síntesis de proteínas llevado a cabo en los ribosomas, a


partir de la información aportada por el ARN mensajero
que es, a su vez, una copia de un gen.

Las proteínas de los seres vivos se fabrican en los RIBOSOMAS, orgánulos celulares
que se encuentran en el citoplasma de los eucariotas, asociados al retículo
26
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

endoplásmico.

Los ribosomas son nucleoproteínas, algo similar a la propia cromatina nuclear, con la
particularidad de que están formados por una asociación de proteínas y un ARN
especial que es el llamado ARN-ribosómico

La TRANSCRIPCION del ADN es el primer proceso de la expresión génica, mediante el


cual se transfiere la información contenida en la secuencia del ADN hacia la secuencia
de proteína utilizando diversos ARN como intermediarios.

27
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

➢ Transcripción es el proceso de fabricación ARN usando el ADN como molde.

➢ Traducción es la construcción de una secuencia de aminoácidos (poli


péptido) con la información proporcionada por la molécula de ARN.

➢ El esquema de este "dogma" ha sido encontrada repetidamente y se


considera una regla general (salvo en los retrovirus).

➢ El Ácido Ribonucleico mensajero (ARNm) es el molde para la construcción


de la proteína.

➢ El Ácido Ribonucleico ribosómico (ARNr) se encuentra en el sitio donde se


construye la proteína: el ribosoma.

➢ El Ácido Ribonucleico de transferencia (ARNt) es el transportador que


coloca el aminoácido apropiado en el sitio correspondiente.

28
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

➢ El ARN tiene el azúcar ribosa en vez de desoxirribosa. La base uracilo (U)


reemplaza a la timina (T) en el ARN.

➢ El ARN tiene una sola hebra, si bien el ARNt puede formar una estructura
de forma de trébol debido a la complementariedad de sus pares de bases.

Haciendo Una Copia Del Arn De La Secuencia Del Adn

La ARN polimerasa abre la parte del ADN a ser transcripta. Solo una de las hebras del
ADN (la hebra codificante) se transcribe. Los nucleótidos de ARN se encuentran
disponibles en la región de la cromatina (este proceso solo ocurre en la interface) y se
unen en un proceso de síntesis similar al del ADN.

El ARN está en el núcleo y se hace la transcripción dentro del núcleo, luego el ARNm
sale al citoplasma.

Encontramos cinco (5) pasos en el proceso de transcripción estos son:

Etapas de la transcripción

29
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

El proceso de la transcripción en 3 etapas principales (iniciación, elongación y


terminación), pero realmente se pueden diferenciar 5 etapas:

1. Pre-iniciación

Antes del inicio de la transcripción se necesita toda una serie de factores de


transcripción que ejercen los factores de iniciación. Estos se unen a secuencias
específicas de ADN para reconocer el sitio donde la transcripción ha de
comenzar.

2. Iniciación

Primero, una Helicasa separa las hebras de ADN en estas denominadas cajas
TATA, ya que entre adenina y timina se establecen dos enlaces de hidrógeno,
mientras que entre citosina y guanina se forman tres. Posteriormente se unen
los factores y las proteínas de transcripción (TBP, TF2D, TF2B) permitiendo, de
esta manera, el acceso de la ARN polimerasa al molde de ADN de cadena
simple, siendo esta la última en posicionarse.

30
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

3. Disgregación del promotor

Una vez sintetizado el primer enlace se debe deshacer el complejo del promotor
para que quede limpio para volver a funcionar de nuevo. Durante esta fase hay
una tendencia a desprenderse el transcrito inicial de ARN y producir transcritos
truncados, dando lugar a una iniciación abortada, común tanto en procariontes
como eucariontes.

31
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

4. Elongación

1.5.5 Código Genético

32
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

Fue un astrónomo quien señaló que el código que representa a los aminoácidos debía
consistir en grupos de al menos tres de las cuatro bases del ADN.

En efecto, los 20 aminoácidos están representados en el código genético por la


agrupación de tres letras (triplete) de las cuatro existentes.

Si uno considera las posibilidades de arreglo de cuatro letras agrupadas de a tres (43)
resulta que tenemos 64 posibilidades de palabras a codificar, o 64 posibles codones
(secuencia de tres bases en el ARNm que codifica para un aminoácido específico o una
secuencia de control). El código genético fue "roto" por Marshall Nirenberg y Heinrich
Matthaei (del NIH), 10 años después que Watson y Crick "rompieran" el misterio de la
estructura del ADN.

Nirenberg descubrió que el ARNm, independientemente del organismo de donde


proviene, puede iniciar la síntesis proteica cuando se lo mezcla con el contenido del
homogéneo de Escherichiacoli

Adicionando poli-U (un ARNm sintético) a cada uno de 20 tubos de ensayo (cada uno de
los cuales tenía un aminoácido diferente) Nirenberg y Matthaei determinaron que el
codón UUU, el único posible en elpoli-U, codificaba para el aminoácido fenilalanina.

Asimismo un ARNm artificial compuesto por bases A y C alternando codifica


alternativamente para histidina y treonina. Gradualmente se fue confeccionando una lista
completa del código genético.

El código genético consiste en 61 codones para aminoácidos y 3 codones de


terminación, que detienen el proceso de traducción. El código genético es por lo tanto
redundante, en el sentido que tiene varios codones para un mismo aminoácido. Por
ejemplo, la glicina es codificada por los codones GGU, GGC, GGA, y GGG. Si un codón
muta por ejemplo de GGU a CGC, se especifica el mismo aminoácido.

33
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

Significado de Código genético.

Es el conjunto de reglas que define la traducción de una secuencia de nucleótidos en


el ARN a una secuencia de aminoácidos en una proteína, en todos los seres vivos. El
código define la relación entre secuencias de tres nucleótidos, llamadas codones, y
aminoácidos. De ese modo, cada codón se corresponde con un aminoácido
específico.

¿Sabías que?
Los perros y los seres humanos compartimos el 75% de
nuestro código genético.

34
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

Características del Código Genético

1. Es universal, pues lo utilizan casi todos los seres vivos conocidos. Solo existen
algunas excepciones en unos pocos tripletes en bacterias.

2. No es ambiguo, pues cada triplete tiene su propio significado.

3. Es degenerado, pues hay varios tripletes para un mismo aminoácido, es decir hay
codones sinónimos.

TABLA DEL CÓDIGO GENÉTICO ESTÁNDAR

La siguiente tabla inversa indica qué codones codifican cada uno de los aminoácidos.

35
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

Para tener en cuenta:

• El código genético mitocondrial es la única


excepción a la universalidad del código, de
manera que en algunos organismos los
aminoácidos determinados por el mismo
triplete o codón son diferentes en el núcleo
y en la mitocondria.

36
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

1.5.6 Proteínas
Las proteínas son moléculas formadas por cadenas lineales de aminoácidos.

Las proteínas desempeñan un papel fundamental para la vida y son las biomoléculas
más versátiles y más diversas.

Clasificación y Estructura

La organización de una proteína viene definida por cuatro niveles estructurales


denominados: estructura primaria, estructura secundaria, estructura terciaria y estructura
cuaternaria. Cada una de estas estructuras informa de la disposición de la anterior en el
espacio.

Estructura Primaria: La estructura primaria es la secuencia de AA de la proteína. Nos


indica qué AAS componen la cadena polipeptídica y el orden en que dichos AAS. se
encuentran. La función de una proteína depende de su secuencia y de la forma que ésta
adopte.

37
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

Estructura Secundaria: La estructura secundaria es la disposición de la secuencia de


aminoácidos en el espacio. Los AAS, a medida que van siendo enlazados durante la
síntesis de proteínas y gracias a la capacidad de giro de sus enlaces, adquieren una
disposición espacial estable, la estructura secundaria.

Estructura Terciaria: La estructura terciaria informa sobre la disposición de la estructura


secundaria de un polipéptido al plegarse sobre sí misma originando una conformación
globular.

Estructura cuaternaria: Esta estructura informa de la unión, mediante enlaces débiles


(no covalentes) de varias cadenas polipeptídicas con estructura terciaria, para formar un

38
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

complejo proteico. Cada una de estas cadenas poli peptídicas recibe el nombre de
protómero.

Clasificación

Las proteínas poseen veinte aminoácidos, los cuales se clasifican en:

Glicina, alamina, valina, leucina, isoleucina, fenil, alanina, triptófano, serina, treonina,
tirosina, prolina, hidroxiprolina, metionina, cisteína, cistina, lisina, arginina, histidina,
ácido aspártico y ácido glutámico.

Según su composición

Pueden clasificarse en proteínas "simples" y proteínas "conjugadas".

Las "simples" o "Holo proteínas" son aquellas que al hidrolizarse producen únicamente
aminoácidos, mientras que las "conjugadas" o "Heteroproteínas" son proteínas que al
hidrolizarse producen también, además de los aminoácidos, otros componentes orgánicos
o inorgánicos. La porción no proteica de una proteína conjugada se denomina grupos
prostético". Las proteínas conjugadas se subclasifican de acuerdo con la naturaleza de
sus grupos prostéticos.

39
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

1.6 NCBI Entrez


Entrez es un portal y un buscador que permite acceder a la base de datos del National
Center for Biotechnology Information (NCBI). NCBI es una parte de la National Library of
Medicine (NLM), así como un departamento de National Institutes of Health (NIH) del
Gobierno de los Estados Unidos. Ahora conocido como Gquery.

http://www.ncbi.nlm.nih.gov/gquery/

40
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA

Cada ícono es una base fundamental y diferente. Permite encontrar:

✓ PubMed: reúne todos los artículos científicos de las ciencias de la vida y la


medicina.
✓ PubMed Central: Parte de los artículos de PubMed que están disponibles.
✓ SiteSearch: Buscar en todo el sitio.
✓ Books: Buscar en los libros del portal.
✓ Nucleotide: Secuencias del ADN y ARN.
✓ Protein: Todas las secuencias de las proteínas.
✓ Genome: Buscar secuencias de los genomas completos (Genoma Humano).
✓ Structure: Tiene todas las estructuras.
✓ Taxonomy: Clasificación de las especies.

Aquí toda la información biológica es de dominio público. No se puede patentar la


información genética.

Podemos reducir la búsqueda con ayuda de operadores Booleanos aquí se usan en


mayúscula AND, OR, NOT. Podemos seguir reduciendo la búsqueda con Limits->limits
to (Lo que se hace es poner rangos de búsqueda).

Encontramos de la misma manera en los resultados la opción de poder el formato FASTA


o ver las estructuras tridimensionales.

Es por ejemplo entramos la siguiente expresión en el buscador en la opción Protein ->


(AIDS) AND NATURE [JOURNAL] obtendríamos los resultados de todas las proteínas
relacionadas con el SIDA publicadas en la revista NATURE.

41
CAPITULO II - SECUENCIAS DE ADN

CAPITULO II - SECUENCIAS DE ADN

2.1 Formato FASTA

El formato FASTA es el formato más común de secuencia de ADN, ARN y Proteínas. Es


un formato de solo texto(se puede escribir o leer en un bloc de notas). Hay unas líneas
de descripción y unas líneas donde esta nuestra secuencia. La secuencia máxima de las
líneas del formato FASTA es de 80 caracteres de longitud, es decir que cuando llegamos
a 80 se empieza una nueva línea.

Formato FASTA, NBCI.

42
CAPITULO II - SECUENCIAS DE ADN

Sí la secuencia
es de Símbolo Significado
nucleótidos el
formato permite A ADENINA
los siguientes
símbolos: C CITOSINA

T TIMINA

G GUANINA

U URACILO

R PURINA

Y PIRIMIDINA

K GoT

N A,C,G o T

- Hueco

Símbolo Significado Símbolo Significado


A Alanina P Prolina
B Asparagina Q Glutamina
C Cisteina R Arginina
D Ácido S Serina
Aspártico
E Ácido T Treonina
Sí la secuencia es de Glutámico
aminoácidos el formato F Fenilalanina U Selenocysteina
permite los siguientes G Glicina V Valina
símbolos: H Histidina W Triptófano
I Isoleucina Y Tirosina
K Lisina Z Ácido Glutámico
L Leucina M Metionina
N Asparagina * Fin de la traducción
- Gap de Indeterminada
longitud

43
CAPITULO II - SECUENCIAS DE ADN

2.2 Alineamiento de Secuencias

Alinear: Comparar dos (2) secuencias. Resaltar sus similitudes y diferencias. Cuando se
analizan secuencias es común utilizar los términos similitud y homología de forma
indiscriminada, pero estos dos términos hacen referencia a conceptos distintos.

SIMILITUD: Es el resultado del análisis (observación cuantitativa) de la estructura


primaria de dos o más secuencias; la secuencias pueden ser ácidos nucleicos o
proteínas.

Para poder cuantificar el grado de similitud de dos secuencias lo primero que hay que
hacer es alinearlas.

Una sustitución es un cambio de una base por otra.

Cuando falta una base decimos que hay un gap.

Un gap puede corresponder tanto a una deleción como a una inserción.

Debido a la existencia de gaps y sustituciones alinear dos secuencia no es trivial.

Puede haber diferentes alineamientos dependiendo del número de gaps que


permitamos introducir.

44
CAPITULO II - SECUENCIAS DE ADN

Hay dos tipos de alineamiento:

➢ Pareado: (==2)
➢ Múltiple: (>2) Es más complicado.

2. 3 Algoritmos de Búsqueda de ADN

Para estos tipos de alineamiento encontramos dos (2) tipos de algoritmos, pero antes
debemos explicar algunas características que pueden tener como son:

• Determinístico: Es un algoritmo dada la entrada (input) siempre tenemos una


misma salida.
• Heurístico: No es segura la misma salida.
• Aleatorio: Siempre da una salida distinta.

Los algoritmos para el alineamiento son Globales y Locales:

➢ Globales: Toman la secuencia 1 y la secuencia 2 completas las coloca en una


matriz y empieza a comparar. Este algoritmo es lento y ocupa mucha memoria,
sus ventajas es que es fácil de programar y es determinístico.
➢ Locales: Toma las secuencias y las divide en pedazos o partes pequeñas y
después empieza a comparar. Son Heurísticos, son más rápidos y trabaja el tipo
de alineamiento Múltiple.

En bioinformática lo más básico es el alineamiento, por esto el algoritmo de Needleman-


Wunsches comúnmente usado para alinear secuencias de nucleótidos o proteínas a
través del alineamiento Global. El algoritmo Needleman-Wunsch basa en programación
dinámica; esta forma de programación es un nos permite reducir el orden de complejidad
de un algoritmo.

45
CAPITULO II - SECUENCIAS DE ADN

Lo siguiente es un ejemplo de cómo trabaja el algoritmo Needleman-Wunsch: Al alinear


las siguientes secuencias:

A = GAATTCAGTTA

B = GGATCGA Parámetros: Coincidencias = 1 No coincidencias = 0 Huecos = 0

Inicialización:(Tabla 1) Llenado de la Matriz:(Tabla 2)

Recuperación de la solución: (Tabla 3)

46
CAPITULO II - SECUENCIAS DE ADN

Alineamiento:
[x=1 1,y=7], [x=1 0,y=6], [x=9,y=6], [x=8,y=6], [x=7,y=5], [x=6,y=5], [x=5,y=4] [x=4,y=4],
[x=3,y=3], [x=2,y=3], [x=1,y=2], [x=1,y=1], [x=0,y=0]

G¬AATTCAGTTA GGA¬T¬C¬G¬¬A

2.5.1 FASTA
FASTA es un programa para alineamiento de secuencias de ADN y de proteínas.

Fue descripto por primera vez (como FASTP) por David J. Lipman y William R. Pearson
en 1985 en el artículo "Rapid and sensitive protein similarity searches". El programa
original fue diseñado para buscar similitudes de secuencias proteicas. FASTA, descrito
en 1988, agregó la posibilidad de hacer búsquedas de ADN contra ADN, ADN contra
proteínas traducidas y un programa más sofisticado de aleatorización para evaluar la
significancia estadística de los resultados. El nombre FASTA viene de "FAST-ALL"
porque busca con cualquier alfabeto, es una extensión de "FAST-P" (proteínas) y
"FAST-N" (nucleótido).

El paquete actual de FASTA incluye programas para búsquedas del tipo


proteína/proteína, ADN/ADN, proteína/ADN traducido (con cambios del marco de
lectura), y búsqueda ordenada y desordenadas de péptidos. Las versiones recientes
incluyen un algoritmo para manejar errores de desplazamiento del marco de lectura, las
cuales las búsquedas que traducen los seis marcos suelen tener problemas) cuando
compara datos de secuencia de proteínas con los nucleotidos.

Además de los métodos de búsqueda heurísticos rápidos, el paquete FASTA provee


SSEARCH, una implementación delalgoritmo Smith-Waterman. Uno de los principales
objetivos del paquete es el cálculo estadístico de las similitudes para que los biólogos
puedan juzgar si un alineamiento ha ocurrido por azar o si se puede usar para inferir
homología.

47
CAPITULO II - SECUENCIAS DE ADN

2.5.2 BLAST

El algoritmo y el programa de computadora que lo implementa fueron desarrollados por:


Stephen Altschul, Warren Gish, David Lipman en el Centro Nacional de Información
Biotecnológica (NCBI, por sus siglas en inglés), Webb Millar en la Universidad estatal
de Pennsylvania, y Gene Myers en la Universidad de Arizona. También es basado en el
algoritmo Smith-Waterman y es local, bastante rápido pero no garantiza el mejor
resultado solo el mejor alineamiento. Es usado para encontrar probables genes
homólogos, es decir con funciones similares. Para ejecutarse, BLAST requiere dos
secuencias como entrada: una secuencia de consulta (también llamada secuencia
blanco) y una base de datos de secuencias. BLAST encontrará subsecuencias en la
consulta que son similares a subsecuencias de la base de datos. En el uso típico, la
secuencia de consulta es mucho más pequeña que el banco de datos, por ejemplo, la
consulta puede ser de mil nucleótidos mientras que la base de datos es de varios miles
nucleótidos. BLAST busca alineamientos de secuencias de alto puntaje secuencia de
consulta y las secuencias en el banco de datos usando heurístico. La velocidad y la
relativamente buena precisión de BLAST de la innovación técnica de los programas
BLAST y probablemente herramienta de búsqueda más popular en bioinformática.

48
CAPITULO II - SECUENCIAS DE ADN

ETAPAS

1. Asemilladlo (Seeding): BLAST busca coincidencias exactas de una pequeña


longitud fija W entre la secuencia de consulta y las secuencias de la base de datos. Por
ejemplo, dadas las secuencias AGTTAC y ACTTAG y el largo de palabra W = 3, BLAST
podría identificar la subcadena coi ncidente TTA que es común en ambas
secuencias.Por defecto, W = 11 para "semillas" nucleicas.

2. Extensión: BLAST trata de extender la coincidencia en ambas direcciones,


comenzando por la semilla. El proceso de alineamiento sin huecos, extiende la
coincidencia de la semilla inicial de longitud W en cada dirección en un intento de
estimular el puntaje de alineación. Inserciones y eliminaciones no son consideradas
durante esta etapa. Para nuestro ejemplo, el alineamiento sin huecos entre las
secuencias AGTTAC y ACTTAG centrado alrededor de la palabra en común TTA podría
ser: Si es encontrado un alineamiento sin huecos de alto puntaje, la base de datos de
secuencias pasa a la tercera etapa.

3. Evaluación: BLAST realiza un alineamiento con huecos entre la secuencia de


consulta y la secuencia de la base de datos usando una variación del algoritmo de
Smith-Waterman. Entonces los alineamientos relevantes estad ísticamente son
mostrados al usuario.

FAMILIA DE BLAST

➢ *BlastN: Busca una secuencia ADN/ARN en la base de datos de Nucleotidos


(ADN/ARN).

➢ *BlastP: Busca una proteína en una base de datos de proteínas. *BlastX: Busca
nucleótidos (ADN) en la base de datos de proteínas.

➢ *TBlastN: Busca proteínas en el ADN. Traduce de la BD(Base de Datos) a


proteínas. La traducción va en un solo sentido.

49
CAPITULO II - SECUENCIAS DE ADN

Variantes De BLAST

➢ Gapped BLAST: Esta es una mejora al algoritmo original del BLAST.2 También
se lo conoce como BLAST 2.0. Se trata de un BLAST que contempla la existencia
de pequeñas inserciones o eliminaciones en las secuencias que se están
comparando, permitiendo así alinear uno o varios nucleótidos o aminoácidos con
huecos vacíos llamados gaps.
➢ PsiBLAST: Esta variante de BLAST2 es usada para buscar posibles homólogos
en organismos muy lejanos entre ellos, filogenéticamente hablando. Está
disponible sólo para secuencias de aminoácidos.

PRECAUCIÓN: BLAST no garantiza que las secuencias que alinea sean homólogas y
mucho menos que tengan la misma función, simplemente provee posibles candidatos.
Se debe recordar que el programa es heurístico y por lo tanto puede que no encuentre
la solución óptima.

50
CAPITULO - III GENES

CAPITULO - III GENES

3.1 Código Genético


El código genético viene a ser como un diccionario que establece una equivalencia entre
las bases nitrogenadas del ARN y el leguaje de las proteínas, establecido por los
aminoácidos. Después de muchos estudios (1955 Severo Ochoa y Grumberg; 1961
M.Nirenberg y H. Mattaei) se comprobó que a cada aminoácido la corresponden tres
bases nitrogenadas o tripletes (61 tripletes codifican aminoácidos y tres tripletes carecen
de sentido e indican terminación de mensaje).

51
CAPITULO - III GENES

Características Del Código Genético

➢ El Código es Organizado en Tripletes o Codones: Si cada nucleótido


determinara un aminoácido, solamente podríamos codificar cuatro aminoácidos
diferentes ya que en el ADN solamente hay cuatro nucleótidos distintos. Cifra
muy inferior a los 20 aminoácidos distintos que existen. Si cada dos nucleótidos
codificarán un aminoácido, el número total de dinucleótidos distintos que
podríamos conseguir con los cuatro nucleótidos diferentes (A, G, T y C) serían
variaciones con repetición de cuatro elementos tomados de dos en dos VR4,2 =
42 = 16. Por tanto, tendríamos solamente 16 dinucleótidos diferentes, cifra inferior
al número de aminoácidos distintos que existen (20).

Si cada grupo de tres nucleótidos determina un aminoácido. Teniendo en cuenta


que existen cuatro nucleótidos diferentes (A, G, T y C), el número de grupos de
tres nucleótidos distintos que se pueden obtener son variaciones con repetición
de cuatro elementos (los cuatro nucleótidos) tomados de tres en tres: VR4,3 = 43
= 64. Por consiguiente, existe un total de 64 tripletes diferentes, cifra más que
suficiente para codificar los 20 aminoácidos distintos.

➢ El Código Genético es Degenerado: Como hemos dicho anteriormente existen


64 tripletes distintos y 20 aminoácidos diferentes, de manera que un aminoácido
puede venir codificado por más de un codón.

52
CAPITULO - III GENES

Este tipo de código se denomina degenerado. Wittmann (1962) induciendo


sustituciones de bases por diseminación con nitritos, realizó sustituciones de C
por U y de A por G en el ARN del virus del mosaico del tabaco (TMV),
demostrando que la serina y la isoleucina estaban determinadas por más de un
triplete. Las moléculas encargadas de transportar los aminoácidos hasta el
ribosoma y de reconocer los codones del ARN mensajero durante el proceso de
traducción son los ARN transferentes (ARN-t). Los ARN-t tienen una estructura
en forma de hoja de trébol con varios sitios funcionales: *Extremo 3': lugar de
unión al aminoácido (contiene siempre la secuencia ACC).

➢ *Lazo dihidrouracilo (DHU): lugar de unión a la aminoacil ARN-t sintetasa o


enzimas encargadas de unir una aminoácido a su correspondiente ARN-t.

➢ *Lazo de T ψ C: lugar de enlace al ribosoma.

➢ *Lazo del anti codón: lugar de reconocimiento de los codones del mensajero.
Normalmente el ARN-t adopta una estructura de hoja de trébol plegada en forma
de L o forma de boomerang.

53
CAPITULO - III GENES

➢ El Código Genético es No Solapado o Sin Superposiciones: Un nucleótido


solamente forma parte de un triplete y, por consiguiente, no forma parte de varios
tripletes, lo que indica que el código genético no presenta superposiciones. Por
tanto, el código es no solapado.

54
CAPITULO - III GENES

➢ La Lectura del Código Genético es "Sin Comas": Teniendo en cuenta que la


lectura se hace de tres en tres bases, a partir de un punto de inicio la lectura se
lleva a cabo sin interrupciones o espacios vacíos, es decir, la lectura es seguida
"sin comas". De manera, que si añadimos un nucleótido (adición) a la secuencia,
a partir de ese punto se altera el cuadro de lectura y se modifican todos los
aminoácidos. Lo mismo sucede si se pierde (deleción) un nucleótido de la
secuencia. A partir del nucleótido delecionado se altera el cuadro de lectura y
cambian todos los aminoácidos. Si la adición o la deleciónes de tres nucleótidos
o múltiplo de tres, se añade un aminoácido o más de uno a la secuencia que
sigue siendo la misma a partir de la última adición o deleción. Una adición y una
deleción sucesivas vuelven a restaurar el cuadro de lectura. La lectura se puede
hacer de dos formas:

➢ El Código Genético es Universal: El desciframiento del código genético se ha


realizado fundamentalmente en la bacteria E. coli, por tanto, cabe preguntarse si
el código genético de esta bacteria es igual que el de otros organismos tanto
procarióticos como eucarióticos. Los experimentos realizados hasta la fecha
indican que el código genético nuclear es universal, de manera que un
determinado triplete o codón lleva información para el mismo aminoácido en
diferentes especies.

Hoy día existen muchos experimentos que demuestran la universalidad del


código nuclear, algunos de estos experimentos son:

• Utilización de ARN mensajeros en diferentes sistemas acelulares. Por


ejemplo ARN mensajero y ribosomas de reticulocitos de conejo con ARN
transferentes de E. coli. En este sistema se sintetiza un poli péptido igual
o muy semejante a la hemoglobina de conejo.

• Las técnicas de ingeniería genética que permiten introducir ADN de un


organismo en otro de manera que el organismo receptor sintetiza las
proteínas del organismo donante del ADN. Por ejemplo, la síntesis de
proteínas humanas en la bacteria E. coli.

Splicing

En el caso de los organismos Eucariotas el ADN no se transcribe completamente sino


solo por partes; Las secciones que no se transcriben se llaman Intrónes, los cuales son
regiones del ADN que debe ser eliminada del transcrito primario de ARN, y las secciones
que se trascriben se llaman Exones, los cuales son regiones que codifican para una
determinada proteína.

El resultado de la trascripción de los Exones es una cadena de ARNm (ARN Mensajero)


a la que se le puede realizar Transcripción Inversa, dando lugar a una cadena de cADN
(ADN Complementario).

55
CAPITULO - III GENES

Este cADN solo se puede hacer en el Laboratorio o por un retrovirus, y se utiliza para
leer el ADN que finalmente se va a utilizar en el ADNm y posteriormente en la Proteína.

El proceso anteriormente descrito se puede observar en el siguiente gráfico:

3.2 Open Reading Frames (ORF)

Marco Abierto de Lectura

Es una secuencia de información genética que contiene datos que pueden ser utilizados
para codificar aminoácidos; Los marcos de lectura se encuentran en el ADN y ARN. En
el caso de ADN, el ADN contiene conjuntos de nucleótidos conocida como tripletes o
codones. Cada codón puede ser transcrito por el ARN en otro triplete.

El marco de lectura es la sección de ADN o ARN que contiene instrucciones para hacer
una proteína completa. En el ADN, hay seis marcos de lectura posibles, ya que el inicio
de un marco de lectura depende de donde uno empieza a leer, y el ADN es de doble
cadena. Con el ARN, existen tres posibles marcos de lectura. Una sección de lectura
comienza con un codón de inicio (AUG) y uno de parada (UAA, UAG o UGA).

Un marco abierto de lectura puede contener un gen completo, o los genes que se
solapan; el código genético no siempre es tan ordenada como uno podría imaginar. De
56
CAPITULO - III GENES

hecho, el código genético contiene mucho de lo que se conoce como el ADN no


codificante, es decir, que el ADN no parece cumplir una función en términos de la
expresión génica. No codificante del ADN puede contener información interesante
acerca de la herencia genética de una especie, y puede utilizarse para otras funciones.

Existen 6 sentidos en los que se puede aparecer un marco de lectura: +1, +2, +3, -1, -
2, -3.

Si una secuencia se empieza a leer desde el 1er carácter, entonces el marco de lectura
es +1; si se empieza desde la 2da, entonces el marco de lectura es +2; Y si se comienza
desde la 3era, entonces el marco de lectura es +3.
Para la secuencia complementaria, si se empieza a leer desde el 1er carácter, entonces
el marco de lectura es -1; si se empieza desde la 2da, entonces el marco de lectura es
-2; Y si se comienza desde la 3era, entonces el marco de lectura es -3.
El proceso anteriormente descrito se puede observar en el siguiente gráfico:

Para complementar se puede concluir que el Marco abierto de lectura es una porción
de una molécula de ADN que cuando se traduce a los aminoácidos, no contiene
codones de terminación. El código genético lee secuencias de ADN en grupos de tres
pares de bases, esto significa que, en una molécula de ADN de doble hebra, hay 6
posibles sentidos en los que pueden abrirse marcos de lectura -tres en dirección hacia
adelante y tres en reverso. Un marco abierto de lectura larga es probable que sea parte
de un gen.

57
CAPITULO - III GENES

ORF Finder (Open Reading Frame Finder) - NCBI

ORF Finder busca marcos abiertos de lectura (ORF) en la secuencia de ADN que Ud.
introduzca. El programa devuelve el rango de cada ORF, junto con la traducción de la
proteína correspondiente. ORF Finder soporta el alfabeto IUPAC y varios códigos
genéticos. Utilice ORF Finder para buscar posibles segmentos de codificación de
proteínas en nuevas secuencias de ADN.

http://www.ncbi.nlm.nih.gov/gorf/gorf.html

58
CAPITULO - III GENES

Como usar este Buscador:

1. Tomamos una secuencia en Formato FASTA que introduciremos en el cuadro


correspondiente y así encontrar su marco de lectura, códigos genéticos.

2. Debemos colocar en el menú de geneticcodes la opción estándar [ ] luego hacemos


clic en el botón y obtenemos la siguiente imagen:

59
CAPITULO - III GENES

3. Luego de esto daremos clic en BLAST, en esta secuencia no mostraría ningún


resultado por lo corta así que hicimos lo mismo con una secuencia larga (Secuencia de
la Salmonella) en su bloque más grande que escogimos nos da el resultado con BLAST
y veremos en el siguiente gráfico el resultado.

60
CAPITULO - III GENES

3.3 Modelos Estocásticos

Estocástico: Utiliza probabilidad. un proceso estocástico es un concepto matemático


que sirve para caracterizar una sucesión de variables aleatorias (estocásticas) que
evolucionan en función de otra variable, generalmente el tiempo. Cada una de las
variables aleatorias del proceso tiene su propia función de distribución de probabilidad
y, entre ellas, pueden estar correlacionadas o no.

61
CAPITULO - III GENES

Modelo Oculto de Markov

Un método de previsión muy fiable sería aquel que analizase la evolución de distintos
desarrollos teniendo en cuenta las interrelaciones entre dichos desarrollos e introdujese
la variable tiempo.

A partir de un estudio del tipo Delphi, se obtienen como conclusiones las probabilidades
y las fechas estimadas de ocurrencia de los eventos del cuestionario. Sin embargo, no
se consideran las interrelaciones entre los distintos desarrollos.

El modelo de Markov va a caracterizar el desarrollo secuencial tecnológico mediante


dos parámetros probabilísticos: la secuencia de los desarrollos y el tiempo entre
desarrollos sucesivos. Estos dos parámetros se pueden representar con los conceptos
transición de estados y tiempo de permanencia en el estado.

Se dice que un proceso es de Markov cuando verifica la propiedad de Markov: la


evolución del proceso depende del estado actual y del próximo, y no de anteriores o
posteriores.

A partir de un Delphi clásico se pueden extraer los parámetros característicos del


modelo de Markov. Con estos parámetros se puede hacer un análisis de los procesos
de Markov por ordenador, estudiando el proceso secuencial en el tiempo y hallando la
distribución de probabilidades en el tiempo de los desarrollos.

Como consecuencia se obtienen un conjunto de cadenas, denominadas cadenas de


Markov, que indican posibles caminos para conseguir un desarrollo tecnológico. Usando
este tipo de cadenas, se puede realizar una previsión del futuro en la que se analiza la
evolución de distintos desarrollos, teniendo en cuenta las interacciones entre desarrollos
e introduciendo la variable tiempo.

OBJETIVO - Determinar los parámetros desconocidos (ocultos) a partir de parámetros


observables.

62
CAPITULO - III GENES

El proceso anteriormente descrito se puede observar en el siguiente gráfico:

➢ En el modelo de Markov normal los estados son visibles. (a son los únicos
parámetros)

➢ En el HMM el estado no es visible más sí las variables influidas por el estado.

➢ Cada estado tiene una distribución de probabilidad sobre los posibles símbolos
de salida.

➢ Se utiliza para analizar la composición de secuencias, para localizar genes


prediciendo ORF y para producir predicciones de estructuras secundarias de
proteínas.

En los términos de un típico modelo oculto de Markov:

Estados observables - columnas individuales del alineamiento

63
CAPITULO - III GENES

Estados ocultos -> la supuesta secuencia ancestral desde la cual las secuencias del
conjunto problema se presume han descendido.
El éxito de un HMM (HiddenMarkovModels) depende de tener un buen modelo “a priori”.

El HMM comienza con un alineamiento al azar -> construye un modelo -> mejora las
probabilidades en base a un entrenamiento iterativo -> se detiene cuando los
alineamientos no cambian.

El modelo de Markov posee ventajas y desventajas entre las cuales podemos


observar:
Ventajas:

➢ Usualmente un HHM arroja un MSA bueno.

➢ Es un método fundamentado por la teoría de la probabilidad

➢ No se requiere de un orden en las secuencias

➢ Las penalidades de inserción y deleción no son necesarias.

➢ Se puede utilizar información experimental

Desventajas:

➢ Se necesitan al menos 20 secuencias (si no más) para poder acomodar la


historia evolutiva.
➢ Para construir un modelo se debe tener una base de datos de genes antes.

3.4 GENSCAN

64
CAPITULO - III GENES

GENSCAN fue desarrollado por Chris Burge en el grupo de investigación de Samuel


Karlin, Departamento de Matemáticas de la Universidad de Stanford.

El programa y el modelo que subyace en ella se describen en: Burge, C. y Karlin, S.


(1997) Predicción de la estructura de los genes completos en ADN genómico humano.
J. Mol. Biol. 268, 78-94.

Los modelos del sitio de empalme se describen en más detalle en: Burge, CB (1998) las
dependencias de modelado de señales de empalme pre-ARNm. En Salzberg, S., Searls,
D. y Kasif, S., eds. Métodos Computacionales en Biología Molecular, ElsevierScience,
Amsterdam, pp 127-163.

Lo primero que hacemos es buscar en entrez una secuencia del ser humano para que
pueda ser analizada por Genscan.

Lo primero que hacemos es buscar en entrez una secuencia del ser humano para que
pueda ser analizada por Genscan.

65
CAPITULO - III GENES

Luego podremos observar los resultados, los cuales analizaremos

66
CAPITULO V - BASES DE DATOS

CAPITULO IV - ALINEAMIENTO DE SECUENCIAS Y PROTEÍNAS

4.1 Alineamiento de Secuencias


Alineamiento múltiple de Secuencias

Un método de alineamiento múltiple verdadero, alinea todas las secuencias al mismo


tiempo.

Pero no existe un método computacional que pueda realizar esto en tiempo razonable
para más de 3 secuencias cortas.

¿Por qué alinear simultáneamente varias secuencias?

Un ejemplo claro de este caso sería comparar proteínas muy conservadas


evolutivamente que cumplen igual función en distintos organismos, de esta forma se
podrían confeccionar árboles evolutivos.

Un caso muy estudiado en mamíferos es la insulina, la cual está muy conservada en


distintas especies.
“Los cambios acumulados en una secuencia biológica se producen a una tasa
relativamente constante e independiente de parámetros poblacionales”

El alineamiento de múltiples secuencias es muy utilizado en la búsqueda de que varias


especies estén emparentadas por un ancestro común.

67
CAPITULO V - BASES DE DATOS

Encontramos tres (3) formas de acercarse al alineamiento:

4.1.1 Método Global

Confronta una secuencia con otra completa. Los primeros programas que se
desarrollaron para el alineamiento de secuencias fueron diseñados para tratar de crear
alineamientos globales, es decir para detectar similaridades utilizando las proteínas
enteras. Un alineamiento que se extiende a lo largo de toda la longitud de las secuencias
utilizadas se denomina alineamiento GLOBAL, como en los ejemplos que acabamos de
ver anteriormente. Este tipo de alineamientos son buenos para proteínas globulares
(que carecen de dominios definidos) y en el caso de que las dos secuencias sean muy
parecidas a lo largo de toda su longitud (secuencias que han divergido poco a lo largo
de la evolución).

68
CAPITULO V - BASES DE DATOS

4.1.2 Programación Dinámica

La técnica de programación dinámica


es teóricamente aplicable a cualquier
número de secuencias; sin embargo, y
puesto que es computacionalmente
costosa tanto en tiempo como en
memoria, raramente se usa en su
forma más básica para más de tres o
cuatro secuencias. Este método
requiere la construcción de un
equivalente n-dimensional a la matriz
formada por dos secuencias, donde “n”
es el número de secuencias problema.

La PD constituye una técnica muy general de programación. Se suele aplicar cuando


existe un espacio de búsqueda muy grande y éste puede ser estructurado en una serie
o sucesión de estados tales que:

➢ el estado inicial contiene soluciones triviales de subproblemas

➢ cada solución parcial de estados posteriores puede ser calculada por iteración
sobre un número fijo de soluciones parciales de los estados anteriores

➢ el estado final contiene la solución final Un algoritmo de PD consta de 3 fases:

a. fase de inicialización y definición recurrente del score óptimo

b. relleno de la matriz de PD para guardar los scores de subproblemas resueltos en


cada iter. Se comienza por resolver el subproblemas pequeño

c. un rastreo reverso de la matriz para recuperar la estructura de la solución óptima

4.1.3 Árbol Filogenético

69
CAPITULO V - BASES DE DATOS

La filogenia y el alineamiento de secuencias son campos íntimamente relacionados


debido a su necesidad compartida de evaluar el parentesco entre secuencias.

La filogenia hace un uso extensivo de los alineamientos de secuencias en la


construcción e interpretación de árboles filogenéticos, que se usan para clasificar las
relaciones evolutivas entre genes homólogos representados en el genoma de especies
divergentes.

En los siguientes gráficos podemos ver como se realiza la alineación de secuencias con
las dos más cercanas y la siguiente:

70
CAPITULO V - BASES DE DATOS

Árbol Filogenético

71
CAPITULO V - BASES DE DATOS

Todos los seres vivos comparten su origen: todos provienen del reino móneras. Este
reino abarca los seres unicelulares procariotas, que carecen de núcleo celular. Son las
arqueo bacterias y las eubacterias.

De las móneras surgieron los protoctistas. Este reino reúne seres eucariotas
unicelulares heterótrofos y con digestión interna (protozoos), y eucariotas unicelulares
o pluricelulares sin tejidos, autótrofos fotosintéticos (algas).

El reino de los hongos comprende seres eucariotas, unicelulares o pluricelulares, sin


tejidos, heterótrofos y con digestión externa. Las metáfitas o plantas son eucariotas
pluricelulares con tejidos y nutrición autótrofa.
El reino metazoos o animal reúne los eucariotas pluricelulares con tejidos y nutrición
heterótrofa, con digestión interna.

Nuevas tendencias en la clasificación

Estudiando los ácidos nucleicos, especialmente el ARN ribosómico, se ha comprobado


que se pueden clasificar los seres vivos en solo tres grandes grupos o dominios. Esta
técnica se denomina filogenia molecular y tiene una gran utilidad para establecer las
relaciones de parentesco entre taxones de seres vivos, basándose en la similitud
genética existente entre éstos.

Los tres dominios propuestos por Carl Woese (1990) son: Archaea, que reúne a las
arqueo bacterias; Bacteria, que comprende a las eubacterias; y Eucarya, que incluye a
todos los seres eucariotas.

En 1998, Cavalier-Smith propuso un nuevo sistema de clasificación con dos suprareinos


(Prokariota y Eukaryota) y seis reinos: Bacterias, Protozoos, Chromistas, Hongos,
Plantas y Animales.
Las Hojas son diferentes y representan una secuencia que tendrá un puntaje.

Los árboles filogenéticos son una representación gráfica de las similitudes y diferencias
entre unas secuencias determinadas. Habitualmente, las secuencias de los genes y las
proteínas son más parecidas entre organismos más cercanos evolutivamente. Los
organismos que hace más tiempo que se separaron en la evolución suelen tener más
diferencias en las secuencias de sus respectivos genes, y, por lo tanto, cuando se
realiza un árbol filogenético, aparecen más alejados entre sí.

4.2 Clustal Y JalView

4.2.1 Clustal

CLUSTAL es un programa que permite hacer alineamientos globales de proteínas y


ácidos nucleicos y que además tiene un algoritmo heurístico progresivo, bastante
rápido, para calcular alineamientos múltiples. En combinación con herramientas como
BLAST, CLUSTAL es muy útil para definir familias de proteínas y de ácidos nucleicos.

72
CAPITULO V - BASES DE DATOS

Al igual que BLAST, también hay servidores web para correr CLUSTALW sin necesidad
de instalar software, pero asimismo tiene ventajas instalarlo localmente, sobre todo para
correr trabajos de alineamiento múltiple a gran escala y tener todo el proceso bajo
control.

Podemos ver ahora como trabajar en clustal:

73
CAPITULO V - BASES DE DATOS

74
CAPITULO V - BASES DE DATOS

75
CAPITULO V - BASES DE DATOS

4.2.2 Jalview

JalView es un editor de alineamiento múltiple por escrito en Java. Se utiliza ampliamente


en una variedad de páginas web (por ejemplo, el servidor de EBI Clustalw y la base de
datos de proteínas Pfam dominio), pero está disponible como un editor de propósito
general, la alineación y banco de trabajo de análisis.
Se usa JalView para:

➢ Ver

Lee y escribe en las alineaciones en una variedad de formatos (Fasta, PFAM, MSF,
Clustal, BLC, PIR).
Guarda las alineaciones y los árboles asociados en JalView formato XML.

➢ Editar

Las lagunas se pueden insertar / borrar con el ratón o el teclado.


Instrucciones simples.
Grupo de edición (supresión de inserción de las lagunas en los grupos de
secuencias).La eliminación de las columnas con huecos.

➢ Análisis

Alinear las secuencias utilizando Servicios Web ( Clustal , muscular ...)


Aminoácidos análisis de conservación similar a la de AMAS.
Las opciones de alineación de clasificación (por su nombre, para los árboles, el
porcentaje de identidad, grupo).
Árboles UPGMA y NJ calculado y elaborado a partir de distancias por ciento
de identidad.
Clústeres de secuencia mediante el análisis de componentes principales.
La eliminación de las secuencias redundantes.
Smith Waterman pares de alineación de las secuencias seleccionadas.
76
CAPITULO V - BASES DE DATOS

➢ Anotar

Uso de la Web basada en los programas de predicción de estructura secundaria (JNET).


Usuarios predefinidos o personalizados esquemas de color a las alineaciones de color
o de grupos.
Secuencia de recuperación de función y se muestran en la alineación.

➢ Publicar

mprimir su alineación con los colores y anotaciones.


Crear páginas HTML.
Salida de alineación de imagen Portable Network Graphics (PNG).
Salida de la alineación como un archivo PostScript encapsulado
(EPS).
Podemos ingresar a la página original de Jalview descargarlo y
conocer todas sus opciones, características para poder trabajar con él.

77
CAPITULO V - BASES DE DATOS

4.3 Proteínas y Proteómica

4.3.1 Proteínas

Es una macromolécula -> Cadena muy larga de


aminoácidos. Los tipos principales de
macromoléculas son las proteínas, formadas
por cadenas lineales de aminoácidos; los
ácidos nucleicos, DNA y RNA, formados por
bases nucleotídicas (purinas y pirimidinas), los
polisacáridos, formados por subunidades de
azúcares y los lípidos formados por glicerol,
ácidos grasos o colesterol.

Los aminoácidos de las proteínas están unidos


por enlaces peptídicos, los carbohidratos de los polisacáridos por enlaces glucosídicos
o peptídicos y los lípidos y ácidos nucleicos por enlaces éster.

El estudio de las proteínas permite estudiar:


➢ Su Estructura: Es la manera como se organiza una proteína para adquirir cierta
forma. Se puede estudiar su forma:
• 3D: Se realiza Experimentalmente (Rayos X, etc.) o Matemáticamente.
• Dominios Funcionales: Subsecuencia que desarrolla una función específica.
• Su Función: Específicamente es lo hace la proteína. Los biólogos se enfatizan
en el estudio de la función de las proteínas.
En las proteínas podemos encontrar que:
➢ Su Estructura: Puede ser Primaria, Terciaria, Cuaternaria.
➢ Su Forma: Podrían ser Globulares, Fibrosas, Mixtas.

Las proteínas son fundamentales para el


correcto funcionamiento del cuerpo
humano. Todas y cada una de ellas
cumplen funciones precisas y con el mal
funcionamiento de por lo menos una se da
un desequilibrio en todo el resto del
cuerpo

78
CAPITULO V - BASES DE DATOS

➢ Su Función: Puede variar ente ser de transporte, estructural, protección,


señalización entre otras.

4.3.2 Proteóma

Es el conjunto de todas las proteínas producidas por una célula en un instante de tiempo.
El término proteóma se utilizó por primera vez en 1995 y ha sido aplicado a diferentes
escalas en los sistemas biológicos. El proteoma celular es la totalidad de proteínas
expresadas en una célula particular bajo condiciones de medioambiente y etapa de
desarrollo, (o ciclo celular) específicas, como lo puede ser la exposición a estimulación
hormonal.

79
CAPITULO V - BASES DE DATOS

También se puede hablar del proteoma completo de un organismo que puede ser
conceptualizado como las proteínas de todas las variedades de proteomas celulares.
Es aproximadamente, el equivalente proteínico del genoma.

El Proteoma es un elemento altamente dinámico, cuyos componentes varían en un


organismo, tejido, célula o compartimento subcelular, como consecuencia de cambios
en su entorno, situaciones de estrés, administración de drogas, señales bioquímicas o
su estado fisiológico o patológico.

Estrategias empleadas en los estudios de proteomas

La estrategia de elección más utilizada actualmente para el estudio de proteomas, que


ha demostrado ser eficiente, es la combinación de electroforesis en gel de poliacrilamida
bidimensional con espectrometría de masa (El proceso anteriormente descrito se puede
observar en el siguiente gráfico ). La electroforesis permite la separación de proteínas
de un dado sistema biológico con alta resolución y reproductibilidad, mientras que la
espectrometría de masa permite, a través de alta demanda y sensibilidad, la
identificación de proteínas presentes en un spot de gel.

80
CAPITULO V - BASES DE DATOS

4.3.3 Proteómica

Ciencia que estudia el Proteoma. Estudios que se han realizado tradicionalmente


mediante la técnica de electroforesis en gel de dos dimensiones.

En la primera dimensión las proteínas se separan por isoelectroenfoque, que separa las
proteínas con base en su carga eléctrica.

En la segunda dimensión, las proteínas se separan por peso molecular utilizando SDS-
PAGE.

La Proteómica engloba un conjunto de metodologías orientadas al estudio sistemático


de las proteínas, que son los componentes primordiales que regulan la maquinaria
biológica. Los cambios experimentados por las células de un tejido, por la acción de
factores naturales, drogas o fármacos o a causa de alguna patología, son consecuencia
de cambios, más o menos sutiles, en la pauta de proteínas que producen las células en
ese momento.

El análisis de estos cambios está siendo cada vez más utilizado en la moderna

81
CAPITULO V - BASES DE DATOS

biomedicina con fines diagnósticos y de pronóstico (biomarcadores), para el tratamiento


individualizado de pacientes o para el estudio de mecanismos moleculares en el campo
de la investigación básica.

El método permite la automatización absoluta del proceso de identificación de proteínas


con una tasa máxima de error que puede ser establecida a priori, obteniéndose así
resultados completamente fiables.

Conjuntamente, las dos técnicas permiten la identificación y cuantificación de miles de


proteínas de forma rápida y eficiente y son aplicables al estudio de cualquier modelo
biológico. Estas nuevas técnicas están siendo utilizadas por el equipo que las ha
desarrollado en proyectos de relevancia biomédica tales como la identificación de
nuevos ligandos de las células T del sistema inmune, el estudio del mecanismo
molecular de la angiogénesis (crecimiento de nuevos vasos sanguíneos en tumores), o
el análisis de los mecanismos de protección del miocardio contra episodios de isquemia.

4.4 Análisis Comparativo de Proteínas

Significa tomar una proteína compararla con otras proteínas conocidas para ver
fundamentalmente su función. La proteínas al estudiar su estructura se pueden dividir
por Familias esta clasificación es jerárquica: Superfamilias, familias y subfamilias.

Superfamilia: es un conjunto de proteínas con un origen evolutivo común, un conjunto


de homólogos. Las superfamilias se pueden dividir, más o menos arbitrariamente, según
lo grandes que sean, en familias y subfamilias. Son conceptos paralelos a los de
ortólogos y parálogos: las proteínas de una misma subfamilia son ortólogas entre sí
(también puede haber in-paralogs), mientras que son parálogas de las de otras
subfamilia que pertenezca a la misma superfamilia.

82
CAPITULO V - BASES DE DATOS

Y otros presentan un patrón de conservación dependiente de cada familia.

En la superfamilia hay: chaperones (dnak), proteínas implicadas en la formación del


septo bacteriano (ftsA, mreB), hexokinasas (hxk), actina (act)....

La forma más frecuente de determinas qué familias y subfamilias hay es construyendo


un árbol filogenético. El problema de los árboles es que uno tiene que buscar los
homólogos, alinearlos, construir el árbol... y, además de que esto puede llevar bastante
tiempo, a veces los árboles resultantes no son buenos, especialmente si hay proteínas
demasiado divergentes o si hay dominios no homólogos en las proteínas que intentamos
alinear. Además, si queremos comparar dos genomas y ver qué funciones tiene uno y
cuáles el otro (quizás intentándolo correlacionarlo con características fenotípicas de los
organismos) debemos conocer las relaciones de ortología. Y esto no podemos hacerlo
manualmente construyendo árboles para tantos genes. Por eso (entre otras razones)
existen numerosas bases de datos y métodos para estudiar la organización de las
familias de proteínas.

83
CAPITULO V - BASES DE DATOS

4.5 Bases de Datos de Familias de Proteínas PROSITE, PRINTS, Pfam, InterPro

4.5.1 PROSITE

PROSITE es una base de datos de familias y dominios de proteínas creada por Amos
Bairoch en 1988. Consiste en entradas que describen dominios, familias y sitios
funcionales así como patrones de aminoácidos. Estos son manualmente verificados por
un equipo del Instituto Suizo de Bioinformática e integrado con la base de datos de
Swiss-Prot.

Sus usos incluyen la identificación de posibles funciones de las proteínas recientemente


descubiertas y el análisis de aquellas ya conocidas pero con actividades previamente
desconocidas. PROSITE ofrece herramientas para el análisis de secuencias de
proteínas y detección de motivos de proteínas; es parte de los servidores de análisis de
proteómica de ExPASy.

En PROSITE existe un patrón para describir la superfamilia de las proteínas que unen
ATP/GTP, que es enorme. En Pfam, sin embargo, existen diversos dominios para las
distintas familias que unen ATP/GTP: la familia ras, la familia de factores de elongación
de la traducción, etc.

Veamos cómo funciona Prosite:

Cogeremos una secuencia de una proteína prueba en este caso será de Miosina de
Arabidopsisthaliana. Entonces lo primero que haremos es seleccionarla si ya la hemos
buscado, en nuestro caso la tomaremos de la plataforma moodle:

84
CAPITULO V - BASES DE DATOS

85
CAPITULO V - BASES DE DATOS

86
CAPITULO V - BASES DE DATOS

4.5.2 PRINTS

Prints es un compendio de las huellas dactilares de proteínas. Una huella digital es un


grupo de motivos conservados utilizado para caracterizar una familia de proteínas; su
poder de diagnóstico se refina mediante la exploración iterativa de un compuesto Swiss-
Prot/TrEMBL. Por lo general, los motivos no se solapan, sino que están separados a lo
largo de una secuencia, aunque pueden ser contiguos en un espacio 3D.

La fuerza especial de diagnóstico de las huellas digitales reside en su capacidad para


distinguir las diferencias de secuencia en los niveles clan, superfamilia, familia y
subfamilia. Esto permite de grano fino diagnóstico funcional de las secuencias sin
caracterizar, lo que permite, por ejemplo, la discriminación entre los miembros de la
familia sobre la base de los ligandos que se unen o las proteínas con las que interactúan,
y oligomerización destacando el potencial o los sitios alostéricos.

87
CAPITULO V - BASES DE DATOS

Veamos cómo funciona PRINTS:

Tomamos una secuencia de la proteína prueba (Miosina de Arabidopsisthaliana).

Lo primero que hacemos es seleccionarla si ya la hemos buscado, en nuestro caso la


tomaremos de la plataforma moodle:

88
CAPITULO V - BASES DE DATOS

89
CAPITULO V - BASES DE DATOS

90
CAPITULO V - BASES DE DATOS

91
CAPITULO V - BASES DE DATOS

4.5.3 Pfam

La base de datos Pfam es una de las más importantes colecciones de información en el


mundo para la clasificación de las proteínas. La base de datos clasifica el 75 por ciento
de proteínas conocidas para formar una biblioteca de familias de proteínas - una "tabla
periódica" de la biología. El recurso de acceso abierto se estableció en el Instituto
Wellcome Trust Sanger en 1998.

Para cada familia en Pfam se puede:

➢ Ver alineamientos múltiples

➢ Revisar las arquitecturas y organización de los dominios proteicos

➢ Examinar la distribución de especies

➢ Seguir enlaces a otras bases de datos

92
CAPITULO V - BASES DE DATOS

➢ Ver estructuras proteicas conocidas

Nótese que una única proteína puede pertenecer a varias familias Pfam.

Pfam-A es la porción de la base de datos manualmente gestionada, y contiene alrededor


de 9.000 entradas. Por cada una de ellas se almacena un alineamiento múltiple de
secuencias de proteínas y un modelo oculto de Márkov. Estos modelos ocultos de
Márkov pueden usarse para buscar en bases de datos de secuencias con el paquete
HMMER. Puestos que estas entradas en Pfam-A no cubren todas las proteínas
conocidas, se proporciona un suplemento generado automáticamente denominado
Pfam-B. Pfam-B contiene un buen número de familias pequeñas derivadas de la base
de datos PRODOM.

Veamos cómo funciona Pfam:

Tomamos la secuencia de la proteína prueba (Miosina de Arabidopsisthaliana),


seleccionamos la secuencia de la misma manera que en Prosite y PRINTS:

1.

93
CAPITULO V - BASES DE DATOS

2.

3.

94
CAPITULO V - BASES DE DATOS

4.

5.

95
CAPITULO V - BASES DE DATOS

96
CAPITULO V - BASES DE DATOS

CAPITULO V - BASES DE DATOS

5.1 Introducción

El término base de datos fue acuñado por primera vez en 1963, en un simposio
celebrado en California.

De forma sencilla podemos indicar que una base de datos no es más que un conjunto
de información relacionada que se encuentra agrupada o estructurada.

El archivo por sí mismo, no constituye una base de datos, sino más bien la forma en que
está organizada la información es la que da origen a la base de datos. Las bases de
datos manuales, pueden ser difíciles de gestionar y modificar. Por ejemplo, en una guía
de teléfonos no es posible encontrar el número de un individuo si no sabemos su
apellido, aunque conozcamos su domicilio.

Los problemas expuestos anteriormente se pueden resolver creando una base de datos
informatizada.

Desde el punto de vista informático, una base de datos es un sistema formado por un
conjunto de datos almacenados en discos que permiten el acceso directo a ellos y un
conjunto de programas que manipulan ese conjunto de datos.
Desde el punto de vista más formal, podríamos definir una base de datos como un
conjunto de datos estructurados, fiables y homogéneos, organizados
independientemente en máquina, accesibles a tiempo real, compartibles por usuarios
concurrentes que tienen necesidades de informaciones diferentes y no predecibles en
el tiempo.

La idea general es que estamos tratando con una colección de datos que cumplen las
siguientes propiedades:

➢ Están estructurados independientemente de las aplicaciones y del soporte de


almacenamiento que los contiene.

➢ Presentan la menor redundancia posible.

➢ Son compartidos por varios usuarios y/o aplicaciones.

En 1884 Herman Hollerith creó la


máquina automática de tarjetas
perforadas, con esto realizaban las
primeras bases de datos

97
CAPITULO V - BASES DE DATOS

5.2 Modelos de Base de Datos

Al igual que cuando se habla, p.ej., de coches no existe un único modelo, ni una sola
marca, ni siquiera una sola tecnología sobre su funcionamiento, cuando se trabaja con
bases de datos ocurre una cosa parecida: no existe una sola marca, sino varias, y
además cada marca puede tener diferentes productos cada uno de ellos apropiado a un
tipo de necesidades.

Sin embargo, la división que vamos a hacer aquí de las bases de datos será en función
de la tecnología empleada en su funcionamiento. Hablando de coches tenemos los
tradicionales de motor a gasolina, los de gasóleo, los turbo diesel, los que funcionaban
con gasógeno, y mucho menos frecuentes los coches solares o incluso los de propulsión
a chorro; pues bien, hablando de bases de datos tenemos que las más utilizadas son la
bases de datos relacionales, las más antiguas son las jerárquicas y en red, y las más
avanzadas son las orientadas a objetos, y las declarativas. Estas se diferencian como
hemos dicho, en la forma de trabajar con los datos y en la concepción o mentalidad que
el usuario debe adoptar para interactuar con el sistema.

5.2.1 Modelo jerárquico.

98
CAPITULO V - BASES DE DATOS

Un modelo de datos jerárquico es un modelo de datos en el cual los datos son


organizados en una estructura parecida a un árbol. La estructura permite a la
información que repite y usa relaciones padre/Hijo: cada padre puede tener muchos
hijos pero cada hijo sólo tiene un padre. Todos los atributos de un registro específico
son catalogados bajo un tipo de entidad.

5.2.2 Modelo en red.

Podemos considerar al modelo de bases de datos en red como de una potencia


intermedia entre el jerárquico y el relacional que estudiaremos más adelante. Su
estructura es parecida a la jerárquica aunque bastante más compleja, con lo que se
consiguen evitar, al menos en parte, los problemas de aquél.

Los conceptos fundamentales que debe conocer el administrador para definir el


esquema de una base de datos jerárquica, son los siguientes:

➢ Registro: Viene a ser como cada una de las fichas almacenadas en un fichero
convencional.
➢ Campos o elementos de datos. Son cada uno de los apartados de que se
compone una ficha.
➢ Conjunto: Es el concepto que permite relacionar entre sí tipos de registro
distintos.

Podemos imaginar los registros simplemente como fichas de un fichero. Para ilustrar el

99
CAPITULO V - BASES DE DATOS

concepto de conjunto, supongamos que tenemos un tipo de registro de clientes, y un


tipo de registro de vuelos de avión, y supongamos que queremos asociar ambas
informaciones, de manera que para cada vuelo queremos saber cuáles son los
pasajeros que viajan en él. La forma de hacerlo es a través de un conjunto. Un conjunto
relaciona dos tipos de registro. Uno de ellos es el registro propietario del conjunto, y el
otro es el miembro.

5.2.3 Modelos Avanzados

100
CAPITULO V - BASES DE DATOS

Las bases de datos relacionales han sido y siguen siendo ampliamente utilizadas para
una extensa gama de aplicaciones. Sin embargo, el aumento de potencia de los
ordenadores personales, ha hecho aparecer nuevas aplicaciones potentes que
requieren la utilización de datos complejamente relacionados o con necesidades de
consultas muy particulares, como puedan ser p.ej., los sistemas de información
geográficos, el diseño de circuitos electrónicos por ordenador, etc.

5.2.4 Modelo orientado a objetos.

Una base de datos orientada a objetos es una base de datos donde los elementos son
objetos. Estos pueden ser bases de datos multimedia (videos, imágenes y sonidos),
donde la herencia nos permita una mejor representación de la información, estas bases
de datos tienen una identidad de ser un Todo, y no solo una parte de una gran base,
por ejemplo una base de secuencias de ADN.

El objetivo de una base de datos orientada a objetos son los mismos que los de las
bases de datos tradicionales, pero con la ventaja de representar las modelos de datos
con un marco mucho más eficiente, manteniendo la integridad y relación entre ellos.

A continuación algunos unos conceptos útiles:


101
CAPITULO V - BASES DE DATOS

➢ Clase. Cuando hay varios objetos semejantes, pueden agruparse en una clase.
De hecho, todo objeto debe pertenecer a una clase, que define sus
características generales.

➢ Estado. Son las características propias de cada objeto. Siguiendo con el caso de
los engranajes, su estado puede ser el número de dientes, el tamaño, etc. El
estado se utiliza especialmente para guardar la situación del objeto que varía con
el tiempo. En nuestro caso almacenaríamos la situación en un espacio
tridimensional, y la posición o postura en que se encuentra.

➢ Encapsulación. Cada objeto es consciente de sus propias características. El


engranaje «sabe» que si recibe una fuerza en uno de sus dientes, debe girar, y
lo sabe porque obedece a unas leyes físicas.

➢ Mensaje. Es cada uno de los estímulos que se envían a un objeto.

➢ Herencia. Para facilitar la programación, se puede establecer toda una jerarquía


de tipos o clases.

5.2.5 Modelo declarativo.

102
CAPITULO V - BASES DE DATOS

El enfoque de las bases de datos declarativas es sumamente intuitivo para el usuario, y


le permite abstraerse de los problemas de programación inherentes a otros métodos.
Este modelo suele usarse para bases de conocimiento, que no son más que bases de
datos con mecanismos de consulta en los que el trabajo de extracción de información a
partir de los datos recae en realidad sobre el ordenador, en lugar de sobre el usuario.

Antes de comenzar, aclararemos que, cuando se vea el lenguaje SQL sobre las bases
de datos relacionales, diremos que este es un lenguaje no procedural, en el sentido de
que el usuario especifica qué es lo que quiere, pero no cómo. No se debe confundir este
aspecto del SQL con un lenguaje puramente declarativo, ya que éstos, amplían la
filosofía de la base de datos, de manera que el usuario no es consciente de los métodos
de búsqueda que se realizan internamente, y la forma en que se manejan los datos
también es muy distinta; además, en el caso de las funcionales, es necesario complicar
soberanamente los métodos utilizados si se quiere mantener la pureza de la
metodología funcional. Además, la teoría que subyace en ambos modelos difiere
radicalmente.

103
CAPITULO V - BASES DE DATOS

5.3 Estructura de Bases de Datos Relacionales

5.3.1 Descomposición y Normalización

Siempre que un analista de sistemas de base de datos arma una base de datos, queda
a su cargo descomponer dicha base en grupos y segmentos de registros. Este proceso
es la descomposición; el mismo es necesario independientemente de la arquitectura de
la base de datos - relacional, red o jerárquica.

Sin embargo, para la base de datos relacional, la acción correspondiente puede dividirse
y expresarse en términos formales y se denomina normalización a la misma.

La normalización convierte una relación en varias sub-relaciones, cada una de las


cuales obedece a reglas. Estas reglas se describen en términos de dependencia. Una
vez que hayamos examinado las distintas formas de dependencia, encontraremos
procedimientos a aplicar a las relaciones de modo tal que las mismas puedan
descomponerse de acuerdo a la dependencia que prevalece. Esto no llevará
indefectiblemente a formar varias subrelaciones a partir de la única relación
preexistente.

5.3.2 Normalización

¿Qué es normalización?

Normalización es un proceso que clasifica relaciones, objetos, formas de relación y


demás elementos en grupos, en base a las características que cada uno posee. Si se
identifican ciertas reglas, se aplica un categoría; si se definen otras reglas, se aplicará
otra categoría.

104
CAPITULO V - BASES DE DATOS

5.3.3 Biología de Visualización de Datos

Es una rama de la bioinformática relacionada con la aplicación de gráficos por


ordenador, visualización científica, y la visualización de la información a las diferentes
áreas de las ciencias de la vida. Esto incluye la visualización de secuencias de genomas,
las alineaciones, las filogenias, estructuras macromoleculares, la biología de sistemas,
la microscopía, y los datos de resonancia magnética. Herramientas de software
utilizadas para la visualización de los datos biológicos van desde simples programas
independientes a los sistemas complejos e integrados.

105
CAPITULO V - BASES DE DATOS

Una nueva tendencia es la difuminación de las fronteras entre la visualización de las


estructuras 3D a resolución atómica, la visualización de los complejos más grandes de
crio-microscopía electrónica, y la visualización de la ubicación de las proteínas y
complejos dentro de las células y los tejidos conjunto.

5.4 Base de Datos Biológicas

106
CAPITULO V - BASES DE DATOS

Una base de datos biológica es una biblioteca de información sobre ciencias de la vida,
recogida de experimentos científicos, literatura publicada, tecnología de
experimentación de alto rendimiento, y análisis computacional.1 Contiene información
de áreas de investigación incluyendo genómica, proteómica, metabolómica, expresión
génica mediante microarrays, y filogenética.2 La información contenida en bases de
datos biológicas incluye funciones, estructura y localización (tanto celular como
cromosómica) de genes, efectos clínicos de mutaciones, así como similitudes de
secuencias y estructuras biológicas.

Una base de datos biológica es un almacén de datos para información derivada de los
datos obtenidos experimentos biológicos, ni más ni menos. Y una base de datos
bioinformática es un almacén de datos para información derivada de datos biológicos y
de programas bioinformáticos. Si bajamos al nivel más técnico, las bases de datos
biológicas y bioinformáticas están disponibles generalmente como un conjunto de
ficheros planos, cuyo tamaño suele ser enorme. Para que os hagáis una idea, os incluyo
un gráfico público de crecimiento de la base de datos GenBank desde 1982 hasta 2008.

Principales bases de datos se secuencias de nucleótidos:


➢ NCBI (EEUU)
➢ EMBL (Europa)
➢ DDBJ (Japón)

Algunas bases de datos de genomas de organismos concretos:


➢ Flybase (Drosophila)
➢ SGD (Levadura)
➢ TAIR (Arabidopsis)
➢ ENSEML (Hombre, ratón y otros)

Principales bases de datos de proteínas:


➢ Uniprot
➢ Swiss-prot
107
CAPITULO V - BASES DE DATOS

➢ PDB
➢ MMDB
➢ SCOP

108
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

6.1 Estructura ADN

La información con la que se fabrican las moléculas necesarias para el


mantenimiento de las funciones celulares está guardada en una molécula de
ácido nucleico llamada ácido desoxirribonucleico (ADN).

En la década de los cincuenta, el campo de la biología fue convulsionado por el


desarrollo del modelo de la estructura del ADN. James Watson y Francis Crick
en 1953 demostraron que consiste en una doble hélice formada por dos cadenas.

Es posible tener dos tipos de


ADN, En casos muy raros, una
persona puede tener dos tipos de
ADN diferente. Se trata de las
quimeras humanas

109
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

El ADN es un ácido nucleico formado por nucleótidos. Cada nucleótido consta de


tres elementos:

➢ Un azúcar: desoxirribosa en este caso (en el caso de ARN o ácido ribonucleico,


el azúcar que lo forma es una ribosa)
➢ Un grupo fosfato
➢ Una base nitrogenada: adenina (A), guanina (G), citosina (C) y timina (T).
Estas forman puentes de hidrógeno entre ellas, respetando una estricta
complementariedad: A sólo se aparea con T (y viceversa) mediante dos puentes
de hidrógeno, y G sólo con C (y viceversa) mediante 3 puentes de hidrógeno. Si
la molécula tiene sólo el azúcar unido a la base nitrogenada entonces se
denomina nucleótido.

El ADN tiene tres estructuras:

6.1.1 Estructura Primaria:

Se trata de la secuencia de desoxirribonucleótidos de una de las cadenas. La


información genética está contenida en el orden exacto de los nucleótidos.

Aproximadamente el 8%
del ADN deriva de virus
que en algún minuto
entraron al cuerpo de
nuestros ancestros.

110
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

6.1.2 Estructura Secundaria:

Es una estructura en doble hélice. Permite explicar el almacenamiento de la información


genética y el mecanismo de duplicación del ADN.

6.1.3 Estructura Terciaria:

Se refiere a como se almacena el ADN en un volumen reducido. Varía según se trate


de organismos procariontes o eucariontes:
➢ En procariontes se pliega como una super-hélice en forma, generalmente,
circular y asociada a una pequeña cantidad de proteínas. Lo mismo ocurre
en la mitocondrias y en los plastos.
➢ En eucariontes el empaquetamiento ha de ser más complejo y compacto
y para esto necesita la presencia de proteínas, como son las histonas y
otras de naturaleza no histona (en los espermatozoides las proteínas son
las protaminas).

111
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

6.2 Estructura ARN

El ARN es un polímero de ribonucleótidos de uracilo, citosina, guanina y adenina,


organizado en una banda simple, como la mitad de una escalera con la misma estructura
del ADN: los laterales están formados por los grupos fosfatos y azúcares de los cuales
parte una base nitrogenada.

Para traducir de un idioma a otro se necesitan un diccionario y unas reglas gramaticales;


igualmente, para traducir el ADN a las proteínas se necesita una clave o código genético
de equivalencia, que se denomina Código Genético.

Veamos el siguiente cuadro comparativo que nos podrá aclarar las dudas en cuanto a
la diferencias con el ADN:

112
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

113
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

6.2.1 Estructura Primaria del ARN

Al igual que el ADN, se refiere a la secuencia de las bases nitrogenadas que constituyen
sus nucleótidos.

6.2.2 Estructura Secundaria del ARN

Alguna vez, en una misma cadena, existen regiones con secuencias complementarias
capaces de aparearse.

114
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

6.2.3 Estructura Terciaria del ARN

Es un plegamiento, complicado, sobre la estructura secundaria.

115
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

6.3 Estructura de Proteínas

La palabra proteína proviene del griego protop (lo primero, lo principal, lo más
importante). Las proteínas son las responsables de la formación y reparación de los
tejidos, interviniendo en el desarrollo corporal e intelectual.

Las proteínas son biopolímeros (macromoléculas orgánicas), de elevado peso


molecular, constituidas básicamente por carbono (C), hidrógeno (H), oxígeno (O) y
nitrógeno (N); aunque pueden contener también azufre (S) y fósforo (P) y, en menor
proporción, hierro (Fe), cobre (Cu), magnesio (Mg), yodo (Y). Estos elementos químicos
se agrupan para formar unidades estructurales (monómeros) llamados aminoácidos
(aa), a los cuales se consideran como los "ladrillos de los edificios moleculares
proteicos". Estos edificios macromoleculares se construyen y desmoronan con gran
facilidad dentro de las células, y a ello debe precisamente la materia viva su capacidad
de crecimiento, reparación y regulación.

116
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

La unión de un bajo número de aminoácidos da lugar a un péptido; si el número de aa


que forma la molécula no es mayor de 10, se denomina oligopéptido; si es superior a
10, se llama poli péptido y si el número es superior a 50 aa, se habla ya de proteína.

Se clasifican, de forma general, en Holo proteínas y Heteroproteínas según estén


formadas, respectivamente, sólo por aminoácidos o bien por aminoácidos más otras
moléculas o elementos adicionales no aminoacídicos.

La organización de una proteína viene definida por cuatro niveles estructurales


denominados: estructura primaria, estructura secundaria, estructura terciaria y
estructura cuaternaria. Cada una de estas estructuras informa de la disposición de la
anterior en el espacio.

6.3.1 Estructura Primaria

Una cadena polipeptídica consiste en una cadena lineal de aminoácidos unidos por
enlaces peptídicos. El primer puesto de la cadena corresponde al grupo amino terminal,
y la estructura primaria es la secuencia en la que están situados todos los constituyentes
hasta llegar al carboxilo terminal. Esta secuencia está codificada genéticamente.

Existen cadenas poli peptídicas de cualquier número de aminoácidos, sin que exista una
solución de continuidad entre péptidos y proteínas. Por convención, se suele considerar
proteína aquellos poli péptidos con un peso molecular del orden de 10.000 o más.

117
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

6.3.2 Estructura Secundaria

La estructura secundaria es la forma en la que la cadena poli peptídica se pliega en el


espacio. En una proteína, cada tramo de cadena polipeptídica tiene distinta estructura
secundaria. Existen varias formas definidas de estructura secundaria, las más
importantes de las cuales son las llamadas hélice a y hoja plegada b. Las estructuras
secundarias definidas están mantenidas por puentes de hidrógeno formados
exclusivamente entre los grupos amino y carboxilo que constituyen el esqueleto de la
cadena polipeptídica. Consecuentemente, los parámetros estructurales (distancias,
ángulos) serán iguales, independientemente de la proteína y de los aminoácidos que
formen la estructura.

118
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

6.3.3 Estructura Terciaria

La estructura terciaria de la proteína es la forma en la que se organizan en el espacio


los diferentes tramos de la cadena polipeptídica, que pueden tener una estructura
secundaria definida, como las hélices u hojas o no tenerla. La estructura terciaria está
mantenida hidrógeno entre las cadenas laterales de los aminoácidos, enlaces
hidrofóbicos y eventualmente puentes disulfuro.

6.3.4 Estructura Cuaternaria

La estructura cuaternaria de una proteína es la forma en la que se asocian las distintas


subunidades constituyentes, si es que existen. Es decir, para poder hablar de estructura
cuaternaria es necesario que la proteína esté formada por varias subunidades. Como
ejemplos de proteínas con estructura cuaternaria se puede considerar la hemoglobina,
las inmunoglobulinas o la miosina.

119
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

Funciones y Ejemplos de las Proteínas

Las proteínas determinan la forma y la estructura de las células y dirigen casi todos los
procesos vitales. Las funciones de las proteínas son específicas de cada una de ellas y
permiten a las células mantener su integridad, defenderse de agentes externos, reparar
daños, controlar y regular funciones.

Todas las proteínas realizan su función de la misma manera: por unión selectiva a
moléculas. Las proteínas estructurales se agregan a otras moléculas de la misma
proteína para originar una estructura mayor. Sin embargo, otras proteínas se unen a
moléculas distintas: los anticuerpos, a los antígenos específicos; la hemoglobina, al
oxígeno; las enzimas, a sus sustratos; los reguladores de la expresión genética, al ADN;
las hormonas, a sus receptores específicos.

El proceso anteriormente descrito se puede observar en el siguiente gráfico:

6.4 Protein Data Bank

El Protein Data Bank es un repositorio de descripciones experimentales de las


estructuras moleculares de proteínas y ácidos nucleicos resueltos hasta el momento.
Cada descripción es un archivo de texto que contiene las coordenadas atómicas de la
molécula en cuestión en un formato que se llama PDB.

120
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

Crecimiento

Cuando se fundó, el PDB contenía tan sólo 7 estructuras de proteínas. Desde entonces
ha experimentado un crecimiento aproximadamente exponencial en el número de
estructuras y nada parece indicar que el ritmo vaya a decaer.

http://www.rcsb.org/pdb/home/home.do

Veamos en las siguientes imágenes como se puede navegar y observar las


descripciones:

Interfaz: podemos navegar dependiendo el organismo que queremos examinar, así que
seleccionamos entre las diferentes opciones brindadas.

121
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

Seleccionar Homosapiens donde obtenemos resultados de cuantos organismos se


encuentran para este:

Nos desplazamos a la parte inferior de la pantalla y seleccionamos una de las


estructuras para analizar sus características.

122
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

Veamos más grande la estructura:

123
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

6.5 Folding de Proteínas

Las proteínas para llevar a cabo sus funciones deben alcanzar una forma determinada,
conocida como “Pliegue”, en otras palabras, antes de realizar su trabajo tienen que
ensamblarse así mismas. Este proceso de auto ensamblaje se le llama “Plagamiento”.

Las proteínas plegadas incorrectamente por lo general carecen de actividad biológica,


pero en algunos casos pueden estar asociadas con enfermedades.

Para esto las células tienen sistemas que reducen las posibilidades de que las proteínas
estén mal plegadas, además cualquier proteína de este tipo son degradados por grupos
celulares especializados del sistema de eliminación.

Por lo general, todas las moléculas de proteína de cualquier especie adoptan una
conformación única, llamada Cadena Nativa. Para la gran mayoría de las proteínas, el
estado natural es la forma más estable plegada de la molécula.

Las células requieren un mecanismo rápido y eficiente, para el plegamiento de proteínas


en su forma correcta, de lo contrario, las células perderían mucha energía en la síntesis
de proteínas funcionales y en la degradación de proteínas mal plegadas o desplegadas.

124
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

6.5.1 Proceso De Folding

La explicación de la eficiencia de la célula en la promoción de plegamiento de las


proteínas probablemente se encuentra en los chaperones, la cual es una clase de
proteína que se encuentra en todos los organismos desde las bacterias hasta en los
seres humanos. Los chaperones están localizados en cada compartimiento celular,
unidos a una gran variedad de proteínas, y la función de la chaperona en general es el
mecanismo de plegamiento de las proteínas en las células.

Existen dos tipos de Chaperonas:

➢ Chaperonas Moleculares: Se unen para estabilizar las proteínas desplegadas


o parcialmente doblados, impidiendo así que estas proteínas se agreguen y se
degraden.

➢ Chaperoninas: Facilitan directamente el plegamiento de las proteínas.

Chaperonas Moleculares

De particular importancia son las chaperonas presentes en todos los tipos de células y
en los compartimentos celulares. Algunas chaperonas interactúan con las cadenas
recién formadas que emergen de los ribosomas. En tanto que otras guían en las etapas
posteriores del plegado. Las chaperonas moleculares frecuentemente trabajan en
conjunto asegurando que los diferentes estadios en el plegado de cada sistema sean
completamente eficientes. Muchos de los detalles del funcionamiento de las chaperonas
moleculares han sido determinados en estudios realizados in Vitro.

125
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

La proteína nativa casi siempre corresponde a una estructura que es


termodinámicamente estable bajo condiciones fisiológicas. Sin embargo el número total
de posibles combinaciones de una cadena poli peptídica es muy grande, una búsqueda
sistemática para una estructura en partícula seria larga y difícil.

Chaperoninas

Las chaperoninas utilizan su estructura para ayudar en el plegamiento de muchas


proteínas mediante un mecanismo muy general pero poco eficiente, que se basa en el
aislamiento de la proteína a plegar. En los organismos eucariotas esta arquitectura ha
generado la chaperonina CCT, que pliega eficientemente un reducido número de
proteínas.

Uno de los ejemplos más evidentes de este mecanismo es el de las chaperoninas o


proteínas de choque térmico de 60 kDa (Hsp60). Estas chaperonas se encuentran en

126
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

todos los organismos, y en realidad son mucho mayores, pues son grandes oligómeros
compuestos por subunidades de esa masa molecular que forman siempre la misma
estructura, un doble anillo dispuesto espalda contra espalda.

Las chaperoninas se clasifican en dos grupos, las de tipo I que se encuentran en las
eubacterias y en organelos endosimbiontes, y las de tipo II que se localizan en las
arqueo bacterias y en el citosol de eucariotas. Las de tipo II son más complejas que las
de tipo I, pero todas ellas funcionan como chaperonas generales, capaces de plegar
casi cualquier proteína desnaturalizada en cualquier conformación, mediante
interacciones hidrófobas entre los residuos de las proteínas desnaturalizadas y los que
se encuentran en la entrada de la cavidad de la chaperonina.

6.6 Alineamiento de Estructuras

Un alineamiento estructural es un tipo de alineamiento de secuencias basado en la


comparación de la forma. Estos alineamientos intentan establecer equivalencias entre
dos o más estructuras de polímeros basándose en su forma y conformación
tridimensional. El proceso se aplica normalmente a las estructuras terciarias de las
proteínas, pero también puede usarse para largas moléculas de ARN. En contraste a la
simple superposición estructural, donde al menos se conocen algunos residuos
equivalentes de las dos estructuras, el alineamiento estructural no requiere un
conocimiento previo de posiciones equivalentes. Es una valiosa herramienta para la
comparación de proteínas con baja similitud entre sus secuencias, en donde las
relaciones evolutivas entre proteínas no pueden ser fácilmente detectadas por técnicas
estándares de alineamiento de secuencias.

El alineamiento estructural puede usarse, por lo tanto, para sugerir relaciones evolutivas
entre proteínas que comparten una secuencia común muy corta. Sin embargo, el uso

127
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

de los resultados como evidencia de un ancestro evolutivo común debe realizarse con
cautela dados los posibles efectos de confusión con la evolución convergente, según la
cual múltiples secuencias de aminoácidos sin relación filogenética entre si convergen a
una misma estructura terciaria."

El resultado de un alineamiento estructural es una superposición de los conjuntos de


coordenadas atómicas, así como una distancia media cuadrática mínima (o RMSD, de
Root Mean SquareDeviation, o desviación de la media cuadrática) entre las estructuras
básicas de las proteínas superpuestas. La RMSD de estructuras alineadas indica las
divergencias entre ellas.

El alineamiento estructural puede complicarse por la existencia de múltiples dominios


proteicos en el interior de una o más de las estructuras de entrada, ya que cambios en
la orientación relativa de los dominios entre dos estructuras a alinear pueden exagerar
la RMSD artificialmente.

128
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

Puesto que las estructuras de las proteínas se componen de aminoácidos cuyas


cadenas laterales están enlazadas por un esqueleto de proteínas comunes, se puede
utilizar un número de los posibles subconjuntos diferentes de átomos que conforman
una macromolécula de proteína para producir un alineamiento estructural y calcular los
correspondientes valores RMSD.

Cuando se alinean estructuras con secuencias muy diferentes, los átomos de la cadena
lateral, generalmente, no se toman en cuenta, ya que sus identidades difieren en
muchos de los residuos alineados. Por esta razón, en los métodos de alineamiento
estructural es común usar por defecto solo los átomos del esqueleto incluidos en el
enlace peptídico. Solo cuando las estructuras a alinear son altamente similares, e
incluso idénticas, es significativo alinear posiciones de átomos de la cadena lateral, en
cuyo caso la RMSD refleja no solo la conformación del esqueleto de la proteína

129
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS

La comparación más sencilla posible entre estructuras de proteínas no intenta alinear


las estructuras de entrada, sino que necesita un alineamiento pre calculado como input
para determinar cuáles de los residuos en la secuencia deben considerarse para el
cálculo de la RMSD.

Este método utiliza tradicionalmente un sencillo algoritmo de ajuste por mínimos


cuadrados, en el que las rotaciones y translaciones óptimas se encuentran minimizando
la suma de los cuadrados de las distancias entre todas las estructuras de la
superposición. Más recientemente, los métodos bayesianos y de máxima verosimilitud
han incrementado enormemente la precisión de las rotaciones, translaciones y matrices
de covarianza estimadas para la superposición.

130
CONCLUSIONES

➢ El proceso de recopilación de la información para complementar el libro de la


Clase de Bioinformática implico el retomar una gran variedad de conceptos
fundamentales para el conocimiento de la asignatura y transmisión del mismo por
medio del presente texto.

➢ Algunos de los conceptos de la bioquímica aplicada a la bioinformática dieron


más ideas y compresión acerca de las bases de datos que se pueden crear para
el desarrollo y avance en cuanto al conocimiento de la información de los
organismos en general.

➢ La bioinformática es una ciencia en continuo desarrollo, tiene que ver con cada
aspecto del vida cotidiana desde lo que consumimos en el desayuno, la cura de
enfermedades, hasta el desarrollo de modelos genéticos de cómo puede
cambiar un organismo debido al cambio en el medio ambiente.

➢ La incursión de la informática a este campo se da de forma muy acelerada, cada


día se producen miles de millones de bits de información y son la genética y la
biología molecular las que ahora están aportando a la informática sobre cómo se
debe hacer el almacenamiento de esta información.

➢ La bioinformática es una disciplina cuya visión llevara a las biociencias y la


medicina a logros de gran trascendencia, como son la telemedicina, el
descubrimiento de oncogenes, la nanotecnología en pro de la medicina y el
proyecto genoma humano.

131
DICCIONARIO DE TERMINOS.
A específico de ADN. Puede producirse
• ADN: Un ácido nucleico compuesto de in vivo o in vitro.
dos cadenas polinucleotídicas que se Ver clonación, reacción en cadena de
disponen alrededor de un eje central la polimerasa.
formando una doble hélice, capaz de
autorreplicarse y codificar la síntesis de • Anabolismo (del griego ana =
ARN. sobre, metabole = cambio): en un
organismo el conjunto de reacciones
• ADN complementario (cADN): ADN biosintéticas o sea las reacciones en
sintetizado a partir de un molde de que moléculas pequeñas forman
ARN; esta cadena no apareada suele moléculas más grandes.
utilizarse como sonda (probe)
en mapeos físicos. • Anticuerpos (del griego anti = contra)
Proteínas producidas por las células
• Aminoácidos (del griego Ammon = del sistema inmune (linfocitos B) que se
dios egipcio cerca de cuyo templo se combinan específicamente con
prepararon por primera vez las sales de moléculas extrañas al organismo
amonio a partir de estiércol de (antígenos) con la finalidad de
camello): Las subunidades inactivarlas.
(monómeros) que forman
las proteínas (polímeros). Cada • Antígenos (del griego anti =
aminoácido posee por lo menos un contra; genos = origen): Moléculas,
grupo funcional amino (básico) y un generalmente extrañas al organismo
grupo funcional carboxilo (ácido) y receptor, que inician la producción
difiere de otros aminoácidos por la de anticuerpos, generalmente son
composición de su grupo R. proteínas o combinaciones de
proteínas con polisacáridos.
• Actina (del griego aktis = rayo):
Proteína compuesta por subunidades • ARN (ácido ribonucleico): Ácido
globulares que forma filamentos. nucleico formado por una cadena
polinucleotídica. Su nucleótido,
• Adaptación (del latín adaptare = consiste en una molécula del azúcar
acomodar): Tendencia de un ribosa, un grupo fosfato, y una de estas
organismo a "adecuarse" a su medio cuatro bases nitrogenadas: adenina,
ambiente; uno de los principales uracilo, citosina y guanina.
puntos de la teoría de la evolución por
la selección natural de Charles Darwin: • ARN mensajero: "Molde" para la
los organismos se adaptan a su medio síntesis proteica que es copiado de una
ambiente. Aquellos organismos mejor de las hebras de ADN y que se traduce
adaptados tendrán mayor probabilidad en los ribosomas en una secuencia
de sobrevivir y pasar sus genes a la proteica. Se abrevia ARNm.
siguiente generación.
• ARN ribosómico: Uno de los tres tipos
• Amplificación: Un aumento del de ARN, el ARNr es un componente
número de copias de un fragmento estructural de los ribosomas. Son el
"core" (parte principal) de los
132
ribosomas y posiblemente la clave del compuesto de neutrones y protones, y
mecanismo de traducción de las en electrones que se mueven
proteínas. Su estudio comparativo llevó alrededor de mismo.
a postulación de un Árbol Filogenético
Universal. • ATP: (adenosín trifosfato): El principal
producto químico utilizado por los
• ARNs satélites: ARN similar a sistemas vivientes para almacenar
los viroides empaquetados energía, consiste en un una base
en capsides de determinadas cepas (adenina) unida a un azúcar (ribosa) y
de virus, se replican en presencia del a tres fosfatos. Fórmula.
virus "colaborador" específico,
modificando su patogenicidad.

• ARN de transferencia (del


latín transferre = transportar, der.
de ferre= llevar) Ácido ribonucleico,
pequeño, de una sola cadena, pega al
aminoácido y lo lleva
al codón apropiado en el ARN m. Se
abrevia ARNt. B
• Arqueobacterias (del • Bases apareadas (en
griego arkhaios = antiguo; bakterion = inglés base pair, bp) Dos bases
bastón): grupo de procariotas de unos nitrogenadas (adenina y timina o
3.500 millones de años de antigüedad, guanina y citosina) mantenidas juntas
presentan una serie de características por enlaces débiles (puente
diferenciales que hicieron que Carl hidrógeno). Las dos hebras del ADN se
Woese, profesor de la Universidad de mantienen juntas formando una doble
Illinois, Urbana, U.S.A. hélice por los enlaces de sus bases
, carl@ninja.life.uiuc.edu , proponga su apareadas.
separación del reino Moneras y la
creación de uno nuevo: Archaea, • Bioquímica: Ciencia que estudia los
propuesta que hoy es cada vez más procesos químicos asociados con los
aceptada. seres vivos.
• Asexual (del griego a como prefijo • Bioinformatica: Según una de sus
privativo): Un método de reproducción definiciones más sencillas, es la
en el cual se producen descendientes aplicación de tecnología
genéticamente idénticos a su único de computadores a la gestión y análisis
progenitor. Ocurre por diversos de datos biológicos. Los términos
mecanismos, entre ellos fisión, bioinformática, biología
gemación y fragmentación. computacional y, en
ocasiones, biocomputación,
• Átomo (del griego átomos = utilizados en muchas situaciones
indivisible): La menor partícula como sinónimos, hacen referencia a
indivisible de la materia que posee una campos de estudios interdisciplinares
existencia independiente y mantener muy vinculados que requieren el uso o
las propiedades del elemento, consiste el desarrollo de diferentes técnicas
en una zona central: el núcleo,
133
estudiadas universitariamente en • Ciclinas: proteína que interviene en el
la Ingeniería Informática como ciencia "reloj" que controla el ciclo celular,
aplicada de la disciplina informática. fosforilada y combinada con la quinasa
cdc2 promueve la división. Proteínas
• Biotecnología: Aplicación práctica de sintetizadas continuamente durante la
los avances de las técnicas utilizadas interfase y degradadas súbitamente
en la investigación básica de la por enzimas al final de cada mitosis.
bioquímica del ADN, hoy utilizados en Durante el ciclo celular su
el desarrollo de productos por la concentración fluctúa. Y, al hacerlo
industria del ADN recombinante, fusión actúan como reguladores de la
celular, manipulación genética de actividad enzimática de las quinasas.
vegetales y otras.
• Ciclo de Calvin (o de Calvin - Benson
o de Fijación del Carbono) Serie de
reacciones bioquímicas mediadas
porenzimas, mediante las cuales el
anhídrido carbónico es reducido e
C incorporado en moléculas orgánicas,
eventualmente algunas de ellas forman
• Cariotipo (del griego karion =
azúcares. En los eucariotas, esto
núcleo; typos = estampar, imprimir):
ocurre en el estroma del cloroplasto.
Microfotografía de los cromosomas
individuales ordenados en un formato
• Cigoto (del griego zygos = "yugo",
normatizado que muestra el número,
porque une): óvulo fecundado. Célula
tamaño y forma de cada tipo de
diploide (2n) resultante de la fusión de
cromosoma. Se usa para correlacionar
un gameto masculino con uno
anormalidades de los cromosomas
femenino (ovocélula).
(observables a este nivel de
resolución) con determinadas
enfermedades. • Citoplasma (del griego kytos =
recipiente; plasma = materia
modelable): lo que se encuentra entre
• Cariotipo de flujo: uso de la citometría
la membrana celular y la membrana
de flujo para analizar y/o separar
nuclear. Materia viva en el interior de
cromosomas en base a su contenido
una célula, excluyendo al material
en ADN.
genético.
• Célula (del latín cella = cámara): la
• Clon (del griego klon = retoño ramita):
más pequeña unidad estructural de los
Grupo de células o individuos
seres vivos capaz de funcionar
originados de un solo antecesor, por
independientemente. Cianobacterias
reproducción asexual o
: o algas verde-azuladas, procariotas
por manipulación biotecnológica. Uno
con capacidad fotosintética , algunas
de los miembros de dicho origen.
de ellas asimilan nitrógeno
atmosférico. Organismos que se
encuentran entre los más antiguos • Clonación: En la tecnología de ADN
conocidos existiendo recombinante, los procedimientos para
depósitos fósiles de cerca de 3.000 la manipulación del ADN que permiten
millones de años. la producción de múltiples copias de un
gen o segmento de ADN se conocen
como "clonación del ADN". El proceso
134
de producción asexual de un grupo de griego homos = igual; der. homologos=
células u organismos (clones), acorde, correspondiente; formado
genéticamente idénticos. con lego = "yo digo"): Cromosomas
que llevan genes correspondientes y
• Código genético: Las secuencias de se asocian en pares en la primera
nucleótidos (tripletes) que representan etapa de la meiosis, los miembros del
a los aminoácidos a introducir en una par derivan de sendos padres. Un par
molécula durante la síntesis proteica. de cromosomas en cual un miembro
La secuencia de nucleótidos del ADN del par tiene origen materno y el otro
puede utilizarse para predecir la paterno.
secuencia del ARNm y por ende la
secuencia de aminoácidos.

• Codominante: caso en que, en los


heterocigotos,
se expresan ambos genotipos present D
es.
• Deleción (del griego deleomai= yo
• Codon: Una secuencia de destruyo): Pérdida de un segmento de
tres nucleótidos en el ARNm que un cromosoma.
codifica para un aminoácido.
• Desintegración radioactiva: La
• Coenzima (del griego co = juntos): conversión espontánea de un átomo a
molécula o cofactor no proteico que un átomo de un elemento diferente por
colabora con la enzima en su la emisión de una partícula de su
función catalítica , con frecuencia núcleo (desintegración alfa o beta).
actúan en reacciones de óxido-
reducción.
• Dextrán nombre comercial del
dextrano utilizado en medicina como
• Cromátida: Cualquiera de las dos sustituto del plasma, su alto peso
partes longitudinales de un cromosoma molecular y la falta de enzimas que lo
replicado, unidas por el centrómero. destruyan, lo mantiene dentro de los
vasos sanguíneos; la presión osmótica
• Cromatína (del griego chroma = ejercida mantiene a los líquidos en los
color) : Complejo de ADN y proteínas vasos.
en células eucariotas que se dispersa
en el núcleodurante la interfase y se • Difusión: El movimiento espontáneo
condensa en cromosomas durante de partículas desde un área de alta
la meiosis y mitosis. concentración a un área de baja
concentración.
• Cromosomas (del griego khroma =
color; soma = cuerpo): Estructuras del
núcleo de la célula eucariota que • Dihibridación (del latín ibrida =
consiste en moléculas de ADN (que "producto de la cruza de dos animales
contienen los genes) y proteínas diferentes"): En genética, un
(principalmente histonas). cruzamiento de dos variedades
diferentes en el que están implicadas
• Cromosomas homólogos (del dos características.
135
• Diploide (del griego di= doble; ploion= • Endocitosis (del griego endon =
nave): organismo o fase nuclear que dentro; kytos = célula): La
tiene los dos juegos de cromosomas. incorporación de material desde el
Numero cigótico de cromosomas (2n), exterior de la célula hacia el interior por
por oposición al número gamético (n) o la formación, en la membrana
haploide. plasmática, de una vesícula que rodea
al material en manera tal que la célula
lo pueda incorporar. Incluye
• Doble hélice: La forma que toman las 1) fagocitosis 2) pinocitosis 3)
dos hebras de ADN cuando se endocitosis mediada por receptor.
encuentran unidas.
• Energía de activación: La menor
• Dominante: Término aplicado a un cantidad de energía requerida para que
carácter (alelo) que se expresa sin ocurra una determinada reacción
tener en cuenta el segundo carácter química. Varía de reacción en
(alelo). reacción.

• Energía: la capacidad de producir


• Duplicación: Copia extra de un trabajo.
segmento de un cromosoma.

• Entrenudo: La región del tallo entre


los nudos de las plantas.

E • Entropía (del griego en = en; trope =


girar): el grado de desorden de un
sistema.
• Ecología (del griego oikos =
casa; logos = discurso): ciencia que
estudia la manera en que interactúan
• Enzima (del griego en = en; zyme =
los organismos entre sí y con su medio
levadura): Molécula de proteína que
ambiente.
actúa como catalizador en las

reacciones bioquímicas.
• Elemento: una sustancia compuesta
de átomos con el mismo número
• Epidermis (del griego epi =
atómico; no puede ser roto por
encima; derma = piel): En plantas, la
reacciones químicas ordinarias.
capa mas externa de células, a
menudo cubierta por
• Elementos cribosos: células
uncutícula cerosa. Provee protección a
tubulares, de paredes finas que forman
la planta. tejido que recubre el cuerpo
un sistema de tubos que se extiende
primario de las plantas.
desde las raíces a las hojas en el
floema de las plantas; pierden su
• Escherichia coli: Bacteria común,
núcleo y orgánulos en la madurez, pero
habitante del intestino humano,
conservan una membrana plasmática
estudiada intensivamente por los
funcional.
genetistas en razón de su facilidad para
crecer en el laboratorio, lo pequeño de
• Elongación: alargamiento.
136
su genoma y su falta de patogenicidad hebra): Estructura masculina de la flor
(generalmente..) que produce polen, generalmente esta
formada por un filamento que sostiene
a la antera productora de polen.
• Esclereida: célula de esclerénquima,
de forma variada, típicamente no muy • Estatolito: grano de almidón móvil,
alargada, y con paredes secundarias que le permite a la planta recibir el
gruesas lignificadas. estímulo de la gravedad.

• Esclerénquima (del griego skleros = • Estoma (del griego stoma = boca):


duro): Tipo de tejido de sostén con aberturas en la epidermis de las hojas
células de paredes celulares gruesas, y tallos rodeadas de células oclusivas,
frecuentemente lignificadas que en la intervienen en el intercambio gaseoso.
madurez pueden estar vivas o
muertas.
• Estrellas (del latín stella id.): En
astronomía cada uno de los astros
• Esclerificación: proceso de formación que brillan con luz propia en el
de esclerénquima, tejido de paredes firmamento.
secundarias rígidas.
• Estroma: La matriz proteica entre las
• Espectro de luz visible: Conjunto de granas de los cloroplastos.
los siete colores simples que produce Sitio de las reacciones oscuras de la
un rayo luminoso al descomponerse fotosíntesis.
por efecto de una refracción
adecuada. • Eter: Compuesto químico cuya
fórmula general es R-O-R', donde R y
• Esporas (del griego spora = semilla): R' son grupos hidrocarbonados.
célula reproductora asexual capaz de
desarrollar un nuevo organismo sin • Eubacterias (del griego eu = bueno,
fusionarse con otra célula. verdadero; bakterion = bastón):
subgrupo del reino Monera que incluye
• Esporofítica: generación que produce a las bacterias verdaderas
esporas, en las plantas con flores está como Escherichia coli
representada por la planta verde • Eucariotas (del griego eu = bueno,
originada de la semilla. verdadero; karyon = núcleo, nuez):
organismos caracterizados por poseer
• Esporofito (del griego spora = células con un núcleo verdadero
semilla; phyton = planta): La rodeado por membrana. El registro
generación diploide (productora de arqueológico muestra su presencia en
espora) en los organismos con rocas de aproximadamente 1.200 a
alternancia de generaciones. 1500 millones de años de antigüedad.

• Esquizógeno: espacio originado por • Euglenoides: término aplicado a una


separación de las paredes de dos división de los protozoarios que tienen
células contiguas. un flagelo largo, carecen de pared
celular y que pueden poseer
• Estambre (del griego stamen = cloroplastos.

137
Los genes expresados incluyen a
• Eustela: tipo de estela o cilindro aquellos que han sido transcriptos a
vascular más evolucionado, hueco y ARNm y luego traducidos a proteínas
formado por hacecillos vasculares y aquellos que han sido transcriptos a
colaterales en un solo círculo. ARN pero no traducidos a proteínas
(p.ej. ARNt y ARNr).
• Evolución (del latín e- =
fuera; volvere = girar): Cambio de los • Expresión: En genética, proceso por el
organismos por adaptación, variación, cual la información codificada en
sobrerreproducción y reproducción / los genes se convierte en estructuras
sobrevivencia diferencial, proceso al operacionales presentes en la célula.
que Charles Darwin y Alfred Wallace se
refirieron como selección natural. • Expresividad y penetrancia: El grado
de expresión de un gen puede variar
• Exina (del latín ex = fuera): Cubierta como resultado de su interacción con el
externa de los granos de polen, a ambiente o con otros genes.
menudo compuesta por Esta EXPRESIÓN VARIABLE se ve
esporopolenina, unpolisacárido ácido en la polidactilia (presencia de dedos
resistente que facilita la fosilización de supernumerarios en manos o pié),
los granos de polen. causada por una alelo dominante.
Existe una gran variabilidad en la
• Exocitosis: El proceso en el cual una expresión entre los integrantes de la
vesícula primero se fusiona con la familia algunos tienen dedos
membrana plasmática y luego se abre supernumerarios en pies y manos y
y libera su contenido al exterior. otros, solo en el pié.

• Exoenzimas (del griego ex = fuera,


en = en, zyme = F
levadura): Enzimas que salen fuera de • Fagocito (del griego phagos =
la célula . comilón; kytos = célula): literalmente
"célula comilona" deriv.fagocitosis,
• Exón (del griego exo = por fuera): La forma de endocitosis en la cual la
porción del ADN de un gen que codifica célula rodea a partículas sólidas,
para una proteína, los exones son bacterias o virus que son introducidas
característicos de los eucariotas. para su destrucción.
• Exonucleasa (xel griego exo = por • Familia de Genes: Grupo de genes
fuera; asa = sufijo que indica actividad muy relacionados que fabrican
enzimática): Enzima que corta productos similares.
secuencialmente nucleótidos de los
extremos libres de un ácido nucleico. • Familia: En taxonomía, término
aplicado a las subcategorías dentro de
los órdenes.
• Expresión génica: El proceso por el
cual la información codificada en los • Fasciculado: agrupado en un manojo.
genes se convierte en las estructuras
operacionales presentes en las
• Fase G1 (del inglés gap = intervalo):
células.
primer intervalo del ciclo celular.
138
hoja/nudo, decusada si hay dos hojas
• Fase G2 (del inglés gap = intervalo): por nudo, ubicadas en cruz.
intervalo o período de latencia antes
de pasar a la mitosis (fase M). • Fisión binaria: (del latín fissus =
partir; binarius = 'de dos en dos'): El
• Fase S: (la S va por Síntesis del método por el cual se reproducen las
ADN): fase del ciclo celular bacterias.La molécula de ADN se
caracterizada por la síntesis de ADN. replica y luego la célula se parte en dos
células idénticas, cada una de las
• Fase: estados del ciclo biológico. En cuales contiene una copia exacta del
los organismos con reproducción ADN de la célula. original.
sexual, estados en que se presenta,
de acuerdo a la dotación cromosómica • Fitohemoaglutinina: producto de
de las células (2n o n). origen vegetal (lectina) que aglutina
eritrocitos, e induce a la mitosis.
• Fenotipo (del griego phaineim =
mostrar, typos = imprimir, estampar): • Fitohormona: compuestos de peso
Características observables de un molecular medio, producidos por
individuo. La expresión de la células vegetales y que actúan en
composición alélica para un otras partes de la planta, como
determinado carácter bajo estudio (Lo estimulantes de algún proceso
que se ve). fisiológico.

• Fibra: célula esclerenquimática • Flagelos (del latín flagellus = batir)


alargada a menudo de extremos órgano de locomoción que se
adelgazados con pared secundaria encuentra tanto en células eucariotas
lignificada. como en procariotas. El flagelo
eucariota tiene una distribución interna
de microtúbulos que es característica:
9 + 2 (nueve pares que rodean a dos
centrales) Y NO SE ENCUENTRA EN
• Filamento (del latín filum = hilo): el PROCARIOTAS.
pedicelo de un estambre.
• Floema (del griego phlos = corteza):
• Filogenia (del griego phylon = raza, tejido del sistema vascular de las
tribu): 1) el estudio de relaciones plantas que transporta azúcares
evolutivas en un grupo 2) hipótesis disueltos y otros productos de
evolutiva representada en un diagrama la fotosíntesis, desde las hojas a otras
como un "árbol evolutivo" 3) Estudio de regiones de la planta; constituido
la formación y la evolución de los principalmente por las célulascribosas.
organismos, con el objeto de Células del sistema vascular de las
establecer su parentesco . plantas que transportan alimentos
desde las hojas a otras áreas de la
• Filotaxis: estudio de la disposición planta.
foliar sobre tallos y ramas.
Puede ser alterna, con una hoja por • Flores: Estructura reproductiva de
nudo, dística si las hojas están los esporofitos de las angiospermas,
opuestas; verticilada, con más de 1 donde se genera el gametofito.

139
• Fosas: en geografía se denomina así a parenquimáticas con algunas
las grandes profundidades marinas. de colénquima yesclerénquima, ocupa
el espacio entre la epidermis y el
• Fosfolípidos (del griego lipos = sistema vascular; interviene en
grasa): moléculas lipídicas asimétricas, la fotosíntesis, almacenamiento de
con una "cabeza" hidrofílica y una agua y alimentos. También tiene
"cola"hidrofóbica. Posee un grupo funciones de soporte.
fosfato en lugar de uno de los tres En hojas, raíces y tallos jóvenes todo
ácidos grasos que esterifican a la lo que no sea o vascular.
glicerina en las grasas.
El grupo fosfato además se une a
bases orgánicas como la colina. G
• Galaxias (del griego galaxias =
• Fósiles (del latín fossilis = "que se relativo a la leche, de allí "vía láctea"):
saca cavando la tierra", enterrado): cada una de las grandes agrupaciones
Los vestigios o restos de vida del tipo de nuestra "vía láctea”, que
prehistórica preservadas en las rocas aisladas en los espacios siderales
de la corteza Terrestre.Cualquier constituyen los elementos que
evidencia de vida pasada. conforman el universo.
• Fotosíntesis (del griego photos = • Gameto (del griego gamos = "unión de
luz, syn = juntos, tithenai = ubicar): los sexos", esposa): Célula
Conversión de energía lumínica en reproductora haploide(n) que cuando
energía química. Síntesis de su núcleo se fusiona con otro gameto
compuestos orgánicos a partir de (n) del sexo opuesto origina un cigoto
anhídrido carbónico y agua utilizando (2n), que por mitosis desarrolla un
la energía lumínica captada por individuo con células somáticas
laclorofila. diploides (2n), en algunos hongos y
protistas puede, por meiosis, producir
• Fotosistema: 1) Unidad compuesta células somáticas haploides (n).
por cientos de moléculas de clorofila y
otras moléculas accesorias embebidas • Gametofítica: generación que se inicia
en los tilacoides de los cloroplastos e con la meiosis y termina en la
implicada en reacciones fotosintéticas fecundación, en las plantas con flores
que requieren luz. está representada por la micróspora
Los eucariotas poseen dos tipos de (gametofito masculino) y el saco
fotosistemas: el I y el II. embrionario (gametofito femenino)
2) La serie de pigmentos verdes
relacionados con la absorción de la
• Gametofito (del griego gamos =
energía luminosa, que en eucariotas
"unión de los sexos", esposa; phyton =
ocurre en los tilacoides de los
plantas): En las plantas que presentan
cloroplastos.
alternancia de generaciones, el
La energía de la luz es pasada a los
estadio haploide que
electrones a medida que ellos se
produce gametos por mitosis.
mueven a través de los pigmentos del
fotosistema.
• Gametofito masculino: grupo de dos
a cuatro células que se encuentran
• Fundamental: tejido compuesto
constituyendo el grano de polen.
principalmente por células
140
Plantas con semillas desnudas; las
• Generación: período de desarrollo en primeras plantas con semillas.
el ciclo biológico de un organismo, Entre los actuales grupos vivientes
originado a partir de una estructura tenemos a las coníferas (p. ej.Pinus).
reproductiva y que termina en otra
estructura reproductiva luego de una • Gineceo (del griego gyne =
serie de mitosis sucesivas. hembra, oikos = casa): Termino
colectivo aplicado a todos los carpelos
• Género (del latín genus = raza, (o pistilos) de una planta. Algunas
orígen): Subcategoría taxonómica plantas tienen varios pistilos parciales
dentro de la Familia, se compone de o totalmente fusionados.
uno o más especies.
• Glicerina (del griego glykeros =
• Genes (del griego genos = "sabor dulce"): propanotriol,
nacimiento, raza; del latín genus = polialcohol de tres átomos de carbono.
raza, origen): segmentos específicos
de ADN que controlan las estructuras • Glicólisis: El proceso metabólico
y funciones celulares; la unidad universal del mundo celular en el cual
funcional de la herencia. la glucosa (6 carbonos) se rompe en
Secuencia de bases de ADN que dos moléculas de piruvato (tres
usualmente codifican para una carbonos) y en el proceso se produce
secuencia polipeptídica de ATP y NADH.
aminoácidos.
• Glucosa: Azúcar común, con seis
átomos de carbono
• Genética : el estudio de la herencia de (C6H12O6), monosacárido más
los caracteres. frecuente en la mayoría de los
organismos.
• Genoma 1.Conjunto de genes de un
individuo.2.Conjunto de genes • Gónada (del griego gone= semilla ):
compartidos por los miembros de una Órgano productor de gametos de los
unidad reproductiva tales como una animales pluricelulares, ovario o
población o especie.Todo el material testículo.
genético de los cromosomas de un
organismo en particular, su tamaño se
da generalmente como el número total
de bases apareadas. H
• Genotipo: La totalidad de los alelos de
un organismo.
• Halófilas (del griego halos = sal,
mar; philios= amigo): bacterias que
• Geotropismo: fenómeno trópico en el
medran en ambientes salinos.
que el factor estimulante es la
gravedad.
• Haploide (del griego haploos =
simple, ploion = nave): Célula que
• Gimnospermas (del griego gymnos =
contiene solo un miembro de
desnudo, sperma = semilla):
cada cromosomahomólogo (número
literalmente, semillas desnudas.
haploide = n).
141
En la fecundación, homólogos.
dos gametos haploides se fusionan Cuando los dos alelos son diferentes,
para formar una sola célula con un el alelo dominante es el que se
número diploide (por oposición, 2n) de expresa.
cromosomas.
• Heterogamético (del griego heteros =
• Hemofilia (del otro): El sexo que posee
griego haima, haimatos = dos cromosomas sexuales diferentes,
sangre; philos = amigo): desorden como los machos en el caso humano y
genético humano recesivo, ligado al de la Drosophila.
sexo , resultante de la ausencia de
determinados factores que intervienen • Heteropolímero (del griego heteros =
en la coagulación de la sangre, otro, diferente; polys =
generalmente Factor VIII. muchos, meros = parte): Polímero
Los hemofílicos tienen dificultades en cuyas subunidades son diferentes.
la coagulación de su sangre.
• Heterótrofos (del griego heteros =
• Herbáceas (del latín herba = pasto): otro, diferente; trophe = nutrición, que
término utilizado para nombrar a las se alimenta de): Organismos que
plantas sin madera en el tronco (no obtienen sus alimentos rompiendo
leñosas), tienen un crecimiento moléculas orgánicas sintetizadas por
secundario mínimo. otros organismos para obtener
energía, opuesto a autótrofo.
• Herbicida: Sustancia que destruye o Incluyen a muchas bacterias, hongos y
inhibe el crecimiento de las plantas. animales.

• Herencia (del latín haerentia = cosas • Heteroxilo: leño de características


vinculadas): transmisión de diversas, heterogéneo.
características del/de los progenitor/es
a los hijos. • Hibridación "in situ" (del latín "en el
lugar"): El uso de sondas de ADN o
• Herencia ligada al sexo: Condición ARN para detectar la presencia de
en la cual la herencia de un cromosoma secuencias de ADN complementarias a
sexual se acopla con un determinado ellas, en bacterias clonadas o células
gen; p.ej.los casos de ceguera al color eucariotas cultivadas.
rojo (daltonismo) y hemofilia en
humanos. • Hibridación (del latín ibrida =
"producto de la cruza de dos animales
• Herencia poligénica: ocurre cuando diferentes"): El proceso de "juntar" dos
una característica es controlada por hebras complementarias de ADN o una
varios pares de genes, generalmente de ADN y otra de ARN para formar una
resulta en una variación continua de la molécula bicatenaria.
característica.
• Hidratos de carbono: Cumplen
• Heterocigoto (del griego heteros = funciones de almacenamiento
diferente) La presencia energético, estructurales e intervienen
de alelos diferentes en el en procesos de regulación y de
mismo locus de cromosomas reconocimiento.

142
Compuesto orgánico en el cual por mueve desde la de menor
cada átomo de carbono se encuentra concentración hacia la de mayor
hidrógeno y oxígeno en una proporción concentración.
2:1, p.
ej. • Histonas: Grupo de cinco proteínas
el azúcar. básicas asociadas con el ADN de
los eucariotas.
• Hidrocarburo: compuesto orgánico
formado solo por carbono e hidrógeno. • HIV (del ingles, VIH, en
castellano, Virus de
• Hidrófila: polinización efectuada por el la Inmunodeficiencia Humana).
agua. El retrovirus que ataca a las células T
del sistema inmunitario, destruyendo
• Hidrofílico (del latín hydro = las defensas y permitiendo el
agua, philios = amigo): Término desarrollo del síndrome de
aplicable a las moléculas polares que inmunodeficiencia adquirida (SIDA).
pueden formar puentes hidrógeno con
el agua. • "Homebox" genes: Corta secuencia
de nucleótidos virtualmente idéntica
• Hidrofóbico (del latín hydro = agua, en todos los genes de los organismos
del griego phobeo = "yo temo") que la contienen. Se la ha encontrado
Término aplicable a las moléculas en numerosos organismos, desde la
apolares que no pueden formar mosca de la fruta a los seres
puentes hidrógeno con el agua. humanos.
En la mosca de la fruta parecen
• Hidrólisis (del latín hydro = agua; del determinar los grupos particulares de
griego lysis = disolución): Ruptura de genes que se expresan durante el
una molécula por la adición de agua. desarrollo.

• Hidrosfera (del griego hydros =


agua): la parte de entorno físico que • Homeostasis (del griego homos =
consiste en toda el agua líquida y sólida mismo o similar, satis = estar): La
que se encuentra en la superficie capacidad de mantener relativamente
terrestre o cercana a ella. constante el medio interno.

• Hipótesis de Lyon: Propuesta por • Homocigoto (del griego homos =


Mary Lyon, sostiene que las hembras mismo o similar, sigan = par): Cuando
de los mamíferos inactivan uno u otro los dos alelos son iguales.
de suscromosomas X durante el
desarrollo del embrión.El cromosoma • Homología ( del griego homología =
inactivado forma el cuerpo de Barr. acuerdo): similaridades entre las
secuencias de ADN o proteínas entre
• Hipotónico (del hypo = individuos de la misma especie o entre
debajo; tonos = tensión: De dos especies diferentes.
soluciones, la de menor concentración
de solutos. Si se encuentran separadas • Homólogos: Un par de cromosomas
por una membrana que no deje pasar en cual un miembro del par tiene
el soluto (semipermeable) el agua se origen materno y el otro paterno; se

143
los encuentra en células diploides. desarrolla métodos para la búsqueda
rápida en bases de datos, analizar la
• Homoxilo: leño uniforme, información proveniente de las
homogéneo. secuencias de ADN y para predecir la
secuencia de las proteínas a partir de
• Hormona (del griego hormaein = la secuencia de ADN.
excitar): cualquier producto químico de
naturaleza orgánica producido en una
parte de un organismo que tiene como • Inserción (del latín insertare=
"blanco" otra parte del mismo. intercalar): Tipo de mutación en la cual
Sus funciones son reguladoras, se intercalan una o más bases
generalmente se producen en de ADN en una secuencia de bases de
pequeñas cantidades. ADN preexistente.
Esto produce un corrimiento del marco
• Hormona vegetal: Compuesto de lectura en el proceso de síntesis
orgánico que se sintetiza en alguna proteica dando, por lo general, como
parte de la planta y se transloca a otra resultado una proteína alterada.
parte, en donde a concentraciones
muy bajas causan una respuesta • Interfase: la parte más larga del ciclo
fisiológica. celular, ocurre antes de la mitosis o
meiosis; comprende a las
• Horquilla de replicación: La fases G1, S, G2.
estructura en forma de Y que se forma
en el punto donde se separan las • Intrón: La secuencia de bases de ADN
hebras del ADN al momento de que interrumpe la secuencia de un gen
la replicación y donde se sintetizan las que codifica para una proteína, esta
dos cadenas complementarias. secuencia se transcribe al ARNm pero
en un proceso de "corte y empalme" se
separa del mismo antes que el ARN
• Inversión: Alteración en un segmento
del cromosoma que tiene como
consecuencia que los genes queden
ordenados de manera inversa a la
I original.
• Idioblasto: célula que difiere Ocurre por una doble ruptura y giro de
marcadamente por su forma, tamaño 180 grados del segmento.
o contenido de las otras células del
mismo tejido. • "in vitro": del latín literalmente "en
vidrio", se usa para indicar
• Imperfectas: flores con un solo sexo, experimentos realizados fuera de un
femeninas o pistiladas y flores organismo vivo.
masculinas o estaminadas.
• Isodiamétrico: de forma regular, con
• Informática: El estudio de la todos los diámetros igualmente largos
aplicación de la computadora y • Isótopo (del griego isos =
técnicas estadísticas al manejo de la igual, topos = lugar): átomos con el
información. mismo número atómico pero con un
En el proyecto genoma la informática diferente número de neutrones; se los

144
nombra agregando el número de masa más próximos se encuentren los
al nombre del elemento, p.ej.carbono marcadores menores son las
12 o 12C; carbono 14 o14C. posibilidades que se separen durante
los procesos de división celular y por lo
tanto mayor la posibilidad de que se
J hereden juntos.
• Jurásico: Período que aconteció
• Lípidos (del griego lipos = grasa):
alrededor de la mitad de la era
Intervienen en el almacenamiento a
Mezosoica (ver Figura), hace unos 185
largo plazo de la energía celular,
- 135 millones de años.
aislamiento, forman parte de
Caracterizado por ser el momento del
estructuras (p.ej.membranas) y en
posible origen de las Angiospermas y
ciertos casos en funciones de control.
la continuación de la ruptura del
Este grupo incluye a las grasas,
supercontinente Pangea.
aceites, los esteroides (p.ej.
el colesterol), los fosfolípidos y los
carotenoides.Moléculas orgánicas no
polares insolubles en agua y soluble en
K solventes orgánicos (también no
• Kilobase (kb): Unidad de longitud del polares).
ADN equivalente a 1000 (1k)
nucleótidos.

M
L • Madera: la parte central del tallo
• Látex: emulsión acuosa de sustancias (compuesta de xilema) de las plantas
insolubles, resinas y caucho, con leñosas.
azúcares, gomas y alcaloides, que
circulan por tubos laticíferos en el • Magnetita: Las magnetitas fósiles se
cuerpo de algunas plantas. consideran de origen bacteriano.
Curiosamente cadenas de magnetizas
se encontraron en el meteorito
• Leño: (del latín, lignum: madera) marciano ALH84001 con un patrón
conjunto de elementos conductores semejante al de las bacterias
lignificados. Tejidos secundarios terrestres.
producidos por el cámbium hacia el
interior del mismo. • Mapa comosómico: Diagrama que
muestra las posiciones relativas en un
• Librería: una colección desordenada cromosoma de los loci de los genes,
de clones (por ejemplo ADN clonado de basado en la frecuencia en que
un organismo particular) cuyas heredan conjuntamente.Las distancias
interrelaciones pueden establecerse se miden en centimorgans (cM).
por mapeo físico.
• Mapa Físico: mapa de la localización
• Ligamiento (del inglés linkage): La de marcas identificables en el ADN (p.
proximidad de dos o más (genes) ej.genes, sitios de corte de enzimas de
marcadores en un cromosoma; cuanto restricción, bandas) que se
145
confecciona prescindiendo de los encuentra por encima de los 200
fenómenos hereditarios.Las distancias micrones.
se miden en pares de bases.En el
genoma humano el mapa físico de • Meiosis (del griego meio = menor;
menor resolución lo constituye los meiosis = reducción): División celular
patrones de bandeo de los 24 en la cual la copia de los cromosomas
cromosomas diferentes (22 es seguida por dos divisiones
autosómicos, el X y el Y).El de mayor nucleares.
resolución lo constituirá la secuencia Cada uno de los
completa de nucleótidos de los cuatro gametos resultantes recibe la
cromosomas. mitad del número de cromosomas
(número haploide) de la célula original.
• Mapeo genético: Determinación de la
posición relativa de los genes en la • Melanina (del griego melan= negro):
molécula de ADN (plásmido o pigmento que da color a la piel y
cromosoma) y las distancias (unidades protege a la capas subyacentes de la
de "unión") entre ellos. radiación ultravioleta.

• Marcador (del inglés marker; pob.del • Membranas: Capas delgadas


italiano marcare = "señalar una cosa constituídas principalmente por lípidos
para que se distinga de otra"): Una y proteínas, que separan las células de
posición física identificable en un su entorno.
cromosoma cuya herencia puede Existen membranas en el interior de
seguirse (p.ej.un gen o un sitio que las células que permiten la
corta una enzima de restricción).Los compartimentalización (p.
marcadores pueden ser una región del ej.
ADN que se expresa (gen) o un limitando las vacuolas y las
segmento de ADN que no se conoce organelas).
que codifica pero que se puede seguir
su manera de heredarse • Meristema: (del griego merizein =
(ver RFLP iniciales del dividir): tejido embrionario localizado
inglés RestrictionFragment Lenght Pol en las puntas de los tallos y de las
ymorphism). raíces y, ocasionalmente, a todo lo
largo de la planta; sus células se
• Materia: todo aquello que tiene masa y dividen por mitósis produciendo
ocupa un lugar en el espacio. nuevas células de las cuales surgen
nuevos tejidos.
• Megabase (Mb): Unidad de longitud
del ADN equivalente a 1.000.000 de • Meristema apical (del latín apex =
nucleótidos aproximadamente igual a 1 ápice): meristema (tejido embrionario)
cM. de la punta de tallo o la raíz,
responsable del incremento en largo de
• Megáspora (del griego megas = las plantas.
grande; sporo = semilla): Cuatro
células haploides producidas por • Meristemas laterales secundarios:
meiosis en el óvulo de la flor. tejidos que producen el crecimiento
Generalmente tres degeneran, y la secundario, son el cámbium y el
célula remanente se convierte en un felógeno.
gameto (n): ovocélula. Su tamaño se
146
• Mesófilo (del griego mesos = sinérgidas y el óvulo.
intermedio): referido a la temperatura Lugar común de entrada del tubo
de desarrollo bacteriano, entre 20 oC y polínico al óvulo.
42 oC.
Otros comportamientos en referencia • Microsporangios (del griego mikros =
la tempertura son: psicrófilo, por debajo pequeño, spora = semilla, sementera)
de 20 oC; termófilo: entre 40 y 70 oC; Estructura del esporófito que produce,
termófilos extremos: por encima de los pormeiosis, las microsporas.
70 oC; hipertermófilos: por encima de En las plantas con flores se conocen
80 y 100 oC. como sacos polínicos de la antera.

• Mesófilo: parénquima fotosintético • Micróspora (del griego mykros =


localizado entre las dos epidermis de la pequeño; sporo= semilla, sementera):
lámina de la hoja. cada una de las cuatro células
haploides producidas por división
• Mesofíticas: plantas que viven en una meiótica en los sacos de la antera de
ecología intermedia entre el medio las flores, se dividen por mitosis y se
seco y acuático. rodean de una pared gruesa para
formar los granos de polen.
• Metabolismo (del griego metabole = Esporas de tamaño pequeño, menor
cambio): El conjunto de reacciones de 200 micrones, producida por
químicas que se producen en las meiosis.
células vivas.La totalidad de las
reacciones químicas (intercambio de • Microtúbulos (del latín mikros =
energía) en un organismo. pequeño, tubus = caño, conducto)
Conducto hueco, estrecho y alargado
• Metabolito secundario: Compuestos de unos 25 nm de diámetro.
sintetizados por la planta que no se Se compone de dos subunidades de
necesitan para el crecimiento y proteínas que se alternan a lo largo del
desarrollo normal de las rutas mismo, y, entre otras funciones,
metabólicas comunes a todos los mueven a los cromosomas en la
vegetales. división celular y proporcionan la
estructura interna de cilias y flagelos.
• Microfilamento (del latín mikros =
pequeño, filum = hilo): varillas largas • Miembro de vaso: uno de los
de unos 5 a 7 nm de diámetro, componentes celulares de un vaso.
compuestas de actina que interviene
en el movimiento y la división celular. • Minerales: Elemento o compuesto
inorgánico que ocurre naturalmente.
• Micrón (del griego mikros = pequeño):
Unidad de medida, 1 u (micrón) = 10 - • Mitocondria (del griego mitos = hilo,
6 hebra; chondros = grano, terrón,
m.
cartílago): La usina celular. Organelas
• Micrópilo (del griego mykros = autorreplicantes, que se encuentran en
pequeño; pile = puerta): abertura el citoplasma de la célula eucariota
dejada por los tegumentos del óvulo, rodeadas por membrana, completan el
ubicada en dirección al final del saco proceso de consumo de la glucosa
embrionario donde se localizan las generando (por quimiósmosis) la
mayor parte del ATP que necesita la
147
célulapara sus funciones. • Monosacárido (del griego mono=
sencillo; del árabe súkkar = azúcar):
azúcar simple que no puede ser
• Mitosis (del griego mitos = hebra): La hidrolizado a moléculas de azúcar más
división del núcleo y del material pequeñas.
nuclear de una célula; se la divide
usualmente en cuatro etapas: profase, • Mosaico Fluido: Modelo de la
metafase, anafase, y telofase. La copia membrana plasmática ampliamente
de una célula. La mitosis ocurre aceptado en los que las proteínas (los
únicamente eneucariotas. El ADN de la "mosaicos") están embebidas en los
célula se duplica en la interfase y se lípidos (el "fluido").
distribuye durante las fases de la
mitosis en las dos células resultantes • Mureína: heteropolímero que forma el
de la división. esqueleto de la pared celular
bacteriana.
• Moleculas de ADN recombinante: El mismo, y las enzimas que
Combinación de moléculas de ADN de intervienen en su síntesis, son una
diferentes orígenes que se unen por característica general de todas las
medio de la tecnología del ADN eubacterias.
recombinante. Las arqueobacterias no poseen
mureína.
• Monocotiledóneas (del
griego monos = único, kotyledon = • Mutación (del latín mutare = cambiar):
hueco en forma de copa): Uno de los El cambio de un gen de una
dos tipos de plantas con flores; se forma alélica a otra, cambio que resulta
caracterizan por tener semillas con un heredable.
solo cotiledón, órganos florales
organizados en ciclos de tres y hojas • Mutante: Organismo que lleva un gen
con nervaduras paralelas; incluyen a que ha sufrido una mutación.
las hierbas, palmeras etc.

• Monohibridación (del latín mono =


uno; ibrida = "producto de la cruza de
dos animales diferentes"): En genética,
un cruzamiento de dos variedades
diferentes en el que está implicada una
N
sola característica. • Néctar: es un líquido azucarado
producido por estructuras llamadas
nectarios.
• Monoico: (del griego: mono:
Se ubican estratégicamente en la flor
uno, oikos: casa) planta con flores de
para que los insectos al tomarlo toquen
dos tipos: masculinas y femeninas.Ej.
los estambres y se lleven el polen de
maíz (Zea mays).
una flor a otra.
• Monómero (del griego monos =
• Nervaduras: Tejido vascular en las
solo, meros = parte) molécula pequeña
hojas, distribuido de manera reticulada
que se encuentra repetitivamente en
en dicotiledóneas y paralelas unas a
otra más grande (polímero).
otras en las monocotiledóneas.

148
• NIH: (National Institute of Health) proteica (ARN) y transferencia de
Instituto Nacional de la Salud de los energía, como nucleótidos simples
Estados Unidos ATP, GTP, UTP.
• Nomenclatura binomial: Sistema de .
clasificación ideado por Linneo a .
comienzos del siglo 18.Cada especie (fórmulas) o dobles NADH y NADPH
de planta o animal recibe un nombre (fórmulas).
compuesto de dos términos, el primero
corresponde al genero y el segundo a • Nudo (del griego nodus = nudo): La
la especie; p.ej.Homo sapiens, el región de la planta adonde se
leguaje utilizado es el latín. implantan una o más hojas.

• Núcleo (celular) La organela más • Número atómico: el número de


importante de la célula eucariota, se protones en el núcleo de un átomo.
encuentra rodeado por la membrana
nuclear y contiene la información • Nutrición (del latín nutritio: acción y
genética para la síntesis de la efecto de nutrir): Nutrir: del
estructura celular y el control de sus latín nutrire aumentar la sustancia viva
funciones. del organismo

• Núcleo del endosperma: célula


central del saco embrionario, cuyos O
dos núcleos haploides (n) se unen (2n) • Oligotróficos (del griego oligo =
antes de la fecundación. poco; trophe = nutrición, que se
Orgánulo celular limitado por una alimenta de): literalmente "poco
envoltura nuclear, en cuyo interior se alimento".
encuentra el ADN en forma de
cromatina organizada en • Orden: Subcategoría de clases
cromosomas, dependiendo de la fase
nuclear en que se encuentra. • Organelas (del griego organon =
Orgánulo capaz de dividirse por herramienta): Estructuras subcelulares
mitosis o meiosis, sitio de la que realizan determinadas funciones
información genética. (generalmente están rodeadas por
membranas y se las encuentra en las
• Nucléolo (del latín nucleolus = pepita células eucariotas) p.ej.: mitocondrias,
pequeña) Cuerpo redondeado u oval cloroplastos, núcleo.
que se observa en el núcleo de las
células eucariotas; consiste en bucles • Organos: grupo de células o tejidos
de cromatina que sirven de molde para que realizan una determinada función.
la producción de rARN (ácido
ribonucleico ribosomal). • Osmosis: (del griego osmos =
impulso) movimiento de las moléculas
• Nucleótidos : Los monómeros de los de agua a través de una membrana en
ácidos nucleicos, se componen de un respuesta a diferencias en la
fosfato, un azúcar y una base concentración de los solutos. El agua
nitrogenada (fórmulas). se mueve de áreas de alta
Los nucleótidos se encuentran concentración de agua/ baja
relacionados con el almacenamiento concentración de solutos a áreas de
de la información (ADN), síntesis
149
baja concentración de agua/alta protones y de los neutrones de un
concentración de solutos. Movimiento átomo. El peso atómico difiere
del agua a través de una barrera entre isótopos de un mismo elemento.
semipermeable, como la membrana
celular, desde un alto potencial de agua • Placas cribosas: Placas perforadas
a un bajo potencial de agua. que se encuentran en las paredes
terminales de los elementos cribosos y
que sirven para conectarlos entre
ellos.

• Plantas no vasculares: Plantas que


carecen tejido vascular lignificado
P (xilema), hojas vascularizadas y tienen
un estadio gametofítico que domina el
ciclo vital.
• Paleozoico (del griego palaios =
viejo): Período de tiempo geológico
que comienza unos 570 millones de • Plantas vasculares: Plantas
años atrás y culmina hace unos 245 contienen un tejido vascular lignificado
millones de años. Se divide en varios (xilema)
períodos (Figura).
• Plantas: eucariotas inmóviles,
• Parásitos: Organismos que viven multicelulares y autotróficos. Poseen
dentro o sobre otro organismo. Los celulosa en las paredes celulares y
parásitos se benefician de esta utilizan el almidón como sustancia de
asociación, perjudicando a su reserva. Sus pigmentos fotosintéticos
huésped. son la clorofila a y la b.

• Pared celular: estructura producida • Plásmido: ADN bicatenario circular y


por algunas células por fuera de autoreplicante, que se encuentra a
membrana celular, químicamente menudo en las células bacterianas. Se
compuesta por quitina lo utiliza como vector en tecnología del
(hongos), peptidoglicano mureína (bac ADN recombinante. Los plásmidos son
terias) o celulosa (plantas). de replicación autónoma y portan entre
2 y 30 genes. Algunos tienen la
capacidad para "entrar y salir" del
• Pared primaria: es la primera
cromosoma bacteriano.
membrana que desarrollan las células
jóvenes, en algunas es la única que
poseen toda su vida. Contiene • Plástido ( del griego plastos =
celulosa, hemicelulosa y alguna formado, modelado) En plantas,
pectina. organelas celulares rodeadas por
membranas que tienen funciones de
producción o almacenamiento de
• Pared secundaria: sigue a la pared
alimentos. Término aplicado a
primaria en orden de aparición. Consta
cualquier organela rodeada por doble
principalmente de celulosa, modificada
membrana. Los cloroplastos contienen
por la acumulación de lignina y otros
la maquinaria para la fotosíntesis, los
componentes.
amiloplastos almacenan almidón y los
cromoplastos contienen pigmentos
• Peso atómico: la suma del peso de los
fuertemente coloreados tales como los
150
encontrados en los pétalos de las deriva de una enfermedad genética:
flores, y la epidermis de los frutos. el RetinoBlastoma, donde su ausencia
está relacionada con el desarrollo del
• Pleiotropía (del griego pleios= tumor (hoy se sabe que esta
más; trope= girar): La capacidad de un relacionada con diferentes tumores).
gen para afectar varias
características fenotípicas diferentes. • Primera ley de la termodinámica (de
la conservación): La energía no se
• Polar (del latín polus = extremo de un crea ni se destruye, cambia de una
eje): Que tiene partes con propiedades forma a otra.
opuestas como cargas positivas y
negativas. • Procariota (del latín pro = antes, del
griego karyon = núcleo, nuez): Tipo de
• Polaridad: antagonismo entre la parte célula que carece de núcleo rodeado
superior e inferior del cuerpo del por membrana, posee un solo
vegetal. Se reconocen un polo caulinar cromosoma circular y ribosomas que
y uno radical. sedimentan a 70 S (los de los
eucariotas lo hacen a 80S). Carecen de
• Polimerasa (ADN o ARN): Enzimas organelas rodeadas por membranas.
que catalizan la síntesis de ácidos Se consideran las primeras formas de
nucléicos en base a templados vida sobre la Tierra, existen evidencias
preexistentes, utilizando que indican que ya existían hace unos
ribonucleótidos para el ARN y 3.500.000.000 años.
desoxirribonucleótidos para el ARN.
• Producto génico: El material
• Polímero (del griego polys = bioquímico, ya sea ARN o proteína,
muchos, meros = parte): Molécula resultante de la expresión de los genes.
compuesta por muchas subunidades La cantidad de producto génico se
idénticas o similares (monómero). utiliza para medir cuan activo es un
gen, cantidades anormales pueden
• Polimorfismo: Diferencia entre las correlacionarse con alelos que causan
secuencia de ADN entre individuos. enfermedades.

• Polinización: la transferencia • Promotor: Sitio del ADN donde se


del polen de pegará la ARN polimerasa para iniciar
la antera al estigma femenino. Trasla la transcripción.
do de los granos de polen al estigma en
una Dicotiledónea o a la micrópila del • Proteínas: (del griego proteios =
óvulo en una Gimnosperma. primario, del griego Proteo, dios
mitológico que adoptaba numerosas
• Poricida: abertura por poros, formas). Polímerosconstituidos por
comúnmente apicales de la anteras aminoácidos que intervienen en
para la salida del polen. Ej: numerosas funciones celulares. Una
Solanáceas. de las clases de macromoléculas
orgánicas que tienen funciones
• pRB: proteína que bloquea la estructurales y de control en los
transcripción de genes necesarios para sistemas vivientes. Las proteínas son
la proliferación celular. Su nombre polímeros de aminoácidos unidos por
uniones peptídicas.
151
• Puntuación simple: la pared
• Proteinoides: Polímeros de secundaria no se deposita en zonas de
aminoácidos formados la pared primaria, formando pequeños
espontáneamente a partir de canalículos.
moléculas orgánicas; tiene
propiedades parecidas a las enzimas y • Puntuación: depresión o cavidad en la
pueden por lo tanto catalizar pared celular donde la pared primaria
reacciones químicas. no está cubierta por pared secundaria.

• Protón: Partícula subatómica cargada


positivamente (+), que se encuentra en
el núcleo del átomo, tiene una masa
ligeramente inferior al neutrón. Los Q
elementos difieren por el número de
• Quiasma (del griego chiasma =
protones en sus átomos.
cruce): Unión entre dos cromosomas
• Protoplasma: materia viva
que se aparean en la meiosis y que da
propiamente dicha, incluye citoplasma
lugar a la recombinación genética.
y núcleo.
• Quimiolitoautótrofos (del
• Protozoarios: Protistos unicelulares,
griego lithos = piedra; autos =
agrupados por su método de
propio; trophe = nutrición, que se
locomoción.
alimenta de): un ejemplo singular lo
constituye una bacteria capaz de
• Proyecto Genoma Humano: Nombre
oxidar el ácido sulfhídrico (SH2) y
que abarca una serie de proyectos
transformar el anhídrido carbónico en
iniciados en 1986 por la DOE y
moléculas orgánicas utilizando la
apoyados, entre otros, por la NIH para
energía química de esta oxidación, vive
1) crear un registro de segmentos de
en simbiosis con un gusano: Riftia
ADN de localizaciones cromosómicas
pachyptilaen los medios hidrotermales
conocidas 2) Desarrollar
profundos.
métodos informáticos para analizar el
• Quimiósmosis: El proceso por el cual
mapa genético y los datos de las
se forma el ATP en la membrana
secuencias de ADN y 3) Desarrollar
interna de la mitocondria. El sistema
nuevas técnicas e instrumentos para
transportador de electrones transfiere
analizar y detectar ADN. Tema
protones del compartimiento interno al
ampliado.
externo; a medida que los protones
fluyen nuevamente hacia el
• Pseudopodos: del griego pseudes =
compartimiento interno la energía del
falso; podos = pié.
movimiento es usado para agregar
fosfato al ADP para formar ATP. Tema
• Punto R (R por restricción): fase tardía ampliado
de la G1 cuando las células detienen su
división.
• Quitina (del griego chiton = túnica): Es
el constituyente esencial de la pared
• Puntuación areolada: puntuación en celular de grandes grupos de hongos
la cual la pared secundaria se arquea (basidiomicetos, ascomicetos y
sobre la membrana de la puntuación. zigomicetos). La unidad de la quitina es
la N-acetilglucosamina estos
152
monómeros están unidos entre sí -igual rojo en presencia del ADN de la
que la glucosa en la celulosa- mediante muestra tratada; dicho color permite
uniones ß 1,4 glucosídicas. También visualizar, por microscopía óptica, su
forma el esqueleto externo de los localización en la muestra procesada.
artrópodos y otros grupos animales.
• Reacción en cadena de la
polimerasa (PCR, de las iniciales en
inglés Polimerase Chain Reaction):
Método deamplificación de una
secuencia de bases del ADN, ideado
por Mullis, usando una polimerasa
R termoestable y dos cebadores
("primers") de 20 bases de largo de la
• Radioactividad (del latín radius =
secuencia a ser amplificada, uno
rayo): Energía emitida por los núcleos
complementario de las secuencias final
inestables de
de la hebra (+) y otro de la otra
determinados isótopos (los así
secuencia final de la hebra (-). En razón
llamados "radioactivos") en forma de
que las nuevas cadenas de ADN
ondas o partículas.
sintetizadas pueden
subsecuentemente servir de moldes
• Radios medulares: bandas radiales
adicionales para la misma secuencia
de tejido parenquimático, formadas por
de cebadores, sucesivos "ciclos" de
el cámbium hacia el xilema y el floema
anillado de cebadores, alargamiento de
secundarios || R. uniseriado: radio de
la cadena y disociación del ADN
una sola célula de ancho. || R.
bicatenario formado producen
multiseriado: consta de varias células
rápidamente grandes cantidades de la
de espesor.
secuencia original (amplificación). La
PCR puede utilizarse para detectar una
• Rafidio: cristales en forma de aguja secuencia definida en una muestra de
compuestos de carbonato de calcio. ADN.
• Raíz (del latín radix = raíz): órgano, • Receptáculo: parte de la flor donde se
usualmente subterráneo, absorbe insertan los verticilos de la mismo.
nutrientes y agua, fija la planta a la Puede ser plano (girasol) o acopado
tierra. (rosa).
• Raíz adventicia: raíz que nace de • Recesivo: Término que se aplica a un
cualquier órgano adulto, no de la carácter (alelo) que solo
radícula embrional. se expresa cuando el segundo
carácter (alelo) es igual.
• Raíz primaria: originaria de la radícula
del embrión. • Recombinación: El proceso por el
cual se produce en la progenie una
• Reacción de Feulgen : Descripta por combinación de genes diferentes a los
Robert Feulgen, esta tinción se basa en de los padres. En los organismos
que, en determinadas condiciones superiores por el proceso de
experimentales (el ARN es eliminado entrecruzamiento (crossing over).
por hidrólisis ácida o enzimática), la
fucsina decolorada recobra su color • Región medular: (del latín medulla =
153
la parte más interna): en plantas, la • Retrovirus (del latín retro = girar hacia
parte central del tronco compuesta atrás): Virus que contienen una sola
esencialmente en tejido hebra de ARN como material genético,
parenquimatoso modificado para se reproducen copiando el ARN
almacenamiento. en ADN complementario usando
la transcriptasa reversa. La hebra de
• Reinos: En taxonomía, cinco grandes ADN es luego copiada y, el ADN
categorías bicatenario, es insertado en el ADN de
(Monera, Protista, Plantae, Fungi, Ani la célula huésped.
malia) en que se agrupan los
organismos, basándose en • RFLP: (del inglés restriction-fragment-
características comunes. Seis, si se length polymorphisms; polimorfismo
incluye el de las Archeobacterias. de longitud de los fragmentos de
restricción): Bajo esta sigla se
• Replicación ( del ¿latín? replere = reconoce las variaciones entre
rellenar): Proceso anterior a la división individuos de la longitud de los
celular por el cual se duplica el ADN. fragmentos de ADN cortados por
enzimas de restricción. Este hecho
• Replicación del ADN ( del latín generalmente es causado por
replere = rellenar): El uso de un ADN mutaciones en el sitio de corte.
existente como molde para la síntesis
de nuevas hebras de ADN. Proceso • Ribosomas: Pequeñas organelas,
que en eucariotas ocurre en el núcleo. compuestas de ARNr (r por
ribosómico) y proteínas. Están
• Replicar: producir una copia muy presentes en el citoplasma de
parecida (facsímil). procariotas (70s) y eucariotas (80s).
• Reproducción vegetativa (r. Son el sitio de la síntesis proteica. Esta
asexual): multiplicación propiamente compuesto de dos subunidades. Los
dicha, realizada sin fecundación. ribosomas de las organelas eucariotas
(mitocondrias y cloroplastos) tienen 70
• Resinas: producto secretado por los S, es decir son similares a los de los
vegetales con aspecto y propiedades procariotas.
análogas a los productos conocidos
vulgarmente con el mismo nombre. El • Rizomas (del griego rhizoma = masa
ámbar es una resina fósil. de raíces): un tallo horizontal que crece
a lo largo o debajo de la superficie,
• Retículo endoplásmico (abreviado puede intervenir en la reproducción
ER de la siglas en inglés, del vegetativa de la planta.
latín reticulum = red; del
griego endon = dentro; plasma"del
citoplasma") Compleja red
tridimensional de membranas que
divide el citoplasma de las células S
eucariotas en compartimentos y • S (por Svedberg, que la definió):
canales. Cuando esta recubierto de Unidad de velocidad de
ribosomas se denomina rugoso, caso sedimentación.
contrario liso.
• Saco embrionario: conjunto de 7
154
células formado a partir de una célula en las Angiospermas encerradas en el
haploide originada por meiosis. Se fruto.
encuentra en el interior del óvulo.
• Senescencia (del latín senectus =
• Secuencia complementaria: Secuen vejez) acción y efecto de envejecer.
cia de bases en una molécula de ADN
que puede formar una doble hebra • Sépalos: Hojas modificadas que
al aparear las bases de otra. Por protegen a los pétalos de las flores y a
ejemplo la secuencia complementaria las estructuras reproductivas. En
de G-T-A-C es C-A-T-G. general son verdes, pero en muchas
Monocotiledóneas tienen el mismo
• Secuencia conservada: Secuencia color que los pétalos.
de bases en una molécula de ADN (o
de aminoácidos en una proteína) que • Sephadex dextrano utilizado para
ha permanecido prácticamente intacta separaciones cromatográficas.
a lo largo de la evolución. Esencialmente se pueden describir
como esferas con numerosos
• Secuencia de bases: el orden de las "agujeros" en su superficie. Colocadas
bases de los nucleótidos en una como relleno de una columna de
molécula de ADN. cromatografía se produce el siguiente
efecto: las moléculas de tamaño menor
• Secuenciar: Determinación del orden que el "agujero" entran y salen de los
de los nucleótidos en el ADN o ARN o mismos a lo largo de su recorrido por la
el orden de los aminoácidos en las columna retrasándose en mayor o
proteínas. menor grado y permitiendo por lo tanto
su separación
• Segregación: separación de los
cromosomas durante la división • Sexual: Sistema de reproducción en el
celular. cual se fusionan dos células sexuales
(gametos) haploides para producir un
• Selección artificial: realizada por el cigoto diploide.
hombre, buscando caracteres
mediante cruzamientos planificados. • Simplasto (plasto como protoplasto)
en el sentido del conjunto de células
• Selección natural: proceso de vivas de las plantas atravesadas por
conservación y preponderancia de los plasmodesmos.
organismos mejor dotados para
defenderse de la competencia de sus • Síndrome de Down: Aquellos con el
semejantes en determinadas síndrome de Down sufren de retardo
condiciones. mental moderado o severo, cuerpo
bajo, macizo, cuello grueso y lengua
• Semillas: (del latín, diminutivo plural agrandada lo que dificulta la dicción.
de seminilla = semen; ¿ del Son propensos a infecciones y
mozárabe xemínio?) Embrión en enfermedades cardíacas y (en aquellos
estado latente, rodeado o no de tejido de mayor supervivencia), a desarrollar
nutricio y protegido por el episperma o la enfermedad de Alzheimer. El 95% de
cubierta seminal. En las los casos de Down son el resultados de
Gimnospermas se hallan desnudas y la no disyunción del cromosoma 21.

155
• Sinérgidas: Células en saco pasivos del protoplasto, tales
embrionario de las angiospermas que como almidón, glóbulos lipídicos,
flanquean la ovocélula. El tubo polínico cristales.
crece a través de una de ellas
(generalmente la más pequeña).

• Sistemas (del griego systema = lo que


se pone junto): conjunto de órganos T
que realizan funciones relacionadas.
• Tablero de Punnett: Diagrama que
permite calcular las posibilidades de
• Sitios de corte por enzimas de combinaciones en un
restricción: Una secuencia de bases entrecruzamiento.
específica en la molécula de ADN al
cual corta una particular enzima de
• Taxón: (del griego taxis = arreglo,
restricción. Algunos sitios se
poner orden) Término aplicado a un
encuentran frecuentemente en el ADN
grupo de organismos situado en una
(por ejemplo cada cientos de pares de
categoría de un nivel determinado en
bases) otro son mucho menos
un esquema de
frecuentes por ejemplo cada 10.000
clasificación taxonómica..
pares de bases.
• Somático (del griego soma = cuerpo):
• Tecnología del ADN
Relacionado al tejido no-gonadal de un
recombinante: Procedimientos
organismo.
utilizados para unir segmentos de ADN
en un sistema libre de células ("cell free
• Sonda (del francés sonde , system" es decir fuera de un organismo
abreviación del anglosajón sundline, o célula). Bajo condiciones adecuadas,
en su acepción de elemento una molécula de ADN recombinante
exploratorio): Molécula de ADN o ARN puede introducirse dentro de una célula
monocatenario con una secuencia de para ser replicado, ya sea
bases específica, marcada autónomamente o integrada al
radiactivamente o inmunológicamente, cromosoma celular.
que se utiliza para detectar secuencias
de bases complementarias
• Teicoicos (del griego teichos = muro):
por hibridación.
cadenas de moléculas de glicerina o
ribitol esterificadas entre sí por puentes
• Súber o corcho: tejido protector fosfato, portan una fuerte carga
compuesto de células muertas con negativa (probablemente sirvan para
paredes impregnadas con suberina y "secuestrar cationes" ). Se unen a la
formadas en dirección centrífuga por el mureína a través del fosfato formando
felógeno como parte de la peridermis. una amida.
• Suberina: Polímero ceroso • Tejidos (del latín texere = tejer ): en los
impermeable al agua que se encuentra organismos pluricelulares, grupo de
en algunas células de las plantas, células similares que realizan una
como las células endodérmicas de la determinada función. Grupo de células
raíz. organizadas como una unidad
estructural y funcional.
• Sustancias ergásticas: productos

156
• Teoría celular: Uno de los conceptos • Transgénico: organismo portador de
unificadores en biología. La teoría material genético perteneciente a
celular sostiene que todos los seres especies no emparentadas transferido
vivos están compuestos por lo menos a él mediante ingeniería genética.
por una célula y que la célula es la
unidad fundamental y funcional de los • Translocación: fenómeno por el cual
organismos. La composición química un fragmento de un cromosoma se
de la célula es fundamentalmente transfiere a un cromosoma no
similar; toda célula se origina de una homólogo.
célula preexistente por división celular.
• Teoría cromosómica de la herencia:
propuesta en1903 por Walter Sutton y • Transporte activo: Transporte de
Teodoro Boveri, sostiene que los moléculas contra un gradiente de
cromosomas son los componentes concentración (de regiones de baja
físicos que contienen los genes. concentración a regiones de alta
concentración) con ayuda de proteínas
• Terapia génica (del de la membrana celular y energía
griego therapeuo = "yo cuido"): proveniente del ATP.
Inserción de ADN normal en una célula
para corregir un defecto genético. • Transporte de electrones: 1) Una
serie de reacciones de
• Timina: Una de las oxidación/reducción en las cuales los
bases pirimidínicas del ADN, la timina electrones son pasados como "papas
es reemplazada por el uracilo en calientes" de una proteína/enzima
el ARN. ligada a membrana a otra hasta que
finalmente son cedidos al aceptor final,
• Traducción: 1) La síntesis de una generalmente oxígeno. Durante este
proteína sobre un "molde" de ARNm, proceso se forma ATP 2) serie de
consiste en tres etapas: iniciación, reacciones acopladas durante las
elongación y terminación. cuales se genera ATP a partir de la
energía generada por los electrones
• Transcriptasa reversa: Enzima que se mueven de un estado altamente
utilizada para su replicación por los reducido a otro de menor reducción.
retrovirus; copia • Transporte pasivo: Difusión a través
el ARN del retrovirus en una hebra de la membrana plasmática sin gasto
complementaria de ADN. energético por parte de la célula.

• Transducción (del latín trans = a • Traqueidas (del griego tracheia =


través; ducere = conducir): 1) la rugoso): células alargadas y ahusadas,
conversión de una señal en otra 2) relativamente angostas y con paredes
Transferencia de material genético de gruesas y punteadas sin perforaciones
una célula a otra por un virus. verdaderas. Forman el sistema de
• tubos del xilema y llevan agua y
• Transferencia horizontal de genes: solutos desde las raíces al resto de la
mecanismo por el cual se transmiten planta. Al madurar mueren,
genes individuales, o grupos de ellos, poseen lignina en sus paredes
de una especie a otra secundarias. Un elemento traqueal del
xilema que no tiene perforaciones, en
contraste con un miembro de vaso. Se
157
presenta tanto en el xilema primario expresiones fenotípicas distintas (ej.
como en el secundario. flores rojas o blancas).

• Tricomas: escrecencias de la • Vector de Clonación: (del


epidermis de los vegetales, latín vehere = transportar) Molécula de
unicelulares o pluricelulares, ADN originada en un virus, plásmido, o
glandulares o eglandulares. en la célula de un organismo superior
en el que se puede integrar otro
• Tritio (el griego tri = fragmento de ADN, sin que pierda la
tres): 3H, isótopo radioactivo del capacidad de autoreplicaciónde. Los
hidrógeno (2H), con una vida media de "vectores" introducen ADN extraño en
12,5 años. una célula huésped, donde puede
reproducirse en grandes cantidades.
Ejemplos: plásmidos, cósmidos y los
cromosomas artificiales de levadura. A
menudo los vectores son moléculas de
ADN recombinante que contienen
U secuencias de diferentes vectores.
• Uniformismo: movimiento que
• Vida Media: El tiempo requerido para
sostiene que los procesos geológicos
la desintegración de la mitad de la
que observamos en la actualidad (la
cantidad original de un
erosión del viento y la lluvia,
elemento radioactivo y su conversión
vulcanismo etc.) son los responsables
en un elemento más estable.
de todos los cambios geológicos
acontecidos en la historia de la Tierra,
• Viroides: Entidades "subviráles",
Charles Lyell decía "no estamos
formas infectantes de ácido nucleico
autorizados a recurrir a agentes
circular que no poseen cubierta
extraordinarios" para explicar los
proteica; moléculas de ARN sin
cambios que ocurrieron en la Tierra, "el
cubierta; ARN "desnudo",
presente es la clave del pasado".
posiblemente virus "degenerados", que
infectan plantas.

• Virus (del latín virus = veneno):


Agente infeccioso de
V naturaleza obligatoriamente
• Vacuolas (del latín vacuus = vacío): intracelular para sintetizar su material
espacio o cavidad citoplasmática, genético, ultramicroscópico y
rodeada por una membrana, que se ultrafiltrable. Constan de un ácido
observa en células animales y nucleico (ADN o ARN) y un
vegetales que remueven productos de recubrimiento proteico. Entidad no
desechos y almacenan alimentos celular, de muy pequeño tamaño. En
ingeridos. Parte de los compartimentos estado extracelular son inertes.
lisosómicos de la célula.
• Virusoides: ARNs satélites no
• Variación discontinua: ocurre cuando infectivos, presentes en el interior
los fenotipos de una característica del cápsido de ciertos virus,
controlada por un solo gen pueden ser replicándose exclusivamente junto a
clasificados claramente en dos su virus "colaborador".
158
una planta vascular.
• Vitamina (del latín vita = vida):
Sustancias orgánicas relacionadas que
no pueden ser sintetizadas por un • Xilema: tejido formado por el cámbium,
organismo en particular y son presenta vasos o traqueidas,
esenciales , en cantidades pequeñas, parénquima xilemático y fibras leñosas.
para su funcionamiento y crecimiento. Y
X
• Yema axilar: meristema ubicado en la
• Xilema secundario: tejido xilemático unión de la hoja con el tallo (axila),
formado por el cámbium vascular protegido por los primordios de hojas.
durante el crecimiento secundario en

159
BIBLIOGRAFÍA E INFOGRAFÍA

➢ Apuntes de Clase de Bioinformática. Ingeniería Telemática. Docente Marco


Regalia. Universidad Distrital Francisco José de Caldas. 2011.
➢ http://tecnologica.udistrital.edu.co/moodle/course/view.php?id=36
➢ http://www.um.es/molecula/anucl03.htm
➢ http://www.slideshare.net/munevarjuan/protein-folding-2105013
➢ http://www.cienciasaplicadas.buap.mx/convocatoria/memorias_2005/065.pdf
➢ http://folding.stanford.edu/Spanish/Science
➢ http://es.scribd.com/doc/2529983/Plegamiento-de-Proteinas
➢ http://www.sebbm.es/ES/divulgacion-ciencia-para-todos_10/chaperoninas-
plegamiento-mediante-aislamiento_522
➢ http://es.wikipedia.org/wiki/Alineamiento_estructural
➢ http://www.psicologia2000.com/es/enciclopedia-general-psicologia-on-line-wiki-
letra-a/21805-alineamiento-estructural.html
➢ http://aportes.educ.ar/biologia/nucleo-teorico/estado-del-arte/el-libro-de-la-vida-
el-adn/estructura_del_adn.php
➢ http://www.um.es/molecula/anucl02.htm
➢ http://www.xuletas.es/ficha/estructura-del-adn-y-arn/
➢ http://www.profesorenlinea.cl/Ciencias/ProteinasEstruct.htm
➢ http://milksci.unizar.es/bioquimica/temas/aminoacids/estructurprot.html
➢ http://www.aula21.net/Nutriweb/proteinas.htm#10
➢ http://www.slideshare.net/carmen42/presentacin-proteinas
➢ http://biologiadelacelula.files.wordpress.com/2008/04/senalizacion-celular.pdf
➢ http://www.marcoregalia.com/STUFF/UDISTRITAL/Bioinformatica/Actividades/R
esumenes%20Clases/alineamientoEstruct.html
➢ http://www.rcsb.org/pdb/home/home.do
➢ http://www.ncbi.nlm.nih.gov/
➢ http://www.ncbi.nlm.nih.gov/pubmed/12958260

160