Vous êtes sur la page 1sur 10

Qu es bioinformtica?

varios tipos de informacin El desarrollo de nuevos algoritmos (frmulas matemticas) y estadsticos con los cuales Bioinformtica es una disciplina cientfica emergente que utiliza tecnologa de la se pueda relacionar partes de un conjunto enorme de datos, como por ejemplo mtodos informacin para organizar, analizar y distribuir informacin biolgica con la finalidad de para localizar un gen dentro de una secuencia, predecir estructura o funcin de protenas y responder preguntas complejas en biologa. Bioinformtica es un rea de investigacin poder agrupar secuencias de protenas en familias relacionadas." multidisciplinaria, la cual puede ser ampliamente definida como la interface entre dos ciencias: Biologa y Computacin y esta impulsada por la incgnita del genoma humano La Medicina molecular y la Biotecnologa constituyen dos reas prioritarias cientfico y la promesa de una nueva era en la cual la investigacin genmica puede ayudar tecnolgicas como desarrollo e Innovacin Tecnolgica. El desarrollo en ambas reas dramticamente a mejorar la condicin y calidad de vida humana. estn estrechamente relacionadas. En ambas reas se pretende potenciar la investigacin Avances en la deteccin y tratamiento de enfermedades y la produccin de alimentos genmica y postgenmica as como de la bioinformtica, herramienta imprescindible para genticamente modificados son entre otros ejemplos de los beneficios mencionados ms el desarrollo de estasDebido al extraordinario avance de la gentica molecular y la frecuentemente. Involucra la solucin de problemas complejos usando herramientas de genmica, la Medicina Molecular se constituye como arma estratgica del bienestar sistemas y computacin. Tambin incluye la coleccin, organizacin, almacenamiento y social del futuro inmediato. Se pretende potenciar la aplicacin de las nuevas tecnologas recuperacin de la informacin biolgica que se encuentra en base de datos. y de los avances genticos para el beneficio de la salud. Dentro de las actividades Segn la definicin del Centro Nacional para la Informacin Biotecnolgica "National Center forBiotechnologyInformation" (NCBI por sus siglas en Ingls, 2001): "Bioinformtica es un campo de la ciencia en el cual confluyen varias disciplinas tales como: biologa, computacin y tecnologa de la informacin. El fin ltimo de este campo es facilitar el descubrimiento de nuevas ideas biolgicas as como crear perspectivas globales a partir de las cuales se puedan discernir principios unificadores en biologa. Al comienzo de la "revolucin genmica", el concepto de bioinformtica se refera slo a la creacin y mantenimiento de base de datos donde se almacena informacin biolgica, tales como secuencias de nucletidos y aminocidos. El desarrollo de este tipo de base de datos no solamente significaba el diseo de la misma sino tambin el desarrollo de interfaces complejas donde los investigadores pudieran acceder los datos existentes y suministrar o revisar datos Luego toda esa informacin deba ser combinada para formar una idea lgica de las actividades celulares normales, de tal manera que los investigadores pudieran estudiar cmo estas actividades se vean alteradas en estados de una enfermedad. De all viene el surgimiento del campo de la bioinformtica y ahora el campo ms popular es el anlisis e interpretacin de varios tipos de datos, incluyendo secuencias de nucletidos y aminocidos, dominios de protenas y estructura de protenas. El proceso de analizar e interpretar los datos es conocido como biocomputacin. Dentro de la bioinformtica y la biocomputacin existen otras sub-disciplinas importantes: El desarrollo e implementacin de herramientas que permitan el acceso, uso y manejo de financiables, existen acciones estratgicas, de infraestructura, centros de competencia y grandes instalaciones cientficas. En esta rea, la dotacin de infraestructura se plasmar en la creacin y dotacin de unidades de referencia tecnolgica y centros de suministro comn, como Centros de Bioinformtica, que cubran las necesidades de la investigacin en Medicina Molecular. En cuanto a centros de competencia, se crearn centros de investigacin de excelencia en hospitales en los que se acercar la investigacin bsica a la clnica, as como centros distribuidos en red para el apoyo a la secuenciacin, DNA microarrays y DNA chips, bioinformtica, en coordinacin con la red de centros de investigacin genmica y protemica que se proponen en el rea de Biotecnologa. En esta rea la genmica y protemica se fundamenta como accin estratgica o instrumento bsico de focalizacin de las actuaciones futuras. Las tecnologas de la informacin jugarn un papel fundamental en la aplicacin de los desarrollos tecnolgicos en el campo de la gentica a la prctica mdica como refleja la presencia de la Bioinformtica mdica y la Telemedicina dentro de las principales lneas en patologa molecular. La aplicacin de los conocimientos en gentica molecular y las nuevas tecnologas son necesarios para el mantenimiento de la competitividad del sistema sanitario no slo paliativo sino preventivo. La identificacin de las causas moleculares de las enfermedades junto con el desarrollo de la industria biotecnolgica en general y de la farmacutica en particular permitirn el desarrollo de mejores mtodos d e diagnstico, la identificacin de dianas teraputicas y desarrollo de frmacos personalizados y una mejor medicina preventiva

Bioinformtica: una nueva rea de oportunidad Eugenio Jacobo Hernndez Valdelamar Fundacin Arturo Rosenblueth. Insurgentes Sur 670-3. Colonia del Valle. CP 03100. Mxico, D.F., Mxico jack@mail.rosenblueth.mx jack_hv@yahoo.com Resumen. Este artculo presenta los conceptos fundamentales relativos a la bioinformtica con el fin de difundir y enfatizar la importancia del desarrollo en esta rea. Palabras clave: biocomputacin, bioinformtica, vida artificial, biologa molecular, biotecnologa. 1. Qu es la bioinformtica? La bioinformtica es el campo de la ciencia en donde la biologa, las ciencias de la computacin y las tecnologas de la informacin (TI) se unen para formar una sola disciplina. Este campo interdisciplinario comprende la investigacin y desarrollo de herramientas tiles para llegar a entender el flujo de informacin desde los genes a las estructuras moleculares, a su funcin bioqumica, a su conducta biolgica y, finalmente, a su influencia en las enfermedades y caractersticas agronmicas Una definicin generalmente aceptada es: Una disciplina cientfica que se interesa por todos los aspectos relacionados con la adquisicin, almacenamiento, procesamiento, distribucin, anlisis e interpretacin de informacin biolgica, mediante la aplicacin de tcnicas y herramientas de las matemticas, de la biologa y de la informtica, con el propsito de comprender el significado biolgico de una gran variedad de datos. 2. Orgenes y desarrollo

Desde la propuesta de Wienner, los trabajos de Rosenblueth, Pitts, etc., siempre ha existido una gran influencia de los modelos biolgicos aplicados a las computadoras o sus aplicaciones, por ejemplo: La inteligencia artificial (IA) toma muchas cosas sobre el funcionamiento del cerebro. La vida artificial (VA) lleva los comportamientos de los animales a modelos de cmputo. Hay tcnicas de optimizacin basadas en el procesamiento de informacin a nivel de genes (algoritmos genticos) Histricamente, el uso de las computadoras para resolver cuestiones biolgicas comenz con el desarrollo de algoritmos y su aplicacin en el entendimiento de las interacciones de los procesos biolgicos y las relaciones filogenticas entre diversos organismos. El incremento exponencial en la cantidad de secuencias disponibles, as como la complejidad de las tcnicas que emplean las computadoras para la adquisicin y anlisis de datos, han servido para la expansin de la bioinformtica. El reto en la construccin de bases de datos es el establecimiento de una arquitectura que permita la realizacin de bsquedas inteligentes, comunicacin con otras bases de datos y la unin con herramientas de anlisis y minera de datos especficas que permitan dar respuesta a problemas biolgicos concretos. Los cientficos que se encarguen de la construccin de esas bases de datos deben tener unos conocimientos previos que les permitan determinar qu problemas cientficos concretos necesitan una resolucin y cul o cules mtodos son los mejores para resolverlos. La bioinformtica comprende tres especialidades: La investigacin y desarrollo de la infraestructura y sistemas de informacin y comunicaciones que requiere la biologa moderna. (Redes y bases de datos para el genoma, estaciones de trabajo para procesamiento de imgenes). Bioinformtica en sentido estricto. La computacin que se aplica al entendimiento de cuestiones biolgicas

bsicas, mediante el modelado y simulacin como sistemas de vida artificial, algoritmos genticos, redes de neuronas artificiales (biologa molecular computacional). El desarrollo y utilizacin de sistemas computacionales basados en modelos y materiales biolgicos. (biochips, biosensores, computacin basada en ADN). Los computadores basados en DNA se estn empleando para la secuenciacin masiva y el anlisis de diversas enfermedades, explotando su caracterstica de procesamiento paralelo implcito (biocomputacin). 3. Conceptos y tcnicas principales Para entender el trabajo que se hace en bioinformtica es necesario conocer algunos trminos. Un genoma es el conjunto de los genes que caracterizan a una especie. Los genes(agrupados en cromosomas) estn hechos de ADN, una molcula que puede considerarse un largsimo rosario en el que cada cuenta es un compuesto qumico llamadobase o nucletido. Hay cuatro tipos de bases: A para la adenina, la T para la timina, la G para la guanina y la C para la citosina, y stas son las letras qumicas con las que se escribe el lenguaje de la vida. La informacin gentica est contenida en el orden exacto (o secuencia) de las bases a lo largo del ADN, al igual que la informacin literaria est contenida en el orden de las letras a lo largo de un texto. La combinacin o la secuencia de las letras determinan el cdigo gentico de la clula. "Secuenciar" significa determinar el orden de las bases. El genoma humano mide cerca de 3.000 millones de bases: de ah la dificultad de describirlo. El genoma no es ms que el libro de instrucciones generales; quienes realizan el trabajo de verdad son las protenas. El conjunto de todas las protenas que intervienen en los procesos biolgicos de una especie es lo que se conoce como proteomade esa especie, y el objetivo que se plantea ahora es llegar a determinar la composicin,

estructura y funciones de todas y cada una de ellas. La bioinformtica se ocupa de la aplicacin de la computacin a secuencias biolgicas, tales como ADN o protenas. No hay que confundirla con otras aplicaciones de la computacin en el mbito de la salud, como la informtica mdica y la telemedicina. El principal proceso que se realiza en bioinformtica es el anlisis de secuencias, el cul consiste en "tratar de encontrar algo" relativo a una secuencia de un aminocido o un nucletido empleando tcnicas de biologa in silico. Este algo puede ser: aprender lo que hace una secuencia de ADN confirmar que la clonacin de un gen ha sido exitosa saber si un gusano tiene una protena similar a los humanos Fig. 1. Bioinformtica: estructuras biolgicas, datos, procesamiento y aplicaciones El anlisis puede consistir de tareas como: extraer una secuencia de un gen buscar una secuencia en un gen o protena Las tecnologas de la informacin y las comunicaciones ayudan a recolectar, organizar y distribuir informacin sobre el genoma humano, para emplearse en su anlisis y en aplicaciones. Bsicamente, los sistemas informticos se emplean en este campo para: Adquisicin de datos Software para visualizacin Programas para control de reactivos, geles y otros materiales Generacin y ensamblaje de secuencias Anlisis de datos Programas para anlisis de secuencias Prediccin de estructura de protenas Paquetes de integracin y ensamblaje de mapas genticos Software para clasificacin y comparacin Tcnicas de Inteligencia Artificial Gestin de datos Bases de datos locales o accesibles mediante redes de comunicaciones. Distribucin de datos

Redes de comunicaciones 4. Sistemas bioinformticos Las computadoras se usan de varias formas en la biologa moderna: Recolectan y procesan seales detectadas por equipos de laboratorio (p.ej. secuenciadores de ADN, espectrgrafos). Supervisan muestras y administran experimentos en laboratorios industriales. Almacenan datos en bases de datos pblicas y proveen acceso a dichas bases por medio de buscadores u otros mecanismos. Extraen patrones y reglas de grandes colecciones de datos y usan los patrones observados para caracterizar y predecir caractersticas en nuevas muestras de datos Anotacin: uso de mtodos de cmputo automatizados para asignar significado a los datos y crear ligas de informacin entre colecciones de datos diferentes. Simulacin: la informacin conocida sobre un sistema, que junto con modelos matemticos o fisicoqumicos, se usa para simular propiedades del sistema (p.ej. simulacin de interacciones entre protenas, flujos y rutas bioqumicas). Existen 3 recursos fundamentales que se requieren para la investigacin bioinformtica: almacenamiento de datos, recursos de cmputo y ancho de banda. La administracin del volumen de datos requiere de una infraestructura significativa de hardware y software. Laboratorios Centros de investigacin Fuentes pblicas Fuentes privadas Sistemas fuente Procesamiento de datos DW DM DMDM OLAP/Minera de datos

Servidor Web Clientes Aplicacin Fig. 2. Aproximacin de la arquitectura de los sistemas bioinformticos En ese sentido, en la figura 2 se presenta un esquema con la aproximacin de una arquitectura genrica de un sistema bioinformtica (aunque hay otras propuestas en desarrollo), donde los principales componentes son: los sistemas de origen, que son los repositorios de informacin que se crean a partir de la investigacin en laboratorios e institutos; estos recursos pueden ser pblicos (GenBank, ProDom, TIGR, RegulonDB, AceDB) o privados (Celera). los sistemas de procesamiento de datos, entre los que destacan los datawarehouse, encargados de concentrar y modelar la informacin para luego creardatamarts de contexto especfico. Ya que se tiene la informacin en una presentacin ms adecuada puede procederse a explotarla con herramientas OLAP, de minera de datos o aplicaciones propietarias. los sistemas de explotacin (cliente), que pueden ser navegadores de Internet o clientes propietarios que se comunican con un servidor para procesar informacin especfica. En el caso de los sistemas de explotacin, muchas tareas comunes en el trabajo con secuencias de ADN y protenas, por ejemplo su lectura, alineamiento, manejo de bases de datos, etc., son realizadas por medio de programas comerciales, por ejemplo BLAST, FASTA, GCG. Adicionalmente existen proyectos ms orientados a desarrolladores donde se proveen frameworks para el desarrollo de aplicaciones bioinformticas (p.ej. BioJava, BioLisp, BioPerl, BioCORBA, BioXML, BSML) 5. Bioinformtica en Mxico Esta disciplina se est desarrollando en nuestro pas de manera discreta, pero se est trabajando. Algunas de las instituciones que estn desarrollando trabajos en esta rea son: Centro investigacin sobre la fijacin del nitrgeno, con su programa de investigacin en genmica computacional (http://www.cifn.unam.mx/) y en

colaboracin con Red Europea de Biologa Molecular desarrollan el Nodo Nacional de Bioinformtica EMBnet Mxico (http://embnet.cifn.unam.mx/) Instituto de Biotecnologa y el Instituto de Qumica de la UNAM (http://www.ibt.unam.mx/) Departamento de Biotecnologa, UAM-Iztapalapa (http://www.iztapalapa.uam.mx/iztapala.www/division.cbs/biotecnolo/) Unidad Profesional Interdisciplinaria de Biotecnologa (http://www.upibi.ipn.mx/) ITESM, con su programa de Verano de Investigacin (http://w3.mor.itesm.mx/~esucar/veraniegos.html) UAEM, con su especialidad en biologa molecular el su licenciatura (http://www.fc.uaem.mx) 6. Conclusiones La cultura bioinformtica es necesaria para: los expertos que trabajan en esta rea (bilogos, qumicos, computlogos e informticos) los estudiantes de carreras de biologa, computacin e informtica. Inclusive es viable crear programas para formar especialistas "hbridos" (otros pases lo estn haciendo) el pblico en general, usuario de los resultados de las investigaciones Adems las oportunidades de investigacin y desarrollo para los profesionales de la informtica y computacin en esta rea son muchas. Entre ellas destacara: Desarrollo de laboratorios virtuales Desarrollo de tcnicas y herramientas de procesamiento y visualizacin Desarrollo de plataformas de cmputo para el procesamiento masivo de datos e informacin. Desarrollo de una legislacin en el rea para los derechos de propiedad intelectual, licenciamiento, regulacin y desarrollo de productos. Por ltimo, debe tomarse en cuenta que desarrollar recursos humano en esta disciplina es estratgico si queremos contar con tecnologa y desarrollos propios. En ese sentido las principales habilidades y conocimientos que un profesional en bioinformtica debe desarrollar son:

Comprensin del mtodo cientfico. Comprensin de los fundamentos de la biologa molecular Manejo de computadoras, ambientes operativos Conocimiento de lenguajes y tcnicas de programacin Establecer mtodos para anlisis y fragmentacin de secuencias (de informacin biolgica), ensamblado de mapas y prediccin y extraccin de caractersticas de secuencias. Establecer mtodos para el anlisis y simulacin de estructuras moleculares Soporte de cmputo a laboratorios de biologa Diseo, implementacin e integracin de bases de datos biolgicas. Algoritmos y mtodos de bioinformtica (p.ej. redes neuronales, programacin dinmica, etc.)

En un contexto amplio, la Bioinformtica est involucrada en los procesos de capturar, almacenar, analizar, exhibir en forma grfica, modelar y finalmente distribuir la informacin biolgica. A partir de los avances de la informtica, se produce un cambio de los paradigmas de la biologa. Esencialmente los seres vivos hoy son comprendidos en tanto sistemas o secuencias de nucletidos en la secuencia de ADN, es decir, datos que permiten determinar caractersticas de los seres vivos y, en este sentido, las ciencias biolgicas se asemejan mucho ms a una lgica informtica que como se entendan originalmente.

Hasta ahora, la primera etapa aplicada a las ciencias era la observacin. A partir de ella el planteo de la hiptesis y luego el planteo de modelos experimentales que intentasen probar o rechazar esas hiptesis. En la actualidad, muchas de esas hiptesis son primero ensayadas desde un punto de vista estadstico, mediante la simulacin informtica. Eso permite que cuando se pase a la parte de experimentacin ya se hayan descartado muchas variables por su baja probabilidad de ocurrencia. Ejemplo: diseo de frmacos o de drogas, diseo de vectores o vehculos para suministrar una determinada medicacin, una determinada terapia. Mucha de la fase experimental se ve ahorrada porque se realizan a nivel de ensayos.

Citemos un ejemplo: Argentina es uno de los pases de mayor produccin y exportacin de especies genticamente modificadas (EGM). Si adems de producirlas, se estudiara el desarrollo de nuevas EGM teniendo en cuenta variables de especies autctonas o nuestra biodiversidad, se provocara un cambio estratgico de nuestro pas en relacin con estas nuevas tecnologas. De hecho, el gobierno nacional defini a comienzos de 2004, carreras universitarias prioritarias que forman profesionales demandados por los sectores ms dinmicos de la economa, entre los que se pueden mencionar las industrias de base biotecnolgica y de software y servicios informticos. Perfil de los lic.en Bioinformtica

Aplicaciones El rea de aplicaciones bioinformticas requiere de profesionales con una Donde primero se comprendi el impacto de la Bioinformtica fue en la industria farmacutica, que la usa para el desarrollo de nuevos frmacos a partir de la deteccin de potenciales dianas. No obstante, se prev que esta disciplina tambin ser clave en otras reas mdicas como la epidemiologa, la gentica, la investigacin clnica y la toma de decisiones en salud, a travs de tecnologas como los biochips o tambin llamada biologa in silico. sta ltima supone la obtencin de conocimiento mediante consideraciones tericas, simulaciones y experimentos llevados a cabo sobre la tecnologa basada en el silicio de un ordenador. Adems de estos campos, la Bioinformtica cobra un rol protagnico en los estudios de sistemtica, ecologa, agroecologa y evolucin. En general, los cuadros profesionales de organismos estatales y empresas privadas de la regin no pueden cubrir aspectos relacionados con nuevas tecnologas bioinformticas: ya que la formacin de los profesionales informticos est orientada hacia los sistemas administrativos, mientras que la formacin de los bilogos, bioqumicos, biotecnlogos, etc. est orientada hacia aspectos antomofuncionales y clnicos de los seres vivos. Los licenciados en Bioinformtica, egresados de la Facultad de Ingeniera de la Universidad Nacional de Entre Ros, comprendern y resolvern perfectamente los formacin de base adecuada en ingeniera de software, complementada con un conocimiento bsico de biologa molecular y celular, bioqumica y biotecnologa.

problemas que plantea la biologa y tambin avanzarn sobre los desafos que propone la programacin. Historia En lo que sigue, y adems de los hechos relevantes directamente relacionados con el desarrollo de la bioinformtica, se mencionarn algunos hitos cientficos y tecnolgicos que servirn para poner en un contexto adecuado tal desarrollo. Arrancaremos esta breve historia en la dcada de los 50 del pasado siglo XX, aos en los que Watson y Crick proponen la estructura de doble hlice del ADN (1953),20 se secuencia la primera protena (insulina bovina) por F. Sanger (1955),21 o se construye el primer circuito integrado por Jack Kilby en los laboratorios de Texas Instruments (1958).22 [editar]Las primeras dcadas: aos 60 y 70 del siglo XX En los aos 60, L. Pauling elabora su teora sobre evolucin molecular (1962),23 y Margaret Dayhoff, una de las pioneras de la bioinformtica, publica el primero de los Atlas of ProteinSequences (1965), que tendr continuidad en aos posteriores, se convertir en una obra bsica en el desarrollo estadstico, algunos aos ms tarde, de las matrices de sustitucinPAM, y ser precursor de las actuales bases de datos de protenas.24 En el rea de la tecnologa de computadores, se presentan en el ARPA (AdvancedResearchProjects Agency, agencia de proyectos de investigacin avanzados) los protocolos de conmutacin de paquetes de datos sobre redes de ordenadores (1968), que permitirn enlazar poco despus varios ordenadores de diferentes universidades en EE.UU.:25 haba nacido ARPANET (1969), embrin de lo que posteriormente ser Internet. En 1970 se publica el algoritmo Needleman-Wunsch para alineamiento de secuencias;26 se establece el BrookhavenProtein Data Bank (1971), 27 se crea la primera molcula de ADN recombinante (Paul Berg, 1972), 28E. M. Southern desarrolla la tcnica Southernblot de localizacin de secuencias especficas de ADN (1976), 29 comienza la secuenciacin de ADN y el desarrollo de software

para analizarlo (F. Sanger, software de R. Staden, 1977), 3031 y se publica en 1978 la primera secuencia de genes completa de un organismo, el fago -X174 (5.386 pares de bases que codifican 9 protenas). 32 En mbitos tecnolgicos vinculados, en estos aos se asiste al nacimiento del correo electrnico (RayTomlinson, BBN, 1971),33 al desarrollo de Ethernet (protocolo de comunicaciones que facilitar la interconexin de ordenadores, principalmente en redes de mbito local) por Robert Metcalfe (1973),34 y al desarrollo del protocolo TCP (Transmission Control Protocol, protocolo de control de transmisin) por VintonCerf y Robert Kahn (1974), uno de los protocolos bsicos para Internet. 35 [editar]Aos 80 En la dcada de los 80 se asiste, en diversas reas, a importantes avances: Niveles de estructura de las protenas. En los primeros ochenta se publica cmo investigar la estructura terciaria mediante RMN; en la siguiente dcada se desarrollarn mtodos para predecir de novo algunas estructuras secundarias. y Cientficos: tras la secuenciacin del fago -X174 a finales de la dcada de los 70, en 1982 F. Sanger consigue la secuenciacin del genoma del fago (fago lambda) utilizando una nueva tcnica, la secuenciacin shotgun (secuenciacin por perdigonada), desarrollada por l mismo;36 tambin entre 1981 y 1982 K. Wthrich publica el mtodo de utilizacin de la RMN (Resonancia Magntica Nuclear) para determinar estructuras de protenas;37Ford Doolittle trabaja con el concepto de secuencia motivo (similitudes supervivientes, segn las denomina en el resumen de su artculo) en 1981;38 el descubrimiento en 1983 de la PCR (PolymeraseChainReaction, reaccin en cadena de la polimerasa) lleva a la multiplicacin de muestras de ADN, lo que permitir su anlisis; 39 en 1987, D. T. Burke et al. describen el uso de cromosomas artificiales de levadura (YAC, Yeast Artificial Chromosome), 40 y Kulesh et al. sientan las bases de los chips de ADN.41 Bioinformticos: por lo que se refiere al desarrollo de algoritmos, mtodos y programas, aparece el algoritmo Smith-Waterman (1981), 42 el

algoritmo de bsqueda en bases de datos de secuencias (Wilbur-Lipman, 1983),43 FASTP/FASTN (bsqueda rpida de similitudes entre secuencias, 1985), 44 el algoritmo FASTA para comparacin de secuencias (Pearson y Lipman, 1988),45 y comienzan a utilizarse modelos ocultos de Mrkov para analizar patrones y composicin de las secuencias (Churchill, 1989),46 lo que permitir ms adelante localizar genes47 y predecir estructuras proticas;48 aparecen importantes bases de datos biolgicas (GenBank en 1982, Swiss-Prot en 1986), 4950 redes que las interconectan (EMBnet en 1988), 51 y se potencian o se crean diferentes organismos e instituciones (EMBL se constituye en 1974 pero se desarrolla durante la dcada de los 80, NCBI en 1988);5253 tambin en estos aos empieza a estudiarse la viabilidad de la Human GenomeInitiative (First Santa Fe Conference, 1985), que ser anunciada un ao despus por el DoE (Department of Energy, departamento de energa del gobierno de los EE.UU.) y que pondr en marcha proyectos piloto para desarrollar recursos y tecnologas crticas; en 1987 el NIH (NationalInstitutes of Health, institutos nacionales de la salud de EE.UU.) comienza aportar fondos a proyectos genoma, mientras que en 1988 arranca la Human GenomeInitiative, ms conocida finalmente como Human Genome Project (Proyecto Genoma Humano).5414 y Tecnolgicos: 1983 ver la aparicin del estndar Compact Disc (CD) en su versin para ser ledo por un ordenador (Yellow Book);55 Jon Postel y Paul Mockapetris desarrollan en 1984 el sistema de nombres de dominio DNS, necesario para un direccionamiento correcto y gil en Internet;56 en 1987Larry Wall desarrolla el lenguaje de programacinPERL, de amplio uso posterior en bioinformtica;57 y a finales de la dcada se vern las primeras compaas privadas importantes con actividades vinculadas al genoma, protenas, bioqumica, etc. (GeneticsComputerGroup GCG, Oxford Molecular Group, Ltd.), y que, en general, experimentarn importantes transformaciones aos ms tarde.58

Cientficos: en 1991 comienza la secuenciacin con EST (ExpressedSequenceTags, marcaje de secuencias expresadas);59 al ao siguiente es publicado el mapa de ligamiento gentico (en baja resolucin) del genoma humano completo;60 en 1995 se consigue secuenciar completamente los primeros genomas de bacterias (Haemophilusinfluenzae, Mycoplasmagenitalium, de 1,8 millones de pares de bases -Mbps- y 0,58 Mbps, respectivamente);6162 en 1996, y en diferentes pasos (por cromosoma), se hace lo propio con el primer genoma eucariota, el de la levadura (Saccharomycescerevisiae, con 12 Mbps),63 as como en 1997 con el genoma de Escherichiacoli (4,7 Mbps),64 en 1998 con el primer genoma de un organismo multicelular (97 Mbp del Caenorhabditiselegans), 65 para terminar la dcada con el primer cromosoma humano (el 22) completamente secuenciado en 1999 (33,4 Mbps).66 Bioinformticos: bsqueda rpida de similitudes entre secuencias con BLAST (1990);67 base de datos de huellas de protenas PRINTS, de Attwood y Beck (1994);68ClustalW, orientado al alineamiento mltiple de secuencias, en 1994,69 y PSI-BLAST en 1997;70 a finales de la dcada se desarrolla T-Coffee, que se publica en 2000.71 Por lo que se refiere a actividades institucionales y nuevos organismos, tenemos la presentacin por parte del DoE y NIH al Congreso de los EE.UU., en 1990, de un plan de esfuerzos conjuntos en el Human Genome Project para cinco aos;72 se crean el Sanger Centre (Hinxton, UK, 1993; ahora SangerInstitute) y el EuropeanBioinformaticsInstitute (EBI, Hinxton, UK, 1992-1995).7374 Tecnolgicos: Tim Berners-Lee inventa la World Wide Web (1990) mediante aplicacin de protocolos de red que explotan las caractersticas del hipertexto;75 en 1991 aparecen los protocolos definitivos de Internet (CERN)76 y la primera versin del sistema operativo Linux,77 muy utilizado posteriormente en aplicaciones cientficas; en 1998Craig Venter funda Celera, compaa que perfeccionar la secuenciacin por perdigonada de F. Sanger y analizar los resultados con software propio.78

Aos 90 En los aos 90 asistimos a los siguientes eventos:

Primeros aos del siglo XXI

A destacar que en los aos 2000 estn culminando mltiples proyectos de secuenciacin de genomas de diferentes organismos: en 2000 se publican, entre otros, el genoma de Arabidopsisthaliana (100 Mb)79 y el de Drosophila melanogaster (180 Mbp).80 Tras un borrador operativo de la secuencia de ADN del genoma humano del ao 2000,81 en 2001 aparece publicado el genoma humano (3 Gbp).82 Poco despus, en 2003, y con dos aos de adelanto sobre lo previsto, se completa el Human Genome Project. 83 Por mencionar algunos de los genomas analizados en los aos siguientes, anotaremos que en 2004 aparece el borrador del genoma de Rattusnorvegicus (rata), 84 en 2005 el del chimpanc,85 en 2006 el del macaco rhesus,86 en 2007 el del gato domstico,87 y en 2008 se secuencia por primera vez el genoma de una mujer.88 Gracias al desarrollo de las tcnicas adecuadas, asistimos actualmente a un aluvin de secuenciaciones de genomas de todo tipo de organismos. En 2003 se funda en Espaa el Instituto Nacional de Bioinformtica,89 soportado por la Fundacin Genoma Espaa (fundada, a su vez, un ao antes y que pretende constituirse en instrumento del estado para potenciar la investigacin en este campo).90 En 2004, la estadounidense FDA (Food and DrugAdministration, agencia para la administracin de alimentos y frmacos) autoriza el uso de un chip de ADN por primera vez.91 En 2005 se completa el proyecto HapMap (catalogacin de variaciones genticas en el ser humano).92 En 2008UniProt presenta el primer borrador del proteoma completo del ser humano, con ms de veinte mil entradas. 93

Vous aimerez peut-être aussi