< 1990: Sistemas de bsqueda de archivo no Web: Archie 1990: Nace la Web 1994: Web Crawler 1995: Alta vista, Excite, Info seek 2001: Llegada de Google (Page Rank) 2004: Yahoo! Buscador, Clusty, MSN Search 2005: Windows Live
Los buscadores, o motores de bsqueda, son sistemas de informacin documental que permiten realizar consultas y recuperar informacin contenida en la Web. Hoy da estas aplicaciones se han convertido en la principal herramienta para acceder a los contenidos de la Web. Buscadores vs. Directorios Existen dos formas bsicas de obtener informacin en la web: La Navegacin Directorios La Interrogacin Motores de bsqueda Creacin: Directorios: creados y mantenidos mediante esfuerzo intelectual. Buscadores: bsqueda de forma automtica mediante programas informticos Resultados: Sitios web (Directorios) vs. Pginas web y documentos (Buscadores) Funciones de un motor de bsqueda 1. Acceder a sitios web, localizar y descargar documentos. 2. Extraer el contenido textual (y multimedia) de los documentos descargados. 3. Analizar e indexar el contenido de los documentos para construir los ndices del motor. 4. Realizar el anlisis de enlaces de cada pgina y otorgar alguna medida de popularidad. 5. Permitir la formulacin de consultas mediante palabras clave. 6. Facilitar el acceso a los resultados de una consulta ordenndolos conforme a unos criterios de relevancia COMPONENTES DE UN MOTOR DE BSQUEDA Un motor de bsqueda consta de un conjunto de programas que trabajan cooperativamente. Son: Rastreador del motor de bsqueda o Spider. 1.-Un spider (araa) o un crawler (rastreador) es un programa que explora la Web de forma sistemtica con dos objetivos principales: Interactuar con los servidores de sitios web para descargar pginas web u otros documentos y Obtener nuevas direcciones (URL) para aadir a su lista de enlaces pendientes de revisar. Las expresiones crawler , spider y robot (en este contexto) son equivalentes.
Sistema de recuperacin de informacin: ndices directos ndices invertidos Interfaz: Formulario de consulta Pgina de resultados Software de relevancia. Su funcin es la ordenacin de los resultados, es decir, la construccin del ranking de resultados en funcin de unos criterios de relevancia. Algunos de ellos son: Enlaces: enlaces de entrada y URL. Contenido/Propiedades de la pgina: frecuencia / ubicacin / formato de las palabras clave, etc. Resultados pagados y Resultados no pagados.
PRINCIPALES BUSCADORES GENERALISTAS Existen cientos de buscadores que compiten entre s para atraer a los usuarios. No obstante, slo cuatro concentran la mayora de las bsquedas. Estos son: Google ( http://www.google.es/ ) Yahoo! ( http://es.yahoo.com/ ) bing ( http://www.bing.com/ ) Ask.com ( http://es.ask.com/ )
Buscadores especializados
Los buscadores generalistas constituyen hoy la mejor opcin ante bsquedas sencillas y fcilmente formulables . No obstante, estas herramientas ofrecen resultados poco satisfactorios cuando tratamos de encontrar informacin muy especializada. Un buscador especializado (BE) es aquel que limita su mbito de bsqueda a un dominio concreto, con el objetivo de proporcionar a sus usuarios acceso a los contenidos de calidad que sobre su rea de especializacin hay en la web. Buscadores para usos acadmicos 1. Los buscadores especializados 2. Buscadores acadmicos 3. Buscadores de libros 4. Buscadores de imgenes 5. Buscadores de informes 6. Buscadores de noticias 7. Buscadores de blogs 8. Otros buscadores de internet. LOS DIFERENTES TIPOS DE BUSCADORES Los buscadores de tipo directorio, estn estructurados en forma de rboles de informacin (al estilo del ndice analtico de un libro), donde grandes clasificaciones genricas se van dividiendo en otras ms especficas. El ser clasificado dentro de estos grandes ndices hace necesaria una solicitud activa por parte de los propietarios del sitio web. A este esquema de funcionamiento responden Ya hoo y Ol (el buscador hispano ms conocido http://www.ole.es). El proceso de seleccin y clasificacin de las distintas solicitudes influa directamente en la calidad del ndice y en su grado de respuesta ante una peticin de informacin. El otro gran tipo de buscador, el motor de bsqueda, esta basado en la bsqueda de informacin a travs de la red y su almacenamiento en grandes bases de datos. Esta clasificacin se archiva y procesa gracias a potentes bases de datos de tipo documental. El sistema de bsqueda selecciona una serie de palabras a lo largo del texto, aunque son tambin importantes los meta tags - palabras claves, seleccionadas por los autores de las pginas, y utilizadas por estos motores de bsqueda para realizar sus clasificaciones. Este es el esquema de funcionamiento de Alta vista (http://www.altavista.com), y, en espaa, de Alta vista Magallanes, http://www.altavista.magallanes.net. Se conocen tambin como buscadores de tipo araa, y almacenan datos sobre un porcentaje mucho mayor de pginas de los alrededor de 100 millones de sitios web que se calcula estn disponibles en todo el planeta.