Académique Documents
Professionnel Documents
Culture Documents
1. DEFINICION
1
En las bases de datos de los buscadores ¿Están todas las páginas
existentes en la web?
Por supuesto que no. La cantidad de páginas existentes es tan grande que
esto sería imposible. Los buscadores van incorporando las páginas que
encuentran con sus sistemas de rastreo. Además, cuando alguien coloca en
la red una página nueva, puede enviar los datos a distintos buscadores para
que éstos los incluyan en sus bases.
Si con cualquier buscador puedo realizar una búsqueda
indistintamente por palabras clave y por categorías, ¿dónde está la
diferencia?
En la forma de construir la base de datos y en su estructura. No olvidemos
que, en el caso de un índice, la base de datos relaciona temas con
direcciones, mientras que un motor relaciona palabras clave.
Si se realiza la misma búsqueda con un índice y con un motor, ¿cuál
de los dos me devolvería más resultados?
La base de datos de un motor siempre es más amplia que la de un índice, ya
que su método de rastreo (automatizado por una araña) le permite más
incorporaciones a la base que un método manual.
2
clasificadas por categorías ó temas y subcategorías en función de su contenido.
De este modo, la base de datos de un índice de búsqueda contiene una lista de
categorías y subcategorías relacionadas con un conjunto de direcciones de
páginas web que tratan esos temas.
3
3.1.1. LOS DIRECTORIOS O ÍNDICES TEMÁTICOS
Los directorios son listas de recursos organizados por categorías temáticas que se
estructuran jerárquicamente en un árbol de materias que permite visualizar los
recursos descendiendo desde los temas más generales situados en las ramas
superiores, a los temas más específicos situados en las ramas inferiores. Las
categorías ofrecen una lista de enlaces a las páginas que aparecen referenciadas
en el buscador. Cada enlace también ofrece una breve descripción de su contenido.
Así pues, los directorios o índices se estructuran por temas o categorías principales
que, a su vez, contienen otras subcategorías, y así sucesivamente hasta que al final
se ofrecen enlaces directos a otras páginas o recursos de Internet.
4
El Índice o Directorio permite acceder a los recursos referenciados por medio de 2
sistemas:
5
Sin embargo, la formación de un directorio presenta graves problemas ya que sólo
listan una pequeña parte de los documentos existentes y no suelen estar
actualizados. Además, la clasificación y categorización requieren una intervención
manual y en muchos casos, debido a la heterogeneidad de los temas tratados,
algunas páginas presentan problemas de categorización ya que los índices suelen
mantener su base de datos de forma manual.
a) METABUSCADORES
6
remitir la consulta a los motores. Una vez que reciben la respuesta, la remiten al
usuario no directamente, sino tras realizar un filtrado de los resultados.
Este filtrado consiste en eliminar y depurar los enlaces repetidos y en ordenar los
enlaces. Además, sólo aparecerá un número limitado de enlaces, los que se
consideren más importantes. Los más repetidos ocuparán los primeros puestos ya
que el metabuscador considerará que son los más relevantes por estar dados de
7
Un metabuscador es un verdadero programa que pueden actuar bien integrado en
la propia WWW como el caso de MetaCrawler o Buscopio, o bien como un
programa autónomo, como Copernic, una pequeña herramienta de software que se
instala en el ordenador y permite hacer búsquedas en varios buscadores a la vez.
Existen incluso metabuscadores especializados en determinadas materias: noticias,
bibliotecas, diccionarios, blogs, software, etc; otros que permiten búsquedas
multilingües, e incluso algunos permiten personalizar las búsquedas con los
buscadores elegidos.
Buscamultiple: http://www.buscamultiple.com/
8
ixquick: Busca simultáneamente en los motores de
búsqueda más comunes: Google, AltaVista, Yahoo, Ask
Jeeves, OpenDirectory, MSN, etc.
http://www.eu.ixquick.com/
Info.com: Busca separada o simultáneamente en
Google, Yahoo, MSN Ask Jeeves. http://www.info.com/
Mamma: Busca simultáneamente en varios buscadores.
http://www.mamma.com/
Motores de búsqueda
9
aquellos servidores que cambien más a menudo, como por ejemplo los de los
servicios de noticias.
Por el contrario, la ventaja de los Directorios frente a los motores radica en la mayor
precisión y un menor ruido, aunque son menos exhaustivos que los motores de
búsqueda, ya que se obtienen menos resultados.
Los motores de búsqueda no son otra cosa que enormes bases de datos generadas
como resultado de la indexación automática de documentos que han sido
analizados previamente en la Web. Recogen documentos en formato HTML y otro
tipo de recursos. Esta tarea la lleva a cabo un programa denominado crawler (robot)
que rastrea la red explorando todos los servidores, o limitándose a ciertos
servidores siguiendo un criterio temático, geográfico o idiomático.
10
Existen un gran número de motores de búsqueda y cada uno presenta diferencias
en cuanto al volumen de páginas indexadas, la interfaz, el lenguaje de consulta, el
algoritmo de cálculo de relevancia, etc. Todas ellas son causa de que, ante una
búsqueda, cada motor presente resultados diferentes.
11
la velocidad de respuesta (el tiempo que gasta en consultar el índice, aplicar
el algoritmo de respuesta y ofrecer los resultados)
12
Por ejemplo, si en el buscador Google tecleamos link:www.google.com nos mostrará
todas las páginas que apuntan a la página inicial de Google. Sin embargo, no es
posible combinar una búsqueda link: con una búsqueda de términos común.
Todas las palabras: esto permite recuperar los resultados que contengan
todas las palabras que se introducen en la caja de interrogación. Por
ejemplo, buscando "hipertexto documento historia" mediante Todas las
Palabras, se localizarán los resultados que incluyan todos los términos,
aunque estén separados: hipertexto y documento e historia.
Alguna de las palabras: permite recuperar los resultados que contienen
una de las palabras. Por ejemplo, la interrogación: "documento digital virtual"
devolvería los resultados que contuvieran alguna de estas tres palabras:
documento o digital o virtual.
La frase exacta: es la más adecuada para búsqueda por nombres propios y
expresiones que deben ser buscadas en el orden especificado. Para
introducirla se suelen utilizar comillas. Por ejemplo, la consulta: "historia del
hipertexto" localizaría los documentos que contuvieran dicha frase.
13
La búsqueda booleana: se trata de un tipo de interrogación que incluye
alguno de los operadores lógicos.
Así pues, los buscadores también permiten acotar las búsqueda por medio de la
introducción de una serie de operadores entre los que destacan:
14
orden en que aparezcan. En algunos buscadores se puede sustituir
por el símbolo “~” o utilizando corchetes “[ ]” para delimitar las
palabras clave que deben estar “cerca”.
o FAR: lo mismo que el anterior, pero para indicar lo contrario: lejos.
Se utiliza para localizar documentos en los que los términos de la
búsqueda aparecen con 10-25 palabras o más de distancia.
o ADJ: adyacente. Se utiliza cuando se quieren encontrar documentos
en los que aparezcan los términos juntos, sea en el orden que sea.
o BEFORE: es similar a AND, la única diferencia es que los términos
deben aparecer en el orden especificado, pero pueden encontrarse a
cualquier distancia en el mismo documento.
o FOLLOWED BY: igual que el anterior, pero en este caso las
palabras tendrán que aparecer en el mismo orden en que aparecen
en la cadena de búsqueda.
o PHRASE: este operador no se suele escribir como tal ya que es más
común utilizar comillas para obtener el mismo resultado. Lo que hace
es tratar las palabras clave como una frase, es decir, tal y como han
sido introducidas es como deben aparecer en los documentos que
devuelva el buscador. Es muy útil cuando se conoce parte del
contenido de un texto o para buscar por nombre y apellidos, entre
otros. Es el operador que más restringe las búsquedas, por lo que si
no se conocen los datos con exactitud es muy probable que se
obtenga sólo silencio por parte de la base de datos. Otra forma de
utilizar este operador, dependiendo del buscador que se haya
elegido, puede ser colocando el operador “ADJ” entre las palabras
que se quiere que aparezcan juntas o mediante el uso de guiones “-”
para unir las palabras.
Operadores de rango y comparación: suelen utilizarse en documentos
que contienen datos numéricos ya que especifican y fijan unos límites
(numéricos o alfabéticos) para el rango de búsqueda. Son operadores del
tipo:
o > "mayor que"
o < "menor que"
15
o = "igual que"
o <= "menor o igual que", etc.
Operadores de truncamiento (o de exactitud):
o SUBSTRINGS: ordena al buscador que trate las palabras clave como
cadenas de caracteres y no como palabras completas. Es decir, que
las palabras clave puedan aparecer como partes de otras palabras.
Así, si introducimos el término “sal” y seleccionamos esta opción, nos
devolverá aquellos documentos que contengan palabras como sal,
salero, salino, etc; pero también expresiones como salir, salón,
saludo, etc.
o COMPLETE WORDS: opción contraria a la anterior y que suele venir
por defecto en la mayoría de buscadores, pero en algunos hay que
incluir al final de cada palabra clave un punto “.” para dar a entender
al buscador que se trata de una palabra completa y no de una
cadena de caracteres.
El motor de búsqueda más usado es Google, aunque existen otros muchos como
AltaVista, Go.com (Infoseek), Gigablast, Exalead, etc. Muchos motores cuentan con
versiones en español, además de en inglés.
Por su parte, la ventaja de utilizar un índice está en que resulta muy fácil encontrar
la información deseada si ésta se encuentra en su base de datos. Se puede hacer
descendiendo a través de sus árboles temáticos, introduciéndose en las diferentes
subcategorías hasta dar con lo que se necesita, o introduciendo las palabras clave
adecuadas en el espacio que ofrecen para ello, tanto en la página principal como en
las diferentes categorías. El inconveniente radica en que no siempre están todo lo
actualizados que sería de desear y en que no contienen toda la información que sí
pueden ofrecer los motores de búsqueda. Los ejemplos más clásicos de índices
temáticos son nuevamente los de Yahoo, Altavista o Google, ya que estos tres
buscadores cuentan con índices temáticos, además de sus muy usados motores de
búsqueda.
4. TIPOS DE BUSCADORES
16
Hay que tener en cuenta que además de los buscadores generalistas, existen una
serie de buscadores que se han especializado en un campo o área concreta de
conocimiento y así, encontramos buscadores que se refieren al mundo del cine, los
libros, las bibliotecas, la música, los medios de comunicación o las noticias,
buscadores de personas y empresas que imitan las tradicionales páginas blancas o
amarillas impresas, etc; como también podemos encontrar numerosos buscadores
temáticos referidos a cualquier campo del conocimiento: documentación,
universidad, arte y literatura, ciencias puras o ciencias aplicadas, informática,
ecología, tecnología, educación y formación, legislación, política, administración,
trabajo, cultura, etc.
Por otro lado, también existen buscadores que se centran bien en una morfología
concreta (imagen, audio, vídeo y otros recursos audiovisuales como radio y
televisión), bien en determinados formatos como blogs, noticias o listas de
distribución, etc. o focalizan las búsquedas a determinados ámbitos como pueden
ser las revistas científicas, como hace el buscador Scopus que permite navegar por
toda la Web científica. Una lista exhaustiva de este tipo de buscadores
especializados se muestra en esta tesis en el apartado: Principales
buscadores/especializados, aunque los buscadores generalistas también permiten
acotar las búsquedas limitándose a una morfología o formato concretos.
Por ejemplo, Google cuenta con búsquedas especializadas para Imágenes, Grupos
(listas de distribución), Noticias, Blogs, Google Scholar (que muestra artículos,
revistas especializadas, tesis, tesinas, etc.), Libros, etc. y Yahoo hace lo propio con
búsquedas acotadas por Imágenes, Vídeos, Noticias, Páginas Amarillas, Compras,
Podcats, etc.
17
El siguiente ejemplo muestra uno de los principales buscadores útiles para
bibliotecarios, el que ofrece el Librarian' s Index to the Internet (lii.org). Tanto en este
ejemplo, como en el anterior, podemos ver que en la mayoría de los casos, los
índices temáticos se combinan con motores de búsqueda. En el buscador que
ofrece lii.org, vemos que el motor de búsqueda especializado destinado a
Bibliotecarios, se combina con un índice general.
18
concreta, ésta se irá acotando y mostrando las ramas dependientes. Por ejemplo, si
pinchamos sobre Europa en el directorio que muestra el mapa del mundo por
continentes, nos mostrará otro directorio representado por otro mapa sensible que
incluye los países europeos. Pinchando sobre un país concreto (por ejemplo,
España), se abre otro directorio a modo de mapa que incluye las principales
ciudades españolas; pinchando, por ejemplo, sobre Madrid aparecerán los recursos
que se refieren a esta ciudad por medio de otro directorio que muestra los hoteles,
transportes, plano de la ciudad, etc. Se trata de un procedimiento muy adecuado
para un sitio web sobre viajes.
Uno de los buscadores gráficos más conocidos es KartOO que ofrece una
representación gráfica de los resultados de las búsquedas en forma de mapa donde
se muestran tanto las páginas y su localización URL, como las relaciones que
existen entre ellas.
19
Y también existen los sistemas de búsqueda en 3D. La siguiente imagen es una
reproducción de la City of News ("Ciudad de las noticias"), un sistema de búsqueda
de información en 3D desarrollado por Flavia Sparacino en el Media Lab del MIT. La
representación visual está basada en la metáfora de una ciudad y el sistema permite
que varias personas la habiten en tiempo real por medio de ordenadores portátiles e
interfaces gestuales.
Atrás han quedado aquellos momentos en los que para buscar algo había que
recurrir a revistas, guías telefónicas físicas o recortes de periódicos antiguos. Los
más reticentes a la tecnología aún siguen usando alguno de esos métodos, pero la
mayoría de la población se ha volcado al excelente de internet.
Hemos visto varios tipos de buscadores ¿cual me conviene más utilizar al realizar
una búsqueda?
Depende del tipo de datos que se le pide. Si estamos buscando información sobre
un tema genérico, por ejemplo, sobre antropología en Aragón, sería mejor usar un
índice de búsqueda, ya que el contenido de las páginas que me ofrezca va a estar
muy relacionado con la categoría, es decir, con el tema de la búsqueda. Si el motivo
de la búsqueda es más concreto, por ejemplo, un autor ó un título de una obra, el
motor de búsqueda va a resultar más eficaz, ya que su base de datos es más
amplia.
20
claro el objetivo de qué es lo que queremos buscar. Veamos una lista de los
buscadores más populares de Internet.
21
Google
Nadie tiene dudas que se trata del mejor y más popular buscador que existe en la
internet. Fue creado en el año 1997 y más del 90% de los usuarios de la red utilizan
su servicio. Además de ser un motor de búsqueda, con el tiempo ha ido ampliando
sus servicios hasta convertirse en el líder absoluto
Foto © Bing
• Bing
Antes lo conocíamos con el nombre de Live Search. Es el buscador oficial de
Microsoft y se caracteriza por tener una imagen de fondo muy atractiva. Su
búsqueda se basa en el sistema Powerset2. Además de la búsqueda tradicional te
permite realizar una lista de búsquedas relacionadas y personalizarlas de acuerdo a
tus preferencias.
22
Foto © Yahoo
• Yahoo
Es sin dudas el competidor nato de Google. Durante muchos años, fue el líder en
búsquedas y poco a poco se fue haciendo conocido como un portal, en el que
además de buscar contenidos obtenías servicios de alta calidad como lo eran los
desaparecidos grupos, directorios, noticias, email y más. Creada en 1994, su motor
de búsqueda se caracteriza por brindar los resultados más ajustados y exactos a tus
intereses.
Foto © Ask
• Ask.com
También conocido como Ask Jeeves es un buscador que se caracteriza por la
respuesta a distintas preguntas. A simple vista parece un motor de búsqueda como
cualquier otro, sin embargo, intenta responder de forma sencilla aquellas preguntas
23
que pueden surgir a través de la búsqueda de la palabra clave que has realizado.
Interesante buscador para ampliar conocimientos insospechados
Foto © AOL
• Aol Search
Si bien su sistema de búsqueda y clasificación depende de la empresa Google, su
interface permite realizar búsquedas que contengan videos, fotografías, y sonidos
en tiempo real. Su principal fuerte es la búsqueda de noticias
Foto © Altavista
• Altavista
Fue el primer buscador completo en internet generando la primera gran base de
datos donde realizar búsquedas en la red. Actualmente fue comprado por Yahoo.
Ofrece servicios muy utilizados como traductor, filtro, páginas amarillas y buscador
de personas. Su plataforma es muy sencilla de utilizar y completamente intuitiva
desde todo punto de vista
24
Foto © Mywebsearch
• MyWebSearch
Depende también de Google, pero a diferencia de los demás, permite hacer un
enlace directo con redes sociales como Facebook, Twitter, Linkedin y enviar la
búsqueda que realicemos por correo electrónico al instante. Tiene un plugging de
búsqueda muy utilizado en el navegador Firefox. Hay que cuidar los datos que se
colocan en las redes sociales, sobretodo porque búsquedas que no quieres pueden
ser publicadas en la red social.
Foto © Chacha
• Chacha
Es a día de hoy el buscador que más se diferencia de Google gracias a su sistema
de “búsqueda inteligente”. Además de utilizar las típicas búsquedas sistemáticas,
Chacha, se basa en incluir la inteligencia humana para que los resultados arrojados
sean acordes a lo que queremos. Con un grupo humano completo, estas personas
llamadas “asesores de búsquedas”, ayudan al usuario, por un precio muy bajo, a
obtener lo que busca sin tener que leer publicidades ni pasar por tantas páginas con
información innecesaria. El método de ponerse en contacto con los asesores es
variado, tal como su precio. Su filosofía es la productividad, en estos momentos
donde nuestro tiempo vale oro
25
4.1.2. VENTANA PRINCIPAL DE CADA TIPO DE
BUSCADOR
26