Vous êtes sur la page 1sur 11

OPERADORES BOOLEANOS

Se utilizan para combinar palabras e identificar conceptos en los


documentos. Los operadores de concepto que puede utilizar son los
que describen a continuacin:
AND (y): selecciona los documentos que contienen todas las palabras
especificadas.
OR(o): selecciona los documentos que contiene por lo menos una de
las palabras especificadas. Es til cuando el primer criterio de
bsqueda arroja pocos resultados.
NOT (no): excluye de la bsqueda los documentos que contengan la
palabra o frase especificada. Solo puede utilizarse en combinacin con
los operadores AND y OR.

OPERADORES DE TRUNCAMIENTO
Truncar implica cortar una palabra al principio, final o en medio con la
ayuda de un smbolo como el * y la?, entre otros, mismo que
reemplaza una o varias letras y /o caracteres as se recuperan
documentos que tengan las variantes del trmino, es una forma fcil
de buscar las palabras derivadas de una raz, til cuando no se tiene
certeza de cmo se escribe una palabra o para plurales y singulares.
Se sugiere que al truncar palabras no queden con menos de cuatro
palabras ya que se corre el riesgo de recuperar informacin irrelevante
con el truncamiento se evita teclear los trminos disminuyendo el
margen de error en la sintaxis de la estrategia.

METABUSCADORES
Un meta buscador es un buscador de buscadores. Una potente
herramienta que realiza rastreos por diferentes bases de datos
proporcionando una combinacin de los mejores resultados.
Comnmente se les denomina robots, araas o gusanos crawlers.
A la hora de utilizar los meta buscadores hay que tener en cuenta las
diferentes estrategias de bsqueda que tiene cada buscador. Muchas
veces el orden de los resultados no tiene en cuenta la relevancia y los

muestra segn otros los criterios como la coincidencia de palabras


claves, velocidad de carga de la pgina o temtica..
Si tenemos en cuenta que cada buscador solo es capaz de rastrear una
bsqueda entre el 15% de las pginas web que existen en la red,
utilizar un meta buscador supone realizar una bsqueda ms
exhaustiva.
A continuacin hablamos de algunos de los meta buscadores ms
utilizados.
El Buscn es la plataforma de recursos electrnicos de
la Biblioteca Nacional que permite el acceso a los recursos
electrnicos suscritos por la Biblioteca Nacional, as como
seleccionar estos recursos por materias o tipologas.
Ixquick es el "buscador ms confidencial del mundo" ya que
proporciona una navegacin annima que no deja rastro de
direcciones IP, ni cookies, ni guarda datos personales...Desde
que comenz a funcionar ha proporcionado 1.200 millones de
bsquedas.
Kartoo es un meta buscador de informacin que devuelve
los resultados de la bsqueda en forma de mapas. Segn la
relevancia de los sitios encontrados aparecen esferas ms o
menos grandes. Adems se pueden realizar bsquedas
avanzadas por temas que se pueden ir ajustando dependiendo
los criterios de bsqueda.
Metacrawler es un meta buscador que ofrece los resultados de
las bsquedas de cada buscador utilizado clasificados por
columnas. Es una buena forma de diferenciar los resultados.
Google, Yahoo!, Bing o Ask son algunos de los motores de
bsqueda de los que extrae resultados.
Turbo10 permite una bsqueda en diez buscadores, que el
usuario selecciona previamente. Existe un listado de 1.700
buscadores especializados.
Dogpile es un meta buscador simple y rpido que utiliza
motores de bsqueda como About, Ask.com, FinWhat, Bing,
Google, LookSmart o MSN Search. Permite bsquedas de
informacin, imgenes y vdeos.
Mamma devuelve informacin sobre noticias, imgenes, video
e incluso rastrea en Twitter
Copernic adems de un meta buscador es un programa meta
buscador cuyo software se instala en el ordenador. Existe una
versin gratuita y otra de pago. Entre sus ventajas ms
relevantes se encuentra el filtrado y la ordenacin de los
resultados, los criterios de pertinencia propios, posibilidad de
salvar y recuperar bsquedas para actualizar resultados...

LOS TESAUROS
Un tesauro es un vocabulario controlado y estructurado
formalmente, formado por trminos que guardan entre s relaciones
semnticas y genricas: de equivalencia, jerrquicas y asociativas.
Se trata de un instrumento de control terminolgico que permite
convertir el lenguaje natural de los documentos en un lenguaje
controlado, ya que representa, de manera unvoca, el contenido de
estos, con el fin de servir tanto para la indizacin, como para
la recuperacion de los documentos. define un tesauro como "un
vocabulario controlado y dinmico, compuesto por trminos que
tienen entre ellos relaciones semnticas y genricas y que se aplica
a un dominio particular del conocimiento". Por su parte, Georges van
Slype en los lenguajes de indizacion, define un tesauro como "una
lista estructurada de conceptos destinados a representar de manera
unvoca el contenido de los documentos y de las consultas dentro de
un sistema documental determinado y a ayudar al usuario en la
indizacin de los documentos y de las consultas".
Frente a los lenguajes clasificatorios cuya funcin es de escribir el
tema de un documento, los trminos contenidos en un tesauro
responden al anlisis del texto o materia. Un tesauro recoge todos
los conceptos y no slo los que corresponden al ttulo o el texto. Un
nico tema (aquello de lo que trata el documento) suele
desarrollarse mediante una serie de ideas o conceptos que se
pueden describir por medio de una serie de trminos
o descriptores. El tesauro incorporar todos esos trminos en
una base de datos y cada uno de ellos se convertir en un punto de
acceso para la recuperacin del documento. La potencia de un
tesauro radica adems, en la posibilidad de combinar todos esos
trminos o descriptores, lo que le convierte en un lenguaje
combinatorio
mucho
ms
rico
que
los
tradicionales
encabezamientos de materias. Un tesauro es pues, una herramienta
de control terminolgico muy til para el anlisis, descripcin y
recuperacin automatizados.
La estructura de un tesauro se basa en los siguientes elementos:

Unidades lxicas: que pueden comportar las siguientes


categoras: grupos de descriptores que agrupan los trminos de
indizacin bien por campos (temas), bien por clases de trminos
(facetas).
o

descriptores: trminos permitidos. Un descriptor es una


palabra o conjunto de palabras del lenguaje corriente que
responden a un concepto. Esto es, los descriptores son
trminos o unidades lingsticas que expresan conceptos.
Un concepto se expresa con un nico trmino y ese
trmino responde a un nico concepto. Dicho trmino ser

utilizado para el anlisis y la recuperacin del documento.

trminos simples o unitrminos: se emplean


cuando el concepto es claro en s mismo, sin
necesidad de aadir ninguna otra palabra, o cuando
se usa como genrico de trminos ms concretos o
especficos. Ejemplo: Documentos.

trminos compuestos: la mayora de los trminos


de un tesauro adquieren su verdadero sentido
cuando se convierten en trminos compuestos, ya
que as se logra una mayor especificidad. La
estructura sintctica de los trminos compuestos
suele ser la siguiente:

sustantivo + adjetivo: Documentos digitales

sustantivo
+
sintagma
preposicional: Documentos de archivo

sustantivo
+
sintagma
oposicional: Documentos RDF/XML

no descriptores: trminos

prohibidos. Al elegir un nico trmino para eliminar la


sinonimia del lenguaje natural, se rechazan los trminos
restantes, que sern los no descriptores.

Relaciones semnticas: son todas aquellas relaciones que se


establecen entre los trminos de un tesauro. Podemos distinguir
las siguientes:
o

relaciones de equivalencia: se derivan de la gran


proximidad fontica o smica entre los descriptores y no
descriptores (sinnimos, cuasi-sinnimos, etc). Este tipo de
relaciones se suelen representar mediante el trmino USE
(relacin entre el trmino no preferente y el trmino
preferente, o trmino a usar ms aceptado) y las siglas UP
(Usado por), que en ingls son USE y UF. Ejemplo: Dicta
blanda GOBIERNO
BERENGUER. USEGOBIERNO
BERENGUER U.P (Usado por) Dicta blanda

relaciones jerrquicas: son relaciones asimtricas,


establecidas entre los descriptores, en la que un trmino
es superior o genrico de otro. Esta estructura clasificatoria
distingue al tesauro de las listas alfabticas de materias o
palabras clave, as como de diccionarios y lxicos. De esta
forma se crean campos conceptuales que clasifican los
trminos y los agrupan en un campo delimitado de
significados o facetas que se van agrupando en disciplinas
y sub-disciplinas. Para la presentacin de las relaciones

jerrquicas se suelen utilizar determinadas siglas como


T.G. (Trmino Genrico) y T.E. (Trmino Especfico); o por
sus siglas en ingls, BT (Broad Term o trmino ms amplio),
NT (Narrow Term o trmino ms especfico), SY (sinnimo),
RT (trmino relacionado), etc. Si un descriptor tiene un slo
descriptor por encima de l es mono jerrquico, si tiene
dos o ms es poli jerrquico. Las relaciones jerrquicas
pueden ser de dos tipos:

Relaciones gnero-especie: se aplica a acciones,


propiedades y agentes. (T.G. Armas/T.E. Armas
blancas)

Relaciones parte-todo: el nombre de una parte


implica y evoca la del todo poseedor. Se aplica a
objetos, lugares, disciplinas y sus partes de estudio,
estructuras sociales, etc. (T.G. Guerra/T.E. Guerra de
Irak)

relaciones asociativas: son las relaciones asimtricas


establecidas entre descriptores de distintas familias,
distintas a las jerrquicas o de equivalencia, y que
designan conceptos capaces de evocar mutuamente, por
asociacin de ideas, relaciones entre ellos. Este tipo de
relacin se suele representar mediante las siglas T.R.
(Trmino Relacionado) o en ingls RT (Related Term). La
mayora de las relaciones asociativas se establecen entre
trminos que comparten un lexema comn (por ejemplo,
POLTICA. T.R. POLTICOS) o que mantienen unas relaciones
de hiperonimia o hipo nimia (CARGOS MUNICIPALES. T.R.
ADMINISTRACIN LOCAL). Tambin podemos aadir Notas
de Alcance (N.A.) con el fin de ofrecer una explicacin o
descripcin del significado del trmino.

Atendiendo a diferentes aspectos, los tesauros pueden ser de


diferentes tipos, entre los que cabe destacar los siguientes:

Tesauro facetado: se trata de un tesauro que combina una


clasificacin facetada sistemtica, con un tesauro alfabtico que
reemplaza al ndice de la clasificacin.

Tesauro monolinge: es el que contiene descriptores en una


nica lengua.

Tesauro multilinge: contiene descriptores en ms de una


lengua.

Macrotesauro: se trata de un tesauro que incluye algunos


descriptores bsicos comunes y los propios de su campo o
especialidad.

En cuanto a su estructura, se pueden establecer 3 tipos de tesauros:

Tesauro lineal: presenta los descriptores de forma simple, sin


conexiones.

Tesauro en forma de rbol: se construye siguiendo una


jerarqua en forma de rbol. Cada descriptor posee un descriptor
genrico y varios descriptores con los que se relaciona de forma
de forma ascendente o descendente.

Tesauro reticular: tesauro construido en forma de red en el


cual los descriptores se entrecruzan. Cada descriptor puede
tener varios descriptores genricos y varios descriptores
especficos

En cuando a su presentacin, un tesauro puede ser:

Alfabtico: los descriptores y no descriptores se agrupan en


una nica secuencia alfabtica junto con sus relaciones.

Sistemtico: estructurado en 2 parte. La primera de ellas o


parte principal, contiene las categoras o jerarquas, y la segunda
parte o parte auxiliar, consta de un ndice alfabtico que
conduce a los usuarios a la seccin semntica correspondiente a
la que pertenece el trmino.

Grfico: los trminos se presentan en forma de figura grfica


donde se asocian los trminos relacionados. Esta representacin
grfica suele representarse en forma de rbol, o utilizar flechas.

Los tesauros tambin suelen comprender un ndice alfabtico a modo


de parte auxiliar donde se incluyen los no descriptores, notas de
alcance, etc.
Por lo general, los tesauros se presentan con una estructura tripartita,
esto es, un apartado jerrquico en donde se presentan los descriptores
en el contexto de su campo semntico, una parte alfabtica para
facilitar la entrada en el tesauro por la primera palabra significativa de
descriptores y no descriptores y que expresa las relaciones del
vocabulario, y un ndice permutado que permite el acceso por el resto
de trminos significativos.

GLOSARIO DE TERMINOS DESCONOSIDOS

FILTRAR: Al hacerse referencia al texto, significa dejar de una


informacin pase de una fuente a otra.

IRRELEVANTE: Es algo que carece de importancia.

LEXEMA: Es una palabra que aporta a la palabra una idea


comprensible para los hablantes.

SEMANTICA: Estudia la definicin y el origen de las palabras.

TRUNCAR: Interrumpir y dejar incompleta una obra o una


accin, o algo que se est diciendo o escribiendo.

11 ERRORES MS COMUNES DE LA BUSQUEDA EN INTERNET


Muy seguramente al 90 % de nosotros para no decir que un 99% hemos
cado en el error o en la desdicha de sentirnos frustrados al tratar de
buscar informacin, o simplemente al realizar una bsqueda en internet
sobre un tema en particular, y no haber obtenido nada, y esto es
gracias a los errores que cometemos en la bsqueda de informacin en
internet!!!

Error #1: Mala eleccin de la palabra clave

Esto es bsico, Sin embargo es muy frecuente que nos confundamos al elegir
la

palabra clave adecuada. Sobre todo cuando estamos haciendo bsquedas en


un campo tcnico como el de la ingeniera, fsica, economa que no
conocemos o cuyo lenguaje no dominamos.

Error #2: Seleccionar solo un buscador local Google:


Este es un error menor, pero muy comn desde que google aadi a su motor
de bsqueda los resultados locales. Por ejemplo: Google.es-Google.comGoogle.com.uk, etc. Todos estos ofrecen resultados diferentes para la misma
bsqueda.
Error #3: Cometer un error ortogrfico

Este es un error que hemos cometido todo el mundo como mnimo


una vez en la vida. No por simple podamos ignorarlo y de hecho es el
error ms comn que se puede cometer.
Error #4: No buscar en ms de un idioma
Gran parte de la informacin de gran calidad sobre cualquier temtica se
encuentra en ingls porque las mejores publicaciones cientficas estn en
este idioma.
Considera incluir este idioma en tus bsquedas en la medida de lo
posible.
Error#5 Buscar con las herramientas inadecuadas
Lo primero que tienes que decidir es si necesitas utilizar un motor de
bsqueda u otro tipo de recurso para la busqueda de informacion en
internet.
Error #6 Emplear nicamente la bsqueda simple del motor de
bsqueda
Este es otro aspecto que casi nunca se tiene en cuenta. Sin embargo
la calidad de los resultados de una bsqueda en Internet pueden
aumentar considerablemente, solo con emplear algunos de estos
trucos de la busqueda de google.
Error #7Pensar que los primeros resultados de un buscador son

los mejores
Cerca del 40% de los internautas lo hacen, y no por ser la primera
opcin es la mejor.
Error #8 No retroalimentar la bsqueda con los resultados
obtenidos
Este es un proceso que debemos repetir tantas veces como sea
necesario, hasta dar con la informacin o la fuente de informacin que
necesitamos.
Error#9: Tirar la toalla demasiado pronto
Esperar resultados instantneos a nuestras demandas de informacin. Lo
normal es intentar una o dos bsquedas y al no encontrar nada de inters
rendirse. De hecho el proceso de bsqueda suele ser de largo recorrido.
Sobre todo si lo que buscamos es altamente concreto o especializado.
Esto por lo general tomar su tiempo.
rmate de paciencia y disfruta del proceso mientras tanto.
Error #10: Ir directamente a Google y no a la fuente de informacin
Cualquier bsqueda seria de informacin, empieza por preguntarse donde
puede estar recogida esa informacin y seleccionar la herramienta
adecuada. Por ejemplo las patentes. Nunca se me ocurrira ir a Google a
buscar una patente sobre zapatos o cualquier otra cosa. Siempre acudira
primero a un buscador de patentes como Espacent o Latipat.
Error #11: No tener estrategia de bsqueda en internet.
Es bueno saber:
Cmo vas a proceder en la bsqueda?: Las herramientas a emplear, palabras a
utilizar, idiomas ,etc.
Qu piensas hacer con los resultados que encuentres: los vas a guardar y clasificar,
los necesitaras en el futuro para nuevas bsquedas.

BRIGITTE ELIZABETH BARRIOS VALLEJO


PSICOLOGIA I SEM
INFORMATICA I
MARIA ISABEL TRONCOSO

Vous aimerez peut-être aussi