Vous êtes sur la page 1sur 37

MSTER ESPAOL/INGLS PARA FINES ESPECFICOS

Espaol de la ciencia y la tecnologa



Tema 5
Recursos lingsticos y terminolgicos en
Internet






Grupo EPA
MSTER ESPAOL/INGLS PARA FINES ESPECFICOS
Espaol de la ciencia y la tecnologa

Tema 5:
Recursos lingsticos y terminolgicos en Internet
Dra. Isabel Santamara Prez
mi.santamaria@ua.es
Dr. Jos Joaqun Martnez Egido
jj.martinez@ua.es

La web es un mundo de aplicaciones textuales hay
un gran conjunto de imgenes e incontables archivos
de audio, pero el texto predomina no slo en
cantidad, sino en utilizacin (Milln, 2001: pg.
35-36)
OBJETIVOS
Consultar y localizar informacin de inters
lingstico y terminolgico.
Localizar, gestionar y evaluar textos especializados de
una materia.
Constituir un corpus textual especializado, til para la
investigacin lingstica y terminolgica.
Presentar distintos recursos de consulta lingstica y
terminolgica en Internet.
CONTENIDOS

Internet como fuente de informacin especializada: obtencin
de corpus

Herramientas lingsticas para el tratamiento de textos:
Antconc


Internet como almacn de recursos lingsticos y
terminolgicos


Qu es Internet?
Internet es la red de redes que permite la
interconexin de redes y ordenadores de todo
tipo mediante ruteadores (dispositivos de
conexin y distribucin de datos en una red).
Qu se puede hacer en Internet?
Enviar mensajes
Opinar sobre temas
Chatear
Consultar catlogos de bibliotecas
Visitar museos
Conseguir informacin
Ofrecer informacin
Conseguir programas informticos
Comprar/vender, etc.
Internet para el lingista
Fuente de comunicacin (listas de discusin, correo
electrnico, foros)
Intercambio de datos (bases de datos, publicaciones,
documentacin, corpus, etc.)
Fuente de informacin terminolgica y documental
(catlogos, contextos, definiciones, trminos,
glosarios, bases de datos).
Captura de informacin para realizar un trabajo
terminolgico (trmino, contextos, textos,
publicaciones, herramientas, etc.)
Internet como fuente de informacin
especializada: el corpus
Internet

fuente de informacin lingstica

Corpus


informacin textual y discursiva
informacin sobre unidades concretas (variantes,
definiciones, categora gramatical)
ejemplos de coocurrencias, etc.
Internet como fuente de informacin
especializada: el corpus
Criterios o estrategias
de bsqueda para la
recuperacin de
informacin
Necesidad de informacin







Herramientas de bsqueda
en Internet


INFORMACIN


EN LA WEB
Internet como fuente de informacin
especializada: el corpus
Qu tipo de informacin recuperamos?

Material textual disponible en Internet que
contiene informacin lingstica.

Productos finales que contienen informacin
lingstica (bases de datos, glosarios, diccionarios
en lnea, corpus, etc.).
Directorios vs. motores de bsqueda
BUSCADORES
ndices o directorios
Motores de bsqueda
Metabuscadores
Tendencia actual



convertir a los buscadores en portales que ofrecen
servicios, ventas y productos

Imposibilidad de ubicar a los actuales buscadores en
una sola descripcin (directorios, motores de
bsquedad, etc.)
Directorios vs. motores de bsqueda

Directorios vs. motores de bsqueda
Directorios
Bsqueda dirigida

Funcionan por navegacin

Lista de recursos clasificados por
temas

Recogen una pequea parte de los
recursos digitales de la WWW

Organizan la informacin
manualmente asignando los recursos
a una o ms clases

Actualizacin de la informacin lenta
Motores de bsqueda
Consulta libre

Funcionan por recuperacin de
informacin

Programas automticos que
constituyen una BD con todas las
pginas web exploradas

Recogen la totalidad de recursos

Organizan la informacin por
comparacin automtica y creacin
de ndices

Actualizacin automtica y rpida
Indices-directorios

Ventajas Desventajas
-Informacin clasificada, precisa y de
calidad
-Suelen presentar sus enlaces
comentados
-Realizada por expertos calidad
-Permiten buscar por una catalogacin
temtica preexistente
-Es posible navegar por una temtica
determinada sin concretar la palabra
clave
-Resultados menores que con
los motores de bsqueda
-Enlaces no siempre
actualizados
-Cada directorio tiene su propia
clasificacin
-Sistema menos intuitivo que en
los motores
-En las clasificaciones priman
los criterios comerciales
Motores de bsqueda

Ventajas Desventajas
-Abundante informacin
-Est todo
-Buscan en toda la red
-Fciles de usar e intuitivos
-Actualizacin de los enlaces
-Exceso de informacin
-Los primeros resultados suelen
ser pginas que enlazan con
otras
-Presencia de resultados que no
interesan
Motores de bsqueda

Recursos ms utilizados para buscar en Internet
Se basan en programas automticos que saltan de
una pgina a otra de la web, siguiendo los enlaces
que encuentran en cada pgina para construir una
gigantesca base de datos.
La bsqueda es por palabras clave.
Ejemplos
Directorios:
Yahoo http://es.yahoo.com/
Excite http://www.excite.es/directory
Lycos http://www.tripod.lycos.es

Buscadores:
Google http://www.google.com
AltaVista http://www.altavista.com
Oz http://www.ozu.es
Terra http://www.terra.es
Metabuscadores
Buscador de buscadores
Redirigen las consultas simultneamente a bases de datos
de varios motores y directorios
tiles para consultar datos muy concretos.
Algunos permiten realizar una consulta simultnea a todos
los buscadores indexados o bien determinar el buscador
en concreto al que se desea enviar la interrogacin.
Ejemplos de metabuscadores
http://metacrawler.com
http://www.i-une.com
http://www.kartoo.com

Otros metabuscadores en:
http://www.cuervoblanco.com/metabuscadores.html
http://www.buscopio.net
http://www.internetinvisible.com



Buscadores especializados
Se estructuran sobre la base de un directorio
temtico, aunque pueden ofrecer un motor de
bsqueda.
Su atractivo reside en la especializacin temtica y en
la calidad de los vnculos.
Los recursos que proporcionan son muy variados:
portales temticos, sitios web de asociaciones,
pginas personales, etc.
http://www.scirus.com


Recuperacin de informacin: operadores
booleanos
Permiten expresar nuestras necesidades de
informacin con la mxima precisin.

Sirven para exigir o excluir conceptos en la
bsqueda avanzada y en determinados
motores de bsqueda.
Tipos de operadores booleanos
AND (&): localiza documentos que contengan uno y
otro trminos expresados en la consulta.

OR (I): localiza documentos que contengan uno u
otro de los trminos especificados en la consulta.

NOT (!): recupera documentos que no contengan un
trmino expresado en la consulta.
Tipos de operadores booleanos
Frase exacta: Permite buscar ocurrencias de
fragmentos textuales que coincidan
exactamente con el contenido de un
documento.
Se representan:
transcripcin gentica

Tipos de operadores booleanos
Limitar idioma: Permite limitar los resultados de la
bsqueda a los que se encuentren en una
determinada lengua especificada previamente.
Limitar a un servidor (domain: host): Encuentra las
pginas con la palabra o frase especificada en el
dominio del servidor Web donde se encuentre estas
pginas.
Domain: .mx (limitamos la bsqueda a ese dominio:
Mxico)

Tipos de operadores booleanos
Limitar a ttulo: El motor de bsqueda
encuentra las pginas que contienen la
palabra o frase en el ttulo.

Limitar a texto: el contenido de la pgina.

Limitar a perodo temporal.
Tipos de operadores booleanos
Formatos de documentos en Internet
Pginas .html
Documentos de word .doc
Archivos .pdf
Imgenes .jpg, .gif
Comprensin y descomprensin de ficheros .zip
Internet como almacn de recursos
lingsticos y terminolgicos
a. Recursos lexicogrficos
b. Recursos terminolgicos: catlogos de
diccionarios especializados
c. Recursos textuales
d. Bases de datos terminolgicos y neolgicos
e. Consulta con otros especialistas: listas de
discusin y foros
a) Recursos lexicogrficos
Recursos lingsticos generales: Diccionarios y enciclopedias
Espaol
http://www.rae.es
http://clavecorp.grupo-sm.com
Cataln
http://pdl.iecat.net
Ingls
http://www.m-w.com (Merriam Webster)
http://www.ldoceonline.com (Longman)
http://dictionary.cambridge.org
http://www.hyperdictionary.com
http://www.oed.com/ (Oxford English Dictionary)

Francs
http://atilf.atilf.fr/tlfv3.htm

Alemn
http://www.dwds.de/





AllWords.com: Diccionario ingls con traduccin a
seis idiomas
http://www.allwords.com
Diccionario de sinnimos
http://tradu.scig.uniovi.es/sinon.html
ElMundo.es
http://www.elmundo.es/diccionarios
a) Recursos lexicogrficos
Portales
http://www.yourdictionary.com. Portal con 2.500
diccionarios y gramticas en 300 lenguas
http://www.onelook.com/browse.shtml. Portal con
cerca de 900 diccionarios
http://www.diccionarios.com. Portal de Larousse.
http://www.lexicool.com. Portal con ms de 4.000
enlaces de diccionarios y glosarios bilinges y
multilinges




b) Recursos terminolgicos
Portales
Portalingua http://www.portalingua.info. Portal dedicado a las lenguas
neolatina. Consulta de recursos en lnea.
TermSciences http://www.termsciences.fr/. Portal terminolgico
multidisciplinario. Permite la consulta de trminos en francs, ingls,
espaol y alemn
Eureka http://www.foreignword.com/eureka/default.asp. Portal que
recoge informacin sobre bancos de datos terminolgicos, glosarios,
diccionarios, traduccin, etc.
Latinosapiens http://www.latinosapiens.info. Portal de informacin
cientfica en lenguas neolatina. Contiene artculos, foros, revistas.


b) Recursos terminolgicos
Catlogo de glosarios y diccionarios especializados
Hiperenciclopdia http://www.grec.net/home/cel/mainc.htm
Visual dictionary http://www.infovisual.info/
Glossarist http://www.glossarist.com/
Terminology Collection http://lipas.uwasa.fi/comm/termino/collect/
Vademcum del traductor externo
http://www.europarl.europa.eu/transl_es/plataforma/pagina/celter/c
elula.htm
Inventerm http://www.inventerm.com/


c) Recursos textuales
Corpus
BwanaNet
BNC (British National Corpus)
CREA (Corpus de Referencia del espaol actual)
Internet (Scirus [cientfico], Google)
d) Bancos de datos terminolgicos y
neolgicos

TERMITE (Banco creado por la International Telecommunications Union)
http://www.itu.int/terminology/index.html
Terminologa de la FAO http://www.fao.org/faoterm/index.asp?lang=ES
IATE http://iate.europa.eu/
UPF_Term http://upfterm.upf.edu:8080/cat/index.htm
TIS (Terminological Information System)
http://tis.consilium.eu.int/utfwebtis/frames/introfsEN.htm
Termium http://www.termium.gc.ca/site/accueil_home_f.html
Cercaterm http://www.termcat.es
Neoloteca http://www.termcat.es
Bobneo http://obneo.iula.upf.edu/bobneo/


f) Listas de discusin, foros y blogs
The Linguist List. Conjunto de listas (corpora, ELEX,
lexicography)
http://www.linguistlist.org/


Relacin temtica de listas de distribucin de RedIris
(tecnotrad, traduccin, tradumtica)
http://www.rediris.es/list/


Evaluacin de resultados
Autora
Actualidad
Precisin y correccin
Tratamiento del contenido
Originalidad
Enlaces a otros recursos
Ergonoma
Citacin en otros sitios