Vous êtes sur la page 1sur 52

Linguagens Documentrias

Profa. Lillian Alvares Faculdade de Cincia da Informao, Universidade de Braslia

Contexto

Organizao da Informao...

... procura criar mtodos e instrumentos para elaborar informao documentria...


... Indexar, resumir

e construir linguagens de

representao so os termos tcnicos que denominam essas operaes

Contexto

A questo :

Como organizar a informao para que o conhecimento fique disponvel?

Contexto

Pelas Linguagens Documentrias, pois...

...elas esto contidas no contextos de produo e de busca de informao...


...

parte constitutiva da preocupao com a

recuperao da informao.

Contexto

Uma das condies para plena recuperao de


informao o uso de Linguagens Documentrias

Contexto

As Linguagens Documentrias so instrumentos privilegiados


de mediao que apresentam dupla funo:

Contexto

a) representar o conhecimento
b) promover interao entre usurio e contedo.

Principais interseces interdisciplinares

Lingustica: o princpio estrutural da organizao da


linguagem

Terminologia: a modelagem do conceito e dos sistemas de conceitos, onde, glossrios e dicionrios terminolgicos especializados so seus produtos

Lgica: a identificao das formas de raciocnio e de organizao de conjuntos

Campos para atuao...

No exclusivo dos Bibliotecrios e Documentalistas;


reas de aplicao: Filosofia, Informtica, Inteligncia Artificial, Engenharia, Psicologia entre outros....

Contexto

As LD constituem uma espcie de cdigo de traduo que


tem, entre suas funes, a normalizao das representaes documentrias como meio de viabilizar sua comunicao.

Contexto

Essa traduo que permite a transformao de


informaes dos textos em linguagem natural e/ou especializada para uma linguagem documentria controlada, envolve a questo da significao:

Como representar adequadamente as informaes sem comprometer o seu significado?

Resultados da traduo

Contexto

LD so instrumentos que no permitem a recuperao


da dinamicidade dos textos

um dos seus objetivos o de fornecer uma verso extremamente econmica dos textos originais

por intermdio, do destaque das informaes consideradas centrais nos documentos.

Contexto

LD e textos so construes de natureza distinta, por isso..

... na operao de converso perde-se a especificidade do texto original em prol da generalizao.

Definies

Definies

So linguagens artificialmente construdas que visam


traduzir sinteticamente contedos documentais, utilizadas nos sistemas documentrios para indexao, armazenamento e recuperao da informao.

Definies

um conjunto controlado de termos usado para


representar os assuntos dos documentos.

Definies

O objetivo da LD o controle de vocabulrio, isto ,


controlar a terminologia de rea ou reas do conhecimento por meio do estabelecimento de um conceito/interpretao definido aos termos de acordo com as necessidades de uso do sistema.

Definies

A utilizao de uma LD para escolha do termo correto para


descritor reduz a diversidade e a ambiguidade da terminologia e estabelece a eficcia com que o indexador pode descrever o assunto dos documentos, j que vrios autores podem se utilizar de diferentes palavras para

expressar uma mesma idia.

Definies

S podem cobrir conceitos de um domnio especfico do


conhecimento humano, no havendo assim, linguagens documentrias gerais.

Definies

Visam a uniformizao do uso de linguagens especializadas...

...proporcionando uma representao padronizada do contedo informacional...


... bem

como uma recuperao da informao

mais pertinente.

Definies

As palavras (que descrevem as informaes ou descritores)


so os elementos que compem as linguagens documentrias.

So extrados da linguagem natural

Terminologia

Tipos de linguagem

Linguagem Natural Linguagem Documentria, tambm conhecida como:


Linguagem Linguagem Linguagem

Controlada de Indexao Descritoras Documentrias

Codificaes

Medidas de Eficcia

24

Revocao e Preciso

Todos os documentos Documentos relevantes Documentos retornados Relevantes retornados

= Revocao

= Preciso

Revocao ou Recall

Relao entre o nmero de documentos relevantes sobre


determinado tema, recuperados pelo sistema, e o nmero total de documentos sobre o tema, existentes nos registros do mesmo sistema.

26

Preciso ou relevncia

Refere-se qualidade dos documentos recuperados pelo


sistema, para atendimento dos pedidos relativos a temas especficos, encaminhados por usurios diversos.

Documentos relevantes retornados dividido pelo nmero total de retornados

27

Linguagens Pr-Coordenadas e Linguagens Ps-Coordenadas

Linguagens Pr-Coordenadas

Linguagens pr-coordenadas

Combinao feita na etapa de entrada das palavras, na


indexao.

Os assuntos so representados por um conjunto de termos j combinados.

Exemplo: lbum de fotografia

Linguagens pr-coordenadas

Devem contemplar todas as possibilidades de


combinao entre os termos para formar assuntos complexos.

So palavras, termos ou frases escolhidas para expressar um conceito ou uma combinao de conceitos de indexao

Linguagens pr-coordenadas

Adota:

VER: remete ao termo adotado como entrada (sinnimos, termos especficos para termos genricos)

VER TAMBM: remete a assuntos relacionados. Complementa a informao para o usurio

Linguagens pr-coordenadas

Trazem problemas indexao, devido, principalmente,


impossibilidade de prever todas as alternativas de relacionamento entre conceitos.

Linguagens pr-coordenadas

O nmero e a preciso dos termos de uma lista podem


levar a crer numa busca facilitada.

No so flexveis para permitir uma busca por qualquer termo que compe o cabealho.

Linguagens pr-coordenadas

Podem ser de dois tipos:


Classificatrias (Classificaes) Alfabticas (Cabealhos de assunto)

Desvantagens

Necessitam de entradas mltiplas para explicitar todos os


conceitos significativos

Difceis de atualizar, pouco dinamismo Menor flexibilidade na indexao Relaes estticas Menor revocao

Linguagens Ps-Coordenadas

Linguagens ps-coordenadas

Combinao feita no momento da sada, na recuperao da


informao.

Utilizao de operadores booleanos: E, OU, NO


Exemplo: lbum

E fotografia para recuperar lbum de

fotografia

Vantagens

Dinmicas, novos termos podem ser includos com maior


rapidez

Relaes multidimensionais entre termos Todos os termos so pontos de acesso Maior flexibilidade na indexao

Desvantagens

Geram falsa recuperao, necessitam de artifcios para


evit-la

Exigem maior esforo na busca

Linguagem Natural (LN) e Linguagem Documentria (LD)

LN A parte oral mais importante. So gerais So estabelecidas e adaptadas atravs de longos perodos de tempo e por muitas pessoas. A sinonmia e a polissemia so fatos naturais das LN. Aceitam ambigidades

LD So fundamentalmente escritas. So especializadas So estabelecidas em poucos anos por um nmero reduzido de pessoas No aceitam ambiguidades. No comportam polissemias e e se esforam por evitar as sinonmias.

So naturalmente aceitas e adquiridas pelos usurios Interessam os aspectos fonolgicos, semnticos e sintticos So naturais

Devem ser aceitas pelos usurios. Interessam somente os aspectos semnticos e sintticos So artificiais

LN

LD

So menos eficientes que as LD nas operaes de recuperao da informao

So mais eficientes que as LN nas operaes de recuperao da informao

So instrumentos de comunicao
Tm sua prpria estrutura

So instrumentos de comunicao
Sua estrutura baseia-se na estrutura da LN sobre a qual elas so formadas Necessitam de hierarquias para evitar malformaes gramaticais. So sensveis a mudanas culturais Tm um propsito especfico e um nvel de funes

Necessitam de hierarquias para evitar malformaes gramaticais So sensveis a mudanas culturais No tm uma funo especfica

LD: Vantagens e desvantagens


VANTAGENS DESVANTAGENS

Se bem construdo, o vocabulrio Um rgido vocabulrio controlado controlado poder oferecer alta preciso poder no refletir os objetivos e revocao, e tambm ampliar a da base de dados confiana do usurio frente a um possvel resultado negativo

As relaes hierrquicas e as remissivas do vocabulrio controlado auxiliam tanto o indexador, quanto o usurio na identificao de conceitos relacionados

Necessidade de treinamento no uso dos vocabulrios controlados tanto para os intermedirios, quanto para os usurios finais

LD: Vantagens e desvantagens

VANTAGENS

DESVANTAGENS

Reduo no tempo de consulta base, Desatualizao do vocabulrio pois a estratgia de busca ser melhor poder conduzir a resultados falsos elaborada com o uso do vocabulrio controlado

Aumenta a preciso

LD: Vantagens e desvantagens

VANTAGENS
Controle total do vocabulrio de indexao, minimizando os problemas de comunicao entre os indexadores e os usurios

DESVANTAGENS
Custos: a produo e manuteno da base de dados tero despesas maiores com a equipe de indexadores. Ter ainda que, manter pessoal especializado na atualizao do vocabulrio

Promove a consistncia/coerncia na indexao

Linguagem Natural

LN: Vantagens e desvantagens


VANTAGENS
Permite o imediato registro da informao numa base de dados, sem necessidade de consulta a uma linguagem de controle
Processo de busca facilitado com a ausncia de treinamentos especficos no uso da linguagem de controle

DESVANTAGENS
Os usurios, no processo de busca, precisam fazer um esforo intelectual maior para determinar os sinnimos, as grafias
Haver uma alta incidncia de respostas negativas ou de relaes entre os termos usados na busca (por ausncia de padronizao) Custos de acesso tendem a aumentar com a entrada de termos aleatrios

Termos de indexao so extrados diretamente dos documentos que vo compor a base de dados

LN: Vantagens e desvantagens


VANTAGENS
Termos especficos citados nos documentos podem ser encontrados

DESVANTAGENS
Uma estratgia de busca que arrole todos os principais conceitos e seus sinnimos deve ser elaborada para cada base de dados Perda de confiana do usurio numa possvel resposta negativa

Elimina os conflitos de comunicao entre os indexadores e os usurios, pois, ambos tero acesso aos mesmos termos

Tipos de LD

Tipos
Pr-coordenadas

Ps-coordenadas

Sistemas de classificao Listas de cabealhos de assuntos

Vocabulrios controlados Tesauro Taxonomias Ontologias

Glossrios
Dicionrios

Referncia

KOBASHI, Nair Yumiko. Fundamentos semnticos e


pragmticos da construo de instrumentos de representao de informao. DataGramaZero: Revista de Cincia da Informao, v.8, n.6, dez, 2007.

Vous aimerez peut-être aussi