Académique Documents
Professionnel Documents
Culture Documents
DE INFORMAO - SRI
Origem
Desde seu incio, eles tm estado fortemente
relacionados ao desenvolvimento tecnolgico,
tanto no que concerne as telecomunicaes
bem como com a apario dos primeiros
computadores.
Utilizados para gerenciar a exploso da
informao na literatura cientfica e para
facilitar a vida do usurio para que o
mesmo pudesse encontrar no emaranhado
de informaes aquelas que atendessem as
suas necessidades informacionais.
Definies
As definies de SRI buscam abranger as
necessidades de informao e as vrias
metodologias e tecnologias que, atravs dos
tempos, foram geradas para atender a essas
necessidades, desde as atividades de
organizao de colees de documentos em
acervos bibliogrficos, at os modernos
sistemas informatizados que lidam com
documentos em formato digital
(SOUZA, 2006).
MOOERS (1951):
engloba os aspectos intelectuais da
descrio
de
informaes
e
suas
especificidades para a busca, alm de
quaisquer sistemas, tcnicas ou mquinas
empregadas para o desempenho da
operao.
Desde Mooers, a Recuperao de Informao
(RI) tem sido desenvolvida e aperfeioada,
transformando-se em uma atividade multi e
interdisciplinar, podendo ser considerada
como vertente tecnolgica da CI
(SARACEVIC, 1999).
Misso fundamental
Sempre esteve pautada em responder s
necessidades dos usurios e suprimir as
dificuldades que se colocavam na busca de
informao.
Dito de outro modo, permitir que um usurio
recupere documentos atravs de certas
caractersticas especficas (por autor, ttulo
conhecido, assunto ou qualquer combinao
desses elementos).
Modelo de Recuperao de
Informao
Representao dos documentos:
Busca descrever ou identificar cada documento do atravs de seu
contedo. Sendo, a melhor forma de realizar essa representao
por meio da indexao.
Funo de busca:
Compara
as
representaes
dos
documentos
com
a
representao da expresso de busca do usurio e recupera os
itens que supostamente fornecem a informao que o usurio
procura (FERNEDA, 2012, p. 19).
Usabilidade
Usurio:
A partir de sua necessidade de informao ir interagir com
um SRI a fim de buscar documentos que atendam tal
necessidade;
Expresso de busca:
Trata-se do meio que o usurio aplica para comunicar a sua
necessidade de informao para o sistema. Esses termos so
geralmente especificados em linguagem natural ou por meio
de uma linguagem artificial, dependendo dos recursos
oferecidos pelo sistema (FERNEDA, 2012);
Resultados da busca:
So expressos por meio de uma lista de referncias de
documentos que supostamente so relevantes para suprir a
necessidade de informao do usurio (BANHOS, 2008).
Estratgias de Busca
Definies
ROWLEY (1994):
Conjunto
de
decises
tomadas
e
procedimentos adotados durante uma
busca
LOPES (2002):
CENDN (2005):
Booleano
Vetorial
Probabilstico
Processamento de Linguagem Natural
Fuzzy
Redes Neurais
Modelo Booleano
Modelo baseado na teoria de conjuntos e na lgebra de
George Boole.
A lgebra booleana um sistema binrio no qual
existem somente dois valores possveis para qualquer
smbolo algbrico: 1 ou 0, verdadeiro ou falso.
As consultas se expressam como expresses booleanas
com uma semntica clara e concreta:
Operadores booleanos
AND (E ou +)
NOT (NO ou -)
OR (OU)
Principais problemas
Exemplo
Operadores de Proximidade
Surgimento dos sistemas de texto completo .
ADJ Permite pesquisar duas palavras adjacente no texto
de um documento, na ordem especificada na expresso
de busca. Pronto ADJ Socorro/ Pronto Socorro
NEAR (n de proximidade) Permite pesquisar uma
palavra prxima da outra, definindo o nmero de palavras
de distncia. Recuperao NEAR/10 Informao
WITH Permite recuperar documentos cujos termos
apaream no mesmo pargrafo. Recuperao WITH
Informao
SAME Permite recuperar documentos cujos termos
apaream na mesma sentena Recuperao SAME
Informao
Frase Exata Recuperao de Informao
Composio de Operadores
Recuperao de ADJ
(informao OR documentos)
Modelo Vetorial
O modelo vetorial, ou tambm chamado de modelo
espao vetorial, prope um ambiente no qual possvel
obter documentos que respondem parcialmente a
uma expresso de busca.
Isto feito associando-se pesos tanto aos termos de
indexao dos documentos como aos termos utilizados
na expresso de busca.
Esses pesos so utilizados para calcular o grau de
similaridade entre a expresso de busca e cada um
dos documentos do corpus.
Como resultado, obtm-se um conjunto de documentos
ordenado pelo grau de similaridade de cada documento
em relao expresso de busca.
O Sistema SMART
O projeto SMART (System for the Manipulation and Retrieval of
Text) teve incio em 1961 na Universidade de Harvard e
mudou-se para a Universidade de Cornell aps 1965.
O sistema SMART o resultado da vida de pesquisa de Gerard
Salton e teve um papel significativo no desenvolvimento de
toda a rea da Recuperao de Informao.
O SMART uma implementao do modelo vetorial, proposto
pelo prprio Salton nos anos 60.
O sistema SMART fornece um mtodo automtico para o
clculo dos pesos no s dos vetores que representam os
documentos, mas tambm para os vetores das expresses de
busca.
Modelo Probabilstico
Na matemtica, a teoria das probabilidades
estuda os experimentos aleatrios que, repetidos
em condies idnticas, podem apresentar
resultados diferentes e imprevisveis.
Isso ocorre, por exemplo, quando se observa a
face superior de um dado aps o seu lanamento
ou quando se verifica o naipe de uma carta
retirada de um baralho.
Por apresentarem resultados imprevisveis,
possvel apenas estimar a possibilidade ou a
chance de um determinado evento ocorrer.
que
foram
Modelo Fuzzy
Na concepo tradicional um elemento pertence ou
no a um determinado conjunto, da mesma forma
como no modelo booleano um documento ou no
relevante para uma determinada expresso de busca.
Porm, em um sistema de recuperao de informao
esse limite claro e preciso no existe. Entre um
documento relevante e um no-relevante podem
existem gradaes (relevncia parcial) com as quais o
modelo booleano no consegue lidar.
A grande maioria dos experimentos realizados com
este modelo considera apenas pequenos corpora, que
no comprovam sua efetiva superioridade em relao
a outros modelos de recuperao de informao.
Redes Neurais
Mozer (1984) foi o pioneiro na utilizao de tcnicas
de RNA na recuperao de informao.
Ele utilizou uma arquitetura bastante simples que no
empregava uma das principais caractersticas das
redes neurais, que a capacidade de aprender.
A figura mostra um exemplo apresentado por Ford
(1991, p. 108), que utiliza a arquitetura de RNA
idealizada por Mozer.
Referncias
CARDOSO, Olinda Nogueira Paes. Recuperao de Informao.
Lavras: UFLA, 2003.
CESARINO, Maria Augusta da Nbrega. Sistemas de Recuperao
da Informao. Revista da Escola de Biblioteconomia da
UFMG, Belo Horizonte, v.14, n.2, set., 1985.
FERNEDA, Edberto. Recuperao de Informao: anlise sobre
a contribuio da Cincia da Computao para a Cincia da
Informao. 2003. 147 f. Tese (Doutorado em Cincia da
Comunicao) - Escola de Comunicao e Artes, Universidade de
So Paulo, So Paulo, 2003.
LOPES, Ilza Leite. Estratgica de busca na recuperao da
informao: reviso de literatura. Revista Cincia da
Informao, Braslia, v.31, n.2, p.60-71, maio/ago, 2002.
Disponvel
em:
<http://www.scielo.br/scielo.php?
script=sci_arttext&pid=S0100-19652002000200007>.
Acesso
em: 03 out. 2006.