Académique Documents
Professionnel Documents
Culture Documents
XML e Bibliotecas
Estudo crítico sobre as potencialidades de utilização
do XML no contexto das bibliotecas
Índice
Introdução .................................................................................................................................................... 3
O XML ........................................................................................................................................................... 4
Utilização do XML nas bibliotecas ................................................................................................................ 5
Algumas aplicações do XML às bibliotecas ................................................................................................... 6
MARC em XML .......................................................................................................................................... 6
RSS ............................................................................................................................................................ 6
WorldCat .................................................................................................................................................. 7
Conclusão ..................................................................................................................................................... 8
Bibliografia.................................................................................................................................................... 9
Introdução
As bibliotecas têm estado, desde sempre, atentas a tecnologia que facilite
registos, catálogos, pesquisas e a recuperação de informação. De facto as bibliotecas
estão entre as primeiras instituições no mundo a perceber a necessidade de
normalização, da utilização de ferramentas de automatização e da criação de linguagens
e formatos de acordo com as suas especificidades.
O ambiente em rede em que hoje vivemos – promovido principalmente pela
internet – tem levado a que a tecnologia à disposição das bibliotecas de hoje se torne
mais flexível e promova a interoperabilidade, a transparência e a eficiência na difusão
da informação ao utilizador.
As bibliotecas têm-se habituado a trabalhar em rede nomeadamente nos serviços
interbibliotecas (por exemplo nos empréstimos e nos catálogos colectivos) e nos OPAC
ou Web OPAC. Os sistemas de informação criados para as bibliotecas têm em conta a
implementação de normas e linguagens documentais criadas para um ambiente diferente
do da Web como a ISBD, os formatos MARC e o protocolo Z39.50.
Para além das bibliotecas, a internet é um fornecedor de informação importante
para o utilizador; criou-lhe hábitos de pesquisa e recuperação diferentes dos oferecidos
pelas bibliotecas. Por outro lado a informação apresentada é difusa, apresenta ruído e
carece de organização.
É neste contexto que as bibliotecas têm o desafio de voltar a colocar o utilizador
e as suas necessidades de informação em primeiro lugar, tendo já sido dados passos
importantes sobretudo na reformulação e adaptação de normas nacionais e
internacionais de catalogação, na criação de modelos conceptuais que permitam a
criação de redes e ligações entre elementos da informação e da metainformação (FRBR,
FRAD, etc.) e na discussão do futuro dos formatos MARC e dos próprios OPAC.
Sendo interoperabilidade a palavra-chave não só para a área da Informática, mas
também para as Ciências da Informação, o XML aparece como uma das soluções
possíveis para a alcançar. A pertinência do estudo da sua aplicabilidade na área
biblioteconómica é demonstrada pelo número de artigos escritos e publicados sobre este
assunto dos quais alguns são citados neste trabalho.
O XML
O XML (eXtensible Markup Language) é uma linguagem/formato de marcação de
dados. Foi criada para estruturar, armazenar e transportar informação. Não define
parâmetros de visualização como o layout, logo há uma separação do suporte e do
conteúdo. O XML deriva do SGML1 (Standard Generalizes Markup Language) que
define uma norma para linguagens de marcação.
A estrutura formal do XML é definida através do DTD (Document Type
Definition) ou um XML Schema uma vez que as marcações (tags e atributos) não são
predefinidas como acontece com o HTML2.
O XML foi desenhado para ser auto-descritivo e é uma recomendação da W3C (World
Wide Web Consortium). O XML suporta UNICODE o que significa que é possível a
utilização de vários alfabetos.
O XML simplifica a partilha de dados por ser um formato de texto, ao contrário
de outros formatos (proprietários ou não) que são incompatíveis entre si.
Foram desenvolvidas várias linguagens baseadas no XML tais como o RSS,
XHTML e formatos como o Office Open XML (Microsoft Office) , Opendocument
(OpenOffice).
Para a visualização duas possíveis formas:
CSS – Cascading Style Sheets: linguagem de formatação que permite adicionar
estilo de apresentação (fontes, cores, localização do elemento, tamanho, cor,
etc.)
XSL - Extensible Style Language: linguagem de formatação alterar a ordem de
visualização dos elementos, executar computação com base nos elementos,
adicionar conteúdo a um documento, combinar múltiplos documentos.
1
ISO 8879:1986
2
O HTML foi desenhado para a visualização de dados ao contrário do XML que foi desenhado para
descrever a estrutura dos dados (por exemplo: um documento)
MARC em XML
A Biblioteca do Congresso desenvolveu em 2001 o MARCXML um XML
Schema com o propósito de permitir a conversão de um registo em MARC 21 para o
formato MARC 21 XML. Em 2004 começou a ser desenvolvido o MarcXchange cuja
base é a mesma do MARCXML mas que é compatível com os MARC locais e o
UNIMARC. O MarcXchange pode ser usado com vários objectivos: representação de
registo(s) MARC em XML, troca de registos MARC em XML, manipulação, utilização
de web services para transferência de registos MARC (SRW), para utilização do
protocolo OAI-PMH3 e como metadados de um recursos electrónico, entre outros.
O protocolo Z39.50 está também a ser modernizado através do SRU
(Search/Retrieve via URL) e SRW (Search/Retrieve Web service) que utilizam o
protocolo HTTP. Os resultados das interrogações estão no formato XML.
RSS
O RSS (Really Simple Sindication ou Rich Site Summary ou RDF Site
Summary) é um formato baseado em XML e foi criado para a difusão de informação na
Web. Os leitores para este formato são os navegadores Web nas versões mais recentes,
software dedicado e ainda serviços Web como o Google Reader. Outras possibilidades
são a incorporação de uma API (Application Programming Interface) no próprio site.
Este é uma ferramenta útil para as bibliotecas na medida em que podem publicar
informação e conteúdos em vários momentos da navegação Web do utilizador ou
mesmo no seu dispositivo móvel (telemóvel, pda, smartphone, netbook, etc.). As
informações mais habitualmente difundida pelas bibliotecas em feeds RSS são notícias e
3
O protocolo OAI-PMH (Open Archives Iniative. Protocol for metadata harvesting) recolhe os
metadados em Dublin Core e codifica-os em XML para difusão.
WorldCat
O WorldCat é um catálogo colectivo alimentado pelas bibliotecas aderentes de
todo mundo, criado pela OCLC. A implementação de soluções em XML está presente
em várias partes do sítio Web.
Como exemplo do exposto no capítulo anterior, o WorldCat Search API (Web
service)4:
How the API works
Nesta API não só o resultado da pesquisa é feita em formato XML, mas também
é possível receber o registo bibliográfico em vários formatos de citação. Este é um
excelente exemplo de flexibilidade na apresentação da informação, ou seja, o mesmo
conteúdo pode ser apresentado em MARC, RSS, Atom e nos formatos de citação APA ,
Chicago. Outros formatos de exportação estão disponíveis a partir da visualização de
registo.
4
http://www.worldcat.org/affiliate/tools?atype=wcapi
Conclusão
A vantagem tecnológica que as bibliotecas possuíam pela adopção de
tecnologias para os seus registos bibliográficos foi sendo atenuada com a dificuldade
em acompanhar a evolução do ambiente Web. Em parte devido à manutenção de
processos de tratamento documental cuja origem está nas fichas manuais aliada a
problemas na partilha de informação fora do contexto biblioteconómico devido a
formatos de círculo restrito como o MARC e o Z39.50.
O desafio da mudança e da actualização não só tecnológica mas também de
normas e formatos está a ser encarado pelas bibliotecas como uma necessidade que se
não for alcançada pode significar a perda de influência da biblioteca no domínio da
informação.
O XML é visto como a esperança para a entrada em ambientes além-muros da
biblioteca tais como redes sociais, blogues e o telemóvel. O catálogo da biblioteca terá
também que sofrer uma adaptação, concentrando serviços, disponibilizando informação
relevante a utilizadores únicos no momento que em que precisam dela.
O resultado destes esforços por parte das bibliotecas começa a ser timidamente
visível mas parece evidente que há um longo caminho a percorrer. Alguns exemplos de
boas práticas neste campo que foram apresentadas neste trabalho dão, com certeza, um
novo alento a projectos noutras bibliotecas.
Bibliografia
BANERJEE, Kyle – How Does XML Help Libraries? In Computer Libraries. Vol. 22,
N.º8. [Em linha]. 2002. Disponível em
<http://www.infotoday.com/cilmag/sep02/banerjee.htm> Acedido em: 09/06/2010
CARVALHO, Joaquim de; CORDEIRO, Maria Inês – XML and bibliographic data: the
TVS (Transport, Validation and Services) model. In 68th IFLA Council and General
Conference August 18-24. [PDF]. 2002.
JOHNSON, Bruce Chr – XML and MARC: Which is “Right”?. In Cataloging &
Classification Quarterly, 32: 1, 81-90. [Em linha]. 2002. Disponível em:
<http://dx.doi.org/10.1300/J104v32n01_07> Acedido em: 09/06/2010