Vous êtes sur la page 1sur 9

Curso de Mestrado em Ciências da Informação e da Documentação

XML e Bibliotecas
Estudo crítico sobre as potencialidades de utilização
do XML no contexto das bibliotecas

Trabalho realizado no âmbito da disciplina de Tecnologias Aplicadas à Gestão da Informação


Biblioteconómica
Docente: Paulo Leitão
Discente: Hugo Rodrigues
Junho 2010
UNL-FCSH | Tecnologias aplicadas à Gestão da Informação Biblioteconómica
XML e Bibliotecas

Índice

Introdução .................................................................................................................................................... 3
O XML ........................................................................................................................................................... 4
Utilização do XML nas bibliotecas ................................................................................................................ 5
Algumas aplicações do XML às bibliotecas ................................................................................................... 6
MARC em XML .......................................................................................................................................... 6
RSS ............................................................................................................................................................ 6
WorldCat .................................................................................................................................................. 7
Conclusão ..................................................................................................................................................... 8
Bibliografia.................................................................................................................................................... 9

Hugo Rodrigues Página 2


UNL-FCSH | Tecnologias aplicadas à Gestão da Informação Biblioteconómica
XML e Bibliotecas

Introdução
As bibliotecas têm estado, desde sempre, atentas a tecnologia que facilite
registos, catálogos, pesquisas e a recuperação de informação. De facto as bibliotecas
estão entre as primeiras instituições no mundo a perceber a necessidade de
normalização, da utilização de ferramentas de automatização e da criação de linguagens
e formatos de acordo com as suas especificidades.
O ambiente em rede em que hoje vivemos – promovido principalmente pela
internet – tem levado a que a tecnologia à disposição das bibliotecas de hoje se torne
mais flexível e promova a interoperabilidade, a transparência e a eficiência na difusão
da informação ao utilizador.
As bibliotecas têm-se habituado a trabalhar em rede nomeadamente nos serviços
interbibliotecas (por exemplo nos empréstimos e nos catálogos colectivos) e nos OPAC
ou Web OPAC. Os sistemas de informação criados para as bibliotecas têm em conta a
implementação de normas e linguagens documentais criadas para um ambiente diferente
do da Web como a ISBD, os formatos MARC e o protocolo Z39.50.
Para além das bibliotecas, a internet é um fornecedor de informação importante
para o utilizador; criou-lhe hábitos de pesquisa e recuperação diferentes dos oferecidos
pelas bibliotecas. Por outro lado a informação apresentada é difusa, apresenta ruído e
carece de organização.
É neste contexto que as bibliotecas têm o desafio de voltar a colocar o utilizador
e as suas necessidades de informação em primeiro lugar, tendo já sido dados passos
importantes sobretudo na reformulação e adaptação de normas nacionais e
internacionais de catalogação, na criação de modelos conceptuais que permitam a
criação de redes e ligações entre elementos da informação e da metainformação (FRBR,
FRAD, etc.) e na discussão do futuro dos formatos MARC e dos próprios OPAC.
Sendo interoperabilidade a palavra-chave não só para a área da Informática, mas
também para as Ciências da Informação, o XML aparece como uma das soluções
possíveis para a alcançar. A pertinência do estudo da sua aplicabilidade na área
biblioteconómica é demonstrada pelo número de artigos escritos e publicados sobre este
assunto dos quais alguns são citados neste trabalho.

Hugo Rodrigues Página 3


UNL-FCSH | Tecnologias aplicadas à Gestão da Informação Biblioteconómica
XML e Bibliotecas

O XML
O XML (eXtensible Markup Language) é uma linguagem/formato de marcação de
dados. Foi criada para estruturar, armazenar e transportar informação. Não define
parâmetros de visualização como o layout, logo há uma separação do suporte e do
conteúdo. O XML deriva do SGML1 (Standard Generalizes Markup Language) que
define uma norma para linguagens de marcação.
A estrutura formal do XML é definida através do DTD (Document Type
Definition) ou um XML Schema uma vez que as marcações (tags e atributos) não são
predefinidas como acontece com o HTML2.
O XML foi desenhado para ser auto-descritivo e é uma recomendação da W3C (World
Wide Web Consortium). O XML suporta UNICODE o que significa que é possível a
utilização de vários alfabetos.
O XML simplifica a partilha de dados por ser um formato de texto, ao contrário
de outros formatos (proprietários ou não) que são incompatíveis entre si.
Foram desenvolvidas várias linguagens baseadas no XML tais como o RSS,
XHTML e formatos como o Office Open XML (Microsoft Office) , Opendocument
(OpenOffice).
Para a visualização duas possíveis formas:
CSS – Cascading Style Sheets: linguagem de formatação que permite adicionar
estilo de apresentação (fontes, cores, localização do elemento, tamanho, cor,
etc.)
XSL - Extensible Style Language: linguagem de formatação alterar a ordem de
visualização dos elementos, executar computação com base nos elementos,
adicionar conteúdo a um documento, combinar múltiplos documentos.

O XHTML (Extensible HyperText Markup Language) é igualmente uma linguagem


de marcação. Junta funcionalidades do HTML e do XML com o objectivo de tornar o
HTML mais flexível ao nível do conteúdo.

1
ISO 8879:1986
2
O HTML foi desenhado para a visualização de dados ao contrário do XML que foi desenhado para
descrever a estrutura dos dados (por exemplo: um documento)

Hugo Rodrigues Página 4


UNL-FCSH | Tecnologias aplicadas à Gestão da Informação Biblioteconómica
XML e Bibliotecas

Utilização do XML nas bibliotecas


As bibliotecas têm sido das primeiras organizações com forte implementação em
normas e desenvolvimento e utilização de sistemas de informação Por esta razão as
bibliotecas necessitam de mudar o seu posicionamento no que toca às relações
interbibliotecas e bibliotecas/resto do mundo. Esta necessidade torna-se urgente se
pensarmos no ambiente Web em que vivemos.
Os utilizadores notam uma décalage entre as formas de pesquisa e serviços
oferecidos por motores de busca como o Google, as lojas online como a Amazon e os
catálogos das bibliotecas. A informação que consta num catálogo muitas vezes não
passa de uma lista ordenada de existências com um valor acrescentado desajustado em
relação às expectativas. Por outro lado, o vasto conjunto de dados (metadados) que as
bibliotecas produziram ao longo da sua existência parece não estar visível na internet.
Em parte, isto deve-se à criação de um círculo fechado de normas e formatos de uso
apenas por parte do sistema biblioteconómico – a própria biblioteca e os seus
utilizadores directos – e que tem sido um obstáculo à sua importância na sociedade de
informação.
As vantagens do uso do XML nas bibliotecas são principalmente a possibilidade
de partilha, pesquisa e recuperação de informação disponíveis em sistemas e formatos
diferentes na Internet, possibilidade de codificação de metadados numa ferramenta de
uso generalizado e transmissão, manipulação e arranjo dos dados para visualização de
acordo com o pretendido. (Caudle 2003)
Desta forma, a conversão das bases de dados das bibliotecas em XML pode ser
um meio para os catálogos poderem ser referenciados não só nos motores de busca
(Carvalho e Cordeiro, 2002) como também num conjunto de serviços Web externos à
biblioteca como redes sociais, blogues e portais especializados. Só assim a biblioteca
poderá estar a cumprir a sua missão junto do seu utilizador.
Em causa está a interoperabilidade de sistemas, o que significa que a
comunicação entre os sistemas só é possível se se minimizar a incompatibilidade entre
formatos e linguagens. Uma outra vantagem para as bibliotecas é a redução de custos
inerentes à adopção de um formato abrangente como o XML.

Hugo Rodrigues Página 5


UNL-FCSH | Tecnologias aplicadas à Gestão da Informação Biblioteconómica
XML e Bibliotecas

Algumas aplicações do XML às bibliotecas


A codificação da informação produzida pela biblioteca em XML permite a
utilização e reutilização em vários contextos muito para além do seu catálogo.
A tendência em tornar o catálogo da biblioteca num portal agregador de
informação não só com a descrição de documentos em vários suportes mas também com
outra informação de outras bibliotecas quer com a criação de catálogos colectivos ou
simplesmente com a incorporação de dados relevantes para o utilizador no momento da
pesquisa.

MARC em XML
A Biblioteca do Congresso desenvolveu em 2001 o MARCXML um XML
Schema com o propósito de permitir a conversão de um registo em MARC 21 para o
formato MARC 21 XML. Em 2004 começou a ser desenvolvido o MarcXchange cuja
base é a mesma do MARCXML mas que é compatível com os MARC locais e o
UNIMARC. O MarcXchange pode ser usado com vários objectivos: representação de
registo(s) MARC em XML, troca de registos MARC em XML, manipulação, utilização
de web services para transferência de registos MARC (SRW), para utilização do
protocolo OAI-PMH3 e como metadados de um recursos electrónico, entre outros.
O protocolo Z39.50 está também a ser modernizado através do SRU
(Search/Retrieve via URL) e SRW (Search/Retrieve Web service) que utilizam o
protocolo HTTP. Os resultados das interrogações estão no formato XML.

RSS
O RSS (Really Simple Sindication ou Rich Site Summary ou RDF Site
Summary) é um formato baseado em XML e foi criado para a difusão de informação na
Web. Os leitores para este formato são os navegadores Web nas versões mais recentes,
software dedicado e ainda serviços Web como o Google Reader. Outras possibilidades
são a incorporação de uma API (Application Programming Interface) no próprio site.
Este é uma ferramenta útil para as bibliotecas na medida em que podem publicar
informação e conteúdos em vários momentos da navegação Web do utilizador ou
mesmo no seu dispositivo móvel (telemóvel, pda, smartphone, netbook, etc.). As
informações mais habitualmente difundida pelas bibliotecas em feeds RSS são notícias e
3
O protocolo OAI-PMH (Open Archives Iniative. Protocol for metadata harvesting) recolhe os
metadados em Dublin Core e codifica-os em XML para difusão.

Hugo Rodrigues Página 6


UNL-FCSH | Tecnologias aplicadas à Gestão da Informação Biblioteconómica
XML e Bibliotecas

últimas aquisições. É de destacar o exemplo da Biblioteca de Arte da Fundação


Calouste Gulbenkian (Leitão 2010) na utilização do RSS quer na utilização de feeds
automáticos na pesquisa quer nos feeds de periódicos produzidos pela biblioteca.

WorldCat
O WorldCat é um catálogo colectivo alimentado pelas bibliotecas aderentes de
todo mundo, criado pela OCLC. A implementação de soluções em XML está presente
em várias partes do sítio Web.
Como exemplo do exposto no capítulo anterior, o WorldCat Search API (Web
service)4:
How the API works

Send searches in OpenSearch or SRU CQL syntax


Receive OpenSearch responses in RSS or Atom format
Receive SRU responses in MARC XML or Dublin Core
Receive MARC XML content for a single OCLC record
Receive geographically-sorted library holdings information (each including the institution's name,
location and a catalog link) within requests for single records
Receive records in standard bibliographic citation formats (APA, Chicago, Harvard, MLA, and
Turabian)

Nesta API não só o resultado da pesquisa é feita em formato XML, mas também
é possível receber o registo bibliográfico em vários formatos de citação. Este é um
excelente exemplo de flexibilidade na apresentação da informação, ou seja, o mesmo
conteúdo pode ser apresentado em MARC, RSS, Atom e nos formatos de citação APA ,
Chicago. Outros formatos de exportação estão disponíveis a partir da visualização de
registo.

4
http://www.worldcat.org/affiliate/tools?atype=wcapi

Hugo Rodrigues Página 7


UNL-FCSH | Tecnologias aplicadas à Gestão da Informação Biblioteconómica
XML e Bibliotecas

Conclusão
A vantagem tecnológica que as bibliotecas possuíam pela adopção de
tecnologias para os seus registos bibliográficos foi sendo atenuada com a dificuldade
em acompanhar a evolução do ambiente Web. Em parte devido à manutenção de
processos de tratamento documental cuja origem está nas fichas manuais aliada a
problemas na partilha de informação fora do contexto biblioteconómico devido a
formatos de círculo restrito como o MARC e o Z39.50.
O desafio da mudança e da actualização não só tecnológica mas também de
normas e formatos está a ser encarado pelas bibliotecas como uma necessidade que se
não for alcançada pode significar a perda de influência da biblioteca no domínio da
informação.
O XML é visto como a esperança para a entrada em ambientes além-muros da
biblioteca tais como redes sociais, blogues e o telemóvel. O catálogo da biblioteca terá
também que sofrer uma adaptação, concentrando serviços, disponibilizando informação
relevante a utilizadores únicos no momento que em que precisam dela.

O resultado destes esforços por parte das bibliotecas começa a ser timidamente
visível mas parece evidente que há um longo caminho a percorrer. Alguns exemplos de
boas práticas neste campo que foram apresentadas neste trabalho dão, com certeza, um
novo alento a projectos noutras bibliotecas.

Hugo Rodrigues Página 8


UNL-FCSH | Tecnologias aplicadas à Gestão da Informação Biblioteconómica
XML e Bibliotecas

Bibliografia

BANERJEE, Kyle – How Does XML Help Libraries? In Computer Libraries. Vol. 22,
N.º8. [Em linha]. 2002. Disponível em
<http://www.infotoday.com/cilmag/sep02/banerjee.htm> Acedido em: 09/06/2010

CAUDLE, Dana M. – The Catalog of the Future: Integrating Electronic Resources.


[PDF] 2003

CARVALHO, Joaquim de; CORDEIRO, Maria Inês – XML and bibliographic data: the
TVS (Transport, Validation and Services) model. In 68th IFLA Council and General
Conference August 18-24. [PDF]. 2002.

JOHNSON, Bruce Chr – XML and MARC: Which is “Right”?. In Cataloging &
Classification Quarterly, 32: 1, 81-90. [Em linha]. 2002. Disponível em:
<http://dx.doi.org/10.1300/J104v32n01_07> Acedido em: 09/06/2010

LEITÃO, Paulo - A Revolução RSS e as Bibliotecas. [PDF]. [2010]

YOTT, Patrick – Introduction to XML. In Cataloging & Classification Quarterly, 40:


3, 213- 235. [Em linha]. 2005. Disponível em
<http://dx.doi.org/10.1300/J104v40n03_10> Acedido em: 09/06/2010

Hugo Rodrigues Página 9

Vous aimerez peut-être aussi