Académique Documents
Professionnel Documents
Culture Documents
por
Trabalho Individual I
SUMÁRIO
LISTA DE FIGURAS....................................................................................................... 6
LISTA DE TABELAS....................................................................................................... 7
RESUMO ........................................................................................................................ 8
1 INTRODUÇÃO............................................................................................................. 9
1.1 MOTIVAÇÃO ......................................................................................................................... 9
1.2 OBJETIVOS ......................................................................................................................... 11
1.3 ESTRUTURA DO TRABALHO ............................................................................................... 11
2 CONCEITOS E POSICIONAMENTOS RELACIONADOS À TEMÁTICA DAS BDS. 12
2.1 PREÂMBULO ....................................................................................................................... 12
2.2 BIBLIOTECA DIGITAL SEGUNDO CHRISTINE L. BORGMAN ................................................ 12
2.3 BIBLIOTECA DIGITAL SEGUNDO A DIGITAL LIBRARY FEDERATION..................................... 13
2.4 BIBLIOTECA DIGITAL SEGUNDO RICARDO BAEZA-YATES E BERTHIER RIBEIRO-NETO ... 14
2.5 BIBLIOTECA DIGITAL SEGUNDO GARY MARCHIONINI E SEUS CO-AUTORES ..................... 14
2.6 BIBLIOTECA DIGITAL SEGUNDO WILLIAM Y. ARMS ......................................................... 15
2.7 CONSIDERAÇÕES ................................................................................................................ 15
3 PADRÕES DE FORMATO E MARCAÇÃO EM BD................................................... 18
3.1 PREÂMBULO ....................................................................................................................... 18
3.2 PDF - PORTABLE DOCUMENT FORMAT ............................................................................... 18
3.3 PS - POST SCRIPT ................................................................................................................ 20
3.4 HTML - HYPERTEXT MARKUP LANGUAGE E SGML - STANDARD GENERALIZED MARKUP
LANGUAGE................................................................................................................................ 21
3.5 XML - EXTENSIBLE MARKUP LANGUAGE............................................................................ 21
3.5.1 Vantagens da linguagem XML ................................................................................... 22
3.5.2 Usos do padrão XML.................................................................................................. 25
3.6 CONSIDERAÇÕES ................................................................................................................ 25
4 METADADOS EM BD................................................................................................ 26
4.1 PREÂMBULO ....................................................................................................................... 26
4.2 INTEROPERABILIDADE ....................................................................................................... 28
4.3 CONJUNTOS DE ELEMENTOS DE METADADOS .................................................................... 29
4.3.1 DC - Dublin Core........................................................................................................ 30
4.3.2 MARC - MAchine-Readable Cataloging.................................................................... 32
4.3.3 RDF - Resource Description Framework.................................................................... 34
4.4 CONSIDERAÇÕES ................................................................................................................ 35
5 ARQUITETURAS PARA BDS ................................................................................... 37
5.1 PREÂMBULO ....................................................................................................................... 37
5.2 ARQUITETURA DE INFORMAÇÕES ...................................................................................... 37
4
LISTA DE ABREVIATURAS
DC - Dublin Core
BD - Biblioteca Digital
RI - Recuperação de Informação
LISTA DE FIGURAS
Figura 1 Conversão MARC 21 (2709) de/para MARC 21 (XML) [MARC 02] ............. 33
Figura 2 Partes de um objeto digital [ARMS 95]........................................................ 39
Figura 3 Exemplo de um container WF [LAGOZE 96] ............................................... 41
7
LISTA DE TABELAS
RESUMO
Ainda, para melhor suportar operações nas BDs, é necessário construir uma
arquitetura tanto para informação quanto para metadados. Essas arquiteturas também
serão abordadas.
1 INTRODUÇÃO
1.1 Motivação
Carl Lagoze e David Fielding, em [LAGOSE 98], consideram que existem três
características básicas para o sucesso da Web. Por sua universalidade, qualquer
pessoa pode participar, na Web, como autor, editor ou cliente, com um investimento
mínimo de hardware e conhecimento. Por sua uniformidade, recursos, serviços e
usuários participam na Web como iguais, em um espaço comum de informações. Por
sua descentralização, a Web é fundamentalmente desorganizada, exceto em nível
técnico de protocolos e mecanismos de tráfego, onde existe um padrão praticamente
estabelecido.
Estes princípios, que são fundamentais para o sucesso da Web, são também o
núcleo dos problemas que freqüentemente perturbam os usuários. Universalidade, ao
extremo, pode ser traduzida por "quantidade sem qualidade", assim justificando, por
exemplo, que materiais estritamente acadêmicos co-existam com conteúdos
impróprios para crianças. Uniformidade significa que ferramentas, tecnologias de
domínio específico e diretrizes essenciais para usar muitas classes de informação (por
exemplo, geo-espacial, estatística, científica, etc.) são difíceis ou, até mesmo,
impossíveis de encontrar. Descentralização freqüentemente significa que é difícil impor
as estruturas organizacionais necessárias, garantindo a integridade - por exemplo,
confiabilidade e acessibilidade, segurança e privacidade para conteúdos e usuários, e
preservação de informação. Através da adoção de padrões é possível (a) separar
conteúdos próprios de cada domínio do conhecimento (b) facilitar a busca por
tecnologias específicas e (c) organizar as informações de forma estruturada, tanto na
Web quanto nas BDs.
10
1.2 Objetivos
2.1 Preâmbulo
Nos últimos anos têm surgido diversas terminologias para bibliotecas não
convencionais. Segundo Murilo Bastos da Cunha, em [CUNHA 97], a biblioteca digital
é também conhecida como biblioteca eletrônica (principalmente no Reino Unido),
biblioteca virtual, biblioteca sem paredes e biblioteca cibernética.
Uma característica relevante em uma BD, que não é descrita neste conceito,
refere-se à utilização de metadados. Devido à grande quantidade de informações
disponíveis em uma BD e às diversas atividades envolvidas, é bastante importante
que um conceito de BD mencione os metadados. Os metadados serão abordados no
capítulo 4.
1
Consórcio de bibliotecas e agências relacionadas que usam tecnologias de informação
eletrônica para estender suas coleções e serviços.
14
Por outro lado, Gary Marchionini não menciona que BDs são coleções de
informação que usam metadados e realizam serviços, tais como busca, acesso e
apresentação, entre outros.
15
2.7 Considerações
Além desses elementos comuns, as coleções das BDs são compostas por
artefatos digitais, tais como filmes e arquivos de áudio, que não podem ser
representados ou distribuídos em formato impresso.
À luz dos conceitos e dos principais elementos das BDs, conclui-se que coleções
digitais efetivas são sistemas sócio-técnicos complexos. Uma coleção efetiva requer
atenção consistente e simultânea a vários interesses sociais, organizacionais,
administrativos e técnicos, conforme Michael Jones, em [JONES 99].
16
1
Tratamento da informação: acessar, indexar, visualizar, distribuir, gerenciar, entre outros
serviços.
17
3.1 Preâmbulo
importante esclarecer que esta tabela foi elaborada por uma empresa comercial e tem
como objetivo a comercialização do produto.
No contexto das BDs, são de interesse específico os dois últimos itens, uma vez
que a aplicação básica do formato PS é descrever a aparência do texto, formas
gráficas e imagens impressas ou apresentadas em vídeo. Este formato permite editar
o conteúdo dos documentos, possui baixa complexidade na formatação do conteúdo e
é amplamente utilizado quando os documentos precisam ser impressos. Pelo fato de
já existir um grande número de documentos no formato PS, muitas aplicações utilizam
este formato para troca de documentos.
Uma vantagem, em relação aos padrões PDF e PS, se refere ao tamanho final
do arquivo que, usando HTML e SGML, é menor. Por outro lado, a maior desvantagem
da linguagem SGML, em relação à HTML e à recente XML, é o nível de complexidade.
Somente grandes empresas estão trabalhando com SGML. Isso se deve ao fato de as
mesmas possuírem mais recursos humanos, pessoais e financeiros para suportar as
dificuldades impostas pela complexidade. Assim, o uso da linguagem SGML ficou
bastante restrito, fazendo com que este padrão fosse dificilmente adotado por
pequenas e/ou médias empresas.
1
International Federation of Library Associations - http://www.ifla.org
22
vantagens, proporcionadas pelo uso da linguagem XML em BDs, são descritas por
Eric V. Herwijnen, em [HERWIJNEN 00]:
A linguagem XML provê outras facilidades para as BDs, tais como melhor
identificação semântica dos conteúdos, herdar documentos de BDs já existentes pela
adição de links sem modificar os documentos fonte [BAUER 01], e aumento da
velocidade de RI em BDs [BARU 99], [CHRISTEL 01].
Eric V. Herwijnen, em [HERWIJNEN 00], analisa três áreas de uso potencial para
XML:
2) Como uma linguagem de troca entre sistemas (de BDs, por exemplo).
3.6 Considerações
4 METADADOS EM BD
4.1 Preâmbulo
Metadado pode ser definido como “dado estruturado sobre dado”. De acordo
com Date, em [DATE 91], metadados são “descrições de outros objetos no sistema, ao
invés de simples ’dados em bruto’ ”. Para Ricardo Baeza-Yates e Berthier Ribeiro-
Neto, em [BAEZA-YATES 99], metadados são atributos de dados ou documentos,
normalmente descritivos, com informações sobre autor e conteúdo, freqüentemente
subdivididos em categorias ou facetas, tipicamente mantidos em um catálogo,
algumas vezes registrado de acordo com algum framework, como os padrões DC -
Dublin Core (ver seção 4.3.1) ou MARC (ver seção 4.3.2). O conceito de metadados,
quando aplicado ao contexto de bibliotecas, digitais ou tradicionais, normalmente
refere-se a informação que [SMITH 96]:
1
Do inglês contentful
28
4.2 Interoperabilidade
1
Do inglês truncation
2
Palavras que podem ser eliminadas no pré-processamento de textos (por exemplo, “de”,
“por”, “pelo”, etc.).
29
Definir essas cooperações é difícil, mas o desafio central é criar incentivos para
que BDs independentes participem de tais operações. Apesar de ser uma
característica desejada nos sistemas, a interoperabilidade plena dificilmente é atingida
– mesmo quando se trata de sistemas relativamente atuais [PACHECO 01].
O Dublin Metadata Core Element Set (ou Dublin Core, de forma abreviada) é
uma lista de treze elementos de metadados principais, criada pelos participantes do
OCLC/NCSA Metadata Workshop, realizado em março de 1995. Este foi um encontro
de especialistas provenientes de áreas como biblioteconomia, computação e,
especificamente, Processamento de Linguagem Natural.
O objetivo do grupo era criar uma ferramenta para descrição de metadados que
fosse fácil de ser utilizada, além de ajudar as pessoas a encontrar informações
eletrônicas de modo similar ao provido por um sistema de busca de uma biblioteca.
1
http://dublincore.org/documents/1998/09/dces/#
2
Do inglês trust
31
Title
Subject
Description
Author ou Creator
Publisher
OtherAgent ou Contributor
Date
ObjectType
Form or Format
Identifier
Relation
Source
Language
Coverage
Rights
Tabela 5 Resumo dos principais elementos de metadados do Dublin Core
• uma descrição do item, tal como título, descrição física, edição, etc.
1
Do inglês subject headings
34
4.4 Considerações
1
http://ltsc.ieee.org/
2
http://www.adlnet.org/
3
http://www.fgdc.gov/metadata/contstan.html
4
http://www.gils.net/
36
metadados [BLANCHI 01]. Entretanto, ainda existe muita confusão sobre como o
metadado deve ser integrado aos sistemas de informação, devido a questões tais
como [DUVAL 02]: “Como ele é criado ou estendido? Quem o gerenciará? Como ele
pode ser usado ou "trocado"? De onde vem sua autorização? Diferentes padrões de
metadados podem ser usados juntos em um dado ambiente?” Outra questão que
ainda causa dúvida é: “Quais tipos de metadados são importantes para um
determinado ambiente?” Todas estas questões têm motivado o estudo sobre
metadados neste trabalho.
5.1 Preâmbulo
• Relacionamentos
• Formatos
• Versões
Pela dinamicidade com que objetos digitais mudam, versões diferentes são
criadas continuamente (por exemplo, algumas empresas modificam suas home pages
várias vezes por mês). Versões podem diferir por um simples bit ou podem ser
bastante diferentes. Quando um material é convertido para a forma digital, o item físico
original pode ser convertido diversas vezes. Por exemplo, uma foto digitalizada pode
ter uma versão em alta resolução, outra em média resolução ou, ainda, ser
representada de forma minimizada, em baixa resolução.
• Direitos e permissões
• Componentes
Handle
Propriedades
Log de
transação
Conteúdo
(bits)
Assinatura
(opcional)
1
Por objeto digital entenda-se informação armazenada em formato digital, por exemplo,
documento, música, filme, figura, etc.
40
método que sirva para garantir que um objeto não tenha sido trocado.
Freqüentemente, é útil manter um log de todas as transações associadas a cada
objeto digital.
Alexa McCray e Marie Gallagher, em [MCCRAY 01], afirmam que se deve levar
em consideração fatores como preservação e persistência dos objetos digitais na
construção de BDs. Preservação refere-se à longevidade e qualidade técnica de um
objeto; persistência implica um compromisso na manutenção do objeto, de modo que
ele continue existindo e acessível.
De acordo com Erik Duval, em [DUVAL 02], arquitetura de metadados pode ser
definida como uma coleção coerente de tecnologias, conjuntos de elementos e
padrões que coletivamente suportam a criação, gerenciamento e troca de metadados
interoperáveis.
container
pacote
Dublin Core
pacote
registro MARC
• Pacotes Simples: São pacotes contendo metadados, tais como DC, registros
MARC, assinaturas digitais, etc. Esses pacotes utilizam sintaxe e modelos de
dados específicos de uma comunidade.
42
BDs devem ser capazes de fazer inferência sobre o seu conteúdo para
reformular consultas, customizar serviços para a tarefa e o usuário, deduzir novas
relações entre trabalhos e assim por diante. Especificamente, os metadados devem
suportar inferência [WEINSTEIN 98] pois, em todos os contextos, metadados ajudam
as pessoas a (1) encontrar o que elas precisam, (2) verificar a autenticidade de um
objeto digital, (3) processar esses objetos em um formato apropriado [ALLOWAY 99].
5.4 Considerações
6 CONCLUSÃO
Inicialmente, foi realizada uma abordagem dos conceitos de BDs sob diversos
pontos de vista. Alguns conceitos enfatizam algumas partes de uma BD mais do que
outras. Contudo, foi possível visualizar todos os componentes a serem levados em
consideração, na conceitualização de uma BD.
Após concluído este estudo e identificado o estado da arte sobre BDs no ano de
2002, surgiram algumas idéias para trabalho futuro, as quais são apresentadas na
seção que segue.
REFERÊNCIAS BIBLIOGRÁFICAS
[ALLOWAY 99] ALLOWAY, Gene et al. Metadata for Digital Libraries: a Research
Agenda. EU-NSF Working Group on Metadata. Webreferência
disponível por URL: http://www.iei.pi.cnr.it/DELOS/NSF/metadata.
html. Acessado em (13/06/2002).
[ANDREONI 99] ANDREONI, Antonella et al. The ERCIN Technical Reference Digital
Library. In D-Lib Magazine, dezembro de 1999, Vol. 5 Nrº. 12.
[ARMS 95] ARMS, W. Y. Key Concepts in the Architecture of the Digital Library. In D-
Lib Magazine, Julho de 1995.
[BARU 99] BARU, Chaitanya et al. XML-Based Information Mediation for Digital
Libraries, Proc. of ACM Conf. on Digital Libraries, Berldey, August,
1999.
47
[BAUER 01] BAUER, Michael G.; SPECHT, Gunther. Enhancing Digital Library
Documents by Aposteriori Cross Linking Using XSLT. Institut fur
Informatik, TU Munchen Lecture Notes in Computer Science, 2001.
[BORGMAN 96] BORGMAN, Christine L. et. al. Social Aspects of Digital Libraries.
UCLA-NSF Social Aspects of Digital Libraries Workshop, Los
Angeles, California, February 1996.
[BRAY 00] BRAY, T. et al. Extensible Markup Language (XML) 1.0 (Second Edition)
W3C Recommendation (outubro 2000). Webreferência disponível
por URL: http://www.w3c.org/TR/REC-xml. Acessado em
(05/07/2002).
48
[CHRISTEL 01] CHRISTEL, Michael G.; MAHER, Bryan; BEGUN, Andrew. XSLT for
tailored access to a digital video library. JCDL 2001 - Proceedings of
the first ACM/IEEE-CS Joint Conference on Digital libraries,
2001, Roanoke, Virginia, United States, June 24-28.
[COLE 00] COLE, Timothy W.; Allen, PAT; SCHMITZ, John. Building an outreach
digital library collection. In Illinois ACRL Spring 2000 Conference,
13 de abril de 2000.
[CUNHA 97] CUNHA, Murilo Bastos da. Biblioteca Digital: bibliografia internacional
anotada. Ciência da Informação, Brasília, Vol. 26, Nrº. 2, p. 195-
213, 1997.
[DANIEL 98] DANIEL, Ron Jr.; LAGOZE, Carl; PAYETTE, Sandra D. A Metadata
Architecture for Digital Libraries. Proceedings of the Advances in
Digital Libraries Conference ADL98, IEEE, April 1998.
[DC 98] Dublin Core Metadata Element Set, Version 1.0: Reference Description.
Webreferência disponível por URL: http://dublincore.org/documents/
1998/09/dces/# . Acessado em (06 junho 2002).
[DUVAL 02] DUVAL, Erik et al. Metadata Principles and Practicalities. In D-Lib
Magazine, abril de 2002, Vol. 8 Nrº. 4.
[EXNER 98] EXNER, Nina; TURNER, Linda F. Examining XML: New Concepts and
Possibilities in Web Authoring. Computers in Libraries 18.10
(Nov/Dec 1998). Webreferência disponível por URL: http://www-
diglib.stanford.edu/diglib/pub/reports/iita-dlw/main.html. Acessado em
(17/06/2002).
[FENSEL 00] FENSEL, Dieter. The semantic web and its languages. IEEE Intelligent
Systems 2000 (November/December 2000). Webreferência
disponível por URL: http://www.cs.man.ac.uk/~horrocks/Publications/
download/2000 /faqs-on-oil.pdf. Acessado em (05/07/2002).
[FLECKER 00] FLECKER, Dale. Harvard´s library Digital Initiative. Building a First
Generation Digital Library Infrastructure. In D-Lib Magazine,
novembro de 2000, Vol. 6 Nrº. 11.
[GILL 02] GILL, Tony; MILLER, Paul. Re-inventing the wheel? Standards,
Interoperability and Digital Cultural Content. In D-Lib Magazine,
janeiro de 2002, Vol. 8 Nrº. 1.
[HAIGH 98] HAIGH, Susan. A Glossary of Digital Library Standards, Protocols and
Formats. Webreferência disponível por URL: http://www.nlc-
bnc.ca/9/1/p1-253-e.html. Acessado em (08/07/2002).
[HAROLD 99] HAROLD, Elliotte Rusty. XML Bible. 1ª Ed., Chicago: IDG Books, 1999.
[HEARST 99] HEARST, Marti A. The use of categories and clusters for
organizing retrieval results. In Natural language information
retrieval: Text, Speech and Language Technology. Eds. Tomek
Strzalkowski. Dordrecht. Kluwer Academic, 1999. 384 p..
[HERWIJNEN 00] HERWIJNEN, Eric Van. The impact of XML on library procedures and
services. High Energy Physics Libraries Webzine, Issue 1, Março
2000.
50
[JONES 99] JONES, Michael L. W.; GAY G. K.; RIEGER R. H. Project Soup Comparing
evaluations of digital collection efforts. In D-Lib Magazine, Novembro
de 1999, Vol. 5 Nrº. 11.
[MADNICK 01] MADNICK, Stuart E. The Misguided Silver Bullet: What XML Will and Will
NOT Do to Help Information Integration. Working Papers MIT,
August 2001. Webreferência disponível por URL: http://ebusiness.mit.
edu/research/papers-number.html. Acessado em (11/07/2002).
[MARCHIONIINI 02] MARCHIONINI, Gary et al. (in press). The people in digital
libraries: multifaceted approaches to assessing needs and
impact. In A. Bishop et al. Digital library use: social practice in design
and evaluation. MIT Press forthcoming. Webreferência disponível:
http://ils.unc.edu/~march/revision.pdf. Acessado em (07/06/2002).
[MCCRAY 99] MCCRAY, A.; GALLAGHER, M.; FLANNICK, M. Extending the role of
metadata in a digital library system. In Proceedings of the IEEE
Forum on Research and Technology Advances in Digital
Libraries (Baltimore, May 19--21). IEEE Computer Society, Los
Alamitos, CA, 1999, 190--199.
51
[MCCRAY 01] MCCRAY, Alexa T.; GALLAGHER, Marie E. Principles for digital
library development. Communications of the ACM. Volume 44,
Issue 5 (May 2001).
[NURNBERG 95] NURNBERG, Peter J. et al. Digital Libraries: Issues and Architectures.
In Proceedings of The Second International Conference on the
Theory and Practice of Digital Libraries, pages 147--153, June
1995.
[PACHECO 01] PACHECO, Roberto Carlos Santos; KERN, Vinícius Medina. Uma
ontologia comum para a integração de bases de informações e
conhecimento sobre ciência e tecnologia. Ciência da Informação,
Brasília, Vol. 30, Nrº. 3, p. 56-63, 2001.
[RAABE 98] RAABE, André; FILHO, Omer Pohlmann. Estudo comparativo entre
sistemáticas de digitalização de documentos: formatos HTML e PDF.
Ciência da Informação, Brasília, Vol. 27, Nrº. 3, p. 300-310, 1998.
52
[RUSBRIDGE 98] RUSBRIDGE, Chris. Towards the Hybrid Library. In D-Lib Magazine,
Julho/agosto de 1998.
[SNOWHILL 01] SNOWHILL, Lucia. E-books and Their Future in Academic Libraries.
In D-Lib Magazine, julho/agosto de 2001, Vol. 7 Nrº. 7/8.
[SULEMAN 00] SULEMAN, Hussein; FOX, Edward A.; ABRAMS, M. Building Quality
into a Digital Library In Proceedings of the Fifth ACM Conference
on Digital Libraries, June, 2000.
[TENNANT 01] TENNANT, Roy. XML: The Digital Library Hammer. Library Journal,
3/15/2001.
BIBLIOGRAFIA COMPLEMENTAR
[FREW 96] FREW, James et al. The Alexandria Digital Library Testbed. In D-Lib
Magazine, Julho/agosto de 1996.
[MOEN 95] MOEN, William. ANSI/NISO Z39.50 Protocol: information retrieval in the
information infrastructure [on-line]. Webreferência disponível por:
http://www.cni.org/pub/NISO/docs/Z39.50-brochure/. Acessado em
(10/06/2002).
[WOLFF 00] WOLFF, J. E.; FLORKE, H.; CREMERS, A. B. Searching and browsing
collections of structural information. In Proc. of the IEEE Advances
in Digital Libraries, pages 141--150, USA, May 2000. 17.