Armazenagem e manuseio
Conservao
Meio Ambiente
Emergncias
1. Mtodos de armazenamento e prticas de
manuseio
2. A limpeza de livros e de prateleiras
3. A escolha de invlucros de qualidade
arquivstica para armazenagem de livros e
documentos
4. Invlucros de carto para pequenos livros
5. A jaqueta de polister para livros
6. Suporte para livros: descrio e usos
7. Montagens e molduras para trabalhos
artsticos e artefatos em papel
8. Mobilirio de armazenagem: um breve
resumo das opes atuais
9. Solues para armazenagem de artefatos
de grandes dimenses
10. Planificao do papel por meio de
umidificao
11. Como fazer o seu prprio passe-partout
12. Preservao de livros de recortes e lbuns
13. Manual de pequenos reparos em livros
14. Temperatura, umidade relativa do ar, luz e
qualidade do ar: diretrizes bsicas de
preservao
15. A proteo contra danos provocados pela
luz
16. Monitoramento da temperatura e
umidade relativa
17. A proteo de livros e papis durante
exposies
18. Isopermas: uma ferramenta para o
gerenciamento ambiental
19. Novas ferramentas para preservao-
avaliando os efeitos ambientais a longo prazo
sobre colees de bibliotecas e arquivos
20. Planejamento para casos de emergncia
21. Segurana contra as perdas: danos
provocados por gua e fogo, agentes
biolgicos, roubo e vandalismo
22. Secagem de livros e documentos
molhados
23. A proteo de colees durante obras
24. Salvamento de fotografias em casos de
emergncia
25. Planilha para o delineamento de planos
de emergncia
26. Controle integrado de pragas
27. A proteo de livros e papel contra o
mofo
28. Como lidar com uma invaso de mofo:
instrues em resposta a uma situao de
emergncia
29. Controle de insetos por meio de gases
inertes em arquivos e bibliotecas
Planejamento
Edifcio/Preservao
Fotografias e filmes
Registros sonoros e fitas magnticas
Reformatao
30. Planejamento para preservao
31. Polticas de desenvolvimento de coleo e
preservao
32. Planejamento de um programa eficaz de
manuteno de acervos
33. Desenvolvimento, gerenciamento e
preservao de colees
34. Seleo para preservao: uma
abordagem materialstica
35. Consideraes complementares sobre:
"Seleo para preservao: uma abordagem
materialstica"
36. Implementando um programa de reparo
e tratamento de livros
37. Programa de Planejamento de
Preservao: um manual para auto-instruo
de bibliotecas
38. Consideraes sobre preservao na
construo e reforma de bibliotecas:
planejamento para preservao
39. Preservao de fotografias: mtodos
bsicos para salvaguardar suas colees
40. Guia do Image Permanence Institute (IPI)
para armazenamento de filmes de acetato
41. Indicaes para o cuidado e a
identificao da base de filmes fotogrficos
42. Armazenamento e manuseio de fitas
magnticas
43. Guarda e manuseio de materiais de
registro sonoro
44. O bsico sobre o processo de digitalizar
imagens
45. Microfilme de preservao: plataforma
para sistemas digitais de acesso
46. O processo decisrio em preservao e
fotocopiagem para arquivamento
47. Controle de qualidade em cpias
eletrostticas para arquivamento
48. Microfilmagem de preservao: um guia
para bibliotecrios e arquivistas
49. Do microfilme imagem digital
50. Uma abordagem de sistemas hbridos
para a preservao de materiais impressos
51. Requisitos de resoluo digital para textos:
mtodos para o estabelecimento de critrios
de qualidade de imagem
52. Preservao no universo digital
53. Manual do RLG para microfilmagem de
arquivos
Ttulos Publicados
CONSERVAO PREVENTIVA
EM BIBLIOTECAS E ARQUIVOS
49
Do microfilme imagem digital
2 edio
a
Donald J. Waters
capa 49.ps
D:\Trabalho\Clientes\CPBA\Capas Final\capa 49.cdr
ter a-feira, 19 de junho de 2001 18:08:54
Perfil de cores: Desativado
Composi o Tela padro
Do miorofilme o imoQem oiQifol.
oomo exeoufor um projefo poro esfuoo oos
meios, ousfos e benefioios oe oonversoo
poro imoQens oiQifois oe Qronoes
quonfioooes oe oooumenfos
preservooos em miorofilme
2
o
eoioo
Donald J. Waters
Pio oe Joneiro
Projefo Conservooo Prevenfivo em Bibliofeoos e Arquivos
2001
W329 Waters, Donald J.
Do microfilme a imagem digital : como executar um projeto para estudo dos
meios, custos e benefcios de converso para imagens digitais de grandes
quantidades de documentos preservados em microfilme / Donald J. Waters ;
[traduo Jos Luiz Pedersoli Jnior ; reviso tcnica Mauro Resende de
Castro, Ana Virginia Pinheiro, Dely Bezerra de Miranda Santos; reviso final
Cssia Maria Mello da Silva, Lena Brasil] . 2. ed. Rio de Janeiro : Projeto
Conservao Preventiva em Bibliotecas e Arquivos: Arquivo Nacional,
2001.
43 p. : il. ; 30 cm. (Conservao Preventiva em Bibliotecas e Arquivos;
49. Reformatao).
Inclui bibliografias.
ISBN 85-7009-053-6.
1. Microfilmagem. 2. Reprografia. I. Ttulo. II. Srie.
CDD 686.43
Copyright 1991 by The Commission on Preservation and Access.
Ttulo original, publicado por The Commission on Preservation and Access:
From Microfilm to digital imagery: on the feasibility of a project to study the means, costs and benefits of
converting large quantities of preserved library materials from microfilm to digital images.
Autor: Donald J. Waters
Projeto cooperativo interinstitucional Conservao Preventiva em Bibliotecas e Arquivos, em parceria com o
CLIR - Council on Library and Information Resources (Conselho de Recursos em Biblioteconomia e
Informao, que incorporou a antiga Commission on Preservation and Access).
Suporte Financeiro
The Andrew W. Mellon Foundation
Vitae, Apoio Cultura, Educao e Promoo Social
Apoio
Arquivo Nacional
Fundao Getulio Vargas
Coordenao
Ingrid Beck
Colaborao
Srgio Conde de Albite Silva
Traduo
Jos Luiz Pedersoli Jnior
Reviso Tcnica
Mauro Resende de Castro
Ana Virginia Pinheiro
Dely Bezerra de Miranda Santos
Reviso Final
Cssia Maria Mello da Silva
Lena Brasil
Projeto Grfico
TAI Comunicaes
Coordenao Editorial
Edna Pinheiro da Silva
Anamaria da Costa Cruz
Impresso em papel alcalino.
Sumrio
Apresentao 5
Prefcio da Commission on Preservation and Access 7
Introduo 9
Viso 10
Preservando o acesso atravs da preservao 14
Uma economia de escolhas 18
Arquitetura do sistema 25
Plano de trabalho 34
Concluso 42
Notas 43
4
5
Apresentao
O Projeto Conservao Preventiva em Bibliotecas e Arquivos - CPBA
uma experincia de cooperao entre instituies brasileiras e a organizao norte-
americana Commission on Preservation and Access, atualmente incorporada ao
CLIR - Council on Library and Information Resources (Conselho de Recursos
em Biblioteconomia e Informao).
Em 1997, o Projeto traduziu e publicou 52 textos sobre o planejamento e o
gerenciamento de programas de conservao preventiva, onde se insere o controle
das condies ambientais, a preveno contra riscos e o salvamento de colees em
situaes de emergncia, a armazenagem e conservao de livros e documentos, de
filmes, fotografias e meios magnticos; e a reformatao envolvendo os recursos da
reproduo eletrnica, da microfilmagem e da digitalizao.
Reunidos em 23 cadernos temticos, estes textos, somando quase mil pginas,
foram impressos com uma tiragem de dois mil exemplares e doados a colaboradores,
instituies de ensino e demais instituies cadastradas no banco de dados do Projeto.
Esta segunda edio revisada, com uma tiragem de mais dois mil exemplares,
pretende, em continuidade, beneficiar, as instituies e os profissionais de ensino, e
todas aquelas instituies inscritas no banco de dados depois de 1997 e que no
chegaram a receber os textos.
O presente caderno, de nmero 49, relata aspectos de um projeto de converso
de microfilme em imagem digital, desenvolvido nos Estados Unidos. Aborda no apenas
a tecnologia, mas a preocupao de assegurar a preservao da informao, o seu
uso e acesso. Apresenta um plano de trabalho para desenvolver sistemas prticos
para a converso de microfilme em imagem digital. Mapeia a arquitetura de um sistema
de reproduo digital de imagens, identificando pontos crticos. Ao final apresenta o
escopo do projeto aplicado na Universidade de Yale, em uma biblioteca de 10 mil
livros, digitalizados a partir de cpias em microfilme.
Este texto, assim como todo o conjunto de publicaes do Projeto CPBA,
encontra-se disponvel em forma eletrnica na pgina do Projeto, www.cpba.net.
Alm das publicaes distribudas em 1997, o Projeto CPBA ainda formou
multiplicadores, por meio de seminrios organizados nas cinco regies brasileiras,
com o apoio de instituies cooperativas. Os multiplicadores organizaram novos eventos,
estimulando a prtica da conservao preventiva nas instituies. No incio de 2001 o
projeto j contabilizava mais de 120 eventos realizados, somando mais de quatro mil
pessoas envolvidas. Os inmeros desdobramentos ocorridos a partir dos colaboradores
em todo o pas fizeram o Projeto merecedor, em 1998, do Prmio Rodrigo Melo Franco
de Andrade.
Entre 1997 e 2001, o Projeto CPBA continuou promovendo seminrios e
cursos, envolvendo as instituies cooperativas. Em muitas ocasies enviou professores
e especialistas aos eventos organizados pelos multiplicadores. No incio de 2001 o
Projeto j contabilizava mais de 120 eventos realizados em todo o pas, somando mais
de 4.000 pessoas envolvidas.
6
As instituies que colaboram com o Projeto CPBA esto relacionadas na
pgina www.cpba.net , onde tambm poder ser acessado o seu banco de dados, com
mais de 2.600 instituies cadastradas. Esta pgina virtual pretende ser uma plataforma
para o intercmbio tcnico e o desenvolvimento de aes cooperativas.
Desde o incio o Projeto contou com recursos financeiros da Andrew W.
Mellon Foundation e de VITAE, Apoio Cultura, Educao e Promoo Social.
Em 1998 estes patrocinadores aprovaram um segundo aporte financeiro, com o objetivo
de dar continuidade s aes empreendidas e de preparar esta segunda edio.
O Projeto agradece o generoso apoio recebido de seus patrocinadores e das
instituies cooperativas, brasileiras e estrangeiras, reconhecendo que sem esta parceria
nada teria acontecido. Deseja tambm agradecer aos autores e editores das publicaes
disponibilizadas, por terem cedido gratuitamente os direitos autorais. Agradecimentos
especiais ao Arquivo Nacional, que hospedou o Projeto desde o seu incio, assim
como Fundao Getulio Vargas, pela administrao financeira dos recursos.
Considerando que a fase do Projeto apoiada pela Fundao Mellon se encerra
em junho de 2001, o grupo cooperativo espera encontrar, em continuidade,
colaboradores e parceiros no Brasil, para que o processo de difuso do conhecimento
da preservao no seja interrompido.
Rio de Janeiro, junho de 2001.
Ingrid Beck
Coordenadora do Projeto CPBA
7
Prefcio da Commission on Preservation and Access
Em um relatrio da Commission, Michael Lesk, membro do Technology Assessment Advisory
Committee, declara que recomendvel, a longo prazo, a converso de microfilme para imagem
digital objetivando a preservao e o acesso de documentos em deteriorao, sendo tecnicamente
possvel e relativamente barata de se realizar (Image formats for preservations & access, julho de
1990, pgina 8). Contudo, a tecnologia de imagem digital est ainda em desenvolvimento, os padres
para hardware e software continuam a evoluir e a converso de microfilme para formatos de imagem
digital ainda no est amplamente testada nas bibliotecas.
No estgio atual, essencial direcionar a pesquisa e o investimento ao desenvolvimento de
sistemas para gerenciamento da converso digital, armazenamento e acesso, para que possam ser
utilizados por universidades e bibliotecas de pesquisa. para o desenvolvimento de tais sistemas que
a Biblioteca da Universidade de Yale direcionou seus esforos neste estudo de planejamento.
O estudo, encomendado pela Commission, explora a exeqibilidade de um projeto para estudar
os meios, custos e benefcios da converso para imagens digitais de grandes quantidades de documentos
de bibliotecas, preservados em microfilme. O Estudo identifica as necessidades visando um projeto
maior, de anos de durao, para proporcionar acesso tanto intra quanto inter-institucional s imagens
armazenadas e para investigar as implicaes mais gerais da intensificao do acesso intelectual
documentao digitalizada. A Commission espera que os resultados se constituam numa importante
contribuio nossa capacidade de utilizao das novas tecnologias digitais para propsitos de
preservao. Cpias gratuitas das publicaes deste relatrio foram distribudas aos assinantes da
Commission.
8
9
Introduo
Nas ltimas trs dcadas, o processo de microfilmagem foi considerado o mais eficiente para a
preservao de documentos em deteriorao nas bibliotecas: o microfilme durvel, desde que
armazenado num ambiente controlado e que bibliotecas e arquivos sigam procedimentos e especificaes
normatizados, podendo partilhar at mesmo instalaes comuns na microfilmagem. Os custos do processo
so previsveis, variando de 10 a 15 centavos de dlar por pgina, excluindo-se os custos de despesas
gerais administrativas e da seleo do material a ser microfilmado. Alm disso, a tecnologia para se ter
acesso ao microfilme estvel e dificilmente sofrer qualquer alterao significativa no futuro. Em
resumo, para a soluo do problema dos livros quebradios, que atualmente afeta todos os depsitos
de material impresso sobre papel cido, o microfilme essencialmente livre de riscos
1
.
Michael Lesk, gerente da Diviso de Pesquisa em Cincia da Computao na Bellcore, em um
recente relatrio apresentado Commission on Preservation and Access, ratificou a utilizao do
microfilme para preservao nos dias atuais. Contudo, ele foi relativamente cauteloso no tocante sua
viso sobre o papel do microfilme no futuro, argumentando que o mesmo, provavelmente, no a
ltima etapa no processo de preservao. Mais propriamente, argumentou ele, o microfilme um
razovel passo intermedirio para a obteno de imagens digitais, que o processo de escaneamento
de livros para armazenagem em computadores
2
.
Apesar de Lesk ter admitido que a tecnologia de reproduo digital cara e que ainda no est
bem estabelecida, ele argumentou fortemente que esta tecnologia encerra uma promessa fundamental
misso das bibliotecas de gerar, preservar e otimizar o acesso ao conhecimento registrado. Ele
observou que a converso de microfilme para imagem digital tecnicamente possvel hoje e argumentou
que os usurios de bibliotecas iro, a longo prazo, exigir os resultados de tal converso. Previu, ainda,
que a tecnologia de imagem digital, incluindo a possibilidade de converso a partir do microfilme,
estar ao alcance da maioria das bibliotecas ainda nesta dcada e incentivou o desenvolvimento de
pesquisas e investimentos, hoje, para o desenvolvimento de sistemas que possam ser utilizados por
bibliotecas comuns no futuro
3
.
A biblioteca da Universidade de Yale, uma das primeiras instituies a desenvolver prticas de
microfilmagem para preservao, est atualmente envolvida nos estgios iniciais de um esforo amplo
e de longo prazo visando a desenvolver sistemas prticos para a converso de microfilme em imagem
digital e, assim, compreender melhor a relao adequada entre as duas tecnologias na prtica de
preservao futura. Este relatrio resume os resultados da fase inicial de planejamento do projeto
maior. Na prxima seo, comea-se a articular uma viso do lugar a ser ocupado pela tecnologia
digital em uma biblioteca de pesquisa como a de Yale. Em seguida, faz-se um esboo de economia de
1
Nancy E. Gwinn (Ed.). Preservation microfilming: a guide for librarians and archivists. Chicago: American Library Association,
1987. p. xxxvi; John C. Mallinson. On the preservation of human and machine-readable records. Information Technology and
Libraries, v. 7, no. 1, p. 22, Mar. 1988.
2
Michael Lesk. Digital imagery, preservatioon and access. Information Technology and Libraries, v. 9, no. 4, p. 307, Dec. 1990.
3
Idem, ibidem, p. 308.
1 0
escolhas e organizao na qual a converso de microfilme para imagem digital pode surgir como uma
opo vivel de preservao. O relatrio mapeia a arquitetura de um sistema de reproduo digital de
imagens e identifica pontos crticos de exeqibilidade. Finalmente, o relatrio apresenta um plano de
trabalho para um projeto de demonstrao, que investigar em profundidade os custos e benefcios da
converso no processo de construo de uma biblioteca digitalizada de 10 mil livros a partir de cpias
em microfilme.
Viso
Para uma viso ampla do futuro papel das bibliotecas de pesquisa na universidade, deve-se
olhar cuidadosamente, e de perto, a maneira como os estudiosos trabalham para produzir e disseminar
o conhecimento. Uma srie de estudos recentes enfatiza que a qualidade e a quantidade da produo
dos estudiosos em todas as disciplinas dependem decisivamente do acesso pronto e oportuno
informao relevante. A biblioteca do futuro, para estes pesquisadores, no ser necessariamente uma
biblioteca eletrnica, nem ser sua a misso de preservar simplesmente o conhecimento registrado.
Ela ter, sim, como objetivo, mais apropriadamente, a gerao, a preservao e a melhoria para seus
usurios do pronto acesso fsico e intelectual ao conhecimento registrado. Tecnologias emergentes,
como a de imagem digital, tero ento uma posio fundamental, na medida em que ajudam a sustentar
a misso geral da biblioteca.
O Valor do Acesso
Iniciando em 1985, o Research Libraries Group estabeleceu um Programa Especial para
Gerenciamento da Informao de Pesquisa, PRIMA. O programa resultou em uma avaliao detalhada
das necessidades de informao em mais de 20 disciplinas de trs grandes reas de conhecimento:
Cincias Humanas, Cincias Sociais e Cincias Fsicas. Entre as vrias necessidades que emergiram
dessas avaliaes, muitas eram especficas das disciplinas em estudo. Um tema, contudo, percorre
todos os estudos e aplica-se a todas as disciplinas: os estudiosos, usando as palavras expressas no
relatrio sobre as necessidades de informao na rea de humanas preferem os mtodos familiares
e no sistemticos de consulta s notas de p de pgina e aos colegas
4
. Nenhuma evidncia fornecida
nos relatrios para justificar a caracterizao destes mtodos como no sistemticos, mas est claro
que, para os pesquisadores, o valor de se consultar as notas de p de pgina e os colegas est no fato
de que esses mtodos so pronta e facilmente acessveis.
Um estudo patrocinado pelo Faxon Insitute for Advanced Studies in Scholarly and Scientific
Communication, apresentado numa conferncia em abril de 1991, aborda o mesmo ponto, com
respeito aos cientistas, de forma ainda mais intensa. O estudo examinou o comportamento de um
nmero significativo de profissionais da rea cientfica com relao forma como eles adquiriam e
utilizavam informaes em seu trabalho. O estudo concentrou-se no uso da informao por profissionais
4
Constance C. Gould. Information needs in the humanities: na assessment. Mountain View, Ca.: Research Libraries Group, p. 51;
Constance C. Gould and Mark-Handler. Information needs in the social sciences: na assessment. Montain View, Ca.: Research
Libraries Group, 1989; Constance C. Gould. Information needs in the sciences: na assessment. Mountain View, Ca.: Research
Libraries Group, 1991.
1 1
dos nveis jnior, intermedirio e snior nas disciplinas de Qumica, Gentica e Cincia da Computao,
em instituies acadmicas privadas e governamentais. Baseado em contagens dirias dos chamados
encontros de informao, definidos como qualquer utilizao ou aquisio de informao, idias ou
dados que se relacionam substncia de sua profisso, o estudo do Faxon Institute contm grande
volume de informaes valiosas e reveladoras sobre a capacidade de obter informaes percebida
nos profissionais investigados, o tipo de fontes que eles usam para obter informao, a freqncia com
a qual utilizam tais fontes, o tempo que gastam coletando informao, o uso que dado informao
e, especialmente, seus mtodos ou maneiras de obter as informaes necessrias.
5
A Tabela 1 resume alguns dos resultados do estudo do Faxon Institute e indica claramente
que os pesquisadores da rea cientfica dependem intensamente, para seus trabalhos produtivos, das
fontes de informao prontamente disponveis. A opinio dos participantes do estudo era de que a
biblioteca to til quanto consultar suas prprias bibliotecas particulares ou discutir pessoalmente o
assunto. Contudo, eles usavam a biblioteca com muito menos freqncia do que as outras formas de
obter informaes, presumivelmente porque consome-se algum tempo ao se deslocar at a biblioteca
e utiliz-la. Alm disso, a consulta ao material disponvel na biblioteca pessoal de um dado pesquisador
ocorreu em um nmero bem maior de encontros de informao do que qualquer outro mtodo e foi,
junto com o correio eletrnico, a forma utilizada com maior freqncia. E mais, se todos os mtodos
de consulta a colegas conversa pessoal, telefonemas, comunicaes por escrito, correio eletrnico
e fax forem combinados, a pesquisa do Instituto Faxon sugere que a rede pessoal de colegas de um
dado pesquisador ocupa o primeiro lugar e que a biblioteca ocupa um distante terceiro lugar na
porcentagem de utilizao para solucionar um problema de coleta de informao.
Iobelo 1. Utilizoo dos modos de oquisio de informoo.
Modo de informoo Percentogem do totol
de encontros de
informoo em que o
modo foi usodo
Numero mdio de
vezes utilizodo no
semono tronscorrido
Utilidode percebido
modo (clossificoo
mdio em escolo de
10 pontos}
8iblioteco/Arquivo Pessool 45,0% ,7 7,
8iblioteco 31,0% 2,8 7,
Converso Pessool 2,0% 7,7 7,
Telefone 15,0% ,5 7,2
Comunicoo por escrito 7,0% 4,4 5,
8ose de dodos onlne ,0% 2, ,8
Correio eletrnico 5,0% 14,7 ,2
Fox 4,0% 2, ,8
CD kOM 2,0% 1, 5,1
885
0,3% 3, 4,3
5
Eric Almquist. An examination of work-related information acquisition and usage among scientific, technical and medical fields,
resultados de um estudo comissionado pelo Faxon Institute for Advanced Studies in Scholarly and Scientific Comunications,
presented at the 1991 Faxon Institute Annual Conference, Creating users pathways to electronic information, Apr. 1991, Reston,
Virginia, exhibit 2.
6
Idem, ibidem, exhibits 9, 22 e 25.
1 2
A biblioteca acessvel
Os resultados dos estudos do Research Libraries Group e do Faxon Institute, em geral, reforam
as concluses de quase duas dcadas de pesquisa sobre o comportamento dos estudiosos na busca da
informao.
7
Existem ainda muitos campos para trabalhos adicionais que venham a refinar e testar
rigorosamente estas concluses, com relao s disciplinas e aos grupos de disciplinas. Precisa-se, em
particular, de informaes mais detalhadas, no contexto destes estudos, sobre as maneiras como os
pesquisadores das vrias disciplinas realmente utilizam as bibliotecas. Porm, conforme estes estudos
sugerem, se os pesquisadores valorizam extremamente e tendem a optar pelo uso da informao que se
encontra prontamente mo, ento uma medida decisiva do sucesso para as bibliotecas que planejam
seu curso no futuro ser a rapidez com que elas iro disponibilizar a informao para seus usurios.
Um modelo de biblioteca de acesso orientado pode ser esquematicamente retratado conforme
mostra a Figura 1. Este modelo , obviamente, uma simplificao. Ele no representa adequadamente
todas as caractersticas da biblioteca e certamente no constitui a nica maneira de caracterizar o
sistema. Para fins de discusso, contudo, ele destaca os principais componentes funcionais e suas
inter-relaes.
Neste modelo, colees e servios so os dois componentes primrios da biblioteca. A
administrao da biblioteca o terceiro elemento principal. A administrao apoia e fortalece as funes
dos servios de acesso e de colees atravs da organizao e execuo de servios dentro da
biblioteca, como, por exemplo, gerenciamento de instalaes, oramento, pessoal e tecnologia, alm
de representar a biblioteca junto aos seus usurios e a outras agncias externas. Cabe, tambm,
administrao a incumbncia de formular e articular a misso da biblioteca no contexto institucional
local.
A misso da biblioteca de acesso
orientado a de gerar, preservar e
melhorar o acesso s colees de
conhecimentos registrados. Esta misso
governa a relao fundamental entre os
servios de acesso e as colees da
biblioteca e seus usurios, e so de dois
tipos:
Acesso intelectual e fsico
Os servios de acesso intelectual,
como a catalogao, descrevem e
organizam para os usurios da biblioteca
a informao em colees de interesse
7
Ver exemplo, F. W. Lancaster. The measurement and evaluation of library services. Washington, D. C.: Information Resouces
Press, 1977. p. 313. Lancaster faz referncia a uma srie de estudos que defendem o argumento de que a seleo de uma fonte de
informao se baseia quase que exclusivamente na acessibilidade, sendo a fonte (canal) mais acessvel a primeira a ser escolhida;
consideraes a respeito de qualidade e confiabilidade so secundrias, apesar de serem fatores importantes para influenciar o grau
em que o usurio est disposto a aceitar a informao fornecida por uma fonte especfica.
Figuro 1. Modelo de biblioteco de ocesso orientodo
1 3
local e geral. As descries de uma obra geralmente se referem, de forma padronizada, a caractersticas
tais como autor, ttulo, local e data de publicao, editor e formato; a organizao tipicamente por
assunto. A disposio de materiais na coleo por assunto faz com que uma srie de materiais
relacionados se encontre disponvel para os usurios da biblioteca e um servio de acesso intelectual
especialmente valorizado nos estudos em reas humanas e nos estudos interdisciplinares, onde os
mtodos associativos fazem dos resultados fortuitos de se consultar diretamente as estantes da
biblioteca, um aspecto fundamental da pesquisa.
8
Outras dimenses do acesso intelectual incluem a
disponibilidade de uma estrutura de contedo do material, freqentemente representada por um ndice,
e a disponibilidade de um ndice remissivo do texto completo do material. Os servios de acesso fsico,
como a circulao e os emprstimos interbibliotecas, referem-se aos mtodos de distribuio que as
bibliotecas utilizam para disponibilizar informaes, pertencentes s colees locais e/ou distantes,
diretamente aos seus usurios.
Coleo e renovao da coleo
A noo de colees de biblioteca refere-se organizao, seleo e meios de armazenagem da
informao. Para os usurios de uma biblioteca, as colees mantidas no local so as mais importantes.
Obviamente, as colees de qualquer biblioteca de pesquisa representam apenas uma pequena frao do
contedo de informao. Portanto, a responsabilidade por uma coleo local inclui, necessariamente, a
responsabilidade de distingui-la e relacion-la a colees existentes em outros locais.
Dentro da universidade, as colees da biblioteca representam um grande, talvez o maior,
investimento de capital. Como todo capital, a coleo de uma biblioteca est sujeita a processos
distintos e constantes de depreciao e renovao (Figura 2): o material perdido ou extraviado,
devendo ser substitudo; novas aquisies aumentam a coleo; as colees so depuradas e parte do
material descartado; o acervo existente se deteriora e deve ser restaurado ou conservado, podendo
ser preservado por cpia ou por converso a outro formato, por exemplo, de papel para microfilme.
Em uma biblioteca de acesso
orientado, cada um dos vrios
processos de renovao da coleo
objeto de uma rigorosa avaliao
quanto misso de servio da
organizao: qual a qualidade de
gerao, preservao ou melhoria do
acesso fsico e intelectual coleo?
Para os fins desta discusso
abordaremos um dos processos de
renovao, a saber, a microfilmagem
para preservao.
8
Lawrence Downler. Conference on research trends and library resouces. Harvard Library Bulletin, v. 1, no. 2, p. 8, Summer
1990.
Figuro 2. Processo de renovoo de coleo
1 4
Preservando o acesso atravs da preservao
A deteriorao de um documento devido idade, acidez ou utilizao excessiva limita tanto
o acesso fsico quanto o acesso intelectual ao mesmo. Quando um item deteriorado selecionado para
preservao, ele preparado de forma tpica para a microfilmagem (Figura 3). Sendo um processo
fotogrfico, o microfilme reproduz fielmente o material impresso original, incluindo manchas,
descoloraes, tinta esmaecida, notas dos usurios e as bordas viradas nos cantos das pginas. O
processo gera um filme de 35 mm em preto e branco, de alto contrate, em um determinado grau de
reduo, dependendo do tamanho do original. Os limites prticos da utilizao de um meio preto e
branco de alto-contraste significam, obviamente, que a microfilmagem no pode reproduzir
adequadamente materiais com contedo de cor, ilustraes com gradaes de cinza ou detalhes
impressos extremamente delicados. Para evitar a perda de informao hoje, em funo da tecnologia
disponvel, documentos com contedo desse tipo devem ser, sempre que possvel, conservados em
sua forma original.
9
Aps a reproduo, uma cpia matriz do microfilme guardada fora da biblioteca, em um
ambiente controlado, onde, com base em algumas estimativas, ela durar at 500 anos sem experimentar
uma deteriorao significativa. Uma cpia positiva e uma negativa do filme so armazenadas na coleo
de microfilmes da biblioteca. O filme pode ser posteriormente duplicado a partir da cpia negativa,
com relativa facilidade, a um custo de aproximadamente US$ 20 por rolo e o processo copyflo pode
gerar uma cpia sobre papel a um custo de cerca de US$ 0,15 por pgina. Para itens com uso
elevado, a biblioteca pode decidir por disponibilizar uma cpia em papel para leitura. Os usurios da
biblioteca podem obter, por meio de solicitao, uma cpia completa do documento em papel ou
podem imprimir pginas selecionadas em um copiador de microfilme.
Confrontada com a perda total de contedo intelectual de um documento em deteriorao, a
biblioteca obtm vantagens significativas com a microfilmagem para preservao. O contedo salvo
e mantido na coleo, em uma forma compacta e durvel, por meio de uma tecnologia que relativamente
simples e bem estabelecida. Mas, por outro lado, o acesso intelectual e fsico ao material, por parte
dos usurios, significativamente diminudo.
Diferentemente de um livro, que pode ser carregado e utilizado praticamente em qualquer lugar,
o microfilme obriga o usurio a utilizar um equipamento especial de projeo, em um local especfico.
O usurio pode ficar sabendo do contedo intelectual de um documento em microforma, em parte por
meio do registro bibliogrfico criado durante o processo de microfilmagem, mas, ao converter de
papel para microfilme, o processo divide uma coleo, de modo a no ser mais to fcil beneficiar-se
intelectualmente da associao fsica de um volume na estante com outros de contedo similar. Alm
disso, o microfilme difcil de ser folheado e de ser lido. Com uma leitora de microfilme, o usurio
no consegue utilizar, com a mesma facilidade do que em uma cpia em papel, o aparato estrutural
interno do volume ndice de assuntos, sumrios dos captulos, prefcios, notas de p de pgina,
ndices remissivos etc. para obter acesso rpido e eficiente ao contedo intelectual do volume, seja
ele uma nota, pgina, captulo ou alguma combinao dos mesmos
10
. Por ltimo, cpias impressas a
9
Michael Lesk, op. cit., p. 303.
1 5
partir de microfilme, utilizando tanto a tecnologia copyflo quanto a tecnologia de copiador, tm recebido
poucos elogios quanto s suas caractersticas de clareza e de resolues.
No de se surpreender que, dadas estas deficincias, os usurios reclamem intensamente a
respeito da utilizao do microfilme. Sob um aspecto, essas queixas a respeito das deficincias do
microfilme parecem injustas: sem a microfilmagem para preservao, pores substanciais de colees
de bibliotecas estariam completamente perdidas. Neste contexto, a inconvenincia de se usar o microfilme
parece desprezvel. Contudo, dado o valor da acessibilidade informao para os pesquisadores, a
biblioteca obrigada a assegurar que no pode aplicar nenhuma alternativa tecnolgica melhor e
economicamente efetiva, a no ser a microfilmagem, para salvar a contedo intelectual de materiais em
rpida deteriorao e, ao mesmo tempo, preservar ou melhorar o acesso dos pesquisadores ao material.
Por esta razo, bibliotecas como a de Yale, em que mais de 80% da coleo encontra-se atualmente
ou potencialmente quebradia, devem investigar os meios, os custos e os benefcios de se acrescentar
a seu kit de alternativas para preservao novas e promissoras ferramentas, incluindo a tecnologia de
imagem digital.
Imagem digital
A tecnologia de imagem digital propicia os meios de se codificar digitalmente documentos
escaneados em forma de imagem para armazenagem, transmisso e recuperao em sistemas
computadorizados. As imagens digitais produzidas que utilizam essa tecnologia contm texto, mas o
texto no convertido e no acessvel na forma alfanumrica. Existem recursos para tal converso,
total ou parcial, pela aplicao s imagens digitais, de tecnologias de reconhecimento de caracteres. O
10
Blipping, isto , a colocao de marcaes especiais em fotogramas selecionados, pode facilitar a utilizao do microfilme
especialmente se as marcaes forem codificadas e indexadas em um sistema para recuperao automatizada. A tcnica, contudo,
tem sido aplicada principalmente em filmes de 16 mm. A UMI estabeleceu normas de uso interno para o blipping em filmes de 35
mm. Se essas normas se tornaro amplamente disponveis e aplicadas de forma generalizada ao microfilme de 35 mm para
preservao em bibliotecas, o que se ver no futuro.
Figuro 3. Microfilmogem de preservoo
Matriz
1 6
uso da imagem digital aqui idealizado planejado para antecipar a aplicao eventual do reconhecimento
de caracteres, mas no o incorpora no presente momento
11
.
A digitalizao promete melhorar bastante a acessibilidade de materiais de preservao, em
comparao com o microfilme (Figura 4). O acesso fsico biblioteca de imagens digitais, e logicamente
ao microfilme, requer equipamento especial. Em comparao s leitoras de microfilme, contudo, o
equipamento de imagem digital um poderoso computador com um monitor de resoluo relativamente
alta tecnologia de uso geral onde o acesso biblioteca digital deve ser apenas uma das aplicaes.
Alm disso, o pesquisador que se encontra fora da biblioteca, e possivelmente at mesmo ausente do
campus da biblioteca que possui as imagens, pode ter acesso a elas de maneira relativamente fcil e
rpida, uma vez que as imagens digitais podem ser transmitidas pelas redes de alta velocidade j
instaladas e interconectadas em muitos campi universitrios. O pesquisador tem, tambm, a
oportunidade, utilizando a tecnologia de imagem digital, de adicionar integral ou parcialmente o
documento de imagem a sua biblioteca pessoal atravs da requisio de uma cpia impressa. Esta
ter, provavelmente, melhor qualidade e resoluo mais alta que a equivalente produzida a partir de
microfilme e pode at ser substancialmente mais barata, novamente porque a tecnologia subjacente
serve para uso geral.
11
O reconhecimento de caracteres a partir de imagens escaneadas digitalmente levanta uma srie desafiadora de questes. Em
primeiro lugar, apesar do reconhecimento dos caracteres alfanumricos estar sendo constantemente aprimorado a preciso da
tecnologia atualmente disponvel frustrante. Em segundo lugar, h muito o que fazer para melhorar a habilidade do reconhecimento
de caracteres alfanumricos ao lidar com a grande variedade de tipografias e lnguas que so encontradas nos documentos preservados
em bibliotecas. Em terceiro lugar, dado o reconhecimento bem sucedido dos caracteres alfanumricos que compem uma imagem de
texto, necessrio, para propsitos de armazenagem e recuperao, que se relacione os caracteres estrutura e ao layout do
documento original, incluindo quaisquer ilustraes, desenhos, diagramas ou outras imagens grficas que estejam nele contidas.
A maneira como essas questes foram, enfim, abordadas e reconhecidas afetar bastante a acessibilidade dos documentos
armazenados na forma eletrnica. Ns pretendemos estar conscientes e informados a respeito das implicaes das decises e
escolhas que faremos neste projeto para a aplicao futura da tecnologia de reconhecimento de caracteres. De fato, pretendemos
tomar todas as precaues razoveis para assegurar o sucesso de uma aplicao dessa natureza s imagens digitais que produziremos.
Contudo, dada a complexidade e relativa imaturidade da tecnologia de reconhecimento de caracteres, nos referimos sua aplicao
como afim, porm essencialmente fora do alcance do presente projeto.
Para uma discusso frutfera de alguns dos temas associados com a aplicao do reconhecimento de caracteres a documentos de
bibliotecas, ver Stuart Wibel, John Handley; Charles Huff. Automated document architecture processing and tagging. In: Donald
L. Blamberg, Carol L. Dowling; Claudia V. Weston (Ed.). Proceedings of the Conference on Aplication of Scanning Methodologies
in Libraries. Beltsville, Maryland: National Agricultural Lybrary, 1989. p. 3-14.
Figuro 4. mogem digitol no biblioteco
digitalizados
(ot workstoton)
1 7
A imagem digital tambm promete uma melhoria substancial ao acesso intelectual, em comparao
ao microfilme. A capacidade dessa tecnologia de disponibilizar cpias em papel do documento original,
de alta qualidade e relativamente baratas, para a biblioteca pessoal dos pesquisadores torna o aparato
intelectual padro sumrio, ndice e assim por diante diretamente acessvel. Alm disso,
diferentemente da prtica comum com imagens sobre microfilme de 35 mm, as imagens digitais podem
ser indexadas pelos nmeros das pginas e, se os recursos disponveis permitirem, por estruturas tais
como seo, captulo e fascculo. Com um ndice assim e um software para utiliz-lo, os pesquisadores
podem percorrer rapidamente o documento digital e folhear seu contedo intelectual de forma bem
mais eficiente do que a permitida por documentos preservados em microfilme.
Nas formas aqui descritas, a tecnologia de imagem digital no proporciona uma melhoria
substancial, em relao ao microfilme, quanto a proporcionar um substituto eficiente para a consulta de
volumes em estantes. Contudo, estudos recentes sugerem que a adio de informaes suplementares,
como transcries de ndices, s descries bibliogrficas disponveis online, ir permitir uma
oportunidade melhor para efetuar associaes intelectuais, do que com mtodos tradicionais de
classificao e a disposio dos documentos em papel nas estantes da biblioteca por assunto
12
.
medida em que o contedo dos documentos adicionado aos registros bibliogrficos online e os
benefcios resultantes da melhoria do acesso intelectual aos materiais, em todos os formatos, se tornam
aparentes, torna-se possvel alcanar uma substancial melhoria no aproveitamento do material no formato
de imagem digital por meio da criao de conexes eletrnicas diretas entre a informao suplementar
do registro bibliogrfico e as imagens digitais do documento a que o registro se refere. A criao de
tais conexes exigir um trabalho considervel, particularmente no sistema bibliogrfico online, mas a
viso de suas possibilidades significa tambm que se deve planejar, de forma cuidadosa e criativa, os
ndices da paginao e da estrutura do documento dentro dos sistema de imagem digital, para que as
imagens digitais possam ser relacionadas, de maneira fcil e confivel, informao do contedo
armazenada em outras formas legveis por computador, como o registro bibliogrfico online.
Nossa viso da biblioteca do futuro est relacionada s diferenas e s interrelaes principais
que identificamos entre
as colees da biblioteca que incluem os modos de armazenagem de informaes e do
conhecimento registrado selecionados;
o acesso fsico, que inclui os modos de distribuio das colees; e
o acesso intelectual, que inclui os modos principais de uso das colees.
Assim como esperamos que a tecnologia da imagem digital introduza maior flexibilidade e melhore
os modos de utilizao e distribuio de colees, particularmente em comparao com o microfilme,
esperamos, tambm, que essa tecnologia produza efeitos similares nos modos de armazenagem na
coleo. Neste contexto, crucial distinguir entre armazenagem arquivstica e armazenagem para uso
e distribuio.
12
Ver, por exemplo, Karen Markey. Subject searching in library catalogs: before and after the introduction of online catalogs.
Dublin, Ohio: Online Computer Library Center, p. 75-117, 1984; Richard Van Orden. Context-enriched access to electronic
information: summaries of selected research. Library Hi Tech, v. 8, no. 3, p. 27-32, 1990; e Martin Dillon e Patrick Wenzel.
Retrieval effectiveness of enhanced bibliographic records. Library Hi Tech, v. 8, no. 3, p. 43-46, 1990.
1 8
Na biblioteca do futuro, presumimos que o microfilme continuar a ter um papel importante,
talvez ainda permanecendo como o meio preferido de armazenagem de uma verso arquivstica dos
documentos preservados
13
. Para a utilizao e a distribuio dos materiais preservados, contudo, as
imagens digitais se tornaro provavelmente o meio de armazenagem preferido. Dependendo dos custos,
a microfilmagem poder permanecer como uma etapa preliminar em um processo de preservao que
eventualmente levaria digitalizao, ou ento, o filme poder ser gerado a partir da imagem digital.
Em ambos os casos, esperamos que a tecnologia digital aproveite a base substancial de documentos j
preservados em microfilme e atualmente disponveis apenas nesta forma.
Finalmente, nossa viso da utilizao da tecnologia de imagem digital sugere alguns efeitos mais
amplos. Apesar de esperarmos que a biblioteca digital seja estabelecida a partir de um impulso inicial
visando preservao e melhoria do acesso enorme quantidade de livros quebradios e em
deteriorao nas estantes das bibliotecas, ns tambm esperamos um enriquecimento das bibliotecas
ao longo do tempo, com documentos na forma de imagem digital que tenham sido criados por vrias
outras razes, tanto dentro quanto fora da biblioteca. Alm disso, a tecnologia de imagem digital ter
provavelmente um efeito significativo, talvez profundo, na maneira segundo a qual a biblioteca do
futuro encarar, organizar e valorizar seu espao e sua equipe de funcionrios. Por exemplo, na
medida em que a biblioteca digital surja como uma forma de renovar e substituir grandes estoques de
materiais de papel e de microfilme, e na medida em que a biblioteca digital seja armazenada e acessvel
remotamente da biblioteca propriamente dita, o uso do espao central de estanteria, onde se armazenam
documentos na biblioteca, quase que certamente ser modificado e o equilbrio das funes da equipe
de funcionrios tradicionalmente associadas circulao e recolocao nas prateleiras de colees
armazenadas em papel dever ser alterado em funo dos modos de distribuio de documentos
gerados sob demanda a partir de formatos eletrnicos
14
.
Uma economia de escolhas
As bibliotecas do futuro no alcanaro, em uma nica e rpida etapa, a viso aqui apresentada
com relao ao uso da tecnologia digital na preservao e na melhoria do acesso ao conhecimento
registrado. Contudo, as promessas de benefcios em servios e de uma possvel economia de custo
mobilizar, de vrias formas, os bibliotecrios na direo dessa tecnologia. Restries oramentrias e
outros impedimentos organizacionais iro for-los, ainda, a investir nessa tecnologia de outras formas.
Se a promessa justificar o investimento, a maioria ir incorporar a tecnologia de reproduo digital de
imagem da mesma maneira como adotou e assimilou outras tecnologias no passado: atravs de uma srie
de decises especficas e escolhas regidas pela funo e pelas necessidades de suas instituies.
Aqueles que desenvolvem a tecnologia de imagem digital para utilizao na preservao de
bibliotecas devem ter em mente o princpio de aperfeioar seu poder e sua influncia na mudana
13
Sobre a contnua utlidade do microfilme na indstria, veja Whitney S. Minkler. Optical disks vs. Micrographics: is it na
adversarial problem? Micrographics and Optical Technology, v. 7, no. 4, p. 141-149, 1989; e John Blake. War over optical disk
or microfilm ends, future contains multiple media. Micrographics and Optical Technology, v. 8, no. 3, p. 141-143, 1990.
14
Ver, por exemplo, Clifford A. Lynch e Edwin B. Brownrigg. Library applications of eletronic imaging technology. Information
Technology and Lybraries, v. 5, no. 2, p. 100-102, June 1986.
1 9
organizacional. A economia no gerenciamento e administrao dos recursos de uma biblioteca, como
na maioria das grandes instituies, se reflete na racionalizao de escolhas, mesmo quando se trata de
uma tecnologia potencialmente revolucionria. O desenvolvimento da aplicao da imagem digital deve,
ento, produzir resultados no tocante aos meios, custos e benefcios que facilitem e informem, em vez
de distorcer e enganar, sobre tal economia.
Esta seo almeja identificar um conjunto de escolhas funcionais cruciais que, provavelmente,
governaro a incorporao da tecnologia de imagem digital nos processos de preservao de bibliotecas.
A prxima, delineia muitas das exigncias tcnicas detalhadas para a arquitetura de um sistema que
possa acomodar, de maneira flexvel, as diferentes escolhas que as bibliotecas provavelmente faro. A
seo final apresenta um plano de trabalho para o desenvolvimento da arquitetura e para a gerao da
informao que as bibliotecas necessitaro ao fazerem uma escolha cautelosa referente aos custos e
benefcios dessa tecnologia de imagem.
O foco na converso a partir do microfilme
A Universidade de Cornell, uma pioneira na utilizao da imagem digital para fins de preservao
em biblioteca, optou pela investigao de mtodos para superar as limitaes da microfilmagem para
preservao atravs do escaneamento de documentos em deteriorao diretamente para a forma de
imagem, em vez de microfilm-los. Trabalhos adicionais fazem-se necessrios visando expandir as
possibilidades de alimentao direta, incluindo mtodos para o manuseio de documentos de grandes
dimenses, documentos coloridos e outros tipos de documentos especiais. Alm disso, como podem
ser eletronicamente realadas pela eliminao de manchas e outras marcas e pela acentuao do
contraste de tintas esmaecidas, as imagens digitais devero se tornar, em ltima anlise, uma fonte de
qualidade superior fonte original em papel para a cpia sobre microfilme. Os meios para a gerao
de uma cpia sobre microfilme a partir da imagem digital devem, pois, ser sistematicamente explorados.
O papel, contudo, no a nica fonte de alimentao possvel para a criao de uma biblioteca
digital de materiais preservados. A biblioteca da Universidade de Yale busca demonstrar grande
comunidade bibliotecria a viabilidade de uma fonte alternativa, atravs do desenvolvimento de meios
e da identificao dos custos e benefcios de se escanear materiais preservados a partir da microfilmagem.
Embora seja alimentado por microfilme em vez de papel, o sistema de reproduo de imagens
desenvolvido no projeto da Universidade de Yale tambm proporcionar as mesmas capacidades
funcionais bsicas que o projeto em desenvolvimento na Universidade Cornell. No sistema completo,
os usurios da biblioteca podero folhear a biblioteca de imagens a partir de um terminal de computador
(Figura 5). Eles podero, tambm, obter uma verso impressa do documento digital, sempre que
requisitado; a prpria biblioteca poder gerar uma cpia sobre o papel do documento preservado e
coloc-la nas estantes da biblioteca. Alm disso, a biblioteca de imagens ser armazenada separadamente
da coleo nas estantes. Devido presumida acessibilidade da biblioteca digital, tanto de dentro quanto
de fora da biblioteca, a verso em microfilme dos documentos digitalizados pode ser idealmente removida
da biblioteca para um depsito mais remoto e barato.
2 0
O sistema da Universidade de Cornell est sendo desenvolvido, inicialmente, para manejar uma
biblioteca de imagens com 1.000 volumes. Alm do desenvolvimento de uma fonte alternativa de
entrada, o projeto da Universidade de Yale testar a possibilidade de implementar projetos como o da
Universidade de Cornell, em grande escala, aumentando o acervo da biblioteca digital, em uma ordem
de magnitude, para 10 mil volumes. O tamanho da biblioteca digital de Yale, comparado de Cornell,
ajudar a demonstrar as economias do sistema quando implementado em escala e a assegurar
comunidade de bibliotecrios que possvel medir realisticamente os custos associados adio de
componentes ao sistema e manuteno destes componentes ao longo do tempo.
Um modelo de investimento em incrementos
Os custos e benefcios de um sistema de reproduo de imagens dependem largamente, embora
no exclusivamente, dos principais componentes funcionais do sistema, do mtodo e do ritmo de sua
implementao. No necessria a adoo de todos os componentes possveis para a criao de um
sistema de trabalho. Considerando a misso a ser cumprida pelo sistema, alguns componentes so
essenciais e devem ser implementados, j outros so menos importantes, podendo ser instalados
opcionalmente ou posteriormente base de incrementos. A anlise que se segue distingue os principais
componentes funcionais de um sistema de imagem digital para preservao, ordena os componentes
em relao ao objetivo do sistema e os arranja em uma seqncia cumulativa de etapas. A seqncia
sugere uma estratgia plausvel, oferecendo opes de escolha a cada nvel para uma biblioteca que
esteja investindo na tecnologia de imagem digital. Para dar suporte s opes, o desenvolvimento do
projeto de reproduo de imagens em Yale precisa ser planejado de modo a permitir a medio dos
custos e benefcios referentes ao incremento de componentes do sistema, identificados em cada etapa
da seqncia.
O sistema bsico
Se o objetivo da preservao de salvaguardar e otimizar o acesso fsico e intelectual
documentao impressa em deteriorao, e considerando-se que o material j foi microfilmado, o
sistema de imagem digital mais simples e direto aquele que produz, a partir do microfilme, uma cpia
impressa, de alta qualidade, do documento original para a biblioteca colocar em suas prateleiras. Os
componentes essenciais de um sistema desse tipo seriam:
Figuro 5. Conservoo de microfilme de preservoo poro imogem digitol
Folheomento
por demondo (ot workstoton}
2 1
um escaner para microfilme;
um dispositivo de armazenagem temporria para guardar as imagens digitadas;
uma estao de controle de qualidade para revisar as imagens, real-las sempre que possvel
e escanear o filme novamente quando necessrio;
uma rede de alta velocidade para a transferncia das imagens ao servio de impresso;
um servio de impresso, para colocar em fila e tambm controlar o trabalho de impresso; e
uma impressora digital de alta qualidade.
Uma empresa de servios poderia, naturalmente, se encarregar parcial ou totalmente dessas
funes. Poderia escanear com controle de qualidade e imprimir o documento; poderia escanear com
controle de qualidade e devolver biblioteca o conjunto de imagens digitalizadas para impresso. Ser
importante, para o projeto demonstrativo de Yale, acumular experincia interna suficiente em digitalizao,
de modo que se possa transmitir empresa de servios os padres e as expectativas para converso
e indexao, para comparar integralmente os custos de um servio interno com os custos da contratao
de uma empresa de servios que realiza as mesmas funes.
Devido ao fato de que o processo copyflo j capaz de produzir cpias impressas diretamente
a partir do microfilme, uma biblioteca provavelmente achar este sistema bsico de reproduo de
imagens atraente se, e somente se, os custos de digitalizao e impresso forem inferiores aos custos
do copyflo ou se a cpia gerada pela impressora digital for de qualidade superior. Considerando-se
como provavelmente o , que a resoluo da imagem digital gerada a partir do microfilme da ordem
de 300 pontos por polegada (dpi), ento a qualidade de impresso certamente ser igual ou superior
do processo copyflo. Michael Lesk estimou, ainda, que o custo de uma converso simples do
microfilme para imagem digital de aproximadamente 2 centavos de dlar norte-americano por
fotograma
15
. Estimativas anteriores de Cornell sugerem que os custos de impresso de um documento
a partir dessas imagens so aproximadamente de 10 dlares por livro de 300 pginas (sem
encadernao) ou de 3,3 centavos de dlar norte-americano por pgina.
Estas estimativas incluem pressupostos acerca de custos da mo de obra, produtividade, volume
e mtodos de financiamento e amortizao de equipamentos que podem ou no valer para qualquer
circunstncia. Contudo, reconhecendo as limitaes de tais estimativas, compare-as ainda ao custo
atual de 15 centavos de dlar norte-americano por pgina (sem encadernao) do processo copyflo.
Um sistema de imagem digital restrito aos seus componentes essenciais e simplesmente capaz de
digitalizar e imprimir imagens de microfilme ir no somente produzir cpias de qualidade superior, mas
tambm proporcionar mais de 60% em economia com relao aos meios presentes de impresso a
partir do microfilme. Obviamente, com componentes adicionais, um sistema de imagem digital pode
desempenhar uma funo bem maior do que a do sistema aqui descrito, mas os riscos do investimento
aumentam proporcionalmente.
15 Michael Lesk, op. cit., p. 307.
2 2
Impresso sob demanda
Se um sistema de imagem digital bsico habilita a biblioteca a restringir o acesso a um documento
em deteriorao atravs da gerao de uma cpia de fac-smile de alta qualidade e a um custo
relativamente baixo, ento pode-se legitimamente imaginar qual o investimento adicional que seria
necessrio para produzir a cpia impressa sob demanda para um pesquisador colocar em sua biblioteca
pessoal. Um sistema de imagem digital capaz de impresso sob demanda necessita da incorporao
dos seguintes componentes ao sistema bsico:
um dispositivo de armazenagem permanente para as imagens do documento na forma digital;
um ndice a nvel de ttulo para o documento na forma de imagem, de modo que se possa
distinguir um documento de outro no meio de armazenagem;
uma entrada em uma descrio bibliogrfica nova ou j existente, presumivelmente registrada
no catlogo online da biblioteca, que indique ao usurio que o documento se encontra armazenado
na forma digital e est disponvel para impresso sob demanda;
um servio de requisio de impresso; e
um servio de imagem que extraia as imagens sob o identificador nico e as transmita
impressora.
A otimizao da impresso sob demanda sujeita-se tambm a custos substanciais, particularmente
com respeito ao mecanismo de armazenagem. A armazenagem de imagens digitais tecnicamente complexa
e ser tratada com maior detalhe na discusso sobre a arquitetura do sistema, na prxima seo.
importante citar aqui, contudo, que a noo de permanncia na armazenagem digital envolve os custos
de se atualizar periodicamente os arquivos de imagem e relativamente com mais freqncia que livros
e microfilme na medida em que os meios de armazenagem, os formatos de arquivo digital e o
equipamento utilizado para se ter acesso a esses arquivos sofrem mudanas. possvel, mas ainda no
provado, que a economia feita em espao, a partir de uma armazenagem mais densa e compacta e em
outras eficincias adquiridas com a mudana de tecnologia, poderia contrabalanar os custos de atualizao
de arquivos de imagem e, assim, fazer com que o processo de renovao seja auto-sustentvel.
O sistema de indexao neste estgio simples de ser criado e utilizado. Consiste na aplicao
de um nmero de classificao ou outro identificador nico coleo de imagens do documento
digital. O identificador nico proporciona a chave que conecta a entrada bibliogrfica do catlogo ao
ttulo na biblioteca digital, igual a um nmero de chamada que permite ao usurio dirigir-se ao catlogo,
a um livro na estante ou a um rolo de microfilme em uma gaveta especfica de arquivo.
Naturalmente, um pesquisador nem sempre pode dizer, a partir da entrada de um catlogo, se
um documento ou no relevante ao problema ou pesquisa de seu interesse. Antes de requisitar
uma cpia impressa, pode ser necessrio folhear o documento em microfilme na biblioteca para
determinar sua relevncia. Os investimentos em um sistema de imagem digital que propicie um servio
de impresso sob demanda incluem, portanto, os custos de armazenagem e indexao dos documentos
na forma digital, sem, contudo, prescindir da exigncia de que a biblioteca mantenha uma verso dos
mesmos em microfilme, para que o usurio possa folhe-los.
2 3
Folheando um documento online
Considerando-se a armazenagem permanente necessria ao servio de impresso sob demanda,
uma outra extenso natural dos sistema de imagem digital seria permitir ao usurio folhear um documento
online diretamente na forma de imagem digital. A capacidade para se folhear online requer,
adicionalmente queles j identificados, os seguintes componentes:
um terminal de computador e uma impressora para que o usurio possa recuperar, exibir,
navegar e imprimir imagens selecionadas do documento; e
um servio de apresentao que adapte a apresentao da imagem ao tipo especfico de
estao de folheamento em uso.
A melhoria destes componentes do sistema de imagem digital proporciona ao usurio capacidades
funcionais que, em pelo menos um aspecto, se assemelham ao folheamento de um documento na
forma de microfilme. Devido ao fato de que o documento neste estgio est indexado apenas pelo
ttulo, com um identificador nico, no se pode ir automaticamente at uma pgina ou seo especfica
do documento. Como ocorre com uma leitora de microfilme, deve-se mover para frente e para trs,
atravs do documento, imagem por imagem. A principal diferena funcional em relao ao uso do
microfilme, nesse estgio, que o usurio no tem que localizar o rolo de filme manualmente, mas
depende do software do sistema para encontrar e carregar o documento automaticamente. Alm
disso, aps folhear o documento, o usurio pode solicitar que o sistema gere uma cpia impressa de
alta qualidade para uso pessoal.
dever dos responsveis pelo desenvolvimento do sistema assegurar que as caractersticas de
folheamento online de impresso sob demanda incorporadas ao sistema, neste estgio de investimento,
sejam estimulantes e suficientes ao pesquisador, para que o mesmo as utilize em lugar do microfilme.
Partindo do pressuposto de que elas realmente o sejam, a biblioteca poder comear a acumular pelo
menos algumas economias em microfilme da biblioteca. A biblioteca poder tambm contemplar
melhorias significativas na capacidade de folheamento.
Acesso remoto
A biblioteca pode estender a capacidade de folheamento do sistema de imagem, sob um certo
aspecto, tornando-o acessvel remotamente. Dentro da biblioteca, a apresentao das funes de
folheamento pode ser controlada pela limitao do tipo de estao de trabalho utilizada. O acesso
remoto, contudo, requereria um servidor com maior qualificao para suportar a variedade de estaes
de trabalho e capaz de lidar com as imagens que os pesquisadores utilizam fora da biblioteca. Alm do
servidor de imagem e da rede local do campus tambm necessitaria de capacidade para suportar o
trfego mais intenso. Se a funo de folheamento pode, ou no, ser estendida para fora da rede do
campus, em termos prticos, uma questo de considervel interesse que exigir pesquisa adicional e
um grande volume de testes.
Folheamento no nvel de pgina
A biblioteca pode, tambm, estender a capacidade de folheamento do sistema de imagem,
tornando as imagens de um documento diretamente acessveis atravs do nmero da pgina. O
investimento no folheamento em nvel de pgina depende diretamente dos custos de gerao,
manuteno e suporte do software de folheamento e de um ndice de pginas para o documento de
2 4
imagem. No se pode emitir um comando para ir a uma pgina especfica no documento at que, e a
no ser que, algum, deliberadamente, se dedique criao de um ndice conectando as imagens com
os nmeros das pginas do documento. As pginas podem apresentar numerao romana ou arbica.
Por outro lado, algumas pginas podem at no estar associadas com um nmero especfico em qualquer
forma de notao. O sistema de indexao e recuperao necessita refletir, todavia, sobre essas
distines, variaes e peculiaridades.
Folheado em nvel de estrutura do documento
A biblioteca pode estender a capacidade de folheamento do sistema de imagem ainda mais
profundamente, tornando as imagens de um documento diretamente acessveis atravs de suas prprias
divises estruturais internas, tais como pgina de ttulo, sumrio, parte, captulo, seo e ndice. Isto ,
sem mover-se atravs do documento pgina por pgina, o usurio pode emitir um comando para ir
imediata e automaticamente ao terceiro captulo, parte trs, ou pgina do ttulo. Novamente, a
escolha para se implementar um sistema de imagem com este nvel de funcionalidade depende
diretamente do interesse da biblioteca na criao de um ndice conectando uma imagem ou um conjunto
de imagens a um ou mais elementos estruturais especficos do documento. Uma pequena variao
desse sistema proporcionaria ao usurio a capacidade de estruturar temporariamente o documento,
durante o processo de folheamento, com marcadores de pgina. Uma variao ainda mais ambiciosa
seria permitir ao usurio estruturar o documento, completa ou parcialmente, a seu prprio gosto e
salvar o ndice estrutural resultante, sob seu prprio nome, para uso posterior.
A anlise aqui apresentada de um sistema de imagem digital para bibliotecas, que tem a finalidade
de preservar e melhorar o acesso a materiais em deteriorao e derivado da converso de microfilme
para formato de imagem, no esgota todos os usos possveis de um sistema deste tipo. Por exemplo,
pode-se decidir pela digitalizao de uma coleo de documentos baseando-se no fato de que a coerncia
intelectual do material justifica o esforo de torn-lo mais acessvel. Alternativamente, para auxiliar na
diminuio dos custos de armazenagem e indexao, pode-se optar pela digitalizao apenas de
documentos de uso intenso, como uma etapa intermediria, ou mesmo como uma alternativa colocao
de uma cpia em papel nas estantes. Pode-se, ainda, optar, apenas, pela digitalizao de documentos, na
medida em que so requisitados para uso, deixando as pores no utilizadas da coleo em microforma.
Esta anlise tambm no esgota todas as caractersticas possveis de um sistema de imagem digital
para preservao. Como exemplo, uma vez que a tecnologia de reconhecimento de caracteres esteja
suficientemente amadurecida, melhorias adicionais ao sistema de imagem digital tornar-se-o possveis.
Um documento em forma de imagem poder ser, parcial ou totalmente, convertido para um arquivo texto
de caracteres alfanumricos e as imagens do documento poderiam, potencialmente, ser conectadas a
uma poro do arquivo de texto, como o ndice, que armazenado na descrio bibliogrfica do documento
de imagens ou a um ndice remissivo de palavras-chave gerado a partir do arquivo de texto completo.
Avanos deste tipo poderiam enriquecer bastante o valor intelectual da biblioteca de imagens.
A anlise feita nesta seo, contudo, destaca as principais dimenses funcionais de um sistema
de imagem digital para preservao. Sugere, tambm, um arranjo plausvel de escolhas que deve
motivar uma biblioteca a investir economicamente em um sistema deste tipo. Obviamente, deve-se
distinguir entre a motivao e a necessidade funcional e a arquitetura tcnica subjacente ao sistema de
imagem digital que serve aos propsitos da biblioteca e satisfaz suas necessidades alm do
2 5
plano de trabalho para um projeto demonstrativo que desenvolva um sistema completamente articulado
dentro da arquitetura e gere informao suficiente sobre o sistema, de forma a permitir s bibliotecas
tomar decises prudentes e prticas no tocante a seus custos e benefcios.
Arquitetura do sistema
A arquitetura o projeto e a estrutura global de um sistema para criao, armazenagem,
recuperao e impresso de documentos de biblioteca na forma de imagem evoluiu gradualmente durante
a ltima dcada. Na pesquisa inicial e no desenvolvimento de projetos piloto, especialmente na Biblioteca
do Congresso e na Biblioteca Nacional de Medicina norte-americanas, testaram, refinaram e validaram
idias-chave de projeto na medida em que a tecnologia de imagem digital emergiu: as estaes de trabalho
realizam funes com imagem digital, so distribudas numa rede de alta velocidade, utilizam os recursos
necessrios na rede e interagem umas com as outras de acordo com um padro cliente/servidor
16
. Em
seu projeto de preservao digital, a Universidade de Cornell incorporou um projeto de estao de
trabalho distribuda, no padro cliente/servidor, em sua arquitetura de sistema; Yale far o mesmo.
Outros princpios de projeto mais gerais tambm se aplicam arquitetura de sistemas de imagem
digital. Alguns destes princpios governaro o sistema que vem sendo desenvolvido em Yale e deve-se
articul-los, em vez de assumi-los. Inicialmente, os dados, tanto de imagens quanto de seus ndices,
constituiro o recurso principal gerado no projeto de Yale. O software e o hardware necessrios para
criar, armazenar e utilizar os dados mudaro e sero substitudos. Os dados permanecero, contudo,
e devero ser facilmente conversveis de um sistema para outro. Em segundo lugar, baseando-se no
argumento da seo anterior sobre a necessidade de escolha, os componentes do sistema devem ser
desenvolvidos de forma modular, para poderem ser fcil e prontamente adicionados, eliminados ou
alterados quando necessrio. Em terceiro lugar, para assegurar flexibilidade na adio, eliminao ou
alterao no sistema de imagem digital em Yale, os componentes utilizados devem obedecer s normas
oficiais ou industriais, ou ser construdos para interfaces padro.
Relacionando estes princpios na ordem inversa, esta seo identifica os padres relevantes
para o sistema de imagem digital em Yale, rev os componentes do sistema e os aspectos tcnicos a
eles associados e considera a exeqibilidade global do projeto, evidenciando reas em que o interesse
pelos dados devem garantir ateno especial a caractersticas especficas dos sistema.
Normas tcnicas
As normas relevantes que se aplicam ao projeto e construo do sistema de imagem digital em
Yale se encaixam em trs grupos distintos: normas de comunicaes, de armazenagem e de aplicao
17
.
Assim como a maior parte das principais universidades de pesquisa dos Estados Unidos, a Universidade
16
Felix P. Krayeski. Transition of na image system: from paper to microfiche to optical disk. Congresional Research Service, The
Library of Congress, June 1990; Frank L. Walker; George R. Thoma. Access techniques for document image databases. Library
Trends, v. 38, no. 4, p. 751-786, Spring 1990; Frank L. Walker. Issues in document conversion. In: Donald L. Blamberg, Carol
L. Downling; Claudia V. Weston. (Ed.). Proceedings of the Conference on Application of Scanning Methodologies in Libraries.
Beltsville, Maryland: National Agricultural Library, p. 45-60, 1989.
17
Para uma boa viso geral das normas tcnicas relevantes, ver Gerry Walter. Standards help advance document management
system progress. Optical Memory News. p. 25-27, May, 1990.
2 6
de Yale comporta uma variedade de protocolos de rede, mas tem se concentrado nos chamados
padres ethernet, incluindo o TCP/IP como protocolo escolhido para comunicaes em rede.
Componentes do sistema podem operar em uma sub-rede do campus, utilizando um tipo diferente de
protocolo padro, por exemplo, token ring (rede em anel) no nvel de conexo de dados. Contudo, a
sub-rede deve fornecer uma porta confivel e satisfatria para a espinha central da rede, baseada na
ethernet, para comunicao com outros componentes do sistema.
Para armazenagem de dados de imagens, o sistema de Yale suportar o formato TIFF (Tagged
Image File Format), que proporciona a padronizao em nvel de cabealho, necessria para permitir
o intercmbio de imagens. Devido aos arquivos de imagem serem muito grandes, uma norma tcnica
se faz tambm necessria para a compreenso dos arquivos a uma frao de seu tamanho original,
para que se possa armazen-la e comunic-los de forma mais econmica. O padro de compresso
do grupo 4 do CCITT deficiente em alguns aspectos, porque no inclui pginas cujas dimenses
sejam superiores s do tamanho carta, nem manipula bem as imagens com escala mais extensa de
gradaes de cinza ou coloridas. Grupos de normalizao tcnica esto cooperando no momento para
o desenvolvimento de padres de compresso mais adequados. Por enquanto, o padro do grupo 4
do CCITT deve servir s necessidades deste projeto.
Quando se trata das aplicaes, a informao bibliogrfica, referente a um documento na forma
de imagem ser incorporada ao catlogo online da biblioteca em formato padro de catalogao
legvel por computador, MARC - Machine-readable Cataloging. As convenes existentes para o
MARC no so completamente adequadas descrio da verso em imagem digital de um documento,
mas a respectiva organizao de normas tcnicas j esboou uma reviso adequada da norma. A
Universidade de Yale adotar uma soluo temporria at que a norma revisada seja aceita.
Duas outras normas tcnicas so tambm apropriadas no nvel das aplicaes. Em primeiro lugar,
ndices que abrem um documento na forma de imagem para o folheamento nos nveis de ttulo de pgina
e de estrutura do documento, dependem de trabalho que descreva os contedos das imagens, defina e
torne possvel trocar e apresentar um conjunto particular de imagens como um conjunto de entidades de
ordem superior (por exemplo, um livro, um captulo, um conjunto de pginas). Normas tcnicas relativas
ao contedo do documento devem se aplicar (ou ser apropriadamente estendidas para se aplicar)
criao, armazenagem e ao uso dos vrios nveis de ndices estruturais. Alguns fornecedores, incluindo
a IBM, tm difundido seus prprios padres internos para contedo de documento. Contudo, a norma
ISO 8613, intitulada Information Processing - Text and Office Systems - Office Document Architeture
(ODA) and Interchange Format (ODIF), o padro internacional que prevalece e o projeto de Yale
procurar manter-se em conformidade com ela.
Em segundo lugar, os arquivos de estrutura, que descrevem o contedo dos documentos de
imagem em concordncia com a ISO 8613, devem ser armazenados e recuperados de um arquivo de
base de dados conectado referencialmente aos arquivos de imagens de documento. Esperamos que a
base de dados seja relacional. Esperamos, tambm, que ela incorpore e esteja em conformidade com
o padro SQL (Structured Query Language)
18
.
18
A apresentao de um ndice da estrutura do documento em uma forma relacional padronizada, eventualmente facilitar a
criao de conexes entre o documento de imagem digital e qualquer informao sobre seu contedo armazenada em outras fontes
legveis por computador, tais como a descrio bibliogrfica online do documento.
2 7
Componentes do sistema
Uma representao geral da arquitetura do sistema para o projeto de imagem digital para
preservao em Yale apresentada na Figura 6. Os componentes esto todos conectados rede
ethernet de alta velocidade do campus, que tem um ncleo de fibra ptica e velocidades atuais de
transmisso de at 10 megabytes por segundo. Os componentes chave do projeto so: um subsistema
de converso, um subsistema de reproduo (ou impresso), um subsistema de armazenagem e um
subsistema de acesso.
Converso
O propsito do subsistema de converso receber, como alimentao, uma srie de imagens de
fotogramas de microfilme que constituam um documento (livro, folheto ou peridico) e tirar uma
fotografia digital de cada quadro, de forma que a imagem seja armazenada como um arquivo de
computador e possa ser exibida em um monitor de computador. O processo de converso assegura a
qualidade fsica da digitalizao, que inclui o controle da resoluo, bem como do contedo de imagem,
contraste, distoro e seqncia. O processo tambm serve para caracterizar, ou indexar, o conjunto
de arquivos de imagem de forma que eles retenham sua identidade como um documento nico para
posterior armazenagem e recuperao. O passo final no processo submeter o conjunto de arquivos,
como uma entidade documental, para armazenagem permanente.
O subsistema de converso inclui um digitalizador de microfilme e papel e, no mnimo, uma
estao de trabalho controladora em que um operador possa realizar as funes de controle de
qualidade, indexao e confinamento (armazenagem permanente). Para proporcionar uma maior
Figuro . Arquiteturo do sistemo de imogem
2 8
flexibilidade, a estao de trabalho e o digitalizador deve estar conectados por uma rede local de alta
velocidade. Com a interconexo via rede, novas estaes de trabalho podem ser adicionadas para
dividir as tarefas, mas cada funo pode, ainda assim, ser realizada em todas as estaes.
Alternativamente e isto pode ser necessrio para maior eficincia , o digitalizador pode estar
diretamente conectado a uma estao de trabalho controladora, na qual um operador realiza as funes
de controle de qualidade. Aps a concluso do processo, o operador pode ento enviar os arquivos,
utilizando um mecanismo de rede (ou sneakernet) de compartilhamento de arquivos, para uma outra
estao de trabalho para processamento adicional de converso.
O digitalizador deve aceitar rolos de microfilme 35 mm, negativo ou positivo, com fotogramas
em p ou deitados, em vrios graus de reduo. Deve possuir um mecanismo de alimentao automtico
que permita operao no-assistida, alm de ser equipado com sensores para a deteco do incio e
da borda de cada fotograma e para a correo automtica da distoro dos fotogramas. Se possvel,
ele deve detectar o incio e a borda de cada pgina nos casos em que se tenha duas pginas por
fotograma. Em funo do esforo dispensado na digitalizao, o projeto de Yale procurar disponibilizar
as imagens com a mais alta resoluo tecnicamente possvel. O digitalizador deve, contudo, ser capaz
de escanear em diferentes nveis de resoluo e, para prevenir estrangulamentos no trabalho, deve ser
capaz de gerar as imagens em sua resoluo mxima de sada a uma velocidade de dois segundos, ou
menos, por fotograma. Finalmente, o digitalizador deve apresentar um conjunto aberto de interfaces
que lhe permita trabalhar com estaes de trabalho DOS, UNIX ou Macintosh. Um digitalizador para
documentos em papel, de alta velocidade, com as mesmas caractersticas, deve estar mo, para
permitir comparaes controladas de velocidade e qualidade nos casos em que a cpia em papel do
material microfilmado ainda se encontra disponvel.
Para trabalhar com as imagens digitalizadas, cada estao de trabalho, no processo de converso,
necessita da habilidade de processamento para ler e expandir a imagem comprimida de uma pgina e
para comprimir e salvar, no disco, imagem de uma pgina exposta. Todas as estaes de trabalho
devem percorrer a seqncia de arquivos de imagem, para frente e para trs, e saltar para uma imagem
especfica a partir de uma outra qualquer. Cada estao de trabalho necessita, tambm, de um monitor
de alta resoluo capaz de exibir uma imagem de pgina legvel. Cada estao de trabalho deveria
proporcionar funes gerais de manipulao de imagem tais como zoom, reduo, panormica,
rolamento e rotao. Finalmente, todas as estaes de trabalho no processo de converso devem ter
acesso a uma impressora laser local para a impresso de cpias de pginas selecionadas.
A estao de trabalho que controla o digitalizador e a qualidade de sua sada deve permitir ao
operador tanto iniciar um processo de escaneamento totalmente automtico, quanto interferir no mesmo,
de forma clara e substancial. Ela deve possibilitar ao operador o ajuste e a determinao da resoluo
de escaneamento, produzindo, por exemplo, um conjunto de imagens a uma resoluo elevada para
impresso e um outro conjunto a uma resoluo inferior para folheamento. A estao de trabalho
deve dar suporte s tcnicas para realce automtico de imagens, incluindo thresholding fixo e dinmico
e deteco de pico, que ajudam a melhorar o contraste entre texto e fundo, na impresso. Alm disso,
ela deve permitir ao operador cortar bordas de imagens e realizar outras funes de realce de imagem
em tempo real, bem como reescanear completamente uma imagem quando necessrio. Finalmente, a
estao de trabalho deveria criar, automaticamente, arquivos TIFF a partir do digitalizador, comprimir
as imagens escaneadas pela tcnica bidimensional do grupo 4 do CCITT e atribuir nomes seqnciais
para os arquivos de imagens.
2 9
A aplicao de indexao no processo de converso deve guiar o operador atravs de um
processo que proporcione informao sobre certos aspectos chaves da estrutura e do contedo do
conjunto de imagens que constituem o documento convertido. Em uma janela, deve exibir o conjunto
de imagens e permitir ao operador percorrer, para frente e para trs, a seqncia de arquivos de
imagens e ir diretamente at qualquer imagem especfica. Em outra janela, a aplicao de indexao
deve induzir o operador a verificar se a seqncia de imagens est correta e a fornecer um identificador
nico de documento sob o qual o conjunto de imagens possa ser armazenado como uma entidade
nica. Ao fornecer o identificador, a aplicao deveria checar na lista online dos identificadores
existentes se no houve repetio.
Em uma terceira janela, a aplicao deve dar ao operador acesso ao catlogo local online, criar
uma entrada apropriada para o documento em sua forma digital e indicar o identificador nico atravs
do qual o documento digital pode ser encontrado. Quando o trabalho bibliogrfico estiver completo, o
operador pode, opcionalmente, fornecer informaes que relacionem a seqncia de imagens a uma
notao de nmero de pgina e seqncia. O operador pode, tambm, indexar as divises estruturais
significativas dentro do documento e, ento, poder salvar a estrutura e a informao de contedo em
um arquivo de base de dados que, embora distinto, aponta para o conjunto de imagens que constituem
o documento preservado. Se existem duas cpias de um documento em resolues distintas, o arquivo
de estrutura deve apontar precisamente para as cpias como exemplos distintos do mesmo documento
com a mesma estrutura.
Uma vez que o arquivo de estrutura tenha sido criado, e at mesmo aps ter sido permanentemente
armazenado, o operador de indexao deve ser capaz de acess-lo e modific-lo. Alm disso, uma
vez que o operador tenha criado um ndice remissivo de nmeros de pginas para um documento
especfico, ele deve ser capaz, de imediato, de emitir um comando para ir at uma pgina especfica.
De forma similar, uma vez que o operador tenha criado um ndice para a estrutura interna do documento,
a aplicao deve permitir ao operador, com uma funo especial de marcador de pgina, que assinalaria
uma imagem especfica e permitiria o retorno direto a ela a qualquer momento. A localizao dos
marcadores de pgina dos operadores, contudo, no deve ser salva na verso permanente do arquivo
de estrutura.
Ao aplicar a funo de confinamento (armazenagem permanente), o operador verifica se o
processo de converso est completo e se o conjunto de imagens digitais resultante deve ento ser
armazenado. A funo assume, por motivos de segurana e de convenincia do usurio, que os
documentos de imagem e que a base de dados de arquivos de estrutura a eles associada estejam
armazenados em uma instalao de armazenagem central, acessvel por rede e no por analogia ao
microfilme, em armrios localizados nas proximidades das estaes de folheamento. Nos casos em
que o propsito da converso no criar uma cpia permanente do documento na forma digital e sim
imprimi-lo, a funo de armazenagem permanente pode encerrar o processo transferindo as imagens
com o auxlio de meio removvel ou atravs da rede, para a impressora digital de alta velocidade.
Com respeito armazenagem em discos no processo de converso, cada estao de trabalho
que controla o digitalizador requer espao de trabalho suficiente em disco magntico para que o operador
possa armazenar e manipular as imagens escaneadas, no-comprimidas, de pelo menos dois livros
(aproximadamente 600 megabytes). Em cada estao de trabalho que realiza as funes de indexao
3 0
e de armazenagem permanente, deve haver tambm um meio de armazenagem porttil, como um
drive para disco ptico WORM (write once, read many) contendo o disco sobre o qual as imagens
comprimidas do documento podem ser gravadas e, em seguida, fisicamente transportadas ao local de
armazenagem permanente dos discos. Alternativamente, deve existir a possibilidade de gravar em uma
instalao de armazenagem em massa atravs da rede de alta velocidade.
Armazenagem
O propsito do subsistema de armazenagem propiciar um meio (ou uma combinao de
meios) de alta capacidade, confivel para armazenagem de uma coleo de documentos que foram
preservados em forma digital ao subsistema de armazenagem que permita recuperar documentos tanto
para impresso quanto para folheamento em uma estao de trabalho computadorizada. Os
componentes do subsistema de armazenagem incluem os dispositivos para armazenagem em massa, o
controlador de armazenagem em massa, o servidor de base de dados de imagem e o arquivo de
estrutura do documento.
Deve-se presumir que o processo de converso crie cada arquivo de imagem a uma resoluo
de 400 dpi e que a forma comprimida de cada imagem ocupe 150 kilobytes na armazenagem e que
cada livro convertido consista de 300 pginas. Por simples multiplicao, com estas suposies,
conclumos que uma biblioteca digital para os 10 mil livros selecionados para converso no projeto de
Yale necessitar de aproximadamente 450 gigabytes para armazenagem em massa.
Considera-se que o disco ptico WORM , atualmente, o meio mais eficiente, em termos de
custo, para a armazenagem deste volume de informao
19
. Contudo, se uma segunda cpia de cada
documento for criada a uma resoluo inferior para fins de folheamento, as necessidades de
armazenagem podem ser substancialmente menores para a segunda cpia (cerca de 125 GB) do que
para a primeira e a freqncia do uso pode ser suficiente para justificar os custos de armazenagem dos
arquivos de imagem em disco magntico, que proporciona tempos de acesso mais rpidos que o meio
ptico. Os discos pticos WORM contendo as verses de maior resoluo para impresso podem
ser instalados em uma jukebox, ou mantidos fora de linha, o que exigiria um operador para intervir e
instal-lo quando solicitados. Os dados armazenados em meio magntico devem ser regularmente
copiados em fita (back up), como precauo contra a perda de dados devido a falhas do disco; os
dados armazenados pelos meios WORM devem ser periodicamente copiados para novos meios, na
medida em que os formatos ou os equipamentos de acesso se tornem obsoletos e sejam substitudos.
O controlador de armazenagem em massa no subsistema proporciona uma interface entra a
armazenagem em disco e o servidor de imagem. Ele traduz as solicitaes de imagens em comandos
que localizam e recuperam adequadamente os documentos de imagem armazenados no dispositivo de
armazenagem magntico ou na jukebox para discos pticos. Quando o documento estiver armazenado
fora de linha, controlador gerar uma solicitao ao operador para que instale o disco apropriado.
Para solicitaes de armazenagem de documentos de imagem, em vez de sua recuperao, o controlador
localizar o espao, armazenar os arquivos adequadamente e atualizar o diretrio de arquivos.
19
Michael Lesk, op. cit., p. 306.
3 1
O arquivo de estrutura de documento contm aspectos de indexao, de informao, de estrutura
e do contedo de cada documento de imagem. Ele um componentes essencial da biblioteca de
imagens e a informao nele contida deve acompanhar cada solicitao de documento; reciprocamente,
qualquer novo documento de imagem que for armazenado deve conter um componente de ndice para
armazenagem no arquivo de estrutura. Esse arquivo uma base de dados relacional em conformidade
com a norma SQL. Sendo um arquivo online, ele requer cpia reserva (backup) regular.
O servidor de base de dados de imagem conecta o arquivo de estrutura do documento, atravs
do controlador de armazenagem, aos arquivos de documentos de imagens. Ele acessvel pela rede e
responde s solicitaes de imagens, recuperando a informao relevante do arquivo de estrutura e os
arquivos relevantes da biblioteca de imagens, preparando-os para entrega ao subsistema de acesso ou
impressora. O servidor tambm responde a solicitaes para armazenagem de documentos de imagem
assegurando que o arquivo de estrutura esteja atualizado e que os arquivos de imagem sejam transferidos
ao dispositivo de armazenagem em massa apropriado. O servidor requer um volume substancial de
memria armazenada (cache) para os documentos que entram e que saem. Uma funo crucial do
servidor neste processo fornecer dados informativos de status a seus usurios, inclusive informao
referente ao andamento da transmisso e erros na armazenagem ou na recuperao.
Acesso
O propsito do subsistema de acesso dar ao usurio a possibilidade de recuperar e utilizar a
biblioteca de documentos preservados na forma de imagem. Os componentes do subsistema incluem
o servidor de apresentao de imagem e as estaes de visualizao de imagem. No caso mais simples
do subsistema, documentos de imagem devem ser apresentados para visualizao em um nico tipo de
estao de trabalho fornecido pela biblioteca e cuja seleo ela controla. O caso mais complicado
ocorre quando a biblioteca prov acesso aos documentos de imagem para os pesquisadores de todo
o campus, que utilizam diferentes tipos de estaes de trabalho com capacidades de exibio de
imagem variveis. Mas, em qualquer caso, as funes mnimas proporcionadas por uma estao de
visualizao devem ser as mesmas. A estao deve permitir ao usurio recuperar um documento de
imagem atravs de seu identificador nico e exibir e folhear o documento, dependendo da forma em
que ele est descrito no arquivo de estrutura.
Para conseguir lidar com imagens, cada estao de trabalho requer a habilidade de processo
para ler, expandir e exibir uma imagem de pgina comprimida. As estaes requerem um monitor de
alta resoluo capaz de exibir uma imagem de pgina legvel. Cada estao de trabalho deve
proporcionar funes gerais de manipulao de imagem como zoom, reduo panormica, rolamento
e rotao. Finalmente, estaes de visualizao devem ser capazes de, se houver equipamento
disponvel, transferir imagens para impressoras a laser locais a impresso de cpias de pginas
selecionadas.
A partir da estao de trabalho de acesso, o usurio deve ser capaz de consultar o catlogo
online para determinar o identificador nico de um documento. Determinado o identificador, o usurio
deve, ento, ser capaz de requisitar o documento ao servidor de imagem e t-lo disponvel para
visualizao na tela do monitor. No havendo qualquer informao adicional de ndice, o usurio deve
ser capaz de percorrer o documento para frente e para trs, atravs da seqncia dos arquivos de
imagem e de ir diretamente a qualquer imagem especfica a partir de outra.
3 2
Contudo, se existir um ndice de nmeros de pginas, o usurio deve ser capaz de emitir um
comando para ir a uma pgina especfica. Da mesma forma, se houver um ndice para o sumrio, para as
sees e os captulos do documento, alm de outras partes importantes de sua estrutura, o software deve
possibilitar acesso imediato imagem inicial de cada uma dessas divises estruturais. A interface deve
tambm proporcionar ao usurio uma funo especial de marcador de pgina, que marque uma imagem
especfica e permita o retorno direto e imediato a essa imagem a qualquer momento; a localizao dos
marcadores de pgina dos usurios, contudo, existiria apenas durante a sesso de folheamento.
O servidor de apresentao de imagem separa essas diferentes funes de acesso, que todas as
estaes de visualizao devem proporcionar em comum, das diferentes formas como os sistemas de
operao das vrias plataformas (DOS, UNIX, Macintosh) efetivamente as apresentam ao usurio.
No incio de uma sesso de folheamento, o servidor interrogar a estao de visualizao especfica
para determinar seu tipo e suas capacidades. Pode ser que a estao no esteja adequadamente
equipada para a visualizao de imagens e, ento, o servidor responder neste sentido. Por outro lado,
quando o servidor de imagem responder a uma solicitao por um documento, o servidor de
apresentao ser ativado. Ele usar o arquivo de estrutura do documento, que descreve aspectos
crticos do documento, e, utilizando as converses do Office Document Architecture, fornecer um
conjunto de alto nvel de instrues sobre como o contedo do documento deve ser apresentado. O
servidor traduz estas instrues para um formato e um conjunto de instrues de programas apropriados
estao de trabalho especfica. Utilizando um driver obtido do servidor, a estao de visualizao,
por sua vez, processa as instrues e gera um formato de apresentao que permita ao usurio folhear
facilmente o documento de imagem.
Reproduo
O propsito do subsistema de reproduo gerar cpias impressas de altssima qualidade dos
documentos selecionados, total ou parcialmente, que se encontram armazenados na forma de imagem
digital. Os componentes do subsistema incluem a impressora, um servidor de impresso e um solicitador
de impresso. A impressora dever ser capaz de aceitar como alimentao arquivos de imagem de
resoluo muito alta (600 pontos por polegada ou mais), devendo gerar cpias impressas com a
mesma resoluo. Para maior economia, ela deveria operar a velocidades bastante elevadas (100
pginas por minuto, ou mais, um critrio atual de referncia) e apresentar capacidade interna de
cotejamento e encadernao.
O servidor de impresso gerencia a fila de espera para a impressora, proporcionando vrios
controles de operao, incluindo a possibilidade de definir prioridades de execuo, de informar sobre
o andamento das mesmas e de cancel-las. Ele deveria contar com uma capacidade de transferncia
de dados substancial e precisaria aceitar arquivos TIFF comprimidos de acordo com o padro grupo
4 do CCITT. Se precisar reformatar tais arquivos para um formato interno, deve faz-lo sem qualquer
perda de qualidade ou informao. Para acomodar necessidades de impresso diretamente do subsistema
de converso, o servidor de impresso pode precisar de um drive WORM compatvel para a entrada
direta do documento a ser impresso.
Os usurios que queiram imprimir total ou parcialmente um documento especfico o faro
chamando um servio de rede que submeta requisies de impresso. Um indivduo pode solicitar uma
cpia impressa de um documento de imagem atravs do identificador nico especificado no catlogo
3 3
online. O servio de requisio recuperar a informao de estrutura referente ao documento e pedir
ao mesmo para determinar quais as partes ou as pginas do documento a serem impressas e se
necessria a encadernao. O servio de requisio de impresso deve possuir capacidade interna de
contabilidade, de forma que os usurios possam ser cobrados pelas cpias que geraram. O uso geral
do servio de requisio em rede para cobrana presume que haja uma maneira de identificar os
usurios e de verificar se eles so realmente quem dizem que so. Considerando a questo da identificao
como tendo sido realizada, uma extenso natural do servio de requisio de impresso ser utilizada
para coletar os encargos de royalty apropriados pela reproduo de documentos tais como artigos
recentes de peridicos, que podem ser, eventualmente, adicionados biblioteca digital.
Aspectos de exeqibilidade
Como foi visto, um conjunto de normas tcnicas est sendo elaborado para regular a arquitetura
de sistemas de imagem digital. Alm disso, vem tomando corpo um entendimento geral sobre a natureza
e a inter-relao dos componentes do sistema de imagem digital para preservao em larga escala, em
Yale, no qual o material convertido a partir do microfilme se torna, em formato de imagem,
consideravelmente mais acessvel e valioso comunidade de pesquisadores.
O otimismo quanto exeqibilidade geral da criao de um sistema vivel com base em uma
biblioteca de imagens com 10 mil volumes no deve, contudo, obscurecer os riscos associados. Nem
todos os aspectos dos componentes do sistema e de suas inter-relaes so to bem compreendidos
quanto outras partes; h ainda muitas incertezas e aspectos desconhecidos sobre a tecnologia e sua
operao. Invocando um princpio de projeto citado anteriormente em que os dados criados e
armazenados constituem o recurso principal de uma biblioteca em um sistema automatizado e
indagando de que maneira os dados estaro em maior risco nesta arquitetura especfica, podemos
identificar pelo menos quatro reas de preocupao que devem limitar ou impedir o desenvolvimento
do sistema e que, portanto, merecem especial ateno.
Em primeiro lugar, a rea de maior preocupao a integrao dos dispositivos de armazenagem
em massa. A tecnologia de armazenagem ptica WORM , em geral, bem conhecida, mas formatos
padronizados para o meio ainda no foram estabelecidos. Alm disso, a experincia na indstria ainda
no muito rica no tocante utilizao atual da tecnologia e, em particular, maneira de se otimizar a
combinao de armazenagem magntica e ptica para aplicaes especficas e, desta forma, melhorar
o tempo de acesso e aliviar a disputa pelos drives em um ambiente multiusurio.
Diante das circunstncias, a aplicao que a biblioteca espera desenvolver parece especial. As
aplicaes da tecnologia de reproduo digital de imagem esto ganhando espao em ambientes de
escritrio, onde o documento modelo uma pasta de arquivo que contm uns poucos itens e que
algum consulta rapidamente e segue em frente. O documento modelo na biblioteca, contudo, o livro
com algumas centenas de pginas, cujo texto algum pode ler minuciosamente por algum tempo e,
ocasionalmente, percorrer rapidamente para frente e para trs, para consultar pontos relacionados,
citaes, e assim por diante. Parece razovel prever que os diferentes padres de uso de documentos
na biblioteca sobrecarregaro os mecanismos de armazenagem em novas e diferentes maneiras,
requerendo solues que podem no estar, ainda, disponveis. A questo : a experincia corroborar
esta hiptese ou no?
3 4
Em segundo lugar, a questo da renovao peridica dos dados em meios pticos de
armazenagem ainda causa preocupao. Centros de computao e fornecedores de computadores j
atravessaram muitos ciclos de alteraes tcnicas no tocante aos meios magnticos, exigindo a recpia
peridica de dados. Os ciclos de mudana na tecnologia ptica, contudo, apenas comearam a atingir
os grandes centros de produo de dados. Devido ao fato da tecnologia ser diferente e do volume de
dados armazenado no disco ptico ser, em ordem de magnitude, muito superior ao volume armazenado
nos meios magnticos, os conhecidos paradigmas de renovao de dados podem no ser aplicados.
Os fornecedores desempenharo um papel chave na difuso de solues apropriadas e prticas; porm,
quando interrogados, poucos so capazes de articular tais solues.
A terceira rea principal de preocupao o denominado arquivo de estrutura do documento.
medida em que a biblioteca indexa seus documentos de imagem pelo nmero da pgina ou pela
estrutura interna do documento, uma grande parte de seu trabalho e investimento vai sendo vinculada
a este arquivo de estrutura. Os padres ODA (Office Document Architecture) e SQL parecem
apropriados para regular sua natureza e organizao e para fazer com que os dados neles contidos
sejam transferveis para um outro sistema ou implementao quando necessrio. Contudo, j est
claro que este modo de investimento na biblioteca de imagens e nos vrios ndices incorporados no
arquivo de estrutura de documento ir, sem dvida, garantir a participao ativa da biblioteca de Yale
no s na implementao especfica da ODA, mas tambm em suas extenses e desenvolvimento.
Finalmente, um quarto aspecto de preocupao potencial emana do processo de controle de
qualidade. A comunidade bibliotecria esperou durante anos que, dada a tecnologia correta, o
microfilme fosse facilmente conversvel forma digital. O projeto de Yale gerar, certamente, bastante
informao til sobre a facilidade (ou dificuldade) tcnica do processo de converso. Porm, a
qualidade do produto resultante do processo depender no somente dos mecanismos e da magia
tcnica do processo de converso por si s, como tambm da qualidade do microfilme, da qualidade
necessria s imagens digitais para servir como alimentao para processos tcnicos subseqentes,
bem como do reconhecimento ptico de caracteres (OCR), e dos padres de qualidade reivindicados
pelos usurios que usaro as imagens digitais em seu trabalho de pesquisa. Ser importante neste
projeto, ento, capturar e avaliar as formas pelas quais o acervo para preservao em microfilme
possa ou deva ser alterado para gerar uma imagem digital melhor. Da mesma forma, ser importante
encontrar maneiras de avaliar a qualidade do processo de digitalizao do ponto de vista dos processos
tcnicos afins, como o reconhecimento de caracteres, tornando-se absolutamente essencial avaliar
o processo do ponto de vista da satisfao do usurio.
Plano de trabalho
O projeto de preservao digital de Yale ser baseado em trabalhos relacionados, desenvolvidos
na Biblioteca do Congresso norte-americano, na Biblioteca Nacional de Medicina, na Universidade
de Cornell e em outras instituies bibliotecrias e arquivsticas, concentrando-se na converso de
microfilme para imagens digitais e almejando a construo de uma biblioteca digital com 10 mil volumes
durante o processo. Grande parte do equipamento e do software de aplicao necessrios construo
de um sistema em Yale j se encontra disponvel no mercado, a partir dos fornecedores, ou encontra-
se em estgio avanado de desenvolvimento pelos mesmos. A principal exceo o gerenciador de
apresentao de imagem descrito na seo anterior, para o qual a Yale conta com a mo-de-obra
especializada de desenvolvimento e que ser gerado como um produto especfico do sistema de Yale.
3 5
Naturalmente, preocupaes sobre vrios aspectos ambguos e incertos da arquitetura de sistemas
de imagem digital acentuam os riscos do investimento em tecnologia relativamente nova e cara, na
escala contemplada pelo projeto da Yale. Contudo, estas preocupaes chamam, tambm, a ateno
para as reas de oportunidade que um projeto com o alcance e a extenso que tem o projeto da Yale
oferece para o avano de nossa compreenso acerca do potencial e dos limites da tecnologia, para o
desenvolvimento de certos aspectos da tecnologia e, acima de tudo, para reduzir de modo mensurvel
os riscos do investimento para aquelas bibliotecas que venham a seguir o caminho da imagem digital.
Para minorar os riscos do projeto e para ampliar suas possibilidades de gerar um retorno valioso, uma
soluo um plano de implementao deliberado e cuidadoso com objetivos claros, resultados
mensurveis e uma abordagem em etapas, de forma que tudo no seja perdido ou esteja necessariamente
em risco, caso surja algum problema ou obstculo.
Objetivos do projeto
O projeto de preservao digital planejado para a Biblioteca da Universidade de Yale apresenta
trs objetivos maiores:
identificar, desenvolver e avaliar os meios de criar e armazenar uma biblioteca digital de materiais
preservados atravs da converso de imagens armazenadas em microfilme para a forma
digitalizada, numa escala de produo de 10 mil volumes;
Identificar, desenvolver e avaliar os meios de propiciar, prover e melhorar a distribuio ou o
acesso fsico aos materiais preservados na forma de imagem digital, tanto de dentro quanto de
fora da biblioteca;
Identificar, desenvolver e avaliar os meios de prover, preservar e melhorar o acesso intelectual
aos materiais da biblioteca na forma de imagem digital.
Escopo do projeto
O projeto ser dividido em seis fases, ao longo de trs anos (Figura 7). A primeira se estender
do ms 1 ao 4 e estabelecer a estrutura organizacional geral para o projeto. Durante a segunda fase,
que se estender do ms 5 ao 8, ser feita a instalao inicial do hardware e do software. A fase 3
estabelecer um processo no nvel de produo para a converso de microfilme para imagens digitais.
Ela ter incio no ms 9 e terminar no ms 18. A quarta fase do projeto tambm ter incio no ms 9,
mas terminar no ms 21, quando os documentos e imagem digital se tornarem acessveis aos usurios
dentro da biblioteca de Yale. A quinta fase se estender do ms 22 ao 33 e estabelecer o acesso aos
documentos de imagem digital para usurios de fora da biblioteca de Yale. O projeto ser concludo na
sexta fase, durante os meses 34 ao 36, com a finalizao da converso dos 10 mil volumes, um ajuste
final e a avaliao de todos os componentes do sistema.
Em cada estgio, um relatrio ser gerado para assumir os resultados at ento alcanados e
para avaliar o mrito geral do projeto. Devido ao fato de que a tecnologia de imagem digital que est
sendo investigada e demonstrada ainda est sujeita a rpidas alteraes e desenvolvimento, possvel,
embora pouco provvel, que os resultados daqui vislumbrados emerjam em algum outro lugar ou que
as capacidades da prpria tecnologia ultrapassem as pretenses em que os projetos se fundamenta.
Desta forma, cada relatrio tratar o final daquela fase como um marco para perguntar e responder a
seguinte questo: valido continuar este projeto?
3 6
Fase 1 - Organizao
Objetivo - O objetivo da fase 1 criar a estrutura organizacional geral para o projeto e preparar
o trabalho para as fases subseqentes.
Cronograma - Meses 1-4
Atividades - Durante a fase 1, um Comit Diretor ser criado para prover a superviso geral e
a direo para o projeto. Ele ser constitudo, ao menos inicialmente, pelo diretor da Biblioteca da
Universidade, pelo diretor substituto, pelos bibliotecrios ligados Biblioteca para servios tcnicos,
atendimento ao pblico e desenvolvimento de colees pelo chefe do Departamento de Preservao,
pelo diretor de Computao e Sistemas de Informao da Universidade, pelo diretor acadmico de
Computao, pelo gerente do projeto e por quatro membros selecionados da equipe. O Comit pode
ajustar sua composio ao longo do tempo, se necessrio.
A agenda inicial do Comit incluir os seguintes itens:
estabelecer os critrios para identificar que pores da coleo de microfilme para preservao
sero convertidas em imagens digitais;
auxiliar o gerente do projeto e membros da equipe do projeto, no estabelecimento de relaes
de parceria adequadas, com os fornecedores de equipamento e aplicaes para o processamento
digital de documentos;
rever o oramento proposto para o projeto e auxiliar na identificao e obteno de fontes de
financiamento.
O gerente do projeto ser o chefe do escritrio de sistemas da biblioteca. A equipe do projeto
se constituir, inicialmente, pelo chefe do Departamento de Preservao da Biblioteca e pelo diretor
associado de Sistemas, Tecnologias e Planejamento do Departamento de Computao e Sistemas de
Informao. Durante esta fase, a equipe do projeto:
Figuro 7. Foses do pro|eto
3 7
identificar o hardware e o software especficos que sero adquiridos para o projeto;
estabelecer relaes de parceria adequadas com os fornecedores de equipamento e aplicaes
para o processamento digital de documentos que sero adquiridos no projeto;
preparar um plano da composio do quadro de profissionais envolvidos para todas as fases
subseqentes do projeto;
preparar um oramento para o projeto inteiro e trabalhar com o Comit Diretor e outras
fontes apropriadas para a obteno de financiamentos.
Pr-requisitos - Este documento, Do microfilme imagem digital, proporcionar a base e
os fundamentos de planejamento para o trabalho inicial do Comit Diretor e da equipe do projeto.
Produtos
um oramento para o projeto;
um plano de custeio;
um relatrio resumindo os resultados do trabalho nesta fase.
Fase 2 - Estrutura
Objetivo - O objetivo da fase 2 iniciar a instalao do ambiente de trabalho necessrio ao
projeto.
Cronograma - Meses 5-8.
Atividades - A equipe do projeto:
aplicar os critrios estabelecidos pelo Comit Diretor e iniciar a seleo dos segmentos da
coleo de microfilme a serem convertidos;
criar e iniciar a implementao de um plano para avaliar se os critrios utilizados na seleo
de material para converso criaro uma biblioteca digital que os usurios da Biblioteca considerem
intelectualmente valiosa;
contratar os profissionais necessrios;
adquirir, instalar e testar o hardware e o software para o subsistema de converso;
adquirir, instalar e testar a impressora digital de alta velocidade e o servidor de impresso.
adquirir, instalar e testar o componente do arquivo de estrutura de documento do subsistema
de armazenagem e comear a adquirir, instalar e testar os outros componentes do subsistema
de armazenagem;
preparar o projeto e as especificaes iniciais para o servidor de apresentao de imagem.
Alm disso, a equipe firmar um contrato com uma agncia de prestao de servios para
converter, de microfilme para a forma de imagem digital, at 10 volumes selecionados aleatoriamente.
O contrato estabelecer a linha base de custos para comparao com os custos de processamento na
prpria instituio. Fornecer, tambm, experincia na formulao e aplicao de critrios de aceitao
para o processo de controle de qualidade dentro da instituio. Presumivelmente, neste estgio, os
documentos sero desenvolvidos na forma de imagem, sem qualquer indexao.
3 8
Pr-requisitos - Para que esta fase se inicie, deve haver um oramento aprovado, provido dos
fundos necessrios para cobrir os custos de pessoal, da aquisio de hardware e software e da
agncia de prestao de servios.
Produtos
dez volumes estaro disponveis na forma digital e prontos para o processo de indexao
dentro do subsistema de converso;
um relatrio resumindo os resultados do trabalho nesta fase, incluindo uma anlise da experincia
com a agncia de prestao de servios e um plano para avaliar sistematicamente, durante toda
a durao o projeto, os mritos da converso dentro da prpria instituio versus a utilizao
da agncia de prestao de servios.
Fase 3 - Converso
Objetivo - O objetivo da fase 3 estabelecer um processo em nvel de produo para a
converso de microfilme para imagens digitais.
Cronograma - Meses 9-18.
Atividades - As principais tarefas da equipe do projeto nesta fase incluem:
desenvolver procedimentos e treinar o(s) operador(es) no uso do digitalizador e da estao de
trabalho de controle de qualidade, incluindo suas caractersticas de realce de imagens;
selecionar para a digitalizao, no incio desta fase, uma amostra de carretis de microfilme que
reflita as variaes na qualidade do processo de microfilmagem. Planejar um mtodo para utilizar
esta amostra tanto para praticar o processo de controle de qualidade quanto para iniciar a
formulao de concluses sobre as maneiras como as tcnicas de microfilmagem podem afetar
a qualidade do processo de digitalizao;
planejar e implementar um padro de controle de qualidade que considere, em especial, a
possibilidade futura de aplicao da tecnologia de reconhecimento de caracteres s imagens
geradas neste processo de converso;
criar um processo contnuo para a avaliao da satisfao do usurio com os processos e as
normas tcnicas de controle de qualidade;
rever o projeto do ndice de nmero de pgina e do ndice de estrutura do documento para assegurar
que conexes podem ser criadas, no futuro, entre estes ndices e as notas de contedo suplementares
e que possam estar armazenadas em algum outro local, em formato legvel por computador;
desenvolver procedimentos e treinar o(s) operador (es) no uso de cada uma das quatro diferentes
funes de indexao de documentos. O(s) operador(es) no uso de cada uma das quatro diferentes
funes de indexao de documentos. O(s) operador(es) deveria(m) ser capaz(es) de: 1) atribuir
um identificador nico ao conjunto de imagens convertidas que constituiriam uma entidade
documental nica; 2) indexar o documento imagem por nmero de pgina; 3) indexar o documento
imagem pela estrutura interna do documento; 4) criar uma entidade bibliogrfica no catlogo
online da Yale que descreva o documento imagem e o identifique na biblioteca de imagem digital
atravs de seu identificador nico;
3 9
planejar mtodos de estruturao e alterao do fluxo de trabalho de indexao para isolar os
custos de cada uma das quatro formas de indexao de documentos;
desenvolver procedimentos e treinar o(s) operador(es) para confinar o documento imagem e
os ndices do documento armazenagem em arquivo permanente utilizando, neste estgio, um
drive porttil WORM;
revisar os critrios para a seleo de materiais de preservao de alta utilizao dos quais uma
cpia impressa ser encadernada e devolvida estante;
desenvolver procedimentos e treinar o(s) operador(es) para transferir as imagens de documentos
selecionados diretamente para a impressora de documentos de imagem de alta qualidade. O
modo de transmisso prefervel atravs da rede de alta velocidade;
planejar um mtodo de estruturao do fluxo de trabalho para isolar os custos de digitalizao,
controle de qualidade e impresso, sem qualquer indexao;
planejar um mtodo e um procedimento contnuo para comparar os custos de digitalizao,
controle de qualidade e indexao na prpria instituio com os custos correspondentes, a nvel
de agncia de prestao de servios;
indexar e confinar armazenagens os 10 volumes digitalizados pela agncia de prestao de
servios na fase 2;
digitalizar, realar, indexar e confinar armazenagem, em arquivo permanente, 490 volumes.
Pr-requisitos - Para que esta fase possa comear, o subsistema de converso, a impressora,
o servidor de impresso e o componentes de arquivo de estrutura de documento do subsistema de
armazenagem devem todos estar instalados e testados.
Aspectos a serem investigados - O trabalho nesta fase concebido para produzir medio
criteriosa de qualidade e custo ao longo de vrias dimenses, incluindo:
os possveis efeitos da qualidade do microfilme sobre a qualidade da digitalizao;
as implicaes de um possvel futuro reconhecimento de caracteres no processo de controle
de qualidade na digitalizao do microfilme;
a satisfao do usurio com os padres e processos de controle de qualidade;
os custos relativos de digitalizao, controle de qualidade e indexao na prpria instituio e
em uma agncia de prestao de servios;
os custos variveis dos diferentes nveis de indexao;
os custos da digitalizao e impresso simples, sem indexao.
Ser importante coletar e monitorar estas vrias medidas em uma base contnua durante todo o
projeto.
Produtos
operao do subsistema de converso em nveis de produo;
500 volumes digitalizados e completamente indexados;
4 0
um relatrio resumindo os resultados do trabalho nesta fase, incluindo uma anlise dos custos.
Fase 4 - Acesso Biblioteca
Objetivo - O objetivo da fase 4 tornar a crescente biblioteca de imagem digital acessvel aos
usurios atravs de estaes de trabalho localizadas dentro da biblioteca de Yale.
Cronograma - Meses 9-21.
Atividades - As principais tarefas da equipe do projeto nesta fase incluem:
completar a aquisio, instalao e teste do subsistema de armazenagem;
especificar, adquirir, instalar e testar as estaes de acesso na biblioteca;
desenvolver e testar um prottipo do servidor de apresentao de imagem capaz de interagir
com as estaes de acesso, na biblioteca;
projetar e implementar um estudo para medir o valor, para os usurios da biblioteca, de cada
uma das ferramentas de ndice disponveis para o documento digital, em comparao com o
aceso ao microfilme;
criar e implementar um plano para fazer cpia reserva (back up) dos dados armazenados
sobre meios magnticos e para, periodicamente, renovar os dados armazenados nos meios
pticos e magnticos;
transferir todos os volumes digitalizados para o sistema de armazenagem permanente;
conceber um mtodo para estimar os custos da adio do subsistema de armazenagem e de
manuteno a uma base contnua;
estabelecer e implementar mtodos e procedimentos contnuos para estimar os efeitos da
carga de acesso sobre a performance do subsistema de armazenagem de imagem;
conceber e implementar mtodos e procedimentos contnuos para monitoramento e ajuste dos
defeitos da transmisso de imagens sobre a performance da rede;
conceber mtodos para estimar os custos da criao e manuteno do subsistema de acesso;
adquirir, instalar e testar o solicitador de impresso;
conceber mtodos para estimar os custos da criao e manuteno do subsistema de impresso;
aps o trmino da fase 2 e durante os meses 16-18, digitalizar, realar, indexar e confinar
armazenagem permanente 1.300 volumes.
Pr-requisitos - Para que esta fase se inicie, a impressora, o servidor de impresso e o
componente de arquivo de estrutura de documento do subsistema de armazenagem devem estar
instalados e testados. O projeto inicial e as especificaes para o servidor de apresentao de imagem
devem tambm estar completos.
Aspectos a ser investigados - O trabalho nesta fase concebido para produzir medio
criteriosa de qualidade e custo ao longo de vrias dimenses, incluindo:
os custos da criao e manuteno do subsistema de armazenagem;
4 1
os custos de confeco de cpia reserva (backup) dos dados armazenados sobre disco
magntico e da renovao peridica dos dados armazenados em meios ptico e magntico;
os custos da criao e manuteno do subsistema de acesso;
os custos da criao e manuteno do subsistema de impresso;
os efeitos da carga de acesso sobre o subsistema de armazenagem;
os efeitos da carga de transmisso sobre a rede;
o valor dos ndices de documento para os usurios na biblioteca;
Ser importante coletar e monitorar estas vrias medidas em uma base contnua durante todo o
projeto.
Produtos
Subsistema de armazenagem de imagens operando em nveis de produo;
Subsistema de impresso operando em nveis de produo;
Prottipo do gerenciador de apresentao de imagem;
Subsistema de acesso operando em nveis de produo na biblioteca;
Servidor de solicitao de impresso;
1.300 volumes digitalizados e completamente indexados;
Um relatrio resumindo os resultados do trabalho nesta fase, incluindo uma anlise de custos.
Fase 5 - Acesso remoto
Objetivo - O objetivo da fase 5 estabelecer o acesso aos documentos de imagem digital de
fora da biblioteca de Yale.
Cronograma - Meses 22-23
Atividades - As principais tarefas da equipe do projeto nesta fase incluem:
estender a operao do servidor de apresentao de imagens, de forma a torn-lo capaz de
interagir com tipos selecionados de estaes de trabalho fora da biblioteca;
tornar o subsistema de acesso s imagens disponvel, atravs do servidor de apresentao de
imagens, a tipos selecionados de estaes de trabalho conectadas rede do campus;
conceber mtodos para estimar os custos iniciais e os custos contnuos da introduo do
acesso ao sistema de imagem de fora da biblioteca;
planejar e implementar um estudo para medir o valor, para os usurios de fora da biblioteca, de
cada uma das ferramentas de ndice disponveis para o documento digital;
digitalizar, realar, indexar e confinar armazenagem permanente 7.800 volumes.
Pr-requisitos - Para que esta fase se inicie, o prottipo do servidor de apresentao de
imagem deve estar completo e operacional.
4 2
Aspectos a ser investigados - O trabalho nesta fase projetado para produzir medies
criteriosas do valor dos ndices de documento para usurios de fora da biblioteca. Ser importante
coletar e monitorar estas medidas em uma base contnua durante esta e a ltima fase do projeto.
Produtos
gerenciador de apresentao de imagem em nvel de produo;
operao do subsistema de acesso a partir de estaes de trabalho fora da biblioteca;
7.800 volumes digitalizados e completamente indexados;
um relatrio resumindo os resultados do trabalho nesta fase, incluindo uma anlise de custos.
Fase 6 - Finalizao
Objetivo - O objetivo da fase 6 completar a converso dos 10 mil volumes e realizar um
ajuste e uma avaliao finais de todos os componentes do sistema.
Cronograma - Meses 34-36.
Atividades - As tarefas principais da equipe do projeto nesta fase incluem:
rever e avaliar todas as medies de qualidade e performance em cada um dos subsistemas.
digitalizar, realar, indexar e confinar armazenagem permanente 400 volumes.
Pr-requisitos - Para que esta fase se inicie, a verso de produo do servidor de apresentao
de imagens deve estar completa e operacional.
Produtos
um relatrio final;
400 volumes digitalizados e completamente indexados.
Concluso
A biblioteca da Universidade de Yale prev um futuro em que a tecnologia de imagem digital
constituir uma ferramenta fundamental no processo de preservao dos materiais em deteriorao de
suas ricas e valiosas colees. Justamente no momento em que a deteriorao de documentos compostos
de papel cido est se acelerando a uma taxa alarmante em Yale e em outras grandes bibliotecas de
pesquisa por todo os Estados Unidos, a arquitetura de sistemas de imagem digital est se tornando
mais conhecida, e os componentes do sistema esto cada vez mais bem integrados e prontamente
disponveis. A Biblioteca do Congresso norte-americano, A Biblioteca Nacional de Medicina, a
Universidade Cornell e outras instituies bibliotecrias e arquivsticas tm fornecido, de diferentes
formas, grandes contribuies ao desenvolvimento da tecnologia de imagem digital e sua aplicao
para preservar e melhorar o acesso geral ao manancial nacional e internacional de conhecimento
registrado. Este o momento certo para outro grande passo no sentido de fazer da tecnologia de
imagem digital uma ferramenta prtica para bibliotecas.
O projeto de preservao digital de Yale ser fundamentado em trabalho de igual natureza aos
desenvolvidos em outras instituies, particularmente na Universidade de Cornell. Concentrando-se
4 3
na converso de microfilme para imagens digitais e almejando a construo de uma biblioteca digital
com 10 mil volumes. Grande parte do equipamento e do software de aplicao necessrios construo
de um sistema em Yale j est disponvel no mercado, ou em estgio avanado de desenvolvimento
pelos fornecedores. Contudo, o sistema de processamento de imagens digitais para preservao da
Yale implicar em um grau elevado de capital e, particularmente na fase de indexao do processo de
converso, de trabalho. Seu sucesso exigir auxlio considervel de agncias de financiamento e parcerias
significativas e produtivas com membros da comunidade de fornecedores. O resultado para todos os
participantes do projeto ser um corpo substancial de informaes sobre os custos e benefcios da
tecnologia de imagem digital. As bibliotecas, e os fornecedores que com elas trabalham, dependero
de tais informaes, no futuro, para tomar decises prudentes e prticas sobre a incorporao da
tecnologia aos materiais nela contidos.
Notas
Agradecimentos: Na preparao deste relatrio de planejamento, eu recebi muita ajuda de vrias pessoas em vrias
instituies privadas e universitrias. Elas so muito numerosas para serem individualmente citadas; eu sou muito grato a todas
elas. Contudo, quero agradecer a meus colegas do Escritrio de Sistemas da Biblioteca da Universidade de Yale, Merri Beth
Lavagnino e Greg Kaisen, por sua considervel ajuda. Agradeo, tambm, Commision of an Access Preservation por seu apoio
atravs da contratao da biblioteca da Universidade de Yale para elaborar este relatrio.
Donald J. Waters
Chefe do Escritrio de Sistemas
Biblioteca da Universidade de Yale
New Haven, Connecticut 06520
O Projeto Conservao Preventiva em Bibliotecas e Arquivos - CPBA
est sediado no
Arquivo Nacional
Rua Azeredo Coutinho 77, sala 605 - C
CEP 20230-170 Rio de Janeiro - RJ
Tel/Fax: (21) 2253-2033
www.cpba.net
www.arquivonacional.gov.br
The Council on Library and Information Resources - CLIR
(incorporando a antiga Commission on Preservation and Access)
1755 Massachusetts Avenue, NW, Suite 500
Washington, DC 20036
Tel: (202) 939-4750
Fax: (202) 939-4765
www.clir.org
Armazenagem e manuseio
Conservao
Meio Ambiente
Emergncias
1. Mtodos de armazenamento e prticas de
manuseio
2. A limpeza de livros e de prateleiras
3. A escolha de invlucros de qualidade
arquivstica para armazenagem de livros e
documentos
4. Invlucros de carto para pequenos livros
5. A jaqueta de polister para livros
6. Suporte para livros: descrio e usos
7. Montagens e molduras para trabalhos
artsticos e artefatos em papel
8. Mobilirio de armazenagem: um breve
resumo das opes atuais
9. Solues para armazenagem de artefatos
de grandes dimenses
10. Planificao do papel por meio de
umidificao
11. Como fazer o seu prprio passe-partout
12. Preservao de livros de recortes e lbuns
13. Manual de pequenos reparos em livros
14. Temperatura, umidade relativa do ar, luz e
qualidade do ar: diretrizes bsicas de
preservao
15. A proteo contra danos provocados pela
luz
16. Monitoramento da temperatura e
umidade relativa
17. A proteo de livros e papis durante
exposies
18. Isopermas: uma ferramenta para o
gerenciamento ambiental
19. Novas ferramentas para preservao-
avaliando os efeitos ambientais a longo prazo
sobre colees de bibliotecas e arquivos
20. Planejamento para casos de emergncia
21. Segurana contra as perdas: danos
provocados por gua e fogo, agentes
biolgicos, roubo e vandalismo
22. Secagem de livros e documentos
molhados
23. A proteo de colees durante obras
24. Salvamento de fotografias em casos de
emergncia
25. Planilha para o delineamento de planos
de emergncia
26. Controle integrado de pragas
27. A proteo de livros e papel contra o
mofo
28. Como lidar com uma invaso de mofo:
instrues em resposta a uma situao de
emergncia
29. Controle de insetos por meio de gases
inertes em arquivos e bibliotecas
Planejamento
Edifcio/Preservao
Fotografias e filmes
Registros sonoros e fitas magnticas
Reformatao
30. Planejamento para preservao
31. Polticas de desenvolvimento de coleo e
preservao
32. Planejamento de um programa eficaz de
manuteno de acervos
33. Desenvolvimento, gerenciamento e
preservao de colees
34. Seleo para preservao: uma
abordagem materialstica
35. Consideraes complementares sobre:
"Seleo para preservao: uma abordagem
materialstica"
36. Implementando um programa de reparo
e tratamento de livros
37. Programa de Planejamento de
Preservao: um manual para auto-instruo
de bibliotecas
38. Consideraes sobre preservao na
construo e reforma de bibliotecas:
planejamento para preservao
39. Preservao de fotografias: mtodos
bsicos para salvaguardar suas colees
40. Guia do Image Permanence Institute (IPI)
para armazenamento de filmes de acetato
41. Indicaes para o cuidado e a
identificao da base de filmes fotogrficos
42. Armazenamento e manuseio de fitas
magnticas
43. Guarda e manuseio de materiais de
registro sonoro
44. O bsico sobre o processo de digitalizar
imagens
45. Microfilme de preservao: plataforma
para sistemas digitais de acesso
46. O processo decisrio em preservao e
fotocopiagem para arquivamento
47. Controle de qualidade em cpias
eletrostticas para arquivamento
48. Microfilmagem de preservao: um guia
para bibliotecrios e arquivistas
49. Do microfilme imagem digital
50. Uma abordagem de sistemas hbridos
para a preservao de materiais impressos
51. Requisitos de resoluo digital para textos:
mtodos para o estabelecimento de critrios
de qualidade de imagem
52. Preservao no universo digital
53. Manual do RLG para microfilmagem de
arquivos
Ttulos Publicados
CONSERVAO PREVENTIVA
EM BIBLIOTECAS E ARQUIVOS
49
Do microfilme imagem digital
2 edio
a
Donald J. Waters
capa 49.ps
D:\Trabalho\Clientes\CPBA\Capas Final\capa 49.cdr
ter a-feira, 19 de junho de 2001 18:08:54
Perfil de cores: Desativado
Composi o Tela padro
Bien plus que des documents.
Découvrez tout ce que Scribd a à offrir, dont les livres et les livres audio des principaux éditeurs.
Annulez à tout moment.