Académique Documents
Professionnel Documents
Culture Documents
Ficha tcnica MIP Ttulo: Recomendaes para a produo de Planos de Preservao Digital Autor: Francisco Barbedo coordenador Autor: Glria Santos Autor: Lus Corujo Autor: Mrio SantAna Id. Classificao: 260.01.02/DSIPE 25 PPD Descritores: Preservao Digital, Planos de Preservao Digital, Documentos de Arquivo Electrnico, Colaborador: Cmara Municipal de Lisboa Colaborador: INFARMED I.P Colaborador: Instituto de Segurana Social, I.P. Data/Hora: 2008-03-25 Formato de dados: Texto, PDF Estatuto de utilizao: Acesso pblico Relao: verso 1.0 DGARQ, 2008
0 Introduo ...................................................................................................................................................4 0.1 A necessidade de um Plano de Preservao Digital (PPD) ............................................4 0.2 Estado da situao ............................................................................................................................5 0.3 Preservao digital ...........................................................................................................................5 0.4 O Plano de Preservao Digital ..................................................................................................6 0.5 Objectivos e destinatrios deste documento ........................................................................7 0.6 Estrutura e contedo do documento .......................................................................................7 1 Elaborao de um Plano de Preservao Digital.......................................................................10 1.1 Pr-requisitos ...................................................................................................................................10 1.2 Metodologia para a elaborao do PPD ................................................................................13 1.2.1 Caracterizao dos sistemas de informao e identificao dos requisitos dos documentos de arquivo electrnicos ................................................................................15 1.2.2 Planeamento da estratgia de preservao ..................................................................17 2 Implementao do Plano de Preservao Digital .....................................................................23 2.1 Teste da soluo proposta...........................................................................................................23 2.2 Produo de cpias de segurana ............................................................................................23 2.3 Aplicao da Estratgia de Preservao ................................................................................23 2.4 Medidas de monitorizao e auditorias internas ...............................................................24 2.5. Afectao de recursos ..................................................................................................................24 3 Ameaas ......................................................................................................................................................25 3.1 Obsolescncia de formatos e software...................................................................................25 3.2 Obsolescncia do hardware e suportes .................................................................................26 3.3 Elementos que afectam os suportes .......................................................................................27 4 Caracterizao de formatos e aplicaes .......................................................................................28 4.1 Formatos ............................................................................................................................................28 4.1.1 Identificao de formatos alternativos normalizados..............................................32 4.2 Aplicaes ..........................................................................................................................................33 5 Sistemas de armazenamento ..............................................................................................................35 5.1 Atributos desejveis .......................................................................................................................35 5.2 Arquitecturas Possveis ................................................................................................................36 5.2.1 Critrios para avaliao de solues de armazenamento ......................................38 5.3 Cpias de segurana ......................................................................................................................39 5.3.1 Gesto do repositrio de dados ........................................................................................41 6 Metainformao .......................................................................................................................................43 7 Estratgias de Preservao mais comuns......................................................................................48 7.1 Preservao de tecnologia ...........................................................................................................48 7.2 Emulao ............................................................................................................................................48 7.3 Monitorizao de suportes e formatos ...................................................................................49 7.4 Encapsulamento ..............................................................................................................................49 7.5 Transposio de Formatos e Suportes (Migrao e transferncia de suporte) ....49 8 Concluso ...................................................................................................................................................52 Anexos .............................................................................................................................................................53 A Lista de requisitos para a prtica de preservao digital..................................................54 B Questionrio ........................................................................................................................................58 C Exemplo de um ficheiro PREMIS contendo MI tcnica NISO Z39.87......................72 D Recursos Aconselhados..................................................................................................................75 E Glossrio................................................................................................................................................83
0. Introduo
0 Introduo
Conceito Ao longo deste documento sero utilizados os termos documento de arquivo electrnico (DAE) e objecto digital (OD). Estes termos representam duas realidades relacionadas. O DAE a entidade lgica que possui contedo, contexto e estrutura de forma a ter um significado especfico. O OD a componente fsica do DAE, normalmente equivalente a ficheiros. Um DAE sempre composto por, pelo menos, um OD, podendo ser composto por vrios OD. Por exemplo, um relatrio em formato <.doc> pode ser composto por um ficheiro de texto, um ficheiro de imagem e um ficheiro tabular, estando todos integrados para a representao completa do documento. A mesma situao se aplica a documentos estruturados como bases de dados (simples ou de suporte a sistemas de informao complexos) ou ainda documentos multimdia. Em termos prticos apenas se consegue preservar um documento de arquivo electrnico se forem realizadas aces sobre as suas componentes, ou seja, os OD.
0. Introduo
O mercado informtico no oferece solues orientadas para a preservao digital, embora haja bastantes aplicaes vocacionadas para gesto de documentos electrnicos. Tais ferramentas permitem apenas gerir eficazmente funcionalidades de gesto de documentos, tais como produo, circulao ou armazenamento, no sendo previstas capacidades conducentes preservao dos documentos ao longo de perodos de tempo prolongados. No entanto as organizaes necessitam, sob o ponto de vista operacional, da informao produzida digitalmente durante perodos mais ou menos prolongados, consoante a natureza da informao e a perenidade do seu valor administrativo, legal ou de qualquer outra natureza. Neste cenrio a preservao que, em ambiente papel, normalmente confiada a instituies especializadas, torna-se um problema premente das organizaes produtoras. fundamental que estas sejam capazes de gerir a sua informao digital de forma a mant-la utilizvel e garantir os propsitos operacionais da organizao. O presente documento pretende contribuir para esse propsito.
Exemplos tpicos desta situao so por exemplo, bases de dados ou documentos multimdia
0. Introduo
3. Conjunto de actividades que assistem na preservao do contedo intelectual, forma, estilo, aparncia e funcionalidade.
Assim sendo, para maximizar as perspectivas da preservao de OD a longo prazo, devem ser aplicadas medidas de preservao logo que possvel, ou seja, preferencialmente enquanto os OD so/esto ainda acessveis e ainda na fase de produo. Quanto mais rpida a instituio integrar a preservao digital no seu plano de aco (e oramento!), definir e implementar solues apropriadas, maior a probabilidade de sucesso na preservao dos OD. Pretende-se pois que a organizao possua um documento estratgico que determine, partida, quais os procedimentos a realizar para evitar obsolescncia tecnolgica e a consequente probabilidade de perder informao. Os organismos so encorajados a serem proactivos na prossecuo das suas estratgias de preservao digital e na definio e implementao dessas medidas, antes que a sua informao digital se torne obsoleta e consequentemente inutilizvel. Na realidade as medidas de preservao so normalmente tomadas reactivamente quando o so de todo como resposta a situaes emergentes de constatao de perda de informao necessria, quando tais medidas deveriam ser planeadas e implementadas como parte de uma soluo de preservao digital a longo prazo.
0. Introduo
AVISO A preservao digital implica custos significativos que devem ser analisados e previstos pela Organizao atravs do reforo oramental, considerado adequado situao diagnosticada aquando da elaborao do Plano de Preservao Digital.
Mantenha em formato electrnico essa informao; Tenha reconhecidas necessidades de utilizao operacional dessa informao que excedam sete anos de longevidade; Pretenda produzir um documento de planeamento que lhe permita determinar procedimentos de forma a reunir as condies materiais necessrias a preservar de facto essa informao.
Este documento composto por nove captulos, conforme o esquema que abaixo se apresenta. Salienta-se que, no incio de cada captulo, foi introduzido um resumo do contedo do mesmo.
A Introduo (Cap. 0) e a Concluso (Cap. 8) destinam-se a contextualizar e evidenciar as problemticas relativas a elaborao de Planos de Preservao Digital.
Entre os Cap. 1 e 2 existe uma relao cronolgica sequencial, enquanto que os Cap. 3 a 7 contm informao de suporte ao Cap. 1.
0. Introduo
1.1 Pr-requisitos
Consideram-se como instrumentos estruturantes de base elaborao de um PPD: O plano de classificao e A tabela de seleco. A classificao destina-se a organizar a informao de acordo com critrios pr-determinados (funcionais, orgnicos, etc.) de forma a compartiment-la para sobre ela realizar de forma eficiente algum tipo de trabalho. A existncia de um sistema de classificao essencial para a organizao da informao. O plano de classificao (um tipo de sistema classificativo) permite optimizar a aplicao de um PPD, na medida em que se apresenta como uma ferramenta de gesto de documentos de arquivo que visa, nomeadamente:
Plano de classificao: Elemento estruturante do sistema de arquivo de qualquer organismo, na medida em que se apresenta como um conjunto de regras claramente definidas que promovem a organizao dos documentos de arquivo.
Fonte: Manual para a gesto de documentos, p. 2-5.
Perceber as relaes entre os documentos; Assegurar a continuidade da nomenclatura dos documentos ao longo do tempo; Facilitar a recuperao dos documentos relativos a uma funo ou a uma actividade; Definir os nveis de proteco e de acesso a diferentes conjuntos documentais.
O plano de classificao deve ser funcional, reflectir as actividades da organizao da qual deriva e resultar da anlise das suas funes/actividades. Constitui a base
Para informaes adicionais sobre sistemas de classificao, consultar: SIADE caderno 2: Recomendaes para a Gesto de Documentos de Arquivo Electrnicos (MOREQ) Manual para gesto de documentos Norma Portuguesa NP4438 partes 1 e 2
10
O sistema de classificao funcional tem por base as funes atribudas a uma instituio para dar cumprimento aos fins para os quais foi criada, s actividades levadas a cabo no desempenho de cada funo e s aces que as concretizam. Assim, a classificao dever reflectir as funes/actividades da organizao.
Considerando que o sistema de classificao funcional no est dependente das alteraes orgnicas que ocorrem nas instituies, consegue-se uma vantajosa estabilidade organizativa dos documentos produzidos.
Organizar, descrever e relacionar entre si os seus documentos; Relacionar e partilhar documentos de reas diferentes, dentro da organizao ou com entidades externas; Melhorar o acesso, a recuperao, a utilizao e a disseminao dos seus documentos.
O primeiro nvel representa as funes, O segundo as actividades que constituem a funo O terceiro e subsequentes nveis so refinamentos das actividades ou grupo de transaces que decorrem no mbito de cada actividade.
A tabela de seleco uma ferramenta Tabela de seleco: crucial na elaborao de um PPD, Regista o resultado do processo de avaliao porque permite determinar os documental e fixa, para os conjuntos de documentos adequados prazos de reteno e aces identificados (sries), os respectivos prazos de de eliminao ou de transferncia de conservao administrativa e destino final. documentos. Desta forma torna-se possvel circunscrever os DAE a serem abrangidos pelo PPD, i.e., aqueles cujo prazo de conservao, segundo a referida tabela, seja superior a sete anos. Salienta-se que qualquer tabela de seleco que carea de aprovao da DGARQ, ao abrigo do Decreto-Lei 447/88, de 10 de Dezembro, e que inclua documentos de arquivo electrnicos implica a elaborao de um PPD desde que se verifiquem cumulativamente as seguintes circunstncias: 1. O prazo de conservao previsto seja superior a sete anos,.
INSTITUTO PORTUGUS DA QUALIDADE - NP 4438-2, Informao e documentao. Gesto de documentos de arquivo. Parte 2: Recomendaes de aplicao. Lisboa: Instituto Portugus da Qualidade, 2005, p.17
11
2. O destino final seja de conservao permanente, ou conservao permanente parcial Considerando que as actividades relativas preservao de OD so dispendiosas, pois implicam a mobilizao de recursos materiais e humanos especializados, assim como a afectao de tempo para as concretizar, a rigorosa aplicao da tabela de seleco assume bvias vantagens organizativas e oramentais. A criticidade de um documento sob o ponto de vista probatrio e a sua longevidade, (i.e., o tempo de vida operacional considerado como necessrio pela organizao para a manuteno do documento no seu sistema de arquivo), so variveis independentes que no se alteram de forma directamente proporcional.
Exemplo: Uma factura tem um elevado nvel de criticidade ou relevncia operacional que dura apenas um curto perodo de tempo. Um contrato, no entanto, pode ter um grau de criticidade probatria menos elevado mas bastante mais prolongado no tempo (pelo menos durante o perodo de vigncia da transaco veiculada no contrato).
Em termos de preservao digital este aspecto adquire especial relevncia. De facto se tiver sido avaliada a informao produzida na organizao sob o ponto de vista de relevncia operacional e longevidade necessria, podemos facilmente determinar sobre que classes de informao ou sobre que sistemas de informao deveremos prever aces de preservao digital.
Exemplo 1: Uma base de dados contm informao sobre execuo oramental. Essa informao de acordo com a Lei tem um prazo de conservao que atinge os dez anos, podendo a partir da ser eliminada. Neste caso no se justifica investir tempo e recursos para preservar essa informao pois de qualquer forma poder ser eliminada aps 10 anos de vigncia. Exemplo 2 Um sistema de web conference atravs do qual se processam reunies distncia envolvendo diversos servios deslocalizados de uma organizao. Neste contexto as gravaes realizadas equivalem s actas e por esse motivo devero ser objecto de conservao permanente. Neste caso necessrio prever medidas de preservao digital que permitam a manuteno desta informao.
muito pouco provvel que, no que toca a documentos electrnicos, haja uma longevidade nica, isto , um nico e idntico perodo temporal durante o qual til guardar a informao. Assim, apenas interessa planear e empreender aces de preservao sobre as classes ou sistemas de informao cuja necessidade de utilizao operacional exceda um determinado perodo de tempo, a partir do qual os formatos em que a informao foi produzida se comeam a tornar obsoletos Chamaremos a essa barreira temporal o horizonte de obsolescncia de um determinado OD. O horizonte de obsolescncia estimado em sete anos, pelo que toda a informao digital cujo prazo de vida operacional no exceda este perodo de tempo no dever ser abrangida pelo PPD. Note-se que este perodo no rgido reportando-se ao prazo de retrocompatibilidade normalmente assegurado pelas empresas vendedoras, pelo que pode ser alterado consoante a realidade especfica de cada organizao. Por exemplo, os sistemas de informao que suportam a actividade contabilstica contm informao cujo prazo de vida til esperado de 10 anos pelo que, apesar de ultrapassar o prazo sugerido, pode no ser necessrio considerar estes sistemas para serem objecto de aces de preservao. 12
Salienta-se que os dois requisitos acima descritos so parte integrante da Lista de requisitos para a prtica de preservao digital (Anexo A).
Legenda:
# 1 2 3 4 5 6 Smbolo Actividade. Fluxo ou sentido do processo (diagrama de actividades). Nota: indica observaes gerais que completam o sentido de elementos. Incio do processo. Fim do processo (pode haver mais que um). Transio (unio): indica a juno de mltiplas actividades. Descrio
13
14
1.2.1 Caracterizao dos sistemas de informao e identificao dos requisitos dos documentos de arquivo electrnicos
Nesta etapa pretende-se caracterizar e avaliar o desempenho do sistema de arquivo e dos documentos electrnicos que o integram.
Documentos de Arquivo Electrnicos: So documentos de arquivo produzidos, transmitidos e conservada em forma electrnica.
Os sistemas de arquivo produzem ou armazenam informao, transaccional ou analtica, directamente relacionada com as actividades desempenhadas pela organizao. Neste sentido o seu desempenho ter impacto nos processos a utilizar para preservar essa informao.
Um sistema de informao adquire e gere informao(es) necessria(s) para: A conduo das actividades da organizao; A percepo das necessidades e expectativas dos clientes internos e externos; Solidificar posies num ambiente competitivo; Apoiar as actividades dos actores organizacionais; Adaptar a organizao envolvente (diminuir a incerteza e a complexidade).
O desenvolvimento de um PPD implica a anlise da informao de arquivo electrnica, produzida pela organizao, e que obedece ao seguinte conjunto de propriedades: Ser produzida na rede organizacional; Ser considerada como propriedade institucional; Ter um prazo de conservao superior a sete anos, de acordo com a respectiva tabela de seleco (horizonte de obsolescncia); Possuir reconhecida importncia (vital) de acordo com tabela de seleco, anlise de risco e criticidade de sistemas para o organismo. Isto significa que nem todos os documentos electrnicos produzidos na organizao devero ser objecto de anlise para a elaborao do PPD. Na organizao existem, certamente, centenas de documentos produzidos a ttulo individual, como documentos pessoais de trabalho, que no foram comunicados e que nessa qualidade no tm representatividade institucional. Da mesma forma h, muitas vezes, pequenas aplicaes desenvolvidas a ttulo pessoal pelos colaboradores para os auxiliar nas suas actividades e que podem no ter expresso institucional, ou seja, no constiturem para todos os efeitos documentos de arquivo. O conhecimento do sistema uma fase essencial no processo, pois permite aferir a situao real no que respeita existncia de condies viveis para assegurar a preservao dos DAE, registando os pontos fortes e fracos da organizao no que respeita a preservao digital e indicando quais as reas a desenvolver para implementar o PPD. Para tal dever ser realizado o levantamento e anlise dessa mesma informao, tendo por base o questionrio que se apresenta no anexo B, o qual contempla duas vertentes: A) Anlise e caracterizao do sistema de gesto documental e suas funcionalidades. Nesta fase pretende-se apreender as caractersticas do sistema em vigor na organizao relativamente a um conjunto de funcionalidades relevantes para a organizao e para a segurana da informao: Controlo e segurana; Armazenamento;
15
Funes administrativas; Encriptao; Desempenho e escalabilidade; Contratao de servios externos; Conservao a longo prazo; Metainformao.
B) Anlise das sries documentais ou actividades suportadas pelas mesmas (nos seguintes casos: inexistncia de Plano de Classificao, de Tabela de Seleco ou qualquer outra identificao das sries documentais). Trata-se de particularizar dentro do sistema, caracterizado na parte anterior, as sries documentais existentes em que sejam produzidos documentos de arquivo electrnicos e avaliar quais os elementos do sistema que se lhes aplicam.
Conceito: necessrio, ainda, explicar o que se entende, neste contexto, por srie documental e qual a sua relao com OD. Uma srie documental (independentemente do suporte) um conjunto de documentos que obedecem a idntica competncia funcional e tipolgica. Neste contexto pode tratar-se de um: Sistema de informao que suporte uma determinada actividade; Conjunto de sistemas de informao que suporte a mesma funo ou actividade, ou ainda Conjunto de documentos electrnicos no estruturados (por exemplo documentos de texto e mensagens de correio electrnico que faam parte de um processo administrativo).
Alguns conceitos arquivsticos que nos so habituais e raramente suscitam dvidas podem tornar-se confusos quando passamos do papel para o digital. Por exemplo, um sistema de bases de dados transaccional produz informao de arquivo, na medida em que os dados contidos esto vinculados a transaces especficas. Qual a identificao arquivstica que corresponde a esta entidade informacional? Uma srie? Um documento composto? Dito de outro modo, podemos interrogar-nos sobre a equivalncia de um sistema de informao relativamente a entidades conceptuais arquivsticas tradicionais. No entanto pode-se apontar semelhanas nos dois universos. Em digital uma base de dados corresponde ao nvel de sries quando se refere a dados de carcter organizacional, funcional ou administrativo. Os ficheiros que a constituem so descritos ao nvel do documento que pode ser composto ou simples. Tomando como exemplo o SRH (Sistema de gesto de Recursos Humanos) teramos: Srie: Sistema de gesto de Recursos Humanos Documento composto1: act_admg.sql Documento composto 2: pr-m002-02288.txt Etc. Neste caso o sistema de informao como um todo consiste na srie documental. Este sistema composto fisicamente por unidades fsicas ficheiros que equivalem individual ou de forma agregada a documentos simples ou compostos. (No caso apresentado, cada ficheiro equivale a um documento)
16
Repare-se que um ficheiro pode no equivaler a um documento. A cardinalidade pode variar da seguinte forma: 1 (documento) 1..n (ficheiros)
Para o efeito de preservao digital essencial identificar estes dois nveis de existncia, embora apenas nos casos em que se justifique a preocupao em preservar estes objectos digitais (ver p.12). A relao entre estes dois nveis apresenta uma cardinalidade 1:n com uma associao do tipo agregao. Ou seja, as partes (documentos/ficheiros) fazem parte do todo (srie/base de dados) e aquelas podem existir mesmo se o elemento agregador desaparecer. Com efeito os ficheiros podem ser reutilizados noutra base de dados.
Salienta-se ainda que para efeitos de preservao a unidade atmica o ficheiro mesmo que este isoladamente no corresponda a uma unidade de descrio documento.
A observao de diversos sistemas organizacionais permite afirmar que nem sempre todas as caractersticas de um sistema de informao se aplicam a todos dos OD produzidos. Efectivamente, a deciso desta escolha depende, muitas vezes, de factores como: A criticidade atribuda informao; A irrelevncia, por vezes injustificada, atribuda a outro tipo de DAE (por exemplo stios web); O desconhecimento de que determinados OD so de facto produzidos na organizao ou onde estes, efectivamente, se encontram.
A parte B do inqurito incide sobre as seguintes questes: Identificao do produtor; Referenciao da srie; Controlo e segurana; Avaliao; Assinaturas digitais;
A anlise e tratamento dos dados do questionrio permitir obter uma descrio das caractersticas do sistema, bem como a informao necessria sobre os documentos de arquivo electrnicos que se pretendem preservar no mbito do PPD.
17
documentos de arquivo electrnicos e dos objectos digitais constituintes. Esse planeamento deve ser feito com base na informao reunida anteriormente e comporta:
Os procedimentos que devem ser realizados pelo organismo sobre as diversas classes de informao identificadas (ver Cap. 7); A definio de formatos para preservao para cada uma das classes de informao caracterizadas (ver Cap. 4.1); A seriao fundamentada de solues de software alternativas para um determinado formato (ver Cap. 4.2); A seleco e utilizao de solues de armazenamento adequadas a preservao digital (ver Cap. 5); Os esquemas de metainformao que devem ser utilizados (ver Cap. 6).
Os processos de preservao requerem a utilizao de normas reconhecidas, nomeadamente de normas para gesto de documentos (Ex: NP 4438).
Custos de implementao e custos de manuteno para as medidas de preservao; Complexidade tcnica da abordagem escolhida e a capacidade da organizao para suportar essa abordagem ao longo do tempo (tcnica e financeiramente); Compatibilidade com o software e hardware existentes; Impacto nos processos de negcio (ex.: se a abordagem escolhida obriga a alteraes das prticas de trabalho); Eficcia e robustez da abordagem na proteco da integridade, acessibilidade e funcionalidade dos documentos de arquivo electrnicos ao longo do tempo.
Naturalmente a intensidade das medidas de preservao a empreender devem estar directamente relacionadas com o grau de criticidade atribuda aos objectos digitais, assim como a anlise de risco que deve ser efectuada.
18
As caractersticas dos ficheiros (que descrevem a experincia visual e contextual dos utilizadores ao lidar com os OD) ao nvel de:
Ficheiro de base de dados Forma: dependente do formulrio ou relatrio; Contedo: dados colocados via formulrio; Estrutura: tabular; Comportamento: actualizao de data e hora (caso esteja assim definido nas caractersticas).
Deve-se, ainda, ter em conta a discriminao das caractersticas especficas que um determinado formato possa ter. Por exemplo a profundidade de cor, resoluo de imagem, tipos de interactividade, possibilidade de utilizao de macros, e metainformao embebida;
As caractersticas tcnicas dos documentos de arquivo electrnicos (que incluem o contexto, o suporte de armazenamento, relaes existentes com outros documentos de arquivo, e a metainformao que lhes est associada ou atribuda pela organizao);
Contexto: Justificao de faltas; Suporte de armazenamento: servidor; Relaes existentes com outros documentos de arquivo: inclui informao contida na base de dados do teleponto; faz parte do processo individual do funcionrio. Metainformao: Assunto, Data, Colaborador, Data da Falta, Justificao, Despacho.
Os factores inerentes aos documentos de arquivo electrnicos que iro influenciar opes a incluir no PPD por exemplo:
Usabilidade: significa que um documento utilizvel ou seja, que pode ser localizado, recuperado, apresentado e interpretado. Escalabilidade: caracterstica de um sistema ou equipamento que pode crescer em escala, isto , que possibilita incrementos de capacidade ou funcionalidades acompanhando as necessidades dos utilizadores (aumento da capacidade de armazenamento do sistema atravs da substituio ou instalao de novos discos rgidos; verses mais actuais do formato PDF que permitem a incluso de informao de dados CAD). Complexidade: significa que um documento integra diversas componentes digitais (por exemplo as pginas Web).
Os custos, tanto com recursos humanos como materiais, tm uma importncia elevada na escolha das solues de preservao. importante, nesta fase, empreender uma anlise custo/benefcio que compare os diversos cenrios de preservao digital adequados informao que identificada e avaliada em funo das seguintes variveis em parte j referidas neste documento:
19
Criticidade dos OD, i.e., a sua importncia para o desempenho das actividades da organizao; Longevidade operacional, ou seja, qual o tempo de vida operacional atribudo ao objecto digital; Risco aceitvel pela organizao, ou seja, a avaliao pela organizao do grau de risco aceitvel de perda ou obsolescncia dos OD; Nvel de formalizao dos DAE produzidos (ignorar DAE produzidos a ttulo individual, por ex.). Tal anlise deve ter em conta os custos correspondentes, de forma a obter uma soluo valorizada, de acordo com as variveis referidas. Aconselha-se ainda a criao e adopo de regras e procedimentos, de forma a ajudar a normalizar a aplicao das tcnicas escolhidas por todos os sistemas da instituio. Uma abordagem mais especfica das estratgias encontra-se no Cap. 7.
Poder ser necessrio proceder aquisio de software, caso o existente no d resposta s medidas previstas no PPD; Poder ser necessrio proceder adaptao, alterao ou substituio de software utilizado no Organismo, de acordo com o indicado no PPD; Devero constar, no PPD, orientaes que sirvam de base a futuras aquisies de software.
Em todos estes casos h que ter em considerao o conjunto de estratgias de preservao e os formatos definidos anteriormente, bem como a verificao da existncia, no mercado, de solues compatveis com essas estratgias e formatos. Caso estas no existam ou no sejam
20
satisfatrias, a opo passa por se investir no desenvolvimento de solues especficas, ou empreender aces de congelamento dos OD produzidos nesse formato at ao aparecimento de uma soluo vivel.
Neste ltimo caso aconselha-se a utilizao, sempre que possvel, de aplicaes informticas com especificaes abertas, no proprietrias e bem documentadas, pelas razes indicadas no Cap. 3.1. Estas devem permitir executar todas as operaes necessrias definidas no mbito do PPD, ser robustas, fceis de utilizar e conter uma interface intuitiva.
Objectos Digitais; Sistemas de informao (por exemplo registo de correspondncia, Sistemas de informao geogrficos); Utilizadores; Funcionalidades a disponibilizar.
Por exemplo o sistema de registo de documentos utiliza metainformao, os servios de Tecnologias da Informao e Comunicao (TIC), utilizam-na igualmente quando guardam rotinas de auditoria que registam o comportamento dos sistemas e os acessos aos mesmos.
A metainformao normalmente utilizada dentro da organizao seja de forma implcita ou explcita com diversos propsitos e por diferentes reas funcionais. Basicamente pretende-se referenciar ou descrever outra informao de forma a ser mais fcil a sua posterior recuperao ou ainda garantir a evidncia de uma determinada transaco (veja-se por exemplo a metainformao embebida no cabealho de imagens ou nos documentos de texto). Na maior parte dos casos observados no existe, todavia, uma formalizao organizacional 21
(num documento nico por exemplo) de todos os esquemas de metainformao utilizados e de quais os respectivos elementos. Prope-se assim a criao de um documento deste tipo, de forma a oficializar e disseminar a utilizao de metainformao e evitar redundncias e repeties muitas vezes verificadas. Tal documento deve adequar-se igualmente documentao analgica e documentao digital. A vantagem desta prtica reside em saber exactamente que metainformao utilizada para cada classe de informao. A utilizao de metainformao especfica de preservao digital ainda uma das componentes que deve ser integrada nesse documento.
Os processos de preservao devem estar totalmente documentados e a documentao guardada para apoio a futuros esforos de preservao. Qualquer cpia ou reformatao de dados para migrao ou converso deve ser documentada na metainformao de gesto documental.
22
So apresentadas, de seguida, algumas recomendaes de aces a tomar na fase de implementao do PPD. Estas no pretendem ser rgidas, visto que a implementao do plano de preservao digital, ou seja, a aplicao prtica no terreno das medidas nele preconizadas, dever ser programada pela prpria instituio. Aconselha-se a utilizao de bibliografia ligada temtica de Gesto de Projecto 3, como apoio a esta fase.
A DGARQ, como entidade coordenadora do sistema nacional de arquivos, neutra quanto ao mtodo escolhido pela organizao no que concerne implementao do PPD. DGARQ importa apenas, em sede de auditoria, o resultado dessa mesma implementao. Nesse mbito, o anexo A estabelece uma lista de requisitos considerados obrigatrios para a prtica de preservao digital, a qual servir de base a uma eventual auditoria. Este facto no inviabiliza que a DGARQ fornea apoio tcnico para a construo de uma estratgia de preservao digital quando uma organizao o solicite.
Por exemplo. ANSI/PMI - A Guide to the Project Management Body of Knowledge: PMOBOK Guide, 3 ed.. Pensylvannia:. Project Management Institute. 2004 .ISBN 193069945X
23
Depois de sujeitos a aces de preservao, os OD devero ser reavaliados de forma a confirmar a permanncia das suas funcionalidades de acordo com os padres prdefinidos.
A integridade de toda a metainformao relevante associada aos OD deve ser verificada aps a aplicao da estratgia de preservao. A metainformao deve tambm ser actualizada, registando as ocorrncias verificadas durante o processo de preservao de forma a constituir um histrico essencial para provar a integridade do sistema ou a verificao e comprovao de eventuais disfunes.
O que monitorizar nos documentos de arquivo electrnicos preservados: Integridade; Funcionalidade; Estrutura; Contedo; Metainformao associada.
Por exemplo. Aps a migrao de um sistema de bases de dados produzido originalmente em ORACLE, para um formato em MySQL ou DBML, necessrio verificar se os dados migrados mantm a sua qualidade e se as relaes existentes entre tabelas permanecem explcitas. Aps a migrao de documentos produzidos em Word para formato PDF necessrio verificar se no houve desformatao, se as notas de p de pgina no foram apagadas, se os cabealhos permanecem, etc. Aps a migrao de documentos de udio e vdeo para formato MPEG necessrio verificar se no houve dessincronizao entre as imagens e o som com, se no existem fenmenos de arrastamento de pixels, etc. Aps migrao de publicaes Multimdia Interactivas necessrio verificar se as hiperligaes se mantm correctas, se possvel o acesso ao contedo dos ficheiros, se todos os ficheiros permanecem presentes, etc.
24
3. Ameaas
3 Ameaas
Este captulo destina-se a explicitar o conjunto de ameaas que pesam sobre os OD, abordando a problemtica da obsolescncia dos formatos, software, hardware e suportes, assim como elementos que afectam os suportes. A especificidade dos OD implica que estes estejam sujeitos s seguintes ameaas:
Obsolescncia tecnolgica: Ocorre ao nvel de formatos e software, mas tambm do prprio hardware e suportes utilizados. Danos fsicos: Estes podem ser acidentais ou propositados, ocorrem principalmente ao nvel dos materiais que compem o hardware e os suportes, mas tambm podem ocorrer nos ficheiros (muitas vezes como consequncia dos danos de hardware e/ou dos suportes).
No que diz respeito ao software, este pode dividir-se em trs grupos, de acordo com o exposto no Cap. 4.2: Proprietrio com especificaes fechadas; Proprietrio com especificaes abertas; No proprietrio com especificaes abertas.
Para escolher o melhor software no mbito do planeamento da estratgia de preservao necessrio avaliar se este: Tem grande adopo; retrocompatvel; Tem suporte de metainformao (como XML); Dispe de vrias funcionalidades, sem ser muito complexo; Permite a utilizao de vrios formatos; Inclui funcionalidades de verificao de erros;
25
3. Ameaas
Tais alteraes levam rpida substituio dos suportes, no s devido maior rapidez, capacidade e produtividade disponveis, mas tambm devido ao cada vez maior nmero de funes oferecidas.
As normas ISO/IEC 17799, ISO/IEC 27000 a ISO/IEC 27008 fornecem informaes, cdigos de prticas, e requisitos para auditoria e certificao de tcnicas de segurana para sistemas de gesto de informao. De referir, no entanto, que a anlise destas normas no est no mbito deste documento e que no cabe DGARQ a certificao destas tcnicas.
As tendncias em termos de fragilidade, estabilidade, segurana e durao antes da obsolescncia e Outras melhorias, Levam a novas e melhores aplicaes de software, que aumentam a probabilidade obsolescncia do equipamento anterior.
Assim os dispositivos necessrios para leitura do suporte de armazenamento podem deixar de ser produzidos. Os fabricantes de todas estas tecnologias competem, emergem, unem-se, ou desaparecem, tornando cada vez mais difcil a manuteno dos contedos digitais ao longo do tempo.
26
3. Ameaas
27
4.1 Formatos
Qualquer tentativa de categorizao/compartimentao de tipos de documentos electrnicos necessariamente artificial, devido ao facto de muitos conterem, em si, elementos de outras categorias. Por exemplo, so raros os documentos electrnicos de texto estruturado que no incluam actualmente tabelas ou imagens; so raros os formatos de registos de vdeo que no incluam tambm som e/ou voz. Visto que, para efeitos de definio de formatos, necessrio definir tais categorias, optou-se pela taxionomia dos tipos de documentos de arquivo electrnicos 4 baseada na definida pelos Arquivos Nacionais do Reino Unido 5. Na tabela abaixo apresentada, inclui-se uma coluna relativa categoria de formato utilizada, uma segunda coluna que descreve as principais caractersticas dessa categoria e uma terceira coluna onde se indica a estratgia de preservao recomendada.
Categoria
Caractersticas
Estratgia de Preservao Recomendada Migrao para novas plataformas. Converso de dados e estrutura para formatos normalizados. Actualmente impossvel migrar as componentes comportamentais relacionadas com motores de gesto de bases de dados, normalmente proprietrios. Migrao para novas plataformas. Converso para formatos normalizados. Refrescamento de suportes.
Informao Adicional
O Arquivo Nacional dos Pases Baixos produziu uma proposta para preservao de: Folhas de clculo <www.digitaleduurzaa mheid.nl/bibliotheek/d ocs/volatilitypermanence-spreadshen.pdf>; Bases de Dados <www.digitaleduurzaa mheid.nl/bibliotheek/d ocs/volatilitypermanence-databasesen.pdf>. O Arquivo Nacional dos Pases Baixos produziu propostas para preservao de: Documentos de texto <www.digitaleduurzaa mheid.nl/bibliotheek/
Dados alfanumricos existente numa vasta variedade de aplicaes de processamento de dados; Dados geridos em ficheiro linear (flatfile), em rede, hierrquica; Bases de dados relacionais e orientadas a objectos.
Dados alfanumricos; Dados de marcao (markup); Etiquetas para outros tipos de dados (imagens vectoriais e
4 In STEPHENS, David O. Digital Preservation in the United Kingdom in THE INFORMATION MANAGEMENT, vol. 34, n. 4, Outubro 2000 5 The National Archives, http://www.nationalarchives.gov.uk/
28
Categoria
Caractersticas
Informao Adicional
docs/volatilitypermanence-textdocsen.pdf>; Mensagens de Correio Electrnico <www.digitaleduurzaa mheid.nl/bibliotheek/ docs/volatilitypermanence-emailen.pdf>.
mapas de bits [raster]) existentes em processadores de texto/programas para escritrio e digitalizao de documentos/sistemas aplicacionais de gesto de documentos electrnicos, bases de dados relacionais, e outros ambientes de tipos de documentos de aplicaes especficas. 3. Dados de Desenho [design data] Imagens vectoriais e de mapa de bits e dados alfanumricos em sistemas de CAD e converso orientada a objectos para bases de dados normalizadas. Retrocompatibilidade, interoperabilidade, e formatos com emulao de tecnologia como estratgia a curto prazo para dados do produto (product data) em sistemas obsoletos. Refrescamento de suportes. 4. Apresentaes Dados alfanumricos em imagens empresariais, clipart [coleco de imagens], vdeo, e multimdia de treino/ensino. Diagramas para a gesto de informaes, de conhecimento e de capital intelectual; para a compreenso e soluo de problemas. 5. Imagens Imagens de mapas de bit e dados alfanumricos existentes no software de captura/edio de imagens, bases de dados orientadas a objectos, relacionais ou simples de livrarias de fotos, coleces de digitais de belas-artes, coleces de imagens Retrocompatibilidade. Converso para formatos normalizados. Refrescamento de suportes. Retrocompatibilidade. Converso para formatos normalizados. Refrescamento de suportes.
29
Categoria
Caractersticas
Informao Adicional
mdicas. 6. Documentos de som e voz Dados de som em processamento de voz, bases de dados relacionais ou simples (flat) de registos udio em coleces de musica e repositrios similares. Retrocompatibilidade. Converso para formatos normalizados. Refrescamento de suportes (Esta uma rea especializada que necessita de trabalho adicional por especialistas de preservao digital). Retrocompatibilidade. Converso para formatos normalizados. Refrescamento de suportes. A tecnologia de preservao necessria em situaes a curto prazo quando os dados esto fechados em sistemas proprietrios. Retrocompatibilidade. Converso para formatos normalizados. Refrescamento de suportes. A tecnologia de preservao necessria em situaes a curto prazo quando os dados esto fechados em sistemas proprietrios. A tecnologia de preservao necessria em situaes a curto prazo quando os dados esto fechados em sistemas proprietrios at que existam normas aceites e amplamente utilizadas.
O Arquivo Nacional dos Pases Baixos aborda a problemtica da preservao de stios Web em <www.digitaleduurzaa mheid.nl/index.cfm?pa ginakeuze=374>.
7. Documentos de Vdeo
Vdeo Digital, ecr total (fullscreen)/ vdeo (em movimento) em fotogramas de vdeo digital armazenadas em ficheiros de mapas de bit e som armazenadas em bases de dados relacionais ou simples (flat) em coleces de musica e repositrios similares Imagens vectoriais e de mapa de bits e dados alfanumricos em sistemas de informao geogrfica (SIG) e software de cartografia. Dados armazenados orientada em bases de dados relacionais orientadas a objectos.
Dados de som e vdeo, imagens em movimento, imagens vectoriais e de mapa de bits e dados alfanumricos armazenados em software de criao e edio em ambientes de publicao electrnica.
30
Categoria
Caractersticas
Estratgia de Preservao Recomendada A tecnologia de preservao necessria em situaes a curto prazo quando os dados esto fechados em sistemas proprietrios at que existam normas aceites e amplamente utilizadas.
Informao Adicional
Apresentam-se, a seguir, dois exemplos que ilustram relaes possveis entre categorias que podem coexistir num mesmo formato. Importa referir que qualquer esquema que tente representar relaes entre categorias no est, nem pode estar nunca, encerrado, uma vez que a listagem de categorias existentes e as suas caractersticas distintivas nunca estaro definitivamente estabilizadas. As necessidades nesta rea nunca estaro, por definio, satisfeitas assim como as respostas a essas necessidades podem ser imprevisveis em termos de possibilidades de combinao. Assim natural que, no futuro, surjam novos formatos que, partida, no sejam passveis de categorizar na lista actual. Tal remete para a perenidade deste documento e para a necessidade constante da sua actualizao.
Exemplo 1: Documento de texto Dados Estruturados/Documentos de Office: um documento de texto pode conter, para alm do texto, Dados Tabulares (tabelas), Imagens e ainda Dados de Desenho.
31
Exemplo 2: Web-conference Dentro das Publicaes Multimdia Interactivas podemos incluir a Web-conference, a qual pode conter Registos de som e voz, Registos de vdeo, Apresentaes, Imagens, Texto Estruturado.
Recomenda-se a no utilizao de formatos proprietrios para armazenamento e preservao digital a longo prazo, pelas razes indicadas nos Cap. 3.1, devendo ser necessrio identificar, partida, quais os formatos que, por serem normalizados e/ou no proprietrios e de fcil preservao a longo prazo, se podero utilizar alternativamente. Tal escolha deve assentar que o DAE se insere.
O projecto RODA definiu para as taxonomias de OD com que opera actualmente, os seguintes formatos de preservao: Texto estruturado: PDF/A (0Hwww.pdfa.org) Imagens fixas bidimensionais: TIFF (1Hhttp://partners.adobe.com/public/developer/ti ff) Bases de dados relacionais: DBML, um formato
preciso salientar que no existem formatos normalizados para cada uma das categorias de formatos identificados. Tal comporta riscos para a preservao desses OD que no podem ser evitados. No caso em que no haja formato alternativo e o DAE se encontra inactivo h que
32
manter o formato original sujeito a monitorizao regular at ser desenvolvido um formato normalizado aplicvel ao formato original em questo. Deve ser produzida uma tabela que permita definir quais os formatos de preservao que o organismo pretende utilizar.
4.2 Aplicaes
As aplicaes informticas ou software so, conceptualmente, uma sequncia de instrues a serem seguidas e/ou executadas, na manipulao, redireccionamento ou modificao de dados ou informao, e que permitem ao utilizador fazer uma ou mais tarefas especficas. Do ponto de vista tcnico, integra igualmente, no s o programa de computador propriamente dito, mas tambm manuais, especificaes, planos de teste, etc. As aplicaes fazem parte do sistema intermedirio que permite a produo, manipulao, gesto e preservao dos OD. As aplicaes que produzem os documentos podem dividir-se em trs tipos:
Proprietrio com especificaes fechadas: A cpia, redistribuio ou modificao so proibidas pelo seu criador ou distribuidor. Tais restries so conseguidas atravs de meios legais e/ou tcnicos. Os meios legais podem incluir o licenciamento de software, copyright (direitos de autor), e uso de patentes, enquanto que os meios tcnicos so caracterizados pela venda ao utilizador de binrios executveis legveis pelo hardware, ocultando ou encriptando o cdigo fonte legvel pelos humanos.
Proprietrio com especificaes abertas: Vrios produtores de software definem e utilizam especificaes ou padres para garantir a interoperabilidade entre aplicaes e plataformas. Estes padres devem estar disponveis para livre acesso e implementao, sem quaisquer royalties e outras taxas e sem discriminao de uso.
No proprietrio com especificaes abertas: Software livre, segundo a definio O software livre permite as seguintes modalidades: criada pela Free Software Gratuito (freeware): no implica no Foundation, qualquer programa de pagamento de licenas de uso ou royalties ; computador que pode ser usado, Shareware: pode ser copiado, distribudo e copiado, estudado, modificado e utilizado experimentalmente por um redistribudo sem nenhuma restrio. determinado perodo, aps o qual se deve Este tipo de software ope-se ao pagar uma taxa. conceito de software proprietrio, mas no comercializao (software comercial). A forma usual de distribuio de software livre anexar a este uma licena de software livre, e tornar o cdigo fonte do programa disponvel. Para tal muito usual a utilizao de especificaes abertas (normas) para manter a interoperabilidade de todas as distribuies originrias do mesmo cdigo fonte base.
33
Aconselha-se a utilizao, sempre que possvel, de aplicaes e formatos com especificaes abertas, no proprietrios e bem documentados, pelas razes indicadas no Cap. 3.1.
Esta prtica objecto da Resoluo de Conselho de Ministros 21/2002, de 31 de Janeiro. Para mais informaes sobre a promoo da utilizao de software livre na Administrao Pblica, aceda a: http://www.softwarelivre.citiap.gov.pt/
34
5. Sistemas de Armazenamento
5 Sistemas de armazenamento
Este captulo destina-se abordar os sistemas de armazenamento de acordo com um conjunto de critrios que devem obedecer. Em seguida feita uma anlise comparativa das arquitecturas de armazenamento (NAS, SAN e CAS), sendo definidos critrios de avaliao das mesmas. Finalmente dada relevncia problemtica das cpias de segurana no que concerne criao de rplicas, modelos de armazenamento, tipos de gesto de repositrios de dados.
A combinao destes atributos permite auditorias fceis e frequentes e, ainda, reparaes rpidas. Deve suportar a introduo progressiva de novos componentes heterogneos (ex. discos rgidos de diferentes marcas), permitindo assim a escalabilidade e a existncia de um plano de sucesso facilmente implementvel. O sistema de armazenamento deve: Ter um desempenho adequado s necessidades especficas de cada organizao, de forma a evitar engarrafamentos (bloqueios e atrasos de reposta); Estar em conformidade com normas de jure;
35
5. Sistemas de Armazenamento
Ser independente da plataforma aplicacional utilizada (sistema operativo e vendedor de hardware). Preferencialmente o custo inicial e de manuteno dever ser mnimo, tal como o esforo necessrio para a sua administrao.
Network Attached Storage (NAS) Storage Area Network (SAN) Content-Addressable Storage (CAS).
Estes cenrios aplicam-se a organizaes com uma forte produo de DAE que requerem, portanto, elevada capacidade de armazenamento e de resposta. No caso da organizao produzir DAE em pequena escala possvel recorrer a sistemas de Por questes que se prendem com a gesto e armazenamento com desempenho segurana, aconselha-se a utilizao de um sistema de inferior que podem, inclusivamente, armazenamento, caso o volume de documentos de incluir suportes pticos e dispositivos de arquivo electrnicos utilizados pelo organismo for armazenamento conexos. superior a 10Gb.
As NAS so dispositivos dedicados partilha de ficheiros entre diferentes clientes de rede. Permitem adicionar armazenamento na rede sem ser necessrio desligar o servidor. Podem estar ligadas em qualquer parte da rede, no integrando, porm, o servidor que faz a gesto do processamento dos dados. uma soluo barata, fcil de instalar, administrar e escalar, e baseia-se em protocolos abertos e bastante disseminados. No entanto a ligao entre servidor aplicacional e armazenamento lenta; apresenta limitaes no que respeita ao tamanho mximo de um bastidor (actualmente 16 terabytes); precisa de utilizar sistemas de virtualizao de armazenamento (storage virtualization) para suportar mltiplos sistemas de ficheiros com o objectivo de guardar os dados.
As SAN so redes projectadas para agrupar dispositivos de armazenamentos de computador. Existem duas variaes de SAN: 1. Uma rede na qual o propsito principal a transferncia de dados entre computadores e dispositivos de armazenamento. Neste caso a SAN consiste numa infra-estrutura de comunicao que dota conexes fsicas com uma camada de gesto, com o objectivo de organizar dispositivos de armazenamento, conexes e computadores, tornando a transferncia de dados mais robusta e segura; 2. Um sistema de armazenamento formado por dispositivos de armazenamento, computadores e/ou aplicaes, e todo um controlo via software, comunicando-se atravs de uma rede de computadores.
36
5. Sistemas de Armazenamento
As SAN caracterizam-se por: Apresentar um bom desempenho; Ser normalmente mais dispendiosas; Ter maior exigncia de administrao (gesto de unidades lgicas e de sistemas de ficheiros); Ter reduzida interoperabilidade (o que funciona numa SAN pode no funcionar noutra); O suporte aos servidores estar dependente do sistema operativo (com as consequentes problemas de limitaes de drivers de controlos). As CAS so mecanismos para armazenamento de informao, cuja recuperao se baseia no seu contedo e no na sua localizao de armazenamento. As CAS caracterizam-se por disponibilizarem um acesso simples, sem as limitaes normais de um sistema de ficheiros ou protocolo de partilha. So fceis de instalar e administrar e tm um elevado grau de escalabilidade. No entanto so dispendiosas, pelo menos na fase inicial de aquisio, e a sua interface de programao (API) restrita e pouco disseminada.
Apresenta-se, abaixo, um quadro comparativo destes sistemas de armazenamento: Quadro comparativo de sistemas de armazenamento
NAS
SAN
CAS
Heterogeneidade
Boa
Nenhuma
Escalabilidade
Upgrade
At 24 Petabytes
Desempenho
Baixo
Muito Alto
Alto
Sim
API restrita
Independncia
Completa
Custo
Baixo
Alto
Administrao
Depende da virtualizao
Difcil
Muito Fcil
37
5. Sistemas de Armazenamento
1. Custo Custo de instalao Manuteno e suporte/ano Prazo da garantia Custo da soluo para 1 TB Custo da soluo para 10 TB Custo da soluo para 100 TB Custo de cada n (1 n suporta vrios discos) Custo de cada unidade de controlo
2. Escalabilidade Nmero mximo de ns Nmero mximo de ns por cada unidade de controlo Capacidade mxima de cada n (nmero de discos) Limite mximo em TB de cada n
3. Interoperabilidade Suporta ns de marcas concorrentes Suporta discos de marcas concorrentes Disponibiliza interfaces de programao Suporta conectividade NFS Suporta conectividade SMB
38
5. Sistemas de Armazenamento
5. Facilidade de programao Storage Virtualization API de controlo do nmero de rplicas API de controlo dos processos de auditoria
Assim, aconselha-se a utilizao de uma soluo fora de linha, que limite o acesso apenas quando a informao armazenada estiver corrompida.
2. Verificar, visualmente, se o disco foi alvo de algum dano aps a utilizao; 2. Armazenar em condies ambientais recomendadas para armazenamento de arquivo.
39
5. Sistemas de Armazenamento
No estruturado Este modelo pode ser constitudo apenas por um conjunto de suportes pticos gravveis, com a informao mnima sobre o que foi replicado e quando. Trata-se do modelo mais fcil de implementar mas, provavelmente, o que piores resultados obter em termos de recuperao de alto nvel.
Total+Incremental Neste caso pretende-se armazenar vrias rplicas dos OD originais da seguinte forma: 1. Em primeiro lugar feita uma cpia de segurana de todos os OD; 2. Posteriormente poder ser feito uma cpia de segurana incremental; 3. Finalmente, quando se proceder ao restauro do sistema na totalidade e at determinada data, necessria a localizao da cpia de segurana total, bem como do ponto (data) de restauro pretendido. Este modelo oferece um alto nvel de segurana, em que qualquer OD pode ser restaurado e pode ser utilizado com suportes removveis, tais como tapes e suportes pticos. O aspecto menos positivo a existncia de longas sries de incrementaes e necessidade de espao.
Total + Diferencial Difere do modelo anterior no sentido em que, aps a cpia de segurana total, cada cpia de segurana parcial deve capturar todos os OD criados ou modificados aps aquela, mesmo que j tenham sido includos na cpia de segurana parcial anterior. A vantagem que o restauro apenas obriga recuperao da cpia de segurana total e a ltima cpia de segurana parcial.
Rplica + Incremental invertido (Sincronizao) Este modelo similar ao repositrio Total + Incremental, diferindo no facto de fornecer uma rplica que reflecte o estado do sistema, aquando da ltima cpia de segurana, bem como uma lista das incrementaes invertidas. Um dos benefcios reside no facto de requer uma cpia de segurana total. Cada cpia de segurana incremental imediatamente aplicada rplica, e os OD a substituir so movidos para uma incrementao invertida, i.e., feita uma sincronizao. Este modelo no deve utilizar suportes mveis, visto que cada cpia de segurana necessita de ser efectuada por comparao com o mirror.
Proteco de dados contnua Neste modelo so registadas todas as alteraes do sistema, em vez de calendarizar cpias de segurana peridicas. Esta operao geralmente realizada atravs da gravao das diferenas a nvel de bytes ou blocos de dados, e no das diferenas a nvel de ficheiros. Este modelo difere da simples replicao de discos, uma vez que permite retornar ao estado anterior do registo e, assim, restaurar a anterior imagem de dados.
40
5. Sistemas de Armazenamento
Unidades de suporte para backups mais aconselhadas: Tapes (magnticas): so um suporte de acesso sequencial, pelo que, mesmo que os tempos de acesso sejam baixos, a velocidade de escrita ou leitura contnua de dados rpida. So, desde h muito tempo, o suporte mais utilizado para armazenamento, cpias de segurana, arquivo e transmisso. Existe uma variedade de formatos, muitos dos quais proprietrios ou especficos de alguns nichos de mercado, como o caso das mainframes ou de uma marca de computadores especfica. Discos rgidos: podem ser ligados localmente atravs de interfaces SCSI, USB ou Firewire, ou atravs de tecnologias de maior distncia, tais como Ethernet (Rede), SCSI ou Canais de Fibra. As suas principais vantagens so: tempos de acesso baixos, disponibilidade, capacidade e facilidade de uso. A relao capacidade/preo dos discos rgidos tem vindo a melhorar ao longo dos anos. Cpia de Segurana Remota: so feitas atravs Internet para um local remoto e permitem proteger os dados contra alguns dos maiores perigos, como o fogo, inundaes, sismos ou detonao nuclear. medida que as ligaes de Internet de banda larga se tornam cada vez mais disseminadas, os servios de cpia de segurana remota so cada vez mais utilizados. Um dos aspectos menos positivos desta soluo, prende-se com o facto da velocidade da ligao de Internet ser normalmente mais baixa do que a velocidade de transmisso dos sistemas de armazenamento de dados locais. Este facto pode ser problemtico quando se lida com grandes volumes de dados. Adicionalmente, necessrio ter em conta os perigos associados subcontratao (outsourcing) de terceiros para armazenarem dados considerados sensveis ou pessoais. As unidades de suporte para backups menos aconselhadas so: Discos pticos: podem ser utilizados como suporte de cpias de segurana. Uma das vantagens do CD e do DVD poderem ser restaurados em qualquer mquina com um leitor. Muitos formatos de disco ptico so WORM, o que faz com que sejam tradicionalmente utilizados para arquivo, visto os dados no poderem ser alterados. Outros formatos regravveis podem tambm ser utilizados, como os CDRW ou DVD-RAM. Os novos discos HD-DVD e BluRay aumentaram de forma significativa a quantidade de dados que podem ser armazenados num nico disco ptico. No entanto preciso ter em considerao a inexistncia de estudos sobre a real perdurabilidade de suportes pticos. Disquetes: muito utilizadas durante a dcada de 80 e incios de 90 e associadas s cpias de segurana. Hoje em dia, a capacidade das disquetes tornaram esta soluo obsoleta. Dispositivos de memria: tambm conhecidos por memrias flash, Pen-drives, cartes de memria, cartes digitais, etc., estes suportes so relativamente caros em comparao com a sua baixa capacidade, mas so bastante portteis e fceis de utilizar.
Em linha (Online) Normalmente o tipo de armazenamento de dados mais acessvel, que pode iniciar o restauro em milissegundos. Um exemplo disso um disco rgido interno ou um conjunto de discos rgidos (ligados a uma SAN). Este tipo de armazenamento muito conveniente e rpido, mas relativamente caro. Por outro lado, sofre de alguma vulnerabilidade, pois os dados podem ser apagados ou alterados, seja por acidente ou por vrus que elimine dados.
41
5. Sistemas de Armazenamento
Perto de Linha (Near-line) Normalmente trata-se de um tipo de armazenamento de dados menos acessvel, mas mais barato, do que o armazenamento em linha, sendo til para o armazenamento de dados de rplicas (cpias de segurana). Um exemplo disso um conjunto de tapes com tempos de restauro que vo desde segundos at alguns minutos. Normalmente est associado a um aparelho mecnico que move as unidades de suporte do local de armazenamento para o dispositivo de leitura e/ou gravao de dados. Fora de Linha (Off-line) Similar ao perto de linha, embora necessite de interveno humana para disponibilizar as unidades de suporte. Isto pode incluir simplesmente o armazenamento das tapes de cpias de segurana nas estantes. O tempo de acesso deste suporte pode ser muito demorado. Cofre-Forte (Off-site vault) Com vista proteco contra desastres naturais, algumas instituies preferem enviar os suportes de armazenamento das cpias de segurana para um cofre-forte fora de linha. O cofre pode ser simplesmente o gabinete do Administrador do sistema ou, algo to sofisticado como, um bunker de alta segurana com sistemas anti-desastre e controlo climatrico, que permitem o armazenamento de suportes de cpias de segurana.
Unidade de Cpias de Segurana/Centros de Recuperao de Dados (Backup site, Disaster Recovery Center) No caso de um desastre, os dados nos suportes de cpia de segurana no sero suficientes para a recuperao da informao. Tambm so necessrios sistemas informticos e redes bem configuradas para os dados poderem ser restaurados. Algumas organizaes tm os seus prprios centros de recuperao de dados equipados para este tipo de cenrio. De notar que, sendo estas unidades de recuperao de dados um investimento to dispendioso, raramente se utilizam as cpias de segurana como mtodo de transferncia de dados para a unidade de recuperao de dados. O procedimento mais usual a replicao de disco (disk mirroring) remota, que permite manter os dados no centro de recuperao de dados o mais actualizado possvel.
42
6. Metainformao
6 Metainformao
Este captulo aborda a problemtica da necessidade de metainformao (MI) para uma correcta e vivel preservao digital. Para tal refere-se a utilizao de vrias camadas de MI, como forma de a organizar, indicando-se, para cada camada, exemplos de esquemas de MI passveis de serem utilizados. proposta uma lista de elementos de MI recomendados para a camada de MI de preservao. Finalmente, alerta-se para a utilizao de uma linguagem cuja sintaxe permita ser legvel e pesquisvel pelo ser humano e pelas mquinas. Com vista sistematizao de informao, disponibiliza-se um instrumento de apoio (anexo E) relativo definio de esquemas de MI.
A Metainformao ou metadados transversal a todos os elementos (identificados nos Cap. 4 e 5) do PPD. Na acepo mais bsica, a MI informao sobre informao, ou mais especificamente dados estruturados sobre informao capturada no sistema de arquivo. A metainformao descreve atributos do documento de arquivo electrnico dando-lhe significado, contexto e organizao, permitindo a produo, gesto e utilizao de documentos de arquivo ao longo do tempo, assim como nos, e atravs dos, domnios em que so produzidos. Note-se que existem muitos esquemas de metainformao normalizados ou no destinados a descrever aspectos temticos ou funcionalmente especializados. Por exemplo existe metainformao especfica para dados estatsticos ou para sistemas espaciais como os SIG. A metainformao pode ainda existir implicitamente embebida nos objectos digitais sendo automaticamente produzida pelas solues aplicacionais que lhes deram origem
No mbito da documentao de arquivo electrnica, a MI consiste num conjunto de elementos (atributos) associados a cada OD no momento da sua integrao no arquivo e ao longo da sua gesto. A metainformao pode ser associada no apenas a documentos individuais mas tambm a pastas, utilizadores, plano de classificao e qualquer outra entidade de um Sistema de Gesto Documental/Arquivo.
A importncia da MI neste mbito prende-se com a dependncia dos documentos electrnicos relativamente ao sistema intermedirio, sendo ento necessria para que os OD fiquem contextualizados em termos de produo, gesto e preservao. A metainformao associada aos OD permite: A referenciao nica e persistente de cada OD; A localizao e recuperao expedita de cada OD; A criao do histrico de cada OD; O registo das transformaes realizadas sobre cada OD;
Embora de uma forma geral os documentos electrnicos contenham alguma metainformao fornecida pelas aplicaes que os produzem, esta insuficiente e/ou no se encontra estruturada (organizada). Para ultrapassar esse facto dispomos de esquemas de metainformao que designam os elementos que tm de ser associados aos documentos electrnicos. Importa clarificar que no existem esquemas de MI obrigatrios, pese embora a sua utilizao se inclua no conjunto de boas prticas para a preservao digital. Visto que a MI pode ser repartida por reas, aconselhvel a utilizao de diferentes esquemas no mbito da preservao digital, que devem ser aplicados por diversas camadas: 43
6. Metainformao
Metainformao Descritiva ou de Identificao: O objectivo a pesquisa, O stio Web da Library of Congress inclui a pgina recuperao e identificao. oficial do EAD: <URL:http://www.loc.gov/ead>. Pode incluir elementos como o ttulo, o assunto, autor e O RODA utiliza um modelo de dados baseado no EAD, palavras-chave. O esquema designado por EADPART, abordado em <URL: http://roda.iantt.pt/pt/system/files/rodaEAD (Encoded Archival relatorioFinal.pdf> Description) um bom exemplo, por ser um esquema muito completo e que respeita as normas de descrio arquivstica;
MI Administrativa: Fornece informao para apoio gesto do documento de arquivo electrnico, tal como quando e como foi criado, tipo de ficheiro e outra informao tcnica, e quem tem privilgios de acesso;
MI Estrutural: Relaciona hierarquicamente O stio Web da Library of Congress inclui a pgina oficial os diferentes OD que fazem do METS: <URL: http://www.loc.gov/standards/mets>. parte de um mesmo documento. O esquema O esquema METS foi escolhido no mbito do RODA, por METS (Metadata Encoding & permitir a codificao da MI relativa ao OD, nomeadamente a sua estrutura hierrquica, o seu nome e Transmition Standard) permite localizao. agrupar metainformao descritiva, administrativa e estrutural sobre objectos guardados num repositrio digital. MI Tcnica: Descreve as caractersticas tcnicas dos ficheiros e dos seus formatos, pelo que a mais especfica, por depender do formato do OD. Um exemplo deste tipo de MI o esquema baseado na norma ANSI/NISO Z39.87 - Metadata for Images in XML schema, define um conjunto normalizado de elementos de metainformao para imagens digitais; MI de preservao: Contm informao necessria para arquivar e preservar o OD. O esquema PREMIS (PREservation Metadata Implementation Strategies), produto da parceria entre a OCLC (Online Computer Library Center) e a RLG (Research Libraries Group) o mais conhecido,
O stio Web da Library of Congress inclui a pgina oficial da ANSI/NISO Z39.87: <URL:http://www.loc.gov/standards/mix> O RODA utiliza o esquema baseado na norma ANSI/NISO Z39.87 no caso das imagens digitais.
O stio Web da Library of Congress inclui a pgina oficial do PREMIS: <URL:http://www.loc.gov/standards/premis> O RODA definiu o PREMIS como o esquema MI de preservao a ser utilizado no mbito do projecto.
44
6. Metainformao
Existem, adicionalmente, algumas subcamadas de tipos de metainformao, que so aqui identificadas em separado: MI de gesto de controlo e direitos: que tem a ver com os direitos de propriedade intelectual; MI de contexto de produo; MI de controlo e gesto.
O organismo deve fazer uma descrio de todos os esquemas, modelos ou elementos de MI utilizados ou que lhes interesse utilizar, considerados suficientes. Para tal deve produzir uma tabela que contenha essa informao. preciso ter em conta que, no contexto da preservao digital, existem elementos de MI que devem ser considerados obrigatrios. Para tal, avanada, no quadro abaixo, uma proposta que especifica os elementos recomendados, retirados do esquema PREMIS 6. A primeira coluna indica o sujeito do conjunto dos atributos; a coluna ID apresenta o nmero do atributo de acordo com a ordenao existente no dicionrio de dados do PREMIS; a coluna atributo identifica as unidades semnticas; a coluna Descrio estabelece o mbito dos atributos.
45
6. Metainformao
Descrio Uma designao para identificar de forma unvoca um objecto num arquivo digital. O valor do identificador do objecto. Um valor a indicar o conjunto de funcionalidades de preservao a aplicar ao objecto. Pode ser adequado consoante aquilo que se pretende que o OD assegure. A categoria de objecto a que a MI aplicvel. A profundidade de MI aplicvel, de acordo com o elemento 2. As propriedades tcnicas de um ficheiro ou bitstream Indicao sobre se o OD est sujeito a uma ou mais operaes de descodificao ou decomposio. No caso do OD estar comprimido ou agregado a outros OD e ser necessrio isollo. Organizao de um ficheiro ou bitstream em que se entende por formato a organizao da informao digital de acordo com condies pr-definidas. Registar o formato para cada ficheiro que compem o OD. Designao do formato do ficheiro ou bitstream. Informao sobre como e onde o OD armazenado no Arquivo Digital. Esquema de utilizao utilizado (os meios para aceder localizao). A referncia localizao do contedo. O suporte fsico em que o objecto est armazenado. Uma designao para identificar de forma nica um evento decorrido dentro do Arquivo Digital. Designao para o domnio em que o Identificador do evento nico (ex. sistema de armazenamento, integrao, monitorizao, etc. ou um identificador nico sequencial para todo o Arquivo Digital). Valor do identificador. Categorizao da natureza do evento (de acordo com as funcionalidades asseguradas pelo Arquivo Digital e que devem constar de uma lista de autoridade). A data ou intervalo de datas em que o evento decorreu. A designao usada para identificar de forma nica um actor dentro de um sistema de arquivo digital. Designao do domnio em que o id do actor nico. Valor do id do actor. As aces permitidas pelo depositante ao AD. Aco que o AD pode empreender. Data de incio do acordo. Data em que termina o acordo.
3 4 4.1 Objecto
4.4
{format}
14.2 15
eventIdentifierValue eventType
A metainformao estruturada deve basear-se numa sintaxe que facilite a pesquisa e a identificao por parte tanto do utilizador como da mquina. A sintaxe mais utilizada na actualidade o XML (eXtensible Markup Language), desenvolvida pelo W3C (World Wide
O Arquivo Nacional da Holanda produziu um Digital Preservation Testbed White Paper sobre o XML <www.digitaleduurzaamheid.nl/bibliothee k/docs/white-paper_xml-en.pdf>
46
6. Metainformao
Web Consortium), uma forma estendida de HTML que permite a definio localizada de etiquetas e a troca facilitada de informao. Actualmente, existem cada vez mais ferramentas para XML, e esta linguagem tem assumido um papel cada vez mais crucial na troca de uma variedade de dados na Web. Apresentamos um exemplo da utilizao do XML no Anexo C.
47
A seleco da(s) estratgia(s) de preservao apropriada(s) deve ser, como j foi referido, o resultado de um esforo de colaborao entre as unidades orgnicas referentes ao arquivo e informtica, com a participao de todas as unidades orgnicas afectadas pelo processo ou que produzam documentos de arquivo electrnicos. Apresenta-se, seguidamente, o conjunto das estratgias de preservao mais comummente utilizadas, elencando caractersticas, vantagens e desvantagens de cada uma delas. As estratgias apresentadas podem ser utilizadas a curto, mdio e longo prazo, cabendo entidade produtora definir a sua calendarizao e utilizao no seu PPD
O facto de qualquer plataforma tecnolgica acabar por se tornar obsoleta; A existncia de dificuldades na gesto do espao fsico; A manuteno e custos de operao; O facto do acesso informao estar limitado a alguns locais fsicos do globo e com condicionalismos acrescidos ao nvel da reutilizao da informao.
7.2 Emulao
A emulao corresponde utilizao de um software - o emulador - capaz de reproduzir o comportamento de uma plataforma de hardware e/ou software, numa outra plataforma que, partida, seria incompatvel.
Tipos de emulao possveis: Emulao de aplicaes informticas (ex: Lotus 123); Emulao de sistemas operativos (ex: emulador de MS Windows para Linux); Emulao de plataformas de hardware (ex: emulador de ZX Spectrum para PC). Jeff Rothenberg, defensor da emulao, prope um modelo terico passvel de emular plataformas actuais em computadores futuros, atravs da conservao do objecto digital juntamente com o software necessrio sua execuo/apresentao e na criao de uma especificao escrita numa linguagem independente da plataforma de hardware que suporta a execuo desse software. www.clir.org/pubs/reports/rothenberg/pub77.pdf
As principais vantagens da emulao incluem o facto de preservar, de forma fiel, as caractersticas e as funcionalidades
48
do objecto digital original e, embora se centre na preservao do objecto lgico no seu formato original, no sofre de alguns dos problemas da estratgia de preservao de tecnologia (Ex.: envelhecimento do hardware).
T. Hendley defende que a emulao apenas deveria ser utilizada em situaes em que haja interesse em preservar o ambiente tecnolgico original ou quando no possvel converter os OD para formatos actuais. David Bearman considera que a emulao pretende conservar o objecto errado, i.e., as funcionalidades dos sistemas de informao em vez dos DAE, pois so estes ltimos que tm valor evidencial, atravs do seu contedo, estrutura e contexto.
No entanto, o emulador pode tornar-se obsoleto e a sua utilizao pressupe que os utilizadores do futuro sejam capazes de operar adequadamente aplicaes e sistemas operativos h muito desaparecidos (Ex.: O Arquivo Nacional dos Pases Baixos produziu um Digital num futuro prximo ser difcil Preservation Testbed White Paper sobre a Emulao < conceber que os utilizadores www.digitaleduurzaamheid.nl/bibliotheek/docs/white_paper_e estejam aptos a enfrentar as mulatie_EN.pdf> particularidades do sistema operativo MS-DOS).
7.4 Encapsulamento
O encapsulamento consiste em preservar, juntamente com o objecto digital, toda a informao necessria e suficiente para permitir o futuro desenvolvimento de conversores, visualizadores ou emuladores (por exemplo, a descrio formal e detalhada do formato do objecto preservado). O encapsulamento est orientado a objectos que apenas sero acedidos num futuro longnquo. Permite adiar a responsabilidade de preservao, e o desenvolvimento futuro de visualizadores, migradores ou emuladores. No entanto, preciso estar ciente que objectos complexos possuem especificaes complexas e que uma especificao incompleta poder ter um efeito desastroso para a preservao do OD.
49
O principal objectivo evitar a obsolescncia tecnolgica, mantendo os OD compatveis com tecnologias actuais, de forma a permitir a sua interpretao sem necessidade de recorrer a artefactos menos convencionais. A transposio prev processos de: Refrescamento a nvel de suportes (exemplo: O Arquivo Nacional dos Pases Baixos produziu um Digital de Disquete para CD-R Preservation Testbed White Paper sobre a Migrao ou de CD-R para DVD<www.digitaleduurzaamheid.nl/bibliotheek/docs/Migration.pdf> R), nos casos em que existam e sejam utilizados estes suportes (cf. Cap. 5). Processos de migrao entre formatos (exemplo: de Word 97 para Word 2000); Transposio conjunta de formatos e suportes.
Probabilidade de algumas propriedades dos OD no serem correctamente transferidas para o formato de destino adoptado; Existncia de incompatibilidades entre os formatos de origem e destino; Inadequao dos conversores; Obsolescncia de formatos.
Adicionalmente, durante a transposio de documentos para novos formatos h informao que se perde ao nvel da estrutura, da metainformao e, por vezes, do contedo.
Face a estas situaes de perda de Documentos multimdia (pginas web em informao, deve recorrer-se a estratgias que as actualizaes e modificaes so nas quais se incluem documentar frequentes). exaustivamente o processo de migrao (metainformao) para que fique claro o que se perdeu, quando e como se perdeu. Desta forma tenta-se garantir que o que se perde no compromete a autenticidade e fidedignidade do documento. Este aspecto de confirmao da perda de informao em objectos migrados foi j referida no captulo 2.
Esta questo particularmente evidente em documentos compostos e complexos como, por exemplo: Bases de dados (muitas tabelas com ligaes entre si e circulao constante de informao);
Apesar das desvantagens apresentadas, esta de longe a estratgia de preservao mais aplicada at data e a nica que tem vindo a dar provas da sua eficcia.
Actualizao de verses: Caracteriza-se pela actualizao dos formatos utilizando software retrocompatvel (por exemplo, a utilizao do Word 6 para actualizar um documento criado com o Word 5);
50
Converso para formatos concorrentes: Permite ultrapassar o risco de descontinuidade de formatos, convertendo OD para formatos anlogos, independentemente da aplicao utilizada na sua criao (por exemplo, converter um documento Word para PDF);
Normalizao: Corresponde migrao para um nmero reduzido de formatos compatveis, o que poder evitar futuras complicaes a nvel de direitos de autor ou pagamento de royalties. Promove, tambm, a interoperabilidade entre sistemas distintos.
O facto de serem utilizados formatos abertos e independentes da plataforma permite que diferentes configuraes de hardware e software sejam capazes de os interpretar. Existem vrios tipos de normas:
Normas de facto: Quando o produto est firmemente estabelecido no mercado, a compatibilidade das outras aplicaes medida referenciando esse produto e as alteraes de compatibilidade dependem do proprietrio (ex: Word);
Especificaes pblicas: Quando algumas empresas lderes de mercado criam um consrcio para definir uma norma de ligao que possibilita o desenvolvimento de produtos compatveis;
Normas de jure Quando organismos oficiais promovem o consenso acerca de uma especificao, que depois se torna uma norma oficial (ex: ISO, NP, etc.)
O tempo de intervalo entre transferncias de formato est dependente da evoluo da tecnologia, bem como do facto de usarmos ou no formatos normalizados, podendo variar entre os 7 e os 10 anos.
51
8. Concluso
8 Concluso
A preservao digital uma funo que no pode ser evitada. Cada vez mais as organizaes dependem, a mdio e longo prazo, de informao produzida e mantida electronicamente. Tal dependncia deve-se a motivos que se prendem com a operao da organizao, salvaguarda dos seus interesses, incrementao da transparncia administrativa e credibilidade da instituio relativamente aos seus stakeholders, entre os quais se contam o Governo e o cidado. A organizao pode ter a opo de no preservar a sua informao digital. Julgamos, no entanto, ser esse risco inaceitvel atendendo s circunstncias referidas. Embora tal implique custos que podem ser significativos, compete organizao ponderar seriamente o que tem a perder caso decida nada fazer. Este documento um primeiro passo para guiar as organizaes na tarefa de preservao digital. A DGARQ, enquanto rgo responsvel pela coordenao e execuo da poltica arquivstica nacional, posiciona-se como parte interessada nesse processo, disponibilizando o seu conhecimento na rea para auxiliar as organizaes a construir e implementar processos de preservao, sem se pretender substituir de forma alguma s responsabilidades que toda e qualquer organizao deve manter relativamente ao seu patrimnio arquivstico, independentemente do suporte em que este se encontra.
52
Anexos
53
# 1 1.1 1.2 2
Designao O organismo dispe de: Plano de Classificao Tabela de Seleco Foi elaborada uma anlise e caracterizao da informao electrnica produzida pela organizao no mbito: do sistema de gesto documental das sries documentais A anlise anterior permitiu: definir classes preservadas de informao a serem
Obrigatoriedade
Comentrio
Aconselhvel Aconselhvel
Obrigatrio Obrigatrio
Obrigatrio
3.2
identificar as caractersticas dos ficheiros por cada classe de informao definida identificar as caractersticas tcnicas Documentos de Arquivo Electrnico dos
Obrigatrio
3.3
Obrigatrio
3.4
identificar os seguintes factores inerentes aos Documentos de Arquivo: Usabilidade Complexidade Escalabilidade Foram elaborados e analisados estudos no intuito de identificar os custos de solues de Preservao na fase de desenvolvimento e implementao em termos de: software Obrigatrio Obrigatrio Obrigatrio Obrigatrio
4.1
54
Designao
Comentrio
preparao e adaptao de infraestruturas recursos humanos Foram analisados e identificados os custos de funcionamento, manuteno e actualizao em termos de: parque informtico infraestrutura formao recursos humanos Foi produzida uma avaliao e escolha de: formatos normalizados de preservao a longo prazo, para cada formato de ficheiro a preservar? aplicaes informticas: com capacidade de incremento de utilizadores simultneos com especificaes abertas que permitam a exportao formatos normalizados solues armazenamento: que permitam o escalamento capacidade de armazenamento que incluam sistemas de backup que incluam sistema de rotinas de auditoria e monitorizao Analisaram-se e metainformao: adaptaram-se os esquemas de da para
Obrigatrio
6.2 6.2.1
Obrigatrio
6.2.2 6.2.3
Obrigatrio Obrigatrio
6.3 6.3.1
Obrigatrio
6.3.2 6.3.3
Obrigatrio Obrigatrio
7.1
7.1.1
55
Designao Tcnica Estrutural Preservao a serem implementados e que contenham elementos de metainformao: Descritiva
Comentrio
7.2.1
Obrigatrio aplicvel Obrigatrio aplicvel Obrigatrio aplicvel Obrigatrio aplicvel definidos para Obrigatrio aplicvel Aconselhvel
se
7.2.2
Tcnica
se
7.2.3
Estrutural
se
7.2.4
se
se
Foi definido um cronograma para execuo da implementao Foram definidas medidas de auditoria internas a nvel de: procedimentos de preservao formatos para preservao solues de software alternativas para um determinado formato solues de armazenamento esquemas de metainformao Foram definidas medidas de monitorizao interna dos documentos de arquivo electrnicos preservados, em termos de: integridade funcionalidade estrutura contedo
10
10.4 10.5 11
Obrigatrio Obrigatrio
56
# 11.5 12
Designao metainformao associada Foi produzido um documento que defina o PPD de acordo com as solues propostas anteriormente A soluo proposta foi testada preventivamente sobre cpias de documentos de arquivo electrnicos, para despistar falhas Foram produzidas cpias de segurana documentos de arquivo electrnicos a preservar? dos
Comentrio
13
Aconselhvel
14
Aconselhvel
15
A estratgia de preservao digital foi implementada de acordo com o definido no PPD desenvolvido pelo organismo?
Obrigatrio
57
Anexo B Questionrio
1.Controlo e Segurana a) Segurana do Sistema: Refere-se s funcionalidades do sistema que asseguram a proteco dos dados. O objectivo identificar as medidas de proteco de dados utilizadas pelo sistema. Estas podem consistir em Firewalls (dispositivo ou aplicao de controlo de trfego de dados de e para a rede), sistemas de deteco de intrusos, e outros a especificar pelo Organismo. Um sistema pode utilizar um ou mais medidas de segurana.
a) Rotinas de Auditoria: Permitem o registo de procedimentos efectuados a nvel do sistema. Pretende-se saber: Quais os elementos que esto sujeitos a estas rotinas de auditoria; Se essas rotinas do origem a relatrios; Que tipo de informao consta nesses relatrios; Se esses relatrios so protegidos contra alteraes ou eliminaes no autorizadas; Quem tem acesso a esses relatrios.
2. Armazenamento a) Sistemas de Informao Inclui questes relativas ao armazenamento de OD originais. O objectivo identificar onde esto instalados os repositrios de dados que se pretendem preservar a longo prazo, quais as arquitecturas de armazenamento utilizados para o efeito (ver Cap. 5.2 para informaes mais pormenorizadas) e onde se localizam. Esta localizao poder referir-se sala, cofre ou empresa com quem se estabeleceu um protocolo de outsourcing. Pretende-se, igualmente, saber que outros dispositivos portteis so tambm utilizados fora do local, qual a infra-estrutura de acesso aos repositrios de dados (ver os Cap. 5.3.1 para informaes mais pormenorizadas), e se possvel a sincronizao de dados com outro repositrio. Finalmente, solicitada a identificao dos formatos lgicos dos dados dos diferentes recursos da srie e categorias utilizados (que esto identificados no Cap. 4.1 e listados no anexo C), e as respectivas aplicaes informticas (de acordo com o Cap. 4.2), a dimenso, o espao ocupado e a taxa de crescimento de OD em unidades binrias, medidas em terabytes.
58
Anexo B Questionrio
b) Backups Estas questes referem-se ao armazenamento das rplicas ou cpias de segurana produzidas a partir dos OD originais. O objectivo identificar onde esto instalados os repositrios das rplicas dos dados que se pretendem preservar a longo prazo, quais as arquitecturas de armazenamento utilizados para o efeito (ver Cap. 5.3 para informaes mais pormenorizadas) e onde se localizam. Esta localizao poder referir-se sala, cofre ou empresa com quem se estabeleceu um protocolo de outsourcing. Finalmente, pedida a dimenso, em unidades binrias medidas em terabytes.
3. Funes Administrativas Inclui questes respeitantes aos recursos de manuteno e apoio ao sistema.
a) Administrao Geral Relativa gesto de parmetros, salvaguarda e reconstituio do sistema, bem como administrao de utilizadores. Pretende-se a identificao das UO que administram (normalmente a UO ligada informtica) e das que detm a propriedade dos sistemas de informao.
4. Outras funes a) Encriptao O objectivo saber se a encriptao utilizada. Em caso afirmativo pretende-se identificar qual(ais) o(s) sistema(s) de encriptao utilizado(s) (ex: MD5, SSH, etc.), e em que tipos de documentos so utilizados.
5 Requisitos no funcionais a) Desempenho e escalabilidade Inclui questes relacionadas com a capacidade de satisfazer a gama de requisitos para o qual o sistema foi concebido. A questo 28 reporta-se s capacidades do sistema de gesto documental, actuais e possveis no futuro, relativamente ao nmero de utilizadores possveis em simultneo; velocidade de retorno de pesquisa e de carregamento para visualizao (medidas em segundos); e ainda capacidade de armazenamento (medida em terabytes).
b) Contratao de servios externos Reflecte a opo de utilizar prestadores de servios externos ao organismo para gesto do sistema. Pretende-se saber se a subcontratao de servios utilizada para a administrao e alojamento dos sistemas de informao. Adicionalmente, pede-se a descrio do tipo e durao desse(s) contrato(s).
59
Anexo B Questionrio
c) Conservao a longo prazo (entendida em termos de preservao digital como um perodo superior a sete anos). O objectivo identificar: Quais as normas e legislao (Ex. art. 17 de RCM 5/90, de 28 de Fevereiro) relativas a requisitos ambientais observados; Quais as condies ambientais especficas para armazenamento a longo prazo, caso existam; Se a monitorizao dos sistemas e suportes de armazenamento feita regularmente. 6 Metainformao Pretende-se obter informao sobre a utilizao de esquemas ou modelos de MI. Em caso afirmativo, solicita-se que se faa a identificao dos mesmos, referindo qual(ais) o(s) sistema(s) de informao em que so utilizados. Caso contrrio, dever ser produzida uma lista com os elementos de MI utilizados em cada sistema de informao.
Parte II - Srie/Actividade suportada Esta parte pretende caracterizar cada uma das sries documentais que contm OD. Caso a Organizao no utilize qualquer plano de classificao ou no possua tabela de seleco, dever orientar estas questes no mbito das actividades suportadas pelos OD.
1. Identificao da organizao produtora Campo destinado identificao da entidade produtora da documentao, objecto de avaliao. O objectivo fornecer informao sobre o sector de actividade a que pertence o produtor da srie, a sua identificao formal e unvoca e o nome do Organismo, unidade orgnica ou pessoa individual (desde que no coincidente com o anterior) responsvel pela compilao e transmisso dos documentos da srie. Os sectores de actividade possveis (mas no exclusivos) so: Sector Privado (SP); Sector Pblico Empresarial (SPE); Administrao Central (AC); Administrao Local (AL); Administrao Regional (RA); Segurana Social (SS); Governo (GOV); Tribunais (TRB); Presidncia da Repblica (PR); Assembleia da Repblica (AR); Organizaes No Governamentais (ONG); Instituies de Solidariedade Social (ISS); Organismos Comunitrios (OC); Organizaes Inter-Governamentais (OIG) 2. Referenciao da srie Pretende fornecer informao identificativa da srie ou da actividade suportada pela documentao em causa. a) Nmero de Referncia Nmero sequencial exclusivo que identifica a srie ou actividade suportada. No caso de no existir tabela de seleco passar ao grupo 3.
b) Cdigo de classificao Cdigo exclusivo da srie, que permite a sua localizao intelectual, tal como se apresentam no plano de classificao.
c) Identificao da srie documental/actividade - Pretende-se obter informao descritiva sobre a srie documental, nomeadamente ao nvel de ttulos, actividade suportada e assunto.
60
Anexo B Questionrio
d) Srie relacionadas So sries que contm documentos e/ou informao que diz igualmente respeito ou outra(s) srie(s). Preencher no caso da srie em anlise conter informao sntese (o contedo informativo existente numa ou em mais sries documentais sintetizado ou resumido numa outra srie), duplicada (uma srie documental contm, no todo ou em parte, o mesmo contedo informativo que outras sries) ou complementar (o contedo informativo de uma srie est relacionado com o de outra srie, acrescentando-lhe informao adicional). 3. Controlo e Segurana a) Acesso O objectivo saber se existem restries de acesso informao da srie/actividade suportada.
b) Salvaguarda e Recuperao Pretende-se conhecer a existncia de cpias de segurana e relacionar os tipos de cpias de segurana com o intervalo de tempo entre cada uma. As cpias podem ser integrais ( produzida sobre a totalidade dos OD da srie/actividade suportada), parciais (produzidas sobre parte da srie, normalmente os OD mais recentes) e distribudas (so produzidas rplicas que so armazenadas em localizaes diferente). Os perodos de intervalo podem ser dirios, semanais, mensais, etc.
c) Categorias de Segurana Visa a identificao da categoria documental/actividade relacionada. de segurana mais alta existente na srie
4 Avaliao a) Tabelas de Seleco O objectivo identificar o tempo de reteno definido para os recursos da srie e a aco a tomar, findo o prazo de conservao. A eliminao global significa que: A srie tem um valor secundrio nulo; A informao contida na srie foi objecto de publicao, com um nmero de depsito legal e no arquivo definitivo se conserve, pelo menos, um exemplar da publicao; Os dados essenciais da srie esto includos noutra srie de conservao permanente no mesmo organismo ou num organismo distinto. A Conservao permanente global significa que: A srie tem valor secundrio relevante e se verifica que o conjunto da informao no est publicado nem recupervel noutras sries de conservao permanente.
61
Anexo B Questionrio
A Reviso significa que: No h certezas sobre o destino a dar srie, pelo que tal deciso ser adiada para quando terminar o prazo de conservao. b) Anlise de risco necessria, devido possibilidade de perda ou corrupo dos dados, resultados de danos fsicos. Pretende-se saber a percentagem de tolerncia da organizao para a perda dos OD que compem a srie em causa, e se esta contm documentos vitais, com vista a identificar se se trata de uma srie candidata a preservao digital.
5 Outras Funes
a) Assinaturas Digitais O objectivo obter dados referentes validao duma assinatura electrnica ou digital anexa aos documentos da srie ou certificado digital.
62
Anexo B Questionrio
Firewall
Outros
Quais? ____________________
b) Rotinas de Auditoria
2. So efectuadas rotinas de auditoria sobre:
Sistemas de informao
Dados
Documentos electrnicos
Utilizadores
Sim
No
Alguns
A nvel do sistema
A nvel de utilizadores
Sim
No
63
Anexo B Questionrio
Servidores
Sistema de armazenamento
9. Indique o tipo:
10. Suporte fsico dos recursos: CAS NAS SAN Discos pticos Tapes Discos rgidos Outros:_________________________ 11. Localizao topogrfica dos suportes utilizados:
12. Existem dados armazenados em aparelhos que so normalmente utilizados fora do local, como portteis ou PDA? Quais os aparelhos utilizados?
Discos Externos
Pen-drives
PDA
___________________________
64
Anexo B Questionrio
14. Os dados esto sincronizados com outro repositrio? No mesmo edifcio ou externo?
16. Aplicaes utilizadas no mbito desses formatos Nome do Formato Nome da Aplicao Proprietrio (S/N) ;
b) Backups
18. Onde esto instalados ou depositados os backups?.
Servidores
Sistema de armazenamento
65
Anexo B Questionrio
22. Dimenso:
Sim
No
Documentos de texto [PDF, WORD] Imagens Mensagens de correio electrnico Outros Quais?_______________________________
66
Anexo B Questionrio
Capacidade de armazenamento
30. O alojamento dos sistemas de informao e subcontratada? Sim (no todo ou em parte) No
67
Anexo B Questionrio
6 Metainformao
37 Utilizam algum esquema/modelo de metainformao? Sim No
39. No caso de no ser utilizado um esquema/modelo, indique que elementos de Metainformao so utilizados:
40. Mapeamento dos sistemas de informao com os respectivos esquemas/modelos de metainformao utilizados. Sistema de Informao Esquema/modelo de Metainformao
68
Anexo B Questionrio
2. Identificao do Produtor
3. Designao do Produtor
b) Cdigo de classificao
5. Cdigo de Classificao
7. Actividade suportada
69
Anexo B Questionrio
d) Srie relacionadas
9. Ttulo da Srie/Subsrie relacionada 1. 2. Possui informao Sntese Sntese Complementar Complementar Duplicada Duplicada
Livre para todos os funcionrios Livre para todos os funcionrios com algumas restries Restrito a todos os funcionrios Restrito maior parte dos funcionrios com algumas excepes
b) Salvaguarda e Recuperao
11. So feitas cpias de segurana?
Sim
No
12. Que tipo de cpias de segurana/Perodo de intervalo Tipo de cpias de segurana Perodo de intervalo entre cpias de segurana (ex. dirio, semanal, mensal, etc.)
Integrais
Parciais
Distribudas
c) Categorias de Segurana
13. Tem classificao de segurana? Sim No
70
Anexo B Questionrio
b) Anlise de risco
17. Quais as tolerncias para perda ou corrupo de dados? 0 5% 6 10% 11 20% 21 50 % 51 - 100%
Sim
No
71
72
</object> <object> <objectIdentifier> <objectIdentifierType>Custom</objectIdentifierType> <objectIdentifierValue>F2006.01.0001.0000001</objectIdentifierValue> </objectIdentifier> <preservationLevel>full</preservationLevel> <objectCategory>File</objectCategory> <objectCharacteristics> <compositionLevel>0</compositionLevel> <fixity> <messageDigestAlgorithm>MD5</messageDigestAlgorithm> <messageDigest>5d5679af155d9752fab9a42e6c724f0a</messageDigest> </fixity> <size>482190</size> <format> <formatDesignation> <formatName>image/tiff</formatName> </formatDesignation> <formatRegistry> <formatRegistryName>JHOVE</formatRegistryName> <formatRegistryKey>TIFF5.0</formatRegistryKey> </formatRegistry> <formatRegistry> <formatRegistryName>MIME</formatRegistryName> <formatRegistryKey>image/tiff</formatRegistryKey> </formatRegistry> </format> <significantProperties> <mix:mix> <mix:BasicImageParameters> <mix:Format> <mix:MIMEType>image/tiff</mix:MIMEType> <mix:ByteOrder>littleendian</mix:ByteOrder> <mix:Compression> <mix:CompressionScheme>1</mix:CompressionScheme> </mix:Compression> <mix:PhotometricInterpretation> <mix:ColorSpace>0</mix:ColorSpace> </mix:PhotometricInterpretation> <mix:Segments> <mix:StripOffsets>8</mix:StripOffsets> <mix:RowsPerStrip>2339</mix:RowsPerStrip> <mix:StripByteCounts>481834</mix:StripByteCounts> </mix:Segments> <mix:PlanarConfiguration>1</mix:PlanarConfiguration> </mix:Format> <mix:File> <mix:Orientation>1</mix:Orientation> </mix:File> </mix:BasicImageParameters> <mix:ImageCreation> <mix:ScanningSystemCapture> <mix:ScanningSystemSoftware> <mix:ScanningSoftware>KofaxImageProcessingPlatformv1.10.018;KIPPTIFFStorageFilterv110.018</mix:Scannin gSoftware> </mix:ScanningSystemSoftware> </mix:ScanningSystemCapture> <mix:DateTimeCreated>19920509T15:10:57</mix:DateTimeCreated> </mix:ImageCreation> <mix:ImagingPerformanceAssessment> <mix:SpatialMetrics> <mix:SamplingFrequencyUnit>2</mix:SamplingFrequencyUnit> <mix:XSamplingFrequency>200</mix:XSamplingFrequency> <mix:YSamplingFrequency>200</mix:YSamplingFrequency> <mix:ImageWidth>1648</mix:ImageWidth> <mix:ImageLength>2339</mix:ImageLength> </mix:SpatialMetrics> <mix:Energetics> <mix:BitsPerSample>1</mix:BitsPerSample> <mix:SamplesPerPixel>1</mix:SamplesPerPixel> </mix:Energetics> </mix:ImagingPerformanceAssessment> </mix:mix> </significantProperties> </objectCharacteristics>
73
<creatingApplication> <creatingApplicationName>tiffcp(libtifftools)</creatingApplicationName> <creatingApplicationVersion>3.7.31ubuntu1.1</creatingApplicationVersion> <dateCreatedByApplication>20060609T15:34:15Z</dateCreatedByApplication> </creatingApplication> <originalName>3</originalName> <storage> <contentLocation> <contentLocationType>URI</contentLocationType> <contentLocationValue>R2006.01.0001/F2006.01.0001.0000001.tiff </contentLocationValue> </contentLocation> <storageMedium>DVD</storageMedium> </storage> </object> </premis>
74
D Recursos Aconselhados
ALVES, Ivone [et. al.] Dicionrio de terminologia arquivstica. Lisboa: IBL, 1993. ADOBE Tiff developer information site. 2002 URL: [Consult. 10 Dez. 2007]
<http://partners.adobe.com/public/developer/tiff>. ANDERSSON, Ulf - Short Version of the Sesam Report: Philosophy and Rules Concerning Electronic Archives and Authenticity. Proceedings of the DLM-Forum on Electronic Records. Brussels, 18-20 December 1996.
ASSOCIAO PARA O DESENVOLVIMENTO DA SOCIEDADE DA INFORMAO Glossrio da Sociedade da Informao Verso 2007 BARBEDO, Francisco et al. RODA: Relatrio Final, Maro 2007, Direco Geral de Arquivos e Universidade do Minho, [Consult. 10 Dez. 2007] URL:<
http://roda.iantt.pt/pt/system/files/roda-relatorioFinal.pdf>;
BARBEDO, Francisco et al. RODA: Repositrio de Objectos Digitais Autnticos, in CONGRESSO NACIONAL DE BIBLIOTECRIOS, ARQUIVISTAS E
DOCUMENTALISTAS, 9, Ponta Delgada, Portugal, 2007 Bibliotecas e arquivos : informao para a cidadania, o desenvolvimento e a inovao: actas [CD-ROM]. [S.l.] : Associao Portuguesa de Bibliotecrios, Arquivistas e Documentalistas, 2007. ISBN 978-9729067-37-2.
BARBEDO, Francisco RODA - De projecto a programa estratgico para a Preservao Digital, in Boletim Arquivos Nacionais, n19, Janeiro-Maro 2007, Lisboa. ISSN1645-5460;
BARBEDO, Francisco; GOMES, Eugnia; HENRIQUES, Ceclia SIADE caderno 1: Contexto de Suporte [Em linha]. Lisboa: Instituto dos Arquivos Nacionais; Instituto de Informtica, 2000 [Consult. 10 Dez. 2007] Disponvel em: <http://www.iantt.pt/downloads/SIADE_Caderno1.pdf>.ISBN 972-8107-59-5
BARBEDO, Francisco; GOMES, Eugnia; HENRIQUES, Ceclia; LAGOAS, Jos SIADE caderno 2: Recomendaes para a Gesto de Documentos de Arquivo Electrnicos (MOREQ). Lisboa: Instituto dos Arquivos Nacionais; Instituto de Informtica, 2000 [Consult. 10 Dez. 2007] Disponvel em: <URL:http://www. http://www.iantt.pt/downloads/SIADE_Caderno2.pdf>. ISBN 972-8107-59-5
75
BEARMAN, David - Electronic Evidence. Strategies for Managing Records in Contemporary Organizations. Pittsburgh: Archives & Museum Informatics. 1994. ISBN: 1-885626-08-8
BEARMAN, David - Reality and Chimeras in the Preservation of Electronic Records, in D-Lib Magazine, Abril 1999, disponvel em: <www.dlib.org/dlib/april99/bearman/04bearman.html>
BEARMAN, David - Toward a Reference Model for Business Acceptable Communication, 1994, disponvel em: < www.lis.pitt.edu/~nhprc/prog6-5.html> BESSER, Howard; TRANT Jennifer - Introduction to Imaging: Issues in Constructing an Image Database. Santa Monica, CA: Getty Art History Information Program, 1995. ISBN-13: 9780892363612
CONSELHO INTERNACIONAL DE ARQUIVOS Documentos de Arquivo Electrnicos: Manual para arquivistas. (Estudos, n 16) trad e adapt. IAN/TT. 2005. [Em linha]. Lisboa: IAN/TT, 2005. [Referncia de 8 de Maio de 2006]. [Consult. 10 Dez. 2007] Disponvel na internet em: <http://www.ica.org/sites/default/files/ICAEstudo16_PT_4.pdf>.
CONSELHO INTERNACIONAL DE ARQUIVOS - ISAD(G): Norma geral internacional de descrio arquivstica: adoptada pelo Comit de Normas de Descrio, Estocolmo: Sucia, 19-22 de Setembro de 1999. Trad. Grupo de Trabalho para a Normalizao da Descrio em Arquivo. 2 ed. [Em linha]. Lisboa: IAN/TT, 2004. [Consult. 10 Dez. 2007].Disponvel na internet em: < http://www.iantt.pt/downloads/ISADG.pdf>.
CONSELHO INTERNACIONAL DE ARQUIVOS - ISAAR (CPF): Norma internacional de registo de autoridade arquivstica para pessoas colectivas, pessoas singulares e famlias. Trad. Grupo de Trabalho para a Normalizao da Descrio em Arquivo. 2 ed. [Em linha].Lisboa: IAN/TT, 2004. [Consult. 10 Dez. 2007]. Disponvel na internet em: <
http://www.iantt.pt/downloads/ISAAR2.pdf>
CONSULTATIVE COMMITTEE FOR SPACE DATA SYSTEMS, Reference Model for an Open Archival Information System (OAIS) - Blue Book. Washington: National Aeronautics and Space Administration, 2002.
COOK, Terry - Electronic Records, Paper Minds: The Revolution in Information Management and Archives in the Post-Custodial and Post-Modernist Era. Archives and Manuscripts 22 (Novembro 1994): p.300-328. 76
DUFF, Wendy - Will Metadata Replace Archival Description: A Commentary. Archivaria 39 (Maro 1995): 33-38.
FERREIRA, Miguel - Introduo preservao digital Conceitos, estratgias e actuais consensos. Guimares: Escola de Engenharia da Universidade do Minho, 2006 ISBN-13: 978-972-8692-308 [em linha] [Consult. 10 Dez. 2007] Disponvel na Internet
<URL:https://repositorium.sdum.uminho.pt/handle/1822/5820>
HENDLEY, T. - Comparison of Methods & Costs of Digital Preservation, British Library Research and Innovation Center, West Yorkshire 106, 1998.
HENRIQUES, M., LIBREOTTO, G., RAMALHO, J., e HENRIQUES, P. - Bidirectional conversion between xml documents and relational data bases. International conference on CSCW in design, 2002. Disponvel na Internet <URL: http://hdl.handle.net/1822/601> INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. ISO/IEC 17799:
Information technology -- Security techniques -- Code of practice for information security management. Genebra: ISO, 2005.
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. ISO/IEC 27001: Information technology -- Security techniques -- Information security management systems Requirements. Genebra: ISO, 2005. INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. ISO/IEC 27002: Information technology -- Security techniques -- Code of practice for information security management. Genebra: ISO, 2005. INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. ISO/IEC 27006: Information technology -- Security techniques -- Requirements for bodies providing audit and certification of information security management systems. Genebra: ISO, 2007.
77
INSTITUTO PORTUGUS DA QUALIDADE - NP 4438-1, Informao e documentao.Gesto de documentos de arquivo. Parte 1: Princpios directores. Lisboa: Instituto Portugus da Qualidade, 2005.
INSTITUTO PORTUGUS DA QUALIDADE - NP 4438-2, Informao e documentao. Gesto de documentos de arquivo. Parte 2: Recomendaes de aplicao. Lisboa: Instituto Portugus da Qualidade, 2005.
INSTITUTO DOS ARQUIVOS NACIONAIS/TORRE DO TOMBO - Manual para a gesto de documentos. Coord. Madalena Garcia e Maria Joo Pires de Lima; elab. Ceclia Henriques, Francisco Barbedo e Lus Montalvo. 2 ed. Lisboa: IAN/TT, 2004.
LAVOIE, B. F. - The open archival information system reference model: Introductory guide. Digital Preservation Coalition. 2004
MACNEIL, Heather - Metadata Strategies and Archival Description: Comparing Apples to Oranges. Archivaria 39 (Maro 1995): 22-32.
MORELLI, Jeffrey - Defining Electronic Records: a Terminology Problem... or Something More. Electronic Information Resources and Historians: European Perspectives, Eds. Seamus Ross, and Edward Higgs, 83-91. St Katharinen: Scripta Mercaturae Verlag, 1993.
NISO Z39.87-2006, Data Dictionary Technical Metadata for Digital Still Images. Bethesda: National Information Standards Institute; 2006
PARER, Dagmar; PARROTT, Keith - Management Practices in the Electronic Records Environment. Archives and Manuscripts 22, no. 1 (Maio 1994):106-122.
RLG EAD Advisory Group - RLG Best Practice Guidelines for Encoded Archival Description, 2002
ROTHENBERG, J. - Avoiding Technological Quicksand: Finding a Viable Technical Foundation for Digital Preservation A Report to the Council on Library & Information Resources (CLIR), 1999, ISBN - 1-887334-63-7 (disponvel em www.clir.org/pubs/reports/rothenberg/contents.html ou www.clir.org/pubs/reports/rothenberg/pub77.pdf
78
ROTHENBERG, Jeff - Ensuring the Longevity of Digital Documents. Scientific American. (Janeiro 1995), 42-47.
SARAMAGO, M. - Metadados para a preservao digital e aplicao do modelo OAIS. In VIII Congresso da BAD. 2004.
STEPHENS, David O. Digital Preservation in the United Kingdom in THE INFORMATION MANAGEMENT, vol. 34, n. 4, Outubro 2000
STEPHENS, David O.; WALLACE, Roderick C. Electronic Records Retention: Fourteen Basic Principles in THE INFORMATION MANAGEMENT, vol. 34, n. 4, Outubro 2000
WALLACE, David - Managing the Present: Metadata as Archival Description. Archivaria 39 (Maro 1995): 11-21.
WALLACE, David - Metadata and the Archival Management of Electronic Records: A Review. Archivaria 36 (1993): 87-110.
Endereos electrnicos
DELOS - www.delos.info/
DGARQ - http://www.dgarq.gov.pt
79
DLM-Forum - http://www.europa.eu.int/historical_archives/dlm_forum
de
documentos
electrnicos)
Erpanet - http://www.erpanet.org/
Interpares - www.interpares.org/
Records
Management
Application
(RMA)
MIP http://www.dgarq.gov.pt/downloads/MIIP_v1.0a.doc Model Requirements for the Management of Electronic Records (verso original) http://www.cornwell.co.uk/moreq
RECORDKEEPING
WEB
SITE
GUIDE
80
PDF/A
Competence
Center
The
pdf/a
competence
center
webpage,
2007,
URL:<http://www.pdfa.org>.
PLANETS - www.planets-project.eu/
RODA - http://roda.iantt.pt/
SOCIETY OF AMERICAN ARCHIVISTS - Society of American Archivists home page. 2003 <http://www.archivists.org.>
SOCIETY
OF
AMERICAN
ARCHIVISTS
EAD
tools
survey.
2006,
URL:
<http://www.archivists.org/saagroups/ead>.
THE LIBRARY OF CONGRESS. NISO metadata for images in XML schema official web site. 2004.- <http://www.loc.gov/standards/mix>
81
THE
LIBRARY
OF
CONGRESS
Pgina
oficial
do
EAD
verso
de
2002.
<http://www.loc.gov/ead/>.
THE
LIBRARY
OF
CONGRESS.
Pgina
oficial
do
METS.
2006.
<http://www.loc.gov/standards/mets>.
THE
LIBRARY
OF
CONGRESS
Pgina
oficial
do
PREMIS.
2006,
<http://www.loc.gov/standards/premis>.
THE LIBRARY OF CONGRESS - Sustainability of Digital Formats Planning for Library of Congress Collection: TIFF rev6.0, Maro 2007. -
<http://www.digitalpreservation.gov/formats/fdd/fdd000022.shtml>
82
Anexo E - Glossrio/Conceitos
E Glossrio
API - Application Programming Interface (ou Interface de Programao de Aplicativos) um conjunto de rotinas e normas/regras estabelecidos por um software para utilizao das suas funcionalidades por programas aplicativos - isto : programas que no se querem envolver em detalhes da implementao do software, mas apenas utilizar os seus servios. De modo geral, a API composta por uma srie de funes acessveis somente por programao, e que permitem utilizar caractersticas do software menos evidentes ao utilizador tradicional. (fonte: Wikipdia Consult. Dez. 2007)
Aplicao Utilizao de tcnicas informticas para resolver um problema de aplicao, que conduz normalmente ao desenvolvimento ou utilizao de programas de aplicao como, por exemplo, folhas de clculo ou processadores de texto. Nota: O termo aplicao informtica muitas vezes tomado no sentido de programa de aplicao. (fonte: Glossrio da sociedade da informao - Verso 2007)
Programa concebido como ferramenta auxiliar para o desempenho de uma determinada tarefa, como processamento de texto, a contabilidade ou a gesto de inventrios (fonte: Dicionrio prtico de informtica - McGraw Hill)
Administrador - Funo responsvel pela execuo rotineira da poltica de gesto de documentos de arquivos numa organizao (fonte: MoReq)
Arquivo Digital Consiste numa organizao de pessoas e sistemas, que aceitou a responsabilidade de preservar informao e torn-la disponvel para uma dada comunidade. (fonte: OAIS adapt.)
Autenticidade Um documento de arquivo autntico aquele do qual se que pode provar a) ser aquilo que pretende ser, b) ter sido produzido ou enviado pelo alegado produtor ou remetente, e c) ter sido produzido ou enviado no alegado momento de produo ou envio. Para assegurar a autenticidade dos documentos de arquivo, as organizaes devem implementar e documentar polticas e procedimentos de controlo da produo, recepo, transmisso, manuteno e destino dos mesmos, assegurando que quem produz documentos est devidamente autorizado e identificado e que os documentos esto protegidos contra qualquer aco no autorizada (adicionar, apagar ou alterar informao, uso no autorizado ou imposio de restries de acesso indevidas). (fonte: NP 4438-1, p. 14.) Backup Cpia de um programa, disco ou dados, destinada a ser arquivada ou a salvaguardar ficheiros valiosos, caso os originais sejam destrudos (fonte Dicionrio prtico de informtica - McGraw Hill)
83
Anexo E - Glossrio/Conceitos
Classificao: identificao sistemtica e organizao de actividades e/ou documentos de arquivo em classes, de acordo com converses logicamente estruturadas, mtodos e regras representados num sistema de classificao. (fonte: NP 4438-1, p. 9)
Cdigo fonte conjunto de palavras escritas de forma ordenada, contendo instrues numa das linguagens de programao existentes no mercado, de maneira lgica. Entende-se como o cdigo base de um programa de computador, implementando o ncleo de funcionalidade do programa.
Complexidade - quando um documento integra diversas componentes digitais (por exemplo as paginas Web)
Conservao a longo prazo: Acto de manter a informao numa forma independente e acessvel a longo prazo (fonte: OAIS adapt.)
Consumidor papel das pessoas ou sistemas clientes, que interagem com servios do arquivo digital, com o fim de pesquisar informao preservada de interesse e acederem a essa informao de forma detalhada. Isto poder incluir pessoas ou sistemas de arquivos digitais internos ou de outros arquivos digitais.
Cpia de segurana incremental Cpias de seguranas de dados armazenados e/ou alterados posteriormente cpia de segurana inicial. Documento de arquivo electrnico (DAE) Documento de arquivo produzido, transmitido e conservado, em forma electrnica Documento Electrnico (DE) Documento produzido ou recebido, e fixo para armazenamento e manipulao num sistema informtico, e que requer a utilizao do sistema para ser inteligvel pelos humanos (fonte Interpares 2, glossary adapt.)
Documentos estruturados contm informao de forma a ser interpretada primariamente por aplicaes informticas (Ex: registos de sistemas contabilsticos, registos de dados de controlo de trfego areo, etc.) Documentos no estruturados apresentam a informao de forma a ser inteligvel primariamente por humanos (Ex: cartas, memorandos, mensagens de correio electrnico, imagens, fotocpias, imagens digitalizadas, registos udio e/ou vdeo.
84
Anexo E - Glossrio/Conceitos
Documento Vital que asseguram a continuidade do negcio em caso de acidente ou catstrofe (fonte: NP 4438-2 p.21) Documento de que a instituio depende em absoluto para a prossecuo das suas funes. Ou seja, caso se verificasse um acidente que destrusse esses documentos, o organismo ver-seia impedido de prosseguir com eficcia a sua actividade. Em ambiente electrnico, toda a documentao tcnica relativa s caractersticas do sistema de informao instalado e ao seu desempenho, assim como toda a metainformao descritiva na tramitao documental, ter de ser considerada vital, pois caso se verifique quebra do sistema ela ter papel fundamental para que se proceda ao processo de recuperao. (fonte: Manual de Gesto de Documentos)
Em linha (Online) Normalmente o tipo de armazenamento de dados mais acessvel, que pode iniciar o restauro em milissegundos. Um exemplo disso um disco rgido interno ou um conjunto de discos rgidos (ligados a uma SAN). Este tipo de armazenamento muito conveniente e rpido, mas relativamente caro. Por outro lado, sofre de alguma vulnerabilidade, pois os dados podem ser apagados ou alterados, seja por acidente ou por vrus que elimine dados.
Embebido Caracterstica de algo com identidade prpria (que pode existir autonomamente), que faz parte ou est includo dentro de um conjunto, que tambm pode ser uma entidade. Ex: um OD que est embebido noutro OD (imagem embebida num documento de texto)
Emulao Reproduo do comportamento e resultados de um material digital obsoleto atravs do desenvolvimento de novo hardware e/ou software para permitir a execuo da antiga aplicao de software em computadores no futuro (fonte Interpares 2, glossary)
Emulador Software capaz de reproduzir o comportamento de uma plataforma de hardware e/ou software numa outra que partida seria incompatvel. (fonte: Manual de Preservao)
Encapsulamento Preservar, juntamente com o objecto digital, a informao necessria e suficiente para permitir o futuro desenvolvimento de conversores, visualizadores ou emuladores. Esta informao poder consistir, por exemplo, numa descrio formal e detalhada do formato do objecto preservado. (fonte: Introduo preservao digital)
Encriptao converso de dados para um cdigo secreto ( ou de texto linear em texto cifrado) para transmisso numa rede pblica (fonte Interpares 2, glossary, adapt.) Processo de execuo de uma transformao complexa de um objecto digital de modo a que este no possa ser apresentado por uma aplicao de uma forma legvel ou inteligvel, a no ser que a transformao correspondente de descriptografia seja aplicada.
85
Anexo E - Glossrio/Conceitos
(fonte: Moreq)
Escalabilidade caracterstica do sistema ou equipamento que pode crescer em escala, isto , que possibilita incrementos de capacidade ou funcionalidades acompanhando as necessidades dos usurios (aumento da capacidade de armazenamento do sistema atravs da substituio ou instalao de novos discos rgidos; verses mais actuais do formato PDF que permitem a incluso de informao de dados CAD). (fonte: Wikipdia Consult. Dez. 2007)
Ethernet Arquitectura de redes locais que suporta um trfego de alto dbito. Nota: A Ethernet um padro usual de rede local. (fonte: Wikipdia Consult. Dez. 2007) Ficheiro Coleco completa de informaes com uma designao, como seja um programa, um conjunto de dados utilizados por um programa ou um documento criado pelo utilizador. O ficheiro constitui a unidade de armazenamento bsica que permite ao computador distinguir um conjunto de informaes de outro. uma unidade coerente que o utilizador pode obter, alterar, eliminar, guardar ou enviar para um dispositivo de sada (fonte Dicionrio prtico de informtica - McGraw Hill)
Ficheiro linear ficheiros cuja informao passvel de ser transferida integralmente para formato analgico.
Fora de Linha (Off-line) - Similar ao perto de linha, embora necessite de interveno humana para disponibilizar as unidades de suporte. Isto pode incluir simplesmente o armazenamento das tapes de cpias de segurana nas estantes. O tempo de acesso deste suporte superior a uma hora.
Formato Em geral, designa a estrutura ou aspecto de uma unidade de dados. 2) Disposio de dados num ficheiro que normalmente permite que o documento seja lido ou alterado por uma determinada aplicao. (fonte: Dicionrio prtico de informtica - McGraw Hill) Organizao sequencial de dados em termos dos seus componentes. (fonte: OAIS)
Formato proprietrio - formatos de ficheiros com patente ou copyright (fonte: Wikipdia Consult. Dez. 2007)
Formato normalizado Formatos cujas definies e caractersticas esto especificadas numa norma, ou consensualmente utilizado pela comunidade ciberntica, (fonte: Wikipdia Consult. Dez. 2007)
86
Anexo E - Glossrio/Conceitos
Formato aberto - Formato com especificaes pblicas para armazenamento, geralmente mantido por organizaes de normas no proprietrias e de uso livre de restries legais. (fonte: Wikipdia Consult. Dez. 2007)
Horizonte de obsolescncia Prazo contado a partir da data de produo de um objecto digital a partir do qual, no se verificando aces de preservao, a possibilidade deste se tornar obsoleto incrementa numa escala geomtrica. (fonte: Wikipdia Consult. Dez. 2007)
Integridade A integridade de um documento de arquivo refere-se a este permanecer completo e inalterado. necessrio que os documentos sejam protegidos contra alteraes no autorizadas. As polticas de gesto de documentos de arquivo devem especificar que tipo de adies ou anotaes podem ser feitas a um documento depois da sua produo, em que circunstncias essas alteraes podem ser autorizadas, e quem est autorizado a faz-las. Qualquer alterao autorizada a um documento de arquivo deve ser explicitamente indicada e reconhecvel enquanto tal. (fonte: NP 4438-1, p. 15) Latncia (em ingls lag) refere-se ao atrasos que se podem verificar na comunicao entre computadores (internet, por exemplo) e comunicaes via satlite. Em computao, lag referese ao tempo que um pacote de dados leva a completar um percurso de ida e volta entre um computador local e o seu destino. (fonte: Wikipdia Consult. Dez. 2007)
Metainformao (no contexto da gesto de documentos de arquivo) Informao estruturada ou semiestruturada que permite a produo, gesto e utilizao de documentos de arquivo ao longo do tempo, assim como nos e atravs dos domnios em que so produzidos. (fonte: Wikipdia Consult. Dez. 2007) Migrao - Processo de transferncia de um documento de arquivo de um sistema ou suporte de armazenamento para outro, de forma a assegurar a continua acessibilidade medida que o sistema ou suporte onde se encontrava de degrada ou se torna obsoleto. Mirror Procedimento de proteco de dados e de acesso aos mesmos nos equipamentos informticos. Este sistema implementa-se na tecnologia de RAID 1. Consiste basicamente em ter 2 discos rgidos ligados. Um o principal e o outro guarda uma cpia exacta do principal armazenando qualquer alterao que se faa em tempo real. Desta forma consegue ter-se 2 discos rgidos idnticos e que permite, se tudo estiver bem configurado, que perante a falha do disco principal, o segundo assuma a sua funo impedindo a quebra do sistema e a perca de dados armazenados (fonte: Wikipdia Consult. Dez. 2007)
87
Anexo E - Glossrio/Conceitos
NFS (Network File System), um modelo de sistema de ficheiros, que tem como funo centralizar ficheiros num servidor, formando assim uma pasta virtual. utilizado para sistemas de ficheiros distribudos numa rede de computadores de rea local. Possibilita que diferentes sistemas ligados a uma mesma rede acedam a ficheiros remotos como se fossem ficheiros locais. (fonte: Wikipdia Consult. Dez. 2007)
Objecto Digital (OD) Unidade de informao digital que inclui propriedades do objecto e poder incluir tambm mtodos de execuo de operaes no objecto. (fonte Interpares 2, glossary) Unidade discreta de informao em formato digital. (fonte RODA Relatrio Final)
Obsolescncia a perda de valor que um bem sofre em resultado do progresso tcnico ou da evoluo. (fonte: Priberam)
Pacote de aplicaes conjunto de programas de computador que tem por objectivo o desempenho de tarefas de ndole prtica, em geral ligadas ao processamento de dados, como o trabalho em escritrio ou empresarial. A sua natureza diferente da de outros tipos de software, como sistemas operativos e ferramentas a eles ligadas, jogos e outros softwares ldicos, entre outros. (Microsoft Office, Open Office) (fonte: Wikipdia Consult. Dez. 2007)
Perto de Linha (Near-line) - Normalmente trata-se de um tipo de armazenamento de dados menos acessvel, mas mais barato, do que o armazenamento em linha, sendo til para o armazenamento de dados de rplicas (cpias de segurana). Um exemplo disso um conjunto de tapes com tempos de restauro que vo desde segundos at alguns minutos. Normalmente est associado a um aparelho mecnico que move as unidades de suporte do local de armazenamento para o dispositivo de leitura e/ou gravao de dados. (fonte: Wikipdia Consult. Dez. 2007)
Prazo de reteno Perodo, previamente estabelecido para a permanncia dos documentos junto da actividade produtora, antes do seu destino final. (Dicionrio de Terminologia Arquivstica, adapt.)
Plano de classificao - Documento que regista o sistema de classes concebido para a organizao de um arquivo corrente e as respectivas notas de aplicao, nomeadamente quanto ao mbito das classes e ordenao das unidades arquivsticas abrangidas por cada uma, de modo a determinar toda a estrutura de um arquivo. (fonte: Manual para a Gesto de Documentos)
88
Anexo E - Glossrio/Conceitos
Plano de Preservao Digital - documento estratgico contendo polticas, procedimentos e prticas/actividades para a constituio de uma estrutura tcnica e organizacional que permita preservar de forma continuada Objectos Digitais.
Plataforma 1) Tecnologia de base de um sistema de computador. Dado que os computadores so dispositivos em camadas, compostos por uma camada de hardware a nvel dos chips, por uma camada de controladores de hardware e de sistema operativo e por uma camada de aplicao, a camada mais baixa de um computador normalmente designada por plataforma 2) Na utilizao quotidiana, o tipo de computador ou sistema operativo a ser utilizado (Dicionrio prtico de informtica - McGraw Hill) Preservao digital Conjunto de actividades ou processos responsveis por garantir o acesso continuado e a longo-prazo informao e restante patrimnio cultural existente em formatos digitais. (fonte: Introduo preservao digital) Conjunto de actividades desenvolvidas com o fim de aumentar a vida til dos OD, salvaguardando a utilizao operacional, e proteg-los das falhas de suportes, perda fsica e obsolescncia tecnolgica; Conjunto de actividades que promovem a acessibilidade aos contedos; Conjunto de actividades que assistem na preservao do contedo intelectual, forma, estilo, aparncia e funcionalidade.
RAID (Redundant Array of Independent Drives ou Disks) Conjunto Redundante de Discos Independentes, um meio de se criar uma unidade virtual de armazenamento composta por vrios discos individuais, com a finalidade de aumentar a segurana e desempenho atravs de redundncia. (fonte: Wikipdia Consult. Dez. 2007)
Rplica ver backup. Repositrio local centralizado onde se armazena e mantm informao digital, habitualmente bases de dados ou ficheiros informticos. (fonte: Wikipdia Consult. Dez. 2007)
Restauro do sistema Recuperao dos dados do sistema, atravs das cpias de segurana.
Srie documental Unidade arquivstica constituda por um conjunto de documentos simples ou compostos a que, originariamente, foi dada uma ordenao sequencial, de acordo com um sistema de recuperao da informao. Em princpio, os documentos de cada srie devero
89
Anexo E - Glossrio/Conceitos
corresponder ao exerccio de uma mesma funo ou actividade, dentro de uma mesma rea de actuao. (fonte: Manual para a Gesto de Documentos)
Sistema aberto - Sistema informtico concebido com uma arquitectura tal que permita a juno de componentes de hardware e/ou de software provenientes de diversos fornecedores. (Fonte Glossrio da sociedade da informao verso 7)
Sistema de armazenamento Dispositivo ou conjunto de dispositivos utilizados para armazenar primariamente os dados e a informao produzida.
Sistema operativo programa ou um conjunto de programas cuja funo servir de interface entre um computador e o utilizador. (Windows, Linux; MacOS) Software de base de um computador destinado a controlar a execuo de programas, a comunicao entre dispositivos e programas, assegurando as operaes de entrada-sada, a atribuio de recursos aos diferentes processos, o acesso s bibliotecas de programas e aos ficheiros, assim como a compatibilidade dos trabalhos. Nota: O sistema operativo o software mais importante a correr num computador. (fonte: Glossrio da sociedade da informao - Verso 2007)
SMB (Server Message Block) opera como um protocolo de comunicao de rede utilizado. (fonte: Wikipdia Consult. Dez. 2007)
Software livre - segundo a definio criada pela Free Software Foundation, qualquer programa de computador que pode ser usado, copiado, estudado, modificado e redistribudo sem nenhuma restrio. A liberdade de tais directrizes central ao conceito, o qual se ope ao conceito de software proprietrio, mas no ao software que vendido almejando lucro (software comercial). A maneira usual de distribuio de software livre anexar a este uma licena de software livre, e tornar o cdigo fonte do programa disponvel. O software livre tambm conhecido pelo acrnimo FLOSS (do ingls Free/Libre Open Source Software). (fonte: Wikipdia Consult. Dez. 2007)
Suporte Material adequado ao registo de informao. Exemplos de suportes electrnicos: CD, DVD, tape, Discos rgidos). (fonte: Manual para a Gesto de Documentos)
Tabela de seleco Instrumento que regista o resultado da avaliao, apresentando-se como uma relao dos documentos de arquivo de um organismo ou administrao que fixa os respectivos prazos de conservao em fase activa e semi-activa e destino final. (fonte: Manual para a Gesto de Documentos)
Unidade binria: - (em ingls BInary uniT, ou bit), unidade de medida de transmisso de dados usada na Computao e na Teoria da Informao.
90
Anexo E - Glossrio/Conceitos
Usabilidade significa que um documento utilizvel ou seja, que pode ser localizado, recuperado, apresentado e interpretado. (fonte: NP 4438-1 p.15)
USB Sigla de universal serial bus (bus srie universal). Bus srie com uma largura de banda de 1.5 Mbps, utilizado para ligar perifricos (modems, impressoras, ratos, teclados, ) a um microcomputador. (Dicionrio prtico de informtica - McGraw Hill)
Virtualizao de armazenamento (Storage Virtualization) processo de abstraco de armazenamento lgico a partir do armazenamento fsico. Este conceito utilizado actualmente para descrever esta abstraco em qualquer camada no conjunto de software e hardware de armazenamento. (fonte: Wikipdia Consult. Dez. 2007)
91