Vous êtes sur la page 1sur 91

Recomendaes para a produo de

PLANOS DE PRESERVAO DIGITAL

Lisboa, 25 de Maro de 2008

Ficha tcnica MIP Ttulo: Recomendaes para a produo de Planos de Preservao Digital Autor: Francisco Barbedo coordenador Autor: Glria Santos Autor: Lus Corujo Autor: Mrio SantAna Id. Classificao: 260.01.02/DSIPE 25 PPD Descritores: Preservao Digital, Planos de Preservao Digital, Documentos de Arquivo Electrnico, Colaborador: Cmara Municipal de Lisboa Colaborador: INFARMED I.P Colaborador: Instituto de Segurana Social, I.P. Data/Hora: 2008-03-25 Formato de dados: Texto, PDF Estatuto de utilizao: Acesso pblico Relao: verso 1.0 DGARQ, 2008

0 Introduo ...................................................................................................................................................4 0.1 A necessidade de um Plano de Preservao Digital (PPD) ............................................4 0.2 Estado da situao ............................................................................................................................5 0.3 Preservao digital ...........................................................................................................................5 0.4 O Plano de Preservao Digital ..................................................................................................6 0.5 Objectivos e destinatrios deste documento ........................................................................7 0.6 Estrutura e contedo do documento .......................................................................................7 1 Elaborao de um Plano de Preservao Digital.......................................................................10 1.1 Pr-requisitos ...................................................................................................................................10 1.2 Metodologia para a elaborao do PPD ................................................................................13 1.2.1 Caracterizao dos sistemas de informao e identificao dos requisitos dos documentos de arquivo electrnicos ................................................................................15 1.2.2 Planeamento da estratgia de preservao ..................................................................17 2 Implementao do Plano de Preservao Digital .....................................................................23 2.1 Teste da soluo proposta...........................................................................................................23 2.2 Produo de cpias de segurana ............................................................................................23 2.3 Aplicao da Estratgia de Preservao ................................................................................23 2.4 Medidas de monitorizao e auditorias internas ...............................................................24 2.5. Afectao de recursos ..................................................................................................................24 3 Ameaas ......................................................................................................................................................25 3.1 Obsolescncia de formatos e software...................................................................................25 3.2 Obsolescncia do hardware e suportes .................................................................................26 3.3 Elementos que afectam os suportes .......................................................................................27 4 Caracterizao de formatos e aplicaes .......................................................................................28 4.1 Formatos ............................................................................................................................................28 4.1.1 Identificao de formatos alternativos normalizados..............................................32 4.2 Aplicaes ..........................................................................................................................................33 5 Sistemas de armazenamento ..............................................................................................................35 5.1 Atributos desejveis .......................................................................................................................35 5.2 Arquitecturas Possveis ................................................................................................................36 5.2.1 Critrios para avaliao de solues de armazenamento ......................................38 5.3 Cpias de segurana ......................................................................................................................39 5.3.1 Gesto do repositrio de dados ........................................................................................41 6 Metainformao .......................................................................................................................................43 7 Estratgias de Preservao mais comuns......................................................................................48 7.1 Preservao de tecnologia ...........................................................................................................48 7.2 Emulao ............................................................................................................................................48 7.3 Monitorizao de suportes e formatos ...................................................................................49 7.4 Encapsulamento ..............................................................................................................................49 7.5 Transposio de Formatos e Suportes (Migrao e transferncia de suporte) ....49 8 Concluso ...................................................................................................................................................52 Anexos .............................................................................................................................................................53 A Lista de requisitos para a prtica de preservao digital..................................................54 B Questionrio ........................................................................................................................................58 C Exemplo de um ficheiro PREMIS contendo MI tcnica NISO Z39.87......................72 D Recursos Aconselhados..................................................................................................................75 E Glossrio................................................................................................................................................83

Plano de Preservao Digital V1.0 2008-03-25

0. Introduo

0 Introduo
Conceito Ao longo deste documento sero utilizados os termos documento de arquivo electrnico (DAE) e objecto digital (OD). Estes termos representam duas realidades relacionadas. O DAE a entidade lgica que possui contedo, contexto e estrutura de forma a ter um significado especfico. O OD a componente fsica do DAE, normalmente equivalente a ficheiros. Um DAE sempre composto por, pelo menos, um OD, podendo ser composto por vrios OD. Por exemplo, um relatrio em formato <.doc> pode ser composto por um ficheiro de texto, um ficheiro de imagem e um ficheiro tabular, estando todos integrados para a representao completa do documento. A mesma situao se aplica a documentos estruturados como bases de dados (simples ou de suporte a sistemas de informao complexos) ou ainda documentos multimdia. Em termos prticos apenas se consegue preservar um documento de arquivo electrnico se forem realizadas aces sobre as suas componentes, ou seja, os OD.

0.1 A necessidade de um Plano de Preservao Digital (PPD)


As tecnologias de informao so, actualmente, o principal suporte para a produo e armazenamento de informao. As actividades organizacionais so, em graus de menor ou maior intensidade, mediadas tecnologicamente. Informao de diversos tipos, seja ela de apoio deciso, operacional, probatria, ou qualquer outra, produzida e mantida electronicamente estando portanto dependente de um sistema intermedirio composto pelo software e hardware que contriburam para a sua criao e, naturalmente, indispensveis para recuperar e utilizar essa informao. A rpida taxa de obsolescncia tecnolgica, inerente indstria informtica, levanta problemas crticos de preservao de informao operacionalmente indispensvel organizao. No entanto, a tarefa de preservao digital est longe de ser simples ou isenta de custos. A experincia constatada no terreno, pela DGARQ, identificou cenrios prevalecentes em que a informao produzida com carcter de utilizao imediata sem serem consideradas necessidades operacionais sobre essa mesma informao a mdio ou longo prazo. O resultado desta atitude resulta na perda, muitas vezes irreversvel, de informao com consequncias mais ou menos dramticas para a instituio que a perdeu. A produo do presente documento visa dar uma linha de orientao para as organizaes que produzam e dependam, em maior ou menor percentagem, de informao criada e mantida electronicamente. Essa orientao servir para tomar medidas que possam garantir as condies materiais mnimas para preservar informao digital, durante o perodo pelo qual a organizao dela necessite. No considerada, neste documento, a circunstncia em que um produtor deseje criar um arquivo digital, orientado para a preservao de objectos digitais (OD) de conservao permanente e acessvel a utilizadores externos organizao. Neste caso muitos outros requisitos sero necessrios bem como recursos humanos e materiais indispensveis para gerir esse tipo de funo. Neste caso, a metodologia aconselhada a de proceder a transferncias desses objectos para um arquivo digital especializado nessa funo. Actualmente a DGARQ encontra-se a desenvolver um sistema desta natureza o RODA (Repositrio de Objectos Digitais Autnticos) - que se prev estar apto a entrar em explorao a partir de Janeiro de 2009.

Plano de Preservao Digital V1.0 2008-03-25

0. Introduo

0.2 Estado da situao


As novas tecnologias digitais permitem novas possibilidades que, trazendo consigo benefcios e problemas, tornam os objectos delas resultantes complicados de gerir, particularmente se considerarmos perodos prolongados de tempo. Alguns exemplos: O mesmo documento ou formato de documento pode ser representado em diferentes suportes para diferentes finalidades, obrigando distino entre formato e suporte; Diferentes suportes podem ser utilizados em diferentes fases de criao/captura, armazenamento, acesso, distribuio e uso do documento, podendo os documentos ser codificados de maneiras completamente diferentes em cada uma destas fases; A separao entre formato e suporte e o tratamento separado de cada uma das fases do documento, permite uma estruturao mais livre dos documentos sem constrangimentos inerentes ao suporte papel; Os contedos originalmente digitais podem representar material de leitura, som, vdeo, fotografias, artes grficas, radiografias, jogos, registos, dados e outros; A qualidade da cpia digital permanece, em tudo, idntica, independentemente do nmero de cpias sucessivas realizadas; A transposio para papel no aplicvel por ocasionar perda de informao significativa que comprometeria decisivamente a sua utilidade e inteligibilidade 1.

O mercado informtico no oferece solues orientadas para a preservao digital, embora haja bastantes aplicaes vocacionadas para gesto de documentos electrnicos. Tais ferramentas permitem apenas gerir eficazmente funcionalidades de gesto de documentos, tais como produo, circulao ou armazenamento, no sendo previstas capacidades conducentes preservao dos documentos ao longo de perodos de tempo prolongados. No entanto as organizaes necessitam, sob o ponto de vista operacional, da informao produzida digitalmente durante perodos mais ou menos prolongados, consoante a natureza da informao e a perenidade do seu valor administrativo, legal ou de qualquer outra natureza. Neste cenrio a preservao que, em ambiente papel, normalmente confiada a instituies especializadas, torna-se um problema premente das organizaes produtoras. fundamental que estas sejam capazes de gerir a sua informao digital de forma a mant-la utilizvel e garantir os propsitos operacionais da organizao. O presente documento pretende contribuir para esse propsito.

0.3 Preservao digital


A preservao digital, considerada no contexto deste documento, assume trs vectores: 1. Conjunto de actividades desenvolvidas com o fim de aumentar a vida til dos DAE, salvaguardando a utilizao operacional e protegendo-os das falhas de suportes, perda fsica e obsolescncia tecnolgica; 2. Conjunto de actividades que promovem a acessibilidade continuada aos contedos;

Exemplos tpicos desta situao so por exemplo, bases de dados ou documentos multimdia

Plano de Preservao Digital V1.0 2008-03-25

0. Introduo

3. Conjunto de actividades que assistem na preservao do contedo intelectual, forma, estilo, aparncia e funcionalidade.

Assim sendo, para maximizar as perspectivas da preservao de OD a longo prazo, devem ser aplicadas medidas de preservao logo que possvel, ou seja, preferencialmente enquanto os OD so/esto ainda acessveis e ainda na fase de produo. Quanto mais rpida a instituio integrar a preservao digital no seu plano de aco (e oramento!), definir e implementar solues apropriadas, maior a probabilidade de sucesso na preservao dos OD. Pretende-se pois que a organizao possua um documento estratgico que determine, partida, quais os procedimentos a realizar para evitar obsolescncia tecnolgica e a consequente probabilidade de perder informao. Os organismos so encorajados a serem proactivos na prossecuo das suas estratgias de preservao digital e na definio e implementao dessas medidas, antes que a sua informao digital se torne obsoleta e consequentemente inutilizvel. Na realidade as medidas de preservao so normalmente tomadas reactivamente quando o so de todo como resposta a situaes emergentes de constatao de perda de informao necessria, quando tais medidas deveriam ser planeadas e implementadas como parte de uma soluo de preservao digital a longo prazo.

0.4 O Plano de Preservao Digital


Um Plano de Preservao Digital: 1. um documento estratgico que 2. contm polticas e procedimentos orientados 3. para a constituio de uma estrutura tcnica e organizacional que 4. permita preservar de forma continuada documentos de arquivo electrnicos (DAE) atravs de 5. aces realizadas sobre os objectos digitais (OD) que os compem. Destina-se a garantir que os DAE sejam conservados de forma legvel e acessvel, mantendo simultaneamente as suas propriedades de autenticidade e integridade durante tanto tempo quanto a organizao deles necessitar. O Plano de Preservao Digital permitir identificar quais as funcionalidades que devem ser implementadas e a forma de as implementar, para manter a integridade e usabilidade dos documentos de arquivo electrnicos ao longo do tempo. O desenvolvimento de um Plano de Preservao Digital e a seleco das estratgias apropriadas, deve ser o resultado de um esforo de colaborao entre as unidades orgnicas referentes ao arquivo (gesto documental) e informtica (tecnologias da informao), com a participao de todas as unidades orgnicas afectadas pelo processo ou que produzam informao electrnica. Trata-se de um processo directamente ligado a prticas de gesto documental, como adiante ser explicado.

Plano de Preservao Digital V1.0 2008-03-25

0. Introduo

AVISO A preservao digital implica custos significativos que devem ser analisados e previstos pela Organizao atravs do reforo oramental, considerado adequado situao diagnosticada aquando da elaborao do Plano de Preservao Digital.

0.5 Objectivos e destinatrios deste documento


Estas recomendaes para a elaborao de planos de preservao digital destinam-se a ser utilizadas por qualquer organismo que: Produza documentao/informao documentao de cariz arquivstico); em formato electrnico (especificamente

Mantenha em formato electrnico essa informao; Tenha reconhecidas necessidades de utilizao operacional dessa informao que excedam sete anos de longevidade; Pretenda produzir um documento de planeamento que lhe permita determinar procedimentos de forma a reunir as condies materiais necessrias a preservar de facto essa informao.

0.6 Estrutura e contedo do documento

Este documento composto por nove captulos, conforme o esquema que abaixo se apresenta. Salienta-se que, no incio de cada captulo, foi introduzido um resumo do contedo do mesmo.

A Introduo (Cap. 0) e a Concluso (Cap. 8) destinam-se a contextualizar e evidenciar as problemticas relativas a elaborao de Planos de Preservao Digital.

Entre os Cap. 1 e 2 existe uma relao cronolgica sequencial, enquanto que os Cap. 3 a 7 contm informao de suporte ao Cap. 1.

Finalmente, os Anexos contm instrumentos de apoio aos Cap. 1, 2 e 4.

Plano de Preservao Digital V1.0 2008-03-25

0. Introduo

Plano de Preservao Digital V1.0 2008-03-25

(pgina intencionalmente deixada em branco)

Plano de Preservao Digital V1.0 2008-03-25

1. Elaborao de um Plano de Preservao Digital

1 Elaborao de um Plano de Preservao Digital


Este captulo encontra-se dividido em dois grandes pontos: O primeiro destina-se a apresentar e explicar os pr-requisitos considerados como basilares para uma organizao que pretenda proceder elaborao de um PPD, nomeadamente, o plano de classificao e a tabela de seleco. O segundo desenvolve as etapas e actividades da metodologia para a elaborao do PPD: A avaliao do desempenho do sistema de arquivo e dos documentos electrnicos que o integram, atravs do levantamento e anlise dessa mesma informao. Com vista a agilizar a recolha de dados, so fornecidos em anexo os instrumentos necessrios. Planeamento da estratgia de preservao, a qual tem como finalidade a escolha da melhor soluo de preservao para o organismo e a consequente produo do PPD. Referem-se factores a considerar ao nvel da definio de estratgias de preservao e formatos de preservao, bem como da escolha de aplicaes informticas, solues de armazenamento e metainformao.

1.1 Pr-requisitos
Consideram-se como instrumentos estruturantes de base elaborao de um PPD: O plano de classificao e A tabela de seleco. A classificao destina-se a organizar a informao de acordo com critrios pr-determinados (funcionais, orgnicos, etc.) de forma a compartiment-la para sobre ela realizar de forma eficiente algum tipo de trabalho. A existncia de um sistema de classificao essencial para a organizao da informao. O plano de classificao (um tipo de sistema classificativo) permite optimizar a aplicao de um PPD, na medida em que se apresenta como uma ferramenta de gesto de documentos de arquivo que visa, nomeadamente:
Plano de classificao: Elemento estruturante do sistema de arquivo de qualquer organismo, na medida em que se apresenta como um conjunto de regras claramente definidas que promovem a organizao dos documentos de arquivo.
Fonte: Manual para a gesto de documentos, p. 2-5.

Perceber as relaes entre os documentos; Assegurar a continuidade da nomenclatura dos documentos ao longo do tempo; Facilitar a recuperao dos documentos relativos a uma funo ou a uma actividade; Definir os nveis de proteco e de acesso a diferentes conjuntos documentais.

O plano de classificao deve ser funcional, reflectir as actividades da organizao da qual deriva e resultar da anlise das suas funes/actividades. Constitui a base

Para informaes adicionais sobre sistemas de classificao, consultar: SIADE caderno 2: Recomendaes para a Gesto de Documentos de Arquivo Electrnicos (MOREQ) Manual para gesto de documentos Norma Portuguesa NP4438 partes 1 e 2

Plano de Preservao Digital V1.0 2008-03-25

10

1. Elaborao de um Plano de Preservao Digital

crtica para a organizao e recuperao dos documentos.

O sistema de classificao funcional tem por base as funes atribudas a uma instituio para dar cumprimento aos fins para os quais foi criada, s actividades levadas a cabo no desempenho de cada funo e s aces que as concretizam. Assim, a classificao dever reflectir as funes/actividades da organizao.

Considerando que o sistema de classificao funcional no est dependente das alteraes orgnicas que ocorrem nas instituies, consegue-se uma vantajosa estabilidade organizativa dos documentos produzidos.

De acordo com a NP 4438-2 2, os sistemas de classificao permitem:

Organizar, descrever e relacionar entre si os seus documentos; Relacionar e partilhar documentos de reas diferentes, dentro da organizao ou com entidades externas; Melhorar o acesso, a recuperao, a utilizao e a disseminao dos seus documentos.

A estrutura de um sistema de classificao funcional hierrquica, sendo que:

O primeiro nvel representa as funes, O segundo as actividades que constituem a funo O terceiro e subsequentes nveis so refinamentos das actividades ou grupo de transaces que decorrem no mbito de cada actividade.

A tabela de seleco uma ferramenta Tabela de seleco: crucial na elaborao de um PPD, Regista o resultado do processo de avaliao porque permite determinar os documental e fixa, para os conjuntos de documentos adequados prazos de reteno e aces identificados (sries), os respectivos prazos de de eliminao ou de transferncia de conservao administrativa e destino final. documentos. Desta forma torna-se possvel circunscrever os DAE a serem abrangidos pelo PPD, i.e., aqueles cujo prazo de conservao, segundo a referida tabela, seja superior a sete anos. Salienta-se que qualquer tabela de seleco que carea de aprovao da DGARQ, ao abrigo do Decreto-Lei 447/88, de 10 de Dezembro, e que inclua documentos de arquivo electrnicos implica a elaborao de um PPD desde que se verifiquem cumulativamente as seguintes circunstncias: 1. O prazo de conservao previsto seja superior a sete anos,.

INSTITUTO PORTUGUS DA QUALIDADE - NP 4438-2, Informao e documentao. Gesto de documentos de arquivo. Parte 2: Recomendaes de aplicao. Lisboa: Instituto Portugus da Qualidade, 2005, p.17

Plano de Preservao Digital V1.0 2008-03-25

11

1. Elaborao de um Plano de Preservao Digital

2. O destino final seja de conservao permanente, ou conservao permanente parcial Considerando que as actividades relativas preservao de OD so dispendiosas, pois implicam a mobilizao de recursos materiais e humanos especializados, assim como a afectao de tempo para as concretizar, a rigorosa aplicao da tabela de seleco assume bvias vantagens organizativas e oramentais. A criticidade de um documento sob o ponto de vista probatrio e a sua longevidade, (i.e., o tempo de vida operacional considerado como necessrio pela organizao para a manuteno do documento no seu sistema de arquivo), so variveis independentes que no se alteram de forma directamente proporcional.

Exemplo: Uma factura tem um elevado nvel de criticidade ou relevncia operacional que dura apenas um curto perodo de tempo. Um contrato, no entanto, pode ter um grau de criticidade probatria menos elevado mas bastante mais prolongado no tempo (pelo menos durante o perodo de vigncia da transaco veiculada no contrato).

Em termos de preservao digital este aspecto adquire especial relevncia. De facto se tiver sido avaliada a informao produzida na organizao sob o ponto de vista de relevncia operacional e longevidade necessria, podemos facilmente determinar sobre que classes de informao ou sobre que sistemas de informao deveremos prever aces de preservao digital.

Exemplo 1: Uma base de dados contm informao sobre execuo oramental. Essa informao de acordo com a Lei tem um prazo de conservao que atinge os dez anos, podendo a partir da ser eliminada. Neste caso no se justifica investir tempo e recursos para preservar essa informao pois de qualquer forma poder ser eliminada aps 10 anos de vigncia. Exemplo 2 Um sistema de web conference atravs do qual se processam reunies distncia envolvendo diversos servios deslocalizados de uma organizao. Neste contexto as gravaes realizadas equivalem s actas e por esse motivo devero ser objecto de conservao permanente. Neste caso necessrio prever medidas de preservao digital que permitam a manuteno desta informao.

muito pouco provvel que, no que toca a documentos electrnicos, haja uma longevidade nica, isto , um nico e idntico perodo temporal durante o qual til guardar a informao. Assim, apenas interessa planear e empreender aces de preservao sobre as classes ou sistemas de informao cuja necessidade de utilizao operacional exceda um determinado perodo de tempo, a partir do qual os formatos em que a informao foi produzida se comeam a tornar obsoletos Chamaremos a essa barreira temporal o horizonte de obsolescncia de um determinado OD. O horizonte de obsolescncia estimado em sete anos, pelo que toda a informao digital cujo prazo de vida operacional no exceda este perodo de tempo no dever ser abrangida pelo PPD. Note-se que este perodo no rgido reportando-se ao prazo de retrocompatibilidade normalmente assegurado pelas empresas vendedoras, pelo que pode ser alterado consoante a realidade especfica de cada organizao. Por exemplo, os sistemas de informao que suportam a actividade contabilstica contm informao cujo prazo de vida til esperado de 10 anos pelo que, apesar de ultrapassar o prazo sugerido, pode no ser necessrio considerar estes sistemas para serem objecto de aces de preservao. 12

Plano de Preservao Digital V1.0 2008-03-25

1. Elaborao de um Plano de Preservao Digital

Salienta-se que os dois requisitos acima descritos so parte integrante da Lista de requisitos para a prtica de preservao digital (Anexo A).

1.2 Metodologia para a elaborao do PPD


Apresenta-se, de seguida, a descrio grfica do processo de elaborao de um PPD, sob a forma de diagrama de actividades, contemplando os actores intervenientes e todas as actividades que o compem. De referir que a sequncia apresentada para as actividades 9 a 13 apenas uma sugesto, podendo a sua ordem ser alterada.

Legenda:
# 1 2 3 4 5 6 Smbolo Actividade. Fluxo ou sentido do processo (diagrama de actividades). Nota: indica observaes gerais que completam o sentido de elementos. Incio do processo. Fim do processo (pode haver mais que um). Transio (unio): indica a juno de mltiplas actividades. Descrio

Plano de Preservao Digital V1.0 2008-03-25

13

1. Elaborao de um Plano de Preservao Digital

Plano de Preservao Digital V1.0 2008-03-25

14

1. Elaborao de um Plano de Preservao Digital

1.2.1 Caracterizao dos sistemas de informao e identificao dos requisitos dos documentos de arquivo electrnicos
Nesta etapa pretende-se caracterizar e avaliar o desempenho do sistema de arquivo e dos documentos electrnicos que o integram.
Documentos de Arquivo Electrnicos: So documentos de arquivo produzidos, transmitidos e conservada em forma electrnica.

Os sistemas de arquivo produzem ou armazenam informao, transaccional ou analtica, directamente relacionada com as actividades desempenhadas pela organizao. Neste sentido o seu desempenho ter impacto nos processos a utilizar para preservar essa informao.

Um sistema de informao adquire e gere informao(es) necessria(s) para: A conduo das actividades da organizao; A percepo das necessidades e expectativas dos clientes internos e externos; Solidificar posies num ambiente competitivo; Apoiar as actividades dos actores organizacionais; Adaptar a organizao envolvente (diminuir a incerteza e a complexidade).

O desenvolvimento de um PPD implica a anlise da informao de arquivo electrnica, produzida pela organizao, e que obedece ao seguinte conjunto de propriedades: Ser produzida na rede organizacional; Ser considerada como propriedade institucional; Ter um prazo de conservao superior a sete anos, de acordo com a respectiva tabela de seleco (horizonte de obsolescncia); Possuir reconhecida importncia (vital) de acordo com tabela de seleco, anlise de risco e criticidade de sistemas para o organismo. Isto significa que nem todos os documentos electrnicos produzidos na organizao devero ser objecto de anlise para a elaborao do PPD. Na organizao existem, certamente, centenas de documentos produzidos a ttulo individual, como documentos pessoais de trabalho, que no foram comunicados e que nessa qualidade no tm representatividade institucional. Da mesma forma h, muitas vezes, pequenas aplicaes desenvolvidas a ttulo pessoal pelos colaboradores para os auxiliar nas suas actividades e que podem no ter expresso institucional, ou seja, no constiturem para todos os efeitos documentos de arquivo. O conhecimento do sistema uma fase essencial no processo, pois permite aferir a situao real no que respeita existncia de condies viveis para assegurar a preservao dos DAE, registando os pontos fortes e fracos da organizao no que respeita a preservao digital e indicando quais as reas a desenvolver para implementar o PPD. Para tal dever ser realizado o levantamento e anlise dessa mesma informao, tendo por base o questionrio que se apresenta no anexo B, o qual contempla duas vertentes: A) Anlise e caracterizao do sistema de gesto documental e suas funcionalidades. Nesta fase pretende-se apreender as caractersticas do sistema em vigor na organizao relativamente a um conjunto de funcionalidades relevantes para a organizao e para a segurana da informao: Controlo e segurana; Armazenamento;

Plano de Preservao Digital V1.0 2008-03-25

15

1. Elaborao de um Plano de Preservao Digital

Funes administrativas; Encriptao; Desempenho e escalabilidade; Contratao de servios externos; Conservao a longo prazo; Metainformao.

B) Anlise das sries documentais ou actividades suportadas pelas mesmas (nos seguintes casos: inexistncia de Plano de Classificao, de Tabela de Seleco ou qualquer outra identificao das sries documentais). Trata-se de particularizar dentro do sistema, caracterizado na parte anterior, as sries documentais existentes em que sejam produzidos documentos de arquivo electrnicos e avaliar quais os elementos do sistema que se lhes aplicam.

Conceito: necessrio, ainda, explicar o que se entende, neste contexto, por srie documental e qual a sua relao com OD. Uma srie documental (independentemente do suporte) um conjunto de documentos que obedecem a idntica competncia funcional e tipolgica. Neste contexto pode tratar-se de um: Sistema de informao que suporte uma determinada actividade; Conjunto de sistemas de informao que suporte a mesma funo ou actividade, ou ainda Conjunto de documentos electrnicos no estruturados (por exemplo documentos de texto e mensagens de correio electrnico que faam parte de um processo administrativo).

Alguns conceitos arquivsticos que nos so habituais e raramente suscitam dvidas podem tornar-se confusos quando passamos do papel para o digital. Por exemplo, um sistema de bases de dados transaccional produz informao de arquivo, na medida em que os dados contidos esto vinculados a transaces especficas. Qual a identificao arquivstica que corresponde a esta entidade informacional? Uma srie? Um documento composto? Dito de outro modo, podemos interrogar-nos sobre a equivalncia de um sistema de informao relativamente a entidades conceptuais arquivsticas tradicionais. No entanto pode-se apontar semelhanas nos dois universos. Em digital uma base de dados corresponde ao nvel de sries quando se refere a dados de carcter organizacional, funcional ou administrativo. Os ficheiros que a constituem so descritos ao nvel do documento que pode ser composto ou simples. Tomando como exemplo o SRH (Sistema de gesto de Recursos Humanos) teramos: Srie: Sistema de gesto de Recursos Humanos Documento composto1: act_admg.sql Documento composto 2: pr-m002-02288.txt Etc. Neste caso o sistema de informao como um todo consiste na srie documental. Este sistema composto fisicamente por unidades fsicas ficheiros que equivalem individual ou de forma agregada a documentos simples ou compostos. (No caso apresentado, cada ficheiro equivale a um documento)

Plano de Preservao Digital V1.0 2008-03-25

16

1. Elaborao de um Plano de Preservao Digital

Repare-se que um ficheiro pode no equivaler a um documento. A cardinalidade pode variar da seguinte forma: 1 (documento) 1..n (ficheiros)

Para o efeito de preservao digital essencial identificar estes dois nveis de existncia, embora apenas nos casos em que se justifique a preocupao em preservar estes objectos digitais (ver p.12). A relao entre estes dois nveis apresenta uma cardinalidade 1:n com uma associao do tipo agregao. Ou seja, as partes (documentos/ficheiros) fazem parte do todo (srie/base de dados) e aquelas podem existir mesmo se o elemento agregador desaparecer. Com efeito os ficheiros podem ser reutilizados noutra base de dados.

Salienta-se ainda que para efeitos de preservao a unidade atmica o ficheiro mesmo que este isoladamente no corresponda a uma unidade de descrio documento.

A observao de diversos sistemas organizacionais permite afirmar que nem sempre todas as caractersticas de um sistema de informao se aplicam a todos dos OD produzidos. Efectivamente, a deciso desta escolha depende, muitas vezes, de factores como: A criticidade atribuda informao; A irrelevncia, por vezes injustificada, atribuda a outro tipo de DAE (por exemplo stios web); O desconhecimento de que determinados OD so de facto produzidos na organizao ou onde estes, efectivamente, se encontram.

A parte B do inqurito incide sobre as seguintes questes: Identificao do produtor; Referenciao da srie; Controlo e segurana; Avaliao; Assinaturas digitais;

A anlise e tratamento dos dados do questionrio permitir obter uma descrio das caractersticas do sistema, bem como a informao necessria sobre os documentos de arquivo electrnicos que se pretendem preservar no mbito do PPD.

1.2.2 Planeamento da estratgia de preservao


O planeamento da estratgia de preservao tem como finalidade a escolha da melhor soluo de preservao para o organismo e a consequente produo do documento Plano de Preservao Digital, por forma a assegurar a integridade e funcionalidade continuadas dos

Plano de Preservao Digital V1.0 2008-03-25

17

1. Elaborao de um Plano de Preservao Digital

documentos de arquivo electrnicos e dos objectos digitais constituintes. Esse planeamento deve ser feito com base na informao reunida anteriormente e comporta:

Os procedimentos que devem ser realizados pelo organismo sobre as diversas classes de informao identificadas (ver Cap. 7); A definio de formatos para preservao para cada uma das classes de informao caracterizadas (ver Cap. 4.1); A seriao fundamentada de solues de software alternativas para um determinado formato (ver Cap. 4.2); A seleco e utilizao de solues de armazenamento adequadas a preservao digital (ver Cap. 5); Os esquemas de metainformao que devem ser utilizados (ver Cap. 6).

No planeamento da estratgia de preservao as instituies devem ter em conta, os seguintes factores:

Os processos de preservao requerem a utilizao de normas reconhecidas, nomeadamente de normas para gesto de documentos (Ex: NP 4438).

Custos de implementao e custos de manuteno para as medidas de preservao; Complexidade tcnica da abordagem escolhida e a capacidade da organizao para suportar essa abordagem ao longo do tempo (tcnica e financeiramente); Compatibilidade com o software e hardware existentes; Impacto nos processos de negcio (ex.: se a abordagem escolhida obriga a alteraes das prticas de trabalho); Eficcia e robustez da abordagem na proteco da integridade, acessibilidade e funcionalidade dos documentos de arquivo electrnicos ao longo do tempo.

Naturalmente a intensidade das medidas de preservao a empreender devem estar directamente relacionadas com o grau de criticidade atribuda aos objectos digitais, assim como a anlise de risco que deve ser efectuada.

1.2.2.1 Definio de estratgias de preservao


A definio da estratgia de preservao implica a identificao, anlise, caracterizao e adequao de procedimentos para a salvaguarda de informao digital, de acordo com a informao reunida e as decises tomadas anteriormente. Estas vo definir a especificidade da estratgia (ou conjunto de estratgias) de preservao que o organismo ir assumir e materializar no PPD.

Os elementos a identificar e recolher para a definio da estratgia de preservao so os seguintes:

Plano de Preservao Digital V1.0 2008-03-25

18

1. Elaborao de um Plano de Preservao Digital

As caractersticas dos ficheiros (que descrevem a experincia visual e contextual dos utilizadores ao lidar com os OD) ao nvel de:

Forma (aparncia); Contedo; Estrutura; Comportamento.

Ficheiro de base de dados Forma: dependente do formulrio ou relatrio; Contedo: dados colocados via formulrio; Estrutura: tabular; Comportamento: actualizao de data e hora (caso esteja assim definido nas caractersticas).

Deve-se, ainda, ter em conta a discriminao das caractersticas especficas que um determinado formato possa ter. Por exemplo a profundidade de cor, resoluo de imagem, tipos de interactividade, possibilidade de utilizao de macros, e metainformao embebida;

As caractersticas tcnicas dos documentos de arquivo electrnicos (que incluem o contexto, o suporte de armazenamento, relaes existentes com outros documentos de arquivo, e a metainformao que lhes est associada ou atribuda pela organizao);

Contexto: Justificao de faltas; Suporte de armazenamento: servidor; Relaes existentes com outros documentos de arquivo: inclui informao contida na base de dados do teleponto; faz parte do processo individual do funcionrio. Metainformao: Assunto, Data, Colaborador, Data da Falta, Justificao, Despacho.

Os factores inerentes aos documentos de arquivo electrnicos que iro influenciar opes a incluir no PPD por exemplo:
Usabilidade: significa que um documento utilizvel ou seja, que pode ser localizado, recuperado, apresentado e interpretado. Escalabilidade: caracterstica de um sistema ou equipamento que pode crescer em escala, isto , que possibilita incrementos de capacidade ou funcionalidades acompanhando as necessidades dos utilizadores (aumento da capacidade de armazenamento do sistema atravs da substituio ou instalao de novos discos rgidos; verses mais actuais do formato PDF que permitem a incluso de informao de dados CAD). Complexidade: significa que um documento integra diversas componentes digitais (por exemplo as pginas Web).

A usabilidade; A complexidade; A escalabilidade;

Os custos, tanto com recursos humanos como materiais, tm uma importncia elevada na escolha das solues de preservao. importante, nesta fase, empreender uma anlise custo/benefcio que compare os diversos cenrios de preservao digital adequados informao que identificada e avaliada em funo das seguintes variveis em parte j referidas neste documento:

Plano de Preservao Digital V1.0 2008-03-25

19

1. Elaborao de um Plano de Preservao Digital

Criticidade dos OD, i.e., a sua importncia para o desempenho das actividades da organizao; Longevidade operacional, ou seja, qual o tempo de vida operacional atribudo ao objecto digital; Risco aceitvel pela organizao, ou seja, a avaliao pela organizao do grau de risco aceitvel de perda ou obsolescncia dos OD; Nvel de formalizao dos DAE produzidos (ignorar DAE produzidos a ttulo individual, por ex.). Tal anlise deve ter em conta os custos correspondentes, de forma a obter uma soluo valorizada, de acordo com as variveis referidas. Aconselha-se ainda a criao e adopo de regras e procedimentos, de forma a ajudar a normalizar a aplicao das tcnicas escolhidas por todos os sistemas da instituio. Uma abordagem mais especfica das estratgias encontra-se no Cap. 7.

1.2.2.2 Definio de formatos de preservao


A escolha do formato de Pretende-se que um dos resultados do PPD seja a preservao deve ser feita antes da produo de uma tabela que relacione a cada um dos criao do OD que se pretende formatos utilizado na Organizao, um ou mais formatos preservar evitando-se, deste modo, de preservao definidos para o efeito. custos adicionais na sua converso para o formato final. A utilizao de formatos normalizados e bem documentados de aplicaes com especificaes abertas permitem garantir uma continuidade de utilizao mais estvel e prolongada, quando comparados com os formatos e as aplicaes proprietrios (ver Cap. 3.1). Apresenta-se uma lista de categorias de formatos no Cap. 4.1.

1.2.2.3 Escolha de aplicaes informticas


A escolha do sistema aplicacional da organizao dever ter em conta, como um dos critrios de escolha, as vantagens que a aplicao oferece para a estabilizao e normalizao da informao produzida atravs dela. Dependendo da informao recolhida no mbito do captulo anterior (caracterizao dos sistemas de informao e identificao dos requisitos dos documentos de arquivo electrnico).

Poder ser necessrio proceder aquisio de software, caso o existente no d resposta s medidas previstas no PPD; Poder ser necessrio proceder adaptao, alterao ou substituio de software utilizado no Organismo, de acordo com o indicado no PPD; Devero constar, no PPD, orientaes que sirvam de base a futuras aquisies de software.

Em todos estes casos h que ter em considerao o conjunto de estratgias de preservao e os formatos definidos anteriormente, bem como a verificao da existncia, no mercado, de solues compatveis com essas estratgias e formatos. Caso estas no existam ou no sejam

Plano de Preservao Digital V1.0 2008-03-25

20

1. Elaborao de um Plano de Preservao Digital

satisfatrias, a opo passa por se investir no desenvolvimento de solues especficas, ou empreender aces de congelamento dos OD produzidos nesse formato at ao aparecimento de uma soluo vivel.

Neste ltimo caso aconselha-se a utilizao, sempre que possvel, de aplicaes informticas com especificaes abertas, no proprietrias e bem documentadas, pelas razes indicadas no Cap. 3.1. Estas devem permitir executar todas as operaes necessrias definidas no mbito do PPD, ser robustas, fceis de utilizar e conter uma interface intuitiva.

Identificamos as tipologias de aplicaes de software quanto sua origem no Cap. 4.2.

1.2.2.4 Escolha de solues de armazenamento


O sistema de armazenamento utilizado de importncia crtica para a preservao digital. com efeito imprescindvel que este obedea a caractersticas que assegurem a persistncia e segurana dos objectos digitais a preservar. ainda preciso notar que o grande volume de informao digital normalmente produzida exige elevada capacidade de armazenamento acompanhada dos imprescindveis mecanismos de segurana (entre os quais o backup se conta). A escolha da soluo de armazenamento deve considerar os recursos e as infraestruturas de apoio existentes, de forma a avaliar: A sua adequao a necessidades de preservao digital; Quais as necessidades de aquisio de sistemas de armazenamento adequados (no caso da resposta ao quesito anterior ser negativa); Os custos com necessidades de armazenamento de informao a mdio/longo prazo. Uma opo que se venha a revelar menos adequada, poder ter como resultado indesejvel obrigar a uma inflexo de todo o planeamento elaborado. Uma anlise mais aprofundada sobre as solues de armazenamento aconselhadas encontra-se no Cap. 5.

1.2.2.5 Escolha de Metainformao


A metainformao tem tambm um papel primordial na preservao digital, visto que ser esta que permitir uma melhor gesto dos:

Objectos Digitais; Sistemas de informao (por exemplo registo de correspondncia, Sistemas de informao geogrficos); Utilizadores; Funcionalidades a disponibilizar.
Por exemplo o sistema de registo de documentos utiliza metainformao, os servios de Tecnologias da Informao e Comunicao (TIC), utilizam-na igualmente quando guardam rotinas de auditoria que registam o comportamento dos sistemas e os acessos aos mesmos.

A metainformao normalmente utilizada dentro da organizao seja de forma implcita ou explcita com diversos propsitos e por diferentes reas funcionais. Basicamente pretende-se referenciar ou descrever outra informao de forma a ser mais fcil a sua posterior recuperao ou ainda garantir a evidncia de uma determinada transaco (veja-se por exemplo a metainformao embebida no cabealho de imagens ou nos documentos de texto). Na maior parte dos casos observados no existe, todavia, uma formalizao organizacional 21

Plano de Preservao Digital V1.0 2008-03-25

1. Elaborao de um Plano de Preservao Digital

(num documento nico por exemplo) de todos os esquemas de metainformao utilizados e de quais os respectivos elementos. Prope-se assim a criao de um documento deste tipo, de forma a oficializar e disseminar a utilizao de metainformao e evitar redundncias e repeties muitas vezes verificadas. Tal documento deve adequar-se igualmente documentao analgica e documentao digital. A vantagem desta prtica reside em saber exactamente que metainformao utilizada para cada classe de informao. A utilizao de metainformao especfica de preservao digital ainda uma das componentes que deve ser integrada nesse documento.
Os processos de preservao devem estar totalmente documentados e a documentao guardada para apoio a futuros esforos de preservao. Qualquer cpia ou reformatao de dados para migrao ou converso deve ser documentada na metainformao de gesto documental.

Plano de Preservao Digital V1.0 2008-03-25

22

2. Implementao de um Plano de Preservao Digital

2 Implementao do Plano de Preservao Digital


Neste captulo procede-se abordagem da implementao do Plano de Preservao Digital, mencionando algumas recomendaes a tomar aos seguintes nveis: teste da soluo proposta; produo de cpias de segurana; aplicao da estratgia de preservao; medidas de monitorizao e auditorias internas; e afectao de recursos.

So apresentadas, de seguida, algumas recomendaes de aces a tomar na fase de implementao do PPD. Estas no pretendem ser rgidas, visto que a implementao do plano de preservao digital, ou seja, a aplicao prtica no terreno das medidas nele preconizadas, dever ser programada pela prpria instituio. Aconselha-se a utilizao de bibliografia ligada temtica de Gesto de Projecto 3, como apoio a esta fase.

A DGARQ, como entidade coordenadora do sistema nacional de arquivos, neutra quanto ao mtodo escolhido pela organizao no que concerne implementao do PPD. DGARQ importa apenas, em sede de auditoria, o resultado dessa mesma implementao. Nesse mbito, o anexo A estabelece uma lista de requisitos considerados obrigatrios para a prtica de preservao digital, a qual servir de base a uma eventual auditoria. Este facto no inviabiliza que a DGARQ fornea apoio tcnico para a construo de uma estratgia de preservao digital quando uma organizao o solicite.

2.1 Teste da soluo proposta


Antes da implementao do PPD, os procedimentos tcnicos e solues decididas a partir do processo de avaliao descrito em 1.2.2 devem ser sujeitos a testes. Estes devem ser levados a cabo pelos colaboradores do organismo sobre duplicados dos documentos de arquivo electrnicos de forma a salvaguardar os originais de quaisquer resultados indesejveis, sempre possveis em fases de teste.

2.2 Produo de cpias de segurana


Antes da interveno de implementao devem ser feitas cpias de segurana de todos os OD seleccionados para preservao. A integridade destas cpias deve ser verificada antes da sua remoo para uma rea de armazenamento segura. Estes duplicados no devem ser sujeitos a qualquer tratamento de preservao, devendo funcionar como matrizes caso os procedimentos preconizados para a estratgia de salvaguarda sejam mal sucedidos.

2.3 Aplicao da Estratgia de Preservao


Aps a finalizao desta fase e caso os resultados tenham sido satisfatrios, o tratamento de preservao deve ser estendido a todos os OD seleccionados para tal.

Por exemplo. ANSI/PMI - A Guide to the Project Management Body of Knowledge: PMOBOK Guide, 3 ed.. Pensylvannia:. Project Management Institute. 2004 .ISBN 193069945X

Plano de Preservao Digital V1.0 2008-03-25

23

2. Implementao de um Plano de Preservao Digital

2.4 Medidas de monitorizao e auditorias internas


A eficcia da aplicao do plano de preservao digital dever ser regularmente monitorizada internamente considerando o conjunto de tpicos que compem o PPD descritos em 1. Desta forma ser possvel identificar eventuais disfunes e empreender aces correctivas.
Tpicos a considerar na Monitorizao: Os procedimentos de preservao a realizar pelo organismo (ver Cap. 7); A definio de formatos para preservao; (ver ponto 3.1) A listagem de solues de software alternativas para um determinado formato (ver ponto 3.2); A seleco e utilizao de solues de armazenamento; (ver ponto 5) Esquemas de metainformao a utilizar (ver ponto 6)

Depois de sujeitos a aces de preservao, os OD devero ser reavaliados de forma a confirmar a permanncia das suas funcionalidades de acordo com os padres prdefinidos.

A integridade de toda a metainformao relevante associada aos OD deve ser verificada aps a aplicao da estratgia de preservao. A metainformao deve tambm ser actualizada, registando as ocorrncias verificadas durante o processo de preservao de forma a constituir um histrico essencial para provar a integridade do sistema ou a verificao e comprovao de eventuais disfunes.

O que monitorizar nos documentos de arquivo electrnicos preservados: Integridade; Funcionalidade; Estrutura; Contedo; Metainformao associada.

Por exemplo. Aps a migrao de um sistema de bases de dados produzido originalmente em ORACLE, para um formato em MySQL ou DBML, necessrio verificar se os dados migrados mantm a sua qualidade e se as relaes existentes entre tabelas permanecem explcitas. Aps a migrao de documentos produzidos em Word para formato PDF necessrio verificar se no houve desformatao, se as notas de p de pgina no foram apagadas, se os cabealhos permanecem, etc. Aps a migrao de documentos de udio e vdeo para formato MPEG necessrio verificar se no houve dessincronizao entre as imagens e o som com, se no existem fenmenos de arrastamento de pixels, etc. Aps migrao de publicaes Multimdia Interactivas necessrio verificar se as hiperligaes se mantm correctas, se possvel o acesso ao contedo dos ficheiros, se todos os ficheiros permanecem presentes, etc.

2.5. Afectao de recursos


essencial prever antecipadamente os recursos humanos, materiais, bem como os elementos de gesto basilares (cronograma), considerados como necessrios para assegurar o esforo de implementao do plano.

Plano de Preservao Digital V1.0 2008-03-25

24

3. Ameaas

3 Ameaas
Este captulo destina-se a explicitar o conjunto de ameaas que pesam sobre os OD, abordando a problemtica da obsolescncia dos formatos, software, hardware e suportes, assim como elementos que afectam os suportes. A especificidade dos OD implica que estes estejam sujeitos s seguintes ameaas:

Obsolescncia tecnolgica: Ocorre ao nvel de formatos e software, mas tambm do prprio hardware e suportes utilizados. Danos fsicos: Estes podem ser acidentais ou propositados, ocorrem principalmente ao nvel dos materiais que compem o hardware e os suportes, mas tambm podem ocorrer nos ficheiros (muitas vezes como consequncia dos danos de hardware e/ou dos suportes).

3.1 Obsolescncia de formatos e software


A obsolescncia de formatos e software pode ocorrer quando: Um formato de ficheiro ultrapassado por outro formato ou por uma verso mais recente que comporta mais complexidade; Um dado formato no vinga ou as empresas no criam software compatvel; Um dado formato falha, estagna, ou j no compatvel com os sistemas actuais; O software que suporta o formato falha comercialmente ou adquirido por um concorrente que o retira do mercado.

No que diz respeito ao software, este pode dividir-se em trs grupos, de acordo com o exposto no Cap. 4.2: Proprietrio com especificaes fechadas; Proprietrio com especificaes abertas; No proprietrio com especificaes abertas.

Para escolher o melhor software no mbito do planeamento da estratgia de preservao necessrio avaliar se este: Tem grande adopo; retrocompatvel; Tem suporte de metainformao (como XML); Dispe de vrias funcionalidades, sem ser muito complexo; Permite a utilizao de vrios formatos; Inclui funcionalidades de verificao de erros;

Plano de Preservao Digital V1.0 2008-03-25

25

3. Ameaas

Dispe de um ciclo de actualizaes razovel.

3.2 Obsolescncia do hardware e suportes


No mbito do hardware e dos suportes, a rpida obsolescncia uma constante, devido aos avanos tecnolgicos a nvel de: Velocidade do processador; Densidade dos chips de memria; Capacidade dos perifricos de armazenamento; Velocidade de processamento de imagem; Velocidade de transmisso.

Tais alteraes levam rpida substituio dos suportes, no s devido maior rapidez, capacidade e produtividade disponveis, mas tambm devido ao cada vez maior nmero de funes oferecidas.
As normas ISO/IEC 17799, ISO/IEC 27000 a ISO/IEC 27008 fornecem informaes, cdigos de prticas, e requisitos para auditoria e certificao de tcnicas de segurana para sistemas de gesto de informao. De referir, no entanto, que a anlise destas normas no est no mbito deste documento e que no cabe DGARQ a certificao destas tcnicas.

Elementos como: A diminuio do tamanho fsico;

O aumento da capacidade e diminuio do custo por unidade de armazenamento;

As tendncias em termos de fragilidade, estabilidade, segurana e durao antes da obsolescncia e Outras melhorias, Levam a novas e melhores aplicaes de software, que aumentam a probabilidade obsolescncia do equipamento anterior.

Assim os dispositivos necessrios para leitura do suporte de armazenamento podem deixar de ser produzidos. Os fabricantes de todas estas tecnologias competem, emergem, unem-se, ou desaparecem, tornando cada vez mais difcil a manuteno dos contedos digitais ao longo do tempo.

Cronologia: evoluo de suportes

Plano de Preservao Digital V1.0 2008-03-25

26

3. Ameaas

3.3 Elementos que afectam os suportes


Os principais elementos que afectam os suportes e, directamente, os OD que se pretendem preservar, so: A instabilidade do material; As condies ambientais de armazenamento (temperatura, humidade relativa e exposio luz); O manuseamento e utilizao (riscos em suportes pticos, dedadas, borres, sujidade, poeiras, gua e humidade, solventes orgnicos, marcadores de escrita, etiquetas adesivas); Desastres naturais (fogo, inundaes, abalos de terra); Falhas de infra-estrutura (canalizao, electricidade, sistema de controlo climatrico); Manuteno inadequada e mau funcionamento do hardware; Erro humano, sabotagem (roubo e vandalismo); Campos magnticos, raios X e microondas; Desgaste derivado da utilizao.

Plano de Preservao Digital V1.0 2008-03-25

27

4. Caracterizao de formatos e aplicaes

4 Caracterizao de formatos e aplicaes


Este captulo pretende caracterizar o conjunto de formatos e aplicaes existentes, sendo definidas: Os formatos, as suas caractersticas e propostas para estratgias de preservao; As diferentes categorias de aplicaes e suas especificaes. So igualmente apresentados conselhos relativos formatos e aplicaes a utilizar.

4.1 Formatos
Qualquer tentativa de categorizao/compartimentao de tipos de documentos electrnicos necessariamente artificial, devido ao facto de muitos conterem, em si, elementos de outras categorias. Por exemplo, so raros os documentos electrnicos de texto estruturado que no incluam actualmente tabelas ou imagens; so raros os formatos de registos de vdeo que no incluam tambm som e/ou voz. Visto que, para efeitos de definio de formatos, necessrio definir tais categorias, optou-se pela taxionomia dos tipos de documentos de arquivo electrnicos 4 baseada na definida pelos Arquivos Nacionais do Reino Unido 5. Na tabela abaixo apresentada, inclui-se uma coluna relativa categoria de formato utilizada, uma segunda coluna que descreve as principais caractersticas dessa categoria e uma terceira coluna onde se indica a estratgia de preservao recomendada.

Categoria

Caractersticas

Estratgia de Preservao Recomendada Migrao para novas plataformas. Converso de dados e estrutura para formatos normalizados. Actualmente impossvel migrar as componentes comportamentais relacionadas com motores de gesto de bases de dados, normalmente proprietrios. Migrao para novas plataformas. Converso para formatos normalizados. Refrescamento de suportes.

Informao Adicional
O Arquivo Nacional dos Pases Baixos produziu uma proposta para preservao de: Folhas de clculo <www.digitaleduurzaa mheid.nl/bibliotheek/d ocs/volatilitypermanence-spreadshen.pdf>; Bases de Dados <www.digitaleduurzaa mheid.nl/bibliotheek/d ocs/volatilitypermanence-databasesen.pdf>. O Arquivo Nacional dos Pases Baixos produziu propostas para preservao de: Documentos de texto <www.digitaleduurzaa mheid.nl/bibliotheek/

1. Dados Tabulares (Data Set)

Dados alfanumricos existente numa vasta variedade de aplicaes de processamento de dados; Dados geridos em ficheiro linear (flatfile), em rede, hierrquica; Bases de dados relacionais e orientadas a objectos.

2. Texto estruturado/ documentos do Office

Dados alfanumricos; Dados de marcao (markup); Etiquetas para outros tipos de dados (imagens vectoriais e

4 In STEPHENS, David O. Digital Preservation in the United Kingdom in THE INFORMATION MANAGEMENT, vol. 34, n. 4, Outubro 2000 5 The National Archives, http://www.nationalarchives.gov.uk/

Plano de Preservao Digital V1.0 2008-03-25

28

4. Caracterizao de formatos e aplicaes

Categoria

Caractersticas

Estratgia de Preservao Recomendada

Informao Adicional
docs/volatilitypermanence-textdocsen.pdf>; Mensagens de Correio Electrnico <www.digitaleduurzaa mheid.nl/bibliotheek/ docs/volatilitypermanence-emailen.pdf>.

mapas de bits [raster]) existentes em processadores de texto/programas para escritrio e digitalizao de documentos/sistemas aplicacionais de gesto de documentos electrnicos, bases de dados relacionais, e outros ambientes de tipos de documentos de aplicaes especficas. 3. Dados de Desenho [design data] Imagens vectoriais e de mapa de bits e dados alfanumricos em sistemas de CAD e converso orientada a objectos para bases de dados normalizadas. Retrocompatibilidade, interoperabilidade, e formatos com emulao de tecnologia como estratgia a curto prazo para dados do produto (product data) em sistemas obsoletos. Refrescamento de suportes. 4. Apresentaes Dados alfanumricos em imagens empresariais, clipart [coleco de imagens], vdeo, e multimdia de treino/ensino. Diagramas para a gesto de informaes, de conhecimento e de capital intelectual; para a compreenso e soluo de problemas. 5. Imagens Imagens de mapas de bit e dados alfanumricos existentes no software de captura/edio de imagens, bases de dados orientadas a objectos, relacionais ou simples de livrarias de fotos, coleces de digitais de belas-artes, coleces de imagens Retrocompatibilidade. Converso para formatos normalizados. Refrescamento de suportes. Retrocompatibilidade. Converso para formatos normalizados. Refrescamento de suportes.

Plano de Preservao Digital V1.0 2008-03-25

29

4. Caracterizao de formatos e aplicaes

Categoria

Caractersticas

Estratgia de Preservao Recomendada

Informao Adicional

mdicas. 6. Documentos de som e voz Dados de som em processamento de voz, bases de dados relacionais ou simples (flat) de registos udio em coleces de musica e repositrios similares. Retrocompatibilidade. Converso para formatos normalizados. Refrescamento de suportes (Esta uma rea especializada que necessita de trabalho adicional por especialistas de preservao digital). Retrocompatibilidade. Converso para formatos normalizados. Refrescamento de suportes. A tecnologia de preservao necessria em situaes a curto prazo quando os dados esto fechados em sistemas proprietrios. Retrocompatibilidade. Converso para formatos normalizados. Refrescamento de suportes. A tecnologia de preservao necessria em situaes a curto prazo quando os dados esto fechados em sistemas proprietrios. A tecnologia de preservao necessria em situaes a curto prazo quando os dados esto fechados em sistemas proprietrios at que existam normas aceites e amplamente utilizadas.
O Arquivo Nacional dos Pases Baixos aborda a problemtica da preservao de stios Web em <www.digitaleduurzaa mheid.nl/index.cfm?pa ginakeuze=374>.

7. Documentos de Vdeo

Vdeo Digital, ecr total (fullscreen)/ vdeo (em movimento) em fotogramas de vdeo digital armazenadas em ficheiros de mapas de bit e som armazenadas em bases de dados relacionais ou simples (flat) em coleces de musica e repositrios similares Imagens vectoriais e de mapa de bits e dados alfanumricos em sistemas de informao geogrfica (SIG) e software de cartografia. Dados armazenados orientada em bases de dados relacionais orientadas a objectos.

8. Dados geogrfico/cartog rficos

9. Publicaes Multimdia Interactivas

Dados de som e vdeo, imagens em movimento, imagens vectoriais e de mapa de bits e dados alfanumricos armazenados em software de criao e edio em ambientes de publicao electrnica.

Plano de Preservao Digital V1.0 2008-03-25

30

4. Caracterizao de formatos e aplicaes

Categoria

Caractersticas

Estratgia de Preservao Recomendada A tecnologia de preservao necessria em situaes a curto prazo quando os dados esto fechados em sistemas proprietrios at que existam normas aceites e amplamente utilizadas.

Informao Adicional

10. Dados Cientficos e Financeiros

Dados especficos de carcter cientfico e financeiro.

Apresentam-se, a seguir, dois exemplos que ilustram relaes possveis entre categorias que podem coexistir num mesmo formato. Importa referir que qualquer esquema que tente representar relaes entre categorias no est, nem pode estar nunca, encerrado, uma vez que a listagem de categorias existentes e as suas caractersticas distintivas nunca estaro definitivamente estabilizadas. As necessidades nesta rea nunca estaro, por definio, satisfeitas assim como as respostas a essas necessidades podem ser imprevisveis em termos de possibilidades de combinao. Assim natural que, no futuro, surjam novos formatos que, partida, no sejam passveis de categorizar na lista actual. Tal remete para a perenidade deste documento e para a necessidade constante da sua actualizao.

Exemplo 1: Documento de texto Dados Estruturados/Documentos de Office: um documento de texto pode conter, para alm do texto, Dados Tabulares (tabelas), Imagens e ainda Dados de Desenho.

Plano de Preservao Digital V1.0 2008-03-25

31

4. Caracterizao de formatos e aplicaes

Exemplo 2: Web-conference Dentro das Publicaes Multimdia Interactivas podemos incluir a Web-conference, a qual pode conter Registos de som e voz, Registos de vdeo, Apresentaes, Imagens, Texto Estruturado.

4.1.1 Identificao de formatos alternativos normalizados


A criao de documentos de arquivo electrnicos, de acordo com as necessidades operativas do organismo, obriga utilizao de uma panplia de formatos decorrentes das aplicaes de software utilizado na sua produo. Muitas vezes isso traduz-se na produo de formatos proprietrios e no normalizados, o que dificulta a sua preservao a longo prazo. Nestes casos fundamental prever quais os formatos digital.
No caso das categorias Texto estruturado/documentos do Office e Imagens a escolha facilitada pela existncia de formatos normalizados muito utilizados e que mantm o contedo informacional e a estrutura dos documentos (mais concretamente o PDF e o TIFF). Outras categorias, como Data Set, Design Data, Dados geogrficos/cartogrficos e Publicaes Multimdia Interactivas, ainda no dispem de formatos normalizados que garantam a preservao de todas as caractersticas dos OD.

normalizados a utilizar no mbito da preservao

Recomenda-se a no utilizao de formatos proprietrios para armazenamento e preservao digital a longo prazo, pelas razes indicadas nos Cap. 3.1, devendo ser necessrio identificar, partida, quais os formatos que, por serem normalizados e/ou no proprietrios e de fcil preservao a longo prazo, se podero utilizar alternativamente. Tal escolha deve assentar que o DAE se insere.

O projecto RODA definiu para as taxonomias de OD com que opera actualmente, os seguintes formatos de preservao: Texto estruturado: PDF/A (0Hwww.pdfa.org) Imagens fixas bidimensionais: TIFF (1Hhttp://partners.adobe.com/public/developer/ti ff) Bases de dados relacionais: DBML, um formato

em primeiro lugar na categoria de formatos em

preciso salientar que no existem formatos normalizados para cada uma das categorias de formatos identificados. Tal comporta riscos para a preservao desses OD que no podem ser evitados. No caso em que no haja formato alternativo e o DAE se encontra inactivo h que

Plano de Preservao Digital V1.0 2008-03-25

32

4. Caracterizao de formatos e aplicaes

manter o formato original sujeito a monitorizao regular at ser desenvolvido um formato normalizado aplicvel ao formato original em questo. Deve ser produzida uma tabela que permita definir quais os formatos de preservao que o organismo pretende utilizar.

4.2 Aplicaes
As aplicaes informticas ou software so, conceptualmente, uma sequncia de instrues a serem seguidas e/ou executadas, na manipulao, redireccionamento ou modificao de dados ou informao, e que permitem ao utilizador fazer uma ou mais tarefas especficas. Do ponto de vista tcnico, integra igualmente, no s o programa de computador propriamente dito, mas tambm manuais, especificaes, planos de teste, etc. As aplicaes fazem parte do sistema intermedirio que permite a produo, manipulao, gesto e preservao dos OD. As aplicaes que produzem os documentos podem dividir-se em trs tipos:

Proprietrio com especificaes fechadas: A cpia, redistribuio ou modificao so proibidas pelo seu criador ou distribuidor. Tais restries so conseguidas atravs de meios legais e/ou tcnicos. Os meios legais podem incluir o licenciamento de software, copyright (direitos de autor), e uso de patentes, enquanto que os meios tcnicos so caracterizados pela venda ao utilizador de binrios executveis legveis pelo hardware, ocultando ou encriptando o cdigo fonte legvel pelos humanos.

Proprietrio com especificaes abertas: Vrios produtores de software definem e utilizam especificaes ou padres para garantir a interoperabilidade entre aplicaes e plataformas. Estes padres devem estar disponveis para livre acesso e implementao, sem quaisquer royalties e outras taxas e sem discriminao de uso.

No proprietrio com especificaes abertas: Software livre, segundo a definio O software livre permite as seguintes modalidades: criada pela Free Software Gratuito (freeware): no implica no Foundation, qualquer programa de pagamento de licenas de uso ou royalties ; computador que pode ser usado, Shareware: pode ser copiado, distribudo e copiado, estudado, modificado e utilizado experimentalmente por um redistribudo sem nenhuma restrio. determinado perodo, aps o qual se deve Este tipo de software ope-se ao pagar uma taxa. conceito de software proprietrio, mas no comercializao (software comercial). A forma usual de distribuio de software livre anexar a este uma licena de software livre, e tornar o cdigo fonte do programa disponvel. Para tal muito usual a utilizao de especificaes abertas (normas) para manter a interoperabilidade de todas as distribuies originrias do mesmo cdigo fonte base.

Plano de Preservao Digital V1.0 2008-03-25

33

4. Caracterizao de formatos e aplicaes

Aconselha-se a utilizao, sempre que possvel, de aplicaes e formatos com especificaes abertas, no proprietrios e bem documentados, pelas razes indicadas no Cap. 3.1.

Esta prtica objecto da Resoluo de Conselho de Ministros 21/2002, de 31 de Janeiro. Para mais informaes sobre a promoo da utilizao de software livre na Administrao Pblica, aceda a: http://www.softwarelivre.citiap.gov.pt/

Plano de Preservao Digital V1.0 2008-03-25

34

5. Sistemas de Armazenamento

5 Sistemas de armazenamento
Este captulo destina-se abordar os sistemas de armazenamento de acordo com um conjunto de critrios que devem obedecer. Em seguida feita uma anlise comparativa das arquitecturas de armazenamento (NAS, SAN e CAS), sendo definidos critrios de avaliao das mesmas. Finalmente dada relevncia problemtica das cpias de segurana no que concerne criao de rplicas, modelos de armazenamento, tipos de gesto de repositrios de dados.

5.1 Atributos desejveis


A soluo de armazenamento deve ser distinta das rplicas de segurana (tambm designados de ficheiros de salvaguarda ou backups), abordadas no Cap.5.3. Assim, um sistema de armazenamento consiste no dispositivo ou conjunto de dispositivos utilizados para armazenar primariamente os dados e a informao produzida (dispositivos primrios). O backup destina-se a salvaguardar os dados contidos nesses dispositivos primrios. Consiste portanto numa rplica desses dados, a qual poder ser efectuada seguindo diferentes mtodos oferecendo a garantia de, em caso de perda ou corrupo dos dados primrios contidos no sistema de armazenamento, estes poderem ser recuperados atravs das cpias de backup e o sistema reposto na situao original antes da ruptura verificada. Um sistema de armazenamento uma estrutura de complexidade varivel, mas no se pode confundir com um suporte de armazenamento individualizado. Por exemplo um DVD, ou um conjunto de DVD considerados individualmente sem um sistema de organizao mecnica ou electrnica, no constitui um sistema de armazenamento na acepo deste documento, embora contenha informao. Mais frente abordar-se- os suportes considerados de forma descontextualizada do sistema de armazenamento, pelo facto de, em muitas organizaes, ainda se recorrer a esse processo para armazenar informao. normal um sistema de armazenamento incluir um sistema de cpia de segurana. Dever incluir rplicas, geogrfica e administrativamente independentes. Desta forma a soluo de armazenamento dever ter as seguintes caractersticas:
Latncia (em ingls lag): refere-se ao atrasos que se podem verificar na comunicao entre computadores (Internet, por exemplo) e comunicaes via satlite. Em computao, lag refere-se ao tempo que um pacote de dados leva a completar um percurso de ida e volta entre um computador local e o seu destino.

Estar disponvel em linha; Apresentar baixa latncia.

A combinao destes atributos permite auditorias fceis e frequentes e, ainda, reparaes rpidas. Deve suportar a introduo progressiva de novos componentes heterogneos (ex. discos rgidos de diferentes marcas), permitindo assim a escalabilidade e a existncia de um plano de sucesso facilmente implementvel. O sistema de armazenamento deve: Ter um desempenho adequado s necessidades especficas de cada organizao, de forma a evitar engarrafamentos (bloqueios e atrasos de reposta); Estar em conformidade com normas de jure;

Plano de Preservao Digital V1.0 2008-03-25

35

5. Sistemas de Armazenamento

Ser independente da plataforma aplicacional utilizada (sistema operativo e vendedor de hardware). Preferencialmente o custo inicial e de manuteno dever ser mnimo, tal como o esforo necessrio para a sua administrao.

5.2 Arquitecturas Possveis


As arquitecturas de armazenamento a longo prazo, actualmente disponveis so as seguintes:

Network Attached Storage (NAS) Storage Area Network (SAN) Content-Addressable Storage (CAS).

Estes cenrios aplicam-se a organizaes com uma forte produo de DAE que requerem, portanto, elevada capacidade de armazenamento e de resposta. No caso da organizao produzir DAE em pequena escala possvel recorrer a sistemas de Por questes que se prendem com a gesto e armazenamento com desempenho segurana, aconselha-se a utilizao de um sistema de inferior que podem, inclusivamente, armazenamento, caso o volume de documentos de incluir suportes pticos e dispositivos de arquivo electrnicos utilizados pelo organismo for armazenamento conexos. superior a 10Gb.

As NAS so dispositivos dedicados partilha de ficheiros entre diferentes clientes de rede. Permitem adicionar armazenamento na rede sem ser necessrio desligar o servidor. Podem estar ligadas em qualquer parte da rede, no integrando, porm, o servidor que faz a gesto do processamento dos dados. uma soluo barata, fcil de instalar, administrar e escalar, e baseia-se em protocolos abertos e bastante disseminados. No entanto a ligao entre servidor aplicacional e armazenamento lenta; apresenta limitaes no que respeita ao tamanho mximo de um bastidor (actualmente 16 terabytes); precisa de utilizar sistemas de virtualizao de armazenamento (storage virtualization) para suportar mltiplos sistemas de ficheiros com o objectivo de guardar os dados.

As SAN so redes projectadas para agrupar dispositivos de armazenamentos de computador. Existem duas variaes de SAN: 1. Uma rede na qual o propsito principal a transferncia de dados entre computadores e dispositivos de armazenamento. Neste caso a SAN consiste numa infra-estrutura de comunicao que dota conexes fsicas com uma camada de gesto, com o objectivo de organizar dispositivos de armazenamento, conexes e computadores, tornando a transferncia de dados mais robusta e segura; 2. Um sistema de armazenamento formado por dispositivos de armazenamento, computadores e/ou aplicaes, e todo um controlo via software, comunicando-se atravs de uma rede de computadores.

Plano de Preservao Digital V1.0 2008-03-25

36

5. Sistemas de Armazenamento

As SAN caracterizam-se por: Apresentar um bom desempenho; Ser normalmente mais dispendiosas; Ter maior exigncia de administrao (gesto de unidades lgicas e de sistemas de ficheiros); Ter reduzida interoperabilidade (o que funciona numa SAN pode no funcionar noutra); O suporte aos servidores estar dependente do sistema operativo (com as consequentes problemas de limitaes de drivers de controlos). As CAS so mecanismos para armazenamento de informao, cuja recuperao se baseia no seu contedo e no na sua localizao de armazenamento. As CAS caracterizam-se por disponibilizarem um acesso simples, sem as limitaes normais de um sistema de ficheiros ou protocolo de partilha. So fceis de instalar e administrar e tm um elevado grau de escalabilidade. No entanto so dispendiosas, pelo menos na fase inicial de aquisio, e a sua interface de programao (API) restrita e pouco disseminada.

Apresenta-se, abaixo, um quadro comparativo destes sistemas de armazenamento: Quadro comparativo de sistemas de armazenamento

NAS

SAN

CAS

Heterogeneidade

Boa

Nenhuma

Escalabilidade

Adicionando mais NAS

Upgrade

At 24 Petabytes

Desempenho

Baixo

Muito Alto

Alto

Segue normas standard

Sim

Flavours da norma standard de base

API restrita

Independncia

Completa

Parcial. S alguns sistemas operativos so suportados

Sim. Desde que implemente a API

Custo

Baixo

Alto

Muito Alto (inicial)

Administrao

Depende da virtualizao

Difcil

Muito Fcil

Plano de Preservao Digital V1.0 2008-03-25

37

5. Sistemas de Armazenamento

5.2.1 Critrios para avaliao de solues de armazenamento


So seguidamente referidas as variveis que devero ser consideradas para avaliar a soluo de armazenamento mais adequada s necessidades de preservao identificadas. Sem detrimento de outros critrios que a organizao pretenda considerar os que so a seguir enunciados so bsicos para assegurar a qualidade da preservao digital a longo prazo. Estas variveis esto organizadas nos seguintes grupos: custo, escalabilidade, interoperabilidade, segurana de dados e facilidade de programao. Compete organizao definir a ponderao a atribuir a cada uma das variveis, de forma a permitir essa avaliao. Para cada uma destas variveis deve ser atribuda uma ponderao parcial de acordo com os critrios que a organizao queira privilegiar. O conjunto de variveis por grupo dar a pontuao final desse grupo. A mdia ponderada dos quais dar uma classificao final ao sistema de armazenamento avaliado.

1. Custo Custo de instalao Manuteno e suporte/ano Prazo da garantia Custo da soluo para 1 TB Custo da soluo para 10 TB Custo da soluo para 100 TB Custo de cada n (1 n suporta vrios discos) Custo de cada unidade de controlo

2. Escalabilidade Nmero mximo de ns Nmero mximo de ns por cada unidade de controlo Capacidade mxima de cada n (nmero de discos) Limite mximo em TB de cada n

3. Interoperabilidade Suporta ns de marcas concorrentes Suporta discos de marcas concorrentes Disponibiliza interfaces de programao Suporta conectividade NFS Suporta conectividade SMB

4. Segurana de dados Suporta RAID

Plano de Preservao Digital V1.0 2008-03-25

38

5. Sistemas de Armazenamento

Suporta backups Suporta replicao remota

5. Facilidade de programao Storage Virtualization API de controlo do nmero de rplicas API de controlo dos processos de auditoria

5.3 Cpias de segurana


A capacidade de fazer rplicas de igual qualidade (digital para digital) significa que possvel, e recomendvel, armazenar cpias de OD num ambiente diferente das armazenadas para acesso frequente. Estas cpias tero a mesma qualidade da cpia ou original arquivado, e estes s sero necessrios para inspeces, para fazer novas cpias, ou para efectuar a migrao para novos formatos. As cpias digitais de arquivo devem tambm ser guardadas em locais diferentes das cpias de acesso frequente, a fim de prevenir perdas de informao por desastres, roubo ou mau manuseamento.

Assim, aconselha-se a utilizao de uma soluo fora de linha, que limite o acesso apenas quando a informao armazenada estiver corrompida.

Cpia arquivada uso limitado (backup/rplica)

Cpia de acesso frequente uso mltiplo (armazenamento)

1. Armazenar num ambiente controlado e separado, se possvel, da cpia de acesso frequente;

1. Armazenar para fcil acesso;

2. Verificar, visualmente, se o disco foi alvo de algum dano aps a utilizao; 2. Armazenar em condies ambientais recomendadas para armazenamento de arquivo.

3. Armazenar em condies ambientais similares s condies de utilizao.

Plano de Preservao Digital V1.0 2008-03-25

39

5. Sistemas de Armazenamento

O armazenamento de backups deve seguir um dos seguintes modelos:

No estruturado Este modelo pode ser constitudo apenas por um conjunto de suportes pticos gravveis, com a informao mnima sobre o que foi replicado e quando. Trata-se do modelo mais fcil de implementar mas, provavelmente, o que piores resultados obter em termos de recuperao de alto nvel.

Total+Incremental Neste caso pretende-se armazenar vrias rplicas dos OD originais da seguinte forma: 1. Em primeiro lugar feita uma cpia de segurana de todos os OD; 2. Posteriormente poder ser feito uma cpia de segurana incremental; 3. Finalmente, quando se proceder ao restauro do sistema na totalidade e at determinada data, necessria a localizao da cpia de segurana total, bem como do ponto (data) de restauro pretendido. Este modelo oferece um alto nvel de segurana, em que qualquer OD pode ser restaurado e pode ser utilizado com suportes removveis, tais como tapes e suportes pticos. O aspecto menos positivo a existncia de longas sries de incrementaes e necessidade de espao.

Total + Diferencial Difere do modelo anterior no sentido em que, aps a cpia de segurana total, cada cpia de segurana parcial deve capturar todos os OD criados ou modificados aps aquela, mesmo que j tenham sido includos na cpia de segurana parcial anterior. A vantagem que o restauro apenas obriga recuperao da cpia de segurana total e a ltima cpia de segurana parcial.

Rplica + Incremental invertido (Sincronizao) Este modelo similar ao repositrio Total + Incremental, diferindo no facto de fornecer uma rplica que reflecte o estado do sistema, aquando da ltima cpia de segurana, bem como uma lista das incrementaes invertidas. Um dos benefcios reside no facto de requer uma cpia de segurana total. Cada cpia de segurana incremental imediatamente aplicada rplica, e os OD a substituir so movidos para uma incrementao invertida, i.e., feita uma sincronizao. Este modelo no deve utilizar suportes mveis, visto que cada cpia de segurana necessita de ser efectuada por comparao com o mirror.

Proteco de dados contnua Neste modelo so registadas todas as alteraes do sistema, em vez de calendarizar cpias de segurana peridicas. Esta operao geralmente realizada atravs da gravao das diferenas a nvel de bytes ou blocos de dados, e no das diferenas a nvel de ficheiros. Este modelo difere da simples replicao de discos, uma vez que permite retornar ao estado anterior do registo e, assim, restaurar a anterior imagem de dados.

Plano de Preservao Digital V1.0 2008-03-25

40

5. Sistemas de Armazenamento

Unidades de suporte para backups mais aconselhadas: Tapes (magnticas): so um suporte de acesso sequencial, pelo que, mesmo que os tempos de acesso sejam baixos, a velocidade de escrita ou leitura contnua de dados rpida. So, desde h muito tempo, o suporte mais utilizado para armazenamento, cpias de segurana, arquivo e transmisso. Existe uma variedade de formatos, muitos dos quais proprietrios ou especficos de alguns nichos de mercado, como o caso das mainframes ou de uma marca de computadores especfica. Discos rgidos: podem ser ligados localmente atravs de interfaces SCSI, USB ou Firewire, ou atravs de tecnologias de maior distncia, tais como Ethernet (Rede), SCSI ou Canais de Fibra. As suas principais vantagens so: tempos de acesso baixos, disponibilidade, capacidade e facilidade de uso. A relao capacidade/preo dos discos rgidos tem vindo a melhorar ao longo dos anos. Cpia de Segurana Remota: so feitas atravs Internet para um local remoto e permitem proteger os dados contra alguns dos maiores perigos, como o fogo, inundaes, sismos ou detonao nuclear. medida que as ligaes de Internet de banda larga se tornam cada vez mais disseminadas, os servios de cpia de segurana remota so cada vez mais utilizados. Um dos aspectos menos positivos desta soluo, prende-se com o facto da velocidade da ligao de Internet ser normalmente mais baixa do que a velocidade de transmisso dos sistemas de armazenamento de dados locais. Este facto pode ser problemtico quando se lida com grandes volumes de dados. Adicionalmente, necessrio ter em conta os perigos associados subcontratao (outsourcing) de terceiros para armazenarem dados considerados sensveis ou pessoais. As unidades de suporte para backups menos aconselhadas so: Discos pticos: podem ser utilizados como suporte de cpias de segurana. Uma das vantagens do CD e do DVD poderem ser restaurados em qualquer mquina com um leitor. Muitos formatos de disco ptico so WORM, o que faz com que sejam tradicionalmente utilizados para arquivo, visto os dados no poderem ser alterados. Outros formatos regravveis podem tambm ser utilizados, como os CDRW ou DVD-RAM. Os novos discos HD-DVD e BluRay aumentaram de forma significativa a quantidade de dados que podem ser armazenados num nico disco ptico. No entanto preciso ter em considerao a inexistncia de estudos sobre a real perdurabilidade de suportes pticos. Disquetes: muito utilizadas durante a dcada de 80 e incios de 90 e associadas s cpias de segurana. Hoje em dia, a capacidade das disquetes tornaram esta soluo obsoleta. Dispositivos de memria: tambm conhecidos por memrias flash, Pen-drives, cartes de memria, cartes digitais, etc., estes suportes so relativamente caros em comparao com a sua baixa capacidade, mas so bastante portteis e fceis de utilizar.

5.3.1 Gesto do repositrio de dados


Independentemente do modelo de repositrio ou suporte utilizado para as cpias de segurana, necessrio estabelecer um equilbrio entre as questes de acessibilidade, segurana e custos.

Em linha (Online) Normalmente o tipo de armazenamento de dados mais acessvel, que pode iniciar o restauro em milissegundos. Um exemplo disso um disco rgido interno ou um conjunto de discos rgidos (ligados a uma SAN). Este tipo de armazenamento muito conveniente e rpido, mas relativamente caro. Por outro lado, sofre de alguma vulnerabilidade, pois os dados podem ser apagados ou alterados, seja por acidente ou por vrus que elimine dados.

Plano de Preservao Digital V1.0 2008-03-25

41

5. Sistemas de Armazenamento

Perto de Linha (Near-line) Normalmente trata-se de um tipo de armazenamento de dados menos acessvel, mas mais barato, do que o armazenamento em linha, sendo til para o armazenamento de dados de rplicas (cpias de segurana). Um exemplo disso um conjunto de tapes com tempos de restauro que vo desde segundos at alguns minutos. Normalmente est associado a um aparelho mecnico que move as unidades de suporte do local de armazenamento para o dispositivo de leitura e/ou gravao de dados. Fora de Linha (Off-line) Similar ao perto de linha, embora necessite de interveno humana para disponibilizar as unidades de suporte. Isto pode incluir simplesmente o armazenamento das tapes de cpias de segurana nas estantes. O tempo de acesso deste suporte pode ser muito demorado. Cofre-Forte (Off-site vault) Com vista proteco contra desastres naturais, algumas instituies preferem enviar os suportes de armazenamento das cpias de segurana para um cofre-forte fora de linha. O cofre pode ser simplesmente o gabinete do Administrador do sistema ou, algo to sofisticado como, um bunker de alta segurana com sistemas anti-desastre e controlo climatrico, que permitem o armazenamento de suportes de cpias de segurana.

Unidade de Cpias de Segurana/Centros de Recuperao de Dados (Backup site, Disaster Recovery Center) No caso de um desastre, os dados nos suportes de cpia de segurana no sero suficientes para a recuperao da informao. Tambm so necessrios sistemas informticos e redes bem configuradas para os dados poderem ser restaurados. Algumas organizaes tm os seus prprios centros de recuperao de dados equipados para este tipo de cenrio. De notar que, sendo estas unidades de recuperao de dados um investimento to dispendioso, raramente se utilizam as cpias de segurana como mtodo de transferncia de dados para a unidade de recuperao de dados. O procedimento mais usual a replicao de disco (disk mirroring) remota, que permite manter os dados no centro de recuperao de dados o mais actualizado possvel.

Plano de Preservao Digital V1.0 2008-03-25

42

6. Metainformao

6 Metainformao
Este captulo aborda a problemtica da necessidade de metainformao (MI) para uma correcta e vivel preservao digital. Para tal refere-se a utilizao de vrias camadas de MI, como forma de a organizar, indicando-se, para cada camada, exemplos de esquemas de MI passveis de serem utilizados. proposta uma lista de elementos de MI recomendados para a camada de MI de preservao. Finalmente, alerta-se para a utilizao de uma linguagem cuja sintaxe permita ser legvel e pesquisvel pelo ser humano e pelas mquinas. Com vista sistematizao de informao, disponibiliza-se um instrumento de apoio (anexo E) relativo definio de esquemas de MI.

A Metainformao ou metadados transversal a todos os elementos (identificados nos Cap. 4 e 5) do PPD. Na acepo mais bsica, a MI informao sobre informao, ou mais especificamente dados estruturados sobre informao capturada no sistema de arquivo. A metainformao descreve atributos do documento de arquivo electrnico dando-lhe significado, contexto e organizao, permitindo a produo, gesto e utilizao de documentos de arquivo ao longo do tempo, assim como nos, e atravs dos, domnios em que so produzidos. Note-se que existem muitos esquemas de metainformao normalizados ou no destinados a descrever aspectos temticos ou funcionalmente especializados. Por exemplo existe metainformao especfica para dados estatsticos ou para sistemas espaciais como os SIG. A metainformao pode ainda existir implicitamente embebida nos objectos digitais sendo automaticamente produzida pelas solues aplicacionais que lhes deram origem

No mbito da documentao de arquivo electrnica, a MI consiste num conjunto de elementos (atributos) associados a cada OD no momento da sua integrao no arquivo e ao longo da sua gesto. A metainformao pode ser associada no apenas a documentos individuais mas tambm a pastas, utilizadores, plano de classificao e qualquer outra entidade de um Sistema de Gesto Documental/Arquivo.

A importncia da MI neste mbito prende-se com a dependncia dos documentos electrnicos relativamente ao sistema intermedirio, sendo ento necessria para que os OD fiquem contextualizados em termos de produo, gesto e preservao. A metainformao associada aos OD permite: A referenciao nica e persistente de cada OD; A localizao e recuperao expedita de cada OD; A criao do histrico de cada OD; O registo das transformaes realizadas sobre cada OD;

Embora de uma forma geral os documentos electrnicos contenham alguma metainformao fornecida pelas aplicaes que os produzem, esta insuficiente e/ou no se encontra estruturada (organizada). Para ultrapassar esse facto dispomos de esquemas de metainformao que designam os elementos que tm de ser associados aos documentos electrnicos. Importa clarificar que no existem esquemas de MI obrigatrios, pese embora a sua utilizao se inclua no conjunto de boas prticas para a preservao digital. Visto que a MI pode ser repartida por reas, aconselhvel a utilizao de diferentes esquemas no mbito da preservao digital, que devem ser aplicados por diversas camadas: 43

Plano de Preservao Digital V1.0 2008-03-25

6. Metainformao

Metainformao Descritiva ou de Identificao: O objectivo a pesquisa, O stio Web da Library of Congress inclui a pgina recuperao e identificao. oficial do EAD: <URL:http://www.loc.gov/ead>. Pode incluir elementos como o ttulo, o assunto, autor e O RODA utiliza um modelo de dados baseado no EAD, palavras-chave. O esquema designado por EADPART, abordado em <URL: http://roda.iantt.pt/pt/system/files/rodaEAD (Encoded Archival relatorioFinal.pdf> Description) um bom exemplo, por ser um esquema muito completo e que respeita as normas de descrio arquivstica;

MI Administrativa: Fornece informao para apoio gesto do documento de arquivo electrnico, tal como quando e como foi criado, tipo de ficheiro e outra informao tcnica, e quem tem privilgios de acesso;

MI Estrutural: Relaciona hierarquicamente O stio Web da Library of Congress inclui a pgina oficial os diferentes OD que fazem do METS: <URL: http://www.loc.gov/standards/mets>. parte de um mesmo documento. O esquema O esquema METS foi escolhido no mbito do RODA, por METS (Metadata Encoding & permitir a codificao da MI relativa ao OD, nomeadamente a sua estrutura hierrquica, o seu nome e Transmition Standard) permite localizao. agrupar metainformao descritiva, administrativa e estrutural sobre objectos guardados num repositrio digital. MI Tcnica: Descreve as caractersticas tcnicas dos ficheiros e dos seus formatos, pelo que a mais especfica, por depender do formato do OD. Um exemplo deste tipo de MI o esquema baseado na norma ANSI/NISO Z39.87 - Metadata for Images in XML schema, define um conjunto normalizado de elementos de metainformao para imagens digitais; MI de preservao: Contm informao necessria para arquivar e preservar o OD. O esquema PREMIS (PREservation Metadata Implementation Strategies), produto da parceria entre a OCLC (Online Computer Library Center) e a RLG (Research Libraries Group) o mais conhecido,

O stio Web da Library of Congress inclui a pgina oficial da ANSI/NISO Z39.87: <URL:http://www.loc.gov/standards/mix> O RODA utiliza o esquema baseado na norma ANSI/NISO Z39.87 no caso das imagens digitais.

O stio Web da Library of Congress inclui a pgina oficial do PREMIS: <URL:http://www.loc.gov/standards/premis> O RODA definiu o PREMIS como o esquema MI de preservao a ser utilizado no mbito do projecto.

Plano de Preservao Digital V1.0 2008-03-25

44

6. Metainformao

Existem, adicionalmente, algumas subcamadas de tipos de metainformao, que so aqui identificadas em separado: MI de gesto de controlo e direitos: que tem a ver com os direitos de propriedade intelectual; MI de contexto de produo; MI de controlo e gesto.

O organismo deve fazer uma descrio de todos os esquemas, modelos ou elementos de MI utilizados ou que lhes interesse utilizar, considerados suficientes. Para tal deve produzir uma tabela que contenha essa informao. preciso ter em conta que, no contexto da preservao digital, existem elementos de MI que devem ser considerados obrigatrios. Para tal, avanada, no quadro abaixo, uma proposta que especifica os elementos recomendados, retirados do esquema PREMIS 6. A primeira coluna indica o sujeito do conjunto dos atributos; a coluna ID apresenta o nmero do atributo de acordo com a ordenao existente no dicionrio de dados do PREMIS; a coluna atributo identifica as unidades semnticas; a coluna Descrio estabelece o mbito dos atributos.

O Esquema PREMIS est disponvel em http://www.oclc.org/research/projects/pmwg/

Plano de Preservao Digital V1.0 2008-03-25

45

6. Metainformao

Id. 1 1.1 1.2 2

Atributo (semantic unit) {objectIdentifier} objectIdentifierType objectIdentifierValue preservationLevel

Descrio Uma designao para identificar de forma unvoca um objecto num arquivo digital. O valor do identificador do objecto. Um valor a indicar o conjunto de funcionalidades de preservao a aplicar ao objecto. Pode ser adequado consoante aquilo que se pretende que o OD assegure. A categoria de objecto a que a MI aplicvel. A profundidade de MI aplicvel, de acordo com o elemento 2. As propriedades tcnicas de um ficheiro ou bitstream Indicao sobre se o OD est sujeito a uma ou mais operaes de descodificao ou decomposio. No caso do OD estar comprimido ou agregado a outros OD e ser necessrio isollo. Organizao de um ficheiro ou bitstream em que se entende por formato a organizao da informao digital de acordo com condies pr-definidas. Registar o formato para cada ficheiro que compem o OD. Designao do formato do ficheiro ou bitstream. Informao sobre como e onde o OD armazenado no Arquivo Digital. Esquema de utilizao utilizado (os meios para aceder localizao). A referncia localizao do contedo. O suporte fsico em que o objecto est armazenado. Uma designao para identificar de forma nica um evento decorrido dentro do Arquivo Digital. Designao para o domnio em que o Identificador do evento nico (ex. sistema de armazenamento, integrao, monitorizao, etc. ou um identificador nico sequencial para todo o Arquivo Digital). Valor do identificador. Categorizao da natureza do evento (de acordo com as funcionalidades asseguradas pelo Arquivo Digital e que devem constar de uma lista de autoridade). A data ou intervalo de datas em que o evento decorreu. A designao usada para identificar de forma nica um actor dentro de um sistema de arquivo digital. Designao do domnio em que o id do actor nico. Valor do id do actor. As aces permitidas pelo depositante ao AD. Aco que o AD pode empreender. Data de incio do acordo. Data em que termina o acordo.

3 4 4.1 Objecto

objectCategory {objectCharacteristics} compositionLevel

4.4

{format}

4.4.1.1 7 7.1.1 7.1.2 7.2 14 14.1 Evento

formatName {storage} contentLocationType contentLocationValue storageMedium {eventIdentifier} eventIdentifierType

14.2 15

eventIdentifierValue eventType

16 21 Actor 21.1 21.2 28 Direitos 28.1 28.3.1 28.3.2

eventDateTime {agentIdentifier} agentIdentifierType agentIdentifierValue {permissionGranted} act startDate endDate

A metainformao estruturada deve basear-se numa sintaxe que facilite a pesquisa e a identificao por parte tanto do utilizador como da mquina. A sintaxe mais utilizada na actualidade o XML (eXtensible Markup Language), desenvolvida pelo W3C (World Wide

O Arquivo Nacional da Holanda produziu um Digital Preservation Testbed White Paper sobre o XML <www.digitaleduurzaamheid.nl/bibliothee k/docs/white-paper_xml-en.pdf>

Plano de Preservao Digital V1.0 2008-03-25

46

6. Metainformao

Web Consortium), uma forma estendida de HTML que permite a definio localizada de etiquetas e a troca facilitada de informao. Actualmente, existem cada vez mais ferramentas para XML, e esta linguagem tem assumido um papel cada vez mais crucial na troca de uma variedade de dados na Web. Apresentamos um exemplo da utilizao do XML no Anexo C.

Plano de Preservao Digital V1.0 2008-03-25

47

7. Estratgias de Preservao mais comuns

7 Estratgias de Preservao mais comuns


Este captulo identifica as estratgias de preservao mais utilizadas, a saber, preservao de tecnologia, emulao, monitorizao de suportes e formatos, encapsulamento e a migrao e transferncia de suportes. Neste mbito, so referidas as caractersticas, bem como os aspectos positivos e negativos de cada uma destas estratgias.

A seleco da(s) estratgia(s) de preservao apropriada(s) deve ser, como j foi referido, o resultado de um esforo de colaborao entre as unidades orgnicas referentes ao arquivo e informtica, com a participao de todas as unidades orgnicas afectadas pelo processo ou que produzam documentos de arquivo electrnicos. Apresenta-se, seguidamente, o conjunto das estratgias de preservao mais comummente utilizadas, elencando caractersticas, vantagens e desvantagens de cada uma delas. As estratgias apresentadas podem ser utilizadas a curto, mdio e longo prazo, cabendo entidade produtora definir a sua calendarizao e utilizao no seu PPD

7.1 Preservao de tecnologia


A preservao de tecnologia implica a conservao e manuteno de todo o hardware e software necessrios correcta apresentao dos OD. Neste mbito, o foco da preservao concentra-se, no no objecto conceptual, mas sim na preservao do objecto digital na sua forma original.

A preservao de tecnologia apresenta algumas desvantagens, nomeadamente:

O facto de qualquer plataforma tecnolgica acabar por se tornar obsoleta; A existncia de dificuldades na gesto do espao fsico; A manuteno e custos de operao; O facto do acesso informao estar limitado a alguns locais fsicos do globo e com condicionalismos acrescidos ao nvel da reutilizao da informao.

7.2 Emulao
A emulao corresponde utilizao de um software - o emulador - capaz de reproduzir o comportamento de uma plataforma de hardware e/ou software, numa outra plataforma que, partida, seria incompatvel.
Tipos de emulao possveis: Emulao de aplicaes informticas (ex: Lotus 123); Emulao de sistemas operativos (ex: emulador de MS Windows para Linux); Emulao de plataformas de hardware (ex: emulador de ZX Spectrum para PC). Jeff Rothenberg, defensor da emulao, prope um modelo terico passvel de emular plataformas actuais em computadores futuros, atravs da conservao do objecto digital juntamente com o software necessrio sua execuo/apresentao e na criao de uma especificao escrita numa linguagem independente da plataforma de hardware que suporta a execuo desse software. www.clir.org/pubs/reports/rothenberg/pub77.pdf

As principais vantagens da emulao incluem o facto de preservar, de forma fiel, as caractersticas e as funcionalidades

Plano de Preservao Digital V1.0 2008-03-25

48

7. Estratgias de Preservao mais comuns

do objecto digital original e, embora se centre na preservao do objecto lgico no seu formato original, no sofre de alguns dos problemas da estratgia de preservao de tecnologia (Ex.: envelhecimento do hardware).

T. Hendley defende que a emulao apenas deveria ser utilizada em situaes em que haja interesse em preservar o ambiente tecnolgico original ou quando no possvel converter os OD para formatos actuais. David Bearman considera que a emulao pretende conservar o objecto errado, i.e., as funcionalidades dos sistemas de informao em vez dos DAE, pois so estes ltimos que tm valor evidencial, atravs do seu contedo, estrutura e contexto.

No entanto, o emulador pode tornar-se obsoleto e a sua utilizao pressupe que os utilizadores do futuro sejam capazes de operar adequadamente aplicaes e sistemas operativos h muito desaparecidos (Ex.: O Arquivo Nacional dos Pases Baixos produziu um Digital num futuro prximo ser difcil Preservation Testbed White Paper sobre a Emulao < conceber que os utilizadores www.digitaleduurzaamheid.nl/bibliotheek/docs/white_paper_e estejam aptos a enfrentar as mulatie_EN.pdf> particularidades do sistema operativo MS-DOS).

7.3 Monitorizao de suportes e formatos


A monitorizao prev processos de verificao automtica, manual e semi-automtica dos OD, sendo as duas ltimas opes mais realistas por razes de custos. As preocupaes da monitorizao prendem-se com as seguintes questes: Tempo de vida estimado dos suportes; Tempo mdio de prevalncia de uma verso de aplicao informtica (3 anos); Retrocompatibilidade assegurada pelos fabricantes (em mdia 3 verses anteriores).

7.4 Encapsulamento
O encapsulamento consiste em preservar, juntamente com o objecto digital, toda a informao necessria e suficiente para permitir o futuro desenvolvimento de conversores, visualizadores ou emuladores (por exemplo, a descrio formal e detalhada do formato do objecto preservado). O encapsulamento est orientado a objectos que apenas sero acedidos num futuro longnquo. Permite adiar a responsabilidade de preservao, e o desenvolvimento futuro de visualizadores, migradores ou emuladores. No entanto, preciso estar ciente que objectos complexos possuem especificaes complexas e que uma especificao incompleta poder ter um efeito desastroso para a preservao do OD.

7.5 Transposio de Formatos e Suportes (Migrao e transferncia de suporte)


A transposio de formatos e suportes refere-se transferncia de documentos contidos num determinado suporte ou formato para outro suporte ou formato mais actualizado. o processo responsvel pela reorganizao dos elementos de informao que constituem um OD. Centrase, sobretudo, na preservao do seu contedo intelectual, ou seja, na preservao do objecto conceptual e na verificao frequente da integridade dos suportes fsicos.

Plano de Preservao Digital V1.0 2008-03-25

49

7. Estratgias de Preservao mais comuns

O principal objectivo evitar a obsolescncia tecnolgica, mantendo os OD compatveis com tecnologias actuais, de forma a permitir a sua interpretao sem necessidade de recorrer a artefactos menos convencionais. A transposio prev processos de: Refrescamento a nvel de suportes (exemplo: O Arquivo Nacional dos Pases Baixos produziu um Digital de Disquete para CD-R Preservation Testbed White Paper sobre a Migrao ou de CD-R para DVD<www.digitaleduurzaamheid.nl/bibliotheek/docs/Migration.pdf> R), nos casos em que existam e sejam utilizados estes suportes (cf. Cap. 5). Processos de migrao entre formatos (exemplo: de Word 97 para Word 2000); Transposio conjunta de formatos e suportes.

Esta estratgia apresenta, no entanto, algumas desvantagens como sejam a:

Probabilidade de algumas propriedades dos OD no serem correctamente transferidas para o formato de destino adoptado; Existncia de incompatibilidades entre os formatos de origem e destino; Inadequao dos conversores; Obsolescncia de formatos.

Adicionalmente, durante a transposio de documentos para novos formatos h informao que se perde ao nvel da estrutura, da metainformao e, por vezes, do contedo.

Face a estas situaes de perda de Documentos multimdia (pginas web em informao, deve recorrer-se a estratgias que as actualizaes e modificaes so nas quais se incluem documentar frequentes). exaustivamente o processo de migrao (metainformao) para que fique claro o que se perdeu, quando e como se perdeu. Desta forma tenta-se garantir que o que se perde no compromete a autenticidade e fidedignidade do documento. Este aspecto de confirmao da perda de informao em objectos migrados foi j referida no captulo 2.

Esta questo particularmente evidente em documentos compostos e complexos como, por exemplo: Bases de dados (muitas tabelas com ligaes entre si e circulao constante de informao);

Apesar das desvantagens apresentadas, esta de longe a estratgia de preservao mais aplicada at data e a nica que tem vindo a dar provas da sua eficcia.

Existem algumas variantes no caso especfico da transferncia de formatos, a saber:

Actualizao de verses: Caracteriza-se pela actualizao dos formatos utilizando software retrocompatvel (por exemplo, a utilizao do Word 6 para actualizar um documento criado com o Word 5);

Plano de Preservao Digital V1.0 2008-03-25

50

7. Estratgias de Preservao mais comuns

Converso para formatos concorrentes: Permite ultrapassar o risco de descontinuidade de formatos, convertendo OD para formatos anlogos, independentemente da aplicao utilizada na sua criao (por exemplo, converter um documento Word para PDF);

Normalizao: Corresponde migrao para um nmero reduzido de formatos compatveis, o que poder evitar futuras complicaes a nvel de direitos de autor ou pagamento de royalties. Promove, tambm, a interoperabilidade entre sistemas distintos.

O facto de serem utilizados formatos abertos e independentes da plataforma permite que diferentes configuraes de hardware e software sejam capazes de os interpretar. Existem vrios tipos de normas:

Normas de facto: Quando o produto est firmemente estabelecido no mercado, a compatibilidade das outras aplicaes medida referenciando esse produto e as alteraes de compatibilidade dependem do proprietrio (ex: Word);

Especificaes pblicas: Quando algumas empresas lderes de mercado criam um consrcio para definir uma norma de ligao que possibilita o desenvolvimento de produtos compatveis;

Normas de jure Quando organismos oficiais promovem o consenso acerca de uma especificao, que depois se torna uma norma oficial (ex: ISO, NP, etc.)

O tempo de intervalo entre transferncias de formato est dependente da evoluo da tecnologia, bem como do facto de usarmos ou no formatos normalizados, podendo variar entre os 7 e os 10 anos.

Plano de Preservao Digital V1.0 2008-03-25

51

8. Concluso

8 Concluso
A preservao digital uma funo que no pode ser evitada. Cada vez mais as organizaes dependem, a mdio e longo prazo, de informao produzida e mantida electronicamente. Tal dependncia deve-se a motivos que se prendem com a operao da organizao, salvaguarda dos seus interesses, incrementao da transparncia administrativa e credibilidade da instituio relativamente aos seus stakeholders, entre os quais se contam o Governo e o cidado. A organizao pode ter a opo de no preservar a sua informao digital. Julgamos, no entanto, ser esse risco inaceitvel atendendo s circunstncias referidas. Embora tal implique custos que podem ser significativos, compete organizao ponderar seriamente o que tem a perder caso decida nada fazer. Este documento um primeiro passo para guiar as organizaes na tarefa de preservao digital. A DGARQ, enquanto rgo responsvel pela coordenao e execuo da poltica arquivstica nacional, posiciona-se como parte interessada nesse processo, disponibilizando o seu conhecimento na rea para auxiliar as organizaes a construir e implementar processos de preservao, sem se pretender substituir de forma alguma s responsabilidades que toda e qualquer organizao deve manter relativamente ao seu patrimnio arquivstico, independentemente do suporte em que este se encontra.

Plano de Preservao Digital V1.0 2008-03-25

52

Anexos

Plano de Preservao Digital V1.0 2008-03-25

53

Anexo A Lista de requisitos para a prtica de preservao digital

A Lista de requisitos para a prtica de preservao digital


Indicar na coluna Comentrio a seguinte informao: Se o requisito for considerado cumprido colocar S Se o requisito for considerado no cumprido colocar N

# 1 1.1 1.2 2

Designao O organismo dispe de: Plano de Classificao Tabela de Seleco Foi elaborada uma anlise e caracterizao da informao electrnica produzida pela organizao no mbito: do sistema de gesto documental das sries documentais A anlise anterior permitiu: definir classes preservadas de informao a serem

Obrigatoriedade

Comentrio

Aconselhvel Aconselhvel

2.1 2.2 3 3.1

Obrigatrio Obrigatrio

Obrigatrio

3.2

identificar as caractersticas dos ficheiros por cada classe de informao definida identificar as caractersticas tcnicas Documentos de Arquivo Electrnico dos

Obrigatrio

3.3

Obrigatrio

3.4

identificar os seguintes factores inerentes aos Documentos de Arquivo: Usabilidade Complexidade Escalabilidade Foram elaborados e analisados estudos no intuito de identificar os custos de solues de Preservao na fase de desenvolvimento e implementao em termos de: software Obrigatrio Obrigatrio Obrigatrio Obrigatrio

3.4.1 3.4.2 3.4.3 4

4.1

Plano de Preservao Digital V1.0 2008-03-25

54

Anexo A Lista de requisitos para a prtica de preservao digital

# 4.2 4.3 4.4 5 hardware

Designao

Obrigatoriedade Obrigatrio Obrigatrio Obrigatrio

Comentrio

preparao e adaptao de infraestruturas recursos humanos Foram analisados e identificados os custos de funcionamento, manuteno e actualizao em termos de: parque informtico infraestrutura formao recursos humanos Foi produzida uma avaliao e escolha de: formatos normalizados de preservao a longo prazo, para cada formato de ficheiro a preservar? aplicaes informticas: com capacidade de incremento de utilizadores simultneos com especificaes abertas que permitam a exportao formatos normalizados solues armazenamento: que permitam o escalamento capacidade de armazenamento que incluam sistemas de backup que incluam sistema de rotinas de auditoria e monitorizao Analisaram-se e metainformao: adaptaram-se os esquemas de da para

5.1 5.2 5.3 5.4 6 6.1

Obrigatrio Obrigatrio Obrigatrio Obrigatrio

Obrigatrio

6.2 6.2.1

Obrigatrio

6.2.2 6.2.3

Obrigatrio Obrigatrio

6.3 6.3.1

Obrigatrio

6.3.2 6.3.3

Obrigatrio Obrigatrio

7.1

j utilizados no organismo, com elementos de metainformao: Descritiva Obrigatrio

7.1.1

Plano de Preservao Digital V1.0 2008-03-25

55

Anexo A Lista de requisitos para a prtica de preservao digital

# 7.1.2 7.1.3 7.1.4 7.2

Designao Tcnica Estrutural Preservao a serem implementados e que contenham elementos de metainformao: Descritiva

Obrigatoriedade Obrigatrio Obrigatrio Aconselhvel

Comentrio

7.2.1

Obrigatrio aplicvel Obrigatrio aplicvel Obrigatrio aplicvel Obrigatrio aplicvel definidos para Obrigatrio aplicvel Aconselhvel

se

7.2.2

Tcnica

se

7.2.3

Estrutural

se

7.2.4

Preservao Foram afectados implementao os recursos

se

se

Foi definido um cronograma para execuo da implementao Foram definidas medidas de auditoria internas a nvel de: procedimentos de preservao formatos para preservao solues de software alternativas para um determinado formato solues de armazenamento esquemas de metainformao Foram definidas medidas de monitorizao interna dos documentos de arquivo electrnicos preservados, em termos de: integridade funcionalidade estrutura contedo

10

10.1 10.2 10.3

Obrigatrio Obrigatrio Obrigatrio

10.4 10.5 11

Obrigatrio Obrigatrio

11.1 11.2 11.3 11.4

Obrigatrio Obrigatrio Obrigatrio Obrigatrio

Plano de Preservao Digital V1.0 2008-03-25

56

Anexo A Lista de requisitos para a prtica de preservao digital

# 11.5 12

Designao metainformao associada Foi produzido um documento que defina o PPD de acordo com as solues propostas anteriormente A soluo proposta foi testada preventivamente sobre cpias de documentos de arquivo electrnicos, para despistar falhas Foram produzidas cpias de segurana documentos de arquivo electrnicos a preservar? dos

Obrigatoriedade Obrigatrio Obrigatrio

Comentrio

13

Aconselhvel

14

Aconselhvel

15

A estratgia de preservao digital foi implementada de acordo com o definido no PPD desenvolvido pelo organismo?

Obrigatrio

Plano de Preservao Digital V1.0 2008-03-25

57

Anexo B Questionrio

B Questionrio Instrues para o preenchimento do questionrio


Parte I - Sistema de gesto documental Esta primeira parte respeita aos recursos de manuteno e apoio ao sistema de gesto documental.

1.Controlo e Segurana a) Segurana do Sistema: Refere-se s funcionalidades do sistema que asseguram a proteco dos dados. O objectivo identificar as medidas de proteco de dados utilizadas pelo sistema. Estas podem consistir em Firewalls (dispositivo ou aplicao de controlo de trfego de dados de e para a rede), sistemas de deteco de intrusos, e outros a especificar pelo Organismo. Um sistema pode utilizar um ou mais medidas de segurana.

a) Rotinas de Auditoria: Permitem o registo de procedimentos efectuados a nvel do sistema. Pretende-se saber: Quais os elementos que esto sujeitos a estas rotinas de auditoria; Se essas rotinas do origem a relatrios; Que tipo de informao consta nesses relatrios; Se esses relatrios so protegidos contra alteraes ou eliminaes no autorizadas; Quem tem acesso a esses relatrios.

2. Armazenamento a) Sistemas de Informao Inclui questes relativas ao armazenamento de OD originais. O objectivo identificar onde esto instalados os repositrios de dados que se pretendem preservar a longo prazo, quais as arquitecturas de armazenamento utilizados para o efeito (ver Cap. 5.2 para informaes mais pormenorizadas) e onde se localizam. Esta localizao poder referir-se sala, cofre ou empresa com quem se estabeleceu um protocolo de outsourcing. Pretende-se, igualmente, saber que outros dispositivos portteis so tambm utilizados fora do local, qual a infra-estrutura de acesso aos repositrios de dados (ver os Cap. 5.3.1 para informaes mais pormenorizadas), e se possvel a sincronizao de dados com outro repositrio. Finalmente, solicitada a identificao dos formatos lgicos dos dados dos diferentes recursos da srie e categorias utilizados (que esto identificados no Cap. 4.1 e listados no anexo C), e as respectivas aplicaes informticas (de acordo com o Cap. 4.2), a dimenso, o espao ocupado e a taxa de crescimento de OD em unidades binrias, medidas em terabytes.

Plano de Preservao Digital V1.0 2008-03-25

58

Anexo B Questionrio

b) Backups Estas questes referem-se ao armazenamento das rplicas ou cpias de segurana produzidas a partir dos OD originais. O objectivo identificar onde esto instalados os repositrios das rplicas dos dados que se pretendem preservar a longo prazo, quais as arquitecturas de armazenamento utilizados para o efeito (ver Cap. 5.3 para informaes mais pormenorizadas) e onde se localizam. Esta localizao poder referir-se sala, cofre ou empresa com quem se estabeleceu um protocolo de outsourcing. Finalmente, pedida a dimenso, em unidades binrias medidas em terabytes.

3. Funes Administrativas Inclui questes respeitantes aos recursos de manuteno e apoio ao sistema.

a) Administrao Geral Relativa gesto de parmetros, salvaguarda e reconstituio do sistema, bem como administrao de utilizadores. Pretende-se a identificao das UO que administram (normalmente a UO ligada informtica) e das que detm a propriedade dos sistemas de informao.

4. Outras funes a) Encriptao O objectivo saber se a encriptao utilizada. Em caso afirmativo pretende-se identificar qual(ais) o(s) sistema(s) de encriptao utilizado(s) (ex: MD5, SSH, etc.), e em que tipos de documentos so utilizados.

5 Requisitos no funcionais a) Desempenho e escalabilidade Inclui questes relacionadas com a capacidade de satisfazer a gama de requisitos para o qual o sistema foi concebido. A questo 28 reporta-se s capacidades do sistema de gesto documental, actuais e possveis no futuro, relativamente ao nmero de utilizadores possveis em simultneo; velocidade de retorno de pesquisa e de carregamento para visualizao (medidas em segundos); e ainda capacidade de armazenamento (medida em terabytes).

b) Contratao de servios externos Reflecte a opo de utilizar prestadores de servios externos ao organismo para gesto do sistema. Pretende-se saber se a subcontratao de servios utilizada para a administrao e alojamento dos sistemas de informao. Adicionalmente, pede-se a descrio do tipo e durao desse(s) contrato(s).

Plano de Preservao Digital V1.0 2008-03-25

59

Anexo B Questionrio

c) Conservao a longo prazo (entendida em termos de preservao digital como um perodo superior a sete anos). O objectivo identificar: Quais as normas e legislao (Ex. art. 17 de RCM 5/90, de 28 de Fevereiro) relativas a requisitos ambientais observados; Quais as condies ambientais especficas para armazenamento a longo prazo, caso existam; Se a monitorizao dos sistemas e suportes de armazenamento feita regularmente. 6 Metainformao Pretende-se obter informao sobre a utilizao de esquemas ou modelos de MI. Em caso afirmativo, solicita-se que se faa a identificao dos mesmos, referindo qual(ais) o(s) sistema(s) de informao em que so utilizados. Caso contrrio, dever ser produzida uma lista com os elementos de MI utilizados em cada sistema de informao.

Parte II - Srie/Actividade suportada Esta parte pretende caracterizar cada uma das sries documentais que contm OD. Caso a Organizao no utilize qualquer plano de classificao ou no possua tabela de seleco, dever orientar estas questes no mbito das actividades suportadas pelos OD.

1. Identificao da organizao produtora Campo destinado identificao da entidade produtora da documentao, objecto de avaliao. O objectivo fornecer informao sobre o sector de actividade a que pertence o produtor da srie, a sua identificao formal e unvoca e o nome do Organismo, unidade orgnica ou pessoa individual (desde que no coincidente com o anterior) responsvel pela compilao e transmisso dos documentos da srie. Os sectores de actividade possveis (mas no exclusivos) so: Sector Privado (SP); Sector Pblico Empresarial (SPE); Administrao Central (AC); Administrao Local (AL); Administrao Regional (RA); Segurana Social (SS); Governo (GOV); Tribunais (TRB); Presidncia da Repblica (PR); Assembleia da Repblica (AR); Organizaes No Governamentais (ONG); Instituies de Solidariedade Social (ISS); Organismos Comunitrios (OC); Organizaes Inter-Governamentais (OIG) 2. Referenciao da srie Pretende fornecer informao identificativa da srie ou da actividade suportada pela documentao em causa. a) Nmero de Referncia Nmero sequencial exclusivo que identifica a srie ou actividade suportada. No caso de no existir tabela de seleco passar ao grupo 3.

b) Cdigo de classificao Cdigo exclusivo da srie, que permite a sua localizao intelectual, tal como se apresentam no plano de classificao.

c) Identificao da srie documental/actividade - Pretende-se obter informao descritiva sobre a srie documental, nomeadamente ao nvel de ttulos, actividade suportada e assunto.

Plano de Preservao Digital V1.0 2008-03-25

60

Anexo B Questionrio

d) Srie relacionadas So sries que contm documentos e/ou informao que diz igualmente respeito ou outra(s) srie(s). Preencher no caso da srie em anlise conter informao sntese (o contedo informativo existente numa ou em mais sries documentais sintetizado ou resumido numa outra srie), duplicada (uma srie documental contm, no todo ou em parte, o mesmo contedo informativo que outras sries) ou complementar (o contedo informativo de uma srie est relacionado com o de outra srie, acrescentando-lhe informao adicional). 3. Controlo e Segurana a) Acesso O objectivo saber se existem restries de acesso informao da srie/actividade suportada.

b) Salvaguarda e Recuperao Pretende-se conhecer a existncia de cpias de segurana e relacionar os tipos de cpias de segurana com o intervalo de tempo entre cada uma. As cpias podem ser integrais ( produzida sobre a totalidade dos OD da srie/actividade suportada), parciais (produzidas sobre parte da srie, normalmente os OD mais recentes) e distribudas (so produzidas rplicas que so armazenadas em localizaes diferente). Os perodos de intervalo podem ser dirios, semanais, mensais, etc.

c) Categorias de Segurana Visa a identificao da categoria documental/actividade relacionada. de segurana mais alta existente na srie

4 Avaliao a) Tabelas de Seleco O objectivo identificar o tempo de reteno definido para os recursos da srie e a aco a tomar, findo o prazo de conservao. A eliminao global significa que: A srie tem um valor secundrio nulo; A informao contida na srie foi objecto de publicao, com um nmero de depsito legal e no arquivo definitivo se conserve, pelo menos, um exemplar da publicao; Os dados essenciais da srie esto includos noutra srie de conservao permanente no mesmo organismo ou num organismo distinto. A Conservao permanente global significa que: A srie tem valor secundrio relevante e se verifica que o conjunto da informao no est publicado nem recupervel noutras sries de conservao permanente.

A Conservao permanente parcial significa que:


A srie muito extensa, com um contedo informativo significativamente homogneo e repetitivo e cujo interesse informativo no to grande que justifique a sua conservao permanente global. Contudo tambm se entenda que a eliminao da totalidade da srie uma opo demasiado radical fazendo sentido conservar uma amostra desta; A srie constituda por OD cujo interesse informativo muito desigual.

Plano de Preservao Digital V1.0 2008-03-25

61

Anexo B Questionrio

A Reviso significa que: No h certezas sobre o destino a dar srie, pelo que tal deciso ser adiada para quando terminar o prazo de conservao. b) Anlise de risco necessria, devido possibilidade de perda ou corrupo dos dados, resultados de danos fsicos. Pretende-se saber a percentagem de tolerncia da organizao para a perda dos OD que compem a srie em causa, e se esta contm documentos vitais, com vista a identificar se se trata de uma srie candidata a preservao digital.

5 Outras Funes

a) Assinaturas Digitais O objectivo obter dados referentes validao duma assinatura electrnica ou digital anexa aos documentos da srie ou certificado digital.

Plano de Preservao Digital V1.0 2008-03-25

62

Anexo B Questionrio

Parte I Sistema de gesto documental

1.Controlo e Segurana a) Segurana do Sistema


1. Que medidas de segurana so usados pelo sistema para proteger os dados?

Firewall

Sistemas de deteco de intrusos

Outros

Quais? ____________________

b) Rotinas de Auditoria
2. So efectuadas rotinas de auditoria sobre:

Sistemas de informao

Dados

Documentos electrnicos

Utilizadores

3. So produzidos relatrios de auditoria a partir das rotinas?

Sim

No

Alguns

4. Que informao contm os relatrios de auditoria sobre os dados?

A nvel do sistema

A nvel dos documentos

A nvel dos dados

A nvel de utilizadores

5. Os relatrios de auditoria so protegidos?

Sim

No

Plano de Preservao Digital V1.0 2008-03-25

63

Anexo B Questionrio

6. Quem tem direitos de acesso e administrativos aos relatrios?

Administradores de sistema Arquivistas/Gestores de Informao Informticos Outros

7. Durante quanto tempo so guardados os relatrios de auditoria?

2. Armazenamento a) Sistemas de Informao


8. Onde esto instalados ou depositados os sistemas de informao?

Servidores

Sistema de armazenamento

9. Indique o tipo:

10. Suporte fsico dos recursos: CAS NAS SAN Discos pticos Tapes Discos rgidos Outros:_________________________ 11. Localizao topogrfica dos suportes utilizados:

12. Existem dados armazenados em aparelhos que so normalmente utilizados fora do local, como portteis ou PDA? Quais os aparelhos utilizados?

Computadores Portteis Outros

Discos Externos

Pen-drives

PDA

___________________________

Plano de Preservao Digital V1.0 2008-03-25

64

Anexo B Questionrio

13. Infra-estrutura para acesso:

Em linha Near line Fora de linha

14. Os dados esto sincronizados com outro repositrio? No mesmo edifcio ou externo?

15. Formatos e categorias de formatos de dados:

16. Aplicaes utilizadas no mbito desses formatos Nome do Formato Nome da Aplicao Proprietrio (S/N) ;

Especificaes Abertas (S/N) 17. Dimenso:

18. Taxa de crescimento de OD:

b) Backups
18. Onde esto instalados ou depositados os backups?.

Servidores

Sistema de armazenamento

19. Indique o tipo:

20. Suporte fsico dos recursos:

CAS NAS SAN Discos pticos

Plano de Preservao Digital V1.0 2008-03-25

65

Anexo B Questionrio

Tapes Discos rgidos Outros:_________________________

21. Localizao topogrfica dos suportes utilizados no backup?

22. Dimenso:

3. Funes Administrativas a) Administrao Geral


23. Indique a Unidade orgnica/funcional que administra os sistemas de informao:

24. Indique a unidade orgnica/funcional proprietria dos sistemas:

4. Outras funes a) Encriptao


25. utilizada encriptao?

Sim

No

26. Se sim, indique quais os sistemas de encriptao que utiliza:

27. Se sim a que documentos:

Documentos de texto [PDF, WORD] Imagens Mensagens de correio electrnico Outros Quais?_______________________________

Plano de Preservao Digital V1.0 2008-03-25

66

Anexo B Questionrio

5 Requisitos no funcionais a) Desempenho e escalabilidade


28. Capacidades actuais e possibilidade de expanso em termos de: Nmero de utilizadores simultneos

Velocidade de pesquisa simples/complexa

Velocidade de recuperao e visualizao

Capacidade de armazenamento

b) Contratao de servios externos


29. A administrao dos sistemas de informao subcontratada? Sim (no todo ou em parte) No

30. O alojamento dos sistemas de informao e subcontratada? Sim (no todo ou em parte) No

31. Tipo de contrato: Perodo temporal: Anos Horas Qual? _______________________________

c) Conservao a longo prazo


32. So observados requisitos ambientais previstos em normativos e legislao? Sim No

33. Se sim, indique as normas e a legislao:

34. H condies ambientais para suportar longos perodos de armazenamento? Sim No

Plano de Preservao Digital V1.0 2008-03-25

67

Anexo B Questionrio

35. Se sim, indique quais as condies:

36. feita regularmente monitorizao dos suportes/sistemas de armazenamento? Sim No

6 Metainformao
37 Utilizam algum esquema/modelo de metainformao? Sim No

38. No caso de ser(em) utilizado(s) esquema(s)/modelo(s), indique quais:

39. No caso de no ser utilizado um esquema/modelo, indique que elementos de Metainformao so utilizados:

40. Mapeamento dos sistemas de informao com os respectivos esquemas/modelos de metainformao utilizados. Sistema de Informao Esquema/modelo de Metainformao

Plano de Preservao Digital V1.0 2008-03-25

68

Anexo B Questionrio

Parte II Srie/Actividade suportada


1. Identificao da organizao produtora
1. Sector de Produo

2. Identificao do Produtor

3. Designao do Produtor

2. Referenciao da srie a) Nmero de Referncia


4. Nmero de Referncia (No caso de existir tabela de seleco passar ao grupo 3)

b) Cdigo de classificao
5. Cdigo de Classificao

c) Identificao da srie documental/actividade


6. Ttulo da srie documental

7. Actividade suportada

8. mbito e contedo da srie

Plano de Preservao Digital V1.0 2008-03-25

69

Anexo B Questionrio

d) Srie relacionadas
9. Ttulo da Srie/Subsrie relacionada 1. 2. Possui informao Sntese Sntese Complementar Complementar Duplicada Duplicada

3. Controlo e Segurana a) Acesso


10. O acesso informao :

Livre para todos os funcionrios Livre para todos os funcionrios com algumas restries Restrito a todos os funcionrios Restrito maior parte dos funcionrios com algumas excepes

b) Salvaguarda e Recuperao
11. So feitas cpias de segurana?

Sim

No

12. Que tipo de cpias de segurana/Perodo de intervalo Tipo de cpias de segurana Perodo de intervalo entre cpias de segurana (ex. dirio, semanal, mensal, etc.)

Integrais

Parciais

Distribudas

c) Categorias de Segurana
13. Tem classificao de segurana? Sim No

Plano de Preservao Digital V1.0 2008-03-25

70

Anexo B Questionrio

14. Qual? Muito secreto Secreto Confidencial

4 Avaliao a) Tabelas de Seleco


15. Prazo de Conservao

16. Destino Final Eliminao global ; ; Conservao permanente parcial Reviso ; ;

Conservao permanente global

b) Anlise de risco
17. Quais as tolerncias para perda ou corrupo de dados? 0 5% 6 10% 11 20% 21 50 % 51 - 100%

18. Quais os documentos da srie considerados vitais?

5 Outras Funes a) Assinaturas Digitais


19. Contm documentos que utilizam a autenticao de assinatura electrnica

Sim

No

Plano de Preservao Digital V1.0 2008-03-25

71

Anexo C Exemplo de um ficheiro PREMIS contendo MI tcnica NISO Z39.87

C Exemplo de um ficheiro PREMIS contendo MI tcnica NISO Z39.87


<?xml version=1.0 encoding=UTF8?> <premis xmlns=http://www.loc.gov/standards/premis/v1 xmlns:mix=http://www.loc.gov/mix/ xmlns:xsi=http://www.w3.org/2001/XMLSchemainstance xsi:schemaLocation=http://www.loc.gov/standards/premis/v1 http://www.loc.gov/standards/premis/v1/PREMISv11.xsd http://www.loc.gov/mix/http://www.loc.gov/mix/mix.xsd> <object> <objectIdentifier> <objectIdentifierType>Custom</objectIdentifierType> <objectIdentifierValue>R2006.01.0001</objectIdentifierValue> </objectIdentifier> <preservationLevel>full</preservationLevel> <objectCategory>representation</objectCategory> <relationship> <relationshipType>structural</relationshipType> <relationshipSubType>hasroot</relationshipSubType> <relatedObjectIdentification> <relatedObjectIdentifierType>Custom</relatedObjectIdentifierType> <relatedObjectIdentifierValue>F2006.01.0001</relatedObjectIdentifierValue> <relatedObjectSequence>0</relatedObjectSequence> </relatedObjectIdentification> </relationship> <relationship> <relationshipType>structural</relationshipType> <relationshipSubType>haspart</relationshipSubType> <relatedObjectIdentification> <relatedObjectIdentifierType>Custom</relatedObjectIdentifierType> <relatedObjectIdentifierValue>F2006.01.0001.0000001</relatedObjectIdentifierValue> <relatedObjectSequence>1</relatedObjectSequence> </relatedObjectIdentification> </relationship> <linkingIntellectualEntityIdentifier> <linkingIntellectualEntityIdentifierType>Custom</linkingIntellectualEntityIdentifierType> <linkingIntellectualEntityIdentifierValue>1</linkingIntellectualEntityIdentifierValue> </linkingIntellectualEntityIdentifier> </object> <object> <objectIdentifier> <objectIdentifierType>Custom</objectIdentifierType> <objectIdentifierValue>F2006.01.0001</objectIdentifierValue> </objectIdentifier> <preservationLevel>full</preservationLevel> <objectCategory>File</objectCategory> <objectCharacteristics> <compositionLevel>1</compositionLevel> <size>3156</size> <format> <formatDesignation> <formatName>image/xml</formatName> </formatDesignation> <formatRegistry> <formatRegistryName>JHOVE</formatRegistryName> <formatRegistryKey>XML1.0</formatRegistryKey> </formatRegistry> <formatRegistry> <formatRegistryName>MIME</formatRegistryName> <formatRegistryKey>text/xml</formatRegistryKey> </formatRegistry> </format> </objectCharacteristics> <creatingApplication> <creatingApplicationName>MakeDVDImage.pl</creatingApplicationName> <dateCreatedByApplication>20060609T15:34:18Z</dateCreatedByApplication> </creatingApplication> <storage> <contentLocation> <contentLocationType>URI</contentLocationType> <contentLocationValue>R2006.01.0001/F2006.01.0001.mets</contentLocationValue> </contentLocation> <storageMedium>DVD</storageMedium> </storage>

Plano de Preservao Digital V1.0 2008-03-25

72

Anexo C Exemplo de um ficheiro PREMIS contendo MI tcnica NISO Z39.87

</object> <object> <objectIdentifier> <objectIdentifierType>Custom</objectIdentifierType> <objectIdentifierValue>F2006.01.0001.0000001</objectIdentifierValue> </objectIdentifier> <preservationLevel>full</preservationLevel> <objectCategory>File</objectCategory> <objectCharacteristics> <compositionLevel>0</compositionLevel> <fixity> <messageDigestAlgorithm>MD5</messageDigestAlgorithm> <messageDigest>5d5679af155d9752fab9a42e6c724f0a</messageDigest> </fixity> <size>482190</size> <format> <formatDesignation> <formatName>image/tiff</formatName> </formatDesignation> <formatRegistry> <formatRegistryName>JHOVE</formatRegistryName> <formatRegistryKey>TIFF5.0</formatRegistryKey> </formatRegistry> <formatRegistry> <formatRegistryName>MIME</formatRegistryName> <formatRegistryKey>image/tiff</formatRegistryKey> </formatRegistry> </format> <significantProperties> <mix:mix> <mix:BasicImageParameters> <mix:Format> <mix:MIMEType>image/tiff</mix:MIMEType> <mix:ByteOrder>littleendian</mix:ByteOrder> <mix:Compression> <mix:CompressionScheme>1</mix:CompressionScheme> </mix:Compression> <mix:PhotometricInterpretation> <mix:ColorSpace>0</mix:ColorSpace> </mix:PhotometricInterpretation> <mix:Segments> <mix:StripOffsets>8</mix:StripOffsets> <mix:RowsPerStrip>2339</mix:RowsPerStrip> <mix:StripByteCounts>481834</mix:StripByteCounts> </mix:Segments> <mix:PlanarConfiguration>1</mix:PlanarConfiguration> </mix:Format> <mix:File> <mix:Orientation>1</mix:Orientation> </mix:File> </mix:BasicImageParameters> <mix:ImageCreation> <mix:ScanningSystemCapture> <mix:ScanningSystemSoftware> <mix:ScanningSoftware>KofaxImageProcessingPlatformv1.10.018;KIPPTIFFStorageFilterv110.018</mix:Scannin gSoftware> </mix:ScanningSystemSoftware> </mix:ScanningSystemCapture> <mix:DateTimeCreated>19920509T15:10:57</mix:DateTimeCreated> </mix:ImageCreation> <mix:ImagingPerformanceAssessment> <mix:SpatialMetrics> <mix:SamplingFrequencyUnit>2</mix:SamplingFrequencyUnit> <mix:XSamplingFrequency>200</mix:XSamplingFrequency> <mix:YSamplingFrequency>200</mix:YSamplingFrequency> <mix:ImageWidth>1648</mix:ImageWidth> <mix:ImageLength>2339</mix:ImageLength> </mix:SpatialMetrics> <mix:Energetics> <mix:BitsPerSample>1</mix:BitsPerSample> <mix:SamplesPerPixel>1</mix:SamplesPerPixel> </mix:Energetics> </mix:ImagingPerformanceAssessment> </mix:mix> </significantProperties> </objectCharacteristics>

Plano de Preservao Digital V1.0 2008-03-25

73

Anexo C Exemplo de um ficheiro PREMIS contendo MI tcnica NISO Z39.87

<creatingApplication> <creatingApplicationName>tiffcp(libtifftools)</creatingApplicationName> <creatingApplicationVersion>3.7.31ubuntu1.1</creatingApplicationVersion> <dateCreatedByApplication>20060609T15:34:15Z</dateCreatedByApplication> </creatingApplication> <originalName>3</originalName> <storage> <contentLocation> <contentLocationType>URI</contentLocationType> <contentLocationValue>R2006.01.0001/F2006.01.0001.0000001.tiff </contentLocationValue> </contentLocation> <storageMedium>DVD</storageMedium> </storage> </object> </premis>

Plano de Preservao Digital V1.0 2008-03-25

74

Anexo D Recursos Aconselhados

D Recursos Aconselhados
ALVES, Ivone [et. al.] Dicionrio de terminologia arquivstica. Lisboa: IBL, 1993. ADOBE Tiff developer information site. 2002 URL: [Consult. 10 Dez. 2007]

<http://partners.adobe.com/public/developer/tiff>. ANDERSSON, Ulf - Short Version of the Sesam Report: Philosophy and Rules Concerning Electronic Archives and Authenticity. Proceedings of the DLM-Forum on Electronic Records. Brussels, 18-20 December 1996.

ASSOCIAO PARA O DESENVOLVIMENTO DA SOCIEDADE DA INFORMAO Glossrio da Sociedade da Informao Verso 2007 BARBEDO, Francisco et al. RODA: Relatrio Final, Maro 2007, Direco Geral de Arquivos e Universidade do Minho, [Consult. 10 Dez. 2007] URL:<

http://roda.iantt.pt/pt/system/files/roda-relatorioFinal.pdf>;

BARBEDO, Francisco et al. RODA: Repositrio de Objectos Digitais Autnticos, in CONGRESSO NACIONAL DE BIBLIOTECRIOS, ARQUIVISTAS E

DOCUMENTALISTAS, 9, Ponta Delgada, Portugal, 2007 Bibliotecas e arquivos : informao para a cidadania, o desenvolvimento e a inovao: actas [CD-ROM]. [S.l.] : Associao Portuguesa de Bibliotecrios, Arquivistas e Documentalistas, 2007. ISBN 978-9729067-37-2.

BARBEDO, Francisco RODA - De projecto a programa estratgico para a Preservao Digital, in Boletim Arquivos Nacionais, n19, Janeiro-Maro 2007, Lisboa. ISSN1645-5460;

BARBEDO, Francisco; GOMES, Eugnia; HENRIQUES, Ceclia SIADE caderno 1: Contexto de Suporte [Em linha]. Lisboa: Instituto dos Arquivos Nacionais; Instituto de Informtica, 2000 [Consult. 10 Dez. 2007] Disponvel em: <http://www.iantt.pt/downloads/SIADE_Caderno1.pdf>.ISBN 972-8107-59-5

BARBEDO, Francisco; GOMES, Eugnia; HENRIQUES, Ceclia; LAGOAS, Jos SIADE caderno 2: Recomendaes para a Gesto de Documentos de Arquivo Electrnicos (MOREQ). Lisboa: Instituto dos Arquivos Nacionais; Instituto de Informtica, 2000 [Consult. 10 Dez. 2007] Disponvel em: <URL:http://www. http://www.iantt.pt/downloads/SIADE_Caderno2.pdf>. ISBN 972-8107-59-5

Plano de Preservao Digital V1.0 2008-03-25

75

Anexo D Recursos Aconselhados

BEARMAN, David - Electronic Evidence. Strategies for Managing Records in Contemporary Organizations. Pittsburgh: Archives & Museum Informatics. 1994. ISBN: 1-885626-08-8

BEARMAN, David - Reality and Chimeras in the Preservation of Electronic Records, in D-Lib Magazine, Abril 1999, disponvel em: <www.dlib.org/dlib/april99/bearman/04bearman.html>

BEARMAN, David - Toward a Reference Model for Business Acceptable Communication, 1994, disponvel em: < www.lis.pitt.edu/~nhprc/prog6-5.html> BESSER, Howard; TRANT Jennifer - Introduction to Imaging: Issues in Constructing an Image Database. Santa Monica, CA: Getty Art History Information Program, 1995. ISBN-13: 9780892363612

CONSELHO INTERNACIONAL DE ARQUIVOS Documentos de Arquivo Electrnicos: Manual para arquivistas. (Estudos, n 16) trad e adapt. IAN/TT. 2005. [Em linha]. Lisboa: IAN/TT, 2005. [Referncia de 8 de Maio de 2006]. [Consult. 10 Dez. 2007] Disponvel na internet em: <http://www.ica.org/sites/default/files/ICAEstudo16_PT_4.pdf>.

CONSELHO INTERNACIONAL DE ARQUIVOS - ISAD(G): Norma geral internacional de descrio arquivstica: adoptada pelo Comit de Normas de Descrio, Estocolmo: Sucia, 19-22 de Setembro de 1999. Trad. Grupo de Trabalho para a Normalizao da Descrio em Arquivo. 2 ed. [Em linha]. Lisboa: IAN/TT, 2004. [Consult. 10 Dez. 2007].Disponvel na internet em: < http://www.iantt.pt/downloads/ISADG.pdf>.

CONSELHO INTERNACIONAL DE ARQUIVOS - ISAAR (CPF): Norma internacional de registo de autoridade arquivstica para pessoas colectivas, pessoas singulares e famlias. Trad. Grupo de Trabalho para a Normalizao da Descrio em Arquivo. 2 ed. [Em linha].Lisboa: IAN/TT, 2004. [Consult. 10 Dez. 2007]. Disponvel na internet em: <

http://www.iantt.pt/downloads/ISAAR2.pdf>

CONSULTATIVE COMMITTEE FOR SPACE DATA SYSTEMS, Reference Model for an Open Archival Information System (OAIS) - Blue Book. Washington: National Aeronautics and Space Administration, 2002.

COOK, Terry - Electronic Records, Paper Minds: The Revolution in Information Management and Archives in the Post-Custodial and Post-Modernist Era. Archives and Manuscripts 22 (Novembro 1994): p.300-328. 76

Plano de Preservao Digital V1.0 2008-03-25

Anexo D Recursos Aconselhados

DECRETO-LEI N 447/88. de 10 de Dezembro Regula a Regula a pr-arquivagem de documentao.

DICIONRIO PRTICO DE INFORMTICA. Alfragide: Editora McGrow-Hill de Portugal, 2000.

DUFF, Wendy - Will Metadata Replace Archival Description: A Commentary. Archivaria 39 (Maro 1995): 33-38.

FERREIRA, Miguel - Introduo preservao digital Conceitos, estratgias e actuais consensos. Guimares: Escola de Engenharia da Universidade do Minho, 2006 ISBN-13: 978-972-8692-308 [em linha] [Consult. 10 Dez. 2007] Disponvel na Internet

<URL:https://repositorium.sdum.uminho.pt/handle/1822/5820>

HENDLEY, T. - Comparison of Methods & Costs of Digital Preservation, British Library Research and Innovation Center, West Yorkshire 106, 1998.

HENRIQUES, M., LIBREOTTO, G., RAMALHO, J., e HENRIQUES, P. - Bidirectional conversion between xml documents and relational data bases. International conference on CSCW in design, 2002. Disponvel na Internet <URL: http://hdl.handle.net/1822/601> INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. ISO/IEC 17799:

Information technology -- Security techniques -- Code of practice for information security management. Genebra: ISO, 2005.

INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. ISO/IEC 27001: Information technology -- Security techniques -- Information security management systems Requirements. Genebra: ISO, 2005. INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. ISO/IEC 27002: Information technology -- Security techniques -- Code of practice for information security management. Genebra: ISO, 2005. INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. ISO/IEC 27006: Information technology -- Security techniques -- Requirements for bodies providing audit and certification of information security management systems. Genebra: ISO, 2007.

Plano de Preservao Digital V1.0 2008-03-25

77

Anexo D Recursos Aconselhados

INSTITUTO PORTUGUS DA QUALIDADE - NP 4438-1, Informao e documentao.Gesto de documentos de arquivo. Parte 1: Princpios directores. Lisboa: Instituto Portugus da Qualidade, 2005.

INSTITUTO PORTUGUS DA QUALIDADE - NP 4438-2, Informao e documentao. Gesto de documentos de arquivo. Parte 2: Recomendaes de aplicao. Lisboa: Instituto Portugus da Qualidade, 2005.

INSTITUTO DOS ARQUIVOS NACIONAIS/TORRE DO TOMBO - Manual para a gesto de documentos. Coord. Madalena Garcia e Maria Joo Pires de Lima; elab. Ceclia Henriques, Francisco Barbedo e Lus Montalvo. 2 ed. Lisboa: IAN/TT, 2004.

LAVOIE, B. F. - The open archival information system reference model: Introductory guide. Digital Preservation Coalition. 2004

MACNEIL, Heather - Metadata Strategies and Archival Description: Comparing Apples to Oranges. Archivaria 39 (Maro 1995): 22-32.

MORELLI, Jeffrey - Defining Electronic Records: a Terminology Problem... or Something More. Electronic Information Resources and Historians: European Perspectives, Eds. Seamus Ross, and Edward Higgs, 83-91. St Katharinen: Scripta Mercaturae Verlag, 1993.

NISO Z39.87-2006, Data Dictionary Technical Metadata for Digital Still Images. Bethesda: National Information Standards Institute; 2006

OCLC e RLG - PREMIS: Data Dictionary for Preservation Metadata., 2005

PARER, Dagmar; PARROTT, Keith - Management Practices in the Electronic Records Environment. Archives and Manuscripts 22, no. 1 (Maio 1994):106-122.

RLG EAD Advisory Group - RLG Best Practice Guidelines for Encoded Archival Description, 2002

ROTHENBERG, J. - Avoiding Technological Quicksand: Finding a Viable Technical Foundation for Digital Preservation A Report to the Council on Library & Information Resources (CLIR), 1999, ISBN - 1-887334-63-7 (disponvel em www.clir.org/pubs/reports/rothenberg/contents.html ou www.clir.org/pubs/reports/rothenberg/pub77.pdf

Plano de Preservao Digital V1.0 2008-03-25

78

Anexo D Recursos Aconselhados

ROTHENBERG, Jeff - Ensuring the Longevity of Digital Documents. Scientific American. (Janeiro 1995), 42-47.

SARAMAGO, M. - Metadados para a preservao digital e aplicao do modelo OAIS. In VIII Congresso da BAD. 2004.

STEPHENS, David O. Digital Preservation in the United Kingdom in THE INFORMATION MANAGEMENT, vol. 34, n. 4, Outubro 2000

STEPHENS, David O.; WALLACE, Roderick C. Electronic Records Retention: Fourteen Basic Principles in THE INFORMATION MANAGEMENT, vol. 34, n. 4, Outubro 2000

WALLACE, David - Managing the Present: Metadata as Archival Description. Archivaria 39 (Maro 1995): 11-21.

WALLACE, David - Metadata and the Archival Management of Electronic Records: A Review. Archivaria 36 (1993): 87-110.

Endereos electrnicos

CASPAR Project - http://www.casparpreserves.eu/caspar-project

Conselho Internacional de Arquivos - http://www.ica.org/

Conservation on Line (vrios links) - http://palimpsest.stanford.edu/

DELOS - www.delos.info/

DGARQ - http://www.dgarq.gov.pt

Digitale Duurzaamheid - http://www.digitaleduurzaamheid.nl/home.cfm

Plano de Preservao Digital V1.0 2008-03-25

79

Anexo D Recursos Aconselhados

DLM-Forum - http://www.europa.eu.int/historical_archives/dlm_forum

Electronic recordkeeping resources (Gesto http://www.kshs.org/archives/ermlinks/ermlinks.htm

de

documentos

electrnicos)

Erpanet - http://www.erpanet.org/

Estudos de caso (Universidade de Indiana) - http://www.indiana.edu/~libarche/index.html

Interpares - www.interpares.org/

Jeff Rothenberg's Digital Longevity Papers - http://www.panix.com/~jeffr/Prof/digilong.html

Joint Interoperability Test Command http://jitc.fhu.disa.mil/recmgt/

Records

Management

Application

(RMA)

MIP http://www.dgarq.gov.pt/downloads/MIIP_v1.0a.doc Model Requirements for the Management of Electronic Records (verso original) http://www.cornwell.co.uk/moreq

National Archives of Australia - http://www.naa.gov.au/

National Archives and Records Administration (USA) - http://www.nara.gov/

New South Wales ELECTRONIC http://www.records.nsw.gov.au/

RECORDKEEPING

WEB

SITE

GUIDE

Plano de Preservao Digital V1.0 2008-03-25

80

Anexo D Recursos Aconselhados

PDF/A

Competence

Center

The

pdf/a

competence

center

webpage,

2007,

URL:<http://www.pdfa.org>.

PLANETS - www.planets-project.eu/

Projecto Interpares - http://www.interpares.org/index.htm

Projecto Duranti - http://www.interpares.org/UBCProject/index.htm

Public Record Office - http://www.pro.gov.uk/

Records Continuum Research Group (Meta-informao) - http://rcrg.dstc.edu.au/

Research Libraries Group (preservao de documentos electrnicos) - http://www.rlg.org/

RLG - RLG EAD report card. 2002, - <http://www.rlg.org/eadreport-card>.

RODA - http://roda.iantt.pt/

SOCIETY OF AMERICAN ARCHIVISTS - Society of American Archivists home page. 2003 <http://www.archivists.org.>

SOCIETY

OF

AMERICAN

ARCHIVISTS

EAD

tools

survey.

2006,

URL:

<http://www.archivists.org/saagroups/ead>.

THE LIBRARY OF CONGRESS. NISO metadata for images in XML schema official web site. 2004.- <http://www.loc.gov/standards/mix>

Plano de Preservao Digital V1.0 2008-03-25

81

Anexo D Recursos Aconselhados

THE

LIBRARY

OF

CONGRESS

Pgina

oficial

do

EAD

verso

de

2002.

<http://www.loc.gov/ead/>.

THE

LIBRARY

OF

CONGRESS.

Pgina

oficial

do

METS.

2006.

<http://www.loc.gov/standards/mets>.

THE

LIBRARY

OF

CONGRESS

Pgina

oficial

do

PREMIS.

2006,

<http://www.loc.gov/standards/premis>.

THE LIBRARY OF CONGRESS - Sustainability of Digital Formats Planning for Library of Congress Collection: TIFF rev6.0, Maro 2007. -

<http://www.digitalpreservation.gov/formats/fdd/fdd000022.shtml>

Plano de Preservao Digital V1.0 2008-03-25

82

Anexo E - Glossrio/Conceitos

E Glossrio
API - Application Programming Interface (ou Interface de Programao de Aplicativos) um conjunto de rotinas e normas/regras estabelecidos por um software para utilizao das suas funcionalidades por programas aplicativos - isto : programas que no se querem envolver em detalhes da implementao do software, mas apenas utilizar os seus servios. De modo geral, a API composta por uma srie de funes acessveis somente por programao, e que permitem utilizar caractersticas do software menos evidentes ao utilizador tradicional. (fonte: Wikipdia Consult. Dez. 2007)

Aplicao Utilizao de tcnicas informticas para resolver um problema de aplicao, que conduz normalmente ao desenvolvimento ou utilizao de programas de aplicao como, por exemplo, folhas de clculo ou processadores de texto. Nota: O termo aplicao informtica muitas vezes tomado no sentido de programa de aplicao. (fonte: Glossrio da sociedade da informao - Verso 2007)

Programa concebido como ferramenta auxiliar para o desempenho de uma determinada tarefa, como processamento de texto, a contabilidade ou a gesto de inventrios (fonte: Dicionrio prtico de informtica - McGraw Hill)

Administrador - Funo responsvel pela execuo rotineira da poltica de gesto de documentos de arquivos numa organizao (fonte: MoReq)

Arquivo Digital Consiste numa organizao de pessoas e sistemas, que aceitou a responsabilidade de preservar informao e torn-la disponvel para uma dada comunidade. (fonte: OAIS adapt.)

Autenticidade Um documento de arquivo autntico aquele do qual se que pode provar a) ser aquilo que pretende ser, b) ter sido produzido ou enviado pelo alegado produtor ou remetente, e c) ter sido produzido ou enviado no alegado momento de produo ou envio. Para assegurar a autenticidade dos documentos de arquivo, as organizaes devem implementar e documentar polticas e procedimentos de controlo da produo, recepo, transmisso, manuteno e destino dos mesmos, assegurando que quem produz documentos est devidamente autorizado e identificado e que os documentos esto protegidos contra qualquer aco no autorizada (adicionar, apagar ou alterar informao, uso no autorizado ou imposio de restries de acesso indevidas). (fonte: NP 4438-1, p. 14.) Backup Cpia de um programa, disco ou dados, destinada a ser arquivada ou a salvaguardar ficheiros valiosos, caso os originais sejam destrudos (fonte Dicionrio prtico de informtica - McGraw Hill)

Plano de Preservao Digital V1.0 2008-03-25

83

Anexo E - Glossrio/Conceitos

Classificao: identificao sistemtica e organizao de actividades e/ou documentos de arquivo em classes, de acordo com converses logicamente estruturadas, mtodos e regras representados num sistema de classificao. (fonte: NP 4438-1, p. 9)

Cdigo fonte conjunto de palavras escritas de forma ordenada, contendo instrues numa das linguagens de programao existentes no mercado, de maneira lgica. Entende-se como o cdigo base de um programa de computador, implementando o ncleo de funcionalidade do programa.

Complexidade - quando um documento integra diversas componentes digitais (por exemplo as paginas Web)

Conservao a longo prazo: Acto de manter a informao numa forma independente e acessvel a longo prazo (fonte: OAIS adapt.)

Consumidor papel das pessoas ou sistemas clientes, que interagem com servios do arquivo digital, com o fim de pesquisar informao preservada de interesse e acederem a essa informao de forma detalhada. Isto poder incluir pessoas ou sistemas de arquivos digitais internos ou de outros arquivos digitais.

Cpias de Segurana - ver Backup

Cpia de segurana incremental Cpias de seguranas de dados armazenados e/ou alterados posteriormente cpia de segurana inicial. Documento de arquivo electrnico (DAE) Documento de arquivo produzido, transmitido e conservado, em forma electrnica Documento Electrnico (DE) Documento produzido ou recebido, e fixo para armazenamento e manipulao num sistema informtico, e que requer a utilizao do sistema para ser inteligvel pelos humanos (fonte Interpares 2, glossary adapt.)

Documentos estruturados contm informao de forma a ser interpretada primariamente por aplicaes informticas (Ex: registos de sistemas contabilsticos, registos de dados de controlo de trfego areo, etc.) Documentos no estruturados apresentam a informao de forma a ser inteligvel primariamente por humanos (Ex: cartas, memorandos, mensagens de correio electrnico, imagens, fotocpias, imagens digitalizadas, registos udio e/ou vdeo.

Plano de Preservao Digital V1.0 2008-03-25

84

Anexo E - Glossrio/Conceitos

Documento Vital que asseguram a continuidade do negcio em caso de acidente ou catstrofe (fonte: NP 4438-2 p.21) Documento de que a instituio depende em absoluto para a prossecuo das suas funes. Ou seja, caso se verificasse um acidente que destrusse esses documentos, o organismo ver-seia impedido de prosseguir com eficcia a sua actividade. Em ambiente electrnico, toda a documentao tcnica relativa s caractersticas do sistema de informao instalado e ao seu desempenho, assim como toda a metainformao descritiva na tramitao documental, ter de ser considerada vital, pois caso se verifique quebra do sistema ela ter papel fundamental para que se proceda ao processo de recuperao. (fonte: Manual de Gesto de Documentos)

Em linha (Online) Normalmente o tipo de armazenamento de dados mais acessvel, que pode iniciar o restauro em milissegundos. Um exemplo disso um disco rgido interno ou um conjunto de discos rgidos (ligados a uma SAN). Este tipo de armazenamento muito conveniente e rpido, mas relativamente caro. Por outro lado, sofre de alguma vulnerabilidade, pois os dados podem ser apagados ou alterados, seja por acidente ou por vrus que elimine dados.

Embebido Caracterstica de algo com identidade prpria (que pode existir autonomamente), que faz parte ou est includo dentro de um conjunto, que tambm pode ser uma entidade. Ex: um OD que est embebido noutro OD (imagem embebida num documento de texto)

Emulao Reproduo do comportamento e resultados de um material digital obsoleto atravs do desenvolvimento de novo hardware e/ou software para permitir a execuo da antiga aplicao de software em computadores no futuro (fonte Interpares 2, glossary)

Emulador Software capaz de reproduzir o comportamento de uma plataforma de hardware e/ou software numa outra que partida seria incompatvel. (fonte: Manual de Preservao)

Encapsulamento Preservar, juntamente com o objecto digital, a informao necessria e suficiente para permitir o futuro desenvolvimento de conversores, visualizadores ou emuladores. Esta informao poder consistir, por exemplo, numa descrio formal e detalhada do formato do objecto preservado. (fonte: Introduo preservao digital)

Encriptao converso de dados para um cdigo secreto ( ou de texto linear em texto cifrado) para transmisso numa rede pblica (fonte Interpares 2, glossary, adapt.) Processo de execuo de uma transformao complexa de um objecto digital de modo a que este no possa ser apresentado por uma aplicao de uma forma legvel ou inteligvel, a no ser que a transformao correspondente de descriptografia seja aplicada.

Plano de Preservao Digital V1.0 2008-03-25

85

Anexo E - Glossrio/Conceitos

(fonte: Moreq)

Escalabilidade caracterstica do sistema ou equipamento que pode crescer em escala, isto , que possibilita incrementos de capacidade ou funcionalidades acompanhando as necessidades dos usurios (aumento da capacidade de armazenamento do sistema atravs da substituio ou instalao de novos discos rgidos; verses mais actuais do formato PDF que permitem a incluso de informao de dados CAD). (fonte: Wikipdia Consult. Dez. 2007)

Ethernet Arquitectura de redes locais que suporta um trfego de alto dbito. Nota: A Ethernet um padro usual de rede local. (fonte: Wikipdia Consult. Dez. 2007) Ficheiro Coleco completa de informaes com uma designao, como seja um programa, um conjunto de dados utilizados por um programa ou um documento criado pelo utilizador. O ficheiro constitui a unidade de armazenamento bsica que permite ao computador distinguir um conjunto de informaes de outro. uma unidade coerente que o utilizador pode obter, alterar, eliminar, guardar ou enviar para um dispositivo de sada (fonte Dicionrio prtico de informtica - McGraw Hill)

Ficheiro linear ficheiros cuja informao passvel de ser transferida integralmente para formato analgico.

Fora de Linha (Off-line) - Similar ao perto de linha, embora necessite de interveno humana para disponibilizar as unidades de suporte. Isto pode incluir simplesmente o armazenamento das tapes de cpias de segurana nas estantes. O tempo de acesso deste suporte superior a uma hora.

Formato Em geral, designa a estrutura ou aspecto de uma unidade de dados. 2) Disposio de dados num ficheiro que normalmente permite que o documento seja lido ou alterado por uma determinada aplicao. (fonte: Dicionrio prtico de informtica - McGraw Hill) Organizao sequencial de dados em termos dos seus componentes. (fonte: OAIS)

Formato proprietrio - formatos de ficheiros com patente ou copyright (fonte: Wikipdia Consult. Dez. 2007)

Formato normalizado Formatos cujas definies e caractersticas esto especificadas numa norma, ou consensualmente utilizado pela comunidade ciberntica, (fonte: Wikipdia Consult. Dez. 2007)

Plano de Preservao Digital V1.0 2008-03-25

86

Anexo E - Glossrio/Conceitos

Formato aberto - Formato com especificaes pblicas para armazenamento, geralmente mantido por organizaes de normas no proprietrias e de uso livre de restries legais. (fonte: Wikipdia Consult. Dez. 2007)

Gestor ver Administrador

Horizonte de obsolescncia Prazo contado a partir da data de produo de um objecto digital a partir do qual, no se verificando aces de preservao, a possibilidade deste se tornar obsoleto incrementa numa escala geomtrica. (fonte: Wikipdia Consult. Dez. 2007)

Integridade A integridade de um documento de arquivo refere-se a este permanecer completo e inalterado. necessrio que os documentos sejam protegidos contra alteraes no autorizadas. As polticas de gesto de documentos de arquivo devem especificar que tipo de adies ou anotaes podem ser feitas a um documento depois da sua produo, em que circunstncias essas alteraes podem ser autorizadas, e quem est autorizado a faz-las. Qualquer alterao autorizada a um documento de arquivo deve ser explicitamente indicada e reconhecvel enquanto tal. (fonte: NP 4438-1, p. 15) Latncia (em ingls lag) refere-se ao atrasos que se podem verificar na comunicao entre computadores (internet, por exemplo) e comunicaes via satlite. Em computao, lag referese ao tempo que um pacote de dados leva a completar um percurso de ida e volta entre um computador local e o seu destino. (fonte: Wikipdia Consult. Dez. 2007)

Metadados Ver metainformao

Metainformao (no contexto da gesto de documentos de arquivo) Informao estruturada ou semiestruturada que permite a produo, gesto e utilizao de documentos de arquivo ao longo do tempo, assim como nos e atravs dos domnios em que so produzidos. (fonte: Wikipdia Consult. Dez. 2007) Migrao - Processo de transferncia de um documento de arquivo de um sistema ou suporte de armazenamento para outro, de forma a assegurar a continua acessibilidade medida que o sistema ou suporte onde se encontrava de degrada ou se torna obsoleto. Mirror Procedimento de proteco de dados e de acesso aos mesmos nos equipamentos informticos. Este sistema implementa-se na tecnologia de RAID 1. Consiste basicamente em ter 2 discos rgidos ligados. Um o principal e o outro guarda uma cpia exacta do principal armazenando qualquer alterao que se faa em tempo real. Desta forma consegue ter-se 2 discos rgidos idnticos e que permite, se tudo estiver bem configurado, que perante a falha do disco principal, o segundo assuma a sua funo impedindo a quebra do sistema e a perca de dados armazenados (fonte: Wikipdia Consult. Dez. 2007)

Plano de Preservao Digital V1.0 2008-03-25

87

Anexo E - Glossrio/Conceitos

NFS (Network File System), um modelo de sistema de ficheiros, que tem como funo centralizar ficheiros num servidor, formando assim uma pasta virtual. utilizado para sistemas de ficheiros distribudos numa rede de computadores de rea local. Possibilita que diferentes sistemas ligados a uma mesma rede acedam a ficheiros remotos como se fossem ficheiros locais. (fonte: Wikipdia Consult. Dez. 2007)

Objecto Digital (OD) Unidade de informao digital que inclui propriedades do objecto e poder incluir tambm mtodos de execuo de operaes no objecto. (fonte Interpares 2, glossary) Unidade discreta de informao em formato digital. (fonte RODA Relatrio Final)

Obsolescncia a perda de valor que um bem sofre em resultado do progresso tcnico ou da evoluo. (fonte: Priberam)

Pacote de aplicaes conjunto de programas de computador que tem por objectivo o desempenho de tarefas de ndole prtica, em geral ligadas ao processamento de dados, como o trabalho em escritrio ou empresarial. A sua natureza diferente da de outros tipos de software, como sistemas operativos e ferramentas a eles ligadas, jogos e outros softwares ldicos, entre outros. (Microsoft Office, Open Office) (fonte: Wikipdia Consult. Dez. 2007)

Perto de Linha (Near-line) - Normalmente trata-se de um tipo de armazenamento de dados menos acessvel, mas mais barato, do que o armazenamento em linha, sendo til para o armazenamento de dados de rplicas (cpias de segurana). Um exemplo disso um conjunto de tapes com tempos de restauro que vo desde segundos at alguns minutos. Normalmente est associado a um aparelho mecnico que move as unidades de suporte do local de armazenamento para o dispositivo de leitura e/ou gravao de dados. (fonte: Wikipdia Consult. Dez. 2007)

Prazo de reteno Perodo, previamente estabelecido para a permanncia dos documentos junto da actividade produtora, antes do seu destino final. (Dicionrio de Terminologia Arquivstica, adapt.)

Plano de classificao - Documento que regista o sistema de classes concebido para a organizao de um arquivo corrente e as respectivas notas de aplicao, nomeadamente quanto ao mbito das classes e ordenao das unidades arquivsticas abrangidas por cada uma, de modo a determinar toda a estrutura de um arquivo. (fonte: Manual para a Gesto de Documentos)

Plano de Preservao Digital V1.0 2008-03-25

88

Anexo E - Glossrio/Conceitos

Plano de Preservao Digital - documento estratgico contendo polticas, procedimentos e prticas/actividades para a constituio de uma estrutura tcnica e organizacional que permita preservar de forma continuada Objectos Digitais.

Plataforma 1) Tecnologia de base de um sistema de computador. Dado que os computadores so dispositivos em camadas, compostos por uma camada de hardware a nvel dos chips, por uma camada de controladores de hardware e de sistema operativo e por uma camada de aplicao, a camada mais baixa de um computador normalmente designada por plataforma 2) Na utilizao quotidiana, o tipo de computador ou sistema operativo a ser utilizado (Dicionrio prtico de informtica - McGraw Hill) Preservao digital Conjunto de actividades ou processos responsveis por garantir o acesso continuado e a longo-prazo informao e restante patrimnio cultural existente em formatos digitais. (fonte: Introduo preservao digital) Conjunto de actividades desenvolvidas com o fim de aumentar a vida til dos OD, salvaguardando a utilizao operacional, e proteg-los das falhas de suportes, perda fsica e obsolescncia tecnolgica; Conjunto de actividades que promovem a acessibilidade aos contedos; Conjunto de actividades que assistem na preservao do contedo intelectual, forma, estilo, aparncia e funcionalidade.

Produtor Entidade que cria os registos, produz e manipula os contedos.

Proprietrio Unidade Orgnica responsvel pela informao/documento.

RAID (Redundant Array of Independent Drives ou Disks) Conjunto Redundante de Discos Independentes, um meio de se criar uma unidade virtual de armazenamento composta por vrios discos individuais, com a finalidade de aumentar a segurana e desempenho atravs de redundncia. (fonte: Wikipdia Consult. Dez. 2007)

Rplica ver backup. Repositrio local centralizado onde se armazena e mantm informao digital, habitualmente bases de dados ou ficheiros informticos. (fonte: Wikipdia Consult. Dez. 2007)

Restauro do sistema Recuperao dos dados do sistema, atravs das cpias de segurana.

Srie documental Unidade arquivstica constituda por um conjunto de documentos simples ou compostos a que, originariamente, foi dada uma ordenao sequencial, de acordo com um sistema de recuperao da informao. Em princpio, os documentos de cada srie devero

Plano de Preservao Digital V1.0 2008-03-25

89

Anexo E - Glossrio/Conceitos

corresponder ao exerccio de uma mesma funo ou actividade, dentro de uma mesma rea de actuao. (fonte: Manual para a Gesto de Documentos)

Sistema aberto - Sistema informtico concebido com uma arquitectura tal que permita a juno de componentes de hardware e/ou de software provenientes de diversos fornecedores. (Fonte Glossrio da sociedade da informao verso 7)

Sistema de armazenamento Dispositivo ou conjunto de dispositivos utilizados para armazenar primariamente os dados e a informao produzida.

Sistema operativo programa ou um conjunto de programas cuja funo servir de interface entre um computador e o utilizador. (Windows, Linux; MacOS) Software de base de um computador destinado a controlar a execuo de programas, a comunicao entre dispositivos e programas, assegurando as operaes de entrada-sada, a atribuio de recursos aos diferentes processos, o acesso s bibliotecas de programas e aos ficheiros, assim como a compatibilidade dos trabalhos. Nota: O sistema operativo o software mais importante a correr num computador. (fonte: Glossrio da sociedade da informao - Verso 2007)

SMB (Server Message Block) opera como um protocolo de comunicao de rede utilizado. (fonte: Wikipdia Consult. Dez. 2007)

Software livre - segundo a definio criada pela Free Software Foundation, qualquer programa de computador que pode ser usado, copiado, estudado, modificado e redistribudo sem nenhuma restrio. A liberdade de tais directrizes central ao conceito, o qual se ope ao conceito de software proprietrio, mas no ao software que vendido almejando lucro (software comercial). A maneira usual de distribuio de software livre anexar a este uma licena de software livre, e tornar o cdigo fonte do programa disponvel. O software livre tambm conhecido pelo acrnimo FLOSS (do ingls Free/Libre Open Source Software). (fonte: Wikipdia Consult. Dez. 2007)

Suporte Material adequado ao registo de informao. Exemplos de suportes electrnicos: CD, DVD, tape, Discos rgidos). (fonte: Manual para a Gesto de Documentos)

Tabela de seleco Instrumento que regista o resultado da avaliao, apresentando-se como uma relao dos documentos de arquivo de um organismo ou administrao que fixa os respectivos prazos de conservao em fase activa e semi-activa e destino final. (fonte: Manual para a Gesto de Documentos)

Unidade binria: - (em ingls BInary uniT, ou bit), unidade de medida de transmisso de dados usada na Computao e na Teoria da Informao.

Plano de Preservao Digital V1.0 2008-03-25

90

Anexo E - Glossrio/Conceitos

(fonte: Wikipdia Consult. Dez. 2007)

Usabilidade significa que um documento utilizvel ou seja, que pode ser localizado, recuperado, apresentado e interpretado. (fonte: NP 4438-1 p.15)

USB Sigla de universal serial bus (bus srie universal). Bus srie com uma largura de banda de 1.5 Mbps, utilizado para ligar perifricos (modems, impressoras, ratos, teclados, ) a um microcomputador. (Dicionrio prtico de informtica - McGraw Hill)

Utilizador ver consumidor (fonte OAIS)

Virtualizao de armazenamento (Storage Virtualization) processo de abstraco de armazenamento lgico a partir do armazenamento fsico. Este conceito utilizado actualmente para descrever esta abstraco em qualquer camada no conjunto de software e hardware de armazenamento. (fonte: Wikipdia Consult. Dez. 2007)

Plano de Preservao Digital V1.0 2008-03-25

91

Vous aimerez peut-être aussi