quinta-feira, 17 de dezembro de 2009

Política Preservação Digital 3

A política de preservação digital da Universidade de Yale nos parece ser um exemplo que, apesar da simplicidade, contém o essencial.
Ainda falta, infelizmente, a descrição da melhores práticas (pelo menos disponível no sítio da Política), mas, por outro lado, há um útil glossário.
Confira em: http://www.library.yale.edu/iac/DPC/final1.html

quinta-feira, 19 de novembro de 2009

Uma aula de preservação digital

Fui convidado a dar uma aula sobre Preservação de Documentos Digitais para uma turma da disciplina Preservação & Restauração de Documentos. Achei interessante o exercício intelectual para resumir e apresentar uma assunto, atualmente, tão vasto em menos de duas horas. Assim, resolvi compartilhar o resultado desse esforço. O produto ficou em três partes: Os conceitos e os Objetivos, As estratégias e Os Riscos e Desafios. Não vou me aprofundar muito em cada uma dessas partes, o que faço na aula expositiva. Aqui apresento somente as linhas gerais.

Os conceitos e os objetivos
São muitos os conceitos e seus objetivos no que diz respeito à preservação digital, no entanto dois deles são fundamentais.

O primeiro conceito que precisa ser explicitado e definido da maneira mais precisa possível é o conceito de Documento Digital. Da adequada definição desse conceito dependem as ações realmente necessárias que devem ser implementadas para o sucesso da Preservação Digital. É importante também contrapor esse conceito com o conceito, mais abrangente, de Documento Eletrônico. Além de explicitar as diferenças específicas entre suporte e conteúdo nos documentos digitais.

O segundo conceito, igualmente importante, é o próprio conceito de Preservação Digital. Esclarecendo sobre as diferenças entre a Preservação de Documentos em suportes tradicionais como o papel. Há que se explicitar o fato de que as ações de preservação digital precisam ocorrer até antes da produção dos documentos digitais. Outro paradigma em contraste à preservação tradicional é o cuidado com o suporte e o conteúdo dos documentos digitais como entidades independentes. Como se sabe, documentos em suportes tradicionais não dissociam esses dois entes.

Parece-nos importante também discutir os vários sentidos da Preservação Digital: a preservação da estrutura, do conteúdo e do contexto dos documentos digitais. Sendo que o item contexto refere-se às ações de descrição do conteúdo em relação ao ambiente sócio-cultural e em relação a outros documentos presentes no ambiente de sua produção. Em geral, o problema da preservação do contexto é o menos abordado entre os pesquisadores.

As estratégias
Em relação às estratégias de preservação digital, as ações efetivas preservar, é preciso, antes de mais nada, levar em consideração as características únicas desse tipo de documento. A complexidade dessas características exigem a definição de uma Política de Preservação Digital (PPD) para a instituição responsável pelos documentos digitais. Política essa, de maneira ideal, ainda na fase de produção dos documentos ou antes disso.

Essa PPD deve definir e prescrever diretrizes gerais para a organização e os mecanismos que subsidiem as ações necessárias que também são explicitadas na política. Os produtos desses mecanismos devem subsidiar, pelo menos:

1.Os cuidados ambientais adequados para os suportes físicos dos documentos digitais;
2.Os padrões de formatos de suporte e formatos de arquivo mais adequados para a preservação;
3.Os suportes físicos mais adequados para uso corrente e de guarda permanente;
4.Os procedimentos de migração de suportes e formatos;

Os riscos e desafios
Mesmo uma sondagem inicial na quantidade de trabalhos de pesquisa ou artigos de especialistas em preservação digital pode mostrar a complexidade do assunto e, consequentemente, uma grande quantidade de riscos e desafios. Por outro lado, eu entendo que dois deles são basilares e devem orientar a maior parte do planejamento: A Autenticidade e confiabilidade dos Documentos Digitais e sua Descrição.

O problema e preocupação com a autenticidade e confiabilidade dos documentos digitais está muito mais presente em aos documentos tradicionais, pois, ao contrário dos últimos, os primeiros precisam passar por modificações, inclusive planejadas e, às vezes, de grande porte. Normalmente, um documento tradicional é mantido tal como ficou pronto em seu uso inicial. É o caso de um pergaminho da idade média ou um livro raro. Na verdade, todo o esforço de preservação desse tipo de documento recai para mantê-lo tal qual o original. Por sua vez, os documentos digitais não podem deixar de passar por modificações como a migração de formatos de suporte e formatos de arquivo o que cria um paradoxo entre confiar num documento e modificá-lo periodicamente.

O outro grande desafio é fazer frente aos riscos no que se refere ao sentido da preservação digital do contexto, ou seja, da descrição do conteúdo e sua relação com outros documentos e seu ambiente social. Esse desafio deve ser encarado com ações de descrição dos documentos através do uso de metadados e vocabulário controlado.

Bem, encerro aqui a última parte e estou sempre disponível para comentários, observações ou qualquer outro tipo de informação.

Tchau.

terça-feira, 17 de novembro de 2009

Políticas de Preservação Digital 2

Uma instituição que compartilhou informações sobre sua política de preservação digital (PPD) é a ICPSR (INTER UNIVERSITY CONSORTIUM FOR POLITICAL AND SOCIAL RESEARCH) que em tradução livre significa 'consórcio inter universitário para a pesquisa política e social'.

Trata-se de uma instituição que congrega aproximadamente 700 instituições acadêmicas e organizações de pesquisa.

Bem, o que nos interessa de fato é sua PPD. Há uma página web dedicada a ela, onde podemos encontrar informações gerais sobre tal política que está estruturada em oito partes:

Propósito;
Aderência ao padrão OAIS;
Responsabilidades administrativas;
Viabilidade Organizacional;
Sustentabilidade financeira;
Aplicabilidade tecnológica e procedimental;
Segurança do sistema;
Procedimentos de auditória;

Cada uma das oito partes acima está subdividida em seções mais detalhadas. O primeiro parágrafo da parte 1 (propósito) é bastante esclarecedor:

“ICPSR cumpre seu papel como responsável confiável da herança das ciências sociais através da captura dos resultados da pesquisa científica do passado e do presente para os futuros pesquisadores. Sua Estrutura de Política de Preservação Digital (Digital Preservation Policy Framework) dá suporte a essa missão e é o mais relevante documento de política de preservação no ICPSR. Ela deixa explícito o comprometimento do ICPSR com a preservação de acervos digitais em suas coleções através do desenvolvimento e evolução de um abrangente programa de preservação digital. Essa estrutura reflete os objetivos definidos no Plano Estratégico (2005) do ICPSR e contém referências a outros procedimentos e políticas relevantes no ICPSR. O público alvo dessa estrutura inclue os membros do ICPSR, sua staff, depositários de conteúdo digital, fundadores e usuários.”

O que me chamou a atenção foi a clareza de percepção da importância dessa política para a instituição, inclusive estando presente em seu plano estratégico. Essa é uma excelente notícia, pois demonstra o crescimento da importância da preservação digital nas instituições.

Acho que vale realmente a pena conferir mais detalhes na página do ICPSR.
Bom proveito!

terça-feira, 10 de novembro de 2009

Políticas de Preservação Digital 1

Iniciamos a partir de hoje uma análise sobre políticas de preservação digital. A idéia é pesquisar instituições que tenham políticas e que estejam disponíveis em seus sites. Inicialmente farei uma pesquisa com instituições de língua inglesa.
A primeira delas é a Política de Preservação Digital da Biblioteca Nacional da Austrália. Na página da biblioteca há a exposição de nove itens:

1 Propósito
2 Os objetivos das atividades de preservação digital da biblioteca
3 A natureza das coleções digitais da biblioteca
4 Os desafios para manter acessíveis recursos digitais informacionais
5 Orientações gerais para a preservação das coleções digitais da biblioteca
6 Princípios de implementação
7 Desenvolvimento de pesquisa e padrões
8 Trabalhando com outros para preservar recursos digitais informacionais nacionais
9 Trabalhando com outros para alavancar a preservação digital

Não ficou claro se existe um documento oficial mais detalhado que registre essa política. De qualquer forma, trata-se de um importante aspecto sobre preservação digital.
Vale a pena conferir essa página e outras que publicarei em breve.
Até mais.

terça-feira, 20 de outubro de 2009

Categorias de Formatos de Arquivos

Formatos de arquivo são entidades fundamentais para a compreensão dos processos de preservação digital no que cabe à preservação do conteúdo de documentos digitais. Os responsáveis por estratégias ou políticas de preservação digital são obrigados a considerar ações com relação aos formatos de arquivo, por exemplo: escolha dos formatos mais adequados para preservação digital ou migração de formatos de arquivo. Nesse sentido, uma categorização de formatos de arquivo existentes pode ser bastante útil para guiar essas ações.
No âmbito tecnológico, há um sistema de categorias chamado MIME o qual, na verdade, agrupa formatos de arquivos em grupos (http://www.webopedia.com/TERM/M/MIME.html).
Diversos repositórios de formatos de arquivo também têm suas próprias categorias, veja por exemplo a compilação de Clause em http://netarchive.dk/publikationer/FileFormats-2004.pdf.
Por outro lado, é importante não confundir a categorização de formatos de arquivo com uma categorização de documentos digitais. Essa equivalência parece não ser possível. Veja por exemplo a categoria de documentos digital textual como memorandos ou cartas. É preciso lembrar que pode-se encontrar documentos digitais textuais juntamente com imagens e/ou sons. Consequentemente, pode-se encontrar documentos digitais textuais em inúmeros formatos de arquivo.

quarta-feira, 14 de outubro de 2009

Escolha da melhor mídia

Nesse post, estamos escrevendo sobre o último folheto da série disponibilizada pelo Arquivo Nacional do Reino Unido: guidance notes. O de hoje trata da escolha de mídias para armazenamento de documentos digitais. O trabalho procura evidenciar que características devem ser levadas em conta quando se faz a escolha desse tipo de mídia, observando que “nenhuma mídia para armazenamento em computador pode ser considerada como sendo para arquivamento durável, independentemente de sua longevidade física: a obsolescência tecnológica é inevitável e todas as mídias tem ciclos de vida limitados”.


Os seis critérios que são individualmente abordados e sucintamente explicados são:


Longevidade; [recomendando o mínimo de dez anos]
Capacidade [de armazenamento];
Viabilidade; [refere-se ao equipamento possuir métodos de correção de erros]
Obsolescência; [recomenda utilizar tecnologia já testada e aprovada no mercado]
Custo; [custo total por Gigabyte]
Susceptibilidade; [ser tolerante a danos físicos e larga escala de variação de condições climáticas]


Ao final, o artigo apresenta uma tabela com um sistema de pontuação de 1 a 3 para cada uma dessas seis características acima. São comparadas mídias do tipo CD-R, DVD-R, Hard Disk, Flash Memory e fitas LTO.


Finalmente, esse trabalho apresenta uma fonte de bibliográfica de referência, que segue:


Bennett, J C, 1997, A framework of data types and formats, and issues affecting the long-term preservation of digital material. JISC/NPO studies on the preservation of electronic materials, British Library Research and Innovation Report, 50.


Trata-se de um trabalho bastante sucinto como todos os demais dessa série. Apesar disso possui informação que pode ser valiosa, principalmente, quando não se dispõe de nenhuma.
Com esse post, encerramos essa série.

Até a próxima!!!!

terça-feira, 6 de outubro de 2009

Mídias Removíveis

Comentamos hoje o número da coleção do Arquivo Nacional dedicado a cuidados com a conservação de Mídias Removíveis. O folheto aborda discos magnéticos flexíveis, fitas magnéticas, discos ópticos e dispositivos de estado sólido (como PenDrive).
As recomendações básicas apresentadas são:

Armazenar as mídias nas embalagens originais;
Armazená-las nas embalagens originais quando não estiverem em uso;
Distanciá-las de líquidos, sujeira, fumaça ou temperaturas extremas;
Armazená-las verticalmente;
Checar por sinais de deterioração semestralmente;
Aclimatá-las por 24hs antes de transferências entre acervos;
Manter os equipamentos de leitura sempre limpos.

Além disso, o folheto lista recomendações específicas para cada um dos quatro tipos de mídias acima. Ao final há uma tabela com recomendações de temperatura e umidade para cada tipo de mídia.
Conferindo a bibliografia, nota-se que o trabalho baseia-se na norma BS 5454:2000 que é uma norma britânica para a preservação de material de arquivo.

Vale a pena conferir!
Até mais.

terça-feira, 29 de setembro de 2009

Formatos para Imagens

Nessa ocasião, mais um comentário sobre as publicações do Arquivo do Reino Unido para apoio à Preservação Digital. Hoje, um folheto que trata especificamente de formatos de arquivo projetados para acomodar imagens: fotos, desenhos vetoriais e variantes. O folheto procura apresentar informações resumidas sobre formatos dessa categoria e indica, em alguns casos, fontes suplementares de consulta.

Primeiro, o trabalho apresenta uma categorização desses formatos, separando o tipo Raster Graphics (não há uma tradução exata no português, mas se refere a formatos de arquivo que utilizam pixels para representar imagens como em fotos de máquinas fotográficas digitais), Vector Graphics e Metafiles. Desses três grupos, apenas o primeiro é mais ou menos dissecado e explorado com relação a características importantes como a profundidade de cores e palettes.

No resto do folheto de 15 páginas o autor relaciona, apresentando características e comentários resumidos de 10 formatos na categoria Raster Graphics e 4 formatos em cada uma das outras duas categorias: total 18 formatos comentados.

Para um contato inicial com formatos de arquivo para imagens gráficas, o folheto parece ser uma excelente fonte de informações.

Até a próxima!

terça-feira, 22 de setembro de 2009

Guias do Reino Unido: compressão de arquivos

Vou dar continuidade a uma idéia que iniciei em janeiro desse ano e, por vários motivos, não pude dar continuidade. Como agora há espaço, retomo os comentários para a série Guias & Orientações. São folhetos publicados pelo Arquivo Nacional do Reino Unido. São eles: Selecionando Formatos de Arquivo, selecionando mídias de armazenamento, cuidados com mídias removíveis, formatos gráficos e compressão de imagem.
Em janeiro, publiquei meus comentários para o exemplar sobre Formatos de Arquivo e hoje publico sobre Compressão de Imagem.
Trata-se, como nos outros folhetos da série, de uma publicação de poucas páginas. O folheto esclarece que o Arquivo Nacional do Reino Unido "Não especifica ou exige ou uso de nenhum algoritmo específico de compressão para os documentos que lhes forem enviados". Esclarece também que algoritmos de compressão são mecanismos matemáticos implementados por software para reduzir o tamanho de arquivos com documentos. O que se aplica, principalmente, para arquivos muito grandes como tradicionalmente ocorre com Documentos Fotográficos.
O folheto elenca apenas dois fatores que devem ser levados em consideração quando se utilizam algoritimos: A Eficiência e a Perda de Dados (Lossiness). No primeiro caso, trata-se de identificar se o algoritmo se aplica melhor de acordo com o tipo de formato de arquivo. E no último caso, fator que considero o mais importante, se haverá perda de informações do arquivo original caso esse seje submetido a processos de compressão.
A maior parte do trabalho apenas lista onze algoritmos com breves informações sobre cada um deles. São eles o: Run Length Encoding (RLE), LZ Compressions, Huffman Encoding, Deflate, CCITT Group 3 and Group 4, Lempel-Ziff-Welch (LZW), JPEG, JPEG 2000, PNG Compression, Fractal Compression e o HD Photo.
Finalmente, o artigo resume numa tabela os algoritmos e quais são Lossness ou Lossy (perdem ou não dados na compressão) e em que arquivos são mais eficientes.
Espero que as informações sejam úteis. Até a próxima mensagem!!!!!

quarta-feira, 17 de junho de 2009

Digitalização

O Arquivo Nacional brasileiro está elaborando suas RECOMENDAÇÕES PARA DIGITALIZAÇÃO DE DOCUMENTOS ARQUIVÍSTICOS. Trata-se de recomendações que visam permitir um processo de digitalização de qualidade.
A consulta pública está disponível no sítio do CONARQ. Essas recomendações tem alguns pontos positivos e outros negativos. De positivo, o documento reconhece - o que nem sempre ocorre entre os especialistas - que a digitalização é um procedimento de preservação do acervo físico original e não um procedimento de preservação digital em si.
Por outro lado, a digitalização gera um acervo de documentos digitais (que aliás a Minuta da Recomendação chama, impropriamente, de Representante Digital) que precisarão ser preservados. Isto porque não é muito racional investir em processos caros e até potencialmente danosos aos documentos originais (particularmente se se tratar de documentos antigos e raros) para refazer tudo em alguns anos.
E esse é o ponto negativo da Recomendação, deveria haver um cuidado maior com os Arquivos Digitais e seus correspondentes Formatos de Arquivo gerados.
Vamos aguardar o resultado final das RECOMENDAÇÕES após receber nossas recomendações!!!! (desculpe o trocadilho!!!)

quinta-feira, 23 de abril de 2009

Artigos&Textos

Estou disponibilizando alguns textos que produzi e podem ser úteis para uma introdução aos conceitos, políticas e estratégias sobre preservação digital.
O primeiro deles é um resumo de palestras que ministrei para alunos de preservação e restauração de documentos em 2009, buscando aproximar a preservação digital da preservação de documentos em suportes tradicionais.
O segundo deles é um artigo que apresentei em 2007 no Seminário Internacional de Bibliotecas Digitais em São Paulo, trata-se de um trabalho com farta referência a outros textos nacionais e internacionais para aprofundamento da teoria.
O último texto é minha dissertação de mestrado, apresentada em 2008. Nela alguns assuntos, notadamente o conceito e aplicação de formatos de arquivo & preservação digital é tratado em profundidade.

Bom proveito!

quarta-feira, 11 de fevereiro de 2009

Arquivistas digitais

A demanda por profissionais que saibam lidar com documentos digitais está crescendo. Pelo menos é o que pensa um artigo do New York Times: Digital Archivists, Now in Demand.

O texto completo da reportagem pode ser acessado nesse link: http://www.nytimes.com/2009/02/08/jobs/08starts.html?emc=eta1

Segue uma tradução dos três primeiros parágrafos para dar um gostinho do texto:

"Quando o mundo entrou na era digital, uma considerável parte dos registros históricos da humanidade não acompanharam o mesmo caminho.
Literatura, filmes, periódicos científicos, jornais, documentos judiciários, documentos corporativos e outros, acumulados através dos séculos, precisaram ser adaptados para as bases de dados computacionais. Uma vez lá, precisaram ser organizados - juntamente com os documentos já nascidos digitais - de uma maneira tal que as pessoas possam encontrar o que necessitam e continuar encontrando no futuro.
As pessoas adequadas a encontrar um lugar para essa imensidão de informação são conhecidas como digital asset managers ou, às vezes, digital archivists e digital preservation officers. Seja lá como forem chamadas, a demanda por elas está aumentando."
By Conrad de Aenlle (fevereiro, 2009)

sexta-feira, 30 de janeiro de 2009

Selecionando Formatos de Arquivo

A publicação do Arquivo Nacional do Reino Unido sobre preservação digital com o título SELECTING FILE FORMATS FOR LONG-TERM PRESERVATION (selecionando formatos de arquivo para preservação por longos períodos) corresponde a um livreto com 10 páginas, sem bibliografia (infelizmente) e no idioma original inglês britânico, o autor é Adrian Brown.

O trabalho é composto por uma curta introdução e, ao final, uma conclusão, os dois capítulos realmente relevantes são: Elementos para Seleção e Avaliando Formatos: fontes de informação.

O capítulo Elementos para Seleção contém a descrição de doze critérios que deveriam ser utilizados para avaliar o quanto um formato de arquivo é adequado ou não tanto para uso corrente como também para a preservação digital dos documentos, são eles: UBIQÜIDADE, SUPORTE, ABERTURA DA ESPECIFICAÇÃO, QUALIDADE DA DOCUMENTAÇÃO, ESTABILIDADE, IDENTIFICAÇÃO E VALIDAÇÃO, DIREITOS AUTORAIS, SUPORTE A METADADOS, COMPLEXIDADE, INTEROPERABILIDADE, VIABILIDADE, REUTILIZAÇÃO.

Infelizmente, talvez em função do formato limitado do texto (a proposta é de fazer um Guia com notas), não há fundamentação da fonte desses critérios. O texto também não ajuda em explicar como alguns critérios podem ser verificados no mundo real, por exemplo: UBIQÜIDADE, trata-se do critério que refere-se quanto um formato de arquivo é “popular” no mercado, o raciocínio é que quanto mais um formato for conhecido maiores serão as chances de obter suporte técnico ou software para utilizá-lo. Porém, para verificar esse critério é necessária uma pesquisa complexa de mercado, no mundo todo, o que é operacionalmente difícil de executar ou mesmo planejar.

Após esse capítulo, o trabalho aborda possíveis fontes para verificação desses critérios. Na verdade, fica claro que o objetivo principal do capítulo é demonstrar o quanto o projeto PRONOM - criado, hospedado e mantido pelo Arquivo Nacional – pode ser útil. No final das contas, o PRONOM é uma biblioteca de informações sobre formatos de arquivo. Algumas dessas informações podem ser acessadas diretamente em sua base de dados, como o software compatível para determinado formato de arquivo (efetuando-se a busca Compatible Software). Outras informações, podem ser localizadas através de links fornecidos na base. É importante observar que nem todos os formatos de arquivo possuem informações completas, quer seja diretamente ou através de links.

Minha opinião sobre o trabalho é a de que trata-se de um guia útil para os responsáveis por ações de preservação digital, apesar de bastante limitado e, claramente, direcionado a evidenciar o projeto PRONOM, que diga-se de passagem é uma excelente iniciativa.

terça-feira, 27 de janeiro de 2009

Preservação digital no Reino Unido

Em outubro do ano passado postei uma mensagem sobre o projeto PRONOM de iniciativa do Arquivo Nacional do Reino Unido. Essa instituição também disponibiliza uma série de textos técnicos com orientações sobre diversos aspectos da Preservação Digital. Pretendo explorar a série Guias & Orientações, postando uma mensagem para cada um dos cinco títulos dessa coleção: Selecionando Formatos de Arquivo, selecionando mídias de armazenamento, cuidados com mídias removíveis, formatos gráficos e compressão de imagem. Na próxima postagem, tecerei comentários sobre o exemplar Formatos de Arquivo. Uma boa notícia é que todos os cinco títulos foram atualizados em sua segunda edição em agosto do ano passado, por isso o material deve estar ainda melhor. Até mais!

quarta-feira, 14 de janeiro de 2009

Dissertação

Caros colegas,

Finalmente e depois de muito suor, minha dissertação de mestrado está concluída, defendida, aprovada, impressa e entregue, UFA!! Faltam as críticas e sugestões!
Para isso, já coloquei uma cópia em PDF em minha biblioteca digital. O título é:
PRESERVAÇÃO DE DOCUMENTOS DIGITAIS: o papel dos formatos de arquivo.

Espero que seja útil!