terça-feira, 31 de maio de 2011

Formatos & Preservação Digital

O termo formato parece ser muito caro quando se trata de Preservação Digital. Aparece com muita frequência nos textos e discussões sobre PD e a meu ver aparece em contexto de grande importância.
Por isso, vamos abordar esse tema nas próximas postagens!

Em se tratando desse termo, o que aparece com mais frequência, no âmbito de discussões sobre PD, é o termo formato de arquivo. Mas vamos abordar também os formatos de mídia.
Vamos iniciar recuperando algumas definições sobre esses termos:


Formato de Arquivo


“The organization of data within digital objects, usually designed to facilitate the storage, retrieval, processing, presentation and/or transmission of the data by software.” O que traduzimos como “A organização de dados em objetos digitais, usualmente projetado para facilitar o armazenamento, recuperação, processamento, apresentação e/ou transmissão de dados por software.” (Interpares)


Digital Object


“A discrete aggregation of one or more bitstreams and the metadata about the properties of the object and, if applicable, methods of performing operations on the object.” O que traduzimos como “Uma agregação discrete de um ou mais sequências de bits (bitstreams) e os metadados sobre as propriedades dos objetos e, se aplicável, métodos para executar operações nesse objeto.” (Interpares)

Não encontrei definições para formatos de mídia, talvez porque não sejam chamados por este termo. Encontrei:


Digital Medium


“Physical material, such as a CD, DVD, DAT or hard disk, used for storage of digital data.” Ou “Material físico, como um CD, DVD, DAT ou disco rígido, usado para armazenamento de dados digitais.” (Interpares)
Essas definições serão nossos pontos de partida. Até a próxima!

Estratégias para preservação e acesso

No Recife, em meados de setembro acontece o Conferência sobre Tecnologia , Cultura e Memória : Estratégias para a preservação e o acesso à informação (CTCM).

Vale a pena conferir a programação!

sexta-feira, 27 de maio de 2011

Documentos digitais e sua migração

Vamos tratar aqui sobre o problema da migração de documentos digitais, no que diz respeito à parte lógica do documento digital, ou seja, tudo menos o suporte físico utilizado em seu registro. Infelizmente, não se trata de uma tarefa simples, como pode dar a impressão de ser à primeira vista.

Vamos começar analisando o quê pode ser migrado, para depois entrar na seara sobre como isso deve acontecer.

Basicamente, o que pode ser migrado é o formato de arquivo utilizado no documento digital, por exemplo, um formato JPEG ou um formato TXT. No entanto, minhas pesquisas tem mostrado que formatos de arquivo podem ser muito complexos. Dependendo do formato de arquivo específico, será necessário considerar a criptografia utilizada, o tipo de compressão de dados utilizado ou o conjunto de metadados adotado. Além disso, notadamente para os formatos de vídeo digital, não se trata necessariamente de um único formato de arquivo, mas de um conjunto de elementos utilizados para o registro do vídeo digital. Dessa forma, é preciso cuidado ao se falar em migrações de formatos de arquivo, pois para cada caso considerado, vários outros problemas podem ter que ser analisados e solucionados.

Intimamente ligado à questão anterior, há considerações sobre como executar a migração, ou melhor, o que considerar durante o processo em si de migração. Essas considerações terão como resultado um documento digital migrado que possui Autenticidade ou não. O termo Autenticidade aqui significa “Valor de confiabilidade de um documento como documento, ou seja, a qualidade de um documento de ser o que se propõe a ser e que está livre de alterações ou corrupções.” (projeto INTERPARES termo authenticity).

Dependendo do conteúdo do formato de arquivo, certas características técnicas deverão ser consideradas. Por exemplo, para o vídeo digital, a nova versão produzida deve possuir a mesma qualidade do original, em termos de resolução de imagem. Não poderá haver alterações substanciais nas cores originais.

O ambiente onde ocorre a migração também deve ser levado em consideração. Assim, pode ser necessário controle (através de registros de auditoria) e autorização para fazer esse processo. Dependendo do documento digital, poderá ser necessária autorização legal para execução dessas migrações.

Os custos envolvidos pode ser um outro fator importante a ser levado em consideração. Isso se aplica a casos onde há um grande volume de documentos digitais necessitando de migração. Importante lembrar que esse processo pode precisar ocorrer juntamente com a migração dos suportes utilizados e seus respectivos custos.

Finalmente, em relação ao como fazer migrações de formatos de arquivo, será de grande ajuda o uso de critérios para a escolha de um novo formato de arquivo, esses critérios são baseados tanto em aspectos técnicos como também pretendem garantir autenticidade da migração executada. Nossa dissertação de mestrado investigou exatamente esse aspecto da preservação digital e pode ser de ajuda para quem esteja envolvido com esse problema.

Até a próxima.

terça-feira, 24 de maio de 2011

Suportes Físicos 4

No âmbito da preservação de documentos digitais, pode-se incluir na categoria de ações preventivas os procedimentos para MIGRAÇÃO de documentos digitais. Pode-se falar aqui tanto em migrações de suportes físicos como também da migração do conteúdo lógico. Vamos analisar um pouco cada um desses procedimentos.

As migrações de suportes físicos de documentos digitais como os discos do tipo Compact Disc (CD) são muitas vezes chamadas de refreshing quando os suportes são substituídos por outros iguais, porém mais novos e, consequentemente, em melhores condições de armazenamento e uso. A migração, propriamente, ocorrerá quando os documentos digitais gravados em determinado suporte físico, digamos um disco do tipo DVD, passam a ser gravados num outro suporte físico diferente do original, como uma fita magnética de determinado tipo.

Por que fazer essas migrações?

A motivação é a percepção de que os suportes físicos utilizados para registrar o conteúdo de documentos digitais possuem uma vida útil determinada. Para os documentos digitais, essa vida útil não está diretamente ligada somente aos materiais utilizados na fabricação dos suportes, mas também em relação aos equipamentos utilizados para reproduzir esses mesmos suportes. Ao longo do tempo, à medida que surgem novas tecnologias, determinados suportes físicos deixam de ser produzidos e seus respectivos equipamentos de gravação e reprodução também.

Um exemplo de obsolescência de suporte/equipamento são os discos chamados ZIP DRIVE, do fabricante IOMEGA http://go.iomega.com , agora considerados obsoletos e ultrapassados. Eram discos com capacidade de 100 ou 200Mbytes. Hoje, dispositivos como os PenDrives (muito mais simples e baratos) estão disponíveis com capacidades de armazenamento dezenas de vezes superior a isso.

As migrações de documentos digitais ao nível lógico, por sua vez, são um tema bem mais mais complexo, mesmo para o formato resumido que apresentamos nossos artigos aqui, por isso vamos tratar dele na próxima oportunidade.

Até lá!

quinta-feira, 5 de maio de 2011

Suporte físico 3

Uma diferença fundamental entre os procedimentos para preservação de documentos digitais em comparação à preservação de documentos em suportes tradicionais é a maior velocidade de evolução tecnológica dos documentos digitais.

A tecnologia utilizada para a fabricação de suportes tradicionais evolui lentamente. Um exemplo emblemático é o papel. Esse suporte mudou muito pouco nos últimos séculos. Por outro lado, os suportes utilizados em documentos eletrônicos e digitais evoluiu tanto, somente nos últimos 50 anos, que a tecnologia atual não tem quase nada em comum com as primeiras tentativas de registro.

Essa constatação é de extrema importância, pois como já defendemos, os procedimentos para preservação fundamentam-se na tecnologia específica dos suportes físicos utilizados. Dessa forma, uma rápida mudança nas tecnologias desses suportes tem um impacto direto nas ações de preservação digital, principalmente, no que diz respeito às ações preventivas.

Um exemplo que ilustra o que estamos defendendo são os suportes do tipo discos do Compact Disc (CD). Inicialmente, o mercado disponibilizou discos do tipo CD-ROM, que utilizam uma tecnologia onde as marcas correspondentes aos bits são prensadas em metal, alguns anos depois, já estavam disponíveis, comercialmente, os discos do tipo CD-R. Nessa versão os dados são gravados num processo químico utilizando luz a lazer na gravação.

Do ponto de vista da preservação preventiva desses suportes, essas diferenças tecnológicas são fundamentais. A incidência de luz nos discos CD-ROM é muitíssimo menos danosa do que a mesma quantidade de incidência de luz em discos do tipo CD-R, que utilizam produtos sensíveis a luz em sua estrutura física.

Quem quiser se aprofundar mais nos detalhes tecnológicos de discos do tipo Compact Disc, pode consultar um trabalho de 2003 que é bastante completo sobre o tema. Há também um artigo meu, esse em português, que aborda a preservação de documentos digitais, considerando a estrutura dos suportes.

Portanto, é preciso ser cauteloso sobre o que chamo de "armadilha tecnológica" para as pesquisas sobre preservação digital. Limitar os esforços a compreender e aplicar procedimentos para suportes - e, na verdade, qualquer tecnologia específica - produz produtos que, em pouco tempo, estarão muito defasados para aplicações práticas.

Até a próxima!!