terça-feira, 26 de abril de 2011

Suportes físicos 2

As ações que podem ser executadas para a preservação de acervos em geral agrupam-se em três grandes categorias: prevenção contra riscos, ações preventivas e ações corretivas.

O primeiro grupo refere-se ao planejamento de ações e procedimentos que deverão ser executados quando e se ocorrerem sinistros previsíveis, mesmo que se trate de ocorrências pouco prováveis. Nesse grupo estão exemplos como um possível incêndio, uma inundação ou mesmo um terremoto ou furtos.

O segundo grupo, ações preventivas, normalmente referem-se mais aos suportes físicos em si, ou seja, o que deve ser feito para preservar materiais específicos onde os documentos foram registrados. As ações mais comuns, geralmente, envolvem o controle ambiental: umidade relativa do ar, temperatura, presença de insetos ou incidência de luz.

No último grupo, que compreende ações corretivas, o suporte utilizado nos documentos também é o foco das atenções. Há inúmeras técnicas e procedimentos para cada tipo de suporte documental. Não é a toa que muitos defendem que a preservação corretiva ou restauração de documentos seja uma disciplina independente e que deve ser executada por profissionais especializados. O exemplo mais comum nesse grupo é a higienização de documentos, desde a remoção manual de sujidades pequenas até um banho especial nos documentos.

No universo dos documentos digitais, esses três grupos também são válidos. Apesar da importante restrição sobre restauração de documentos digitais. Há alguns trabalhos de pesquisa sobre esse assunto. Mas em geral, devido às próprias características dos documentos digitais, é geralmente impossível restaurá-los.

No universo digital, como era de se esperar, os exemplos de ações para cada um daqueles grupos são diferentes.

Podemos encaixar no grupo que se refere a combate a riscos, praticamente os mesmos exemplos para os suportes tradicionais, como prevenção a incêndio e inundações. E acrescentar cuidados como o acesso indevido, pois documentos digitais são muito mais susceptíveis a alterações em seu conteúdo ou mesmo a eliminação.

Para a preservação preventiva dos suportes digitais, os cuidados também são basicamente os mesmos, como o controle do ambiente. A diferença fundamental em relação a documentos tradicionais ocorre em relação aos valores numéricos específicos. Além dos documentos digitais serem muito mais susceptíveis a variações nas condições ambientais.

Continuamos no próximo.

segunda-feira, 25 de abril de 2011

Preservação dos suportes físicos

Chega a ser curiosa a compreensão incorreta sobre uma das características nos documentos digitais. Tal compreensão é comum mesmo entre profissionais que lidam com algum tipo específico de documento digital. A confusão refere-se à existência ou não de um suporte físico.

Não deveria haver dúvida alguma sobre o fato que qualquer documento digital, independentemente de qualquer característica, possui um suporte físico, sempre. Mas essa dúvida aparece com bastante frequência.

Um palpite meu que explicaria essa percepção é a grande dinamicidade dos documentos digitais manifestada através do uso de muitas cópias funcionalmente idênticas ao original em locais geograficamente distintos, muitas vezes em continentes diferentes. E isso tudo em intervalos de tempo de segundos.

Um exemplo que tenho utilizado para ilustrar o quanto um documento digital sempre precisará de seu respectivo suporte físico é o caso de transmissão dos bits de um documento digital via satélite. Nesse caso extremo, os bits estão sendo transmitidos no espaço sideral. Em casos como o envio de documentos digitais (p. ex. fotos digitais) de outro planeta ao nosso - como ocorreu recentemente pela sonda espacial enviada a Marte – esses bits são transmitidos até mesmo num meio sem atmosfera. Então nesse caso essas fotos digitais não precisaram de suporte físico?

Precisaram sim, como qualquer foto digital gravada em um disco comum. O fato é que a essa transmissão não poderia ter ocorrido sem um suporte físico na origem da transmissão, como os fotosensores da câmera digital, além de memórias eletrônicas, bem como um outro para a recepção dos sinais e gravação das fotos completas.

E por que é importante esclarecer adequadamente essa questão? Simplesmente porque se sempre será necessário um suporte físico, então precisamos nos preocupar em preservar esses suportes também. Isso se quisermos o sucesso da Preservação Digital.

Por isso, vamos fazer algumas considerações sobre esse aspecto da Preservação Digital nas próximas postagens.

quinta-feira, 7 de abril de 2011

Definição de documento digital 2

Na última mensagem publicada, apresentamos uma definição operacional para o conceito de documento digital:

Um documento digital é o equivalente a uma sequência de códigos binários registrados em algum tipo de tecnologia de memória. Organizados de acordo com determinado formato de arquivo computacional e mensurado através da quantidade de bytes total desse arquivo. Dependendo do tipo de conteúdo, haverá outras características específicas como a representação de cores, som ou texto. A interpretação desses códigos para humanos ocorrerá através de sistemas computacionais de software e hardware.”

Um possível problema com essa definição operacional é que ela possui um outro conceito não óbvio para a imensa maioria das pessoas e até para alguns especialistas: trata-se do conceito de formato de arquivo. Dessa forma, é conveniente também desenvolvermos uma definição operacional para esse importante conceito.

Formatos de arquivo nada mais são do que convenções sobre como organizar os bytes de um arquivo gerado por software. Isso é necessário porque as informações correspondentes aos bytes no arquivo gravado em algum tipo de memória possuem diferentes categorias. Explicitando melhor, alguns bytes correspondem ao conteúdo do arquivo (por exemplo texto), outros correspondem à disposição ou layout do conteúdo na tela ou na impressora, outros correspondem a alguma característica de som (no caso de arquivos sonoros). Há ainda os trechos de bytes que registram o nome do arquivo, seu autor, data de criação, tamanho total em extensão. Enfim, há uma infinidade de categorias possíveis. Quantas e quais dessas dependerá do tipo de arquivo e software que o cria.

Formatos de arquivo são, originalmente, definidos e convencionados pelos mesmos criadores do software que os produz. Por exemplo, um determinado editor de texto pode gerar arquivos no formato de arquivo XYZ que passa a ser vinculado ao software editor de texto. Um outro software para edição de imagens pode gerar arquivos no formato XYZ(2) e assim por diante. Às vezes, um software é conhecido pelo nome de seu formato de arquivo. Por outro lado, é muito comum que um determinado software utilize e até mesmo produza arquivos em vários formatos, muitos deles definidos por outras empresas ou organizações. Isso é ainda mais comum quando é definido um formato de arquivo padrão criado justamente para ser utilizado por qualquer software que tenha interesse naquele tipo de arquivo. Um exemplo são arquivos no formato JPEG2000 .

A convenção sobre quais são as categorias e quais informações específicas serão gravadas e representadas através dos bytes num arquivo de computador - bem como a posição física desses bytes nesse mesmo arquivo – resulta no que é chamado de especificação de formato de arquivo. Isso é basicamente um documento textual, muito similar a um manual técnico. Adicionalmente, muitos outros manuais podem ser disponibilizados. Um exemplo são as instruções para aplicação em softwares ou uso de características especiais como a compressão de dados no arquivo, se for o caso.

Essas especificações costumam ser agrupadas entre as proprietárias e não proprietárias. Referindo-se à existência de uma instituição ou empresa que detenha os direitos de propriedade sobre aquelas informações. Normalmente, trata-se da mesma instituição ou empresa que desenvolve e comercializa o software que gera aqueles arquivos.

Um outro agrupamento comum refere-se à publicidade dada à especificação do formato de arquivo. Nesse caso, costumam ser agrupadas entre as abertas ou fechadas. Ou seja, as informações da especificação são disponibilizadas, oficialmente, ao público ou não. Uma especificação não proprietária costuma estar disponibilizada ao público em geral, o que, raramente, acontece com uma especificação proprietária.

Há ainda uma categoria de especificações de formatos de arquivo e refere-se ao fato dela ser uma norma (oficial ou de facto). Um formato de arquivo com uma especificação na forma de norma oficial é aquele que, através de uma instituição normativa oficial como a International Organization for Standardization (ISO), é criado e atualizado. Está nesse caso a norma ISO 19005-1:2005 (Document management – electronic document file format for long-term preservation, part 1: use of PDF 1.4 – PDF/A-1). Outras especificações de formato de arquivo, apesar de não estarem na forma de norma oficial, podem se transformar numa norma de facto. Isso acontece para aqueles casos onde o formato de arquivo acaba sendo tão utilizado no mercado que acaba, informalmente, virando uma norma. O problema com essas “normas” são as possíveis diferenças entre diferentes implementações. Como não se trata de uma norma oficialmente documentada, costumam surgir “aprimoramentos” ou pequenas diferenças em relação a diferentes empresas. Esse é o caso do formato de arquivo TIFF, que apesar de ser uma norma de facto, muitos defendem que, na verdade, existem vários formatos, todos chamados de TIFF.

A partir do quadro conceitual e das informações acima, como deveria ser uma definição operacional de formato de arquivo? Propomos uma com a seguinte redação:

Um formato de arquivo é o equivalente à convenção de informações, representadas através de bytes, que dizem respeito ao conteúdo, propriamente dito, e outras informações necessárias para gravar um arquivo gerado por software ou, posteriormente, reproduzir esse arquivo para ter acesso a seu conteúdo. Essa convenção defini também a posição física e ordem dos bytes gravados no arquivo. Formalmente, essa convenção será registrada num documento chamado especificação de formato de arquivo. A qual poderá ter acesso público a seu conteúdo ou não, possuir um detentor de seus direitos autorias com restrições a seu uso ou não. E ainda pode estar na forma de uma norma oficial padronizada ou não.”

A rigor, trata-se de uma definição de formato de arquivo e especificação de formato de arquivo, mas parece atender bem nossos interesses em relação à preservação digital.

terça-feira, 5 de abril de 2011

Definição de documento digital

Definir algo é uma das tarefas mais difíceis que um pesquisador precisa fazer. Precisa porque a partir do ponto de partida das definições é que se torna possível desenvolver um problema e possíveis soluções. Sem isso, simplesmente não é possível ser claro, ou seja, qual é o problema? Como, exatamente, se pretende resolvê-lo. Definições são também elementos essenciais para uma boa comunicação.

Um pesquisador e de resto todos nós sempre possuímos nossas definições para qualquer coisa. Ainda que nem sempre se trate de uma definição aceita como correta pelos demais sujeitos. O problema da comunicação é que só podemos afirmar se concordamos ou não com a definição do outro, se soubermos qual é essa definição. Em outras palavras, principalmente numa empreitada científica, a explicitação das definições que adotamos é vital para a qualidade do produto final.


Nesses termos, para tratar do tema preservação de documentos digitais, precisamos de uma definição de documento digital, de documento tradicional, além de outras definições. Por enquanto, vamos nos limitar à definição de documento digital. Como coloquei no início desse texto, definir é uma tarefa difícil. Aqui não vou entrar no mérito dessa discussão que envolve muitas linhas filosóficas. Basta dizer que o ato de definir alguma coisa foi um dos primeiros problemas filosóficos, desde Platão e Aristóteles, para citas os mais célebres.


Por outro lado, essa mesma filosofia nos subsidiará para definir o que é um documento digital através do conceito de operacionismo e definição operacional. O operacionismo é uma “doutrina segundo a qual o significado de um conceito científico consiste unicamente em determinado conjunto de operações” (Abbagnano, 2007, p. 850). Isso significa que se vamos definir uma coisa física, devemos expressá-la através das operações que possam ser utilizadas para caracterizá-la em termos físicos conhecidos e aceitos. Por exemplo, tomemos um conceito operacional de temperatura como sendo "medida obtida através do uso de uma escala calibrada para graus Celsius que compara a dilatação de mercúrio em relação ao incremento de calor no mesmo". Não se trata de uma definição teórica geral a ser amplamente aceita, mas possui uma vantagem, outro indivíduo pode repetir essas operações e chegar aos mesmos resultados, o que a torna um meio eficiente de comunicação. Essa maneira de definir foi originalmente proposta pelo físico Percy W. Bridgman (The Logic of Modern Physics, 1927).


Como seria uma definição operacional de Documento Digital?


Primeiro, vou considerar uma coisa concreta, um arquivo produzido por uma câmera fotográfica digital, ou seja, uma fotografia digital. Uma definição operacional dessa coisa pode ser: "Sequência de códigos binários registrados em algum tipo de tecnologia de memória organizados de acordo com determinado formato de arquivo computacional e mensurado através da quantidade de bytes total desse arquivo. O significado desses códigos refere-se às cores de cada ponto de uma imagem real qualquer e a quantidade desses pontos é diretamente relacionada à qualidade final do arquivo gerado".


Agora, se considerarmos outras definições operacionais correspondentes a documentos digitais como o vídeo digital, um documento digitalizado, um mensagem eletrônica, um texto digitado ou qualquer outro exemplo, haveria uma definição operacional com elementos comuns a todos esses casos? Defendemos a tese de que isso é possível e essa definição operacional pode ser derivada da definição operacional de um caso específico. Tomemos como exemplo a definição acima de fotografia digital. Assim, com algumas modificações, uma definição operacional de documento digital pode ser:


“Um documento digital é o equivalente a uma sequência de códigos binários registrados em algum tipo de tecnologia de memória. Organizados de acordo com determinado formato de arquivo computacional e mensurado através da quantidade de bytes total desse arquivo. Dependendo do tipo de conteúdo, haverá outras características específicas como a representação de cores, som ou texto. A interpretação desses códigos para humanos ocorrerá através de sistemas computacionais de software e hardware.”

Eis nosso ponto de partida.

ABBAGNANO, Nicola. Dicionário de Filosofia. São Paulo: Martins Fontes, 2007.

segunda-feira, 4 de abril de 2011

Preservação e Preservação Digital

A disciplina Preservação, na linha tradicional, possui, basicamente, duas vertentes. A primeira delas diz respeito aos procedimentos necessários para manter documentos em condições de acesso e uso, ou seja, tentar evitar sua natural deterioração. Isso pode ser feito através de ações preventivas de controle de umidade do ar e temperatura ambiente, controle do nível de poluentes no ar, higienização de documentos, entre outras medidas. A outra vertente compreende as ações de restauração de documentos, dentro do possível, ao estado original que esses estavam quando foram criados. Ambas as vertentes possuem seus limites e, na prática, mesmo ações completas não podem garantir a inexorável deterioração dos documentos e, de resto, de tudo que é físico e material em nosso mundo.

Dependendo da tradição original do pesquisador e do país, há divergências sobre a terminologia. Assim, às vezes, o termo preservação refere-se ao sentido que apresentamos acima, mas de alguns pontos de vista, preservação refere-se às ações preventivas, nossa primeira vertente. De maneira que as ações de restauração compõem uma disciplina totalmente independente. Seja como for, apesar das divergências terminológicas, não há como negar a existência de ambas as vertentes. Note-se que até aqui estamos falando da preservação de documentos em suportes tradicionais.

O surgimento do documento digital e sua importância, cada vez maior, no mundo contemporâneo, trouxe muitos novos desafios. Inclusive para sua preservação.

É curioso notar inclusive que, se pesquisarmos os trabalhos de autores e especialistas que trabalham com a preservação de documentos tradicionais, não encontramos referências à preservação de documentos digitais. No máximo, encontramos alguns autores que tratam da preservação de documentos eletrônicos mais antigos, do ponto de vista de hoje, como fitas magnéticas. E, ainda assim, são procedimentos de manutenção das condições climáticas dessas fitas em salas e mobiliários especiais.

A preservação digital nasceu e tem crescido como uma disciplina totalmente independente da preservação tradicional. Inclusive com novos grupos de pesquisa, novas linhas de atuação e, claro, novos problemas.