PRESERVAÇÃO DIGITAL NA AP: O PAPEL DO ÓRGÃO DE GESTÃO DA POLÍTICA ARQUIVÍSTICA NACIONAL Francisco Barbedo (Direcção-Geral de Arquivos)
[email protected] Resumo A preservação digital consiste em assegurar a médio e longo prazo a perdurabilidade, de forma autêntica, evidencial e inteligível, dos documentos produzidos electronicamente pela AP. Actualmente assiste-se a uma forte proliferação de iniciativas no âmbito do Governo Electrónico que implicam a desmaterialização da informação. No entanto não existem medidas que acautelem a preservação da informação agora desmaterializada. O IAN/TT defende a elaboração participada de uma estratégia nacional para a preservação digital que proporcione soluções integradas para este problema considerando as mútiplas vertentes implicadas. Neste contexto o projecto RODA pretende propor possibilidades de carácter técnico e tecnológico que poderão servir de base para a futura construção de um Repositório Digital para a AP
1. Definição e âmbito do problema O documento electrónico, devido a um conjunto de características bem conhecidas, não é um objecto perene. Depende de um sistema intermediário para ser criado, compilado e lido, sistema esse sujeito à volatilidade do mercado informático, o que o torna rapidamente obsoleto e portanto inutilizável. Nessa condição, o documento electrónico não serve qualquer propósito: deixa de ter utilidade para a organização produtora pondo mesmo em causa direitos e valores como a transparência da Administração e o direito de acesso do cidadão (ver Lei 65/93 de acesso aos documentos da administração). A organização constata que informação probatória e indispensável para assegurar o seu posicionamento no ambiente externo, desaparece –ou torna-se tecnologicamente obsoleta, (o que corresponde a um desaparecimento virtual mas objectivo!) antes do seu período de tempo de vida operacional terminar. Esta situação torna-se particularmente grave se atendermos ao facto que na AP não existem de forma generalizada sistemas específicos de gestão de documentos capazes de lidar com a problemática da preservação digital . O conceito de utilização de documento sob a forma de objecto digital é reduzido à sua aplicação imediata, descurando soluções para a utilização administrativa prolongada. O problema também se coloca mais a jusante, nas instituições especializadas de arquivo que acabavam por receber, normalmente no fim da linha e de forma reconhecidamente incontrolada, as toneladas de papel considerado dispensável pelas organizações produtoras. Acontece que no caso de informação digital o problema é diferente: como receber, gerir e acessibilizar quantidades consideráveis de terabites produzidos em variados formatos em muitos casos proprietários e sem possibilidade de migração? Neste cenário o objecto digital ou não chega aos arquivos definitivos (é eliminado ou
1
desaparece naturalmente no processo de evolução tecnológica da organização produtora) e portando à consulta do utilizador secundário, ou então, chega num estado obsolescência tecnológica- que não permite a sua utilização. No contexto digital a informação deixa de se materializar num objecto discreto sendo antes fragmentada e modularizada. Os sistemas de bases de dados são disso um exemplo clássico: pelo facto de constituírem entidades complexas não deixam de produzir e armazenar dados e informação capazes de constituir prova de transacções organizacionais (veja-se por exemplo o SIC) e por consequência corresponder ao conceito de documento de arquivo. Mesmo um objecto digital aparentemente uniforme e discreto como um documento produzido com software de texto contém diversas componentes algumas das quais dependentes do próprio sistema operativo (por exemplo as fontes.) A informação produzida na AP pelo facto de ser electrónica não é excluída do universo da informação de arquivo. Desde que a funcionalidade primária da informação resida na prova ou suporte evidencial a transacções (independentemente da granularidade e desagregação da informação), deverá ser inequivocamente incluída no universo do sistema de arquivo organizacional. Nessa condição os mesmos princípios e disposições legais lhe são aplicáveis, nomeadamente a eliminação e a preservação da informação com valor social e histórico 1 . Neste contexto o problema reside em não existirem estruturas especializadas com as competências e recursos indispensáveis para recepcionar e gerir essa informação que, inevitavelmente irá sendo produzida em maior quantidade. No actual cenário da AP, nem as organizações produtoras nem as instituições de arquivo definitivos têm hábitos, técnicas, recursos para lidar como objectos digitais numa perspectiva de médio/longo prazo. 2 Um aspecto exemplar: documentos autenticados através de assinatura digital A assinatura digital introduzida no sistema legislativo nacional através de um pacote de diplomas que definem os seus princípios e regulamentam a sua aplicação, constitui um meio de autenticação digital em princípio equiparável à autenticação através de assinatura convencional. Este aspecto é desde logo redutor visto que o objecto electrónico tem propriedades e comportamentos diferentes do seu equivalente analógico pelo que acrece de contextos jurídicos que ae adequem a esse facto Logo à partida a capacidade de autenticação de um documento conferida por este processo não se pode considerar como completa visto que não estabelece a identidade do objecto autenticado. Enquanto que em suporte papel este efeito é naturalmente conseguido pela visibilidade imediata dos caracteres e articulação de elementos de validação e de identificação nomeadamente através de códigos de classificação ou número de registo, em ambiente electrónico tais símbolos não são perceptíveis. Sem ser inequivocamente estabelecida a identidade do documento a sua autenticidade encontra-se comprometida. Tal como sem a existência de um certificado digital que associe autoritariamente a assinatura digital a um determinado indivíduo esta carece de valor probatório.
1 Ver por exemplo Decreto-lei n.º 447/88, de 10 de Dezembro, Decreto-Lei nº 16/93, de 23 de Janeiro, Lei nº 107/2001, de 30 de Agosto de 2001. (textos disponíveis em www.iantt.pt )
2
Um segundo aspecto refere-se à incapacidade da assinatura digital conferir autenticidade ao documento assinado. Esta propriedade difere da autenticação que consiste num processo de validação de um documento o qual à partida pode não usufruir do atributo de autenticidade. É interessante referirmos uma das propriedades previstas no Código Civil para a comferância deste estado a um documento, as quais são de resto equivalentes às propriedades diplomáticas de autenticidade. “O documento só é autêntico quando a autoridade ou oficial público que o exara for competente, em razão da matéria e do lugar, e não estiver legalmente impedido de o lavrar (Artigo 369º Código Civil)” “Presume-se que o documento provém da autoridade ou oficial público a quem é atribuído, quando estiver subscrito pelo autor com assinatura reconhecida por notário ou com o selo do respectivo serviço. lavrar (Artigo 370º Código Civil)” No segundo caso a assinatura digital responde eficazmente na medida em que garante, desde que comprovado por certificado emitido por entidade certificadora, a associação de uma assinatura digital com um determinado indivíduo. No entanto não consegue produzir efeito no primeiro caso. Isto significa que um documento pode ser assinado digitalmente por um indivíduo que efectivamente disponha desse meio de validação mas que no entanto não possua dentro da organização de competências próprias para o fazer. A assinatura digital 2 do ponto de vista de preservação digital oferece dificuldades acrescidas: Constitui uma camada suplementar de software que tem de ser preservado. Como referi a preservação digital implica a periódica migração da informação para formatos actualizados. Quanto mais camadas de software diferenciado existirem associadas a um documento electrónico maior é a complexidade induzida no processo de preservação. Este facto é semelhante ao que se passa em imagens às quais tenha sido acrescentado um esquema de compressão. A assinatura digital detecta qualquer alteração na nível físico ocorrida no documento assinado. Essa alteração manifesta-se ao nível físico e não lógico, pelo que a menor alteração ao nível de bit produzirá como efeito a perda de validação do documento. Note-se que esta alteração pode ser devida a ocorrências espontâneas de deterioração de bits, facto relativamente frequente em suportes de armazenamento 3 . Do ponto de vista de preservação e médio/longo prazo é necessário migrar o documento electrónico para formatos subsequentes da aplicação em que foi produzido ou para formatos de preservação normalizados e consequentemente mais estáveis. Este processo no entanto implica alteração física do documento o que redunda automaticamente na perda da autenticação concedida pela assinatura digital. Tal diminui inevitavelmente a força probatória original do documento. A assinatura digital foi pensada para ser utilizada de forma imediata descurando obviamente a necessidade mediata de conservação de um documento cuja força probatória deve ser preservada por períodos alargados de tempo. O artigo artº 34º alº a) do Decreto Regulamentar 25/2004 de 15 de Julho mostra preocupação sobre este problema apontando como solução a reassinatura do documento
Para o efeito desta comunicação quando referimos assinatura digital estamos a considerar a modalidade de assinatura electrónica qualificada (artº 2º alª g) do Decreto-Lei 62/2003) 3 Por exemplo em sistema RAID emque são implementados dispositivos de correcção de alteração de bits. 2
3
“…nos casos em que estes sejam necessários, na forma assinada, por um período de tempo superior à validade dos algoritmos e parâmetros associados utilizados na geração e verificação da assinatura;” O artigo 35ºdo mesmo diploma especifica ainda que: “A nova assinatura referida na alínea a) do artigo anterior deve ser gerada com os algoritmos e parâmetros associados adequados e incluir as assinaturas anteriores, assim como validação cronológica.” No entanto a solução 4 apontada pelo legislador, apresenta dois problemas que não são abordados e para os quais nenhuma solução é apontada 5 : 1/a impossibilidade de aceder ao documento original caso este não seja alterado e a perda de valor probatória resultante da automática perda de validade da assinatura digital mediante a superveniência desse mesmo facto. 2/ a necessidade de preservar não apenas as anteriores assinaturas digitais mas também todos os passos dos processos de certificação que lhes deram origem, incluindo o respectivo software e hardware utilizados para o efeito. Com efeito considera-se boa prática a promoção da auto-suficiência de arquivos digitais, ie, a sua independência relativamente a sistemas externos, naturalmente sujeitos a regras raramente consentâneas com a perenidade da preservação digital. A actual legislação 6 prevê prazos de conservação mínimos de 20 anos para toda a documentação, seja ele electrónica ou em papel, relativa ao processo de certificação. Prevê ainda que caso as entidades certificadoras, por qualquer razão, cessem a sua actividade, deverão transferir essa documentação para a entidade credenciadora. No entanto a legislação que regulamenta esta última entidade 7 em nada prevê a sua competência funcional para funcionar enquanto arquivo digital capaz de exercer acções de preservação temporalmente alargada sobre o material digital sob a sua eventual custódia. Da mesma forma nada é previsto relativamente aos documentos electrónicos certificados cujo interesse histórico e social justifique a sua conservação permanente. 3 O papel do órgão de gestão da Política Arquivística Nacional (PAN) Considerando todos os factos apresentados e atendendo à legislação vigente aplicável, nomeadamente a Lei orgânica do IAN/TT (decreto-lei n.º 60/97, de 20 de Março) particularmente os seus artigos 2º e 3º sobre atribuições e competências e em consonância com o regime geral dos arquivos e do património arquivístico (DL 16/93 de 23 de Janeiro) e a Lei de bases da política e do regime de protecção e valorização do património cultural (Lei n.º 107/2001, de 8 de Setembro), considerou-se que ao IAN/TT enquanto órgão do governo para executar a política arquivística nacional compete a reflexão e construção de ferramentas que viabilizem a inclusão da informação electrónica produzida na AP nos programas de salvaguarda patrimonial. É importante destacar que ao desenvolver mecanismos de preservação digital são servidos dois interesses (stakeholders); as organizações produtoras que necessitam de Esta solução foi equacionada no contexto da Comissão Europeia (European Electronic Signature Standardisation Initiative),conjuntamente outras possíveis soluções tais como a criação de entidades arquivistícas certificadas ou utilização de formatos canónicos. 5 Podem-se ainda considerar problemas de natureza prática e jurídica; no primeiro caso pode não interessar ao autor da assinatura digital inicial revalidar o documento ou pode inclusivamente este ter falecido. No segundo caso podemos interrogar-mo-nos se uma nova assinatura aposta ao documento anos depois da transacção ter ocorrido será legalmente admissível ou terá idêntica força probatória. 6 Decreto Regulamentar 25/2004 de 15 de Julho 7 Decreto-Lei 116-A/2006 de 16 de Junho 4
4
preservar informação digital durante períodos tempo mais dilatados e as instituições especializadas de arquivos que têm como objectivo a salvaguarda e difusão de informação electrónica patrimonial relevante. A preservação digital implica a elaboração de uma estratégia nacional que contemple integradamente todos os problemas s possíveis soluções aplicáveis sistematicamente às situações desenvolvidas no âmbito de Governo Electrónico. Esta estratégia assenta em respostas a ser dadas nos domínios técnicos e tecnológicos, económicos e organizacionais.
Do ponto de vista económico e financeiro que deverá indicar soluções para suportar os custos associados à manutenção de um arquivo digital! É necessário assegurar recursos humanos muito especializados; equipamentos sofisticados com uma curva de amortização curta; instalações adequadas para a preservação digital. Além disso um arquivo digital é uma estrutura dinâmica em constante evolução de forma a adequar-se permanentemente às rápidas novidades tecnológicas e descobertas provenientes da investigação científica. Há portanto que definir um modelo de financiamento viável e realista que suporte este conjunto de necessidades. O relacionamento com os futuros clientes primários e secundários desta estrutura terá que ser igualmente alvo de reflexão. O princípio de utilizador/pagador não tem sido um modelo utilizado no âmbito da cultura em Portugal. No entanto e redefinição deste modelo terá eventualmente que ser readmitido como parte da solução.
O aspecto organizacional implica esclarecer o modelo de implantação a nível nacional de uma estrutura deste tipo, atendendo à massa crítica disponível comparada com os recursos e custos anteriormente identificados
Os pontos de vista técnicos (arquivísticos) e tecnológicos (informáticos) passam pela construção de arquivos digitais.
O Arquivo Digital é uma estrutura que compreende tecnologia, recursos humanos e um conjunto de políticas para incorporar, gerir e acessibilizar numa perspectiva continuada objectos digitais de natureza arquivística. A informação de arquivo distingue-se de qualquer outra pelo facto de ser produzida com o propósito primário de constituir prova de uma actividade organizacional. Por esse facto a sua estabilidade e perenidade têm que ser asseguradas de forma a garantir as suas propriedades básicas - integridade, fidedignidade e autenticidade - ao longo do tempo:. Ainda neste sentido aspectos como o contexto de produção de manutenção do documento electrónico é da maior importância para garantir as qualidades referidas. Em ambiente tradicional, a preservação destes atributos é normalmente assegurada pela garantia da sua inalterabilidade. Naturalmente, quando em ambiente digital, esse conceito perde razão de ser optando-se antes por nos referirmos a “alterabilidade controlada”. Ou seja: sabe-se que o objecto digital vai necessariamente alterar-se ao longo do tempo, pretende-se saber o que é alterado e quando é alterado, preferencialmente podendo-se assegurar um certo controlo sobre as componentes que serão alteradas. 3.1 O projecto RODA O IAN/TT tem seguido com atenção as iniciativas empreendidas na área de preservação digital tanto a nível internacional como também em Portugal nas medidas políticas relativas ao governo electrónico. As iniciativas governamentais no âmbito da utilização
5
estratégica das novas tecnologias ao serviço do cidadão e da administração pública sofreram um salto quantitativo e qualitativo. Este avanço materializa-se na produção de diversas medidas enquadradoras e promotoras: pacotes legislativos específicos como é o caso do conjunto de diplomas relativos à assinatura digital , considerando no entanto a reconhecida inadequação dos mesmos à preservação a longo prazo de objectos digitais e necessidade de formular outras disposições legislativas como por exemplo sobre o património arquivístico “informático”; a constituição de organismos especialmente vocacionados para a promoção e acompanhamento de medidas específicas (UMIC, UCMA); a abertura de eixos de apoio financeiro directamente vocacionados para o desenvolvimento de oferta no contexto de um novo conceito social, profissional, económico e cultural enraizado nas novas tecnologias. Neste momento a situação de reforma estrutural da AP, nomeadamente a concentração nas Secretarias Gerais das áreas comuns em que inserem os processos de arquivo constitui uma oportunidade propícia ao desenvolvimento do conceito de arquivo digital. Refiro conceito, porque se trata de uma iniciativa que necessita de ser “vendida” para obter a suficiente adesão e consequente massa crítica dos organismos públicos para que se tornar efectivamente viável. No contexto acima descrito a criação de um repositório de objectos digitais de arquivo dirigido para a AP que assegure a recepção, gestão e acessibilização dos objectos digitais correntemente produzidos na AP que receba das instituições produtoras, de acordo com regras definidas e precisas, os objectos digitais (ou documentos electrónicos ou sistemas de informação de arquivo) considerados como de interesse histórico e que tenham perdido o seu valor administrativo e/ou capacidade operativa, tornou-se um propósito atingível porque consentâneo com a conjuntura política vigente. O IAN/TT candidatou ao POAP um projecto designado de “Gestão Documental e Memória na AP”, cujo financiamento foi recentemente aprovado por este Programa, em que se propõe como objectivos: 1/ a elaboração de um modelo conceptual e lógico de uma estrutura de arquivo digital, compreendendo análise estática de topo e dinâmica de processos de gestão e preservação digital; 2/ a concretização de um protótipo de arquivo digital de acordo com o ponto anterior que considere integração, gestão e acessibilização dos objectos digitais sob sua gestão; 3/ a elaboração de ferramentas informáticas de preservação digital para assegurar a preservação de objectos digitais num horizonte de curto/médio prazo pelas organizações produtoras; 4/ a definição de políticas, regras e recomendações para: incorporar objectos digitais, acessibilizar objectos digitais; 5/ a criação de competências técnicas e organizacionais em preservação digital. O desenvolvimento deste projecto, iniciado em Março deste ano e baptizado de RODA (Repositório de Objectos Digitais Autênticos), prolongar-se-à até Abril de 2007. A continuidade deste projecto já foi planeada embora careça da obtenção dos recursos indispensáveis. O fluxo de desenvolvimento do RODA prevê a criação dos seguintes produtos agrupados em 3 períodos temporais: 1 a análise de esquemas de meta-informação utilizáveis no repositório, 2/ a elaboração dos requisitos funcionais ; 3) a definição d modelo conceptual, lógico e de dados; 4/ a definição das taxionomias de objectos digitais a serem integrados nesta primeira fase; 5/ o desenvolvimento de componentes funcionais e gráficas do protótipo.
6
O desenvolvimento o RODA foi equacionado a partir dos principais documentos normativos e recomendativos produzidos internacionalmente e que constituem ferramentas estruturais para o desenvolvimento de produtos internacionais no domínio da preservação digital. Foram também referenciadas e analisadas as experiências desenvolvidas nesta área, sendo analisadas as consideradas mais relevantes para o projecto. Tratando-se de um protótipo destinado a provar um conceito de arquitectura técnica e tecnológica para preservação digital não irão ser integralmente desenvolvidas todas estas funcionalidades. Nesta perspectiva decidiu-se o seguinte plano de desenvolvimento: 1/ o processo de ingestão, que implica uma interface intuitiva para interactuar como o cliente que pretende integrar objectos digitais, irá ser inteiramente desenvolvido. Esta tarefa já foi iniciada, tendo sido desenhado e documentado o respectivo diagrama de actividades e iniciada a programação baseada em experiências já existentes a nível internacional. 2/ o processo de gestão de Objectos Digitais em que o projecto focará a sua atenção na gestão de eventos, ou seja a especificação de eventos-tipo para a realização de qualquer acção sobre o material custodiado 3/ o processo de disseminação relativamente ao qual apenas se irá propor a pesquisa simples e a recuperação do Objecto Digital sem funcionalidades específicas de visualização. Tendo em consideração as limitações impostas pela natureza do projecto apenas serão considerados nesta primeira fase as seguintes taxonomias de Objectos Digitais; 1/ Texto estruturado, com ou sem imagens e/ou tabelas, 2/ imagens fixas não vectoriais 3/ bases de dados relacionais. A continuidade esperada deste projecto a partir de Abril de 2007, trará a análise e inclusão de outras taxionomias de objectos digitais avaliadas em função da sua disseminação na AP. A plataforma de desenvolvimento escolhida foi o Fedora 8 , adoptada por se tratar de software livre e por proporcionar um conjunto de serviços destinados a desenvolver ferramentas de preservação digital. Esta escolha culminou um processo de análise e teste intensivo realizado durante o mês de Agosto em que foram comparadas diversas plataformas existentes no cenário internacional dentro desta área funcional. Resta dizer que se prevê a colaboração de alguns organismos da AP através da cedência de material que será utilizado eventualmente pelo RODA para testar as funcionalidades desenvolvidas. Esperamos a partir de Janeiro de 2007, iniciar a apresentação de alguns aspectos do conceito desenvolvido que na nossa perspectiva permitem lançar as bases para uma preservação digital efectiva na AP. O IAN/TT mantém com o apoio do Departamento de Informática da Universidade do Minho, um sítio web 9 em que são colocados todos os documentos produzidos no projecto assim como links e eventos relacionados com esta temática. 4. Conclusão 8 9
http://www.fedora.info/ http://roda.iantt.pt/
7
A preservação e gestão de objectos digitais é neste momento uma prioridade estratégica do IAN/TT de acordo com uma filosofia renovada de prestação de serviços ao exterior baseada na qualidade. Trata-se no entanto de um processo complexo envolvendo muitas variáveis que obrigam a um planeamento e execução detalhadas. Constata-se igualmente ausência de consideração de medidas relativas a preservação digital nas múltiplas inciativas inseridas no contexto do Governo Electrónico. O IAN/TT enquanto órgão executivo da política arquivística nacional aposta na elaboração de uma estraegia global para a presevração digital em Portugal, desenvolvida em conjunto com a AP e com diferentes áreas de conhecimento, susceptívelde apresentar soluções que integrem as componentes económica, organizacional, técnica e tecnológica. Nesta última vertente o projecto RODA (Repositório de Objectos Digitais Autênticos) apoiado pelo POAP esta a ser desenvolvido pelo IAN/TT com a colaboração do Departamento de Informática da Universidade do Minho e pretende desenvolver um protótipo de arquivo digital até Abril de 2007 em que serão exaustivamente testados funcionalidades que devem estar presentes na aplicação dos princípios e na prática da preservação digital seja esta direccionada para a informação operacional das organizações para a salvaguarda da memória documental da AP.
XXXXXXX Francisco Barbedo Coordenador do Gabinete de Estudos e Arquivos Correntes (GEAC) IAN/TT Tel. 21 781 15 00 (ext. 12254) email:
[email protected]
8