Preservação da Dimensão Lógica

Share Embed


Descrição do Produto

Isabel Tootill 110793052 Rita Fontelo 110793038

A Preservação da dimensão “lógica” Docente Maria Manuela Gomes de Azevedo Pinto

Faculdade de Letras da Universidade do Porto Licenciatura em Ciência da Informação 1º Semestre

Ano Letivo 2014/2015

Faculdade de Letras da Universidade do Porto Preservação e Conservação

Isabel Tootill 110793052 Rita Fontelo 110793038

A Preservação da dimensão “lógica” Docente Maria Manuela Gomes de Azevedo Pinto

Faculdade de Letras da Universidade do Porto Licenciatura em Ciência da Informação 1º Semestre

08 – A Preservação da dimensão “lógica” (formatos e diretórios de formatos; normas: ISO 19005-1:2005 – Document management. Electronic document file format for long-term preservation. Part 1: Use of PDF (PDF/A), ISO/IEC PRF 26300:2006 - Information technology. Open Document Format for Office Applications (OpenDocument) v1.0 …; ver versão 9.1 da biblioteca de software "libjpeg“ novo formato jpg sem perda

Ano Letivo 2014/2015 2

Faculdade de Letras da Universidade do Porto Preservação e Conservação

Lista de ilustrações Figura 1 - A preservação como vertente da GI no âmbito da CI.................................. 11 Figura 2 - A pluridimensionalidade a preservar ........................................................... 13 Figura 3 - Da dimensão lógica à dimensão conceptual ............................................... 14 Figura 4 - Esquematização do comportamento de um software emulador .................. 17 Figura 5 - Esquemitazação da migração a pedido ...................................................... 18

3

Faculdade de Letras da Universidade do Porto Preservação e Conservação

Lista de Tabelas Tabela 1 - Descrição e exemplos das diferentes categorias de meta-informação ....... 21 Tabela 2 - Extensões ODF mais utilizadas ................................................................. 22 Tabela 3 - Os 17 capítulos da ISO/IEC 26300:2006 ................................................... 23 Tabela 4 - As três partes da ISSO 19005.................................................................... 26 Tabela 5 - As vantagens e desvantagens do uso do PDF ........................................... 30

4

Faculdade de Letras da Universidade do Porto Preservação e Conservação

Resumo analítico A Preservação da Dimensão Lógica dos objetos digitais visa garantir a mediação entre a dimensão física – o ficheiro presente no hardware – e a dimensão conceptual – o que é apresentado ao utilizador – associando-a à garantia da longevidade pretendida. Para um maior aprofundamento e melhor compreensão teórica do tema é feita uma abordagem da relação da Preservação com a Gestão da Informação; dos tipos de estratégias para atingir essa Preservação, incluindo as suas vantagens, problemas e contingentes; das especificações técnicas e objetivos relativos os tipos de formatos ODF, PDF e JPEG; e ainda, da Biblioteca Libjpeg e dos diretórios de formatos PRONOM, JHOVE e PLATO.

Palavras-Chave: Preservação Digital; Preservação da Dimensão Lógica; Dimensão Lógica; Estratégias de Preservação; Meta-informação; ODF; PDF; JPEG; Biblioteca Libjpeg; Diretórios de Formato; PRONOM; JHOVE; PLATO;

5

Faculdade de Letras da Universidade do Porto Preservação e Conservação

Abstract The Preservation of Logic Dimension of digital objects aims to ensure mediation between the physical dimension – file in the hardware – and the conceptual dimension – what is presented to the user – linking it to the guarantee of the desired longevity. For further development and better theoretical understanding of the subject other approaches are made: the relationship between Preservation and Information Management; the types of strategies to achieve this Preservation, including its advantages, problems and contingent; the technical specifications and objectives of the formats ODF, PDF and JPEG; and finally, the Libjpeg Library and the directories format PRONOM, JHOVE and PLATO.

Key-Words: Digital Preservation; Preservation of the Logical Dimension; Logical Dimension; Preservation Strategies; Meta-information; ODF; PDF; JPEG; Libjpeg Library; Directories Format; PRONOM; JHOVE; PLATO;

6

Faculdade de Letras da Universidade do Porto Preservação e Conservação

Índice LISTA DE ILUSTRAÇÕES

3

LISTA DE TABELAS

4

RESUMO ANALÍTICO

5

ABSTRACT

6

1. INTRODUÇÃO

9

2. ENQUADRAMENTO TÉCNICO, TEÓRICO E CONCEPTUAL

11

2.1. A PRESERVAÇÃO COMO VERTENTE DA GI NO ÂMBITO DA CI 2.2. A PLURIDIMENSIONALIDADE DA INFORMAÇÃO EM MEIO DIGITAL 2.3 A PRESERVAÇÃO DA DIMENSÃO LÓGICA

11 12 13

3. OS FORMATOS

15

3.1. O QUE É UM FORMATO? 3.2. FORMATOS PROPRIETÁRIOS/FECHADOS E NÃO PROPRIETÁRIOS/ABERTOS

15 15

4. FORMATOS: PROBLEMAS E ESTRATÉGIAS DE PRESERVAÇÃO

15

4.1. CONSERVAÇÃO DE HARDWARE/SOFTWARE 4.2. EMULAÇÃO 4.3. REFRESCAMENTO 4.4. ENCAPSULAMENTO 4.5. MIGRAÇÃO E PRESERVAÇÃO DE FORMATOS 4.5.1. MIGRAÇÃO A PEDIDO 4.5.2. MIGRAÇÃO DISTRIBUÍDA 4.5.3. TRANSFERÊNCIA PARA SUPORTE ANALÓGICO 4.5.4. ATUALIZAÇÃO DE VERSÕES 4.5.5. CONVERSÃO PARA FORMATOS CONCORRENTES 4.5.6. NORMALIZAÇÃO 4.5.7. CONVERSÃO PARA XML 4.6. META-INFORMAÇÃO DE PRESERVAÇÃO DIGITAL

16 16 17 18 18 18 19 19 19 19 19 20 20

5. FORMATOS ABERTOS

22

5.1 ODF E A ISO/IEC 26300:2006 – INFORMATION TECHNOLOGY. OPEN DOCUMENT FORMAT FOR OFFICE APPLICATIONS (OPENDOCUMENT) V1.0 22 7

Faculdade de Letras da Universidade do Porto Preservação e Conservação 5.2. PDF E SUAS VARIANTES 23 5.2.1. PDF/A E SUAS VARIANTES 24 5.2.1.1. ISO 19005-1:2005 – Document management. Electronic document file format for longterm preservation. Part 1: Use of PDF (PDF/A) 27 5.2.2. PDF/E 27 5.2.3. PDF/X 28 5.2.4. PDF/UA 28 5.2.5. PDF/VT 29 5.3. VANTAGENS E DESVANTAGENS DO PDF 29 6. A BIBLIOTECA DE SOFTWARE LIBJPEG

30

6.1. USO DA LIBJPEG 6.2. A SUA EVOLUÇÃO 6.3. O NOVO FORMATO JPEG (.JPG)

30 31 32

6. DIRETÓRIOS DE FORMATOS

32

7.1. PRONOM 7.2. JHOVE 7.3. PLATO (SERVIÇO DE MIGRAÇÃO)

32 33 33

7. CONCLUSÕES

35

8. REFERÊNCIAS BIBLIOGRÁFICAS

36

8

Faculdade de Letras da Universidade do Porto Preservação e Conservação

1. Introdução Desde o início da escrita – comummente aceite como os primórdios da civilização humana –, que o Homem, enquanto ser individual e social, tem necessidade de registar acontecimentos e ideias marcantes e preservar para o futuro esses mesmos registos. Assim sendo, é com a escrita que nasce a vontade, intenção e/ou necessidade de guardar o que se regista, para partilhar com outros, comunicar e deixar testemunho aos vindouros, de eventos e pensamentos que, de outro modo, não poderiam ser lembrados nem partilhados. A lenta evolução do ato de arquivar passa por três etapas fundamentais, sendo a primeira uma evolução natural, nascida de práticas empíricas, que foram acompanhando o desenvolvimento histórico-cultural das sociedades ocidentais, desde os seus alvores até à Época Contemporânea iniciada com a Revolução Francesa de 1789. A segunda etapa, que se inicia com este acontecimento histórico, tem um desenvolvimento muito mais acelerado, visto que o progresso das sociedades se tornou também muito mais rápido. A arquivística passa a ser submetida a um paradigma histórico-tecnicista, que mais tarde, lhe viria a conferir o estatuto de disciplina auxiliar de outras ciências, sobretudo da História. A terceira, e última etapa, a era pós-custodial, inicia-se no final do séc. XX, com a necessidade de encontrar um novo paradigma capaz de acompanhar o nascer de uma nova era – a era da informação – e de adaptar a metodologia arquivística à alteração que então surge: o objeto de estudo passa a ser o conteúdo informacional, em desfavor do documento físico. Na década de noventa, é então criado, no Canadá, o paradigma vigente: o paradigma científico-informacional. A Revolução Tecnológica teve início ainda no séc. XIX, tendo tido como catalisadores da sua proliferação o surgimento do ambiente digital e da internet nas duas últimas décadas. Hoje, no séc. XXI, vivemos em plena Era Digital e os conhecimentos de arquivística encontram-se sobre um domínio humano considerável, mas aquilo que podemos chamar de «arquivística digital», o que por conseguinte, inclui a preservação da informação presente no que é armazenado, é o que agora apresenta inúmeros e grandes desafios para o conhecimento científico da área da Preservação Digital e também uma certa urgência em adquirir esse mesmo conhecimento. Na primeira parte deste trabalho, correspondente ao ponto 1, será feita uma integração da Preservação como um conjunto de processos, sob uma perspetiva sistémica, na Gestão da Informação como uma das suas funções. Será ainda 9

Faculdade de Letras da Universidade do Porto Preservação e Conservação explicada a noção da pluridimensionalidade de um objeto digital, incidindo sobre a preservação da dimensão lógica. Na segunda parte, correspondente aos pontos 2, 3 e 4, é explicitada a noção de formato bem como as suas duas variantes: os formatos proprietários ou fechados e os formatos não proprietários ou abertos e também as estratégias de preservação existentes, com a sua descrição, o seu objetivo, o seu modus operandis, todas as suas vantagens e desvantagens, todos os seus problemas e contingentes, e a sua relação com as duas variantes de formato. A terceira parte, correspondente aos pontos 5, 6 e 7 trata-se de uma explicação detalhada do funcionamento de alguns formatos abertos (PDF, documentos ODF e a biblioteca Libjpeg), assim como das respetivas normas (ISO 19005-1:2005 e ISO 26300:2006). O último ponto trata os diretórios de formatos, especificamente o PRONOM, o JHOVE e o PLATO. Este trabalho termina com uma série de conclusões retiradas ao longo da sua realização assim como com uma extensa lista de referências bibliográficas utilizadas.

10

Faculdade de Letras da Universidade do Porto Preservação e Conservação

2. Enquadramento técnico, teórico e conceptual 2.1. A preservação como vertente da GI no âmbito da CI

Figura 1 - A preservação como vertente da GI no âmbito da CI

11

Faculdade de Letras da Universidade do Porto Preservação e Conservação Não pode ser difícil o entendimento da integração da preservação nas funções da GI (Gestão da Informação). Dado o volume de informação existente – e o seu constante aumento nos dias de hoje – a par da colossal importância de garantir que se lhe confere a longevidade necessária tendo em vista o acesso conveniente para satisfazer as necessidades informacionais de organizações, atividades ou processos, à luz da CI (Ciência da Informação), preservar é exponencialmente vital a uma correta efetivação de objetivos. Nasce, portanto, uma necessidade de existirem profissionais que invistam numa constante atualização consciencial face aos novos papéis a desempenhar, novas técnicas e metodologias, novos problemas e consequentemente novas soluções: já não se trata apenas da aplicação de procedimentos de conservação do suporte, é preciso garantir um acesso continuado à informação em formato digital. Nos primórdios dos tempos o suporte informacional era o próprio ser humano e a preservação da informação era inconscientemente confinada à transmissão oral, através da linguagem. Este nível básico e primitivo da preservação faz com que a influência do aparecimento da escrita sobressaia na História da preservação gritantemente pois passa a existir forma de representar conteúdos: um sistema de representação. Eram representados em suportes físicos não só atos do quotidiano, burocracias económicas e etc. mas também os conhecimentos adquiridos, e toda esta informação necessitou de preservação e proteção constante e com constante evolução teórica e técnica contra as ameaças que lhe eram atribuídas. A Era digital, na qual existe todo um novo rol de formatos para (aprender a) preservar, detém a grande vantagem de ser uma eficaz alternativa de armazenamento e de haver uma garantia mais tranquilizante quanto ao acesso continuado, mas não carece de menos progressão… até porque, desta sobreposição temporal da Era de Informação e da Era Digital emerge um conceito de preservação convocado por estes novos formatos: A Pluridimensionalidade a Preservar.

2.2. A pluridimensionalidade da informação em meio digital Observe-se a explicitação da pluridimensionalidade da informação através do seguinte esquema1:

1

PINTO, Maria Manuela Gomes de Azevedo (2013) – Pluridimensionalidade a preservar. 2013, esquema retirado de PINTO, Maria Manuela Gomes de Azevedo (2013) – Gestão de Documentos e meio digital: um posicionamento urgente e estratégico. Porto: Universidade do Porto/CETAC.MEDIA, Portugal. P. 14 Esta publicação foi feita no âmbito do 3º Seminário de Estudos da Informação, tendo este, como assuntos a Gestão do Conhecimento, a Gestão da Informação e a Gestão de Documentos em Contextos informacionais.

12

Faculdade de Letras da Universidade do Porto Preservação e Conservação

Figura 2 - A pluridimensionalidade a preservar

Posta esta esquematização, assume-se que as unidades de informação em meio digital convocam três dimensões: A dimensão física, que corresponde às inscrições registadas no suporte físico, interpretáveis pelo hardware (ex: CD); A dimensão lógica, que se trata da mediação entre a dimensão física e a dimensão conceptual, entre o hardware e o utilizador, que acaba por corresponder à estruturação fornecida por um formato: a maneira como os dados estão estruturados para serem interpretados pelo software pretendido (ex: PDF); A dimensão conceptual, que diz respeito à transformação dos sinais digitais em analógicos de modo a construírem na mente do recetor a ideia/sentimento/imagem pretendidos (ex: Texto);

2.3 A preservação da dimensão lógica Para melhor compreendermos a preservação da dimensão lógica de um objeto digital, temos de consciencializar o facto de cada objeto duas ter componentes digitais: a dimensão lógica e a dimensão física. Estas componentes têm de ser recuperáveis para que possa ser feita a reconstituição da dimensão concetual do objeto, ou seja, para que possamos visualizar o objeto conforme é suposto.

13

Faculdade de Letras da Universidade do Porto Preservação e Conservação Para preservar a dimensão lógica de um documento devemos ter presente a ideia de que esta não diz apenas respeito aos ficheiros que contêm conteúdos do documento. Se tomarmos os simples exemplos das bibliotecas de fontes ou das folhas de estilo para HTML, apercebemo-nos que estas podem conter informação necessária para a estruturação da apresentação do documento a nível concetual ao utilizador. Posto isto, é percetível o porquê de termos de garantir a sua correta associação ao objeto digital.

Figura 3 - Da dimensão lógica à dimensão conceptual

Tomando novamente um exemplo, desta vez de um documento word, compreenderemos como é feito o armazenamento da dimensão lógica. Se um documento word for muito grande pode ser armazenado em divisões de subdocumentos, juntamente com outro ficheiro que defina como deve ocorrer a sua conjugação, ainda que estejam armazenados em ficheiros separados. A dimensão lógica do documento, ainda que se divida em vários ficheiros, deve ser armazenada, por uma questão de eficiência de armazenamento, num único ficheiro físico: armazenamento da dimensão lógica é feito a nível físico. No entanto, ela pode ser armazenada em ficheiros físicos separados, correspondendo cada um tipo de estruturação de dados diferente: isto é indiferente a nível lógico desde que os ficheiros, em output, estejam na localização conveniente. Para uma preservação correta da dimensão lógica temos de ter conhecimento dos requisitos de processamento da estruturação de dados de cada objeto e que software pode processá-los corretamente.

14

Faculdade de Letras da Universidade do Porto Preservação e Conservação

3. Os formatos 3.1. O que é um formato? A definição de formato pode resumir-se, muito sumariamente, como a forma de organização de dados para apresentação, armazenamento ou impressão. É um agregador de informação passível de ser armazenado como ficheiro de dados. Um formato tem dois lados da estruturação de dados que lhe dizem respeito: tanto a estruturação de dados que é passível de ser interpretada por um ou mais softwares, como a estruturação de dados resultante que é a nova estruturação conferida a um objeto digital como marca da intervenção de um software.

3.2. Formatos proprietários/fechados e não proprietários/abertos Um Formato Proprietário ou Formato Fechado trata-se do tipo de formato que é coberto por uma patente ou copyright. Os formatos desta ordem não permitem ao utilizador recuperar a informação estruturada à luz dos seus requisitos sem ser através do software produtor, pois só este tem a capacidade de ler os dados do ficheiro corretamente. Isto ocorre porque a estruturação predefinida dos dados não são públicas, ou seja, não são dadas a conhecer a comunidade utilizadora. Esta barreira

de

desconhecimento

da

estruturação

coloca

muitas

limitações

à

2

interoperabilidade . Um Formato Não Proprietário ou Aberto é o absoluto oposto do suprarreferido. As estruturas de dados destes softwares são conhecidas pelo utilizador, concedendo assim a interoperabilidade entre diferentes softwares: podendo um documento ser manipulado tanto por softwares não-proprietários como proprietários.

4. Formatos: problemas e estratégias de preservação Para preservar um objeto digital e, por conseguinte, a sua dimensão lógica, é fulcral considerar o contexto em que foi criado, não só para que os utilizadores entendam o propósito da sua existência mas para que este seja um fator orientador da sua preservação. Nomeadamente para a definição do ciclo de vida do objeto, que é essencial como delimitador temporal de todo o processo de preservação. A incapacidade de assegurar a Preservação Digital a longo-prazo deve-se não só à ausência de normalizações a todos os níveis e aos formatos proprietários mas

2

Interoperabilidade – é a possibilidade de manipulação (execução de operações) de um mesmo ficheiro por diferentes softwares.

15

Faculdade de Letras da Universidade do Porto Preservação e Conservação também à falta de implementações de Planos de Preservação, devendo-se, este último, à falta de recursos humanos capazes de o fazer e aos custos que representam. Vejamos, em seguida, as estratégias de preservação existentes para combater estes problemas.

4.1. Conservação de hardware/software Esta estratégia é também conhecida como Preservação da Tecnologia e consiste na preservação de equipamentos e programas no seu estado original para garantir a leitura dos objetos criados no seu ambiente digital. Problemas: Põe-se a questão da gestão do espaço físico: se esta estratégia for adotada em todas as ocasiões o espaço que por norma existe destinado a maquinaria tecnológica não é suficiente. Se somarmos ao problema do espaço os custos de manutenção dessa mesma tecnologia (maquinaria ou softwares) pode dizerse que a estratégia é inviabilizada face à grande maioria de circunstâncias.

4.2. Emulação A emulação consiste na criação de programas emuladores, ou seja: a criação de

um

software

que

reproduza

as

funções

de

um

ambiente

digital

e,

consequentemente, que permite a reprodução de outros softwares criados a partir do ambiente produzido, como está ilustrado no seguinte esquema:

16

Faculdade de Letras da Universidade do Porto Preservação e Conservação

Figura 4 - Esquematização do comportamento de um software emulador Fonte: FERREIRA, Carla Alexandra Silva

Problemas: Esta estratégia enfrenta o problema da obsolescência: pois surge a necessidade de frequentes produções de novos emuladores; E ainda o problema dos conflitos de propriedade dos códigos programadores dos programas emuladores.

4.3. Refrescamento O refrescamento trata-se da transferência de informação de um suporte para outro, antes que o primeiro se torne obsoleto.3 No entanto, esta estratégia não pode ser aplicada apenas quando são detetados problemas de obsolescência: esta última deve ser sempre prevista, e, por conseguinte, o refrescamento deve tratar-se de uma medida preventiva e não de uma consequência de uma rutura. Problemas: a estratégia só resolve problemas de obsolescência de suporte. 3

FERREIRA, Miguel - Introdução à preservação digital: conceitos, estratégias e acuais consensos [em linha]. Guimarães: Escola de Engenharia da Universidade do Minho, 2006. P. 33-35. [Consultado em 04-10-2013]. Disponível em www: http://repositorium.sdum.uminho.pt/bitstream/1822/5820/1/livro.pdf ISBN 972-8692-30-7. ISBN 978-972-8692-30-8

17

Faculdade de Letras da Universidade do Porto Preservação e Conservação

4.4. Encapsulamento Esta estratégia visa preservar juntamente com o objeto digital toda a informação necessária para desenvolver, futuramente, conversores, emuladores e visualizadores que sejam convenientes.4 Problemas: Face à necessidade quotidiana de reduzir os volumes de informação armazenados, mas de armazenar e preservar a informação necessária, põe-se a questão: que informação preservar?

4.5. Migração e Preservação de Formatos Este grande grupo de estratégias trata-se da transferência periódica de materiais digitais, ou de uma configuração de hardware/software para outra, ou de uma geração computacional para a geração seguinte.5 Têm o objetivo de tornar o objeto digital mais compatível com tecnologias atuais e foca-se na preservação da dimensão concetual: preserva a integridade da informação e transfere dados para outros formatos para que possam ser copiados, recriados e atualizados.

4.5.1. Migração a Pedido Neste tipo de migração, as conversões são sempre aplicadas ao objeto original e não ao mais atual. O processo é visualizável na seguinte ilustração:

Tempo Figura 5 - Esquematização da migração a pedido

4

Idem, p.33 ARELLANO, Miguel Angel – Preservação de Documentos Digitais [em linha]. In Scielo. Vol. 33, Nº2 (Maio/Agosto 2004). P. 20-21. [Consultado em 23-12-2014]. Disponível em www: http://www.scielo.br/pdf/ci/v33n2/a02v33n2.pdf 5

18

Faculdade de Letras da Universidade do Porto Preservação e Conservação

4.5.2. Migração Distribuída A migração distribuída trata-se de todo o conjunto de serviços de conversão disponíveis na web, como é exemplo o TOM (Typed Objects Model). A existência desta rede global de conversores possibilita a redução de custos de preservação. Problemas: O volume de informação, os requisitos de largura de banda, a segurança dos dados e o tempo de transferência, são problemas que podem reduzir a eficácia da estratégia.

4.5.3. Transferência para suporte analógico Esta estratégia é a conversão de um objeto digital para suportes não digitais: o papel ou o microfilme. No entanto, e apesar de ser um modo segura para a aumentar a longevidade a informação visto que existe hoje maior domínio e conhecimento das estratégias deste tipo de preservação, este método não permite preservar registos de movimento. Problemas: O que faz com que a transferência para suporte analógico seja uma estratégia apenas adotada em última instância é o fato de só permitir preservar texto ou imagem, uma vez que em suportes analógicos não é possível desencadear movimento.

4.5.4. Atualização de versões Como é percetível, a estratégia de atualização de versões consiste na atualização de objetos digitais produzidos por um determinado software, recorrendo a uma versão mais atual do mesmo. É viável por existir aplicações de software às quais esta estratégia é inerente: objetos digitais de versões antigas são atualizados automaticamente quando manipulados por uma versão mais recente.

4.5.5. Conversão para formatos concorrentes A conversão para formatos concorrentes ao formato resultante do software produtor é uma estratégia que funciona como garantia de sobrevivência face a ruturas tecnológicas e face à descontinuidade de formatos. Devem ser evitados, logicamente, formatos proprietários.

4.5.6. Normalização A estratégia da normalização tem como objetivo padronizar formatos diferentes: quantos mais formatos controlados houver, serão mais os objetos digitais preservados à luz da mesma estratégia. Esta normalização das estratégias para 19

Faculdade de Letras da Universidade do Porto Preservação e Conservação preservar, que é consequente da homogeneização de formatos, contribui para a redução de custos de preservação. Para isto a escolha de formato de normalização tem de ser tanto conhecido pela comunidade como abrangido por normas internacionais acessíveis/consultáveis.

4.5.7. Conversão para XML O XML (Extensible Markup Language) é uma linguagem sobre estruturas de documentos e o seu significado. Favorece a interoperabilidade de um sistema e é uma linguagem passível de produzir documentos. Esta linguagem é, por si só, uma estratégia de preservação. É portável e não proprietário e pode usar-se em qualquer plataforma porque tem um padrão internacional

4.6. Meta-informação de preservação digital A meta-informação é informação sobre informação, uma maneira de administrar dados que confere maior longevidade à informação digital. A metainformação de preservação digital são registos de descrição, caraterísticas, contingentes e atividades passíveis de construir uma sequência lógica desde o momento em que a informação nasce até ao momento em que é integrada em repositórios. Existem cinco variantes da meta-informação: a meta-informação administrativa, a descritiva, a técnica, a de uso e a de preservação. Vejamos o seguinte quadro:

20

Faculdade de Letras da Universidade do Porto Preservação e Conservação

Categoria da meta-informação Meta-Informação Administrativa

Meta-Informação Descritiva

Meta-Informação Técnica

Meta-Informação de Uso

Meta-Informação de Preservação

Descrição

Exemplos

Informação de apoio à tomada Requisitos legais de acesso; de decisão Direitos de autor; Autorizações de reprodução e uso; Etc. Informação que descreve Dados identificadores: todas as caraterísticas do  Título objeto digital em questão  Autor  Data de publicação; Dados de organização intelectual:  Assunto(s); Etc. Informação relativa à estrutura Informação sobre do objeto hardware/software; Informação técnica:  Tamanho dos ficheiros  Formato; Informação sobre a digitalização:  Scanner utilizado; Etc. Informação relacionada com os Informação sobre exibição; recursos usados/a usar Informação sobre utilização; Informação sobre utilizadores; Etc. Informação que visa documentar a condição física dos recursos e as ações realizadas para a preservação de versões físicas e digitais dos recursos (p.e.: a migração). Abrange todas as estratégias suprarreferidas.

Tabela 1 - Descrição e exemplos das diferentes categorias de meta-informação

21

Faculdade de Letras da Universidade do Porto Preservação e Conservação

5. Formatos abertos 5.1 ODF e a ISO/IEC 26300:2006 – Information technology. Open Document Format for Office Applications (OpenDocument) v1.0 A

ISO

Internacional

de

(International

Organization

Standardização]),

em

for

conjunto

Standardization com

a

IEC

[Organização (International

Electrotechnical Comission [Comissão Eletrotécnica Internacional]) está responsável pela standardização a nível mundial. É em comités técnicos, onde participam membros da ISO ou da IEC, que são tomadas decisões relativamente a Normas Internacionais que são elaboradas de acordo com um conjunto de regras estabelecidas nas Directivas da ISO/IEC. O ODF (Open Document Format for Office Applications), também conhecido como formato OpenDocument trata-se de um formato aberto para armazenar documentos. Um formato aberto é uma especificação disponível para livre acesso que serve para armazenar dados digitais e tem como objectivo garantir o acesso a longo prazo aos mesmos, mantendo a certeza da longevidade do conteúdo do documento graças à sua independência face a plataforma ou fornecedor. O formato OpenDocument pode ser utilizado gratuitamente por qualquer sistema - de código aberto ou fechado – sem a necessidade de uma licença de uso restrito. O formato ODF é mantido pela OASIS (Organization for the Advancement of Structured Information Standards [Organização para o Avanço de Padrões de Informação Estruturada]), que tem como objetivo o desenvolvimento e a promoção de padrões digitais a usar na Internet. Arquivos e documentos em formato ODF podem ser identificados através da sua extensão, sendo as mais utilizadas6: Extensão

Tipo de Documento

.odt

Documento de texto

.ods

Planilha eletrónica

.odp

Apresentação de slides

.odb

Banco de dados

.odg

Desenho vetorial

.odf

Equação matemática

Tabela 2 – Extensões ODF mais utilizadas

O ODF foi aprovado pela Norma ISO/IEC 26300 no ano de 2006 – ISO/IEC 26300:2006 - Information technology - Open Document Format for Office Applications (OpenDocument) v1.0. Esta Norma define um esquema XML aplicável 6

A seguinte tabela foi retirada da página web http://www.opendocument.com.br/project-definition .

22

Faculdade de Letras da Universidade do Porto Preservação e Conservação a aplicações e documentos de escritório – documentos de texto, tabelas e gráficos, desenhos, apresentações, panificações – não se restringindo, no entanto, apenas a este tipo de documentos. O esquema XML definido nesta Norma permite a edição de documentos, assim como a sua transformação através da utilização de XSLT ou ferramentas de XML. A Norma está dividida em 17 capítulos: Capítulo

Assunto

Capítulo 1

introduz o formato OpenDocument

Capítulo 2

descreve a estrutura de documentos que estejam em conformidade com a especificação do formato OpenDocument descreve a meta-informação que pode ser contida em tais documentos descrevem o conteúdo do texto e parágrafos destes documentos descreve campos de texto

Capítulo 3 Capítulos 4 e 5 Capítulo 6 Capítulo 7 Capítulo 8

descreve os índices de texto

Capítulo 9

descreve o conteúdo de uma tabela de um documento em formato OpenDocument descreve o seu conteúdo gráfico

Capítulo 10

descreve o conteúdo de um gráfico

Capítulo 11

descreve o conteúdo da sua forma

Capítulo 12

descreve o conteúdo comum a todos os documentos descreve a integração de remarcação de animação SMIL no esquema OpenDocument explica o conteúdo de estilo de informação

Capítulo 13 Capítulo 14 Capítulo 15 Capítulo 16 Capítulo 17

especifica propriedades de formatação que podem ser usadas dentro de estilos descreve os tipos de dados usados pelo esquema do OpenDocument descreve os pacotes conteptuais usados pelo formato OpenDocument

Tabela 3 – Os 17 capítulos da ISO/IEC 26300:2006

5.2. PDF e suas variantes O PDF – Portable Document Format – é um formato de arquivo usado para apresentar documentos de forma independente de sistemas de software hardware e operacionais. Foi desenvolvido pela Adobe Systems na década de 90 não só com o 23

Faculdade de Letras da Universidade do Porto Preservação e Conservação objetivo de suavizar o processo de mover texto e gráficos de editoras para impressoras como o de otimizar a visualização de documentos através da representação de texto, fontes, gráficos, entre outros. O PDF é, desde Julho 2008, um padrão aberto podendo, portanto, qualquer pessoa escrever aplicações que leiam ou escrevam neste padrão. O grande motivo pelo qual se recorre ao PDF advém de características como a sua portabilidade em diferentes plataformas. Entre 1993 e 2011, a Adobe Systems foi mudando a especificação do PDF (de 1.0 a 1.7) com o intuito de incluir novos recursos como passwords, tópicos, links, elementos interativos, reprodução de vídeo, assinaturas digitais, marca de impressão, importação de conteúdos de um PDF para outro, trabalho artístico 3D, entre muitos outros. Assim, o PDF acabou por se tornar um padrão standard graças à ISO (International

Organization

for

Standardization

[Organização

Internacional

de

Standardização]), nomeadamente para a representação de material impresso. A partir de formatos como o ODF (do LibreOffice) ou o DOC (do Microsoft Word) e imagens como Jpeg e PNG existe a possibilidade de gerar arquivos em PDF, correndo o risco da qualidade variar, podendo não ser a melhor dependendo do formato do arquivo matriz a partir do qual o PDF foi gerado. Assim, vale a pena ter em atenção à escolha do formato mais adequado. Existem diferentes variantes de PDF, cada uma representando diferentes restrições e/ou extenções relativamente ao padrão PDF descrito na Norma ISO 32000. São elas o PDF/A , o PDF/E, o PDF/X, o PDF/UA e o PDF/VT.

5.2.1. PDF/A e suas variantes O PDF/A é uma versão do PDF especializada para a preservação digital de documentos electrónicos. Foi elevada a padrão standard em 2005 pela ISO (International

Organization

for

Standardization

[Organização

Internacional

de

Standardização]), ficando conhecida como a ISO 19005-1:2005 – Document management. Electronic document file format for long-term preservation. Part 1: Use of PDF (PDF/A). O PDF/A difere do PDF no sentido em que proíbe recursos inadequados a arquivamento de longo prazo, sendo disso exemplo a ligação de fontes (font linking), em oposição à incorporação de fontes (font embedding). A standardização do PDF/A não define uma estratégia de arquivamento, define sim um perfil para documentos eletrónicos que garante a reproduação exata dos mesmos nos próximos anos, independentemente do software usado. No início da sua implementação, em 2005, uma das principais preocupações girava à volta dos direitos de propriedade e de autor da Adobe Systems sobre o 24

Faculdade de Letras da Universidade do Porto Preservação e Conservação formato PDF. Assim, a Adobe Systems decidiu doar a licença e patentes para o seu livre uso, podendo qualquer usuário da Norma criar aplicações que lessem, escrevessem ou processassem arquivos PDF/A livremente. “Qualquer pessoa, empresa ou o governo pode usar o PDF Reference e o XMP Specification em conjunto com a Norma ISO 19005-1 para criar tais aplicações. Com isso, o formato fica totalmente desconectado de sua empresa criadora.”7 Nos últimos anos, o objetivo de encontrar

“…um

formato

sólido,

estável,

não

proprietário

e

aceite

internacionalmente…”8 tem feito com que o PDF/A seja motivo de interesse e de estudo em todo o mundo. Existem três grandes variantes do PDF/A: 

PDF/A-1

O PDF/A-1 é a principal revisão do PDF/A e baseia-se na Referência PDF 1.4 da Adobe Systems, uma plataforma estável implementada no Adobe Acrobat 5 que se caracteriza pela sua independência relativamente a qualquer plataforma de software ou hardware e pela sua autonomia e autossuficiência – tudo o que é necessário para vizualizar e imprimir um PDF/A-1 está contido no próprio ficheiro. A sua Norma é a ISO 19005-1: 2005 - Document Management – Electronic document file format for long term preservation – Part 1: Use of PDF 1.4 (PDF/A-1), publicada em Outubro de 2005. O PDF/A-1 divide-se em dois níveis de conformidade:  PDF/A-1a – tem como objetivo preservar a capacidade de máquinas e seres humanos compreenderem o conteúdo semântico e visual de ficheiros PDF/A, salvaguardando a sua estrutura lógica, sendo assim possível, por exemplo, ajustar o conteúdo textual a ecrãs de diferentes dimensões. Utilizando o PDF/A-1a é também possível garantir a pesquisa e o reaproveitamento do conteúdo do documento.  PDF/A-1b – é um padrão menos rigoroso que tem como objetivo garantir uma reprodução fiável e correta da aparência do arquivo PDF/A, de forma a que o utilizador consiga ler e entender o seu conteúdo. Assim, o PDF/A-1b assegura apenas a aparência visual do documento, sem garantir uma coerência textual. Em oposição ao

7

MORTARA, Bruno – A nova parte da norma ISO 19005 ou, simplesmente, PDF/A-2 [em linha]. In: Tecnologia gráfica: a revista técnica do setor gráfico brasileiro. nº76 (23 Março 2011). [consultado em 22-11-2014]. Disponível em www: http://www.revistatecnologiagrafica.com.br/index.php?option=com_content&view=article&id=1762:anova-parte-da-norma-iso-19005-ou-simplesmente-pdfa-2&catid=60:normalizacao&Itemid=185 8 MORTARA, Bruno – Manual para criação de arquivos digitais no padrão PDF/A: ISO 19005-1. São Paulo: Prata da Casa Consultoria, 2007. [Prefácio]

25

Faculdade de Letras da Universidade do Porto Preservação e Conservação PDF/A-1a, os arquivos PDF/A-1b não exigem que a informação semântica do documento esteja presente no arquivo PDF/A. 

PDF/A-2

O PDF/A-2 baseia-se na Norma ISO 32000-1 – PDF 1.7 e é definido pela norma ISO 19005-2:2011 – Document management – Electronic document file format for long-term preservation – Part 2: Use of ISO 32000-1 (PDF/A-2), publicada em Julho de 2011. O PDF/A-2 é, então, a segunda parte da Norma ISO 19005, atualizando o padrão PDF/A-1 . O PDF/A-2 não tem como objetivo substituir o padrão já existente, mas sim complementá-lo com novas funções das novas funções da Referência PDF (1.5, 1.6 e 1.7.) – são exemplos dessas funções efeitos de transparência, compressão de

imagens JPEG2000 e disposição de assinaturas digitais. Também o padrão

PDF/A-2 tem dois níveis de conformidade correspondentes ao padrão PDF/A-1, sendo eles o PDF/A-2a e o PDF/A-2b. Contudo, neste padrão existe um novo nível de conformidade: o PDF/A-2u (a letra “u” advém da palavra unicode) que representa o nível B de conformidade (PDF/A-2b) com o acréscimo da exigência de que todo o texto do documento tenha um mapeamento de unicode. 

PDF/A-3

O padrão PDF/A-3 baseia-se na Norma ISO 32000-1 – PDF 1.7 e é definida pela norma ISO 19005-3:2012 – Document management -- Electronic document file format for long-term preservation - Part 3: Use of ISO 32000-1 with support for embedded files (PDF/A-3), publicada em Outubro de 2012. O PDF/A-3 amplia o PDF/A-2 no sentido em que permite a incorporação de arquivos de dados de formato arbitrário em arquivos PDF/A-3. Esta terceira parte da Norma ISO 19005 serve, essencialmente, para arquivar os dados originais de um ficheiro PDF/A para uso futuro. A seguinte tabela9 resume as três variantes do PDF/A:

Tabela 4 – As três partes da ISSO 19005

9

Tabela retirada da página web https://en.wikipedia.org/wiki/PDF/A

26

Faculdade de Letras da Universidade do Porto Preservação e Conservação

5.2.1.1. ISO 19005-1:2005 – Document management. Electronic document file format for long-term preservation. Part 1: Use of PDF (PDF/A) A

ISO

Internacional

(International

de

Organization

Standardização]),

em

for

conjunto

Standardization com

a

IEC

[Organização (International

Electrotechnical Comission [Comissão Eletrotécnica Internacional]) está responsável pela standardização nível mundial. É em comités técnicos, onde participam membros da ISO ou da IEC, que são tomadas decisões relativamente a Normas Internacionais que são elaboradas de acordo com um conjunto de regras estabelecidas nas Directivas da ISSO/IEC. A Norma ISO 19005-1:2005 – Document management. Electronic document file format for long-term preservation. Part 1: Use of PDF (PDF/A) foi publicada em 2005 e tem como objetivo principal definir um formato de arquivo com base em PDF que disponibiliza um mecanismo que represente documentos eletrónicos de forma a preservar as suas características visuais ao longo dos anos, independentemente do software utilizado. Outro objetivo prende-se pelo fornecimento de um enquadramento para a manutenção do contexto e da História dos documentos. Um terceiro objetivo desta Norma é a definição de um quadro que auxilie à preservação da estrutura lógica e informação semântica dos documentos. Esta Norma encontra-se dividida em seis partes, sendo elas: 

As Referências Normativas;



Os Termos e Definições;



As Notações;



Os Níveis de Conformidade;



Os Requerimentos Técnicos.

5.2.2. PDF/E O PDF/E foi criado pela ISO 24517-1 – Document management – Engineering document format using PDF – Part 1: Use of PDF 1.6 (PDF/E-1) no ano de 2008 e coloca várias restrições aos arquivos PDF. Sendo a letra E de Engenharia, estas restrições têm como objetivo a criação e usabilidade de documentos em fluxos de trabalho de Engenharia, transformando o PDF/E num formato fiável para transferir os mesmos de uma ferramenta de software para outra e para poderem ser visualizados por ferramentas de software de engenharia diferentes. A Norma ISO 24517-1 define o formato PDF/E, baseado na Referência PDF 1.6 da Adobe Systems, e foi criada para responder às necessidades das organizações 27

Faculdade de Letras da Universidade do Porto Preservação e Conservação que necessitam criar, permutar e rever de forma fiável documentos de Engenharia. No entanto, esta Norma não define um método que crie ou converta documentos eletrónicos/impressos para o formato PDF/E. “Benefícios chave do PDF/E: 

Redução dos requisitos de software caro e proprietário;



Redução dos custos de armazenamento e troca (comparativamente ao papel);



Troca de confiança entre vários aplicativos e plataformas;



Autocontenção;



Custos eficazes e meios de captura e marcação precisos;



Desenvolvimento e manutenção pela comissão ISO PDF/E.”10

5.2.3. PDF/X O PDF/X foi criado em 2001 através das Normas ISO 15929 e 15930, tendo por base as versões 1.3 e 1.4 do PDF da Adobe Systems. O PDF/X é um conjunto de padrões que vai desde o PDF/X-1a:2001 até ao PDF/X-5n, passando pelo PDF/X-2, PDF/X-3:2002, PDF/X-1ª:2003, PDF/X-3:2003, PDF/X-4, PDF/X-5, PDF/X-5g, PDF/X-5pg e PDF/X-5n, sendo todos extensões ou revisões uns dos outros e tendo diferentes aplicações, funções e/ou restrições. Os arquivos com o formato PDF/X não devem apenas seguir as restrições impostas, têm também que conter uma identificação específica relativa à versão PDF/X de que se trata. Deste modo, um certo ficheiro só pode estar configurado a um formato PDF/X específico. Este formato tem como objetivo facilitar a troca de gráficos tendo, portanto, vários requisitos de impressão não aplicados ao arquivo de PDF padrão. O PDF/X coloca várias restrições em arquivos PDF com o intuito de uma transmissão e impressão fiáveis através de um fluxo de trabalho de artes gráficas, obtendo o utilizador um resultado esperado. Além disso, recursos como assinaturas, comentários e sons incorporados e os filmes não são permitidos em PDF / X.

5.2.4. PDF/UA O PDF/UA (PDF/Universal Accessibility) foi criado em 2012 pela Norma ISO 14289-1, tendo como base a versão 1.7 do PDF da Adobe Systems. O formato PDF/UA fornece condições e requisitos para que a acessibilidade em documentos e

10

PDF/E [Em linha]. [Consultado em 24-11-2014]. Disponível em www: https://en.wikipedia.org/wiki/PDF/E

28

Faculdade de Letras da Universidade do Porto Preservação e Conservação aplicativos PDF seja uma constante sempre presente e tem como objetivo principal colocar restrições diversas a arquivos PDF com a finalidade de acessibilidade de conteúdo. Esta acessibilidade é extremamente importante para utilizadores com restrições físicas – aqueles que usam ampliadores de ecrã, software de leitura de ecrã (cegos) e descrições de conteúdo (surdos) – e por isso, o PDF/UA fornece tecnologias para navegar e ler o conteúdo eletrónico. Contudo, os benefícios do formato PDF/UA vão para além das pessoas com deficiências. Com o software apropriado para este formato, o utilizador terá a possibilidade de rearranjar o texto em telas pequenas de forma fiável, transformar a aparência do texto, proporcionar opções de navegação poderosas, ajudar na seleção e cópia do texto, entre outras.

5.2.5. PDF/VT O formato PDF/VT, criado pela Norma Internacional ISO 16612-2 em Agosto de 2010, trata-se de uma série de restrições e melhorias para arquivos PDF de maneira a que estes possam ser utilizados como dados-modelo para uma rápida interpretação e impressão de dados transacionais e variáveis. Este é o primeiro formato de impressão de dados variáveis (VDP – variable data printing) que assegura a gestão de cores através do uso do ICC (International Colour Consortium-based) Output Intents. É nas Normas dos PDF/X -4 e -5 que o formato PDF/VT se baseia para garantir fidelidade de impressão, incluindo também construções que definam conteúdos reutilizáveis da página e que façam com que exista um bom desempenho durante a impressão de diferentes itens de dados. O PDF/VT derivou de uma Norma prévia – PPML/VDX (a primeira versão da Norma ISO 16612). A principal diferença é que o PDF/VT utiliza recursos adicionais relativos à fidelidade de impressão, assim como informações de marcação diferentes. Existem dois tipos de PDF/VT: 

O PDF/VT-1 – trata-se de um arquivo autossuficiente que está sempre pronto para impressão sem recorrer a dados externos.



O PDF/VT-2 – trata-se de um arquivo que requer recursos ou dados externos para impressão.

5.3. Vantagens e desvantagens do PDF Hoje em dia, é possível dizer que são inúmeras as vantagens e desvantagens da utilização do formato PDF. Com o estabelecimento da Era da Informação, em que a Internet entrou e espalhou-se “a matar”, o PDF tornou-se o formato eleito para

29

Faculdade de Letras da Universidade do Porto Preservação e Conservação exposição de documentos eletrónicos, sendo reconhecido pela ISO (International Organization for Standardization [Organização Internacional de Standardização]) como o formato padrão de documentos. Vantagens

Desvantagens

Os arquivos PDF são extremamente fáceis e rápidos de criar;

Criar um arquivo PDF requer a compra de programas especializados (Adobe Acrobat, por exemplo);

É um formato seguro aquando do envio ou da distribuição do documento;

Não tendo o Adobe Reader instalado ou tendo uma versão desatualizada torna impossível a visualização de um arquivo PDF;

Tem a capacidade de compactar arquivos pesados;

A existência de vários tipos de PDF pode não ser tão vantajoso como se poderá pensar. A forma de inserir informação na criação de um PDF varia consoante o tipo de PDF que está a ser criado, afetando a forma como certas funções de conversão e visualização funcionam;

comprimir/

Para visualizar um arquivo PDF basta ter o Adobe Reader (gratuito) instalado;

Um ficheiro PDF pode tornar-se difícil de ler num ecrã de computador;

Um arquivo PDF é visualizado de forma igual tanto em Windows, como em Linux como em Mac desde que exista um visualizador;

Os arquivos PDF nem sempre estão integrados em páginas web – apenas têm se o utilizador tiver instalado o plug-in do Adobe Reader ou de outro leitor PDF e só assim é possível ao utilizador visualizar o ficheiro;

É possível visualizar um documento PDF em vários navegadores Web em vez de fazer o seu download e abri-los separadamente;

Um ficheiro PDF é difícil de editar, não sendo ele editável por natureza, apesar da sua aparência ser semelhante à de um ficheiro de texto. Esta desvantagem pode ser facilmente contornada através da conversão de um ficheiro PDF para um ficheiro Word.

Os arquivos PDF preservam os estilos de texto originais, assim como a formatação e as imagens; Os arquivos PDF contém texto, gráficos, tabelas, entre outros; O arquivo PDF pode ser considerado portátil, no sentido em que qualquer ficheiro PDF existe independentemente do sistema operador, do hardware e do software utilizado. Assim, torna-se simples a transferência de arquivos entre computadores cujos hardwares e softwares sejam diferentes. Tabela 5 – As vantagens e desvantagens do uso do PDF

6. A Biblioteca de Software Libjpeg 6.1. Uso da Libjpeg A Libjpeg trata-se de uma biblioteca livre, utilizada em todo o mundo, cujas funções estão essencialmente viradas para a manipulação dos dados de imagem do formato JPEG. Esta biblioteca está escrita em linguagem de programação e, fora muitas outras 30

Faculdade de Letras da Universidade do Porto Preservação e Conservação utilidades, tem implementado um codec (codificador e descodificador) do formato JPEG. A Libjpeg é distribuída como software gratuito juntamente com o seu códigofonte. Existem várias versões da Libjpeg, sendo a original, de código aberto, mantida e publicada pelo IJG (Independent JPEG Group [Grupo JPEG Independente]). As versões mais recentes são compatíveis com a original, tendo recursos adicionais, como por exemplo o aumento da eficiência de codificação. Fazem parte do pacote Libjpeg os seguintes programas: 

Cjpeg e Djpeg – servem para realizar conversões entre o formato JPEG e outros formatos de imagem;



Rdjpgcom e Wrjpgcom – servem para inserir e extrair comentários textuais em arquivos JPEG;



Jpegtran – serve para realizar conversões entre formatos JPEG diferentes. Este programa fornece recursos para transformar dados de formato de imagem reais, para reformatar e recodificar a representação de coeficientes e para descartar dados auxiliares em arquivos JPEG.

6.2. A sua evolução A 7 de Outubro de 1991, o Independent JPEG Group lançou publicamente a implementação do formato JPEG que tem sofrido desenvolvimentos consideráveis desde então. Tom Lane, um cientista computacional, foi o responsável pelos primeiros desenvolvimentos, como por exemplo pela implementação do Software Open Source do Independent JPEG Group, um dos principais pacotes Open Source – fundamental para o sucesso do formato JPEG. Em Setembro de 1994 todo o código base do formato foi reescrito, criando-se assim a 5ª versão da Libjpeg – programas como o Rdjpgcom e Wrjpgcom foram introduzidos com o intuito de ser possível manipular comentários de texto embutidos. Já a 6ª versão da Libjpeg, lançada a em Agosto do ano seguinte, apareceu suportando os progressos do formato JPEG, surgindo pela primeira vez o programa Jpegtran que possibilitou a hipótese de girar e inverter imagens e reduzir os tons de cinza. As versões 7 a 9 da Libjpeg foram lançadas 11 anos mais tarde após uma mudança na liderança do Independent JPEG Group. Novas características e utilidades foram introduzidas, tais como suporte para codificação aritmética, recorte em Jpegtran (versão 7) e atualizações que compatibilizam controvérsias entre extensões de formatos (versões 8 e 9). Foi em Março de 2014 que foi publicada a primeira versão do Mozjpeg – com o objetivo de otimizar questões relativas ao tamanho de ficheiros. A versão 2.0, lançada em Julho deste mesmo ano, permite a redução do tamanho base do formato JPEG. A 31

Faculdade de Letras da Universidade do Porto Preservação e Conservação Libjpeg tem tido apoios de organizações como o Facebook, que doou 60.000$ para o desenvolvimento a próxima versão e como o CloudFare que apoia melhorias do Mozjpeg.

6.3. O novo formato JPEG (.jpg) Ao longo dos tempos, o format JPEG tornou-se no formato de imagem mais utilizado – tanto em câmaras digitais como na web como até os smartphones. Ainda assim, até ao lançamento do novo formato – 9.1. – o JPEG não oferecia aos utilizadores a melhor flexibilidade a nível de edição de imagem, daí muitos preferirem os formatos RAW e TIFF. Assim, o Independent JPEG Group lançou em 2014 a versão 9.1 do Libjpeg que adiciona funções e recursos dos quais são exemplos os seguintes: 

ampliamento da gama e a profundidade de cores (suporte de cores de 12 bits);



possibilidade de compressão sem perda de qualidade através de codificação aritmética;



nova escala multi-funcional – “escala inteligente”

6. Diretórios de formatos A principal função de um diretório de formato centra-se na disposição online de toda a informação técnica existente sobre formatos digitais – data de criação e identificação dos produtores do formato, por exemplo. Assim, estes diretórios facilitam a preservação digital no sentido em que proporcionam a exposição de ferramentas identificadoras do formato de um certo objeto digital, capazes de promover esquemas normalizados que o descrevam. Entre os vários diretórios de formatos destacamos o PRONOM, o JHOVE e o PLATO.

7.1. PRONOM Em 2002 foi lançado um novo projeto pelo National Archives of United Kingdom de seu nome PRONOM, sendo o primeiro registo de formato de arquivo operacional público, e tem como função apoiar os serviços de preservação digital. O PRONOM começou por ser um projeto interno do National Archives of United Kingdom como sendo um registo técnico em que fosse possível aceder a toda a informação técnica sobre os registos eletrónicos mantidos pelo arquivo, acabando por ser atualmente um diretório público que disponibiliza informações sobre os formatos de arquivos, sobre produtos de software, sobre períodos de suporte para produtos de software, assim 32

Faculdade de Letras da Universidade do Porto Preservação e Conservação como outras informações técnicas necessárias aquando o acesso a longo prazo a documentos eletrónicos. O registo técnico PRONOM materializa-se num sítio web que fornece um banco de dados para pesquisa de tais informações, permitindo também aos utilizadores a submissão de nova informação pertinente. Existem cinco versões do diretório PRONOM, todas lançadas entre os anos de 2002 e 2006. O projeto PRONOM destaca-se também pelo lançamento do software DROID (Digital Record Object Identification) – uma ferramenta de software que identifica automaticamente formatos digitais, utilizando assinaturas internas (sequência de bytes) e externas (extensão de arquivo).

7.2. JHOVE JHOVE trata-se de um projeto desenvolvido em conjunto entre a Biblioteca da Universidade de Harvard e o JSTOR (diminutivo de Journal Storage), escrito em Java, tratando-se de um API (Application Programing Interface) que identifica, caracteriza e valida objetos digitais de formatos-específicos. O JHOVE está disponível para download por parte de qualquer utilizador, podendo ser executado em qualquer sistema operativo Unix, Windows ou Machintosh que suporte o Java 1.4. Ao utilizar o JHOVE, os documentos são analisados, seguindo-se uma verificação cuidada da qualidade e da validade do formato. Existe um sucessor, de nome JHOVE 2 – um desenvolvimento open-source do primeiro. Este tem as mesmas funções do JHOVE, adicionando-se uma avaliação do formato do documento com base numa política de repositório, tendo um código base completamente separado.

7.3. PLATO (serviço de migração) PLATO trata-se de uma ferramenta de apoio à decisão que implementa um processo sólido de planeamento de preservação, integrando serviços orientados para tal, assim como para a caracterização do conteúdo, acabando por suportar da melhor forma o empreendimento do planeamento de preservação. Esta ferramenta atua da melhor forma ao definir as ações necessárias para se dar tal preservação, tendo em vista a garantia de acesso futuro ao conteúdo digital de um conjunto específico de objetos, mantendo-o assim vivo podendo vir a ter valor no futuro. “A ferramenta PLATO faz uma avaliação de ferramentas de migração orientada por políticas e estratégias de uma determinada instituição, respondendo a perguntas como: 

Será esta ferramenta a mais conveniente dadas as limitações pessoais da minha instituição?

33

Faculdade de Letras da Universidade do Porto Preservação e Conservação 

Será que o uso desta ferramenta para conversão do meu conteúdo combina com a política da minha instituição?”11

11

Plato – Planets Preservation Planning Tool [Em linha]. [Consultado em 06/12/2014]. Disponíel em www. http://www.alliancepermanentaccess.org/index.php/preservationsoftware/plato-planetspreservation-planning-tool/

34

Faculdade de Letras da Universidade do Porto Preservação e Conservação

7. Conclusões

O gigantesco volume de informação produzido hoje em dia transmitido sob diversos suportes e formatos torna-se assustador, sendo necessário cada vez mais atentar à Preservação Digital. Ao tentar assegurar a longevidade do documento digital, enfrentam-se atualmente vários desafios deixados pelo novo paradigma, sendo exemplo a efemeridade dos recursos e tecnologias. Técnicas como a migração, a emulação, a preservação da tecnologia e a preservação da meta-informação são procedimentos úteis – aplicando a técnica mais adequada ao formato em questão – utilizados cada vez mais na Preservação Digital.

O aumento da clareza dos que problemas e desafios que estão na natureza do surgimento da necessidade de tornar a preservação numa atividade sistémica, para que esta possa integrar a a gestão da informação da organização a que se destine e ainda para que se torne uma linha orientadora na definição da estratégia global. Este alinhamento contribui para a aglutinação de várias áreas do conhecimento científico o que torna todas as práticas resultantes dessa mesma aglutinação fortemente fundamentadas e passíveis de se lhes conferir um elevado grau de confiabilidade e previsibilidade.

35

Faculdade de Letras da Universidade do Porto Preservação e Conservação

8. Referências Bibliográficas 

Advantages and disadvantages of PDF [em linha]. In websuburb: connecting communities. [Consultado em 26-11-14]. Disponível em WWW:



ASSOCIATION FOR DIGITAL DOCUMENT STANDARDS ADDS. PDF/A Forever: Long-term Archiving with PDF. In: 4th International PDF/A Conference, 2010, Berlim. Berlim: Association For Digital Document Standards Adds, 2010



ARELLANO, Miguel Angel – Preservação de Documentos Digitais [em linha]. In Scielo. Vol. 33, Nº2 (Maio/Agosto 2004). [Consultado em 23-12-2014]. Disponível em WWW:



FANNING, Betsy. PDF/Achive: Preserving Electronic Assets. Washington DC: NACRC, 2010.



FERREIRA, Carla Alexandra Silva – Preservação da Informação Digital: uma perspetiva orientada para as bibliotecas [em linha]. Coimbra: Faculdade de Letras da Universidade de Coimbra, 2011. [Consultado em 0412-2014]. Disponível em WWW:



FERREIRA, Miguel - Introdução à preservação digital: conceitos, estratégias e acuais consensos [em linha]. Guimarães: Escola de Engenharia da Universidade do Minho, 2006. [Consultado em 04-10-2013]. Disponível em WWW:



Formato aberto [em linha]. In Wilipédia: a enciclopédia livre. [Consultado em 15-11-14]. Disponível em WWW: 36

Faculdade de Letras da Universidade do Porto Preservação e Conservação



Further Reasources [em linha]. In MetaArchive cooperative. [Consultado em 03-12-14]. Disponível em WWW:



ISO 19005-1 (PDF/A-1) Application Notes [em linha]. In AIIM: the global community of information professionals. [Consultado em 22-11-14]. Disponível em WWW:



INTERNATIONAL

STANDARD

ORGANIZATION.



ISO 19005-1:2005

Document management — Electronic document file format for long-term preservation — Part 1: Use of PDF 1.4 (PDF/A-1) [em linha]. [Consultado em 22-11-14]. Disponível em WWW: 

INTERNATIONAL STANDARD ORGANIZATION. ISO/IEC 26300:2006 Information technology - Open Document Format for Office Applications (OpenDocument) v1.0 [em linha]. [Consultado em 16-11-14]. Disponível em WWW:



JHOVE [em linha]. In Wikipedia: the free encyclopedia. [Consultado em 04-1214]. Disponível em WWW:



JPEG Standard 9.1 Will Bring 12-Bit Color, Lossless Compression [em linha]. In Photo.com. [Consultado em 06-12-14]. Disponível em WWW:



JPEG’s governing body puts out new version, with 12-bit color and lossless compression [em linha]. In Digital Trends. [Consultado em 06-12-14]. Disponível

em

WWW:

37

Faculdade de Letras da Universidade do Porto Preservação e Conservação 

LEVENSON, Stephen P. Levenson. The Making of PDF/A. In: 1st Intl. PDF/A Conference, Amsterdam 2008. Washington DC: United States Federal Judiciary, 2008.



Libjpeg [em linha]. In Free Code. [Consultado em 29-11-14]. Disponível em WWW:



Libjpeg [em linha]. In Wikipédia: a enciclopédia livre. [Consultado em 29-1114]. Disponível em WWW:



Libjpeg [em linha]. In Wikipedia: the free encyclopedia. [Consultado em 29-1114]. Disponível em WWW:



Open Document [em linha]. In Wikipédia: a enciclopédia livre. [Consultado em 15-11-14]. Disponível em WWW:



O que é o padrão aberto de documentos (odf)? [em linha]. In Diretoria de Tecnologia da Informação. [Consultado em 15-11-14]. Disponível em WWW:



O que é ODF: O OpenDocument Format [em linha]. In ODF. [Consultado em 15-11-14]. Disponível em WWW:



Padrão aberto [em linha]. In Wikipédia: a enciclopédia livre. [Consultado em 16-11-14]. Disponível em WWW:

38

Faculdade de Letras da Universidade do Porto Preservação e Conservação 

PDF File Variants: an Overview [em linha]. In Datalogic Blog: all about Datalogics and Adobe PDF and eBook technologies. [Consultado em 22-1114]. Disponível em WWW:



PDF/A [em linha]. In Wikipedia: the free encyclopedia. [Consultado em 22-1114]. Disponível em WWW:



PDF/E [em linha]. In Wikipedia: the free encyclopedia. [Consultado em 22-1114]. Disponível em WWW:



PDF/UA [em linha]. In Wikipedia: the free encyclopedia. [Consultado em 24-1114]. Disponível em WWW:



PDF/VT [em linha]. In Wikipedia: the free encyclopedia. [Consultado em 24-1114]. Disponível em WWW:



PDF/X [em linha]. In Wikipedia: the free encyclopedia. [Consultado em 24-1114]. Disponível em WWW:



PINTO, Maria Manuela Gomes de Azevedo – Gestão da Informação e Preservação Digital: uma perspetiva portuguesa de uma mudança de paradigma. Valencia: Universidade do Porto, 2009.



PINTO, Maria Manuela Gomes de Azevedo (2013) – Gestão de Documentos e

meio digital: um

posicionamento

urgente

e

estratégico. Porto:

Universidade do Porto/CETAC.MEDIA, 2013 

PLATO – Planets Preservation Planning Tool [em linha]. In APA: Alliance for permanent access. [Consultado em 06-12-14]. Disponível em WWW:

39

Faculdade de Letras da Universidade do Porto Preservação e Conservação 

PRONOM [em linha]. In Wikipedia: the free encyclopedia. [Consultado em 0312-14]. Disponível em WWW:



ROG, Judith; BIBLIOTHEEK, Koninklijke; DUURZAAMHEID, Digitale. PDF Guidelines: Recommendations for the creation of PDF for long-term preservation and access. [S.L.]: [S.N.], 2007.



SILVA, Márcio Rohan. Documentos digitais: um estudo sobre métodos de avaliação de formatos de arquivos digitais e a sua adequação à preservação digital [em linha]. Porto Alegre: Universidade Federal do Rio Grande do Sul, 2009. [Consultado em 04-12-2014]. Disponível em WWW:



Sustainability of Digital Formats: planning for library of Congress Collectons [em linha]. [Consultado em 27-12-14]. Disponível em WWW:



THALLER, Manfred. An Introduction to Digital Preservation. Koln: Universitat zu Koln, 2009.



The technical registry PRONOM [em linha]. In The National Archives. [Consultado em 03-12-14]. Disponível em WWW:



THIBODEAU, Kenneth. Overview of Technological Approaches to Digital Preservation and Challenges in Coming Years [em linha]. [Consultado em: 03-12-14]. Disponível em WWW: < http://www.clir.org/PUBS/reports/pub107/thibodeau.html >



Tom Lane (computer scientist) [em linha]. In Wikipedia: the free encyclopedia. [Consultado em 29-11-14]. Disponível em WWW:

40

Faculdade de Letras da Universidade do Porto Preservação e Conservação 

Vantagens e desvantagens do uso de um Adobe PDF [em linha]. In Conhecimento Computador. [Consultado em 26-11-14]. Disponível em WWW:



What is PDF file format? [em linha]. In Knowledge Base: Find your answers here. [Consultado em 26-11-14]. Disponível em WWW:



What is Plato? [em linha]. In Plato. [Consultado em 06-12-14]. Disponível em WWW:



Why use PDF: a backgrounder on PDFs advantages and disadvantages [em linha]. In Investintech.com: PDF solutions. [Consultado em 26-11-14]. Disponível em WWW:

41

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.