PROJECTDOCUMENTATIE
06-6030 NA4ALL 03.01.02 Richtlijn bestandsformaat en compressie
Uitgave: Concept Datum: 20-03-2009
PRINCE 2 Auteur: Jeroen van Luin Projectmanager: Petra Schoen Opdrachtgever: Martin Berendse Documentnummer: 06-6030-03.01.02 Versie: 0.6
PRINCE2 managementproducten
Richtlijn Bestandsformaat en compressie Voor de diverse digitaliseringsprojecten binnen het Nationaal Archief is behoefte aan een standaard voor bestandsformaten waarin gedigitaliseerd wordt. In de keuze voor bestandsformaten is rekening gehouden met de kosten van opslag, de duurzaamheid van bestandsformaten en het doel waarvoor de afbeelding gebruikt gaat worden. Het team Collectie van het project NA4all heeft een richtlijn opgesteld voor de keuze van bestandsformaten voor de mogelijke digitaliseringsdoeleinden. In dit document wordt de richtlijn beschreven. Productnummer:
03.01.02
Productnaam:
Richtlijn bestandsformaat en compressie
Vastgesteld door:
NA4All Team Collectie
Doel Samenstelling
Verantwoordelijkheid realisatie Kwaliteitscriteria:
Het vaststellen van de bestandsformaten die zijn toegestaan bij digitaliseringsopdrachten, en de vorm van compressie die bij opslag mag worden toegepast. De richtlijn onderscheidt de mogelijke doelen van een digitaliseringsopdracht, en geeft aan welk bestandsformaat en compressietype bij elk van deze doelen gekozen dient te worden. Voor de voorgeschreven bestandsformaten wordt aangegeven welke extensie gebruikt moet worden in de bestandsnaam. Het team Collectie van het project NA4all is verantwoordelijk voor het opstellen van de richtlijn. •
• •
Een voorgeschreven bestandsformaat en compressietype sluit aan bij de behoefte aan duurzaamheid passend bij het doel waarvoor gedigitaliseerd wordt. Een voorgeschreven bestandsformaat en compressietype kan een afbeelding op voldoende kwaliteit opslaan. Een voorgeschreven bestandsformaat en compressietype is een goede afweging tussen opslagkosten en gewenste kwaliteit.
Kwaliteitsmethode
De richtlijn zal in twee pilots worden toegepast. De richtlijn en de resultaten van de pilots worden door het afdelingshoofd Toegangen & Gegevensbeheer en het afdelingshoofd Digitale Duurzaamheid beoordeeld. Kwaliteit tolerantie De richtlijn moet volledig voldoen aan de gestelde kwaliteitscriteria. Personen of vaardigheden De kwaliteitscontrole wordt uitgevoerd door Pieter Koenders benodigd voor kwaliteits- en Jacqueline Slats. beoordeling
Productbeschrijving 03.01.02 Richtlijn bestandsformaat en compressie Versie 0.6, concept, 20-03-2009
2
PRINCE2 managementproducten
Beschrijving Richtlijn bestandsformaat en compressie Begrippen In deze richtlijn wordt onderscheid gemaakt tussen de verschillende doelen waarvoor gedigitaliseerd kan worden. Hierbij worden de volgende begrippen gebruikt: Leesbaar Afdrukbaar Duurzaam Substituerend
Een digitaal bestand waarvan alleen is vereist dat de inhoud van het archiefstuk leesbaar is op een beeldscherm of afgedrukt op papier. Een digitaal bestand waarvan de kwaliteit voldoende hoog is om de afbeelding te kunnen gebruiken in hoogwaardig drukwerk. Een digitaal bestand die geschikt is om in het Digitaal Depot duurzaam te worden bewaard Een digitaal bestand waarvan het origineel na digitalisering wordt vernietigd.
Voorgeschreven bestandsformaten en compressietypen Digitale bestanden op leesbare kwaliteit Digitale bestanden op leesbare kwaliteit worden opgeslagen in JPEG formaat, met maximale compressie 1:10.
Digitale bestanden op afdrukbare kwaliteit Digitale bestanden op afdrukbare kwaliteit worden opgeslagen in TIFF formaat, zonder compressie.
Digitale bestanden op duurzame kwaliteit Digitale bestanden op duurzame kwaliteit worden opgeslagen in TIFF formaat, zonder compressie.
Digitale bestanden op substituerende kwaliteit Digitale bestanden op substituerende kwaliteit worden opgeslagen in TIFF formaat, zonder compressie.
Extensie in bestandsnamen Bij het opstellen van de bestandsnaam van een bestand dient de volgende extensie te worden gebruikt: • •
Voor JPEG bestanden: Voor TIFF bestanden:
jpg tif
Productbeschrijving 03.01.02 Richtlijn bestandsformaat en compressie Versie 0.6, concept, 20-03-2009
3
PRINCE2 managementproducten
Uitleg bij de richtlijn Keuze digitaliseringsdoelen Voor de richtlijn is bekeken voor welk doel een digitaal bestand gemaakt kan worden. Ook al wordt in drie van de onderkende doelen hetzelfde formaat en compressietype voorgeschreven, is besloten om de indeling in vier digitaliseringsdoelen te handhaven, met het oog op eventuele aanpassing van de richtlijn in de toekomst.
Keuze bestandsformaat/compressie Bij de keuze voor het bestandsformaat en de compressietechniek is uitgegaan van de wensen en eisen binnen het Nationaal Archief, en het onderzoek dat is uitgevoerd door het Stadsarchief Amsterdam, gepubliceerd in het rapport “Digitalisering ontrafeld” 1. • Voor afbeeldingen waarbij alleen leesbaarheid als eis wordt gesteld is het belangrijk dat het bestand voor een zo breed mogelijk publiek bruikbaar is. Vanwege de relatief geringe bestandsomvang, de hoge detail- en kleurreproductie en de brede ondersteuning door webbrowsers en tekenpakketten is JPEG met 1:10 compressie een erg geschikt formaat voor afbeeldingen op leesbare kwaliteit. • Het JPEG2000 formaat, de “opvolger” van JPEG wordt nog weinig ondersteund door webbrowsers en beeldbewerkingssoftware. Ondanks de betere compressie die dit formaat toestaat, en de dus lagere opslagkosten en overdrachttijd is dit formaat (nog) niet geschikt voor digitaliseringsprojecten. • Het TIFF bestandsformaat kan een afbeelding zonder compressie opslaan, is goed gedocumenteerd, vrij van auteursrecht (mits zonder compressie gebruikt) en biedt de mogelijkheid om in het bestand metadata op te slaan. De grote bestandsomvang en slechte ondersteuning door webbrowsers maken dit formaat ongeschikt voor afbeeldingen op leesbare kwaliteit. De goede documentatie, de mogelijkheid om afbeeldingen ongecomprimeerd op te slaan en de mogelijkheid om (technische) metadata op te slaan maken het formaat heel erg geschikt om afbeeldingen op hoge kwaliteit en duurzaam op te slaan. Het TIFF formaat kan afbeeldingen met een maximale bestandsgrootte tot 4GB aan, wat verwacht wordt voldoende te zijn voor de komende jaren.
Extensie in bestandsnamen • •
De extensie jpg voor JPEG bestanden is gedefinieerd in de ISO/IEC 10918-1:1994 standaard De extensie tif voor TIFF bestanden is aanbevolen door Adobe in de definitie van TIFF 6
1
Robert Bourgonjen, Marc Holtman en Ellen Fleurbaay: “Digitalisering ontrafeld, technische aspecten van digitale reproductie van archiefstukken”. Stadsarchief Amsterdam, april 2006. Productbeschrijving 03.01.02 Richtlijn bestandsformaat en compressie Versie 0.6, concept, 20-03-2009
4
PRINCE2 managementproducten
Colofon Overzicht van wijzigingen Datum wijziging 24-042007 25-062007 10-012008 22-012008 03-032009 20-032009
Samenvatting van wijzigingen
Status
Eerste opzet, nog zonder compressie bij JPEG. Compressie wordt onderzocht door Joop Korswagen en Jindra Sanders Toegevoegd: compressieformaat, uitleg bij de richtlijn Uitbreiding met verklaring extensies Verbeteringen in spelling n.a.v. reactie Pieter Kleine tekstuele aanpassingen voorafgaand aan goedkeuringsverzoek Aanpassingen na commentaar kwaliteitsreviewers
Concept 0.1 Concept 0.2 Concept 0.3 Concept 0.4 Concept 0.5 Concept 0.6
Goedkeuringen Voor dit document zijn de volgende goedkeuringen nodig. In het Managementdeel van het projectbestand worden ondertekende goedkeuringsformulieren opgenomen. Naam
Handtekening
Functie
Datum uitgifte
Versie
Verspreiding Dit document is verspreid aan: Naam
Functie
Team Collectie Pieter Woltjer Team Collectie Pieter Koenders en Jacqueline Slats
Projectteamleden Teammanager Collectie Projectteam NA4all Kwaliteitscontroleurs
Productbeschrijving 03.01.02 Richtlijn bestandsformaat en compressie Versie 0.6, concept, 20-03-2009
Datum Uitgifte 24-04-2007 10-01-2008 22-01-2008 03-03-2009
Versie
Status
0.1 0.3 0.4 0.5
Concept Concept Concept Concept
5