Een digitaal archief in 10 stappen

Informatie aan Zee 2009 donderdag 10 tot vrijdag 11 september 2009

Een digitaal archief in 10 stappen

Wie:

Sonja Schaule, eDavid

Waar:

Permeke

Wanneer:

Vrijdag 11 september 2009, 13.30u.

Abstract

Tijdens deze workshop wordt stap per stap besproken wat de aandachtspunten zijn bij het archiveren van digitale documenten, welke infrastructuur en welke (open source) tools gebruikt kunnen worden en hoe alles praktisch kan worden uitgewerkt.

Tijdens de workshop demonstreren we een aantal zaken in de praktijk. De deelnemers kunnen hierdoor kennismaken met tools voor digitale archivering.

Tot de doelgroep van deze workshop behoren kleine tot middelgrote erfgoedbeherende instellingen (archieven, bibliotheken, musea, documentatiecentra, ...) die digitale en gedigitaliseerde documenten willen archiveren. Er wordt uitgegaan van instellingen met een beperkt budget en met een alledaagse ICT-infrastructuur.

Deelnemers weten na deze workshop hoe ze hun digitale en gedigitaliseerde documenten op een duurzame en bruikbare wijze moeten beheren.

CV

Sonja Schaule studeerde in 2007 af in Finland als Master Audiovisual Media Culture. Sindsdien breidde ze haar expertise inzake digitaal archiveren als projectmedewerker bij het Expertisecentrum DAVID (eDAVID) uit. Sonja werkt momenteel aan het project Digitaal Depot http://www.edavid.be/digitaaldepot/. Dit project is gericht op het duurzaam bewaren van digitaal cultureel erfgoed zoals websites, e-mails, blogs, etc.

Verslag door Luc De Munck

Sonja Schaule, projectmedewerker van het Expertisecentrum DAVID (eDAVID), besprak op een overzichtelijke manier 10 aandachtspunten waarmee rekening moet worden gehouden bij het opzetten van een e-depot. Daarbij maakte ze een onderverdeling in drie grote thema’s: de hard- en softwarearchitectuur, de functionaliteiten van het digitaal archief en het documenteren van het digitaal archief.

Bij de hard- en softwarearchitectuur is de eerste stap de keuze voor het opslagsysteem. Dit moet uitbreidbaar zijn, gescheiden van de beheersapplicatie en meerdere interfaces ondersteunen. Digitale objecten moeten naar een nieuw opslagsysteem worden overgeplaatst wanneer de vereiste leestechnologie in onbruik raakt of niet langer wordt ondersteund, het aantal fouten op een drager opvallend stijgt of de drager degradeert.

Daarbij worden best permanent en systematisch kwaliteitscontroles uitgevoerd, hetzij volledig geautomatiseerd, hetzij bij eenvoudiger systemen steekproefgewijs op een representatief staal. Ook toegangscontroles zijn noodzakelijk (wie heeft welke rechten?), evenals het maken van back-ups en veiligheidskopieën.

Een tweede stap is het duurzaam bewaren van de metadata. De digitale duurzaamheid van documenten wordt immers alleen gegarandeerd als ook de metadata over de documenten digitaal duurzaam worden bewaard. Daarom is het belangrijk dat metadata niet enkel in applicatieafhankelijke formaten en/of een database worden bewaard, maar dat dit bv. in XML-formaat gebeurt in het digitale archiveringssysteem. Een archiveringsstrategie voor metadata is noodzakelijk en het is ook belangrijk dat documentatie over het datamodel van de database wordt gearchiveerd.

Een derde en laatste stap in de hard- en softwarearchitectuur is de band tussen het document en de metadata. Contextinformatie is essentieel voor het begrijpen en gebruiken van archiefdocumenten, maar veel archiveringssystemen slaan metadata gescheiden van documenten op. Een duurzame en reconstrueerbare link tussen het document en de metadata is echter noodzakelijk. Dit kan gerealiseerd worden door het inbedden van metadata in de header van de bestanden (bv. bij TIFF), door de inkapseling van het document en de metadata in een containerformaat (bv. XML) of door de opslag van metadata bij de digitale objecten in het opslagsysteem (bv. als XML).

De meeste aandachtspunten bij het archiveren van digitale documenten hebben te maken met de functionaliteiten van het digitaal archief. Een eerste stap daarin is de noodzaak om voor elk digitaal object metadata te registreren. Elk object moet immers identificeerbaar, lokaliseerbaar en controleerbaar op fouten zijn, en de relatie tussen het document, de representaties en de digitale objecten moet duidelijk zijn. Daarom is het nodig de unieke identificatiekenmerken ID, de relatie met de representatie en het digitale document, en de reference-, fixity- en representation information expliciet te registreren.

Een volgende stap is het definiëren en documenteren van de essentiële eigenschappen van de documenten. Welke dit zijn hangt af van de ontstaanscontext en de archiefwaarde. Zo kan het voor een website belangrijk zijn om haar opmaak en alle functionaliteiten te bewaren (bv. animaties), terwijl voor e-mails de opmaak vaak minder belangrijk is. Er moet gedocumenteerd worden welke elementen van een digitaal document essentieel zijn voor het behoud van authenticiteit en integriteit. De keuzes van archiveringsformaten, omzettings- en emulatietools worden gebaseerd op het behoud van de essentiële eigenschappen van het document.
Een derde stap bij de functionaliteiten van het digitaal archief is het bewaren van de leesbaarheid van documenten. Omdat deze leesbaarheid zeer sterk afhangt van de software is het belangrijk om afhankelijkheden van softwarepakket, -versie of –leverancier te vermijden. Dit kan door het gebruik van formaten die genormeerd, open en voldoende gedocumenteerd zijn, de essentiële eigenschappen van het authentieke document bewaren, geen significant informatieverlies met zich meebrengen en voldoen aan de behoeften van de gebruikersgroepen. Bij opname in het digitaal archief moet gecontroleerd worden of de vereiste representaties aanwezig zijn, of deze voldoen aan het voorgeschreven formaatprofiel (hiervoor kunnen tools als JHOVE en/of DROID – Digital Record Object Identification - worden gebruikt, die tijdens de presentatie ook werden voorgesteld), of de documenten niet corrupt of beschadigd zijn, of de documenten kunnen geopend worden en of de technische metadata en de softwareondersteuning voor het leesbaar maken van documenten aanwezig zijn.

Een volgende stap is het archiveren van de componenten voor getrouwe reconstructie. Hiervoor is meestal bepaalde software vereist. Alle componenten voor deze reconstructie moeten geïdentificeerd worden, en de vereiste componenten worden dan in het digitaal archief opgenomen. Deze componenten en hun afhankelijkheden en onderlinge relaties moeten ook gedocumenteerd worden.
Een vijfde stap is het documenteren van het beheer van documenten. Om het beheer van de authenticiteit van documenten te onderbouwen, is het belangrijk om de evolutie van een document te documenteren vanaf de creatie/opname in het digitaal archief. Dit situeert zich zowel op het niveau van de beheersmetadata, waarbij wordt bepaald voor welke beheersacties welke metadata worden uitgevoerd, als op dat van de metadata voor het uitvoeren van preserveringsacties.

Een laatste stap bij de functionaliteiten van het digitaal archief is het beschrijven van de documenten. Beschrijvende metadata zijn immers nodig om documenten terug te vinden en te begrijpen. Daarom moeten documenten geïdentificeerd en gecontextualiseerd worden. Hierbij is het nodig een antwoord te geven op vragen naar de archiefvormer, het werkproces waarin het document een rol had en de relatie van het document met andere documenten.

Een allerlaatste stap is het documenteren van het digitaal archief. Het is noodzakelijk om documentatie te archiveren over het digitaal archiveringsbeleid, de bewaarstrategie, de toegepaste normen en standaarden, de databasemodellen, de broncode, de procedures, de workflows en het opslagsysteem. Het verdient aanbeveling om deze documentatie niet exclusief in het eigen archief te bewaren, maar bv. bij de notaris of in de archiefbeherende instelling.

Sonja Schaule gaf tot slot aan dat deze 10 stappen misschien afschrikwekkend overkomen, maar dat het vooral belangrijk is om hiermee van start te gaan en dan stap voor stap een digitaal depot uit te bouwen. Uiteraard moet de eigen organisatie daarbij altijd het uitgangspunt vormen, en moet het duidelijk zijn waar ze naartoe wil. Digitaal archiveren zal steeds een ‘work-in-progress’ blijven, de publicaties van eDavid (zie www.edavid.be) bieden alvast een stevig houvast voor iedereen die met deze uitdaging wordt geconfronteerd. En wie is dat niet in de archiefwereld?

Waarom lid van de VVBAD worden?

  • Deel zijn van het netwerk van experten en collega's
  • Mee de belangen van de informatiesector behartigen
  • Korting krijgen op de activiteiten van de VVBAD
  • Toegang krijgen tot vakinformatie
  • Participeren in de verenigingsbesturen
Word lid

VVBAD maakt gebruik van cookies om uw gebruikservaring te optimaliseren. Door deze te accepteren of door gebruik te blijven maken van deze website, gaat u akkoord met het plaatsen van deze cookies. Wil u meer weten over cookies, of uw cookie-instellingen voor deze website aanpassen? Bekijk dan hier de voorwaarden.

© Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw
Statiestraat 179 | B-2600 Berchem (Antwerpen)
Tel: (+32) 03 281 44 57 | email: vvbad@vvbad.be