Hoe eArchiving Europa verbindt

META Nummer 2020/8

Hoe eArchiving Europa verbindt

Geschreven door Thomas Fillis, Robert Ley, Fulgencio SanMartin
Gepubliceerd op 26.10.2020
IMPORTANT

Digitale archivering roept verschillende vragen op: Is het echt gemakkelijker bits en bytes te bewaren dan papier? Zorgt digitalisering ervoor dat papier bewaard wordt? (Hints: neen en neen). In dit artikel gaan we in op verschillende vragen en lichten we het eArchivingprogramma van de Connecting Europe Facility (CEF) toe.

Digitalisering is het proces waarbij analoog materiaal omgezet wordt naar digitaal. Het is per definitie een momentopname die nodig is voor het bewaren van gegevens. Maar digitaliseren (scannen) is slechts een eerste stap in de digitale transformatie van een archief, er komt zoveel meer bij kijken.

Archivering kent verschillende uitdagingen voor zowel fysieke als digitale bewaarmethoden. Een kort overzicht vind je terug in het bijgevoegde kader. Het bewaren van gegevens is dus afhankelijk van digitale strategieën zoals migratie of emulatie. Wanneer je niet migreert, betekent dat het verlies van data.

Uit een studie van Vines et al. blijkt dat tachtig procent van de wetenschappelijke gegevens die onderzoekers in de jaren negentig verzamelden, voor altijd verloren gegaan is. Nog enkele vragen die hierbij van belang zijn: Wil je of moet je data voor een lange tijd bewaren? Hoelang?

Zijn je data ooit opzettelijk of onbedoeld gewijzigd door menselijke tussenkomst of door beschadiging van de fysieke drager? Is je data-collectie volledig? Hoe weet je dat of wanneer was de laatste keer dat je dat nagekeken hebt? Het enige doel van optische dragers, zoals dvd’s of cd’s, was het voorkomen van piraterij.

Daarom kregen ze maar een beperkte gebruiksduur. Hoeveel archieven – vooral culturele archieven – zijn er echter gebaseerd op optische dragers? Heb je de afgelopen vijf tot tien jaar al je cd’s, dvd’s of USB-apparaten gecontroleerd? Moet je veel verschillende formaten opslaan?

Heb je verschillende formaten voor hetzelfde type document? Zijn je gegevensformaten nog leesbaar over vijf of tien jaar? Met leesbaar bedoelen we dat het formaat niet afhankelijk is van een particulier bedrijf of van specifieke software om op dat moment nog te bestaan.

IMPORTANT

Daarnaast moeten we bij nog heel wat andere vragen stilstaan. Archiveer je je e-mails in een standaardformaat? Wat met websites, databases of sociale media? Bewaar je metadata – dat zijn contextuele gegevens over de gegevens zelf?

Hoe doorzoek je je data? Stel je voor dat over tien jaar niemand van je team te bereiken is, zal de informatie dan nog bruikbaar of zinvol zijn voor een toekomstig team?

“Once a document is signed, it is preserved forever.”

Deze zin werd ooit uitgesproken tijdens een vergadering over digitalisering. “Digitalisering is het gebruik van digitale technologieën om een businessmodel te wijzigen en nieuwe inkomsten en waarde-creërende kansen te bieden. Het is de ontwikkeling naar een digitaal bedrijfsmodel.” Zo staat het in de Gartner Glossary.

De bewering zou echter eerder iets moeten zijn als: “Zodra een document elektronisch ondertekend is, hebben we bewijs dat het niet gewijzigd is”. En dat zolang de handtekening, de software en het platform samen bewaard zijn.

Daarom moeten we in staat zijn om deze drie zaken te migreren naar een toekomstige omgeving Opnieuw ontstaan hier heel wat vragen bij. Hoe weet je dat je gegevens ingevoerd zijn door de oorspronkelijke auteur?

Heeft iemand (of een kunstmatige intelligentie) je data gelezen, geëxtraheerd of aangepast zonder autorisatie of tracering? Als je je gegevens in de cloud bewaart, of op een computer, server of datacenter dat aangesloten is op het internet, zijn die data dan gelezen door iemand die niet bevoegd is?

Kun je daar bewijs voor leveren? Bewaar je verschillende versies van je gegevens? Wat met metadata? Hoe weet je of je collectie compleet is? Samenvattend kunnen we stellen dat het een uitdaging is om je data te bewaren voor toekomstig hergebruik. Daarvoor moeten ze uitwisselbaar en betrouwbaar zijn.

Je gegevens bewaren, migreren, hergebruiken en vertrouwen: dit is de visie van CEF eArchiving

De Europese Commissie en de EU-lidstaten werken samen om Europa’s nationale IT-landschappen op verschillende manieren te verbinden.

Enkele voorbeelden daarvan zijn het onderling verbinden van nationaal uitgegeven elektronische ID’s, het standaardiseren van het digitale inkoopproces en het opzetten van de uitwisseling van transcontinentale veiligheidsdata.

Daarnaast wil men een data-economie mogelijk maken, waarbij big-datasets in realtime gebruikt kunnen worden en zo een basis kunnen vormen voor de besluitvorming in de publieke sector

IMPORTANT
OAIS Functional Entities (bron: public.ccsds.org)

De Europese Commissie, gefinancierd door de CEF, bewerkstelligde dat door digitale Building Blocks te implementeren. Dat zijn op standaarden gebaseerde open solutions die zowel publieke als private digitale diensten uitwisselbaar maken tussen EU-lidstaten.

In 2018 keurde de Europese Commissie de CEF eArchiving Building Block goed. De Commissie deed dat in de wetenschap dat een onderling verbonden, digitale, eengemaakte markt gebaseerd is op correct bewaarde data, zodat deze data hergebruikt en vertrouwd kunnen worden.

De CEF eArchiving Building Block helpt overheidsinstanties de uitdagingen van gegevensbeheer op korte en lange termijn aan te pakken. eArchiving is bedacht en ontwikkeld om de nationale archieven van de lidstaten te onderhouden en ondersteunen bij het uitvoeren van hun mandaten, taken en uitdagingen.

De CEF eArchiving Building Block

Elk informatiesysteem en de bijbehorende fysieke ondersteuning ervan raakt uiteindelijk in onbruik. Dat heeft invloed op veiligheid, efficiëntie en gebruiksgemak.

Een groeiend aantal instellingen behandelt de kwestie van de digitale nalatenschap al; namelijk door de vraag te stellen hoe je ervoor kunt zorgen dat cruciale digitale informatie die in verouderde systemen verzameld is, toch beschikbaar blijft via moderne technologieën, hardware- en softwarecomponenten.

De gebruikelijkste oplossing is datamigratie. De data worden daarbij geëxporteerd uit het oorspronkelijke systeem, opnieuw geformatteerd indien nodig, en daarna geïmporteerd in het nieuwe platform.

Hoewel het op kleine schaal doenbaar is, maken het groeiende aantal informatiesystemen en de hoeveelheid gegevens migratie steeds complexer en duurder. In het ergste geval kan datamigratie leiden tot het verlies data of van de context ervan.

Dat heeft ernstige gevolgen voor de levering van diensten voor bedrijven en kan leiden tot een verlies van aansprakelijkheid en tot onjuiste beslissingen.

IMPORTANT

De eArchiving Building Block biedt hiervoor enkele oplossingen. Hij is gebaseerd op de resultaten van het E-ARK-project (2014- 2017). Daarbij waren een aantal Europese nationale archieven, e-overheidsinstanties, ontwikkelaars van digitale bewaringssoftware en onderzoeksinstellingen betrokken.

Het doel was om best practices uit heel Europa met elkaar in verband te brengen en een kernset van uitwisselbaarheidspecificaties voor archieven te ontwikkelen. Het project werkte een aantal componenten van archiveringssoftware bij om aan de specificaties te voldoen.

Daarnaast voerde het een aantal pilootprojecten uit om de geldigheid over de grenzen en de uitwisselbaarheid van de specificaties te verifiëren. De specificaties worden onderhouden door de Digital Information LifeCycle Interoperability Standards (DILCIS) Board.

Na de succesvolle afronding van het E-ARK-project in 2017, nam de Europese Commissie de resultaten ervan op in het CEFprogramma om de basis te vormen van de eArchiving Building Block.

Binnen de CEF worden de initiële specificaties en de opensourcesoftware-componenten uitgebreid met diensten op het vlak van opleiding en ondersteuning bij de implementatie.

De eArchiving-specificaties

De eArchiving-specificaties zijn gebaseerd op gemeenschappelijke, internationale standaarden voor het verzenden, beschrijven en bewaren van digitale gegevens.

De belangrijkste standaard is het referentiemodel voor een Open Archival Information System (OAIS), de internationale ISO-norm 14721, dat informatiepakketten als basis heeft.

De belangrijkste standaard voor het verzenden van informatiepakketten is de Metadata Encoding and Transmission Standard (METS). Voor het documenteren van de bewaarde informatiepakketten zijn de Preservation Metadata: Implementation Strategies (PREMIS) de belangrijkste standaard.

IMPORTANT

De eArchiving-specificaties beschrijven in detail de uitwisselbare en open formaten om data en metadata te bundelen voor overdracht naar archiefbewaarplaatsen (E-ARK SIP), voor de langdurige bewaring (E-ARK AIP) en voor het hergebruik van gearchiveerde content (E-ARK DIP).

De meest voorkomende principes en vereisten worden afzonderlijk gepresenteerd in de E-ARK Common Specification for Information Packages (E-ARK CS for IP). Meer details over eArchiving-specificaties zijn beschikbaar op dilcis.eu

Hoe werkt eArchiving?

Je begint met eArchiving door je probleem van digitale langetermijnbewaring af te stemmen op de eArchiving formaatspecificatie en tool portfolio. Dat betekent dat je de formaatspecificaties en tools selecteert die het best bij je probleem passen.

De juiste eArchiving-componenten vinden, is niet altijd eenvoudig. Je moet de logica achter de eArchiving-elementen begrijpen en enige kennis hebben van de eArchiving-use cases, specificaties en tools.

Dit proces komt neer op: 

  1. het volgen van het OAIS-referentiemodel voor een digitaal archief, informatiepakket en archiveringsproces;
  2. het gebruiken van E-ARK-use cases en -processen als voorbeeld
  3. het begrijpen van de specificaties en tools van eArchiving;
  4. het vinden van oplossingen voor je digitale archiveringsproblemen.

Een informatiepakket volgens het OAIS-model bestaat uit de archiefinhoud samen met de beschrijvende en technische metadata. Er zijn drie soorten informatiepakketten:

  • de Submission Information Package (SIP), d.w.z. de input van het archief;
  • de Dissemination Information Package (DIP), d.w.z. de output van het archief;
  • de Archival Information Package (AIP), d.w.z. het interne formaat dat het archief gebruikt voor de langetermijnbewaring.
IMPORTANT

De processen van een OAIS-archief zijn: Ingest (opname), Archival Storage (opslag), Preservation Planning (bewaarstrategie), Data Management (informatiemanagement) en Access Administration (toegangsbeheer).

De bovenstaande lijst wordt vaak uitgebreid met een Pre-Ingest-proces. Dat houdt in dat de data en metadata beoordeeld worden en vervolgens gecompileerd worden tot de Submission Information Package. Het Pre-Ingest-proces wordt meestal uitgevoerd door de instelling die de data produceert.

Het nut van CEF eArchiving 

Door gebruik te maken van eArchiving kan elke organisatie haar eigen ecosysteem voor archivering op lange termijn opzetten. Daarnaast kan ze gestandaardiseerde workflows ontwikkelen die waardevolle interne content naar externe archiefopslagplaatsen overbrengen.

De eArchiving-set bevat:

  • open en platformonafhankelijke specificaties voor het creëren van tijdbestendige data en metadata. De specificaties zorgen ervoor dat gegevens naar opslagplaatsen voor lange termijn (d.w.z. digitale archieven) overgezet kunnen worden en maken het bewaren en hergebruiken van gegevens over verschillende generaties softwaresystemen mogelijk;
  • opensourcesoftware-componenten die aantonen hoe gegevens geëxporteerd, bewaard en hergebruikt kunnen worden volgens de specificaties; - voorbeeldsoftware om aan te tonen hoe de specificaties in verschillenden scenario’s en bedrijfsomgevingen gebruikt kunnen worden;
  • gestandaardiseerde begeleiding en training over vraagstukken rond gegevensbeheer op lange termijn en digitale archivering; - een centrale community voor discussies over digitale archivering.

CEF eArchiving biedt de volgende voordelen voor dataproducenten, dienstverleners en archieven:

  • uitwisselbaarheid: door het implementeren van een gemeenschappelijke reeks specificaties voor het verpakken van digitale informatie, kunnen verschillende organisaties gegevens bundelen en verzenden voor opslag (en voor daaropvolgende toegang en hergebruik). Dat gebeurt onafhankelijk van platforms en over de grenzen heen. Door Europese open standaarden en specificaties te gebruiken, vermijden organisaties dat ze afhankelijk worden van een leverancier.
  • beveiliging: het behouden van gegevens met open specificaties, het toestaan van digitale handtekeningen en het documenteren van gegevenswijzigingen bevorderen een sfeer van transparantie. Die creëert op haar beurt vertrouwen in de data en in de informatielevenscyclus onder de gebruikers van eArchiving.
  • wettelijke verplichtingen: de gemeenschappelijke reeks specificaties, ontwikkeld door de nationale archieven van de lidstaten in het licht van een uitgebreide pan-Europese juridische studie, bevordert het naleven van allerhande wettelijke verplichtingen (bv. bewaarplicht).
  • schaalbaarheid en analyse: door een gemeenschappelijke set specificaties te implementeren voor het verpakken van digitale informatie, kunnen zowel kleine als zeer grote digitale archiefsystemen uitgebouwd worden.
IMPORTANT
Deelnemers tijdens de breakout-sessies van de workshop Meet eArchiving.

Zoals de zaken er nu voorstaan, vormen de nationale (centrale of gemeentelijke) archieven, evenals financiële instellingen en EU-organen, de grootste groep die de CEF eArchiving Building Block hergebruikt. Met name het publicatiebureau van de EU behoort tot deze groep.

Het Official Journal of the European Union is digitaal ondertekend en juridisch bindend sinds 2013. Het wordt bewaard in een eArchiving-conform systeem. Hergebruik van CEF eArchiving is op verschillende manieren gunstig gebleken voor bovenstaande organisaties.

Zo kon het Deense nationale archief dankzij de steun van deze Building Blocks beginnen met gestandaardiseerde digitale archivering.

Het werkte nauw samen met de Zwitserse federale archieven en het softwarebedrijf KEEP Solutions om een bijgewerkte versie van het open formaat Software Independent Archiving of Relational Databases (SIARD) te creëren.

Deze update biedt nieuwe functies en een betere schaalbaarheid zodat het mogelijk is om databases te behouden en opnieuw te gebruiken.

EU-subsidies om CEF eArchiving te laten hergebruiken 

Na verschillende workshops, conferenties en informele contacten met belanghebbenden was het duidelijk dat eArchiving één belangrijk element ontbeerde: fysieke hosting en financiering voor IT-advies.

De Europese Commissie luisterde en wees 1 miljoen euro toe om de implementatie van onze eArchiving-specificaties te ondersteunen. Deze strategische financiering is gericht op andere organisaties dan de nationale archieven, zoals openbare of internationale instellingen, softwarebedrijven of kleine en middelgrote ondernemingen.

Dat gebeurt op verschillende domeinen zoals cultureel erfgoed, justitie, financiën en milieu. Concreet dekt deze financiering de aanpassing van bestaande digitale archieven en repositories om te voldoen aan de E-ARK SIP, de E-ARK AIP en de E-ARK DIP, naast bepaalde andere criteria.

Voorstellen kunnen verder betrekking hebben op het verwerven of verhuren van archiefhosting, inclusief hardware, onderhoud van activa, kennisuitwisseling en trainingsactiviteiten ter ondersteuning van de acceptatie en het hergebruik van de eArchiving Building Block.

IMPORTANT

Tot 15 november kunnen bedrijven nog een aanvraag indienen voor de CEF-subsidies. Deze financiering maakt de weg vrij om het aantal gebruikers te doen toenemen, wat meerdere voordelen oplevert:

  • lagere kosten voor het implementeren en onderhouden van eArchiving-oplossingen (bv. schaalvoordelen) en een hogere efficiëntie; eenvoudigere manieren voor data-eigenaars om gegevens uit te wisselen met organisaties of individuen, wat zal helpen om te voldoen aan de vereisten van de gegevensoverdraagbaarheid in de Algemene Verordening Gegevensbescherming (AVG);
  • betere marktkansen en een groter concurrentievermogen voor IT-aanbieders, dankzij een gemakkelijkere grensoverschrijdende uitwisseling van archiefgegevens; grotere grensoverschrijdende beschikbaarheid van commerciële eArchivingsdiensten voor zowel de publieke als de particuliere sector; de mogelijkheid om nieuwe innovatieve diensten te creëren op basis van gearchiveerde digitale gegevens;
  • betere opleidings- en werkgelegenheidskansen voor personeel, dankzij het gebruik van een gemeenschappelijk systeem;
  • verbeterde langetermijnopslag en beschikbaarheid van data uit de publieke en private sector; betere transparantie van de overheid als resultaat van verbeteringen in de eArchivingsmogelijkheden en van de openbare toegang tot gearchiveerde digitale documenten.

eArchiving community, webinars en workshops 

Naast het conceptuele model en de specificaties voor informatiepakketten, bouwt de Commissie een actieve gemeenschap rond eArchiving. Via de eArchiving User Community-ruimte kunnen belanghebbenden ervaringen uitwisselen.

Pan-Europese projecten die (her)gebruik maken van CEF eArchiving hebben hun eigen subgemeenschappen binnen die ruimte. Daarbovenop komen de open webinars en evenementen die de Europese eArchiving-gemeenschap samenbrengen.

IMPORTANT
Specialisten van de Commissie presenteren de Building Block. V.l.n.r.: Joao Rodrigues Frade, Lieven Baert en Fulgencio Sanmartin

De teams achter de Building Block hebben begin 2020 een reeks webinars georganiseerd, waarvan vele opgenomen zijn. Je kunt ze online bekijken.

  • Daarnaast organiseerde het CEF eArchiving-team een workshop voor belanghebbenden, met drie hoofddoelstellingen:
  • bewustmaking van de problematiek wat betreft digitale bewaring en van het potentieel van eArchiving op dat vlak;
  • verder reiken dan de nationale archieven, zowel naar andere bestuursniveaus als naar andere domeinen;
  • luisteren naar de verschillende gebruikersgemeenschappen om het beleid op dit gebied te verbeteren.

De workshop had als doel een uitgebreid begrip te krijgen van de behoeften en problemen van de deelnemers op het vlak van digitale bewaring. Ook deze sessies zijn opgenomen en kun je online bekijken.

Al de feedback die we verzamelden tijdens deze workshop zal ons helpen om het digitale archiveringsbeleid in de CEF eArchiving Building Block te verbeteren.

Conclusie 

eArchiving is de onschatbare, maar vaak over het hoofd geziene schakel in de keten die nodig is om een verbonden, digitale, eengemaakte markt op te bouwen. Wanneer men aan ‘archiveren’ denkt, denkt men vaak dat het dient om dingen uit het verleden te bewaren.

Maar archiveren is gericht op de toekomst, en archivarissen worden gedwongen als volgt te denken: hoe kan het toekomstige archiefteam over tien jaar de informatie die we vandaag genereren begrijpen en hergebruiken?

Bestaan de formaten en de media waarop we de gegevens bewaren dan nog? Documenten digitaliseren of digitaal ondertekenen, zijn slechts kleine stappen in het langdurig bewaren en hergebruiken van informatie.

eArchiving richt zich op de volledige levenscyclus van het bewaren van je gegevens door deze standaard en uitwisselbaar te houden, zodat je erop kunt vertrouwen dat je ze kunt hergebruiken in de toekomst.

Waarom lid van de VVBAD worden?

  • Deel zijn van het netwerk van experten en collega's
  • Mee de belangen van de informatiesector behartigen
  • Korting krijgen op de activiteiten van de VVBAD
  • Toegang krijgen tot vakinformatie
  • Participeren in de verenigingsbesturen
Word lid
© Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw
Statiestraat 179 | B-2600 Berchem (Antwerpen)
Tel: (+32) 03 281 44 57 | email: vvbad@vvbad.be