FAAD-studiedag data-archivering (6 maart 2023)

META Nummer 2023/5

FAAD-studiedag data-archivering (6 maart 2023)

Geschreven door Sofie Roebben, Remco Bruijnje
Gepubliceerd op 05.09.2023
IMPORTANT

Het is een feestjaar voor het Forum voor Afgestudeerden Archivistiek en hedendaags Documentbeheer (FAAD), we bestaan namelijk 25 jaar. Ook de manama-opleiding archivistiek staat voor een nieuw tijdperk, nadat we vorig jaar afscheid namen van Frank Scheelings als hoofd van de opleiding. Bart Ballaux neemt de fakkel over en wordt daarbij bijgestaan door drie nieuwe docenten: Erwin Steegen, Geert Leloup en (de eerste vrouw!) Jelena Dobbels. Hoewel de opleiding en het lesprogramma de laatste jaren wijzigingen ondergaan hebben, gaat men de komende jaren nog enkele verbeteringen doorvoeren. Zo wil men onder meer de vereisten voor de stages aanpakken. Pas afgestudeerden kunnen hierover meedenken en hun ervaringen delen door zich aan te melden voor de focusgroep.

Het is een feestjaar voor het Forum voor Afgestudeerden Archivistiek en hedendaags Documentbeheer (FAAD), we bestaan namelijk 25 jaar. Ook de manama-opleiding archivistiek staat voor een nieuw tijdperk, nadat we vorig jaar afscheid namen van Frank Scheelings als hoofd van de opleiding. Bart Ballaux neemt de fakkel over en wordt daarbij bijgestaan door drie nieuwe docenten: Erwin Steegen, Geert Leloup en (de eerste vrouw!) Jelena Dobbels. Hoewel de opleiding en het lesprogramma de laatste jaren wijzigingen ondergaan hebben, gaat men de komende jaren nog enkele verbeteringen doorvoeren. Zo wil men onder meer de vereisten voor de stages aanpakken. Pas afgestudeerden kunnen hierover meedenken en hun ervaringen delen door zich aan te melden voor de focusgroep.

IMPORTANT

Een introductie over moderne data-architectuur werd gegeven door Michiel De Keyzer van PwC. Een van de tendensen binnen data-architectuur die hij aanhaalt, is de loskoppeling van applicaties en data. De data blijven zoveel mogelijk in hun bronapplicatie zitten en worden opgehaald door of gevisualiseerd in andere applicaties. Databanken moeten ook steeds flexibeler ingezet kunnen worden en bereikbaar zijn via de cloud. Een goed beheer van data én hun metadata is essentieel voor het opzetten van data-oplossingen binnen een organisatie. Opdat alle systemen op een goede manier met elkaar kunnen communiceren, is het werken met standaarden essentieel, ook voor de data en metadata. Daarbij verwijst hij naar de OSLO-standaard (Open Standaarden voor Linkende Organisaties) die ontwikkeld werd door de Vlaamse overheid en (bijna) geïmplementeerd is binnen Digitaal Archief Vlaanderen (DAV). Op die manier worden de data een echte troef voor je organisatie.

Vanuit Lissabon gaf Luis Faria van KEEP SOLUTIONS ons meer uitleg over de concepten, strategieën en tools voor data-archivering. In zijn verhaal ligt de focus vooral op relationele databanken. KEEP SOLUTIONS promoot de strategie van het converteren van data in een archiveringsformaat en het inkapselen van alle documentatie die latere preserveringsacties mogelijk maken. Daarbij maken ze gebruik van Software Independent Archiving of Relational Databases (SIARD), een opensource-archiveringsformaat voor relationele databanken. Dat op internationale standaarden gebaseerde formaat wordt gebruikt en ondersteund door de Europese Commissie. Om de archivering van databanken in de praktijk om te zetten, heeft KEEP SOLUTIONS de Database Preservation Toolkit (DBPTK) ontwikkeld. Met deze tool zet je een relationele databank om naar een archiveringsformaat en kun je dat valideren en doorzoeken. Het SIARD-pakket is vervolgens klaar voor opname in een e-depot.

IMPORTANT

Jef Scheepers lichtte nadien zijn thesis over sensordata uit 2019 toe. Daarbij bestudeerde hij data die geregistreerd worden door sensoren (zoals klimaatsensoren in archiefdepots, tellingen van fietsers op de openbare weg). Voor het verwerken van sensordata moet rekening gehouden worden met een aantal aandachtspunten: 1) de betrouwbaarheid van de data en de aannames die we maken, 2) op welke manier deze data iets vertellen over personen en ze dus privacygevoelig zijn, en 3) de al dan niet voorspelbare aangroei van de data. Het verzamelen van de data wordt ook vaak uitbesteed, waardoor de aanbestedende instelling de data moet ophalen via een portaalsite. Je kunt het best op voorhand afspraken maken over de overdracht van de data van zodra het contract met de leverancier afloopt. Zo niet, dan zijn alle data verloren. Tijdens zijn stage kwam Jef tot de conclusie dat datastromen perfect beschreven kunnen worden via ISAD(G) en PREMIS. Een moeilijkere oefening was deze van de selectie van sensordata. Deze data zijn belangrijk in het kader van later wetenschappelijk onderzoek, en wetenschappelijk hergebruik is niet helemaal hetzelfde als historisch hergebruik. De selectie van sensordata zou dus nog meer onderzocht moeten worden. Vanuit zijn thesis, en ook vanuit zijn huidige job bij ManGO (het platform voor het beheer van actieve onderzoeksdata van de KU Leuven) wil Jef ons vooral bijbrengen dat we geen angst moeten hebben om ons verder te verdiepen in het beheer en de archivering van data.

Ten slotte kwam Mathias Dillen van de Plantentuin Meise aan het woord. Bij deze erfgoedinstelling maken ze gebruik van Zenodo voor de archivering en wereldwijde ontsluiting van hun wetenschappelijk onderzoeksmateriaal. Zo’n 75 procent van de collectie is momenteel gedigitaliseerd. De TIFF-bestanden worden reeds gearchiveerd door meemoo.

IMPORTANT

Daarnaast experimenteert de Plantentuin met Zenodo als een archiveringsoplossing voor gedigitaliseerde natuurhistorische data en documentatie. Zenodo wordt gehost door CERN en zij beloven dat de applicatie minstens twintig jaar ondersteund zal worden. Ze zetten de tool ook in voor het beschrijven van hun content door het grote publiek. Na enkele pilootprojecten waarbij grote datasets geüpload werden, kwam men tot de volgende conclusies: enerzijds is Zenodo een gratis en toegankelijk platform, relatief eenvoudig in gebruik, en je krijgt garanties op lange termijn; anderzijds is de ondersteuning beperkt en werken de application programming interfaces (API’s) niet altijd even goed.

Data vormen geen nieuw gegeven voor organisaties, maar er zijn wel veel uitdagingen. Data-archivering is er een van. De sprekers toonden aan dat er, ondanks het feit dat er nog veel onontgonnen terrein is, ook oplossingen zijn, al zijn ze niet altijd evident om uit te voeren. Dat dit onderwerp leeft onder afgestudeerden wordt duidelijk door de hoge opkomst (ongeveer zestig deelnemers). Het toont ook aan dat de archivaris een belangrijke rol te spelen heeft in het omgaan met data, niet alleen bij archivering, maar ook bij de opbouw van data. We kijken uit naar toekomstige ontwikkelingen, die ongetwijfeld zullen resulteren in nieuwe, boeiende use cases door onze alumni.

IMPORTANT

Waarom lid van de VVBAD worden?

  • Deel zijn van het netwerk van experten en collega's
  • Mee de belangen van de informatiesector behartigen
  • Korting krijgen op de activiteiten van de VVBAD
  • Toegang krijgen tot vakinformatie
  • Participeren in de verenigingsbesturen
Word lid
© Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw
Statiestraat 179 | B-2600 Berchem (Antwerpen)
Tel: (+32) 03 281 44 57 | email: vvbad@vvbad.be