Eén petabyte. Tegelijk véél en heel weinig.µ
In Digitaal Archief Vlaanderen willen we na vijf jaar 1 petabyte digitale overheidsinformatie gearchiveerd hebben. De eerste jaren starten we kleinschalig om daarna in hogere versnellingen te schakelen.
Eén petabyte is weinig in vergelijking met een data-intensief bedrijf zoals Google dat tientallen petabytes data per dag verwerkt. Facebook heeft een opslagcapaciteit van 100 petabyte. En de teller van de Wayback Machine van het Internet Archive, dat sinds 1996 actief is, staat op zo’n 10 petabyte aan gearchiveerde websites. De Vlaamse openbare sector is dus een kleine speler, wat ons aanspoort om samen te werken.
En tegelijk is één petabyte heel veel. Dat zijn 27 miljoen sociale dossiers van een OCMW of 143 miljoen overheidsopdrachtendossiers van een VO-departement. Dat is een ontzettend rijke bron aan informatie, die momenteel hoegenaamd niet ontgonnen wordt. Maar iedereen heeft nog wel even werk om dat doel te halen, zeker als die informatie netjes beschreven moet zijn.
De maatschappij verwacht van ons dat we onze overheidsinformatie beter en sneller ter beschikking stellen. Archieven moeten daarin een leidende rol opnemen. Bovendien willen we meer informatiegestuurd werken, wat ook enkel kan als gearchiveerde informatie bereikbaar is. Maar om 1 petabyte overheidsinformatie te ontsluiten, volstaat de huidige methodologie niet.
We hebben dus nog veel werk voor de boeg. Als we binnen vijf jaar de kaap van 1 petabyte zouden ronden, zal er niet alleen veel informatie gearchiveerd zijn maar zijn de fundamenten gelegd om de maatschappij toe te laten meerwaarde te creëren met onze informatie.