6

META Nummer 2012/5

6

Geschreven door Tom Cobbaert
Gepubliceerd op 01.06.2012
Op de General Assembly van het International Internet Preservation Consortium (IIPC) begin mei 2012 presenteerde de Library of Congress (LoC) een stand van zaken over webarchivering in hun instelling. Opvallend was de groeiratio van het webarchief dat sinds dit jaar ongeveer 6 terabyte (TB) per maand bedraagt. 6 TB of 6000 gigabyte per maand. Een twitterende vakgenoot merkte bij het zien van dit cijfer op hoe lang de LoC dit qua opslag nog zal volhouden. Denkend aan de verschillende studies rond information explosion — de onhoudbare groei van digitale informatie, tot 1,8 zettabyte of 1 biljoen TB op jaarbasis, die de wereldwijd beschikbare opslag overstijgt — is dit geen onterechte observatie. De LoC startte in 2000 met MINERVA, een pilootproject rond webarchivering. De bibliotheek bouwde in de daaropvolgende jaren haar collectie uit met thematische webharvests rond de Amerikaanse verkiezingen van 2000 en 9/11. In 2004 werd een webarchiveringsteam gevormd om een documentaire collectie van websites aan te leggen rond een thema of een gebeurtenis zoals de oorlog in Irak, orkaan Katrina tot de Jasmijnrevolutie. In 2010 kwamen daar ook alle publieke data van Twitter bij. Het logische gevolg is dat de cijfers variëren per verzamelstrategie. Als quasi enige speler poogt het Internet Archive een zo groot mogelijk deel van het WWW te harvesten, ongeacht thema of geografie. Dit resulteert in een omvangrijke collectie van circa 2,4 petabytes of 2400 TB en een maandelijkse aangroei van meer dan 20 TB. Wijder verspreid is de verzamelstrategie die zich beperkt tot een bepaald nationaal domein. Wanneer we bij een aantal bekende initiatieven bekijken blijkt dat bijv. het Deense Netarkivet een trimesteriële aangroei van gemiddeld 25 TB realiseert. Terwijl aan de andere kant van de wereld het webarchief van de National Library of Australia (NLA) een jaarlijkse aangroei van circa 35 TB kent.

Waarom lid van de VVBAD worden?

  • Deel zijn van het netwerk van experten en collega's
  • Mee de belangen van de informatiesector behartigen
  • Korting krijgen op de activiteiten van de VVBAD
  • Toegang krijgen tot vakinformatie
  • Participeren in de verenigingsbesturen
Word lid
© Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw
Statiestraat 179 | B-2600 Berchem (Antwerpen)
Tel: (+32) 03 281 44 57 | email: vvbad@vvbad.be