Waarom contentdonatie aan Wikimedia Commons een fantastisch idee is voor (erfgoed)organisaties

META Nummer 2019/9

Waarom contentdonatie aan Wikimedia Commons een fantastisch idee is voor (erfgoed)organisaties

Geschreven door Sam Donvil
Gepubliceerd op 09.12.2019
IMPORTANT

Tijdens Informatie aan Zee 2019 presenteerde PACKED-medewerker Sam Donvil ‘Waarom contentdonatie aan Wikimedia Commons een fantastisch idee is voor (erfgoed)organisaties’. Tijdens deze presentatie toonden we de resultaten van collecties die in het kader van het Wiki Loves Heritage project ontsloten werden. In dit artikel beantwoorden we opnieuw de vraag hoe de publicatie van erfgoedcollecties op Wikimedia platformen kan bijdragen tot meer zichtbaarheid voor je collecties en toeleiding naar je eigen platformen. Ook bekijken we hoe deze publicatie leidt tot een betere spreiding van je content, hergebruik van je data door derden en je tenslotte in staat stelt om je collecties met andere data te linken (linked open data). Voor deze bijdrage aan META bekijken we elk van deze stellingen aan de hand van een upload van de deelcollectie van het FelixArchief en onze werking rond het ontsluiten van podiumkunsten.

Het potentieel van het Wikimedia ecosysteem en haar community

De Wikimedia beweging heeft een sterk engagement naar het ontsluiten van kennis rond erfgoed en cultuur. Aangezien haar platformen dagelijks wereldwijd door een enorm publiek geraadpleegd worden, is zij een natuurlijke bondgenoot voor erfgoedinstellingen die hun collecties breed zichtbaar willen maken. Daarom zet PACKED al sinds enkele jaren in op projecten die erfgoed op de encyclopedie Wikipedia, de audiovisuele repository Wikimedia Commons en de vrij bewerkbare databank Wikidata erfgoedcollecties ontsluiten. Samen vormen deze platformen namelijk een gelinkt ecosysteem dat erfgoeddata en reproducties via verschillende zoekingangen zichtbaar en vindbaar maakt. Eens deze content op de beeld- en databank staat, kan gebruik gemaakt worden van het crowdsourcingpotentieel van de Wikipedia-community door Wikipedianen te mobiliseren om deze beelden in Wikipedia-artikels in te bedden. Bovendien kan de op Wikidata gepubliceerde metadata door vrijwilligers verrijkt worden en aan andere datasets gekoppeld worden.

IMPORTANT

Wiki loves Heritage

De Wikimedia-community organiseert wereldwijd een aantal fotowedstrijden om privépersonen aan te zetten hun foto’s onder vrije licenties op Wikimedia Commons op te laden met als doel meer illustratiemateriaal voor de encyclopedie Wikipedia beschikbaar te maken. Vaak gebeurt dit rond een bepaald thema zoals Wiki Loves Monuments of Wiki Loves Africa. Uiteraard is de community ook geïnteresseerd in de officiële reproducties die door erfgoedinstellingen zelf gemaakt worden. In 2019 co-organiseerde PACKED daarom op vraag van het Departement Cultuur, Jeugd en Media, en samen met Wikimedia België, Herita, FARO en het Agentschap Onroerend Erfgoed, het project Wiki Loves Heritage met als doelstelling de erfgoedsector aan te sporen om te experimenteren met ontsluiting op Wikimedia platformen en het aanmoedigen van de samenwerking met de Wikimedia-gemeenschap. 

Dit project verliep langs twee sporen: enerzijds zetten we in op crowdsourcing door vrijwilligers, net als de bij andere Wiki Loves-initiatieven, door middel van een wedstrijd aan te sporen om hun eigen content op Wikimedia Commons te publiceren. Tussen het aflopen van de wedstrijd in november 2018 en het moment van schrijven werden de 4370 beelden die door de vrijwilligers opgeladen werden in totaal 8.558.563 keer weergegeven. In 2019 werd het project herhaald. Dit leverde tot het moment van schrijven al 584 nieuwe beelden op.

Zichtbaarheid, vindbaar en beter gespreid 

Anderzijds is Wiki Loves Heritage voor PACKED een vehikel om erfgoedinstellingen aan te zetten om hun eigen reproducties en metadata op Wikimedia platformen te ontsluiten. Zo besloot het FelixArchief om een deelcollectie van 1048 prenten op Wikimedia Commons te ontsluiten. Volgens de analytics van Wikimedia werden sinds de upload 75 beelden in Wikipedia-artikels geplaatst en daar in de maand september 64.292 keer weergegeven.

Content op Wikimedia platformen bereikt geïnteresseerden uit diverse taalgemeenschappen. De beelden van het FelixArchief vinden op de verschillende taalversies van Wikipedia op dit moment hun weg naar lezers van Wikipedia in het Nederlands, Engels, Frans, Duits, Fins, Italiaans, Portugees en Zweeds. Naargelang de community nieuwe artikels schrijft of bestaande artikels vertaalt, zal de zichtbaarheid van de collectie van het FelixArchief verder toenemen. Bovendien kunnen erfgoedinstellingen (of hun achterban) zelf hun expertise inzetten om nieuwe artikels te schrijven om zo hun digitaal bereik verder te vergroten. Zo schreven medewerkers van het Koninklijk Museum voor Schone Kunsten Antwerpen zelf artikels over een groot aantal van hun topstukken. Op die manier verhoogden ze het aantal Nederlandstalige artikels over individuele werken uit haar collectie naar 90. Deze content is voor een groot stuk mee verantwoordelijk voor vertalingen naar andere talen wat het aantal artikels in het Engels op 47 brengt, artikels in het Spaans en het Italiaans op tien en tenslotte één Russisch artikel.

Beelden kunnen op verschillende manieren gebruikt worden. Uiteraard kan een beeld gebruikt worden om een artikel over dat specifieke werk te illustreren. Daarnaast kan eenzelfde beeld ook op vele verschillende plaatsen gebruikt worden. Denk maar aan artikels over personen, plaatsen en concepten. Op die manier speel je in op de reële manier hoe mensen op internet op zoek gaan naar informatie en geïnteresseerd raken in verwante content. Hun zoektocht begint namelijk meestal niet op de website van een bepaalde instelling. Iemand die misschien niet zozeer op zoek is naar de collectie van het FelixArchief wordt er nu via een Google-zoekopdracht naar bv. de 19de eeuwse politicus Frans Verdussen toch mee geconfronteerd omdat het beeld van het FelixArchief nu in de infobox in het artikel over deze persoon staat.

Naast meertalige tekstuele content op Wikipedia, biedt de inherente meertaligheid van de databank Wikidata voordelen. De metadata die we per werk ook in Wikidata ingeven, kan namelijk in bijna 500 talen weergegeven worden. Dit is automatisch en vereist geen extra inspanning eens je je data in Wikidata hebt opgeladen. Dit houdt natuurlijk wel een data reconciliation in die je via de upload-functionaliteit van het datacleaning programma OpenRefine kan doorvoeren. Met deze tool reconcilieer je de text strings uit je dataset namelijk met entiteiten (bv. Frans Verdussen, politicus of Antwerpen) op Wikidata (of maak je nieuwe aan wanneer deze nog niet bestaan). Deze opkuisprocedure zorgde er in het geval van het FelixArchief voor dat aan de data in de bestaande entiteit voor Frans Verdussen ook de tot dan toe ontbrekende Franstalige versie van zijn naam François Antoine Verdussen toegevoegd werd. Aangezien Google data uit Wikidata hoog indexeert, vinden gebruikers van de zoekmachine nu ook voor het Franstalige equivalent van de naam dezelfde persoon (en bijbehorend beeld uit collectie FelixArchief ter illustratie) bovenaan in hun zoekresultaten.

IMPORTANT

Toeleiding naar eigen platformen

Er zijn verschillende manieren waarop je de kans kunt verhogen dat bezoekers van Wikimedia platformen bewust zullen worden dat een bepaald beeld uit je collectie komt en eventueel naar je eigen platformen doorverwezen worden. Ten eerste laden we de reproducties op met gedetailleerde metadata. Hierbij linken we zoveel mogelijk terug naar de collectiebeherende instelling. Deze metadata worden op verschillende niveau’s toegevoegd, te beginnen van het bestandsniveau.

Voor we een beeld opladen, voegen we met een tool beschrijvende metadata (maker, collectie, rechteninformatie, creatiedatum, persistente links, enz.) toe aan de ingebedde metadata. Je kent ingebedde metadata wellicht voornamelijk van technische metadata in verband met de camera-instellingen of geografische informatie. Er zijn echter ook gestandaardiseerde EXIF-velden vastgelegd om onze beschrijvende metadata in te bedden. Aangezien deze metadata in het bestand zelf ingebed zijn, reizen ze mee naargelang het van Wikimedia Commons gedownload wordt en daarna buiten de Wikimedia platformen circuleert. Daarnaast voegen we deze metadata ook nog eens toe bij het beeld op de beeldbank Wikimedia Commons en als linked data op Wikidata. Bovendien kan je nog eens extra in de verf zetten van waar een beeld komt door een klikbare link naar het artikel van je instelling op te nemen in de legende van het beeld als je het in een Wikipedia artikel zet.

Linken met andere data (linked data) en verrijking 

Zoals boven vermeld, biedt de databank Wikidata erfgoedinstellingen de mogelijkheid om hun datasets van text-strings te publiceren als linked data. De omzetting van text-strings naar zogenaamde triple statements bestaande uit een subject, predicaat en object gebeurt tijdens het datacleaningproces in de eerder vermelde tool OpenRefine. Zo een triple statement is de kleinste entiteit in het Resource Description Framework datamodel dat toelaat om data te linken en machineleesbaar te maken. Op die manier wordt het mogelijk om de data op te vragen aan de hand van een query (in het geval van Wikidata in de SPARQL-querytaal). Dit stelt bv. onderzoekers in staat om doorheen alle op Wikidata gepubliceerde en gelinkte collectiedata van de wereld te zoeken en in dezelfde query aan te spreken.

Nadien kan deze data natuurlijk verder verrijkt worden door andere bewerkers. Dit gaat van het toevoegen van geografische gegevens en iconografische beschrijvingen tot afgebeelde personen, dingen of plaatsen, stijlperiodes, enzovoort. Zo publiceerde PACKED data van Kunstenpunt in verband met podiumkunsten. Louter door data over de podiumkunsten op Wikidata te uploaden, ontstaat er al een vorm van verrijking. Een deel van de onderwerpen uit de dataset van Kunstenpunt was reeds aanwezig op Wikidata met een bepaalde hoeveelheid informatie.

Door op Wikidata de koppeling te leggen met de corresponderende identifier bij Kunstenpunt, kan iedereen die dat wil de verrijkte data hergebruiken. Ook voor Kunstenpunt zelf als datadonateur is er een directe winst. Neem bv. Mercat de les Flors, een theater in Barcelona waar elk jaar een aantal Vlaamse dansvoorstellingen te zien zijn. De Kunstenpuntdatabase bevat de naam van het theater, het land, de postcode, zelfs het precieze adres, maar door de koppeling met Wikidata krijgt Kunstenpunt onder meer de geocoördinaten, een foto van de speellocatie en gekoppelde Wikipedia-artikels aangereikt. Van de 2058 speellocaties die vanuit de Kunstenpuntdatabank in Wikidata verrijkt of eraan toegevoegd werden, hebben 802 een gelinkte afbeelding in Wikidata. Daar liggen dus directe mogelijkheden tot verrijking.

IMPORTANT

Ook de data vanuit Archiefbank Vlaanderen verrijken Wikidata. Doordat zowel Kunstenpunt als Archiefbank Vlaanderen data over dezelfde organisaties beheren, wordt Wikidata de plaats waar deze informatie samenkomt in een rijkere context. Een voorbeeld: Bij’ De Vieze Gasten was al aanwezig op Wikidata. Vanuit de Kunstenpuntdatabank werd dit item verrijkt. Nadien werden de gegevens over de archieflocatie uit Archiefbank Vlaanderen toegevoegd. Ook andere gebruikers zorgden voor verrijking van dit item, bv. door de toevoeging van de MusicBrainz-identificatiecode.

IMPORTANT

Hergebruik 

We hadden het hierboven al over gebruik binnen het Wikipedia-ecosysteem zelf. De beelden kunnen echter ook buiten het ecosysteem circuleren, denk maar aan het gebruik op blogs of andere websites, gebruik in de klas, enzovoort. Zoals hierboven vermeld, vormt de ingebedde metadata dan de beste garantie dat gebruikers informatie over het beeld en de collectie waartoe het behoort meekrijgen. Anderzijds kan het materiaal ook voor creatief hergebruik aangewend worden. Zo moedigt het
Rijksmuseum met haar Rijksstudio Awards ontwerpers aan om de collecties die zij online ontsluiten te gebruiken in hun nieuwe creaties.

IMPORTANT

Door instellingen vrijgegeven data kunnen via de Application Programming Interface of API van Wikidata in andere applicaties binnengetrokken worden. Als we op de online catalogus van Muntpunt zoeken naar Guy Cassiers’ toneelbewerking van de roman van Marcel Proust, krijgen we onderaan een tekst uit Wikipedia met een foto die door een vrijwilliger op Wikimedia Commons was opgeladen. Als ik mijn taalinstelling naar het Frans verander, wordt deze info uit het Franstalig artikel getrokken.
 

IMPORTANT

PACKED organiseert elk jaar verschillende opleidingen wat betreft werken met Wikimedia platformen in het kader van de Open Data Bootcamp en Publiek Domein Dag. Voor meer info hou je de nieuwsbrief van PACKED in de gaten!

De slides van de presentatie tijdens Informatie Aan Zee 2019 vind je hier terug: www.slideshare.net/packedvzw

Waarom lid van de VVBAD worden?

  • Deel zijn van het netwerk van experten en collega's
  • Mee de belangen van de informatiesector behartigen
  • Korting krijgen op de activiteiten van de VVBAD
  • Toegang krijgen tot vakinformatie
  • Participeren in de verenigingsbesturen
Word lid
© Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw
Statiestraat 179 | B-2600 Berchem (Antwerpen)
Tel: (+32) 03 281 44 57 | email: vvbad@vvbad.be