Het Gevaert Papierproject

Home META META Nummer 2022/8 Het Gevaert Papierproject

META Nummer 2022/8

Het Gevaert Papierproject

Geschreven door Thomas Jenné, Alexander Derveaux

Gepubliceerd op 13.12.2022

Het Gevaert Papierproject ontsluit het fotopapier en de fotodocumentatie, de verpakkingen en de stalenboeken van de historische collectie Agfa-Gevaert uit de periode Gevaert (1894-1964). In samenwerking met digitaal-erfgoedexpert meemoo, Vlaams instituut voor het archief maken medewerkers van het team Collectie van het Fotomuseum Antwerpen (FOMU) dat materiaal en de bijbehorende informatie toegankelijk als open data, en linken ze het aan de collectie fotoverpakkingen en stalenboeken van het FOMU. Zo wordt dat de eerste referentiecollectie van die omvang in Europa.

De historische collectie Agfa-Gevaert kwam in 2017 naar het FOMU na een intensief waarderingstraject. De collectie werd tijdelijk opgeslagen in een extern depot tot duidelijk was op welke hoogte en met welke middelen de collectie ontsloten zou worden. In 2020 kende de Vlaamse overheid subsidie toe aan het Gevaert Papierproject, dat in eerste instantie focust op het borgen van de kennis over analoge fotografie die aanwezig is in de collectie, en in tweede instantie op het breed ter beschikking stellen van de collectie aan onderzoekers en publiek. De historische collectie Agfa-Gevaert heeft immers door haar omvang, inhoud en unieke karakter nationaal en internationaal aanzien.

In de collectie is bijzonder veel informatie bewaard over de fotopapieren die Gevaert produceerde tijdens de eerste helft van de twintigste eeuw. Het ‘lezen’ van die fotopapieren levert veel informatie en data op over de taal van fotografen en fotofabrikanten. Dat ‘lezen’ doe je aan de hand van nauwkeurige observatie en gespecialiseerde kennis. Elementen zoals onder andere textuur, glans, kleur en dikte maken elk papier uniek. Als je die kunt identificeren, kun je de producent benoemen en leer je veel over de technische en artistieke werkwijze van fotografen. Naast de fotopapieren geeft ook de documentatie over deze materialen ons inzicht in de analoge zwart-witfotografie uit de twintigste eeuw.

Omdat allerlei gegevens over fotopapier verzameld zouden worden en ergens opgeslagen moesten worden door de medewerkers van het team Collectie, was een databank de meest logische ontsluitingstool voor de fotopapieren en hun verpakkingen. Meemoo, partner van het FOMU binnen het project, zag hierin een kans om het gebruik van een Wikibase-instantie te testen binnen het cultureel-erfgoedveld.

Een Wikibase-instantie is een privéversie van de software die ook gebruikt wordt voor Wikidata, een ecosysteem dat nauw verwant is aan Wikipedia. Waar Wikidata dus volledig publiek is, kan een privé-instantie enkel door gekozen deelnemers bewerkt worden.

We digitaliseerden en registreerden meer dan 1.300 fotopapierverpakkingen en 70 hangmappen uit de collectie met informatie over fotopapier van Gevaert. De gegevens over deze verpakkingen worden gemodelleerd in een Wikibase-instantie en later gekoppeld aan de digitale afbeeldingen van de verpakkingen. We integreren ook de informatie uit de hangmappen in deze databank.

Bovendien namen we het grotere geheel van de historische collectie Agfa-Gevaert mee in het project. Zo maakten we alvast een standplaatslijst op van de documentheek – een deelcollectie die bijna elk mogelijk onderwerp in de geschiedenis van (Agfa)Gevaert documenteert. Hierdoor konden we sinds 2020 al 63 vragen over de historische collectie beantwoorden, en vonden zowel nationale als internationale onderzoekers hun weg naar onze leeszaal.

Vooronderzoek en ontwerp databank

De data vergaard binnen dit project passen niet binnen het reguliere collectiebeheersysteem (Adlib) van het FOMU. Papiersoort is namelijk geen standaard fysiek erfgoedobject. We hebben weliswaar samples (waarvan bepaalde informatie opgeslagen wordt in Adlib), maar de focus van het project ligt op de productspecificaties van dit papier. Dat is een aspect dat in de bestaande erfgoedapplicaties niet specifiek geïdentificeerd wordt. Daarom hebben we nood aan een applicatie die de nodige flexibiliteit biedt om het beschrijvingsmodel stap voor stap te ontwikkelen.

Een eerste belangrijke keuze bij het ontwerp van de databank was of we rechtstreeks op Wikidata zouden werken, of een private instantie wilden aanmaken – een databank die hetzelfde kan als Wikidata, maar waarin enkel wij dingen kunnen wijzigen. Uiteindelijk kozen we voor de private instantie vanwege de hogere graad van controle over de data. In Wikidata werken zou immers betekenen dat we onze data conform de daar geldende normen moesten opladen, en dat we het risico zouden lopen dat andere gebruikers wijzigingen zouden aanbrengen die niet volgens onze visie zijn. De mogelijkheid bestaat ook steeds dat de consensus op Wikidata verandert. Daarnaast biedt Wikibase een oplossing voor de nodige flexibiliteit, we hebben het datamodel zelf moeten ontwikkelen en dat zal ook nog verder evolueren.

Voor die private instantie hadden we de keuze tussen twee achterliggende softwarepakketten: Semantic MediaWiki (hierna SMW) of Wikibase. SMW is de standaard software om data in een wikiinstantie te beheren. Bij dat alles moet gezegd dat het Wikibaseverhaal van het FOMU een avontuur genoemd kan worden. SMW was waarschijnlijk de veiligere keuze: het biedt een robuuster ecosysteem, bestaat al sinds 2005 en kent een brede gebruikersgroep die een beginnende organisatie kan ondersteunen. Wikibase kent een kleinere gebruikersgemeenschap die zich focust binnen de digital humanities, met maar enkele ontwikkelaars die zich toeleggen op het platform. Toch hebben wij gekozen voor het Wikibasepakket: de afwegingen bij de beslissing sommen we hieronder op. Waar SMW meer opties heeft om de gebruikersomgeving aan te passen en de databank er dus mooier uit te laten zien, is Wikibase veel rigider: om een gebruiksvriendelijke(re) interface te krijgen, moet er nog een frontend (webschil) geprogrammeerd worden. De andere verschillen gaven voor ons echter de doorslag om toch met Wikibase aan de slag te gaan. Onze data moeten in eerste instantie aan te bieden zijn als open data, en daarin blinkt Wikibase uit.

Zo moet het SPARQL-eindpunt, waarin bezoekers data via specifieke parameters kunnen opvragen, in SMW eerst geconfigureerd worden – in Wikibase is het standaard aanwezig. Het datamodel aanpassen is een omslachtig proces in SMW, waarbij onze hosting service provider elke keer zou moeten tussenkomen. In een Wikibase-instantie kunnen we zelf naar wens concepten toevoegen, verwijderen en aanpassen. Daarnaast is een essentiële eigenschap van open data dat ze gelinkt kunnen worden met andere data, bijvoorbeeld via verwijzingen naar andere autoriteitslijsten.

Binnen de flexibele datamodellering in Wikibase kunnen we onbeperkt linken naar andere autoriteitslijsten.

De Wikibase ‘zonder meer’ (lees: zonder mooie gebruikersomgeving) richt zich voornamelijk op mensen die hun weg kennen binnen de wereld van data. Via zelf samengestelde SPARQL-query’s kunnen ze data naar wens opzoeken en weergeven. In de toekomst gaan we ook andere doelgroepen aanspreken door een frontend op deze databank te ontwikkelen. Daardoor maken we de databank visueel aantrekkelijker en bouwen we gemakkelijkere zoekfuncties in. Die komen er in de vorm van voorgeschreven SPARQL-query’s, waarmee de meest voor de hand liggende vragen opgezocht kunnen worden, zoals ‘Geef me elk papier van het merk Gevaert in deze databank’. Naast een aantal voorbeelden met zelfgeschreven query’s documenteren we tevens hoe je zelf query’s kunt maken of op andere manieren de databank kunt doorzoeken. De search tools op de website van het Digital Archive of Artists’ Publishing laten zien hoe je voorbeeldquery’s kunt tonen en hoe je de zoekmogelijkheden voor gebruikers kunt documenteren.

Voor de ontwikkeling en hosting van onze Wikibase werken we samen met ontwikkelaar Professional.wiki. Zij hebben reeds jaren ervaring met allerlei softwarepakketten binnen het MediaWikiecosysteem en kwamen na een marktonderzoek als beste uit de bus. Sinds de start van het project is de populariteit van Wikibase overigens aanzienlijk toegenomen. Verschillende erfgoedinstellingen in de ons omringende landen zijn hier ondertussen ook mee aan de slag (onder andere het Ministerie van Cultuur in Luxemburg) en er is ook een stakeholdergroep opgericht waar FOMU lid van is. Wikibase is in essentie een databasesoftware die toelaat om semantisch betekenisvolle triples te maken op de manier die je hieronder ziet.

Dat laat ons ook eenvoudig toe om van onze databank een autoriteitslijst te maken van fotopapier. Daarop leggen wij een extra laag die het mogelijk maakt om eenvoudige zoekopdrachten uit te voeren en de lay-out te wijzigen. Op die manier kunnen we eenzelfde Wikibase-databank gebruiken voor informatie uit andere kennisbeheersystemen van het FOMU – in eerste instantie de Directory of Belgian Photographers. Zo verzamelen we systematisch meer kennis in Wikibase en bestaat de mogelijkheid om te linken tussen de databanken. Je kunt ook twee aparte websites maken die informatie trekken uit eenzelfde databank waarbij enkel de voor die website relevante data getoond worden.

Ontwikkeling van het datamodel

Voor het ontwerp van het datamodel werden we bijgestaan door Bert Lemmens van meemoo. Toen duidelijk was dat we voor Wikibase kozen, was de belangrijkste vraag welke informatie we wilden opnemen in het datamodel. Daarvoor keken we naar twee informatiebronnen: wat staat er op de verpakking en wat kunnen we terugvinden in de archiefmappen over het product.

Op de afbeelding is zichtbaar welke soort informatie allemaal terug te vinden is op een fotopapierverpakking: merk, productnaam en productcode, contrast, reflectie, kleur van de onderlaag, oppervlaktetextuur, drager en eventuele inscripties. Deze informatie beschouwen we als de belangrijkste informatie over elke verpakking in onze collectie die we minstens willen invoeren in de databank. Uit de vele archiefmappen die bewaard zijn over de (fotopapier)producten van Gevaert komt nog een reeks extra informatie, zoals bijvoorbeeld de gebruikersdoelgroep van het fotopapier, concurrerende vergelijkbare producten, ontwikkelsnelheid, gebruiksrichtlijnen en zuiveringstechniek.

In het uiteindelijke datamodel hebben we gekozen om informatie niet of zo weinig mogelijk te herhalen, en geven we op het hoogst mogelijke niveau gegevens die hetzelfde zijn voor alle onderliggende records. Daarom werken we bij het beschrijven van producten op drie niveaus: dat van productreeks, product en productinstantie.

Enige context over fotopapier is hier op zijn plaats om de informatiestructuur beter te begrijpen. Een fotopapier werd gelanceerd onder een bepaalde productnaam, bijvoorbeeld ‘Gevarto’. Gevarto had als gebruikersdoelgroep de artistieke fotograaf, en de kenmerken van het fotopapier waren daarop afgestemd. Gevarto is in dit voorbeeld de productreeks.

De specifieke kenmerken van een fotopapier werden voor een gemakkelijke herkenning in productcodes gegoten, zoals ‘Gevarto K8XZ’. In die code staat de ‘K’ voor een kartonnen drager, ‘8’ voor een bepaalde textuur en reflectie, en ‘XZ’ voor een extra zacht contrast. Die combinatie aan eigenschappen binnen een productcode beschrijven we binnen het record product. Zo bestaan er records voor Ridax 8V, Ridax 8XZ, Ridax 8Z enzovoort.

Tot slot beschrijven we de eigenschappen die een verpakking uniek maken in vergelijking met andere verpakkingen: er staat een met de hand geschreven inventarisnummer op, er werden misschien inscripties gemaakt door vorige eigenaars van de verpakking, we noteren of de verpakking volledig is (hoeveel fotopapieren zijn er al uitgehaald) en wat de fysieke conditie van de verpakking is. Deze data beschrijven we binnen het laagste niveau, de product-instantie. De databank kan in sommige gevallen meerdere product-instanties van eenzelfde product bevatten: we nemen elke product-instantie op, omdat inscripties, inventarisnummers en de conditie van de verpakking kunnen verschillen.

Al deze gegevens werden onderverdeeld in de datatypes string, quantity en item, waarbij een string vrije tekst bevat, een quantity een aantal en een item uit een voorgeschreven lijst aan concepten kan kiezen.

Ontologie

Naast het beschrijven en verzamelen van de data willen we deze optimaal ter beschikking stellen voor andere cultureel-erfgoedinstellingen door deze te mappen naar een gemeenschappelijke ontologie binnen de sector. Het belang van het gebruik van een ontologie is dat de informatie door machines (en mensen) overal als hetzelfde geïnterpreteerd wordt. Het concept ‘dikte’ zal op die manier een duidelijke omschrijving hebben, verwijzende naar een gedeelde ontologie, zodat andere instellingen deze informatie kunnen overnemen, wetende wat dat juist wil zeggen.

In samenspraak met meemoo is ervoor gekozen om onze data te mappen naar een CIDOC-CRM-ontologie gezien wij hier gebruikmaken van een knowledge graph en niet van een relationele databank. Door het toenemende belang van de OSLO-standaard (Open Standaarden voor Linkende Organisaties) en de ontwikkeling van de applicatieprofielen Cultureel Erfgoed, willen we onze data tevens uitwisselbaar maken via de OSLO-standaard. Ook dat gebeurt in samenwerking met meemoo. Voor de meer technische uitwerking hiervan kun je na afloop van het project ons rapport nalezen op CEST en de documentatie op onze Wikibase-instantie.

Keuze terminologie en data-upload

Het lijkt misschien logisch om de terminologie over te nemen die Gevaert gebruikt voor al zijn concepten (zoals kleur, textuur of contrast). Dat zou inderdaad zo zijn als elke fabrikant in de twintigste eeuw dezelfde terminologie gehanteerd had. Laurent Roosens, oudwerknemer van Agfa-Gevaert en bezieler van de historische collectie Agfa-Gevaert, schrijft daarover in Arbeid Adelt – het basiswerk over de geschiedenis van Agfa-Gevaert: “elk fotochemisch bedrijf duidde de kenmerken van fotopapier, o.m. het oppervlak, met een zelfgekozen getal of letter of een combinatie van beide. Een internationale overeenkomst bestond hiervoor op verre na niet […] De fotohandel klaagde de toestand [in 1936 al] herhaaldelijk aan.” Het is dus moeilijk om fotopapieren van verschillende fabrikanten met elkaar te vergelijken, omdat de termen die Gevaert hanteerde iets compleet anders kunnen betekenen bij bijvoorbeeld Kodak. En een van de mogelijke manieren om onze databank te gebruiken, zou het vergelijkend onderzoek tussen Gevaert-fotopapier en andere fotopapieren moeten kunnen zijn. Maar daarvoor is dus een algemeen aanvaarde terminologie nodig die losstaat van de terminologie gehanteerd door de fabrikanten.

Als oplossing zochten we internationaal aansluiting bij de Universiteit van Amsterdam (UvA) en bij het Lens Media Lab (LML) van Yale University. Dat bood weinig soelaas: het project van de UvA focuste zich binnen het veld van analoge fotografie vooral op het hoogste niveau van termen, terwijl wij net nood hebben aan heel granulaire termen om eigenschappen zo correct mogelijk te beschrijven. Het LML maakte dan weer dezelfde bemerking die Roosens al formuleerde: terminologie binnen de wereld van fotopapier is zo’n wespennest dat ze zelfs niet proberen om een overschrijdende lijst aan terminologie te maken en bijna altijd de beschrijving van de fabrikant overnemen.

Na een steekproef op de historische collectie kwamen we tot de conclusie dat de terminologie van (Agfa-)Gevaert voor het beschrijven van fotopapier gedurende de twintigste eeuw nagenoeg hetzelfde blijft. Daarom oordeelden we in overleg met meemoo dat het te verantwoorden is om die terminologie over te nemen in onze Wikibase, met als beschrijving in het label dat we deze term niet zelf toegekend hebben, maar overgenomen van fabrikant Gevaert. Verder oordelen we zelf niet over wat de term betekent. Als later blijkt dat Kodak of Ilford Photo eenzelfde term gebruikte, voegen we dat onderaan het record toe – nogmaals zonder te beweren dat we weten wat zij ermee definieerden, enkel dat zij de term hanteerden.

Na het finaliseren van het datamodel en de terminologielijst werd een eerste reeks data opgeladen naar de Wikibase. Dat deden we met behulp van QuickStatements, een tool die ontwikkeld werd voor het opladen van gegevens op Wikidata, maar ook voor Wikibase gebruikt kan worden. Dat is de meest intuïtieve manier om data op te laden, maar tevens ook omslachtig. Daarom hebben we in fase 2 verder onderzoek gedaan en hiervoor betere oplossingen gevonden: tools zoals WikibaseSync (voor het importeren van Wikidataitems), OpenRefine (data cleaning-tool die ook in de bredere Wikicommunity gebruikt wordt) en Wikibase Integrator (een Python-tool voor het maken van geavanceerde bots die kunnen lezen van, en schrijven naar, Wikibase).

Vervolg van het papierproject

Het FOMU is een van de eerste cultureel-erfgoedinstellingen die een Wikibase gebruikt voor de ontsluiting van haar data. We hopen met dit artikel zowel de voor- en nadelen als het nut van een private Wikibase-instantie te hebben aangetoond. Binnenkort is de databank met informatie over de meer dan 1.300 fotopapierverpakkingen in de FOMU-collectie te raadplegen via de FOMU-website. Het papierproject gaat in 2023 verder, als subsidie gevonden wordt, met de ontsluiting van de collectie aan de hand van een driedelige videoreeks, een schrijfsessie op Wikipedia en een sectordag.

Volg het Gevaert Papierproject en het verhaal van de ontsluiting van de historische collectie Agfa-Gevaert verder via de FOMU-website en de FOMU-nieuwsbrief, en via onze partners binnen het project. Je kunt ons ook bereiken via onze e-mailadressen: Thomas.Jenne@ fomu.be of Alexander.Derveaux@fomu.be.

Dit project werd tot stand gebracht met steun van de Vlaamse overheid.

Het Gevaert Papierproject

Het Gevaert Papierproject

Vooronderzoek en ontwerp databank

Ontwikkeling van het datamodel

Ontologie

Keuze terminologie en data-upload

Vervolg van het papierproject

Waarom lid van de VVBAD worden?

Blijf op de hoogte