Een andere reden om zoveel mogelijk data over de gecreëerde metadata op te nemen, is het in de toekomst kunnen herhalen van bepaalde processen. Mogelijk zorgt de evolutie van de technologie binnen enkele jaren voor workflows die een nog beter resultaat opleveren. Ook de referentieset zal soms (moeten) wijzigen, bijvoorbeeld omdat er nieuwe en betere foto’s ter beschikking komen, of omdat mensen ouder worden en de referentieset bij voorkeur de leeftijdsvariatie weerspiegelt.
Wegschrijven van gegenereerde metadata
Ook het wegschrijven van de verkregen metadata, zijnde de opname van de metadata in een beheersysteem, is een uitdaging. De gezichtsherkenningsresultaten zijn pas zinvol wanneer ze op een goede manier weggeschreven worden door de collectiebeherende organisaties. Of de gebruikte beheersystemen daar vandaag klaar voor zijn, hangt gedeeltelijk af van wat de organisaties precies willen wegschrijven. Dat kan variëren van een text string met iemands naam, over een unieke interne of externe identifier voor elke geïdentificeerde persoon (eventueel met waarschijnlijkheidsscore), tot aanvullend de exacte positie van de persoon in de foto of de tijdcode in de video waarop een bepaalde persoon voorkomt.
Een aansluitende vraag is of deze metadata eerder in het collectiebeheersysteem, het beeldbeheersysteem of een ander databeheersysteem opgenomen moeten worden, en hoe ze dan gestructureerd moeten zijn om de import ervan vlot te laten verlopen. Een belangrijk aspect daarbij is de keuze van het bestandsformaat. Bij de betrokken FAME-partners komen JSON, XML en CSV het vaakst naar boven als hanteerbare bestandsformaten om data in bulk in hun beheersystemen te importeren.
Technische infrastructuur en diensten
Niet alle erfgoedorganisaties beschikken over de kennis en middelen om zelf aan gezichtsherkenning te doen. Hoe kan de sector samenwerken om de technische infrastructuur en bijbehorende expertise te delen die daarvoor nodig is? Als we de technische vereisten voor een gedeelde technische infrastructuur kunnen bepalen, wordt het misschien mogelijk om deze zodanig te centraliseren dat verschillende organisaties er gebruik van kunnen maken. Dat zou ook de nood aan zeer specifieke expertise in elke collectiebeherende organisatie deels wegnemen. Technische infrastructuur delen impliceert een schaalvergroting, wat een sterke impact heeft op de relatieve prijs. Technologische componenten voor gezichtsherkenning evolueren razendsnel en vereisen continue investeringen. Een open vraag blijft of de schaal en de draagkracht van de Vlaamse cultureel-erfgoedsector volstaan om zo’n centrale infrastructuur op te zetten en te onderhouden.
Fysiek delen van infrastructuur is niet de enige optie. Het is ook mogelijk om gecentraliseerd gezichtsherkenning aan collectiebeherende organisaties aan te bieden als software as a service. Daarbij kunnen we ofwel bestaande diensten bij (vaak grote internationale) bedrijven aankopen, ofwel een eigen Vlaamse dienstverlening uitbouwen.
Bestaande producten hebben het voordeel dat ze gebruiksklaar en kwalitatief zijn. Een nadeel is hun gebrek aan transparantie. Zelf tools ontwikkelen laat toe om optimaal op onze noden in te spelen en op onze specifieke workflows te focussen, maar dat kost kennis en tijd. Het budget gaat dan niet naar de aankoop van software, maar naar de werktijd van vakmensen. Dat maakt wel bepaalde principiële keuzes mogelijk, bijvoorbeeld voor open source en ethische waarden. Cruciale afwegingen tussen beide opties zijn dus enerzijds de gewenste mate van controle en anderzijds de bruikbaarheid qua kwaliteit en schaal van off the shelf (kant-en-klare) oplossingen.
Conclusie
FAME heeft aangetoond dat gezichtsherkenning een positieve impact kan hebben op de aanmaak en aanvulling van beschrijvende metadata. In grote hoeveelheden foto’s zijn op een (semi)- automatische manier de afgebeelde publieke personen geïdentificeerd. Mogelijk zouden collectieregistratoren nooit al die personen zelf hebben kunnen identificeren, omdat dat niet alleen veel tijd, maar ook veel kennis vergt.
Betekent dat dat iedere archiefinstelling, iedere bibliotheek of ieder documentatiecentrum onmiddellijk probleemloos gezichtsherkenning kan beginnen toepassen op eigen collecties? Nee, spijtig genoeg niet. Er is nog geen laagdrempelige kant-en-klare oplossing die door de meeste cultureel-erfgoedorganisaties individueel op een (kosten)efficiënte manier gebruikt kan worden. Een groot deel van de sector zal aangewezen zijn op overkoepelende oplossingen
Maar dat betekent dat er eerst een (gedeelde) technische infrastructuur ontwikkeld moet worden die verschillende partijen op een laagdrempelige en (kosten)efficiënte manier kunnen gebruiken. Een extra uitdaging daarbij is dat de technologie nog evolueert, en dat de gecreëerde vectorprofielen meestal niet uitwisselbaar zijn tussen verschillende softwares. De vectorprofielen zullen telkens opnieuw gecreëerd moeten worden, ook voor de referentiesets. Niettemin zou in het delen van het referentiemateriaal een grote efficiëntiewinst kunnen schuilen, want de creatie van referentiesets kost veel tijd. Er zijn echter nog juridische drempels voor het delen van fotomateriaal en vectorprofielen.
En last but not least: gezichtsherkenning blijft op ethisch vlak een moeilijke kwestie. Los van wat louter wettelijk gezien (al dan niet) toegelaten is, dienen we als sector duidelijk te bepalen wat wij ethisch (on)aanvaardbaar vinden.