ISNI als uniek verbindingselement

META Nummer 2021/9

ISNI als uniek verbindingselement

Geschreven door Ann Van Camp
Gepubliceerd op 07.12.2021
IMPORTANT

Hoewel bibliotheken en erfgoedinstellingen traditioneel vooral focussen op het catalogiseren van hun collecties, groeit het besef dat ook het kwaliteitsvol beschrijven van personen en organisaties in belangrijke mate bijdraagt tot het beheren en ontsluiten van cultureel erfgoed. In een wereld waarin de digitale uitwisseling of publicatie van data exponentieel toeneemt, vervult de International Standard Name Identifier (ISNI) een sleutelrol.

In de bibliotheekwereld en bij uitbreiding in heel de GLAM-sector (Galleries, Libraries, Archives en Museums) lag de focus traditiegetrouw in de eerste plaats op de collecties en de bibliografische beschrijving ervan. In een papieren catalogus kon je fiches voor elk collectie-item aantreffen, alfabetisch gerangschikt volgens de familienaam van (een van) de auteur(s). Zelden of nooit bood zo’n fichebak uitgebreide informatie over de auteur zelf en in het geval van meerdere auteurs riskeerden de laatste namen op de titelbladzijde zelfs te verdwijnen onder een anonieme afkorting als et al., wat staat voor et alii of ‘en anderen’.

In de realiteit zijn de mensen die de collecties creëerden echter minstens even belangrijk als de werken die ze nalieten. Hoe dikwijls wordt een nieuwe publicatie of tentoonstelling niet aangekondigd met de naam van de auteur of kunstenaar? Denk bijvoorbeeld maar aan ‘de nieuwe Toni Coppers’ of ‘Toots 100. The Sound of a Belgian Legend’.

Bovendien kan sinds de opkomst van digitale catalogi elk onderdeel van een bibliografische beschrijving (auteur, titel, plaats van uitgave, uitgever, publicatiejaar, enz.) een zoekterm vormen en valt de beperking qua plaats die voor een papieren fiche gold, volledig weg. Verder valt het niet te ontkennen dat onze zoekgewoonten radicaal veranderd zijn nu we met zijn allen in groten getale gebruikmaken van zoekmachines als Google om snel even iets op te zoeken en pas in tweede instantie meer gespecialiseerde databanken raadplegen.

IMPORTANT

Die verander(en)de context zet bibliotheken ertoe aan om mee te evolueren. Een geïsoleerde bibliotheekcatalogus volstaat niet langer om aan de informatiebehoeften van het hedendaagse publiek te voldoen. Indien je als bibliotheek of erfgoedinstelling nog een stap verdergaat en granulaire beschrijvingen van jouw collecties ook op het internet verbindt met informatie uit verschillende andere online bronnen, dan kun je de kansen die het semantische web en linked (open) data bieden optimaal benutten. Een essentiële voorwaarde is wel dat je jouw informatie op een gestructureerde, machineleesbare en taalonafhankelijke wijze invoert, volgens standaarden en technologieën die wereldwijd gebruikt worden.

Wat is ISNI

International Standard Name Identifier

Een alom bekend voorbeeld van zulke internationale standaarden is het International Standard Book Number (ISO 2108) of ISBN, waarmee boeken sinds 1970 wereldwijd en eenduidig geïdentificeerd kunnen worden. Voor seriële publicaties bestaat er sedert 1975 een International Standard Serial Number (ISO 3297) of ISSN, waarvoor KBR trouwens ook fungeert als registratiekantoor. Voor personen en organisaties uit de creatieve sector is in 2012 een gelijkaardige internationale standaard ingevoerd: de International Standard Name Identifier (ISO 27729) of kortweg ISNI. ISNI is een uniek, persistent identificatienummer van zestien cijfers dat toegekend wordt aan publieke identiteiten van personen en organisaties die betrokken zijn bij de creatie, de productie, het beheer en de distributie van culturele inhoud.

Voordelen

Het gebruik van ISNI-nummers biedt heel wat voordelen. Ten eerste garandeert ISNI een betrouwbare identificatie van publieke identiteiten en voorkomt het verwarring tussen naamgenoten. Dat is bijvoorbeeld voor het beheer van intellectuele rechten cruciaal. Ook verhoogt een persistente URI (uniform resource identifier) zoals https://isni.org/isni/0000000122714686 de vindbaarheid van je beschrijving op het web.

Ten derde is het toekennen van een unieke identifier die wereldwijd en in diverse domeinen gebruikt wordt bijzonder handig voor het verbeteren van de kwaliteit van je data: dubbele beschrijvingen zijn vlot te detecteren en je data verrijken met informatie uit andere betrouwbare bronnen wordt nu veel eenvoudiger. Dat taalonafhankelijk en machineleesbaar identificatienummer vergemakkelijkt de uitwisseling van informatie aanzienlijk. Kortom, ISNI is heel nuttig als verbindend element om gegevens uit verschillende collecties en databanken aan elkaar te linken met het oog op wetenschappelijk onderzoek of toepassingen bestemd voor een breder publiek.

Wie beheert de ISNI-standaard?

Het bestuur van ISNI

Het ISNI International Agency – dat eind 2010 in Londen opgericht werd en dagelijks geleid wordt door een uitvoerend directeur, Tim Devenport, en een raad van bestuur – promoot en beheert het gebruik van de ISNI-standaard wereldwijd. Het ISNI Assignment Agency zorgt op zijn beurt voor de toekenning van de ISNI-identificatienummers en beheert de centrale ISNI-databank. Die rol van technische partner wordt vervuld door OCLC in Nederland.

Het ISNI Quality Team verleent advies om de algoritmes voor het toewijzen van ISNI’s te verfijnen, controleert representatieve steekproeven om de kwaliteit op peil te houden, verbetert records die manueel nazicht vereisen en antwoordt op input van eindgebruikers. Het kwaliteitsteam legt de lat op minimaal 95 procent accuratesse en bestaat uit leden van de Bibliothèque nationale de France en de British Library. 

De ISNI-gemeenschap

ISNI kan enkel bestaan dankzij de bijdragen van andere organisaties. Er zijn verschillende manieren om deel uit te maken van de ISNI-gemeenschap. ISNI Registration Agencies of registratiekantoren krijgen een licentie van het ISNI International Agency om ISNI-nummers aan te vragen, zowel voor zichzelf als voor derde partijen. ISNI Members of leden kunnen tegen een gunstig tarief gebruikmaken van de diensten van ISNI, enkel voor eigen doeleinden, niet namens anderen. Direct Data Contributors of gegevensverstrekkers bezorgen hun data rechtstreeks aan OCLC om de centrale ISNI-databank te verrijken en over verschillende sectoren heen identiteiten aan elkaar te linken.

KBR, een ISNI-registratiekantoor

KBR is sinds oktober 2020 erkend door het International ISNI Agency als ISNI-registratiekantoor. Die nieuwe rol opnemen, sluit naadloos aan bij onze missie en strategie. Als nationale bibliotheek en federale wetenschappelijke instelling verzamelt, beheert, bewaart, bestudeert en ontsluit KBR het Belgische uitgeefpatrimonium, en dat omvat niet alleen de collecties op zich, maar ook de autoriteiten die eraan gelinkt zijn. Bovendien is ISNI een essentieel hulpmiddel om de kansen die nieuwe technologieën en automatisering bieden ten volle te benutten en om vlot informatie uit te wisselen met het ecosysteem waarvan we deel uitmaken, met als uiteindelijk doel om nog beter te beantwoorden aan de behoeften van onze gebruikers.

IMPORTANT
Voor de verwerking van de KBR-data

Een eerste stap tijdens de opstartfase is het vergelijken van de meer dan 800.000 bestaande persoonsbeschrijvingen uit de KBR-catalogus met de centrale ISNI-databank. Zoals blijkt uit Tabel 1 en Grafieken 1 en 2, zijn er nu al – nog voor de verwerking van de KBR-data – 45.692 ISNI-nummers toegekend aan Belgische personen (71%) en organisaties (29%) en zijn er nog eens 14.751 ISNI-records voorlopig aangemaakt, maar nog te onzeker of onvolledig om al te publiceren. Na de verwerking van de KBR-data zullen die aantallen aanzienlijk stijgen voor personen, zoals blijkt uit Grafiek 3.

Zodra die initiële bulk load submission achter de rug is en de KBR-autoriteiten met een bestaand of een nieuw nummer verrijkt zijn, wordt er een permanente workflow opgezet, waarbij KBR tijdens het catalogiseren op regelmatige basis ISNI-nummers zal aanvragen voor personen van wie minstens één werk in de collecties van KBR aanwezig is en over wie onze informatie voldoende volledig is.

Ook een bulk load submission voor de bijna 118.000 collectiviteiten uit de KBR-catalogus staat nog op de agenda, maar omdat het beschrijven van organisaties heel wat complexer is en meer voorbereiding vergt, plannen we dat later in.

Hoe een ISNI-nummer vinden?

Eender wie kan online nakijken of aan een bepaalde persoon of organisatie al een ISNI-nummer toegekend is. De internationale ISNI-databank is vrij te raadplegen. Wie een uitzonderlijke fout of dubbel opmerkt in de databank, kan dat rechtstreeks melden via de link « Please help us improve this record » bij de ISNI-beschrijving in kwestie. Ben je geïnteresseerd in het opzoeken van ISNI-nummers in grote hoeveelheden? Dan biedt een (betalende) API-search (application programming interface) of binnenkort het linkeddata-aanbod een oplossing.

ISNI versus andere (name) identifiers

ISNI versus VIAF

Uiteraard is ISNI niet de eerste, noch de enige name identifier die in het leven geroepen is. Al in 2003 creëerde OCLC een Virtual International Authority File (VIAF), die sindsdien uitgegroeid is tot een wereldwijde referentie voor bibliotheken, archieven en musea. Hoewel OCLC zowel de ISNI-databank als VIAF host, verschillen beide initiatieven wezenlijk in meerdere opzichten.

Het voornaamste verschil bestaat erin dat ISNI een unieke, persistente, interoperabele, globale identifier verschaft voor het uitwisselen van betrouwbare informatie over personen en organisaties over verscheidene domeinen heen, terwijl VIAF op geen enkele manier ingrijpt in de data die het op geautomatiseerde wijze clustert en zich beperkt tot het neutraal samenvoegen van entiteiten uit een selectie van digitale bronnen, grotendeels nationale bibliografische agentschappen.

IMPORTANT
Grafiek 3: Aantal ISNI-nummers voor personen in de KBR-catalogus, volgens status

Bij het ontstaan van ISNI zijn data van VIAF geoogst om de nieuwe ISNI-databank te voeden. Een groot deel van de bestaande, dikwijls oudere ISNI-nummers kwam tot stand dankzij de input van VIAF. Sinds 2016 is er echter geen directe upload meer gebeurd van VIAF-data naar ISNI, terwijl ISNI nog wel data naar VIAF verzendt. 

ISNI versus Wikidata

Een recentere datahub waarvan het gebruik heel snel toeneemt, is Wikidata, de centrale databank om gestructureerde data te beheren van alle Wikimedia Foundation-projecten zoals Wikipedia en Wikimedia Commons. In Wikidata kun je niet enkel personen en organisaties uit de creatieve sector terugvinden, maar eender welke entiteit of eender welk real world object. Iedereen kan ertoe bijdragen, zolang de data maar beantwoorden aan het criterium van notability of relevantie. Tabel 2 vat de vergelijking van ISNI met VIAF en Wikidata samen.

ISNI versus ORCID

Een derde name identifier die complementair is ten opzichte van ISNI, is ORCID, een identifier die specifiek bestemd is om wetenschappelijke publicaties accuraat toe te schrijven aan individuele onderzoekers. Beide organisaties werken onafhankelijk van elkaar, maar hebben zich in 2013 wel bereid verklaard om hun identifiers zo goed mogelijk op elkaar af te stemmen: zo heeft ISNI een reeks nummers voorbehouden voor ORCID, gaande van 0000 0001 5000 0007 tot 0000 0003 5000 0001.

Nieuwe toepassingen van klassieke principes 

Universele Bibliografische Controle in tijden van het semantische web De visie achter ISNI is geïnspireerd door de principes van de Universele Bibliografische Controle (UBC). Al in 1974 richtte de Internationale Federatie van Bibliotheekverenigingen en Instellingen (IFLA) een bureau op voor UBC met als grondbeginsel dat elk document slechts één keer in het land van herkomst gecatalogiseerd zou worden, en dat die beschrijving dan door elke bibliotheek ter wereld hergebruikt zou kunnen worden, met het oog op meer efficiëntie en samenwerking. Het doel van UBC was een wereldwijd systeem op te zetten voor het beheer en de uitwisseling van bibliografische informatie, waarbij lokale nationale bibliografische agentschappen als het ware een universele catalogus zouden voeden.

IMPORTANT
ISNI van Filips de Goede en Filips de Goede, kopie naar Rogier van der Weyden. CC0, KMSKA - artinflanders.be – Hugo Maertens

Al gauw volgde echter het besef dat er meer nood was aan diversiteit en inclusie, zodat het lokale meer plaats kreeg in die globale aspiratie en de informatie ook toegankelijk werd voor lokale eindgebruikers in hun eigen taal of terminologie. In tegenstelling tot de traditionele authority control waarbij sprake is van enerzijds een unieke geautoriseerde vorm en anderzijds verworpen vormen, kent ISNI een uniek identificatienummer toe aan elke publieke identiteit en worden alle naamsvarianten in verschillende talen, alfabetten of culturen neutraal en evenwaardig opgelijst.

Bovendien is een bibliografische beschrijving als tekststring in zijn geheel voorbijgestreefd in de context van het semantische web, waarin – zoals eerder aangehaald – elk onderdeel van een record als afzonderlijke entiteit beschreven wordt, in verband met of gekoppeld aan andere real world objects, ook van buiten de bibliotheekwereld. ISNI werkt dus voort in de geest van UBC, maar met meer respect voor lokale verscheidenheid, met links naar de bronnen en hun oorspronkelijke beschrijvingen, en over de grenzen van verschillende creatieve domeinen heen.

Ad fontes

Of je nu nieuwe technologieën en internationale standaarden hanteert of niet, het eeuwenoude motto van Erasmus van Rotterdam, in primis ad fontes ipsos properandum (‘voor alles moet men zich haasten naar de bronnen zelf’), blijft brandend actueel voor eender welke informatieprofessional. Hoe bekom je kwaliteitsvolle informatie? Door betrouwbare bronnen liefst in hun oorspronkelijke versie en taal met elkaar te vergelijken en tegenstrijdige informatie verder te onderzoeken om uit te pluizen welke bron het bij het rechte eind heeft.

Dat bronnenonderzoek of het verzamelen en vergelijken van diverse bronnen is tegenwoordig heel wat eenvoudiger geworden dankzij de beschikbaarheid van digitale informatie online en (deels) geautomatiseerde methodes voor de verwerking ervan. Alleen heeft een computer eenduidige input en instructies nodig, terwijl een menselijk brein dikwijls onbewust meerduidige informatie aan de hand van de context of eigen kennis juist zal interpreteren. 

Zo is het voor een computer niet meteen duidelijk dat ‘Stijn Streuvels’ en ‘Streuvels, Stijn’ een en dezelfde persoon is, omdat de schrijfwijze verschilt en omdat de informatie niet granulair genoeg gestructureerd is. Voor computationele verwerking is het beter om aparte informatievelden aan te maken voor enerzijds de voornaam en anderzijds de familienaam.

IMPORTANT
Tabel 2: Vergelijking tussen ISNI, VIAF en Wikidata

Uitgaan van bepaalde vooronderstellingen kan heel praktisch zijn, maar houdt ook een risico in. Als je er bijvoorbeeld op vertrouwt dat een identieke voor- en familienaam voldoende is om personen te identificeren, dan kom je bedrogen uit in het geval van naamgenoten. Om ‘Koen Wauters’ te onderscheiden van ‘Koen Wauters’ heb je extra informatie nodig, zoals bijvoorbeeld het beroep: de ene is zanger en tv-presentator, terwijl de andere schrijver en wetenschapsjournalist bij de VRT is.

In andere gevallen kan het toevoegen van bijvoorbeeld de geboortedatum een oplossing bieden, al is dat lang niet altijd evident voor autoriteiten uit vroegere tijden. In het geval van onzekere informatie is het des te belangrijker om niet blindelings te vertrouwen op een gezaghebbende bron of de eerste de beste bron die je (online) terugvindt en om de moeite te nemen om de herkomst van de informatie na te gaan.

Zo merkte ik onlangs dat de geboortedatum die aan Filips de Goede toegeschreven wordt op Wikidata, namelijk 31 juli 1396, veelvuldig overgenomen werd op andere websites, terwijl de catalogus van de Bibliothèque nationale de France een andere geboortedatum vermeldt, namelijk 21 juli 1396.

Aangezien ik zelf geen expert ben op dat domein, ging ik te rade bij een collega van de afdeling Handschriften bij KBR. Volgens haar was geen van beide geboortedata correct en werd Filips De Goede geboren op 30 juni 1396. Die derde geboortedatum vond ik nadien ook terug in de gespecialiseerde databank Bibale.

Toen ik bij Bibale extra informatie opvroeg, antwoordde Hanno Wijsman dat 31 juli 1396 als geboortedatum waarschijnlijk is, maar dat 30 juni ook mogelijk blijft, afgaande op de Mémoires de l’Académie des sciences, arts et belles-lettres de Dijon (1830), p. LXIV-LXVII en een artikel van Bertrand Schnerb, noot 109, die op hun beurt weer andere bronnen citeren. Dat voorbeeld geeft aan dat de herkomst van informatie nagaan met kritische zin en menselijke inbreng meer dan ooit nodig blijft in een tijdperk van digitale transformatie waarin fake news zich – al dan niet opzettelijk – razendsnel wereldwijd kan verspreiden.

In tijden waarin we massaal data uitwisselen over alle grenzen heen, is een internationale standaard zoals ISNI onmisbaar voor een betrouwbare identificatie. Tegelijkertijd blijft er een hoge nood aan de expertise die bibliothecarissen en archivarissen sinds eeuwen opbouwden. Informatieprofessionals die vernieuwing met open armen verwelkomen zonder in te boeten aan kwaliteit, kunnen een voortrekkersrol spelen in een netwerk van linked data en meerwaarde creëren tot ver buiten de informatiesector.

Meer weten?

Neem een kijkje op kbr.be/nl/isni en isni.org.

Waarom lid van de VVBAD worden?

  • Deel zijn van het netwerk van experten en collega's
  • Mee de belangen van de informatiesector behartigen
  • Korting krijgen op de activiteiten van de VVBAD
  • Toegang krijgen tot vakinformatie
  • Participeren in de verenigingsbesturen
Word lid
© Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw
Statiestraat 179 | B-2600 Berchem (Antwerpen)
Tel: (+32) 03 281 44 57 | email: vvbad@vvbad.be