Collectie-analyse met de hulp van SQLite en Python

META Nummer 2022/2

Collectie-analyse met de hulp van SQLite en Python

Geschreven door Luca Maggiore, Jef De Ridder, Pieter Lernout
Gepubliceerd op 22.03.2022
IMPORTANT
RBL

Het databasemanagementsysteem SQLite en de programmeertaal Python zijn efficiënte hulpmiddelen om collectie-analyses uit te voeren ter ondersteuning van het bibliotheekmanagement van wetenschappelijke bibliotheken. In dit artikel presenteren we de resultaten van de benchmarking van de collecties van de rechtsbibliotheek van de Universiteit Antwerpen en de Rechtsbibliotheek Limburg.

Ontstaansgeschiedenis en aankoopbeleid van de twee rechtsbibliotheken

Bibliotheekcollecties zijn geen statische verzamelingen, maar groeien per definitie op een organische manier. Enerzijds nemen ze geleidelijk toe in omvang via weldoordachte aankopen, onverwachte schenkingen en al dan niet opgelegde fusies of migratiebewegingen. Anderzijds zijn ze door de tijd heen onderhevig aan allerhande bijsturingen: speerpunten in het aankoopbeleid veranderen van klemtoon, standing orders worden opgezegd of net uitgebreid en gerichte wiedoperaties zorgen voor de nodige opschoning.

Precies vanwege dat levende karakter van bibliotheekcollecties is een grondige periodieke analyse geen overbodige luxe. Zo’n analyse biedt de kans om ten volle zicht te krijgen op de omvang en de diepte van de eigen collectie, legt mogelijke lacunes bloot en stelt bibliothecarissen in staat om de collectievorming gericht bij te sturen. Dat is exact wat de Universiteit Antwerpen (UAntwerpen) en de Universiteit Hasselt (UHasselt) deden met de collecties van hun rechtsbibliotheken, die redelijk vergelijkbaar zijn qua omvang en beide ontsloten worden via Brocade, het bibliotheeksysteem ontwikkeld door de UAntwerpen. Vooraleer dieper in te gaan op de analyse van beide collecties, blikken we terug op de specifieke ontstaansgeschiedenis en het aankoopbeleid van deze twee rechtsbibliotheken. 

Rechtsbibliotheek Limburg

De Rechtsbibliotheek Limburg (RBL) zag pas in oktober 2012 het levenslicht. De jonge faculteit Rechten van de UHasselt was tien jaar geleden volop bezig met de uitbouw van haar rechtsbibliotheek en vond een logische partner in de FOD Justitie, die plannen maakte om zijn intrek te nemen in het nieuwe Hasseltse gerechtsgebouw. Met zeven deelbibliotheken beschikten de verschillende Limburgse hoven en rechtbanken weliswaar over een grote verzameling boeken en tijdschriften, maar het registratie- en documentatiesysteem was erg beperkt. Knowhow en personeel ontbraken om die collecties professioneel te beheren. Een samenwerking bood kansen voor beide. De UHasselt leverde de nodige expertise en bracht alle collecties samen in een gemeenschappelijke catalogus.

De voorbije jaren investeerden alle partners stevig in de verdere collectie-uitbouw, zowel op papier als digitaal, en ook op het vlak van infrastructuur werden grote stappen voorwaarts gezet, teneinde optimaal in te kunnen spelen op de informatiebehoeften van de (Limburgse) juridische wereld. Sinds de start van de RBL-samenwerking tussen de UHasselt en de FOD Justitie sloten nog andere juridische beroepsgroepen zich aan – van de Limburgse balie over de gerechtsdeurwaarders tot het notariaat. De bibliotheek brengt de hele juridische wereld in Limburg dichter bij elkaar, wat het tot een bijzondere ontmoetingsplek maakt tussen onderwijs, onderzoek én praktijk.

IMPORTANT
UAntwerpen

Het acquisitiebeleid van de RBL wordt bepaald en gemonitord door een stuurgroep die bestaat uit drie leden van de UHasselt en drie leden van de Limburgse korpsen (FOD Justitie). De collectievorming wordt voornamelijk georganiseerd via het systeem van standing orders, reeksorders en/of pakketbestellingen bij de belangrijkste Belgische juridische uitgevers. Hierdoor komen de meeste juridische publicaties die in België verschijnen automatisch in de collectie terecht. Daarnaast wordt erop toegekeken dat men voldoende tegemoetkomt aan de onderwijsbehoeften door alle in de studiegids verplichte en aanbevolen literatuur altijd ter beschikking van de rechtenstudenten te hebben staan. Het zijn uiteraard de docenten die beslissen welke boeken daarin opgenomen worden.

Verder is er de specifieke onderzoeksliteratuur die in de bibliotheek een plaats krijgt. Hier hebben de onderzoekers het stuur in handen: zij geven aan welke publicaties ze in het kader van hun onderzoek zoal wensen aan te schaffen, al helpt een academisch bibliotheekverantwoordelijke de speerpunten inzake onderzoek te expliciteren en te bewaken. Tot slot wordt in het aankoopbeleid zeker ook rekening gehouden met de ondersteuning van de verschillende beroepsgroepen die in de bibliotheek over de vloer komen. Naast de academische focus wenst de collectie dus tegelijkertijd ook tegemoet te komen aan de ondersteuning van het juridische werkveld.

Rechtsbibliotheek UAntwerpen

In 2003 smolten de drie Antwerpse universiteiten – de Universitaire Faculteiten Sint-Ignatius Antwerpen (UFSIA), de Universitaire Instelling Antwerpen (UIA) en het Rijksuniversitair Centrum Antwerpen (RUCA) – samen tot de UAntwerpen. Als gevolg van de fusie werden de rechtscollecties van de UFSIA en de UIA samengebracht in de leeszaal van de hernieuwde bibliotheek op de Stadscampus. De collectie van de UFSIA bestond voornamelijk uit de boeken die bewaard werden in de seminariebibliotheek van de faculteit, en in kleinere mate uit de boeken van het Centrum voor Grondslagen van het Recht en het Centrum voor Rechtssociologie, Rechtsfilosofie en Rechtstheorie. De collectie van de UIA was gelegen op de campus in Wilrijk en werd sinds de stichting van de universiteit in 1971 gestaag uitgebouwd aan de hand van schenkingen en aankopen.

De huidige collectie bevat een evenwicht tussen actuele naslagwerken en oudere rechtskundige bronnen, die geschiedkundig onderzoek toelaten. Als enige collectie in de bibliotheek is ze voornamelijk een referentiecollectie. De bronnen dienen zoveel mogelijk ter plaatse geraadpleegd te worden, om maximale beschikbaarheid voor onderzoekers en studenten te garanderen. Binnen diezelfde filosofie wordt de papieren collectie waar mogelijk aangevuld met elektronische bronnen zoals databanken, elektronische boeken en tijdschriften, opdat alles maximaal beschikbaar is voor iedereen.

Het acquisitiebeleid is in de handen van de Faculteit Rechten. De faculteitsraad benoemt een lid van het academisch personeel tot bibliotheekadviseur, die een go-between wordt tussen de faculteit en de bibliotheek. Met de hulp en het advies van de dienst Acquisitie en de dienst E-Info van de bibliotheek selecteert de bibliotheekadviseur welke boeken, tijdschriften en elektronische informatie aangeschaft moeten worden. Fundamentele en ingrijpende wijzigingen van het aankoopbeleid worden beslist door de Facultaire Bibliotheekcommissie, waarin naast de bibliotheekadviseur en leden van de bibliotheek ook de decaan van de faculteit en eventueel andere faculteitsleden zetelen. De commissie heeft eveneens een meer algemeen adviserende opdracht bij het bepalen van het bibliotheekbeleid van de faculteit. De collectie wordt naast de selectie van de bibliotheekadviseur mee gevormd door reeks- en standing orders bij de belangrijkste Belgische juridische uitgevers, analoog met wat in de RBL gebeurt.

Collectie-analyse en benchmarking

De collectie-analyse werd uitgevoerd op basis van de bibliografische gegevens uit de Anet-catalogus die beheerd en ontsloten wordt via Brocade. We vertrokken van de dataset van 30 juni 2021. Brocade biedt aan de doorsneegebruikers de mogelijkheid om rapporten en lijsten te genereren en deze eventueel in CSVformaat te exporteren voor bewerking en analyse. De gebruikers die meer vertrouwd zijn met gegevensanalyse kunnen de catalografische gegevens in een SQLite-databank exporteren om ze te bevragen via query’s, met de hulp van Python-modules zoals pandas, numpy, sqlite3 en matplotlib. Deze modules laten toe de data op diepgaande wijze te bestuderen en ze beter te visualiseren door middel van tabellen en grafieken.

In het kader van dit artikel hebben we ons beperkt tot de bevraging van een deel van de papieren boekencollecties, met name de monografieën en de naslagwerken aanwezig in de leeszalen in open kast. Men zou de analyse perfect kunnen uitbreiden naar de volledige papieren collectie en zelfs naar de volledige holding, met inbegrip van de elektronische informatie. De keuze om de studie evenwel te beperken tot (een deel van) de papieren collectie, heeft in hoofdzaak te maken met het feit dat nogal wat elektronische bronnen via een abonnementsformule aangeschaft worden en bijgevolg niet (altijd) exhaustief via de klassieke bibliotheekcatalogus ontsloten worden.

Nog een laatste opmerking alvorens we de resultaten van de analyse presenteren: de catalografische regels zijn geen statisch gegeven en evolueren in de loop der jaren. De gegevens kunnen bijgevolg onvolledig zijn, omdat bepaalde velden in het verleden niet – of niet consequent – ingevuld werden. Bij elke hieronder beschreven bevraging worden dergelijke problemen expliciet vermeld.

IMPORTANT
RBL

Bevraging van de bibliografische dataset

De technische aspecten van de toepassing van SQLite en Python op de dataset kunnen in de repository op GitHub geraadpleegd worden. In dit artikel schetsen we kort vijf query’s in verband met de volgende aspecten: auteurs en redacteurs, uitgevers, jaar van uitgave, taal van de inhoud en onderwerpsontsluiting via UDC-codes (Universal Decimal Classification).

Auteurs en redacteurs van de publicaties

De doelstelling van deze query is om na te gaan welke namen van personele auteurs en redacteurs het meest voorkomen in de twee collecties. Volgens de regels voor catalografische beschrijvingen in de Anet-catalogus dienen alle auteurs en/of redacteurs die vermeld worden op de titelpagina van de publicatie, opgenomen te worden in de bibliografische beschrijving. Deze regel is echter pas sinds juni 2013 van toepassing. Voordien namen de catalografen enkel de eerste drie auteurs en/of redacteurs van de titelpagina op. Dat kan een invloed gehad hebben op de resultaten. Een auteur die na 2013 publiceerde, heeft meer kans om in de berekeningen opgenomen te worden.

Wanneer we de top twintig van de meest voorkomende auteurs en/of redacteurs in beschouwing nemen, dan stellen we vast dat het overgrote deel van de auteurs Belg is. Dat is een gevolg van het eerder vermelde automatisch doorstromen van publicaties via standing orders bij Belgische uitgevers. Niet-Belgische auteurs kunnen uiteraard ook boeken over Belgisch recht publiceren, maar hun aantal is hoogstwaarschijnlijk zeer miniem. De stelling wordt ook bevestigd door de affiliatie van de auteurs. Bijna alle auteurs doceren aan een Belgische universiteit en voeren onderzoek naar Belgisch recht. Slechts twee auteurs zijn verbonden aan een buitenlandse instelling. Een tweede vaststelling is dat vijf auteurs uit de top twintig van de collectie van de RBL ook actief zijn als advocaat. Dat toont de eerder vermelde verwevenheid aan tussen onderzoek en praktijk binnen de RBL.

IMPORTANT

Uitgevers van de publicaties

Als we de top tien van de uitgevers bestuderen, stellen we vast dat acht van de tien in beide collecties voorkomen. Er is dus een grote overeenstemming. Dat heeft ongetwijfeld opnieuw te maken met het op standing orders gebaseerde aankoopbeleid. Dezelfde verklaring kan ook aangehaald worden voor het feit dat de meeste uitgevers Belgische bedrijven zijn. In de top tien van de collectie van de UAntwerpen vindt men bijvoorbeeld slechts twee Britse uitgevers (Edward Elgar Publishing en Oxford University Press) en één Franse uitgever (LGDJ éditions).

De bibliografische gegevens zijn helaas niet volledig, omdat in het verleden de naam van de uitgever niet altijd opgenomen werd. Wanneer de uitgever ook als auteur optrad, moesten de catalografen het veld van de uitgever leeg laten. Daarnaast kan één bepaalde uitgever diverse entries hebben in de Anet-catalogus, en dat om verschillende redenen, zoals tikfouten van de catalograaf of naamsveranderingen van de uitgeverij. Dat werd vroeger nog opgevangen door de verplichte normalisatie van de naam van de uitgever in de catalogus – ‘LGDJ, une marque de Lextenso’ of ‘LGDJ, un savoir-faire de Lextenso’ werden simpelweg opgenomen als ‘LGDJ’ – maar sinds 2013 wordt de naam van de uitgever onverkort overgenomen vanop de titelpagina. Al deze afwijkingen gelinkt aan de aanwezigheid van meerdere entries hebben we grotendeels kunnen opvangen dankzij Python en dankzij de beperking van deze analyse tot de periode 2011-2021.

IMPORTANT

Jaar van uitgave

In deze analyse gaan we na hoeveel boeken met een publicatiedatum tussen 2011 en 2021 opgenomen werden in beide collecties. De performantie van een collectie kan uiteraard niet alleen gemeten worden door de aanwezigheid van recente literatuur, maar het belang voor optimaal onderwijs en onderzoek is duidelijk. Voor titels die in verschillende volumes opgenomen werden in de catalogus, werd de datum van de publicatie van het eerste volume in beschouwing genomen.

De resultaten van de query tonen aan dat beide collecties bijna evenredig gegroeid zijn in de betreffende periode. De collectie van de UAntwerpen groeide aan met 6.016 titels, die van de RBL met 5.636 titels. Dat zijn hoofdzakelijk nieuwe titels, maar er zit ook een minderheid tussen die afkomstig is uit de tweedehands markt of uit schenkingen.

Een tweede opvallende vaststelling is dat de query in beide gevallen een dalende trend toont, vooral vanaf 2020. COVID-19 speelt hierin waarschijnlijk een rol, al zal de echte impact van de pandemie pas duidelijk worden wanneer de gegevens voor 2022 en 2023 beschikbaar zijn. COVID-19 heeft zich hoe dan ook in beide instellingen niet specifiek vertaald in een aanpassing van het aankoopbeleid. Zowel de UAntwerpen als de UHasselt zetten immers al langer in op de opbouw van een uitgebreide digitale collectie van monografieën. Voorbeelden zijn de online platformen als Jura, Jurisquare en Stradalex. De papieren collectie wordt eerder als een aanvulling gezien op de elektronische collectie.

In 2020 heeft de UAntwerpen 29.388 euro uitgegeven aan papieren monografieën, namelijk 6,15 procent van de totale uitgaven voor de collectie. De UHasselt heeft in dezelfde periode 38.194 euro uitgegeven, oftewel 25,8 procent van alle uitgaven. Bovendien werd de dalende lijn reeds in 2016 ingezet.

De verantwoordelijken van het aankoopbeleid in beide bibliotheken moeten dus op zoek gaan naar andere mogelijke oorzaken van deze trend. Werden er minder boeken gepubliceerd bij de Belgische uitgevers? Is het systeem van selectie binnen de faculteiten, gecombineerd met standing orders, wel efficiënt genoeg? Zijn er budgettaire redenen? Is de daling van de papieren collectie een gevolg van de verschuiving naar de aankoop van meer elektronische bronnen? Hierbij is het belangrijk om de complementariteit van de online collectie en de papieren collectie goed te bewaken.

IMPORTANT

Taal van de inhoud

Aan de hand van deze query wordt gepeild naar de meest voorkomende talen in de twee collecties. Het is belangrijk te preciseren dat het hier niet over de taal van de titel gaat, maar over de taal van de inhoud. Er kunnen immers publicaties zijn met een meertalige titel waarvan de inhoud in één enkele taal gepubliceerd is. Voor de taal van de inhoud wordt in de Anet-catalogus enkel rekening gehouden met de taal van de hoofdtekst, niet met die van citaten of randteksten.

Als we de top zes in beschouwing nemen, scoren Nederlands en Frans logischerwijze zeer goed in beide collecties. Dat bevestigt de eerder vermelde focus op Belgische publicaties. Daarnaast scoort in de collectie van de UAntwerpen het Engels zeer goed, met een tweede plaats in de ranking. Hier kunnen twee verklaringen voor gegeven worden. Ten eerste bevat de collectie van de UAntwerpen veel titels over onderwerpen waarover vaker in het Engels gepubliceerd wordt, zoals rechtstheorie en Europees recht (zie verder). Een tweede verklaring kan zijn dat de UAntwerpen de Engelstalige opleiding Master of Laws aanbiedt, en dat dat zich bijgevolg vertaalt in de aankoop van meer boeken in het Engels.

De RBL heeft, voor alle duidelijkheid, ook wel een uitgebreid aanbod aan internationale Engelstalige literatuur, maar die collectie zit hoofdzakelijk vervat in digitale abonnementsformules die niet via de klassieke Anet-catalogus ontsloten worden, maar eerder via andere tools zoals de UHasselt discovery service.

IMPORTANT

Onderwerpsontsluiting door UDC-termen

De inhoud van de publicaties wordt in de Anet-catalogus ontsloten op basis van verschillende systemen. De codes van elk systeem zijn gebaseerd op authority codes die door de catalografen opgesteld, gecontroleerd en onderhouden worden. Voor deze studie hebben we enkel rekening gehouden met de onderwerpstermen van het UDC-systeem, die in elke bibliografische beschrijving aanwezig zijn.

De onderwerpsontsluiting laat toe om de zwaartepunten van een collectie te analyseren en af te toetsen aan de noden van de gebruikers. Bij een onevenwicht tussen het aanbod en de behoeften, dient het aankoopbeleid te worden aangepast. Uit de top twintig van de gebruikte UDC-codes zijn er achttien die in beide collecties voorkomen. ‘Sociaal recht’, ‘Contractenrecht’, ‘Gerechtelijk privaatrecht’ en ‘Strafrecht’ scoren bijzonder goed in beide collecties. In de collectie van de UAntwerpen scoort ‘Rechtstheorie’ ook heel goed, ‘Fiscaal recht’ doet hetzelfde voor de RBL-collectie.

Het feit dat de twee bibliotheken gedeeltelijk een ander publiek hebben – de collectie van de UAntwerpen is uitsluitend gericht op studenten en academici van de universiteit, terwijl die van de RBL ook op het beroepsveld gericht is – blijkt zich dus niet te vertalen in grote verschillen in de inhoud van de publicaties. Unieke UDC-codes in de top twintig van de collectie van de RBL zijn ‘Milieurecht’ en ‘Socialezekerheidsrecht’. Voor de UAntwerpen zijn dat ‘Industriële en intellectuele eigendom’ en ‘Internationaal privaatrecht’.

IMPORTANT

De rechtsbibliotheken van de UAntwerpen en de UHasselt zijn allebei behoorlijk jong. Doordat ze het resultaat zijn van een of meerdere fusies, vergelijkbaar zijn qua omvang, en ontsloten worden via Brocade, leek een grondige collectie-analyse en benchmarking een interessante oefening. SQLite en Python bleken daarbij efficiënte hulpmiddelen te zijn. De voorbeelden van de bevraging van de bibliografische dataset illustreren mooi hoe gegevensanalyse vruchten kan afwerpen bij de evaluatie van de collectie en hoe kritische vragen daarbij automatisch boven water komen drijven. Het moge duidelijk zijn dat dergelijke analyse geen eindpunt vormt, maar net kan fungeren als een objectief vertrekpunt om de collectie kritisch te toetsen aan de verwachtingen van het doelpubliek en aan de noden van onderwijs, onderzoek en praktijk.

Waarom lid van de VVBAD worden?

  • Deel zijn van het netwerk van experten en collega's
  • Mee de belangen van de informatiesector behartigen
  • Korting krijgen op de activiteiten van de VVBAD
  • Toegang krijgen tot vakinformatie
  • Participeren in de verenigingsbesturen
Word lid
© Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw
Statiestraat 179 | B-2600 Berchem (Antwerpen)
Tel: (+32) 03 281 44 57 | email: vvbad@vvbad.be