De Vlaamse inhaaloperatie voor de Digitale Bibliotheek voor de Nederlandse Letteren (DBNL)

META Nummer 2018/3

De Vlaamse inhaaloperatie voor de Digitale Bibliotheek voor de Nederlandse Letteren (DBNL)

Geschreven door Charles Derre
Gepubliceerd op 09.04.2018
IMPORTANT

De Digitale Bibliotheek voor de Nederlandse Letteren (DBNL) is een digitale schatkamer: de collectie, te vinden op www.dbnl.org, bevat meer dan 15.000 titels (ofwel zo’n 4.200.000 pagina’s) die behoren tot de Nederlandse letterkunde, taalkunde en cultuurgeschiedenis van de vroegste tijd tot heden. De komende jaren kondigen zich voor de DBNL aan als een belangrijke periode: in 2018 ging een nieuw beleid van start, met daarbij extra aandacht voor Vlaams gebruik van de website.

Wat vooraf ging

De DBNL werd opgericht in 1999 en ging voor het eerst online in het jaar 2000. Onder het beheer van de Stichting DBNL uit het Nederlandse Leiden, groeide de site snel uit tot een populaire dienst die duizenden teksten aanbiedt. Bezoekers vinden er niet alleen klassiekers zoals Houtekiet van Gerard Walschap of Lof der zotheid van Erasmus, ook allerlei secundaire literatuur, tijdschriften, auteursbiografieën en naslagwerken zoals het Algemeen Letterkundig Lexicon of Wormcruyt met suycker (over kinderliteratuur) zijn er te raadplegen. De DBNL wordt dan ook vaak gebruikt: elk jaar zijn er gemiddeld vier miljoen sessies wereldwijd.

In 2014 werd beslist om de activiteiten van de Stichting DBNL over te hevelen naar de Koninklijke Bibliotheek, de nationale bibliotheek van Nederland (KB). Toen werd ook een nieuw beheersorgaan opgericht, de Commissie DBNL, waarin de Taalunie, de KB en de Vlaamse Erfgoedbibliotheek zetelen. Die drie organisaties zijn sindsdien samen verantwoordelijk voor het beleid en de kaders voor de collectievorming van de DBNL: de Taalunie zorgt voor de financiering; de KB neemt het grootste deel van de uitvoerende werkzaamheden voor haar rekening; de Vlaamse Erfgoedbibliotheek neemt ook uitvoerende taken op zich en vertegenwoordigt, op vraag van de Vlaams minister van Cultuur, de Vlaamse stem in de DBNL.

Digitaal verrijkte teksten

De DBNL was een van de eerste initiatieven om in het hele taalgebied en daarbuiten het Nederlandstalig literair en cultureel erfgoed digitaal te ontsluiten. Teksten die voorheen vooral analoog werden doorgenomen en geanalyseerd waren opeens online beschikbaar en bovendien gratis raadpleegbaar.

Drie pijlers vormen het fundament van de DBNL: fulltext-digitalisering, contextualisering en redactie. Fulltext-digitalisering betekent, zoals de naam zelf al zegt, dat teksten in hun volledigheid en in tekstvorm (dus doorzoekbaar) opgenomen worden. Bovendien wordt de foutenmarge bij het omzetten naar het digitale bestand zo laag mogelijk gehouden: een strikte kwaliteitsstandaard van een fout per twintigduizend aanslagen wordt hier gehanteerd. Contextualisering, de tweede pijler, ook wel metadatering genoemd, betekent dat teksten op de DBNL-website verrijkt worden door voorcoderen: er worden tags aangebracht om teksten structureel (bijvoorbeeld hoofdstuktitels of paragrafen) en inhoudelijk (auteursnamen, boektitels) te verrijken. De verrijkte scans worden na controle door de DBNL-redactie omgezet in een XML-bestand. XML is een opmaaktaal die in het Engels voluit Extensible Markup Language heet. Een XML-bestand is vooral handig om de tekst- en verrijkingsgegevens te bewaren. Voor publicatie op de website wordt dit bestand omgezet in verschillende leesbaardere formaten: een webversie, pdf en e-book. Daarnaast wordt vaak de originele scan aangeboden met daarbij (als er nog geen full-tekst online staat) de ongecorrigeerde OCR (optical character recognition). Dit hele proces wordt gecoördineerd en onderhouden door de eerdergenoemde DBNL-redactie, die daarmee de derde pijler van de DBNL vormt. Gebruikers voor wie de aangeboden bestanden op de website niet volstaan kunnen zelfs het XML-bestand met de bijbehorende metadata apart opvragen.
Dit uitvoerige en nauwgezette productieproces leidt ertoe dat de duizenden titels uit de DBNL in allerlei formaten getoond worden. Dat alles maakt van de DBNL een reusachtige bibliotheek, met als voordeel dat de lezer ze kan bezoeken zonder dat hij of zij daarvoor het huis uit moet.

Verdieping en plezier

De DBNL is echter meer dan alleen een bibliotheek. De website biedt ook tal van mogelijkheden die haar geschikt maken voor onderzoek en onderwijs. Dwarsdoorsnedes uit de collectie op basis van een thema of tekstsoort, de n-gramviewer waarmee de collectie doorzocht kan worden op de frequentie van een bepaald woord, de atlas waarop iemand kan zien in welke plaatsen schrijvers geboren werden of teksten ontstonden, enz. Er kan naar hartenlust mee geëxperimenteerd worden. In de n-gramviewer kun je bijvoorbeeld opzoeken vanaf wanneer het woord ‘aardappel’ in teksten voorkomt. Het is een ietwat ludiek voorbeeld, maar het helpt om een taal- en geschiedenisles op een aantrekkelijke manier te presenteren.

Dankzij deze functionaliteiten richt de DBNL zich op specifieke doelgroepen binnen en buiten het taalgebied. De primaire doelgroep bestaat uit literatuur- en taalwetenschappers, (cultuur)historici en docenten en studenten. De secundaire doelgroep betreft de liefhebbers van de Nederlandse taal en literatuur.

Faciliteren van onderzoek, zowel voor professionele doeleinden als voor het plezier, is een van de belangrijkste opdrachten van de DBNL. Aan diverse universiteiten is de website dan ook een veelgebruikt instrument. Kevin Absillis, professor moderne Nederlandse letterkunde aan de Universiteit Antwerpen getuigt: “Ik gebruik de DBNL dagelijks. Ik zetel ook in de pool van deskundigen, een inhoudelijk adviesorgaan van het project. Het DBNL-corpus groeit voortdurend en als onderzoeker neem ik er sowieso wel eens een kijkje. In 2004 schreef ik mijn proefschrift en toen gebruikte ik de DBNL al, vandaag staat er nog veel meer op. Het is ongelooflijk hoeveel materiaal er beschikbaar is.” In zijn gebruik van de DBNL maakt Absillis een onderscheid tussen zijn werk als onderzoeker en zijn werk als docent. “Voor filologisch onderzoek lees ik zoveel mogelijk primaire en secundaire literatuur. Vooral eerste edities zijn daarin belangrijk. Zo staat de historisch-kritische editie van Max Havelaar volledig op de website. In mijn lessen daarentegen wijs ik mijn studenten vooral op het bestaan van de DBNL. Een deel van het Algemeen Letterkundig Lexicon verwerk ik bijvoorbeeld in de zelfstudiepakketten. Verder biedt de DBNL hen extra achtergrondinformatie. Sowieso komen studenten Nederlands een keer op de website terecht als ze iets googelen over hun studierichting. Een pervers neveneffect van al het materiaal op de DBNL is dat studenten intussen niet meer in staat zijn de fysieke bibliotheken goed te raadplegen. Daar treft de DBNL zelf geen schuld, al blijft het wel belangrijk om dat ook te doen.”

Soms is de synergie tussen de DBNL en de academische wereld nog sterker. De eerder genoemde n-gramviewer bijvoorbeeld kwam tot stand dankzij een samenwerking met Els Stronks, hoogleraar vroegmoderne Nederlandse letterkunde aan de Universiteit Utrecht. Voor haar onderzoek naar denkbeelden over jongeren in Nederlandse teksten tussen 1500-1800 bood dit instrument nieuwe inzichten. Deze n-gramviewer, maar ook andere datasets, maken de DBNL sowieso heel nuttig voor Digital Humanities-onderzoek. Gedigitaliseerde bestanden en datamateriaal bieden immers de kans om enorme tekstbestanden snel te doorzoeken en in veelgelezen teksten toch nog ongeziene patronen te ontwaren.

Een nieuw beleid

De afgelopen beleidsperiode van de DBNL, die liep van 2015 tot en met 2017, stond vooral in het teken van de transitie naar een nieuwe beleidsstructuur. In het nieuwe beleidsplan, dat werd uitgetekend voor de jaren 2018-2020, leggen de Taalunie, de KB en de Vlaamse Erfgoedbibliotheek een aantal extra accenten. Het streven is dat in 2020 in het hele taalgebied en daarbuiten optimaal gebruikgemaakt wordt van de DBNL-collectie, in al haar verschillende vormen en via verschillende kanalen. Het volledige beleidsplan is te lezen op de website van de DBNL, maar de visie valt te herleiden tot vier krachtlijnen.

De eerste krachtlijn is om de DBNL terug tot de kern te brengen. Met ‘kern’ wordt de collectie van de in zeer hoge kwaliteit gedigitaliseerde teksten met de bijbehorende metadata bedoeld. Door de kwaliteitsstandaard — voor 99,995 procent correct omgezet naar de nieuwe digitale vorm — onderscheidt de DBNL zich van andere digitaliseringsprojecten. Voor de samenstelling van de collectie laat de Commissie DBNL zich adviseren door een werkgroep van inhoudelijke experten, voorgezeten door de Vlaming Geert Buelens, professor moderne Nederlandse letterkunde aan de Universiteit Utrecht. Paul Buschmann, hoofdbibliothecaris van de faculteitsbibliotheek Letteren en Wijsbegeerte aan de Universiteit Gent, is hier eveneens lid van. Een van de principes in het collectiebeleid is dat de DBNL in de eerste plaats teksten in de Nederlandse taal bevat. De collectie moet ook representatief zijn voor het hele taalgebied. Wat betreft het literaire gedeelte is het de bedoeling om de canon van de Nederlandstalige letteren er integraal deel van te laten uitmaken. Onder canon worden de titels vernoemd in de negendelige, monumentale Taalunie-reeks Geschiedenis van de Nederlandse literatuur verstaan. Teksten uit de Nederlandse taalkunde en cultuurgeschiedenis blijven evenzeer van belang. Ook is het de intentie om de collectie te blijven aanbieden in zoveel mogelijk hoogwaardige bestandsformaten, dus zowel webtekst, scan, pdf, e-book en ongecorrigeerde OCR. Deze focus op de kern brengt met zich mee dat andere typen van redactionele inhoud, zoals bijvoorbeeld audio- en videofragmenten of taal- en auteursportretten, geen plaats meer hebben op de DBNL. Een aantal van die zaken staat weliswaar al op de website, maar daarvoor zal een passende oplossing gezocht worden.

De tweede krachtlijn van het DBNL-beleidsplan gaat over het genereren van een groter bereik. Het is de wens om vanuit externe bronnen — catalogi en websites — meer links naar de DBNL te laten leggen. Tegelijk wordt hergebruik van de DBNL-collectie via andere kanalen gestimuleerd en gefaciliteerd. Dat geldt voor het hele taalgebied én daarbuiten: Van de vier miljoen gebruikssessies per jaar komt het merendeel logischerwijs uit Nederland (68 procent) en België (18 procent), maar de DBNL wordt ook in Zuid-Afrika (2 procent), de Verenigde Staten (1,3 procent) en Suriname (1,2 procent) geraadpleegd. Met name voor onderzoekers en liefhebbers van het Nederlands buiten het taalgebied is DBNL de snelste en goedkoopste manier om teksten te pakken te krijgen. De neerlandistiek blijft een discipline die wereldwijd aan 314 instellingen gedoceerd wordt, van Moskou over Kiev tot Kaapstad. Voor al die vakgroepen en instellingen wil de DBNL er zijn.

De derde krachtlijn, samenwerking en uitwisseling, dient niet alleen om het uitzonderlijke samengaan van de Taalunie, de KB en de Vlaamse Erfgoedbibliotheek in de verf te zetten, maar wijst ook op de interactie van andere actoren met de DBNL. Dat gaat om onderzoekers, auteurs en collectiebeherende, culturele en wetenschappelijke organisaties. Hun betrokkenheid bij de selectie, distributie en ontsluiting van de teksten stimuleert expertise-uitwisseling en vergroot het draagvlak voor het gebruik van de website. Het spreekt voor zich dat de DBNL deze bestaande relaties wil bestendigen en steeds geïnteresseerd is in nieuwe samenwerkingsverbanden.

Meer Vlaanderen in de DBNL, meer DBNL in Vlaanderen, de laatste krachtlijn in het beleidsplan, heeft zowel betrekking op de inhoud van de DBNL als op het gebruik. In Nederland wordt vooralsnog meer naar de DBNL gesurft dan in België. Het verschil in aantal Nederlandssprekenden tussen beide landen speelt natuurlijk mee, maar uit een publieksonderzoek blijkt niettemin dat er groeimarge zit op het aantal Vlaamse (en Belgische) gebruikers. Iets wat het verschil in gebruik van de DBNL tussen Vlaanderen en Nederland bijvoorbeeld treffend illustreert, is het aantal digitaliseringsverzoeken. Via een formulier op de website kunnen gebruikers met zo’n verzoek zelf suggesties geven voor het digitaliseren van een tekst. Zo goed als alle vragen komen voorlopig echter vanuit Nederland. Mede daarom wordt de communicatie over de DBNL de komende jaren in Vlaanderen opgevoerd. Een vernieuwde nieuwsbrief werd vorig jaar al gelanceerd, maar er wordt ook gewerkt aan een breder communicatieplan.

Alle mogelijkheden verkennen

Een van de intenties om het gebruik in Vlaanderen te verhogen is om Vlaamse onderzoekers en docenten, die al behoren tot de primaire doelgroep, nog directer bij de DBNL te betrekken. Ze komen wel op de website terecht, zoals Kevin Absillis eerder getuigde, maar niet alle mogelijkheden worden door hen benut. Door nauwer contact met hen te onderhouden, zal het makkelijker zijn om hun noden te leren kennen en er met een gepast aanbod op in te spelen. Ook het secundair onderwijs heeft daar een belangrijke plaats in. Een aantal functionaliteiten op de website zou bijvoorbeeld in een lespakket kunnen worden samengebracht. Of de DBNL-collectie zou als bron kunnen dienen voor de leeslijst. Al die verschillende pistes worden nu verkend.

De Vlaamse inhaaloperatie voor de DBNL betreft niettemin meer dan het gebruik van de website alleen. Ook tekstmateriaal gemaakt door Vlaamse auteurs is minder nadrukkelijk aanwezig op de website. Voor de collectievorming is specifieke kennis vanuit Vlaanderen dan ook gewenst. De KB bezit in haar magazijn weliswaar meer dan honderd kilometer bibliotheekmateriaal, maar voor veel titels zijn de collecties in Vlaanderen van het grootste belang. Via de Vlaamse Erfgoedbibliotheek werd alvast een procedure opgestart om titels uit te lenen die alleen in Vlaanderen beschikbaar zijn.

Het gebrek aan Vlaams materiaal op de DBNL-website wordt natuurlijk mede veroorzaakt door het auteursrecht. De belangrijkste niet meer beschermde werken — werken waarvan de auteur minstens zeventig jaar geleden overleden is — uit de canon, zoals Het vader-huis van Karel van de Woestijne of Vanden Vos Reynaerde staan wel op de DBNL, maar beschermd materiaal is moeilijker te vinden. Dat heeft te maken met de aanpak die tot nog toe gehanteerd werd. Om teksten online te kunnen plaatsen werden oorspronkelijk individuele licentiecontracten gesloten met de rechthebbenden. Vandaag richt het beleid zich op het afsluiten van collectieve licentiecontracten. Op basis van zo’n contract is het mogelijk om werken van meerdere auteurs online te plaatsen. De overeenkomst die medio 2017 in Nederland met de rechtenorganisatie Lira gesloten werd, is daarvan een mooi voorbeeld. Die overeenkomst is echter vooral van toepassing op Nederlandse auteurs en maar in beperkte mate op Vlaamse. Voor Vlaanderen worden de mogelijkheden om een soortgelijke overeenkomst af te sluiten nu verkend. In vergelijking met Nederland zijn er in het Belgische juridische landschap echter meer organisaties in het spel. De Commissie DBNL heeft daarom de werkgroep rechten opnieuw in het leven geroepen, die zal adviseren over de strategie ten aanzien van de gewenste collectieve regeling voor Vlaamse auteursrechten. Eenzelfde efficiënte regeling voor Vlaanderen en de onderhandeling met de Belgische auteursrechtenorganisaties krijgt de komende jaren in elk geval prioriteit. Tot die tijd blijft individuele rechtenklaring voor Vlaamse auteurs noodzakelijk. Bij dit alles moet beklemtoond worden dat de DBNL zich enkel richt op de literatuur die out of commerce is.

Een laatste punt waar in Vlaanderen nog aan gewerkt kan worden (en dat deels al verwerkt zit in de tweede krachtlijn van het DBNL-beleidsplan), is data-uitwisseling en -hergebruik. Opnieuw treedt daar een belangrijk verschil met Nederland op. Voor de KB, die niet alleen de DBNL huisvest maar ook Delpher, een online platform dat gedigitaliseerde kranten, tijdschriften en boeken bevat, is dit al deels gerealiseerd. Het is wel zo dat enkele Vlaamse bibliotheken vandaag al vanuit hun catalogi verwijzen naar de DBNL, maar het komt er vooral op aan dit systematischer en gefundeerder aan te pakken. Omwille van het meer gespreide Vlaamse bibliotheeklandschap zal voor het realiseren van data-uitwisseling en -hergebruik sowieso maatwerk en experiment noodzakelijk zijn. Dat zal, net zoals het afsluiten van een collectieve rechtenregeling, een werk van jaren zijn, maar er wordt al duchtig over nagedacht.

Verankering in Vlaanderen

De DBNL is, omwille van het internationale karakter en haar hoge kwaliteit, een uitzonderlijk digitaliseringsproject. De integratie ervan in de KB zorgde vanaf 2015 voor een duurzaam beheer van de unieke collectie Nederlandstalige teksten. De KB heeft de wetenschappelijke, juridische, redactionele, productionele en technische kennis in huis om de voortzetting van de website te garanderen. Niettemin bleek de afgelopen jaren dat voor het realiseren van een sterkere Vlaamse verankering ook aan Vlaamse zijde uitvoerend personeel nodig is. Binnen het DBNL-project werden daarom middelen vrijgemaakt om bij de Vlaamse Erfgoedbibliotheek een projectmedewerker aan te stellen. Deze aanstelling was aanvankelijk deeltijds, maar vanaf april 2018 gaat het om een voltijdse betrekking. Hiervoor werd in het kader van de Vlaams-Nederlandse culturele samenwerking ook financiële steun verkregen van de Vlaamse minister voor Cultuur.

Op basis van de krachtlijnen uit het beleidsplan valt het takenpakket van deze Vlaamse DBNL-projectmedewerker terug te brengen tot de volgende punten: hij moet de Vlaamse stem vertegenwoordigen in het project; in Vlaanderen meer communicatie opzetten om een groter bereik te genereren; een procedure coördineren om lacunes in de DBNL-collectie aan te vullen met Vlaams materiaal; via een regeling rond auteursrechten een grotere aanwezigheid van Vlaamse auteurs en teksten teweegbrengen op de website; samenwerking zoeken op het gebied van data-uitwisseling en hergebruik. Een hele boterham die een voltijdse betrekking zeker rechtvaardigt. Vanzelfsprekend zal de DBNL-projectmedewerker bij de Vlaamse Erfgoedbibliotheek dit in nauw overleg doen met de DBNL-ploeg van de KB Den Haag.

De Vlaamse inhaaloperatie maakt dat er voor de DBNL belangrijke jaren in het verschiet liggen. Het nieuwe beleidsplan was een aankondiging, de opdracht is nu om de uitgesproken ambities in de praktijk om te zetten. Geïnteresseerden kunnen de ontwikkelingen van nabij volgen via de website en de maandelijkse DBNL-nieuwsbrief. Het jaar 2020 wordt alvast een eerste moment om terug te blikken. De website is dan niet alleen twintig jaar online, het jubileumjaar valt tevens samen met het einde van het beleidsplan. Het uitgelezen moment om de DBNL als groot grensoverschrijdend digitaliseringsproject te vieren, en daarbij hopelijk ook een verhoogde Vlaamse aanwezigheid.

Waarom lid van de VVBAD worden?

  • Deel zijn van het netwerk van experten en collega's
  • Mee de belangen van de informatiesector behartigen
  • Korting krijgen op de activiteiten van de VVBAD
  • Toegang krijgen tot vakinformatie
  • Participeren in de verenigingsbesturen
Word lid
© Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw
Statiestraat 179 | B-2600 Berchem (Antwerpen)
Tel: (+32) 03 281 44 57 | email: vvbad@vvbad.be