Historische kranten: van bedrukt papier naar leesbare digitale bronnen

Informatie aan Zee 2021 donderdag 14 tot vrijdag 15 oktober 2021

Historische kranten: van bedrukt papier naar leesbare digitale bronnen

Wie:

Sophia Rochmes (Vlaamse Erfgoedbibliotheken), Rony Vissers (meemoo) & Jolien Schroyen (Erfgoedcel k.ERF)

Waar:

Permeke

Wanneer:

donderdag 14/10 16:00 - 16:30

Historische kranten zijn belangrijke bronnen voor wetenschappelijk onderzoek en educatie. Ze spreken ook een breed publiek aan, vooral als ze berichten bevatten die verband houden met de persoonlijke geschiedenis (in brede zin) van de lezer. Digitalisering maakt krantenerfgoed toegankelijker voor alle soorten gebruikers. Maar de bruikbaarheid van gedigitaliseerde kranten is grotendeels afhankelijk van een betrouwbare omzetting van de gedrukte tekst naar elektronische full-text. Die maakt zowel eenvoudig zoeken door de kranten als digital humanities-onderzoek mogelijk.

De full-text wordt meestal geproduceerd met behulp van software voor optical character recognition (OCR). Een kwalitatieve omzetting van papieren kranten naar elektronische tekst blijkt in de praktijk een stevige uitdaging te zijn. De afgelopen jaren is er dankzij de inzet van artificiële intelligentie (machine-learning) gelukkig veel vooruitgang geboekt op het gebied van OCR. 

In het kader van het project Nieuwe Tijdingen voeren de Vlaamse Erfgoedbibliotheken en meemoo testen uit voor de verbetering van OCR van gedigitaliseerde kranten. Samen met collectiebeheerders en vrijwilligers maken we met de software Transkribus een reeks ground truth-bestanden, foutvrije versies van de tekst en de segmentering van testpagina’s. Die dienen als toetssteen voor OCR-tests door onze expertisepartner, de Staatsbibliothek zu Berlin. De resultaten van de tests zullen in 2022 worden gebruikt bij het uitvoeren van een proefproject voor de verbetering van de OCR van reeds gedigitaliseerde kranten. In deze sessie delen we onze ervaringen tot dusver.

Waarom lid van de VVBAD worden?

  • Deel zijn van het netwerk van experten en collega's
  • Mee de belangen van de informatiesector behartigen
  • Korting krijgen op de activiteiten van de VVBAD
  • Toegang krijgen tot vakinformatie
  • Participeren in de verenigingsbesturen
Word lid

VVBAD maakt gebruik van cookies om uw gebruikservaring te optimaliseren. Door deze te accepteren of door gebruik te blijven maken van deze website, gaat u akkoord met het plaatsen van deze cookies. Wil u meer weten over cookies, of uw cookie-instellingen voor deze website aanpassen? Bekijk dan hier de voorwaarden.

© Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw
Statiestraat 179 | B-2600 Berchem (Antwerpen)
Tel: (+32) 03 281 44 57 | email: vvbad@vvbad.be