Linked Data Fragments

META Nummer 2019/5

Linked Data Fragments

Geschreven door Sam Donvil, Bert Lemmens
Gepubliceerd op 16.06.2019

Culturele organisaties die hun data beschikbaar willen maken als linked data botsen al snel op het kostenplaatje van de systemen die ze daarvoor nodig hebben. Weinig collectiebeheersystemen hebben zelf de mogelijkheid om hun data als linked data beschikbaar te maken. Dus moeten organisaties hiervoor afzonderlijke servers en applicaties inrichten. Een aspect dat daarbij heel erg doorweegt op de kostprijs (én de performantie) is de manier waarop je linked data doorzoekbaar maakt via het web.

De klassieke manier om dat te doen is via een zogenaamde SPARQL-endpoint waarmee je de volledige dataset live kunt doorzoeken. Dat vereist echter veel rekencapaciteit, en dus een krachtige en dure webserver. De goedkoopste oplossing om je linked data set doorzoekbaar te maken is de dataset als een downloadbestand aan te bieden en zo de werklast en kosten van het eigenlijke zoekwerk door te schuiven naar de gebruiker. Linked Data Fragments is een alternatieve methode die de kosten en werklast van het doorzoeken van linked data sets evenwichtiger verdeelt tussen de aanbieder en de gebruiker. De oplossing bestaat erin om enerzijds webservers eenvoudiger en dus goedkoper te maken, en anderzijds slimmere gebruikersapplicaties te maken die een deel van het zoekwerk kunnen doen.

Voor het eerste deel van de oplossing deel je de linked data sets op in kleinere Triple Pattern Fragments. Dat zijn subsets van je linked data set waarvan de triples een gelijkaardige opbouw hebben. Hierdoor wordt het aantal triples dat je moet doorzoeken kleiner en eenvormiger. Je bepaalt zelf hoe je je dataset opdeelt, bv. opdelen als triples over een bepaald onderwerp. Een Triple Pattern Fragment creëert een specifieke zoekingang op je collectiedata. Elk fragment moet je ook voorzien van metadata over het aantal triples in het fragment en over hoe de triple is opgebouwd.

Voor het tweede deel van de oplossing hanteer je een slimme gebruikers­applicatie die metadata over de opbouw van de triple gebruikt om een slimme zoekstrategie op te zetten. Daarvoor splitst ze een complexe SPARQL-query op in kleinere zoekacties, en vervolgens wordt het fragment geselecteerd waarmee ze de zoekactie kan uitvoeren. Door ze te voeren aan een Triple Pattern Fragments server kan een complexe SPARQL-zoekvraag in verschillende stapjes opgelost worden.

Wat is het voordeel van Linked Data Fragments?

Bij de klassieke manier van werken met een SPARQL-endpoint worden de zoekvragen op serverniveau verwerkt. De servers bereiken echter al snel hun maximumcapaciteit, en worden bijgevolg tijdelijk onbeschikbaar. Dat probleem wordt groter wanneer je van verschillende servers tegelijk data opvraagt. Het schaalbaar maken van het semantische web is dus een architec­turaal probleem dat opgelost kan worden door het gebruik van Linked Data Fragments.

Wat heb je nodig om met Linked Data Fragments aan de slag te gaan?

Voor deze oplossing moeten zowel de aanbieder als de gebruiker van linked data specifieke tools gebruiken. Als culturele organisatie moet je je linked data set opdelen in fragmenten en die aanbieden via een Triple Pattern Fragments server. Dat is een webserver die je linked data set niet als een monolithische dataset aanbiedt, maar in kleinere fragmenten die bevraagbaar zijn. Daarvoor zijn verschillende tools beschikbaar, naargelang de gewenste programmeertaal. Zo’n Triple Pattern Fragments server kan fragmenten maken door data uit een SPARQL-endpoint te halen of op basis van JSON-LD-documenten die je gemaakt hebt.

Ook om de gebruikersapplicatie te bouwen zijn er verschillende tools beschikbaar naargelang de gewenste programmeertaal. Met die tools kun je een zoekinterface bouwen die eerst je zoekvraag omzet in een SPARQL-query, ze dan opdeelt in kleinere zoekacties en ze vervolgens doorstuurt naar de Triple Pattern Fragments server die het relevante linked data fragment bevat.

Wat is de relevantie van Linked Data Fragments voor bibliotheken, archieven en documentatiecentra?

Bibliotheken, archieven en documentatiecentra kunnen hun collectiecatalogus op een performante manier als linked data aanbieden met een Triple Pattern Fragments interface. VIAA gebruikte bv. Linked Data Fragments om een grote verzameling gedigitaliseerde kranten uit de Eerste Wereldoorlog te publiceren als linked data.

>    http://linkeddatafragments.org/software voor een overzicht van de software
>    https://hetarchief.be/nl/blog/oorlogskranten-na-honderd-jaar-ook-als-linked-data-beschikbaar-0
>    https://github.com/LinkedDataFragments

 

Waarom lid van de VVBAD worden?

  • Deel zijn van het netwerk van experten en collega's
  • Mee de belangen van de informatiesector behartigen
  • Korting krijgen op de activiteiten van de VVBAD
  • Toegang krijgen tot vakinformatie
  • Participeren in de verenigingsbesturen
Word lid
© Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw
Statiestraat 179 | B-2600 Berchem (Antwerpen)
Tel: (+32) 03 281 44 57 | email: vvbad@vvbad.be