SPARQL

META Nummer 2018/1

SPARQL

Geschreven door Alina Saenko
Gepubliceerd op 15.01.2018

Het vorige Uitgepakt-artikel ging over RDF triples: een speciale drievoudige structuur, waarmee je kennis kunt vormgeven als een machineleesbaar netwerk. Zulke netwerken kun je dan complexe vragen stellen, wat interessante resultaten kan opleveren. Maar hoe stel je precies een vraag aan zo’n netwerk van kennis? En hoe zien de resultaten er precies uit?

Zoekopdrachten

RDF-triple is data gestructureerd als een simpele en natuurlijke stelling, die uit drie elementen bestaat: subject - bewering - object. Zulke stellingen worden inhoudelijk aan elkaar gekoppeld tot een grote grafe — een ‘netwerk van kennis’. Omdat die graaf machineleesbaar is, kun je een machine een ingewikkelde zoekopdracht laten uitvoeren, maar dan moet die machine voor die vraag een specifieke taal gebruiken.

Een vraag die je aan een databank stelt wordt ook wel eens een query genoemd. Query’s gebruiken een specifieke taal die afgestemd is op het soort databank waaraan je de vraag stelt. Voor RDF-databanken heet die taal SPARQL, Protocol And RDF Query Language. SPARQL is ontworpen voor gebruik op het web en laat toe om vragen te stellen aan verschillende bronnen en heel grote netwerken van kennis (https://www.projectcest.be/wiki/Standaard:SPARQL). Een RDF-databank aanspreken met SPARQL doe je via een SPARQL-endpoint. Dat is de API (een verzameling programmeeropdrachten die de functies van een programma aanroepen) waarmee je RDF-databank kan communiceren met andere machines.

Toepassing

Een online werkende en een heel toegankelijke SPARQL-endpoint is die van Wikidata. Wikidata is een databank die alle informatie uit Wikipedia artikels en meer in een gestructureerde vorm verzamelt. De interface van de endpoint is te vinden op https://query.wikidata.org en is voorzien van een toelichting over de verschillende parameters, een veld waar je een SPARQL-query kunt opstellen en een veld waar je de resultaten te zien krijgt en kunt downloaden als CSV, JSON, RDF, enz. Om al een paar voorbeelden te zien, kan men op de pagina van de SPARQL-endpoint van Wikidata voorgemaakte query’s lanceren zoals: ‘Geef me een lijst van steden waarvan de burgemeester een vrouw is’ of ‘Toon me alle luchthavens van België op een map’ of ‘Toon me een grafiek van het aantal van boeken per genre dat elk jaar uitkomt’.

Bij het opstellen van zo’n SPARQL-query kun je bepalen waarnaar je op zoek bent en welke metadata je als resultaat per entiteit meekrijgt. Een simpele SPARQL-query kan er zo uitzien: SELECT ?item ?_inventory_number WHERE { ?item wdt:P195 wd:Q2365880. OPTIONAL { ?item wdt:P217 ?_inventory_number. }}. De query in dit voorbeeld vraagt om alle kunstobjecten te tonen die bij een specifieke museale collectie behoren en een record online op Wikidata hebben. Men heeft ook de mogelijkheid om de resultaten op verschillende manieren te laten visualiseren: een tijdslijn, een beeldoverzicht, en map, een bubble chart en andere soorten grafieken.

Je kunt een simpele query verder uitbreiden door telkens meer voorwaarden toe te voegen en zo ingewikkeldere zoekopdrachten op te stellen. En als je SPARQL-taal niet kent, zijn er gelukkig andere gebruikers die je kunnen helpen om een query in SPARQL te schrijven.
SPARQL-query’s worden vooral gebruikt in digital humanities-onderzoekspraktijk waarbij computers en digitale hulpmiddelen ingezet worden voor onderzoek in de geesteswetenschappen. Vaak worden ze gebruikt voor vragen die niet door analoog onderzoek beantwoord kunnen worden (of toch niet op een redelijk termijn). Door RDF databanken met verschillende soorten gegevens op te stellen en er zoekopdrachten met SPARQL uit te voeren, kunnen onderzoekers grootschalige sets van data naast elkaar analyseren, nieuwe verbanden zoeken en nieuwe kennis verkrijgen.

Waarom lid van de VVBAD worden?

  • Deel zijn van het netwerk van experten en collega's
  • Mee de belangen van de informatiesector behartigen
  • Korting krijgen op de activiteiten van de VVBAD
  • Toegang krijgen tot vakinformatie
  • Participeren in de verenigingsbesturen
Word lid
© Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw
Statiestraat 179 | B-2600 Berchem (Antwerpen)
Tel: (+32) 03 281 44 57 | email: vvbad@vvbad.be