Onder de noemer van artificiële intelligentie vallen heel wat verschillende deelgebieden die tot een waaier van toepassingen leiden. Denk bijvoorbeeld aan beeldherkenning (gezichten, locaties, concepten, enz.), geluidsherkenning (toepassingen in muziek, toepassingen met spraakherkenning zoals Siri) of tekstherkenning (OCR, named-entity recognition, enz.), maar ook aan robots (bv. in industriële en medische toepassingen of in zelfrijdende auto’s).
Welke machine? En wie instrueert ze? De algoritmes en statistische modellen waar machine learning gebruik van maakt, stellen de machine in staat om autonoom een taak uit te voeren. Hoe beter de achterliggende algoritmes en modellen, hoe preciezer de machine de taak zal uitvoeren. De technologie is niet neutraal, laat staan kunstmatig (“artificial”). Het zijn mensen die de technologie aansturen en zij zijn ook niet neutraal. De trainingsdata – die machines in grote getale nodig hebben om te kunnen leren – zijn evenmin neutraal, omdat ze het resultaat zijn van wat mensen beslist hebben bij te houden.
Computers bevatten meer geheugencapaciteit en rekenen sneller dan mensen, maar ze zijn op zichzelf niet kunstmatig intelligent. Machines zijn vandaag niet in staat om menselijke denkfouten, vooringenomenheid of blinde vlekken te corrigeren. Dat lijkt misschien maar een klein probleem wanneer een algoritme in een beeldherkenningssoftware foutief suggereert dat een peuter op een schilderij een pop is. Maar wat wanneer die algoritmes in medische toepassingen of in onze zelfrijdende auto fouten maken? Is dan de dokter, de bestuurder, of de machine verantwoordelijk?
(N)iets voor ons?
Is het dan allemaal niet betrouwbaar en bijgevolg nutteloos? Neen, zolang je het menselijke aspect niet uit het oog verliest. Binnen de informatiesector is machine learning vooral interessant om metadata te verrijken en collecties beter doorzoekbaar en dus vindbaar en bruikbaar te maken. We hebben het dan in eerste instantie over machine learning voor beeld-, geluids- en tekstherkenning en minder over robotica. Wanneer je machine learning combineert met linked (open) data, opent zich bovendien een nieuwe waaier aan mogelijkheden. Succesvol herkende concepten of locaties krijgen dan immers een rijke en meertalige context.
Daarnaast biedt machine learning interessante mogelijkheden om met je collectie op een andere manier (andere) mensen te bereiken. Denk bijvoorbeeld aan onderzoeksmatige toepassingen: plantkundigen die op zoek gaan naar de planten die afgebeeld staan op schilderijen, musicologen die op zoek zijn naar historische afbeeldingen van instrumenten, foto’s of audiovisueel materiaal die na geolokalisatie gebruikt kunnen worden in toepassingen die het publiek meenemen doorheen de geschiedenis van een bepaalde plaats, enz. Deze voorbeelden zijn geen toekomstmuziek, ze worden vandaag gerealiseerd. Eens proberen?