Die spraakverwarring heerst soms ook in vakpublicaties. In het boekje Tagging van Gene Smith lezen we op één en dezelfde pagina: “A taxonomy is a controlled vocabulary that establishes parent-child, or broader and norrow, relationships between terms.” en “The most famous taxonomy is probably the Dewey Decimal Classification system.”² De formulering van het eerste citaat past voor een thesaurus en niet voor taxonomie, want daarvoor ontbreekt de notie van systematisch overzicht, die essentieel is voor een taxonomie. Bij het tweede citaat worden taxonomie en classificatie zondermeer gelijkgesteld, terwijl we pas van een classificatie spreken als er een extra element aanwezig is, nl. een notatiesysteem. Verder lezen we nog: “Finally, the thesaurus is like a taxonomy on steroids. It combines broader, narrower and equivalence relationships along with associative ones, allowing you to traverse a hierarchy by jumping between related concepts as well as browsing up and down.” Ook hier weer worden taxonomie en thesaurus zonder meer gelijkgesteld. Al in 2004 schreef Lars Marius Garshol: “The term taxonomy has been widely used and abused to the point that when something is referred to as a taxonomy it can be just about anything, though usually it will mean some sort of abstract structure.”³ en “Like the term ‘taxonomy’ the term ‘thesaurus’ has been used to describe all kinds of subject classification structures […]”⁴. Het jongste Nederlandstalige boek over onder meer thesauri, Organiseer je informatie, zet die traditie gedeeltelijk voort.
Het laatste decennium zag het er misschien een beetje naar uit dat ontologieën de plaats zouden innemen van de klassieke thesauri. Ontologieën doen in wezen hetzelfde als thesauri, nl. relaties tussen termen leggen, maar dan op een veel complexere manier. Zo is het perfect mogelijk om een ontologie over zoiets als bier te maken waarin relaties voorkomen als “heeft ingrediënt” en “is ingrediënt van” of “heeft producent” en “is producent van”, terwijl we bij een thesaurus vrede moeten nemen met slechts een handvol voorgeschreven relaties: voornamelijk bredere, engere en verwante termen, en enkele varianten daarvan. Ontologieën zijn dan ook nogal populair in middens van knowledge management, maar in bibliotheken kennen ze nog maar weinig succes, hoewel er wel aandacht voor bestaat in de bibliotheekopleidingen.
De charme van thesauri Waarom bestaat er eigenlijk (internationaal althans) relatief veel aandacht voor thesaurusbouw en voor de ontwikkeling van concrete thesauri? Een eerste reden is dat theorie over thesaurusbouw compact, clean, beheersbaar is, in tegenstelling tot de theorie i.v.m. trefwoordsystemen. Die zijn vaak het resultaat van een zeer lange praktijk en bevatten allerlei uitzonderingsregels en ad-hocoplossingen. Om uit te leggen hoe de Library of Congress Subject Headings (LCSH) werken heb je dan ook een boek van niet minder dan 550 pagina's nodig⁵.
Ook sluiten postcoördinatieve systemen dichter aan bij de praktijk van de information retrieval, waarbij de zoeker vaak een aantal losse woorden intikt. Daarbij bekommert hij of zij zich bijvoorbeeld niet om de voorgeschreven volgorde waarin de afzonderlijke delen van een geleed trefwoord voorkomen. Systemen met trefwoorden als inhoudelijke ontsluiting zorgen er dan ook voor dat die vaste volgorde geen hindernis vormt bij het zoeken. In de Library of Congress was er dan ook discussie over pre- versus postcoördinatieve aanpak in verband met de LCSH, toch het belangrijkste precoördinatieve systeem ter wereld. De uitkomst van de discussie was dat men vooralsnog vasthoudt aan precoördinatie, maar de hele discussie bewijst dat dit niet langer evident is. De verleiding is echter dan ook groot om op zijn minst zo goed te ogen als een thesaurus.
Vermomde trefwoordsystemen De theorie over thesaurusbouw mag dan wel relatief eenvoudig zijn, ze is ook relatief streng; wie de basisregels niet volgt, eindigt ongetwijfeld met een rammelende thesaurus. En volgens die basisregels behoren thesauri in wezen inderdaad postcoördinatief te zijn. Fundamenteel zijn ook de regels over hoe je de relaties tussen de termen legt. Het is niet voldoende om kwistig om te springen met bredere, engere en verwante termen om uiteindelijk een goedgevormde thesaurus te krijgen. Dit gebeurde in de jaren tachtig van de vorige eeuw toen de LCSH omgebouwd werd tot een “thesaurus”. LCSH is en blijft in wezen een precoördinatief systeem met zeer vele precoördinatieve combinaties en bovendien kun je niet zomaar straffeloos “zie ook”- verwijzingen de ene keer door “bredere term”, de andere keer door “engere term” of nog een andere keer door “verwante term” vervangen. Mary Dykstra schreef in 1988 een scherp artikel tegen deze gang van zaken. Ze spaarde daarin allerminst haar kritiek op LC. Ze stelde dat elke wijziging aan de LCSH er één in negatieve zin geweest was en dat LCSH toch wel een dieptepunt bereikt had door zowat alle regels over thesaurusbouw te verkrachten.⁶