Drie wetten van information retrieval

Pieter Wisse

Wat is een onbegrijpelijk verschijnsel? Dat blijkt betrekkelijk. Het hangt er vanaf of de waarnemer voor haar/interpretatie een passende vóóronderstelling van samenhang hanteert. Het dilemma is natuurlijk dat ieder mens zo’n aanname ook geleerd moet hebben. Dan helpt vaak een vergelijking, althans zolang die opgaat. Voor de meeste bestuurders biedt zelfs een traditionele bibliotheek al een krachtige metafoor om tot inzicht te komen dat sturing van moderne informatievoorziening ondersteunt.

Lang geleden ontdekte ik dat bibliothecarissen sinds mensenheugenis belangrijke sleutels tot informatievoorziening bezitten. Omdat zij vooraf de informatiebehoeften van hun klanten nooit tot in detail kennen, benoemen zij a priori slechts relevante kenmerken van objecten. Als het goed is, kan een redelijke vraag naderhand opgegeven worden in de vorm van een combinatie van dergelijke kenmerken. Vanwege dat ‘naderhand’ heet dat postcoördinatie. Het is alsof het antwoord elke keer op maat is. En dat lukt dus zolang de kenmerken relevant zijn.

Met moderne informatietechnologie zijn de praktische mogelijkheden voor postcoördinatie natuurlijk enorm gegroeid. Vanuit enkelvoudige registratie voedt en beheert computerprogrammatuur automatisch allerlei indices. Een antwoord is meestal interactief beschikbaar.

Deze benadering staat op z’n Engels als information retrieval bekend. Daarbij gaat het niet meer uitsluitend om ontsluiting van en toegang tot documenten in een bibliotheek. Information retrieval ondersteunt informatievoorziening over willekeurige verzamelingen objecten, van reisbestemmingen tot en met personeelsleden. De informatietechnologie van de relationele database stimuleert dergelijke verspreiding extra door haar simpele, vergaand gestandaardiseerde structuur en bijbehorende manipulatietaal.

De inzet van digitale technologie voor information retrieval geeft echter dikwijls aanleiding tot een paradoxaal verschijnsel. Ter verklaring heb ik een drietal wetten geformuleerd. Mijn Eerste Wet van Information Retrieval luidt:

Het gebruik van information retrieval leidt tot afnemende behoefte eraan.

Dit voert terug op eigenschappen van het menselijk geheugen. Een gemiddeld mens kan geen informatie over objecten in een verzameling van onbeperkte omvang bijhouden. Er bestaat blijkbaar een praktische bovengrens. Bijvoorbeeld, als u meer dan 1200 speelgoedautootjes heeft gespaard, kunt u ze niet meer allemaal afzonderlijk voor de geest halen. De topstukken uitgezonderd, uiteraard. Dat aantal van 1200 is trouwens niet zo dogmatisch. Maar boven de 2000 wordt information retrieval puur op eigen, menselijk geheugen voor bijna iedereen problematisch. Dat geldt voor kauwgomplaatjes, voor elpees, voor wetten(!) en ook voor sollicitanten.

De waarnemingen die mij tot de Eerste Wet van Information Retrieval leidden, deed ik inderdaad op een personeelsafdeling. Dat was eind zeventiger jaren van de twintigste eeuw. Daar werden toen, uit een groot bestand van kandidaten, zeg ook maar sollicitanten, medewerkers voor externe projecten geselecteerd. Dat gebeurde vooral op hun opleiding en werkervaring waarin grote variatie bestond. Ik had bedacht dat een bibliotheeksysteem uitstekend zou voldoen. De objecten, als ik ze zo mag noemen, waren echter geen boeken, maar de kandidaten. En dat werkte prima. Doordat de personeelsmedewerkers nu interactief hun bestand konden bevragen, begonnen ze driftig volgens allerlei combinaties van criteria te zoeken. Bijvoorbeeld, wie spreekt er goed Frans, is geboren vóór 1955 en heeft praktijkervaring met aanleg van dijklichamen? Deze werkwijze had tot gevolg dat de medewerkers voortdurend geconfrontreerd werden met resultaten in de vorm van lijsten van kandidaten. Zo, meteen op het beeldscherm. Nadat zij op deze manier enige tijd gewerkt hadden, bleken de objecten in de verzameling veel meer afzonderlijk te zijn gaan leven. Het was niet meer zo nodig om de automatiseringsmiddelen te gebruiken. De selectiemedewerker wist inmiddels zelf dat meneer X en/of mevrouw Y voldeed aan de eisen. Met andere woorden, de intensiteit van gebruik nam af.

Maar kan je de automatiseringsmiddelen na zo’n begin dan weggooien? Nee, dat beslist niet. Neemt u de Tweede Wet even in u op?

Beneden een minimaal onderhoudsniveau van het gebruik van gereedschap voor information retrieval nemen de prestaties van de medewerkers (wederom) af.

Dat komt omdat het menselijk geheugen een vitale functie heeft, en dat is: vergeten. Er is minimale stimulering nodig om informatie actief toegankelijk te houden. Het is precies de information retrieval met automatiseringsmiddelen die de noodzakelijke stimulering kan bieden. Dat gebeurt door voortdurend gebruik met confrontatie van objecten in de praktijk. Voorts is het zo dat het bestand met kandidaten verandert. Informatie over wie überhaupt niet meer voor selectie in aanmerking komt, kan beter verdwijnen. Aan de andere kant komen er nieuwe kandidaten bij. Dankzij gebruik van de hulpmiddelen leert de selectiemedewerker dergelijke wijzigingen. Dit wijst op een regelkring met medewerker en hulpmiddelen als samenhangende elementen. Het is dus absoluut niet zo dat het informatiesysteem alle geheugenfuncties van de medewerker overneemt. In de praktijk valt te zien dat het ingewikkelder is. Het is zelfs zo dat de werking van het geheugen van de medewerkers in belangrijk opzicht sterk verbetert onder invloed van geautomatiseerde information retrieval. Deze paradoxale verhouding komt in mijn Derde Wet van Information Retrieval tot uitdrukking:

Het juiste gereedschap versterkt de unieke vaardigheden van de medewerker die het hanteert.

De Derde Wet zegt vooral dat automatisering — of het om information retrieval gaat of niet — er niet is om mensen te vervangen, maar om ze beter te laten functioneren. Voor wie dat begrijpt, is er tenslotte geen paradox meer.