Thesaurus

Pieter Wisse

1. Van t naar T

Vaak hanteren organisaties (nog) een thesaurus die geen gestructureerde ontsluiting & toegankelijkheid biedt voor de vollédige informatievoorziening. Met zijn oorsprong in de interne bibliotheek is de thesaurus dan niet geschikt voor, bijvoorbeeld, archiefdocumentatie.

Hier probeer ik deze conclusie voor andere 'buitenstaanders' te verklaren; wie haar deelt begrijpt meteen dat over de thesaurus als instrument voor toekomstige informatievoorziening een wezenlijke beslissing nodig is.

Een organisatie met zijn medewerkers is verwikkeld in gevarieerde activiteiten. Die activiteiten kunnen — sterk vereenvoudigd, maar dat is voor verklaring toereikend — langs één dimensie geordend worden met bijvoorbeeld extern beleid aan het ene uiteinde en intern beheer aan het andere uiteinde van zo'n spectrum.

Traditioneel mikt de bibliotheekafdeling van een wat complexere (overheids)organisatie met collectievorming en bijbehorende ontsluiting & toegankelijkheid op — ondersteuning van — het externe beleid. Daar zijn inmiddels doorgaans wat bestuurskundige bronnen bijgekomen. Documenten over (interne) beheersaspecten zijn echter schaars, zo niet compleet afwezig. Bijgevolg is de thesaurus bijna netzo volledig gericht op extern beleid.

Ondersteuning van andere activiteitengroepen, dus op het spectrum meer in de richting van intern beheer, is echter niet een kwestie van simpele toevoegingen met relevante trefwoorden. Daartegen pleit bijvoorbeeld dat één en dezelfde term diverse betekenissen kan dragen.

Wat verschaft helderheid over welke betekenis in een concreet geval (lees ook: document) aan de orde is? Dat lukt op een grove manier door nevengeschikte toevoeging van een term. De combinatie van zulke termen is dan specifiek. Deze aanpak (postcoördinatie) passen organisaties in de praktijk reeds op bescheiden schaal in hun thesaurus toe.

Selectiever werkt het door (zonodig) een term expliciet aan een context te koppelen. Omdat zo'n context eveneens door een term wordt weergegeven, ontstaat een hiërarchie (precoördinatie). Deze manier vergt uiteraard meer werk aan de thesaurus.

De wezenlijke vraag die nu openstaat luidt, of de ene thesaurus inderdaad ook andere activiteiten(groepen) (lees à la de filosoof Wittgenstein: taalspelen) dan extern beleid stelselmatig moet ondersteunen.

Zo nee, dan beschikt de organisatie voor haar medewerkers onverminderd over een optimale thesaurus (die natuurlijk onderhouden moet blijven). Zo ja, dus als stelselmatige ontsluiting & toegankelijkheid voor de volledige informatievoorziening gewenst is, dan vormt de traditionele thesaurus toch een degelijk uitgangspunt. Want met een mengsel van postcoördinatie en contexthiërarchie verkrijgt de thesaurus vervolgens voldoende onderscheidend vermogen voor bredere toepassing. Dit algemene(re) thesaurusbeheer vergt wèl extra aandacht (lees: menskracht van niveau), met consistente(re) informatievoorziening als resultaat.

De beperkte reikwijdte van de thesaurus volgens de traditioneel beperkte(re) oriëntatie kan met de kleine letter 't' aangeduid worden. Een algemeen bruikbare thesaurus, geldig voor het gehele spectrum van activiteiten, kent als symbool dan de hoofdletter 'T.' Samengevat gaat het om de vraag of de thesaurus zich tot een Thesaurus moet ontwikkelen, ofwel van kleine 't' naar grote T.

 

 

2. Thesaurusstructuur

Ik maak bij voorbaat mijn excuus, als de inhoud van deze paragraaf (te) moeilijk overkomt. Ik heb geprobeerd een aanzet te geven voor (verdere) communicatie over wat ik als kern voor beheersbare informatievoorziening beschouw. Zo'n aanzet wilde ik kort houden. Pretentie op volledigheid heb ik geenszins. Het lijkt me zinnig om desgewenst verkenning van dit ingewikkelde probleem annex kans mondeling voort te zetten.

In de voorgaande paragraaf, van t naar T, staat de vraag vermeld of de thesaurus zoals een organisatie die hanteert (vooral) gericht moet blijven op haar extern beleid òf instrument moet zijn voor beheersbare ontsluiting & toegankelijkheid voor — informatievoorziening voor — het gehele spectrum van intra- tot en met interorganisatorische activiteiten. Inmiddels blijkt dat vrijwel overal een retorische vraag. Dus, de ontwikkeling van een thesaurus met een kleine t naar één met een grote T is noodzakelijk voor samenhangende informatievoorziening.

Wanneer het retorisch gehalte van de vraagstelling overeind blijft, dwz wanneer het idee voor de ontwikkeling van thesaurus naar Thesaurus ook daadwerkelijk brede steun verkrijgt, komt daarna de vraag naar de optimale 'structuur' van de Thesaurus (hier verder gewoon weer met kleine t geschreven, thesaurus dus) aan de orde. Ik nam hierboven trouwens al een voorschot met enkele opmerkingen over classificatie met trefwoorden zonodig in hiërarchische samenhang. Dit acht ik voor de ontwikkeling een kritiek punt. De structuur van de huidige thesaurus is meestal 'plat,' dwz zonder hiërarchie 'binnen'in de termen.

Nota bene, verwar hiërarchie tussen (tref)woorden in één dezelfde term niet met evt hiërarchie tussen termen, zoals de relatie van een bepaalde term met een zgn broader term of juist een narrower term. Deze tweede 'vorm' van hiërarchie is in de huidige thesaurus uitgebreid toegepast en 'vormt' zelfs een wezenlijk structuurbeginsel ervan.

Zo'n platte structuur lijkt me voor de gevarieerde activiteiten nu en in de toekomst onvoldoende waarborg bieden voor relevante ontsluiting & toegankelijkheid. Daarom moet de thesaurusstructuur m.i. gewijzigd worden, opdat tenminste de mogelijkheid voor hiërarchische classificatie bestaat. Die mogelijkheid kan dan benut worden, zodra daaraan concrete behoefte ontstaat. Dat moment zie ikzelf overigens al vroeg arriveren, dwz wanneer de thesaurus uiteenlopende 'contexten' moet expliciteren. Dit neemt niet weg dat feitelijke termen zoveel mogelijk enkelvoudig, plat moeten worden gekozen. Waar mogelijk, bestaat een term dus uit één woord. Soms uit enkele nevengeschikte woorden. Het is echter verstandig om de complexe, hiërarchische terminologie niet als uitzonderingen buiten de structuur te plaatsen, maar volgens algemene regels erin.

Ik merk hierbij op, dat woordenhiërarchie in de algemene thesaurus niet hoeft te betekenen dat ontsluiting & toegankelijkheid in een specifiek informatiesysteem een hiërarchisch karakter heeft. De relevante termen zijn voor een begrensde toepassing 'plat,' wanneer het niveau dat de context expliciet benoemt binnen zo'n informatiestelsel 'weggelaten' kan worden. Dit is overigens meteen een toelichting dat de algemene thesaurus tov diverse, eventueel nog afzonderlijke informatiesystemen een overkoepelend beheersinstrument voor ontsluiting & toegankelijkheid vormt. En naarmate de reikwijdte informatievoorziening groeit, ofwel er méér stelselmatig moet passen, neemt volgens mij de noodzaak van zo’n beheersinstrument toe.

Mijn voorkeur voor — de mogelijkheid van — contextgerichte, hiërarchische classificatie heeft dus alles te maken met het besef dat voor gevarieerde informatievoorziening een thesaurus met passende variëteit onmisbaar is. Een hiërarchische structuur biedt nu eenmaal een orde van grootte méér variëteit dan een platte structuur.

Het gaat eerst en vooral om de schatting van de informatievoorziening bij de betrokken partijen. Concreet: Zijn er 'genoeg' identieke woorden in gebruik, die in verschillende contexten afwijkende betekenissen dragen? Zo nee, dan voldoet een platte structuur. Zo ja, dan moet of a. het mechanisme van postcoördinatie bewust(er) toegepast worden of b. moet de context expliciet benoemd zijn, wat vaak in een platte structuur kan, maar soms een hiërarchische classificatie vergt.

Wie zich (opnieuw?) wil verdiepen in afwegingen over thesaurusstructuur, verwijs ik naar oa het werk van de Indiase wiskundige en bibliotheekwetenschapper S.R. Ranganathan (1892-1972) Zijn zgn colon classification met facet analysis was overigens (nog) ontworpen voor handmatig beheer van de catalogus. Dankzij moderne, digitale informatietechnologie kan de structuur van een thesaurus zelfs directer op de variëteit in informatievoorziening afgestemd worden. Ik geef het toe, dat is mijn stokpaard.

 

 

16-21 januari 1997, webeditie 2005 © Pieter Wisse