Authentieke informatie in informatiemodellen

Martijn Houtman

Inleiding

Bij overheidsgegevens wordt vaak gebruik gemaakt van gegevens die uit een authentieke bron komen. In de toekomst zal zo’n authentieke bron direct aangesproken worden, zodat het kopiëren en overbodig onderhoud van gekopieerde gegevens verleden tijd wordt. De vraag die hier gesteld wordt is de volgende:
"Wat zijn de eisen aan een algemene opzet van een informatiemodel om het gebruik van authentieke informatie op de eenvoudigste wijze te implementeren?"

 

Datalagen in informatieverkeer

Indien gegevens opgevraagd worden spelen in het informatieverkeer twee vragen een rol:

 

De vraag wat opgehaald moet worden verwijst naar inhoud van de gegevens en de vraag hoe iets opgehaald moet worden verwijst naar een procedure, een vormvoorschrift om de gegevens op te halen.

 

Aan de hand van metadata kan de juiste procedure afgeleid worden om gegevens op te halen. Natuurlijk kent de metadatavraag zelf ook weer de twee vragen wat en hoe. Om ergens een einde aan dit vraagproces te laten komen is op het hoogste nivo een ad hoc oplossing voor de “hoe vraag” nodig. Een simpele methode om alle vragen op een lager nivo expliciet te kunnen behandelen, is er voor te zorgen dat op het hoogste nivo maar één procedure mogelijk is, zodat het antwoord daar triviaal is. Gewoonlijk wordt de “hoe vraag” echter op impliciete wijze geïmplementeerd door dit ad hoc te programmeren. In dat geval is de metadata in de code van de programmatuur verwerkt en blijft de expliciete datavraag betreffende bijbehorende metadata achterwege.

 

Symmetrie

Wanneer het antwoord op de “hoe vraag” in verschillende modellen identiek is, is er sprake van symmetrie. Symmetrie leidt in de natuurkunde en in economische modellen (zie mijn proefschrift "Nonparametric Consumer and Producer Analysis") tot behoudswetten.

 

Behoudswet

De behoudswet voor de symmetrie van gelijkluidende antwoorden op “hoe vragen” is simpel. Er is sprake van behoud van resultaat bij delegatie van de “wat vraag”. De “wat vraag” kan immers in een willekeurig model beantwoord worden en gedelegeerd worden zonder dat dit tot een ander resultaat leidt, aangenomen dat er sprake is van een identiek antwoord op de “hoe vraag”.

 

Authentieke informatie

Het gebruik van een authentieke gegevensbron is een speciaal geval van bovenstaande vorm van symmetrie, waarin "hoe vragen" identieke antwoorden hebben. De delegatie naar het authentieke bronmodel is in dat geval een vast onderdeel van het antwoord op de “hoe vraag”. Er wordt altijd verwezen naar de authentieke bron. In de symmetrische benadering is de gevolgde “hoe procedure” voor het authentieke bronmodel niet anders dan voor de andere modellen die van deze bron gebruik maken. Het authentieke bronmodel delegeert de vraag dan ook, maar wel naar zichzelf.

 

Het ideale geval

In het ideale geval kan de "hoe vraag" uit het authentieke bronmodel verplaatst of gecopieerd worden en ingeplugd in een ander model. Dit is echter alleen eenvoudig indien deze vraag expliciet gesteld wordt en niet op een ad hoc wijze in het model of de programmatuur opgesloten is.

 

Authentiek of niet-authentiek?

Het onderscheid tussen vragen voor authentieke en “niet-authentieke” gegevensbronnen kan opgeheven worden door iedere vraag te delegeren. In het geval van authentieke gegevensbronnen delegeert het model de vraag naar zichzelf, waarmee het model zelf het authentieke bronmodel wordt voor deze vragen. Het voordeel van deze opzet is dat daardoor symmetrie op een hoger abstractienivo ontstaat. Het antwoord op de “hoe vraag” is op het hogere abstractienivo van dezelfde vorm voor authentieke en “niet-authentieke” gegevensbronnen, omdat er altijd sprake is van delegatie. Bovendien sluit deze aanpak naadloos aan bij de symmetrische benadering van authentieke bronnen.

 

Conclusie

Voor een eenvoudig en consistent informatiemodel met gebruik van authentieke bronnen is het nodig dat het authentieke bronmodel naar zichzelf kan verwijzen en zichzelf daarbij niet als een bijzonder geval ziet. Op deze manier gaat de symmetrie in de opzet niet verloren en kan het antwoord op de “hoe vraag” overal hetzelfde zijn. Om hiervan gebruik te maken dienen de vragen betreffende metadata expliciet gesteld te worden.
Om symmetrie op een hoger abstractienivo te verkrijgen kan iedere vraag gedelegeerd worden, zonodig naar het betreffende informatiemodel zelf, zodat er enkel verwijzingen naar authentieke gegevensbronnen bestaan.