Opgenomen (bewerkt) als bijlage d in: Semantiek op stelselschaal: issues en oplossingsrichtingen

 

 

Interoperabiliteitscatalogus informatietypen

Pieter Wisse

Wat hebben catalogus en interoperabiliteit met elkaar te maken?

Op z’n eenvoudigst, ga uit van twee aparte informatieverzamelingen. Zeg ook dat de ene verzameling functioneert als bron, de andere als bestemming. Dat betekent praktisch dat van een element in de bronverzameling een kopie gemaakt wordt. Zonodig na enige vervorming ter borging van pasvorm … vormt die kopie dan (tevens) een element in de bestemmingsverzameling. Aldus is interoperabiliteit van die informatieverzamelingen bereikt.

Dergelijk succes met informatieverkeer vergt uiteraard nadere kennis van de inhoud van betrokken verzamelingen. Dus, welke elementen precies telt de ene verzameling en welke elementen precies de andere verzameling?

Een catalogus is van oudsher een kennisinstrument voor inventarisatie. Voor interoperabiliteit op basis van digitale technologie gaat daarvoor de aandacht in eerste aanleg uit naar welke sóórten elementen de respectievelijke informatieverzamelingen tellen. Dat zijn, met een ander woord, de informatietypen.
Aanvullend valt met een catalogus algemeen toegankelijk te documenteren welke specifieke informatie, zeg ook maar selectie uit een verzameling informatiewáárden (domein), zo’n type kan bevatten.

 

 

Verkeerstelsel met variëteit

Voor inrichting van interoperabiliteit biedt een gezamenlijke catalogus een krachtig hulpmiddel. Dat roept de vraag op naar welke informatieverzamelingen daarin met hun informatietypen enzovoort geïnventariseerd moeten zijn.
Het antwoord ligt dankzij de verkeersmetafoor voor de hand. Daarvoor komen àlle verzamelingen in aanmerking waartussen verbindingen behoren tot hetzelfde verkeersstelsel.
Kortom, de elektronische overheid is feitelijk één verkeersstelsel. Dat volgt bijvoorbeeld uit de doelstelling van enkelvoudige registratie, meervoudig gebruik. Blijkbaar moet wat ergens enkelvoudig geregistreerd staat, overal elders beschikbaar (kunnen) zijn. Daarvoor zijn verbindingen nodig, voilá, verkeersstelsel.

Met dat ruime bereik van informatieverkeer moet de catalogus (kunnen) rekenen met verschillende manieren waarop typen voor een bepaalde informatieverzameling systematisch verband kennen. Dat zou voluit de informatietypenstructuur van zo’n verzameling moeten heten. Kortweg is dat haar informatiestructuur.

 

 

Stelselmatige structuur

De catalogus helpt nogeens èxtra, indien hij verder gaat dan inventarisatie van informatiestructuur met bijbehorende –typen van louter afzonderlijke informatieverzamelingen. Samenvoeging van die aparte documentatie in één catalogus maakt toevoegingen mogelijk.
In het bijzonder, tussen welke bron- en bestemmingselementen precies 1. kàn interoperabiliteit bestaan, 2. ligt vooralsnog een drempel die zulk verkeer belemmert, 3. is hergebruik en dùs interoperabiliteit zelfs verplicht, respectievelijk 4. is interoperabiliteit reeds gerealiseerd.
Dat weerspiegelt allemaal, nota bene, óók structuur. Zo vormen informatieverzamelingen annex –systemen op hun beurt als elementen bijelkaar een systeem van zgn hogere orde. In de Nederlandse taal is daarvoor de term stelsel geschikt. In het Engels, waar zo’n apart woord ontbreekt, is daarvoor de aanduiding system of systems gebruikelijk.

 

 

Nieuwe semantische vraagstukken op stelselschaal

Voorgaande uitleg over een Interoperabiliteitscatalogus Informatietypen bedoelt enig inzicht te verschaffen in de semantische vraagstukken die ervoor opgelost moeten worden. Het eerste volgt uit de reële structuurverschillen van de relevante informatieverzamelingen. Dat vergt de mogelijkheid voor structuurvariëteit. Tegelijk, en dat is het tweede vraagstuk, moet tussen informatietypen volgens eventueel afwijkende structuren expliciet, éénduidig verband aangegeven kunnen zijn.
In termen van informatiemodellering is daarvoor een methode nodig die òngevoelig is voor de beperking tot een afzonderlijk informatiesysteem. Het gaat immers om stelselmatige betekenisordening met alle verschillen inclusief hun samenhang van dien.

Een modelleermethode die dankzij variabele verbijzondering naar context (en tijd) opzettelijk mikt op toepassing op stelselschaal is Metapattern. Voor praktische demonstratie van een modelleerresultaat bestaat tevens een zgn programmatuurplatform.

 

 

Proefopzet met voorbeeldverzamelingen

Metapattern met bijbehorend platform is benut voor ontwerp en ontwikkeling van een wèrkende proefopzet voor een Interoperabiliteitscatalogus Informatietypen (hier verder kortweg Icit genoemd).

Voor dit opstel voert het te ver om het stelselmatige model voor informatietypen in Icit te verklaren. Zie de bijlage voor het ontwerpschema. Daarin staat tevens enige tekstuele toelichting opgenomen.

De proefopzet voor Icit werd ook concreet gevuld. Dat is gebeurd met de complete, maar dus afzonderlijke ‘papieren’ catalogi van vier basisregistraties:

BGR – Basisregistratie Gebouwen1
BRA – Basisregistratie Adressen2
GBA – Gemeentelijke Basisregistratie Persoonsgegevens3
NHR – Nieuw Handelsregister4

De respectievelijke catalogi voor BGR, BRA en NHR zijn opgesteld aan de hand van hetzelfde template met bijbehorende toelichting.5 Volgens bedoeld template (sjabloon) bestaat een specifieke informatieverzameling primair uit objecten. Daarvan beschrijft de catalogus in kwestie dus de zgn klassen (lees ook: typen). Elk object telt vervolgens één of meer attributen, wat voor zo’n catalogus neerkomt op vermelding van attribuutklassen bij een objectklasse.

De catalogus voor NHR zèlf is problematisch. Zo biedt het template geen aanwijzingen voor (het documenteren van) a. objectgerichte overerving en b. geheel/onderdeel-betrekking. Voor aparte, geobjectiveerde relaties biedt het template evenmin een voorziening.
Dergelijke modelleervarianten ontbreken in BGR en BRA. Dat verklaart dus waarom het template daarvoor wèl voldoet.
De experimentele vulling van Icit op basis van die catalogi bracht onduidelijkheden voor NHR aan het licht. Dat komt omdat voor Icit de conceptuele hoofdlijn bestaat uit — desgewenst herhaling van — geheel/onderdeel-betrekkingen. Andersoortige betrekkingen/relaties, waaronder eventuele overerving, moeten (en kunnen!) in Icit allemaal met èxtra kenmerken eenduidig bepaald worden. Maar welke kant moet dat op, zolang voor NHR op diverse punten nog onduidelijk is of er sprake is van a òf b? Voor de proefopzet zijn daarvoor overwogen gissingen gemaakt om Icit toch ook voor NHR qua informatietypen compleet gevuld te krijgen.
GBA was weer geen enkel probleem voor/met Icit. Kenmerkend voor GBA is immers herhaling van geheel/onderdeel-betrekkingen en daarin was met de stelselmatige Icit-structuur van meet af aan voorzien. Ook voor die opzet lijkt het template overigens te beperkt, zoals hierboven toegelicht. Want daarvoor zou op z’n minst een attribuutklasse tevens als objectklasse moeten kunnen doorgaan, zodat vervolgens daarvoor weer attribuutklassen definieerbaar zijn, zonodig enzovoort.

Nadat de informatiestructuren volgens vier genoemde catalogi compleet in de proefopstelling waren opgenomen, zijn enkele relaties aangetekend tùssen informatietypen van verschillende basisregistraties. Met andere woorden, dat waren vingeroefeningen met informatiestructuur op stelselschaal, dus voor interoperabiliteit. Een voorbeeld:

¾ NHR kent personen. Daarvan vormen natuurlijke personen een deelverzameling. Als eigenschap van een natuurlijk persoon geldt de eventuele “geslachtsnaam partner.”
¾ Ook de GBA kent personen. Daar betreft het echter per definitie natuurlijke personen, zodat die toevoeging, respectievelijk onderverdeling onder de noemer van natuurlijke ontbreekt! Over een persoon staat informatie over ondermeer een eventueel huwelijk/geregistreerd partnerschap gegroepeerd opgenomen. Daarbinnen vormt de naam van de echtgenoot/geregistreerd partner een subgroep. Pas daarvan geldt de “geslachtsnaam echtgenoot/geregistreerd partner” als een rubriek.

Het is duidelijk dat qua betekenis een relatie bestaat/moet bestaan tussen de beide elementen “geslachtsnaam echtgenoot/geregistreerd partner” en “geslachtsnaam partner.” Gegevenscatalogus Nieuw Handelsregister (p. 27) vermeldt de GBA als “authentieke bron.”6 Voor interoperabiliteit is GBA-geslachtsnaam echtgenoot/geregistreerd partner dus het bronelement en NHR-geslachtsnaam partner het bestemmingselement. In Icit is die stelselmatige relatie ook èxpliciet opgenomen inclusief classificatie van de aard ervan. In dit voorbeeld gaat het om wat enerzijds geldt als authentiek (bron), anderzijds gewaarmerkt afschrift ervan (bestemming).7

 

 

Samenloop met Stelselcatalogus

De nogal gewrochte naam Interoperabiliteitscatalogus Informatietypen dient mede om verwarring met de zgn Stelselcatalogus te vermijden. Sinds eind maart 2009 is de Stelselcatalogus beschikbaar (www.stelselcatalogus.nl[, nota bene inmiddels vervallen]). Dat is ook de reden om het voor Icit bij de proefopstelling te houden.

Er zijn echter in hun opzet enkele wezenlijke verschillen.
Qua informatiestructuur houdt de Stelselcatalogus het Kenniscentrum/SBG-template aan. Dat beperkt de mogelijkheden voor structuurvariëteit uiteraard sterk.
Wie voor de aparte catalogus van een basisregistratie het template niet hanteert, ontbreekt in de Stelselcatalogus. Dat geldt bijvoorbeeld voor de GBA (die inclusief informatiestructuur allang bestond voordat het template ontwikkeld werd). Gelet op haar spilfunctie, van de GBA dus, voor de zgn identiteitsinfrastructuur is dat een extra gemis
Uit de oriëntatie op het template voor een catalogus voor aparte basisregistratie volgt ook dat de Stelselcatalogus géén expliciet gemaakte stelselmatige structuur toont. Dat wil zeggen, aanknopingspunten voor interoperabiliteit kunnen niet éénduidig geïnventariseerd zijn. Voor beheersing van zgn gouden stroom,8 te weten uitwisseling vanàf authentieke bron náár afgeleide registratie, is die precisie uiteraard nodig.
Wat niets met structurering heeft te maken is de beperking van de Stelselcatalogus tot basisregistraties. Volgens het verkeersperspectief reikt het stelsel voor relevant informatieverkeer verder, veel verder dan de verzamelde basisregistraties. Zij vormen er een onderdeel van. Dat is gedacht als een wezenlijk onderdeel. Als bron van zgn authentieke informatie moeten zij interoperabiliteit bevorderen. Want, zo moet het gaan werken, voor elke authentieke informatiewaarde is er precies één basisregistratie als dè bron. De basisregistraties dekken echter niet de volledige vulling van andere informatieverzamelingen. Interoperabiliteit heeft (veel) ruimere strekking. In die zin is de naam ‘Stelselcatalogus’ niet in overeenstemming met het bereik van de geïnventariseerde informatietypen.

Als proefopstelling is Icit verder ontwikkeld om voor de Stelselcatalogus als praktisch voorbeeld te dienen hoe interoperabiliteit valt te bevorderen met de vereiste precisie van inzicht in informatierelaties tussen willekeurige verzamelingen. Met dat doel is de proefopstelling gedemonstreerd aan medewerkers van Kenniscentrum en (destijds) ODP die betrokken waren bij de Stelselcatalogus.

 

 

bijlage

Ontwerpschema Interoperabiliteitscatalogus Informatietypen

Hier volgt verder een toelichting op een zgn interoperabiliteitscatalogus (voor) informatietypen. In essentie gaat het erom allerlei informatiemodellen te registreren in één catalogus. De, zeg maar, catalogusfilosofie luidt om die registratie pèr — informatiemodel van een — informatiesysteem tot de structúúr ervan te beperken. Grof gezegd markeert die structuur uit welke (qua typen!) informatie(deel)verzamelingen tot en met –elementen zo’n apàrt informatiesysteem bestaat inclusief eventueel direct verband ertussen binnen dat ene systeem.
In catalogusjargon heten informatie(deel)verzamelingen tot en met –elementen allemaal: informatieverzameling. Dat had overigens ook informatieelement kunnen zijn. Daarop viel de keuze echter niet. Er zijn inderdaad informatieverzamelingen die op hùn beurt niet verder opgesplitst zijn; dergelijke verzamelingen gelden dus als elementair. Een voordeel om ze desondanks eveneens als verzameling te beschouwen is dat ze eventueel later zonodig wèl opgesplitst kunnen worden zònder dat daarvoor het structuurprincipe hoeft te wijzigen.
(Pas) zodra van meerdere systemen hun aparte informatiemodellen in één catalogus opgenomen zijn, nota bene volgens vergelijkbare systematiek, kan de catalogus vervolgens tevens expliciet verband gaan bevatten van informatieverzamelingen in verschillende systemen. Wat als structuur geldt, groeit daardoor een orde van grootte: stelselmatig.
De toegevoegde waarde van de ene catalogus voor modellen van verschillende informatiesystemen is dus … dat samenhang eenduidig aanwijsbaar is. Dat lukt tot in detail èn met ruimer bereik. Dat bereik overstijgt dus strikt apàrte informatiesystemen. In de Engelse taal heet het resultaat van zo’n ordesprong: system of systems. In het Nederlands zijn er de woorden systeem en stelsel. Wij kunnen dus system of systems aanduiden met een ènkel woord: stelsel.
Kenmerkend voor een interoperabiliteitscatalogus is de zo kaal mogelijk gehouden (typen)structuur van informatieverzamelingen per systeem èn van het systeem van die systemen, stelselmatig dus. Deze ene interoperabiliteitscatalogus is aldus een instrument voor realisatie van stelselmatigheid.
Van welke informatiesystemen horen informatiemodellen in de catalogus? Het antwoord volgt onmiddellijk uit het praktische bereik dat interoperabiliteit moet kennen, zeg ook maar de reikwijdte van wat als een verkeersstelsel moet (kunnen) functioneren. Elk systeem waaruit informatie ‘meespeelt’ in relevant informatieverkeer, moet in de catalogus verschijnen. Partijen kunnen uiteraard hun informatieve interacties direct, dus met onderlinge voorzieningen (blijven) faciliteren. Daarvoor maken zij dan geen gebruik van het algemene verkeersstelsel en zijn evenmin aan voorwaarden voor interoperabiliteit op die ruime schaal gehouden. Zolang een systeem niet aangesloten is op de algemene infrastructuur voor informatieverkeer, kan het in de catalogus onvermeld blijven. Deze redenering geldt uiteraard precies zo voor zgn diensten in de zin van, op z’n Engels, service oriented architecture.
Welke dwarsverbanden documenteert de catalogus? Die omvatten in de eerste plaats noodzakelijkerwijs alle informatieverzamelingen waarvoor een verplichting voor samenhang bestaat, bijvoorbeeld ter operationalisering van enkelvoudige informatieverstrekking door burger en bedrijf. Ten tweede kunnen deelnemers er hun informatievoorziening vrijwillig mee optimaliseren.
Welke inhoud is optimaal voor de catalogus? Dat varieert. In dit stadium, alle architectuurretoriek ten spijt, ontstaat een informatiesysteem feitelijk meestal nog in isolement. Daarvoor is (dus) ook compleet eigen documentatie opgesteld. Voor de ene catalogus is dan de beperking optimaal tot wat hierboven tot structuur per systeem verklaard is. Vertegenwoordigd door een knooppunt in zo’n structuur(model) kan vandaaruit worden verwezen naar de ‘oorspronkelijke’ documentatie over een bepaalde informatieverzameling. Uit deze systeemspecifieke traditie volgt logisch dat niet of nauwelijks documentatie bestaat over samenhang tussen informatieverzamelingen in verschillende systemen. Zoals de catalogus zulke verbanden expliciet opneemt met stelselmatige structuur als resultaat, ligt het voor de hand om aanvullende documentatie erover óók een plaats in de catalogus te geven. Die is immers nieuw en elders is er geen plaats voor gedacht. Het is denkbaar dat na verloop van tijd het model en verdere documentatie van wat ooit een strikt apart systeem was, doelmatiger meteen maar in de catalogus kan worden bijgehouden. Het heeft inderdaad geen nut om dat eerst allemaal apart te doen, waarna het model vervolgens tòch in die ene catalogus terecht komt. Naarmate het stelselperspectief de opzet van verkeersvoorzieningen sterker bepaalt, verandert de catalogus van de aanvankelijke collectie van aparte informatiemodellen in een algemeen model van infrastructuur voor informatieverkeer. Dat is veranderkundig nog een lange weg, maar informatiekundig is inmiddels methodische borging van stelselmatige betekenisordening mogelijk; zie ook het volgende punt.
Hoe passen (formele) definities? Stelselmatige semantiek leert dat absoluut geldige definities niet bestaan. Dat is trouwens geen nieuw inzicht. Op z’n laatst was het Aristoteles die erover begon; zie daar dus al voor steekhoudende argumentatie voor betekenisvariëteit! Nota bene Interoperabiliteitscatalogus informatietypen operationaliseert zulke betrekkelijkheid. Daar staat elke informatievoorziening gestructureerd in/volgens een expliciete context. Dus ook voor definities geldt, een plaats voor alles en alles op z’n plaats. Dit verplaatst (woordspeling?) de nadruk voor ordening naar de relevante plaatsen. Voor een teken, zeg even tekst, is dat steeds contekst, excuus, context. De definitie van een bepaalde informatieverzameling zou dus beschikbaar kunnen komen via de verwijzing naar ‘oorspronkelijke’ documentatie. Als daarin zo’n definitie (nog) ontbreekt, kan daarin eventueel met aanvullende documentatie voorzien zijn. Let wel dat definities als zodanig géén knooppunten van de structuur bieden/vormen; ze zijn hoogstens vanuit die knooppunten (extra) opvraagbaar. Een interoperabiliteitscatalogus mikt in eerste aanleg op samenhang tussen systemen die met digitale technologie werken. Het zou daarom merkwaardig zijn om definities van toepassing op intermenselijk (rechts)verkeer als het ware via automatiseringsmiddelen te ontsluiten. Weliswaar lukt ontsluiting met precies dezelfde methode van contextuele verbijzondering. Maar indien dezèlfde catalogus tevens die rechtsbegrippen moet ‘meenemen,’ vergt dat allereerst een karakteristieke structuur. Vervolgens kunnen knooppunten dááruit, omdat immers dezelfde methode/systematiek benut is, expliciet in verband worden gebracht met knooppunten ‘namens’ digitale informatiesystemen.
Nawoord: In de tweedelige editie van The Works of Aristoteles (Encyclopædia Britannica, 1952, herdruk 1987) luidt de àllereerste zin: “Things are said to be named ‘equivocally’ when, though they have a common name, the definition with the name differs for each.” Het is natuurlijk tekenend voor zijn stelselmatige blik dat Aristoteles vertrèkt vanuit erkenning van dubbelzinnigheid, zeg ook maar betekenisvariëteit.

 

 

noten

1. Catalogus Basis Gebouwen Registratie, versie 4.0, Ministerie van VROM, februari 2006.
2. Catalogus Basis Adressen Registratie, versie 4.0, Ministerie van VROM, februari 2006.
3. GBA Logisch Ontwerp, versie 3.6, Agentschap BPR, 26 november 2007.
4. Gegevenscatalogus Nieuw Handelsregister, Kamer van Koophandel Nederland, 16 november 2007.
5. Opgesteld door het programma Stroomlijning Basisgegevens, later onderdeel van Kenniscentrum (ICTU).
6. Maar waarom dan een afwijkende naam voor het informatietype? Voor Icit maakt dat overigens niets uit, omdat de relatie ertussen opzettelijk èxpliciet wordt aangetekend.
7. In werkelijkheid is dat verband stellig ingewikkelder. Nog ervan afgezien waarom dat informatieelement eigenlijk voor de NHR-verzameling bepaald is, ontbreekt de garantie dat partners van natuurlijke personen die relevant zijn voor NHR geregistreerd staan in de GBA. Dat heeft te maken met wat als populatie geldt voor de GBA. Het lijkt erop dat daarvoor geen rekening wordt gehouden met taken die wel degelijk de status van publieke taken dragen. Dat manco kennen andere basisregistraties ook.
8. Het idee van gouden stroom is veralgemeniseerd van de aanpak zoals voorgesteld in Relaties tussen basisregistraties in het geo-domein: Samenhang in het stelsel (ministerie van VROM, 30 november 2007).

 

 

mei 2009, webeditie 2010 © Pieter Wisse