Interoperable: waarom jouw dataformaat bepaalt of collega's jouw data kunnen gebruiken

Stel je voor: je hebt maandenlang data verzameld. Alles netjes in Excel, met eigen kolomnamen, een beetje aangepast hier en daar.

▶Inhoudsopgave

Wat betekent Interoperable eigenlijk?
Waarom faal je zonder interoperabiliteit
Welke dataformaten werken het best?
De praktijk: hoe begin je vandaag nog?
Waarom dit ertoe doet — ook buiten jouw eigen onderzoek
Veelgestelde vragen

Je deelt het met een collega. En die collega? Die zit daar kijkend alsof het in het Chinees geschreven is. Geen paniek, geen drama — gewoon een opmerking: "Dit werkt niet in mijn systeem." Klinkt herkenbaar?

Dan zit je precies bij het vierde principe van FAIR data: Interoperable. En ja, dat woord klinkt saai. Maar het is misschien wel het belangrijkste principe als je wilt dat anderen écht met jouw data aan de slag kunnen.

Wat betekent Interoperable eigenlijk?

Interoperabiliteit is een mondvol, maar het komt neer op één ding: jouw data moet samenwerken met andere data en systemen. Niet alleen in jouw eigen laptop, niet alleen in jouw favoriete software, maar ook in de tools van je collega, de database van een ander instituut, of een analyseplatform aan de andere kant van de wereld.

Binnen de FAIR-principes (Findable, Accessible, Interoperable, Reusable) is Interoperable het principe dat ervoor zorgt dat data begrepen wordt door zowel mensen als machines.

Het gaat niet alleen om toegang krijgen tot data — dat is het Accessible-deel — maar om het daadwerkelijk kunnen combineren, vergelijken en hergebruiken met andere datasets.

Waarom faal je zonder interoperabiliteit

Het probleem is vaak subtieler dan je denkt. Je data is "open", je hebt een repository gebruikt, er zit een licentie bij.

Maar als je data in een formaat staat dat niemand anders gebruikt, of als je labels en definities niet gestandaardiseerd zijn, dan is je data praktisch onbruikbaar. En dat is zonde.

Denk aan dit voorbeeld: twee onderzoeksgroepen meten de luchtkwaliteit in Nederland. De eerste groep slaat resultaten op als "temp_c" en "pm25_ugm3". De tweede groep gebruikt "temperatuur" en "fijnstof_concentratie". Beide meten hetzelfde, maar een computer kan deze datasets niet automatisch combineren.

Een mens moet er eerst handmatig achter komen wat wat betekent. Dat kost tijd, geld, en fouten zijn bijna onvermijdelijk.

Volgens de European Interoperability Framework (EIF), ontwikkeld door de Europese Commissie, is interoperabiliteit een van de pijlers van effectief digitaal overheidsbeleid en wetenschappelijke samenwerking. De EU investeert er serieus in — onder meer via de Interoperable Europe Act, die sinds 2024 van kracht is en grensoverschrijdende digitale samenwerking tussen overheden verplicht stelt. De boodschap is duidelijk: als je data deelt, moet die ook écht werken in een ander systeem.

Interoperabiliteit werkt op meerdere niveaus. De EIF onderscheidt er vier, maar voor onderzoeksdata zijn er drie die er echt toe doen:

De drie lagen van interoperabiliteit

1. Technische interoperabiliteit — Dit is het basisniveau. Gaat het technisch?

Kun je de data inlezen in een ander systeem? Denk aan bestandsformaten: CSV, JSON, XML, of gesloten formaten zoals .xls of .sav (SPSS). Hoe open en breed ondersteund het formaat is, hoe beter.

CSV en JSON zijn bijvoorbeeld universeel leesbaar. Een eigen Excel-template met macro's? Veel minder.

2. Semantische interoperabiliteit — Dit is waar het écht interessant wordt.

Gaat het om betekenis. Als jij "leeftijd" noemt en een ander "age", bedoelen jullie dan hetzelfde?

En als je "diagnose" opslaat, gebruik je dan de ICD-10 classificatie of je eigen benamingen? Semantische interoperabiliteit zorgt dat data niet alleen technisch uitwisselbaar is, maar ook begrepen wordt op dezelfde manier door iedereen. 3. Organisatorische interoperabiliteit — Dit gaat over afspraken tussen organisaties. Gebruiken jullie dezelfde standaarden?

Zijn er gedeelde protocollen voor data-uitwisseling? In de wetenschap zie je dit bij consortiumafspraken of binnen infrastructuurprojecten zoals die van de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO) en de VSNU.

Welke dataformaten werken het best?

Er is geen "beste" formaat — het hangt af van je vakgebied en use case.

Maar er zijn wel duidelijke richtlijnen die je verder helpen: Voor tabulaire data: CSV (Comma Separated Values) is de gouden standaard. Het is platte tekst, geen afhankelijkheid van specifieke software, en universeel leesbaar. Gebruik UTF-8 encoding om problemen met speciale tekens te voorkomen.

Vermijd Excel (.xlsx) als primair opslagformaat — het lijkt handig, maar het introduceert risico's zoals automatische datumconversie (ja, die beruchte genen-namen die omgezet worden in datums in Excel, daar is een hele wetenschap over geschreven). Voor gestructureerde data: JSON en XML zijn krachtig als je hiërarchische of complexe data opslaat. Ze zijn leesbaar voor machines en breed ondersteond in API's en webapplicaties. Voor statistische analyse: Als je met R of Python werkt, zijn formaten zoals Parquet of Feather efficiënt voor grote datasets.

Maar denk aan toekomstige gebruikers: kun je ook een CSV-versie aanbieden? Voor metadata: Hier geldt: gebruik bestaande standaarden.

In de levenswetenschappen is Dublin Core veelgebruikt. In de sociale wetenschappen is DDI (Data Documentation Initiative) gangbaar. In de gezondheidszorg speelt HL7 FHIR een grote rol. Kijk wat jouw veld gebruikt en sluit daar aan.

Controlled vocabularies en ontologieën: je geheime wapen

Een van de meest effectieve manieren om interoperabiliteit te verbeteren is het gebruiken van controlled vocabularies of ontologieën. Dit zijn gestandaardiseerde lijsten van termen die binnen een vakgebied afgesproken zijn.

Voorbeelden die je kunt gebruiken: — SNOMED CT voor medische terminologie
— MeSH (Medical Subject Headings) voor biomedische literatuur
— AGROVOC voor landbouwgerelateerde data
— ORDO (Ontology of Rare Diseases) voor zeldzame ziekten Door te verwijzen naar deze standaarden in je metadata, maak je direct duidelijk wat je data betekent. Geen gokwerk, geen verwarring. En door te kiezen voor linked data en FAIR principes, maak je jouw dataset onderdeel van het semantisch web en verbind je deze met andere datasets wereldwijd.

De praktijk: hoe begin je vandaag nog?

Je hoeft niet alles in één keer te fixen. Maar deze stappen brengen je al een heel eind:

1. Kies open, breed ondersteunde formaten. CSV boven Excel, JSON boven eigen binaire formaten.

Minder is meer — hoe simpeler het formaat, hoe groter de kans dat het overal werkt. 2. Documenteer je data goed. Een goede README-file of data dictionary waarin je elk veld uitlegt, is goud waard. Wat betekent kolom X?

Welke eenheid wordt gebruikt? Zijn er missings, en zo ja, hoe zijn die gecodeerd? 3.

Gebruik bestaande standaarden. Kijk op FAIRsharing.org welke standaarden en ontologieën relevant zijn voor jouw vakgebied. Sluit je aan bij wat al bestaat in plaats van zelf iets nieuws te verzinnen. 4. Test met anderen. Deel je data met een collega uit een ander team of instituut en ontdek hoe je jouw dataset optimaal herbruikbaar maakt. Kunnen zij er mee werken zonder dat jij alles hoeft uit te leggen?

Zo niet, dan is er werk aan de winkel. 5. Denk aan de lange termijn. Wordt het formaat over vijf jaar nog ondersteund?

Is de standaard levensvatbaar? Kies voor duurzame oplossingen, niet voor de laatste hype.

Waarom dit ertoe doet — ook buiten jouw eigen onderzoek

Interoperabiliteit is niet alleen een technisch detail. Het is een kwessie van samenwerking.

In een tijd waarin grote vraagstukken — klimaat, gezondheid, migratie — alleen opgelost kunnen worden door data uit verschillende bronnen te combineren, is het van essentelijk belang dat die data ook écht samen kan.

De Europese Open Science Cloud (EOSC) bouwt hiervan. Het Nederlandse programma Nationale Wetenschapsagenda (NWA) vraagt erom. En het Plan S-beleid van cOAlition S, waar Nederland bij aansluit, vereist dat onderzoeksdata FAIR zijn — en dus ook interoperable.

Jouw dataformaat is dus niet zomaar een technische keuze. Het is een beslissing over of jouw werk mee kan doen in het grotere geheel. Of het op een schrijftje blijft liggen in een repository die niemand raadpleegt, of het daadwerkelijk bijdraagt aan nieuwe ontdekkingen. Start als promovendus vanaf dag één met het goed bijhouden van je data. Kies voor open formaten. Gebruik standaarden. Documenteer helder.

En denk altijd aan de collega aan de overkant — die jouw data niet kent, maar er wel iets mee moet kunnen.

Dat is interoperabiliteit. En dat is FAIR.

Veelgestelde vragen

Wat houdt interoperabiliteit precies in binnen data?

Interoperabiliteit betekent dat jouw data, ongeacht het formaat of de software waarin het is opgeslagen, kan worden gebruikt in combinatie met andere datasets en systemen.

Waarom is interoperabiliteit zo belangrijk voor onderzoek?

Denk bijvoorbeeld aan het automatisch vergelijken van meetresultaten van verschillende onderzoeksgroepen, zelfs als ze verschillende terminologie gebruiken, waardoor je waardevolle inzichten kunt genereren. Zonder interoperabiliteit kan data in silos blijven, waardoor het moeilijk wordt om resultaten te combineren en te analyseren. Het zorgt ervoor dat data niet alleen toegankelijk is, maar ook daadwerkelijk bruikbaar is voor samenwerking en hergebruik, zoals de Europese Commissie benadrukt met initiatieven zoals de Interoperable Europe Act. Stel je voor dat twee onderzoeksgroepen luchtkwaliteit meten: de ene groep gebruikt 'temp_c' en 'pm25_ugm3', de andere 'temperatuur' en 'fijnstof_concentratie'.

Hoe ziet interoperabiliteit er in de praktijk uit, bijvoorbeeld bij onderzoeksgroepen?

Interoperabiliteit vereist dat deze data automatisch kunnen worden vertaald en gecombineerd, zodat de resultaten samenhangend zijn en bruikbaar voor een bredere analyse, zonder handmatige conversie. Als data niet interoperabel is, kan het leiden tot onbruikbare datasets, omdat ze niet gemakkelijk kunnen worden geïntegreerd met andere bronnen.

Wat zijn de gevolgen als data niet interoperabel is?

Dit resulteert in verspilling van tijd, geld en moeite, en beperkt de mogelijkheid tot nieuwe inzichten en innovatie binnen onderzoek en andere sectoren.

Welke overheidsinitiatieven ondersteunen interoperabiliteit?

De Europese Commissie investeert aanzienlijk in interoperabiliteit via de Interoperable Europe Act, die grensoverschrijdende digitale samenwerking tussen overheden stimuleert. Dit is een belangrijke stap om ervoor te zorgen dat data effectief kan worden gedeeld en gebruikt, wat essentieel is voor wetenschappelijke samenwerking en effectief overheidsbeleid.