FAIR data principes in de praktijk

Wanneer mag je data NIET openbaar maken en toch FAIR zijn

Lieke de Vries Lieke de Vries
· · 6 min leestijd

Stel: je hebt een prachtig onderzoek afgerond. Je data is netjes geordend, uitstekend gedocumenteerd en als het een potje was, zou je het de hele wereld laten zien.

Inhoudsopgave
  1. FAIR is niet hetzelfde als "open"
  2. Juridische redenen om data af te schermen
  3. Ethische redenen: wanneer openbaar maken schade veroorzaakt
  4. Wetenschappelijke redenen: kwaliteit boven kwantiteit
  5. Hoe je data FAIR maakt zonder openbaar te maken
  6. De balans vinden

Maar dan denk je: wacht eens even. Bevat dit gegevens over patiënten?

Zitten er bedrijfsgeheimen tussen? Is dit data die iemand in gevaar kan brengen? FAIR-data delen is fantastisch. Maar FAIR zijn betekent niet automatisch dat alles openbaar moet.

Soms is het slimmer — en zelfs noodzakelijk — om data af te schermen.

En toch kun je dan nog perfect voldoen aan de FAIR-principes. Hoe dat werkt? Daar gaat dit artikel over.

FAIR is niet hetzelfde als "open"

Laten we even met elkaar helderheid scheppen. Veel mensen verwarren FAIR met "open access".

Dat is begrijpelijk, maar het klopt niet. FAIR staat voor Findable, Accessible, Interoperable en Reusable.

Het gaat erom dat onderzoeksdata vindbaar, toegankelijk, uitwisselbaar en herbruikbaar is. Niet per se gratis voor iedereen. Belangrijk onderscheid: "accessible" betekent dat er duidelijke voorwaarden zijn voor toegang. Dat kan "open voor iedereen" zijn, maar ook "alleen na aanvraag", "alleen voor onderzoekers", of "alleen binnen ons consortium". Zolang het duidelijk is hoe je toegang krijgt, voldoe je aan het A van FAIR.

Juridische redenen om data af te schermen

Privacy: de AVG als harde grens

Dit is veruit de meest voorkomende reden. Als je data persoonsgegevens bevat — en in de praktijk betekent dat vaak: als er maar een kleine kans bestaat dat iemand herleidbaar is — dan valt het onder de Algemene Verordening Gegevensbescherming, beter bekend als de AVG.

Denk aan medische dossiers, onderzoeksgegevens met namen of adresgegevens, interview-opnames, of zelfs datasets waar combinaties van kenmerken (leeftijd, woonplaats, beroep) iemand uniek identificeren. Zelfs als je de namen eraf haalt, kun je nog steeds overtreden als re-identificatie mogelijk is.

De boetes zijn geen grap: tot €20 miljoen of 4% van de wereldwijde jaaromzet, afhankelijk van wat het hoogste is. Dus hier is geen ruimte voor "het zou wel meevallen". Is je data onderdeel van een samenwerking met een bedrijf? Bevat het octrooigegevens, prototypes of innovatieve methoden die commerciële waarde hebben?

Intellectueel eigendom en licenties

Dan zijn er goede redenen om niet alles openbaar te gooien. Licenties spelen hier een grote rol.

Een Creative Commons-licentie kan precies vastleggen wie wat mag doen met je data. Maar als er exclusieve rechten in het spel zijn — bijvoorbeeld via een samenwerkingsovereenkomst — dan heeft dat voorrang. Veel onderzoek wordt gefinancierd door overheden, EU-programma's of private partijen.

Contractuele verplichtingen

Die contracten bevatten vaak specifieke clausules over data. Soms mag je data pas na een bepaalde periode delen.

Soms mag je bepaalde onderdelen helemaal niet publiceren. Negeer die afspraken niet: het kan leiden tot het verlies van financiering of juridische problemen.

Ethische redenen: wanneer openbaar maken schade veroorzaakt

Schade aan individuen

Soms kan het openbaar maken van data mensen daadwerkelijk raken. Medische gegevens die leiden tot discriminatie. Criminele justitiegegevens die iemands herstel in de weg staan.

Interviewgegevens over trauma die gevoelig zijn. Het medische ethische principe van do no harm geldt hier ook.

Kwetsbare groepen extra beschermen

Als er een reëel risico is dat openbaarmaking iemand schaadt, dan wegen de beschermingsmaatregelen zwaarder dan het delingsprincipe. Data over kinderen, vluchtelingen, mensen met een psychische aandoeningen of andere kwetsbare groepen verdient extra zorg.

De gevolgen van misbruik of onbedoelde openbaarmaking zijn hier vaak ernstiger. En het gaat niet alleen om individuen. Ook data over bijvoorbeeld bedreigde diersoorten of archeologische vindplaatsen kan — als die openbaar wordt — onbedoeld leiden tot plundering of verstoring.

Wetenschappelijke redenen: kwaliteit boven kwantiteit

Slecht gedocumenteerde data schaadt de wetenschap

Stel: je maakt data openbaar, maar de documentatie is onvolledig. Andere onderzoekers kunnen de dataset niet reproduceren.

Ze trekken verkeerde conclusies. Jouw reputatie als onderzoeker gaat erop achteruit. FAIR gaat over kwaliteit, niet over hoeveelheid.

Data met beperkte herbruikbaarheid

Beter een goed beschermde dataset met uitstekende metadata dan een halfbakken openbare dataset die verwarring zaait.

Soms is data zo specifiek voor een bepaalde context, apparatuur of software dat het voor anderen weinig waarde heeft. Dat is geen reden om het niet FAIR te maken — maar het is wel een reden om te overwegen of openbaar maken echt toevoegt.

Hoe je data FAIR maakt zonder openbaar te maken

Goed nieuws: je kunt data volledig FAIR inrichten, ook als deze niet openbaar is, bijvoorbeeld bij het publiceren van persoonsgegevens.

1. Maak uitstekende metadata

Hier zijn de belangrijkste stappen. Metadata is de sleutel. Zelfs als de data zelf afgeschermd is, moet de metadata vindbaar en begrijpelijk zijn. Beschrijf duidelijk wat de dataset bevat, hoe deze is verzameld, wat de beperkingen zijn en onder welke voorwaarden toegang mogelijk is.

Gebruik gestandaardiseerde schema's zoals Dublin Core of discipline-specifieke standaarden. Dat maakt je data vindbaar voor de juiste doelgroep, zonder dat de gegevens zelf openbaar zijn.

2. Kies een repository met toegangsbeheer

Veel data-repositories bieden mogelijkheden voor beperkte toegang. Denk aan DANS, de 4TU.ResearchData repository, of institutionale repositories van universiteiten.

Je kunt instellen wie toegang krijgt, bijvoorbeeld alleen na aanvraag, na goedkeuring door een data access committee, of alleen voor verificatiedoeleinden. Zo blijft je data findable (via de metadata in de repository) en accessible (via een duidelijk toegangsproces), zonder dat iedereen erbij kan. Als privacy de enige reden is om data af te schermen, kijk dan of anonimisering of pseudonimisering een oplossing biedt.

3. Anonimiseer of pseudonimiseer waar mogelijk

Pseudonimisering — waarbij je persoonsgegevens vervangt door codes — is vaak een goed tussenpad. Maar wees eerlijk: volledige anonimisering is lastiger dan je denkt.

Een goede risicoanalyse is essentieel. En soms is zelfs gepseudonimiseerde data nog te gevoelig voor openbaarmaking. Een Data Use Agreement (DUA) is een contract tussen jou en de ontvanger van de data.

4. Gebruik data use agreements

Hierin leg je vast wat de ontvanger wel en niet mag doen: geen heridentificatie, geen doorgeven aan derden, alleen gebruik voor specifieke doeleinden.

Dit geeft je controle over hoe je data wordt gebruikt, ook nadat iemand toegang heeft gekregen. Documentatie is het fundament van herbruikbaarheid.

5. Documenteer alles

Leg uit welke software je gebruikt hebt, welke versie, welke parameters, wat de datastructuur is, wat de missende waarden betekenen.

Hoe beter je documentatie, hoe nuttiger je data is voor anderen — óf ze nu direct toegang hebben of via een aanvraagproces.

De balans vinden

FAIR-data is geen alles-of-niks verhaal. Het is een afweging.

Aan de ene kant wil je wetenschappelijke kennis delen en onderzoek reproducerbaar maken.

Aan de andere kant heb je verantwoordelijkheden richting deelnemers, partners en de samenleving. Het doel is niet om data openbaar te maken voor de openbaarmaking zelf. Het doel is om de wetenschappelijke waarde en impact te maximaliseren — binnen de juiste kaders van privacy, ethiek en kwaliteit.

Dus: wees FAIR. Maar wees ook verantwoordelijk. Die twee horen bij elkaar.


Lieke de Vries
Lieke de Vries
Expert in Open Science principes

Lieke adviseert onderzoekers over het publiceren van FAIR data volgens de nieuwste normen.

Meer over FAIR data principes in de praktijk

Bekijk alle 42 artikelen in deze categorie.

Naar categorie →
Lees volgende
Wat zijn FAIR data principes en waarom doet elke Nederlandse onderzoeker er iets mee in 2026
Lees verder →