Datarepositories kiezen en gebruiken

Vergelijking: open versus gesloten repositories voor gevoelig medisch onderzoek

Lieke de Vries Lieke de Vries
· · 5 min leestijd

Medisch onderzoek draait om vertrouwen. Patiënten delen hun gegevens met de hoop dat wetenschappers er iets goeds mee doen.

Inhoudsopgave
  1. Wat is het verschil tussen open en gesloten repositories eigenlijk?
  2. Waarom open repositories aantrekkelijk zijn
  3. Maar wat als de data gevoelig is?
  4. De middenweg: zo open als mogelijk, zo gesloten als nodig
  5. Wat kies jij als onderzoeker?
  6. De conclusie? Wees bewust, niet bang

Maar hoe zorg je ervoor die data veilig én toegankelijk is? Dat is precies de kern van de discussie tussen open en gesloten repositories.

En eerlijk is eerlijk: het antwoord is zelden zwart-wit. Laten we er eens goed induiken, want de keuze voor de manier van data-opslag heeft grote gevolgen voor zowel onderzoekers als patiënten.

Wat is het verschil tussen open en gesloten repositories eigenlijk?

Een open repository is een online plek waar onderzoeksvrij toegankelijk data opslaat.

Denk aan platforms zoals Zenodo, Dryad of Figshare. Iedereen kan de data inzien, downloaden en hergebruiken. Geen poortwachter, geen drempels.

Een gesloten repository werkt heel anders. Daar zitten toegangsmechanismen om de data heen.

Je moet vaak een aanvraag indienen, je identiteit verifiëren en aantonen dat je een legitieme reden hebt om de data te gebruiken.

Denk aan platforms zoals DANS (Data Archiving and Networked Services) of gespecialiseerde medische omgevingen zoals de European Genome-phenome Archive (EGA). Beide aanpakken hebben hun plek. Het hangt er vooral van af: wat voor data heb je, en wat wil je ermee bereiken?

Waarom open repositories aantrekkelijk zijn

Open Science is dé grote trend in de wetenschappelijke wereld. En daar is een goede reden voor. Open data betekent:

Snelle verspreiding van kennis. Andere onderzoekers kunnen direct verder bouwen op jouw bevindingen.

Geen maanden wachten op toestemming, geen bureaucratische hindernissen. Herhaalbaarheid en transparantie. Als je data openbaar is, kan iedereen je resultaten controleren. Dat verhoogt het vertrouwen in onderzoek aanzienlijk. Meer samenwerking. Open repositories trekken een breed publiek aan. Dat leidt tot onverwachte samenwerkingen en nieuwe inzichten die je nooit had bedacht.

En laten we het hebben over subsidiegevers: organisaties zoals NWO en ZonMw vragen steeds vaker om open data als onderdeel van je onderzoeksvoorstelling. Het Plan S-initiatief, dat Nederland via de VSNU actief steunt, legt zelfs verplichtingen op voor Open Access publiceren. Open data opslaan is dus niet meer een luxe, het wordt een vereiste.

Maar wat als de data gevoelig is?

En dan komen we bij het grote probleem. Medisch onderzoek bevat vaak persoonsgegevens: genetische informatie, medische geschiedenissen, beeldmateriaal.

Die data valt onder de AVG (Algemene Verordening Gegevensbescherming) en soms zelfs onder strengere nationale wetgeving. Je kunt niet zomaar een dataset met patiëntgegevens op Zenodo gooien.

Hoe werkt toegangsbeheer in de praktijk?

Dat is niet alleen onethisch, het is gewoon illegaal. En daarom bestaan gesloten repositories. Moderne gesloten repositories bieden iets wat "controlled access" heet. Dat betekent niet dat data afgesloten is, maar dat er een laagje beveiliging omheen zit.

Een bekend voorbeeld is de EGA, waar onderzoekers een aanvraag indienen bij een Data Access Committee (DAC).

Dat comité beoordeelt of je aanvraag wetenschappelijk valide is en of je voldoende maatregelen treft voor dataveiligheid. Dit klinkt misschien omslachtig, en dat is het soms ook. Maar het biedt enorme voordelen:

Patiëntvertrouwen blijft intact. Mensen stellen hun data beschikbaar omdat ze weten dat er strenge controles zijn. Zonder dat vertrouwen stoppen patiënten met meewerken, en dan stopt het onderzoek.

Je voldoet aan de wet. De AVG stelt strenge eisen aan de verwerking van medische data.

Gesloten repositories zijn specifiek ontworpen om aan die eisen te voldoen. Je behoudt controle. Je kunt nagaan wie jouw data gebruikt, waarvoor en onder welke voorwaarden. Dat is bijna onmogelijk met volledig open data.

De middenweg: zo open als mogelijk, zo gesloten als nodig

De beste aanpak? Die bestaat echt. In de wereld van Open Science praten steeds meer mensen over het principe: "as open as possible, as closed as necessary".

Zo open als mogelijk, zo gesloten als nodig. Wat betekent dat concreet? Je scheidt de data.

Niet alles is even gevoelig. Statistische samenvattingen, geanonimiseerde datasets en analysecode kunnen prima in een open repository, of in een geschikte datarepository voor longitudinale studies.

De ruwe patiëntgegevens blijven in een gesloten omgeving met toegangsbeheer. Platforms zoals DANS bieden hier al voor oplossingen. Ze hebben zowel open als beperkt toegankelijke opties, zodat je niet hoeft te kiezen.

En tools zoals DataverseNL, veelgebruikt bij Nederlandse universiteiten, ondersteunen ook gelaagde toegang. Belangrijk is ook het FAIR-data principe: data moet Findable, Accessible, Interoperable en Reusable zijn.

FAIR betekent niet "open". Het betekent dat data vindbaar en herbruikbaar is, ook als de toegang beperkt is.

Een goede metadata-beschrijving in een repository zorgt ervoor dat andere onderzoekers weten dat jouw data bestaat, ook als ze er niet zomaar bij kunnen.

Wat kies jij als onderzoeker?

Stel jezelf deze vragen: Welke data verzamel je? Bevat het direct identificeerbare informatie?

Dan is een gesloten repository vrijwel onvermijdelijk. Wat vragen je subsidiegevers? NWO, ZonMw en de EU (via Horizon Europe) leunen steeds zwaarder op open data-beleid. Maar ze begrijpen ook dat medische data uitzonderingen verdient. Wat is je langetermijnvisie? Wil je dat jouw data over vijf jaar nog steeds bruikbaar is? Kies de beste datarepository voor jouw discipline met een duidelijk duurzaamheidsbeleid en persistente identifiers zoals DOI's. Heb je de technische capaciteit? Gesloten repositories vragen meer voorbereiding: data-anonimisatie, toegangsprotocollen, DAC-samenstelling. Reken daar tijd en middelen voor in.

De conclusie? Wees bewust, niet bang

De keuze tussen open en gesloten repositories is geen ideologische strijd. Het is een praktische afweging die je als onderzoeker bewust moet maken. Open data versnelt de wetenschap, maar patiëntenrechten en wetgeving stellen grenzen.

Gelukkig hoef je het niet zelf uit te vinden. Nederland heeft een rijk ecosysteem aan ondersteuning.

De VSNU biedt richtlijnen over Open Science. DANS helpt bij data-archivering.

En op accelerateopenschience.nl vind je een overzicht van alle initiatieven die je op weg helpen. De sleutel is simpel: wees transparant over wat je waarom opslaat waar. Als je dat goed doet, profiteert iedereen. De wetenschap, de patiënten, en jij als onderzoeker.


Lieke de Vries
Lieke de Vries
Expert in Open Science principes

Lieke adviseert onderzoekers over het publiceren van FAIR data volgens de nieuwste normen.

Meer over Datarepositories kiezen en gebruiken

Bekijk alle 38 artikelen in deze categorie.

Naar categorie →
Lees volgende
Wat is een datarepository en waarom mag jij er niet zomaar één kiezen
Lees verder →