Stel je voor: een onderzoekseresultaat dat levens kan redden, maar niemand kan het terugvinden.
▶Inhoudsopgave
- FAIR in één zin: waarom het ertoe doet
- Findable: zodat je data niet verdwijnt in de digitalen mist
- Accessible: open, maar niet zomaar alles vrijgeven
- Interoperable: spreek dezelfde taal als je collega's
- Reusable: bouw voort op wat er al is
- De grote uitdaging: privacy versus openheid
- Wat kun jij als onderzoeker doen?
De data bestaat wel, maar ligt begraven in een Excel-bestand op een laptop die al drie jaar niet meer is opgestart. Klinkt absurd? Gebeurt vaker dan je denkt. In medisch onderzoek is data goud waard — maar alleen als anderen die data ook daadwerkelijk kunnen vinden, begrijpen en hergebruiken. Daar komen de FAIR-principes om de hoek kijken. En in de medische wereld gelden daar nog een paar extra regels bij die je écht niet over het hoofd mag zien.
FAIR in één zin: waarom het ertoe doet
FAIR staat voor Findable, Accessible, Interoperable en Reusable. Vier Engelse woorden die samen een simpel idee beschrijven: onderzoeksdata moet zó worden beheerd dat iedereen die het nodig heeft, er mee aan de slag kan. Niet morgen, niet over een jaar — nu.
De principes zijn in 2016 gepubliceerd in het wetenschappelijke tijdschrift Scientific Data en sindsdien wereldwijd omarmd door universiteiten, subsidieverstrekkers en overheden.
In Nederland speelt de VSNU een belangrijke rol bij het verspreiden van FAIR-kennis, en initiatieven zoals accelerateopenscience.nl helpen onderzoekers om de principes in de praktijk te brengen. Maar laten we eerlijk zijn: de basisprincipes zijn één ding.
Toepassen in medisch onderzoek, met al zijn privacywetgeving, complexe dataformaten en ethische dilemma's, is een heel ander verhaal. Daarom duiken we hier dieper in op wat FAIR écht betekent als je werkt met medische data.
Findable: zodat je data niet verdwijnt in de digitalen mist
De eerste letter van FAIR is misschien wel de belangrijkste: vindbaar. Als niemand je data kan vinden, is de rest niet relevant.
Maar hoe zorg je ervoor dat medische onderzoeksdata ook over vijf jaar nog te traceren is? Het antwoord begint bij metadata — kwalitatieve beschrijvingen van je dataset. Denk aan titel, onderzoeker, methode, gebruikte meetinstrumenten en tijdsperiode.
Hoe rijker de metadata, hoe beter zoekmachines en onderzoekers je data kunnen vinden.
Maar metadata alleen is niet genoeg. Je hebt ook een persistente identifier nodig, zoals een DOI (Digital Object Identifier). Een DOI werkt als een vast adres voor je data, ook als de onderliggende bestanden verplaatst worden. In de medische wereld zijn er specifieke systemen die hierbij helpen. ClinicalTrials.gov registreert klinische studies wereldwijd en kent elk onderzoek een uniek nummer. ORCID geeft onderzoekers zelf een vaste identificatie, waardoor hun werk altijd aan hen gekoppeld blijft — ook als ze van universiteit wisselen. En binnen Europa speelt de European Open Science Cloud (EOSC) een groeiende rol in het verbinden van onderzoeksdata-uitwisseling tussen landen en disciplines.
Accessible: open, maar niet zomaar alles vrijgeven
Toegankelijkheid klinkt eenvoudig: zorg dat data beschikbaar is. Maar in medisch onderzoek zit de kneus in het woje beschikbaar.
Want medische data bevat vaak persoonlijke gegevens van patiënten. En daar gelden strenge regels voor. In Europa is de AVG (Algemene Verordening Gegevensbescherming) leidraad.
In de Verenigde Staten geldt HIPAA. Beide wetten zeggen in essentie hetzelfde: je mag gegevens van patiënten niet zomaar delen.
Anonimisering en pseudonimisering zijn de meest gebruikte technieken om privacy te waarborgen. Bij anonimisering verwijder je alle informatie die naar een persoon kan leiden. Bij pseudonimisering vervang je die informatie door een code. Beide methoden hebben hun beperkingen — met genoeg contextgegevens is anonimisering soms ongedaan te maken.
Daarom kiezen steeds meer onderzoekers voor controleerde toegang. Data wordt opgeslagen in beveiligde repositories zoals Dryad of Figshare, en onderzoekers moeten een aanvraag indien om toegang te krijgen.
Zo blijft de data beschermd, maar wel bruikbaar voor valide onderzoek. Het is een balans tussen openheid en verantwoordelijkheid — en die balans is in de medische wereld extra scherp.
Interoperable: spreek dezelfde taal als je collega's
Stel dat twee ziekenhuizen onderzoek doen naar dezelfde ziekte. Ze gebruiken allebei data, maar in compleet verschillende formaten.
Het ene ziekenhuis werkt met HL7, het andere met FHIR. Ze kunnen hun data niet zonder meer combineren. Dat is precies het probleem dat interoperabiliteit moet oplossen.
- HL7 en FHIR voor het uitwisselen van klinische gegevens tussen systemen.
- DICOM voor medische beelden zoals röntgenfoto's en MRI-scans.
- SNOMED CT als internationale standaard voor medische terminologie.
- ICD-10 en ICD-11 voor de classificatie van ziekten.
Interoperabel betekent: data kan worden uitgewisseld en gecombineerd met andere datasets. Daarvoor is het gebruik van gestandaardiseerde formaten en terminologieën onmisbaar.
In de medische wereld zijn er al enkele standaarden die breed worden gebruikt: Door deze standaarden te gebruiken, zorg je ervoor dat data van verschillende bronnen naadloos samenwerken. Het is alsof iedereen in dezelfde taal praat — en dat maakt samenwerking een stuk efficiënter.
Reusable: bouw voort op wat er al is
Het laatste principe gaat over hergebruik. Medisch onderzoek kost tijd en geld.
Waarom zou je het wiel opnieuw uitvinden als de data er al is? Maar hergebruik is alleen mogelijk als de data goed gedocumenteerd is.
Een data dictionary is hierbij essentieel. Dit document beschrijft precies wat elke variabele in je dataset betekent, welke eenheden worden gebruikt en hoe de data is verzameld. Zonder zo'n dictionary is het voor een ander onderzoekers bijna onmogelijk om je data correct te interpreteren. Daarnaast is het belangrijk om data te valideren en te testen op kwaliteit.
Het is daarom cruciaal om veelvoorkomende valkuilen bij het FAIR maken te vermijden, want fouten in de data leiden tot foutieve conclusies — en in de medische wereld kan dat ernstige gevolgen hebben.
Tools zoals Dataverse helpen bij het gestructureerd opslaan en documenteren van datasets, en het DataCite Metadata Schema biedt een gestandaardiseerde manier om je data te beschrijven.
De grote uitdaging: privacy versus openheid
Laten we niet om het hete hangen draaien: de grootste weerstand tegen FAIR data in medisch onderzoek is de angst voor privacy-incidenten. Wil je weten hoe je gevoelige data FAIR maakt binnen de privacywetgeving? Die angst is niet onterecht.
Medische data is gevoelig. Een lek kan grote gevolgen hebben voor patiënten.
Toch is er een groeiend besef dat juist het niet delen van data een risico vormt. Als onderzoekers niet kunnen bouwen op elkaars werk, gaan kansen liggen. Nieuwe behandelingen worden later ontdekt. Fouten worden herhaald.
De oplossing ligt in een tussenweg: data zo open mogelijk delen, maar met de juiste beschermingsmaatregelen. Technieken zoals federated learning bieden hier perspectief. Bij federated learning reken je op de data bij de bron — bijvoorbeeld in het ziekenhuis zelf — in plaats van de data naar je toe te halen. Alleen de resultaten worden gedeeld, niet de ruwe data. Zo kun je grote analyses doen zonder dat persoonsgegevens ooit een server verlaten.
Wat kun jij als onderzoeker doen?
FAIR data is geen project dat je in een weekend opzet. Het is een manier van werken.
Maar er zijn concrete stappen die je vandaag al kunt nemen: De medische wereld staat voor enorme uitdagingen. Van persoonlijke geneeskunde tot pandemievoorbereiding: het alleen kan met data die écht bruikbaar is.
- Begin met een Data Management Plan (DMP) voordat je onderzoek start. Veel subsidieverschrijvers, zoals ZonMw en de NWO, vragen hier inmiddels om.
- Gebruik bestaande repositories om je data op te slaan, niet je harde schijf of een USB-stick.
- Documenteer alles. Een goede data dictionary bespaart je — en je collega's — veel hoofdpijn later.
- Raadpleeg je data steward of research support afdeling. Op vrijwel elke Nederlandse universiteit zijn er mensen die je hierbij helpen.
- Blijf op de hoogte van nieuwe ontwikkelingen. FAIR is geen statisch concept — het groeit mee met de technologie.
FAIR is geen bureaucratische plicht. Het is de basis voor beter onderzoek, snellere doorbraken en uiteindelijk gezonderheid voor iedereen.
Dus die extra regels die je niet mag missen? Ze zijn er niet om je te lastigvallen. Ze zijn er omdat het ertoe doet.