Stel je voor: je leest een wetenschappelijk artikel dat een doorbraak belooft. Je wilt het resultaat zelf controleren, maar de onderzoeksdata is nergens te vinden.
▶Inhoudsopgave
De methodologie is vaag beschreven. En de code? Die bestaat gewoon niet meer. Frustrerend, toch?
Dit is geen theoretisch scenario. Het is dagelijkse werkelijkheid in de wetenschap. En precies hier komen FAIR data en reproduceerbaar onderzoek samen als een koppel dat alles kan veranderen.
Waarom reproduceerbaar onderzoek nog steeds zo moeilijk is
De wetenschap heeft een probleem. Een groot probleem. Uit onderzoek van Nature uit 2016 bleek dat meer dan 70% van de onderzoekers een ander wetenschappelijk experiment niet konden reproduceren.
En bijna 50% kon hun eigen werk niet herhalen. Dat is geen klein detail.
Dat is een fundamentele kwestie van vertrouwen. De oorzaken zijn bekend. Data wordt niet gedeeld.
Methodes zijn slecht gedocumenteerd. Analysecodes verdwijnen in een digitale achterbak.
En de druk om te publiceren zorgt ervoor dat snelheid boven kwaliteit gaat. Het gevolg? Een wetenschappelijke literatuur die deels op wankel fundament staat. Maar er is goed nieuw. Er groeit een beweging die dit wil omdraaien. En FAIR data staat daar middenin.
Wat zijn FAIR data eigenlijk?
FAIR staat voor Findable, Accessible, Interoperable en Reusable. Vier simpele woorden die een enorme impact hebben. Het concept werd in 2016 gepubliceerd in het tijdschrift Scientific Data en is sindsdien uitgegroeid tot de gouden standaard voor data management in de wetenschap.
Maar wat betekent het echt in de praktijk? Data moet te vinden zijn.
Findable: vindbaar en herkenbaar
Niet alleen voor jezelf over twee jaar, maar voor iedereen. Dat betekent rijke metadata, unieke identifiers zoals DOI's, en opschrijving in doorzoekbare repositories.
Accessible: toegankelijk wanneer je het nodig hebt
Denk aan platforms zoals DANS, Zenodo of Figshare. Als je data niet vindbaar is, bestaat het eigenlijk niet voor de wetenschappelijke gemeenschap. Vindbaar is niet genoeg.
Data moet ook toegankelijk zijn. Dat betekent duidelijke toegangsprotocollen, zelfs als de data zelf om goede redenen beperkt is.
Interoperable: spreek dezelfde taal
De metadata moet altijd beschikbaar blijven. En als er authenticatie nodig is, moet helder zijn hoe dat werkt. Geen doolhofen, geen e-mailtjes in het niets. Data moet combineerbaar zijn met andere datasets.
Dat vraagt om gestandaardiseerde formaten, gevocabularieerde termen en kwalitatieve referenties. Als jouw dataset niet "prat" met andere data, blijft het een eilandje.
Reusable: klaar voor het volgende onderzoek
En eilandjes leveren weinig inzicht op. Dit is waar het echt interessant wordt.
Data moet zo worden opgeslagen en gedocumenteerd dat anderen het kunnen hergebruiken. Heldere licenties, gedetailleerde provenance-informatie, en aanbevelingen uit de onderzoeksgemeenschap. Hergebruik is geen luxe. Het is efficiëntie. Het is vooruitgang.
De krachtige verbinding met reproduceerbaar onderzoek
Nu komt het belangrijkste. Het is daarbij cruciaal om te begrijpen wat het verschil is tussen FAIR data en open data.
Beide concepten zijn namelijk geen losse initiatieven, maar versterken elkaar. Sterker nog: zonder FAIR data is reproduceerbaar onderzoek vrijwel onmogelijk.
Wist je trouwens dat FAIR data zorgt voor meer citaties? Denk er eens over na. Om een onderzoek te reproduceren heb je de originele data nodig. Je hebt de code nodig.
Je hebt de exacte methodologie nodig. En je hebt context nodig over hoe en waarom beslissingen zijn genomen.
FAIR data zorgt ervoor dat al die bouwstenen aanwezig en bruikbaar zijn. Maar het werkt ook andersom. De eisen van reproduceerbaar onderzoek dwingen onderzoekers om hun data beter te organiseren, beter te documenteren en beter te delen.
Het creëert een positieve spiraal. Betere data leidt tot betere verificatie, wat leidt tot beter onderzoek.
Wat betekent dit voor Nederlandse onderzoekers?
Nederland loopt voorop. De VSNU heeft met het Plan S en het Open Science Programma Nederland een duidelijke koers uitgezet.
Het National Plan Open Science uit 2017 legde al vast dat Open Science de norm moet worden. En FAIR data is daar een essentieel onderdeel van. De Nederlandse universiteiten investeren in data stewards, research support teams en digitale infrastructuur. Organisaties zoals DANS (Data Archiving and Networked Services) bieden praktische ondersteuning bij het FAIR maken van onderzoeksdata.
En het GO FAIR initiatief verbindt partijen in een internationaal netwerk. Maar er is nog veel werk te doen.
Veel onderzoekers ervaren FAIR data nog als een last, niet als een kans.
De kloof tussen beleid en praktijk is reëel. En de beloningen in de wetenschappelijke carrièrepaden zijn nog niet altijd in lijn met Open Science principes.
Van theorie naar praktijk: concrete stappen
Goed nieuws: je hoeft niet alles tegelijk te doen. Hier zijn stappen die direct impact hebben. Begin met een Data Management Plan. De meeste subsidieverschrijvers vragen er inmiddels om. Maak het niet alleen voor de aanvraag, maar gebruik het als leidraad.
Tools zoals de DMPonline helpen je op weg. Kies een geschikte repository. Niet alles hoeft in dezelfde plek. Maar kies bewust.
Denk aan duurzaamheid, vindbaarheid en community-acceptatie. DANS is voor veel Nederlandse disciplines een logische keuze. Documenteer alles. Niet alleen de data, maar ook de context.
Waarom heb je deze variabele gekozen? Welke versie van de software heb je gebruikt? Wat zijn de beperkingen?
Een goed README-bestand is goud waard. Gebruik persistente identifiers. DOI's voor datasets, ORCID voor onderzoekers, en ROR voor organisaties.
Deze kleine dingen maken het verschil tussen data die verdwijnt en data die blijft bestaan. Deel je code. Platforms zoals GitHub of GitLab zijn standaard geworden. Maak je code open, voeg een licentie toe, en zorg voor documentatie. Reproduceerbaar onderzoek zonder open code is halverwege.
De toekomst is samenwerking
FAIR data en reproduceerbaar onderzoek zijn geen eindbestemming. Ze zijn een reis.
Een reis die we samen moeten maken. Onderzoekers, bibliotheken, databeheerders, subsidieverschrijvers en uitgevers. Iedereen heeft een rol.
De technologie is er. De kennis is er. De infrastructuur groeit.
Wat nu nodig is, is een cultuurverschuiving. Een cultuur waarin delen de norm is. Waarin transparantie wordt gewaardeerd.
Waarin reproduceerbaarheid geen bijzaak is, maar de kern van goed onderzoek. De verbinding tussen FAIR data en reproduceerbaar onderzoek is niet alleen belangrijk. Het is essentieel.
Voor de geloofwaardigheid van de wetenschap. Voor het vertrouwen van de samenleving.
En voor de snelheid waarmee we echte vooruitgang kunnen boeken. Dus de volgende keer dat je data aanmaakt, vraag jezelf af: kan iemand anders hiermee verder? Als het antwoord ja is, ben je op de goede weg.
Veelgestelde vragen
Wat zijn de FAIR-principes voor data?
FAIR staat voor Findable, Accessible, Interoperable en Reusable. Deze vier principes vormen de basis voor het beheren van wetenschappelijke data op een manier die het voor iedereen toegankelijk en bruikbaar maakt, waardoor de reproduceerbaarheid van onderzoek wordt bevorderd.
Wat betekent FAIR-data precies?
FAIR-data is een benadering van data management die erop gericht is dat wetenschappelijke data gemakkelijk te vinden, toegankelijk te zijn, met andere datasets te kunnen samenwerken en opnieuw te kunnen gebruiken. Het is een cruciale stap richting transparantie en reproduceerbaarheid in de wetenschap. Om je data 'fair' te maken, begin met het opslaan in een betrouwbaar data-archief of repositorium, zoals DANS, Zenodo of Figshare. Daarnaast is het essentieel om de data goed te documenteren en te coderen volgens gangbare standaarden, gebruik duurzame bestandsformaten en een duidelijke licentie toe te passen.
Hoe kan ik mijn data 'fair' maken?
Hoewel de vier FAIR-principes de kern vormen, is het belangrijk om ook te denken aan principes als rechtmatigheid, billijkheid en transparantie in dataverwerking. Deze ethische overwegingen zorgen ervoor dat data op een verantwoorde manier wordt gebruikt en dat de privacy van betrokkenen wordt beschermd.
Zijn er specifieke principes die verder gaan dan de vier FAIR-principes?
FAIR-data is essentieel omdat het de mogelijkheid biedt om onderzoek te reproduceren, fouten op te sporen en nieuwe inzichten te genereren.
Waarom is FAIR-data zo belangrijk voor de wetenschap?
Door data toegankelijk te maken, wordt de wetenschappelijke literatuur betrouwbaarder en wordt de kwaliteit van onderzoek verbeterd.