FAIR data voor promovendi: wat je vanaf dag één moet bijhouden

Je begint net aan je promotieonderzoek. Je hebt een onderwerp, een supervisor, en waarschijnlijk een beetje stress over de jaren die komen gaan.

▶Inhoudsopgave

Waarom FAIR data al vanaf dag één ertoe doet
De vier FAIR-principes in de praktijk
De tools die je echt nodig hebt
De grootste fout die promovendi maken
Veelgestelde vragen

Maar er is één ding dat je nu al kunt doen om jezelf later een hoop kopzorgen te besparen: je onderzoeksdata goed organiseren.

Niet over drie jaar, maar vanaf vandaag. Want FAIR data is geen buzzwoord dat je even kunt negeren. Het is de basis van betrouwbaar, herbruikbaar en toekomstbestendig onderzoek.

FAIR staat voor Findable, Accessible, Interoperable en Reusable. Klinkt abstract? Dat is het ook, totdat je het in de praktijk ziet werken. In dit artikel lees je precies wat je als promovendus moet bijhouden, waarom het ertoe doet, en hoe je het gewoon in je dagelijkse werk kunt verwerken.

Waarom FAIR data al vanaf dag één ertoe doet

Stel je voor: je bent anderhalf jaar bezig met je onderzoek en je legevragenbevestiging komt niet meer goed overeen met je dataset. Of er komt een nieuwe promovendus in je project die jouw bestanden moet begrijpen.

Of je supervisor vraagt om een specifieke analyse die je al eens hebt gedaan, maar je kunt de code niet meer terugvinden.

Dit soort situaties komen vaker voor dan je denkt. Uit onderzoek van de DANS Data Station blijkt dat een groot deel van onderzoeksdata na afloop van een project moeilijk of niet meer te hergebruiken is. Niet omdat de data slecht is, maar omdat de context ontbreekt.

Metadata, versiebeheer, documentatie — het lijkt saai, maar het maakt het verschil tussen data die waarde heeft en data die op een harde schijf vergaart. Daarnaast steeds meer financierders, zoals NWO en de Europese Commissie, eisen dat onderzoeksdata FAIR zijn.

Als je subsidie aanvraagt, moet je vaak al een Data Management Plan (DMP) indienen. En die moet je dan ook écht kunnen naleven.

De vier FAIR-principes in de praktijk

Findable: vindbaar voor jezelf én anderen

Data is alleen nuttig als je het terug kunt vinden. Dat klinkt logisch, maar hoeveel bestanden heb je al op je laptop staan met namen als "definitieve_versie_FINAL_v3.xlsx"?

Begin met een duidelijke mappenstructuur. Denk aan hoofdmappen per experiment of dataset, met submappen voor ruwe data, verwerkte data, scripts en output. Gebruik een consistente naamgevingsconventie: bijvoorbeeld "2025-06-15_experiment1_versie01.csv". De datum vooraan zorgt ervoor dat bestanden automatisch chronologisch gesorteerd staan.

Daarnaast kun je je data registreren in een zoals Zenodo of Figshare. Daar krijgt je dataset een DOI (Digital Object Identifier), waardoor anderen je data kunnen vinden en citeren.

Accessible: toegankelijk, ook over vijf jaar

Veel universiteiten bieden ook een eigen data repository aan, bijvoorbeeld via DANS of de Research Data Service van je eigen instelling.

Je data moet toegankelijk zijn, niet alleen voor jezelf, maar ook voor anderen die er later mee aan de slag willen. Dat betekent dat je moet nadenken over waar je data opslaat en hoe je toegang regelt. Gebruik geen USB-stick of persoonlijke Google Drive als primaire opslag.

De meeste Nederlandse universiteiten bieden onderzoeksopslag aan via bijvoorbeeld YODLO, ResearchDrive of SURFfilesender. Deze diensten zijn veiliger, beter beheerd en voldoen aan de eisen van de AVG.

Interoperable: zorg dat systemen en mensen elkaar begrijpen

Let ook op de toegangsstatus. Niet alles hoeft openbaar te zijn. Sommige data bevat bijvoorbeeld persoonsgegevens of is vertrouwelijk.

FAIR betekent niet "open", maar wel "toegankelijk onder duidelijke voorwaarden". Documenteer daarom altijd wie toegang heeft en onder welke condities.

Interoperabiliteit gaat over het formaat en de taal van je data. Als je data in een formaat opslaat dat niemand anders kan lezen, is het niet interoperabel.

Reusable: maak je data klaar voor hergebruik

Kies voor open, gestandaardiseerde formaten waar mogelijk. In plaats van Excel (.xlsx), overwegen om data op te slaan als CSV of TSV.

Voor statistische analyses kun je werken met R of Python, waarvan de scripts zelf al documentatie vormen. Vermijd proprietary formaten tenzij er geen alternatief is. Gebruik ook gestandaardiseerde terminologie en vocabularia. Als je bijvoorbeeld werkt met medische data, kijk dan of er een bestaande standaard is zoals SNOMED CT of MeSH-termen.

Dit maakt het makkelijker om je data te combineren met andere datasets en verhoogt de herbruikbaarheid aanzienlijk. Vergeet niet dat een goede bestandsnaam het begin is van FAIR data.

Data is alleen echt herbruikbaar als iemand anders er mee aan de slag kan, zonder jou te hoeven bellen.

Documenteer daarom alles. Schrijf een README-bestand bij elke dataset waarin je beschrijft wat de data bevat, hoe het is verzameld, welke variabelen er zijn en wat de eenheden zijn. Leg uit wat je hebt gedaan tijdens de dataverwerking: welke stappen, welke software, welke versie.

Gebruik ook een datamanagementtool of labjournaal. Elektronische labjournalen zoals RSpace of eLabFTW helpen je om je werkprocessen gestructureerd bij te houden. En maak gebruik van versiebeheer voor code: GitHub of GitLab zijn hiervoor uitkomst, en veel universiteiten bieden een eigen GitLab-instantie aan.

De tools die je echt nodig hebt

Je hebt geen dure software nodig om FAIR te werken. Een paar goede tools volstaan: OSF (Open Science Framework) — gratis platform om je project te organiseren, data te delen en samen te werken. Gebruik onze handige checklist voor een vliegende start. Ideaal voor promovendi.

GitHub of GitLab — voor versiebeheer van code en scripts. Ook handig voor samenwerking.

Zenodo of DANS — voor het publiceren en archiveren van datasets met een DOI. LibreOffice of R/Python — voor data-analyse in open formaten, zodat je niet afhankelijk bent van dure licenties. En niet te vergeten: de Data Management Plan-template van je universiteit.

Vul die in aan het begin van je traject en actualiseer hem regelmatig. Het is geen document dat je één keer invult en vergeten bent.

De grootste fout die promovendi maken

De grootste fout? Wachten. Veel promovendi denken: "Ik regel het later, als de data compleet is." Maar later betekent vaak: nooit.

Of het betekent: in paniek, vlak voor je verdediging, wanneer je al geen idee meer hebt waarom je bepaalde keuzes hebt gemaakt. Begin vandaag. Maak een mappenstructuur. Schrijf een README. Kies een opslagplek. Het kost je vandaag een uur, en bespaart je over twee jaar een maand.

FAIR data is geen extra last — het is een manier van werken die je onderzoek beter, sneller en betrouwbaarder maakt. En als je er niet uitkomt: vraag het aan je bibliotheek. De meeste Nederlandse universiteiten hebben een Research Data Helpdesk die je gratis helpt met data management, DMP's en FAIR-principes. Voorkom de meest gemaakte fouten bij het FAIR maken van je data; ze bestaan echt, en ze staan te springen om je te helpen.

Veelgestelde vragen

Wat houdt het principe van ‘Findable’ FAIR data precies in?

Het principe ‘Findable’ betekent dat je data gemakkelijk kunt terugvinden, zowel voor jezelf als voor anderen.

Waarom is het belangrijk om vanaf het begin aan FAIR data te denken tijdens je promotieonderzoek?

Begin met een duidelijke mappenstructuur, gebruik consistente bestandsnamen met datum (bijvoorbeeld “2024-01-15_experiment1_versie01.csv”) en registreer je data in een openbare repository zoals Zenodo of Figshare, waar een DOI (Digital Object Identifier) zorgt voor een permanente link. Het is cruciaal om al vanaf het begin aan FAIR data te denken, omdat je anders later kunt merken dat je data moeilijk te hergebruiken is.

Wat zijn de gevolgen van het niet naleven van FAIR data eisen, bijvoorbeeld voor subsidieaanvragen?

Denk bijvoorbeeld aan het feit dat je supervisor later een specifieke analyse nodig heeft die je niet meer kunt terugvinden, of dat een andere promovendus moeite heeft met het begrijpen van je dataset. Steeds meer financierders, zoals NWO en de Europese Commissie, eisen dat onderzoeksdata FAIR zijn. Daarom is het essentieel om een Data Management Plan (DMP) te hebben en deze daadwerkelijk te kunnen naleven, zoals vereist in subsidieaanvragen. Een goed DMP zorgt ervoor dat je data toegankelijk en bruikbaar blijft.

Wat is een Data Management Plan (DMP) en waarom is het belangrijk?

Een Data Management Plan (DMP) is een plan waarin je beschrijft hoe je je onderzoeksdata gaat organiseren, archiveren en delen.

Waar kan ik mijn onderzoeksdata veilig opslaan en delen?

Het is belangrijk omdat het financierders laat zien dat je je bewust bent van de FAIR-principes en dat je je data op een verantwoorde manier gaat beheren, zodat deze ook in de toekomst bruikbaar blijft. Er zijn verschillende opties om je onderzoeksdata veilig op te slaan en te delen, zoals je eigen universiteit (via DANS of de Research Data Service) of openbare repositories zoals Zenodo of Figshare. Deze repositories bieden vaak ook een DOI (Digital Object Identifier) voor je dataset, waardoor deze gemakkelijk te vinden en te citeren is.