Stel je voor: je pakt een onderzoeksproject op dat twee jaar geleden is afgerond.
▶Inhoudsopgave
Je opvolger vraagt om de ruwe data, de analysebestanden en de definitieve versie van het artikel. En jij? Jij kijkt naar een chaos van bestanden met namen als definitief_v3_ACTUEEL_FINAL.xlsx. Klinkt bekend? Dan is het tijd om eindelijk één keer een mappenstructuur op te zetten die écht werkt. Geen ingewikkelde theorie, maar een systeem dat je collega's ook begrijpen. Laten we beginnen.
Waarom een standaard mappenstructuur zo belangrijk is
Onderzoeksdata is alleen waardevol als je het terug kunt vinden, begrijpt en kunt delen.
Dat klinkt logisch, maar in de praktijk is het een van de grootste struikelblokken in onderzoek. Volgens de FAIR-principes moet data Findable, Accessible, Interoperable en Reusable zijn. En dat begint niet met een ingewikkelde databasemanager.
Het begint met je mappenstructuur. Een goede mappenstructuur zorgt ervoor dat:
- Je binnen seconden vindt wat je zoekt, ook maanden later.
- Je collega's of opvolgers zonder uitleg door je bestanden kunnen navigeren.
- Je voldoet aan de eisen van onderzoeksfinanciers en instituten rond data management.
- Je fouten voorkomt, zoals het per ongeluk overschrijven van bestanden.
De Nederlandse universiteiten en organisaties als de VSNU en DANS hebben hier al jarenlang aandacht voor.
Maar een standaard die écht breed wordt gebruikt? Die is er nog niet écht. Daarom hier: een structuur die je vandaag kunt toepassen.
De kern: vijf hoofdmappen die altijd werken
De basis is simpel. Elk onderzoeksproject begint met vijf hoofdmappen.
01_Projectadministratie
Niet tien, niet drie. Vijf. Hieronder zie je ze, met een korte uitleg per map. Hier komt alles dat met het beheer van het project te maken hebben: subsidieaanvragen, ethische goedkeuringen, projectplannen, correspondentie met de financier en meetingnotities.
Niet spannend, maar onmisbaar. Vooral als er ooit een audit komt of als je later wilt weten waarom je bepaalde beslissingen hebt genomen.
02_Dataverzameling
Alle ruwe, onbewerkte data komt hier. En dat is het sleutelwoord: onbewerkte.
De data zoals je die hebt ontvangen of gemeten, zonder enige bewerking. Denk aan surveyresultaten, labjournaalnotities, interviewopnames, sensordatasets. Deze map is read-only. Je wijzigt hier niets aan.
03_Dataverwerking
Zo heb je altijd een betrouwbaar startpunt. Dit is je werkplek.
Hier zet je de scripts, code, syntaxbestanden en tussentijdse datasets die ontstaan bij het opschonen en analyseren van je data. Door je onderzoeksbestanden slim te organiseren, gebruik je duidelijke bestandsnamen met versienummers of datums. Bijvoorbeeld: 2025-01-15_survey_opschonen_v2.R. Zo weet je altijd welke versie de meest recente is. De output van je onderzoek komt hier: tabellen, figuren, rapporten, manuscripten en presentaties.
04_Resultaten
Scheid tussen conceptversies en definitieve versies. Een simpele truc: gebruik een submap Concept en een submap Definitief.
Of werk met een duidelijke naamgevingsconventie waarin FINAL alleen echt de laatste versie is. Deze map is misschien wel de belangrijkste. Hier zet je je data management plan, codeboeken, README-bestanden en uitleg over hoe de data is verzameld en verwerkt.
05_Documentatie
Stel dat iemand anders over zes maanden je data opnieuw wil analyseren: zonder documentatie is dat bijna onmogelijk.
Met goede documentatie is het een peulenschil.
Naamgeving: de onderschatte gamechanger
Een goede mappenstructuur zonder consistente bestandsnaamgeving is als een bibliotheek zonder planken.
Je hebt een systeem nodig, en die moet je volgen. Vanaf dag één. Drie gouden regels: En die FINAL en definitief in bestandsnamen? Stop daarmee. Serieus.
- Geen spaties in bestandsnamen. Gebruik underscores of koppeltekens. Spaties veroorzaken problemen bij het werken met scripts en commandoregel.
- Begin met een datum in het formaat YYYY-MM-DD. Zo staan je bestanden automatisch chronologisch gesorteerd.
- Wees beschrijven, niet creatief. Interview_deelneemer12_2025-03-10.wav is beter dan laatste_opname_def.wav.
Uit onderzoek van de Universiteit van Groningen en ervaringen van data librarians bij DANS blijkt dat gemiddeld 40 procent van de onderzoekers meerdere "definitieve" versies heeft. Gebruik versienummers of datums in plaats van woorden die beloven dat iets definitief is.
Versiebeheer: werk niet in je hoofd
Je kunt versiebeheer doen met bestandsnamen, maar voor grotere projecten is het beter om daadwerkelijk een versiebeheersysteem te gebruiken. Git, bijvoorbeeld, is populair in veel onderzoeksgroepen. Maar ook Google Drive, OneDrive of SharePoint bieden ingebouwde versiegeschiedenis.
Het belangrijkste is: kies iets en gebruik het consistent. Een versiebeheersysteem heeft alleen waarde als iedereen in het team het gebruikt. Leg het vast in je projectplan en zorg dat nieuwe teamleden het krijgen uitgelegd bij aanvang.
Wat te doen met oude projecten?
Veel onderzoekers beginnen enthousiast, maar vergeten de mappenstructuur weer zodra het project afloopt. Fout. De structuur is pas écht waardevol als je het ook na het project blijft gebruiken.
Maak bij afronding een archiefversie aan. Dat betekent: Veel Nederlandse universiteiten bieden hiervoor voorzieningen via hun IT-afdeling of bibliotheek.
- Verwijder tussentijdse bestanden die geen toegevoegde waarde meer hebben.
- Zorg dat de README in map 05_Documentatie compleet en actueel is.
- Controleer of de ruwe data intact en toegankelijk is.
- Archiveer de volledige projectmap op een veilige locatie, bijvoorbeeld de instituutsof faculteitsserver.
Check wat jouw instituut aanbiedt, en gebruik het.
Begin vandaag, niet morgen
Je hoeft niet alles perfect te krijgen vanaf het begin. Maar begin. Kies een structuur, leg het vast, en pas het aan waar nodig.
De vijf hoofdmappen uit dit artikel zijn een solide startpunt. Ze werken voor kwalitatief onderzoek, kwantitatief onderzoek, en alles ertussenin.
En het mooiste? Als je eenmaal gewend bent aan een duidelijke structuur, wil je nooit meer terug. Je tijd is te kostbaar om te besteden aan het zoeken naar bestanden die je zelf hebt vernoemd als dit_is_het_wel_ja.xlsx.
Open Science begint niet met ingewikkelde technologie. Het begint met orde op zaken. En die orde begint met vijf mappen.