Hoe organiseer je jouw onderzoeksbestanden zodat anderen er iets mee kunnen

Stel je voor: je collega pakt jouw onderzoek over. Of je promovendus stopt.

▶Inhoudsopgave

Waarom bestandsorganisatie zo belangrijk is voor jouw onderzoek
Stap 1: Kies een logische mappenstructuur
Stap 2: Geef bestanden duidelijke en consistente namen
Stap 3: Documenteer alles in een README-bestand
Stap 4: Maak gebruik van metadata en data-documentatie
Stap 5: Kies het juiste bestandsformaat
Stap 6: Deel en bewaar je bestanden op een veilige plek
Begin vandaag — niet morgen

Of iemand anders wil jouw data hergebruiken voor een vervolgstudie. En dan? Dan ligt er een chaos aan bestanden op een harde schijf waar niemand iets mee kan. Geen structuur, geen uitleg, bestandsnamen als "FINAL_v3_definitief_WERKEND.xlsx". Klinkt dat bekend?

Het organiseren van onderzoeksbestanden is misschien niet het meest sexy onderdeel van wetenschap. Maar het is wel een van de belangrijkste.

Goede bestandsorganisatie maakt jouw onderzoek herhaalbaar, deelbaar en toekomstbestendig. En het scheurt je — en anderen — een hoop hoofdpijn.

Hier lees je hoe je dat aanpakt.

Waarom bestandsorganisatie zo belangrijk is voor jouw onderzoek

Onderzoek draait om vertrouwen. Als anderen jouw resultaten willen controleren of voortbouwen op je werk, moeten ze begrijpen wat er in jouw bestanden staat. Dat begint bij organisatie.

De FAIR-principes — Findable, Accessible, Interoperable, Reusable — zijn inmiddels de gouden standaard in de wetenschap.

Die principes vragen niet alleen om open data, maar ook om goed georganiseerde, leesbare bestanden. Als je onderzoeksdata niet te vinden of te begrijpen is, is het in de praktijk waardeloos.

Voor anderen, maar ook voor jezelf over twee jaar. En laten we het hebben over tijd: onderzoekers besteden gemiddeld maandelijks meer dan 15 uur aan het zoeken naar informatie en bestanden. Een goede mappenstructuur en duidelijke naamgeving kan daar een flink stuk van besparen.

Stap 1: Kies een logische mappenstructuur

Allereerst: zorg voor een heldere mapindeling. Niet alleen voor jezelf, maar voor iedereen die ooit met jouw bestanden aan de slag gaat.

Begin met een projectmap

Maak voor elk onderzoeksproject één hoofdmap aan. Geef die map een duidelijke naam, bijvoorbeeld het projectnummer of een korte projectomschrijving met het jaar. Bijvoorbeeld: 2024_EffectGroeneStad_Luchtkwaliteit.

Gebruik standaard submappen

Binnen die hoofdmap kun je submappen aanmaken voor de verschillende onderdelen van je onderzoek. Een veelgebruikte indeling is: De precieze mappenstructuur voor je onderzoeksprojecten mag je zelf kiezen, maar wees consistent. Als je een systeem kiest, houd het dan aan voor elk project. Tools zoals DMPonline helpen je bij het plannen van je data-organisatie vanaf het begin van je onderzoek.

Data — ruwe data, verwerkte data, analysebestanden
Documenten — protocollen, ethische goedkeuringen, vragenlijsten
Analyse — scripts, code, statistische output
Publicaties — manuscripten, figuren, tabellen
Administratie — correspondentie, afsprakennotities, subsidiedocumenten

Stap 2: Geef bestanden duidelijke en consistente namen

Bestandsnaamgeving klinkt saai, maar het is waar veel onderzoekers struikelen. Een goede bestandsnaam vertelt in één oogopslag wat er in het bestand zit, wanneer het is aangemaakt en wie het heeft gemaakt. Volg deze vuistregels: Voorbeeld van een goede bestandsnaam: 2024-03-15_Luchtkwaliteit_Rotterdam_Dataset_v2.csv

Wat maakt een goede bestandsnaam?

Gebruik geen spaties — vervang ze door underscores (_) of koppeltekens (-)
Voeg een datum toe in het formaat JJJJ-MM-DD (bijvoorbeeld 2024-03-15), zodat bestanden automatisch chronologisch gesorteerd worden
Wees specifiek — "interview_deelnemer03_transcript" is beter dan "gesprek3"
Vermijd vage termen als "nieuw", "definitief" of "laatste_versie"
Gebruik versienummers** als je bestanden herhaaldelijk aanpast: v1, v2, v3

Stap 3: Documenteer alles in een README-bestand

Dit is misschien wel de belangrijkste stap van allemaal. Maak een README-bestand aan in de hoofdmap van je project.

Wat zet je in een README-bestand?

Dat is een simpel tekstbestand waarin je uitlegt wat er in de map staat en hoe alles is georganiseerd. Een goed README-bestand bevat minimaal: Je kunt het README-bestand bijvoorbeeld maken in Markdown-formaat (.md), wat leesbaar is in elke tekstverwerker en ook goed werkt op platforms zoals GitHub of GitLab.

Projecttitel en een korte beschrijving van het onderzoek

Namen en contactgegevens van de onderzoekers

Datum van aanmaak en laatste update

Uitleg van de mappenstructuur — wat zit er in elke map?

Uitleg van bestandsnamen — welke afkortingen of codes gebruik je?

Informatie over dataverzameling — hoe, wanneer en waar zijn de data verzameld?

Licentiegegevens — onder welke voorwaarden mogen anderen de data gebruiken?

Stap 4: Maak gebruik van metadata en data-documentatie

Bestanden alleen zijn niet genoeg. Je hebt ook metadata nodig: gegevens over je gegevens.

Codeboeken en variabelelijsten

Metadata helpt anderen te begrijpen wat de data betekenen, hoe ze zijn verzameld en hoe ze gebruikt mogen worden. Voor kwantitatieve data is een codeboek onmisbaar.

Standaard metadata-schema's

Daarin beschrijf je elke variabele in je dataset: de naam, het meetniveau, de mogelijke waarden en eventuele ontbrekende waarden. Tools zoals SPSS, R of Python bieden mogelijkheden om metadata direct aan je dataset te koppelen. Afhankelijk van je vakgebied zijn er specifieke metadata-standaard. In de gezondheidswetenschappen gebruik je bijvoorbeeld vaak CDISC, in de geesteswetenschappen Dublin Core, en in de natuurwetenschappen DataCite. Check bij jouw onderzoeksinstituut of er richtlijnen zijn voor metadata in jouw discipline, en vergeet ook niet om e-mailcommunicatie en besluitvorming vast te leggen.

Stap 5: Kies het juiste bestandsformaat

Niet alle bestandsformaten zijn even geschikt voor langetermijnopslag. Sommige formaten zijn afhankelijk van specifieke software die over tien jaar misschien niet meer bestaat.

Liever open en gangbare formaten

Kies waar mogelijk voor open, gestandaardiseerde formaten: De DANS — Data Archiving and Networked Services — houdt een overzicht bij van aanbevolen bestandsformaten per discipline. Een heel handig naslagwerk als je twijfelt.

Tekst: .txt, .md of .pdf (niet .docx)

Tabellen: .csv (niet .xlsx)

Afbeeldingen: .tiff of .png (niet .psd)

Statistiek: bewaar zowel het script als de ruwe data, niet alleen de output

Stap 6: Deel en bewaar je bestanden op een veilige plek

Organiseren is één ding, maar je bestanden ook veilig bewaarbaar en deelbaar maken is minstens zo belangrijk.

Opslag en back-up

Volg de 3-2-1-regel: bewaar je data op minimaal 3 verschillende plekken, op minimaal 2 verschillende soorten opslagmedia, waarvan er minimaal 1 op een externe locatie staat. Denk aan een combinatie van je werkcomputer, een externe harde schijf en een cloudopslagdienst.

Veel Nederlandse universiteiten bieden onderzoekers toegang tot Research Drive of Yoda (Your Data) voor veilige opslag en deling van onderzoeksdata. Check bij jouw instituut wat de mogelijkheden zijn. Als je data openbaar wil delen, gebruik dan een trusted repository. Dat is een erkende opslagplek voor onderzoeksdata, waar je data een DOI (Digital Object Identifier) krijgt.

Data delen via een repository

Dat maakt je data vindbaar en citeerbaar. Bekende repositories zijn 4TU.ResearchData, DANS EASY en Zenodo.

Blijf op de hoogte
Ontvang de beste tips over FAIR data voor onderzoekers direct in je inbox.
Geen spam. Altijd afmelden mogelijk.
✓Aangemeld! Je ontvangt binnenkort een bevestiging.
Begin vandaag — niet morgen

De beste tijd om je onderzoeksbestanden te organiseren, is aan het begin van je project. De op een na beste tijd is nu. Een paar uur investeren in goede bestandsorganisatie bespaart je weken zoekwerk later — en maakt jouw onderzoek een stuk waardevoller voor anderen.

Begin klein: maak een mappenstructuur, noem je bestanden netjes en schrijf een README-bestand.

De rest volgt vanzelf. Belofte.

Hoe organiseer je jouw onderzoeksbestanden zodat anderen er iets mee kunnen

Waarom bestandsorganisatie zo belangrijk is voor jouw onderzoek

Stap 1: Kies een logische mappenstructuur

Begin met een projectmap

Gebruik standaard submappen

Stap 2: Geef bestanden duidelijke en consistente namen

Wat maakt een goede bestandsnaam?

Stap 3: Documenteer alles in een README-bestand

Wat zet je in een README-bestand?

Stap 4: Maak gebruik van metadata en data-documentatie

Codeboeken en variabelelijsten

Standaard metadata-schema's

Stap 5: Kies het juiste bestandsformaat

Liever open en gangbare formaten

Stap 6: Deel en bewaar je bestanden op een veilige plek

Opslag en back-up

Data delen via een repository

Ontvang de beste tips over FAIR data voor onderzoekers direct in je inbox.

Begin vandaag — niet morgen

Meer over Onderzoeksdata organiseren en documenteren