Stel je voor: je collega pakt jouw onderzoek over. Of je promovendus stopt.
▶Inhoudsopgave
- Waarom bestandsorganisatie zo belangrijk is voor jouw onderzoek
- Stap 1: Kies een logische mappenstructuur
- Stap 2: Geef bestanden duidelijke en consistente namen
- Stap 3: Documenteer alles in een README-bestand
- Stap 4: Maak gebruik van metadata en data-documentatie
- Stap 5: Kies het juiste bestandsformaat
- Stap 6: Deel en bewaar je bestanden op een veilige plek
- Begin vandaag — niet morgen
Of iemand anders wil jouw data hergebruiken voor een vervolgstudie. En dan? Dan ligt er een chaos aan bestanden op een harde schijf waar niemand iets mee kan. Geen structuur, geen uitleg, bestandsnamen als "FINAL_v3_definitief_WERKEND.xlsx". Klinkt dat bekend?
Het organiseren van onderzoeksbestanden is misschien niet het meest sexy onderdeel van wetenschap. Maar het is wel een van de belangrijkste.
Goede bestandsorganisatie maakt jouw onderzoek herhaalbaar, deelbaar en toekomstbestendig. En het scheurt je — en anderen — een hoop hoofdpijn.
Hier lees je hoe je dat aanpakt.
Waarom bestandsorganisatie zo belangrijk is voor jouw onderzoek
Onderzoek draait om vertrouwen. Als anderen jouw resultaten willen controleren of voortbouwen op je werk, moeten ze begrijpen wat er in jouw bestanden staat. Dat begint bij organisatie.
De FAIR-principes — Findable, Accessible, Interoperable, Reusable — zijn inmiddels de gouden standaard in de wetenschap.
Die principes vragen niet alleen om open data, maar ook om goed georganiseerde, leesbare bestanden. Als je onderzoeksdata niet te vinden of te begrijpen is, is het in de praktijk waardeloos.
Voor anderen, maar ook voor jezelf over twee jaar. En laten we het hebben over tijd: onderzoekers besteden gemiddeld maandelijks meer dan 15 uur aan het zoeken naar informatie en bestanden. Een goede mappenstructuur en duidelijke naamgeving kan daar een flink stuk van besparen.
Stap 1: Kies een logische mappenstructuur
Allereerst: zorg voor een heldere mapindeling. Niet alleen voor jezelf, maar voor iedereen die ooit met jouw bestanden aan de slag gaat.
Begin met een projectmap
Maak voor elk onderzoeksproject één hoofdmap aan. Geef die map een duidelijke naam, bijvoorbeeld het projectnummer of een korte projectomschrijving met het jaar. Bijvoorbeeld: 2024_EffectGroeneStad_Luchtkwaliteit.
Gebruik standaard submappen
Binnen die hoofdmap kun je submappen aanmaken voor de verschillende onderdelen van je onderzoek. Een veelgebruikte indeling is: De precieze mappenstructuur voor je onderzoeksprojecten mag je zelf kiezen, maar wees consistent. Als je een systeem kiest, houd het dan aan voor elk project. Tools zoals DMPonline helpen je bij het plannen van je data-organisatie vanaf het begin van je onderzoek.
- Data — ruwe data, verwerkte data, analysebestanden
- Documenten — protocollen, ethische goedkeuringen, vragenlijsten
- Analyse — scripts, code, statistische output
- Publicaties — manuscripten, figuren, tabellen
- Administratie — correspondentie, afsprakennotities, subsidiedocumenten
Stap 2: Geef bestanden duidelijke en consistente namen
Bestandsnaamgeving klinkt saai, maar het is waar veel onderzoekers struikelen. Een goede bestandsnaam vertelt in één oogopslag wat er in het bestand zit, wanneer het is aangemaakt en wie het heeft gemaakt. Volg deze vuistregels: Voorbeeld van een goede bestandsnaam: 2024-03-15_Luchtkwaliteit_Rotterdam_Dataset_v2.csv
Wat maakt een goede bestandsnaam?
- Gebruik geen spaties — vervang ze door underscores (_) of koppeltekens (-)
- Voeg een datum toe in het formaat JJJJ-MM-DD (bijvoorbeeld 2024-03-15), zodat bestanden automatisch chronologisch gesorteerd worden
- Wees specifiek — "interview_deelnemer03_transcript" is beter dan "gesprek3"
- Vermijd vage termen als "nieuw", "definitief" of "laatste_versie"
- Gebruik versienummers** als je bestanden herhaaldelijk aanpast: v1, v2, v3
Stap 3: Documenteer alles in een README-bestand
Dit is misschien wel de belangrijkste stap van allemaal. Maak een README-bestand aan in de hoofdmap van je project.
Wat zet je in een README-bestand?
Dat is een simpel tekstbestand waarin je uitlegt wat er in de map staat en hoe alles is georganiseerd. Een goed README-bestand bevat minimaal: Je kunt het README-bestand bijvoorbeeld maken in Markdown-formaat (.md), wat leesbaar is in elke tekstverwerker en ook goed werkt op platforms zoals GitHub of GitLab.
- Projecttitel en een korte beschrijving van het onderzoek
- Namen en contactgegevens van de onderzoekers
- Datum van aanmaak en laatste update
- Uitleg van de mappenstructuur — wat zit er in elke map?
- Uitleg van bestandsnamen — welke afkortingen of codes gebruik je?
- Informatie over dataverzameling — hoe, wanneer en waar zijn de data verzameld?
- Licentiegegevens — onder welke voorwaarden mogen anderen de data gebruiken?
Stap 4: Maak gebruik van metadata en data-documentatie
Bestanden alleen zijn niet genoeg. Je hebt ook metadata nodig: gegevens over je gegevens.
Codeboeken en variabelelijsten
Metadata helpt anderen te begrijpen wat de data betekenen, hoe ze zijn verzameld en hoe ze gebruikt mogen worden. Voor kwantitatieve data is een codeboek onmisbaar.
Standaard metadata-schema's
Daarin beschrijf je elke variabele in je dataset: de naam, het meetniveau, de mogelijke waarden en eventuele ontbrekende waarden. Tools zoals SPSS, R of Python bieden mogelijkheden om metadata direct aan je dataset te koppelen. Afhankelijk van je vakgebied zijn er specifieke metadata-standaard. In de gezondheidswetenschappen gebruik je bijvoorbeeld vaak CDISC, in de geesteswetenschappen Dublin Core, en in de natuurwetenschappen DataCite. Check bij jouw onderzoeksinstituut of er richtlijnen zijn voor metadata in jouw discipline, en vergeet ook niet om e-mailcommunicatie en besluitvorming vast te leggen.
Stap 5: Kies het juiste bestandsformaat
Niet alle bestandsformaten zijn even geschikt voor langetermijnopslag. Sommige formaten zijn afhankelijk van specifieke software die over tien jaar misschien niet meer bestaat.
Liever open en gangbare formaten
Kies waar mogelijk voor open, gestandaardiseerde formaten: De DANS — Data Archiving and Networked Services — houdt een overzicht bij van aanbevolen bestandsformaten per discipline. Een heel handig naslagwerk als je twijfelt.
- Tekst: .txt, .md of .pdf (niet .docx)
- Tabellen: .csv (niet .xlsx)
- Afbeeldingen: .tiff of .png (niet .psd)
- Statistiek: bewaar zowel het script als de ruwe data, niet alleen de output
Stap 6: Deel en bewaar je bestanden op een veilige plek
Organiseren is één ding, maar je bestanden ook veilig bewaarbaar en deelbaar maken is minstens zo belangrijk.
Opslag en back-up
Volg de 3-2-1-regel: bewaar je data op minimaal 3 verschillende plekken, op minimaal 2 verschillende soorten opslagmedia, waarvan er minimaal 1 op een externe locatie staat. Denk aan een combinatie van je werkcomputer, een externe harde schijf en een cloudopslagdienst.
Veel Nederlandse universiteiten bieden onderzoekers toegang tot Research Drive of Yoda (Your Data) voor veilige opslag en deling van onderzoeksdata. Check bij jouw instituut wat de mogelijkheden zijn. Als je data openbaar wil delen, gebruik dan een trusted repository. Dat is een erkende opslagplek voor onderzoeksdata, waar je data een DOI (Digital Object Identifier) krijgt.
Data delen via een repository
Dat maakt je data vindbaar en citeerbaar. Bekende repositories zijn 4TU.ResearchData, DANS EASY en Zenodo.
Begin vandaag — niet morgen
De beste tijd om je onderzoeksbestanden te organiseren, is aan het begin van je project. De op een na beste tijd is nu. Een paar uur investeren in goede bestandsorganisatie bespaart je weken zoekwerk later — en maakt jouw onderzoek een stuk waardevoller voor anderen.
Begin klein: maak een mappenstructuur, noem je bestanden netjes en schrijf een README-bestand.
De rest volgt vanzelf. Belofte.