Stel je voor: het is drie jaar geleden dat je een experiment hebt uitgeerd.
▶Inhoudsopgave
Nu heb je die data weer nodig voor een nieuw artikel. Je opent de map en ziet honderd bestanden met namen als definitieve_versie_FINAL_v3.xlsx of data_test2.csv. Klinkt dat bekend? Geen paniek. Dit probleem is heel gewoon in de wetenschap, en het heeft één simpele oorzaak: geen goede bestandsnaamconventie. In dit artikel leg ik uit waarom die regels zo belangrijk zijn, hoe je ze slim aanpakt, en welke fouten je beter kunt vermijden. Want een goede bestandsnaam is geen luxe — het is basis.
Waarom bestandsnaamconventies ertoe doen
Onderzoeksdata is waardeloos als je het niet kunt vinden of begrijpen. En dat begint al bij de bestandsnaam.
- Verwarring: Welke versie is nou de juiste? Is resultaten_v2 echt nieuwer dan resultaten_def?
- Tijdverlies: Onderzoekers besteden gemiddeld 30% van hun tijd aan het zoeken naar data. Dat is tijd die je liever aan analyse besteedt.
- Reproduceerbaarheid: Als anderen jouw data niet kunnen begrijpen, kunnen ze je onderzoek niet herhalen. En dat is een probleem.
- Samenwerking: In teamonderzoek moet iedereen snappen wat er in een bestand zit — zonder dat jij het hoeft uit te leggen.
Een slordige naam lijkt onschuldig, maar zorgt voor grote problemen op de lange termijn. Denk aan: De FAIR-principes (Findable, Accessible, Interoperable, Reusable) zijn tegenwoordig de gouden standaard voor onderzoeksdata.
Een goede bestandsnaam draagt direct bij aan de ‘F’ en de ‘I’: vindbaar en uitwisselbaar. Kortom: als je serieus bent over Open Science, begin dan bij je bestandsnamen.
Wat maakt een bestandsnaam goed?
Een sterke bestandsnaam is kort, duidelijk en voorspelbaar. Geen kunstwerkje, maar een praktisch hulpmiddel.
1. Wees consistent — altijd
Hier zijn de belangrijkste regels: Kies een formaat en houd je eraan. Voor elk project, elk team, elk bestand.
2. Gebruik logische componenten
Als je begint met project_experiment_datum.csv, doe dat dan ook voor alle andere bestanden.
- Projectcode: Bijvoorbeeld ABC2023 of GROEN.
- Experiment of meting: Zoals blootstelling of groeitest.
- Variabele: Wat heb je gemeten? Temperatuur, pH, gewicht?
- Eenheid: °C, kg, mmol — voeg dit toe als het relevant is.
- Datum: Gebruik het formaat YYYYMMDD (bijv. 20231027). Dit zorgt ervoor dat bestanden automatisch op volgorde staan.
- Versie: v1, v2, of final. Maak het niet ingewikkeld.
Inconsistentie is de vijand van duidelijkheid. Een goede bestandsnaam bestaat uit kleine bouwstenen die samen een compleet plaatje geven. Denk aan: Voorbeeld van een goede naam: ABC2023_groeitest_temperatuur_C_20231027_v2.csv.
3. Vermijd spaties en speciale tekens
Alles erin, niets te veel. Gebruik underscores (_) om woorden te scheiden.
4. Geen afkortingen tenzij iedereen ze kent
Geen spaties, geen komma's, geen haakjes. Waarom? Omdat sommige systemen daar moeite mee hebben, vooral bij automatisering of command-line tools.
Houd het simpel: alleen letters, cijfers, underscores en punten. Temp is duidelijk, maar ExpGr1 misschien niet. Als je afkortingen gebruikt, leg ze dan vast in een README-bestand. Beter nog: schrijf het gewoon volledig uit.
5. Datumformaat: YYYYMMDD, altijd
Je toekomstige zelf zal je bedanken. Dit is geen voorstel — het is de standaard in de wetenschap. 20231027 is beter dan 27-10-2023 of okt27. Waarom?
Omdat het alfabetisch en chronologisch gesorteerd is. Geen verwarring over dag-maand of maand-dag.
Voorbeelden per bestandstype
Niet alle data is hetzelfde, dus je naamgeving kan variëren. Hier zijn tips voor veelgebruikte formaten:
CSV-bestanden
Gebruik de variabele en eenheid in de naam. Bijvoorbeeld: ABC2023_pH_meting_20231027_v1.csv. Zo weet je meteen wat erin zit. Door je onderzoeksbestanden slim te organiseren, voeg je eenvoudig locatie, datum en beschrijving toe. Bijvoorbeeld: ABC2023_monster_A1_20231027_100x.jpg.
Afbeeldingen (JPG, PNG, TIFF)
Handig als je honderden foto’s hebt. Gebruik het type document en versie. Bijvoorbeeld: ABC2023_protocol_extractie_v3.docx.
Documenten (PDF, DOCX)
Zo vind je altijd de laatste versie.
Tools die je helpen
Je hoeft dit niet alleen te doen. Er zijn handige tools om bestandsnamen te beheren:
- Git: Ideaal voor versiebeheer. Je kunt wijzigingen terugdraaien en zien wie wat heeft aangepast.
- Regex (Regular Expressions): Handig voor het automatisch hernoemen van veel bestanden tegelijk.
- Data catalogi: Sommige universiteiten gebruiken systemen zoals Dataverse of OSF, waar je metadata en bestandsnamen kunt koppelen.
Veel Nederlandse universiteiten hebben hun eigen richtlijnen. Kijk op de website van je instituut of er een standaard is.
De VSNU en DANS bieden ook waardevolle tips voor data management.
Conclusie: doe het nu, niet later
Een goede bestandsnaamconventie kost weinig tijd, maar bespaart je veel kopzorgen. Het is een kleine investering met grote impact: betere samenwerking, snellere analyse, en data die ook over vijf jaar nog bruikbaar is. Begin vandaag nog met het opstellen van regels voor je volgende project.
Schrijf ze vast in een README, deel ze met je team, en houd je eraan.
Want de beste tijd om een goede naamgeving te beginnen, is nu. De tweede beste tijd? Gisteren.