Je moet een Data Management Plan schrijven. Grote kans dat je even fronst. “Wat moet ik nou precies invullen bij datatypes?” Geen paniek. Dit is geen technisch document voor informatici.
▶Inhoudsopgave
- Wat is een DMP eigenlijk, en waarom bestaat het?
- Waarom je datatypen goed moet beschrijven
- Hoe beschrijf je datatypen zonder in technisch jargon te verzanden?
- Praktische tips om het simpel én sterk te houden
- Voorbeeld: hoe ziet een goede datatypesectie eruit?
- Laatste woord: schrijf voor mensen, niet voor machines
Het is een helder verhaal voor mensen die willen weten wat voor data je verzamelt, hoe je ermee omgaat, en waarom dat belangrijk is.
En ja, je mag gewoon menselijk blijven terwijl je dat doet.
Wat is een DMP eigenlijk, en waarom bestaat het?
Een Data Management Plan — kortweg DMP — is een document waarin je beschrijft hoe je met je onderzoeksdata omgaat. Vanaf het moment dat je begint tot lang nadat het project is afgerond. Het gaat over opslag, beschrijving, kwaliteitscontrole, toegang en archivering.
Veel onderzoeksfinanciers vragen terecht om een DMP. Maar eigenlijk is het gewoon goed voor jezelf.
Het dwingt je na te denken over wat je verzamelt, waarom, en wat je ermee gaat doen. En dat maakt je onderzoek beter herbruikbaar, transparant en betrouwbaar.
Organisaties zoals de VSNU en NWO stimuleren al jaren het gebruik van DMPs als onderdeel van Open Science. Dus als je er aan begint, ben je niet alleen verplicht — je bent ook gewoon vooruitstrevend.
Waarom je datatypen goed moet beschrijven
Stel: iemand anders wil jouw onderzoek herhalen. Of combineren met eigen data.
Of gewoon begrijpen hoe je tot je conclusies kwam. Dan is het handig als die persoon snapt wat voor data je hebt gebruikt. Door je datatypen duidelijk te omschrijven:
- Borg je de kwaliteit van je onderzoek.
- Maak je herhaalbaarheid mogelijk.
- Laat je zien dat je verantwoordelijk omgaat met data.
En het mooie? Je hoeft daarvoor geen programmeur te zijn.
Gewoon helder denken en helder schrijven.
Hoe beschrijf je datatypen zonder in technisch jargon te verzanden?
De sleutel is simpel: praat over wat je doet, niet over hoe je het doet met code of systemen. Gebruik alledaagse taal. Denk eraan dat je lezer misschien geen statisticus is, maar wel moet begrijpen waar je mee bezig bent.
Vermijd termen zoals “longitudinale multilevel datasets” of “geospatial raster layers”. Zeg in plaats daarvan: “We hebben meetwaarden van 500 deelnemers over drie jaar verzameld” of “We gebruiken satellietbeelden om landgebruik in kaart te brengen.” Om overzicht te houden, kun je je data groeperen in drie logische groepen, wat ook essentieel is als je een data management plan voor NWO wilt schrijven:
Drie categorieën om je data in te ordenen
Dit zijn de gegevens die direct gerelateerd zijn aan je onderzoeksvraag. Denk aan:
1. Onderzoeksdata — de kern van je werk
Beschrijf ze zoals je ze aan een collega zou uitleggen tijdens een koffiepauze. Bijvoorbeeld: “We interviewen 30 leraren over hun ervaringen met digitaal onderwijs. De interviews worden opgenomen en uitgeschreven.” Zonder context is data waardeloos.
- Numerieke data: meetwaarden, scores, percentages, sensorgegevens.
- Tekstuele data: interviews, vragenlijsten, notities, artikelen.
- Beeld- en geluidsdata: foto’s, video-opnamen, audio-interviews.
- Geografische data: GPS-coördinaten, kaarten, locatiegegevens.
- Biologische of medische data: bloedmonsters, genetische sequenties, scanresultaten.
Daarom documenteer je ook: Zeg bijvoorbeeld: “Alle analyses zijn uitgevoerd met R versie 4.3.2.
2. Ondersteunende documentatie — het huwelijkspapier van je data
Het volledige script is beschikbaar als bijlage.” Dat is helder, niet ingewikkeld. Soms vergeet je dat ook interne documenten belangrijk zijn: Deze hoeven niet in detail in je DMP, maar een korte vermelding over beveiliging helpt om het geheel compleet te maken.
- Onderzoeksprotocollen: hoe je precies te werk bent gegaan.
- Codeboeken: wat betekenen de variabelen in je dataset?
- Software-instellingen: welke tools hebt je gebruikt, en hoe waren die geconfigureerd?
- Analysecode: scripts of formules die je gebruikt hebt om resultaten te genereren.
3. Projectgerelateerde gegevens — de administratieve achterkant
- Tijdplanningen en mijlpalen.
- Communicatie met partners of deelnemers.
- Goedkeuringen van ethische commissies.
Praktische tips om het simpel én sterk te houden
Voordat je begint met schrijven, houd deze vijf punten in gedachten:
- Wees concreet, niet vaag. Niet: “We verzamelen wat data.” Maar: “We meten bloeddruk en hartslag van 200 patiënten tijdens drie sessies van 45 minuten.”
- Noem het formaat alleen als het relevant is. “De afbeeldingen worden opgeslagen als TIFF van 20 MB per stuk” — alleen als dat echt uitmaakt voor opslag of hergebruik.
- Denk aan FAIR-principes. Zorg ervoor dat je data Findable, Accessible, Interoperable en Reusable is. Maar zeg gewoon: “We delen ons dataset via 4TU.ResearchData onder een CC BY-licentie.” Dat zegt meer dan een technische uitleg.
- Gebruik voorbeelden uit je eigen veld. Een historicus beschrijft data anders dan een neuroloog — en dat is prima. Pas taal aan aan je publiek.
- Herzie je DMP regelmatig. Het is geen einddocument. Het groeit mee met je project.
Voorbeeld: hoe ziet een goede datatypesectie eruit?
Laten we eens kijken naar een realistisch fragment uit een DMP: Datatypes
In dit project verzamelen we de volgende soorten data: Kwaliteitsborging: Alle metingen worden dubbel ingevoerd. Interviewtranscripties worden gecontroleerd door een tweede onderzoeker.
Video-opnamen worden beoordeeld op helderheid en volledigheid. Toegankelijkheid: Na afloop van het project worden alle anonieme data gepubliceerd via DANS EASY onder een CC BY 4.0-licentie.
- Numerieke data: fysiologische metingen (hartslag, zuurstofgehalte) van 150 atleten tijdens trainingen. Opgeslagen in CSV-bestanden.
- Tekstuele data: transcripties van semi-gestructureerde interviews met coaches. Opgeslagen als Word-documenten.
- Video-opnamen: observaties van trainingssessies. Opgeslagen in MP4-formaat.
- Protocol: gedetailleerde beschrijving van de meetprocedure. Opgeslagen als PDF.
Zie? Geen technisch gewauwel. Gewoon helder, compleet en menselijk.
Laatste woord: schrijf voor mensen, niet voor machines
Een DMP is geen bureaucratisch formulier, maar een communicatiemiddel. Je wilt dat iedereen — van subsidieverlener tot medeonderzoeker — snapt wat je doet met je data.
Dus als je twijfelt: lees je tekst hardop voor. Klinkt het alsof je het aan een slimme vriend vertelt?
Dan zit je goed. Klinkt het als een handleiding voor een supercomputer?
Dan schrap je wat techniek en voeg je wat helderheid toe. Want uiteindelijk gaat het erom dat je data leeft — niet alleen in mappen en servers, maar ook in het verhaal dat je eromheen vertelt.