Onderzoeksdata organiseren en documenteren

Codebooks schrijven voor kwalitatief en kwantitatief onderzoek: een praktische aanpak

Lieke de Vries Lieke de Vries
· · 5 min leestijd

Stel je voor: je collega pikt jouw dataset op en heeft geen idee wat de variabelen betekenen. Of je promotor vraagt om je kwalitatieve codes, maar je codeboek is een rommeltje aantekeningen in de marge. Klinkt herkenbaar?

Inhoudsopgave
  1. Wat is een codebook precies en waarom is het zo belangrijk?
  2. Codebook voor kwantitatief onderzoek: structuur en voorbeelden
  3. Codebook voor kwalitatief onderzoek: codes, thema's en beslissingen
  4. Praktische tips voor een strak codebook
  5. Codebooks en Open Science: meer dan een vereiste

Dan is het hoog tijd om écht goed aan de slag te gaan met codebooks schrijven. Geen gedoe, gewoon helder en praktisch. Een codebook is in essentie de handleiding bij jouw onderzoeksdata.

Het document waarin je vastlegt wat elke variabele, elke code en elke waarde betekent.

Of je nu werkt met diepe interviews of met een dataset van duizenden respondenten, zonder een goed codebook ben je data op termijn waardeloos. En laten we eerlijk zijn: niemand wil over zes maanden zelf nog uitzoeken wat "var_042" nou eigenlijk moest voorstellen.

Wat is een codebook precies en waarom is het zo belangrijk?

Een codebook, soms ook codeboek of datadocumentatie genoemd, is een gestructureerd document dat beschrijft hoe je data is opgebouwd, gecodeerd en geïnterpreteerd.

Het bevat minimaal de namen van variabelen, hun labels, mogelijke waarden en de betekenis van die waarden. Maar een echt goed codebook gaat verder: het legt ook de meetniveaus vast, beschrijft missings en noteert beslissingen die je tijdens het coderen hebt genomen. Waarom is dit zo cruciaal?

Omdat het de ruggengraat vormt van reproduceerbaar onderzoek. De FAIR-principes, die binnen Open Science centraal staan, vragen er expliciet om dat data vindbaar, toegankelijk, interoperabel en herbruikbaar is.

Een codebook is daarvoor onmisbaar. Zonder documentatie kan niemand, jijzelf incluig, jouw data begrijpen of hergebruiken.

Codebook voor kwantitatief onderzoek: structuur en voorbeelden

Bij kwantitatief onderzoek draait een codebook om variabelen. Denk aan surveydata, experimentele meetinstrumenten of secundaire datasets.

De basiscomponenten

Een solide kwantitatief codebook bevat voor elke variabele de volgende elementen. Ten eerste: de variabelenaam. Dit is de korte aanduiding die in je dataset verschijnt, bijvoorbeeld "leeftijd" of "edu_niveau".

Houd deze kort en consistent. Geen spaties, geen speciale tekens.

Ten tweede: het variabelelabel. Dit is de volledige beschrijvende naam, zoals "Leeftijd in jaren op moment van enquêtestarting" of "Hoogst genoten opleidingsniveau volgens CBS-indeling 2021".

Hier geef je precies aan wat de variabele meet. Derde: de waarden en waardelabels. Leg uit wat elke code betekent. Bijvoorbeeld: 1 = man, 2 = vrouw, 3 = non-binair, 99 = missing.

Dit klinkt triviaal, maar juist hier gaat het mis als je het niet vastlegt. Vierde: het meetniveau. Is het nominaal, ordinaal, interval of ratio?

Dit bepaalt welke analyses je kunt uitvoeren, dus noteer het. Een echt goed kwantitatief codebook gaat verder dan alleen variabelen. Noteer ook de bron van de data, de populatie en steekproefomvang, het datumberikte en eventuele recode-beslissingen.

Wat je extra moet vastleggen

Heb je leeftijd omgezet in categorieën? Leg dan precies uit waarom en met welke afkapwaarden.

Gebruik je een bestaand meetinstrument zoals de Utrechtse Burnout Scale of de WHO-5 Well-Being Index? Vermeld de bron en de gebruikte versie. En vergeet de missings niet.

Leg uit hoe ontbrekende waarden zijn gecodeerd. Is een leeg veld een systematische missing of gewoon een niet-ingevulde vraag?

Dit maakt een wereld van verschil bij de analyse.

Codebook voor kwalitatief onderzoek: codes, thema's en beslissingen

Bij kwalitatief onderzoek ziet een codebook er anders uit, maar het principe is hetzelfde: je documenteert hoe je data hebt geordend en geïnterpreteerd. Of je nu werkt met thematische analyse, grounded theory of een andere benadering, een kwalitatief codebook helpt je om transparant en systematisch te werk te gaan.

De kern van een kwalitatief codebook

Elke code in je codebook bevat idealiter een codenaam, een definitie, inclusiecriteria (wanneer pas je dit toe?), exclusiecriteria (wanneer juist niet?), en een of meer voorbeeldcitaten uit de data.

Net zoals je bij kwantitatieve data een data dictionary maakt om variabelen te verduidelijken, zorgt dit codebook voor de nodige context bij je kwalitatieve analyse. Neem bijvoorbeeld de code "vertrouwen in instituties". De definitie zou kunnen zijn: "Verwijzingen naar het al dan niet vertrouwen hebben in overheidsinstellingen, wetenschappelijke organisaties of andere formele structuren." Inclusiecriteria: de respondent spreekt expliciet over vertrouwen, wantrouwen of twijfel.

Van initiële codes naar een volledig codebook

Exclusiecriteria: algemene kritiek op beleid zonder verwijzing naar vertrouwen valt hier niet onder. En dan voeg je twee of drie pakkende citaten toe die de code illustreren. Een kwalitatief codebook is geen statisch document. Het groeit mee met je onderzoek.

Begin met open coderen: lees je data en noteer alles wat relevant lijkt.

Daarna ga je axiaal coderen: groeperep je codes in bredere categorieën of thema's. Noteer bij elke stap waarom je bepaalde beslissingen neemt.

Dit is je audit trail, en die maakt je onderzoek geloofwaardig. Gebruik hiervoor software als Atlas.ti, NVivo of MaxQDA. Maar ook een simpel spreadsheet kan wonderen werken als je consistent bent. Het belangrijkste is dat je het documenteert, niet welk tool je gebruikt.

Praktische tips voor een strak codebook

Begin vroeg. Schrijf je codebook niet achteraf, maar start er direct mee, zelfs voordat je data verzamelt.

Een voorlopig codebook helpt je al bij het opzetten van je instrumenten en geeft richting aan je onderzoek.

Wees consistent in je naamgeving en opbouw. Kies een format en houd daar je aan, door het hele document heen. Dit maakt het niet alleen leesbaar voor anderen, maar ook voor jezelf over drie maanden.

Versieer je codebook. Gebruik een versienummer en een datum.

Elke wijziging die je aanbrengt, noteer je met een korte toelichting. Dit is vooral belangrijk bij teamonderzoek, waar meerdere codeurs aan dezelfde data werken. En de gouden regel: test je codebook. Laat iemand anders erin kijken.

Als zij er geen weg in kunnen vinden, is het te ingewikkeld.

Een goed codebook moet voor een buitenstaander begrijpelijk zijn zonder dat jij erbij hoeft te staan.

Codebooks en Open Science: meer dan een vereiste

Binnen de Open Science-beweging is data-documentatie geen nice-to-have, maar een must. Funders als NWO en ZonMw vragen steeds vaker om een Data Management Plan, en een goed codebook is daar een essentieel onderdeel van.

Ook de FAIR-data-inspectiecommissie legt nadruk op herbruikbaarheid van data, en die begint bij documentatie. Als je je data deelt via repositories zoals DANS of DataverseNG, dan is een codebook het eerste wat anderen zien. Het bepaalt of jouw dataset wordt begrepen, geciteerd en hergebruikt.

Of dat hij verdwijnt in de digitale massa. Dus investeer die tijd.

Een goed codebook bespaart je later meer werk dan het kost. Het maakt je onderzoek transparant, reproduceerbaar én waardevol voor de wetenschappelijke gemeenschap.

En dat is uiteindelijk waar het om draait.


Lieke de Vries
Lieke de Vries
Expert in Open Science principes

Lieke adviseert onderzoekers over het publiceren van FAIR data volgens de nieuwste normen.

Meer over Onderzoeksdata organiseren en documenteren

Bekijk alle 12 artikelen in deze categorie.

Naar categorie →
Lees volgende
Hoe organiseer je jouw onderzoeksbestanden zodat anderen er iets mee kunnen
Lees verder →