Onderzoeksdata organiseren en documenteren

Hoe archiveer je e-mailcommunicatie en beslissingen die bij jouw onderzoeksdata horen

Lieke de Vries Lieke de Vries
· · 5 min leestijd

Stel je voor: je bent anderhalf jaar verder met je onderzoek, en ineens vraagt iemand: "Waarom heb je die ene variabele weggelaten uit je analyse?" Je weet dat je dat besluit hebt genomen na een mailwisseling met je begeleider. Maar die mail? Die zit ergens tussen 3.000 andere berichten in je inbox.

Inhoudsopgave
  1. Waarom je e-mail en beslissingen moet archiveren
  2. Wat archiveer je precies?
  3. Zo archiveer je e-mailcommunicatie voor onderzoek
  4. Beslissingen documenteren: het beslissingslogboek
  5. De grote lijn: maak het jezelf makkelijk

En je begeleider is inmiddels met pensioen. Klinkt als een nachtmerrie?

Dat is het ook. Maar het is makkelijk te voorkomen. Mail en besluitvorming rondom onderzoeksdata zijn geen bijzaak.

Ze zijn onderdeel van je data. Ze vertellen het verhaal achter je onderzoek.

En in de wereld van Open Science en FAIR-data (Findable, Accessible, Interoperable, Reusable) geldt: als je het niet kunt terugvinden en begrijpen, bestaat het eigenlijk niet. Dus laten we het hebben over hoe je dit slim aanpakt.

Waarom je e-mail en beslissingen moet archiveren

Veel onderzoekers zien e-mail als iets persoonls of tijdelijks. Maar denk eens na: in je mailbox zitten vaak expliciete afspraken over dataverzameling, wijzigingen in je onderzoeksdesign, toestemmingen van ethische commissies, of feedback van collega's die heeft geleid tot belangrijke keuzes.

Die informatie is essentieel om je onderzoek reproduceerbaar te maken. De FAIR-principes vragen niet alleen om goed beschreven datasets, maar ook om context. En context zit vaak in je communicatie.

Als je dat niet archiveert, verlies je een stukje van de provenance van je data: de herkomst en geschiedenis van hoe iets tot stand is gekomen.

Daarbovenop: steeds meer financierders, zoals NWO en de EU via Horizon Europe, vragen om een Data Management Plan waarin je ook aantoont hoe je met niet-traditionele data omgaat. E-mail valt daar onder.

Wat archiveer je precies?

Niet elke mail hoeft bewaard te worden. Dat zou overweldigend zijn.

  • Afspraken over welke data je wel of niet gebruikt in je analyse
  • Goedkeuringen of afwijzingen van je onderzoeksdesign door een ethische commissie
  • Feedback van begeleiders of collega's die heeft geleid tot wijzigingen in je methode
  • Correspondentie over toegang tot gedeelde datasets of gebruik van faciliteiten
  • Afspraken over auteurschap, data-eigendom of licentievoorwaarden

Maar richt je op de berichten die beslissingen documenteren. Denk aan: Kortom: alles wat verklaart waarom je onderzoek eruitziet zoals het eruitziet.

Zo archiveer je e-mailcommunicatie voor onderzoek

1. Maak een duidelijke mapstructuur aan

Begin simpel door je onderzoeksbestanden logisch te organiseren. Maak in je projectmap een submap aan met de naam Communicatie_en_beslissingen. Maak daarbinnen weer submappen per thema, bijvoorbeeld Ethische_goedkeuring, Data_selectie, Methodologie_wijzigingen.

2. Exporteer mails als PDF of .eml

Zo vind je alles terug zonder te hoeven zoeken. Je inbox is geen archief.

Accounts worden opgeheerd, universiteiten wisselen van systeem, en je oude Gmail van je studententijd bestaat niet meer. Exporteer relevante e-mails en sla ze op in je projectmap.

3. Geef bestanden een logische naam

In Outlook kun je een e-mail gewoon slepen naar een map in Verkenner, of opslaan als .msg of .eml. In Gmail kun je een conversatie openen, klikken op de drie puntjes, en kiezen voor "Afdrukken" — en dan opslaan als PDF. De .eml-formaat is het meest toekomstbestendig, want het is een open standaard die je met vrijwel elke e-mailclient kunt openen.

Belangrijk: noem je bestanden zodat je ze later begrijpt zonder ze te openen.

Gebruik een consistente naamgevingsconventie. Bijvoorbeeld: 2024-03-15_mail_begeleider_dataselectie_v2.pdf Zo weet je meteen wanneer het ging, met wie, en waarover. Gebruik geen spaties in bestandsnamen — gebruik underscores of koppeltekens. En begin altijd met de datum in het formaat JJJJ-MM-DD, zodat bestanden automatisch chronologisch gesorteerd worden.

4. Schrijf een README-bestand bij je archief

Een map vol PDF's is niet genoeg. Maak een README.txt of README.md aan waarin je kort uitlegt: Dit is misschien wel het belangrijkste onderdeel.

  • Welke conversaties er zijn gearchiveerd en waarom
  • Welke beslissingen er zijn genomen en door wie
  • Hoe de bestanden zijn georganiseerd

Over twee jaar ben jij ook een ander persoon, en die jij van de toekomst zal dankbaar zijn voor een paar zinnen context.

5. Gebruik een versiebeheersysteem of repository

Als je serieus bent over Open Science, stop je je gearchiveerde communicatie in dezelfde plek als je onderzoeksdata. Veel Nederlandse universiteiten bieden toegang tot DataverseNL, een platform waar je datasets kunt publiceren en archiveren. Je kunt er ook niet-traditionele bestanden uploaden, inclusief documenten en gearchiveerde e-mails.

Een andere optie is Zenodo, een door CERN ontwikkelde repository die gratis is en een DOI (Digital Object Identifier) aan je materiaal koppelt. Zo wordt je communicatie vindbaar en citeerbaar. Let op: als je e-mails bevatten persoonsgegevens van anderen, moet je die anonymiseren of pseudonimiseren voordat je ze publiek toegankelijk maakt.

De AVG geldt ook hier. Vervang namen door codes en documenteer de sleutel in een apart, niet-publiek bestand.

Beslissingen documenteren: het beslissingslogboek

Naast e-mails is het slim om een beslissingslogboek bij te houden. Dat is een simpel document — een spreadsheet of tekstdocument — waarin je per datum noteert:

  • Welke beslissing is genomen
  • Door wie
  • Op basis van welke informatie of argumenten
  • Welke alternatieven zijn overwogen

Dit kost je vijf minuten per beslissing en bespaart je uren achteraf.

Het is ook een uitstekend hulpmiddel voor je methodologie-sectie in artikelen. En het maakt je onderzoek transparant, wat precies is wat Open Science voorstaat.

De grote lijn: maak het jezelf makkelijk

Je hoeft geen ingewikkeld systeem te bouwen. De kern is simpel: sla op wat belangrijk is, maak het vindbaar, en leg uit waarom het er is. Begin vandaag nog.

Open je inbox, zoek de drie belangrijkste mails van het afgelopen jaar, en archiveer ze volgens de structuur die hierboven staat.

Want het verschil tussen een goed onderzoek en een uitstekend onderzoek zit vaak niet in de data zelf, maar in de context eromheen. En die context begint in je mailbox.


Lieke de Vries
Lieke de Vries
Expert in Open Science principes

Lieke adviseert onderzoekers over het publiceren van FAIR data volgens de nieuwste normen.

Meer over Onderzoeksdata organiseren en documenteren

Bekijk alle 12 artikelen in deze categorie.

Naar categorie →