Datarepositories kiezen en gebruiken

Hoe koppel je jouw dataset in een repository aan jouw gepubliceerde artikel

Lieke de Vries Lieke de Vries
· · 7 min leestijd

Je hebt maanden (of jaren) gewerkt aan je onderzoek. Het artikel is eindelijk gepubliceerd. Gefeliciteerd!

Inhoudsopgave
  1. Waarom je data en artikel bij elkaar horen
  2. Stap 1: Kies de juiste data repository
  3. Stap 2: Zorg voor uitstekende metadata
  4. Stap 3: Maak de koppeling écht werkend
  5. Stap 4: Kies een licentie die past bij jouw doel
  6. Stap 5: Documenteer alles — ook het lelijke werk
  7. Stap 6: Controleer of alles werkt
  8. Wat als je artikel al gepubliceerd is?
  9. De grote lijn: waarom dit ertoe doet

Maar wacht… waar is je data? Als je dataset los staat van je artikel, is het alsof je een recept deelt zonder de lijst met ingrediënten. Andere onderzoekers kunnen je resultaten niet controleren, niet hergebruiken, en niet bouwen op wat je hebt gemaakt.

En dat is zonde. Want goede data die je niet koppelt aan je artikel?

Die wordt gewoon niet gevonden. In dit artikel lees je stap voor stap hoe je dat wél doet — zodat je onderzoek écht impact maakt.

Waarom je data en artikel bij elkaar horen

Laten we even helder zijn: een artikel zonder data is onvolledig. Het is alsof je iemand vertelt dat je een geweldig gerecht hebt gekookt, maar je geeft het recept niet.

Andere onderzoekers willen graag kunnen controleren of je resultaten kloppen. Ze willen je data hergebruiken voor nieuw onderzoek.

En ze willen verder bouwen op wat jij hebt ontdekt. Daarom bestaan de FAIR-principes: data moet vindbaar, toegankelijk, uitwisselbaar en herbruikbaar zijn. Die principes staan centraal in Open Science, en organisaties als de VSNU en platforms als accelerateopenscience.nl helpen onderzoekers hierbij. Het koppelen van je dataset aan je artikel is geen extra klus — het is een essentieel onderdeel van goed onderzoek.

Stap 1: Kies de juiste data repository

Voordat je iets kunt koppelen, moet je data ergens terechtkomen. Een data repository is een online plek waar je dataset veilig opslaat, beschrijft en toegankelijk maakt.

Zenodo

Maar niet elke repository is hetzelfde. Hier zijn de populairste opties: Zenodo is een gratis repository van CERN.

Figshare

Je kunt er vrijwel alles uploaden: datasets, software, presentaties, je naam het maakt niet uit.

Dryad

Elke upload krijgt een DOI (Digital Object Identifier), wat het koppelen aan je artikel een stuk makkelijker maakt. Zenodo is ideaal als je een simpel, betrouwbaar platform zoekt zonder gedoe. Figshare richt zich op het delen van alle soorten onderzoeksoutput. Je kunt er data, figuren, video's en zelfs hele publicaties uploaden.

Dataverse

Er is een gratis versie, maar voor meer opslag en extra functies betaal je een abonnement. Figshare werkt goed als je veel verschillende bestandstypen wilt delen.

Dryad is speciaal gemaakt voor data die bij wetenschappelijke publicaties horen. Het platform legt veel nadruk op goede metadata en duidelijke beschrijvingen. Als je artikel bij een tijdschrift staat dat samenwerkt met Dryad, is dit vaak de logische keuze.

Dataverse is een open-source platform dat door veel universiteiten wordt gebruikt. Het biedt veel flexibiliteit en is geschikt voor grotere projecten of samenwerkingen.

Als je universiteit een eigen Dataverse-installatie heeft, is dat vaak een goed startpunt. Tip: Kies een repository die aansluit bij jouw vakgebied en controleer of je tijdschrift of universiteit een voorkeur heeft. Soms is de keuze al voor je gemaakt — en dat scheelt tijd.

Stap 2: Zorg voor uitstekende metadata

Metadata is de informatie over je data. Zonder goede metadata is je dataset onvindbaar, hoe goed die ook is.

Stel je voor: je uploadt een dataset met de titel "data_final_v3.xlsx". Wie moet daar iets mee? Niemand. De meeste repositories gebruiken standaard metadata-schema's zoals Dublin Core of DataCite.

  • Titel: Duidelijk en beschrijvend. Bijvoorbeeld: "Surveydata mentale gezondheid studenten 2023-2024".
  • Beschrijving: Leg uit wat de data bevat, hoe deze is verzameld, en waarom het belangrijk is.
  • Auteur(s): Vermeld iedereen die een substantiële bijdrage heeft geleverd.
  • Licentie: Kies een open licentie zoals CC-BY 4.0, zodat anderen weten wat ze mogen doen met je data.
  • Datum: De periode waarin de data is verzameld en de publicatiedatum.
  • Trefwoorden: Gebruik termen die andere onderzoekers ook zouden invoeren bij zoeken.
  • Gerelateerde publicatie: Hier voer je de DOI van je artikel in. Dit is de koppeling!

Vul deze velden zorgvuldig in. Dit is wat je minimaal nodig hebt:

Hoe beter je metadata, hoe vaker je data wordt gevonden en geciteerd. Dit is geen overbodige administratie — dit is waar de impact van je onderzoek begint.

Stap 3: Maak de koppeling écht werkend

Je data staat in de repository, eventueel met een data embargo ingesteld. Je artikel is gepubliceerd.

In je artikel

Nu moet je ze aan elkaar verbinden. Dit doe je op twee plekken: in je artikel én in je repository. Voeg een data availability statement toe aan je artikel.

Dit is een korte alinea (vaak in de sectie "Methoden" of aan het eind) waarin je beschrijft waar de data te vinden is. Bijvoorbeeld:

"De dataset die ten grondslag ligt aan deze publicatie is openbaar beschikbaar via Zenodo, DOI: 10.5281/zenodo.1234567." Veel tijdschriften vragen inmiddels expliciet om zo'n vermelding. Als je tijdschrift dat niet vergt, doe het dan toch.

In je repository

Het maakt je onderzoek transparanter en geloofwaardiger. Op de pagina van je dataset in de repository voer je de DOI van je artikel in bij het veld "Gerelateerde publicatie" of "Related identifier", wat ook helpt bij hoe reviewers jouw data beoordelen.

Zo ontstaat een wederzijdse koppeling: je artikel verwijst naar je data, en je data verwijst terug naar je artikel.

Let op: Gebruik altijd de DOI, niet gewoon een URL. DOI's zijn permanent. URLs kunnen veranderen of doodgaan. Een DOI blijft altijd werken, ook over twintig jaar.

Stap 4: Kies een licentie die past bij jouw doel

Je data is online, maar mag iedereen er mee doen wat hij wil? Nee.

Daarom kies je een licentie. Een licentie geeft aan wat anderen mogen doen met je data: gebruiken, kopiëren, aanpassen, delen. De meest gebruikte licentie in de wetenschap is CC-BY 4.0.

Die zegt: "Gebruik mijn data voor alles wat je wilt, maar vermeld mij als bron." Het is simpel, duidelijk, en bevordert hergebruik. Wil je helemaal geen restricties?

Kies dan CC0 (ook wel "public domain" genoemd). Je geeft alle rechten op, en iedereen mag met je data doen wat hij zonder enige verplichting.

Belangrijk: Als je data persoonlijke informatie bevat, kun je niet zomaar een open licentie kiezen. Denk aan privacywetgeving zoals de AVG. Soms is anonimiseren nodig, of moet je de data beperkt toegankelijk maken. Check dit altijd voordat je publiceert.

Stap 5: Documenteer alles — ook het lelijke werk

Je dataset stap voor stap uploaden is niet genoeg. Andere onderzoekers moeten begrijpen hoe de data is verzameld, wat de kolommen betekenen, en welke bewerkingen je hebt gedaan.

Dit noemen we documentatie. Zorg voor een README-bestand bij je dataset. Hierin staat:

  • Een beschrijving van het onderzoek en de onderzoeksvraag.
  • Uitleg van elke variabele in je dataset (een codeboek).
  • De methode van dataverzameling.
  • Welke software je hebt gebruikt (bijvoorbeeld SPSS, R, Python).
  • Welke stappen je hebt genomen om de data schoon te maken.
  • Eventuele beperkingen of aandachtspunten bij het gebruik van de data.

Dit klinkt als veel werk. En dat is het ook. Maar goede documentatie maakt het verschil tussen data die wordt hergebruikt en data die vergeten raakt in een digitale la.

Stap 6: Controleer of alles werkt

Alles staat online. De koppelingen zijn gemaakt.

  • Klik op de DOI in je artikel. Gaat deze naar de juiste dataset?
  • Klik op de verwijzing in je repository. Kom je op het juiste artikel?
  • Kan iemand zonder inloggegevens je data bekijken?
  • Is de licentie zichtbaar?
  • Leest de documentatie logisch voor iemand die niets van je onderzoek afweet?

Maar werkt het ook écht? Neem vijf minuten de tijd om te testen:

Als alles werkt, ben je klaar. Gefeliciteerd — je onderzoek is nu écht open, transparant, en klaar om hergebruikt te worden.

Wat als je artikel al gepubliceerd is?

Geen paniek. Je kunt je data altíd nog koppelen, ook als het artikel al maanden online staat. Upload je dataset, voeg de DOI van je artikel toe in de repository, en neem contact op met de uitgever van je artikel om de data availability statement toe te voegen of te updaten. Veel uitgevers maken dit mogelijk, ook na publicatie.

De grote lijn: waarom dit ertoe doet

Het koppelen van je dataset aan je artikel is geen technische bijzaak. Het is een fundamentele stap in Open Science. Het zorgt ervoor dat je onderzoek controleerbaar is, dat je data hergebruikt wordt, en dat jouw werk meer impact heeft.

Organisaties als de VSNU, NWO, en platforms als accelerateopenscience.nl zetten zich in om onderzoekers te ondersteunen bij open data delen.

De tools zijn er. De kennis is er.

Het enige wat nodig is, is dat jij de stap zet. Dus: de volgende keer dat je een artikel publiceert, publiceer dan ook je data. Koppel ze aan elkaar. En maak je onderzoek compleet.


Lieke de Vries
Lieke de Vries
Expert in Open Science principes

Lieke adviseert onderzoekers over het publiceren van FAIR data volgens de nieuwste normen.

Meer over Datarepositories kiezen en gebruiken

Bekijk alle 38 artikelen in deze categorie.

Naar categorie →
Lees volgende
Wat is een datarepository en waarom mag jij er niet zomaar één kiezen
Lees verder →