Je hebt je dataset gepubliceerd in een repository. Gefeliciteerd! Maar wat nu?
▶Inhoudsopgave
Hoe weet je of je data daadwerkelijk wordt gevonden, gedownload en gebruikt? En hoe meet je de impact die je dataset maakt in de wetenschappelijke wereld? Dat komt allemaal neer op één ding: repository statistieken begrijpen. In dit artikel lees je precies wat die cijfers betekenen, hoe je ze moet interpreteren — en hoe je ze kunt gebruiken om je data zichtbaarder en impactvoller te maken.
Waarom repository statistieken ertoe doen
Open Science draait om transparantie, hergebruik en samenwerking. Maar als niemand je dataset vindt of gebruikt, blijft die impact stuk.
Repository statistieken geven je een eerlijk beeld van wat er écht gebeurt met je data. Niet hoeveel mensen er denken dat je dataset populair is, maar hoe vaak hij daadwerkelijk wordt bekeken, gedownload en geciteerd. Deze cijfers zijn waardevol voor jou als onderzoeker, maar ook voor je instelling en financieringsorganisaties.
Ze laten zien dat je werk hergebruikt wordt, dat je bijdraagt aan vervolgonderzoek en dat je data FAIR is gemaakt — Findable, Accessible, Interoperable en Reusable. Kortom: statistieken zijn geen vanity metrics. Ze zijn bewijs van impact.
De belangrijkste statistieken in een repository
Niet alle repositories zijn hetzelfde, maar de meeste — zoals Zenodo, Figshare, Dryad en DANS Data Stations — bieden een kernset aan gebruiksstatistieken. Hieronder bespreken we de belangrijkste.
Downloads: de meest concrete maatstaf
Downloads zijn het aantal keer dat iemand daadwerkelijk een bestand uit je dataset heeft opgehaald. Dit is de meest tastbare indicator van gebruik. Een dataset met 500 downloads in drie maanden zegt meer over impact dan een dataset met 50 downloads in een jaar.
Let wel: de definitie van een download kan verschillen per repository. Sommige tellen elke klik, ook van dezelfde gebruiker.
Views: interesse zonder actie
Andere tellen alleen unieke downloads. Zenodo bijvoorbeeld toont zowel het totale aantal downloads als het aantal unieke downloads. Check daarom altijd hoe een repository dit telt, zodat je cijfers correct vergelijkt. Views geven aan hoe vaak de landingspagina van je dataset is bekeken.
Dit is een belangrijke aanvulling op downloads, want niet iedereen die je dataset bekijkt, downloadt hem ook. Toch zegt een hoge view count wel iets waardevols: mensen vinden je dataset, lezen de beschrijving en overwegen hem te gebruiken.
Citations: de gouden standaard van impact
Een groot verschil tussen views en downloads kan wijzen op een probleem. Misschien is je dataset moeilijk te downloaden, of de metadata is onduidelijk. Of de licentie is zo beperkt dat mensen afhaken.
Views zijn dus ook een signaalpunt — ze vertellen je waar mensen stilstaan, zelfs als ze niet doorgaan naar download.
Als je dataset wordt geciteerd in een wetenschappelijk artikel, dan is dat het sterkste bewijs van impact. Repositories zoals Zenodo en Figshare werken samen met DataCite om elk dataset een DOI (Digital Object Identifier) te geven. Die DOI maakt het mogelijk om citaties systematisch te volgen.
Niet alle repositories tonen citaties direct in hun dashboard. Soms moet je tools zoals Google Scholar, Dimensions of de DataCite Event Data API raadplegen.
Gebruiksstatistieken op bestandsniveau
Maar het loont om hier energie in te steken. Citations zijn wat reviewers, aanstellingscommissies en fondsenmakers willen zien.
Sommige repositories brengen verder in detail. Je kunt dan zien welk bestand in je dataset het meest wordt gedownload. Misschien is het CSV-bestand populair, maar het codeboek wordt nauwelijks geraadpleegd.
Dat zou je aanleiding kunnen geven om de documentatie beter te maken of duidelijker te linken.
Deze granulariteit is vooral handig als je datasets met meerdere bestanden publiceert. Het helpt je begrijpen wat gebruikers écht nodig hebben — en waar je verbeterpunten liggen.
Wat statistieken je niet vertellen
Statistieken zijn nuttig, maar ze geven geen compleet beeld. Hier zijn een paar belangrijke kanttekeningen.
Ten eerste: een lage download count betekent niet per se dat je dataset waardeloos is. Sommige datasets zijn niche, technisch of bedoeld voor een kleine doelgroep. Ze kunnen ontzettend waardevol zijn voor precies die vijf onderzoekers die ze nodig hebben.
Ten tweede: je ziet niet altijd hoe je data wordt gebruikt. Iemand downloadt je dataset, combineert die met drie andere bronnen, en publiceert een baanbrekend artikel, zeker als je weet hoe je een data paper schrijft dat echt gelezen wordt.
Jouw repository statistieken laten alleen die ene download zien — niet de kettingreactie die daarna volgt.
En ten derde: niet alle repositories zijn even transparant over hun meetmethoden. Sommige updaten statistieken met vertraging, andere filteren bots en crawlers uit, weer andere niet. Wees je bewust van deze beperkingen als je cijfers vergelijkt tussen platforms.
Hoe je de impact van je dataset vergroot
Goede statistieken zijn niet vanzelfsprekend. Ze zijn het resultaat van doordacht werk.
Hier zijn concrete stappen die je kunt nemen. Schrijf metadata die mensen vindt. Je titel, samenvatting en trefwoorden zijn het eerste wat zoekmachines en onderzoekers zien. Gebruik duidelijke, specifieke termen.
Niet "onderzoeksdata 2023", maar "bodemkwaliteitsmetingen Noord-Holland 2020-2023". Hoe beter je metadata, hoe hoger je views — en uiteindelijk je downloads.
Kies een open licentie. Datasets onder een Creative Commons-licentie (bijvoorbeeld CC-BY of CC0) worden vaker hergebruikt dan datasets zonder licentie of met restrictieve voorwaarden.
Mensen willen weten wat ze mogen doen met je data. Wees daar duidelijk over. Promoot je dataset. Publiceer hem niet en vervolgens vergeten. Deel de DOI op sociale media, in nieuwsbrieven, op ResearchGate of LinkedIn.
Vermeld je dataset in relevante artikelen en koppel je dataset aan je publicatie. Hoe meer zichtbaarheid, hoe meer gebruik.
Monitor en reageer. Bekijk je statistieken regelmatig. Zie je een piek na een bepaalde periode? Dan is iets gebeurd — een artikel, een presentatie, een social media post. Begrijp wat werkt, en doe meer van dat.
De juiste repository kiezen voor inzicht
Niet elke repository biedt dezelfde statistieken. Als gebruiksdata belangrijk zijn voor jou, kies dan een repository als je vakgebied er geen heeft die transparante, gedetailleerde analytics biedt.
Zenodo toont downloads, views en citations via DataCite. Figshare biedt een uitgebreid dashboard met altmetrics. Dryad toont downloads en verbindt datasets met gerelateerde publicaties. Voor Nederlandse onderzoekers zijn er ook specifieke opties.
DANS, het Data Archiving and Networked Services, biedt de Data Stations voor verschillende onderzoeksdomeinen. Deze repositories voldoen aan internationale standaarden en bieden betrouwbare statistieken die je kunt gebruiken in onderzoeksvoorstellen en evaluaties.
Van cijfers naar verhaal
Repository statistieken zijn meer dan nummers op een scherm. Ze vertellen het verhaal van jouw data. Wie vond het? Wie gebruikte het? Hoe dragt het bij aan de wetenschap?
Leer die cijfers lezen. Gebruik ze om je data beter te maken, zichtbaarder te promoten en je impact aan te tonen.
Want in de wereld van Open Science geldt: wat je niet meet, kun je niet verbeteren. En wat je niet deelt, kan geen impact maken.