Datarepositories kiezen en gebruiken

CoreTrustSeal certificering: wat betekent het voor de betrouwbaarheid van een repository

Lieke de Vries Lieke de Vries
· · 5 min leestijd

Stel je voor: je hebt maandenlang data verzameld voor je onderzoek. Uren, soms jaren, gewerkt aan een dataset die essentieel is voor je publicatie. En dan?

Inhoudsopgave
  1. Wat is CoreTrustSeal precies?
  2. Waarom is CoreTrustSeal belangrijk voor betrouwbaarheid?
  3. Hoe werkt het certificeringsproces?
  4. Welke repositories hebben CoreTrustSeal?
  5. Wat betekent dit voor jou als onderzoeker?
  6. CoreTrustSeal en Open Science: een logische match
  7. Wat komt er nog?

Dan wil je die data veilig opslaan, zodat anderen het kunnen vinden, checken en hergebruiken. Maar hoe weet je of de plek waar je je data kwijt bent, echt betrouwbaar is? Gaat die over tien jaar nog bestaan?

Wordt je data goed beheerd? En kun je er als onderzoeker op vertrouwen dat alles correct is opgeslagen?

Dat zijn geen rare vragen. Sterker nog, het zijn precies de vragen die steeds vaker gesteld worden in de wereld van Open Science. En dat is ook waarom CoreTrustSeal bestaat. In dit artikel lees je wat deze certificering precies is, hoe het werken, en waarom het écht uitmaakt voor de betrouwbaarheid van een datarepository.

Wat is CoreTrustSeal precies?

CoreTrustSeal is een internationale certificering voor digitale repositories. Een repository is simpel gezegd een online plek waar onderzoekdata wordt opgeslagen en toegankelijk gemaakt.

Maar niet elke repository is even betrouwbaar. Sommige zijn goed ingericht, met duidelijke beleidsplannen en langetermijnplannen. Anderen zijn wat slapper.

CoreTrustSeal zorgt ervoor dat je als onderzoeker, financier of instelling kunt zien: deze repository voldoet aan echt goede normen.

De certificering is opgezet door een samenwerking van Europese organisaties, waaronder CERN en ICSU World Data System. Het idee is simpel: repositories die het CoreTrustSeal-certificaat hebben, hebben bewezen dat ze aan strenge kwaliteitseisen voldoen. Niet alleen nu, maar ook op de lange termijn.

Waarom is CoreTrustSeal belangrijk voor betrouwbaarheid?

Betrouwbaarheid van een repository draait om één kernvraag: kun je erop vertrouwen dat jouw data veilig, correct en toegankelijk blijft? Niet alleen vandaag, maar ook over vijf, tien of twintig jaar.

Organisatie en governance

CoreTrustSeal beantwoordt die vraag door repositories te toetsen aan zeventien vereisten. Die vereisten vallen onder drie grote thema's:

Een betrouwbare repository moet een duidelijke organisatiestructuur hebben. Wie is verantwoordelijk? Wat zijn de missie en het beleid? Is er voldoende financiële ondersteuning om de repository op de lange termijn draaiende te houden?

Beheer van data en digitale objecten

CoreTrustSeal kijkt of de repository een solide basis heeft, zodat je niet plotseling je data kwijtraakt omdat de stichting failliet is gegaan. Hier gaat het om de kern van het werk: hoe wordt je data eigenlijk beheerd?

Wordt alles goed beschreven met metadata? Zijn er procedures om te voorkomen dat data beschadigd raakt of verloren gaat? Wordt er voldaan aan de FAIR-principes, zodat data vindbaar, toegankelijk, interoperabel en herbruikbaar is? CoreTrustSeal eist dat repositories aantonen hoe ze hiermee omgaan, met duidelijke documentatie en werkprocessen.

Technische infrastructuur

De techniek moet kloppen. Is de opslag veilig?

Wordt er regelmatig een back-up gemaakt? Zijn er plannen voor het migreren van data naar nieuwe formaten of systemen wanneer technologie verandert? Een repository die vandaag top is, maar over vijf jaar niet meer kan meebewegen met nieuwe standaarden, is op termijn niet betrouwbaar. CoreTrustSeal let hier specifiek op.

Hoe werkt het certificeringsproces?

Het behalen van een CoreTrustSeal is geen koud kunstje. Het begint met een uitgebreide zelfevaluatie.

De repository moet aantonen, aan de hand van documentatie en bewijsmateriaal, dat ze aan alle zeventien vereisten voldoen.

Daarna beoordeelt een onafhankelijke commissie van experts het dossier. Die commissie kan vragen stellen, verduidelijking vragen, of aanvullend bewijs opvragen. Als alles goed is, krijgt de repository het certificaat.

Maar daar is het niet op uit. Het certificaat is geldig voor drie jaarna, niet twee jaar zoals soms wordt beweerd.

En tussentijd moet de repository jaarlijks rapporteren over eventuele wijzigingen. Zo blijft de kwaliteit gewaardeerd en wordt voorkomen dat een repository het certificaat krijgt en vervolgens op een zijspoor belandt. Denk ook na over de bewaartermijn van je data en wat er daarna met je bestanden gebeurt.

Welke repositories hebben CoreTrustSeal?

Begin 2024 zijn er wereldwijd meer dan honderd repositories die het CoreTrustSeal-certificaal hebben behaald. En dat aantal groeit.

Bekende voorbeelden zijn Zenodo, beheerd door CERN, een van de grootste open access repositories ter wereld. Zoek je de juiste repository voor jouw discipline? Dan is re3data een uitstekend startpunt.

Maar ook Driedad, Figshare en Dataverse hebben de certificering. In Nederland zijn er ook meerdere repositories met CoreTrustSeal, bijvondelijk DANS, dat gespecialiseerd is in data-archivering voor de geesteswetenschappen en sociale wetenschappen. De volledige lijst van gecertificeerde repositories kun je terugvinden op de website van CoreTrustSeal zelf. Handig als je als onderzoeker een betrouwbare plek zoekt voor je data.

Wat betekent dit voor jou als onderzoeker?

Als onderzoeker hoef je geen expert te worden in repository-beheer. Maar het is wel handig om te weten wat CoreTrustSeal betekent.

  • Dat de repository is getoetst door onafhankelijke experts.
  • Dat er duidelijke beleidsplannen zijn voor langetermijnbehoud.
  • Dat je data wordt beheerd volgens internationale normen, waaronder de FAIR-principes.
  • Dat de repository transparant is over hoe ze te werk gaan.

Kies je een repository met deze certificering, dan weet je: Kortom: je kunt erop vertrouwen dat jouw onderzoeksdata in goede handen is. Waarom je niet zomaar elke datarepository kunt kiezen, is daarom een belangrijke vraag. En dat is precies wat je wilt weten, toch?

CoreTrustSeal en Open Science: een logische match

Open Science draait om transparantie, herhaalbaarheid en samenwerking. Maar dat werkt alleen als de infrastructuur kloppet.

Als data niet goed wordt beheerd, of als repositories plotseling verdwijnen, dan stuit Open Science op zijn grenzen. CoreTrustSeal helpt om die infrastructuur betrouwbaarder te maken. Het zegt tegen de wetenschappelijke gemeenschap: deze repository voldoet aan de normen.

Je kunt erop bouwen. Daarom wordt CoreTrustSeal ook steeds vaker vermeld in richtlijnen van fondsenwervers en instellingen.

Sommige organisaties vragen zelfs expliciet om data op te slaan in een CoreTrustSeal-gecertificeerde repository. Een teken dat de certificering serieus wordt genomen.

Wat komt er nog?

CoreTrustSeal blijft zich ontwikkelen. Er wordt gewerkt aan het verfijnen van de criteria, het beter ondersteunen van kleinere repositories, en het aansluiten bij nieuwe internationale standaarden.

Ook wordt er gekeken naar hoe de certificering beter kan aansluiten bij domeinspecifieke behoeften. Want een repository voor medische data heeft andere uitdagingen dan een repository voor aardwetenschappelijke datasets. De toekomst van CoreTrustSeal ziet er veelbelovend uit. En voor de betrouwbaarheid van onderzoeksdata is dat goed nieuws. Want hoe beter de repositories, hoe sterker de basis voor Open Science.


Lieke de Vries
Lieke de Vries
Expert in Open Science principes

Lieke adviseert onderzoekers over het publiceren van FAIR data volgens de nieuwste normen.

Meer over Datarepositories kiezen en gebruiken

Bekijk alle 38 artikelen in deze categorie.

Naar categorie →
Lees volgende
Wat is een datarepository en waarom mag jij er niet zomaar één kiezen
Lees verder →