Je hebt je onderzoek afgerond, je data is netjes opgeslagen, en nu wil je het delen met de wetenschappelijke wereld. Maar hoe doe je dat eigenlijk?
▶Inhoudsopgave
- Wat is DANS Data Station precies?
- Waarom zou je je data uploaden naar DANS Data Station?
- Stap 1: Maak een account aan
- Stap 2: Kies het juiste Data Station
- Stap 3: Bereid je data voor
- Stap 4: Start een nieuwe dataset
- Stap 5: Upload je bestanden
- Stap 6: Kies de juiste licentie
- Stap 7: Publiceer je dataset
- Wat als je data gevoelige informatie bevat?
- Conclusie: data delen hoeft niet ingewikkeld te zijn
Waar upload je je dataset zodat anderen het kunnen vinden, citeren en hergebruiken?
Geen zorgen, het is eenvoudiger dan je denkt. In dit artikel leggen we stap voor stap uit hoe je via DANS Data Station je dataset uploadt en beschikbaar maakt voor de wetenschap.
Wat is DANS Data Station precies?
DANS Data Station is een online platform van Data Archiving and Networked Services, kortweg DANS.
Dit is de grootste Nederlandse databank voor onderzoeksdata. Denk aan datasets van wetenschappers uit allerlei vakgebieden: van archeologie tot taalkunde, van gezondheidswetenschappen tot sociale wetenschappen. Het platform helpt onderzoekers om hun data veilig te bewaren en toegankelijk te maken, precies zoals Open Science dat beoogt. Wat DANS Data Station zo handig maakt: het platform is gratis te gebruiken voor onderzoekers die verbonden zijn aan een Nederlandse universiteit of onderzoeksinstelling.
Je dataset krijgt een DOI, een Digital Object Identifier. Dat is een unieke code die ervoor zorgt dat anderen jouw data altijd kunnen vinden en correct kunnen citeren. Handig, toch?
Waarom zou je je data uploaden naar DANS Data Station?
Goede vraag. Er zijn eigenlijk drie redenen waarom je dit zou moeten doen.
Ten eerste: meer en meer verchrijvers en onderzoeksfinanciers vragen expliciet om data delen.
Plan S, het Europese Open Science-beleid, steeds vaker vereisen dat onderzoeksdata openbaar beschikbaar is. Ten tweede: als je data uploadt naar DANS Data Station, wordt het opgeslagen volgens de FAIR-principes. Dat betekent dat je data Findable, Accessible, Interoperable en Reusable is.
En ten derde: je dataset wordt voor langere tijd veilig bewaard. DANS garandeert dat je data minimaal tien jaar toegankelijk blijft. Dat is een stuk betrouwarder dan een oude harde schijf op je kantoor.
Stap 1: Maak een account aan
Allereerst heb je een account nodig. Ga naar de website van DANS Data Station en klik op registreren.
Je kunt je aanmelden met je instellingsaccount, bijvoorbeeld via SURFconext. Dat is het inlogsysteem dat veel Nederlandse universiteiten en hogescholen gebruiken. Heb je geen toegang via SURFconext? Dan kun je ook een persoonlijk account aanmaken. Het registratieproces duurt slechts enkele minuten.
Stap 2: Kies het juiste Data Station
DANS biedt meerdere Data Stations aan, elk gericht op een specifiek vakgebied. Er is een Data Station voor de geesteswetenschappen, een voor de sociale en gedragswetenschappen, en een voor de natuur- en levenswetenschappen. Kies het Data Station dat het beste past bij jouw onderzoeksgebied.
Weet je niet welk je moet kies? Kies dan voor het generieke Data Station.
Je kunt je data altijd later nog verplaatsen als dat nodig is.
Stap 3: Bereid je data voor
Voordat je begint met uploaden, is het belangrijk om je data goed voor te bereiden.
Zorg ervoor dat je bestanden een gangbaar formaat hebben, zoals CSV, PDF, TIFF of SPSS. Vermijd eigenaardige of verouderde bestandsformaten, want die zijn over tien jaar misschien niet meer leesbaar. Geef je bestanden ook duidelijke, beschrijvende namen. "Onderzoek_resultaten_definitief_FINAL_v3.csv" is natuurlijk niet handig.
Liever zoiets als "enquete_gezondheid_2024.csv". Maak daarnaast een README-bestand aan.
Dit is een simpel tekstbestand waarin je uitlegt wat er in je dataset zit.
Welke variabelen gebruik je? Hoe zijn de data verzameld? Zijn er beperkingen bij het gebruik van de data?
Dit bestand is goud waard voor iedereen die jouw dataset later wil begrijpen en hergebruiken. Wil je de data vervolgens veilig opslaan? Ontdek hoe DataverseNL werkt en welke instellingen het gebruiken.
Stap 4: Start een nieuwe dataset
Log in op DANS Data Station en klik op "Submit Dataset" of "Dataset aanmaken".
Je komt dan terecht bij een formulier waarin je metadata invult. Metadata is eigenlijk gewoon informatie over je data. Denk aan de titel van je dataset, de naam van de auteur, een korte beschrijving en enkele trefwoorden.
Hoe beter je metadata invult, hoe makkelijker anderen jouw dataset kunnen vinden via zoekmachines en zoekfuncties. Let op: sommige velden zijn verplicht, andere zijn optioneel.
Vul zoveel mogelijk in, want elk extra stukje informatie helpt bij de vindbaarheid.
Voeg ook de naam van je universiteit of onderzoeksinstelling toe, evenals eventuele projectnummers of subsidiegegevens.
Stap 5: Upload je bestanden
Nu het moment waarop je data daadwerkelijk het platform opgaat. Klik op "Add Files" of "Bestanden toevoegen" en selecteer de bestanden die je wilt uploaden.
DANS Data Station ondersteunt bestanden tot 2 gigabyte per bestand. Grotere bestanden kun je opsplitsen in meerdere delen.
Het uploaden zelf gaat via je browser, dus je hoeft geen speciale software te installeren. Tip: als je veel bestanden hebt, kun je ze ook als zip-bestand uploaden. Dat scheelt tijd en houdt alles overzichtelijk. Zorg er wel voor dat de structuur binnen het zip-bestand logisch is en dat je het README-bestand erbij stopt.
Stap 6: Kies de juiste licentie
Een belangrijke stap die je niet over wilt slaan: kies een licentie voor je dataset. De licentie bepaalt wat anderen mogen en niet mogen met jouw data.
DANS raadt aan om te kiezen voor een Creative Commons-licentie. De meest open variant is CC0, waarmee je afstand doet van je rechten en je data volledig vrij geeft. Een andere populaire keuze is CC BY 4.0, waarbij anderen je data mogen gebruiken zolang ze jou als auteur vermelden.
Twijfel je over welke licentie het beste past? DANS biedt een handige licentie-wizard die je helpt bij de keuze.
Neem even de tijd om hierover na te denken, want de licentie is lastig terug te draaien.
Stap 7: Publiceer je dataset
Alles ingevuld, alle bestanden geupload, licentie gekozen? Dan kun je op "Submit" of "Verzenden" klikken.
Je dataset wordt nu beoordeeld door een moderator van DANS. Dit duurt meestal enkele werkdagen. De moderator controleert of je dataset voldoet aan de richtlijnen: zijn de bestanden compleet, is de metadata duidelijk, en is de licentie correct gekozen?
Na goedkeuring wordt je dataset gepubliceerd en krijgt het een DOI toegewezen.
Vanaf dat moment is jouw dataset vindbaar en toegankelijk voor de hele wetenschappelijke wereld. Je kunt de DOI gebruiken in je publicaties, zodat lezers direct naar je data kunnen verwijzen.
Wat als je data gevoelige informatie bevat?
Soms bevat je dataset persoonsgegevens of andere gevoelige informatie. In dat geval kun je je dataset onder beperkte toegankelijkheid plaatsen.
Dat betekent dat anderen eerst toestemming moeten vragen voordat ze de data kunnen inzien.
DANS biedt hiervoor een aanvraagproces aan. Je geeft aan wie toegang heeft en onder welke voorwaarden. Zo kun je je data delen zonder privacy in gevaar te brengen.
Conclusie: data delen hoeft niet ingewikkeld te zijn
Uploaden van je dataset naar DANS Data Station is eigenlijk best een eenvoudig proces. Zeven stappen, en je data is veilig opgeslagen, vindbaar voor anderen, en voorzien van een DOI.
Het kost je misschien een uur van je tijd, maar de baten zijn groot: meer zichtbaarheid voor je onderzoek, voldoen aan Open Science-vereisten, en een bijdrage aan de wetenschappelijke kennis. Dus wacht niet langer, upload je dataset vandaag nog.