Onderzoekssoftware en reproduceerbaarheid

GitHub versus GitLab voor onderzoekssoftware: wat gebruik je als Nederlandse onderzoeker

Lieke de Vries Lieke de Vries
· · 8 min leestijd

Je zit midden in je onderzoek, je code groeit, je collega's draaien mee, en ineens hoor je van iedereen: "Zet het maar op GitHub" of "Wij gebruiken altijd GitLab." Maar wacht eens even. Welke past nou écht bij jouw onderzoek?

Inhoudsopgave
  1. Wat is het verschil tussen GitHub en GitLab toch weer?
  2. Waarom kiezen onderzoekers nu juist voor GitLab?
  3. Maar GitHub heeft toch ook duidelijke voordelen?
  4. Hoe zit het met Open Science en FAIR-data?
  5. Wat doen Nederlandse universiteiten eigenlijk?
  6. Dus wat moet jij kiezen?
  7. Veelgestelde vragen

Want laten we eerlijk zijn: niet elk platform is even geschikt voor onderzoekssoftware.

En als Nederlandse onderzoeker heb je het bijna niet eens extra lastig met FAIR-data, Open Science-beleid en universitaire eisen. Dus laten we er eens echt in duiken.

Wat is het verschil tussen GitHub en GitLab toch weer?

Beide platformen zijn gebouwd op Git — het versiebeheersysteem dat wereldwijd door ongeveer 87% van de ontwikkelaars wordt gebruikt. Maar daar eindigt de gelijkenis ook al bijna.

GitHub is het grootste en bekendste platform ter wereld, met meer dan 100 miljoen gebruikers. Het is een beetje de Instagram van code: overal aanwezig, overal gebruikt, overal herkend. GitLab is kleiner, maar juist daarom vaak krachtiger als het om geïntegreerde workflows gaat.

GitHub is eigendom van Microsoft sinds 2018. Dat betrouwbaar? Ja. Maar het betekent ook dat je afhankelijk bent van de koers van een Amerikaans techbedrijf.

GitLab is een onafhankelijk bedrijf met een sterke open-source-kern — het hele platform is open source, wat voor onderzoekers die geloven in transparantie een sterk argument kan zijn.

Waarom kiezen onderzoekers nu juist voor GitLab?

Het grootste pluspunt van GitLab voor onderzoekers? Alles zit in één platform.

CI/CD-pipelines, issue tracking, wiki, code review, container registry — het is er allemaal standaard inbegrepen. Bij GitHub moet je daarvoor vaak naar externe tools of de betaalde versies, en dan heb je het nog steeds niet zo geïntegreerd. Stel: je hebt een Python-script dat data verwerkt en je wilt automatisch testen of het nog werkt elke keer als iets wijzigt. Met GitLab CI/CD zet je daar vijf minuten op neer.

Bij GitHub kun je dit ook, maar de gratis versie heeft minder minuten per maand en de setup is wat omslachtiger. En dan is er nog het punt van zelf hosten.

Veel Nederlandse universiteiten en onderzoeksinstellingen willen graag controle over waar hun data staat.

GitLab kun je zelf hosten op je eigen servers — volledig gratis. GitHub biedt dit alleen met GitHub Enterprise Server, en dat kost behoorlijk wat. Voor een onderzoeksgroep die gevoelige of persoonsgebonden data verwerkt, kan dit het verschil maken.

Maar GitHub heeft toch ook duidelijke voordelen?

Zeker! GitHub is ontzettend populair, en dat heeft praktische voordelen. Het grootste?

Je collega's kennen het. Je begeleider kent het. De ontwikkelaar op het lab naast de jouwe kent het.

De leercurve is laag, en de hoeveelheid tutorials, HOWTO's en community-ondersteuning is enorm.

GitHub heeft ook sterke functies voor open source en zichtbaarheid. GitHub Pages kun je gratis gebruiken om een projectwebsite te hosten — handig voor het publiceren van documentatie bij je onderzoek. GitHub Actions is een krachtig automatisatiesysteem dat steeds beter wordt. En het netwerkeffect is reëel: als je code op GitHub staat, vinden mee mensen het.

Daarnaast biedt GitHub gratis privé-repositories, zelfs in de gratis versie. Dat is fijn als je nog niet klaar bent om je code openbaar te maken — bijvoorbeeld als je artikel nog onder review staat.

Hoe zit het met Open Science en FAIR-data?

Hier wordt het echt interessant voor Nederlandse onderzoekers. Het Open Science-beleid in Nederland — gestimuleerd door de VSNU en verankerd in Plan S — vraagt om open toegankelijke en reproduceerbare onderzoeksresultaten. Beide platformen kunnen hier aan voldoen, maar op verschillende manieren.

GitLab biedt iets wat GitHub niet heeft: ingebouwde ondersteuning voor het koppelen van onderzoeksoutput aan persistent identifiers.

Je kunt eenvoudig DOIs koppelen aan releases via integraties met Zenodo of Figshare. GitHub heeft de integratie met Zenodo ook, maar de GitLab-setup is duidelijker gedocumenteerd voor onderzoeksgebruik.

Beide platformen ondersteunen het gebruik van licenties, contributor guidelines en code of conducts — allemaal onderdelen van de FAIR-principles voor software. Bij een vergelijking tussen open source en commerciële analyse-software valt echter op dat GitLab wat mij betreft een stapje verder gaat in het standaard aanbieden van templates voor onderzoeksprojecten.

Wat doen Nederlandse universiteiten eigenlijk?

Veel Nederlandse universiteiten bieden GitLab aan via hun eigen IT-diensten. Denk aan SURF, de gezamenlijke ICT-organisatie van Nederlandse onderwijs- en onderzoeksinstellingen.

Via SURF kun je soms toegang tot eigen GitLab-instances krijgen, wat betekent dat je code binnen de Nederlandse onderzoeksecosysteem blijft. GitHub wordt ook veel gebruikt, vaak als persoonlijk of project-specifiek platform. Sommige faculteiten of groepen hebben een GitHub-organisatie, maar dat is minder gestandaardiseerd dan GitLab-aanbod via de universiteit.

Dus wat moet jij kiezen?

Als je als beginnende onderzoeker gewoon een plek zoekt om je code te beheren en te delen: begin met GitHub. Het is eenvoudig, je kent het waarschijnlijk al, en het werkt goed voor kleine tot middelgrote projecten. Maar als je serieus bezig bent met reproduceerbare onderzoekssoftware — met automatische tests, CI/CD, goede documentatie, en je wilt binnen de Nederlandse onderzoeksecosysteem blijven: kijk zeker naar GitLab.

De geïntegreerde aanpak bespaart je tijd, en de mogelijkheid tot zelf hosten geeft je controle.

En het mooiste? Je hoeft niet te kiezen.

Gebruik GitHub voor zichtbaarheid en samenwerking met het bredere wereldwijde veld, en GitLab voor je interne workflow en pipeline. Veel onderzoekers doen dat in de praktijk. Het enige wat telt is dat je code goed beheerd, vindbaar en reproduceerbaar is. Of je nu kiest voor een vergelijking tussen Nextflow en Snakemake, de rest is slechts gereedschap.

Veelgestelde vragen

Welke platformen zijn geschikt voor onderzoekssoftware?

Bij het kiezen van een platform voor onderzoekssoftware is het belangrijk om te kijken of het platform de benodigde functionaliteiten biedt, zoals versiebeheer, CI/CD-pipelines en issue tracking. GitHub is populair, maar GitLab biedt vaak een meer geïntegreerde workflow, vooral voor onderzoekers die zelf controle willen over hun data.

Wat zijn de belangrijkste verschillen tussen GitHub en GitLab voor onderzoekers?

GitHub en GitLab zijn beide gebaseerd op Git, maar GitLab onderscheidt zich door de geïntegreerde workflows, inclusief CI/CD, issue tracking en container registry.

Waarom zou een Nederlandse onderzoeker voor GitLab kiezen?

Dit maakt het een aantrekkelijk alternatief voor onderzoekers die een alles-in-één oplossing zoeken, terwijl GitHub meer afhankelijk is van externe tools en betaalde versies. Onderzoekers in Nederland hebben vaak specifieke eisen met betrekking tot FAIR-data en Open Science-beleid. GitLab biedt de mogelijkheid om het platform zelf te hosten, wat cruciaal kan zijn voor de controle over data en het voldoen aan universitaire eisen, en daarmee een veilige optie is voor gevoelige onderzoeksgegevens.

Wat zijn de voordelen van GitHub ten opzichte van GitLab?

GitHub is zeer populair en kent een grote community, wat betekent dat er veel tutorials, HOWTO's en ondersteuning beschikbaar zijn. Dit maakt het gemakkelijk om te leren en te gebruiken, en collega's en begeleiders zijn waarschijnlijk al bekend met het platform, wat de overstap vereenvoudigt.

Wat zijn de nadelen van GitHub?

Omdat GitHub eigendom is van Microsoft, is er een afhankelijkheid van de koers van een Amerikaans techbedrijf. Daarnaast kan het voor onderzoeksgroepen die zelf data willen hosten, duurder zijn om dit te doen via GitHub Enterprise Server, in vergelijking met de gratis optie van GitLab.


Lieke de Vries
Lieke de Vries
Expert in Open Science principes

Lieke adviseert onderzoekers over het publiceren van FAIR data volgens de nieuwste normen.

Meer over Onderzoekssoftware en reproduceerbaarheid

Bekijk alle 28 artikelen in deze categorie.

Naar categorie →
Lees volgende
Waarom onderzoekssoftware ook FAIR moet zijn en niet alleen jouw data
Lees verder →