Onderzoekssoftware en reproduceerbaarheid

Computational notebooks uitgelegd: Jupyter, R Markdown en Quarto voor reproduceerbaar onderzoek

Lieke de Vries Lieke de Vries
· · 7 min leestijd

Stel je voor: je bent maanden bezig met een onderzoek, draaiende analyses, prachtige grafieken, een helder verhaal. Dan vraagt iemand: "Kun je dat herbeleven?" En jij staat erbij met twintig losse scripts, een Excel-bestand waar niemand de herkomst van kent, en een half werkende pipeline. Klinkt herkenbaar?

Inhoudsopgave
  1. Wat zijn computational notebooks en waarom zijn ze zo belangrijk?
  2. Jupyter Notebooks: de grote naam in computational notebooks
  3. R Markdown: de favoriet onder R-gebruikers
  4. Quarto: de volgende generatie computational notebooks
  5. Welke notebook-tool past bij jouw onderzoek?
  6. Veelgestelde vragen

Precies daarom bestaan computational notebooks. Ze pakken code, tekst, resultaten en data samen in één document, zodat jouw onderzoek altijd en overal herhaalbaar is.

Dit is geen luxe. Voor wie serieus werkt aan reproduceerbaar onderzoek, is het een basisvereiste.

Wat zijn computational notebooks en waarom zijn ze zo belangrijk?

Computational notebooks zijn interactieve documenten waarin je code, uitleg, visualisaties en resultaten combineert. In plaats van losse scripts en losse documenten, werk je in één geheel. Je schrijft een stukje tekst, voert daaronder code uit, ziet het resultaat, en geeft er meteen context aan.

Voor wie Open Science en reproduceerbaarheid serieus neemt, is dat een gamechanger.

De kern is simpel: als iemand jouw notebook opent, moet die persoon jouw hele analyseslagen kunnen herhalen. Geen gokwerk, geen "even bellen met de auteur".

Gewoon openen, runnen, en hetzelfde resultaat krijgen. Dat is wat notebooks mogelijk maken, en dat is precies wat het onderzoeksveld nodig heeft.

Jupyter Notebooks: de grote naam in computational notebooks

Als het gaat over computational notebooks, dan is Jupyter waarschijnlijk de eerste naam die je tegenkomt. Jupyter is opensource en ondersteunt meer dan 40 programmeertalen, waaronder Python, R, Julia en Scala. De naam "Jupyter" is een verwijzing naar die drie kern-talen: Julia, Python en R.

Jupyter werkt met zogenaamde "cellen". Je hebt tekstvakken (in Markdown) en code-cellen.

Voer een cel uit, en het resultaat verschijnt er direct onder. Je kunt door een notebook heen werken alsof het een verhaal vertelt, met code en uitleg door elkaar.

Jupyter Notebook is de klassieker, maar JupyterLab is de modernere omgeving die meer lijkt op een volledige ontwikkelomgeving. Wil je weten hoe je een Jupyter notebook reproduceerbaar maakt? Het is gratis, heeft een enorme community, en integreert goed met tools als GitHub, Google Colab en Binder.

Met Binder kun je zelfs een Jupyter notebook online delen zodat anderen het kunnen uitvoeren zonder iets te installeren.

Voor onderzoekers die hun werk willen delen, is dat goud waard.

R Markdown: de favoriet onder R-gebruikers

Als je vooral werkt in R, dan is R Markdown waarschijnlijk jouw beste vriend.

R Markdown is een formaat van het R-pakket "rmd" en maakt het mogelijk om documenten te schrijven die R-code bevatten. Het resultaat? Rapporten, papers, zelfs hele boeken en presentaties, allemaal gegenereerd uit één enkel document. Het mooie van R Markdown is hoe soepel het werkt binnen RStudio, de populaire ontwikkelomgeving van Posit (voorheen RStudio).

Je schrijft tekst in Markdown, voegt R-codeblokken toe, en rendert het document naar HTML, PDF of Word. De code wordt uitgevoerd tijdens het renderen, dus je output is altijd actueel.

Geen handmatig grafieken kopiëren en plakken meer. R Markdown ondersteunt ook parameteriseerbare rapporten.

Dat betekent dat je één sjabloon kunt hebben en eenvoudig aanpast voor verschillende datasets of condities, zonder de code te wijzigen. Voor onderzoekers die vergelijkbare analyses herhalen, bespaart dat enorm veel tijd en voorkomt fouten.

Quarto: de volgende generatie computational notebooks

Quarto is de nieuwste speler en komt van dezelfde makers als R Studio, het bedrijf Posit. Het is ontworpen als opvolger en uitbreiding van R Markdown, maar dan voor meer talen.

Quarto ondersteunt Python, R, Julia en JavaScript, waardoor het een universeel gereedschap wordt voor computational notebooks.

Wat Quarto bijzonder maakt, is de flexibiliteit. Je kunt er notebooks mee maken, maar ook volledige websites, artikelen, boeken en zelfs interactieve dashboards. Het werkt naadloos met Jupyter Notebooks, dus je kunt bestaande .ipynb-bestanden gewoon openen en verwerken in Quarto.

De opdrachtregel-interface maakt het ook geschikt voor geautomatiseerde workflows en CI/CD-pipelines, wat voor grotere projecten essentieel is.

Quarto is opensource en groeit snel. Voor onderzoekers die op zoek zijn naar een toekomstbestendige oplossing die niet gebonden is aan één programmeertaal, is Quarto een logische keuze.

Welke notebook-tool past bij jouw onderzoek?

De keuze hangt af van jouw situatie. Wer je vooral in Python en wil je een enorme community en veel bestaande voorbeelden?

Dan is Jupyter een veilige en krachtige keuze. Zit je volop in R en werk je veel met statistische analyses en rapporten?

R Markdown biedt de meest soepele ervaring binnen die omgeving. Wil je een moderne, multitaaloplossing die meer kan dan alleen notebooks, en ben je klaar voor de volgende stap? Geef Quarto een kans. Maar ongeacht welke tool je kiest, het belangrijkste is dit: begin.

Combineer je code met uitleg, documenteer je stappen, en gebruik de beste tools voor reproduceerbaar onderzoek om je werk herhaalbaar te maken.

Dat is geen technische details, dat is goede wetenschappelijke praktijk. En met deze tools is het makkelijker ooit.

Veelgestelde vragen

Wat zijn de voordelen van computational notebooks voor onderzoek?

Computational notebooks bieden een gestroomlijnde manier om je onderzoek te documenteren en te organiseren, door code, uitleg, visualisaties en resultaten te combineren in één interactief document.

Wat is Jupyter Notebook en waarom is het populair?

Dit zorgt ervoor dat je analyses eenvoudig herhaalbaar zijn, wat essentieel is voor reproduceerbaarheid en open wetenschap. Jupyter Notebook is een webapplicatie die je in staat stelt om code, tekst en resultaten te combineren in een interactieve omgeving.

Hoe draagt R Markdown bij aan reproduceerbare onderzoeken?

Het is populair vanwege de ondersteuning voor diverse programmeertalen, de mogelijkheid om cellen in willekeurige volgorde uit te voeren en de integratie met tools zoals GitHub en Google Colab, waardoor het een ideale keuze is voor onderzoekers. R Markdown is een formaat dat je in staat stelt om documenten te schrijven die R-code bevatten, waardoor je rapporten, papers en presentaties kunt genereren vanuit één enkel document. Dit zorgt ervoor dat je analyses en resultaten consistent en reproduceerbaar zijn, wat cruciaal is voor wetenschappelijke publicaties. R Markdown is een gevestigd formaat dat sterk afhankelijk is van R.

Wat is het verschil tussen R Markdown en Quarto?

Quarto is een nieuwere optie die je in staat stelt om documenten te maken met code uit verschillende talen (zoals Python en Julia) zonder dat R nodig is.

Waarom is het belangrijk om computational notebooks te gebruiken in de wetenschap?

Dit maakt Quarto een flexibeler en toegankelijker alternatief voor R Markdown. Computational notebooks zijn essentieel voor het bevorderen van open wetenschap en reproduceerbaarheid, omdat ze onderzoekers in staat stellen hun analyses te documenteren, te delen en te herhalen. Door de workflow te centraliseren en de resultaten transparant te maken, dragen notebooks bij aan de betrouwbaarheid en validiteit van wetenschappelijke bevindingen.


Lieke de Vries
Lieke de Vries
Expert in Open Science principes

Lieke adviseert onderzoekers over het publiceren van FAIR data volgens de nieuwste normen.

Meer over Onderzoekssoftware en reproduceerbaarheid

Bekijk alle 28 artikelen in deze categorie.

Naar categorie →
Lees volgende
Waarom onderzoekssoftware ook FAIR moet zijn en niet alleen jouw data
Lees verder →