FAIR data principes in de praktijk

Linked data en FAIR: wanneer wordt jouw dataset onderdeel van het semantisch web

Lieke de Vries Lieke de Vries
· · 8 min leestijd

Stel je voor: je hebt een dataset. Prachtig verzorgd, netjes opgeslagen, en je bent er best trots op. Maar als niemand hem kan vinden, begrijpen of hergebruiken, dan ligt die dataset eigenlijk gewoon te slapen.

Inhoudsopgave
  1. Wat zijn FAIR-data eigenlijk, en waarom zou je dat willen?
  2. Linked data: de technologie die data met elkaar verbindt
  3. Waar komen FAIR en linked data samen?
  4. Het semantisch web: waarom jouw dataset daarheen moet
  5. Concreet beginnen: van dataset naar linked data
  6. Waarom het nu de moeite waard is
  7. Veelgestelde vragen

Precies dat probleem pakken linked data en de FAIR-principes samen op. En eigenlijk is het best wel spannend hoe die twee elkaar versterken.

Laten we er eens in duiken.

Wat zijn FAIR-data eigenlijk, en waarom zou je dat willen?

FAIR staat voor Findable, Accessible, Interoperable en Reusable. Die vier principes zijn bedacht om onderzoeksbeter bruikbaar te maken, niet alleen voor jezelf, maar voor iedereen.

Het idee is simpel: data moet vindbaar zijn, toegankelijk, uitwisselbaar met andere systemen, en makkelijk te hergebruiken. In Nederland wordt dit steeds belangrijker, mede door de Nederlandse Open Science-community en initiatieven van de VSNU die onderzoekers helpen om hun data écht open en bruikbaar te maken. Maar hier wordt het interessant. FAIR zegt wat je moet bereiken, maar niet altijd hoe. En dat is precies waar linked data om de hoek komt kijken.

Linked data: de technologie die data met elkaar verbindt

Linked data is een manier om informatie op het web zó te structureren dat computers én mensen de verbanden tussen data kunnen begrijpen. In plaats van data in losse bestanden of databases te stoppen, verbind je ze met gestandaardiseerde links.

Denk aan het World Wide Web, maar dan niet voor webpagina's, maar voor losse data-punten. De kern van linked data zijn URIs (Uniform Resource Identifiers). Elk stukje data krijgt een unieke webadres.

En via RDF (Resource Description Framework) beschrijf je de relaties tussen die data.

Bijvoorbeeld: "Deze dataset is gemaakt door persoon X" of "Deze meting hoort bij onderzoek Y." Die relaties zijn leesbaar voor machines, waardoor systemen automatisch kunnen begrijpen wat jouw data betekent en hoe het zich verhoudt tot andere data. Tim Berners-Lee, de uitvinder van het web, bedacht dit concept al in 2006. Hij stelde een vijfsterren-schaal voor voor open linked data. Van ster één (data online zetten) tot ster vijf (data verbinden met andere linked data op het web). Hoe meer sterren, hoe rijker je data in het semantisch web.

Waar komen FAIR en linked data samen?

Hier wordt het echt goed. Kijk eens naar de FAIR-principes door de bril van linked data:

Findable (Vindbaar): Linked data maakt je dataset vindbaar door het een unieke URI te geven. Daarnaast gebruik je gestandaardiseerde metadata, bijvoorbeeld via Dublin Core of schema.org, zodat zoekmachines en onderzoekers je data kunnen ontdekken. Accessible (Toegankelijk): Met linked data ben je afhankelijk van webstandaarden zoals HTTP. Dat betekent dat je data via protocollen opvraagbaar is.

Je bepaalt zelf wie toegang heeft, maar de techniek staat altijd klaar. Interoperable (Uitwisselbaar): Dit is waar linked data echt schijnt. Door gebruik te maken van gedeelde vocabulariums en ontologieën, zoals SKOS of OWL, spreekt je data dezelfde taal als andere datasets.

Geen babbeltonen meer, maar één gemeenschappelijke standaard. Reusable (Herbruikbaar): Duidelijke licenties en rijke metadata maken het voor anderen makkelijk om jouw data te begrijpen en te hergebruiken.

Linked data zorgt ervoor dat de context van je data mee wordt meegegeven, zodat niemand in het duister tast. Dit wordt ook cruciaal voor FAIR data voor AI-trainingssets die aan de nieuwe Europese regels moeten voldoen.

Het semantisch web: waarom jouw dataset daarheen moet

Het semantisch web is eigenlijk het doel. Het is een web waar data niet alleen voor mensen leesbaar is, maar waar machines de betekenis van data begrijpen.

Jouw dataset wordt dan onderdeel van een gigantisch netwerk van onderling verbonden kennis.

Dat klinkt groot, en dat is het ook. Maar het begint met kleine stappen. In Nederland zijn er al mooie voorbeelden.

De Koninklijke Bibliotheek maakt bibliografische data beschikbaar als linked data. Geonovus werkt aan het koppelen van geografische datasets. En universiteiten geven steeds vaker hun onderzoekskoppelingen via linked data vorm, wat direct bijdraagt aan FAIR data en reproduceerbaar onderzoek. De GO FAIR Foundation en het Research Data Alliance (RDA) bieden internationale richtlijnen en community-ondersteuning om deze overgang te maken. In Nederland speelt de VSNU een belangrijke rol in het verbinden van universiteiten rondom Open Science en FAIR-data.

Concreet beginnen: van dataset naar linked data

Je hoeft niet van de ene op de andere dag alles om te gooien. Begin met deze stappen:

Geef je data een URI. Elk onderwerp, elke dataset, elke persoon krijgt een unieke identificatie die via het web opvraagbaar is.

Kies bestaande vocabulariums. Je hoeft niet alles zelf te verzinnen. Gebruik standaarden zoals Dublin Core voor basisbeschrijvingen, of domeinspecifieke ontologieën die al bestaan in jouw vakgebied. Publiceer in RDF-formaat. RDF, Turtle of JSON-LD zijn gangbare formaten. Tools zoals Apache Jena of GraphDB helpen je data te publiceren en te beheren. Link naar andere datasets. Dit is de magie.

Wijs vanuit je data naar gerelateerde datasets elders op het web. Zo groeit jouw data organisch mee naar het semantisch web.

Waarom het nu de moeite waard is

De druk om FAIR te werken neemt toe. Financiers zoals NWO en de Europese Commissie vragen steeds vaker een data management plan waarin het verschil tussen FAIR en open data een rol speelt.

Als je nu al linked data inbouwt, ben je voorbereid op die eisen. Bovendien vergroot je de zichtbaarheid en impact van je onderzoek aanzienlijk. Jouw dataset hoeft niet in een hoekje te verstoffen.

Met linked data en FAIR wordt het een levend onderdeel van het semantisch web.

En dat is niet alleen goed voor de wetenschap, maar ook voor jouw reputatie als onderzoeker. Dus: begin vandaag. Geef je data een URI, kies je vocabularium, en maak die eerste verbinding. Het semantisch web wacht op jou.

Veelgestelde vragen

Wat zijn FAIR-data precies en waarom is het belangrijk voor onderzoekers?

FAIR-data, oftewel Findable, Accessible, Interoperable en Reusable, is een set van principes die ervoor zorgen dat onderzoeksdata niet verloren gaat, maar makkelijk te vinden, te gebruiken en te delen is.

Wat is linked data en hoe helpt het bij het bereiken van FAIR-principes?

Door data in deze vorm te publiceren, kunnen onderzoekers wereldwijd profiteren van de resultaten en samenwerken op een efficiëntere manier. Linked data is een manier om data te structureren en te verbinden met behulp van unieke webadressen (URIs) en gestandaardiseerde relaties (via RDF).

Hoe worden data vindbaar met linked data?

Dit maakt het mogelijk dat computers de betekenis van de data begrijpen en automatisch verbanden leggen, wat essentieel is voor de vindbaarheid en interoperabiliteit van FAIR-data. Met linked data krijgt elke dataset een unieke URI, zoals een webadres, waardoor ze makkelijk te vinden zijn via zoekmachines en andere systemen. Daarnaast worden gestandaardiseerde metadata, zoals Dublin Core of schema.org, gebruikt om de data verder te beschrijven en te categoriseren, zodat ze beter doorzoekbaar zijn. Linked data is gebaseerd op technologieën zoals HTTP, RDF en URI's.

Wat zijn de technische basisprincipes van linked data?

Deze worden gebruikt om data te publiceren op een manier die automatisch door computers kan worden gelezen en verwerkt, waardoor de data niet alleen vindbaar, maar ook uitwisselbaar en hergebruikbaar is.

Wat is het verschil tussen open data en linked data?

Open data is data die vrij beschikbaar is voor iedereen, zonder specifieke koppelingen. Linked data daarentegen, is data die op een specifieke manier is gestructureerd en verbonden met andere data, waardoor het automatisch door computers kan worden begrepen en gebruikt. Het is dus een manier om open data nog bruikbaarder te maken.


Lieke de Vries
Lieke de Vries
Expert in Open Science principes

Lieke adviseert onderzoekers over het publiceren van FAIR data volgens de nieuwste normen.

Meer over FAIR data principes in de praktijk

Bekijk alle 42 artikelen in deze categorie.

Naar categorie →
Lees volgende
Wat zijn FAIR data principes en waarom doet elke Nederlandse onderzoeker er iets mee in 2026
Lees verder →