FAIR data en auteursrecht: van wie is de data die jij hebt verzameld

Stel: je verzamelt data voor je onderzoek. Je scrapt informatie van websites, combineert datasets, en maakt er iets moois van.

▶Inhoudsopgave

Wat is FAIR data eigenlijk?
Auteursrecht en data: een lastige combinatie
Data scraping: mag dat zomaar?
Van wie is jouw data dan echt?
Wat kun je doen om het juiste te doen?
De toekomst: meer openheid, maar ook meer duidelijkheid nodig
Veelgestelde vragen

Maar wacht — is die data eigenlijk van jou? En mag je dat wel? Bij FAIR data en auteursrecht zit je snel in een juridisch doolhof. Geen paniek. We leggen het gewoon uit.

Wat is FAIR data eigenlijk?

FAIR staat voor Findable, Accessible, Interoperable en Reusable. Het zijn principes die ervoor zorgen dat onderzoeksvindbaar, toegankelijk en herbruikbaar is.

In Nederland werken universiteiten, de VSNU en organisaties als DANS eraan om FAIR data de norm te maken. Plan S, het Europese Open Access-initiatief, duwt onderzoekers ook in die richting. Maar hier schuilt een addertje onder het gras: hoe makkelijk is het om data écht open en herbruikbaar te maken, als het auteursrecht je tegenhoudt?

Auteursrecht en data: een lastige combinatie

In Nederland geldt het auteursrecht automatisch. Je hoeft niets te registreren.

Zodra iets origineel is en een eigen creatieve keuze bevat, is het beschermd. Dat geldt voor teksten, afbeeldingen, maar ook voor databases.

Ja, echt waar — een dataset kan auteursrechtelijk beschermd zijn. Maar data zelf, losse feiten en cijfers, vallen niet onder het auteursrecht. Alleen de manier waarop ze zijn geselecteerd of gerangschikt, kan beschermd zijn. Dat maakt het lastig.

De database-recht: een extra beschermlaag

Want wanneer is iets nog "los data" en wanneer is het een beschermde database?

Daar komt nog bij k dat er in Europa een zogenaamd database-recht bestaat. Als je een substantiële investering hebt gedaan in het verzamelen, verifiëren of presenteren van data, heb je recht op bescherming — zelfs als er geen sprake is van creativiteit. Denk aan een uitgebreide dataset van klinische trials of milieumetingen. Die bescherming duurt vijftien jaar, maar kan elke keer opnieuw beginnen als je de database aanzienlijk vernieuwt.

Data scraping: mag dat zomaar?

Data scraping — het automatisch verzamelen van informatie van websites — staat volop in de schijnwerpers. De Autoriteit Persoonsgegevens heeft meerdere malen aangegeven dat deze praktijk vrijwel altijd illegaal is, vooral als het om persoonsgegevens gaat.

Maar ook zonder persoonsgegevens zit het juridisch niet voor de poos. Veel websites hebben gebruiksvoorwaarden die expliciet verbieden om data te scrapen.

Wat zegt de wet over hergebruik van data?

Als je die voorwaarden accepteert — vaak zonder het te weten — dan ben je er aan gebonden. En in sommige gevallen kan het zelfs een inbreuk op het database-recht opleveren. De Europese Databankenrichtlijn uit 1996 geeft de maker van een database het recht om het hergebruik van een substantieel deel van de inhoud te verbieden, ook bij data die achter een login zit.

"Substantieel" is hier het sleutelwoord. Er is geen vast percentage, maar hoe meer je pakt, hoe groter de kans op problemen. Goed nieuws: er zijn uitzonderingen. Voor wetenschappelijk onderzoek geldt sinds de Europese DSM-richtlijn van 2019 een tekst- en data-mining-uitzondering.

Onderzoekers mogen in bepaalde gevallen data scrapen voor wetenschappelijke doeleinden, mits de data legaal toegankelijk was.

Maar let op: die uitzondering geldt niet voor commercieel onderzoek.

Van wie is jouw data dan echt?

Dat hangt af van een paar dingen. Laten we het stap voor stap bekijken.

1. Heb je de data zelf verzameld?

Als je data zelf verzamelt — bijvoord door metingen, enquêtes of observaties — dan ben je in beginsel de maker. Maar let op: als je die data organiseert in een creatieve of substantiële manier, ontstaat er mogelijk database-recht.

2. Gebruik je data van anderen?

Dat betekent dat jij er bescherming op hebt, maar ook dat anderen jouw data niet zomaar mogen hergebruiken. Als je datasets van anderen gebruikt, moet je kijken naar de geldende licentievoorwaarden voor onderzoeksdata. Steeds vaker krijgen onderzoekers data onder een Creative Commons-licentie. CC0 betekent: doe ermee wat je wilt.

CC-BY betekent: gebruik het, maar vermeld de bron. En sommige datasets hebben volledig eigen voorwaarden die hergebruik beperken.

FAIR data gaat over vindbaarheid en herbruikbaarheid, maar het zegt niets over het juridische kader. Dat moet je zelf uitzoeken. Check altijd de licentie voordat je data hergebt.

Dan wordt het echt ingewikkeld. Stel: je combineert een open dataset met een beschermde database en eigen metingen.

3. Combineer je data uit meerdere bronnen?

Het resultaat is een nieuwe dataset, maar de rechten van de oorspronkelijke makers blijven bestaan.

Je kunt niet zomaar doen alsof die rechten er niet zijn.

Wat kun je doen om het juiste te doen?

Geen zorgen, het is niet allemaal onmogelijk. Hier een paar concrete tips.

Check altijd de licentie. Voordat je data gebruikt, kijk naar de gebruiksvoorwaarden of licentie. Bij twijfel: neem contact op met de eigenaar.
Documenteer je dataverzameling. Hoe beter je bijhoudt waar je data vandaan komt, hoe makkelijker je later kunt aantonen dat je het legitiem hebt gedaan.
Gebruik open licenties voor je eigen data. Wil je dat anderen jouw data kunnen hergebruiken? Kies dan bewust voor CC0 of CC-BY. Dat draagt bij aan de FAIR-principes.
Raadpleeg je juridische dienst. Bij grote projecten of commercieel onderzoek is het slim om advies in te winnen. Universiteiten hebben vaak een juridische afdeling die hier mee helpt.
Wees transparant. Vermeld altijd duidelijk waar je data vandaan komt en onder welke voorwaarden je het deelt. Dat is niet alleen juridisch verstandig, maar ook goede wetenschappelijke praktijk.

De toekomst: meer openheid, maar ook meer duidelijkheid nodig

De trend is duidelijk: data moet open, vindbaar en herbruikbaar zijn. FAIR-data, Open Science, Plan S — het gaat allemaal in de richting van meer transparantie. Maar het juridische kader loopt achterop.

Auteursrecht en database-recht zijn bedacht in een tijd dat niemand had gedacht aan machine learning, AI-training op grote datasets of automatische data-scraping.

De Europese Data Act en de AI Act proberen die kloof te dichten, maar voor onderzoekers is het nu nog vaak gokwerk. Daarom is het belangrijk om bewust om te gaan met data — niet alleen vanuit wetenschappelijk oogpunt, maar ook juridisch.

Want uiteindelijk draait het om één simpele vraag: van wie is de data die jij hebt verzameld? Als je die vraag kunt beantwoorden — en aantonen — dan zit je goed. Wil je weten wat de nieuwe Europese regels voor AI-trainingssets voor jouw onderzoek betekenen?

Veelgestelde vragen

Kan ik legaal data verzamelen via scraping?

Data scraping is een complexe kwestie. Hoewel het automatisch verzamelen van informatie vaak illegaal is, vooral bij persoonsgegevens, verbieden veel websites het expliciet in hun gebruiksvoorwaarden.

Wat houdt FAIR data precies in en waarom is het belangrijk?

Het negeren van deze voorwaarden kan leiden tot juridische problemen, waaronder een inbreuk op het database-recht, dus het is cruciaal om de regels van de website te respecteren. FAIR staat voor Findable, Accessible, Interoperable en Reusable. Deze principes zijn essentieel voor onderzoek, omdat ze ervoor zorgen dat data gemakkelijk te vinden, toegankelijk, bruikbaar en samen te voegen is.

Wanneer kan een dataset beschermd zijn door het auteursrecht?

In Nederland werken universiteiten en organisaties aan het implementeren van FAIR data, mede dankzij initiatieven zoals Plan S, maar auteursrechtelijke beperkingen kunnen de herbruikbaarheid bemoeilijken.

Wat is het database-recht en hoe beïnvloedt het datahergebruik?

Hoewel losse feiten en cijfers niet onder het auteursrecht vallen, kan de manier waarop data is geselecteerd, gerangschikt of gecombineerd beschermd zijn. Dit geldt met name voor uitgebreide datasets, zoals klinische trials of milieumetingen, waar een aanzienlijke investering in verzamelen en verifiëren is gedaan. Het database-recht biedt in dat geval extra bescherming.

Het database-recht beschermt de maker van een database tegen ongewenste hergebruik van een substantieel deel van de inhoud, zelfs als er geen sprake is van creativiteit. Dit recht kan vijftien jaar duren en kan opnieuw beginnen als de database aanzienlijk wordt vernieuwd, zoals bij datasets van klinische trials of milieumetingen.

Kan data eigendom zijn, en zo ja, wat betekent dat?

Eigendom van data, zoals een lijst met namen of IP-adressen, bestaat niet in de zin dat je anderen kunt verbieden het gebruik ervan.

Losse data heeft weinig waarde, maar in combinatie met andere data kan informatie ontstaan die waardevol is. Het is dus belangrijk om te begrijpen hoe data gebruikt kan worden binnen de juridische kaders van FAIR data en auteursrecht.