Rechterlijke uitspraak VS zet nieuw precedent auteursrecht bij trainingsdata AI

Al zolang de technologie publiek beschikbaar is, is auteursrecht een heet hangijzer bij kunstmatige intelligentie (AI). Zowel op de vraag of openbaar beschikbaar materiaal waar auteursrecht op richt zonder toestemming gebruikt mag worden als trainingsdata, als op de vraag of er auteursrecht geclaimd kan worden, en zo ja door wie, op materiaal dat geproduceerd is door generatieve AI, is nog geen sluitend antwoord. Een rechter in de Verenigde Staten heeft zich nu over de eerste vraag uitgesproken.

Header nieuwsartikel rechterlijke uitspraak auteursrecht AI training

Het ging om een zaak die uitgever Thomson Reuters had aangespannen tegen de AI-startup ROSS Intellligence. Thomson Reuters beheert het platform Westlaw, een online onderzoeksdatabase van wetten, rechterlijke uitspraken en nieuwsartikelen over de wet. ROSS Inteilligence is een AI-startup die producten en diensten hoopt te ontwikkelen waarin AI wordt gebruikt als aanvulling op de kennis en vaardigheden van de advocaat. De zaak die Thomson Reuters tegen ROSS heeft aangespannen was simpel - ROSS heeft de data van Westlaw gebruikt om hun AI te trainen, en heeft daarbij volgens de uitgever inbreuk gemaakt op het auteursrecht.

De AI die ROSS gebruikt als basis van hun product is gebaseerd op Natural Language Processing (NLP, in het Nederlands taaltechnologie). Dat houdt in dat hun product de taal, in dit geval de database van Westlaw, kan analyseren en interpreteren om vragen te beantwoorden. NLP modellen zijn bedoeld voor een specifieke toepassing, in dit geval het beantwoorden van juridische vragen. Ze zijn minder breed inzetbaar dan grote taalmodellen (LLMs) zoals bijvoorbeeld ChatGPT.

Centraal in de rechtszaak stond de zogenaamde fair use doctrine (doctrine van eerlijk gebruik). Dit is een leidend juridisch principe binnen vragen over auteursrecht in de Verenigde Staten. Om te kijken of het gebruik van auteursrechtelijk materiaal eerlijk is wordt er gekeken naar vier factoren:

  1. Wat is de doel van het gebruik? Gaat het om gebruik met een winstoogmerk, of is er bijvoorbeeld sprake van educatieve doeleinden? En is het gebruik voldoende transformatief? Is het eindproduct substantieel anders dan hetgeen waarop het oorspronkelijke auteursrecht lag?
  2. Wat is de aard van het werk? De jurisprudentie rond auteursrecht in de VS is gebaseerd op het gebruik van auteursrecht om creatieve expressie te beschermen. Creatief gebruik (bijvoorbeeld in een muzieknummer of een gefilmde scene) is daarom minder waarschijnlijk toegestaan dan feitelijk gebruik, bijvoorbeeld in een recensie.
  3. Hoeveel van het auteursrechtelijk materiaal wordt gebruikt? Wordt het geheel of gedeeltelijk gebruikt, en hoe belangrijk is het gebruikte materiaal voor het 'hart' van het materiaal waarop auteursrecht ligt?
  4. Heeft het gebruik van het auteursrechtelijk materiaal negatieve gevolgen voor de commerciële waarde van het materiaal?

Thomson Reuters had de rechter gevraagd om te oordelen over de vraag of het gebruik van hun Westlaw database een schending vormde van het auteursrecht op de database. ROSS had daarentegen hun eigen motie ingediend, waarin ze stelden dat er überhaupt geen auteursrecht op de database van Westlaw kon liggen, omdat de database slechts een compilatie is van het werk van anderen, zonder dat er genoeg eigen kennis en transformatie op werd toegepast. Omdat Westlaw in hun mening geen origineel product is, maar slechts een compilatie van bestaand werk, zou volgens ROSS überhaupt geen auteursrecht van toepassing zijn.

Het oordeel

Beide partijen hadden de rechter gevraagd om een eigen oordeel te vellen, een zogenaamd summary judgement. Dit houdt in dat de betrokken partijen stellen dat de feiten van een zaak dusdanig eenvoudig zijn dat de rechter hier zelf over kan oordelen, zonder dat de zaak wordt voorgelegd aan een jury. Op 11 februari 2025 heeft een federale rechter in Delaware deze uitspraak gedaan in de zaak.

Ten eerste heeft de rechter ook een uitspraak gedaan over de claim van ROSS dat er geen auteursrecht op Westlaw kan rusten. Deze vraag moest eerst beantwoord worden, om te kijken of Thomson Reuters überhaupt een zaak heeft. De rechter heeft besloten dat twee aspecten van de Westlaw database, de door medewerkers van Thomson Reuters geschreven samenvattingen in de vorm van hooofdnoten en het eigen nummeringssysteem voor de casussen die in de database opgenomen worden, voldoende transformatief zijn om Thomson Reuters in staat te stellen auteursrecht te claimen op het gehele corpus van de Westlaw database.

De conclusie van de rechter is dat op het eerste en vierde punt van de fair use doctrine het gelijk ligt bij Thomson Reuters, en bij punt twee en drie bij Ross. De rechter stelt echter dat de punten waarop Thomson Reuters gelijk heeft zwaarder wegen, en dat er daarom inderdaad sprake is van inbraak op het auteursrecht bij het gebruik van Westlaw om een AI te trainen.

Vier punten

Op het eerste punt stelt de rechter dat fair use niet van toepassing is, omdat ROSS het materiaal wil gebruiken voor een commercieel product dat direct concurreert met Westlaw. Ook stelt de rechter dat de output van het product van ROSS niet transformatief genoeg is.

Daarnaast heeft de rechter ook in punt vier geoordeeld dat ROSS geen aanspraak kan maken op fair use, omdat hun product rechtstreeks de concurrentie aangaat met Westlaw en dus negatieve gevolgen heeft voor de commerciële waarde van het gebruikte materiaal. De rechter gaat bovendien nog een stap verder, en stelt dat het onrechtmatig gebruik van Westlaw ook commerciële schade toebrengt doordat het de database minder waardevol maakt in het geval Thomson Reuters deze later wil gebruiken om zelf AI te trainen, of licenties wil verkopen voor AI training. 

Op het tweede punt van de fair use doctrine stelt de rechter dat de inhoud van Westlaw niet creatief genoeg is om te spreken van creatieve expressie. Daarnaast stelt de rechter op punt drie dat de hoeveelheid materiaal die ROSS gebruikt is binnen het criterium van redelijkheid valt. Op deze punten stelt de rechter dus ROSS in het gelijk. Omdat de eerste en vierde factor echter zwaarder wegen, heeft de rechter besloten dat het gebruik van Westlaw om een commerciële AI te trainen niet valt onder de fair use doctrine, en dus inbreuk maakt op het auteursrecht.

Gevolgen

Het is nog niet duidelijk in hoeverre deze uitspraak gevolgen zal hebben voor vergelijkbare lopende zaken. In het Amerikaanse rechtssysteem weegt jurisprudentie, het geheel van eerder genomen rechterlijke besluiten, zeer zwaar. Deze beslissing zal dus ook meegenomen worden in vergelijkbare rechtszaken over auteursrecht en het trainen van AI, zoals de rechtszaak die de New York Times heeft aangespannen tegen OpenAI.

In deze zaak stelt het moederbedrijf van de New York Times dat OpenAI inbreuk heeft gemaakt op het auteursrecht door de gehele database van New York Times artikelen op te nemen in de trainingsdata van hun AI. Ook in deze zaak beroept OpenAI zich op de fair use doctrine. De producten van OpenAI zijn echter LLMs, terwijl het bij ROSS om een NLP-product ging. De output van een LLM is over het algemeen meer transformatief dan dat van een NLP. Het is dus mogelijk dat het eerste punt van de fair use doctrine anders wordt toegepast op LLMs. Dit is een onderscheid dat de rechter heeft gemaakt in het oordeel in Thomson Reuters v. ROSS, en een verschil dat ook de advocaten van OpenAI al eerder benadrukt hebben.

De stelling die de rechter inneemt, dat toekomstig gebruik van auteursrechtelijk materiaal voor het trainen van AI een commerciële waarde heeft die beschadigd wordt bij ongeautoriseerd gebruik voor training, is een relatief nieuw idee dat ook grote gevolgen kan hebben. Gaan andere rechters hierin mee, dan zou dat betekenen dat in de toekomst alle AI bedrijven toestemming zouden moeten vragen om auteursrechtelijk materiaal te gebruiken in de training van het model.

Uiteraard geldt deze uitspraak alleen voor de Verenigde Staten. Dit neemt niet weg dat het ook in Europa grote gevolgen kan hebben, ook omdat een groot aantal aanbieders van AI-producten in Amerika gevestigd zijn en dus ook gebonden zullen zijn door Amerikaanse jurisprudentie.