Merriam-Webster, de toonaangevende uitgever van Engelse woordenboeken, is samen met het moederbedrijf Encyclopedia Britannica een juridische strijd begonnen tegen OpenAI, de maker van de populaire AI-chatbot ChatGPT. De rechtszaak beschuldigt OpenAI ervan illegaal auteursrechtelijk beschermd materiaal te gebruiken om zijn AI-model te trainen, waardoor het in feite meelift op het intellectuele eigendom van het woordenboek.

Kernbeschuldigingen: ongeoorloofd kopiëren en reproductie van uitvoer

De kern van de klacht draait om de bewering dat OpenAI zonder toestemming meer dan 100.000 artikelen, encyclopedie-items en woordenboekdefinities uit online bronnen heeft geschrapt. Deze gegevens werden vervolgens gebruikt om ChatGPT te trainen, waardoor het antwoorden kon genereren die de originele auteursrechtelijk beschermde inhoud direct repliceren of nauw nabootsen.

Volgens de rechtszaak schendt OpenAI het auteursrecht op drie cruciale manieren:
1. Grootschalig kopiëren van beschermd materiaal.
2. Deze inhoud gebruiken voor AI-training.
3. Uitvoer genereren die te veel op de originele tekst lijkt.

Verkeersomleiding en AI-hallucinaties

Merriam-Webster stelt dat het vermogen van ChatGPT om woordenboekdefinities en andere inhoud samen te vatten verkeer kannibaliseert van zijn eigen website, waardoor de uitgever inkomsten wordt ontnomen. Bovendien beweert de rechtszaak dat ChatGPT soms ‘AI-hallucinaties’ produceert – verzonnen reacties die worden gegenereerd wanneer de AI niet over voldoende informatie beschikt – waarbij de gegevens uit het woordenboek als misleidende basis worden gebruikt.

De klacht beweert verder dat ChatGPT regelmatig onvolledige of onnauwkeurige uitleg geeft door selectief delen van de inhoud van het woordenboek weg te laten, waardoor gebruikers worden misleid.

Juridische eisen en implicaties

De eisers eisen een financiële compensatie voor de vermeende schending van het auteursrecht en een permanent bevel om te voorkomen dat OpenAI deze praktijken voortzet.

De zaak is belangrijk omdat het de grenzen van fair use in AI-training opzoekt. Indien succesvol zou de rechtszaak een precedent kunnen scheppen dat AI-ontwikkelaars dwingt om expliciete toestemming te verkrijgen voordat ze auteursrechtelijk beschermd materiaal in hun modellen gebruiken, waardoor de toekomst van de AI-ontwikkeling mogelijk opnieuw wordt vormgegeven. OpenAI heeft nog niet gereageerd op de rechtszaak.

Deze juridische botsing benadrukt de groeiende spanning tussen intellectuele eigendomsrechten en de snelle vooruitgang van AI-technologieën. De uitkomst zal waarschijnlijk een belangrijke standaard vormen voor de manier waarop auteursrechtelijk beschermd materiaal kan worden gebruikt bij de training van grote taalmodellen.