Adobe wordt nu geconfronteerd met een voorgestelde class action-rechtszaak waarin wordt beweerd dat het illegaal auteursrechtelijk beschermde boeken heeft gebruikt, waaronder werken van auteur Elizabeth Lyon, om een van zijn kunstmatige intelligentie (AI)-modellen te trainen. De kern van het geschil draait om het SlimLM-programma van Adobe, een taalmodel dat is ontworpen voor documentondersteuning, en de dataset die is gebruikt om dit te ontwikkelen.
De beschuldigingen: illegale boeken voeden AI
De rechtszaak beweert dat Adobe gebruik heeft gemaakt van een dataset met illegaal materiaal, met name een gemanipuleerde versie van de controversiële ‘Books3’-collectie, die uit 191.000 boeken bestaat. Deze dataset werd geïntegreerd in SlimPajama-627B, de open-source dataset die Adobe gebruikte voor de pre-training van SlimLM. Lyon beweert dat haar eigen auteursrechtelijk beschermde reisgidsen in deze illegaal verkregen trainingsgegevens zijn opgenomen.
Waarom dit ertoe doet: het AI-auteursrechtdebat
Deze zaak benadrukt een groeiende bezorgdheid binnen de technologie-industrie: de ethische en juridische implicaties van het gebruik van auteursrechtelijk beschermd materiaal om AI-modellen te trainen. Veel generatieve AI-systemen zijn afhankelijk van enorme datasets die van internet worden geplukt, vaak inclusief boeken, artikelen en afbeeldingen zonder expliciete toestemming van auteursrechthouders. De wettigheid van dergelijke praktijken blijft omstreden, waarbij meerdere rechtszaken de aanpak van de sector in twijfel trekken.
Bredere juridische uitdagingen op het gebied van AI
Adobe is niet de enige die met kritiek wordt geconfronteerd. Soortgelijke rechtszaken zijn aangespannen tegen Apple en Salesforce, die er beiden van worden beschuldigd hun AI-modellen te hebben getraind op auteursrechtelijk beschermde inhoud afkomstig uit datasets als RedPajama (die is gekoppeld aan Books3). Deze gevallen testen de grenzen van eerlijk gebruik en auteursrechtwetgeving in het tijdperk van generatieve AI.
De centrale vraag is of bedrijven kunnen profiteren van AI die is getraind op gestolen intellectueel eigendom. De uitkomst van deze rechtszaken zou de toekomst van AI-ontwikkeling opnieuw vorm kunnen geven.
De rechtszaak tegen Adobe onderstreept de toenemende juridische risico’s voor technologiebedrijven die graag AI willen inzetten zonder de onderliggende auteursrechtproblemen aan te pakken. Naarmate meer auteurs en makers deze praktijken in twijfel trekken, wordt de industrie mogelijk gedwongen om transparantere en juridisch conforme datasourcingmethoden toe te passen.
