Merriam-Webster, le principal éditeur de dictionnaires anglais, aux côtés de sa société mère Encyclopedia Britannica, a lancé une bataille juridique contre OpenAI, le créateur du populaire chatbot IA ChatGPT. Le procès accuse OpenAI d’utiliser illégalement du matériel protégé par le droit d’auteur pour entraîner son modèle d’IA, « free ride » sur la propriété intellectuelle du dictionnaire.
Allégations principales : copie et reproduction non autorisées
Le cœur de la plainte porte sur l’affirmation selon laquelle OpenAI aurait extrait plus de 100 000 articles, entrées d’encyclopédie et définitions de dictionnaire de sources en ligne sans autorisation. Ces données ont ensuite été utilisées pour entraîner ChatGPT, lui permettant de générer des réponses qui repliquent directement ou imitent étroitement le contenu original protégé par le droit d’auteur.
Selon le procès, OpenAI viole le droit d’auteur de trois manières critiques :
1. Copie à grande échelle de documents protégés.
2. Utilisation de ce contenu pour la formation en IA.
3. Générer des résultats trop similaires au texte original.
Détournement de trafic et hallucinations de l’IA
Merriam-Webster fait valoir que la capacité de ChatGPT à résumer les définitions de dictionnaires et d’autres contenus cannibalise le trafic de son propre site Web, privant l’éditeur de revenus. De plus, le procès affirme que ChatGPT produit parfois des « hallucinations de l’IA » – des réponses fabriquées générées lorsque l’IA manque d’informations suffisantes – en utilisant les données du dictionnaire comme base trompeuse.
La plainte affirme en outre que ChatGPT présente fréquemment des explications incomplètes ou inexactes en omettant sélectivement des parties du contenu du dictionnaire, induisant ainsi les utilisateurs en erreur.
Exigences juridiques et implications
Les plaignants demandent une compensation financière pour la violation présumée du droit d’auteur et une injonction permanente pour empêcher OpenAI de poursuivre ces pratiques.
L’affaire est importante car elle teste les limites de l’utilisation équitable dans la formation à l’IA. En cas de succès, le procès pourrait créer un précédent qui obligerait les développeurs d’IA à obtenir une autorisation explicite avant d’utiliser des éléments protégés par le droit d’auteur dans leurs modèles, ce qui pourrait potentiellement remodeler l’avenir du développement de l’IA. OpenAI n’a pas encore répondu au procès.
Ce conflit juridique met en évidence la tension croissante entre les droits de propriété intellectuelle et l’avancée rapide des technologies de l’IA. Le résultat établira probablement une norme clé sur la manière dont les matériaux protégés par le droit d’auteur peuvent être utilisés dans la formation de grands modèles de langage.





















