Merriam-Webster, la principal editorial de diccionarios de inglés, junto con su empresa matriz Encyclopedia Britannica, han lanzado una batalla legal contra OpenAI, el creador del popular chatbot de IA ChatGPT. La demanda acusa a OpenAI de utilizar ilegalmente material protegido por derechos de autor para entrenar su modelo de IA, aprovechando efectivamente la propiedad intelectual del diccionario.

Acusaciones principales: copia y reproducción no autorizadas

El núcleo de la queja se centra en la afirmación de que OpenAI extrajo más de 100.000 artículos, entradas de enciclopedias y definiciones de diccionarios de fuentes en línea sin permiso. Luego, estos datos se utilizaron para entrenar ChatGPT, lo que le permitió generar respuestas que replican directamente o imitan fielmente el contenido original protegido por derechos de autor.

Según la demanda, OpenAI viola los derechos de autor de tres maneras críticas:
1. Copia masiva de materiales protegidos.
2. Usar este contenido para el entrenamiento de IA.
3. Generar resultados que sean demasiado similares al texto original.

Desvío de tráfico y alucinaciones de IA

Merriam-Webster sostiene que la capacidad de ChatGPT para resumir definiciones de diccionarios y otro contenido canibaliza el tráfico de su propio sitio web, privando al editor de ingresos. Además, la demanda afirma que ChatGPT a veces produce “alucinaciones de IA” (respuestas fabricadas generadas cuando la IA carece de información suficiente) utilizando los datos del diccionario como base engañosa.

La denuncia afirma además que ChatGPT presenta con frecuencia explicaciones incompletas o inexactas al omitir selectivamente partes del contenido del diccionario, engañando a los usuarios en el proceso.

Demandas e implicaciones legales

Los demandantes buscan una compensación financiera por la supuesta infracción de derechos de autor y una orden judicial permanente para impedir que OpenAI continúe con estas prácticas.

El caso es significativo porque pone a prueba los límites del uso legítimo en el entrenamiento de IA. Si tiene éxito, la demanda podría sentar un precedente que obligue a los desarrolladores de IA a obtener un permiso explícito antes de utilizar materiales protegidos por derechos de autor en sus modelos, lo que podría remodelar el futuro del desarrollo de la IA. OpenAI aún tiene que responder a la demanda.

Este choque legal pone de relieve la creciente tensión entre los derechos de propiedad intelectual y el rápido avance de las tecnologías de IA. El resultado probablemente establecerá un estándar clave sobre cómo se pueden utilizar los materiales protegidos por derechos de autor en la formación de grandes modelos lingüísticos.