Merriam-Webster, editora líder de dicionários de inglês, juntamente com sua controladora Encyclopedia Britannica, lançaram uma batalha legal contra OpenAI, o criador do popular chatbot de IA ChatGPT. O processo acusa a OpenAI de usar ilegalmente material protegido por direitos autorais para treinar seu modelo de IA, efetivamente “aproveitando” a propriedade intelectual do dicionário.
Alegações principais: cópia não autorizada e reprodução de saída
O núcleo da reclamação centra-se na alegação de que a OpenAI extraiu mais de 100.000 artigos, entradas de enciclopédias e definições de dicionários de fontes online sem permissão. Esses dados foram então usados para treinar o ChatGPT, permitindo-lhe gerar respostas que replicam diretamente ou imitam o conteúdo original protegido por direitos autorais.
De acordo com o processo, a OpenAI viola os direitos autorais de três maneiras críticas:
1. Cópia em grande escala de materiais protegidos.
2. Usando este conteúdo para treinamento de IA.
3. Gerando resultados muito semelhantes ao texto original.
Desvio de tráfego e alucinações de IA
Merriam-Webster argumenta que a capacidade do ChatGPT de resumir definições de dicionário e outros conteúdos canibaliza o tráfego de seu próprio site, privando o editor de receita. Além disso, o processo alega que o ChatGPT por vezes produz “alucinações de IA” – respostas fabricadas geradas quando a IA não tem informação suficiente – usando os dados do dicionário como base enganosa.
A reclamação afirma ainda que o ChatGPT frequentemente apresenta explicações incompletas ou imprecisas ao omitir seletivamente partes do conteúdo do dicionário, enganando os usuários no processo.
Exigências e Implicações Legais
Os demandantes estão buscando compensação financeira pela suposta violação de direitos autorais e uma liminar permanente para impedir que a OpenAI continue com essas práticas.
O caso é significativo porque testa os limites do uso justo no treinamento de IA. Se for bem-sucedido, o processo poderá estabelecer um precedente que forçará os desenvolvedores de IA a obter permissão explícita antes de usar materiais protegidos por direitos autorais em seus modelos, potencialmente remodelando o futuro do desenvolvimento de IA. A OpenAI ainda não respondeu ao processo.
Este conflito jurídico realça a tensão crescente entre os direitos de propriedade intelectual e o rápido avanço das tecnologias de IA. O resultado provavelmente estabelecerá um padrão fundamental sobre como os materiais protegidos por direitos autorais podem ser usados no treinamento de grandes modelos linguísticos.




















