Merriam-Webster, der führende Verlag für englische Wörterbücher, hat zusammen mit seiner Muttergesellschaft Encyclopedia Britannica einen Rechtsstreit gegen OpenAI, den Entwickler des beliebten KI-Chatbots ChatGPT, eingeleitet. In der Klage wird OpenAI vorgeworfen, illegal urheberrechtlich geschütztes Material zum Trainieren seines KI-Modells zu verwenden und damit effektiv das geistige Eigentum des Wörterbuchs auszunutzen.
Kernvorwürfe: Unerlaubtes Kopieren und Vervielfältigen von Ausgaben
Der Kern der Beschwerde konzentriert sich auf die Behauptung, dass OpenAI ohne Erlaubnis über 100.000 Artikel, Enzyklopädieeinträge und Wörterbuchdefinitionen aus Online-Quellen gecrawlt habe. Diese Daten wurden dann verwendet, um ChatGPT zu trainieren und es ihm zu ermöglichen, Antworten zu generieren, die den ursprünglichen urheberrechtlich geschützten Inhalt direkt replizieren oder genau nachahmen.
Der Klage zufolge verstößt OpenAI auf drei entscheidende Weise gegen das Urheberrecht:
1. Massenkopieren geschützter Materialien.
2. Verwendung dieser Inhalte für das KI-Training.
3. Ausgaben generieren, die dem Originaltext zu ähnlich sind.
Verkehrsumleitung und KI-Halluzinationen
Merriam-Webster argumentiert, dass die Fähigkeit von ChatGPT, Wörterbuchdefinitionen und andere Inhalte zusammenzufassen, den Verkehr von der eigenen Website ausschlachtet und dem Herausgeber Einnahmen entzieht. Darüber hinaus wird in der Klage behauptet, dass ChatGPT manchmal „KI-Halluzinationen“ erzeugt – erfundene Reaktionen, die generiert werden, wenn der KI nicht genügend Informationen vorliegen – und dabei die Daten des Wörterbuchs als trügerische Grundlage nutzt.
In der Beschwerde wird außerdem behauptet, dass ChatGPT häufig unvollständige oder ungenaue Erklärungen präsentiert, indem Teile des Wörterbuchinhalts selektiv weggelassen werden, was die Benutzer dabei irreführt.
Rechtliche Anforderungen und Auswirkungen
Die Kläger fordern eine finanzielle Entschädigung für die angebliche Urheberrechtsverletzung und eine dauerhafte einstweilige Verfügung, um OpenAI daran zu hindern, diese Praktiken fortzusetzen.
Der Fall ist bedeutsam, weil er die Grenzen der fairen Nutzung im KI-Training auf die Probe stellt. Im Erfolgsfall könnte die Klage einen Präzedenzfall schaffen, der KI-Entwickler dazu zwingt, eine ausdrückliche Genehmigung einzuholen, bevor sie urheberrechtlich geschütztes Material in ihren Modellen verwenden, was möglicherweise die Zukunft der KI-Entwicklung verändern könnte. OpenAI hat noch nicht auf die Klage reagiert.
Dieser rechtliche Konflikt verdeutlicht die wachsende Spannung zwischen geistigen Eigentumsrechten und der rasanten Weiterentwicklung der KI-Technologien. Das Ergebnis wird wahrscheinlich einen wichtigen Standard dafür setzen, wie urheberrechtlich geschützte Materialien beim Training großer Sprachmodelle verwendet werden können.


















