Adobe kini menghadapi gugatan class action yang menuduh bahwa mereka secara ilegal menggunakan buku-buku berhak cipta, termasuk karya penulis Elizabeth Lyon, untuk melatih salah satu model kecerdasan buatan (AI). Inti perselisihan berpusat pada program SlimLM Adobe, model bahasa yang dirancang untuk bantuan dokumen, dan kumpulan data yang digunakan untuk mengembangkannya.

Tuduhan: Buku Bajakan Memicu AI

Gugatan tersebut mengklaim Adobe memanfaatkan kumpulan data yang berisi materi bajakan – khususnya, versi manipulasi dari koleksi kontroversial “Books3”, yang terdiri dari 191.000 buku. Himpunan data ini diintegrasikan ke dalam SlimPajama-627B, himpunan data sumber terbuka yang digunakan Adobe untuk pra-pelatihan SlimLM. Lyon menegaskan bahwa buku panduan berhak cipta miliknya disertakan dalam data pelatihan yang bersumber secara ilegal ini.

Mengapa Ini Penting: Debat Hak Cipta AI

Kasus ini menyoroti kekhawatiran yang berkembang dalam industri teknologi: implikasi etika dan hukum dari penggunaan materi berhak cipta untuk melatih model AI. Banyak sistem AI generatif bergantung pada kumpulan data besar yang diambil dari internet, sering kali mencakup buku, artikel, dan gambar tanpa izin jelas dari pemegang hak cipta. Legalitas praktik-praktik tersebut masih diperdebatkan, dengan banyaknya tuntutan hukum yang menantang pendekatan industri ini.

Tantangan Hukum yang Lebih Luas di Bidang AI

Adobe tidak sendirian dalam menghadapi pengawasan. Tuntutan hukum serupa telah diajukan terhadap Apple dan Salesforce, keduanya dituduh melatih model AI mereka pada konten berhak cipta yang bersumber dari kumpulan data seperti RedPajama (yang ditautkan ke Books3). Kasus-kasus ini menguji batasan penggunaan wajar dan hukum hak cipta di era AI generatif.

Pertanyaan utamanya adalah apakah perusahaan dapat memperoleh keuntungan dari pelatihan AI mengenai kekayaan intelektual yang dicuri. Hasil dari tuntutan hukum ini dapat mengubah masa depan pengembangan AI.

Gugatan terhadap Adobe menggarisbawahi meningkatnya risiko hukum bagi perusahaan teknologi yang ingin menerapkan AI tanpa mengatasi masalah hak cipta yang mendasarinya. Karena semakin banyak penulis dan pencipta yang menentang praktik ini, industri mungkin terpaksa mengadopsi metode sumber data yang lebih transparan dan patuh secara hukum.