Meta, AI eğitim veri seti hakkında telif hakkı ihlali iddialarıyla karşı karşıya

Meta'nın yapay zeka eğitimi için kullandığı veri seti, telif hakkı ihlali iddiaları nedeniyle tartışma konusu oldu. Bu durum, AI sektöründeki veri kullanım standartlarına dair soruları beraberinde getiriyor.

Meta Platforms, Facebook ve Instagram gibi sosyal medya devlerinin ana şirketi, son zamanlarda telif hakkı ihlali iddialarıyla gündeme geldi. Şirket, özellikle Sarah Silverman ve Michael Chabon gibi tanınmış yazarlardan oluşan bir grup tarafından dava ediliyor. Bu davanın temelinde, Meta'nın yapay zeka dil modeli Llama'nın eğitimi için binlerce telif hakkı korunan kitabı yasal izin almadan kullanmış olması iddiası yatıyor.

Meta'nın hukuk ekibinin yapay zeka eğitimi için telif hakkı ihlali içeren kitapları kullanmanın potansiyel hukuki riskleri konusunda ciddi uyarılarda bulunmasına rağmen, şirketin tartışmalı veri setini kullanmaya devam ettiği öne sürülüyor. Bu durum, Meta'ya bağlı bir araştırmacı olan Tim Dettmers'in bir Discord sunucusunda veri setinin temini hakkında yaptığı sohbetlerin ortaya çıkmasıyla daha da karmaşık bir hal aldı.

Söz konusu sohbet kayıtlarına göre, Dettmers, eğitim verileri için kitap dosyalarını kullanmanın yasallığı konusunda Meta'nın hukuk departmanıyla görüşmeler yaptı. Hukuk ekibinin, "aktif telif hakkına sahip kitaplar" ile ilgili sorunlar nedeniyle derhal kullanımı uygun bulmadığı belirtiliyor. Chat katılımcıları, bu tür verilerin eğitim amacıyla kullanılmasının, telif hakkı korunan eserlerin belirli lisanssız kullanımlarını koruyan ABD hukuk prensibi olan adil kullanım doktrini altında haklı çıkarılıp çıkarılamayacağını tartıştılar.

Meta, AI eğitim veri seti hakkında telif hakkı ihlali iddialarıyla karşı karşıya

İlk olarak yaz aylarında başlatılan dava, son zamanlarda iki ayrı hukuki işlemi birleştirerek konsolide edildi. Davadaki son gelişmeler arasında, California'daki bir hakimin geçen ay Silverman davasının bir kısmını reddetmesi ve yazarların iddialarında değişiklik yapmalarını talep etmeleri yer alıyor. Bu durum, hukuki sürecin gelişmekte olduğuna işaret ediyor.

Bu hukuki mücadelenin sonuçları, sadece Meta ile sınırlı kalmayıp, tüm yapay zeka endüstrisini etkileyebilir. Bu davaların başarılı olması durumunda, içerik oluşturuculardan tazminat talepleri ve artan denetimler nedeniyle veri aç gözlü yapay zeka modellerini geliştirmenin maliyeti artabilir. Ayrıca, Avrupa'da yapay zeka şirketlerinin, Meta dahil, modellerini eğitmek için kullandıkları verileri açıklamalarını zorunlu kılacak yeni düzenlemeler, onları ek hukuki risklere maruz bırakabilir.

Meta'nın Llama modelleri, özellikle son sürümü olan Llama 2, yaz aylarında piyasaya sürülmüş ve bu konunun merkezinde yer alıyor. İlk sürümün "ThePile'ın Books3 bölümü" kullanılarak eğitildiği bilinirken, pazar için olası bir dönüştürücü olan Llama 2'nin eğitim verileriyle ilgili ayrıntılar Meta tarafından açıklanmadı.