Kaip ir beveik visos kitos egzistuojančios technologijų įmonės, „Adobe“ per pastaruosius kelerius metus labai palinkėjo dirbtiniam intelektui. Nuo 2023 m. programinės įrangos įmonė pristatė daugybę skirtingų dirbtinio intelekto paslaugų, įskaitant „Firefly“ – jos AI valdomą medijos kartos rinkinį. Tačiau dabar įmonės visapusiškas technologijų įsisavinimas galėjo sukelti problemų, nes naujame ieškinyje teigiama, kad ji naudojo piratines knygas, kad išmokytų vieną iš savo AI modelių.
Siūlomas kolektyvinis ieškinys, pateiktas Elizabeth Lyon, autorės iš Oregono, vardu, teigia, kad „Adobe“ naudojo piratines daugelio knygų versijas, įskaitant jos pačios, kad apmokytų bendrovės „SlimLM“ programą.
„Adobe“ apibūdina SlimLM kaip mažą kalbų modelių seriją, kurią galima „optimizuoti dokumentų pagalbos užduotims atlikti mobiliuosiuose įrenginiuose“. Jame teigiama, kad SlimLM buvo iš anksto apmokyta naudoti SlimPajama-627B – „atsikartotą, kelių korpusų, atvirojo kodo duomenų rinkinį“, kurį 2023 m. birželio mėn. išleido „Cerebras“. Lionas, parašęs daugybę negrožinės literatūros rašymo vadovų, teigia, kad kai kurie jos darbai buvo įtraukti į parengiamąjį duomenų rinkinį, kurį naudojo „Adobe“.
Liono ieškinyje, apie kurį iš pradžių pranešė „Reuters“, teigiama, kad jos raštas buvo įtrauktas į apdorotą manipuliuojamo duomenų rinkinio, kuris buvo „Adobe“ programos pagrindas, poaibį: „SlimPajama duomenų rinkinys buvo sukurtas kopijuojant ir manipuliuojant RedPajama duomenų rinkiniu (įskaitant kopijavimą Books3)“, – rašoma ieškinyje. „Taigi, kadangi „SlimPajama“ yra išvestinė „RedPajama“ duomenų rinkinio kopija, jame yra „Books3“ duomenų rinkinys, įskaitant ieškovo ir klasės narių autorių teisių saugomus kūrinius.
„Books3“ – didžiulė 191 000 knygų kolekcija, kuri buvo naudojama genAI sistemoms apmokyti, – nuolatinis teisinių problemų šaltinis technologijų bendruomenei. RedPajama taip pat buvo minima daugelyje bylų. Rugsėjo mėn. ieškinyje prieš Apple buvo teigiama, kad bendrovė panaudojo autorių teisių saugomą medžiagą, kad apmokytų savo Apple Intelligence modelį. ir be kredito ar kompensacijos“. Spalio mėnesį panašus ieškinys prieš „Salesforce“ taip pat teigė, kad bendrovė „RedPajama“ naudojo mokymo tikslais.
Deja, technologijų pramonei tokie ieškiniai jau tapo įprasti. Dirbtinio intelekto algoritmai mokomi naudojant didžiulius duomenų rinkinius, o kai kuriais atvejais šiuose duomenų rinkiniuose tariamai yra piratinės medžiagos. Rugsėjo mėnesį Anthropic sutiko sumokėti 1,5 mlrd. Ši byla buvo laikoma galimu lūžio tašku vykstančiose teisinėse kovose dėl autorių teisių saugomos AI mokymo duomenų medžiagos, kurių yra daug.