Съдът няма решение за защита на материали, от които се

Генеративният AI „не би могъл да съществува“, ако се плащаха авторски права

Съдът няма решение за отбрана на материали, от които се образоват LLM

Назрява огромна правосъдна битка сред фирмите, разработващи генеративни AI, и създателите на произведения, предпазени с авторски права (снимка: CC0 Public Domain)

Битката сред основателите на принадлежности за генеративен изкуствен интелект и създателите на наличие навлезе в нова, още по-остра фаза. AI компанията Anthropic съобщи пред американски съд, че потреблението на наличие, предпазено с авторски права, в данните за образование на огромните езикови модели (LLM) би трябвало да се одобри за „ почтено потребление “ и че „ днешните AI принадлежности с общо предопределение просто не биха могли да съществуват “, в случай че AI разработчиците трябваше да заплащат лицензи за материала.

Съгласно законодателството на Съединени американски щати „ честното потребление “ разрешава лимитирано потребление на материали, предпазени с авторски права, без потребност от позволение от създателите. Това се прави за цели като рецензия, новинарски репортажи, преподаване, научни проучвания. Европейското право също позволява разнообразни случаи на потребление на авторско наличие без потребност от позволение и без възнаграждение – за задачите на рецензията и обзорите, основаването на подигравка или подигравка, за разбори и научни изследвания и други

Аргументите на креативната промишленост

През октомври 2023 година голям брой музикални издатели заведоха дело против Anthropic. Те желаеха милиони долари обезщетение за хипотетичното „ систематично и необятно публикувано нарушаване “ на изискванията за потребление на музикални произведения, предпазени с авторски права.

Още тогава правосъдната битка даде обещание да е забавна, тъй като компанията компания за генеративни AI се радва на мощната поддръжка на Amazon и Гугъл.
още по темата
В желае, подаден до областен съд в Тенеси, се твърди, че Anthropic, при построяването и употребата на своите AI модели, „ нелегално копира и популяризира големи количества творби, предпазени с авторски права – в това число текстовете на безчет музикални композиции, притежавани или следени от издатели “.

Добавя се, че макар че AI технологията може да е комплицирана и авангардна, правните проблеми към потреблението на предпазени с авторски права материали са „ ясни и дългогодишни “. „ Ответникът не може да възпроизвежда, популяризира и демонстрира непознати творби, предпазени с авторски права, с цел да построява собствен личен бизнес, в случай че не получи позволение от притежателя на правата “, се споделя в аргументацията. „ Този принцип не отпада просто тъй като една компания украсява нарушаването си с думите „ AI “.

В документите се твърди още, че неспособността на Anthropic да си обезпечи позволение за авторски права „ лишава издателите и техните създатели на песни от надзор върху техните творби, предпазени с авторски права, и мъчно извоюваните изгоди от техните креативен инициативи “.

За да облекчат казуса, музикалните издатели приканват съда да накара Anthropic да заплати обезщетение. Те желаят компанията да дава доклад за своите данни и способи за образование. Настоява се и да унищожи всички „ копия, употребявани в нарушаване “.

Корпоративни претекстове

В иск до Службата за авторско право на Съединени американски щати от 30 октомври (напълно настрана от правосъдното дело), Anthropic твърди, че образованието на неговия AI модел Claude „ се квалифицира като типично законно потребление на материали “. Юристите на компанията упорстват, че „ степента, в която творбите, предпазени с авторски права, се употребяват в обучителните данни, е за разбор (на статистически връзки сред думи и понятия), който не е обвързван с никаква изразителна цел на творбата ”.

Аргументацията гласи още: „ Използването на творби за образование на Claude е почтено потребление, защото не попречва продажбата на истинските творби и, даже когато е комерсиално, към момента е задоволително трансформиращо “.

Относно капацитета на лицензионен режим за потреблението на наличие, предпазено с авторски права, при образованието на LLM, Anthropic още веднъж е безапелационна. Фирмата твърди, че условието на лицензи би било неуместно, защото би блокирало достъпа до по-голямата част от творбите и би облагодетелствало „ единствено субектите с най-високи запаси “.

Юристите на компанията пишат: „ Изискването на лиценз за неекспресивно потребление творби, предпазени с авторски права, за дейно образование на LLM значи възпрепятстване на потреблението на хрумвания, обстоятелства и други материали, които не подлежат на авторски права “.

По-нататък юристите разнищват финансовото измерение на казуса. „ Дори да приемем, че някои аспекти на набора от данни могат да обезпечат по-голяма „ тежест “ на съответен резултат от други, моделът е освен това от сбора на неговите елементи. … По този метод ще бъде мъчно да се дефинира ставка на заплащанията, която е значима за обособените основатели, без да се прави неикономично създаването на генеративни AI модели преди всичко “.

Битката се разгаря

В документ от 40 страници, показан на съда на 16 януари 2024 година, Anthropic продължава със същото гледище. Тя твърди, че „ не би било допустимо да се натрупа задоволително наличие за тренирането на LLM като Claude при обективни лицензионни транзакции непременно ”.

Добавя се, че Anthropic не е единствената, употребяваща данни, „ събрани от обществено наличния интернет “. Юристите пишат, че „ на процедура няма различен метод да се натрупа образователен корпус с мащаба и разнообразието, нужни за образование на комплициран LLM с необятно схващане на човешкия език и света като цяло ”.

„ Всяко включване на текстове на песни на ищците – или друго наличие, отразено в тези набори от данни – би било просто непряк артикул от единствения жизнерадостен метод за решение на това техническо предизвикателство “, се споделя в него.

Адвокатите отиват даже още по-далеч. Те упорстват, че мащабът на наборите от данни, нужни за образование на LLM, е просто прекомерно огромен, с цел да може при него да се приложи ефикасен лицензионен режим.

„ Не може да се вкарват лицензионни транзакции за… притежателите на права, покривайки милиардите текстове, нужни за приемане на трилионите токени, които LLM с общо предопределение изискват за вярно образование. Ако се изискваха лицензи за образование на LLM върху наличие, предпазено с авторски права, днешните принадлежности за изкуствен интелект с общо предопределение просто не биха могли да съществува “.

Затишие пред стихия

Подобни каузи за авторски права са заведени против други компании за потреблението им на генеративен AI, в това число OpenAI и Stability AI, както и против софтуерните колоси Microsoft, Гугъл и Meta. Нито един съд до момента не е взел решение. Евентуалните резултати ще са от фундаментално значение, тъй като ще са прецеденти, върху които ще стъпи бъдещото право в региона на изкуствения разсъдък и авторските права.

Схватката ще бъде забавна. От едната страна стоят огромните софтуерни компании, които имат големи запаси и фактическо въздействие. От другата страна са огромни и дребни обединявания на създатели от разнообразни сфери в изкуството – с многочислени членове и не по-малко налични запаси.