Генеративните AI могат да се окажат инструмент, който променя технологичния

Защо светът толкова се вълнува от рисунките на AI

Генеративните AI могат да се окажат инструмент, който трансформира софтуерния свят сходно на изобретяването на интернет и базите данни (изображение: генерирано от Craiyon.com)

Компютърните стратегии към този момент могат да основават истински и вдъхновяващи изображения за секунди. Дайте на една AI стратегия няколко думи и тя след момент ще изплюе картина, която в действителност дава отговор на описанието, без значение какъв брой странна е.

Снимките не са съвършени. В тях може да се видят ръце с спомагателни пръсти или числа, които се огъват и извиват неестествено. Генераторите на изображения имат проблеми с текста, съчиняват безсмислени знаци или сформират лична писменост.

Но тези стратегии за генериране на изображения – които през днешния ден наподобяват занимателно – може да са началото на огромна вълна в технологиите. Специалистите ги назовават генеративни модели или генеративен AI. „ През последните три месеца думите „ генеративен AI “ минаха от стадия „ никой въобще не мисли за това “ до модерното „ всички приказват за това “, споделя Дейвид Бейзел, рисков капиталист в NextView Ventures.

През миналата година генеративният AI стана толкоз добър, че въодушеви значително хора да изоставен работата си и да основават нови компании, да мечтаят за бъдеще, в което изкуственият разсъдък може да е основата на ново потомство софтуерни колоси.

Сферата на изкуствения разсъдък и без друго се развива бързо през последните няколко години. Но в този момент множеството достижения са свързани с осмисляне на съществуващите данни. Моделите с изкуствен интелект към този момент са задоволително ефикасни, с цел да разпознават дали има котка на фотография, която преди малко сте създали на телефона си, и задоволително надеждни, с цел да обезпечават резултати в търсачките милиарди пъти всеки ден.

Но генеративните AI модели могат да произведат нещо напълно ново, което не е съществувало до момента. С други думи, те основават, творят – а освен проучват. „ Впечатляващото, даже за мен, е, че изкуственият разсъдък е в положение да композира нови неща “, споделя Борис Дайма, основател на генериращия AI Craiyon. „ Това не е просто пресъздаване на остарели изображения, това са нови облици, които могат да бъдат изцяло разнообразни от това, което е виждано по-рано “.

Sequoia Capital – най-успешната компания за рисков капитал в историята на промишлеността, рано финансирала инициативи като Apple и Гугъл – разяснява в блога си, че „ генеративният AI има капацитета да генерира трилиони долари икономическа стойност ”. Компанията предвижда, че креативният неестествен разсъдък може да промени всяка промишленост, която изисква хората да основават автентично наличие, от игрите през рекламата до правото.

След това Sequoia прави задявка, като отбелязва в обявата, че известието ѝ е отчасти написано от GPT-3 – генеративен AI, който създава текст.

С главата надолу

Създаването на изображения употребява техники от подмножество системи за машинно самообразование, известни като „ надълбоко самообразование “. То стъпва на модели, подготвени върху огромни набори от данни, до момента в който програмата разбере връзките в тези данни. След това моделът може да се употребява за приложения като идентифициране дали на фотографията има куче или пък превод на текст.

Генераторите на изображения работят, като обръщат този развой „ с главата надолу “. Вместо да превеждат от британски на френски, да вземем за пример, те превеждат дадена фраза в изображение. Обикновено имат две съществени елементи, едната обработва първичната фраза, а втората трансформира данните в изображение.

Първата вълна от генеративни AI се основаваше на метод, наименуван GAN: генеративни конкурентни мрежи. GAN се прочуха, откакто бяха употребявани в инструмент, генериращ фотоси на хора, които не съществуват. По създание те работят посредством два AI модела, които се състезават един против различен, с цел да основат по-добре изображение, което дава отговор на задачата.

По-новите подходи нормално употребяват така наречен трансформатори. Те са разказани за първи първи път в документ на Гугъл от 2017 година Това е нововъзникваща техника, която може да се възползва от по-големи набори от данни, чието образование може да коства милиони долари.

Първият генератор на изображения, който притегли доста внимание, беше DALL-E: стратегия, оповестена през 2021 година от OpenAI, добре финансиран стартъп в Силициевата котловина. Тази година OpenAI пусна по-мощна версия.

Друг постоянно употребен генератор на изображения, основан на неестествен разсъдък, е Craiyon, прочут преди като Dall-E Mini, който е наличен в мрежата. Потребителите могат да вкарат фраза и да я видят илюстрирана за минути в своя браузър.

Откакто започва през юли 2021 година, този AI генерира по към 10 милиона изображения дневно, добавяйки до 1 милиард изображения, които в никакъв случай не са съществували преди, съгласно Дайма. Той се занимава с Craiyon на цялостно работно време, откакто използването на инструмента внезапно набъбна по-рано тази година. Специалистът споделя, че се е съсредоточил върху потреблението на реклами, с цел да поддържа уеб страницата безвъзмезден за потребителите, защото разноските за сървъра на уеб страницата са високи.

Но програмата, която породи най-вече неспокойствие, е Stable Diffusion – тя беше пусната за обществеността през август. Кодът за нея е наличен в GitHub. Може да се извършва на компютри, освен в облака или посредством интерфейс за програмиране. Това е въодушевило потребителите да трансформират кода на програмата за свои лични цели или да надграждат върху него.

Реални изгоди

Stable Diffusion, да вземем за пример, беше интегриран в Adobe Photoshop посредством добавка, позволяваща на потребителите да генерират фонове и други детайли от изображения, които по-късно могат непосредствено да манипулират вътре в приложението, употребявайки пластове и други принадлежности на Photoshop. Така генеративният ИИ се трансформира в инструмент, който може да се употребява от експертите.

„ Исках да се срещна с експерти от креативните индустрии… да им дам опция да внедрят AI в работните си процеси, а не да взривяват работните си процеси “, споделя Кантрел, разработчик на добавката.

Кантрел, деец с 20-годишен опит в Adobe, споделя още, че надстройката е била изтеглена десетки хиляди пъти. Художниците му оповестяват, че го употребяват по безчет способи, които той не е могъл да планува, като анимиране на Годзила или основаване на фотоси на Спайдърмен във всяка поза, която художникът може да си показа.

Фундаментална смяна на хоризонта

Някои вложители гледат на генеративния AI като на евентуално трансформираща смяна, която е толкоз генерална, колкото появяването на смарт телефона или даже появяването на интернет. Този тип промени доста уголемяват обсега на хората, които могат да употребяват дадена технология, прехвърляйки я от ръцете на неколцина „ отдадени фанатици “ към необятен кръг бизнес експерти – и в последна сметка към необятната общност.

„ Не е като AI да не е съществувал преди този момент – и не е като да не сме имали мобилни устройства преди 2007 година “, разяснява вложителят Бейзел. „ Става дума за момента, в който всички могат да се допрян: същинските хора, крайните консуматори, могат да опитват и да видят нещо друго “.

Кантрел вижда генеративното машинно образование като нещо сходно на още по-фундаментална технология: базата данни. Първоначално въведени от компании като Oracle през 70-те години на предишния век като метод за запазване и образуване на обособени парчета информация в ясно обрисувани редове и колони, базите данни бяха преосмислени, с цел да съхраняват всеки вид данни за всеки вероятен вид компютърно приложение.

„ Машинното самообразование е нещо като базите данни. Базите данни отключиха благоприятни условия за голям брой уеб-приложения. Почти всяко приложение, което вие или аз в миналото сме употребявали в живота си, е построено върху база данни “, споделя Кантрел. „ Никой не се интересува по какъв начин работи базата данни, приложенията знаят по какъв начин да я употребяват “.

Инвестиции

Майкъл Демпси, ръководещ сътрудник в Compound VC, отбелязва, че са доста редки и вълнуващи сходни моменти, когато технологии, които са били лимитирани до научните лаборатории, навлизат в всеобща приложимост. Тогава те притеглят доста внимание от страна на рискови вложители, които обичат да залагат на нови трендове, които пък могат да се окажат от голямо значение.

Все отново Демпси предизвестява, че сходен трогателен миг в областта на генеративните AI може да се окаже „ фаза на любознание “. А фирмите, учредени през тази „ ера “, могат да изчезнат не след дълго, тъй като не се концентрират върху съответни потребни функционалности, за които бизнесът или потребителите биха платили.

Други експерти в региона имат вяра, че започващите компании, които са пионери в описаната технология през днешния ден, биха могли в последна сметка да се изправят против огромните софтуерни колоси, които сега преобладават в пространството на изкуствения разсъдък, в това число Гугъл, Meta и Microsoft. А това ще проправи пътя за идващото потомство софтуерни колоси.

„ Ще има куп компании за трилиони долари – цяло потомство започващи компании, които ще надграждат върху този нов метод за правене на технологии “, предвижда Клемент Деланг, основен изпълнителен шеф на Hugging Face, платформа за разработчици като GitHub. Неговата цел е да направи AI технологията по-лесна за програмистите.

Някои от въпросните компании към този момент вършат обилни вложения. Hugging Face беше оценена на 2 милиарда $ след набиране на фондове по-рано тази година. Парите пристигнаха от вложители като Lux Capital и Sequoia. OpenAI, най-известният стартъп в региона, получи над 1 милиард $ финансиране от Microsoft и Khosla Ventures.

Междувременно Stability AI, основателят на Stable Diffusion, води договаряния за набиране на рисково финансиране на стойност до 1 милиард $, съгласно Forbes.

Отговорът на мастодонтите

Облачните снабдители като Amazon, Microsoft и Гугъл също могат да се възползват от възхода на технологията. И наподобява имат желание да не изостават. Meta и Гугъл са наели някои от най-известните гении в региона с вярата, че могат да вградят най-новите достижения на генеративния AI в своите артикули. През септември Meta разгласи стратегия за изкуствен интелект, наречена „ Make-A-Video “, която извежда технологията още една крачка напред: тя генерира видеоклипове, а освен изображения.

„ Това е необикновен прогрес “, сподели изпълнителният шеф на Meta Марк Зукърбърг в обява на страницата си във Фейсбук. „ Много по-трудно е да се генерира видео, в сравнение с фотоси, тъй като с изключение на вярното генериране на всеки пиксел, системата също би трябвало да планува по какъв начин те ще се трансформират с времето “.

Гугъл побърза да застане наедно с Meta и разгласи и пусна код за стратегия, наречена Phenaki, която генерира текст във видео и може да генерира минути фрагменти.

Бумът на генеративните AI може да поддържа и производители на чипове като Nvidia, AMD и Intel, които вършат усъвършенствани графични процесори, идеални за образование и внедряване на AI модели. На скорошна конференция основният изпълнителен шеф на Nvidia Дженсън Хуанг акцентира генеративния AI като основен „ клиент “ за най-новите чипове на компанията. По думите му, този тип стратегии скоро могат да „ революционизират връзките “.

Един образец за работата на Nvidia е потреблението на модел за генериране на нови 3D изображения на хора, животни, транспортни средства или мебели, които могат да населят света на някоя виртуална игра.

Етични проблеми

В последна сметка всеки, който създава генеративен AI, ще би трябвало да се бори с някои от етичните проблеми, които идват от генераторите на изображения.

На първо място е въпросът за работните места. Въпреки че доста стратегии изискват мощен графичен процесор, компютърно генерираното наличие въпреки всичко ще бъде доста по-евтино от работата на професионален илюстратор, която може да коства стотици долари на час.

Това може да сътвори проблеми за създатели, художници, видео-продуценти и други хора, чиято работа е да генерират креативна работа. Например човек, чиято работа е да избира изображения за маркетингови материали, може доста скоро да бъде сменен от компютърна стратегия.

„ Оказва се, че моделите за машинно самообразование евентуално ще станат в пъти по-добри, по-бързи и по-евтини от индивида “, сподели Демпси от Compound VC.

Идват и комплицираните въпроси по отношение на оригиналността и интелектуалната благосъстоятелност. Генеративните AI се образоват върху големи количества изображения, които са авторски. Сега се спори до каква степен основателите на истинските изображения имат право на искания за авторски права върху изображения, генерирани от AI, изключително в случай че са в стила на даден автентичен основател.

Показатно е, че някои изображения, генерирани от Stable Diffusion, наподобява имат водни знаци. Това допуска, че част от истинските набори от данни са били предпазени с авторски права. Случаят в допълнение отваря доста въпроси по отношение на интелектуалната благосъстоятелност в тези случаи.

Миналия месец Getty Images забрани на потребителите да качват изображения, които са дело на генеративни AI, в своята база данни с комерсиални изображения. Фирмата е загрижена за правните провокации към авторските права.

Освен това генераторите на изображения могат да се употребяват и за основаване на нови изображения на герои или обекти, които са обект на запазена марка, като да вземем за пример миньоните, героите на Marvel или Game of Thrones.

Тъй като софтуерът за генериране на изображения става все по-добър, той има капацитет да заблуди потребителите. Възможно е те да повярват на погрешна информация или да одобряват за истинни изображения или видеоклипове на събития, които в никакъв случай не са се случвали.

Защо светът толкова се вълнува от рисунките на AI

защо светът

светът толкова

толкова вълнува

вълнува рисунките

защо

светът

толкова

вълнува

рисунките