Какво представляват агентите с изкуствен интелект?
Инструментите с изкуствен интелект последователно се трансформират в нормална действителност. В същото време доста се приказва за сътрудниците с изкуствен интелект и че това е идващото огромно нещо. MIT Technology Review изяснява по какъв начин нов вид изкуствен интелект може да промени бизнеса, да разнообрази видеоигрите и да помогне с ежедневните задания.
Какво е същински неестествен интелект
Когато ChatGPT беше пуснат за първи път, всички говореха за идващото потомство AI основани асистенти. Но през миналата година това неспокойствие се насочи към нова цел: AI-агентите.
Агентите бяха показани на видно място на годишната I/O конференция на Гугъл през май, когато компанията показа своя нов AI-агент, наименуван Astra. Той разрешава на потребителите да взаимодействат с него посредством аудио и видео. Новият модел GPT-4o на OpenAI също се назовава AI-агент.
Технологичните компании харчат големи суми пари за основаването на AI-агенти и техните проучвателен старания могат да доведат до в действителност потребен изкуствен интелект, за който сме мечтали от десетилетия. Много специалисти, в това число и Сам Алтман, споделят, че това е идващото огромно нещо. Но какво съставляват ИИ-агентите? И по какъв начин можем да ги използваме?
Какво е AI-агент и по какъв начин работи?
Що се отнася до сътрудниците с изкуствен интелект, проучванията към момента са в ранен стадий и промишлеността няма дефинитивна формулировка за тях. „ Най-просто казано, това са модели и логаритми с изкуствен интелект, които независимо могат да вземат решения в един динамичен свят “, споделя Джим Фан, старши академик в Nvidia, който управлява самодейността на компанията за AI-агент.
Общата визия на сътрудниците с изкуствен интелект е следната: система, която може да извършва необятен набор от задания, сходно на човешки помощник. Например, в бъдеще може да ви помогне да резервирате почивка, само че също ще запомни и дали предпочитате първокласни хотели, тъй че ще предлага единствено хотели с четири или повече звезди и по-късно ще резервира този, който изберете от лист с варианти. След това ще предложи полети, които най-добре дават отговор на вашия календар, и ще възнамерява маршрута за пътешестване, въз основа на вашите желания. AI-агентът, въз основа на този проект и прогнозата за времето, може да сформира лист с нещата за пакетиране. Може даже да изпрати маршрута ви до другари, които познава и които живеят във вашата дестинация, с цел да ги предложения да се причислят.
В работата може да проучва вашия лист със отговорности и да извършва задания от него, като изпращане на предложения в календара, напомняния или имейли.
Една визия за сътрудниците е, че те са мултимодални, което значи, че могат да обработват тирада, аудио и видео. Например, при демонстрацията на Astra от страна на Гугъл, потребителите можеха да насочат камерата на своя смарт телефон към обособени неща и да задават въпроси на сътрудника, който може да отговори на текстово, аудио и видео наличие.
Тези сътрудници могат също да опростят процесите за бизнеса и публичните организации, споделя Дейвид Барбър, шеф на Центъра за изкуствен интелект в University College London. Например, AI-агентът може да работи като комплициран бот за обслужване на клиентите. Настоящото потомство асистенти, основани на езикови модели, могат да генерират отговори посредством създаване на догатки въз основа на текста на клиента. Но AI-агентът ще може самостоятелно да извършва и команди на натурален език и да дава обслужване на клиентите без потребност от контрол. Например, сътрудник може да проучва имейлите с тъжби, по-късно без значение да ревизира референтния номер на клиента, да получи достъп до базите данни, с цел да ревизира дали жалбата е законна и да я обработи съгласно политиката на компанията.
Има два типа сътрудници с неестествен интелект
Като цяло съществуват две разнообразни категории сътрудници, споделя Фен: софтуерни сътрудници (software agents) и въплътени сътрудници (embodied agents).
Софтуерните сътрудници работят на компютри или мобилни телефони и употребяват съществуващи приложения, сходно на образеца на туристическия сътрудник нагоре. Основната им цел е да извършват задача, която изисква присъединяване на характерен програмен продукт.
“Въплътените сътрудници са логаритми, които се намират в 3D-свят, като да вземем за пример във видео игра или са част от софтуера на робот. “
Такива сътрудници могат да създадат видеоигрите по-ангажиращи, като разрешават на хората да играят с неигрови герои, следени от AI. Тези сътрудници също могат да оказват помощ за основаването на по-полезни роботи, които биха могли да ни оказват помощ с ежедневните задания вкъщи, като прегъване на пране и готвене.
Беше основан въплътен AI-агент, наименуван MineDojo, който взе присъединяване в известната компютърна игра Minecraft. Използвайки големи количества данни, събрани от интернет, AI-агентът съумя да усвои нови умения и задания, които му разрешиха свободно да изследва виртуалния свят на играта и да извършва комплицирани задания като ограждане на лами или загребване на лава в кофа.
Видеоигрите са добър сурогат на действителния свят, тъй като изискват от сътрудниците да схващат физиката, разсъжденията и здравия разсъдък.
В документ, който към момента не е утвърден от сътрудници, откривателите от Принстън споделят, че AI сътрудниците нормално имат една от трите характерности. Системите с изкуствен интелект се смятат за „ сътрудници “, в случай че:
могат да реализират комплицирани цели в комплицирана среда без обучение; могат да бъдат научени на натурален език и да работят самостоятелно без надзор; могат да употребяват принадлежности като търсене в мрежата, програмиране или могат да възнамеряват.Нещо ново ли са сътрудниците с изкуствен интелект?
Терминът „ сътрудници с изкуствен интелект “ съществува от години и значи обособени неща в друго време, споделя Чираг Шах, професор по компютърни науки във Вашингтонския университет.
Имаше две талази от сътрудници, споделя Фан. Настоящата вълна се дължи на взрива на езиковия модел и развиването на системите като ChatGPT. Предишният беше през 2016 година, когато Гугъл DeepMind показа AlphaGo — това е фирмената система за изкуствен интелект. Тя може да взема решения и да възнамерява тактики. Това се основава на образование с подкрепление — техника, която възнаграждава AI-алгоритмите за мечтаното държание.
„ Но тези сътрудници не са общи “ — споделя Ориол Виналс, вицепрезидент на Гугъл DeepMind Research. Те са основани за доста характерна задача — в този случай игра. Новото потомство изкуствен интелект, основан на главния модел, прави сътрудниците по-гъвкави, тъй като могат да се учат от света, с който хората взаимодействат.
Какви са рестриктивните мерки на AI-агентите?
Все още има доста отворени въпроси, на които би трябвало да се отговори. Кангджун Куин, основен изпълнителен шеф и създател на стартъпа за изкуствен интелект Imbue, който работи върху сътрудници, можещи да разсъждават и кодират, съпоставя положението на сътрудниците със положението на самоуправляващите се коли преди повече от десетилетие. Те могат да вършат неща, само че са ненадеждни и към момента не са изцяло самостоятелни. Например кодиращ сътрудник може да генерира код, само че от време на време прави неточности и не знае по какъв начин да тества кода, който генерира. Така че хората към момента би трябвало да вземат участие интензивно в процеса. Системите с изкуствен интелект към момента не могат да схванат изцяло коя е сериозната стъпка в работата в комплицирания и двузначен човешки свят.
„ Не сме покрай сътрудник, който може просто да автоматизира всички домашен отговорности вместо нас “ — споделя Фан. Съвременните системи „ халюцинират и не постоянно следват ясно инструкциите. И това е досадно. “
Друго ограничаване е, че след известно време AI-агентите губят визия върху какво работят. Системите с изкуствен интелект са лимитирани от контекстни прозорци, т.е. количеството данни, което могат да обмислят във всеки един миг.
„ ChatGPT може да кодира, само че не е добър в основаването на дълготрайно наличие. Но за разработчиците ние сътворяваме цяло вместилище в GitHub, което съдържа десетки, в случай че не и стотици редове код, и нямаме проблем с това ” споделя Фан.
За да реши този проблем, Гугъл усили потенциала на моделите си за обработка на данни, което разрешава на потребителите да взаимодействат с тях по-дълго, по време на което си спомнят повече за предишните взаимоотношения. Компанията споделя, че работи в бъдеще превръщането на контекстните прозорци да е безпределно.
За въплътените сътрудници като роботи има още повече ограничавания. Няма задоволително данни за образование, а откривателите занапред стартират да употребяват силата на езиковите модели в роботиката.
Така че макар цялата шумотевица и реклама, коства си да си напомним, че проучването на сътрудниците с изкуствен интелект е към момента в доста ранен стадий и евентуално ще минат години, преди да можем да изпитаме цялостния им капацитет.
Мога ли да тествам AI-агента в този момент?
Определено многообразие, да. Вероятно сте опитвали ранните им прототипи, като ChatGPT и GPT-4 на OpenAI. „ Ако взаимодействате със програмен продукт, който наподобява образован, той е тип сътрудник “ — споделя Канджун Циу.
Понастоящем най-хубавите сътрудници, които имаме, са системи с доста тесни и характерни случаи на приложимост, като асистенти за шифроване, ботове за обслужване на клиенти или програмен продукт за автоматизация на работния развой като Zapier. Но това надалеч не е повсеместен AI-агент, който може да извършва комплицирани задания.
Плъгините с ChatGPT на OpenAI, които разрешават на хората да основават задвижвани от AI асистенти за уеб-браузъра, бяха опит за сътрудници. Но тези системи към момента са тромави, ненадеждни и неспособни да разсъждават.
Все отново, сходни системи един ден ще трансформират метода, по който взаимодействаме с технологиите, има вяра Циу, и това е наклонност, на която хората би трябвало да извърнат внимание. „ Не е като „ О, Боже мой, внезапно имаме AGI “ … по-скоро е „ О, Боже мой, компютърът ми може доста повече, в сравнение с преди пет години. “ “