OpenAI пуска в действие нов агент на ChatGPT, способен да

...
OpenAI пуска в действие нов агент на ChatGPT, способен да
Коментари Харесай

ChatGPT вече върши „черната ви работа“ онлайн

OpenAI пуска в деяние нов сътрудник на ChatGPT, кадърен да употребява виртуален браузър, да попълня формуляри, да взаимодейства с API-та и – най-впечатляващото – да основава файлове, подготвени за събаряне, в това число PowerPoint презентации и Excel таблици.

Въпреки че задачата не е да се явява като пряк сурогат на Microsoft Office, новият сътрудник евентуално ще понижи зависимостта на потребителите от част от корпоративния програмен продукт.

Това идва в миг, когато OpenAI и Microsoft, които са дългогодишни сътрудници, водят нови договаряния за достъпа до моделите на компанията.

Новият сътрудник е част от смелите упоритости на OpenAI да трансформира ChatGPT в резистентен бизнес – задача, която е много комплицирана, даже при милиони консуматори, поради всекидневните разноски за образование и поддръжка на моделите, както и потребността от съществени заплати за гениите, които работят за развиването на системата.

В света на изкуствения разсъдък сътрудникът е софтуерна система, която може да взема решения и да направлява през уеб сайтове и приложения, с цел да извършва сложена задача – от името на друг консуматор.

Именно този „ сътрудник “ се трансформира в една от най-използваните думи в речника на фирмите, които създават AI принадлежности за корпоративни клиенти.

„ Опитахме се да създадем артикул с голям брой приложения за бизнеса “, споделя Яш Кумар, продуктов управител на новия ChatGPT сътрудник. Освен че основава файлове, инструментът е кадърен да работи с терминали за код, да комуникира с услуги като Гугъл Drive и SharePoint, както и да попълня уеб формуляри.

Това въпреки всичко не е първият агентен помощник на OpenAI за годината. Новата версия комбинира две към този момент съществуващи разработки – Operator, който „ цъка “ из уеб сайтове с виртуална мишка, и deep research, който сканира голям брой източници за по-задълбочени изследвания.

„ Бях част от екипа на deep research, а Яш – от Operator “, споделя Фълфорд. „ Осъзнахме, че продуктите ни се допълват идеално и взехме решение да обединим екипите. “

Агентът може да превключва сред образен браузър и текстов интерфейс, съгласно потребностите на задачата – без значение дали приготвя сантиментална вечеря или проучва финансов доклад.

Новият сътрудник към този момент е наличен за Pro, Plus и Team клиенти, като първо го получават Pro потребителите. Корпоративните и просветителни клиенти ще имат достъп „ по-късно това лято “. При старта лимитът е 400 поръчки на месец за Pro клиенти и 40 за останалите платени проекти. Все още няма изясненост по кое време функционалността ще доближи и до потребителите с безвъзмезден проект.

В проява за WIRED Кумар демонстрира по какъв начин сътрудникът възнамерява среща, резервира маса в ресторант и даже приготвя цяла презентация с разбор на Q1 резултатите на Nvidia.

Времето за осъществяване на задачата варира – от към 5 минути за среща до 25 минути за презентация. Средната по дължина задача лишава сред 10 и 15 минути. „ Може да се вършат няколко задания по едно и също време “, отбелязва Кумар.

С опцията сътрудникът да употребява памет – функционалност, която ChatGPT към този момент тества – ще може да се приспособява още по-точно към стила и желанията на потребителя. Например, знае каква храна харесва сътрудникът ви или какви формати за презентации предпочитате. Към момента обаче паметта няма да бъде част от сътрудника, разясняват от OpenAI.

„ Не тъй като мислим, че не е безвредно, а просто желаеме да сме в допълнение деликатни “, изяснява Кумар, базирайки се на опасности като така наречен prompt injection офанзиви.

Контролът на потребителя към момента е значима част при осъществяването на всички задания, споделят Фълфорд и Кумар. Списък от „ рискови уеб сайтове “ – като обществени мрежи или страници за финансови транзакции – е изключен от достъпа на сътрудника.

Подобно на „ watch mode “ при Operator, и тук има режим, който изисква потребителят да следи осъществяването на задачата и да не затваря браузъра, в случай че се правят по-чувствителни дейности.

Най-интригуващата новация обаче се оказва функционалността „ replay “ – потребителят може да гледа екранен запис на всяка интеракция с сътрудника. „ Преди сътрудниците диалозите бяха относително къси “, споделя Кумар. „ Сега те стават по-дълги и по-комплексни. “
Източник: profit.bg


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР