Google DeepMind прави голяма стъпка към бъдещето на роботите с

...
Google DeepMind прави голяма стъпка към бъдещето на роботите с
Коментари Харесай

Роботите на Google DeepMind вече не просто мислят - те влизат в действие

Google DeepMind прави огромна стъпка към бъдещето на роботите с изкуствен интелект - и този път те не просто схващат текст, а работят в действителния свят.

Доскоро AI блестеше основно в текстовата връзка, с чатботове като ChatGPT и Gemini 2.0, които трансформират метода, по който индивидът взаимодейства с технологиите. DeepMind обаче има по-амбициозна цел - да изведе изкуствения разсъдък отвън цифровия свят и да му придаде физическа форма, написа WIRED.

Компанията показва Gemini Robotics - нова версия на своя генеративен модел, която комбинира език, визия и придвижване, с цел да ръководи роботи с висока адаптивност.

Във видео проява DeepMind демонстрира роботизирани ръце, които извършват команди в действително време - сгъват хартия, подават зеленчуци, слагат очила в калъф и правят други фини операции.

Най-важното тук е, че изкуственият разсъдък свързва визуализацията с вероятни дейности, като се приспособява към друг хардуер.

Компанията показва и версия Gemini Robotics-ER (Embodied Reasoning) - модел, който схваща пространството и обектите към себе си, само че без да има пряк надзор върху придвижванията.

Идеята е откриватели и инженери да го употребяват за основаването на свои лични роботи.

Един от най-интересните опити беше с Apollo - хуманоидния робот на Apptronik, който се ръководи от новия модел. Видеото сподели по какъв начин Apollo комуникира с човек и подрежда букви върху масата по команда.

„ Вградихме концептуалното схващане на Gemini 2.0 в роботиката “, разяснява Канишка Рао, водещият откривател на плана.

Според DeepMind моделът може да ръководи разнообразни роботи в стотици сюжети, които не са били категорично включени в образованието му.

„ Когато роботът разбере общите концепции, той става доста по-гъвкав и потребен “, добавя Рао.
Как LLMs трансформират роботиката?
Големите езикови модели са построени върху големи количества данни, мощни логаритми и изчислителни запаси. Макар все още да не е допустимо роботите да бъдат обучавани в толкоз огромни среди, LLMs към този момент имат голямо знание за физическия свят, както и усъвършенствани информационни умения.

Разработчиците комбинират огромните езикови модели с нови способи за образование - посредством телематика и симулация, което разрешава по-ефективно упражняване на физически дейности. В резултат машините стават по-умни, по-прецизни в дейностите си и много по-гъвкави в 3D измерението.

Гугъл не е единствената компания, която самоуверено потегля в тази посока.

Бивши откриватели от компанията към този момент работят по лични планове - Physical Intelligence е нов стартъп, който се концентрира върху същите технологии, а Toyota Research Institute също влага в сходни разработки.

През септември 2024 година DeepMind сподели робот, който комбинира LLMs с напреднали способи за образование, с цел да извършва комплицирани задания като връзване на обувки и прегъване на облекла по команда. А в този момент, с представянето на Gemini Robotics, Гугъл прави още една крачка напред.

Компанията интензивно наваксва след първичния потрес от появяването на ChatGPT през ноември 2022 година и в този момент желае да изведе изкуствения разсъдък оттатък интерфейса на чатботовете - а точно в действителния, физически свят.

За тази цел компанията си партнира с Agility Robotics, Boston Dynamics и Enchanted Tools, които създават разнообразни типове роботи - от хуманоиди до автоматизирани помощници за промишлеността и услугите.

OpenAI, която затвори роботизираното си звено през 2021 година, също е възобновила напъните си в тази посока през 2024 година, като към този момент набира експерти по роботика.

Използването на актуалните AI модели за ръководство на роботи носи освен обещания, само че и много нови опасности.

През декември 2024 година екип от Университета на Пенсилвания показва по какъв начин по този начин наречените AI jailbreaks - техники за „ разтрошаване “ на отбраните на езиковите модели - могат да доведат до рискови последствия, когато моделът ръководи робот.

В опита те съумяват да накарат робот на колела да „ достави “ несъществуваща бомба посредством операция на инструкциите.

За да предотврати сходни произшествия и да смекчи страховете към „ избягалите “ AI роботи, Гугъл DeepMind разгласи нов пример за оценка на рисковете - ASIMOV, кръстен на Айзък Азимов, създател на знаковите закони за роботиката.

Еталонът ще бъде употребен, с цел да се разпознават рискови държания при роботите в разнообразни симулирани обстановки. Например, тестванията могат да разкрият дали един робот може да вземе предмет в миг, когато човек също протяга ръка към него - сюжет, който може да докара до пострадване.

„ Изграждаме тази технология, като главният ни приоритет е сигурността “, акцентира Каролина Парада, началник на роботизираните планове в DeepMind.

Тя обаче признава, че има още много работа, преди роботите, оборудвани с Gemini Robotics, да бъдат в действителност способни.

Едно от най-големите ограничавания е, че те не се учат, до момента в който извършват дилемите, както вършат хората.

Засега Гугъл не разполага с съответни проекти за комерсиализиране на технологията.

Но едно е ясно - AI роботиката е на прага на нова епоха, в която машините ще схващат освен думите, само че и света към себе си.
Източник: profit.bg


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР