Първо мисли, после действай: AI на Google превъзпитава роботите
Интернет колосът Гугъл сътвори и показва нов изкуствен интелект, който кара роботите да мислят, преди да работят. Иновацията има капацитет да превъзпита и усъвършенства доста умните машини.
Подразделението Гугъл DeepMind създаде два нови модела с изкуствен интелект за роботика, Gemini Robotics 1.5 и Gemini Robotics-ER 1.5. Заедно те ползват метод, при който роботът първо „ мисли " за дадена задача и едвам по-късно я извършва, заяви ArsTechnica.
Технологията е основана на генеративни AI системи и цели да преодолее рестриктивните мерки на актуалните роботи, които изискват обширна конфигурация за всяка съответна задача.
Генеративните AI системи, способни да основават текст, изображения, аудио и даже видео, стават все по-разпространени. Точно както генерират тези типове данни, GenAI системите могат да генерират и последователности от дейности за роботи.
Именно това е правилото, заложен в плана Gemini Robotics на Гугъл DeepMind. Двата нови, допълващи се AI модела, разрешават на роботите да „ мислят ", преди да работят.
Докато обичайните огромни езикови модели (LLM) имат редица ограничавания, въвеждането на симулирано размишление доста уголемява техните благоприятни условия. Подобен пробив може да се случи и в роботиката.
Екипът на Гугъл DeepMind има вяра, че генеративният изкуствен интелект има капацитет да революционизира роботиката, като даде на умните машини функционалности с общо предопределение.
За разлика от актуалните системи, които изискват месеци конфигуриране за една единствена, високоспециализирана задача и са едва адаптивни към нови условия, методът на Гугъл към изкуствения разсъдък разрешава на роботите да работят в непозната среда без препрограмиране.
Както означи Каролина Парада, началник на роботиката в DeepMind, роботите през днешния ден са „ извънредно профилирани и сложни за внедряване ". За да осъществя новата идея, DeepMind създаде Gemini Robotics-ER 1.5 и Gemini Robotics 1.5.
Първият е образен езиков модел (VLM) с размишление, който проучва образни и текстови данни, генерира поетапен проект на задачата и може да включва външни принадлежности, като да вземем за пример търсене в Гугъл, за подтекст.
Вторият е образен езиков модел с деяние (VLA), който превежда получените указания във физически дейности на робота, като по едно и също време с това ги поправя въз основа на образна противоположна връзка и личния си развой на „ мислене " за всяка стъпка.
Според Канишка Рао от DeepMind, основният пробив е усъвършенстването на робота със дарба да имитира човешкото интуитивно размишление - т.е. да мисли, преди да работи.
Разработчиците от DeepMind демонстрираха по какъв начин работят новите модели: видео на хуманоиден робот Apollo, оборудван с Gemini Robotics 1.5, който опакова артикули за пътешестване, до момента в който различен робот, Aloha 2, или по-точно, чифт роботизирани ръце, сортира боклука.
И двата модела са основани на фундаменталната архитектура Gemini, само че са в допълнение подготвени благодарение на данни, отразяващи взаимоотношенията с физическия свят. Това разрешава на роботите да извършват комплицирани многоетапни задания, доближавайки ги до равнището на самостоятелни сътрудници.
Системата също по този начин показва междуплатформена съгласуемост. По-конкретно, уменията, вградени в един робот, като да вземем за пример двуръкия Aloha 2, могат да бъдат трансферирани на различен, в това число хуманоида Apollo, без в допълнение персонализиране.
Въпреки евентуалния пробив, практическото приложение на тази технология към момента е лимитирано. Моделът Gemini Robotics 1.5, който управлява роботите, е наличен единствено за доверени тестери.
Междувременно, Gemini Robotics-ER 1.5 към този момент е интегриран в Гугъл AI Studio, което разрешава на разработчиците да генерират указания за свои лични опити с физически роботи.
Според специалистите обаче, домакинските роботи към момента би трябвало да изминат дълъг път, преди да могат да извършват ежедневни задания.
Подразделението Гугъл DeepMind създаде два нови модела с изкуствен интелект за роботика, Gemini Robotics 1.5 и Gemini Robotics-ER 1.5. Заедно те ползват метод, при който роботът първо „ мисли " за дадена задача и едвам по-късно я извършва, заяви ArsTechnica.
Технологията е основана на генеративни AI системи и цели да преодолее рестриктивните мерки на актуалните роботи, които изискват обширна конфигурация за всяка съответна задача.
Генеративните AI системи, способни да основават текст, изображения, аудио и даже видео, стават все по-разпространени. Точно както генерират тези типове данни, GenAI системите могат да генерират и последователности от дейности за роботи.
Именно това е правилото, заложен в плана Gemini Robotics на Гугъл DeepMind. Двата нови, допълващи се AI модела, разрешават на роботите да „ мислят ", преди да работят.
Докато обичайните огромни езикови модели (LLM) имат редица ограничавания, въвеждането на симулирано размишление доста уголемява техните благоприятни условия. Подобен пробив може да се случи и в роботиката.
Екипът на Гугъл DeepMind има вяра, че генеративният изкуствен интелект има капацитет да революционизира роботиката, като даде на умните машини функционалности с общо предопределение.
За разлика от актуалните системи, които изискват месеци конфигуриране за една единствена, високоспециализирана задача и са едва адаптивни към нови условия, методът на Гугъл към изкуствения разсъдък разрешава на роботите да работят в непозната среда без препрограмиране.
Както означи Каролина Парада, началник на роботиката в DeepMind, роботите през днешния ден са „ извънредно профилирани и сложни за внедряване ". За да осъществя новата идея, DeepMind създаде Gemini Robotics-ER 1.5 и Gemini Robotics 1.5.
Първият е образен езиков модел (VLM) с размишление, който проучва образни и текстови данни, генерира поетапен проект на задачата и може да включва външни принадлежности, като да вземем за пример търсене в Гугъл, за подтекст.
Вторият е образен езиков модел с деяние (VLA), който превежда получените указания във физически дейности на робота, като по едно и също време с това ги поправя въз основа на образна противоположна връзка и личния си развой на „ мислене " за всяка стъпка.
Според Канишка Рао от DeepMind, основният пробив е усъвършенстването на робота със дарба да имитира човешкото интуитивно размишление - т.е. да мисли, преди да работи.
Разработчиците от DeepMind демонстрираха по какъв начин работят новите модели: видео на хуманоиден робот Apollo, оборудван с Gemini Robotics 1.5, който опакова артикули за пътешестване, до момента в който различен робот, Aloha 2, или по-точно, чифт роботизирани ръце, сортира боклука.
И двата модела са основани на фундаменталната архитектура Gemini, само че са в допълнение подготвени благодарение на данни, отразяващи взаимоотношенията с физическия свят. Това разрешава на роботите да извършват комплицирани многоетапни задания, доближавайки ги до равнището на самостоятелни сътрудници.
Системата също по този начин показва междуплатформена съгласуемост. По-конкретно, уменията, вградени в един робот, като да вземем за пример двуръкия Aloha 2, могат да бъдат трансферирани на различен, в това число хуманоида Apollo, без в допълнение персонализиране.
Въпреки евентуалния пробив, практическото приложение на тази технология към момента е лимитирано. Моделът Gemini Robotics 1.5, който управлява роботите, е наличен единствено за доверени тестери.
Междувременно, Gemini Robotics-ER 1.5 към този момент е интегриран в Гугъл AI Studio, което разрешава на разработчиците да генерират указания за свои лични опити с физически роботи.
Според специалистите обаче, домакинските роботи към момента би трябвало да изминат дълъг път, преди да могат да извършват ежедневни задания.
Източник: cross.bg
КОМЕНТАРИ




