Google представи локална версия на Gemini за управление на роботи
Гугъл DeepMind показа новия езиков модел Gemini Robotics On-Device, който може да работи самостоятелно на роботите без достъп до облака. Той е основан на по-ранната версия Gemini Robotics, пусната през март 2025 година, и в този момент разрешава роботите да бъдат ръководени локално.
Компанията твърди, че новият модел обезпечава продуктивност, сравнима с облачната версия, и превъзхожда други on-device решения в общоприетите бенчмаркове, макар че съответни други възможности не се показват.
В проява Гугъл сподели, по какъв начин роботи с модела извършват ежедневни задания, като да вземем за пример разкопчаване на чанти и прегъване на облекла. Моделът изначално е създаден за платформата ALOHA, само че е сполучливо приспособен и за двуръкия робот Franka FR3 и хуманоидния робот Apollo на Apptronik.
Според Гугъл, Franka FR3 е обработвал новите задания и обекти, които преди този момент не са били включени в подготвителния набор, в това число и сглобяване на индустриална конвейерна линия.
Заедно с модела, компанията пуска и Gemini Robotics SDK. Разработчиците ще могат да образоват роботи да извършват нови дейности, като дават 50-100 демонстрации, в това число и симулации в MuJoCo — физически симулатор от DeepMind.
Пазарът на роботика интензивно притегля други разработчици на изкуствен интелект. Nvidia работи върху платформа за базови хуманоидни модели, Hugging Face отваря модели и дейта мрежи за роботи, а корейският стартъп RLWRLD, с поддръжката на Mirae Asset, създава свои лични фундаментални ИИ-модели за тази област.




