Не е само модел, а цяла вселена: от лидари до

...
Не е само модел, а цяла вселена: от лидари до
Коментари Харесай

NVIDIA представи публично AR1 – първият AI мозък за роботи, който вижда, анализира и взема решения в реално време

Не е единствено модел, а цяла галактика: от лидари до хуманоиди в единна екосистема.

Точно когато наподобява, че границите на AI са изследвани, NVIDIA още веднъж измества хоризонта. На конференцията NeurIPS компанията показа набор от модели с отворен код за физически и цифрови системи, които могат доста да ускорят напредъка в самостоятелните транспортни средства, роботиката и обработката на тон. Това не е просто следващата актуализация, а по-скоро покана за изпробване за всеки, който се занимава с проучвания в региона на изкуствения разсъдък.

Основният фокус на полемиката е Alpamayo-R1, или просто AR1 – първият модел с отворен код, който съчетава зрението, езиковата интерпретация и действието в една логичност на размишление. Този метод се назовава VLA и до момента сходни комплекси не са били обществено налични. AR1 се учи да проучва обстановката малко по малко: проучва околната среда, начертава вероятните траектории, съпоставя ги с подтекста и избира най-безопасния вид. Това е изключително значимо, когато придвижването става безредно, да вземем за пример когато кръстовището е препълнено с пешеходци, насрещно движещи се коли и неочаквани трудности като паркирани камиони в профил на пътя.

AR1 се базира на платформата Cosmos Reason на NVIDIA и е налична за откриватели с отворен код за некомерсиална приложимост. Отделна част от работата се концентрира върху това по какъв начин образованието с укрепване усъвършенства способността на модела да формулира решенията си: по-дългите цикли на образование сензитивно ускоряват неговата логическа „ вътрешен глас “. Изходният код е наличен в GitHub и Hugging Face, а някои от наборите за образование са включени в отворените набори от данни NVIDIA Physical AI Open Datasets. За тестване е предоставена симулационната рамка AlpaSim, с която може да се ревизира държанието на модела в разнообразни обстановки.

Но като цяло този модел е единствено върхът на една доста по-голяма структура. Под марката Cosmos се развива цяла екосистема от принадлежности, предопределени за физически системи. LidarGen основава синтетични данни за симулация с лидар – основна технология в безпилотните транспортни средства. Omniverse NuRec Fixer оказва помощ да се подредят невронните реконструкции на 3D подиуми. Cosmos Policy генерира правила за държание на роботи, а ProtoMotions3 образова хуманоидите в подробна виртуална среда, в която могат да се разиграват всевъзможни условия – от склад до градска улица.

Тези модели към този момент започнаха да проникват в работни планове: сътрудници на NVIDIA, измежду които Voxel51, 1X, Figure AI, Foretellix, Gatik, Oxa, PlusAI и X-Humanoid, ги употребяват за личните си опити с самостоятелни коли и роботи. Групата ETH Цюрих употребява Cosmos за основаване на 3D подиуми и показа първите резултати на същия NeurIPS.

Успоредно с това компанията укрепва позициите си в региона на цифровото моделиране. Пакетът на Nemotron получи няколко забележителни актуализации: MultiTalker Parakeet се научи да разпознава говора от голям брой представители, Sortformer откроява гласовете в действително време, а новите трупи от синтетични данни са предопределени за образование на системи за размишление и характерни за дадена област AI модели. На друго място в актуализацията се появи Audio Flamingo 3 – огромен аудиомодел, кадърен да обработва тон, музика и тирада в единна логичност за разбор. Друга разработка, Minitron-SSM, свива хибридните модели без забележима загуба на акуратност.

Няколко финални линии са Jet-Nemotron и Nemotron-Flash, основани особено за ускорение на LLM изхода и понижаване на латентността. А в техническото изложение NVIDIA се отбелязва, че дълготрайното образование с укрепване – ProRL – оказва помощ на тези логаритми непрекъснато да превъзхождат базовите версии във връзка с разсъжденията.

Artificial Analysis прави оценка, че фамилията Nemotron към този момент е измежду най-достъпните и транспарантни аналози на пазара. За изследователската общественост това значи повече самостоятелни опити, по-разнообразни приложения и по-малко бариери сред една концепция и нейното валидиране.

(function() { const banners = [ // --- БАНЕР 1 (Facebook Messenger) --- `
Източник: kaldata.com


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР