DeepMind, дъщерната компания на Google, публикува научна статия за новата

DeepMind представи нова парадигма в машинното обучение

DeepMind, дъщерната компания на Гугъл, разгласява научна публикация за новата парадигма в машинното образование Scheduled Auxiliary Control или SAC-X (планиран спомагателен контрол). Учените сътвориха модел, който от нулата се учи независимо да извършва поставените задания при нищожен размер входни данни.
Алгоритъмът бе тестван посредством компютърни симулации, а по-късно с действителни хардуер и съоръжение.

Първата съществена задача, сложена пред новия логаритъм е подреждането на кубчета в кутия. На пръв взор, задачата не наподобява комплицирана, само че за нейното решение изкуственият разсъдък би трябвало да има основни зрително-моторни умения и привички – доближаване до обекта, улавяне, покачване, отваряне на кутията и слагане на предметите в нея.

Специфичното в тази задача е, че изкуственият разсъдък би трябвало независимо да се научи да координира деветте стави на механичната ръка, с цел да извърши вярно всички дейности.

Парадигмата SAC-X се базира на концепцията, че с цел да извършва комплицирани задания, изкуственият разсъдък в началото би трябвало да изследва дребната налична за него област и да овладее базовите привички. Освен тази съществена задача, ИИ получава и няколко спомагателни, които насърчават проучването на пространството, налично за датчиците. Например, да се задействат тактилните датчици на пръстите, да се усили силата на китката, да се усили до най-много ъгъла на ставата, доближаване до обекта за реализиране на удобна зона на видимост и други.

Допълнителните междинни цели доста усилват възможностите за схващане и осъществяване на по-сложни задания. Постигането на всяка една от тези задания се награждава посредством специфичен сигнал, който в този случай значи заплащане и преустановяване на работата по съответната задача или подзадача.

Новият ИИ независимо избира идната си цел. За вземането на това решение оказва помощ модулът за обмисляне, който по време на тренировките и самообучението независимо се усъвършенства. С помощта на този модул бе реализирана оптималната успеваемост на осъществяване на дилемите при най-малко входни данни.

Научната работа по отношение на новата ИИ парадигма Scheduled Auxiliary Control бе оповестена в arxiv.org на 28 февруари тази година.