Ускоряват 20 пъти обучението на изкуствения интелект
Новият логаритъм е стъпка към основаване на повсеместен робот
Ускореното образование на изкуствения разсъдък може да реши проблеми в доста области, където се ползва AI (снимка: CC0 Public Domain)
Учени от лабораторията за изкуствен интелект Tinkoff Research създадоха нов логаритъм за образование на AI. На роботизирани симулатори е реализирано 20-кратно нарастване на скоростта на образование спрямо всички съществуващи аналози, при 10% нарастване на качеството.
Оптимизирането на мощно ресурсоемкия развой на образование на изкуствения разсъдък с новия способ SAC-RND ще форсира развиването на доста области, в които се ползва AI, имат вяра откривателите. Така да вземем за пример, SAC-RND може да „ усъвършенства сигурността на безпилотните транспортни средства, да опрости веригите за доставки, да форсира доставките и работата на складовете, да усъвършенства горивните процеси в енергийните уреди и да понижи излъчванията на нездравословни субстанции в околната среда ”.
още по темата
Алгоритъмът освен усъвършенства работата на високоспециализирани роботи, само че приближава промишлеността до основаването на повсеместен робот, кадърен самичък да извършва всяка задача.
Резултатите от проучването на Tinkoff Research бяха показани на неотдавнашната интернационална конференция за машинно образование (ICML) в Хонолулу, Хавай, която е измежду трите най-големи в света в региона на машинното образование и AI.
Един от най-обещаващите видове AI образование е Reinforcement Learning (RL, образование с подсилване), който разрешава на изкуствения разсъдък да се учи посредством проба и неточност, да се приспособява към комплицирани среди и да трансформира държанието си в придвижване. Обучението с укрепване може да се употребява във всичко – от ръководство на тапите до рекомендации в обществените медии.
По-рано се смяташе, че потреблението на случайни невронни мрежи (RND) не е използвано за офлайн образование с укрепване. Методът RND употребява две невронни мрежи – случайна и съществена, която се пробва да планува държанието на първата. Свойството на невронната мрежа се дефинира от нейната дълбочина – броя на пластовете, от които се състои. Основната мрежа би трябвало да съдържа повече пластове от случайната, в противоположен случай моделирането и образованието стават нестабилни или даже невъзможни.
Използването на неправилни размери на мрежата докара до неправилното умозаключение, че методът RND не може да дискриминира данни – да разграничи дейности от набор от данни от други. Изследователите от Tinkoff Research откриха, че когато се употребява еквивалентната дълбочина на мрежите, методът RND стартира качествено да разграничава данните. След това те се заеха с усъвършенстване на входа и научиха роботите да измислят ефикасни решения, употребявайки механизъм за синтез, основан на модулация на сигнала и линейно картографиране. Преди това, при потребление на метода RND, входящите сигнали не бяха подложени на спомагателна обработка.
Методът SAC-RND е тестван на роботизирани симулатори и сподели по-добри резултати с по-малко запаси и време. Откритието ще помогне за ускорение на проучванията в региона на роботиката и образованието с укрепване, защото понижава времето за приемане на постоянен резултат 20 пъти и е значима стъпка към основаване на повсеместен робот.
Ускореното образование на изкуствения разсъдък може да реши проблеми в доста области, където се ползва AI (снимка: CC0 Public Domain)
Учени от лабораторията за изкуствен интелект Tinkoff Research създадоха нов логаритъм за образование на AI. На роботизирани симулатори е реализирано 20-кратно нарастване на скоростта на образование спрямо всички съществуващи аналози, при 10% нарастване на качеството.
Оптимизирането на мощно ресурсоемкия развой на образование на изкуствения разсъдък с новия способ SAC-RND ще форсира развиването на доста области, в които се ползва AI, имат вяра откривателите. Така да вземем за пример, SAC-RND може да „ усъвършенства сигурността на безпилотните транспортни средства, да опрости веригите за доставки, да форсира доставките и работата на складовете, да усъвършенства горивните процеси в енергийните уреди и да понижи излъчванията на нездравословни субстанции в околната среда ”.
още по темата
Алгоритъмът освен усъвършенства работата на високоспециализирани роботи, само че приближава промишлеността до основаването на повсеместен робот, кадърен самичък да извършва всяка задача.
Резултатите от проучването на Tinkoff Research бяха показани на неотдавнашната интернационална конференция за машинно образование (ICML) в Хонолулу, Хавай, която е измежду трите най-големи в света в региона на машинното образование и AI.
Един от най-обещаващите видове AI образование е Reinforcement Learning (RL, образование с подсилване), който разрешава на изкуствения разсъдък да се учи посредством проба и неточност, да се приспособява към комплицирани среди и да трансформира държанието си в придвижване. Обучението с укрепване може да се употребява във всичко – от ръководство на тапите до рекомендации в обществените медии.
По-рано се смяташе, че потреблението на случайни невронни мрежи (RND) не е използвано за офлайн образование с укрепване. Методът RND употребява две невронни мрежи – случайна и съществена, която се пробва да планува държанието на първата. Свойството на невронната мрежа се дефинира от нейната дълбочина – броя на пластовете, от които се състои. Основната мрежа би трябвало да съдържа повече пластове от случайната, в противоположен случай моделирането и образованието стават нестабилни или даже невъзможни.
Използването на неправилни размери на мрежата докара до неправилното умозаключение, че методът RND не може да дискриминира данни – да разграничи дейности от набор от данни от други. Изследователите от Tinkoff Research откриха, че когато се употребява еквивалентната дълбочина на мрежите, методът RND стартира качествено да разграничава данните. След това те се заеха с усъвършенстване на входа и научиха роботите да измислят ефикасни решения, употребявайки механизъм за синтез, основан на модулация на сигнала и линейно картографиране. Преди това, при потребление на метода RND, входящите сигнали не бяха подложени на спомагателна обработка.
Методът SAC-RND е тестван на роботизирани симулатори и сподели по-добри резултати с по-малко запаси и време. Откритието ще помогне за ускорение на проучванията в региона на роботиката и образованието с укрепване, защото понижава времето за приемане на постоянен резултат 20 пъти и е значима стъпка към основаване на повсеместен робот.
Източник: technews.bg
КОМЕНТАРИ




