Изкуствен интелект програмира сам себе си
Учените от дълго време се пробват да основат сътрудници с изкуствен интелект, които се самоусъвършенстват (снимка: CC0 Public Domain)
Може ли един логаритъм да написа съвършен програмен код? Изглежда, че изкуственият разсъдък ще направи идната решителна стъпка в развиването си. Нов логаритъм на Дарвин-Гьодел разрешава на кодиращите AI сътрудници да се самоусъвършенстват.
Учените от дълго време се надяват да затворят изцяло цикъла, като основат сътрудници с изкуствен интелект, които рекурсивно се самоусъвършенстват. Ново проучване, за което оповестява изданието Spectrum на IEEE, показва впечатляващ образец за такава система.
„ Мисля, че за доста хора резултатите са изненадващи. Тъй като работя по тази тематика от съвсем 40 години, за мен това е може би по-малко изненадващо ”, разяснява достижението Юрген Шмидхубер, компютърен академик в Университета за просвета и технологии „ Крал Абдула ” (KAUST) в Саудитска Арабия.
През 2003 година Шмидхубер основава стратегии за решение на проблеми, които биха пренаписали личния си код, единствено в случай че могат публично да потвърдят, че актуализациите са потребни. Той ги назовава машини на Гьодел, на името на Курт Гьодел, математик, който е работил върху самореферентни системи. Но за комплицирани сътрудници доказуемата полза не е лесна за реализиране.
Новите AI системи, разказани в неотдавнашното проучване, се основават на емпирични доказателства. В знак на респект към Шмидхубер, те се назовават Дарвин-Гьодел машини (DGM).
DGM стартира с кодиращ сътрудник, който може да чете, написа и извършва код, употребявайки LLM (голям езиков модел) за четене и писане. След системата ползва постепенен логаритъм, с цел да сътвори доста нови сътрудници.
При всяка итерация DGM избира един сътрудник от популацията и инструктира LLM да сътвори една смяна, с цел да усъвършенства способността на сътрудника да написа код. LLM имат нещо като вътрешен глас за това какво ще помогне, тъй като са подготвени върху огромни размери код, написан от хора код.
Резултатът е ориентирана еволюция, нещо приблизително сред инцидентна разновидност и доказуемо потребно усъвършенстване. След това DGM тества новия сътрудник върху бенчмарк код, оценявайки способността му да взема решение програмни проблеми.
Някои еволюционни логаритми резервират единствено най-добре представящите се в популацията сътрудници, приемайки, че напредъкът се движи безпределно напред. DGM обаче резервира всички сътрудници, ако иновация, която в началото се е провалила, може да се окаже ключът към пробив по-късно, след в допълнение рационализиране.
Това е форма на „ отворено проучване ”, която оставя отворени пътища за прогрес (DGM към момента дава приоритет на сътрудници с по-високи резултати при избора на предци).
Учените са пуснали DGM на 80 итерации, употребявайки бенчмарк кода SWE-bench, и на 80 итерации, употребявайки бенчмарк кода Polyglot. Резултатите на сътрудниците се подобрили от 20% на 50% в SWE-bench и от 14% на 31% в Polyglot.
„ Бяхме в действителност сюрпризирани, че сътрудникът може самичък да напише подобен комплициран код ”, споделя Джени Джанг, компютърен академик в Университета на Британска Колумбия и водещ създател на публикацията. „ Той можеше да редактира голям брой файлове, да основава нови файлове и да основава в действителност комплицирани системи ”.
Най-важното е, че DGM превъзхождаха различен способ, който употребява външна система за възстановяване на сътрудниците. С използване на DGM, подобренията на сътрудниците се натрупват, до момента в който те се усъвършенстват. DGM също по този начин превъзхождаха версия, която не поддържа популация от сътрудници, а просто модифицира най-новия сътрудник.
Все отново, най-хубавият SWE-bench сътрудник не е толкоз добър, колкото най-хубавият сътрудник, планиран от човек, който получава към 70%, само че е генериран автоматизирано и с задоволително време и изчислителна мощ сътрудникът би могъл да надмине човешкия опит.
Агентите могат да станат неразбираеми или да спрат да следват човешки указания. Затова Джанг и нейните сътрудници прибавят защитни ограничения. Те държат DGM-ите в “пясъчник ” без достъп до интернет или операционна система и записват и одитират всички промени в кода.
В бъдещите си проучвания учените възнамеряват да възнаграждават сътрудниците за това, че са по-разбираеми и поредни, което ще подтиква още повече тяхното самоусъвършенстване.
Дистрибуторска партньорска стратегия и нови бизнес благоприятни условия с Апком България
Апком дава достъп до световната екосистема на Apple за компании у нас »»»
предишна обява: Черният леопард е тук, подготвен за скок: Genesis Zircon XIII следваща обява:
графа: Изкуствен разсъдък, Новаторски, Новини, Топ вести | етикети: логаритъм на Дарвин-Гьодел, изкуствен интелект, програмиране
Коментар
ИМЕ *
Източник: technews.bg
КОМЕНТАРИ




