Изследователи от Google DeepMind и Университета на Южна Калифорния представиха

...
Изследователи от Google DeepMind и Университета на Южна Калифорния представиха
Коментари Харесай

Още една стъпка напред: DeepMind представи фреймуърк, който силно подобрява способностите на LLM

Изследователи от Гугъл DeepMind и Университета на Южна Калифорния показаха напълно новия вид фреймуърк SELF-DISCOVER. Той внезапно усъвършенства качествата за размишление на огромни езикови модели. С този метод GPT-4 реализира резултати от 81%, 85% и 73% акуратност надлежно в тестванията Big-Bench Hard, Thinking for Doing и Math. За разлика от него, при потреблението на Chain of Thought (CoT), различен известен фреймуърк, точността спадна до 75%, 52% и 71%. Новият способ също по този начин изисква от 10 до 40 пъти по-малко изчислителна мощ за правене на изводите.

Софтуерната платформа SELF-DISCOVER дава опция на изкуствения разсъдък (в този случай езикови модели като GPT-4 или PaLM 2) независимо да се научи да намира и ползва най-ефективните способи за решение на комплицирани проблеми. Това значи, че вместо да следват авансово избран логаритъм, моделите сами дефинират по какъв начин най-добре да решат поставената задача.

Основната характерност на този фреймуърк е, че той разрешава на моделите да избират сами и да комбинират разнообразни блокове от разсъждения. По този метод те независимо образуват най-подходящата тактика за реализиране на дадена цел. Това е друго от предходните подходи, при които моделът трябваше да следва набор от ясни указания.

Методът работи на два стадия. В първия моделът на изкуствен интелект проучва поставената задача и дефинира кои блокове от разсъждения могат да бъдат приложени за решаването ѝ. Тези блокове са атомарни единици на логиката и разсъжденията. Като да вземем за пример сериозно мислене, решение малко по малко, разбор на подзадачи и така нататък Моделът преглежда другите способи за размишление, с които разполага, и избира най-подходящите от тях. Този развой е сходен на метода, по който човек, когато се сблъска с нов проблем, търси способи за решаването му и избира най-хубавия от тях.

След като моделът е формирал тактиката за решение, той пристъпва към нейното използване. На този стадий моделът следва създадената конструкция на размишление, като малко по малко прави нужните дейности за реализиране на резултата.

С помощта на SELF-DISCOVER моделите са в положение да вземат решение проблемите доста по-гъвкаво и дейно. За разлика от обичайните способи, при които моделът може да „ зацикли “ при комплицираните проблеми заради несъответствия в заложения логаритъм, SELF-DISCOVER разрешава на изкуствения разсъдък да се приспособява и да откри оптималния път към решението. Това усъвършенства успеваемостта при комплицираните проби.

Изследователите тестваха SELF-DISCOVER, като го използваха в GPT-4, PaLM 2-L и други LLM върху 25 разнообразни задания, изискващи комплицирани разсъждения. В 21 от 25-те случая SELF-DISCOVER се показа по-добре от обичайните способи, като усъвършенства представянето с 32% и повече. Освен това бе открито, че SELF-DISCOVER изисква 10-40 пъти по-малко изчислителни запаси за приемане на резултатите.

Източник: kaldata.com


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР