Google DeepMind използва голям езиков модел, за да разбие известен

Google DeepMind използва голям езиков модел, за да реши неразрешим математически проблем

Гугъл DeepMind употребява огромен езиков модел, с цел да разбие прочут неуреден проблем в чистата математика. В обява, оповестена през днешния ден в Nature, откривателите споделят, че това е първият път, когато е употребен огромен езиков модел за разкриване на решение на дълготраен теоретичен пъзел.

Става въпрос за производство на проверима и скъпа нова информация, която не е съществувала преди.

„ Това не е в данните за образованието – даже не е било известно “, споделя съавторът Пушмийт Кохли, вицепрезидент по проучванията в Гугъл DeepMind.

Големите езикови модели имат известност за измисляне на неща, а не за даване на нови обстоятелства. Новият инструмент на Гугъл DeepMind, наименуван FunSearch, може да промени това. Това демонстрира, че ИИ в действителност може да прави открития, в случай че бъде уверен и в случай че изхвърлите по-голямата част от това, което си измисля.

FunSearch продължава поредност от открития в региона на фундаменталната математика и компютърните науки, които DeepMind направи благодарение на AI. Първият AlphaTensor откри метод да форсира изчисленията в основата на доста разнообразни типове код, като усъвършенства 50-годишен връх. Тогава AlphaDev откри способи да накара основните логаритми, употребявани трилиони пъти дневно, да работят по-бързо.

И въпреки всичко тези принадлежности не употребяват огромни езикови модели.

Създадени върху AI AlphaZero на DeepMind, и двете решаваха математически проблеми, като ги третираха като пъзели в Go или шах. Проблемът е, че те са заседнали в лентите си, споделя Бернардино Ромера-Паредес, откривател в компанията, който е работил както върху AlphaTensor, по този начин и върху FunSearch:

AlphaTensor е страховит в матричното умножение, само че всъщност нищо друго.

FunSearch има друг метод.

Той съчетава огромен езиков модел, наименуван Codey, версия на PaLM 2 на Гугъл, която е тънко настроена на компютърен код, с други системи, които отхвърлят неправилни или безсмислени отговори и включват положителни назад.

За да бъда доста почтен с вас, имаме хипотези, само че не знаем тъкмо за какво това работи. В началото на плана не знаехме дали това въобще ще работи.
Алхусейн Фаузи, откривател в Гугъл DeepMind.

Изследователите започнаха, като скицираха казуса, който желаеха да решат в Python, известен език за програмиране. Но те пропуснаха редовете в програмата, които ще уточнят по какъв начин да се реши. Това е мястото, където се намесва FunSearch. Той кара Коди да попълни празните места – в действителност да предложи код, който ще реши казуса.

След това втори логаритъм ревизира и прави оценка това, което Коди измисля.

Най-добрите оферти, даже в случай че към момента не са верни, се резервират и се връщат на Коди, който се пробва да приключи програмата още веднъж.

Много ще бъдат безсмислени, някои ще бъдат рационални, а няколко ще бъдат в действителност вдъхновяващи. Взимате тези в действителност вдъхновяващи и казвате: „ Добре, вземете тези и повторете.
Коли

След няколко милиона оферти и няколко десетки повторения на цялостния развой, FunSearch съумя да излезе с код, който сътвори вярно и незнайно преди този момент решение на казуса с стеснен набор, което включва намиране на най-големия размер от избран вид набор.

Представете си, че чертаете точки върху милиметрова хартия. Проблемът с набора е като да се пробвате да разберете какъв брой точки можете да поставите, без три от тях да образуват права линия.

Това е супер нишово, само че значимо.

Математиците даже не са съгласни по какъв начин да го решат, камо ли какво е решението.

Терънс Тао от Калифорнийския университет в Лос Анджелис, който е спечелил доста от най-хубавите награди по математика, се изрече по тематиката. Тао е заинтересован от това, което FunSearch може да направи.

Това е обещаваща парадигма. Това е забавен метод да се употребява силата на огромните езикови модели.
Тао

Основно преимущество, което FunSearch има пред AlphaTensor е, че на доктрина може да се употребява за намиране на решения на необятен кръг от проблеми. Това е по този начин, тъй като създава код – рецепта за генериране на решението, а не самото решение. Различен код ще реши разнообразни проблеми. Резултатите от FunSearch също са по-лесни за схващане. Една рецепта постоянно е по-ясна от странното математическо решение, което създава.

За да тестват неговата еластичност, откривателите са употребявали FunSearch, с цел да подходят към различен сложен проблем в математиката.

Проблемът с пакетирането на кошчета, който включва опит за пакетиране на продукти във допустимо минимум кошчета.

Това е значимо за редица приложения в компютърните науки, от ръководство на центрове за данни до електронна търговия. FunSearch измисли метод да го реши, който е по-бърз от тези, основани от хора.

Математиците към момента се пробват да намерят най-хубавия метод да включат огромни езикови модели в нашия проучвателен работен развой по способи, които употребяват тяхната мощ, като в същото време смекчават техните дефекти. Това сигурно демонстрира един вероятен път напред.
Тао