Екип от изследователи в областта на изкуствения интелект от Станфордския

Създадоха конкурент на ChatGPT и DeepSeek-R1 само за $50

Екип от откриватели в региона на изкуствения разсъдък от Станфордския университет и Университета на Вашингтон реализираха революционен триумф. А точно - съумяха да разработят нов ИИ модел за размишление с отворен код (терминът се употребява за модели, които имитират процесите на мислене и взимане на решения в подтекста на AI).

Новият модел е наименуван s1, написа CEO Today.

Изключителното в тази ситуация е, че той е подготвен за по-малко от 50 $ под формата на кредити за облачни калкулации. Разработката на s1 дава опция на скъпите ИИ модели като o1 на OpenAI, да вземем за пример.

Обикновено огромните ИИ компании и проучвателен екипи разполагат с големи бюджети, които могат да се влагат в облачни запаси и инфраструктура за образование на модели. Но тук екипът е съумял да сътвори високопроизводителен ИИ модел с най-малък бюджет, което е огромно достижение и демонстрира, че е допустимо да се реализиран високи резултати с по-скромни запаси. Това може да отвори благоприятни условия за доста дребни екипи или самостоятелни откриватели да вземат участие в ИИ проучвания и разработки, без да имат голям бюджет.

В резюме, това значи, че може да се реализира забележителен прогрес в ИИ проучванията, даже при лимитирани финансови запаси, което е значимо за демократизацията на технологията и прави напредъка в областта на ИИ по-достъпен за повече хора.

Моделът s1 демонстрира, че е кадърен да работи на равнище, сравнимо с открити модели за разсъждения като o1 на OpenAI и R1 на DeepSeek. Неговите качества бяха тествани в основни оценки, със задания като математика и програмиране, където даде обещаващи резултати. Този модел с отворен код е разполагаем в GitHub, където са оповестени и обвързваните с него код за образование и набор от данни, позволявайки на всеки да го достъпи и опитва с него.

Изследователският екип е започнал създаването на s1, като е употребявал базисен модел и го е усъвършенствал посредством развой, наименуван дистилация. Дестилацията (или дистилацията ) на знания в подтекста на образованието на модели с изкуствен интелект е развой, при който по-малък и по-ефективен модел се образова да имитира държанието и резултатите на по-голям и по-комплексен модел. Това е способ, при който се трансферират знанията от един по-мощен, само че по-скъп за образование модел към по-малък, който изисква доста по-малко изчислителни запаси и може да бъде употребен по-ефективно в практиката.

В този случай, s1 е бил дестилиран от един от моделите за разсъждения на Гугъл - Gemini 2.0 Flash Thinking Experimental.

Чрез използване на метода на филтрация, откривателите са успели да основат модел, който показва мощни качества за разсъждения, употребявайки релативно дребен набор от данни. Дестилацията нормално е по-евтина от други техники, като интензивно образование, което се употребява от доста други разработчици на ИИ като DeepSeek за основаване на модели, сходни на o1 на OpenAI.

Моделът s1 е бил подготвен с дребен набор от данни, състоящ се единствено от 1 000 подбрани въпроса и отговори, в това число разсъжденията зад всеки отговор от Gemini 2.0 на Гугъл. Въпреки този дребен набор от данни, достиженията на модела в AI бенчмаркове бяха впечатляващи. Всъщност, той е постигнал тези резултати след единствено 30 минути образование на 16 Nvidia H100 GPU, на цена към 20 $. Това акцентира концепцията, че мощните достижения в ИИ не изискват безусловно големи количества данни или скъпоструващи ресурси.

Изследователите са добавили и образован съставен елемент, който е съумял да усъвършенства качествата на модела да " разсъждава ". Чрез въвеждане на термина " изчакай " в процеса на s1, моделът моделът е съумял да стопира " разсъжденията " си, като по този метод да си даде време да доближи до по-точни отговори на заложените му въпроси.

Успехът на модела s1 слага голям брой въпроси относно комодифицирането на ИИ моделите. Със способността, която откриватели са посочили, а точно да успеят да репликират високо представящи се модели с релативно дребни вложения, пораждат и въпросите, свързани с бъдещето на огромното развиване на ИИ и конкурентната среда за огромните лаборатории по ИИ.

Ако дребен проучвателен екип може да реализира такива резултати с минимални запаси, какви последствия ще има това за бъдещето на ИИ проучванията и развиването на технолгоията?

Наблюдава се възходящ интерес към метода, по който по-малки субекти или самостоятелни откриватели могат да допринесат за региона без нужда от достъп до огромни бюджети или корпоративна поддръжка. Появата на стопански ефикасни ИИ модели като s1 може да докара до по-демократичен достъп до мощни модели за разсъждения, което ще разреши нововъведения по целия свят.

Въпреки триумфа на s1, създаването му повдига опасения в промишлеността. Например, политиката на Гугъл не разрешава назад инженерство на техните модели за основаване на конкурентни услуги, каквото беше направено с s1. Това слага етични и правни въпроси, изключително във връзка с правата върху интелектуалната благосъстоятелност и бъдещето на достъпността на ИИ модели.

Разработчиците на ИИ като OpenAI и DeepSeek показаха опасения по отношение на дестилацията на техните модели, като обявиха, че съперници могат да се възползват от тяхната проприетарна информация.

С възходящото потребление на налични способи за филтрация, се чака тези диспути да продължат да се развиват.

Успехът на s1 акцентира капацитета за основаване на високо представящи се ИИ модели с минимални финансови вложения. Въпреки това, значимо е да се означи, че техниките за филтрация, макар че са ефикасни, не водят безусловно до основаването на революционни нови модели.

Meta, Гугъл и Microsoft са измежду фирмите, които влагат милиарди долари в инфраструктура за ИИ и последващо потомство ИИ модели. Докато дестилацията се оказа стопански ефикасна тактика, огромните вложения ще останат решаващи за напредъка на ИИ, изключително в области като мащабируемостта на моделите и основаването на изцяло нови форми на разсъждения.