Китайският ИИ-стартъп Moonshot AI, създателят на популярния чатбот Kimi, тази

...
Китайският ИИ-стартъп Moonshot AI, създателят на популярния чатбот Kimi, тази
Коментари Харесай

Китайският стартъп Moonshot пусна отворения ИИ-модел Kimi K2, който превъзхожда GPT-4

Китайският ИИ-стартъп Moonshot AI, основателят на известния чатбот Kimi, тази седмица пусна огромния езиков модел с отворен код Kimi K2. Той провокира най-съвременните модели на OpenAI и Anthropic, предоставяйки изключително високи равнища на продуктивност при шифроване и осъществяване на задания за самостоятелни ИИ-агенти.

Езиковият модел Kimi K2 с 1 трилион параметри, от които 32 милиарда са дейни, е построен въз основата на метода „ Смес от специалисти “ (Mixture of Experts). Това значи, че при обработка на поръчка се започва единствено част от цялостния модел, което усилва скоростта и успеваемостта на логаритъма. Стартъп компанията пусна по едно и също време две версии на AI-модела: базова версия за откриватели и разработчици и персонализируемата версия Kimi K2-Instruct, усъвършенствана за чатботове и самостоятелни сътрудници.

Отличителната линия на новия модел е неговата оптимизация за опциите на AI-агентите: способността за самостоятелно потребление на принадлежности, писане и осъществяване на програмен код и осъществяване на комплицирани многоетапни задания без човешка интервенция. По време на бенчмарк тестванията, Kimi K2 реализира акуратност от 65,8% в теста за разработка на програмен продукт SWE-bench Verified. Това е по-добър резултат от множеството други възможности с отворен първоначален код и е сравнимо с продуктивността на личните модели.

Параметрите за продуктивност на Kimi K2 демонстрират, че OpenAI и Anthropic би трябвало да извърнат внимание на логаритъма. Това е по този начин, тъй като Kimi K2-Instruct освен се конкурира с AI-моделите на огромните компании, само че и систематично ги превъзхожда по задания, които са значими за корпоративните клиенти.

В един от най-подходящите проби за шифроване, LiveCodeBench, Kimi K2 реализира акуратност от 53,7% — доста по-добър резултат от този на DeepSeek–V3 (46,9%) и GPT-4.1 (44,7%). Още по-впечатляващ е резултатът му в теста MATH-500, където Kimi K2 означи 97,4%, до момента в който GPT-4.1 показва единствено 92,4%. Това може да демонстрира, че Moonshot AI е направил фундаментален пробив в математическото мислене, който превъзхожда по-големите и по-добре финансирани съперници.

Струва си да се има поради, че Moonshot реализира тези впечатляващи резултати със доста по-малко запаси и средства от по-големите компании. Например, OpenAI харчи стотици милиони долари, с цел да усъвършенства последователно своите AI-модели. Изглежда, че Moonshot е намерил по-ефективен метод за реализиране на същия резултат. Последиците от това биха могли да надвишават елементарното фукане. Корпоративните клиенти от дълго време чакат AI-системи, които фактически могат да извършват комплицирани натоварвания, а не просто да основават лъскави демонстрации. Резултатите от тестванията на Kimi K2 демонстрират, че това може да се случи скоро.

В техническата документи на Moonshot има подробност, който може би е по-голям от резултатите от тестването на новия логаритъм: оптимизаторът MuonClip, който разрешава процеса на образование на AI-модел с трилион параметри да се реализира без никакви спънки.

Това не е просто инженерно достижение, а може би смяна в парадигмата. Нестабилността в образованието се е трансформирала в скрита спънка при създаването на огромни езикови модели. Компаниите са принудени да организират скъпоструващо преквалифициране, да внедряват ограничения за сигурност и да толерират неоптимална продуктивност, с цел да създадат процеса на образование по-стабилен.

Икономическите последствия биха могли да бъдат също толкоз впечатляващи. Ако MuonClip се окаже повсеместен, методът на компанията за образование на моделите с изкуствен интелект би могъл фрапантно да понижи разноските за изчислителна мощ. В промишленост, където разноските за образование доближават десетки милиони долари, даже скромното повишение на успеваемостта би могло да обезпечи по този начин нужното конкурентно преимущество.

Заслужава да се означи още, че решението на Moonshot да даде отворен код на Kimi K2, като в същото време дава достъп до API на логаритъма на конкурентна цена, показва задълбоченото схващане на пазарната динамичност. Ценообразуването на Moonshot от $0,15 на милион въведени токена и $2,50 на милион генерирани токена е доста по-ниско от това на OpenAI и Anthropic, до момента в който AI-моделът на китайския стартъп предлага сравнима и в някои случаи превъзходна продуктивност. Важен стратегически ход е двойната наличност: корпоративните клиенти могат да употребяват API, с цел да внедрят неотложно услугата, а по-късно да преминат към самостоятелни логаритми, с цел да усъвършенстват разноските или да подобрят сходството.

Това може да сътвори проблеми за огромните AI-компании. Ако доближат цените на Moonshot, облагите им ще намалеят. Ако не го създадат, рискуват да изгубят клиенти, които желаят да преминат към по-евтин ИИ-модел, който се показва също толкоз добре. В този случай статутът на модела с отворен код не е някаква благотворителност; това е умишлен ход за привличане на клиенти. Всеки разработчик, който изтегли Kimi K2 и опитва с логаритъма, става евентуален корпоративен клиент на Moonshot. В същото време всяко усъвършенстване, което общността прави, понижава разноските за разработка на компанията.

Демонстрациите на Moonshot демонстрират, че изкуственият разсъдък последователно става все по-полезен. Например, при разбора на заплатите, Kimi K2 не просто дава отговор на въпроси по отношение на данните, а самостоятелно извършва 16 интервенции, с цел да извърши статистически разбор и да генерира интерактивни визуализации. Демонстрацията за обмисляне на концерти в Лондон изискваше потреблението на 17 инструмента в голям брой платформи – търсене, календар, имейл, полети, настаняване и резервации в заведения за хранене. И това не бяха презентации, готови от мениджъри, а действителни демонстрации на изкуствен интелект, изпълняващ самостоятелно комплицирани, многоетапни задания.

Това е друго от метода, по който работят актуалните ИИ-асистенти, които се отличават с воденето на диалози, само че се затрудняват с осъществяването на задания. Докато съперниците работят, с цел да създадат своите чатботове по-човешки, Moonshot дава приоритет на това да направи логаритмите по-полезни. Това е значимо, тъй като бизнесите желаят не изкуствен интелект, който може да премине теста на Тюринг, а подобен, който може да извършва дейно продуктивни задания.

Истинският пробив не е в една единствена опция, а в координираната работа на доста принадлежности и услуги. Предишните версии на AI-агенти изискваха деликатно планиране, обмисляне на работния развой и непрекъснат човешки контрол. Kimi K2 наподобява е кадърен самостоятелно да се оправя с когнитивните натоварвания, свързани с разделянето на задания, избора на принадлежности за решаването им и коригирането на неточности.

За разлика от предходните „ убийци на GPT “, които успяваха в тесни области, само че нямаха практическо приложение, Kimi K2 показва висока подготвеност в необятен набор от задания. Алгоритъмът може да написа програмен код, да взема решение математически проблеми, да употребява разнообразни принадлежности и да извършва комплицирани работни задания. В същото време логаритъмът е наличен за трансформация и изпробване, с помощта на което създаването му може да протича по-бързо.

Източник: kaldata.com


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР