Ant Group представи нов метод за обучение на ИИ модели

...
Ant Group представи нов метод за обучение на ИИ модели
Коментари Харесай

Ant Group измисли как ефективно да обучава ИИ с китайски чипове вместо с тези на Nvidia

Ant Group показа нов способ за образование на ИИ модели посредством потребление на китайски полупроводници, в това число чипове на Huawei и Alibaba. Компанията е приложила архитектурата Mixture of Experts и към този момент е постигнала резултати, сравними с потреблението на графичните процесори (GPU) H800 на Nvidia, което ускорява позициите на Китай на фона на наложените от Съединени американски щати ограничавания.

Постижението бележи значим стадий в софтуерното опълчване сред китайските и американските компании, което ескалира трагично, откакто DeepSeek потвърди, че е допустимо да се основават модерни огромни езикови модели (LLM) без вливане на милиарди долари, сходно на тези, направени от OpenAI и Гугъл. Въпреки че Ant Group към момента употребява решения на Nvidia в редица планове, компанията избира различни снабдители, в това число AMD, както и локалните китайски производители на полупроводници в своите нови разработки, изключително в изискванията на възходящия напън от страна на американските ограничавания за експорт. Това разрешава на китайските компании да поддържат темпото на софтуерния напредък и да понижат зависимостта си от задгранични снабдители, най-много от Nvidia.

Според проучвателен документ, оповестен през март, Ant Group твърди, че нейните модели с изкуствен интелект превъзхождат разработките на Meta при избрани проби. Тези изказвания обаче към момента не са без значение доказани. В същото време е значимо да се означи, че моделът H800, макар че не принадлежи към напредналия клас ускорители на Nvidia, остава мощен инструмент, кадърен да се оправи с ресурсоемките задания за образование на ИИ. Благодарение на личната си усъвършенствана тактика Ant Group съумя да понижи разноските за образование на ИИ модел с 1 трилион токена от 6,35 милиона юана (880 000 долара) на 5,1 милиона юана (707 000 долара). В този подтекст токените са минималните единици текст, върху които се образоват LLM, с цел да генерират след това смислени отговори на потребителски поръчки.

Източник: kaldata.com


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР