Alibaba не изостава от конкурентите и съюзниците си. Китайската компания

DeepSeek е само началото: Qwen 2.5 Max разбива монопола на САЩ върху съвременния изкуствен интелект

Alibaba не изостава от съперниците и съдружниците си.

Китайската компания Alibaba показа новия езиков модел Qwen 2.5 Max, който съгласно разработчиците превъзхожда водещите американски системи за изкуствен интелект. На фона на неотдавнашния триумф на китайския стартъп DeepSeek това събитие провокира нова вълна от полемики за водачеството на Съединени американски щати в региона на изкуствения разсъдък.

Според тестванията в известните системи за оценка Arena-Hard, MMLU-Pro, GPQA-Diamond, LiveCodeBench и LiveBench Qwen 2.5 Max се показва по-добре от GPT-4o на OpenAI, Claude 3.5 Sonnet на Anthropic и Llama 3.1 405B на Meta. Моделът може да обработва текст, видео и изображения, както и да търси в интернет.

Разработчиците от Alibaba акцентират, че са сравнили своя модел с DeepSeek V3, а не с необятно разисквания R1. С това се изяснява и изборът на GPT-4o като точка за съпоставяне вместо на водещите модели o1 от OpenAI. Независимо от това достиженията на китайските компании слагат под въпрос успеваемостта на западните опити да задържат развиването на изкуствения разсъдък в Китай.

Техническите характерности на новия модел към момента са загадка. Известно е единствено, че Qwen 2.5 Max е построен въз основата на архитектурата MoE (mixture of experts) и е подготвен върху набор от данни от 20 трилиона токена. След главното образование моделът е минал през стадии на тънко конфигуриране под наблюдаване и RLHF (обучение с укрепване въз основата на човешка противоположна връзка).

Архитектурата MoE, която се употребява и от Mistral и DeepSeek, разрешава основаването на профилирани „ експертни “ модули за решение на съответни задания, като програмиране или математически калкулации. Основното преимущество на този метод е опцията за увеличение на общия брой параметри без понижаване на продуктивността, защото за всяка поръчка се задействат единствено съответните дялове на невронната мрежа.

Точният брой на параметрите на Qwen 2.5 Max не се разкрива, макар че е известно, че предходната версия на Max е съдържала към 100 милиарда параметъра. Забележително е, че даже вграденият чатбот на модела не може да отговори на въпроса за неговите механически характерности.

За разлика от предходните версии на Qwen, новият модел няма да се популяризира в общественото пространство. В уеб страницата на Alibaba Cloud той е маркиран като патентован, което изяснява оскъдната техническа информация. Този метод е присъщ за доста разработчици – компанията към този момент направи същото с моделите Qwen Turbo и Qwen Plus.

Цената за потребление на Qwen 2.5 Max посредством API е $10 на милион входни токени и $30 на милион генерирани токени. За съпоставяне, GPT-4o на OpenAI таксува 2,50 $ на милион входни токени и 10 $ на милион генерирани токени. В същото време флагманът o1 на OpenAI е по-скъп – надлежно 15 и 60 $.

Qwen 2.5 Max е единствено най-новото попълнение в фамилията на моделите на Alibaba, чието създаване стартира през 2023 година От септември насам компанията пусна серията модели с отворен код Qwen 2.5 с брой на параметрите сред 0,5 милиарда и 72 милиарда Според изказванията на разработчиците най-големите от тях не отстъпват на Llama на Meta с 405 милиарда параметъра.

Успоредно с това Alibaba създава профилирани модели за математически калкулации и програмиране, а през декември показа QwQ – „ мислещ “ модел, сходен по функционалност на o1. Тази седмица компанията пусна и три модела с отворен код за манипулиране на изображения (VLM), за които се твърди, че са толкоз положителни, колкото Gemini 2 на Гугъл, GPT-4o и Sonnet 3.5 на Claude.

Освен това Alibaba усъвършенства своите модели Qwen 2.5 до 7 и 14 милиарда параметри, разширявайки техния контекстен прозорец до един милион токена. Това разширение е изключително потребно за RAG-системите, като им разрешава да обработват огромни количества документи, без да губят подтекста.

Успехът на китайските разработчици обаче поражда угриженост по отношение на поверителността на данните и цензурата. Както и при DeepSeek, данните на потребителите на Qwen Chat се съхраняват на сървъри в Китай и Сингапур. Стив Хайдел, разработчик на API за OpenAI, иронично означи в обществената мрежа X:

„ Американците толкоз обичат да дават данните си на Китайската комунистическа партия в подмяна на безвъзмездни услуги “.

Не по-малко съществени са опасенията за цензура на противоречиви тематики, които биха могли да хвърлят сянка върху режима в Пекин. Подобно на други китайски модели, DeepSeek и Alibaba заобикалят да разискват тематики като събитията на площад Тянанмън или политическия статут на Тайван, или прекъсват генерирането на отговори на такива въпроси.