Компанията за изкуствен интелект на Илон Мъск пусна най-новия си

Илон Мъск представи „мислещите“ модели Grok 3 и Grok 3 mini – конкурентите на DeepSeek и OpenAI със „страшно интелигентен“ ИИ

Компанията за изкуствен интелект на Илон Мъск пусна най-новия си флагмански AI-модел Grok 3, отговорът на xAI на “мислещите “ модели на OpenAI и китайския DeepSeek, който се популяризира като „ ужасно образован AI “.

Отбелязва се, че с цел да образова Grok 3, xAI употребява голям център за данни в Мемфис, който съдържа към 200 000 графични процесора. Самият Мъск означи, че най-новият модел е основан с „ 10 пъти “ по-голяма изчислителна мощ от Grok 2 и с уголемен набор от данни за образование, за който се твърди, че включва материали от правосъдни каузи.

„ Grok 3 е с порядък по-мощен от Grok 2 “, сподели Мъск по време на презентация, излъчена в понеделник. „ Това е AI, който търси истината колкото е допустимо повече, даже в случай че тази истина от време на време опонира на това, което е политкоректно. “

Grok 3 не е обособен модел, а цяло семейство, което включва и по-малка версия — Grok 3 mini (който дава отговор на въпроса по-бързо, само че може да не е толкоз точен). В момента единствено обособени модели са налични в бета-версия, до момента в който цялостното пускане е дадено за понеделник.

Какви са резултатите от теста?

Според xAI, Grok 3 превъзхожда GPT-4o по бенчмаркове, в това число AIME, който прави оценка продуктивността на модела по набор от математически въпроси, и GPQA, който прави оценка моделите, употребявайки проблеми по физика, биология и химия на равнище докторантура. Съобщава се също, че ранната версия на Grok 3 е постигнала конкурентни резултати в тестванията на Chatbot Arena, които се опълчват на разнообразни AI-модели и събират потребителски оценки за техните отговори.

Двете вариации на Grok 3 – Grok 3 Reasoning и Grok 3 mini Reasoning – могат деликатно да „ обмислят “ проблемите, сходно на „ разсъждаващи модели “ като o3-mini на OpenAI и R1 на китайския DeepSeek. Разсъждаващите модели са известни с това, че деликатно се тестват преди издание на резултатите, което им разрешава да избегнат някои от клопките, които нормално изтезават общоприетите модели.

Стартъпът на Мъск също по този начин самоуверено твърди, че Grok 3 Reasoning превъзхожда най-хубавата версия на o3-mini, o3-mini-high — в няколко известни теста, в това число по-новия математически тест, наименуван AIME 2025.

Достъпност

Моделите на размишление, които xAI разпространява като най-хубави при обработката на поръчки по математика, просвета или програмиране, ще бъдат налични в уеб-приложението Grok или приложението за iOS – за по-сложните задания са планувани разновидностите „ Think “ и „ Big Brain “ (последната от които включва „ в допълнение пресмятане “), както и алтернатива DeepSearch (като тази, показана неотдавна от OpenAI).

Мъск означи, че някои от „ мислите “ на разсъждаващите модели в програмата ще бъдат скрити, с цел да се предотврати дестилацията —- техника, употребена сега от разработчиците на AI-модели за заемане на данни от други модели. Наскоро OpenAI заподозря, че по този метод е подготвен моделът DeepSeek, за който се твърди, че е взел данни от ChatGPT.

Grok 3 в началото ще бъде наличен за Premium+ клиентите на X, само че за разширени функционалности към този момент има нов проект, наименуван SuperGrok, който за $30 на месец (или $300 на година) отключва спомагателни разсъждения и поръчки към DeepSearch и разрешава безкрайно основаване на изображения.

След към седмица Grok 3 (и неговите предшественици) ще получи „ гласов режим “, а след няколко седмици ще бъде включен в корпоративния API на xAI, дружно с функционалността DeepSearch. Мъск също дава обещание, че след няколко месеца ще отвори изходния код на Grok 2.

„ Нашият метод е, че отваряме най-новата версия, когато идната е изцяло пусната. Когато Grok 3 стане зрял и постоянен, което е евентуално след няколко месеца, тогава ще стартираме Grok 2 като отворен код.„