GPT-4 има нов съперник: Новият ИИ модел на Nvidia значително го превъзхожда
Nvidia тихомълком показа своя нов ИИ модел Llama-3.1-Nemotron-70B-Instruct, който изпревари продуктите на пазарните водачи като GPT-4 на OpenAI. Моделът без непотребен звук, бе качен в платформата Hugging Face, където незабавно притегли вниманието с помощта на изключителното си показване в бенчмарковете. Експертите настояват, че това е един от най-добре представящите се огромни езикови модели на пазара и с най-хубаво съответствие цена-качество.
Новият модел реализира рекордни резултати: 85,0 точки на Arena Hard, 57,6 точки на AlpacaEval 2 LC и 8,98 точки на GPT-4-Turbo MT-Bench. Тези резултати слагат новия артикул пред GPT-4o на OpenAI и Claude 3.5 Sonnet на Anthropic, като удостоверяват непредвиденото водачество на Nvidia в региона на изкуствения разсъдък.
Компанията, известна преди този момент като производител на графични ускорители, направи стратегически ход, с цел да стартира да създава огромни езикови модели. Проектът на Дженсен Хуанг има за цел да се трансформира в пълновръстен състезател на пазара на ИИ и да притисне колосите, които преобладават в него. За да сътвори Llama-3.1-Nemotron-70B-Instruct, Nvidia усъвършенства модела с отворен код Llama 3.1 на Meta, като ползва техники за интензивно образование с човешка противоположна връзка (RLHF).
Моделът е изключително прелъстителен, защото може да дава отговор на комплицирани поръчки без спомагателен подтекст или специфични маркери. Например той дава отговор вярно на въпроса за броя на „ R “ в думата „ strawberry “ (ягода): преди този момент най-усъвършенстваните RLHF „ заспиваха “ точно на този въпрос.
Нововъведението към този момент е видяно от огромните компании, защото моделът дава по-точни и по-полезни отговори, които покачват равнището на задоволеност на потребителите. Разработчиците са сложили приоритет върху сходството сред упованията на клиентите и и резултатите от модела. Той дава отговор в детайли, само че тъкмо и всъщност. Интегрирането му в приложенията може да бъде по-изгодно, в сравнение с потреблението на конкурентните решения. Nvidia също по този начин дава безвъзмезден достъп до своя модел посредством платформата build.nvidia.com и предлага API, съчетаем с OpenAI.
Въпреки високата продуктивност Nvidia предизвестява за рисковете: моделът към момента не е желателно да се употребява в области като медицината или юридическите преценки, където точността е от решаващо значение. Компанията предлага моделът да се употребява за общоприети цели и да се ползват защитни ограничения за попречване на грешките.
Излизането на Llama-3.1-Nemotron-70B-Instruct удостоверява възходящото въздействие на Nvidia на пазара за изкуствен интелект. Преминаването от хардуер към създаване на ИИ платформи ускорява конкуренцията и предизвиква другите компании да ускорят своята научноизследователска и развойна активност.
През идващите месеци ИИ общността ще следи от близко по какъв начин Llama-3.1-Nemotron-70B-Instruct се показва в действителните приложения отвън сравнителните проби. Способността му да трансформира високите резултати в практични и скъпи решения в последна сметка ще дефинира дълготрайното му влияние върху промишлеността и обществото като цяло.




