Grok 4 ще бъде анонсиран в нощта на 10 юли
Бизнесменът Илон Мъск в X анонсира Live-транслация на Grok 4 в 20:00 часа в сряда тихоокеанско време:
Нека ви напомним, че този модел в началото беше обявен на 29 април от Мъск като Grok 3.5. По това време предприемачът даде обещание да пусне нов изкуствен интелект до седмица, само че по-късно призна, че моделът се нуждае от известно усъвършенстване. В резултат на това стартирането на пазара беше отсрочено с 2 месеца, а моделът преименуван на Grok 4.
Все още не се знае доста за новия артикул. При анонса на Grok 3.5, Мъск съобщи, че моделът ще може да „ разсъждава от първи правила “, т.е. да извършва задания, за които няма изложение на решението в данните за образование. Известно е, че моделът ще съществува в две версии: елементарната Grok 4 и Grok 4 Coder, подготвен особено за програмиране. Най-вероятно първоначално няма да има безвъзмезден достъп — първите, които ще тестват модела, ще бъдат клиентите на SuperGrok (30 $ на месец) и X Premium+ (40 $ на месец).
Накрая, предходната седмица, инсайдерът legit_api разгласява изтекли резултати от бенчмарк тестванията на модела в X, за които се твърди, че са били видяни от тестери:
Съдейки по фотографията, главният растеж на Grok 4 е в Humanity Last Exam — това е бенчмарк от съвсем 2500 въпроса от разнообразни дисциплини, които са подбрани по подобен метод, че отговорите на тях не могат да бъдат открити в Гугъл. HLE обичайно се счита за един от най-трудните проби, тъй че в случай че данните са правилни, резултатът е със 70% по-добър от ChatGPT o3 — това е забележителна крачка напред.




