Google представи Gemini 1.5 - семейство мултимодални модели за взаимодействие

...
Google представи Gemini 1.5 - семейство мултимодални модели за взаимодействие
Коментари Харесай

Gemini 1.5 Pro: Новият модел на Google е суров опонент за GPT-4

Гугъл показа Gemini 1.5 - семейство мултимодални модели за взаимоотношение с текст, изображения и тон, за които се твърди, че превъзхождат конкурентни принадлежности.

Gemini 1.5 Pro, първият член на моделната фамилия, се показва сравнимо с модела Ultra 1.0 на уеб титана, който дебютира предходната седмица, само че съгласно компанията го прави с по-малко изчислителни запаси.

Демис Хасабис, основен изпълнителен шеф на Гугъл DeepMind съобщи, че Gemini 1.5 Pro е по-ефективен за образование и обслужване с помощта на архитектурата си Mixture-of-Experts (MoE).

Най-новият модел на Гугъл за изкуствен интелект превъзхожда съперниците в сравнителните проби въз основа на броя на токените, които може да одобри в поръчка, оповестява The Verge.

Един токен съставлява към четири знака на британски език.

На практическо равнище Gemini 1.5 може да получава текст, код, изображения, аудио и видео, да дава отговор на въпроси на натурален език за този материал, както и да генерира подобен тип наличие.

Това значи, че когато е показан дълъг документ за обработка - до 10 млн. токена - Gemini 1.5 може да отговори вярно на съответна поръчка допълнително от 99 % от случаите.

Според откривателите на Гугъл “капацитетът на Gemini от 10 млн. токена съставлява скок в поколенията по отношение на съществуващите модели като Claude 2.1 и GPT-4 Turbo, които за момента доближават оптимален потенциал от надлежно 200 хиляди и 128 хиляди токена ”.

" Gemini Ultra сега побеждава всички съществуващи други възможности в необятен набор от бенчмаркове ", споделя Франсоа Шоле, софтуерен инженер в Гугъл.

Позовавайки се на такива проби, Джеф Дийн, основен теоретичен помощник в Гугъл DeepMind споделя:

" За текст Gemini 1.5 Pro реализира 100 % отзоваване до 530 хиляди лексеми, 99,7 % до 1 млн. лексеми и 99,2 % акуратност до 10 млн. "

Големият потенциал на модела му разрешава да прави подвизи като усвояване на 402-страничната стенограма от полета на Apollo 11 (326 914 токена) и по-късно, когато му бъде заложен въпрос, да открие " три комични момента " в шегите сред астронавтите.

На поръчка по отношение на Sherlock Jr, 45-минутен филм на Бъстър Кийтън от 1924 година, питаща: " Кажете ми някаква основна информация от листчето, което е извадено от джоба на героя, както и времевия код на този миг ", инструментът изрецитира текста на бележката във кино лентата буквално, дружно с времето, когато се е случила тази сцена.

Гугъл пуска Gemini 1.5 в ранен достъп за разработчици и корпоративни клиенти.

Компанията възнамерява да го направи по-широко наличен в близкото бъдеще.

В момента Gemini 1.0 е налична за потребителите, дружно с вид Pro, който коства 20 $ месечно.
Източник: profit.bg

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР