Няма спор, че в момента компанията OpenAI диктува какво се

Google отговори на OpenAI с Gemini, но отново се „спъна“ на старта

Няма спор, че сега компанията OpenAI диктува какво се случва в областта на генеративния изкуствен интелект (Gen AI). Нейните логаритми са внедрени в личния ѝ бот ChatGTP, като употребяват и от услугите на Microsoft, като са част от Copilot, Bing и така нататък

Гугъл е в догонваща роля, като по-рано тази година пусна своя чатбот Bard. Той обаче бързо се „ спъна “, като се оказа, че позволява обикновени фактологични неточности. Така ChatGPT остана мерилото, което може също да не е идеално, само че се оправя по-добре от съперниците си. Няколко месеца по-късно Гугъл се завръща с нов отговор – доста усъвършенстваният логаритъм Gemini, който ще бъде внедрен в Bard, Гугъл Search, Гугъл Assistant и други услуги на ИТ колоса. И… още веднъж се „ спъна “…

Много по-големи упоритости

Гугъл показа Gemini малко ненадейно. Първо се появиха клюки в профилираните издания, че компанията е съвсем подготвена с логаритъма. След това последва втора вълна спекулации, че дебютът е бил плануван за декември тази година, само че е отсрочен за март следващата година, защото има проблеми с Gemini и компанията желае да пусне логаритъма, когато е подготвен. И малко по-късно Гугъл фактически показа Gemini.

Компанията разгласи, че Gemini е доста по-бърз, акуратен и сполучлив по отношение на другите логаритми. Гугъл се похвали, че технологията ще даде благоприятни условия от последващо потомство. Gemini ще има три версии. Gemini Nano – по-лека версия на логаритъма, която може да се употребява в границите на устройства като смарт телефони, без потребност от интернет връзка. Gemini Pro – най-масовата версия на модела, която е част от Bard и ще може да се употребява за разнообразни задания. Gemini Ultra – най-голямата и комплицирана версия на създаването, която ще е за „ доста комплицирани задания “ и се чака множеството ѝ благоприятни условия да са платени.

Gemini Pro е съперник на GPT-3.5 на OpenAI, а Gemini Ultra – на GPT-4. Гугъл споделя, че Gemini Ultra превъзхожда GTP-4 в 30 от 32 най-популярни университетски теста за инспекция на качествата на огромни езикови модели. Gemini Ultra е и първият логаритъм от подобен вид, който се оправя по-добре и от човек на 57 общоприети теста, които ревизират познанията и експертизата на хора в областта на математика, физика, история, право и така нататък

Впечатляващо, нали? Има и още. Гугъл споделя, че Gemini е мултимодален, т.е. може да работи по едно и също време с текст, фотоси, видео и аудио. Той ще може да схваща хората, когато му приказват, както и да се оправя с по-сложни комбинации от въпроси, да вземем за пример гласова команда, която му споделя да прегледа дадена фотография.

Също по този начин ще може да дава отговор и с няколко типа наличие. Например да направи съпътстващи илюстрации за приказка, която му е казано да напише. Или пък диаграми и даже клипове, които да пресъздават дадена информация и така нататък Gemini ще може да извлича информация от „ стотици хиляди документи “ и ще оказва помощ за резоюмирането на огромни размери данни, както и за осъществяване на нови хрумвания и благоприятни условия в голям брой сфери, в това число просвета, финанси, програмиране и така нататък

Gemini Nano ще бъде внедрен в смарт телефон Pixel 8 Pro на Гугъл, с цел да усъвършенства голям брой аспекти в работата на устройството. Това е самобитна проява какво можем да чакаме от AI в смарт телефоните – от възстановяване на качеството на видеозаписите, до резюмета на записи, умни отговори на известия съгласно подтекста на диалога, усъвършенстване на общата работливост и така нататък

Чудесно, но…

Всичко казано до момента са най-вече упования. Те бяха бързо „ охладени “ откакто се появиха първите мнения на потребителите, които изпробваха Gemini Pro през Гугъл Bard. Социалните мрежи се извършиха с образци, в които Bard, който към този момент употребява Gemini Pro, позволява голям брой разнородни неточности в най-различни тематики и задания.

И още по-лошо, Гугъл беше упрекната, че е „ фалшифицирала “ демонстрационен клип с опциите на Gemini, заяви TechCrunch. Клипът би трябвало да покаже някои от качествата на логаритъма, в това число описаните мултимодални отговори, като акцентира, че тук-там е кратко времето за отговор за нагледност на клипа, т.е. действително ботът ще дава отговор малко по-бавно.

Това не е чак подобен проблем, само че откакто анализатори обърнаха внимание на разминавания сред казаното от компанията и действителните дейности на бота при тестването му, Гугъл призна: „ Създадохме демото, като използваме видео записи, които да тестват качествата на Gemini в голям брой обстановки. След това даваме команди на Gemini с тези фрагменти от записите и текст “, споделя компанията. Накратко, вместо да „ слуша “ и да „ гледа “ както в клипа, Gemini е бил следен общоприетоо посредством текст.

Можем да чакаме, че всичко това ще стане действителност следващата година, когато тръгне и Gemini Ultra. Защото сега единствено Gemini Pro е наличен през Bard, а Nano – през Pixel 8 Pro. Gemini Ultra ще проработи след няколко месеца – време, през което компанията да поправи грешките и да усъвършенства работата на логаритъма. И тя този път фактически би трябвало да го направи. Трети сходен гаф може да се окаже доста тежък удар за репутацията на Гугъл, както и за доверието към технологиите ѝ.

Разбира се, Гугъл към този момент е „ прекомерно огромна, с цел да се срине “ и проблемите няма да доведат до края на компанията. Но също по този начин рискува да изостане от съперниците си и да изтласка потребителите да употребяват най-вече техните услуги най-малко в областта на Gen AI. А точно Gen AI може да се окаже идващият трилионен бизнес, по тази причина не е добра концепция да се позволяват неточности, още повече пък да се повтарят и даже потретват.

Google отговори на OpenAI с Gemini, но отново се „спъна“ на старта

google отговори

отговори openai

openai gemini

gemini отново

отново спъна

спъна старта

google

отговори

openai

gemini

отново

спъна

старта