Големите езикови модели (LLM) като Google Gemini често създават илюзията

Експерти посочиха видовете задачи, с които Google Gemini не може да се справи

Големите езикови модели (LLM) като Гугъл Gemini постоянно основават илюзията за неограничени благоприятни условия заради способността си да проучват и генерират текст. Експертите обаче акцентират, че тези системи са мотори за предсказание на текст, а не цифрови специалисти. Архитектурата на LLM дава приоритет на плавността на речта пред инспекцията на обстоятелствата или точните калкулации, което ги прави ненадеждни за избрани категории задания. Тази информация беше оповестена от портала SlashGear.

Точни URL адреси и цитати

Един от главните проблеми на Gemini е склонността му да халюцинира при генериране на връзки. Моделът познава структурата на URL адреса, само че постоянно не ревизира действителното му битие в мрежата, а математически предсказва по какъв начин би трябвало да наподобява адресът. Това води до генериране на неработещи връзки или неточности 404. Дори Search Grounding методите не подсигуряват цялостна акуратност.

Поддържане на точния брой думи

Gemini не може прецизно да съблюдава ограничаването за броя думи. Това се дължи на обстоятелството, че езиковите модели обработват информацията не в думи, а в токени — статистически групирани фрагменти от знаци. Поради това системата среща компликации при точното броене на броя думи в процеса на генериране на отговор. За планове със строги условия за размера на текста е належащо ръчно редактиране.

SEO индикатори в действително време

Генеративният изкуствен интелект не може да замести професионалните маркетингови принадлежности като Ahrefs или Semrush. Gemini няма достъп до „ живи “ световни бази данни за размера на търсене. Всички съответни цифри, които моделът дава, се основават на статични данни за образование, които може да са остарели или да са резултат от халюцинации.

Биографии на хора, които не са международни звезди

Точността на Gemini понижава, когато се пита за хора, за които информацията е лимитирана в интернет (като да вземем за пример локални служители). В случаи на дефицит на данни, моделът се пробва да запълни празнините, употребявайки вероятности, което води до изфабрикувания или обединение на биографии на разнообразни хора с едно и също име.

Генериране на същински инцидентни цифри

LLM са детерминистични системи, които работят с математически интервенции и код, изискващ начално значение (seed). Те не са в положение да обезпечат високата ентропия, нужна за същинска случайност, както вършат физическите феномени.

Проблеми с пространствената логичност

Текстово-базираните системи срещат компликации при моделирането на физическия свят и пространствените взаимоотношения. Gemini постоянно се проваля в дилемите, които изискват визуализиране на обекти в 3D пространството (напр. слагане на блокове). На изкуствения разсъдък му липсва разбирането за причинно-следствените връзки, които са явни за хората във физическата действителност.

Броене на обекти в изображения

Въпреки че мултимодалните благоприятни условия на Gemini Vision му разрешават да проучва фотоси, моделът е изцяло некадърен да брои тъкмо обектите. Например, не може да дефинира броя на топчетата в буркан. Вместо да брои поредно, както би направил човек, изкуственият разсъдък генерира вероятностен отговор, основан на образни модели. Резултатът е, че в препълнена стая моделът може да „ види “ 10 души вместо действителните 15.

ASCII графики

Създаването на носталгично ASCII изкуство от ранните дни на интернет не е за Gemini. Моделът не схваща точното подравняване на моношироко разпределените шрифтове, належащо за този вид изкуство. Той планува знаци, само че не схваща характерните разделители на редовете, употребявани за основаване на изображението.

Заместване на съставки при печене

Печенето е въпрос на химия, тъй че съветът на Gemini да размени содата бикарбонат с бакпулвер може да наруши pH салдото на тестото. Моделът може да цитира добре познати препоръки от блогове, само че не има химията, с цел да разбере последствията от сходни замествания. Това е същият проблем, който накара изкуствения разсъдък на Гугъл да предложи прибавяне на лепило към пицата.

Дешифриране на неразбираем почерк

Въпреки че OCR технологията за явен текст съществува от дълго време, Gemini поема риск, когато се оправя с нехаен почерк. Моделът се пробва да отгатне думи въз основа на подтекста, даже когато би било по-добре да се допусна, че са нечетливи. В здравна среда сходно „ несъмнено съмнение “ за рецепта може да има пагубни последствия.

Статистика за спортове в ниските лиги

Докато данните за висшите лиги са лесни за намиране в интернет, статистиката за ниските лиги постоянно е фирмена. Задаването на въпрос по отношение на междинния резултат в тим на шампионата на Англия през 1998 година е по-вероятно да докара до фиктивен, само че реалистично звучащ отговор, в сравнение с честното „ Не знам “.

Липограми и лимитирано писане

Липограмата е текст без съответна писмен знак. Изглежда, че това е елементарно за компютърна система, само че Gemini постоянно прави неточности. Причината е токенизацията: моделът постоянно не записва обособени букви в границите на токените, тъй че не може да управлява тяхното неявяване.

Идентифициране на редки хардуерни конектори

Изкуственият разсъдък може да обърка марков DVR кабел със общоприет USB-C кабел заради сходната форма и текстура на повърхността. Тази неточност е рискова: неправилното свързване може да повреди врата или контактите на щепсела.

Текущи цени на дребно

Gemini не сканира Amazon или други магазини в действително време. Когато попитате за цената на графична карта, ще получите цена, която е била настояща преди месеци или години. Моделът извлича данни от вътрешната си памет с избрана последна дата, вместо да ревизира дейните уеб сайтове.

Оценка на креативното писане

За писателите, които се стремят да усъвършенстват неповторим жанр, Gemini е неприятен консултант. Моделът е подготвен да избира общо, корпоративно и безвредно писане. Той неизбежно ще маркира неповторимите стилистични решения и жаргона като неточности. Следването, препоръките му ще лишат текста от всякаква характерност —- и точно тези „ дефекти “ постоянно карат писането да оживява.