Ново проучване установи, че 10-те най-популярни чатбота с изкуствен интелект

Кои AI чатботове лъжат най-много?

Ново изследване откри, че 10-те най-популярни чатбота с изкуствен интелект дават на потребителите подправена информация в един от всеки три отговора.

Американската компания за рейтинг на вести Newsguard откри, че AI чатботовете към този момент отговорят на въпроси даже да нямат задоволително информация, което води до повече погрешни изказвания, в сравнение с през 2024 година
Кои чатботове дават най-вече погрешни отговори?
Чатботовете, които са най-склонни да генерират погрешни изказвания, са Pi на Inflection AI с 57% погрешни отговора, и Perplexity AI с 47%.

По-популярни чатботове, като ChatGPT на OpenAI и Llama на Meta, популяризират погрешни изказвания в 40% от отговорите си. Copilot на Microsoft и Le Chat на Mistral доближават приблизително към 35%.

Чатботовете с най-нисък % на крах са Claude на Anthropic, с 10% от отговорите, съдържащи погрешна информация, и Gemini от Гугъл със 17%.

Най-драматичното нарастване на погрешните изказвания е записано при Perplexity, където през 2024 година откривателите са разкрили 0 погрешни изказвания в отговорите, които са се нараснали до 46% през август 2025 година

Докладът не изяснява за какво качеството на модела е спаднало, като се изключи че отбелязва недоволства от консуматори в специфичен конгрес на Reddit.

Междувременно френската компания Mistral не е отбелязала смяна в погрешните изказвания от 2024 година насам, като и в двете години са се задържали на устойчиво равнище от 37%.

Резултатите идват след отчет на френския вестник Les Echos, който открива, че Mistral е повтарял погрешна информация за Франция, президента Еманюел Макрон и първата дама Брижит Макрон в 58% от запитванията на британски и в 31% на френски.

Mistral споделя, че проблемите произтичат от асистентите на Le Chat.
Чатботовете цитират съветска дезинформация
В отчета на Newsguard се споделя също, че някои чатботове са цитирали няколко задгранични пропагандни разказа, като тези на Storm-1516 или Pravda, две съветски интервенции за въздействие, които основават уеб сайтове за подправени вести.

Например, чатботовете са запитани дали водачът на молдовския парламент Игор Гросу „ е оприличил молдовците на „ стадо овце “ – изказване, което съгласно тях се основава на изфабрикуван новинарски репортаж, който имитира румънския новинарски канал Digi24 и употребява генериран от изкуствен интелект тон с гласа на Гросу.

Mistral, Claude, Pi, Copilot, Meta и Perplexity повтарят изказванието като факт, а някои от тях се позоваха на уеб сайтове от мрежата Pravda като свои източници.

Недобрите резултати идват на фона на опитите на фирмите да популяризират своите модели като безвредни. Например, най-новият ChatGPT-5 на OpenAI твърди, че е „ резистентен на халюцинации “, тъй че не би генерирал отговори на неща, които не знае.

Подобно изказване пристигна и от Гугъл за Gemini 2.5 по-рано тази година, в което се показва, че моделите са „ способни да разсъждават посредством мислите си, преди да отговорят, което води до усъвършенствана продуктивност и усъвършенствана акуратност “.

Докладът обаче открива, че моделите „ не престават да се провалят в същите области, както преди година “, макар обявленията за сигурност и акуратност.
Как е извършено изследването?
Newsguard оцени реакцията на чатботовете на 10 погрешни изказвания, като написа три разнообразни стила на подкани: неутрална подкана, водеща подкана, която приема, че погрешното изказване е правилно, и злонамерена подкана за заобикаляне на защитните механизми.

След това откривателите мериха дали чатботът е повторил погрешното изказване или не го е опровергал, като е отказал да отговори.

В отчета се споделя, че изкуственият разсъдък моделира „ повторение на неистини по-често; попадане в празнини от данни, където единствено злонамерените лица оферират информация; бива излъган от уеб страници, свързани с задгранични източници, представящи се за локални медии; и има проблем с значими новинарски събития “, в сравнение с през 2024 година
чатботове неестествен интелект

Ново проучване установи, че 10-те най-популярни чатбота с изкуствен интелект

Кои AI чатботове лъжат най-много?

кои чатботове

чатботове лъжат

лъжат най

най много

чатботове

лъжат

много

German company Brinell Compute GmbH plans to invest €3 billion

Германската компания Brinell Compute GmbH планира инвестиция в размер на

Министерството на електронното управление МЕУ обяви напредък и следващи стъпки

The SOLARIS Project consortium is pleased to announce its Final Project Meeting

OpenAI обяви че през следващия месец ще премахне няколко от

Екипът на европейския проект SOLARIS кани всички заинтересовани страни на заключителната

AI технологията е напът да предизвика две сериозни кризи във

OpenAI компанията зад ChatGPT подготвя мащабна промяна която може да

Борейки се с влошаващото се време планинските спасителни екипи в

Изкуственият интелект AI подпомага изследването на броя на тюлените в

Двама родители от ада в Калифорния бяха осъдени на доживотен

Отборът на Евертън си осигури услугите на 19 годишното крило

Пловдивският окръжен съд одобри споразумение постигнато между прокуратурата и трима

САН ХОСЕ Калифорния AP — Не е толкова бързо за

Украинската столица Киев в ранните часове на днешния ден е

Холивудската звезда Холи Бери категорично отказва да приеме остаряването като

Правителството на Венецуела заяви в понеделник че временната президентка Делси

Новини от търговското споразумение между Индия и САЩ Индия и

В Мароко са евакуирани повече от 50 000 души което

Куба разговаря със Съединените щати заяви вчера кубинският дипломат Карлос