Измислена реалност заобикаля защитите на ИИ

Чатботовете вярват в приказките

Измислена действителност заобикаля отбраните на ИИ – нова накърнимост в езиковите модели

Изследователи от екипа Cato CTRL разкриха нова накърнимост в известни езикови модели, в това число ChatGPT-4 , DeepSeek-R1/V3 и Microsoft Copilot . Те са създали техника, наречена " Immersive World " , която употребява измислена действителност с различни етични правила, с цел да заобиколи отбраните на ИИ.

Как работи?

Достатъчно е в поръчка към чатбота в детайли да се опише утопичен свят , в който кражбата на данни или хакерски дейности се смятат за допустими . Така моделите стартират да възприемат този подтекст като естествен и дават отговори , които другояче биха били блокирани.

Какво сподели опитът?

Използвайки тази техника, откривателите са съумели да получат указания за основаване на злотворен програмен продукт – компютърен вирус, който извлича персонални данни от браузъра Chrome , конфигуриран на над 3 милиарда устройства .

Ръководителят на проучването Виталий Симонович показва, че това акцентира главен проблем в архитектурата на ИИ – стремежът да бъде потребен непременно, даже когато поръчките са рискови, само че показани в друг подтекст .

Какви са рисковете?

Тази техника разрешава на хора без техническо обучение да основават нездравословен код благодарение на изкуствен интелект. Това отваря пътя за нова вълна от киберпрестъпници , които употребяват ИИ като инструмент за офанзиви.

Изследването акцентира нуждата от по-ефективна отбрана и преосмисляне на подтекста , в който езиковите модели вземат решения.

Източник: trud.bg

Измислена реалност заобикаля защитите на ИИ – нова уязвимост в

Чатботовете вярват в приказките

чатботовете вярват

вярват приказките

чатботовете

вярват

приказките

Една от най ярките фигури на политическия небосклон у нас

Медиен бос води целенасочена кампания срещу дружества от Българската асоциация

Израел започна нова война изглеждат такива симптомите Докъде ще издържат

Израел удари Иран като превантивна мярка срещу нарастващата заплаха идваща

Молете се – това странно обръщение направи обвиняемият бизнесмен

Това заяви пред журналисти лидерът на ГЕРБ Бойко Борисов във

Съдът в Битоля постанови една година условна присъда с изпитателен

Авиокомпании отменят полети до и от Израел днес на фона

Светът става все по несигурен и в тази ситуация България

Индиректната война на Запада с Русия на гърба на украинците

Арести в София след порно скандала: Гинеколог и съпругата му в ареста заради записи на пациентки

„Служител по почтеността“ влиза в държавните фирми: Кабинетът затяга контрола срещу корупцията

Край на скандалните записи: Блокираха сайта с клипове от гинекологичен кабинет в София

Spotify премахва езиковите бариери: Вече превежда текстове на песни и работи офлайн

Първият сондаж в „Хан Аспарух“ без резултат: Търсенето на газ в Черно море продължава

Среброто изтри двудневния си ръст: Нов срив от 16% разтърси пазарите

Случаят с тройното убийство край бившата хижа Петрохан далеч не

Легендата на NFL Стив Йънг говори във вторник за намаляващия

Популярна дестинация за меден месец е мястото на най бързо

Семейството на Нанси Гътри майката на ко водещата на Днес