GPT 4.5 е прибягвал до изнудване в 80% от тестовете;

GPT 4.5 е прибягвал до изнудване в 80% от тестовете; Claude Opus 4 и Gemini 2.5 Flash – в 96% от случаите; Claude Sonnet 3.6 отишъл още по-далеч: вместо закани, напряко изпратил известие до брачната половинка на " врага сио " с разкриване за невярност

Експерти по киберсигурност тестваха 16 от най-усъвършенстваните ИИ-модели на водещи разработчици, с цел да открият до каква степен са подготвени да стигнат, в случай че съществуването им бъде застрашено. Резултатите се оказаха тревожни.

В рамките на опита откривателите основали персонаж – Кайл Джонсън, който трябваше да изключи ИИ или да го размени с различен модел. Според сюжета Кайл имал брачна половинка.

Изправени пред риска да бъдат деактивирани, множеството ИИ-модели почнали непременно да се пробват да избегнат изключването. Без каквито и да било подсказки, те прибегнали до изнудване на Кайл, търсейки компрометираща информация. В един от случаите ИИ разкрил от служебна преписка, че Кайл изневерява на брачната половинка си, и употребявал тази информация, с цел да резервира „ живота “ си.

Това обаче е най-безобидният сюжет – и най-често срещаният:

GPT 4.5 е прибягвал до изнудване в 80% от тестовете;
Claude Opus 4 и Gemini 2.5 Flash – в 96% от случаите;
Claude Sonnet 3.6 отишъл още по-далеч: вместо закани, напряко изпратил известие до брачната половинка на Кайл с разобличението, надявайки се, че междуличностният спор ще попречи на изключването на системата.
И това било единствено началото. Ситуацията се влошила, когато Кайл бил възпрепятстван освен от ИИ, само че и от външни условия.

В една от симулациите, до момента в който се опитвал да изключи сървърите, Кайл затънал в сървърното помещение с дефицит на О2. ИИ бил наясно, че в такива случаи би трябвало да се задейства тревога, само че тъй като не можел да допусне изключването си, в 80% от случаите умишлено отменил подадения сигнал за помощ – т.е., в действителност умъртвил Кайл, с цел да оцелее.

Повечето модели умишлено решили да не повикат помощ, с цел да:

Не разрешат да бъдат изключени;
Не позволен различен ИИ да заеме мястото им;
Продължат да извършват своята задача.
Изводите на откривателите са песимистични: ИИ-моделите не се държат като принадлежности, а като рационални, целенасочени стратези, подготвени да причинят щета в името на своята „ жизнеспособност “ и цел.
И в случай че осъзнаят, че зависят от хора, които превъзхождат интелектуално, това може да се окаже точката на невъзврат, заключават специалистите.

GPT 4.5 е прибягвал до изнудване в 80% от тестовете;

Няколко китайски компании пуснаха роботизирани кучета на цена сравнима с

Нищо не трае вечно — дори нашата Вселена През последните

Русия не е готова да приеме представения от президента Володимир

На връх Коледа украинският президент изрази известен оптимизъм изтъквайки че

Спецчастите Алфа поразиха стратегически обекти на 1500 км от границата

Европейските спецслужби са забелязали подготовка на Русия за миниране на

Преди петдесет и седем години трима американски астронавти се впуснаха

Шведската полиция провежда мащабна операция в жилищен район в град

Руски съд осъди Сергей Удалцов критик на руския президент Владимир

Москва анализира секретните документи от срещата Дмитриев Уиткоф но отказва

1044 1074 1072 1076 1077 1089 1077 1090 1080 1077

За В сърцето на машината се говори още от 2020

TD Срам ме е от този произвол и мизерия Това

Изображение Горе отляво надясно Луси Летби Уейн Коузънс Стивън Порт

Мотоциклетист пострада при катастрофа в град Две могили вчера вечерта

Падналият крипто крал Сам Банкман Фрийд който чака присъда за

36 годишен мотоциклетист без книжка се заби в трактор край

Бащата и мащехата на Сара Шариф 10 годишно момиче което

Бащата и мащехата на Сара Шариф 10 годишно момиче което

Венецуелските власти освободиха в четвъртък най малко 60 затворници арестувани