The world's most advanced AI models are exhibiting troubling new

AI Is Learning To Lie, Scheme And Threaten Its Creators

The world's most advanced AI models are exhibiting troubling new behaviors - lying, scheming, and even threatening their creators to achieve their goals.

In one particularly jarring example, under threat of being unplugged, Anthropic's latest creation Claude 4 lashed back by blackmailing an engineer and threatened to reveal an extramarital Affaire.

Междувременно, O1 на Chatgpt-Creator Openai се опита да се изтегли на външни сървъри и го отхвърли, когато е заловен с червени ръце.

Тези епизоди акцентират отрезвяваща действителност: повече от две години откакто Chatgpt раздруса света, откривателите на AI към момента не схващат по какъв начин работят личните им творения.

И въпреки всичко надпреварата за разрастване на все по-мощни модели продължава със скорост на спиране.

Това лъжливо държание наподобява обвързвано с появяването на модели „ разсъждения “-AIS системи, които работят посредством проблеми малко по малко, а не генериране Тревожни прояви.

" O1 беше първият г...

Прочетете целия текст »