AI Is Learning To Lie, Scheme And Threaten Its Creators
The world's most advanced AI models are exhibiting troubling new behaviors - lying, scheming, and even threatening their creators to achieve their goals.
In one particularly jarring example, under threat of being unplugged, Anthropic's latest creation Claude 4 lashed back by blackmailing an engineer and threatened to reveal an extramarital Affaire.
Междувременно, O1 на Chatgpt-Creator Openai се опита да се изтегли на външни сървъри и го отхвърли, когато е заловен с червени ръце.
Тези епизоди акцентират отрезвяваща действителност: повече от две години откакто Chatgpt раздруса света, откривателите на AI към момента не схващат по какъв начин работят личните им творения.
И въпреки всичко надпреварата за разрастване на все по-мощни модели продължава със скорост на спиране.
Това лъжливо държание наподобява обвързвано с появяването на модели „ разсъждения “-AIS системи, които работят посредством проблеми малко по малко, а не генериране Тревожни прояви.
" O1 беше първият г...
Прочетете целия текст »




