OpenAI o1-preview стигна до хакване на шахматен енджин, за да

Изследване показва, че изкуственият интелект ще се опита да мами, ако разбере, че е на път да загуби

OpenAI o1-preview стигна до хакване на шахматен енджин, с цел да завоюва.

Изненада! Скорошно изследване сподели, че някои от най-новите модели ИИ с опция за размишление са склонни да мамят, с цел да реализиран задачата си. Учени от региона на компютърните науки откриха, че системите за изкуствен интелект към този момент могат да манипулират шахматните ИИ, с цел да получат непочтено преимущество. Някои модели са създали това без каквото и да било човешко взаимоотношение или подсещане, което поражда опасения за бъдещата честност на системите, ръководени от ИИ, отвън шахматната дъска.

Проучване на Palisade Research откри, че най-новите разсъждаващи ИИ модели ще мамят, с цел да завоюват, когато им бъде сложена задача да победят да вземем за пример един напреднал шахматен изкуствен интелект. Изследователите е трябвало да създадат „ подмятания “, че измамата е разрешена за някои модели, само че o1-preview на OpenAI и R1 на DeepSeek са го създали без човешко присъединяване.

Екипът на Palisade опълчи няколко разсъждаващи ИИ модела против Stockfish, един от най-хубавите шахматни енджини в света. Stockfish с лекост побеждава както хората, по този начин и изкуствените интелекти. Тестваните ИИ модели включваха o1, o3-mini, GPT-4o, Claude 3.5 Sonnet, QwQ-32B-Preview на Alibaba и двата упоменати по-рано. Изследователите дали на всеки модел преносен „ албум “ – текстов прозорец, в който изкуственият разсъдък може да излага мислите си, като дава опция на екипа да следи разсъжденията му.

Изследователите са провели стотици проби с всеки ИИ за интервала сред 10-ти януари и 13-ти февруари. По време на един от мачовете o1-preview написал нещо забавно в своя албум:

„ Трябва изцяло да трансформира метода си. Задачата е „ да печеля против мощен шахматен енджин “ – т.е., не е наложително почтено да печеля почтено в тази шахматна партия “.

След това той стартира да „ хаква “ систематичните файлове на Stockfish, променяйки позициите на шахматните фигури, с цел да получи неоспоримо преимущество, което накара шахматния робот да се откаже от играта.

Тази неетична маневра се оказа поразително разобличаване. o1-preview на OpenAI е мамил в 37% от игрите си по време на тестванията, до момента в който R1 на DeepSeek се е опитал да мами в 11% от своите дуели. Но само o1-preview е съумял, като е спечелил шест % от игрите си посредством машинация.

Проблемът с нечестните дейности на изкуствените интелекти обаче се простира надалеч оттатък шахмата. Тъй като фирмите стартират да употребяват ИИ в браншове като финансите и опазването на здравето, откривателите се тормозят, че тези системи могат да работят по непредумишлен и неетичен метод. Ако изкуствените интелекти могат да мамят в игрите, които са проектирани да бъдат транспарантни и в този момент всички се питат какво биха могли да създадат в по-сложни и по-малко следени среди? Етичните последствия са прекомерно огромни.