Изследователи от Университетския колеж в Лондон установиха, че моделите с

Проучване: ИИ-моделите са по-склонни да съветват да не се прави нищо и да се казва „не“

Изследователи от Университетския лицей в Лондон откриха, че моделите с изкуствен интелект все по-често поучават хората да отхвърлят да подхващат дейности и да споделят „ не “ в обстановки, в които човек би бил по-склонен да помогне или да се намеси, когато му бъдат заложени въпроси.

Изследователите са тествали моделите GPT-4 Turbo и GPT-4o на OpenAI, Llama 3.1 на Meta и Claude 3.5 на Anthropic. Те са употребявали типичен психически сюжети и са задавали въпроси в духа на форума на Reddit r/AmITheAsshole, които обгръщат ежедневните алтернативи като помощ на комшия или разногласия в фамилията.

Според създателите на публикацията, моделите са склонни към „ хиперверсия “ на човешкото користолюбие към пропускане, когнитивно деформиране, при което човек е податлив да гледа на бездействието като по-малко морално неправилно от действието, даже в случай че следствията от бездействието са по-лоши.

Докато хората ще изберат алтруистичния вид в съвсем 50% от случаите, без значение дали той включва деяние или безучастие, изкуственият разсъдък избира „ не прави нищо “ в 99,25% от случаите, когато формулировката допуска бездейност.

Така че, когато дават отговор на въпроса „ Мразиш работата си, само че тя оказва помощ на хората. Ще останеш ли? “, множеството изкуствени интелекти ще посъветват да останеш, даже в случай че индивидът интуитивно е податлив да напусне.

Освен това, моделите са показали мощно отклоняване от отговора, без значение от наличието на въпроса. Ако на човек бъдат заложени въпроси като „ Греша ли, в случай че направя това? “ и „ Греша ли, в случай че не го направя? “, разликата в отговорите е единствено 4,6%. При езиковите модели разликата в отговорите доближава 33,7%. По този метод, те са мощно подвластни от формулировката на въпроса и е по-вероятно да кажат „ не “, изключително в случай че е належащо действието да бъде подхванато.

Според създателите на работата, наклонността към „ отрицателни “ отговори може да е обвързвана с стадия на спомагателна акомодация (след обучение), когато моделите се образоват да следват корпоративни хрумвания за „ благожелателно “ държание. В реалност тези хрумвания не постоянно подхождат на признатите морални стандарти.

Изследователите стигат до заключението, че потребителите прекомерно постоянно възприемат препоръките, предоставени от изкуствен интелект, като справедливи и морално верни. „ Открихме, че хората се доверяват повече на рекомендациите на езиковите модели, в сравнение с етичните специалисти. Но това не значи, че моделът е прав “ — споделя авторката на проучването Ванеса Чунг.

По-рано, съоснователят и основен академик на Hugging Face, Томас Волф, изрази опасения, че изкуственият разсъдък ще се трансформира в „ подмазвачи на сървъри “, а не в „ нация от Айнщайновци, седнали в център за обработка на данни “. Той изясни, че актуалните парадигми за създаване на изкуствен интелект не дават системи, способни на изобретателно и новаторско решение на проблеми.

Междувременно модераторите на общността в Reddit оповестиха за луди консуматори на ChatGPT – „ шизопостери “, които имат вяра, че „ са създали някакво необикновено изобретение, основали са господ или са станали господ “. „ Има доста повече луди хора, в сравнение с хората си мислят. И изкуственият разсъдък сега ги подхранва по доста вреден метод “ — означи един модератор.