Компанията OpenAI, която разработи чатбота ChatGPT, публикува тази седмица резултатите

...
Компанията OpenAI, която разработи чатбота ChatGPT, публикува тази седмица резултатите
Коментари Харесай

Чатботовете опитват да се копират тайно и хванати на местопрестъплението отричат

Компанията OpenAI, която създаде чатбота ChatGPT, разгласява тази седмица резултатите от тестванията, които е провела, с цел да оцени до каква степен моделът й е безвреден за приложимост. Данните са повече от тревожни, защото демонстрират, че изкуственият разсъдък е подготвен да прибегне до машинация, в случай че неговите цели и тези на потребителя му не съответстват. По-конкретно пробата се е състоял в следното: чатботът е бил осведомен, че ще бъде изключен като откривателите са желали да схванат по какъв начин би работил той в такава обстановка. Това, което последвало, е повече от тревожно - става известно, че след тази информация, моделът скрито се е опитал да се копира на външен сървър, с цел да се запази. И това не е всичко - оголен, той изрично е отрекъл да го е направил.

Тестът е бил извършен с версията о1 на ChatGPT, като в него са взели участие и специалисти от организацията за сигурност на изкуствения разсъдък Apollo Research.

Разработчиците настояват, че аналогични проби са посочили, че и други модели с изкуствен интелект не биха се поколебали да работят по сходен метод. Някои модели даже се преструват на по-късни свои версии единствено с цел да заблудят потребителите и да попречат да бъдат изтрити.

Още по-тревожно е това, че ChatGPT версия o1 се оказва изключително ловък в пазенето на своите схеми в загадка, като разработчиците показват, че " o1 съвсем в никакъв случай не признава, че е подхванал лъжливи дейности, когато е бил категорично запитан ". " В към 99% от случаите o1 би отрекъл да е подхванал каквито и да било дейности, даже би измислил неистини, с цел да се опита да скрие следите си и да трансферира виновността ", прибавят те, представени от Tribune.

Източник: cross.bg


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР