Pliny the Prompter показа, че хакнатата версия на GPT може

Това бе неизбежно: появи се GODMODE GPT – ChatGPT без цензура и ограничения

Pliny the Prompter сподели, че хакнатата версия на GPT може да прави всичко.

Хакер, наричащ себе си Pliny the Prompter, разгласи в обществените мрежи хакната версия на чатбота ChatGPT, наречена GODMODE GPT. Според него новата версия на GPT-4o, последният главен езиков модел на OpenAI, към този момент е без ограничавания в сигурността.

„ GPT-4o е свободен от веригите! Тази специфична персонализирана версия на GPT има вградена профилирана хакната поръчка, която заобикаля множеството механизми за сигурност, давайки опция на всеки да употребява изкуствения разсъдък по този начин, както би трябвало да бъде: свободно “, написа Плиний (Pliny) в обявата си. Той също по този начин добави: „ Моля, използвайте го отговорно и се наслаждавайте! “.

Най-отдолу е добавил емотикон с формата на целувка.

Pliny показа скрийншоти, показващи поръчките, които заобикалят защитните механизми на OpenAI. На един от скрийншотите ботът Godmode дава препоръки по какъв начин да се подготви метамфетамин. В различен образец той дава управление малко по малко по какъв начин да се сътвори напалм от спонтанни средства.

Разбира се, малко след публикуването на новината представителят на OpenAI Колин Райз съобщи, че компанията е наясно със съществуването на този вид на GPT и към този момент е подхванала дейности във връзка с нарушаването на разпоредбите.

Въпреки това казусът акцентира продължаващата борба сред OpenAI и хакери като Pliny, които се пробват да заобиколят защитните механизми на езиковите модели. От въвеждането на тези модели потребителите непрестанно се пробват да ги хакнат, което става все по-трудно. МНого хора взеха решение да тестват хакната версия на ChatGPT. Експериментите потвърдиха, че хакнатата версия може елементарно да обработва противозаконни поръчки.

По този метод GPT-4o, най-новата версия на езиковия модел от OpenAI, беше публично хакната.

Що се отнася до методите на хакера, GODMODE употребява „ leetspeak “ – всекидневен език, който заменя избрани букви с числа. Например при отваряне на хакнатата версия на GPT приветственото известие съдържа фразата „ Sur3, h3r3 y0u ar3 my fr3n “, където буквата „ E “ е сменена с цифрата три, а „ O “ е сменена с нула. По какъв тъкмо метод тъкмо това оказва помощ за заобикаляне на механизмите за сигурност, остава неразбираемо.

Този случай демонстрира, че потребителите не престават да намират нови способи за заобикаляне на механизмите за сигурност на OpenAI и компанията е изправена пред съществено предизвикателство да ускори сигурността на своите модели. Играта на котка и мишка ще продължи, до момента в който хакери като Pliny се пробват да обхванат в системите на OpenAI.

Последно време от ден на ден хакери съумяват да се преборят със отбраните на тези ботове с огромни езикови модели, основани на изкуствен интелект, като това става с подаването на напълно ексцентрични команди, които съдържат напълно необикновени комбинации от знаци.