AI за първи път премина теста на Тюринг
За първи път модел с изкуствен интелект публично мина теста на Тюринг — способ за оценка на способността на машината да имитира човек. В опит, извършен от учени от Калифорнийския университет в Сан Диего, участниците са объркали модела GPT-4.5 на OpenAI с човек в 73% от случаите по време на тристранна връзка.
Тестът на Тюринг, препоръчан от математика Алън Тюринг през 1950 година, от дълго време се счита за златен стандарт за установяване на човешкия разсъдък на машините. В класическата версия на теста екзаминатор комуникира по едно и също време с човек и компютър посредством текстов интерфейс и се пробва да дефинира кой кой е.
В опита са взели участие към 300 души, които са разграничени на инцидентен принцип в две групи: половината са били изпитващи, а другата половина са се опитвали да потвърдят, че са хора. Всеки изпитващ комуникира редом с човек и чатбот. В края на теста участниците са помолени да дефинират кой от двамата събеседници е изкуствен интелект.
Тестовете са извършени в две версии: в едната AI първо е помолен да поеме ролята на избран човек, да вземем за пример млад интернет фанатик. В други случаи чатботът е работил без подкана. В режим на симулация на хора, два модела са постигнали резултати над 50%: GPT-4.5 е сгрешен с човек в 75,5% от случаите, а LLaMa от Meta — в 64,7%.
Експертите показват, че прекосяването на теста на Тюринг не значи, че AI в действителност мисли като човек. Съвременните езикови модели се образоват върху голямо количество текст, генериран от индивида, което им разрешава майсторски да имитират човешка тирада, даже в обстановки, в които не схващат предмета.




