Той може да преговаря, да бръфира, дори да лъже и

Игра на Дипломация с Цицерон: Изкуственият интелект, който блъфира почти като човек

Той може да договаря, да бръфира, даже да лъже и доста мъчно ще разпознаете, че против вас не стои човек. На 22 ноември Meta показа новата разработка в областта на изкуствения разсъдък (AI) - логаритъмът " Цицерон ".

Кръстен на името на римския общественик и мъдрец, " Цицерон " побеждава безкомпромисно живи хора в на настолната игра " Дипломация " (Diplomacy). По време на тестванията на логаритъма от август до октомври тази година той взе участие в 40 игри против 82-ма души. И никой от хората не схваща, че отсреща им не е различен човек. IA реализира приблизително два пъти повече точки от живите играчи и се настанява измежду 10-те процета най-хубави стратези в играта.

" Той е безсърдечен в използването на тактиката си, само че не задоволително, с цел да нервира или разстройва другите " - това е мнението на международния първенец в играта Андрю Гоф.

Какво е " Дипломация "?

" Дипломация " е стратегическа настолна игра, измислена от американеца Алън Брайън Колхамър през 1954 година Тя е нещо като компилация от известната игра " Риск ", обичайния покер и шоуто " Сървайвър ", разказват я от " Мета ".

Игралното поле е карта на Европа от 1901 година, а участниците - най-вече седем - влизат в ролята на водачи на великите сили по това време: Австро-Унгария, Англия, Германия, Италия, Русия, Турция и Франция. Ако играчите са по-малко, всеки от тях ръководи по няколко страни по едно и също време. Победител е този, под чийто надзор се намират половината от така наречен центрове за поддръжка - специфични зони на полето, които разрешават производството и поддържането на военни единици за по-нататъшно разширение.

На полето има 32 специфични зони, като " неутрални " при започване на играта са единствено 12 от тях. Обикновено те се завземат още в самото начало, след което силите са принудени да се борят между тях за територията. В хода на играта участниците би трябвало да си сътрудничат, да договарят, да си имат доверие и да се поддържат взаимно, като в същото време се борят за допустимо най-голямо поле.

За разлика от други настолни игри, ходовете в " Дипломация " се вършат по едно и също време от играчите. Периодите са два - есен и пролет, а всеки от сезоните е разграничен на няколко етапи:
Фаза на дипломацията - играчите поддържат връзка, подписват съюзи (и открити, и тайни), обмислят тактика или " подслушват " проектите на противниците;Фаза на писане на заповеди - играчите пишат заповеди на хартийки, с цел да придвижат, поддържат, транспортират войските си или да запазят позиции;Фаза на осъществяване на заповедите - играчите прочитат своите заповеди и ги извършват, в случай че е възможно;Фаза на оттегляне и разпускане - играчите извеждат разрушените в борбата обединения в безвредни територии;Фаза на приемане и загуба на войски - играчите преценят какъв брой " центрове за поддръжка " управляват и губят военни елементи или, назад, получават. Тази фаза се играе единствено през есента.
Как работи " Цицерон " (Cicero)?

В множеството обичайни настолни игри шансът неведнъж е от голяма важност. В " Дипломация " казусът не е тъкмо подобен. Придвижването по полето е значим, само че не и главен съставен елемент на играта. В центъра е взаимоотношението сред играчите. " Държавните глави " на седемте сили договарят, подписват съюзи, предават се едни други, мамят, блъфират - и всички тези умения са овладени от " Цицерон "

Алгоритъмът на изкуствен интелект, създаден от " Мета ", е нещо като чатбот, основан на два модула: обработка на натурален език и стратегическо мислене. Освен това има филтри, които правят оценка " нискокачествените " реплики на разговора, които не дават отговор на настоящата обстановка на терена или не водят до реализиране на поставената цел. Благодарение на тези съставни елементи " Цицерон " може да поддържа връзка с съперниците си в играта, да планува дейностите им, да употребява останалите играчи и да побеждава.

Езиковият модел на " Цицерон " включва 2,7 милиарда параметъра, взети от книги, вести, мнения в Reddit и гигански масив от данни от Common Crawl. Освен това инженерите на Meta са употребявали данни от 125 000 онлайн игрови сесии, извършени в webDiplomacy.net. Благодарение на последния съставен елемент от " образованието " си, логаритъмът е научил 12,9 милиона действителни известия, директно свързани с играта.

" Мета " изяснява, че на тази база моделът може да имитира достоверни известия, само че не може да основава по-ефективни реплики въз основа на към този момент научените. С други думи - логаритъмът блъфира, лъже, договаря, " забива нож в гърба " по време на играта, сходно на действителен човек, само че не и по-добре от него. Инжерените след това прибавят алтернатива изкуственият разсъдък да " вижда " и действителните планове на играчите, " скрити " зад известията, на база на които е подготвен. Това оказва помощ да се управлява разговорът сред изкуствения разсъдък и живия състезател и разрешава на " Цицерон " да проучва обстановката на полето и към този момент извършените договаряния, както и планува дейностите на другите.

Първоначално резултатът е, че казаното от " Цицерон " се разминава с дейностите му. Затова Meta създава и логаритъм, посредством който всеки ход в " Дипломация " се преглежда като обособена игра, в която участникът се стреми да предприеме някакво деяние, с цел да реализира в последна сметка избрана цел. Алгоритъмът предсказва както задачата, по този начин и резултата - като " допуска ", че действителният състезател ще избере най-хубавите благоприятни условия, с които разполага.

" Цицерон " обаче на процедура не умее напълно да лъже - по тази причина постоянно дава на съперника си действителни свои проекти. " Мета " създава и способ за оценка на известията, които логаритъмът изпраща до останалите играчи - според от това до каква степен вредят на самия него в играта. В последна сметка той се подрежда измежду най-хубавите стратези в " Дипломация ".

А за какво изкуственият разсъдък би трябвало да играе настолна игра?

" Дипломация " е може би най-хубавият " полигон " за образование на изкуствен интелект в това да умее да убеждава, да договаря, да подписва съюзи и да взаимодейства с човек, пишат създателите на " Медуза ", анализирайки резултатите, показани от " Цицерон ". От " Мета " пък дават опция на искащите да се срещнат с " Цицерон " и да го подобрят - да изпратят заявление до компанията. А тя на собствен ред е подготвена да обезпечи достъп.

Засега " Цицерон " е подобаващ единствено за игра на " Дипломация ", само че методите, употребявани за основаването му, биха били използвани и в други области. Възможността за водене на логичен разговор с потребителя може да бъде потребна за насърчаване на гласовите асистенти, които в този момент могат да дават отговор единствено на ясно заложени въпроси. Освен това ролята на логаритъм като този би била потребна в просветителния процес

Игра на Дипломация с Цицерон: Изкуственият интелект, който блъфира почти като човек

игра дипломация

дипломация цицерон

цицерон изкуственият

изкуственият интелект

интелект който

който блъфира

блъфира почти

почти като

игра

дипломация

цицерон

изкуственият

интелект

който

блъфира

почти

като

човек