Той може да преговаря, да бръфира, дори да лъже и

...
Той може да преговаря, да бръфира, дори да лъже и
Коментари Харесай

Игра на Дипломация с Цицерон: Изкуственият интелект, който блъфира почти като човек

Той може да договаря, да бръфира, даже да лъже и доста мъчно ще разпознаете, че против вас не стои човек. На 22 ноември Meta показа новата разработка в областта на изкуствения разсъдък (AI) - логаритъмът " Цицерон ".

Кръстен на името на римския общественик и мъдрец, " Цицерон " побеждава безкомпромисно живи хора в на настолната игра " Дипломация " (Diplomacy). По време на тестванията на логаритъма от август до октомври тази година той взе участие в 40 игри против 82-ма души. И никой от хората не схваща, че отсреща им не е различен човек. IA реализира приблизително два пъти повече точки от живите играчи и се настанява измежду 10-те процета най-хубави стратези в играта.

" Той е безсърдечен в използването на тактиката си, само че не задоволително, с цел да нервира или разстройва другите " - това е мнението на международния първенец в играта Андрю Гоф.

Какво е " Дипломация "?

" Дипломация " е стратегическа настолна игра, измислена от американеца Алън Брайън Колхамър през 1954 година Тя е нещо като компилация от известната игра " Риск ", обичайния покер и шоуто " Сървайвър ", разказват я от " Мета ".

Игралното поле е карта на Европа от 1901 година, а участниците - най-вече седем - влизат в ролята на водачи на великите сили по това време: Австро-Унгария, Англия, Германия, Италия, Русия, Турция и Франция. Ако играчите са по-малко, всеки от тях ръководи по няколко страни по едно и също време. Победител е този, под чийто надзор се намират половината от така наречен центрове за поддръжка - специфични зони на полето, които разрешават производството и поддържането на военни единици за по-нататъшно разширение.

На полето има 32 специфични зони, като " неутрални " при започване на играта са единствено 12 от тях. Обикновено те се завземат още в самото начало, след което силите са принудени да се борят между тях за територията. В хода на играта участниците би трябвало да си сътрудничат, да договарят, да си имат доверие и да се поддържат взаимно, като в същото време се борят за допустимо най-голямо поле.

За разлика от други настолни игри, ходовете в " Дипломация " се вършат по едно и също време от играчите. Периодите са два - есен и пролет, а всеки от сезоните е разграничен на няколко етапи:
Фаза на дипломацията - играчите поддържат връзка, подписват съюзи (и открити, и тайни), обмислят тактика или " подслушват " проектите на противниците;Фаза на писане на заповеди - играчите пишат заповеди на хартийки, с цел да придвижат, поддържат, транспортират войските си или да запазят позиции;Фаза на осъществяване на заповедите - играчите прочитат своите заповеди и ги извършват, в случай че е възможно;Фаза на оттегляне и разпускане - играчите извеждат разрушените в борбата обединения в безвредни територии;Фаза на приемане и загуба на войски - играчите преценят какъв брой " центрове за поддръжка " управляват и губят военни елементи или, назад, получават. Тази фаза се играе единствено през есента.
Как работи " Цицерон " (Cicero)?

В множеството обичайни настолни игри шансът неведнъж е от голяма важност. В " Дипломация " казусът не е тъкмо подобен. Придвижването по полето е значим, само че не и главен съставен елемент на играта. В центъра е взаимоотношението сред играчите. " Държавните глави " на седемте сили договарят, подписват съюзи, предават се едни други, мамят, блъфират - и всички тези умения са овладени от " Цицерон "

Алгоритъмът на изкуствен интелект, създаден от " Мета ", е нещо като чатбот, основан на два модула: обработка на натурален език и стратегическо мислене. Освен това има филтри, които правят оценка " нискокачествените " реплики на разговора, които не дават отговор на настоящата обстановка на терена или не водят до реализиране на поставената цел. Благодарение на тези съставни елементи " Цицерон " може да поддържа връзка с съперниците си в играта, да планува дейностите им, да употребява останалите играчи и да побеждава.

Езиковият модел на " Цицерон " включва 2,7 милиарда параметъра, взети от книги, вести, мнения в Reddit и гигански масив от данни от Common Crawl. Освен това инженерите на Meta са употребявали данни от 125 000 онлайн игрови сесии, извършени в webDiplomacy.net. Благодарение на последния съставен елемент от " образованието " си, логаритъмът е научил 12,9 милиона действителни известия, директно свързани с играта.

" Мета " изяснява, че на тази база моделът може да имитира достоверни известия, само че не може да основава по-ефективни реплики въз основа на към този момент научените. С други думи - логаритъмът блъфира, лъже, договаря, " забива нож в гърба " по време на играта, сходно на действителен човек, само че не и по-добре от него. Инжерените след това прибавят алтернатива изкуственият разсъдък да " вижда " и действителните планове на играчите, " скрити " зад известията, на база на които е подготвен. Това оказва помощ да се управлява разговорът сред изкуствения разсъдък и живия състезател и разрешава на " Цицерон " да проучва обстановката на полето и към този момент извършените договаряния, както и планува дейностите на другите.

Първоначално резултатът е, че казаното от " Цицерон " се разминава с дейностите му. Затова Meta създава и логаритъм, посредством който всеки ход в " Дипломация " се преглежда като обособена игра, в която участникът се стреми да предприеме някакво деяние, с цел да реализира в последна сметка избрана цел. Алгоритъмът предсказва както задачата, по този начин и резултата - като " допуска ", че действителният състезател ще избере най-хубавите благоприятни условия, с които разполага.

" Цицерон " обаче на процедура не умее напълно да лъже - по тази причина постоянно дава на съперника си действителни свои проекти. " Мета " създава и способ за оценка на известията, които логаритъмът изпраща до останалите играчи - според от това до каква степен вредят на самия него в играта. В последна сметка той се подрежда измежду най-хубавите стратези в " Дипломация ".

А за какво изкуственият разсъдък би трябвало да играе настолна игра?

" Дипломация " е може би най-хубавият " полигон " за образование на изкуствен интелект в това да умее да убеждава, да договаря, да подписва съюзи и да взаимодейства с човек, пишат създателите на " Медуза ", анализирайки резултатите, показани от " Цицерон ". От " Мета " пък дават опция на искащите да се срещнат с " Цицерон " и да го подобрят - да изпратят заявление до компанията. А тя на собствен ред е подготвена да обезпечи достъп.

Засега " Цицерон " е подобаващ единствено за игра на " Дипломация ", само че методите, употребявани за основаването му, биха били използвани и в други области. Възможността за водене на логичен разговор с потребителя може да бъде потребна за насърчаване на гласовите асистенти, които в този момент могат да дават отговор единствено на ясно заложени въпроси. Освен това ролята на логаритъм като този би била потребна в просветителния процес
Източник: boulevardbulgaria.bg

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР