Meta Team изгражда AI, който играе ролята на “дипломация” на много високо ниво

науки (2022). DOI: 10.1126 / science.ade9097″ width=”800″ height=”530″/>

Архитектура на Цицерон. Cicero прогнозира възможните човешки действия на всеки играч въз основа на състоянието на дъската и диалога, използвайки това като отправна точка за алгоритъм за планиране, използващ RL-обучени модели. Резултатът от планирането е действие на агента плюс вярвания относно действията на други играчи, които се използват за определяне на намерения за модела на диалог, който се обуславя. Генерираните филтри за съобщения преминават през няколко стъпки на филтриране, преди да бъде изпратено последното съобщение. приписват му: науки (2022). DOI: 10.1126/science.ade9097

Група изследователи от Meta Fundamental AI Research Diplomacy Team (FAIR), свързана с множество институции в Съединените щати, добави компонент за преговори към AI система, която играе дипломация. В статия, публикувана в сп наукиекипът описва работата, вложена в изграждането на системата и нейната ефективност, когато се сблъска с неизвестни човешки противници.

The Игра Дипломацията е описана като една от най-сложните игри на всички времена – тя пресъздава събитията около Първата световна война, когато много нации са били във война с много други и не всички от тях са били ясно съюзници. в играта, играчи Работете, за да договорите възможно най-добрия резултат за страната, която представляват, въз основа на взаимни споразумения, резултати от битки, подравнявания и дипломация.

Както подсказва името й, една от определящите характеристики на играта е дипломацията, което е умение, което е трудно да се опише. В това ново усилие екипът на FAIR подобри по-ранна версия на AI, която играеше само частта от играта на борда, като добави единица, която участва в В момента английски език Дипломация с човешки играчи.

Новата система се нарича CICERO и е изградена около два основни компонента: единият управлява диалога, а другият разработва стратегии. Механизмът за стратегическо планиране беше същият като този, използван в предишната версия на системата. Екипът обаче е изградил нов двигател, който може да се използва за приемане на диалог от други играчи, предаването му и след това получаване на стратегически планове, преведени в диалог, който се изпраща на други играчи. The диалог Двигателят е обучен с помощта на данни от 50 000 разговора в игри, играни от хора.






След като системата беше изградена и тествана вътрешно, екипът влезе в интернет базирана версия на Diplomacy, където хората бяха непознати един за друг. CICERO играеше играта анонимно, както би направил всеки човешки играч. По този начин той не само трябваше да играе играта като човек, но трябваше да го направи, без другите играчи да забележат, че играят срещу компютърна система.

Изследователите откриха, че само един играч се усъмни в човечеството на CICERO. Освен това системата AI се оказва по-добър играч от повечето си човешки опоненти, отбелязвайки точки в първите 10% от играчите.

повече информация:
Андрю Гоф и др., Игра на човешко ниво в играта на дипломация чрез комбиниране на езикови парадигми със стратегическо мислене, науки (2022). DOI: 10.1126/science.ade9097

Страница на проекта: ai.facebook.com/research/cicero/diplomacy/

© 2022 Science X Network

цитатът: Meta Team изгражда AI, който играе „дипломация“ на много високо ниво (2022 г., 23 ноември) Изтеглено на 24 ноември 2022 г. от

Този документ е обект на авторско право. Освен всяко честно отношение за целите на частно проучване или изследване, никоя част не може да бъде възпроизвеждана без писмено разрешение. Съдържанието се предоставя само за информационни цели.