DeepMind пуска нова AI система, способна да играе “стратегия”

DeepMind звено на Alphabet Inc. разработва нова AI система, способна да играе “стратегия”, настолна игра, считана за по-сложна от шах и въздух.

Дълбок ум Панта Системата за изкуствен интелект, наречена DeepNash, в четвъртък. Отделът на Alphabet казва, че DeepNash има процент на победа над 84% в мачове срещу опитни човешки играчи.

“Stratego” е настолна игра за двама играчи, която в някои отношения е подобна на шаха. Играчите получават набор от фигури за игра, като фигури за шах, които се местят по дъската, докато един от играчите спечели. Но има редица разлики между двете игри, които правят стратегията по-сложна от шаха.

В “Stratego” всеки играч има само ограничена информация за игралните фигури на другия играч. Играчът може да знае, че другият играч е поставил игрална фигура на определена част от дъската, но не и конкретната игрална фигура, която е поставена там. Тази динамика прави играта трудна за AI системите.

Друг източник на сложност е, че има повече възможности, отколкото в шаха. Броят на възможните тактики, които играчите могат да използват в настолна игра, се измерва с метрика, известна като число на сложността на дървото на играта. Шахът има номер на сложност на игралното дърво от 10 на 123-та степен, докато в “Stratego” това число достига до 10 на 535-та степен.

Според DeepMind традиционните подходи за обучение на AI системи да играят на настолни игри не могат да бъдат добре приложени към „stratego“ поради тяхната сложност. За да се справят с това ограничение, изследователите на DeepMind са разработили нов AI метод, наречен R-NaD, който се основава на математическата област на теорията на игрите. Този метод формира основата на DeepNash DeepMind, подробно описан тази седмица.

Според DeepMind, DeepNash разработва план за спечелване на “стратегически” мачове чрез симулиране на така нареченото равновесие на Наш. Равновесието на Наш е ситуацията, в която всеки играч “стратег” използва стратегията на играта, която има най-голям шанс да победи стратегията на другия играч. В такава ситуация и двамата играчи изпълняват оптималната комбинация от ходове на играта по време на мача.

Като изучава какво би се случило, ако опонентът направи оптималната комбинация от ходове, DeepNash може да разработи план за действие, който увеличава шансовете му за победа.

За да оцени представянето на DeepNash, DeepMind изигра поредица от мачове срещу няколко бивши AI системи, конфигурирани за „стратегическа“ игра. DeepNash е спечелил повече от 97% от мачовете, според отдела Alphabet. В друга оценка DeepNash изигра онлайн версия на „Stratego“ и постигна 84% процент на победа срещу опитни човешки играчи.

„За да постигне тези резултати, DeepNash демонстрира забележително поведение както по време на първоначалната си фаза на внедряване на част, така и във фазата на игра“, обясниха изследователите на DeepMind в изявление. блог пост. “DeepNash разработи непредсказуема стратегия. Това означава създаване на първоначални внедрявания, които са достатъчно разнообразни, за да попречат на противника да забележи модели в поредица от игри.”

DeepMind вярва, че AI техниките, които е разработил за изграждането на DeepNash, могат да бъдат приложени към други задачи, освен да играете “Stratego”. Според модула Alphabet способността на AI система да развива оптимален курс на действие в сложни ситуации може да се приложи в области като управление на трафика.

„Също така се надяваме, че R-NaD ще помогне за отварянето на нови приложения за AI в области, които включват голям брой човешки участници или AI с различни цели, които може да не съдържат информация за намеренията на другите или какво се случва в тяхната среда,“ обясняват изследователите на DeepMind.

Снимка: DeepMind

Покажете подкрепата си за нашата мисия, като се присъедините към нашата общност от експерти на Cube Club и Cube Event. Присъединете се към общността, която включва Amazon Web Services и главен изпълнителен директор на Amazon.com Анди Джаси, основател и главен изпълнителен директор на Dell Technologies Майкъл Дел, главен изпълнителен директор на Intel Пат Гелсингер и много други високопоставени лица и експерти.