Общая игра

Общая игра в игры ( GGP ) - это разработка программ искусственного интеллекта , позволяющих успешно играть в несколько игр. ^[1]^[2]^[3] Во многих играх, таких как шахматы, компьютеры запрограммированы для игры в эти игры с использованием специально разработанного алгоритма, который нельзя перенести в другой контекст. Например, компьютерная программа для игры в шахматы не может играть в шашки . Общая игра считается необходимой вехой на пути к общему искусственному интеллекту . ^[4]

Общая игра в видеоигры ( GVGP ) - это концепция GGP, адаптированная для использования в видеоиграх . Для видеоигр правила игры должны быть либо изучены искусственными игроками, такими как TD-Gammon , за несколько итераций ^[5], либо заранее определены вручную на предметно-ориентированном языке и отправлены заранее искусственным игрокам ^[6]^[7], как в традиционный GGP. Начиная с 2013 года, был достигнут значительный прогресс после глубокого изучения армирование подхода, включая разработку программ , которые могут научиться играть Atari 2600 игр ^[8]^[5]^[9]^[10]^[11], а также программу, которая может научить играть в игры Nintendo Entertainment System . ^[12]^[13]^[14]

Первым коммерческим использованием общей игровой технологии была Zillions of Games в 1998 году. Общая игра была также предложена для торговых агентов в управлении цепочкой поставок в рамках переговоров о ценах на онлайн-аукционах с 2003 года. ^[15]^[16]^[17]^[18]

История

В 1992 году Барни Пелл определил концепцию игры в мета-игры и разработал систему «MetaGame». Это была первая программа, которая автоматически генерировала правила игры в шахматные игры, и одна из первых программ, использующих автоматическую генерацию игр. Затем Пелл разработал систему Metagamer . ^[19] Эта система могла играть в несколько шахматных игр, учитывая определение правил игры на специальном языке, называемом Game Description Language (GDL), без какого-либо человеческого взаимодействия после того, как игры были созданы. ^[20]

В 1998 году Джефф Маллет и Марк Лефлер разработали коммерческую систему Zillions of Games . Система использовала LISP-подобный язык для определения правил игры. Zillions of Games автоматически вывели функцию оценки на основе правил игры, основанных на подвижности фигур, структуре доски и целях игры. Он также использовал обычные алгоритмы, используемые в компьютерных шахматных системах: альфа-бета-отсечение с упорядочением ходов, таблицы транспонирования и т. Д. ^[21] В 2007 году пакет был расширен за счет добавления подключаемого модуля Axiom, альтернативного движка метагеймов, который включает полный язык программирования на основе Forth.

В 1998 году z-Tree был разработан Урсом Фишбахером . ^[22] z-Tree - это первый и наиболее цитируемый программный инструмент для экспериментальной экономики . z-Tree позволяет определять правила игры на языке z-Tree для теоретико-игровых экспериментов с людьми . Он также позволяет определять компьютерных игроков, которые участвуют в игре с людьми. ^[23]

В 2005 году был основан Стэнфордский проект General Game Playing . ^[3]

В 2012 году началась разработка PyVGDL. ^[24]

Реализации GGP

Стэнфордский проект

General Game Playing - это проект Stanford Logic Group из Стэнфордского университета , Калифорния, целью которого является создание платформы для обычных игр. Это наиболее известная попытка стандартизации искусственного интеллекта GGP, которая обычно считается стандартом для систем GGP. Игры определяются наборами правил, представленных на языке описания игр . Чтобы играть в игры, игроки взаимодействуют с игровым хост-сервером ^[25]^[26], который отслеживает ходы на предмет законности и информирует игроков об изменениях состояния.

С 2005 года на конференции AAAI ежегодно проводятся соревнования по играм в общую игру . Соревнования оценивают способности ИИ конкурента играть в различные игры, записывая их результативность в каждой отдельной игре. На первом этапе конкурса участники оцениваются по их способности выполнять разрешенные ходы, одерживать верх и быстрее завершать игры. В следующем раунде ИИ сражаются друг с другом во все более сложных играх. ИИ, выигравший наибольшее количество игр на этом этапе, побеждает в соревновании, и до 2013 года его создатель выигрывал приз в размере 10 000 долларов. ^[19] Пока победили следующие программы: ^[27]


Год	Имя	Разработчик	Учреждение	Ссылка
2005 г.	Cluneplayer	Джим Клун	UCLA
2006 г.	Fluxplayer	Стефан Шиффель и Майкл Тильшер	Дрезденский технологический университет	^[28]
2007 г.	Кадиаплеер	Ингви Бьёрнссон и Хильмар Финнссон	Рейкьявикский университет	^[29]
2008 г.	Кадиаплеер	Ингви Бьёрнссон, Хильмар Финнссон и Гильфи Тор Гудмундссон	Рейкьявикский университет
2009 г.	Ары	Жан Меха	Университет Париж 8
2010 г.	Ары	Жан Меха	Университет Париж 8
2011 г.	ТурбоЧерепаха	Сэм Шрайбер
2012 г.	Кадиаплеер	Хильмар Финнссон и Ингви Бьёрнссон	Рейкьявикский университет
2013	ТурбоЧерепаха	Сэм Шрайбер
2014 г.	Санчо	Стив Дрейпер и Эндрю Роуз		^[30]
2015 г.	Гальванизировать	Ричард Эмсли
2016 г.	WoodStock	Эрик Пьетт	Университет Артуа

Другие подходы

Существуют и другие общие игровые системы, которые используют свои собственные языки для определения правил игры. Другое общее игровое программное обеспечение включает:

Система под названием FRAMASI разрабатывалась с 2009 года. ^[31]^[32]

Система под названием AiAi, разработанная Стивеном Тавенером (предыдущим разработчиком Zillions) ^[33], восходит к 2015 году и активно развивается в конце 2017 года. ^[34]^[35]

Система под названием PolyGamo Player от Дэвида М. Беннета, выпущенная в сентябре 2017 года на основе игрового движка Unity . ^[36]

Реализации GVGP

Обучение с подкреплением

GVGP потенциально может использоваться для автоматического создания реального ИИ видеоигр , а также «для тестирования игровых сред, включая те, которые создаются автоматически с использованием процедурной генерации контента, и для поиска потенциальных лазеек в игровом процессе, которые может использовать игрок-человек». ^[7] GVGP также использовался для генерации правил игры и оценки качества игры на основе профилей относительной производительности алгоритмов (RAPP), которые сравнивают различия в навыках, которые позволяет игра между хорошим ИИ и плохим ИИ. ^[37]

Язык описания видеоигр

Соревнование General Video Game AI Competition ( GVGAI ) проводится с 2014 года. В этом соревновании вместо настольных игр, используемых в GGP, используются двухмерные видеоигры, похожие на (а иногда и основанные на) аркадные и консольные игры 1980-х годов. соревнование. Это дало возможность исследователям и практикам протестировать и сравнить свои лучшие общие алгоритмы игры в видеоигры. У конкурса есть соответствующая программная среда, включающая большое количество игр, написанных на языке описания видеоигр (VGDL) , который не следует путать с GDL, и представляет собой язык кодирования, использующий простую семантику и команды, которые можно легко проанализировать. Одним из примеров VGDL является PyVGDL, разработанный в 2013 году. ^[6]^[24] Игры, используемые в GVGP, на данный момент часто являются двумерными аркадными играми, поскольку они являются наиболее простыми и легко поддаются количественной оценке. ^[38] Чтобы упростить процесс создания ИИ, который может интерпретировать видеоигры, игры для этой цели пишутся на VGDL вручную. VGDL можно использовать для описания игры специально для процедурной генерации уровней с использованием программирования набора ответов (ASP) и эволюционного алгоритма (EA). Затем GVGP можно использовать для проверки достоверности процедурных уровней, а также сложности или качества уровней в зависимости от того, как работает агент. ^[39]

Алгоритмы

Поскольку GGP AI должен быть разработан для игры в несколько игр, его конструкция не может полагаться на алгоритмы, созданные специально для определенных игр. Вместо этого ИИ должен разрабатываться с использованием алгоритмов, методы которых можно применять в широком спектре игр. AI также должен быть непрерывным процессом, который может адаптироваться к своему текущему состоянию, а не к выходным данным предыдущих состояний. По этой причине часто наиболее эффективны методы разомкнутого контура . ^[40]

Популярным методом разработки GGP AI является алгоритм поиска по дереву Монте-Карло (MCTS). ^[41] Часто используемые вместе с методом UCT ( верхняя граница достоверности, применяемая к деревьям ), варианты MCTS были предложены, чтобы лучше играть в определенные игры, а также сделать его совместимым с играми в видеоигры. ^[42]^[43]^[44] Другой вариант используемого алгоритма поиска по дереву - это направленный поиск в ширину (DBS), ^[45], в котором дочерний узел текущего состояния создается для каждого доступного действия и посещает каждое ребенок упорядочен по наивысшей средней награде, пока игра не закончится или не истечет время. ^[46] В каждом методе поиска по дереву ИИ моделирует потенциальные действия и оценивает каждое на основе средней наивысшей награды за каждый путь с точки зрения заработанных очков. ^[41]^[46]

Предположения

Чтобы взаимодействовать с играми, алгоритмы должны работать в предположении, что все игры имеют общие характеристики. В книге Half-Real: Video Games Between Real Worlds and Fictionals , Jesper Juul дает следующее определение игр: игры основаны на правилах, у них есть переменные результаты, разные результаты дают разные значения, усилия игрока влияют на результаты, игрок привязаны к результатам, и игра имеет подлежащие обсуждению последствия. ^[47] Используя эти предположения, игровой ИИ может быть создан путем количественной оценки вклада игрока, результатов игры и того, как применяются различные правила, а также использования алгоритмов для вычисления наиболее благоприятного пути. ^[38]

Смотрите также

AlphaZero
- MuZero
Общий искусственный интеллект
Искусственный интеллект в видеоиграх
Развлекательный язык для домена
Язык описания игры
Многозадачное обучение
Схема искусственного интеллекта
Передача обучения

Внешние ссылки

Домашняя страница General Game Playing в Стэнфордском университете

См. Также CS227B - страницу общего курса по игре в игры , GGP.org , страницу GGP.org GitHub и games.stanford.edu .

Общие игровые ресурсы предоставлены Дрезденским технологическим университетом.
AiAi Стивена Тавенера
Проект PolyGamo Player Дэвида М. Беннета
Axiom Development kit - система разработки мета-игр, совместимая с Zillions of Games, авторства Грега Шмидта.
Palamedes - общая игровая среда IDE

видео

Общий конкурс видеоигр по искусственному интеллекту
Демонстрация обучения ConvNetJS Deep Q

[1] Пелл, Барни (1992). Х. ван ден Херик; Л. Эллис (ред.). «Метагейм: новый вызов для игр и обучения» [Эвристическое программирование в искусственном интеллекте 3 - третья компьютерная олимпиада ] (PDF) . Эллис-Хорвуд. Цитировать журнал требует |journal=( помощь )

[pellfirst-2] Пелл, Барни (1996). «Стратегический игрок в метагейм для общих шахматных игр». Вычислительный интеллект . 12 (1): 177–198. DOI : 10.1111 / j.1467-8640.1996.tb00258.x . ISSN 1467-8640 .

[ggppell-3] а б Дженесерет, Майкл; С любовью, Натаниэль; Пелл, Барни (15 июня 2005 г.). «Общие правила игры: Обзор соревнований AAAI». Журнал AI . +26 (2): 62. DOI : 10,1609 / aimag.v26i2.1813 . ISSN 2371-9621 .

[4] Ханаан, Родриго; Салге, Кристоф; Тогелиус, Юлиан; Нилен, Энди (2019). Выравнивание игрового поля [ Труды 14-й Международной конференции по выравниванию игрового поля: справедливость в ИИ по сравнению с критериями игры человека ]. dl.acm.org . С. 1–8. DOI : 10.1145 / 3337722 . ISBN 9781450372176.

[firstatari-5] а б Мних, Владимир; Кавукчуоглу, Корай; Сильвер, Дэвид; Грейвс, Алекс; Антоноглоу Иоаннис; Виерстра, Даан; Ридмиллер, Мартин (2013). «Игра в Atari с глубоким обучением с подкреплением» (PDF) . Семинар по нейронным системам обработки информации 2013 . Проверено 25 апреля 2015 года .

[paperschaul-6] а б Шауль, Том (август 2013). «Язык описания видеоигр для модельного или интерактивного обучения». Конференция IEEE 2013 г. по вычислительному интеллекту в играх (CIG) : 1–8. CiteSeerX 10.1.1.360.2263 . DOI : 10,1109 / CIG.2013.6633610 . ISBN 978-1-4673-5311-3.

[gvgp-7] а б Левин, Джон; Конгдон, Клэр Бейтс; Эбнер, Марк; Кендалл, Грэм; Лукас, Саймон М .; Мииккулайнен, Ристо; Шауль, Том; Томпсон, Томми (2013). «Общие видеоигры» . Искусственный и вычислительный интеллект в играх . Schloss Dagstuhl – Leibniz-Zentrum fuer Informatik. 6 : 77–83 . Проверено 25 апреля 2015 года .

[attariplattform-8] Боулинг, М .; Veness, J .; Naddaf, Y .; Бельмар, MG (2013-06-14). «Обучающая среда Arcade: платформа оценки для агентов общего назначения». Журнал исследований искусственного интеллекта . 47 : 253–279. arXiv : 1207.4708 . DOI : 10.1613 / jair.3912 . ISSN 1076-9757 .

[9] Мних, Владимир; Кавукчуоглу, Корай; Сильвер, Дэвид; Русу, Андрей А .; Венесс, Джоэл; Хассабис, Демис; Bellemare, Marc G .; Грейвс, Алекс; Ридмиллер, Мартин; Fidjeland, Andreas K .; Стиг Петерсен, Георг Островски; Битти, Чарльз; Садик, Амир; Антоноглоу Иоаннис; Король, Хелен; Кумаран, Дхаршан; Виерстра, Даан; Легг, Шейн (26 февраля 2015 г.). «Контроль на уровне человека посредством глубокого обучения с подкреплением». Природа . 518 (7540): 529–533. Bibcode : 2015Natur.518..529M . DOI : 10,1038 / природа14236 . PMID 25719670 .

[10] Корюс, Кристьян; Кузовкин, Илья; Тампуу, Арди; Пунгас, Тайво (2014). «Репликация Бумага„Игра Atari с Deep подкреплением “ » (PDF) . Тартуский университет . Проверено 25 апреля 2015 года .

[11] Го, Сяосяо; Сингх, Сатиндер; Ли, Хонглак; Льюис, Ричард Л .; Ван, Сяоши (2014). «Глубокое обучение для игры в Atari в реальном времени с использованием автономного планирования поиска по дереву Монте-Карло» (PDF) . Протоколы NIPS ^β . Конференция по нейронным системам обработки информации . Проверено 25 апреля 2015 года .

[12] Мерфи, Том (2013). «Первый уровень Super Mario Bros. прост с лексикографическим порядком и путешествиями во времени ... после этого становится немного сложнее » (PDF) . СИГБОВИК . Проверено 25 апреля 2015 года .

[13] Мерфи, Том. «learnfun & playfun: общий метод автоматизации игр NES» . Проверено 25 апреля 2015 года .

[14] Teller, Swizec (28 октября 2013 г.). «Неделя 2: Уровень 1 в Super Mario Bros. прост с лексикографическим порядком и» . Компьютерщик в шляпе . Проверено 25 апреля 2015 года .

[15] Макмиллен, Колин (2003). «На пути к разработке интеллектуального агента для игры в управление цепочкой поставок в рамках конкурса торговых агентов 2003 г.» [Конкурс торговых агентов 2003 г.]. Дипломная работа. Миннеаполис, Миннесота: Университет Миннесоты. S2CID 167336006 . Цитировать журнал требует |journal=( помощь )

[16] Чжан, Донгмо (2009). От общих описаний игр до языка спецификаций рынка для обычных торговых агентов [ Электронная коммерция при посредничестве агентов . Разработка торговых стратегий и механизмов для электронных рынков. ]. Берлин, Гейдельберг: Springer. С. 259–274. Bibcode : 2010aecd.book..259T . CiteSeerX 10.1.1.467.4629 .

[17] "AGAPE - Аукцион ЯЗЫК ДЛЯ ОБЫЧНЫХ АУКЦИОННЫХ ИГРОКОВ" . АГАПЕ (по-французски) . Дата обращения 5 марта 2020 .

[18] Майкл, Фридрих; Игнатов, Дмитрий (2019). «Общие переговоры о ценах между двумя компаниями» (PDF) . Материалы семинара CEUR . Том-2479: 89–99 . Дата обращения 5 марта 2020 . |volume=имеет дополнительный текст ( справка )

[:2-19] Исследование Барни Пелла о компьютерных играх. Архивировано 12 августа 2007 г. в Wayback Machine .

[satirist-20] «Метагейм и общие игры» . Метагейм и общая игра . Проверено 27 марта 2016 года .

[21] Доступно: электронное письмо от Universal Game Engine на comp.ai.games от Джеффа Маллетта, 10 декабря 1998 г.

[22] «UZH - z-Tree - Zurich Toolbox для готовых экономических экспериментов» . www.ztree.uzh.ch . Дата обращения 17 февраля 2020 .

[23] Бекенкамп, Мартин; Хенниг-Шмидт, Хайке; Майер-Риго, Франк П. (1 марта 2007 г.). «Сотрудничество в симметричных и асимметричных играх с дилеммой заключенного». Сеть исследований в области социальных наук. SSRN 968942 . Цитировать журнал требует |journal=( помощь )

[gitschaul-24] а б Шауль, Том (7 февраля 2020 г.). "schaul / py-vgdl" .

[25] GGP Server , платформа для соревнований общих игровых систем.

[26] Dresden GGP Server , платформа для соревнований общих игровых систем с автоматическим планированием матчей.

[27] «Общая игра» . www.general-game-playing.de .

[28] Информация о Fluxplayer , победителе 2-го Международного соревнования по игре в общие игры.

[29] Информация о CADIAPlayer , дополнительная информация о победителе 3-го, 4-го и 8-го Международных соревнований по играм в общие игры.

[30] Санчо - чемпион GGP 2014! , победитель Международного конкурса игровых автоматов 2014 года.

[31] Тагев, Рустам (2009). Филипе, Жоаким; Фред, Ана; Шарп, Бернадетт (ред.). На пути к структуре управления стратегическим взаимодействием [ Труды Международной конференции по агентам и искусственному интеллекту ] (PDF) . Порту, Португалия. С. 587–590. ISBN 978-989-8111-66-1.

[32] Тагев, Рустам (2011). Realer Strategische Interaktion Agenten Ganzheitliche Konzeptualisierung und Softwarekomponenten einer interdisziplinären Forschungsinfrastruktur (neue Ausg ed.). Саарбрюккен. ISBN 9783838125121. |access-date=требуется |url=( помощь )

[33] "Миллионы игр - кто мы?" . www.zillions-of-games.com . Проверено 16 ноября 2017 .

[34] «Домашняя страница AiAi - Стивен Тавенер» . mrraow.com . Проверено 16 ноября 2017 .

[35] "Тема объявления Ai Ai" . BoardGameGeek . Проверено 16 ноября 2017 .

[36] «Проект PolyGamo Player | Языки программирования и общие игроки для абстрактных игр и головоломок» . www.polyomino.com . Проверено 16 ноября 2017 .

[37] Nielsen, Thorbjørn S .; Баррос, Габриэлла А.Б.; Тогелиус, Юлиан; Нельсон, Марк Дж. «На пути к созданию правил аркадных игр с помощью VGDL» (PDF) .

[dagstuhl-38] а б Левин, Джон; Конгдон, Клэр Бейтс; Эбнер, Марк; Кендалл, Грэм; Лукас, Саймон М .; Мииккулайнен Ристо, Шауль; Том, Томпсон; Томми. «Общие видеоигры» (PDF) .

[39] Нойфельд, Ксения; Мостагим, Саназ; Перес-Либана, Диего. «Генерация процедурного уровня с программированием набора ответов для обычных видеоигр» (PDF) .

[40] «Последние достижения в общей игре» . Научный мировой журнал . Hindawi Publishing Corporation. 2015. DOI : 10,1155 / 2015/986262 .

[:0-41] а б «Поиск по дереву Монте-Карло для общей игры» . ResearchGate . Проверено 1 апреля 2016 .

[42] Финнссон, Хилмар (2012). «Обобщенные расширения поиска по дереву Монте-Карло для обычных игр» . Труды двадцать шестой конференции AAAI по искусственному интеллекту .

[43] Фриденберг, Фредерик; Андерсон, Каспер Р .; Ризи, Себастьян; Тогелиус, Юлиан. «Исследование модификаций MCTS при воспроизведении видеоигр» (PDF) .

[44] М. Свеховски; Я. Мандзюк; Ю.С. Онг, «Специализация общей игровой программы на основе UCT для однопользовательских игр», в IEEE Transactions on Computational Intelligence and AI in Games , vol.PP, no.99, pp.1-1 doi : 10.1109 / TCIAIG .2015.2391232

[45] «Изменение корневого узла из предыдущего шага игры» . DBS: алгоритм направленного поиска в ширину (DBS)

[:1-46] а б Перес, Диего; Dieskau, Jens; Хюнермунд, Мартин. «Открытый цикл поиска для обычных видеоигр» (PDF) .

[47] Джеспер Юул. Half-Real: Видеоигры между реальными правилами и вымышленными мирами. MIT Press, 2005.

[1]