Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Pluribus - игрок в компьютерный покер, использующий искусственный интеллект, созданный лабораторией искусственного интеллекта Facebook и Университетом Карнеги-Меллона . Pluribus играет в покер безлимитный техасский холдем и является «первым ботом, победившим людей в сложном многопользовательском соревновании». [1]

По словам создателей Pluribus, «разработка сверхчеловеческого ИИ для многопользовательского покера была широко признанной основной оставшейся вехой» в компьютерном покере до Pluribus. Pluribus полагается на автономную самостоятельную игру для построения базовой стратегии, но затем продолжает обучение в режиме реального времени во время сетевой игры. Базовая стратегия была рассчитана за восемь дней, и по рыночным ценам производство обошлось бы в 144 доллара, что намного меньше, чем такие вехи современных сверхчеловеческих игр, как AlphaZero.. В AI игры с нулевой суммой для двух игроков (такие как хедз-ап холдем) обычно выигрывают, прибегая к стратегии равновесия по Нэшу; однако этот подход не работает для игр с тремя и более игроками. Вместо этого Pluribus использует подход, который не имеет сильных теоретических гарантий, но, тем не менее, эмпирически хорошо работает для победы над игроками-людьми. В разных соревнованиях Pluribus выигрывал в среднем более 30 миллионов больших блайндов за игру. Стиль игры Pluribus, который выучил самостоятельно, избегает «лимпа» (коллирование большого блайнда) и участвует в «донк-ставках» (завершение раунда коллом и начало следующего раунда ставками) чаще, чем это делают эксперты-люди. [2]

Среди опытных игроков в покер Джейсон Лес заявил, что чувствует себя «безнадежным. Вы не чувствуете, что есть что-то, что можно сделать, чтобы выиграть». Крис Фергюсон заявил: «Против Pluribus очень тяжело играть. Его действительно сложно удержать на любой руке». Джимми Чоу заявил: «Каждый раз, когда я играю в бота, я чувствую, что беру что-то новое, чтобы включить его в свою игру». В The Wall Street Journal научный редактор Даниэла Эрнандес охарактеризовала Pluribus как «продвинутый в ключевом человеческом навыке - обмане». [3] [4]

После победы разработчики отказались публиковать исходный код, опасаясь, что он будет использован для тайного обмана игроков в покер в онлайн-матчах. [5] [6]

Ссылки [ править ]

  1. Солли, Мейлан. «Этот искусственный интеллект, играющий в покер, знает, когда держать их, а когда сбрасывать» . Смитсоновский институт .
  2. ^ Браун, Ноам; Сандхольм, Туомас (30 августа 2019 г.). «Сверхчеловеческий ИИ для многопользовательского покера». Наука . 365 (6456): 885–890. DOI : 10.1126 / science.aay2400 .
  3. Винсент, Джеймс (11 июля 2019 г.). «Сверхчеловеческий покерный искусственный интеллект Facebook и CMU превосходит человеческих профессионалов» . Грань . Проверено 4 февраля 2021 года .
  4. Эрнандес, Даниела (11 июля 2019 г.). «Компьютеры теперь могут блефовать, как чемпион по покеру. На самом деле, даже лучше» . Wall Street Journal . Проверено 4 февраля 2021 года .
  5. ^ Ouellette, Дженнифер (11 июля 2019). «Facebook AI Pluribus побеждает лучших покерных профессионалов в Техасском Холдеме на 6 игроков» . Ars Technica .
  6. ^ Рыцарь, Уилл. «Новый искусственный интеллект Facebook для игры в покер может разрушить индустрию онлайн-покера, поэтому он не будет выпущен» . Обзор технологий Массачусетского технологического института .