Pluribus - игрок в компьютерный покер, использующий искусственный интеллект, созданный лабораторией искусственного интеллекта Facebook и Университетом Карнеги-Меллона . Pluribus играет в покер безлимитный техасский холдем и является «первым ботом, победившим людей в сложном многопользовательском соревновании». [1]
По словам создателей Pluribus, «разработка сверхчеловеческого ИИ для многопользовательского покера была широко признанной основной оставшейся вехой» в компьютерном покере до Pluribus. Pluribus полагается на автономную самостоятельную игру для построения базовой стратегии, но затем продолжает обучение в режиме реального времени во время сетевой игры. Базовая стратегия была рассчитана за восемь дней, и по рыночным ценам производство обошлось бы в 144 доллара, что намного меньше, чем такие вехи современных сверхчеловеческих игр, как AlphaZero.. В AI игры с нулевой суммой для двух игроков (такие как хедз-ап холдем) обычно выигрывают, прибегая к стратегии равновесия по Нэшу; однако этот подход не работает для игр с тремя и более игроками. Вместо этого Pluribus использует подход, который не имеет сильных теоретических гарантий, но, тем не менее, эмпирически хорошо работает для победы над игроками-людьми. В разных соревнованиях Pluribus выигрывал в среднем более 30 миллионов больших блайндов за игру. Стиль игры Pluribus, который выучил самостоятельно, избегает «лимпа» (коллирование большого блайнда) и участвует в «донк-ставках» (завершение раунда коллом и начало следующего раунда ставками) чаще, чем это делают эксперты-люди. [2]
Среди опытных игроков в покер Джейсон Лес заявил, что чувствует себя «безнадежным. Вы не чувствуете, что есть что-то, что можно сделать, чтобы выиграть». Крис Фергюсон заявил: «Против Pluribus очень тяжело играть. Его действительно сложно удержать на любой руке». Джимми Чоу заявил: «Каждый раз, когда я играю в бота, я чувствую, что беру что-то новое, чтобы включить его в свою игру». В The Wall Street Journal научный редактор Даниэла Эрнандес охарактеризовала Pluribus как «продвинутый в ключевом человеческом навыке - обмане». [3] [4]
После победы разработчики отказались публиковать исходный код, опасаясь, что он будет использован для тайного обмана игроков в покер в онлайн-матчах. [5] [6]
Ссылки [ править ]
- ↑ Солли, Мейлан. «Этот искусственный интеллект, играющий в покер, знает, когда держать их, а когда сбрасывать» . Смитсоновский институт .
- ^ Браун, Ноам; Сандхольм, Туомас (30 августа 2019 г.). «Сверхчеловеческий ИИ для многопользовательского покера». Наука . 365 (6456): 885–890. DOI : 10.1126 / science.aay2400 .
- ↑ Винсент, Джеймс (11 июля 2019 г.). «Сверхчеловеческий покерный искусственный интеллект Facebook и CMU превосходит человеческих профессионалов» . Грань . Проверено 4 февраля 2021 года .
- ↑ Эрнандес, Даниела (11 июля 2019 г.). «Компьютеры теперь могут блефовать, как чемпион по покеру. На самом деле, даже лучше» . Wall Street Journal . Проверено 4 февраля 2021 года .
- ^ Ouellette, Дженнифер (11 июля 2019). «Facebook AI Pluribus побеждает лучших покерных профессионалов в Техасском Холдеме на 6 игроков» . Ars Technica .
- ^ Рыцарь, Уилл. «Новый искусственный интеллект Facebook для игры в покер может разрушить индустрию онлайн-покера, поэтому он не будет выпущен» . Обзор технологий Массачусетского технологического института .