Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Libratus - это компьютерная программа с искусственным интеллектом, разработанная для игры в покер , в частности в безлимитный техасский холдем один на один . Создатели Libratus предполагают, что его можно будет распространить на другие приложения, не связанные с покером. Он был разработан в Университете Карнеги-Меллона в Питтсбурге.

Фон [ править ]

Хотя Libratus был написан с нуля, он является номинальным преемником Клаудико . Как и его предшественник, его название является латинским выражением и означает «сбалансированный».

Libratus был построен с более чем 15 миллионами основных часов вычислений по сравнению с 2-3 миллионами у Claudico. Вычисления проводились на новом суперкомпьютере Bridges в Питтсбургском суперкомпьютерном центре . По словам одного из создателей Libratus, профессора Туомаса Сандхольма, у Libratus нет фиксированной встроенной стратегии, а есть алгоритм, который ее вычисляет. Техника участвует новый вариант контрфактической минимизации сожалений , [1] , а именно метод CFR + введена в 2014 году Оскари Таммелин. [2]Помимо CFR +, Libratus использовал новую технику, которую Сандхольм и его аспирант Ноам Браун разработали для решения проблемы эндшпиля. Их новый метод избавляется от прежнего фактического стандарта программирования в покере, называемого «отображение действий».

Поскольку Libratus играет только против одного человека или компьютерного игрока, применяются особые правила «один на один» для техасского холдема для двух игроков.

Матч между людьми и ИИ в 2017 году [ править ]

С 11 по 31 января 2017 года Libratus участвовал в турнире против четырех первоклассных игроков в покер [3], а именно Джейсона Лес, Донга Кима, Дэниела Маколея и Джимми Чоу. Чтобы получить более статистически значимые результаты, нужно было сыграть 120 000 рук, что на 50% больше, чем в предыдущем турнире, который Клаудико сыграл в 2015 году. Чтобы справиться с дополнительным объемом, продолжительность турнира была увеличена с 13 до 20 дней. .

Четыре игрока были сгруппированы в две подкоманды по два игрока в каждой. Одна из подкоманд играла под открытым небом, в то время как другая подкоманда располагалась в отдельной комнате под названием «Подземелье», где не было разрешено использование мобильных телефонов или другой внешней связи. Подгруппа Dungeon получила ту же последовательность карт, что и открытая, за исключением того, что стороны поменялись местами: люди Dungeon получили карты, которые AI получил в открытом виде, и наоборот. Эта установка была предназначена для того, чтобы свести на нет эффект карточной удачи.

Призовой фонд в размере 200 000 долларов был разделен исключительно между игроками-людьми. Каждый игрок получил минимум 20 000 долларов, остальные распределялись в зависимости от их успеха в игре против ИИ. Как было заранее написано в правилах турнира, сам ИИ не получил призовых денег, даже если он выиграл турнир у команды людей.

Во время турнира Libratus днем ​​соревновался с игроками. В течение ночи он совершенствовал свою стратегию самостоятельно, анализируя предыдущий игровой процесс и результаты дня, особенно свои потери. Таким образом, он мог постоянно исправлять недостатки, обнаруженные командой людей в ходе обширного анализа, что привело к постоянной гонке вооружений между людьми и Весами. Еще 4 миллиона часов работы суперкомпьютера Bridges было потрачено на соревнования.

Сила ИИ [ править ]

Libratus лидировал против игроков-людей с первого дня турнира. О силе ИИ процитировали игрока Донга Кима: «Я не осознавал, насколько он хорош до сегодняшнего дня. Я чувствовал, что играю против кого-то, кто жульничает, как будто он может видеть мои карты. Я не обвиняю это обмана. Это было просто так хорошо ". [4]

На 16-й день соревнований Libratus впервые преодолела барьер в $ 1 000 000. В конце того дня он опережал команду людей по фишкам на $ 1 194 402. В конце соревнования Libratus обогнал $ 1 766 250 фишек и, таким образом, безоговорочно выиграл. Поскольку большой блайнд в матчах был установлен на уровне 100 долларов, винрейт Libratus эквивалентен 14,7 больших блайндов на 100 рук. Это считается исключительно высоким винрейтом в покере и имеет большое статистическое значение. [5]

Из игроков-людей первым оказался Донг Ким, вторым - Маколей, третьим - Джимми Чоу и четвертым - Джейсон Лес.

Другие возможные применения [ править ]

Хотя первым приложением Libratus была игра в покер, его разработчики поставили перед ИИ гораздо более широкую миссию. [6] Исследователи разработали ИИ, чтобы иметь возможность изучать любую игру или ситуацию, в которой доступна неполная информация, а «противники» могут скрывать информацию или даже участвовать в обмане. Из-за этого Сандхольм и его коллеги предлагают применить систему и к другим, реальным проблемам, включая кибербезопасность, деловые переговоры или медицинское планирование. [7]

См. Также [ править ]

Ссылки [ править ]

  1. Сюй, Джереми (10 января 2017 г.). «Встречайте нового ИИ, бросающего вызов профессионалам в покер» . IEEE Spectrum . Проверено 15 января 2017 .
  2. ^ Браун, Ноам; Сандхольм, Туомас (2017). «Безопасное и вложенное решение эндшпиля для игр с несовершенной информацией» (PDF) . Труды семинара AAAI по компьютерному покеру и играм с несовершенной информацией .
  3. ^ Спайс, Байрон; Аллен, Гаррет (4 января 2017 г.). «Повышение ставки: противостояние лучших профи в покере против искусственного интеллекта» . Университет Карнеги-Меллона . Проверено 12 января 2017 .
  4. ^ Metz, Кейд (24 января 2017). «Искусственный интеллект собирается победить в покере - но не без человеческой помощи» . Проводной . Проверено 24 января 2017 .
  5. ^ "Libratus Poker AI побеждает людей за 1,76 миллиона долларов; конец близок?" . PokerListings . 30 января 2017 . Проверено 16 марта 2018 .
  6. Knight, Will (23 января 2017 г.). «Почему это так важно, что ИИ умеет блефовать в покере» . Обзор технологий Массачусетского технологического института .
  7. ^ «Искусственный интеллект выигрывает $ 800 000 против 4 мастеров покера» . Интересная инженерия . 27 января 2017.

Внешние ссылки [ править ]

  • Официальный сайт " Мозги против искусственного интеллекта" в казино Rivers