Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Логотип AlphaGo
Логотип AlphaGo

AlphaGo - это компьютерная программа , играющая в настольную игру го . [1] Он был разработан DeepMind Technologies [2], который позже был приобретен Google . Последующие версии AlphaGo становились все более мощными, включая версию, которая конкурировала под названием Master . [3] После ухода из соревновательной игры, AlphaGo Master сменила еще более мощная версия, известная как AlphaGo Zero , которая была полностью самоучкой, без изучения человеческих игр. AlphaGo Zero затем была обобщена в программу, известную как AlphaZero., в которые играли дополнительные игры, в том числе шахматы и сёги . На смену AlphaZero, в свою очередь, пришла программа, известная как MuZero, которая учится без обучения правилам.

AlphaGo и его последователи используют алгоритм поиска по дереву Монте-Карло , чтобы находить свои ходы на основе знаний, ранее полученных с помощью машинного обучения , в частности, с помощью искусственной нейронной сети ( метод глубокого обучения ) путем обширного обучения, как в игровой, так и в компьютерной среде. [4] Нейронная сеть обучена определять лучшие ходы и процент выигрыша этих ходов. Эта нейронная сеть улучшает поиск по дереву, что приводит к более сильному выбору хода в следующей итерации.

В октябре 2015 года в матче против Фань Хуэй оригинальная AlphaGo стала первой компьютерной программой в го, которая победила профессионального игрока в го без гандикапа на полноразмерной доске 19 × 19. [5] [6] В марте 2016 года он победил Ли Седола в матче из пяти игр , впервые компьютерная программа Го победила профессионала с 9 даном без гандикапа. [7] Хотя он проиграл Ли Седолу в четвертой игре, Ли подал в отставку в последней игре, дав окончательный счет 4 игры против 1 в пользу AlphaGo. В знак признания победы AlphaGo была удостоена почетного 9-го дана Корейской ассоциацией бадук.. [8] Подготовка и контрольный матч с Ли Седолом были задокументированы в документальном фильме, также названном AlphaGo , [9] режиссера Грега Коса. Он был выбран науками как один из Открытия года Финалист 22 декабря 2016 года [10]

На саммите Future of Go в 2017 году мастер- версия AlphaGo победила Ке Цзе , игрока номер один в мире в то время, в матче из трех игр , после чего AlphaGo была удостоена профессионального 9 дан от Китайской ассоциации Weiqi. . [11]

После матча между AlphaGo и Ke Jie DeepMind удалил AlphaGo, продолжив исследования ИИ в других областях. [12] Самоучка AlphaGo Zero одержала 100–0 побед над ранней соревновательной версией AlphaGo, а его преемник AlphaZero в настоящее время считается лучшим игроком в мире в го, а также, возможно, в шахматы .

История [ править ]

Считается, что для компьютеров в го гораздо труднее выиграть, чем в других играх, таких как шахматы , потому что его гораздо больший фактор ветвления чрезмерно затрудняет использование традиционных методов искусственного интеллекта, таких как альфа-бета-обрезка , обход дерева и эвристический поиск. [5] [13]

Почти два десятилетия после компьютерной компании IBM Deep Blue бить чемпиона мира по шахматам Гарри Каспаров в матче 1997 года , сильнейшие программы Go с использованием искусственного интеллекта , методы достигаются только о любительском 5-дан уровень, [4] и до сих пор не смог обыграть профессиональный игрок идти без инвалидность . [5] [6] [14] В 2012 году программа Zen , работающая на кластере из четырех компьютеров, дважды победила Масаки Такемию ( 9 очков ) с гандикапом в пять и четыре камня. [15] В 2013 году Crazy Stone победилиЙошио Исида (9 очков) с гандикапом в четыре камня. [16]

По словам Дэвида Сильвера из DeepMind , исследовательский проект AlphaGo был сформирован примерно в 2014 году, чтобы проверить, насколько хорошо нейронная сеть, использующая глубокое обучение, может конкурировать на Go. [17] AlphaGo представляет собой значительное улучшение по сравнению с предыдущими программами Go. В 500 играх против других доступных программ Го, включая Crazy Stone и Zen, AlphaGo, запущенная на одном компьютере, выиграла все, кроме одной. [18] В аналогичном матче AlphaGo, запущенная на нескольких компьютерах, выиграла все 500 игр, сыгранных против других программ Go, и 77% игр, сыгранных против AlphaGo, запущенной на одном компьютере. В распределенной версии в октябре 2015 года использовалось 1202 процессора и 176 графических процессоров . [4]

Матч против Фань Хуэй [ править ]

В октябре 2015 года распределенная версия AlphaGo победила чемпиона Европы по го Фан Хуэй , [19] занявшего 2 дан (из 9 возможных) профессионалов со счетом 5: 0. [6] [20] Это был первый случай, когда компьютерная программа Го победила профессионального игрока-человека на полноразмерной доске без гандикапа. [21] Объявление новостей было отложено до 27 января 2016 г., чтобы совпасть с публикацией статьи в журнале Nature [4], описывающей используемые алгоритмы. [6]

Матч против Ли Седола [ править ]

AlphaGo играл с южнокорейским профессиональным игроком в го Ли Седолом , занявшим 9 дан, одним из лучших игроков в го [14] [ нуждается в обновлении ]. Пять игр прошли в отеле Four Seasons в Сеуле , Южная Корея, 9, 10, 12, 13 и 15 марта 2016 г. [22] [23], которые транслировались в прямом эфире. [24] Из пяти игр AlphaGo выиграл четыре игры, а Ли выиграл четвертую игру, что сделало его единственным человеком, победившим AlphaGo во всех 74 официальных играх. [25] AlphaGo использовала облачные вычисления Google, а ее серверы находились в США. [26] Используемый матчВ китайских правилах коми составляет 7,5 очков , и у каждой стороны было два часа на размышление плюс три периода бёёми по 60 секунд . [27] Версия AlphaGo, играющая против Ли, использовала такое же количество вычислительной мощности, как и в матче с Фань Хуэй. [28] The Economist сообщил, что использовалось 1920 процессоров и 280 графических процессоров. [29] На момент игры Ли Седол занимал второе место в мире по количеству побед на международных чемпионатах по го после южнокорейского игрока Ли Чанхо, который удерживал титул чемпиона мира в течение 16 лет. [30] Поскольку не существует единого официального метода ранжирования в международном го, рейтинг в разных источниках может быть разным. Хотя иногда он и занимал первое место, некоторые источники оценивали Ли Седола как четвертого лучшего игрока в мире в то время. [31] [32] AlphaGo не была специально обучена противостоять Ли и не была предназначена для соревнований с какими-либо конкретными игроками-людьми.

Первые три игры были выиграны AlphaGo после отставки Ли. [33] [34] Тем не менее, Ли победил AlphaGo в четвертой игре, выиграв отставкой на 180-м ходу. AlphaGo затем продолжил одерживать четвертую победу, выиграв пятую игру отставкой. [35]

Приз составил 1 миллион долларов США. Поскольку AlphaGo выиграла четыре из пяти и, следовательно, серию, приз будет передан благотворительным организациям, в том числе ЮНИСЕФ . [36] Ли Седол получил 150 000 долларов за участие во всех пяти играх и дополнительно 20 000 долларов за победу в четвертой игре. [27]

В июне 2016 года на презентации, проведенной в университете в Нидерландах, Аджа Хуанг, один из команды Deep Mind, сообщил, что они устранили логическую слабость, которая возникла во время 4-й игры матча между AlphaGo и Ли, а затем после 78-й ход (который многие профессионалы окрестили « божественным ходом »), он пойдет так, как задумано, и сохранит преимущество черных. До 78-го хода AlphaGo лидировала на протяжении всей игры, но из-за действия Ли вычислительные мощности программы были отвлечены и запутаны. [37]Хуанг объяснил, что политическая сеть AlphaGo по нахождению наиболее точного порядка ходов и продолжения не совсем точно указала AlphaGo на правильное продолжение после 78-го хода, поскольку его сеть ценностей не определила 78-й ход Ли как наиболее вероятный и, следовательно, время, когда это движение было сделано AlphaGo не смогла внести правильную корректировку в логическое продолжение. [38]

Шестьдесят онлайн-игр [ править ]

29 декабря 2016 года новая учетная запись на сервере Tygem под названием «Magister» (обозначенная как «Magist» в китайской версии сервера) из Южной Кореи начала играть в игры с профессиональными игроками. Он изменил свое имя учетной записи на «Мастер» 30 декабря, а затем переместился на сервер FoxGo 1 января 2017 года. 4 января DeepMind подтвердил, что «Магистр» и «Мастер» игрались в обновленной версии AlphaGo, называется AlphaGo Master . [39] [40] По состоянию на 5 января 2017 года онлайн-рекорд AlphaGo Master составлял 60 побед и 0 поражений, [41] включая три победы над лучшим игроком Го, Кэ Джи ,[42], которых заранее незаметно проинформировали, что Мастер - это версия AlphaGo.[41] После поражения от Мастера Гу Ли предложил награду в размере 100 000 юаней (14 400 долларов США) за первого игрока-человека, который смог победить Учителя. [40] Мастер играл в темпе по 10 игр в день. Многие быстро заподозрили, что это ИИ-игрок из-за того, что между играми почти не отдыхали. Его противниками были многие чемпионы мира, такие как Кэ Джи , Пак Чон Хван , Юта Ияма , Туо Цзяси , Ми Ютин , Ши Юэ , Чен Яое , Ли Циньчэн, Гу Ли , Чан Хао , Тан Вэйсин, Фань Тиню , Чжоу Жуйян., Цзян Вэйцзе , Чжоу Чун-сун , Ким Джи-сок , Кан Дон-юн , Пак Ён-хун и Вон Сон-джин ; национальные чемпионы или занявшие второе место на чемпионатах мира, такие как Лянь Сяо , Тан Сяо , Мэн Тейлинг, Данг Ифэй, Хуан Юнсун, Ян Динсинь , Гу Цзихао, Шин Джинсео, Чо Хан Сын и Ан Сонджун. Все 60 игр, кроме одной, были быстрыми играми с тремя по 20 или 30 секунд бё-ёми . Мастер предложил продлить байо-ёми до одной минуты, играя с Не Вэйпином.учитывая его возраст. После победы в 59-й игре Мастер показал себя в чате под управлением доктора Аджа Хуанга из команды DeepMind [43], затем сменил национальность на Соединенное Королевство. После того, как эти игры были завершены, соучредитель Google DeepMind Демис Хассабис сказал в твиттере: «Мы с нетерпением ждем возможности сыграть в некоторые официальные полноформатные игры позже [2017] в сотрудничестве с организациями и экспертами Go». [39] [40]

Эксперты по го были впечатлены производительностью программы и ее нечеловеческим стилем игры; Кэ Цзе заявил, что «после того, как человечество потратило тысячи лет на улучшение своей тактики, компьютеры говорят нам, что люди полностью неправы ... Я бы сказал, что ни один человек не коснулся края истины Го». [41]

Будущее Go Summit [ править ]

На саммите Future of Go Summit, состоявшемся в Учжэне в мае 2017 года, AlphaGo Master сыграл три игры с Кэ Цзе, игроком № 1 в мире, а также две игры с несколькими ведущими китайскими профессионалами, одну парную игру в го и одну против сотрудника. команда из пяти человек-игроков. [44]

Google DeepMind предложил призы в размере 1,5 миллиона долларов за матч из трех игр между Кэ Джи и Мастером, а проигравшая сторона получила 300 000 долларов. [45] [46] Мастер выиграл все три игры против Кэ Цзе, [47] [48], после чего AlphaGo была удостоена профессионального 9-го дана Китайской ассоциацией Weiqi. [11]

После победы в матче из трех игр против Ке Цзе, самого популярного игрока в мире в го, AlphaGo ушел в отставку. DeepMind также распустил команду, которая работала над игрой, чтобы сосредоточиться на исследованиях ИИ в других областях. [12] После Саммита Deepmind опубликовала 50 полноформатных матчей AlphaGo vs AlphaGo в качестве подарка сообществу Go. [49]

AlphaGo Zero и AlphaZero [ править ]

Команда AlphaGo опубликовала статью в журнале Nature 19 октября 2017 года, в которой представила AlphaGo Zero, версию без человеческих данных и более сильную, чем любая предыдущая версия, побеждающая человека-чемпиона. [50] Играя в игры против самого себя, AlphaGo Zero превзошла AlphaGo Lee за три дня, выиграв 100 игр с 0, достигла уровня AlphaGo Master за 21 день и превзошла все старые версии за 40 дней. [51]

В документе, опубликованном на arXiv 5 декабря 2017 года, DeepMind утверждал, что обобщил подход AlphaGo Zero в единый алгоритм AlphaZero, который за 24 часа достиг сверхчеловеческого уровня игры в шахматы , сёги и го , победив чемпиона мира. программ, Stockfish , Elmo и 3-дневной версии AlphaGo Zero в каждом случае. [52]

Инструмент обучения [ править ]

11 декабря 2017 года DeepMind выпустила на своем веб-сайте обучающий инструмент AlphaGo [53], чтобы анализировать процент выигрышей в различных открытиях Go, рассчитанный AlphaGo Master . [54] Инструмент обучения собирает 6000 открытий в Го из 230 000 игр для людей, каждая из которых проанализирована с помощью 10 000 000 симуляций AlphaGo Master. Многие из возможностей включают предложения по перемещению человека. [54]

Версии [ править ]

Ранняя версия AlphaGo была протестирована на оборудовании с различным количеством процессоров и графических процессоров , работающих в асинхронном или распределенном режиме. Каждому ходу давалось две секунды на обдумывание. Полученные рейтинги Эло перечислены ниже. [4] В матчах с большим количеством времени на ход достигаются более высокие рейтинги.

В мае 2016 года Google представила собственные проприетарные аппаратные « блоки тензорной обработки », которые, по ее словам, уже были развернуты в нескольких внутренних проектах Google, включая матч AlphaGo против Ли Седола. [55] [56]

На саммите Future of Go в мае 2017 года DeepMind раскрыл, что версия AlphaGo, использованная на этом саммите, была AlphaGo Master , [57] [58] и показала, что она измеряла силу различных версий программного обеспечения. AlphaGo Lee, версия, использованная против Ли, могла дать AlphaGo Fan, версию, используемую в AlphaGo vs. Fan Hui, три камня, а AlphaGo Master был даже на три камня сильнее. [59]

Алгоритм [ править ]

По состоянию на 2016 год алгоритм AlphaGo использует комбинацию машинного обучения и методов поиска по дереву , в сочетании с обширным обучением, как в игровой, так и в компьютерной среде. Он использует поиск по дереву Монте-Карло , руководствуясь «сетью значений» и «сетью политик», которые реализованы с использованием технологии глубокой нейронной сети . [5] [4] Перед отправкой в ​​нейронные сети ко входным данным применяется ограниченный объем предварительной обработки для определения особенностей игры (например, чтобы выделить, соответствует ли ход шаблону накаде ). [4]

Первоначально нейронные сети системы были созданы на основе человеческого опыта в игровом процессе. AlphaGo изначально был обучен имитировать человеческую игру, пытаясь сопоставить движения опытных игроков из записанных исторических партий, используя базу данных, содержащую около 30 миллионов ходов. [19] Как только он достиг определенной степени мастерства, он прошел дальнейшее обучение, настроив играть большое количество игр против других экземпляров самого себя, используя обучение с подкреплением для улучшения своей игры. [5] Чтобы избежать «неуважительной» траты времени оппонента, программа специально запрограммирована на уход в отставку, если ее оценка вероятности победы упадет ниже определенного порога; для матча с Ли порог отставки был установлен на уровне 20%. [62]

Стиль игры [ править ]

Тоби Мэннинг, рефери матча AlphaGo vs. Fan Hui, охарактеризовал стиль программы как «консервативный». [63] Стиль игры AlphaGo решительно отдает предпочтение большей вероятности выигрыша меньшим количеством очков, чем меньшей вероятности выигрыша большим количеством очков. [17] Его стратегия максимизации вероятности выигрыша отличается от того, что обычно делают игроки-люди, а именно максимизируют территориальные выгоды, и объясняет некоторые из его странных ходов. [64] Он делает много вводных ходов, которые никогда или редко делались людьми, при этом избегая многих вводных ходов второй линии, которые любят делать игроки-люди. Он любит использовать удары плечом , особенно если противник слишком сконцентрирован. [ необходима цитата ]

Ответы на победу 2016 года [ править ]

Сообщество AI [ править ]

Победа AlphaGo в марте 2016 года стала важной вехой в исследованиях искусственного интеллекта. [65] Go раньше считался сложной проблемой в машинном обучении, которая, как ожидается, будет недоступна для технологий того времени. [65] [66] [67] Большинство экспертов считали, что до такой мощной программы Go, как AlphaGo, еще не менее пяти лет; [68] некоторые эксперты полагали, что потребуется еще как минимум десять лет, прежде чем компьютеры победят чемпионов го. [4] [69] [70] Большинство наблюдателей в начале матчей 2016 года ожидали, что Ли победит AlphaGo. [65]

С такими играми, как шашки (которые были « решены » командой шашистов Chinook ), шахматами, а теперь и го, выигранным компьютерами, победы в популярных настольных играх больше не могут служить важными вехами для искусственного интеллекта в том виде, в каком они его использовали. к. Deep Blue «s Мюррей Кэмпбелл назвал победу AlphaGo„Конец эпохи ... настольные игры более или менее сделаны , и это время , чтобы двигаться дальше.“ [65]

По сравнению с Deep Blue или Watson базовые алгоритмы AlphaGo потенциально более универсальны и могут свидетельствовать о том, что научное сообщество делает успехи в направлении общего искусственного интеллекта . [17] [71] Некоторые комментаторы считают, что победа AlphaGo дает обществу хорошую возможность начать подготовку к возможному будущему удару машин с универсальным интеллектом . Как заметил предприниматель Гай Сутер, AlphaGo умеет играть только в го и не обладает универсальным интеллектом; «[Оно] не могло просто проснуться однажды утром и решить, что хочет научиться обращаться с огнестрельным оружием». [65] Исследователь ИИ Стюарт Расселсказал, что системы искусственного интеллекта, такие как AlphaGo, развиваются быстрее и становятся более мощными, чем ожидалось, и поэтому мы должны разработать методы, гарантирующие, что они «остаются под контролем человека». [72] Некоторые ученые, такие как Стивен Хокинг , предупреждали (в мае 2015 года перед матчами), что некоторый будущий самосовершенствующийся ИИ может получить реальный общий интеллект, что приведет к неожиданному захвату ИИ ; другие ученые не согласны: эксперт в области искусственного интеллекта Жан-Габриэль Ганашиа считает, что «такие вещи, как« здравый смысл »... никогда не могут быть воспроизведены» [73], и говорит: «Я не понимаю, почему мы должны говорить о страхах. Напротив, это вселяет надежды во многих областях, таких как здоровье и освоение космоса ".[72] Ученый-компьютерщикРичард Саттон сказал: «Я не думаю, что люди должны бояться ... но я действительно думаю, что люди должны обращать внимание». [74]

В Китае AlphaGo стал « моментом спутника », который помог убедить китайское правительство сделать приоритетными и резко увеличить финансирование искусственного интеллекта. [75]

В 2017 году команда DeepMind AlphaGo получила первую медаль IJCAI Марвина Мински за выдающиеся достижения в области ИИ. «AlphaGo - прекрасное достижение и прекрасный пример того, за что была учреждена медаль Мински», - сказал профессор Майкл Вулдридж , председатель комитета по наградам IJCAI. «Что особенно впечатлило IJCAI, так это то, что AlphaGo достигает того, что он делает, благодаря блестящей комбинации классических методов искусственного интеллекта, а также современных методов машинного обучения, с которыми так тесно связан DeepMind. Это захватывающая демонстрация современного искусственного интеллекта, и мы рады, что удостоены этой награды ». [76]

Сообщество Go [ править ]

Го - популярная игра в Китае, Японии и Корее, и матчи 2016 года посмотрели около ста миллионов человек по всему миру. [65] [77] Многие ведущие игроки в го охарактеризовали неортодоксальные игры AlphaGo как кажущиеся сомнительными ходы, которые поначалу сбивали с толку зрителей, но имели смысл в ретроспективе: [69] «Все, кроме лучших игроков в го, создают свой стиль, подражая лучшим игрокам. AlphaGo кажется, что он сам создает совершенно оригинальные ходы ". [65] AlphaGo, казалось, неожиданно стал намного сильнее, даже по сравнению с матчем в октябре 2015 года [78], где компьютер впервые в истории обыграл профессионала го без преимущества гандикапа. [79]На следующий день после первого поражения Ли Чон Ахрам, ведущий корреспондент Го одной из крупнейших ежедневных газет Южной Кореи, сказал: «Прошлая ночь была очень мрачной ... Многие люди пили алкоголь». [80] Корея Baduk ассоциация , организация , которая курирует профессионал Go в Южной Корее, удостоенную AlphaGo почетного 9-дано названия для выставления творческих навыков и продвижения прогресса игры. [81]

Китая Ke Jie , 18-летний обычно признан лучшим в мире игроком Go в то время, [31] [82] первоначально утверждал , что он сможет побить AlphaGo, но отказался играть против него, опасаясь , что она будет "скопируйте мой стиль". [82] По ходу матчей Кэ Цзе ходил туда-сюда, заявляя, что «весьма вероятно, что я (мог) проиграть» после анализа первых трех матчей, [83] но восстановив уверенность после того, как AlphaGo обнаружил недостатки в четвертом матче. . [84]

Тоби Мэннинг, рефери матча AlphaGo с Фань Хуэй, и Хаджин Ли, генеральный секретарь Международной федерации го , считают, что в будущем игроки в го будут получать помощь от компьютеров, чтобы узнать, что они сделали не так в играх, и улучшить свои навыки игры. навыки. [79]

После второй игры Ли сказал, что он «потерял дар речи»: «С самого начала матча я никогда не мог одержать победу в одном единственном ходу. Это была полная победа AlphaGo». [85] Ли извинился за свои поражения, заявив после третьей игры, что «я недооценил возможности AlphaGo и почувствовал себя бессильным». [65] Он подчеркнул, что поражение было «поражением Ли Седола», а не «поражением человечества». [25] [73] Ли сказал, что его окончательная потеря машины была «неизбежной», но заявил, что «роботы никогда не поймут красоту игры так же, как мы, люди». [73] Ли назвал свою победу в четвертой игре «бесценной победой, которую я (не променяю) ни на что».[25]

Подобные системы [ править ]

Facebook также работает над собственной системой игры в гоу darkforest , также основанной на сочетании машинного обучения и поиска по дереву Монте-Карло . [63] [86] Несмотря на то, что он является сильным игроком против других компьютерных программ Go, по состоянию на начало 2016 года он еще не победил профессионального игрока-человека. [87] Darkforest проиграл CrazyStone и Zen и, по оценкам, обладает такой же силой, как CrazyStone и Zen. [88]

DeepZenGo , система, разработанная при поддержке веб-сайта по обмену видео Dwango и Токийского университета , проиграла 2–1 в ноябре 2016 г. мастеру го Чо Тикуну , который является рекордсменом по наибольшему количеству побед в го в Японии. [89] [90]

В статье, опубликованной в Nature за 2018 год , подход AlphaGo был назван основой для нового средства вычисления потенциальных молекул фармацевтических препаратов. [91]

Пример игры [ править ]

AlphaGo Master (белый) против Тан Вэйсина (31 декабря 2016 г.), AlphaGo победила в отставке. Ход белых 36 получил широкую похвалу.

Влияние на Go [ править ]

Документальный фильм AlphaGo [92] [93] вселил надежду, что Ли Седоль и Фань Хуэй извлекут пользу из своего опыта игры в AlphaGo, но по состоянию на май 2018 года их рейтинги мало изменились; Ли Седол занял 11-е место в мире, а Фань Хуэй - 545-е. [94] 19 ноября 2019 года Ли объявил о своем уходе из профессиональной игры, утверждая, что он никогда не сможет стать лучшим игроком в го из-за растущего доминирования ИИ. Ли назвал их «сущностью, которую невозможно победить». [95]

См. Также [ править ]

  • Чинук (игрок в шашки) , программа игры в шашки
  • Глоссарий искусственного интеллекта
  • Иди и математика
  • Лила (программное обеспечение)
  • TD-Gammon , нейронная сеть для игры в нарды
  • Pluribus (покерный бот)

Ссылки [ править ]

  1. ^ «Искусственный интеллект: AlphaGo от Google превосходит мастера го Ли Седола» . BBC News . Проверено 17 марта 2016 года .
  2. ^ «DeepMind AlphaGO» . DeepMind Искусственный интеллект AlphaGo .
  3. ^ "AlphaGo | DeepMind" . DeepMind .
  4. ^ a b c d e f g h i Сильвер, Дэвид ; Хуанг, Аджа ; Мэддисон, Крис Дж .; Гез, Артур; Сифре, Лоран; Дрише, Джордж ван ден; Шриттвизер, Джулиан; Антоноглоу, Иоаннис; Паннеершелвам, Веда; Ланкто, Марк; Дилеман, Сандер; Греве, Доминик; Нхам, Джон; Кальхбреннер, Нал; Суцкевер Илья ; Лилликрап, Тимоти; Лич, Мадлен; Кавукчуоглу, Корай; Грэпель, Тор; Хассабис, Демис (28 января 2016 г.). «Освоение игры го с глубокими нейронными сетями и поиском по дереву». Природа . 529 (7587): 484–489. Bibcode : 2016Natur.529..484S .DOI : 10,1038 / природа16961 . ISSN  0028-0836 . PMID  26819042 . S2CID  515925 .
  5. ^ a b c d e «Исследовательский блог: AlphaGo: освоение древней игры го с машинным обучением» . Блог Google Research . 27 января 2016 г.
  6. ^ a b c d «Google добивается« прорыва »в области ИИ, победив чемпиона по го» . BBC News . 27 января 2016 г.
  7. ^ «Матч 1 - Google DeepMind Challenge Match: Ли Седол против AlphaGo» . 8 марта 2016 г.
  8. ^ «Google AlphaGo получает« божественный »рейтинг Go» . straitstimes.com . 15 марта 2016 . Проверено 9 декабря 2017 .
  9. ^ "AlphaGo Movie" .
  10. ^ «От ИИ к сворачиванию белка: наш прорыв, занявший второе место» . Наука . 22 декабря 2016 . Проверено 29 декабря +2016 .
  11. ^ a b "中国 围棋 协会 授予 AlphaGo 职业 九段 并 颁发 证书" (на китайском языке). Sohu.com . 27 мая 2017 . Проверено 9 декабря 2017 .
  12. ^ a b «После победы в Китае дизайнеры AlphaGo исследуют новый ИИ» . 27 мая 2017.
  13. ^ Schraudolph, Nicol N .; Терренс, Питер Даян; Сейновски Дж. Изучение временной разницы при оценке позиции в игре го (PDF)
  14. ^ a b «Компьютер одерживает большую победу над людьми в древней игре го» . CNN. 28 января 2016 . Проверено 28 января 2016 .
  15. ^ "Программа Zen computer Go побеждает Такемию Масаки всего с 4 камнями!" . Go Game Guru . Архивировано из оригинала на 1 февраля 2016 года . Проверено 28 января 2016 .
  16. ^ "「 ア マ 六段 の 力。 天才 か も 」囲 碁 棋士 、 コ ン ピ ュ タ 敗 れ る 初 の 公式 戦" . MSN Sankei News. Архивировано из оригинального 24 марта 2013 года . Проверено 27 марта 2013 года .
  17. ^ a b c Джон Риберио (14 марта 2016 г.). «Необычные ходы AlphaGo доказывают его искусный интеллект, - говорят эксперты» . Мир ПК . Проверено 18 марта 2016 .
  18. ^ "Google AlphaGo AI чисто зачищает чемпион Европы по го" . ZDNet . 28 января 2016 . Проверено 28 января 2016 .
  19. ^ a b Мец, Кейд (27 января 2016 г.). «В крупном прорыве в области искусственного интеллекта система Google тайно побеждает лучших игроков древней игры го» . ПРОВОДНОЙ . Дата обращения 1 февраля 2016 .
  20. ^ "Специальная вставка Computer Go, охватывающая матч AlphaGo v Fan Hui" (PDF) . Британский журнал Go. 2017 . Дата обращения 1 февраля 2016 .
  21. ^ "Première défaite d'un Professionalnel du go contre une Intelligence Artificielle" . Le Monde (на французском языке). 27 января 2016 г.
  22. ^ "Google AI AlphaGo, чтобы сразиться с № 1 в мире Ли Седолом в прямом эфире" . Хранитель . 5 февраля 2016 . Проверено 15 февраля +2016 .
  23. ^ "Google DeepMind собирается сразиться с лучшим в мире игроком в го в роскошном 5-звездочном отеле в Южной Корее" . Business Insider . 22 февраля 2016 . Проверено 23 февраля +2016 .
  24. ^ NOVET, Иордания (4 февраля 2016). «В марте YouTube будет транслировать ИИ Google в прямом эфире с участием суперзвезды Go Ли Седола» . VentureBeat . Проверено 7 февраля +2016 .
  25. ^ a b c Юн Сон Вон (14 марта 2016 г.). «Ли Седол показывает AlphaGo, которую можно победить» . The Korea Times . Проверено 15 марта 2016 года .
  26. ^ "李世 乭 : 即使 Alpha Go 得到 升级 也 一样 能赢" . JoongAng Ilbo (на китайском языке). 23 февраля 2016 . Проверено 24 февраля +2016 .
  27. ^ a b "이세돌 vs 알파 고, '구글 딥 마인드 챌린지 매치' 기자 회견 열려" (на корейском языке). Корейская ассоциация бадуков . 22 февраля 2016 года Архивировано из оригинала 3 марта 2016 года . Проверено 22 февраля +2016 .
  28. ^ Демис Хассабис [@demishassabis] (11 марта 2016 г.). «Мы используем примерно то же количество вычислительной мощности, что и в матче Fan Hui: распределение результатов поиска по другим машинам имеет убывающую отдачу» (твит) . Проверено 14 марта 2016 г. - через Twitter .
  29. ^ «Разборки» . Экономист . Проверено 19 ноября +2016 .
  30. Стивен Боровец (9 марта 2016 г.). «Машина искусственного интеллекта Google против чемпиона мира по игре« Go »: все, что вам нужно знать» . Хранитель . Проверено 15 марта 2016 года .
  31. ^ a b Реми Кулом . «Рейтинговый список 01.01.2016» . Архивировано из оригинального 18 марта 2016 года . Проверено 18 марта 2016 .
  32. ^ «Корейский мастер го доказывает, что человеческая интуиция все еще сильна в го» . Корейский вестник / ИНН . 14 марта 2016 года Архивировано из оригинала 12 апреля 2016 года . Проверено 15 марта 2016 года .
  33. ^ «ИИ Google побеждает чемпиона мира по го в первом из пяти матчей - BBC News» . BBC Online . Проверено 9 марта 2016 .
  34. ^ "Google AI выигрывает вторую игру в го против чемпиона мира - BBC News" . BBC Online . Проверено 10 марта 2016 .
  35. ^ «Google DeepMind AI побеждает в финальном матче по го для победы в серии 4–1» . Engadget . Проверено 15 марта 2016 года .
  36. ^ «Человеческий чемпион уверен, что победит ИИ в древней китайской игре» . Ассошиэйтед Пресс. 22 февраля 2016 . Проверено 22 февраля +2016 .
  37. ^ «В двух шагах, AlphaGo и Ли Седол пересмотрели будущее» . ПРОВОДНОЙ . Проверено 12 ноября 2017 года .
  38. ^ «黄士杰 : AlphaGo 李世石 人机 大战 第四局 问题 已 date = 8 July 2016» (на китайском языке) . Проверено 8 июля +2016 .
  39. ^ Б Демис Хассабис (4 января 2017). Демис Хассабис в Твиттере: «Рад поделиться новостью о #AlphaGo! " " . Аккаунт Демиса Хассабиса в Twitter . Проверено 4 января 2017 года .
  40. ^ a b c Элизабет Гибни (4 января 2017 г.). «Google раскрывает секретный тест AI-бота, чтобы победить лучших игроков в го» . Природа . 541 (7636): 142. Bibcode : 2017Natur.541..142G . DOI : 10.1038 / nature.2017.21253 . PMID 28079098 . Проверено 4 января 2017 года . 
  41. ^ a b c «Люди скорбят о потере после того, как Google разоблачен как главный китайский игрок» . Wall Street Journal . 5 января 2017 . Проверено 6 января 2017 года .
  42. ^ «Лучший игрок в го в мире говорит, что у него еще есть« последний ход », чтобы победить AlphaGo AI от Google» . Кварц . 4 января 2017 . Проверено 6 января 2017 года .
  43. ^ "横扫 中 日韩 棋手 斩获 59 的 的 Master 发话 : 我 是 阿尔法 狗" (на китайском языке). 澎湃 新闻. 4 января 2017 . Проверено 11 декабря 2017 года .
  44. ^ «Изучение тайн го с AlphaGo и лучшими игроками Китая» . 10 апреля 2017.
  45. ^ "Игрок №1 в го мира Ке Джи берет на себя обновленную AlphaGo в мае" . 10 апреля 2017.
  46. ^ «Ке Цзе против AlphaGo: 8 вещей, которые вы должны знать» . 27 мая 2017.
  47. ^ "Обновленный AlphaGo выигрывает первую игру против китайского гроссмейстера го" . 23 мая 2017.
  48. ^ «Google AlphaGo продолжает доминировать со второй победой в Китае» . 25 мая 2017.
  49. ^ "Полноформатные игры для игроков в го" . Deepmind . Дата обращения 28 мая 2017 .
  50. ^ a b c d e Сильвер, Дэвид ; Шриттвизер, Джулиан; Симонян, Карен; Антоноглоу, Иоаннис; Хуанг, Аджа ; Гез, Артур; Хуберт, Томас; Бейкер, Лукас; Лай, Мэтью; Болтон, Адриан; Чен, Юйтянь ; Лилликрап, Тимоти; Фань, Хуэй ; Сифре, Лоран; Дрише, Джордж ван ден; Грэпель, Тор; Хассабис, Демис (19 октября 2017 г.). «Освоение игры в го без человеческого знания» (PDF) . Природа . 550 (7676): 354–359. Bibcode : 2017Natur.550..354S . DOI : 10.1038 / nature24270 . ISSN  0028-0836 . PMID  29052630 . S2CID  205261034 .
  51. ^ a b c d e «AlphaGo Zero: обучение с нуля» . Официальный сайт DeepMind . 18 октября 2017 . Проверено 19 октября 2017 года .
  52. Сильвер, Дэвид ; Хуберт, Томас; Шриттвизер, Джулиан; Антоноглоу, Иоаннис; Лай, Мэтью; Гез, Артур; Ланкто, Марк; Сифре, Лоран; Кумаран, Дхаршан; Грэпель, Тор; Лилликрап, Тимоти; Симонян, Карен; Хассабис, Демис (5 декабря 2017 г.). «Освоение шахмат и сёги путем самостоятельной игры с использованием общего алгоритма обучения с подкреплением». arXiv : 1712.01815 [ cs.AI ].
  53. ^ "Инструмент обучения AlphaGo" . DeepMind .
  54. ^ a b «AlphaGo 教学 工具 上 线 樊 麾 : 使用 Master Version» (на китайском языке). Sina.com.cn . 11 декабря 2017 . Проверено 11 декабря 2017 года .
  55. ^ Макмиллан, Роберт (18 мая 2016 г.). «Google не играет в игры с новым чипом» . The Wall Street Journal . Проверено 26 июня +2016 .
  56. ^ Jouppi, Нормы (18 мая 2016). «Google решает задачи машинного обучения с помощью специального чипа TPU» . Блог Google Cloud Platform . Проверено 26 июня +2016 .
  57. ^ «AlphaGo 官方 解读 让 三 子 对 人类 高手 没 这种 优势» (на китайском языке). Сина . 25 мая 2017 . Дата обращения 2 июня 2017 .
  58. ^ «各 Version alphago 实力 对比 master 能让 李世石 子 3 子» (на китайском языке). Сина . 24 мая 2017 . Дата обращения 2 июня 2017 .
  59. ^ "Новая версия AlphaGo самообучающаяся и намного более эффективная" . Американская ассоциация го . 24 мая 2017 . Дата обращения 1 июня 2017 .
  60. ^ «【柯 洁 战败 解密】 AlphaGo Master 最新 架构 和 算法 , 谷 歌 云 TPU 拆解» (на китайском языке). Соху . 24 мая 2017 . Дата обращения 1 июня 2017 .
  61. ^ "Дополнительные материалы к бумаге AlphaZero Science, Data S1, figure1_elos.json, max elo достигнут" .
  62. Cade Metz (13 марта 2016 г.). «Гроссмейстер Ли Седол одерживает утешительную победу над искусственным интеллектом Google» . Проводные новости . Проверено 29 марта 2016 года .
  63. ^ a b Гибни, Элизабет (27 января 2016 г.). «Алгоритм Google AI овладевает древней игрой в го» . Природа . 529 (7587): 445–6. Bibcode : 2016Natur.529..445G . DOI : 10.1038 / 529445a . PMID 26819021 . 
  64. ^ Chouard, Танги (12 марта 2016). «Файлы Go: компьютер с ИИ одерживает победу над чемпионом по го» . Природа . DOI : 10.1038 / nature.2016.19553 . S2CID 155164502 . 
  65. ^ Б с д е е г ч Стивен Borowiec; Трейси Лиен (12 марта 2016 г.). «AlphaGo превосходит чемпиона по игре в го в мире искусственного интеллекта» . Лос-Анджелес Таймс . Проверено 13 марта 2016 .
  66. Коннор, Стив (27 января 2016 г.). «Компьютер победил профессионала в самой сложной настольной игре в мире» . Независимый . Проверено 28 января 2016 .
  67. ^ "ИИ Google побеждает чемпиона среди людей в го" . CBC News . 27 января 2016 . Проверено 28 января 2016 .
  68. ^ Дэйв Gershgorn (12 марта 2016). «GOOGLE'S ALPHAGO ПОБЕДИЛ ЧЕМПИОНА МИРА В ТРЕТЬЕМ МАТЧЕ, ВЫИГРАЯ ВСЕ СЕРИИ» . Популярная наука . Проверено 13 марта 2016 .
  69. ^ a b "Компьютер Google DeepMind AlphaGo опередил чемпиона мира по игре в го" . CBC News . Ассошиэйтед Пресс . 12 марта 2016 . Проверено 13 марта 2016 .
  70. ^ София Ян (12 марта 2016 г.). «Компьютер Google победил чемпиона мира по игре в гоу» . CNN Деньги . Проверено 13 марта 2016 .
  71. ^ "AlphaGo: искусственный интеллект Google, чтобы победить чемпиона мира по древней китайской настольной игре" . Австралийская радиовещательная корпорация . 8 марта 2016 . Проверено 13 марта 2016 .
  72. ^ a b Мариетт Ле Ру (12 марта 2016 г.). «Восстание машин: следите за ИИ, предупреждают эксперты» . Phys.org . Проверено 13 марта 2016 .
  73. ^ a b c Мариетт Ле Ру; Паскаль Моллар (8 марта 2016 г.). «Игра окончена? Новый вызов искусственного интеллекта человеческому разуму (обновление)» . Phys.org . Проверено 13 марта 2016 .
  74. Таня Льюис (11 марта 2016 г.). «Эксперт по искусственному интеллекту говорит, что в программе Google Go-play отсутствует одна важная особенность человеческого интеллекта» . Business Insider . Проверено 13 марта 2016 .
  75. ^ Mozur, Павел (20 июля 2017). «Пекин хочет, чтобы искусственный интеллект производился в Китае к 2030 году» . Нью-Йорк Таймс . Проверено 11 апреля 2018 года .
  76. ^ "Медаль Марвина Мински за выдающиеся достижения в области искусственного интеллекта" . Международная совместная конференция по искусственному интеллекту . 19 октября 2017 . Проверено 21 октября 2017 года .
  77. ^ Чо Санг Хан (16 марта 2016). «Компьютерная программа Google превосходит Ли Седола в турнире по го» . Нью-Йорк Таймс . Проверено 18 марта 2016 . По словам Хассабиса, матчи AlphaGo-Lee смотрели более 100 миллионов человек.
  78. Джон Рибейро (12 марта 2016 г.). «Программа Google AlphaGo AI сильна, но не идеальна, - говорит проигравший южнокорейский игрок в го» . Мир ПК . Проверено 13 марта 2016 .
  79. ^ a b Гибни, Элизабет (2016). «Игроки в го реагируют на компьютерное поражение» . Природа . DOI : 10.1038 / nature.2016.19255 . S2CID 146868978 . 
  80. ^ Zastrow, Марк (15 марта 2016). «Как победа Google Go AI вызывает страх в Южной Корее» . Новый ученый . Проверено 18 марта 2016 .
  81. ^ JEE HEUN KAHNG; SE YOUNG LEE (15 марта 2016 г.). «Программа искусственного интеллекта Google превосходит южнокорейский игрок Го с результатом 4–1» . Рейтер . Проверено 18 марта 2016 .
  82. ^ a b Нил Коннор (11 марта 2016 г.). «Google AlphaGo« не может победить меня », - говорит гроссмейстер China Go» . Телеграф (Великобритания) . Проверено 13 марта 2016 .
  83. ^ "Китайский мастер го Ке Цзе говорит, что может проиграть AlphaGo: The DONG-A ILBO" . Проверено 17 марта 2016 года .
  84. ^ «... если сегодняшнее выступление было его истинной способностью, то оно не заслуживает играть против меня» . M.hankooki.com. 14 марта 2016 . Проверено 5 июня 2018 .
  85. ^ Чо Санг Хан (15 марта 2016). «В Сеуле Go Games пробуждают интерес (и беспокойство) по поводу искусственного интеллекта» . Нью-Йорк Таймс . Проверено 18 марта 2016 .
  86. ^ Тиан, Юаньдун; Чжу, Ян (2015). «Лучший компьютерный игрок с нейронной сетью и долгосрочным прогнозированием». arXiv : 1511.06410v1 [ cs.LG ].
  87. HAL 90210 (28 января 2016 г.). «Нет, вперед: Facebook не смог испортить большой день Google AI» . Хранитель . ISSN 0261-3077 . Дата обращения 1 февраля 2016 . 
  88. ^ "Лекция Стрейчи - доктор Демис Хассабис" . Новый прямой эфир . Проверено 17 марта 2016 года .
  89. ^ «Мастер Го Чо выигрывает серию из трех побед против ИИ японского производства» . The Japan Times Online . 24 ноября 2016 . Проверено 27 ноября +2016 .
  90. ^ «Люди наносят ответный удар: корейский мастер го превосходит ИИ в схватке с настольными играми» . CNET . Проверено 27 ноября +2016 .
  91. ^ «Иди и сделай несколько наркотиков Инженер» . www.theengineer.co.uk . Проверено 3 апреля 2018 .
  92. ^ https://www.alphagomovie.com/
  93. ^ «AlphaGo (2017)» . Тухлые помидоры . Проверено 5 июня 2018 .
  94. ^ "Go Ratings" . Перейти рейтинги . Проверено 5 июня 2018 .
  95. Винсент, Джеймс (27 ноября 2019 г.). «Бывший чемпион по го, побежденный DeepMind, уходит в отставку после объявления ИИ непобедимым» . Грань . Проверено 28 ноября 2019 .

Внешние ссылки [ править ]

  • Официальный веб-сайт
  • Вики AlphaGo в библиотеке Sensei , включая ссылки на игры AlphaGo
  • Страница AlphaGo , с архивом и играми
  • Расчетный рейтинг Alpha Go на 2017 год