Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Ричард С. Саттон - канадский ученый-компьютерщик . В настоящее время он является выдающимся ученым-исследователем DeepMind и профессором информатики в Университете Альберты . Саттон считается одним из отцов-основателей современного компьютерного обучения с подкреплением , [1] внесший несколько значительных вкладов в эту область, в том числе методы обучения временной разнице и методы градиента политики.

Жизнь и образование [ править ]

Ричард Саттон родился в Огайо и вырос в Оук - Брук, штат Иллинойс , в пригороде в Чикаго .

Sutton получил степень бакалавра в психологии из Стэнфордского университета в 1978 году , прежде чем принимать MS (1980) и степень доктора философии (1984) по информатике из Массачусетского университета в Амхерсте под руководством Эндрю Барто . Его докторская диссертация « Временное присвоение кредитов в обучении с подкреплением» представила архитектуры «актер-критик» и временное присвоение кредитов . [2]

Карьера [ править ]

В 1984 году Саттон работал научным сотрудником в Массачусетском университете.

С 1985 по 1994 год он был главным техническим сотрудником лаборатории компьютеров и интеллектуальных систем в GTE в Уолтеме, Массачусетс . В 1995 году он вернулся в Массачусетский университет в качестве старшего научного сотрудника.

С 1998 по 2002 год Саттон работал в лаборатории Шеннона AT&T в Флорхэм-парке, штат Нью-Джерси, в качестве главного технического сотрудника отдела искусственного интеллекта.

С 2003 года он был профессором информатики в Университете Альберты . До 2018 года он руководил лабораторией обучения с подкреплением и искусственного интеллекта.

Сохранив пост профессора, Саттон присоединился к Deepmind в июне 2017 года в качестве выдающегося ученого-исследователя и соучредителя нового офиса в Эдмонтоне . [2] [3]

Саттон стал гражданином Канады в 2015 году и отказался от гражданства США в 2017 году.

Избранные публикации [ править ]

  • Саттон, Р.С., Барто, А.Г., Обучение с подкреплением: Введение . MIT Press, 1998. Также переведено на японский и русский языки. Второе издание MIT Press 2018.
  • Миллер, В. Т., Саттон, Р. С., Вербос, П. Дж. (Ред.), Нейронные сети для управления . MIT Press, 1991.
  • Саттон, Р.С. (ред.), Обучение с подкреплением. Перепечатка специального выпуска журнала Machine Learning Journal. Kluwer Academic Press, 1992 г.

Награды и награды [ править ]

Саттон является членом Ассоциации по развитию искусственного интеллекта (AAAI) с 2001 года. [4] В 2003 году он получил президентскую премию Международного общества нейронных сетей [5], а в 2013 году - премию Университета за выдающиеся достижения в области исследований. Массачусетса Амхерст . [6]

Назначение Саттона членом AAAI гласит: [4]

За значительный вклад во многие темы машинного обучения, включая обучение с подкреплением, методы временного различия и нейронные сети.

Ссылки [ править ]

  1. ^ «Эксклюзив: интервью с Ричем Саттоном, отцом обучения с подкреплением» . 2018-01-11. Архивировано из оригинала на 2018-01-11 . Проверено 17 декабря 2018 .
  2. ^ Б «Краткая биография Ричарда Sutton» . incompleteideas.net . Проверено 17 декабря 2018 .
  3. ^ «DeepMind расширяется в Канаду с новым исследовательским офисом в Эдмонтоне, Альберта» . DeepMind . Проверено 17 декабря 2018 .
  4. ^ a b «Избранные стипендиаты AAAI» . www.aaai.org . Проверено 17 декабря 2018 .
  5. ^ «Получатели награды INNS» . www.inns.org . Проверено 17 декабря 2018 .
  6. ^ «Выдающиеся получатели награды за достижения и пропагандистскую деятельность» . Колледж информации и компьютерных наук Массачусетского университета в Амхерсте . 2010-10-05 . Проверено 17 декабря 2018 .

Внешние ссылки [ править ]

  • Домашняя страница Ричарда Саттона
  • Публикации Ричарда С. Саттона, проиндексированные Google Scholar