Дэвид Сильвер (ученый-компьютерщик) - David Silver (computer scientist) - Wikipedia

Дэвид Сильвер (1976 г.р.) возглавляет обучение с подкреплением исследовательская группа в DeepMind и был ведущим исследователем AlphaGo, AlphaZero и со-руководить AlphaStar.

Он окончил Кембриджский университет в 1997 году с премией Аддисона-Уэсли и подружился с ним. Демис Хассабис пока там.[1] Впоследствии Сильвер стал соучредителем компании по производству видеоигр. Elixir Studios, где он был техническим директором и ведущим программистом, получив несколько наград за технологии и инновации.[1][2]

Сильвер вернулся в академию в 2004 г. Университет Альберты учиться на докторскую степень по обучению с подкреплением, где он стал соавтором алгоритмов, которые использовались в первых программах мастер-уровня 9 × 9 Go.[3][4] Его версия программы MoGo (в соавторстве с Сильвен Гелли) была одной из самых сильных программ Го на 2009 год.[5]

Сильвер был удостоен исследовательской стипендии Университета Королевского общества в 2011 году, а затем стал лектором в Университетский колледж Лондона, где он сейчас профессор.[6] Его лекции по обучению с подкреплением доступны на YouTube.[7] Серебро консультировалось для DeepMind с момента создания, присоединившись к штатным сотрудникам в 2013 году.

Его недавняя работа была сосредоточена на сочетании обучение с подкреплением с глубокое обучение, включая программу, которая учится играть в игры Atari прямо из пикселей.[8] Сильвер возглавил проект AlphaGo, кульминацией которого стала первая программа по победе над лучшим профессиональным игроком в полноразмерной игре Go.[9] AlphaGo впоследствии получил почетную профессиональную сертификацию 9 дан; и получил награду «Каннский лев» за инновации.[10] Затем он руководил разработкой AlphaZero, который использовал тот же ИИ, чтобы научиться играть в Го с нуля (обучаясь только самим, а не человеческими играми), прежде чем научиться играть в шахматы и сёги таким же образом, на более высоких уровнях, чем любая другая компьютерная программа.

Сильвер является одним из наиболее публикуемых сотрудников DeepMind, его цитировали более 57 000 раз, и он имеет час-индекс из 64.[11]

Он был награжден премией ACM 2019 в области вычислительной техники за прорыв в компьютерных играх.[12]

Рекомендации

  1. ^ а б Шид, Сэм. "Дэвид Сильвер: незамеченный герой и интеллектуальный центр Google DeepMind". Business Insider. Получено 26 сентября 2020.
  2. ^ «Чему ИИ, стоящий за AlphaGo, может научить нас, как быть людьми». Wired.com. Получено 17 мая 2016.
  3. ^ Дэвид, Сильвер (2009). «Обучение с подкреплением и поиск на основе моделирования в Computer Go». ЭРА. Дои:10.7939 / R39D8T.
  4. ^ Сильвен Гелли, Дэвид Сильвер (2008). «Достижение мастерского уровня игры в компьютерной игре 9 × 9» (PDF). Материалы двадцать третьей конференции AAAI по искусственному интеллекту.CS1 maint: использует параметр авторов (связь)
  5. ^ Стюарт Дж. Рассел, Питер Норвиг (2009). Искусственный интеллект: современный подход (3-е изд.). Prentice Hall.CS1 maint: использует параметр авторов (связь)
  6. ^ "CSML | Дэвид Сильвер". www.csml.ucl.ac.uk. Получено 27 мая 2017.
  7. ^ "Курс RL Дэвида Сильвера - Лекция 1: Введение в обучение с подкреплением". 13 мая 2015 - через YouTube.
  8. ^ Мних, Владимир; Кавукчуоглу, Корай; Сильвер, Дэвид; Русу, Андрей А .; Венесс, Джоэл; Bellemare, Marc G .; Грейвс, Алекс; Ридмиллер, Мартин; Фиджеланд, Андреас К. (26 февраля 2015 г.). «Контроль на уровне человека посредством глубокого обучения с подкреплением». Природа. 518 (7540): 529–533. Bibcode:2015Натура.518..529M. Дои:10.1038 / природа14236. ISSN  0028-0836. PMID  25719670. S2CID  205242740.
  9. ^ Сильвер, Дэвид; Хуанг, Аджа; Мэддисон, Крис Дж .; Гез, Артур; Сифре, Лоран; Дрише, Джордж ван ден; Шриттвизер, Джулиан; Антоноглоу, Иоаннис; Паннеершелвам, Веда; Ланкто, Марк; Дилеман, Сандер; Греве, Доминик; Нхам, Джон; Кальхбреннер, Нал; Суцкевер Илья; Лилликрап, Тимоти; Лич, Мадлен; Кавукчуоглу, Корай; Грэпель, Тор; Хассабис, Демис (28 января 2016 г.). «Освоение игры в го с помощью глубоких нейронных сетей и поиска по дереву». Природа. 529 (7587): 484–489. Bibcode:2016Натура.529..484S. Дои:10.1038 / природа16961. ISSN  0028-0836. PMID  26819042. S2CID  515925.закрытый доступ
  10. ^ «Google DeepMind AlphaGo в Великобритании выигрывает Гран-при за инновации». Получено 27 мая 2017.
  11. ^ "Дэвид Сильвер - цитирование ученых Google". Получено 13 октября 2020.
  12. ^ Ормонд, Джим. «Приз ACM в области вычислений присужден разработчику AlphaGo: Дэвид Сильвер получил признание за прорыв в компьютерных играх». acm.org. Получено 2 апреля 2020.