Дэвид Сильвер (ученый-компьютерщик) - David Silver (computer scientist) - Wikipedia

Дэвид Сильвер (1976 г.р.) возглавляет обучение с подкреплением исследовательская группа в DeepMind и был ведущим исследователем AlphaGo, AlphaZero и со-руководить AlphaStar.

Он окончил Кембриджский университет в 1997 году с премией Аддисона-Уэсли и подружился с ним. Демис Хассабис пока там.^[1] Впоследствии Сильвер стал соучредителем компании по производству видеоигр. Elixir Studios, где он был техническим директором и ведущим программистом, получив несколько наград за технологии и инновации.^[1]^[2]

Сильвер вернулся в академию в 2004 г. Университет Альберты учиться на докторскую степень по обучению с подкреплением, где он стал соавтором алгоритмов, которые использовались в первых программах мастер-уровня 9 × 9 Go.^[3]^[4] Его версия программы MoGo (в соавторстве с Сильвен Гелли) была одной из самых сильных программ Го на 2009 год.^[5]

Сильвер был удостоен исследовательской стипендии Университета Королевского общества в 2011 году, а затем стал лектором в Университетский колледж Лондона, где он сейчас профессор.^[6] Его лекции по обучению с подкреплением доступны на YouTube.^[7] Серебро консультировалось для DeepMind с момента создания, присоединившись к штатным сотрудникам в 2013 году.

Его недавняя работа была сосредоточена на сочетании обучение с подкреплением с глубокое обучение, включая программу, которая учится играть в игры Atari прямо из пикселей.^[8] Сильвер возглавил проект AlphaGo, кульминацией которого стала первая программа по победе над лучшим профессиональным игроком в полноразмерной игре Go.^[9] AlphaGo впоследствии получил почетную профессиональную сертификацию 9 дан; и получил награду «Каннский лев» за инновации.^[10] Затем он руководил разработкой AlphaZero, который использовал тот же ИИ, чтобы научиться играть в Го с нуля (обучаясь только самим, а не человеческими играми), прежде чем научиться играть в шахматы и сёги таким же образом, на более высоких уровнях, чем любая другая компьютерная программа.

Сильвер является одним из наиболее публикуемых сотрудников DeepMind, его цитировали более 57 000 раз, и он имеет час-индекс из 64.^[11]

Он был награжден премией ACM 2019 в области вычислительной техники за прорыв в компьютерных играх.^[12]

Рекомендации

^ ^а ^б Шид, Сэм. "Дэвид Сильвер: незамеченный герой и интеллектуальный центр Google DeepMind". Business Insider. Получено 26 сентября 2020.
^ «Чему ИИ, стоящий за AlphaGo, может научить нас, как быть людьми». Wired.com. Получено 17 мая 2016.
^ Дэвид, Сильвер (2009). «Обучение с подкреплением и поиск на основе моделирования в Computer Go». ЭРА. Дои:10.7939 / R39D8T.
^ Сильвен Гелли, Дэвид Сильвер (2008). «Достижение мастерского уровня игры в компьютерной игре 9 × 9» (PDF). Материалы двадцать третьей конференции AAAI по искусственному интеллекту.CS1 maint: использует параметр авторов (связь)
^ Стюарт Дж. Рассел, Питер Норвиг (2009). Искусственный интеллект: современный подход (3-е изд.). Prentice Hall.CS1 maint: использует параметр авторов (связь)
^ "CSML | Дэвид Сильвер". www.csml.ucl.ac.uk. Получено 27 мая 2017.
^ "Курс RL Дэвида Сильвера - Лекция 1: Введение в обучение с подкреплением". 13 мая 2015 - через YouTube.
^ Мних, Владимир; Кавукчуоглу, Корай; Сильвер, Дэвид; Русу, Андрей А .; Венесс, Джоэл; Bellemare, Marc G .; Грейвс, Алекс; Ридмиллер, Мартин; Фиджеланд, Андреас К. (26 февраля 2015 г.). «Контроль на уровне человека посредством глубокого обучения с подкреплением». Природа. 518 (7540): 529–533. Bibcode:2015Натура.518..529M. Дои:10.1038 / природа14236. ISSN 0028-0836. PMID 25719670. S2CID 205242740.
^ Сильвер, Дэвид; Хуанг, Аджа; Мэддисон, Крис Дж .; Гез, Артур; Сифре, Лоран; Дрише, Джордж ван ден; Шриттвизер, Джулиан; Антоноглоу, Иоаннис; Паннеершелвам, Веда; Ланкто, Марк; Дилеман, Сандер; Греве, Доминик; Нхам, Джон; Кальхбреннер, Нал; Суцкевер Илья; Лилликрап, Тимоти; Лич, Мадлен; Кавукчуоглу, Корай; Грэпель, Тор; Хассабис, Демис (28 января 2016 г.). «Освоение игры в го с помощью глубоких нейронных сетей и поиска по дереву». Природа. 529 (7587): 484–489. Bibcode:2016Натура.529..484S. Дои:10.1038 / природа16961. ISSN 0028-0836. PMID 26819042. S2CID 515925.
^ «Google DeepMind AlphaGo в Великобритании выигрывает Гран-при за инновации». Получено 27 мая 2017.
^ "Дэвид Сильвер - цитирование ученых Google". Получено 13 октября 2020.
^ Ормонд, Джим. «Приз ACM в области вычислений присужден разработчику AlphaGo: Дэвид Сильвер получил признание за прорыв в компьютерных играх». acm.org. Получено 2 апреля 2020.

Эта биографическая статья, относящаяся к специалисту по компьютерам, является заглушка. Вы можете помочь Википедии расширяя это.

[Unsung_Hero-1] а ^б Шид, Сэм. "Дэвид Сильвер: незамеченный герой и интеллектуальный центр Google DeepMind". Business Insider. Получено 26 сентября 2020.

[MyUser_Wired.com_May_17_2016c-2] «Чему ИИ, стоящий за AlphaGo, может научить нас, как быть людьми». Wired.com. Получено 17 мая 2016.

[3] Дэвид, Сильвер (2009). «Обучение с подкреплением и поиск на основе моделирования в Computer Go». ЭРА. Дои:10.7939 / R39D8T.

[4] Сильвен Гелли, Дэвид Сильвер (2008). «Достижение мастерского уровня игры в компьютерной игре 9 × 9» (PDF). Материалы двадцать третьей конференции AAAI по искусственному интеллекту.CS1 maint: использует параметр авторов (связь)

[5] Стюарт Дж. Рассел, Питер Норвиг (2009). Искусственный интеллект: современный подход (3-е изд.). Prentice Hall.CS1 maint: использует параметр авторов (связь)

[6] "CSML | Дэвид Сильвер". www.csml.ucl.ac.uk. Получено 27 мая 2017.

[7] "Курс RL Дэвида Сильвера - Лекция 1: Введение в обучение с подкреплением". 13 мая 2015 - через YouTube.

[8] Мних, Владимир; Кавукчуоглу, Корай; Сильвер, Дэвид; Русу, Андрей А .; Венесс, Джоэл; Bellemare, Marc G .; Грейвс, Алекс; Ридмиллер, Мартин; Фиджеланд, Андреас К. (26 февраля 2015 г.). «Контроль на уровне человека посредством глубокого обучения с подкреплением». Природа. 518 (7540): 529–533. Bibcode:2015Натура.518..529M. Дои:10.1038 / природа14236. ISSN 0028-0836. PMID 25719670. S2CID 205242740.

[9] Сильвер, Дэвид; Хуанг, Аджа; Мэддисон, Крис Дж .; Гез, Артур; Сифре, Лоран; Дрише, Джордж ван ден; Шриттвизер, Джулиан; Антоноглоу, Иоаннис; Паннеершелвам, Веда; Ланкто, Марк; Дилеман, Сандер; Греве, Доминик; Нхам, Джон; Кальхбреннер, Нал; Суцкевер Илья; Лилликрап, Тимоти; Лич, Мадлен; Кавукчуоглу, Корай; Грэпель, Тор; Хассабис, Демис (28 января 2016 г.). «Освоение игры в го с помощью глубоких нейронных сетей и поиска по дереву». Природа. 529 (7587): 484–489. Bibcode:2016Натура.529..484S. Дои:10.1038 / природа16961. ISSN 0028-0836. PMID 26819042. S2CID 515925.

[10] «Google DeepMind AlphaGo в Великобритании выигрывает Гран-при за инновации». Получено 27 мая 2017.

[MyUser_Https:_May_17_2016c-11] "Дэвид Сильвер - цитирование ученых Google". Получено 13 октября 2020.

[12] Ормонд, Джим. «Приз ACM в области вычислений присужден разработчику AlphaGo: Дэвид Сильвер получил признание за прорыв в компьютерных играх». acm.org. Получено 2 апреля 2020.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]