Тони Робинсон (распознавание речи) - Tony Robinson (speech recognition)

Тони Робинсон пионер в применении повторяющиеся нейронные сети к распознавание речи,[1][2][3] быть одним из первых, кто открыл практические возможности глубоких нейронных сетей и то, как их можно использовать для улучшения распознавания речи.[4] Впервые он опубликовал материалы по этой теме, когда учился на докторскую степень в Кембриджском университете в 1980-х годах.[5] С тех пор он опубликовал более сотни широко цитируемых научных работ по автоматическому распознаванию речи (ASR).[6]

В 1995 году Робинсон основал SoftSound Ltd, компанию по разработке речевых технологий, которую приобрела пионер поисковой системы. Автономия с целью использования технологии для упрощения поиска неструктурированных видео и голосовых данных. Робинсон помог создать самую быструю систему распознавания речи с большим словарным запасом, доступную в то время, и работающую на большем количестве языков, чем любая другая модель, путем разработки и сосредоточения внимания на повторяющихся нейронных сетях.[7]

С 2008 по 2010 год Робинсон был директором группы Advanced Speech Group в SpinVox, поставщик услуг преобразования речи в текст для операторских рынков, включая беспроводную связь, VoIP и кабельное телевидение. Их система автоматического распознавания речи (ASR) какое-то время использовалась более миллиона раз в день, и впоследствии SpinVox была приобретена глобальной компанией, занимающейся технологией речи. Нюанс.

Тони Робинсон также был основателем Speechmatics которая запустила свои облачные сервисы распознавания речи в 2012 году. Впоследствии Speechmatics объявила о значительном технологическом прорыве в ускоренном моделировании нового языка в конце 2017 года.[8] Робинсон продолжает публиковать статьи о быстро развивающихся технологиях распознавания речи, особенно в области статистического моделирования языков.[9]

Рекомендации

  1. ^ Робинсон, Тони; Фолсайд, Фрэнк (июль 1991 г.). «Система распознавания речи в сети распространения повторяющихся ошибок». Компьютерная речь и язык. 5 (3): 259–274. Дои:10.1016 / 0885-2308 (91) 90010-Н.
  2. ^ Робинсон, Тони (1996). «Использование рекуррентных нейронных сетей в распознавании непрерывной речи». Автоматическое распознавание речи и говорящего. Международная серия Kluwer в области инженерии и информатики. 355. С. 233–258. CiteSeerX  10.1.1.364.7237. Дои:10.1007/978-1-4613-1367-0_10. ISBN  978-1-4612-8590-8.
  3. ^ Уэйкфилд, Джейн (14 марта 2008 г.). «Распознавание речи переходит в текст». Новости BBC. Получено 2020-08-24.
  4. ^ Робинсон, Тони (сентябрь 1993 г.). «Основанная на нейронной сети, независимая от говорящего, система распознавания непрерывной речи с большим словарным запасом: проект WERNICKE». Третья европейская конференция по речевой коммуникации и технологиям. 1: 1941–1944. Получено 17 мая 2018.
  5. ^ Робинсон, Энтони Джон (июнь 1989 г.). «Сети с динамическим распространением ошибок». Докторская диссертация. Получено 17 мая 2018.
  6. ^ Робинсон, Тони. «Тони Робинсон - Профиль». ResearchGate. Получено 17 мая 2018.
  7. ^ Робинсон, Тони; Хохберг, Майк; Renals, Стив (1996). Использование рекуррентных нейронных сетей для распознавания непрерывной речи. Автоматическое распознавание речи и говорящего. Международная серия Kluwer в области инженерии и информатики. 355. С. 233–258. CiteSeerX  10.1.1.364.7237. Дои:10.1007/978-1-4613-1367-0_10. ISBN  978-1-4612-8590-8.
  8. ^ Орловский, Андрей. «Британский пионер нейронных сетей снова произвел революцию в распознавании речи». Реестр. Публикация ситуации. Получено 17 мая 2018.
  9. ^ Челба, Киприан; Миколов, Томас; Шустер, Майк (2013). Тест «Один миллиард слов» для измерения прогресса в статистическом языковом моделировании (отчет). Библиотека Корнельского университета. arXiv:1312.3005.