Speechbot - Speechbot

SpeechBot был поисковая система за потоковое мультимедиа содержание[1] разработан в Compaq s (позже HP ) исследовательские лаборатории в Кембридж, Массачусетс и Австралия.[2] Compaq запустила веб-сайт на Streaming Media West 1999 в Сан-Хосе, Калифорния.[3][4][5] В Интернет-радио шоу проиндексировано SpeechBot включено Пестрый дурак, Свежий воздух, Разговор о нации, Программа доктора Лауры, и Страна грез с Арт Белл. К июню 2003 года служба проиндексировала более 17 000 часов мультимедийного контента. Веб-сайт был отключен в 2005 году после того, как HP закрыла свою исследовательскую лабораторию в Кембридже.[6]

Индексирование SpeechBot рабочий процесс вовлечена ферма Windows рабочие станции, которые получали потоковый контент; и Linux кластер Бег распознавание речи для расшифровки разговорного звука. В веб сервер, поисковый индекс и библиотека метаданных были размещены на AlphaServers Бег Tru64 UNIX.

Если стенограммы были уже доступны, затем они были выровнены по аудиопотоку; в противном случае приблизительная стенограмма была произведена с использованием распознавания речи. Распознаватель Calista, который использовался, был получен из Сфинкс-3. Из-за низкого качества потокового аудио в то время частота ошибок в словах был довольно высоким, но большинство поисковых запросов все еще позволяли получать релевантные совпадения.[7] Результаты поиска связаны с смещением в потоке, которое соответствует поисковой фразе, поэтому пользователям не нужно слушать всю программу, чтобы найти интересующий раздел.

Рекомендации

  1. ^ Гиббон, Дэвид С .; Чжу Лю (2008). Введение в поисковые системы видео. Берлин: Springer. С. 226–227. ISBN  978-3540793366.
  2. ^ Кэй, Байрон (10 января 2000 г.). «Австралийские исследования дают Compaq право голоса». Мир ПК.
  3. ^ «Compaq представляет первый веб-сайт для индексирования голосовых потоковых медиа; сайт исследований и разработок SpeechBot способствует лидерству в инновациях». PR Newswire. 7 декабря 1999 г.
  4. ^ Леунг, Линда (8 декабря 1999 г.). «Сайт Speechbot Compaq - это прежде всего Интернет». V3. Получено 18 июн 2012.
  5. ^ Нотесс, Грег (март 2000). "Обновление поисковой системы Интернета". ОНЛАЙН.
  6. ^ Прайс, Гэри (4 ноября 2005 г.). «Мультимедийный поиск: Speechbot больше не доступен». Поисковая система Watch.
  7. ^ Mang Shou, X .; Сандерсон, М .; Туфс, Н. (2004). «Связь количества ошибок по словам с рейтингом документа». Материалы семинара по интеллектуальному управлению мультимедийными знаниями на весеннем симпозиуме AAAI: 28–33. ISBN  1577351908.

дальнейшее чтение