Сеть путаницы - Confusion network - Wikipedia

А сеть путаницы (иногда называемый сеть путаницы слов или неофициально известный как колбаса) это обработка естественного языка метод, который объединяет результаты нескольких автоматическое распознавание речи или же машинный перевод системы.[1][2] Сети путаницы простые линейные ориентированные ациклические графы с тем свойством, что каждый путь от начального узла до конечного узла проходит через все остальные узлы. Набор слов, представленный ребрами между двумя узлами, называется набором путаницы. В машинном переводе определяющей характеристикой сетей путаницы является то, что они допускают множественный неоднозначный ввод, откладывая принятие окончательных решений по переводу до более поздних этапов обработки.[3][4] Этот подход используется в Открытый исходный код машинный перевод программного обеспечения Моисей[5] и проприетарный API перевода в IBM Bluemix Watson.[6]

Пример беспорядочной сети

Рекомендации

  1. ^ Рости, Антти-Вейкко И .; Чжан, Бин; Мацукас, Спирос; Шварц, Ричард (2008). «Постепенное согласование гипотез для построения беспорядочных сетей с применением комбинации систем машинного перевода». Материалы третьего семинара по статистическому машинному переводу. StatMT '08. Страудсбург, Пенсильвания, США: Ассоциация компьютерной лингвистики: 183–186. ISBN  9781932432091.
  2. ^ Матусов, Евгений; Уеффинг, Никола; Ней, Германн (2006). «Вычисление консенсусного перевода из нескольких систем машинного перевода с использованием улучшенного согласования гипотез». В Proc. EACL. CiteSeerX  10.1.1.483.5417.
  3. ^ Хоанг, Хиеу (2007). «Факторные модели перевода». В материалах совместной конференции 2007 г. по эмпирическим методам обработки естественного языка и вычислительному изучению естественного языка (EMNLP-CoNLL: 868–876. CiteSeerX  10.1.1.80.3572.
  4. ^ Коэн, Филипп; Хоанг, Хиеу; Береза, Александра; Каллисон-Берч, Крис; Федерико, Марчелло; Бертольди, Никола; Коуэн, Брук; Шен, Уэйд; Моран, Кристин (2007). «Моисей: набор инструментов с открытым исходным кодом для статистического машинного перевода». Материалы 45-го ежегодного собрания ACL по интерактивным плакатам и демонстрационным сессиям. ACL '07. Страудсбург, Пенсильвания, США: Ассоциация компьютерной лингвистики: 177–180. Дои:10.3115/1557769.1557821. S2CID  794019.
  5. ^ "Моисей - Моисей / ConfusionNetworks". www.statmt.org. Получено 2017-11-09.
  6. ^ «Служба IBM® Speech to Text предоставляет справочник по API | IBM Watson Developer Cloud». www.ibm.com. В архиве из оригинала на 2017-11-09. Получено 2017-11-09. Значение достоверности, которое представляет собой нижнюю границу для идентификации гипотезы как возможной альтернативы слова (также известное как «сети путаницы»). Альтернативное слово рассматривается, если его достоверность больше или равна пороговому значению. Укажите вероятность от 0 до 1 включительно. Если вы опустите параметр, альтернативные слова не вычисляются.