Сеть путаницы - Confusion network - Wikipedia
Эта статья дубликаты объем других статей, конкретно, confusion_matrix. (Сентябрь 2018 г.) |
А сеть путаницы (иногда называемый сеть путаницы слов или неофициально известный как колбаса) это обработка естественного языка метод, который объединяет результаты нескольких автоматическое распознавание речи или же машинный перевод системы.[1][2] Сети путаницы простые линейные ориентированные ациклические графы с тем свойством, что каждый путь от начального узла до конечного узла проходит через все остальные узлы. Набор слов, представленный ребрами между двумя узлами, называется набором путаницы. В машинном переводе определяющей характеристикой сетей путаницы является то, что они допускают множественный неоднозначный ввод, откладывая принятие окончательных решений по переводу до более поздних этапов обработки.[3][4] Этот подход используется в Открытый исходный код машинный перевод программного обеспечения Моисей[5] и проприетарный API перевода в IBM Bluemix Watson.[6]
Рекомендации
- ^ Рости, Антти-Вейкко И .; Чжан, Бин; Мацукас, Спирос; Шварц, Ричард (2008). «Постепенное согласование гипотез для построения беспорядочных сетей с применением комбинации систем машинного перевода». Материалы третьего семинара по статистическому машинному переводу. StatMT '08. Страудсбург, Пенсильвания, США: Ассоциация компьютерной лингвистики: 183–186. ISBN 9781932432091.
- ^ Матусов, Евгений; Уеффинг, Никола; Ней, Германн (2006). «Вычисление консенсусного перевода из нескольких систем машинного перевода с использованием улучшенного согласования гипотез». В Proc. EACL. CiteSeerX 10.1.1.483.5417.
- ^ Хоанг, Хиеу (2007). «Факторные модели перевода». В материалах совместной конференции 2007 г. по эмпирическим методам обработки естественного языка и вычислительному изучению естественного языка (EMNLP-CoNLL: 868–876. CiteSeerX 10.1.1.80.3572.
- ^ Коэн, Филипп; Хоанг, Хиеу; Береза, Александра; Каллисон-Берч, Крис; Федерико, Марчелло; Бертольди, Никола; Коуэн, Брук; Шен, Уэйд; Моран, Кристин (2007). «Моисей: набор инструментов с открытым исходным кодом для статистического машинного перевода». Материалы 45-го ежегодного собрания ACL по интерактивным плакатам и демонстрационным сессиям. ACL '07. Страудсбург, Пенсильвания, США: Ассоциация компьютерной лингвистики: 177–180. Дои:10.3115/1557769.1557821. S2CID 794019.
- ^ "Моисей - Моисей / ConfusionNetworks". www.statmt.org. Получено 2017-11-09.
- ^ «Служба IBM® Speech to Text предоставляет справочник по API | IBM Watson Developer Cloud». www.ibm.com. В архиве из оригинала на 2017-11-09. Получено 2017-11-09.
Значение достоверности, которое представляет собой нижнюю границу для идентификации гипотезы как возможной альтернативы слова (также известное как «сети путаницы»). Альтернативное слово рассматривается, если его достоверность больше или равна пороговому значению. Укажите вероятность от 0 до 1 включительно. Если вы опустите параметр, альтернативные слова не вычисляются.
Этот Информатика статья - это заглушка. Вы можете помочь Википедии расширяя это. |