Стохастическая грамматика - Stochastic grammar

А стохастическая грамматика (статистическая грамматика) это грамматическая структура с вероятностный понятие грамматичность:

Грамматика реализована как языковая модель. Разрешенные предложения хранятся в базе данных вместе с частотой встречаемости предложения.[1] Статистический обработка естественного языка использует стохастический, вероятностный и статистический методы, особенно для решения трудностей, которые возникают из-за того, что более длинные предложения двусмысленный при обработке с использованием реалистичных грамматик, дающих тысячи или миллионы возможных анализов. Методы устранения неоднозначности часто включают использование корпус и Марковские модели. «Вероятностная модель состоит из не вероятностной модели плюс некоторых числовых величин; неверно, что вероятностные модели по своей сути проще или менее структурны, чем не вероятностные модели».[2]

Примеры

Вероятностный метод обнаружения рифм реализован Hirjee & Brown.[3] в своем исследовании в 2013 году, чтобы найти внутренние и несовершенные пары рифм в рэп-текстах. Концепция адаптирована из выравнивание последовательностей техника с использованием BLOSUM (BLOcks SUучреждение Mатрикс). Они смогли обнаружить рифмы, не обнаруживаемые с помощью не вероятностных моделей.

Смотрите также

Рекомендации

  1. ^ Стив Янг; Геррит Блутоофт (14 марта 2013 г.). Корпоративные методы в обработке языка и речи. Springer Science & Business Media. С. 140–. ISBN  978-94-017-1183-8.
  2. ^ Джон Голдсмит. 2002. "Вероятностные модели грамматики: фонология как минимизация информации. »Фонологические этюды № 5: 21–46.
  3. ^ Хирджи, Хусейн; Браун, Дэниел (2013). «Использование автоматического распознавания рифм для характеристики стиля рифм в рэп-музыке» (PDF). Обзор эмпирического музыковедения.

дальнейшее чтение

  • Кристофер Д. Мэннинг, Хинрих Шютце: Основы статистической обработки естественного языка, MIT Press (1999), ISBN  978-0-262-13360-9.
  • Стефан Вермтер, Эллен Рилофф, Габриэле Шелер (ред.): Коннекционистский, статистический и символический подходы к обучению для обработки естественного языка, Springer (1996), ISBN  978-3-540-60925-4.
  • Пирани, Джанкарло, изд. Продвинутые алгоритмы и архитектуры для понимания речи. Vol. 1. Springer Science & Business Media, 2013.