Грамматика структуры фраз, управляемая головой - Head-driven phrase structure grammar

Грамматика структуры фраз, управляемая головой (HPSG) является сильно лексикализованным, грамматика на основе ограничений[1] разработан Карл Поллард и Иван Саг.[2][3] Это тип грамматика фразовой структуры, в отличие от грамматика зависимостей, и это непосредственный преемник грамматика обобщенной фразовой структуры. HPSG опирается на другие области, такие как Информатика (теория типов данных и представление знаний ) и использует Фердинанд де Соссюр представление о знак. Он использует единый формализм и организован по модульному принципу, что делает его привлекательным для обработка естественного языка.

Грамматика HPSG включает в себя принципы и правила грамматики, а также лексикон статьи, которые обычно не считаются принадлежащими грамматике. Формализм основан на лексикализме. Это означает, что лексика - это больше, чем просто список статей; он сам по себе богато структурирован. Отдельные записи отмечены типами. Типы образуют иерархию. Ранние версии грамматики были очень лексикализованы с использованием нескольких грамматических правил (схем). Более поздние исследования имели тенденцию добавлять больше и более богатых правил, становясь более похожими на строительная грамматика.[4]

Основным типом HPSG является знак. Слова и фразы два разных подтипа знака. Слово имеет две особенности: [PHON] (звук, фонетический форма) и [SYNSEM]синтаксический и семантический информация), оба из которых разделены на подфункции. Знаки и правила оформляются в виде напечатанный структуры функций.

Образец грамматики

HPSG генерирует строки, комбинируя знаки, которые определяются их положением в иерархии типов и их внутренней структурой признаков, представленной матрицы значений атрибутов (ПТрМ).[3][5] Функции принимают типы или списки типов в качестве своих значений, и эти значения, в свою очередь, могут иметь свою собственную структуру функций. Грамматические правила в значительной степени выражаются через знаки ограничений, накладываемые друг на друга. Структура признаков знака описывает его фонологические, синтаксические и семантические свойства. В общепринятых обозначениях АВМ пишутся с элементами в верхнем регистре, а типы в нижнем регистре курсивом. Пронумерованные индексы в AVM представляют идентичные значения токенов.

В упрощенном AVM для слова (в данном случае глагола, а не существительного, как в «приятных прогулках на выходные») «прогулки» ниже категориальная информация глагола (CAT) разделена на характеристики, которые его описывают (HEAD) и особенности, которые описывают его аргументы (ВАЛЕНЦИЯ).

АВМ для прогулок

«Прогулки» - знак типа слово с головой типа глагол. Как непереходный глагол, "прогулки" не имеет дополнения, но требует подлежащего, который является существительным в единственном числе от третьего лица. Семантическое значение подлежащего (СОДЕРЖАНИЕ) коиндексируется с единственным аргументом глагола (человек, совершающий ходьбу). Следующая AVM для «она» представляет собой знак со значением SYNSEM, который может удовлетворить эти требования.

She-avm.png

Знаки типа фраза объединиться с одним или несколькими дочерними элементами и распространять информацию вверх. Следующий AVM кодирует правило немедленного доминирования для заглавная-фраза, для которого требуются два дочерних элемента: главный дочерний элемент (глагол) и дочерний элемент без головы, который удовлетворяет ограничениям SUBJ глагола.

Head-subj-avm.png

Конечным результатом является знак с заголовком глагола, пустыми элементами подкатегории и фонологическим значением, которое упорядочивает двух детей.

Хотя фактическая грамматика HPSG полностью состоит из структур признаков, лингвисты часто используют деревья для представления объединения знаков, где эквивалентная AVM была бы громоздкой.

Head-subj-tree.png

Реализации

Разные парсеры на основе формализма HPSG были написаны и в настоящее время исследуются возможности оптимизации. Пример системы анализа Немецкий фразы обеспечивается Freie Universität Berlin.[6] Кроме того, CoreGram[7] проект Группы грамматики Freie Universität Berlin предоставляет грамматики с открытым исходным кодом, которые были реализованы в системе TRALE. В настоящее время существуют грамматики для Немецкий,[8] Датский,[9] Мандаринский китайский,[10] Мальтийский,[11] и Персидский[12] которые имеют общее ядро ​​и являются общедоступными.

Большие HPSG-грамматики различных языков разрабатываются в рамках Deep Linguistic Processing with HPSG Initiative (DELPH-IN ).[13] Грамматики английского языка с широким охватом,[14] Немецкий,[15] и Японский[16] доступны по лицензии с открытым исходным кодом. Эти грамматики могут использоваться с множеством взаимосовместимых анализаторов HPSG с открытым исходным кодом: LKB, ДОМАШНИЙ ПИТОМЕЦ,[17] Туз,[18] и согласны.[19] Все они производят семантические представления в формате «Семантика минимальной рекурсии», MRS.[20] Декларативный характер формализма HPSG означает, что эти вычислительные грамматики обычно могут использоваться как для разбор и поколение (создание поверхностных строк из семантических входов). Treebanks, также распространяется DELPH-IN, используются для разработки и тестирования грамматик, а также для обучения моделей ранжирования для принятия решения о правдоподобных интерпретациях при синтаксическом анализе (или реализации при генерации).

Эндзю это свободно доступный вероятностный анализатор HPSG с широким охватом для английского языка, разработанный лабораторией Tsujii в Токийский университет в Япония.[21]

Смотрите также

Рекомендации

  1. ^ «HPSG».
  2. ^ Поллард, Карл и Иван А. Саг. 1987. Информационный синтаксис и семантика. Том 1. Основы. Лекционные заметки CLSI 13.
  3. ^ а б Поллард, Карл; Иван А. Саг. (1994). Грамматика структуры фраз, управляемая головой. Чикаго: Издательство Чикагского университета.
  4. ^ Саг, Иван Анатольевич 1997. Конструкции английских относительных придаточных предложений[постоянная мертвая ссылка ]. Журнал лингвистики. 33,2: 431-484
  5. ^ Саг, Иван А .; Томас Вазоу; И Эмили Бендер. (2003). Синтаксическая теория: формальное введение. 2-е изд. Чикаго: Издательство Чикагского университета.
  6. ^ Вавилонская система: интерактивная HPSG
  7. ^ Проект CoreGram
  8. ^ Берлиграм
  9. ^ DanGram
  10. ^ Китайский
  11. ^ Мальтийский
  12. ^ Персидский
  13. ^ DELPH-IN: глубокая обработка с открытым исходным кодом
  14. ^ Грамматика и лексика английских ресурсов
  15. ^ Бертольд Кризманн
  16. ^ JacyTop - глубокая лингвистическая обработка с HPSG (DELPH-IN)
  17. ^ Парсер DELPH-IN PET
  18. ^ Ace: механизм ограничения ответов
  19. ^ согласен грамматическая инженерия
  20. ^ Копестейк, А., Фликингер, Д., Поллард, К., & Саг, И. А. (2005). Семантика минимальной рекурсии: введение. Исследования языка и вычислений, 3 (2-3), 281-332.
  21. ^ Tsuji Lab: домашняя страница парсера Enju В архиве 2010-03-07 на Wayback Machine (получено 24 ноября 2009 г.)

дальнейшее чтение

внешняя ссылка