Правила структуры фраз - Phrase structure rules

Правила структуры фраз являются разновидностью переписать правило используется для описания данного языка синтаксис и тесно связаны с ранними стадиями трансформационная грамматика, предложено Ноам Хомский в 1957 г.[1] Они используются для разрушения естественного язык предложение на составные части, также известные как синтаксические категории, включая обе лексические категории (части речи ) и фразовый категории. Грамматика, использующая правила структуры фраз, является разновидностью грамматика фразовой структуры. Обычно используемые правила структуры фраз действуют в соответствии с округ отношения, и грамматика, которая использует правила структуры фраз, поэтому грамматика округа; как таковой, он отличается от грамматики зависимостей, которые основаны на зависимость связь.[2]

Определение и примеры

Правила структуры фраз обычно имеют следующую форму:

это означает, что составляющая разделен на две части и . Вот некоторые примеры для английского языка:

Первое правило гласит: A S (предложение ) состоит из НП (словосочетание ) с последующим VP (фразовый глагол ). Второе правило гласит: Существительная фраза состоит из необязательного Det (определитель ), за которым следует N (существительное). Третье правило означает, что N (существительное) может предшествовать необязательной AP (прилагательное ), за которым следует необязательный PP (предложная фраза ). Круглые скобки указывают на необязательные составляющие.

Начиная с символа предложения S и последовательно применяя правила структуры фраз, наконец, применяя правила замены для замены фактических слов на абстрактные символы, можно сгенерировать множество правильных предложений английского языка (или любого другого языка, для которого определены правила). Если правила верны, то любое предложение, составленное таким образом, должно быть грамматически (синтаксически) правильный. Также следует ожидать, что правила будут синтаксически правильными, но семантически бессмысленные предложения, такие как следующий известный пример:

Бесцветные зеленые идеи яростно спят

Это предложение было построено Ноам Хомский в качестве иллюстрации того, что правила структуры фраз способны генерировать синтаксически правильные, но семантически неверные предложения. Правила структуры фраз разбивают предложения на составные части. Эти составляющие часто представлены как древовидные структуры (дендрограммы ). Дерево для предложения Хомского можно представить следующим образом:

Бесцветные зеленые идеи яростно спят.

Составной элемент - это любое слово или комбинация слов, в которых преобладает один узел. Таким образом, каждое отдельное слово является составной частью. Далее предмет NP Бесцветные зеленые идеи, минор НП зеленые идеи, а VP яростно спать являются составными частями. Правила структуры фраз и связанные с ними древовидные структуры являются формой немедленный составной анализ.

В трансформационная грамматика системы правил структуры фраз дополняются правилами преобразования, которые воздействуют на существующую синтаксическую структуру для создания новой (выполняя такие операции, как отрицание, пассивизация, так далее.). Эти преобразования не являются строго обязательными для генерации, так как предложения, которые они производят, могут быть сгенерированы только с помощью соответствующей расширенной системы правил структуры фраз, но преобразования обеспечивают большую экономию и позволяют отразить в грамматике важные отношения между предложениями.

Низходящий

Важным аспектом правил структуры фраз является то, что они рассматривают структуру предложения сверху вниз. Категория слева от стрелки представляет собой большую составляющую, а непосредственные составляющие справа от стрелки - меньшие составляющие. Составляющие последовательно разбиваются на части по мере продвижения вниз по списку правил структуры фраз для данного предложения. Такой взгляд на структуру предложения сверху вниз контрастирует с большой работой, проделанной в современном теоретическом синтаксисе. В Минимализм[3] например, структура предложения создается снизу вверх. Операция Объединить объединяет более мелкие составляющие для создания более крупных составляющих, пока не будет достигнута наибольшая составляющая (то есть предложение). В связи с этим теоретический синтаксис давно отказался от правил структуры фраз, хотя их важность для компьютерная лингвистика кажется, остается нетронутым.

Альтернативные подходы

Избирательная группа против зависимости

Правила структуры фраз, поскольку они обычно используются, приводят к представлению о структуре предложения, которая на основе округа. Таким образом, грамматики, использующие правила структуры фраз, являются грамматики округа (= грамматики фразовой структуры ), в отличие от грамматики зависимостей,[4] которые рассматривают структуру предложения как на основе зависимости. Это означает, что для того, чтобы правила структуры фраз вообще были применимы, нужно стремиться к пониманию структуры предложения на основе избирательных округов. Отношение избирательного округа - это соответствие "один-к-одному" или "нескольким". Для каждого слова в предложении есть по крайней мере один узел в синтаксической структуре, который соответствует этому слову. Отношение зависимости, напротив, является отношением «один к одному»; для каждого слова в предложении есть ровно один узел в синтаксической структуре, который соответствует этому слову. Различие иллюстрируется следующими деревьями:

Правила структуры фраз: постоянство против зависимости

Дерево избирателей слева может быть создано с помощью правил структуры фраз. Предложение S разбивается на все меньшие и меньшие составные части. Дерево зависимостей справа, напротив, не могло быть создано правилами структуры фраз (по крайней мере, в том виде, в котором они обычно интерпретируются).

Репрезентативные грамматики

Ряд теорий репрезентативной структуры фраз в грамматике никогда не признавали правила структуры фраз, но вместо этого преследовали понимание структуры предложения в терминах понятия схема. Здесь структуры фраз не являются производными от правил, которые объединяют слова, но из спецификации или экземпляра синтаксических схем или конфигураций, часто выражающих некоторый семантический контент независимо от конкретных слов, которые появляются в них. Этот подход, по сути, эквивалентен системе правил структуры фраз в сочетании с некомпозиционный семантический теории, поскольку грамматические формализмы, основанные на правилах перезаписи, обычно эквивалентны по мощности формам, основанным на подстановке в схемы.

Таким образом, в этом типе подхода, вместо того, чтобы быть производным от применения ряда правил структуры фраз, предложение Бесцветные зеленые идеи яростно спят будет сгенерирован путем заполнения слов в слоты схемы, имеющей следующую структуру:

[NP [ADJ N] VP [V] AP [ADV]]

И который выражал бы следующее концептуальное содержание:

X ДЕЛАЕТ Y В ОБРАЗЕ Z

Хотя они и не композиционные, такие модели монотонны. Этот подход широко развит в Строительная грамматика[5] и оказал некоторое влияние на Грамматика структуры фраз, управляемой головой[6] и Лексическая функциональная грамматика,[7] последние два явно квалифицируются как грамматики фразовой структуры.

Смотрите также

Заметки

  1. ^ Общие обсуждения правил структуры фраз см., Например, в Borsley (1991: 34ff.), Brinton (2000: 165), Falk (2001: 46ff.).
  2. ^ Грамматики зависимостей связаны, прежде всего, с работой Люсьена Тесньера (1959).
  3. ^ См., Например, Хомский (1995).
  4. ^ Наиболее полным источником по грамматике зависимостей является Ágel et al. (2003/6).
  5. ^ Относительно строительной грамматики см. Goldberg (2006).
  6. ^ Относительно грамматики структуры фраз, управляемых головой, см. Pollard and Sag (1994).
  7. ^ Относительно лексической функциональной грамматики см. Bresnan (2001).

использованная литература