Обработка предложений - Sentence processing - Wikipedia

Обработка предложений происходит всякий раз, когда читатель или слушатель обрабатывает языковое высказывание изолированно или в контекст разговора или текста. Многие исследования процесса понимания человеческого языка были сосредоточены на чтении отдельных высказываний (предложений) без контекста. Обширные исследования показали, что на понимание языка влияет контекст, предшествующий данному высказыванию, а также многие другие факторы.

Двусмысленность

Понимание предложений имеет дело с двусмысленностью[1] в устных и письменных высказываниях, например лексический, структурный, и семантическая двусмысленность. Неоднозначность встречается повсеместно, но люди обычно разрешают ее так легко, что даже не замечают ее. Например, предложение Время летит как стрела имеет (по крайней мере) интерпретации Время летит так быстро, как стрела, Особый вид мух, называемый мухой времени, любит стрелы и Измеряйте скорость мух, как стрелу.. Обычно читателям будет известна только первая интерпретация. Однако образованные читатели спонтанно думают о стрела времени но подавите эту интерпретацию, потому что она отклоняется от исходной фразы, а височная доля действует как переключатель.

Случаи двусмысленности можно классифицировать как местный или же Глобальный двусмысленность. Предложение является глобально неоднозначным, если у него есть две различные интерпретации. Примеры - предложения вроде Кто-то застрелил слугу актрисы, находившуюся на балконе (это служанка или актриса была на балконе?) или Полицейский гнался за преступником на быстрой машине (у копа или у преступника была быстрая машина?). Понимающие могут иметь предпочтительную интерпретацию для любого из этих случаев, но синтаксически и семантически нельзя исключать ни одну из возможных интерпретаций.

Локальные двусмысленности сохраняются только в течение короткого промежутка времени, когда высказывание слышно или записывается, и разрешаются в ходе высказывания, поэтому полное высказывание имеет только одну интерпретацию. Примеры включают такие предложения, как Критик написал, что книга была поучительной, что неоднозначно при Критик написал книгу встречался, но было поучительно Остается обработать. Затем предложение может заканчиваться заявлением, что критик является автором книги, или может продолжаться, поясняя, что критик что-то написал о книге. Неопределенность заканчивается на было поучительно, что определяет правильность второй альтернативы.

Когда читатели обрабатывают локальную двусмысленность, они сразу же выбирают одну из возможных интерпретаций, не дожидаясь, чтобы услышать или прочитать больше слов, которые могут помочь решить, какая интерпретация верна (поведение называется инкрементная обработка). Если читатели удивлены поворотом предложения, обработка замедляется и заметна, например, во времени чтения. Поэтому локально неоднозначные предложения использовались в качестве тестовых примеров для исследования влияния ряда различных факторов на обработку человеческих предложений. Если фактор помогает читателям избежать затруднений, очевидно, что этот фактор играет важную роль в обработке предложения.

Теории

Экспериментальные исследования породили большое количество гипотез об архитектуре и механизмах понимания предложений. Такие вопросы, как модульность в сравнении с интерактивной обработкой и последовательное или параллельное вычисление анализов, были теоретическим разделением в этой области.

Архитектурные вопросы

Модульное против интерактивного

Модульное представление обработки предложений предполагает, что каждый фактор, участвующий в обработке предложения, вычисляется в своем собственном модуле, который имеет ограниченные средства связи с другими модулями. Например, создание синтаксического анализа происходит без ввода семантического анализа или контекстно-зависимой информации, которая обрабатывается отдельно. Распространенное предположение о модульных счетах - это прямая связь архитектура, в которой выходные данные одного шага обработки передаются следующему этапу без механизмов обратной связи, которые позволили бы скорректировать выходные данные первого модуля. Синтаксическая обработка обычно считается самым основным этапом анализа, который используется для семантической обработки и включения другой информации. Отдельный мысленный модуль анализирует предложения, и сначала происходит лексический доступ. Затем рассматривается одна синтаксическая гипотеза. Нет никакого первоначального влияния значения или семантики. Обработка предложений поддерживается временно-фронтальной сетью. Внутри сети временные области обслуживают аспекты идентификации, а фронтальные области - построение синтаксических и семантических отношений. Временной анализ активации мозга в этой сети поддерживает модели, ориентированные на синтаксис, потому что они показывают, что построение синтаксической структуры предшествует семантическим процессам и что они взаимодействуют только на более поздней стадии.[2][3]

Интерактивные учетные записи предполагают, что вся доступная информация обрабатывается одновременно и может немедленно повлиять на расчет окончательного анализа. В интерактивной модели обработки предложений нет отдельного модуля для парсинга. Лексический доступ, присвоение синтаксической структуры и присвоение значения происходят одновременно, параллельно. Одновременно можно рассматривать несколько синтаксических гипотез. Интерактивная модель демонстрирует интерактивное взаимодействие между структурным, лексическим и фонетическим уровнями обработки предложений. Каждое слово, когда оно слышно в контексте нормального дискурса, немедленно вводится в систему обработки на всех уровнях описания и одновременно анализируется на всех этих уровнях в свете любой информации, доступной на каждом уровне в этот момент обработка приговора.[4] Интерактивные модели языковой обработки предполагают, что информация течет как снизу вверх, так и сверху вниз, поэтому на представления, сформированные на каждом уровне, могут влиять как более высокие, так и более низкие уровни. Фреймворк, называемый интерактивным фреймворком активации, который среди прочего включает это ключевое предположение, в том числе предположение, что влияния из разных источников комбинируются нелинейно. Нелинейность означает, что информация, которая может иметь решающее значение при некоторых обстоятельствах, может иметь незначительный эффект или не иметь никакого эффекта при других условиях. В интерактивной среде активации знания, которые направляют обработку, хранятся в связях между устройствами на одном и том же и смежных уровнях. Блоки обработки, которые они подключают, могут получать входные данные из ряда различных источников, что позволяет знаниям, направляющим обработку, быть полностью локальными, в то же время позволяя результатам обработки на одном уровне влиять на обработку на других уровнях, как над и под. Основное предположение структуры - то, что взаимодействия обработки всегда взаимны; именно эта двунаправленная характеристика делает систему интерактивной. Двунаправленные возбуждающие взаимодействия между уровнями допускают одновременное взаимное ограничение между соседними уровнями, а двунаправленные тормозящие взаимодействия внутри уровня допускают конкуренцию между взаимно несовместимыми интерпретациями части входных данных. Межуровневые возбуждающие взаимодействия отражаются в моделях как двусторонние возбуждающие связи между взаимно совместимыми процессорами. Синтаксическая двусмысленность на самом деле основана на лексическом уровне. Кроме того, более поздние исследования с более чувствительными машинами отслеживания взгляда показали ранние контекстные эффекты. Частота и контекстная информация будут влиять на активацию альтернатив, даже если они разрешены в пользу простой интерпретации. Конструктивная простота сочетается с частотой, что противоречит теории садовых дорожек.[5]

Последовательный против параллельного

Серийные отчеты предполагают, что люди сначала строят только одну из возможных интерпретаций и пробуют другую только в том случае, если первая оказывается неверной. Параллельные счета предполагают одновременное построение нескольких интерпретаций. Чтобы объяснить, почему понимающие обычно осведомлены только об одном возможном анализе того, что они слышат, модели могут предположить, что все анализы ранжированы, а самый высокий ранжирован.

Модели

Существует ряд влиятельных моделей обработки человеческих предложений, основанных на различных комбинациях архитектурных решений.

Модель садовой дорожки

Модель садовой дорожки (Фрейзер 1987 ) представляет собой серийную модульную модель разбора. Он предлагает, чтобы один синтаксический анализ был построен синтаксическим модулем. Контекстные и семантические факторы влияют на обработку на более позднем этапе и могут вызвать повторный анализ синтаксического анализа. Повторный анализ дорогостоящий и приводит к заметному замедлению чтения. Когда парсер обнаруживает двусмысленность, он руководствуется двумя принципами: позднее закрытие и минимальное вложение. Модель подтверждена исследованиями ранний левый передний негатив, потенциал, связанный с событием часто возникает как ответ на нарушения структуры фраз.

Позднее закрытие вызывает добавление новых слов или фраз к текущему предложению. Например, «Джон сказал, что уйдет вчера» будет проанализировано как Джон сказал (он уйдет вчера), а не как Джон сказал (он уйдет) вчера (т.е. он говорил вчера).

Минимальная привязанность это стратегия экономии: синтаксический анализатор строит простейшую синтаксическую структуру (то есть с наименьшим количеством фразовых узлов).

Модель на основе ограничений

Теории понимания языка, основанные на ограничениях[6] Подчеркните, как люди используют огромное количество вероятностной информации, доступной в лингвистическом сигнале. Через статистическое обучение,[7] можно выбрать частоту и распределение событий в языковой среде, которые влияют на понимание языка. Таким образом, говорят, что пользователи языка приходят к определенной интерпретации по сравнению с другой во время понимания неоднозначного предложения путем быстрой интеграции этих вероятностных ограничений.

Достаточно хорошая теория

Достаточно хороший подход к пониманию языка предполагает, что слушатели не всегда вовлекаются в полную детальную обработку лингвистического ввода. Скорее, система имеет тенденцию к развитию поверхностных и поверхностных представлений, когда сталкивается с некоторыми трудностями. Теория использует подход, который в некоторой степени сочетает в себе модель садовой дорожки и модель на основе ограничений. Теория фокусируется на двух основных вопросах. Во-первых, изображения, сформированные из сложного или трудного материала, часто бывают поверхностными и неполными. Во-вторых, в случаях, когда система понимания сталкивается с трудностями, часто обращаются к ограниченным источникам информации. Теория может быть проверена с помощью различных экспериментов в психолингвистике, связанных с неправильным толкованием садовых дорожек и т. Д.[8][9]

Методы

Поведенческие задачи

В поведенческих исследованиях испытуемым часто предъявляют лингвистические стимулы и просят выполнить действие. Например, их могут попросить вынести суждение о слове (лексическое решение ), воспроизведите раздражитель или назовите визуально представленное слово вслух. Скорость (часто время реакции: время, необходимое для ответа на стимул) и точность (доля правильных ответов) обычно используются для измерения производительности в поведенческих задачах. Исследователи делают вывод, что природа базовых процессов, требуемых задачей, порождает различия; более медленные темпы и меньшая точность в этих задачах рассматриваются как меры повышенной сложности. Важным компонентом любой поведенческой задачи является то, что она остается относительно верной «нормальному» пониманию языка - способность обобщать результаты любой задачи ограничена, когда задача имеет мало общего с тем, как люди на самом деле сталкиваются с языком.

Распространенная поведенческая парадигма включает: грунтовочные эффекты, при этом участникам сначала отображается штрих, а затем целевое слово. На время отклика для целевого слова влияет соотношение между простым и целевым. Например, Фишлер (1977) исследовал кодирование слов, используя задачу лексического решения. Она попросила участников принять решение о том, являются ли две строки букв английскими словами. Иногда строки представляют собой настоящие английские слова, требующие ответа «да», а в других случаях это не слова, требующие ответа «нет». Подмножество допустимых слов было связано семантически (например, кошка-собака), в то время как другие не были связаны (например, «хлебный стержень»). Фишлер обнаружил, что связанные пары слов реагировали быстрее по сравнению с парами несвязанных слов, что предполагает, что семантическое родство может облегчить кодирование слов.[10]

Движение глаз

Отслеживание глаз был использован для изучения языковой обработки онлайн. Этот метод сыграл важную роль в распространении знаний о чтении.[11] Кроме того, Tanenhaus et al. (1995)[12] установил парадигму визуального мира, которая использует движения глаз для изучения обработки разговорной речи в режиме онлайн. Эта область исследований основана на гипотезе о том, что движения глаз тесно связаны с текущим фокусом внимания.

Нейровизуализация и вызванные потенциалы

Распространение неинвазивных методов предоставляет множество возможностей для изучения основ понимания языка мозгом. Общие примеры включают позитронно-эмиссионная томография (ДОМАШНИЙ ПИТОМЕЦ), функциональная магнитно-резонансная томография (фМРТ), связанные с событиями потенциалы (ERP) в электроэнцефалография (ЭЭГ) и магнитоэнцефалография (MEG) и транскраниальная магнитная стимуляция (ТМС). Эти методы различаются по своему пространственному и временному разрешению (фМРТ имеет разрешение несколько тысяч нейронов на пиксель, а ERP имеет точность до миллисекунд), и каждый тип методологии представляет собой набор преимуществ и недостатков для изучения конкретной проблемы понимания языка.

Вычислительное моделирование

Вычислительное моделирование - еще один способ изучить понимание языка. Модели, например созданные в нейронные сети, особенно полезны, потому что они требуют от теоретиков ясности в своих гипотезах и потому, что их можно использовать для создания точных прогнозов для теоретических моделей, которые настолько сложны, что дискурсивный анализ ненадежный. Классический пример компьютерного моделирования в исследовании языков: Макклелланд и Эльмана СЛЕД модель восприятия речи.[13] Модель обработки предложений можно найти в «рациональном» синтаксическом анализаторе Generalized Left Corner Хейла (2011).[14] Эта модель выводит эффекты садовой дорожки, а также явления локальной согласованности. Вычислительное моделирование также может помочь связать обработку предложений с другими функциями языка. Например, одна модель эффектов ERP при обработке предложений (например, N400 и P600) утверждает, что эти явления возникают в результате процессов обучения, которые поддерживают овладение языком и лингвистическую адаптацию.[15]

Смотрите также

Рекомендации

  1. ^ Альтманн, Джерри (апрель 1998 г.). «Неоднозначность в обработке предложений». Тенденции в когнитивных науках. 2 (4): 146–151. Дои:10.1016 / с1364-6613 (98) 01153-х. PMID  21227111. S2CID  12113211.
  2. ^ Хиллер, Д. (ред.) (1998). Обработка предложений: кросс-лингвистическая перспектива. Синтаксис и семантика 31. Сан Диего: Академическая пресса. п. 464. ISBN  978-0126135312.CS1 maint: дополнительный текст: список авторов (связь)
  3. ^ Фридеричи, Анджела (1 февраля 2002 г.). «К нейронной основе обработки слуховых предложений». Тенденции в когнитивных науках. 6 (2): 78–84. Дои:10.1016 / S1364-6613 (00) 01839-8. PMID  15866191.
  4. ^ Abrahams, V.C .; Роуз, П. К. (18 июля 1975 г.). «Восприятие предложения как интерактивный параллельный процесс». 189: 226–228. Цитировать журнал требует | журнал = (помощь)
  5. ^ Макдональд, Перлмуттер и Зайденберг, 1994).
  6. ^ MacDonald, M.C .; Pearlmutter, M .; Зайденберг, М. (1994). «Лексическая природа разрешения неоднозначности». Психологический обзор. 101 (4): 676–703. Дои:10.1037 / 0033-295x.101.4.676. PMID  7984711.
  7. ^ Зайденберг, Марк С .; Дж. Л. Макклелланд (1989). «Распределенная модель развития распознавания слов и именования». Психологический обзор. 96 (4): 523–568. CiteSeerX  10.1.1.127.3083. Дои:10.1037 / 0033-295X.96.4.523. PMID  2798649.
  8. ^ "Достаточно хорошая языковая обработка: удовлетворительный подход Фернанда Феррейра, Пол Э. Энгельхардт, Манон В. Джонс, Департамент психологии, Эдинбургский университет, Cog Sc Proceedings, 2009
  9. ^ "Достаточно хорошее представление в понимании языков Феррейра, Бейли и Ферраро, Текущие направления психологической науки, 2002 г.
  10. ^ Фишлер И. (1977). «Семантическое содействие без ассоциации в задаче лексического решения». Память и познание. 5 (3): 335–339. Дои:10.3758 / bf03197580. PMID  24202904.
  11. ^ Райнер К. (1978). «Движение глаз при чтении и обработке информации». Психологический бюллетень. 85 (3): 618–660. CiteSeerX  10.1.1.294.4262. Дои:10.1037/0033-2909.85.3.618. PMID  353867.
  12. ^ Tanenhaus M. K .; Спайви-Ноултон М. Дж .; Эберхард К. М .; Седивий Дж. Э. (1995). «Интеграция визуальной и лингвистической информации при понимании устной речи». Наука. 268 (5217): 1632–1634. Дои:10.1126 / science.7777863. PMID  7777863.
  13. ^ McClelland, J.L .; Эльман, Дж. Л. (1986). «Модель восприятия речи TRACE». Когнитивная психология. 18 (1): 1–86. Дои:10.1016/0010-0285(86)90015-0. PMID  3753912. S2CID  7428866.
  14. ^ Хейл, Джон Т. (2011). «Что бы сделал рациональный синтаксический анализатор». Наука о мышлении. 35 (3): 399–443. Дои:10.1111 / j.1551-6709.2010.01145.x.
  15. ^ Фитц, Хартмут; Чанг, Франклин (2019-06-01). «Языковые ERP отражают обучение через распространение ошибок прогнозирования». Когнитивная психология. 111: 15–52. Дои:10.1016 / j.cogpsych.2019.03.002. HDL:21.11116 / 0000-0003-474D-8. ISSN  0010-0285. PMID  30921626. S2CID  85501792.

дальнейшее чтение