Количественная лингвистика - Quantitative linguistics - Wikipedia

Количественная лингвистика (QL) является суб-дисциплиной общее языкознание и, более конкретно, математическая лингвистика. Количественная лингвистика занимается изучением языка, изменением языка и применением, а также структурой естественных языков. QL исследует языки с помощью статистических методов; его наиболее важной целью является формулирование языковых законов и, в конечном счете, общей теория языка в смысле совокупности законов взаимосвязанных языков.[1] Синергетическая лингвистика был с самого начала специально разработан для этой цели.[2]QL эмпирически основан на результатах языковой статистики, поле, которое можно интерпретировать как статистику языков или как статистику любого лингвистического объекта. Эта область не обязательно связана с серьезными теоретическими амбициями. Корпусная лингвистика и компьютерная лингвистика другие области, которые вносят важный вклад эмпирическое доказательство.

История

Самые ранние подходы к КЛ относятся к древнегреческому и индийскому миру. Один из исторических источников состоит из приложений комбинаторики к лингвистическим вопросам.[3] другой основан на элементарных статистических исследованиях, которые можно найти под заголовком колометрия и стихометрия.[4]

Языковые законы

В КЖ понятие закона понимается как класс гипотез закона, которые были выведены из теоретических предположений, математически сформулированы, взаимосвязаны с другими законами в данной области и достаточно и успешно проверены на эмпирических данных, т. Е. Которые могут не могут быть опровергнуты, несмотря на все усилия. Кёлер пишет о законах КЯ: «Более того, можно показать, что эти свойства языковых элементов и отношений между ними подчиняются универсальным законам, которые могут быть сформулированы строго математически так же, как это принято в естествознании. имея в виду в этом контексте, что эти законы имеют стохастический характер; они соблюдаются не в каждом отдельном случае (это было бы ни необходимо, ни возможно); они скорее определяют вероятности изучаемых событий или пропорций. Легко найти контрпримеры к каждому из вышеупомянутых примеров; тем не менее, эти случаи не нарушают соответствующие законы, поскольку отклонения от среднего статистического значения не только допустимы, но даже существенны; они сами количественно точно определяются соответствующими законами. Эта ситуация не отличается от что в естественных науках, которые с тех пор давно отказались от старых детерминистских и причинных взглядов на мир и заменили их статистическими / вероятностные модели ".[5]

Лингвистические законы

В количественной лингвистике лингвистические законы - это статистические закономерности, возникающие в различных лингвистических масштабах (например, фонемы, слоги, слова или предложения), которые можно сформулировать математически и которые были выведены из определенных теоретических предположений. Они также должны быть успешно протестированы с использованием данных, то есть не должны быть опровергнуты эмпирическими данными. Среди основных языковых законов, предложенных разными авторами, можно выделить следующие: [6]

  • Закон Ципфа: Частота слов обратно пропорциональна их рангу в частотных списках. Можно наблюдать подобное распределение между рангом и частотой звуков, фонем и букв. [7]
  • Закон кучи: Он описывает количество отдельных слов в документе (или наборе документов) в зависимости от длины документа.
  • Закон краткости или закон сокращения Ципфа: Он качественно утверждает, что чем чаще используется слово, тем «короче» оно обычно. [8]
  • Закон Мензерата (также закон Мензерата-Альтмана): Этот закон утверждает, что размеры составляющих конструкции уменьшаются с увеличением размера исследуемой конструкции. Чем дольше, например предложение (измеряемое количеством предложений), чем короче предложения (измеряемым числом слов), или: чем длиннее слово (в слогах или морфах), тем короче слоги или слова в звуках).
  • Закон диверсификации. Если лингвистические категории, такие как части речи или словоизменительные окончания, появляются в различных формах, можно показать, что частота их появления в текстах регулируется законами.
  • Закон Мартина: этот закон касается лексических цепочек, которые получаются путем поиска определения слова в словаре, затем поиска определения только что полученного определения и т. Д. Наконец, все эти определения образуют иерархию все более и более общих значений, при этом количество определений уменьшается с увеличением общности. Между уровнями такой иерархии существует ряд законных отношений.
  • Закон изменения языка: процессы роста в языке, такие как увеличение словарного запаса, распространение иностранных или заимствованных слов, изменения в флективной системе и т. Д., Подчиняются закону, известному в КЯ как закон Пиотровского, и соответствуют моделям роста в других научных дисциплинах. Закон Пиотровского - это случай так называемой логистической модели (ср. Логистическое уравнение). Было показано, что он охватывает также процессы овладения языком (см. Закон об овладении языком).
  • Закон о текстовых блоках: лингвистические единицы (например, слова, буквы, синтаксические функции и конструкции) показывают определенное частотное распределение в одинаково больших текстовых блоках.

Стилистика

Изучение поэтических, а также непоэтических стилей может быть основано на статистических методах; кроме того, можно проводить соответствующие исследования на основе конкретных форм (параметров) языковых законов, которые принимают в текстах разных стилей. В таких случаях QL поддерживает исследования в области стилистики: одной из общих целей является получение максимально объективных свидетельств, по крайней мере, в части области стилистических явлений путем ссылки на языковые законы. Одно из центральных предположений QL заключается в том, что некоторые законы (например, распределение длин слов) требуют разных моделей, по крайней мере, разных значений параметров законов (распределения или функций) в зависимости от сортировки текста, к которому принадлежит текст. Если поэтические тексты изучаются, методы QL образуют субдисциплину количественного изучения литературы (стилометрия ).[9]

Важные авторы

Смотрите также

Примечания

  1. ^ Райнхард Кёлер: Gegenstand und Arbeitsweise der Quantitativen Linguistik. В: Райнхард Кёлер, Габриэль Альтманн, Раймунд Г. Пиотровски (Hrsg.): Quantitative Linguistik - количественная лингвистика. Ein internationales Handbuch. de Gruyter, Берлин / Нью-Йорк 2005, стр. 1–16. ISBN  3-11-015578-8.
  2. ^ Райнхард Кёлер: Синергетическая лингвистика. В: Райнхард Кёлер, Габриэль Альтманн, Раймунд Г. Пиотровски (Hrsg.): Quantitative Linguistik - количественная лингвистика. Ein internationales Handbuch. де Грюйтер, Берлин / Нью-Йорк, 2005, стр. 760–774. ISBN  3-11-015578-8.
  3. ^ Н.Л. Биггс: Корни комбинаторики. В: Historia Mathematica 6. 1979. С. 109–136.
  4. ^ Адам Павловски: Пролегомены к истории корпуса и количественной лингвистики. Греческая античность. В: Глоттотеория 1. 2008. С. 48–54.
  5. ^ ср. примечание 1, стр. 1–2.
  6. ^ ср. Ссылки: Köhler, Altmann, Piotrowski (ред.) (2005)
  7. ^ Х. Гитер, М. В. Арапов (ред.): Исследования закона Ципфа. Бохум: Брокмайер, 1982. ISBN  3-88339-244-8.
  8. ^ Zipf GK. 1935 Психобиология языка, введение в динамическую филологию. Бостон, Массачусетс: Houghton – Mifflin.
  9. ^ Александр Мехлер: Eigenschaften der textuellen Einheiten und Systeme. В: Райнхард Кёлер, Габриэль Альтманн, Раймунд Г. Пиотровски (Hrsg.): Quantitative Linguistik - количественная лингвистика. Ein internationales Handbuch. де Грюйтер, Берлин / Нью-Йорк 2005, стр. 325-348, особенно. Количественный СтилистикС. 339–340. ISBN  3-11-015578-8; Вивьен Альтманн, Габриэль Альтманн: Anleitung zu Quantitativen Textanalysen. Methoden und Anwendungen. Люденшайд: RAM-Verlag 2008, ISBN  978-3-9802659-5-9.
  10. ^ Гжибек, Петер и Кёлер, Рейнхард (редакторы) (2007): Точные методы изучения языка и текста. Посвящается Габриэлю Альтманну по случаю его 75-летия. Берлин / Нью-Йорк: Мутон де Грюйтер
  11. ^ de: Benutzer: Доктор Карл-Хайнц_Best
  12. ^ индекс
  13. ^ de: Сергей Григорьевич Чебанов
  14. ^ Бест, Карл-Хайнц (2009): Уильям Пэйлин Элдертон (1877-1962). Глоттометрия 19, стр. 99-101 (PDF ram-verlag.eu ).
  15. ^ Homepage_Gertraud Fenk
  16. ^ de: Эрнст Фёрстеманн; Карл-Хайнц Бест: Эрнст Вильгельм Фёрстеманн (1822-1906). В: Глоттометрия 12, 2006, стр. 77–86 (PDF ram-verlag.eu )
  17. ^ Дитер Айхеле: Das Werk von W. трахается. В: Райнхард Кёлер, Габриэль Альтманн, Раймунд Г. Пиотровски (Hrsg.): Quantitative Linguistik - количественная лингвистика. Ein internationales Handbuch. де Грюйтер, Берлин / Нью-Йорк, 2005, стр. 152–158. ISBN  3-11-015578-8
  18. ^ Петр Гржибек :: Домашняя страница: Home / Kontakt В архиве 29 сентября 2012 г. Wayback Machine
  19. ^ de: Густав Хердан
  20. ^ «Измерение Хердана - Законы количественной лингвистики». Архивировано из оригинал на 2011-07-19. Получено 2010-05-22.
  21. ^ de: Luděk Hřebíček
  22. ^ de: Фридрих Вильгельм Кейдинг
  23. ^ Трирский университет: проф. Д-р Райнхард Кёлер В архиве 2015-04-07 в Wayback Machine
  24. ^ Кордич, Снежана (2001). Wörter im Grenzbereich von Lexikon und Grammatik im Serbokroatischen [Сербско-хорватские слова на границе лексики и грамматики]. Исследования по славянскому языкознанию; 18 (на немецком языке). Мюнхен: Lincom Europa. п. 280. ISBN  3-89586-954-6. LCCN  2005530314. OCLC  47905097. ПР  2863539W. NYPL  b15245330. NCID  BA56769448. Сложить резюме.
  25. ^ Кордич, Снежана (2005) [1-й паб. 1999; 2-й паб. 2002; 3-й паб. 2005]. Der Relativsatz im Serbokroatischen [Относительные придаточные предложения в сербохорватском языке]. Исследования по славянскому языкознанию; 10 (на немецком языке). Мюнхен: Lincom Europa. п. 330. ISBN  3-89586-573-7. OCLC  42422661. ПР  2863535 Вт. NYPL  b14328353 ]. Сложить резюмеСодержание
  26. ^ Георг-Август-Университет Геттингена - Лехфельдт, Вернер, проф. Доктор
  27. ^ Праздник по случаю 70-летия: Проблемы общего, германского и славянского языкознания. Материалы к 70-летию профессора В. Левицкого. Herausgegeben von Gabriel Altmann, Ирина Задорошна, Юлия Мацкуляк. Книги, Черновцы 2008. (Без ISBN.) Левицкий посвятил: Глоттометрия, Heft 16, 2008; Эммерих Келих: Der Czernowitzer Beitrag zur Quantitativen Linguistik: Zum 70. Geburtstag von Prof. Dr. Habil. Виктор В. Левицкий. В: Науковый вестник Чернивецкого университета: Германская филология. Выпуск 407, 2008, с. 3–10.
  28. ^ Человек-язык-компьютер - домашняя страница персонала, ZJU
  29. ^ Карл-Хайнц Бест: Пол Мензерат (1883-1954). В:Глоттометрия 14, 2007, стр. 86–98 (PDF ram-verlag.eu )
  30. ^ Шизуо Мизутани; Портрет к 80-летию со дня рождения в: Глоттометрия 12, 2006 (PDF ram-verlag.eu ); о Мизутани: Наоко Маруяма: Сизуо Мизутани (1926). Основатель японской количественной лингвистики. В: Глоттометрия 10, 2005, стр. 99-107 (PDF ram-verlag.eu ).
  31. ^ Чарльз Мюллер: Инициация à la statistique linguistique. Париж: Ларусс 1968; Немецкий: Einführung in die Sprachstatistik. Хюбер, Мюнхен, 1972.
  32. ^ Раймунд Г. Пиотровски, Р.Г. Пиотровский; ср. Закон Пиотровского: http://lql.uni-trier.de/index.php/Change_in_language В архиве 2011-07-19 на Wayback Machine
  33. ^ de: Piotrowski-Gesetz
  34. ^ Журнал количественной лингвистики 4, № 1 января 1997 г. (Праздник в честь Ю. Тулдава)
  35. ^ Д-р Эндрю Уилсон - лингвистика и английский язык в Ланкастерском университете
  36. ^ de: Albert Thumb
  37. ^ de: Эберхард Цвирнер

Рекомендации

  • Карл-Хайнц Бест: Количественный лингвистик. Эйне Аннахерунг. 3., stark überarbeitete und ergänzte Auflage. Peust & Gutschmidt, Геттинген, 2006 г., ISBN  3-933043-17-4.
  • Карл-Хайнц Бест, Отто Роттманн: Количественная лингвистика, приглашение. RAM-Verlag, Люденшайд, 2017. ISBN  978-3-942303-51-4.
  • Райнхард Кёлер с помощью Кристиан Хоффманн: Библиография количественной лингвистики. Бенджаминс, Амстердам / Филадельфия 1995, ISBN  90-272-3751-4.
  • Райнхард Кёлер, Габриэль Альтманн, Габриэль, Раймунд Г. Пиотровски (ред.): Quantitative Linguistik - количественная лингвистика. Справочник Ein internationales - Международный справочник. де Грюйтер, Берлин / Нью-Йорк 2005, ISBN  3-11-015578-8.
  • Хайтао Лю и Вэй Хуанг. Количественная лингвистика : Современное состояние, теории и методы. Журнал Чжэцзянского университета (гуманитарные и социальные науки). 2012,43 (2) 178–192. на китайском.

внешняя ссылка