Герман Мойсл - Hermann Moisl

Доктор Герман Мойсл пенсионер [1] Старший преподаватель и приглашенный научный сотрудник Лингвистика в Ньюкаслский университет. Он получил образование в различных институтах, в том числе Тринити-колледж Дублина и Оксфордский университет.

Научные интересы включают, среди прочего, компьютерная лингвистика, Обработка естественного языка, корпусная лингвистика, культурная роль грамотность и Кельтские языки и история.

Он был ключевым исследователем Ньюкасл Электронный корпус английского проекта Тайнсайд вместе с бывшим коллегой, профессором Карен Корриган, профессором лингвистики и английского языка.

Другая экспертиза

Старый / Средний английский и Древнеирландский / Среднеирландский язык и литература.

Избранные публикации

  • Мойсл Х.Л., Магуайр В., Аллен В. Фонетические вариации в Тайнсайде: исследовательский многомерный анализ Ньюкаслского электронного корпуса Тайнсайдского английского. В: Франс Хинскенс, изд. Языковые вариации - европейские перспективы: избранные доклады Третьей Международной конференции по языковым вариациям в Европе (ICLaVE 3), Амстердам, июнь 2005 г. Амстердам: John Benjamins Publishing Co, 2006, стр. 127–141.
  • Мойсл Х.Л., Магуайр В. Определение основных детерминант фонетической вариации в электронном корпусе Ньюкасла Tyneside English. Журнал количественной лингвистики 2008, 15, 46-69
  • Мойсл Х.Л., Джонс В.М. Кластерный анализ Ньюкаслского электронного корпуса Tyneside English: сравнение методов. Литературные и лингвистические вычисления 2005, 20 (Дополнение 1), 125-146
  • Moisl HL. Исследовательский многомерный анализ. В: Lüdeling A, Kytö M, ed. Корпусная лингвистика. Международный справочник (серия: Handbücher zur Sprache und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science). Берлин: Mouton de Gruyter (в печати), 2008.
  • Мойсл Х.Л., Корриган К., Бил Дж. Ньюкаслский электронный корпус Tyneside English. Совет по исследованиям в области искусства и гуманитарных наук, 2005 г. Доступно по адресу: https://web.archive.org/web/20080925210840/http://www.ncl.ac.uk/necte/.
  • Moisl HL. Лингвистические вычисления с траекториями пространства состояний. В: Стефан Вермтер, Джим Остин, Дэвид Уилшоу, изд. Новые нейронные вычислительные архитектуры, основанные на неврологии: к вычислениям, вдохновленным нейробиологией. Springer, 2001, стр. 442–460.
  • Moisl HL. Лингвистические вычисления с траекториями пространства состояний. В: Стефан Вермтер, Джим Остин, Дэвид Уилшоу, изд. Новые нейронные вычислительные архитектуры на основе нейробиологии: к вычислениям, вдохновленным нейробиологией. Springer, 2001, стр. 442–460.

Проекты

Лингвистический Капсула времени: Newcastle Electronic Corpus of Tyneside English (NECTE), код проекта AHRB RE11776 Руководители проекта: К. Корриган, Дж. Бил, Х. Моисл, аспирантура по надзору

Моделирование естественного языка и обработка текста. Мои конкретные области интересов: понимание естественного языка системный и многомерный анализ корпусов текстов.

Квалификация

BA (Университет Макгилла ) MPhil (Тринити-колледж Дублина ) DPhil (Оксфордский университет ) MSc (Ньюкаслский университет )

Последипломное обучение

Аспирантура

Моделирование естественного языка и обработка текста. Его конкретные области интересов - системы понимания естественного языка и многомерный анализ текстовых корпусов.

Бакалавриат

Текущая работа

Реализация понимание естественного языка системы, использующие динамические аттракторные последовательности

Д-р Мойсл разрабатывает строго последовательную архитектуру понимания естественного языка, которая обходится без двух основополагающих принципов генеративной лингвистики, господствующей когнитивной науки и большей части искусственного интеллекта - что строки естественного языка имеют сложную синтаксическую структуру, обрабатываемую чувствительными к структуре алгоритмами, и что это структура имеет решающее значение для определения семантики строки. Эта последовательная архитектура первоначально была сформулирована в терминах стандартной теории автоматов как система взаимодействующих автоматов с конечным числом состояний, но в последнее время я заинтересовался нейробиологическими исследованиями, в которых хаотическая траектория аттрактора в пространстве состояний определяется как фундаментальный принцип функционирования мозга на уровне выше. это индивидуальный нейрон, и это указывает на то, что сенсорная обработка и, возможно, более высокое познание в более общем плане, осуществляются взаимодействующими процессами последовательности аттракторов. Некоторые соответствующие публикации:

  • Мойсл, Х. (1992) «Коннекционистская обработка естественного языка с конечным числом состояний», Connection Science 4, 67-91.
  • Мойсл, Х. (1997) «Рекуррентные нейронные сети и обработка естественного языка», Новые методы в обработке языков, под ред. Д. Джонс и Х. Сомерс, UCL Press, Лондон, 69–82
  • Мойсл, Х., (2000) Справочник по обработке естественного языка, Марсель Деккер (совместно с Р. Дейлом из Университета Маккуори и Х. Сомерсом из UMIST)
  • Мойсл, Х., (2001) 'Искусственные нейронные сети и обработка естественного языка ', Энциклопедия библиотек и информатики, изд. М. Дрейк, Марсель Деккер (в печати)
  • Мойсл, Х., (2001) 'Лингвистические вычисления с траекториями в пространстве состояний », в Emergent Neural Computational Architectures, based on Neuroscience, ed. Стефан Вермтер, Джим Остин, Дэвид Уиллшоу, Спрингер, 2001
Создание корпуса естественного языка

Вместе с Карен Корриган из Университета Ньюкасла и Джоан Бил из Университета Шеффилда он недавно завершил Newcastle Electronic Corpus of Tyneside English (NECTE), корпус диалектной речи из Тайнсайда в Северо-Восточной Англии. Он основан на двух ранее существовавших корпусах, один из которых был собран в конце 1960-х в рамках проекта Tyneside Linguistic Survey (TLS), а другой - в 1994 году в рамках проекта Phonological Variation and Change in Contemporary Spoken English (PVC). NECTE объединяет материалы TLS и PVC в единый корпус с кодировкой XML, соответствующий Инициативе кодирования текста (TEI), и делает их доступными в различных согласованных форматах: оцифрованный звук, стандартная орфографическая транскрипция, фонетическая транскрипция и тегированные части речи. . Этот веб-сайт подробно описывает корпус NECTE и делает его доступным для академических исследователей, специалистов в области образования, средств массовой информации в некоммерческих приложениях, а также таких организаций, как языковые общества и лиц, серьезно интересующихся историческими диалектными материалами.

Исследовательский многомерный анализ корпусов текстов

После завершения проекта NECTE он разрабатывал методологию социолингвистического и диалектологического исследования корпуса, цель которой - попытаться выявить интересные закономерности фонетической изменчивости среди информаторы в корпусе и любые корреляции между такими вариациями и соответствующими социальными факторами. Методология основана на методике, сформулированной создателями большей части корпуса NECTE, - Tyneside Linguistic Survey (TLS). Это было радикально в то время и остается таковым сегодня: в отличие от тогдашнего универсального и все еще доминирующего подхода, основанного на теории, где социальные и лингвистические факторы выбираются аналитиком на основе некоторой комбинации независимо определенной теоретической основы, существующей На основе тематических исследований и личного опыта в исследуемой области TLS предложил принципиально эмпирический подход, в котором основные факторы извлекаются из самих данных и затем служат основой для построения модели. Для реализации своего подхода TLS использовал особую исследовательскую многомерную аналитическую технику, иерархический кластерный анализ, но его работа никогда не продвигалась дальше предварительных исследований по ряду теоретических и практических причин. Его разработка методологии TLS

  • я. использует ряд линейных и нелинейных исследовательских аналитических методов в дополнение к иерархическому кластерному анализу, например, многомерное масштабирование и самоорганизующиеся карты, и
  • II. уделяет особое внимание вопросам создания данных, которые имеют решающее значение для достоверности аналитических результатов: нормализация длины документа, уменьшение размерности и нелинейность данных.
Соответствующие публикации
  • MОйсл, Х. и Бил, Дж. К. (2001) «Анализ корпуса и результаты: визуализация с использованием самоорганизующихся карт», Corpus Linguistics 2001, Ланкастерский университет, 386-391. Электронное издание.
  • Moisl, H, Jones, V (2005) Кластерный анализ электронного корпуса Newcastle Tyneside English: сравнение методов. Центр телематики и информационных технологий [CTIT]; TR 2005/65) {A-53328} Университет Твенте.
  • Moisl, H, Jones V., (2005) «Кластерный анализ Newcastle Electronic Corpus of Tyneside English: сравнение методов», Literary and Linguistic Computing 20, 125-46. [Версия онлайн-журнала] [Препринт]
  • MОйсл Х., Магуайр В., Аллен В. (2006) «Фонетическая вариация в Тайнсайде: исследовательский многомерный анализ Ньюкаслского электронного корпуса Тайнсайдского английского языка». В: F. Hinskens, ed. Языковые вариации. Европейские перспективы. Амстердам: Институт Меертенса. [Препринт]
  • АИлен, У.Х., Бил, Дж. К., Корриган, К. П., Магуайр, В. и Мойсл, Х. Л. (2007), «Лингвистическая« капсула времени »: Ньюкаслский электронный корпус английского языка Тайнсайд» в Бил, Дж. К., Корриган, К. and Moisl, H.L. (eds.) Создание и оцифровка языковых корпусов, Vol. 2: Диахронические базы данных. Собачьи мельницы: Пэлгрейв Макмиллан, 16-48. [Препринт]
  • MОйсл, Х. (2007) Нелинейность данных в исследовательском многомерном анализе языковых корпусов, Вычислительная техника и историческая фонология. Материалы девятого совещания Специальной группы ACL по компьютерной морфологии и фонологии, 28 июня 2007 г., изд. Дж. Нербонн, М. Эллисон, Г. Кондрак, Ассоциация компьютерной лингвистики, 93–100. [Интернет-публикация]
  • MОйсл, Х. (2008) «Исследовательский многомерный анализ», В: Lüdeling A, Kytö M, ed. Корпусная лингвистика. Международный справочник (Серия: Handbücher zur Sprache und Kommunikationswissenschaft / Справочники по лингвистике и коммуникационным наукам). Берлин: Мутон де Грюйтер. [Препринт]
  • MОйсл Х., Магуайр У. (2008) «Определение основных детерминант фонетической вариации в электронном корпусе Ньюкасла Tyneside English», Journal of Quantitative Linguistics 15, 46-69. [Препринт]
  • Moisl, H. (2008) «Использование электронных корпусов для изучения языковых вариаций: проблема разреженности данных», который в настоящее время рассматривается для исследований языковых вариаций. Избранные статьи из ICLaVE 4, ed. П. Павлу, Университет Кипра [Препринт]
  • MОйсл, Х. (2008) «Использование электронных корпусов в исследованиях исторической диалектологии: проблема вариации длины документа», которая в настоящее время рассматривается в материалах Второй международной конференции по английской исторической диалектологии, Университет Бергамо, изд. М. Доссена [Препринт]
  • MОйсл, Х. (2008) Нормализация вариации длины документа в исследовательском многомерном анализе текстовых корпусов, Труды INFOS2008: 6-я Международная конференция по информатике и системам, Каирский университет, 27–29 марта 2008 г. [Препринт]

использованная литература

внешние ссылки