Арви Хурскайнен - Arvi Hurskainen

Арви Хурскайнен
Арви Хурскайнен vuonna 2002.jpg
Арви Хурскайнен в 2002 году
Родился (1941-01-25) 25 января 1941 г. (возраст 79)
Kitee, Финляндия
НациональностьФинский
Известенразработка SALAMA, вычислительной среды для языковых технологий
Научная карьера
ПоляЛингвистика Языковые технологии, Машинный перевод
УчрежденияХельсинкский университет
ДокторантыЮха Пентикяйнен и Марья-Лийза Сванц [фи ]
Арви Хурскайнен в 2016 году

Арви Йоханнес Хурскайнен (родился 25 января 1941 г. в г. Kitee ) - финский ученый языковые технологии и лингвистика. С 1985 года он разработал основанную на правилах языковую технологию в основном для суахили, но также и для других языков, включая машинный перевод с английского на финский. Он создал среду разработки под названием SALAMA (аббревиатура от Swahili Language Manager), но она подходит для любого языка. К основным разработанным на данный момент приложениям относятся следующие: проверка орфографии для суахили,[1] аннотатор корпусных текстов,[2] продвинутый словарь между суахили и английским языком [3] и переводчики [4] с суахили на английский, с английского на суахили и с английского на финский. Он также разработал продвинутую систему изучения суахили.[5] и система для создания целевых словарей для изучающих язык.[2] Хурскайнен составил два аннотированный corpus, Helsinki Corpus of Swahili 1.0 и Helsinki Corpus of Swahili 2.0.[6]

Учеба и история работы

Сначала он изучал богословие в Хельсинкском университете. Позже, после работы в Танзании, он изучал антропологию и опубликовал докторскую диссертацию «Крупный рогатый скот и культура». Структура пастырского общества паракуджо.[7]В 1976 году он работал исследователем в проекте Jipemoyo, спонсируемом Академия Финляндии в Танзании, а в 1977–1980 гг. на службе лютеранской миссии Финляндии в Хельсинки.

Хурскайнен работал в Хельсинкский университет сначала как преподаватель в 1981–1989 годах, а затем как профессор в 1989–2006 годах. Между тем, в 1984–1985 гг. Он работал в Университет Тумаини в Танзания. До университетской карьеры он восемь лет работал в Танзании, выполняя различные педагогические задания. В 1999–2001 годах он был директором Департамента азиатских и африканских исследований. Он ушел на пенсию в 2006 году.

В 1988–1992 гг. Он руководил полевым проектом «Язык суахили и фольклор», спонсором которого выступили Министерство иностранных дел Финляндии и Университет Дар-эс-Салама. В рамках проекта был подготовлен речевой корпус DAHE (Дар-эс-Салам - Хельсинки), который впоследствии был оцифрован.

Языковые технологии

Хурскайнен разработал языковые технологии с использованием подробного языкового анализа. Базовое описание языка производится с помощью конечные преобразователи, впервые разработанная Киммо Коскенниеми. Затем отдельные слова устраненный с помощью грамматика ограничений технологии. Так же синтаксический отображение выполняется на этом этапе. Устранение неоднозначности и синтаксическое сопоставление выполняются с использованием Constraint Grammar 3.0, первоначально разработанного Фред Карлссон и реализован Паси Тапанайненом из Connexor.[8]

Подход, основанный на правилах, разработанный Хурскайненом, имеет сходство с другими системами, основанными на правилах, такими как Grammatical Framework.[9] и Нудж.[10] Подходы к языковым технологиям, основанные на правилах, особенно применительно к машинному переводу, считаются подходящими для языков с ограниченными ресурсами и богатой морфологией, таких как языки банту.[11]

Производство

Веб-материалы

  • САЛАМА,[12] вычислительная среда для разработки приложений языковых технологий была начата в 1985 году, и разработка продолжается.
  • На данный момент существует 62 технических отчета по языковым технологиям, в основном по вопросам, связанным с машинным переводом.[13]

использованная литература

  1. ^ "Zana za Uhakiki za Microsoft Office 2013 - суахили". Microsoft. Получено 16 апреля 2018.
  2. ^ а б Хурскайнен, Арви. "Tagger". Получено 16 апреля 2018.
  3. ^ Хурскайнен, Арви. "Толковый словарь". Получено 16 апреля 2018.
  4. ^ Хурскайнен, Арви. "Переводчик". Получено 16 апреля 2018.
  5. ^ Хурскайнен, Арви. "Учить суахили". Получено 16 апреля 2018.
  6. ^ [1]
  7. ^ Суомен профессор 1640–2007. Ювяскюля: Professoriliitto. 2008 г.
  8. ^ «Природные знания». Коннексор. 2011–2016. Получено 16 апреля 2018.
  9. ^ «GF - Grammatical Framework - язык программирования для многоязычных грамматических приложений». GF - грамматические рамки. Получено 16 апреля 2018.
  10. ^ «Среда лингвистического развития». NooJ. Получено 16 апреля 2018.
  11. ^ Хурскайнен, Арви. 2018. Устойчивые языковые технологии для африканских языков. В Agwuele, Augustine and Bodomo, Adams (eds), The Routledge Handbook of African Linguistics, 359-375. Лондон: Издательство Рутледж. ISBN  978-1-138-22829-0
  12. ^ Хурскайнен, Арви. «Добро пожаловать в Саламу». Получено 25 июн 2018. Salama (менеджер языка суахили) - это среда для языковых технологических приложений. Все приложения в Salama используют технологию языка на основе правил, запущенную в 1985 году.
  13. ^ Хурскайнен, Арви. «Технические отчеты по LT». Салама - менеджер по языку суахили. Получено 25 июн 2018.

внешние ссылки