Арви Хурскайнен - Arvi Hurskainen
Арви Хурскайнен | |
---|---|
Арви Хурскайнен в 2002 году | |
Родился | Kitee, Финляндия | 25 января 1941 г.
Национальность | Финский |
Известен | разработка SALAMA, вычислительной среды для языковых технологий |
Научная карьера | |
Поля | Лингвистика Языковые технологии, Машинный перевод |
Учреждения | Хельсинкский университет |
Докторанты | Юха Пентикяйнен и Марья-Лийза Сванц |
Арви Йоханнес Хурскайнен (родился 25 января 1941 г. в г. Kitee ) - финский ученый языковые технологии и лингвистика. С 1985 года он разработал основанную на правилах языковую технологию в основном для суахили, но также и для других языков, включая машинный перевод с английского на финский. Он создал среду разработки под названием SALAMA (аббревиатура от Swahili Language Manager), но она подходит для любого языка. К основным разработанным на данный момент приложениям относятся следующие: проверка орфографии для суахили,[1] аннотатор корпусных текстов,[2] продвинутый словарь между суахили и английским языком [3] и переводчики [4] с суахили на английский, с английского на суахили и с английского на финский. Он также разработал продвинутую систему изучения суахили.[5] и система для создания целевых словарей для изучающих язык.[2] Хурскайнен составил два аннотированный corpus, Helsinki Corpus of Swahili 1.0 и Helsinki Corpus of Swahili 2.0.[6]
Учеба и история работы
Сначала он изучал богословие в Хельсинкском университете. Позже, после работы в Танзании, он изучал антропологию и опубликовал докторскую диссертацию «Крупный рогатый скот и культура». Структура пастырского общества паракуджо.[7]В 1976 году он работал исследователем в проекте Jipemoyo, спонсируемом Академия Финляндии в Танзании, а в 1977–1980 гг. на службе лютеранской миссии Финляндии в Хельсинки.
Хурскайнен работал в Хельсинкский университет сначала как преподаватель в 1981–1989 годах, а затем как профессор в 1989–2006 годах. Между тем, в 1984–1985 гг. Он работал в Университет Тумаини в Танзания. До университетской карьеры он восемь лет работал в Танзании, выполняя различные педагогические задания. В 1999–2001 годах он был директором Департамента азиатских и африканских исследований. Он ушел на пенсию в 2006 году.
В 1988–1992 гг. Он руководил полевым проектом «Язык суахили и фольклор», спонсором которого выступили Министерство иностранных дел Финляндии и Университет Дар-эс-Салама. В рамках проекта был подготовлен речевой корпус DAHE (Дар-эс-Салам - Хельсинки), который впоследствии был оцифрован.
Языковые технологии
Хурскайнен разработал языковые технологии с использованием подробного языкового анализа. Базовое описание языка производится с помощью конечные преобразователи, впервые разработанная Киммо Коскенниеми. Затем отдельные слова устраненный с помощью грамматика ограничений технологии. Так же синтаксический отображение выполняется на этом этапе. Устранение неоднозначности и синтаксическое сопоставление выполняются с использованием Constraint Grammar 3.0, первоначально разработанного Фред Карлссон и реализован Паси Тапанайненом из Connexor.[8]
Подход, основанный на правилах, разработанный Хурскайненом, имеет сходство с другими системами, основанными на правилах, такими как Grammatical Framework.[9] и Нудж.[10] Подходы к языковым технологиям, основанные на правилах, особенно применительно к машинному переводу, считаются подходящими для языков с ограниченными ресурсами и богатой морфологией, таких как языки банту.[11]
Производство
Веб-материалы
- САЛАМА,[12] вычислительная среда для разработки приложений языковых технологий была начата в 1985 году, и разработка продолжается.
- На данный момент существует 62 технических отчета по языковым технологиям, в основном по вопросам, связанным с машинным переводом.[13]
использованная литература
- ^ "Zana za Uhakiki za Microsoft Office 2013 - суахили". Microsoft. Получено 16 апреля 2018.
- ^ а б Хурскайнен, Арви. "Tagger". Получено 16 апреля 2018.
- ^ Хурскайнен, Арви. "Толковый словарь". Получено 16 апреля 2018.
- ^ Хурскайнен, Арви. "Переводчик". Получено 16 апреля 2018.
- ^ Хурскайнен, Арви. "Учить суахили". Получено 16 апреля 2018.
- ^ [1]
- ^ Суомен профессор 1640–2007. Ювяскюля: Professoriliitto. 2008 г.
- ^ «Природные знания». Коннексор. 2011–2016. Получено 16 апреля 2018.
- ^ «GF - Grammatical Framework - язык программирования для многоязычных грамматических приложений». GF - грамматические рамки. Получено 16 апреля 2018.
- ^ «Среда лингвистического развития». NooJ. Получено 16 апреля 2018.
- ^ Хурскайнен, Арви. 2018. Устойчивые языковые технологии для африканских языков. В Agwuele, Augustine and Bodomo, Adams (eds), The Routledge Handbook of African Linguistics, 359-375. Лондон: Издательство Рутледж. ISBN 978-1-138-22829-0
- ^ Хурскайнен, Арви. «Добро пожаловать в Саламу». Получено 25 июн 2018.
Salama (менеджер языка суахили) - это среда для языковых технологических приложений. Все приложения в Salama используют технологию языка на основе правил, запущенную в 1985 году.
- ^ Хурскайнен, Арви. «Технические отчеты по LT». Салама - менеджер по языку суахили. Получено 25 июн 2018.