Управляемый язык в машинном переводе - Controlled language in machine translation
Эта статья включает в себя список общих Рекомендации, но он остается в основном непроверенным, потому что ему не хватает соответствующих встроенные цитаты.Февраль 2013) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
С помощью контролируемый язык в машинный перевод создает несколько проблем.
В автоматическом переводе первый шаг к пониманию контролируемого языка - это знать, что это такое, и различать естественный язык и контролируемый язык.
Основная проблема в машинный перевод это лингвистическая проблема. Язык неоднозначен, и система пытается смоделировать язык по лексико-грамматическому укладу. Для решения этой проблемы есть много альтернатив, например а глоссарий связанные с темой текста.
Управляемый язык с десятью правилами
Грамматические правила различны для каждого языка. Из-за этого правила для контролируемых языков различаются от одного языка к другому. И нет правил, которые давали бы оптимальные результаты для всех языков. Однако существуют правила, которые уменьшают двусмысленность в большинстве текстов на многих языках. Согласно статье Уве Муэгге «Контролируемый язык, оптимизированный для единообразного перевода» (2002 г.) следует применять следующие десять правил:[1]
- Пишите предложения короче 25 слов.
- Будьте краткими (хорошо структурированными)
- Избегайте двусмысленности и подчинения
- Оцените информацию
- Напишите предложения, которые выражают только одну идею.
- Простые предложения
- Избегайте (герундий, сопоставление и т. Д.)
- Напишите такое же предложение, если хотите выразить то же самое содержание.
- Не бойся повторить
- Избегайте синонимов
- Пишите грамматически полные предложения.
- Предложения грамматически и орфографически правильные
- Избегайте многоточия.
- Пишите предложения с простой грамматической структурой.
- Избегайте совмещения, подчинения, относительных местоимений и т. Д.
- Пишите предложения в активной форме.
- Избегайте пассивного голоса
- Напишите предложения, которые повторяют существительное вместо использования местоимения.
- Избегайте таких местоимений, как Это, их, так далее.
- Напишите предложения, в которых используются артикли для обозначения существительных.
- Использовать в, это, так далее.
- Пишите предложения, используя слова из общего словаря.
- Не используйте технические слова
- Пишите предложения, в которых используются только слова с правильным написанием.
- Избегайте ошибок
Преимущества использования контролируемого языка
Это позволяет создавать тексты, которые легче читать, понятнее и легче запоминать, а также с улучшенным словарным запасом и стилем. Причины введения контролируемого языка включают:
- Более удобочитаемые и понятные документы повышают удобство использования продукта.
- Контролируемый язык гарантирует предоставление объективной и структурированной поддержки в типично довольно субъективной и неструктурированной среде.
- Управляемые средствами языковые среды позволяют автоматизировать многие задачи редактирования и обеспечивают объективные показатели качества для процесса создания.
- Более строгий и контролируемый язык, более единообразный и стандартизированный исходный документ и более высокая степень соответствия в системе памяти переводов, а стоимость перевода дешевле.
- Контролируемый язык, разработанный для машинного перевода, значительно повысит качество предложений по переводу, созданных машиной, и сократит время и затраты на редактирование переводчиками-людьми.
Контролируемый язык и перевод
Одна из самых больших проблем, с которыми сталкиваются организации, желающие сократить затраты и время, затрачиваемые на перевод, заключается в том, что даже в средах, сочетающих системы управления контентом с технологией памяти переводов, процент непереведенных сегментов на новый документ остается довольно высоким. Хотя, безусловно, можно управлять контентом на уровне предложения / сегмента, в настоящее время лучше всего использовать фрагменты на уровне темы. Это означает, что повторное использование происходит с довольно высокой степенью детализации.
Рекомендации
- ^ Мегге, Уве: "Контролируемый язык, оптимизированный для единообразного перевода (ППТЮ) ", неопубликованная рукопись, 2002 г.
Источники
- АМОРЕС КАРРЕДАНО, Хосе Хавьер. Системы автоматического перевода [онлайн]. Доступно в: http://quark.prbb.org/19/019046.htm [Дата просмотра: 29 мая 2011 г.]
- AECMA: Упрощенный английский AECMA: Руководство по подготовке документации по техническому обслуживанию воздушного судна на международном языке по техническому обслуживанию самолетов, Брюселас, 1995.
- Grimaila, A .; Шандиу, Дж .: «Решения на заказ». В: Джон Ньютон, изд .: Компьютеры в переводе: практическая оценка, Лондрес, Рутледж, 1992: 33-45.
- Hartley, A.F .; Париж, Калифорния: «Производство многоязычных документов: от поддержки перевода до поддержки авторинга», Машинный перевод (специальный выпуск о новых инструментах для переводчиков-людей) 1997; 12 (12): 109-129.
- Ide, I; Веронис, Дж .: «Введение в специальный выпуск по устранению неоднозначности слов: современное состояние», Компьютерная лингвистика, 1998; 24 (1): 1-40.
- Lehrberger, L .; Бурбо, Л .: Машинный перевод: лингвистические характеристики машинный перевод Системы и общая методология оценки, Амстердам / Филадельфия, Джон Бенджаминс, 1988.