Размещение - Postediting

Постредактирование (или же размещение) - это процесс, при котором люди вносят поправки в машинный перевод для получения приемлемого конечного продукта. Человек, который занимается постредактированием, называется постредактор. Концепция постредактирования связана с концепцией предварительное редактирование. В процессе перевода текста через машинный перевод, наилучших результатов можно добиться, предварительно отредактировав исходный текст - например, применив принципы контролируемый язык - а затем постредактирование вывода машины. Он отличается от редактирование, который относится к процессу улучшения текста, созданного человеком (процесс, который часто называют редактированием в области перевода). Отредактированный текст впоследствии может быть изменен, чтобы гарантировать качество выбранных языков, которые проверяются для исправления простых ошибок.

Постредактирование предполагает исправление машинный перевод результат, чтобы гарантировать, что он соответствует уровню качества, согласованному заранее между клиентом и постредактором. Легкое постредактирование стремится сделать вывод просто понятным; полное постредактирование сделать это еще и стилистически уместным. С развитием машинного перевода полное постредактирование становится альтернативой ручному переводу. Практически все компьютерный перевод Инструменты (CAT) теперь поддерживают постредактирование машинного перевода.

Постредактирование и машинный перевод

Машинный перевод покинул лаборатории и начал использоваться по назначению в конце семидесятых в некоторых крупных учреждениях, таких как Европейская комиссия и Панамериканская организация здравоохранения, а затем, позже, в некоторых корпорациях, таких как Caterpillar и Дженерал Моторс. Первые исследования постредактирования появились в восьмидесятых годах, связанных с этими реализациями.[1] Для разработки соответствующих руководств и обучения члены Американской ассоциации машинного перевода (AMTA) и Европейская ассоциация машинного перевода (EAMT) в 1999 году учредила Специальную группу по постредактированию.[2]

После девяностых годов достижения в области компьютерных мощностей и возможностей подключения ускорили разработку машинного перевода и позволили его развертывание через веб-браузер, в том числе в качестве бесплатного полезного дополнения к основным поисковым системам (переводчик Google, Bing переводчик, Yahoo! Вавилонская рыба ). Более широкое признание несовершенного машинного перевода сопровождалось также более широким распространением постредактирования. Поскольку спрос на локализацию товаров и услуг растет такими темпами, которые невозможно удовлетворить с помощью человеческого перевода, даже без поддержки памяти переводов и других технологий управления переводами, отраслевые организации, такие как Общество пользователей автоматизации перевода (TAUS), ожидают, что машинный перевод и постредактирование будет играть гораздо большую роль в ближайшие несколько лет.[3]

Использование машинного перевода иногда предполагает предварительное редактирование.

Легкое и полное постредактирование

В исследованиях восьмидесятых годов проводилось различие между степенями постредактирования, которые в контексте Службы переводов Европейской комиссии сначала были определены как обычные и быстрые.[4] или полный и быстрый.[5] Легкое и полное постредактирование кажется наиболее часто используемой формулировкой.

Легкое постредактирование подразумевает минимальное вмешательство постредактора, поскольку строго необходимо, чтобы помочь конечному пользователю разобраться в тексте; ожидается, что клиент будет использовать его только для входящих целей, часто когда текст нужен срочно или имеет короткий промежуток времени.

Полное постредактирование предполагает более высокий уровень вмешательства для достижения определенного уровня качества, согласованного между клиентом и постредактором; ожидается, что результатом будет текст, который будет не только понятен, но и представлен некоторым стилистически подходящим образом, чтобы его можно было использовать для ассимиляции и даже для распространения, как для входящих, так и для исходящих целей.

В верхней части полного постредактирования находится ожидание уровня качества, неотличимого от уровня качества перевода, выполненного человеком. Однако предполагалось, что переводчикам требуется меньше усилий для работы непосредственно с исходным текстом, чем для постредактирования версии, созданной машиной. С достижениями в машинный перевод, это может измениться. Для некоторых языковых пар и для некоторых задач, а также с движками, которые были настроены с использованием данных хорошего качества для конкретной предметной области, некоторые клиенты уже просят переводчиков постредактировать вместо перевода с нуля, полагая, что они достигнут аналогичного качества за более низкая стоимость.

Легкая / полная классификация, разработанная в девяностые годы, когда машинный перевод все еще был выпущен на CD-ROM, может не соответствовать достижениям в машинном переводе и при легком постредактировании. Для некоторых языковых пар и некоторых задач, особенно если исходный код был предварительно отредактирован, исходный машинный вывод может быть достаточно хорош для целей составления, не требуя последующего вмешательства человека.

Эффективность постредактирования

Постредактирование используется, когда необработанный машинный перевод недостаточно хорош и человеческий перевод не требуется. Промышленность рекомендует использовать постредактирование, когда оно может как минимум вдвое увеличить производительность ручного перевода, даже в четыре раза больше в случае легкого постредактирования.[нужна цитата ]

Однако эффективность постредактирования трудно предсказать. Различные исследования, проведенные как в академических кругах, так и в промышленности, утверждают, что постредактирование обычно выполняется быстрее, чем перевод с нуля, независимо от языковых пар или опыта переводчиков.[6] Однако нет согласия относительно сколько время можно сэкономить за счет постредактирования на практике (если оно вообще есть): хотя отрасль сообщает об экономии времени примерно на 40%,[7] некоторые академические исследования показывают, что экономия времени в реальных условиях труда с большей вероятностью составит 0–20%. Специалисты также сообщают об отрицательном приросте производительности, когда исправления требуют больше времени, чем перевод с нуля.[8][9]

Постредактирование и языковая индустрия

По прошествии примерно тридцати лет постредактирование все еще остается «зарождающейся профессией».[10] Что такое правильный профиль постредактора, еще до конца не изучено. Постредактирование совпадает с переводом и редактированием, но лишь частично. Большинство думает, что идеальным постредактором будет переводчик, стремящийся обучиться конкретным необходимым навыкам, но есть некоторые, кто думает, что двуязычный без опыта перевода может быть легче обучить.[11] Мало что известно о том, кто на самом деле является постредакторами, склонны ли они быть профессиональными переводчиками, работают ли они в основном в качестве штатных сотрудников или самостоятельно, и на каких условиях. Многие профессиональные переводчики не любят постредактирование, в том числе потому, что оно, как правило, оплачивается по более низким ставкам, чем обычные переводы, с Международная ассоциация профессиональных переводчиков (IAPTI) особенно громко об этом говорил.[12]

Качество вывода машинного перевода для постредактирования выше и, следовательно, требует меньше усилий после редактирования, когда машинный перевод обеспечивается нейронным, вертикальным или индивидуальным машинный перевод двигатель. Повышение эффективности перевода можно измерить, отслеживая время, необходимое лингвистам для исправления машинный перевод в той же среде перевода, такой как XTM Cloud[13], а Система управления переводами и Компьютерный перевод инструмент, позволяющий сравнивать время постредактирования и результаты лингвистической оценки качества постредактированных текстов.

Нет четких данных о том, насколько велик пирог постредактирования в отрасли переводов. Недавний опрос показал, что это предлагают 50% поставщиков языковых услуг, но для 85% из них это составляет менее 10% их пропускной способности.[14] Memsource, веб-инструмент для перевода, утверждает, что более 50 процентов переводов между английским и испанским, французским и другими языками было выполнено на его платформе, сочетающей память переводов с машинным переводом.[15] Постредактирование также осуществляется через порталы краудсорсинга переводов, такие как Unbabel который к ноябрю 2014 года утверждал, что отредактировал более 11 миллионов слов.[16]

В любом случае оценки производительности и объема являются подвижными целями, поскольку достижения в области машинного перевода, в значительной степени обусловленные постредактированным текстом, возвращаемым в его движки, будут означать, что чем больше выполняется постредактирование, тем выше качество машинного перевода и более распространенного постредактирования.[нужна цитата ]

Смотрите также

Рекомендации

  1. ^ «Сенез, Дороти.« Служба постредактирования для пользователей машинного перевода в Европейской комиссии ». Перевод и компьютер 20. Труды конференции Aslib, 12 и 13 ноября 1998 г .; Васконселлос, М. и М. Леон (1985)». SPANAM и ENGSPA: Машинный перевод в Панамериканской организации здравоохранения ". Компьютерная лингвистика 11, 122-136". Отсутствует или пусто | url = (помощь)
  2. ^ «Аллен, Джеффри.« Постредактирование »в Гарольде Сомерсе (ред.) (2003). Компьютеры и перевод. Путеводитель переводчика. Бенджамины: Амстердам / Филадельфия, стр. 312 ". Отсутствует или пусто | url = (помощь)
  3. ^ "Сайт ТАУС".
  4. ^ "Loffler-Laurian, Anne marie. (1986). Пост-édition rapide и post-édition Conventionelle: deux modalities d'una activité spécifique¨. Multilingua 5, 81-88". Отсутствует или пусто | url = (помощь)
  5. ^ "Вагнер, Элизабет." Быстрое постредактирование Systran "Перевод и компьютер 5. Труды конференции Aslib, 10 и 11 ноября 1983". Отсутствует или пусто | url = (помощь)
  6. ^ Грин, Спенс, Джеффри Хир и Кристофер Д. Мэннинг (2013). «Эффективность постредактирования человека для языкового перевода» (PDF). ACM Человеческий фактор в вычислительных системах.CS1 maint: использует параметр авторов (связь)
  7. ^ Плитт, Мирко и Франсуа Массело (2010). «Тест производительности постредактирования статистического машинного перевода в типичном контексте локализации» (PDF). Пражский вестник математической лингвистики. 93: 7–16. Дои:10.2478 / v10108-010-0010-x.
  8. ^ Марчелло Федерико, Алессандро Каттелан и Марко Тромбетти (2012). «Измерение производительности пользователей в машинном переводе с помощью компьютерного перевода» (PDF). Труды десятой проводимой раз в два года конференции Ассоциации машинного перевода в Америке (AMTA), Сан-Диего, Калифорния, 28 октября - 1 ноября.CS1 maint: использует параметр авторов (связь)
  9. ^ Любли, Самуэль, Марк Фишел, Гэри Мэсси, Морин Эренсбергер-Доу и Мартин Фольк (2013). «Оценка эффективности постредактирования в реалистичной среде перевода» (PDF). Материалы 2-го семинара по технологии и практике постредактирования. С. 83–91.CS1 maint: использует параметр авторов (связь)
  10. ^ "Сайт ТАУС".
  11. ^ Хатчинс, Джон (1995). «Размышления об истории и современном состоянии машинного перевода» (PDF).CS1 maint: использует параметр авторов (связь)
  12. ^ «Сайт ИАПТИ».
  13. ^ «Официальный сайт XTM International».
  14. ^ «Опубликование на практике. Отчет TAUS» (PDF). Март 2010. с. 13.
  15. ^ "Сайт Memsource".
  16. ^ «Unbabel запускает сервис машинного перевода, редактируемый людьми, чтобы помочь компаниям выйти на международный уровень и локализовать поддержку клиентов».

дальнейшее чтение

внешняя ссылка