Нечеткое сопоставление (компьютерный перевод) - Fuzzy matching (computer-assisted translation)

Нечеткое соответствие это техника, используемая в компьютерный перевод как частный случай связь записи. Он работает с совпадениями, которые могут быть менее 100% идеальными при нахождении соответствий между сегментами текста и записями в база данных предыдущих переводов. Обычно работает в приговор сегментов уровня, но некоторые технологии перевода позволяют сопоставить на фразовый уровень. Используется, когда переводчик работает с память переводов (ТМ). Оно использует приблизительное соответствие строк.

Фон

Если точное совпадение не может быть найдено в базе данных TM для переводимого текста, есть опция поиска совпадения, которое не является точным; транслятор устанавливает порог нечеткого совпадения на процентное значение менее 100%, и база данных затем возвращает любые совпадения в своей памяти, соответствующие этому проценту. Его основная функция - помогать переводчику, ускоряя процесс перевода; нечеткое сопоставление не предназначено для замены человеческого переводчика.

История

Из-за полиморфной и динамической природы язык, особенно английский (что составляет 90% всех исходных текстов, переводимых в сфере локализации[нужна цитата ]), всегда ищутся способы сделать процесс перевода проще и быстрее. С конца 1980-х годов были разработаны инструменты памяти переводов, чтобы повысить производительность и ускорить весь процесс перевода для переводчика.

В 1990-х годах нечеткое сопоставление стало популярной особенностью инструментов TM, и, несмотря на некоторые проблемы, связанные с дополнительной работой, связанной с редактированием «предложения» нечеткого сопоставления, оно все еще остается популярным подмножеством TM. В настоящее время это функция большинства популярных инструментов TM.

Методология

Инструмент TM выполняет поиск в базе данных, чтобы найти сегменты, которые приблизительно соответствуют сегменту в новом исходном тексте, который нужно перевести. TM, по сути, «предлагает» перевод переводчику; Затем переводчик должен принять это предложение или отредактировать это предложение для более полного приведения в соответствие с новым исходным текстом, который находится в процессе перевода. Таким образом, нечеткое сопоставление может ускорить процесс перевода и повысить производительность.

Это вызывает вопросы о качестве получаемых переводов. Иногда на переводчика оказывается давление, чтобы он доставил вовремя, и поэтому он принимает предложение нечеткого соответствия, не проверяя его пригодность и контекст. Базы данных TM создаются на основе ввода от множества разных переводчиков, работающих над множеством разных текстов, с опасностью, что предложения, извлеченные из этого слова «гобелен», будут сшитой мешаниной стилей и противоположностью стремящейся согласованности - то, что некоторые критики окрестили «салатом из приговоров». Вопрос о вере в предложения TM может стать проблемой при попытке найти баланс между более быстрым процессом перевода и качеством этого перевода. Тем не менее, нечеткое сопоставление по-прежнему является важной частью инструментария переводчика.

внешняя ссылка