Перевод изображений - Image translation

Перевод изображений относится к технологии, при которой пользователь может переводить текст на изображениях или изображениях печатного текста (плакаты, баннеры, список меню, вывеску, документ, снимок экрана и т. д.). оптическое распознавание символов (OCR) к изображению для извлечения любого текста, содержащегося в изображении, с последующим переводом этого текста на язык по своему выбору, и применение Цифровая обработка изображений на исходном изображении, чтобы получить переведенное изображение на новый язык. Перевод изображений связан с машинный перевод.

Общий

Машинный перевод, доступный в Интернете (в Интернете и на мобильных устройствах), является заметным достижением в многоязычном общении, устраняя необходимость в переводчике-посреднике, перевод иностранных текстов по-прежнему представляет собой проблему для пользователя, поскольку нельзя ожидать, что он сможет набрать иностранный текст, который они хотят перевести и понять. Ввод иностранного текста вручную может оказаться затруднительным, особенно в случаях, когда незнакомый алфавит используется из сценария, который пользователь не может прочитать, например Кириллица, китайский, японский и т. Д. Для англоговорящего или любого говорящего на латинском языке или наоборот.

Технические достижения в области оптического распознавания символов сделали возможным распознавать текст на изображениях. Возможность использовать камеру мобильного устройства для захвата и извлечения печатного текста также известна как мобильное распознавание текста и впервые была представлена ​​в мобильных телефонах японского производства в 2004 году. С помощью камеры портативного устройства можно было сфотографировать (строку) текста и получить он извлекается (оцифровывается) для дальнейших манипуляций, таких как сохранение информации в их списке контактов, в виде адреса веб-страницы (URL) или текста для использования в SMS / сообщении электронной почты и т. д.

В настоящее время мобильные устройства с разрешением камеры 2 мегапикселя или выше и возможностью автофокусировки часто имеют службу текстового сканера. Сделав еще один шаг вперед в области сканирования текста, появился перевод изображений, дающий пользователям возможность захватывать текст с помощью камеры своего мобильного телефона, извлекать текст и переводить его на свой язык.

На этой технологии появляется все больше и больше приложений, включая Word Lens.[1][циркулярная ссылка ]. После приобретения Google он стал частью мобильного приложения Google Translate.

Еще одно одновременное продвижение в области обработки изображений позволило теперь заменить текст на изображении переведенным текстом и полностью создать новое изображение.[2]

История

Развитие услуги перевода изображений происходит из достижений в технологии OCR (миниатюризация и сокращение потребляемых ресурсов памяти), позволяющих сканировать текст на мобильных телефонах.

Среди первых, кто анонсировал мобильное программное обеспечение, способное «читать» текст с помощью камеры мобильного устройства, является International Wireless Inc., которая в феврале 2003 года выпустила свои приложения «CheckPoint» и «WebPoint». «CheckPoint» считывает важную символическую информацию о чеках и направлен на сокращение потерь, которые мобильные продавцы несут из-за «отказов» чеков путем сканирования MICR номер внизу чека, а «WebPoint» позволяет визуально распознавать и декодировать напечатанные URL-адреса, которые затем открываются веб-браузером устройства.[3]

Однако первый коммерческий выпуск мобильного сканера текста состоялся в декабре 2004 года, когда Vodafone и Sharp начали продавать мобильный телефон 902SH, который был первым с 2-мегапиксельной цифровой камерой с оптическим зумом. Среди различных мультимедийных функций устройства был встроенный сканер текста / штрих-кода / QR-кода. Функция текстового сканера может обрабатывать до 60 буквенных символов одновременно. Отсканированный текст затем может быть отправлен в виде сообщения электронной почты или SMS, добавлен в качестве словарной статьи или, в случае отсканированных URL-адресов, открыт через веб-браузер устройства. Все последующие мобильные телефоны Sharp оснащены функцией сканера текста.[4]

В сентябре 2005 г. Корпорация NEC а Институт науки и технологий Нара в Японии (NAIST) объявил о новом программном обеспечении, способном превращать телефоны с камерой в сканеры текста. Приложение существенно отличается от аналогичных мобильных телефонов в Японии (способных сканировать визитные карточки и небольшие фрагменты текста и использовать OCR для преобразования их в редактируемый текст или в URL-адреса) способностью сканировать всю страницу. Обе компании, однако, заявили, что не будут выпускать программное обеспечение в коммерческую эксплуатацию до конца 2008 года.[5]

Объединение функции сканера текста с технологией машинного перевода было впервые предложено американской компанией RantNetwork, которая в июле 2007 года начала продавать Communilator, приложение машинного перевода для мобильных устройств с функцией перевода изображений. Используя встроенную камеру, мобильный пользователь мог сфотографировать печатный текст, применить OCR для распознавания текста, а затем перевести его на любой из более чем 25 доступных языков.[6]

В апреле 2008 года Nokia представила свое приложение Shoot-to-Translate для модели N73, которое позволяет делать снимки с помощью камеры устройства, извлекать текст и затем переводить его. Приложение предлагает только перевод с китайского на английский и не обрабатывает большие фрагменты текста. Nokia заявила, что находится в процессе разработки своего продукта Multiscanner, который, помимо сканирования текста и визитных карточек, сможет переводить на 52 языка.[7]

В апреле 2008 года корейская компания Unichal Inc. выпустила свой портативный текстовый сканер Dixau, способный сканировать и распознавать английский текст, а затем переводить его на корейский язык с помощью инструментов онлайн-перевода, таких как Wikipedia или Google Translate. Устройство подключается к ПК или ноутбуку через порт USB.[8]

В феврале 2009 года болгарская компания Interlecta представила на Mobile World Congress в Барселоне свой мобильный переводчик, включающий распознавание изображений и синтез речи. Приложение поддерживает все европейские языки, а также китайский, японский и корейский. Программное обеспечение подключается к серверу через Интернет для распознавания изображений и перевода.[9]

В мае 2014 года Google приобрел Word Lens, чтобы улучшить качество визуального и голосового перевода. Он может сканировать текст или изображение с помощью устройства и мгновенно переводить их.[10][циркулярная ссылка ]

Поскольку OCR улучшается, многие компании или веб-сайты начали комбинировать OCR и перевод, чтобы читать текст с изображения и отображать переведенный текст.

В августе 2018 года индийская компания создала ImageTranslate. Он может читать, переводить и воссоздавать изображение на другом языке.

В настоящее время перевод изображений предлагают следующие компании:

  • Приложение Google Translate с камерой
  • ImageTranslate[11]
  • Яндекс[12]

Рекомендации

  1. ^ "WordLens Tm: wiki". Получено 2019-03-23.
  2. ^ "ImageTranslate Tm: веб-сайт". Получено 2019-03-23.
  3. ^ «International Wireless, Inc. считывает личные чеки с мобильных телефонов. - Бесплатная онлайн-библиотека». Thefreelibrary.com. Получено 2012-02-24.
  4. ^ «Sharp 902 - первый в Европе мобильный телефон 3G с 2-мегапиксельной цифровой камерой». UMTS Форум. Получено 2012-02-24.
  5. ^ «Камеры телефонов будут высокоточными сканерами - технология - 14 сентября 2005 г.». Новый ученый. Получено 2012-02-24.
  6. ^ "RantNetwork TM: PressRelease". Rantnetwork.com. Получено 2012-02-24.
  7. ^ [1] В архиве 12 апреля 2009 г. Wayback Machine
  8. ^ "Словарь в 1 клик Dixau - Новости - Сканер текста Dixau" (на корейском). En.dixau.com. Получено 2012-02-24.
  9. ^ «Программа перевода с речью для BlackBerry». Архивировано из оригинал 13 января 2010 г.. Получено 28 апреля, 2017.
  10. ^ "Переводчик Google". Получено 23 марта, 2019.
  11. ^ «ImageTranslate». Получено 23 марта, 2019.
  12. ^ «Яндекс окр переводчик». Получено 23 марта, 2019.