Перевод изображений


Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Перевод изображений - это машинный перевод изображений печатного текста (плакатов, баннеров, меню, снимков экрана и т. Д.). Это достигается путем применения технологии оптического распознавания символов (OCR) к изображению для извлечения любого текста, содержащегося в изображении, с последующим переводом этого текста на язык по своему выбору и применением цифровой обработки изображения к исходному изображению для получения переведенное изображение на новый язык.

Общий

Машинный перевод, доступный в Интернете (в Интернете и на мобильных устройствах), является заметным достижением в многоязычном общении, устраняя необходимость в переводчике-посреднике, перевод иностранных текстов по-прежнему представляет проблему для пользователя, поскольку нельзя ожидать, что он сможет набирать текст. иностранный текст, который они хотят перевести и понять. Ручной ввод иностранного текста может оказаться затруднительным, особенно в тех случаях, когда незнакомый алфавит используется из сценария, который пользователь не может прочитать, например, кириллица, китайский, японский и т. Д. Для англоговорящего или любого говорящего на латинице. язык или наоборот.

Технические достижения в области распознавания текста сделали возможным распознавание текста на изображениях. Возможность использовать камеру мобильного устройства для захвата и извлечения печатного текста также известна как мобильное распознавание текста и впервые была представлена ​​в мобильных телефонах японского производства в 2004 году. С помощью камеры портативного устройства можно было сфотографировать (строку) текста и получить он извлекается (оцифровывается) для дальнейших манипуляций, таких как сохранение информации в их списке контактов, в виде адреса веб-страницы (URL) или текста для использования в SMS / сообщении электронной почты и т. д.

В настоящее время мобильные устройства с разрешением камеры 2 мегапикселя или выше и возможностью автофокусировки часто имеют службу текстового сканера. Сделав еще один шаг вперед в области сканирования текста, появился перевод изображений, дающий пользователям возможность захватывать текст с помощью камеры своего мобильного телефона, извлекать текст и переводить его на свой родной язык.

Появилось все больше и больше приложений, использующих эту технологию, включая Word Lens [1] [ круговая ссылка ] . После приобретения Google он стал частью мобильного приложения Google Translate.

Еще одно одновременное усовершенствование в обработке изображений позволило теперь заменить текст на изображении переведенным текстом и полностью создать новое изображение. [2]

История

Развитие службы перевода изображений происходит из достижений в технологии OCR (миниатюризация и сокращение потребляемых ресурсов памяти), позволяющих сканировать текст на мобильных телефонах.

Среди первых, кто анонсировал мобильное программное обеспечение, способное «читать» текст с помощью камеры мобильного устройства, является International Wireless Inc., которая в феврале 2003 года выпустила свои приложения «CheckPoint» и «WebPoint». «CheckPoint» считывает важную символическую информацию о чеках и направлен на сокращение потерь, которые мобильные продавцы терпят от «отклоненных» чеков, путем сканирования номера MICR в нижней части чека, в то время как «WebPoint» позволяет визуально распознавать и декодировать напечатанные URL-адреса, которые затем открываются веб-браузером устройства. [3]

Однако первый коммерческий выпуск мобильного сканера текста состоялся в декабре 2004 года, когда Vodafone и Sharp начали продавать мобильный телефон 902SH, который был первым с 2-мегапиксельной цифровой камерой с оптическим зумом. Среди различных мультимедийных функций устройства был встроенный сканер текста / штрих-кода / QR-кода. Функция текстового сканера может обрабатывать до 60 буквенных символов одновременно. Затем отсканированный текст может быть отправлен в виде сообщения электронной почты или SMS, добавлен в виде словарной статьи или, в случае отсканированных URL-адресов, открыт через веб-браузер устройства. Все последующие мобильные телефоны Sharp оснащены функцией сканера текста. [4]

В сентябре 2005 года корпорация NEC и Институт науки и технологий Нара в Японии (NAIST) объявили о новом программном обеспечении, способном преобразовывать телефоны с камерой в сканеры текста. Приложение существенно отличается от аналогичных мобильных телефонов в Японии (способных сканировать визитные карточки и небольшие фрагменты текста и использовать OCR для преобразования их в редактируемый текст или в URL-адреса) способностью сканировать всю страницу. Однако обе компании заявили, что не будут выпускать программное обеспечение в коммерческую эксплуатацию до конца 2008 года [5].

Объединение функции сканера текста с технологией машинного перевода было впервые предложено американской компанией RantNetwork, которая в июле 2007 года начала продавать Communilator, приложение машинного перевода для мобильных устройств с функцией перевода изображений. Используя встроенную камеру, мобильный пользователь мог сфотографировать печатный текст, применить оптическое распознавание текста, чтобы распознать текст, а затем перевести его на любой из более чем 25 доступных языков. [6]

В апреле 2008 года Nokia представила свое приложение Shoot-to-Translate для модели N73, которое способно делать снимки с помощью камеры устройства, извлекать текст и затем переводить его. Приложение предлагает только перевод с китайского на английский и не обрабатывает большие фрагменты текста. Nokia заявила, что находится в процессе разработки своего продукта Multiscanner, который, помимо сканирования текста и визитных карточек, сможет переводить на 52 языка. [7]

В апреле 2008 года корейская компания Unichal Inc. выпустила свой портативный сканер текста Dixau, способный сканировать и распознавать английский текст, а затем переводить его на корейский язык с помощью инструментов онлайн-перевода, таких как Wikipedia или Google Translate. Устройство подключается к ПК или ноутбуку через порт USB. [8]

В феврале 2009 года болгарская компания Interlecta представила на Mobile World Congress в Барселоне свой мобильный переводчик, включающий распознавание изображений и синтез речи. Приложение поддерживает все европейские языки, а также китайский, японский и корейский. Программное обеспечение подключается к серверу через Интернет для распознавания изображений и перевода. [9]

В мае 2014 года Google приобрел Word Lens, чтобы улучшить качество визуального и голосового перевода. Он может сканировать текст или изображение с помощью своего устройства и мгновенно переводить их. [10] [ циркулярная ссылка ]

Поскольку OCR улучшается, многие компании или веб-сайты начали комбинировать OCR и перевод, чтобы читать текст с изображения и отображать переведенный текст.

В августе 2018 года индийская компания создала ImageTranslate. Он может читать, переводить и воссоздавать изображение на другом языке.

В настоящее время перевод изображений предлагают следующие компании:

  • Приложение Google Translate с камерой
  • ImageTranslate [11]
  • Яндекс [12]

использованная литература

  1. ^ WordLens Tm: wiki , дата обращения 23 марта 2019.
  2. ^ "ImageTranslate Tm: веб-сайт" . Проверено 23 марта 2019 .
  3. ^ «International Wireless, Inc. читает личные чеки с мобильных телефонов. - Бесплатная онлайн-библиотека» . Thefreelibrary.com . Проверено 24 февраля 2012 .
  4. ^ "Sharp 902 - первый в Европе мобильный телефон 3G с 2-мегапиксельной цифровой камерой" . Форум UMTS . Проверено 24 февраля 2012 .
  5. ^ "Камеры телефонов будут высокоточными сканерами - технология - 14 сентября 2005" . Новый ученый . Проверено 24 февраля 2012 .
  6. ^ "RantNetwork TM: PressRelease" . Rantnetwork.com . Проверено 24 февраля 2012 .
  7. ^ [1] Архивировано 12 апреля 2009 года в Wayback Machine.
  8. ^ «Словарь в 1 клик Dixau - Новости - Сканер текста Dixau» (на корейском языке). En.dixau.com . Проверено 24 февраля 2012 .
  9. ^ «Программа перевода с речью для BlackBerry» . Архивировано из оригинального 13 января 2010 года . Проверено 28 апреля 2017 года .
  10. ^ Google Переводчик
  11. ^ "ImageTranslate" . Проверено 23 марта 2019 года .
  12. ^ "Яндекс ocr переводчик" . Проверено 23 марта 2019 года .
Источник « https://en.wikipedia.org/w/index.php?title=Image_translation&oldid=1045481056 »