Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Автоматизированный перевод ( CAT ), также называемый машинным переводом ( MAT ) или машинным переводом, выполняемым человеком ( MAHT ), представляет собой использование программного обеспечения для помощи переводчику-человеку в процессе перевода . Перевод создается человеком, а некоторые аспекты процесса выполняются с помощью программного обеспечения; это контрастирует с машинным переводом (МП), в котором перевод создается компьютером, возможно, с некоторым вмешательством человека (например, предварительное редактирование и постредактирование). [1]

Под CAT-программами обычно понимаются программы, которые специально облегчают сам процесс перевода. Большинство программ CAT имеют (а) возможность переводить различные форматы исходных файлов в единой среде редактирования без необходимости использования программного обеспечения, связанного с форматом файлов, для большей части или всего процесса перевода, (б) память переводов и (в) интеграция различных утилит или процессов, повышающих производительность и согласованность при переводе.

Набор инструментов [ править ]

Компьютерный перевод - это широкий и неточный термин, охватывающий целый ряд инструментов. Они могут включать:

  • Инструменты памяти переводов (инструменты TM), состоящие из базы данных фрагментов текста на исходном языке и их переводов на один или несколько целевых языков. [2]
  • Средства проверки орфографии , встроенные в программное обеспечение для обработки текстов или доступные в качестве дополнительных программ.
  • Средства проверки грамматики , встроенные в текстовый редактор или доступные в качестве дополнительных программ.
  • Менеджеры терминологии , которые позволяют переводчикам управлять собственным банком терминологии в электронном виде. Это может быть простая таблица, созданная в текстовом редакторе или электронной таблице переводчика, база данных, созданная в такой программе, как FileMaker Pro, или, для более надежных (и более дорогих) решений, специализированных программных пакетов, таких как SDL MultiTerm , LogiTerm, Termex. , TermWeb и т. Д.
  • Электронные словари, одноязычные или двуязычные
  • Терминологические базы данных, расположенные на главном компьютере или доступные через Интернет, такие как TERMIUM Plus или Grand dictionnaire terminologique из Office québécois de la langue française
  • Инструменты полнотекстового поиска (или индексаторы), которые позволяют пользователю запрашивать уже переведенные тексты или справочные документы различного типа. Некоторыми такими индексаторами являются ISYS Search Software , dtSearch Desktop и Naturel.
  • Конкордансеры , которые представляют собой программы, которые извлекают экземпляры слова или выражения и их соответствующий контекст в одноязычном, двуязычном или многоязычном корпусе, таком как битекст или память переводов.
  • Выравниватели Bitext : инструменты, выравнивающие исходный текст и его перевод, которые затем могут быть проанализированы с помощью инструмента полнотекстового поиска или конкордансера.
  • Программное обеспечение для управления проектами, которое позволяет лингвистам структурировать сложные переводческие проекты в виде цепочки задач (часто называемых «рабочий процесс»), назначать различные задачи разным людям и отслеживать ход выполнения каждой из этих задач.

Концепции [ править ]

Программное обеспечение памяти переводов [ править ]

Программы памяти переводов хранят ранее переведенные исходные тексты и их эквивалентные целевые тексты в базе данных и извлекают связанные сегменты во время перевода новых текстов. [3]

Такие программы разбивают исходный текст на управляемые единицы, известные как «сегменты». Предложение исходного текста или подобная предложению единица (заголовки, заголовки или элементы в списке) могут считаться сегментом. Тексты также могут быть разделены на более крупные блоки, такие как абзацы, или небольшие, например, статьи. По мере того как переводчик работает с документом, программное обеспечение отображает каждый исходный сегмент по очереди и предоставляет предыдущий перевод для повторного использования, если он находит соответствующий исходный сегмент в своей базе данных. В противном случае программа позволяет переводчику ввести перевод для нового сегмента. После завершения перевода сегмента программа сохраняет новый перевод и переходит к следующему сегменту. В доминирующей парадигме память переводов, в принципе, представляет собой простую базу данных полей, содержащих сегмент исходного языка,перевод сегмента и другая информация, такая как дата создания сегмента, последний доступ, имя переводчика и т. д. Другой подход к памяти переводов не предполагает создания базы данных, вместо этого полагаясь на согласованные справочные документы.[4]

Некоторые программы памяти переводов функционируют как автономные среды, в то время как другие функционируют как надстройки или макросы для коммерчески доступных текстовых процессоров или других программ для бизнеса. Дополнительные программы позволяют обрабатывать исходные документы из других форматов, такие как файлы настольных издательских систем, электронные таблицы или HTML- код, с помощью программы TM.

Программное обеспечение языковой поисковой системы [ править ]

Новое в индустрии перевода , язык программного обеспечения для поисковых систем , как правило , система Интернет-которая работает так же , как в поисковых системах Интернета. Однако вместо того, чтобы искать в Интернете, языковая поисковая машина выполняет поиск в большом репозитории памяти переводов, чтобы найти ранее переведенные фрагменты предложений, фразы, целые предложения, даже полные абзацы, которые соответствуют сегментам исходного документа.

Поисковые системы по языку предназначены для использования современных поисковых технологий для выполнения поиска на основе исходных слов в контексте, чтобы гарантировать, что результаты поиска соответствуют значению исходных сегментов. Как и традиционные инструменты TM, ценность языковой поисковой системы в значительной степени зависит от репозитория памяти переводов, в котором она выполняет поиск.

Программное обеспечение для управления терминологией [ править ]

Программное обеспечение для управления терминологией предоставляет переводчику средства автоматического поиска терминов, встречающихся в документе, в данной терминологической базе данных, либо путем автоматического отображения терминов в окне интерфейса программного обеспечения памяти переводов, либо с помощью горячих клавиш для просмотра записи в терминологической базе данных. Некоторые программы имеют другие комбинации горячих клавиш, позволяющие переводчику добавлять новые терминологические пары в терминологическую базу данных на лету во время перевода. Некоторые из более совершенных систем позволяют переводчикам выполнять проверку в интерактивном или пакетном режиме., если правильная комбинация исходного и целевого терминов использовалась внутри и между сегментами памяти переводов в данном проекте. Также существуют независимые системы управления терминологией, которые могут обеспечивать функциональность рабочего процесса, визуальную таксономию, работать как тип средства проверки терминов (аналогично проверке орфографии, термины, которые использовались неправильно, помечаются) и могут поддерживать другие типы многоязычных классификаций аспектов терминов, такие как изображения, видео или звук. [5] [3]

Программное обеспечение для центровки [ править ]

Программы выравнивания берут завершенные переводы, разделяют исходный и целевой текст на сегменты и пытаются определить, какие сегменты принадлежат друг другу, чтобы создать память переводов или другой справочный ресурс с содержанием. Многие программы выравнивания позволяют переводчикам вручную выравнивать несовпадающие сегменты. Полученное в результате выравнивание битекста (также известного как параллельный текст ) можно затем импортировать в программу памяти переводов для будущих переводов или использовать в качестве справочного документа.

Интерактивный машинный перевод [ править ]

Интерактивный машинный перевод - это парадигма, в которой автоматическая система пытается предсказать перевод, который собирается произвести человек-переводчик, предлагая гипотезы перевода. Эти гипотезы могут быть либо полным предложением, либо частью предложения, которое еще предстоит перевести.

Дополненный перевод [ править ]

Расширенный перевод - это форма перевода, выполняемого человеком в интегрированной технологической среде, которая предоставляет переводчикам доступ к подсегментным адаптивным машинным переводам (MT) и памяти переводов (TM), поиску терминологии (CAT) и автоматическому обогащению контента (ACE), чтобы помочь им work, что автоматизирует управление проектами, обработку файлов и другие вспомогательные задачи. [6] [7]

Основанный на концепции дополненной реальности , дополненный перевод стремится сделать переводчиков более продуктивными, предоставляя им актуальную информацию по мере необходимости. Эта информация адаптируется к привычкам и стилю отдельных переводчиков, чтобы ускорить их работу и повысить производительность. Он отличается от классического постдайтинга МП , при котором лингвисты проверяют целые тексты, переведенные машинами, тем, что он предоставляет машинный перевод и информацию в виде предложений, которые могут быть приняты полностью, отредактированы или проигнорированы, в зависимости от обстоятельств . [6]

Расширенный перевод расширяет принципы, впервые разработанные в 1980-х годах, которые вошли в CAT-инструменты. Однако он объединяет несколько функций, которые ранее были дискретными, в одной среде. Например, переводчикам исторически приходилось покидать свои переводческие среды, чтобы проводить исследования терминологии, но в расширенной среде компонент ACE автоматически предоставлял бы ссылки на информацию о терминах и концепциях, встречающихся в тексте, непосредственно в среде.

По состоянию на май 2017 года не существует полных реализаций расширенной среды перевода, хотя отдельные разработчики создали частичные системы.

См. Также [ править ]

  • Сравнение средств компьютерного перевода
  • Компьютерная лингвистика
  • Компьютерное рецензирование
  • Нечеткое соответствие
  • Перевод
  • Компьютерный перевод

Ссылки [ править ]

  1. 2010, «Компьютерный перевод», Линн Боукер и Дес Фишер, в «Справочнике по исследованиям перевода», отредактированный Gambier & Doorslaer, стр. 70.
  2. ^ Кристенсен, Тина Полсен; Schjoldager, Энн. "Исследование памяти переводов (TM): что мы знаем и как мы это знаем?" (PDF) . Гермес . 44 .
  3. ^ a b "Управление терминологией и машинное обучение" (PDF) . Схема . 117 .
  4. ^ "Инструменты CAT против машинного перевода: какой метод лучше?" . Азиатский Абсолют . Проверено 29 января 2017 года .
  5. ^ «Архивная копия» (PDF) . Архивировано из оригинального (PDF) 25 апреля 2012 года . Проверено 3 октября 2011 . CS1 maint: заархивированная копия как заголовок ( ссылка )
  6. ^ а б ДеПальма, Дональд А. и Арль Ломмель (2017-02-15). «Расширенный перевод расширяет возможности языковых служб» . Консультации по здравому смыслу . Проверено 19 мая 2017 .
  7. ^ Эггерс, Уильям Д., Дэвид Шацки и доктор Питер Вехницки (2017-04-26). «Правительство с искусственным интеллектом: использование когнитивных технологий для реорганизации работы государственного сектора» . Deloitte University Press . Проверено 19 мая 2017 .

Внешние ссылки [ править ]

  • Компьютерный перевод в Curlie
  • Машинный перевод и компьютерный перевод: новый способ перевода?