Компьютерный перевод


Из Википедии, бесплатной энциклопедии
  (Перенаправлено с машинного перевода )
Перейти к навигации Перейти к поиску

Компьютерный перевод ( CAT ), также называемый машинным переводом ( MAT ) или автоматическим переводом ( MAHT ), представляет собой использование программного обеспечения для помощи переводчику-человеку в процессе перевода . Перевод создается человеком, а некоторые аспекты процесса облегчаются программным обеспечением; это отличается от машинного перевода (МТ), при котором перевод создается компьютером, возможно, с некоторым вмешательством человека (например, предварительное и постредактирование). [1]

Обычно под CAT-инструментами понимаются программы, которые специально облегчают фактический процесс перевода. Большинство инструментов CAT имеют (а) возможность переводить различные форматы исходных файлов в единой среде редактирования без необходимости использования программного обеспечения, связанного с форматом файла, для большей части или всего процесса перевода, (б) память переводов и (в) интеграция различных утилит или процессов, повышающих производительность и согласованность перевода.

Ассортимент инструментов

Компьютерный перевод — это широкий и неточный термин, охватывающий целый ряд инструментов. Сюда могут входить:

  • Инструменты памяти переводов (инструменты TM), состоящие из базы данных текстовых сегментов на исходном языке и их переводов на один или несколько целевых языков. [2]
  • Средства проверки орфографии , встроенные в текстовые редакторы или доступные в виде дополнительных программ .
  • Средства проверки грамматики , встроенные в программное обеспечение для обработки текстов или доступные в качестве дополнительных программ.
  • Менеджеры терминологии , которые позволяют переводчикам управлять собственным банком терминологии в электронной форме. Это может быть простая таблица, созданная в текстовом редакторе или электронной таблице переводчика, база данных, созданная в такой программе, как FileMaker Pro , или, для более надежных (и более дорогих) решений, специализированные программные пакеты, такие как SDL MultiTerm , LogiTerm, Termex. , TermWeb и т. д.
  • Электронные словари, одноязычные или двуязычные
  • Базы данных терминологии, находящиеся либо на главном компьютере, либо доступные через Интернет, такие как TERMIUM Plus или Grand Dictionnaire terminologique из Управления французского языка в Квебеке.
  • Инструменты полнотекстового поиска (или индексаторы), которые позволяют пользователю запрашивать уже переведенные тексты или справочные документы различного рода. Некоторыми такими индексаторами являются ISYS Search Software , dtSearch Desktop и Naturel.
  • Concordancers , которые представляют собой программы, которые извлекают экземпляры слова или выражения и их соответствующий контекст в одноязычном, двуязычном или многоязычном корпусе, таком как битекст или память переводов.
  • Выравниватели битекста : инструменты, которые выравнивают исходный текст и его перевод, который затем можно проанализировать с помощью инструмента полнотекстового поиска или средства согласования.
  • Программное обеспечение для управления проектами , которое позволяет лингвистам структурировать сложные переводческие проекты в виде цепочки задач (часто называемой «рабочим процессом»), назначать различные задачи разным людям и отслеживать ход выполнения каждой из этих задач.

Концепции

Программное обеспечение памяти переводов

Программы памяти переводов сохраняют ранее переведенные исходные тексты и эквивалентные им целевые тексты в базе данных и извлекают связанные сегменты во время перевода новых текстов. [3]

Такие программы разбивают исходный текст на управляемые единицы, известные как «сегменты». Предложение исходного текста или подобная предложению единица (заголовки, заголовки или элементы в списке) могут считаться сегментом. Тексты также могут быть разделены на более крупные единицы, такие как абзацы, или на более мелкие, такие как пункты. По мере того как переводчик работает с документом, программное обеспечение по очереди отображает каждый исходный сегмент и предоставляет предыдущий перевод для повторного использования, если находит соответствующий исходный сегмент в своей базе данных. Если это не так, программа позволяет переводчику ввести перевод для нового сегмента. После завершения перевода сегмента программа сохраняет новый перевод и переходит к следующему сегменту. В господствующей парадигме память переводов представляет собой, в принципе, простую базу данных полей, содержащих сегмент исходного языка, перевод сегмента и другую информацию, такую ​​как дата создания сегмента, последний доступ, имя переводчика и т. д. Другой подход к памяти переводов не предполагает создания базы данных, вместо этого полагаясь на выровненные справочные документы.[4]

Некоторые программы памяти переводов функционируют как автономные среды, в то время как другие функционируют как надстройка или макрос для коммерчески доступных текстовых процессоров или других программ для бизнеса. Дополнительные программы позволяют обрабатывать исходные документы из других форматов, таких как файлы настольных издательских систем, электронные таблицы или HTML -код, с помощью программы TM.

Программное обеспечение для языкового поиска

Программное обеспечение для языковых поисковых систем, новое в индустрии переводов , обычно представляет собой интернет-систему, которая работает аналогично поисковым системам в Интернете. Однако вместо поиска в Интернете механизм языкового поиска ищет в большом хранилище памяти переводов, чтобы найти ранее переведенные фрагменты предложений, фразы, целые предложения и даже полные абзацы, которые соответствуют сегментам исходного документа.

Механизмы языкового поиска предназначены для использования современных поисковых технологий для проведения поиска на основе исходных слов в контексте, чтобы гарантировать, что результаты поиска соответствуют значению исходных сегментов. Как и в случае с традиционными инструментами TM, ценность системы языкового поиска во многом зависит от репозитория Translation Memory, в котором она осуществляет поиск.

Программное обеспечение для управления терминологией

Программное обеспечение для управления терминологией предоставляет переводчику средства автоматического поиска в данной терминологической базе данных терминов, встречающихся в документе, либо путем автоматического отображения терминов в окне интерфейса программного обеспечения памяти переводов, либо с помощью горячих клавиш для просмотра записи в терминологической базе данных. Некоторые программы имеют другие комбинации горячих клавиш, позволяющие переводчику добавлять новые терминологические пары в терминологическую базу на лету во время перевода. Некоторые из более продвинутых систем позволяют переводчикам выполнять проверку либо в интерактивном, либо в пакетном режиме ., если внутри и между сегментами памяти переводов в данном проекте использовалась правильная комбинация исходного/целевого термина. Также существуют независимые системы управления терминологией, которые могут обеспечивать функциональные возможности рабочего процесса, визуальную таксономию, работать как тип проверки терминов (аналогично проверке орфографии, неправильно используемые термины помечаются) и могут поддерживать другие типы многоязычных классификаций терминов, такие как изображения, видео или звук. [5] [3]

Программное обеспечение для выравнивания

Программы выравнивания берут завершенные переводы, делят исходный и целевой тексты на сегменты и пытаются определить, какие сегменты принадлежат друг другу, чтобы создать память переводов или другой справочный ресурс с содержанием. Многие программы выравнивания позволяют переводчикам вручную выравнивать несовпадающие сегменты. Полученное битекстовое (также известное как параллельный текст ) выравнивание можно затем импортировать в программу памяти переводов для будущих переводов или использовать в качестве справочного документа.

Интерактивный машинный перевод

Интерактивный машинный перевод — это парадигма, в которой автоматическая система пытается предсказать перевод, который собирается выполнить человек-переводчик, предлагая гипотезы перевода. Эти гипотезы могут быть либо полным предложением, либо частью предложения, которую еще предстоит перевести.

Дополненный перевод

Дополненный перевод — это форма человеческого перевода, выполняемая в интегрированной технологической среде, которая предоставляет переводчикам доступ к подсегментам адаптивного машинного перевода (MT) и памяти переводов (TM), поиску терминологии (CAT) и автоматическому обогащению контента (ACE), чтобы помочь им. работы, и это автоматизирует управление проектами, работу с файлами и другие вспомогательные задачи. [6] [7]

Основываясь на концепции дополненной реальности , дополненный перевод направлен на то, чтобы сделать переводчиков более продуктивными, предоставляя им соответствующую информацию по мере необходимости. Эта информация адаптируется к привычкам и стилю отдельных переводчиков, чтобы ускорить их работу и повысить производительность. Он отличается от классического постредактирования МП , при котором лингвисты редактируют целые тексты, переведенные машинами, тем, что он предоставляет машинный перевод и информацию в виде предложений, которые можно полностью принять, отредактировать или проигнорировать в зависимости от ситуации. [6]

Дополненный перевод расширяет принципы, впервые разработанные в 1980-х годах, которые нашли применение в CAT-инструментах. Однако он объединяет несколько функций, которые ранее были отдельными в одной среде. Например, исторически переводчикам приходилось покидать свою среду перевода, чтобы проводить исследования терминологии, но в расширенной среде компонент ACE автоматически предоставлял ссылки на информацию о терминах и понятиях, встречающихся в тексте, непосредственно в среде.

По состоянию на май 2017 года не существует полных реализаций расширенной среды перевода, хотя отдельные разработчики создали частичные системы.

Смотрите также

  • Сравнение средств компьютерного перевода
  • Компьютерная лингвистика
  • Компьютерное рецензирование
  • Нечеткое соответствие
  • Перевод
  • Компьютерный устный перевод

использованная литература

  1. 2010 г., «Компьютерный перевод», Линн Боукер и Дес Фишер, в «Справочнике по переводоведению» под редакцией Gambier & Doorslaer, стр. 70.
  2. ^ Кристенсен, Тина Полсен; Шёлдагер, Энн. «Исследование памяти перевода (ТМ): что мы знаем и откуда мы это знаем?» (PDF) . Гермес . 44 .
  3. ^ a b «Управление терминологией и машинный перевод» (PDF) . Схема . 117 .
  4. ^ «Инструменты CAT против машинного перевода: какой метод лучше?» . Абсолют Азии . Проверено 29 января 2017 г.
  5. ^ «Архивная копия» (PDF) . Архивировано из оригинала (PDF) 25 апреля 2012 г .. Проверено 3 октября 2011 г. . {{cite web}}: CS1 maint: заархивированная копия как заголовок ( ссылка )
  6. ^ a b ДеПальма, Дональд А. и Арле Ломмель (15 февраля 2017 г.). «Расширенный перевод усиливает языковые услуги» . Совет по здравому смыслу . Проверено 19 мая 2017 г. .
  7. Эггерс, Уильям Д., Дэвид Шацкий и доктор Питер Вечницкий (26 апреля 2017 г.). «Правительство с искусственным интеллектом: использование когнитивных технологий для реорганизации работы государственного сектора» . Издательство Университета Делойта . Проверено 19 мая 2017 г. .

внешние ссылки

  • Компьютерный перевод в Curlie
  • Машинный перевод и автоматизированный перевод: новый способ перевода?
Получено с " https://en.wikipedia.org/w/index.php?title=Computer- Assistance_translation &oldid=1052581420 "