Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

После редактирования (или постредактирование ) является процессом , посредством которого люди поправки машинного перевода сгенерированных для достижения приемлемого конечного продукта. Публикующего редактора называют редактором . Концепция постредактирования связана с концепцией предварительного редактирования . В процессе перевода текста с помощью машинного перевода наилучшие результаты могут быть получены путем предварительного редактирования исходного текста - например, путем применения принципов управляемого языка  - и последующего редактирования машинного вывода. Это отличается от редактирования, который относится к процессу улучшения текста, созданного человеком (процесс, который часто называют редактированием в области перевода). Отредактированный текст впоследствии может быть изменен, чтобы гарантировать качество выбранных языков, которые проверяются для исправления простых ошибок.

Постредактирование включает исправление вывода машинного перевода, чтобы обеспечить его соответствие уровню качества, заранее согласованному между клиентом и постредактором. Легкое постредактирование направлено на то, чтобы сделать вывод просто понятным; полное постредактирование, чтобы сделать его еще и стилистически подходящим. С развитием машинного перевода полное постредактирование становится альтернативой ручному переводу. Практически все инструменты компьютерного перевода (CAT) теперь поддерживают постредактирование результатов машинного перевода.

Постредактирование и машинный перевод [ править ]

Машинный перевод покинул лаборатории и начал использоваться по назначению в конце семидесятых в некоторых крупных учреждениях, таких как Европейская комиссия и Панамериканская организация здравоохранения , а затем, позже, в некоторых корпорациях, таких как Caterpillar и General Motors . Первые исследования постредактирования появились в восьмидесятых годах и были связаны с этими реализациями. [1] Для разработки соответствующих руководств и обучения члены Американской ассоциации машинного перевода (AMTA) и Европейской ассоциации машинного перевода (EAMT) в 1999 г. учредили Специальную группу по постредактированию. [2]

После девяностых годов развитие компьютерных мощностей и возможностей подключения ускорило разработку машинного перевода и позволило его развертывать через веб-браузер, в том числе в качестве бесплатного полезного дополнения к основным поисковым системам ( Google Translate , Bing Translator , Yahoo! Babel Fish ). Более широкое признание несовершенного машинного перевода сопровождалось также более широким распространением постредактирования. Поскольку спрос на локализацию товаров и услуг растет такими темпами, которые невозможно удовлетворить с помощью человеческого перевода, даже без поддержки памяти переводов и других технологий управления переводами, отраслевые организации, такие как Общество пользователей автоматизации перевода (TAUS), ожидают, что машинный перевод и постредактирование будет играть гораздо большую роль в ближайшие несколько лет.[3]

Использование машинного перевода предполагает иногда предварительное редактирование .

Легкое и полное постредактирование [ править ]

В исследованиях восьмидесятых годов проводилось различие между степенями постредактирования, которые в контексте Службы переводов Европейской комиссии сначала определялись как обычные и быстрые [4] или полные и быстрые. [5] Легкое и полное постредактирование кажется наиболее используемой сегодня формулировкой.

Легкое постредактирование подразумевает минимальное вмешательство постредактора, поскольку строго необходимо, чтобы помочь конечному пользователю разобраться в тексте; ожидается, что клиент будет использовать его только для входящих целей, часто когда текст требуется срочно или имеет короткий промежуток времени.

Полное постредактирование предполагает более высокий уровень вмешательства для достижения определенного уровня качества, согласованного между клиентом и постредактором; ожидается, что результатом будет текст, который будет не только понятен, но и представлен некоторым стилистически подходящим образом, чтобы его можно было использовать для ассимиляции и даже для распространения, как для входящих, так и для исходящих целей.

На вершине полного постредактирования находится ожидание уровня качества, неотличимого от уровня качества ручного перевода. Однако предполагалось, что переводчикам требуется меньше усилий для работы непосредственно с исходным текстом, чем для постредактирования версии, созданной машиной. С развитием машинного перевода это может измениться. Для некоторых языковых пар и для некоторых задач, а также с движками, которые были настроены с использованием данных хорошего качества для конкретной предметной области, некоторые клиенты уже просят переводчиков постредактировать вместо перевода с нуля, полагая, что они достигнут аналогичного качества за более низкая стоимость.

Легкая / полная классификация, разработанная в девяностых годах, когда машинный перевод все еще существовал на компакт-дисках, также может не соответствовать достижениям в области машинного перевода при легкой постредактировании. Для некоторых языковых пар и некоторых задач, особенно если исходный текст был предварительно отредактирован, исходный машинный вывод может быть достаточно хорош для целей составления, не требуя последующего вмешательства человека.

Эффективность постредактирования [ править ]

Постредактирование используется, когда необработанный машинный перевод недостаточно хорош и человеческий перевод не требуется. Промышленность рекомендует использовать постредактирование, если оно может как минимум вдвое повысить производительность ручного перевода, а в случае легкого постредактирования даже в четыре раза больше. [ необходима цитата ]

Однако эффективность постредактирования трудно предсказать. Различные исследования, проведенные как в академических кругах, так и в промышленности, утверждали, что постредактирование, как правило, выполняется быстрее, чем перевод с нуля, независимо от языковых пар или опыта переводчиков. [6] Однако нет единого мнения о том, сколько времени можно сэкономить с помощью постредактирования на практике (если оно вообще есть): хотя отрасль сообщает об экономии времени около 40%, [7] некоторые академические исследования показывают, что время экономия в реальных условиях труда, скорее всего, составит 0–20%. Профессионалы также сообщают об отрицательном приросте производительности, когда исправления требуют больше времени, чем перевод с нуля. [8] [9]

Постредактирование и языковая индустрия [ править ]

По прошествии примерно тридцати лет постредактирование все еще остается «зарождающейся профессией». [10] Что такое правильный профиль пост-редактора, еще полностью не изучено. Постредактирование частично совпадает с переводом и редактированием. Большинство думает, что идеальным постредактором будет переводчик, стремящийся обучиться конкретным необходимым навыкам, но есть некоторые, кто думает, что двуязычный без опыта перевода может быть легче обучить. [11] Мало что известно о том, кто на самом деле являются постредакторами, склонны ли они быть профессиональными переводчиками, работают ли они в основном в качестве штатных сотрудников или самостоятельно, и на каких условиях. Многим профессиональным переводчикам не нравится постредактирование, в том числе потому, что оно, как правило, оплачивается по более низким ставкам, чем обычные переводы.Особенно активно об этом говорила Международная ассоциация профессиональных переводчиков (IAPTI). [12]

Качество вывода машинного перевода для постредактирования выше и, следовательно, требует меньше усилий после редактирования, когда машинный перевод обеспечивается нейронным, вертикальным или специализированным механизмом машинного перевода . Повышение эффективности перевода можно измерить с помощью отслеживания времени лингвистов нужно исправить машинный перевод в той же среде перевода, такие как XTM Cloud, [13] система управления переводом и Компьютерный перевод инструмент, где постредактирование раз и лингвистическая оценка качества результаты постредактированных текстов можно сравнить.

Нет четких данных о том, насколько велик пирог постредактирования в переводческой отрасли. Недавний опрос показал, что это предлагают 50% поставщиков языковых услуг, но для 85% из них это составляет менее 10% их пропускной способности. [14] Memsource , веб-инструмент для перевода, утверждает, что более 50 процентов переводов между английским и испанским, французским и другими языками было выполнено на его платформе, сочетающей память переводов с машинным переводом. [15] Постредактирование также осуществляется через переводческие краудсорсинговые порталы, такие как Unbabel, которые, по утверждениям , к ноябрю 2014 года отредактировали более 11 миллионов слов. [16]

В любом случае оценки производительности и объема являются подвижными целями, поскольку достижения в области машинного перевода, в значительной степени обусловленные постредактированным текстом, возвращаемым в его движки, будут означать, что чем больше выполняется постредактирование, тем выше качество машинного перевода и более распространенного постредактирования. [ необходима цитата ]

См. Также [ править ]

  • Машинный перевод
  • Контролируемый язык
  • Память переводов
  • Редактирование
  • Корректура
  • Компьютерный перевод
  • Предварительное редактирование

Ссылки [ править ]

  1. ^ "Сенез, Дороти." Услуги постредактирования для пользователей машинного перевода в Европейской комиссии ". Перевод и компьютер 20. Материалы конференции Aslib, 12 и 13 ноября 1998 г .; Васконселлос, М. и М. Леон (1985). "SPANAM и ENGSPA: машинный перевод в Панамериканской организации здравоохранения". Компьютерная лингвистика 11, 122-136 ". Отсутствует или пусто |url=( справка )
  2. ^ «Аллен, Джеффри.« Постредактирование », в Гарольде Сомерсе (редактор) (2003). Компьютеры и перевод. Руководство переводчика . Бенджаминс: Амстердам / Филадельфия, стр. 312». Отсутствует или пусто |url=( справка )
  3. ^ "Сайт ТАУС" .
  4. ^ "Loffler-Laurian, Anne marie. (1986). Пост-édition rapide и post-édition Conventionelle: deux modalities d'una activité spécifique¨. Multilingua 5, 81-88". Отсутствует или пусто |url=( справка )
  5. ^ "Вагнер, Элизабет." Быстрое постредактирование Systran "Перевод и компьютер 5. Труды конференции Aslib, 10 и 11 ноября 1983". Отсутствует или пусто |url=( справка )
  6. ^ Грин, Спенс, Джеффри Хир и Кристофер Д. Мэннинг (2013). «Эффективность постредактирования человека для языкового перевода» (PDF) . ACM Человеческий фактор в вычислительных системах . CS1 maint: uses authors parameter (link)
  7. ^ Плитт, Мирко и Франсуа Массело (2010). «Тест производительности постредактирования статистического машинного перевода в типичном контексте локализации» (PDF) . Пражский вестник математической лингвистики . 93 : 7–16. DOI : 10.2478 / v10108-010-0010-х .
  8. ^ Марчелло Федерико, Алессандро Каттелан и Марко Тромбетти (2012). «Измерение производительности труда пользователей при машинном переводе с помощью компьютерного перевода» (PDF) . Труды десятой проводимой раз в два года конференции Ассоциации машинного перевода в Северной и Южной Америке (AMTA), Сан-Диего, Калифорния, 28 октября - 1 ноября . CS1 maint: uses authors parameter (link)
  9. ^ Läubli, Самуэль, Марк Fishel, Гэри Massey, Морин Ehrensberger-Dow, и Мартин Volk (2013). «Оценка эффективности постредактирования в реалистичной среде перевода» (PDF) . Материалы 2-го семинара по технологии и практике постредактирования . С. 83–91. CS1 maint: uses authors parameter (link)
  10. ^ "Сайт ТАУС" .
  11. ^ Хатчинс, Джон (1995). «Размышления об истории и современном состоянии машинного перевода» (PDF) . CS1 maint: uses authors parameter (link)
  12. ^ "Сайт IAPTI" .
  13. ^ "Официальный сайт XTM International" .
  14. ^ «Практика публикации. Отчет TAUS» (PDF) . Март 2010. с. 13.
  15. ^ "Сайт Memsource" .
  16. ^ «Unbabel запускает сервис машинного перевода, редактируемый людьми, чтобы помочь компаниям выйти на международный уровень, локализовать поддержку клиентов» .

Дальнейшее чтение [ править ]

  • ISO 18587: 2017: Услуги перевода. Постредактирование результатов машинного перевода. Требования ( Предварительный просмотр + оглавление )
  • Илона Валлберг: ISO 18587 - стандарт для процесса постредактирования. В: Йорг Порсиль (ред.): Машинный перевод - что нужно знать языковедам . BDÜ Weiterbildungs- und Fachverlagsgesellschaft mbH, Берлин 2017, ISBN 978-3-938430-94-1 . 

Внешние ссылки [ править ]

  • Translation Automation Users Society (TAUS)