Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Памяти переводов ( TM ) представляют собой базу данных , которая хранит «сегменты», которые могут быть предложения, абзацы или предложения , и как единицы (заголовки, название или элементы в списке), которые ранее были переведены, для того , чтобы помочь человеку переводчикам . Память переводов хранит исходный текст и соответствующий ему перевод в языковых парах, называемых «единицами перевода». Отдельные слова обрабатываются терминологическими базами и не относятся к сфере TM.

Программы, использующие память переводов, иногда называют менеджерами памяти переводов ( TMM ) или системами памяти переводов ( системы TM , не путать с системой управления переводами ( TMS ), которая представляет собой другой тип программного обеспечения, ориентированного на управление процессом перевода) .

Память переводов обычно используется в сочетании со специализированным инструментом автоматизированного перевода (CAT), программой обработки текстов , системами управления терминологией , многоязычным словарем или даже исходными данными машинного перевода .

Исследования показывают, что многие компании, выпускающие многоязычную документацию , используют системы памяти переводов. В опросе языковых профессионалов в 2006 году 82,5% из 874 ответов подтвердили использование TM. [1] Использование TM соотносится с типом текста, характеризующимся техническими терминами и простой структурой предложений (технической, в меньшей степени маркетинговой и финансовой), вычислительными навыками и повторяемостью контента. [1]

Использование памяти переводов [ править ]

Программа разбивает исходный текст (текст для перевода) на сегменты, ищет совпадения между сегментами и исходной половиной ранее переведенных пар исходный-целевой, хранящихся в памяти переводов , и представляет такие совпадающие пары в качестве кандидатов на перевод . Переводчик может принять кандидата, заменить его новым переводом или изменить в соответствии с источником. В последних двух случаях новый или измененный перевод попадает в базу данных.

Некоторые системы памяти переводов ищут только 100% совпадений, то есть они могут извлекать только те сегменты текста, которые точно соответствуют записям в базе данных, в то время как другие используют алгоритмы нечеткого сопоставления для извлечения похожих сегментов, которые представляются переводчику с различиями. отмечен. Важно отметить, что типичные системы памяти переводов ищут текст только в исходном сегменте.

Гибкость и надежность алгоритма сопоставления в значительной степени определяют производительность памяти переводов, хотя для некоторых приложений скорость отзыва точных совпадений может быть достаточно высокой, чтобы оправдать подход 100% -ного совпадения.

Сегменты, по которым не найдено совпадений, переводчик должен переводить вручную. Эти недавно переведенные сегменты хранятся в базе данных, где их можно использовать для будущих переводов, а также для повторов этого сегмента в текущем тексте.

Память переводов лучше всего работает с текстами, которые часто повторяются, например с техническими руководствами. Они также полезны для перевода дополнительных изменений в ранее переведенном документе, соответствующих, например, незначительным изменениям в новой версии руководства пользователя. Традиционно память переводов не считалась подходящей для литературных или творческих текстов по той простой причине, что на используемом языке так мало повторений. Однако другие находят их полезными даже для неповторяющихся текстов, потому что созданные ресурсы базы данных имеют ценность для поиска соответствия, чтобы определить подходящее использование терминов, для обеспечения качества (без пустых сегментов),и упрощение процесса рецензирования (исходный и целевой сегменты всегда отображаются вместе, в то время как переводчикам приходится работать с двумя документами в традиционной среде рецензирования).

Основные преимущества [ править ]

Менеджеры памяти переводов больше всего подходят для перевода технической документации и документов, содержащих специализированные словари. Их преимущества включают:

  • Обеспечение полного перевода документа (память переводов не принимает пустые целевые сегменты)
  • Обеспечение единообразия переведенных документов, включая общие определения, фразы и терминологию. Это важно, когда над одним проектом работают разные переводчики.
  • Предоставление переводчикам возможности переводить документы в самые разные форматы без необходимости владения программным обеспечением, которое обычно требуется для обработки этих форматов.
  • Ускорение всего процесса перевода; поскольку память переводов «запоминает» ранее переведенный материал, переводчикам необходимо перевести его только один раз.
  • Снижение затрат на долгосрочные переводческие проекты; например, текст руководств, предупреждений или серии документов необходимо переводить только один раз и можно использовать несколько раз.
  • Для больших проектов документации экономия (времени или денег) благодаря использованию пакета TM может быть очевидна даже при первом переводе нового проекта, но обычно такая экономия очевидна только при переводе последующих версий проекта, который был переведено перед использованием памяти переводов.

Основные препятствия [ править ]

Основные проблемы, препятствующие более широкому использованию менеджеров памяти переводов, включают:

  • Концепция «памяти переводов» основана на предположении, что предложения, использованные в предыдущих переводах, могут быть «переработаны». Однако руководящий принцип перевода заключается в том, что переводчик должен переводить содержание текста, а не его составные предложения .
  • Менеджеры памяти переводов не легко вписываются в существующие процессы перевода или локализации. Чтобы воспользоваться преимуществами технологии TM, необходимо изменить процесс перевода .
  • Менеджеры памяти переводов в настоящее время поддерживают не все форматы документации, а фильтры могут не существовать для поддержки всех типов файлов.
  • Использование менеджеров памяти переводов требует обучения, и программы должны быть настроены для максимальной эффективности.
  • В тех случаях, когда весь или часть процесса перевода передается на аутсорсинг или выполняется внештатными переводчиками, работающими за пределами офиса, внешним сотрудникам требуются специальные инструменты для работы с текстами, созданными менеджером памяти переводов.
  • Полные версии многих менеджеров памяти переводов могут стоить от US $ 500 до $ 2500 за место, которое может представлять собой значительные инвестиции (хотя более низкие программы расходов также доступны). Однако некоторые разработчики выпускают бесплатные или недорогие версии своих инструментов с сокращенным набором функций, которые отдельные переводчики могут использовать для работы над проектами, созданными с использованием полных версий этих инструментов. (Обратите внимание, что доступны бесплатные и условно-бесплатные пакеты TM, но ни один из них еще не получил большой доли рынка.)
  • Затраты на импорт прошлых переводов пользователя в базу данных памяти переводов, обучение, а также любые дополнительные продукты также могут представлять собой значительные вложения.
  • Ведение баз данных памяти переводов в большинстве случаев по-прежнему, как правило, выполняется вручную, и их несоблюдение может привести к значительному снижению удобства использования и качества сопоставлений TM.
  • Как указывалось ранее, менеджеры памяти переводов могут не подходить для текста, в котором отсутствует внутреннее повторение или который не содержит неизмененных частей между версиями. Технический текст обычно лучше всего подходит для памяти переводов, тогда как маркетинговые или творческие тексты будут менее подходящими.

Влияние на качество [ править ]

Использование систем TM может повлиять на качество переводимых текстов. Его основной эффект явно связан с так называемым «распространением ошибок»: если перевод определенного сегмента неверен, на самом деле более вероятно, что неправильный перевод будет повторно использован в следующий раз, когда тот же исходный текст или аналогичный исходный текст, переводится, тем самым закрепляя ошибку. Традиционно описываются два основных эффекта на качество переведенных текстов: эффект «предложения-салата» (Bédard 2000; цит. По O'Hagan 2009: 50) и эффект «глазка» (Heyn 1998). Первый относится к отсутствию согласованности на уровне текста, когда текст переводится с использованием предложений из TM, которые были переведены разными переводчиками в разных стилях. Согласно последнему, переводчики могут адаптировать свой стиль к использованию системы TM, чтобы они не содержали внутритекстовых ссылок, чтобы сегменты можно было лучше повторно использовать в будущих текстах, тем самым влияя на согласованность и удобочитаемость (O'Hagan 2009).

Существует потенциальное и, если есть, возможно, неосознанное воздействие на переведенный текст. В разных языках используются разные последовательности для логических элементов в предложении, и переводчик, которому предлагается предложение с несколькими предложениями, которое переведено наполовину, с меньшей вероятностью полностью перестроит предложение. Согласованные эмпирические данные (Martín-Mor 2011) показывают, что переводчики, скорее всего, изменят структуру предложения с несколькими предложениями при работе с текстовым процессором, а не с системой TM.

У переводчика также есть возможность работать с текстом механически, предложение за предложением, вместо того, чтобы сосредотачиваться на том, как каждое предложение соотносится с окружающими его людьми и с текстом в целом. Исследователи (Dragsted 2004) определили этот эффект, который связан с функцией автоматической сегментации этих программ, но не обязательно оказывает негативное влияние на качество переводов.

Обратите внимание, что эти эффекты тесно связаны с обучением, а не присущи инструменту. По словам Мартина-Мор (2011), использование систем TM действительно влияет на качество переводимых текстов, особенно на новичков, но опытные переводчики могут этого избежать. Пим (2013) напоминает, что «переводчики, использующие ТМ / МП, как правило, пересматривают каждый сегмент по мере продвижения, оставляя мало времени для окончательной проверки всего текста в конце», что на самом деле может быть основной причиной некоторых из эффекты описаны здесь.

Типы систем памяти переводов [ править ]

  • Рабочий стол: инструменты памяти переводов на рабочем столе обычно используются отдельными переводчиками для выполнения переводов. Это программы, которые переводчик-фрилансер загружает и устанавливает на свой настольный компьютер.
  • Серверные или централизованные: централизованные системы памяти переводов хранят TM на центральном сервере. Они работают вместе с настольной ТМ и могут увеличить коэффициент соответствия ТМ на 30–60% больше, чем рычаг ТМ, достигаемый только настольной ТМ.

Функции [ править ]

Ниже приводится краткое описание основных функций памяти переводов.

Автономные функции [ править ]

Импортировать [ редактировать ]

Эта функция используется для передачи текста и его перевода из текстового файла в TM. Импорт может быть выполнен из необработанного формата , в котором внешний исходный текст доступен для импорта в TM вместе с его переводом. Иногда тексты должны быть переработаны пользователем. Есть еще один формат, который можно использовать для импорта: собственный формат . В этом формате TM используется для сохранения памяти переводов в файл.

Анализ [ править ]

Процесс анализа включает следующие этапы:

Текстовый парсинг
Очень важно правильно распознавать знаки препинания, чтобы различать, например, точку в конце предложения и точку в аббревиатуре. Таким образом, разметка - это своего рода предварительное редактирование. Обычно материалы, обработанные с помощью программ помощи переводчикам, содержат разметку, поскольку этап перевода встроен в линию по производству многоязычных документов. Другие специальные текстовые элементы могут быть выделены разметкой. Есть специальные элементы, которые не нужно переводить, такие как имена собственные и коды, в то время как другие, возможно, потребуется преобразовать в собственный формат.
Лингвистический разбор
Сокращение базовой формы используется для подготовки списков слов и текста для автоматического поиска терминов из банка терминов. С другой стороны, синтаксический анализ может использоваться для извлечения многословных терминов или фразеологии из исходного текста . Таким образом, синтаксический анализ используется для нормализации порядка слов во фразеологии, это то, какие слова могут образовывать фразу.
Сегментация
Его цель - выбрать наиболее полезные единицы перевода. Сегментация подобна синтаксическому анализу. Это делается на одном языке с использованием поверхностного анализа, а выравнивание основывается на сегментации. Если переводчики исправят сегментацию вручную, более поздние версии документа не найдут совпадений с TM на основе исправленной сегментации, потому что программа будет повторять свои собственные ошибки. Переводчики обычно переходят предложение за предложением, хотя перевод одного предложения может зависеть от перевода окружающих.
Выравнивание
Это задача определения переводческих соответствий между исходным и целевым текстами. Должна быть обратная связь от выравнивания к сегментации, и хороший алгоритм выравнивания должен быть в состоянии исправить первоначальную сегментацию.
Срок извлечения
Он может иметь в качестве входных данных предыдущий словарь. Более того, при извлечении неизвестных терминов он может использовать синтаксический анализ на основе статистики текста. Они используются для оценки объема работы, связанной с переводом. Это очень полезно для планирования и составления графика работы. Статистика переводов обычно подсчитывает слова и оценивает количество повторений в тексте.

Экспорт [ править ]

Экспорт переносит текст из TM во внешний текстовый файл. Импорт и экспорт должны быть обратными.

Онлайн-функции [ править ]

При переводе одной из основных целей TM является извлечение наиболее полезных совпадений в памяти, чтобы переводчик мог выбрать лучшее. TM должен показывать как исходный, так и целевой текст, указывая на идентичности и различия.

Получение [ править ]

Из TM можно получить несколько различных типов совпадений.

Полное совпадение
Точные совпадения появляются, когда совпадение между текущим исходным сегментом и сохраненным является посимвольным совпадением. При переводе предложения точное совпадение означает, что это же предложение уже было переведено ранее. Точные совпадения также называются «100% совпадениями».
Точное соответствие в контексте (ICE) или гарантированное соответствие
Соответствие ICE - это точное совпадение, которое происходит в одном и том же контексте, то есть в том же месте в абзаце. Контекст часто определяется окружающими предложениями и атрибутами, такими как имя файла документа, дата и разрешения.
Нечеткое совпадение
Если совпадение неточное, это «нечеткое» совпадение. Некоторые системы присваивают этим видам совпадений проценты, и в этом случае нечеткое совпадение больше 0% и меньше 100%. Эти цифры нельзя сравнивать по системам, если не указан метод оценки.
Соответствие
Когда переводчик выбирает одно или несколько слов в исходном сегменте, система извлекает пары сегментов, соответствующие критериям поиска. Эта функция полезна для поиска переводов терминов и идиом при отсутствии терминологической базы данных .

Обновление [ править ]

TM обновляется новым переводом, когда он был принят переводчиком. Как всегда при обновлении базы данных, возникает вопрос, что делать с предыдущим содержимым базы данных. TM можно изменить, изменив или удалив записи в TM. Некоторые системы позволяют переводчикам сохранять несколько переводов одного и того же исходного сегмента.

Автоматический перевод [ править ]

Инструменты памяти переводов часто обеспечивают автоматический поиск и замену.

Автоматический поиск
Поиск в системах TM выполняется, и его результаты отображаются автоматически, когда переводчик перемещается по документу.
Автоматическая замена
При автоматической подстановке, если при переводе новой версии документа обнаруживается точное совпадение, программа повторит старый перевод. Если переводчик не сверит перевод с источником, ошибка в предыдущем переводе будет повторяться.

Сеть [ править ]

Сеть позволяет группе переводчиков переводить текст вместе быстрее, чем если бы каждый работал по отдельности, потому что предложения и фразы, переведенные одним переводчиком, доступны другим. Более того, если память переводов передается перед окончательным переводом, есть вероятность, что ошибки одного переводчика будут исправлены другими членами команды.

Текстовая память [ править ]

«Текстовая память» является основой предлагаемого стандарта Lisa OSCAR xml: tm. Текстовая память включает в себя авторскую память и память переводов.

Память переводов [ править ]

Уникальные идентификаторы запоминаются во время перевода, поэтому документ на целевом языке «точно» выровнен на уровне текстовой единицы. Если исходный документ впоследствии будет изменен, то те текстовые блоки, которые не изменились, можно напрямую перенести в новую целевую версию документа без необходимости какого-либо взаимодействия с переводчиком. Это концепция «точного» или «идеального» соответствия памяти переводов. xml: tm также может предоставлять механизмы для нечеткого соответствия в документе.

История [ править ]

1970-е годы - это этап зарождения систем ТМ, в котором ученые провели предварительный раунд исследовательских дискуссий. Первоначальная идея систем ТМ часто приписывается [ кому? ] к статье Мартина Кея «Надлежащее место» [2], но ее подробности не приводятся полностью. В этой статье показана основная концепция системы хранения: «Переводчик может начать с выдачи команды, заставляющей систему отображать в хранилище все, что может иметь отношение к ... Прежде чем продолжить, он может изучить прошлое. и будущие фрагменты текста, содержащие аналогичный материал ". На это наблюдение Кея на самом деле повлияло предложение Питера Артерна о том, что переводчики могут использовать аналогичные, уже переведенные документы в Интернете.В своей статье 1978 г. [3]он полностью продемонстрировал то, что мы сегодня называем системами ТМ: любой новый текст будет напечатан на станции обработки текста, и во время набора система сверяет этот текст с более ранними текстами, хранящимися в ее памяти, вместе с его переводом. на все другие официальные языки [Европейского сообщества]. ... Одним из преимуществ перед машинным переводом будет то, что все найденные таким образом отрывки будут грамматически правильными. По сути, мы должны использовать электронный процесс «вырезать и наклеить», который, по моим расчетам, сэкономил бы по крайней мере 15 процентов времени, которое переводчики сейчас используют для эффективного выполнения переводов.

Идея была взята из инструментов ALPS (автоматизированных систем обработки языков), впервые разработанных исследователем из Университета Бригама Янга, и в то время идея систем TM была смешана с инструментом под названием «Обработка повторений», который был нацелен только на поиск совпадающих строк. Лишь спустя долгое время возникла концепция так называемой памяти переводов.

Настоящим этапом исследования систем ТМ будут 1980-е годы. Одна из первых реализаций системы TM появилась в двуязычном банке знаний Сэдлера и Вендельманса. Двуязычный банк знаний - это синтаксически и референциально структурированная пара корпусов, одна из которых является переводом другой, в которой единицы перевода перекрестно перекодированы между корпусами. Целью двуязычного банка знаний является разработка универсального источника знаний на основе корпуса для приложений машинного и автоматизированного перевода (Sadler & Vendelman, 1987). Еще один важный шаг сделал Брайан Харрис со своим «Би-текстом». Он определил двутекст как «единый текст в двух измерениях» (1988),исходный и целевой тексты, связанные с деятельностью переводчика через единицы перевода, перекликались с Двуязычным Банком Знаний Садлера. И в работе Харриса он предложил что-то вроде системы TM без использования этого имени: база данных парных переводов, с возможностью поиска либо по отдельному слову, либо по «целой единице перевода», в последнем случае поиск позволял находить похожие, а не идентичные единицы. .

Технология TM стала коммерчески доступной в широких масштабах только в конце 1990-х годов, поэтому усилия приложили несколько инженеров и переводчиков. Следует отметить первый инструмент TM под названием Trados ( SDL TradosНастоящее время). В этом инструменте при открытии исходного файла и применении памяти переводов любые «100% совпадения» (идентичные совпадения) или «нечеткие совпадения» (похожие, но не идентичные совпадения) в тексте мгновенно извлекаются и помещаются в целевой файл. Затем "совпадения", предложенные памятью переводов, можно либо принять, либо заменить новыми альтернативами. Если единица перевода обновляется вручную, она сохраняется в памяти переводов для будущего использования, а также для повторения в текущем тексте. Аналогичным образом все сегменты в целевом файле без «совпадения» будут переведены вручную, а затем автоматически добавлены в память переводов.

В 2000-х годах услуги онлайн-перевода начали использовать TM. Сервисы машинного перевода, такие как Google Translate , а также профессиональные и «гибридные» переводческие услуги, предоставляемые такими сайтами, как Gengo и Ackuna , включают базы данных данных TM, предоставленных переводчиками и волонтерами, чтобы сделать более эффективные связи между языками, обеспечивая более быстрые услуги перевода для конечных пользователей . [4]

Последние тенденции [ править ]

Одним из последних достижений является концепция «текстовой памяти» в отличие от памяти переводов. [5] Это также основа предлагаемого стандарта LISA OSCAR. [6] Текстовая память в xml: tm состоит из «памяти авторов» и «памяти переводов». Память автора используется для отслеживания изменений во время цикла разработки. Память переводов использует информацию из памяти авторов для реализации сопоставления памяти переводов. Хотя xml: tm в первую очередь ориентирован на XML-документы, его можно использовать в любом документе, который можно преобразовать в формат XLIFF [7] .

Память переводов второго поколения [ править ]

Гораздо более мощные, чем системы TM первого поколения, они включают механизм лингвистического анализа , используют технологию фрагментов для разбиения сегментов на интеллектуальные терминологические группы и автоматически создают специальные глоссарии.

Связанные стандарты [ править ]

TMX [ править ]

Translation Memory eXchange (TMX) - это стандарт, позволяющий обмениваться памятью переводов между поставщиками переводов. TMX был принят сообществом переводчиков как лучший способ импорта и экспорта памяти переводов [ необходима ссылка ] . Текущая версия - 1.4b - она ​​позволяет воссоздавать исходные исходные и целевые документы из данных TMX.

TBX [ править ]

Обмен TermBase . Этотстандарт LISA , который был пересмотрен и переиздан как ISO 30042, позволяет обмениваться терминологическими данными, включая подробную лексическую информацию. Структура TBX обеспечивается тремя стандартами ISO: ISO 12620 , ISO 12200 и ISO 16642. ISO 12620 обеспечивает перечень четко определенных «категорий данных» со стандартизованными именами, которые функционируют как типы элементов данных или как предопределенные значения. ISO 12200 (также известный как MARTIF) обеспечивает основу для основной структуры ТВХ. ISO 16642 (также известный как терминологическая структура разметки) включает структурную метамодель для языков разметки терминологии в целом.

UTX [ править ]

Формат Universal Terminology eXchange (UTX) - это стандарт, специально разработанный для использования в пользовательских словарях машинного перевода , но его можно использовать и для общих, удобочитаемых глоссариев. Цель UTX - ускорить совместное использование и повторное использование словарей за счет его чрезвычайно простой и практичной спецификации.

SRX [ править ]

Обмен правилами сегментации (SRX) предназначен для улучшения стандарта TMX, чтобы данные памяти переводов, которыми обмениваются приложения, могли использоваться более эффективно. Возможность указывать правила сегментации, которые использовались в предыдущем переводе, может повысить эффективность использования.

GMX [ править ]

Показатели GILT . GILT означает (глобализация, интернационализация, локализация и перевод). Стандарт GILT Metrics состоит из трех частей: GMX-V для показателей объема, GMX-C для показателей сложности и GMX-Q для показателей качества. Предлагаемый стандарт GILT Metrics ставит задачу количественной оценки рабочей нагрузки и требований к качеству для любой данной задачи GILT.

OLIF [ править ]

Открытый формат обмена лексиконом . OLIF - это открытый XML-совместимый стандарт обмена терминологическими и лексическими данными. Первоначально предназначенный как средство для обмена лексическими данными между частными лексиконами машинного перевода, он превратился в более общий стандарт обмена терминологией. [8]

XLIFF [ править ]

Формат файла обмена локализацией XML (XLIFF) предназначен для обеспечения единого формата файла обмена, понятного любому поставщику локализации. XLIFF является предпочтительным способом [9] [10] обмена данными в формате XML в индустрии переводов. [11]

TransWS [ править ]

Веб-службы переводов . TransWS определяет вызовы, необходимые для использования веб-служб для отправки и получения файлов и сообщений, относящихся к проектам локализации. Он задуман как подробная структура для автоматизации большей части текущего процесса локализации с использованием веб-служб. [12]

xml: tm [ править ]

Подход xml: tm (память текста на основе XML) к памяти переводов основан на концепции памяти текста, которая включает память автора и память переводов. [13] xml: tm был подарен Лизе ОСКАР XML-INTL.

ЗП [ править ]

Формат переносимого объекта Gettext . Хотя PO-файлы Gettext часто не рассматриваются как формат памяти переводов, они являются двуязычными файлами, которые также используются в процессах памяти переводов так же, как и базы переводов. Обычно система памяти переводов PO состоит из различных отдельных файлов в древовидной структуре каталогов. Общие инструменты, которые работают с PO-файлами, включают GNU Gettext Tools и Translate Toolkit . Также существует несколько инструментов и программ, которые редактируют PO-файлы, как если бы они были простыми исходными текстовыми файлами.

См. Также [ править ]

  • Сравнение средств компьютерного перевода
  • Список программ для перевода
  • Перевод
  • Текстовый корпус
  • Компьютерное рецензирование
  • Программное обеспечение для перевода # Приложения
  • Параллельный текст
  • Двуязычное онлайн-согласование

Ссылки [ править ]

  1. ^ a b Элина Лагоудаки (2006), «Системы памяти переводов: разъяснение точки зрения пользователей. Ключевые выводы исследования TM Survey 2006, проведенного в июле и августе 2006 года. (Имперский колледж Лондона, Обзор памяти переводов 2006), стр.16 » Архивировано копировать» (PDF) . Архивировано из оригинального (PDF) на 2007-03-25 . Retrieved 2007-03-25 .CS1 maint: заархивированная копия как заголовок ( ссылка )
  2. ^ Кей, Мартин (март 1997). «Надлежащее место людей и машин в языковом переводе». Машинный перевод . 12 (1–2): 3–23. DOI : 10,1023 / A: 1007911416676 .
  3. ^ Артерн, Питер (1978). «Машинный перевод и компьютерные системы терминологии: взгляд переводчика» (PDF) . Воплощение и компьютер: материалы семинара, Лондон, 14 ноября 1978 года . ISBN  0444853022.
  4. ^ Инструмент перевода искусственного интеллекта Google, кажется, изобрел свой собственный секретный внутренний язык Девин Колдевей, TechCrunch, 22 ноября 2016 г.
  5. ^ Перевод XML-документов с помощью xml: tm
  6. ^ xml: tm
  7. ^ XLIFF
  8. ^ Открытый формат обмена лексиконом
  9. ^ "DITA Translation SC | OASIS" . www.oasis-open.org . Источник 2021-01-29 .
  10. ^ Ротурье, Иоганн (2019-08-23), О'Хаган, Минако (ред.), «XML для технологии перевода» , Справочник по переводу и технологии Routledge (1-е изд.), Абингдон, Оксон; Нью - Йорк, Нью - Йорк: Routledge, 2020. |:. Routledge, стр 45-60, DOI : 10,4324 / 9781315311258-3 , ISBN 978-1-315-31125-8, получено 2021-01-29CS1 maint: location ( ссылка )
  11. ^ Формат файла обмена локализацией XML
  12. ^ Веб-службы переводов
  13. ^ Анджей Zydroń (август 2008). «OAXAL - что это такое и почему меня это должно волновать» . Новости управления информацией CIDM . Архивировано из оригинала на 17 мая 2013 года . Проверено 30 марта 2013 года . В основе xml: tm лежат следующие концепции, которые вместе составляют «память текста»: память автора и память переводов.

Дальнейшее чтение [ править ]

  • Тащил, Барбара. (2004). Сегментация в системах перевода и памяти переводов: эмпирическое исследование когнитивной сегментации и эффектов интеграции системы TM в процесс перевода . Копенгаген: Samfundslitteratur. 369 с.
  • Хейн, Матиас. (1998). «Память переводов: идеи и перспективы». В: Линн Боукер; и другие. (ред.), Единство в разнообразии? Современные тенденции в переводоведении . Манчестер: Сент-Джером. С. 123–136.
  • Мартин-Мор, Адриа (2011), La interferència lingüística en entorns de Traducció Assistida per Ordinador: Recerca empíricoexperimental . Беллатерра: Автономный университет Барселоны. URL: http://www.tdx.cat/handle/10803/83987.
  • О'Хаган, Минако. (2009). «Компьютерный перевод (CAT)». В: Мона Бейкер и Габриэла Салдана (ред.), Энциклопедия переводоведения Routledge . Лондон: Рутледж. С. 48–51.
  • Пим, Энтони (2013). Наборы навыков перевода в эпоху машинного перевода . Мета: Журнал переводчиков, 58 (3), стр. 487-503. URL: http://id.erudit.org/iderudit/1025047ar

Внешние ссылки [ править ]

  • Память переводов
  • Сравнительный анализ памяти переводов
  • Обзор использования ТМ внештатными переводчиками Ecolore (документ Word)
  • Изменения в памяти переводов на базе Интернета