Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

OmegaT - это компьютерный инструмент для перевода , написанный на языке программирования Java . Это бесплатное программное обеспечение, первоначально разработанное Китом Годфри в 2000 году, а в настоящее время разрабатывается командой под руководством Аарона Мадлона-Кея.

OmegaT предназначена для профессиональных переводчиков. Его функции включают настраиваемую сегментацию с использованием регулярных выражений , память переводов с нечетким сопоставлением и распространение совпадений, сопоставление по глоссарию, сопоставление словарей, память переводов и поиск справочного материала, а также встроенную проверку орфографии с использованием словарей орфографии Hunspell .

OmegaT работает в Linux , macOS , Microsoft Windows и Solaris и требует Java 8. [2] Он доступен на 27 языках. Согласно опросу, проведенному в 2010 году [3] среди 458 профессиональных переводчиков , OmegaT используется на 1/3 меньше, чем Wordfast , Déjà Vu и MemoQ , и на 1/8 меньше, чем Trados, лидер рынка .

История [ править ]

OmegaT была впервые разработана Китом Годфри в 2000 году. Первоначально она была написана на C ++.

Первый публичный выпуск в феврале 2001 г. [4] был написан на Java. В этой версии использовался собственный формат памяти переводов. Он мог переводить неформатированные текстовые файлы и HTML и выполнять сегментацию только на уровне блоков (т.е. абзацы вместо предложений).

Разработка и выпуски программного обеспечения [ править ]

Разработка OmegaT ведется на SourceForge. Команду разработчиков возглавляет Аарон Мадлон-Кей. Как и во многих проектах с открытым исходным кодом, новые версии OmegaT выпускаются часто, обычно с 2–3 исправлениями ошибок и обновлениями функций в каждой. Существует «стандартная» версия, которая всегда имеет полное руководство пользователя, и «последняя» версия, которая включает функции, которые еще не задокументированы в руководстве пользователя. [5] Обновленные исходники всегда доступны в репозитории кода SourceForge. [6]

Как работает OmegaT [ править ]

OmegaT выполняет задание на перевод как проект, иерархию папок с определенными именами. Пользователь копирует непереведенные документы в папку с именем / source / (или ее вложенные папки). На панели «Редактор» исходные документы отображаются в виде отдельных «сегментов» для перевода по одному сегменту за раз. OmegaT по указанию генерирует (частично) переведенные версии в подпапке / target /.

Другие названные папки включают папки для автоматической консультации в программе: / tm / для существующих пар переводов в формате .tmx, / tm / auto / для автоматического перевода 100% совпадений, / glossary / для глоссариев, / dictionary / для StarDict (и .tbx) словари.

Когда пользователь переходит на перевод сегмента в панели редактора, OmegaT автоматически ищет в файлах .tmx в иерархии / tm / предыдущие пары переводов с похожими исходными предложениями и отображает их на панели нечетких совпадений для вставки в панель редактора с Сочетание клавиш. Панели Глоссарий и Словарь предоставляют аналогичные функции автоматического поиска для любых глоссариев и словарей в соответствующих именованных папках в проекте. На дополнительной панели «Машинный перевод» отображаются машинные переводы из Google Translate и аналогичных служб.

Когда пользователь покидает сегмент, OmegaT обычно сначала добавляет пару источник-цель в свою базу данных в памяти. Впоследствии он сохраняет эту базу данных на диск в формате Translation Memory eXchange (.tmx) для использования в другой день, в других проектах, другими переводчиками и даже с другими CAT-программами. Без изменений, естественно, нет такого обновления. Версия 3.1 добавила настройку для блокировки целей, равных их источникам, обычную ошибку, а также сочетание клавиш для ее отмены - числа, исходный код в руководствах по программированию и т. Д.

В любой момент пользователь может создать частично переведенные версии исходных файлов. Обратите внимание, что OmegaT копирует исходные сегменты дословно, если они еще не переведены. Однако перед этим пользователю рекомендуется использовать команду меню «Проверить», чтобы проверить наличие тегов и других ошибок. Версия 3.1 добавила команду меню (и сочетание клавиш) для ограничения операций с текущим файлом - например, для частичной доставки или быстрого обновления.

Особенности OmegaT [ править ]

OmegaT имеет много общих функций с основными CAT-программами. К ним относятся создание, импорт и экспорт памяти переводов, нечеткое сопоставление из памяти переводов, поиск по глоссарию, а также поиск ссылок и соответствий.

OmegaT также имеет дополнительные функции, которые не всегда доступны в других CAT-программах. Они включают:

  • OmegaT начинает с отображения краткого руководства под названием «Мгновенный запуск».
  • OmegaT может переводить несколько файлов в несколько форматов файлов в нескольких подпапках одновременно и обращаться к нескольким базам переводов, глоссариям и словарям (ограничено только доступной памятью компьютера).
  • Что касается поддерживаемых типов файлов, OmegaT позволяет пользователю настраивать расширения файлов и кодировки файлов. Для ряда типов документов пользователь может выборочно выбрать, какие элементы должны быть переведены (например, в файлах OpenOffice.org Writer выбрать, следует ли включать закладки; в файлах Microsoft Office 2007/2010 выбрать, следует ли переводить сноски; или в HTML, выберите, следует ли переводить ALT-текст для изображений). Пользователь также может выбрать способ обработки нестандартных элементов в сторонних базах переводов.
  • Правила сегментации OmegaT основаны на регулярных выражениях. Сегментация может быть настроена на основе языка или формата файла, а последующие правила сегментации наследуют значения друг от друга.
  • В окне редактирования пользователь может перейти непосредственно к следующему непереведенному сегменту или перейти вперед или назад в истории. Пользователи могут использовать отмену и повтор, копирование и вставку, а также переключение между прописными и строчными буквами точно так же, как это делается в расширенном текстовом редакторе. Пользователь может выбрать для просмотра исходный текст уже переведенных сегментов. Панель редактирования также имеет встроенную проверку орфографии с использованием словарей Hunspell, а интерактивная проверка орфографии выполняется с помощью мыши.
  • Пользователи могут вставлять нечеткие совпадения с помощью сочетания клавиш или мыши. OmegaT показывает степень сходства нечетких совпадений с использованием цветов. OmegaT также может отображать дату, время и имя пользователя, который перевел любой данный сегмент. Соответствия глоссарию можно вставить с помощью мыши. Пользователь может выбрать копирование исходного текста в целевое текстовое поле или автоматическую вставку самого высокого нечеткого соответствия.
  • В окне поиска пользователь может выбрать поиск по исходному тексту текущих файлов, целевому тексту, другим базам памяти переводов и справочным файлам. При поиске может учитываться регистр, также можно использовать регулярные выражения. Двойной щелчок по результату поиска переводит пользователя прямо в этот сегмент в окне редактирования.
  • После перевода OmegaT может выполнить проверку тегов, чтобы убедиться в отсутствии случайных ошибок тегов. OmegaT может вычислять статистику для файлов проекта и памяти переводов перед запуском проекта или во время перевода, чтобы показать, как идет работа над переводом.
  • OmegaT может получать машинные переводы из Apertium , Belazar и Google Translate и отображать их в отдельном окне.
  • Различные окна в пользовательском интерфейсе OmegaT можно перемещать, увеличивать, размещать плиткой, вкладками и свертывать.

Поддержка форматов документов [ править ]

Некоторые типы файлов можно переводить прямо в OmegaT. OmegaT определяет тип файла по его расширению. Обработку расширений файлов и предпочтительную кодировку можно настроить так, чтобы переопределить настройки по умолчанию.

OmegaT обрабатывает форматированные документы путем преобразования форматирования в теги, как и другие коммерческие CAT-инструменты.

Прямые поддерживаемые форматы [ править ]

Косвенно поддерживаемые форматы [ править ]

Есть два процесса, которые позволяют OmegaT работать с неподдерживаемыми форматами:

  • зарегистрируйте расширение файла формата в предпочтительном файловом фильтре (обычно все форматы на основе простого текста)
  • преобразовать формат в формат, поддерживаемый напрямую

Поддержка XLIFF [ править ]

Программа Rainbow из Okapi Framework может преобразовывать определенные форматы файлов в формат XLIFF, который OmegaT поддерживает. Rainbow также может создавать полные папки проектов OmegaT из таких документов для упрощения работы с ними в OmegaT. [8]

Поддержка Gettext PO [ править ]

Некоторые форматы файлов могут быть преобразованы в файлы переносимых объектов Gettext (PO), которые можно переводить в OmegaT. Debian Программа po4a может преобразовывать форматы , такие как LaTeX , TeX и POD к Gettext PO. [9] Перевести Toolkit может конвертировать Mozilla .properties и ОТД файлы, CSV - файлы, определенные в Qt .TS файлы и некоторые XLIFF файлы Gettext PO.

Поддержка Office Open XML и ODF [ править ]

Документы Microsoft Word, Excel и PowerPoint от версии 97 до 2003 можно преобразовать в формат Office Open XML (Microsoft Office 2007/2010) или ODF (OpenOffice.org). Преобразование не происходит полностью без потерь и может привести к потере форматирования.

Поддержка файлов Trados® .ttx [ править ]

Файлы Trados® .ttx можно обрабатывать с помощью фильтра Okapi TTX .

Поддерживаемые форматы памяти и глоссария [ править ]

Память переводов в формате TMX [ править ]

Формат внутренней памяти переводов OmegaT не виден пользователю, но каждый раз, когда он автоматически сохраняет проект перевода , все новые или обновленные единицы перевода автоматически экспортируются и добавляются в три внешних памяти TMX: собственный OmegaT TMX, TMX уровня 1 и уровень 2 TMX.

  • Собственный TMX-файл предназначен для использования в проектах OmegaT.
  • Файл TMX уровня 1 сохраняет текстовую информацию и может использоваться с TMX уровнями 1 и 2, поддерживающими CAT-инструменты.
  • Файл уровня 2 сохраняет текстовую информацию, а также информацию встроенных тегов и может использоваться с TMX уровня 2, поддерживающим CAT-инструменты.

Экспортированные файлы уровня 2 включают внутренние теги OmegaT, инкапсулированные в теги TMX, что позволяет таким файлам TMX генерировать совпадения в TMX уровня 2, поддерживающем CAT-инструменты. Тесты Trados и SDLX дали положительные результаты.

OmegaT может импортировать файлы TMX до версии 1.4b уровня 1, а также уровня 2. Файлы уровня 2, импортированные в OmegaT, будут генерировать совпадения того же уровня, поскольку OmegaT преобразует теги TMX уровня 2 иностранного TMX. Здесь снова тесты были положительными с файлами TMX, созданными Transit.

Глоссарии [ править ]

Для глоссариев OmegaT в основном использует простые текстовые файлы с разделителями-табуляциями в кодировке UTF-8 с расширением .txt. Структура файла глоссария чрезвычайно проста: первый столбец содержит слово исходного языка, второй столбец содержит соответствующие слова целевого языка, третий столбец (необязательный) может содержать что угодно, включая комментарии по контексту и т. Д. Такие глоссарии можно легко создать в текстовом редакторе.

Также поддерживаются файлы с аналогичной структурой в стандартном формате CSV и файлы TBX.

Участие сообщества пользователей [ править ]

Проект OmegaT [ править ]

OmegaT - это программное обеспечение с открытым исходным кодом, которому помогают волонтеры. Программирование, безусловно, является наиболее важной функцией, но оно выиграет от большей поддержки со стороны волонтеров практически во всех областях. Если вам так хочется, вы также можете изменить OmegaT в соответствии со своими потребностями. [10]

Локализация OmegaT [ править ]

Пользовательский интерфейс и документация OmegaT переведены примерно на 30 языков. Переводчики-добровольцы могут переводить либо пользовательский интерфейс, либо краткое руководство «Мгновенный запуск», либо все руководство пользователя (или все три компонента). Все языковые файлы и все переводы руководства пользователя включены в стандартный дистрибутив OmegaT.

Пользовательские программы [ править ]

Особенностью сообщества пользователей OmegaT является то, что недостатки OmegaT часто побуждают пользователей создавать макросы, сценарии и программы, которые выполняют эти функции, хотя иногда эти функции позже становятся доступными в самой OmegaT. Когда OmegaT предлагала сегментацию только по абзацам, пользователь создавал макросы OpenOffice.org для сегментации по предложениям. Когда автоматическое использование TM в OmegaT по-прежнему требовало объединения TM, пользователь создал сценарий объединения TMX. Когда OmegaT не предлагала поддержку проверки орфографии, несколько пользователей создали сценарии или нашли решения для обеспечения проверки орфографии как части процесса перевода на основе OmegaT. [11]

Другое программное обеспечение, построенное на OmegaT [ править ]

Набор переводов Autshumato [ править ]

Autshumato состоит из CAT-программы, средства выравнивания, средства извлечения PDF-файлов, редактора TMX и общедоступного TM, основанного на сканированных данных. В готовую версию войдут менеджер терминологии и машинный переводчик. Элемент CAT-инструмента основан на OmegaT и требует для работы OpenOffice.org. Развитие финансируется Департаментом искусства и культуры правительства ЮАР. [12]

Benten [ править ]

Benten - это редактор XLIFF на основе Eclipse. Он использует код OmegaT для обработки процесса сопоставления TM. Частично он финансируется правительством Японии. [13]

Болтран [ править ]

Boltran - это веб-инструмент, имитирующий рабочий процесс проекта OmegaT. Он основан на исходном коде OmegaT и может экспортировать проекты OmegaT. [14]

OmegaT + [ править ]

OmegaT + - это CAT-программа, созданная на основе OmegaT версии 1.4.5 в 2005 году. OmegaT + работает аналогично OmegaT. Он разработал свои собственные функции, но проекты несовместимы с OmegaT. [15]

OmegaT в DGT [ править ]

Главное управление переводов Европейской комиссии (DGT) использует OmegaT в качестве альтернативного CAT-инструмента наряду с основным коммерческим инструментом. DGT поддерживает форк OmegaT (DGT-OmegaT) с адаптациями / улучшениями / новыми функциями, которые отвечают специфическим требованиям DGT, а также ряд вспомогательных приложений для интеграции OmegaT в свой рабочий процесс: мастер для автоматизации создания, обновления, редактирования и доставка проектов, Tagwipe для очистки бесполезных тегов в документах docx и TeamBase для обмена воспоминаниями в реальном времени. Эти приложения предоставляются DGT как бесплатное программное обеспечение с открытым исходным кодом. [16]

См. Также [ править ]

  • Память переводов
  • Компьютерный перевод
  • Программное обеспечение Office Open XML
  • Программное обеспечение OpenDocument

Ссылки [ править ]

  1. ^ http://omegat.sourceforge.net/manual-standard/en/appendix.legal.notices.html
  2. ^ «Глава 1. Установка и запуск OmegaT» . omegat.sourceforge.io . Проверено 14 августа 2019 .
  3. ^ http://www.translationtribulations.com/2010/07/results-of-june-translation-tools.html
  4. ^ http://translationjournal.net/journal/23linux.htm
  5. ^ [1] "Стандартная" и "последняя" версии OmegaT
  6. ^ [2] Последние исходные файлы всегда доступны в репозитории кода SourceForge.
  7. ^ Открытый формат документа для офисных приложений - формат ISO / IEC 26300: 2006
  8. ^ Okapi Framework - утилита извлечения текста может создавать дерево папок проекта OmegaT.
  9. ^ po4a Архивировано 22 июня 2006 г. на Wayback Machine - Утилита преобразования вформат Portable Object и обратно, приложение Perl, упакованное под Debian.
  10. ^ Проект OmegaT и Вы архивация 2011-05-23 в Wayback Machine
  11. ^ http://www.omegat.org/en/resources.html
  12. ^ Аутшумато
  13. ^ Benten
  14. ^ Болтран
  15. ^ OmegaT +
  16. ^ DGT-OmegaT

Внешние ссылки [ править ]

  • Официальный сайт
  • Страница проекта SourceForge

Поддержка пользователей [ править ]

  • [email protected] - многоязычный список рассылки поддержки пользователей (общедоступные архивы)