Инструменты компьютерного рецензирования ( CAR ) - это части программного обеспечения, основанные на алгоритмах сравнения и анализа текстов . Эти инструменты фокусируются на различиях между двумя документами, принимая во внимание шрифт каждого документа посредством интеллектуального анализа.
Обнаружение различий
Интеллектуальный анализ, используемый инструментами CAR, обнаруживает, что различия не имеют одинакового значения в зависимости от их типа и / или поля / темы документа. Например, разница в номере не одинакова, если этот номер представляет собой дату, цену, номер страницы, номер цифры, часть адреса, вызов сноски, номер пункта списка, номер заголовка и т. Д. .
- номер заголовка или разница номеров пунктов списка могут не представлять интереса, если эти числа будут пересчитаны позже перед печатью или публикацией с помощью инструмента обработки текста,
- небольшая разница в числах, например, от «1» до «единицы» или от «1» до «1», часто представляет второстепенный интерес, в зависимости от темы и области документа.
- в то время как некоторые другие различия в числах могут сильно повредить документу.
Эти инструменты интересны в различных приложениях:
- сравнение документа и его обновленной / измененной версии. Основная цель состоит в том, чтобы выделить модификации, сделанные третьим лицом или программой обработки текста.
- сравнение редактируемого документа в двух форматах файлов: Word , TXT, PDF , HTML , XML . Основная цель - выделить различия, связанные с изменением формата или программным обеспечением преобразования / переформатирования. Часто проблемы с простым преобразованием кодировки символов могут стать причиной катастрофы.
Для перевода
Инструменты компьютерного рецензирования для перевода (CART) - это инструменты CAR, которые могут управлять многоязычными сравнениями. Это подразумевает возможность сопоставления каждой части текста из одного документа в другой с учетом специфики каждого языка: форматы даты / чисел, знаки препинания (например, французские / английские кавычки ) и т. Д. Лучшие инструменты CART способны находить соответствия между существительными или глагольными группами, что подразумевает поиск терминологических и синтаксических элементов с помощью лингвистических анализаторов.
Примеры применения
- Автор книги обновляет свой документ (часто в формате Word), пока он получает корректуру принтера (часто в формате PDF) или перевод на другой язык.
- Контент-менеджер веб-сайта, который должен обеспечивать согласованность обновлений и версий своих HTML-страниц на разных языках.
- Принтер, который должен обеспечивать согласованность и качество своего процесса, возможно, с использованием проприетарных форматов XML / SGML, некоторых автоматических обработок, возможных ручных вмешательств, выполняемых им самим или субподрядчиком.
- Редактор, через который проходят документы от всех участников.
- MediaWiki «История» на каждой странице является инструментом CAR