В этой статье не процитировать какие - либо источники . ( июнь 2019 г. ) ( Узнайте, как и когда удалить это сообщение-шаблон ) |
Программное обеспечение для захвата документов относится к приложениям, которые предоставляют возможность и набор функций для автоматизации процесса сканирования бумажных документов или импорта электронных документов, часто в целях обеспечения расширенной классификации документов и процессов сбора данных. Большинство сканирующего оборудования , как сканеры, так и копировальные аппараты , предоставляют базовую возможность сканирования в любое количество форматов файлов изображений , включая PDF , TIFF , JPG , BMP и т. Д. Эта базовая функциональность дополняется программным обеспечением для захвата документов, которое может повысить эффективность и стандартизация процесса.
Типичные особенности [ править ]
Типичные особенности программного обеспечения Document Capture включают:
- Распознавание штрих-кода
- Распознавание патч-кода
- Разделение
- Оптическое распознавание символов (OCR)
- Оптическое распознавание меток (OMR)
- Гарантия качества
- Индексирование
- Миграция
Цель внедрения решения для захвата документов [ править ]
Целью внедрения решения для захвата документов является сокращение времени, затрачиваемого на сканирование, разделение, улучшение, организацию, классификацию, нормализацию и сбор информации из коллекций документов, а также создание метаданных вместе с файлом изображения / PDF и / или Текст OCR. Затем эта информация переносится в общую папку, FTP-сайт, базу данных, систему управления документами или корпоративного контента . Эти системы часто предоставляют функцию поиска, позволяющую искать активы на основе созданных метаданных , а затем просматривать их с помощью программного обеспечения для обработки изображений .
Системные решения Document Capture - Общие [ править ]
Интеграция с системой управления документами [ править ]
ECM (управление корпоративным контентом) и их компонент DMS (система управления документами) принимаются многими организациями в качестве корпоративной системы управления документами для всех типов электронных файлов, например, MS word, PDF ... Однако большая часть информации хранится в организации находятся на бумаге, и их необходимо интегрировать в одно хранилище документов.
Преобразовывая бумажные документы в цифровой формат посредством сканирования, организации конвертируют бумажные документы в графические форматы, такие как TIF, JPG и PDF, а также извлекают из документа ценную индексную информацию или бизнес-данные с помощью технологии OCR . Цифровые документы и связанные с ними метаданные можно легко хранить в ECM в различных форматах. Самым популярным из этих форматов является PDF, который не только обеспечивает точное представление документа, но также позволяет хранить весь текст OCR в документе за изображением PDF. Этот формат известен как PDF со скрытым текстом или PDF с возможностью поиска по тексту. Это позволяет пользователям искать документы с помощью ключевых слов в полях метаданных или путем поиска содержимого файлов PDF в репозитории.
Преимущества сканирования документов в ECM / DMS [ править ]
Информация, хранящаяся на бумаге, обычно не менее ценна для организаций, чем электронные документы, созданные внутри компании. Часто эта информация составляет значительную часть повседневной переписки с поставщиками и клиентами. Возможность управлять этой информацией и обмениваться ею внутри компании через систему управления документами, такую как SharePoint или CMIS-совместимый репозиторий, улучшает сотрудничество между отделами или сотрудниками, а также устраняет риск потери этой информации в результате стихийных бедствий, таких как наводнения или пожары.
Организации, внедряющие ECM / DMS, часто реализуют электронный рабочий процесс, который позволяет включать информацию, хранящуюся на бумаге, как часть электронного бизнес-процесса и включать в файл записи клиента вместе с другими связанными офисными документами и электронными письмами. Для критически важных бизнес-документов, таких как заказы на поставку и счета-фактуры поставщиков, оцифровка документов помогает ускорить бизнес-операции, а также сократить ручные усилия, связанные с вводом данных в бизнес-системы, такие как CRM, ERP и бухгалтерский учет. Отсканированные счета также можно направлять менеджерам для утверждения оплаты по электронной почте или в электронном виде.
Электронный захват документов [ править ]
В более ранних реализациях Document Capture Software эта технология была ориентирована исключительно на оцифровку и сбор информации из бумажных документов. Изображения документов были получены со сканеров документов с помощью драйверов TWAIN / ISIS. С этими решениями обычно были совместимы только форматы файлов на основе изображений, такие как TIF, JPG и BMP. Но в последние годы, по мере того как объем документов, создаваемых в электронном виде, и количество проприетарных форматов файлов продолжает расти с экспоненциальной скоростью, возросла потребность в обработке документов, существующих в электронных форматах. Соответствующие продукты для ввода документов адаптированы для работы с форматами файлов, отличных от изображений, с конечной целью создания единого рабочего процесса обработки, способного обрабатывать все входящие документы.
Возможность импортировать файлы из различных источников - один из примеров такой адаптации. Импорт документов из программных решений ECM / DMS, серверов электронной почты, FTP и EDI теперь является таким же требованием программного обеспечения для ввода документов, как и ввод документов.
Нормализация выходных файлов в текстовый формат PDF теперь является еще одним критическим фактором в долгосрочном архивировании проприетарных электронных форматов файлов. Нормализация расширяет доступ и использование файлов для пользователей всего предприятия, а не только для тех, кто создал исходный электронный файл.