Из Википедии, свободной энциклопедии
  (Перенаправлено из программы OCR )
Перейти к навигации Перейти к поиску

Это сравнение программного обеспечения для оптического распознавания символов включает:

  • Механизмы оптического распознавания символов, которые выполняют фактическую идентификацию символов
  • Программное обеспечение для анализа макета, которое разделяет отсканированные документы на зоны, подходящие для OCR
  • Графические интерфейсы к одному или нескольким механизмам распознавания текста
  • Комплекты для разработки программного обеспечения , которые используются для добавления возможностей оптического распознавания текста в другое программное обеспечение (например, приложения для обработки форм, системы управления изображениями документов, системы электронного обнаружения , решения для управления записями)

Оценка [ править ]

Анализ точности и надежности пакетов OCR Google Docs OCR, Tesseract, ABBYY FineReader и Transym с использованием набора данных, включающего 1227 изображений из 15 различных категорий, показал, что Google Docs OCR и ABBYY работают лучше, чем другие. [23]

Ссылки [ править ]

  1. ^ Дмитрий Гензель; Ашок Попат (6 мая 2015 г.). «Бумага в цифровую форму на 200+ языках» .
  2. ^ Ashok Popat (4 сентября 2015). «IEEE SPS: оптическое распознавание символов для большинства языков мира» .
  3. ^ На основе количества файлов языковой подготовки для версии 3.04. Доступно на странице загрузки .
  4. ^ Использование объяснено в Readme и FAQ по Tesseract
  5. ^ Например, ODF с OCRFeeder
  6. ^ «GitHub - tesseract-ocr / tesseract: Tesseract Open Source OCR Engine (основной репозиторий)» . Проверено 5 ноября 2018 .
  7. ^ «ABBYY FineReader 14: Технические характеристики» . Finereader.abbyy.com . Проверено 23 февраля 2017 .
  8. ^ «ABBYY FineReader 11: Технические характеристики» . Finereader.abbyy.com . Проверено 12 сентября 2013 .
  9. ^ «Лучшее программное обеспечение для оптического распознавания текста» . Ocrworld.com. 30 марта 2010 г. Архивировано из оригинала на 2017-02-23 . Проверено 12 сентября 2013 .
  10. ^ «Возможности Asprise OCR SDK» . asprise.com . Проверено 21 июня 2014 .
  11. ^ «Возможности библиотеки Asprise Java OCR» . asprise.com . Проверено 21 июня 2014 .
  12. ^ «Asprise Java, C # / VB.NET OCR API» . asprise.com. 2015-11-19 . Проверено 19 ноября 2015 .
  13. ^ "Домашняя страница ConPDS" .
  14. ^ Страница руководства Debian для Cuneiform для Linux версии 1.1.0
  15. ^ "Загрузка языковых пакетов OCR SDK" . Dynamsoft.com . Проверено 12 сентября 2013 .
  16. ^ «OmniPage CSDK - OCR Document Capture Toolkit | Document Imaging & OCR» . Нюанс. Архивировано из оригинала на 2010-08-24 . Проверено 12 сентября 2013 .
  17. ^ «Преобразование стандартного документа OmniPage» . Нюанс. Архивировано из оригинала на 2014-03-13 . Проверено 25 февраля 2014 .
  18. ^ "Домашняя страница GOCR" . wasd.urz.uni-magdeburg.de . Проверено 17 октября 2018 .
  19. ^ "ГОКР" . Jocr.sourceforge.net . Проверено 12 сентября 2013 .
  20. ^ Диас, Антонио (2015-04-16). «Выпущен GNU Ocrad 0.26» (Список рассылки). инфо-гну.
  21. ^ OCRopus включает инструмент ocropus-hocr, который производит hOCR из результатов распознавания.
  22. ^ В сочетании с инструментами hocr
  23. ^ Ассефи, Мехди (2016-12-01). «OCR как услуга: экспериментальная оценка Google Docs OCR, Tesseract, ABBYY FineReader и Transym» . ResearchGate . Проверено 31 января 2019 .