GOCR (или JOCR ) - это бесплатная программа оптического распознавания символов , изначально написанная Йоргом Шуленбургом. Его можно использовать для преобразования или сканирования файлов изображений ( портативных растровых изображений или PCX ) в текстовые файлы . [1]
Разработчики) | Йорг Шуленбург |
---|---|
Первый выпуск | Декабрь 2000 г . |
Стабильный выпуск | 0.52 / 15 октября 2018 г . |
Написано в | C |
Операционная система | Linux , Windows , OS / 2 |
Тип | Оптическое распознавание символов |
Лицензия | Стандартная общественная лицензия GNU |
Веб-сайт | www-e |
Функции
GOCR утверждает, что может обрабатывать одноколоночные шрифты без засечек высотой 20–60 пикселей. Он сообщает о проблемах со шрифтами с засечками, перекрывающихся символах, рукописном тексте, неоднородных шрифтах, зашумленных изображениях, больших углах перекоса и тексте, написанном чем-либо, кроме латинского алфавита . [2]
GOCR также может переводить штрих-коды . [2]
Пользовательский интерфейс
GOCR можно использовать как автономное приложение командной строки или как серверную часть для других программ. Он поставляется с графическим интерфейсом gocr.tcl . GOCR также можно использовать в качестве механизма распознавания текста в OCRFeeder . [3]
Разработка
Версия 0.3.0 была выпущена в декабре 2000 года, 0.3.5 в феврале 2002 года и 0.37 в августе 2002 года.
Между версией 0.40 (март 2005 г.) и 0.43 (декабрь 2006 г.) механизм распознавания был постепенно заменен векторной версией.
Версия 0.48 была выпущена в августе 2009 года. [1]
Версия 0.49 была выпущена в сентябре 2010 года. [1]
Версия 0.50 была выпущена в марте 2013 года. [1]
Версия 0.51 была выпущена в августе 2017 года. [4]
Номенклатура
Первоначально приложение называлось GOCR, что означает оптическое распознавание символов GNU. Когда пришло время зарегистрировать проект на SourceForge, название GOCR уже было занято, поэтому проект был зарегистрирован как JOCR (оптическое распознавание символов Йорга). [1] [2]
В результате этого проект и приложение известны как GOCR и JOCR. Шуленбург признает, что это проблематично. [1]
Форматы
Допустимые форматы изображений: [2]
- PNM
- PBM
- PGM
- PPM
- PCX (некоторые)
- TGA
Другие форматы автоматически конвертируются с помощью netpbm-progs, gzip и bzip2 с использованием канала unix. Эти типы изображений включают: [2]
- pnm.gz
- pnm.bz2
- PNG
- JPG
- TIFF
- Гифка
- BMP
Рекомендации
- ^ Б с д е е Шуленбурга, Joerg (март 2007). «ГОКР» . Проверено 25 июня 2008 .
- ^ а б в г д SfR Fresh (nd). "Член" gocr-0.45 / README "архива gocr-0.45.tar.gz" . Архивировано из оригинала на 2008-09-08 . Проверено 25 июня 2008 .
- ^ «Репозиторий исходного кода GNOME GIT» . Проверено 3 февраля 2010 года .
- ^ "Главная страница ГОКР" . www-e.uni-magdeburg.de . Проверено 28 сентября 2017 года .
Внешние ссылки
- Главная страница GOCR
- GOCR на SourceForge.net (может быть устаревшим)