Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

OCR-B - это моноширинный шрифт, разработанный в 1968 году Адрианом Фрутигером для Monotype в соответствии со стандартом Европейской ассоциации производителей компьютеров . Его функция заключалась в облегчении операций оптического распознавания символов с помощью определенных электронных устройств, первоначально предназначенных для финансовых и банковских целей. Он был принят в качестве мирового стандарта в 1973 году. [1] Он соответствует стандарту ISO 1073-2: 1976 (E), усовершенствованному в 1979 году (дизайн «высокая печать», размер I). Включает в себя все ASCIIсимволы и другие символы, необходимые в банковской среде. Он широко используется для удобочитаемых цифр в штрих-кодах UPC / EAN . [2] [ необходима ссылка ] Он также используется для машиночитаемых паспортов . [3] Он разделяет эту цель с OCR-A , но его легче читать человеческим глазом и мозгом, и он имеет менее технический вид, чем OCR-A.

История [ править ]

В июне 1961 года Европейская ассоциация производителей компьютеров (ECMA) приступила к деятельности по стандартизации, связанной с оптическим распознаванием символов (OCR) . После оценки существующих дизайнов OCR было решено разработать два новых шрифта: стилизованный дизайн, состоящий только из цифр, названный «Class A»; и более традиционный дизайн шрифта с более широким охватом символов, названный «Класс B». В феврале 1965 года ECMA предложила дизайн шрифта «Класса B» в ISO , которая приняла его как международный стандарт ISO 1073-2 в октябре 1965 года. [4] Первая редакция содержала три размера шрифта: I, II и III. Спецификация включала офсетные конструкцию, предназначенную для полиграфического оборудования высокого качества; и закругленный крайДизайн с постоянной шириной ширины для ударных принтеров [5] : 3 с пониженным типографским качеством.

В сентябре 1969 года ECMA начала работу по пересмотру опубликованного стандарта. Чтобы сделать OCR-B более распространенным, были немного изменены формы некоторых символов. В новой редакции был удален размер шрифта II, который редко использовался на практике; он удалил пять форм символов; и добавлен новый размер шрифта IV. ECMA опубликовала второе издание OCR-B в октябре 1971 г. [4]

В марте 1976 года ECMA опубликовала третью версию своей спецификации ECMA-11. Он добавил символы § и ¥ к OCR-B; добавлены два типа стираемых меток (█) для затемнения неправильно напечатанных символов; длина вертикальной полосы была изменена в соответствии с ISO 1073-2. [4]

В 1993 году Турция предложила расширить ISO 1073-2, включив в него турецкие буквы Ğğ , İı и Şş . [6] Запрос был обобщен, чтобы расширить OCR-B с помощью ряда латинских и греческих букв, используемых в европейских языках. [7] : 27 Таким образом, был начат пересмотр стандарта ISO 1073-2: 1976, в результате которого были подготовлены три последовательных проекта документов. В окончательном варианте OCR-B будет расширен 40 латинскими и 10 греческими буквами; для шести латинских букв черновик дал новые альтернативные формы. [7] : 26 Запрос на расширение OCR-B с вьетнамским акцентом был отклонен. [7] : 27В отличие от предыдущих версий стандарта, которые определяли формы глифов через справочные чертежи, новая редакция должна была включать формы в машиночитаемой форме. [7] : 26 Однако промышленная поддержка тестирования нового шрифта не могла быть обеспечена в то время, поэтому работа по пересмотру была остановлена ​​в 1997 году. [7] : IV Рабочая группа описала свои выводы в техническом отчете. [7] : 1

Два предложенных варианта знака OCR-B Euro [5]

В июне 1998 года Европейский комитет по стандартизации опубликовал отчет о добавлении знака евро в OCR-B. [5] В отчете предлагались как одинарный, так и двустишийный вариант знака евро, оставляя решение о дальнейшем тестировании работы OCR. [5] : 4 Тестирование было трудным: теоретические методы проектирования, использованные при первоначальной разработке глифов OCR-B, больше не могли быть воспроизведены, а технологические ограничения 1960-х годов также больше не были полностью актуальны в среде OCR 1990-х. [8]Был разработан новый метод тестирования с использованием современной технологии OCR. Тесты не выявили разницы в производительности оптического распознавания текста между двумя вариантами Euro и рекомендовали использовать вариант с двумя штрихами, поскольку он соответствует обычной форме глифа. [8] У проекта не было средств для тщательного тестирования расширений глифов предложения 1993 года; первоначальные результаты были неубедительными. [8]

Доступность [ править ]

Microsoft Office поставляется с версией Letterpress OCR-B, разработанной Monotype . Он охватывает Windows-1252 . [9] Многие поставщики, включая Adobe, по-прежнему продают свои версии OCR-A и OCR-B.

Система набора текста TeX имеет общедоступный шрифт Constant Strokewidth OCR-B в форме определения METAFONT . Он был создан Норбертом Шварцем в 1995 году и обновлен в 2010 году. Он имеет настройку для квадратных концов. [10] Определение также было переведено в METATYPE1 , поэтому округленная версия также доступна в TrueType и OpenType . [11]

Версия Constant Strokewidth OCR-B Мэтью Андерсона имеет расширенный охват символов. Он доступен по лицензии CC-BY 4.0 . [12]

Ссылки [ править ]

  1. ^ Фрутигер, Адриан. Тип. Знак. Символ . ABC Verlag, Цюрих, 1980. стр. 50
  2. ^ «Руководство по внедрению GS1 Human Readable Interpretation (HRI)» (PDF) . GS1 AISBL. 2018. с. 13 . Проверено 27 сентября 2018 .
  3. ^ Microsoft Word - Doc.9303.Part.03.7th.Edition.alltext.en.docx - 9303_p3_cons_en.pdf (PDF) . Doc 9303: Машиносчитываемые проездные документы, часть 3: Технические характеристики, общие для всех МСПД (седьмое издание). Международная организация гражданской авиации . 2015. с. 25. ISBN  978-92-9249-792-7. Проверено 3 марта 2016 .
  4. ^ a b c «Стандарт ECMA-11 для набора буквенно-цифровых символов OCR-B для оптического распознавания» (PDF) . Европейская ассоциация производителей компьютеров. Март 1976 г. Раздел «Краткая история».
  5. ^ a b c d «Проект отчета о евроглифе в OCR-B» (PDF) . 28 июня 1998 г.
  6. Карл Ивар Ларссон (8 августа 2000 г.). «Примечания о передаче ответственности за стандарты OCR-B» .
  7. ^ a b c d e f "Предложение по техническому отчету типа 3, TR 15907, Информационные технологии - Пересмотр стандарта OCR-B (ISO 1073 / II-1976)" (PDF) . 28 сентября 1998 г.
  8. ^ a b c Карссон, Кент Ивар (28 июня 1998 г.), Отчет TC304 о ситуации с OCR-B , Технический комитет Unicode, Консорциум Unicode, Документ UTC L2 / 01-259
  9. ^ https://docs.microsoft.com/en-us/typography/font-list/ocrb
  10. ^ https://ctan.org/tex-archive/fonts/ocr-b?lang=en
  11. ^ https://tsukurimashou.osdn.jp/ocr.php.en
  12. ^ https://web.archive.org/web/20190328165040/https://wehtt.am/ocr-b/

Внешние ссылки [ править ]

  • Веб-страница ISO, где можно купить копию стандарта
  • веб-страница linotype.com на OCR-B
  • Статья о шрифте OCR на wordpress.com