Оптическое распознавание символов - это блок Unicode, содержащий сигнальные символы для стандартов OCR и MICR .
Оптическое распознавание символов | |
---|---|
Диапазон | U + 2440..U + 245F (32 кодовых точки) |
Самолет | BMP |
Скрипты | Общий |
Наборы символов | OCR элементы управления |
Назначенный | 11 кодовых точек |
Неиспользованный | 21 зарезервированная кодовая точка |
История версий Unicode | |
1.0.0 (1991) | 11 (+11) |
Примечание : [1] [2] |
Блокировать
Оптическое распознавание символов [1] [2] Официальная таблица кодов Консорциума Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | B | C | D | E | F | |
U + 244x | ⑀ | ⑁ | ⑂ | ⑃ | ⑄ | ⑅ | ⑆ | ⑇ | ⑈ | ⑉ | ⑊ | |||||
U + 245x | ||||||||||||||||
Заметки |
Подзаголовки
Блок оптического распознавания символов имеет три неофициальных подзаголовка (группы) в своей коллекции символов: OCR-A, MICR и OCR. [3]
OCR-A
Подзаголовок OCR-A содержит шесть символов, взятых из шрифта OCR-A, описанного в стандарте ISO 1073-1: 1976: U + 2440 ⑀ OCR HOOK ,U + 2441 ⑁ СТУЛ OCR ,U + 2442 ⑂ ВИЛКА OCR ,U + 2443 ⑃ ПЕРЕВЕРНУТАЯ ВИЛКА OCR ,U + 2444 ⑄ ПРЯЖКА РЕМНЯ OCR иU + 2445 ⑅ Галстук OCR BOW TIE . Галстук-бабочка OCR имеет информативный псевдоним «уникальная звездочка».
MICR
Подзаголовок MICR содержит четыре символа пунктуации для идентификаторов банковских чеков , взятых из шрифта E-13B для распознавания символов магнитными чернилами (кодифицированного в стандарте ISO 1004: 1995):U + 2446 ⑆ ИДЕНТИФИКАЦИЯ ОТДЕЛЕНИЯ БАНКА OCR ,U + 2447 ⑇ СУММА ПРОВЕРКИ OCR ,U + 2448 ⑈ OCR DASH иU + 2449 ⑉ НОМЕР УЧЕТНОЙ ЗАПИСИ КЛИЕНТА OCR .
Последние два символа неправильно названы: их имена были случайно переключены, когда они были названы в 1993 (первом) издании ISO / IEC 10646 , [4] ошибка, которая присутствовала с Unicode 1.0.0. [5] Хотя их официальные названия остаются неизменными из-за политики стабильности Unicode, у них обоих исправлены нормативные псевдонимы : U + 2448 ⑈ - MICR ON US SYMBOL , а U + 2449 ⑉ - MICR DASH SYMBOL [6] (стандарт отмечает, что «имена символов Unicode содержат несколько неправильных терминов»).
Эти символы ранее кодировались кодировкой ISO-IR-98, определенной в ISO 2033 : 1983, в которой они назывались просто от SYMBOL ONE до SYMBOL FOUR . [7] Все четыре символа имеют информативные псевдонимы в диаграммах Unicode: «транзит», «сумма», «на нас» и «тире» соответственно.
OCR
Подзаголовок OCR состоит из одного символа: U + 244A ⑊ ДВОЙНОЙ ЗАДНИЙ ЗАДНИЙ OCR .
История
Следующие документы, относящиеся к Unicode, фиксируют цель и процесс определения определенных символов в блоке оптического распознавания символов:
Версия | Окончательные коды [a] | Считать | L2 ID | ID WG2 | Документ |
---|---|---|---|---|---|
1.0.0 | U + 2440..244A | 11 | (быть определенным) | ||
L2 / 10-416R | Мур, Лиза (09.11.2010), "Consensus 125-C39", UTC # 125 / L2 # 222 Minutes , создайте два формальных псевдонима: U + 2448 MICR ON US SYMBOL и U + 2449 MICR DASH SYMBOL для Unicode 6.1. | ||||
N4103 | «T.3. Оптическое распознавание символов», неподтвержденный протокол совещания 58 РГ 2 , 03.01.2012 | ||||
|
Рекомендации
- ^ «База данных символов Юникода» . Стандарт Юникода . Проверено 9 июля 2016 .
- ^ «Нумерованные версии стандарта Unicode» . Стандарт Юникода . Проверено 9 июля 2016 .
- ^ «Таблицы кодов Unicode: оптическое распознавание символов» (PDF) . Стандарт Unicode, версия 6.3 . Проверено 27 февраля 2014 года .
- ^ ISO / IEC JTC 1 / SC 2 / WG 2 (2012-01-03). «T.3. Оптическое распознавание символов». Неподтвержденный протокол заседания 58 РГ 2 (PDF) . п. 29. SC2 N4188 / WG2 N4103.
Эти символы распознавания символов магнитными чернилами (MICR) используются банками на чеках. Имена этих символов были случайно перепутаны в версии ISO / IEC 10646 1993 года.
- ^ «3.8: Блок-за-блок-схемы» (PDF) . Стандарт Юникода . версия 1.0. Консорциум Unicode .
- ^ Фрейтаг, Асмус; Макгоуэн, Рик; Уистлер, Кен (2017-04-10). Известные аномалии в именах символов Unicode (4-е изд.). Консорциум Unicode . Техническая записка по Unicode № 27.
- ^ ISO / TC97 / SC2 (1 августа 1985 г.). «ISO-IR-98: Набор из 14 графических символов шрифта E13B» (PDF) . ITSCJ / IPSJ .