Из Википедии, бесплатной энциклопедии
  (Перенаправлено из оптического листа ответов )
Перейти к навигации Перейти к поиску

Оптическое распознавание меток (также называемое оптическим считыванием меток и OMR ) - это процесс сбора данных, помеченных человеком, из форм документов, таких как опросы и тесты. Они используются для чтения анкет, экзаменационных работ с множественным выбором в виде линий или заштрихованных областей.

Фон OMR [ править ]

Тестовая форма OMR с регистрационными метками и выпадающими цветами, предназначенная для сканирования с помощью специального устройства OMR

Многие традиционные устройства OMR работают со специальным сканером, который направляет луч света на бланк. Контрастная отражательная способность в заранее определенных положениях на странице затем используется для обнаружения этих отмеченных областей, поскольку они отражают меньше света, чем пустые области бумаги.

Некоторые устройства OMR используют формы, которые предварительно напечатаны на «трансоптической» бумаге, и измеряют количество света, проходящего через бумагу; таким образом, отметка на каждой стороне бумаги уменьшит количество света, проходящего через бумагу.

В отличие от специального устройства OMR, программное обеспечение OMR для настольных компьютеров позволяет пользователю создавать собственные формы в текстовом редакторе и распечатывать их на лазерном принтере. Затем программное обеспечение OMR работает с обычным настольным сканером изображений с устройством подачи документов для обработки заполненных форм.

OMR обычно отличается от оптического распознавания символов (OCR) тем, что не требуется сложный механизм распознавания образов . То есть метки построены таким образом, что вероятность неправильного чтения меток мала. Это действительно требует, чтобы изображение имело высокую контрастность и легко узнаваемую или несущественную форму. Поле, связанное с OMR и OCR, - это распознавание штрих-кодов , таких как штрих-код UPC на упаковке продукта.

Одним из наиболее известных применений оптического распознавания знака является использование # 2 карандаша (HB в Европе) пузырь оптических листов ответов в Множественный выбор экзаменов . Учащиеся отмечают свои ответы или другую личную информацию темными кружками, отмеченными на заранее распечатанном листе. После этого лист автоматически классифицируется сканирующим устройством. В Соединенных Штатах и ​​большинстве европейских стран горизонтальная или вертикальная «галочка» в прямоугольной «ромбовидной форме» является наиболее часто используемым типом формы OMR; Самым распространенным приложением в Соединенном Королевстве является форма национальной лотереи Соединенного Королевства. [ необходима цитата ] Таблетки в форме ромбов являются более поздней технологией и имеют то преимущество, что их легче маркировать и легче стирать. Большие «пузырьковые» метки - это технология, унаследованная от очень ранних машин OMR, которые были настолько нечувствительны, что для надежности требовалось большое количество. В большинстве азиатских стран для заполнения оптического листа ответов используется специальный маркер . Учащиеся также отмечают ответы или другую информацию затемненными кружками, отмеченными на заранее распечатанном листе. Затем лист автоматически оценивается сканирующим устройством.

Многие из сегодняшних приложений OMR требуют заполнения специализированных форм. Эти формы оптимизированы для компьютерного сканирования, с тщательной регистрацией при печати и тщательным дизайном, так что двусмысленность сведена к минимуму. Благодаря чрезвычайно низкому уровню ошибок, низкой стоимости и простоте использования OMR является популярным методом подсчета голосов. [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] »

Метки OMR также добавляются к элементам физической почты, поэтому можно использовать оборудование для вставки папок. Метки добавляются к каждой (обычно лицевой / нечетной) странице почтового документа и состоят из последовательности черных штрихов, которые сканирует устройство для вставки папок, чтобы определить, когда письмо следует сложить, а затем вставить в конверт.

Оптический лист ответов [ править ]

Ответ на вопрос SAT по математике, отмеченный на оптическом листе ответов

Оптический лист ответов или лист пузыря является особым типом формы используется в нескольких выборе вопроса экзаменов . Оптическое распознавание меток используется для обнаружения ответов. Самой известной компанией в Соединенных Штатах, занимающейся оптическими листами ответов, является Scantron Corporation , хотя для некоторых видов использования требуется собственная индивидуальная система. [ необходима цитата ]

Оптические листы ответов обычно имеют набор пустых овалов или квадратов, которые соответствуют каждому вопросу, часто на отдельных листах бумаги. Штрих-коды могут пометить лист для автоматической обработки, и каждая серия заполненных овалов будет возвращать определенное значение при считывании. Таким образом, ответы студентов могут быть записаны в цифровом виде или идентифицированы.

Чтение [ править ]

Первые оптические листы с ответами были прочитаны путем прохождения света через лист и измерения того, какая часть света была заблокирована, с помощью фототрубок на противоположной стороне. [11] Поскольку некоторые фотолаборы в основном чувствительны к синему концу видимого спектра , [12] нельзя использовать синие ручки, поскольку синие чернила отражают и пропускают синий свет. Из-за этого для заполнения пузырьков пришлось использовать карандаши номер два - графит - очень непрозрачное вещество, которое поглощает или отражает большую часть падающего на него света. [11]

Современные оптические листы ответов читаются на основе отраженного света, измерения освещенности и темноты. Их не нужно заполнять карандашом номер два, хотя они рекомендуются по сравнению с другими типами (это связано с более светлыми отметками, нанесенными карандашами с большим номером, и пятнами от карандашей номер 1). Черные чернила будут считываться, хотя многие системы будут игнорировать метки того же цвета, что и напечатанная форма. [11] Это также позволяет использовать оптические листы с ответами на двух сторонах, поскольку метки, сделанные на противоположной стороне, не будут мешать показаниям отражательной способности столько же, сколько и с показаниями непрозрачности.

Большинство систем учитывают человеческую ошибку при неточном заполнении овалов - до тех пор, пока они не попадают в другие овалы и овал почти заполнен, сканер обнаружит его заполненным.

Ошибки [ править ]

Оптические листы ответов могут быть напечатаны неправильно, так что все овалы будут считаться заполненными. Это происходит, если очертания овалов слишком толстые или неровные. Во время президентских выборов в США в 2008 году это произошло с более чем 19 000 открепительных удостоверений в графстве Гвиннетт , штат Джорджия , и было обнаружено после того, как около 10 000 были уже возвращены. Небольшая разница не была очевидна невооруженным глазом и не была обнаружена до тех пор, пока в конце октября не был проведен тестовый запуск. Это потребовало, чтобы все бюллетени были переведены в правильно напечатанные бюллетени изолированными работниками комиссии по выборам под закрытымнаблюдение со стороны членов Демократической и Республиканской (но не других ) политических партий и депутатов шерифа графств . Передача по закону не могла произойти до дня выборов (4 ноября). [ необходима цитата ]

Программное обеспечение OMR [ править ]

Форма опроса OMR на обычной бумаге, без регистрационных меток и выпадающих цветов, предназначена для сканирования с помощью сканера изображений и программного обеспечения OMR

Программное обеспечение OMR - это компьютерное программное приложение, которое делает возможным OMR на настольном компьютере с помощью сканера изображений для обработки опросов, тестов, ведомостей посещаемости, контрольных списков и других форм простой бумаги, напечатанных на лазерном принтере.

Программное обеспечение OMR используется для сбора данных из листов OMR. Во время сбора данных сканирующие устройства фокусируются на многих факторах, таких как толщина бумаги, размеры листа OMR и шаблон проектирования.

Коммерческое программное обеспечение OMR [ править ]

Одним из первых пакетов программного обеспечения OMR, в котором использовались изображения с обычных сканеров изображений, был Remark Office OMR, созданный Gravic, Inc. (первоначально называвшийся Principia Products, Inc.). Remark Office OMR 1.0 был выпущен в 1991 году.

Потребность в программном обеспечении OMR возникла из-за того, что в ранних системах оптического распознавания меток использовались специальные сканеры и специальные предварительно напечатанные формы с выпадающими цветами и регистрационными метками. Такие формы обычно стоят от 0,10 до 0,19 доллара за страницу. [13] В отличие от этого, пользователи программного обеспечения OMR создают свои собственные формы с распознаванием знаков с помощью текстового процессора или встроенного редактора форм, распечатывают их локально на принтере и могут сэкономить тысячи долларов на большом количестве форм. [14]

Идентификация оптических меток в форме, например, для обработки бланков переписи, была предложена многими компаниями, занимающимися обработкой бланков (Batch Transaction Capture) с конца 1980-х годов. В основном это основано на битональном изображении и количестве пикселей с минимальным и максимальным количеством пикселей для устранения посторонних меток, таких как те, которые были стерты грязным ластиком, которые при преобразовании в черно-белое изображение (битональное) могут выглядеть как допустимые метки. . Таким образом, этот метод может вызвать проблемы, когда пользователь передумает, и поэтому некоторые продукты начали использовать оттенки серого, чтобы лучше идентифицировать цель маркера - внутренне скантрон и сканеры NCS использовали оттенки серого.

Программное обеспечение OMR также используется для добавления меток OMR к почтовым документам, чтобы их можно было сканировать с помощью устройства для вставки папок. Примером программного обеспечения OMR является Mail Markup от британского разработчика Funasset Limited. Это программное обеспечение позволяет пользователю настраивать и выбирать последовательность OMR, а затем применять метки OMR к почтовым документам перед печатью.

Библиотеки разработки OMR [ править ]

Программное обеспечение OMR с открытым исходным кодом [ править ]

Некоторое программное обеспечение OMR, разработанное и распространяемое под бесплатными лицензиями или лицензиями с открытым исходным кодом:

История [ править ]

Оптическое распознавание метки (OMR) - это сканирование бумаги для обнаружения наличия или отсутствия метки в заранее заданном месте. [4] Оптическое распознавание знаков развилось из нескольких других технологий. В начале 19-го и 20-го века были выданы патенты на машины, которые помогали слепым. [2]

OMR теперь используется как устройство ввода для ввода данных. Две ранние формы OMR - это бумажная лента и перфокарты, в которых используются настоящие отверстия, пробитые в носителе, вместо заполненных карандашом кружков на носителе. Бумажная лента использовалась еще в 1857 году в качестве устройства ввода для телеграфа. [10] Перфокарты были созданы в 1890 году и использовались в качестве устройств ввода для компьютеров. Использование перфокарт сильно сократилось в начале 1970-х годов с появлением персональных компьютеров. [8] В современных OMR, где распознается карандаш, заполненный пузырем, распознавание осуществляется с помощью оптического сканера.

Первым сканером считывания меток была машина для подсчета очков IBM 805 ; эти метки считываются путем измерения электропроводности графитового грифеля карандаша с помощью пар проволочных щеток, сканировавших страницу. В 1930-х годах Ричард Уоррен из IBM экспериментировал с системами оптического распознавания меток для тестовой оценки, как описано в патентах США 2150256 (подана в 1932 году, выдана в 1939 году) и 2010653 (подана в 1933 году, выдана в 1935 году). Первый успешный оптический сканер считывания меток был разработан Эвереттом Франклином Линдквистом.как задокументировано в патенте США 3050248 (подана в 1955 г., выдана в 1962 г.). Линдквист разработал множество стандартизированных образовательных тестов и нуждался в машине для подсчета результатов тестов лучше, чем тогдашний стандартный IBM 805. Права на патенты Линдквиста принадлежали Центру исследований измерений до 1968 года, когда Университет Айовы продал предприятие Westinghouse Corporation .

В тот же период IBM также разработала успешную оптическую машину для тестирования распознавания меток, как указано в патенте США № 2 944 734 (подана в 1957 г., выдана в 1960 г.). В 1962 году IBM представила это как оптический считыватель меток IBM 1230. Это и множество связанных с ним машин позволили IBM перенести широкий спектр приложений, разработанных для своих машин считывания меток, на новую оптическую технологию. Эти приложения включают в себя различные формы управления запасами и отчетов о проблемах, большинство из которых имеют размеры стандартной перфокарты .

В то время как другие участники образовательного тестирования были сосредоточены на продаже услуг сканирования, Scantron Corporation, основанная в 1972 году [15], придерживалась другой модели; он будет распространять недорогие сканеры в школах и получать прибыль от продажи тестовых форм. В результате многие люди стали думать обо всех формах, воспринимающих метку (независимо от того, воспринимаются они оптически или нет) как о скантронных формах. Scantron действует как дочерняя компания M&F Worldwide (MFW) [16] и предоставляет системы и услуги тестирования и оценки, а также услуги по сбору и анализу данных для образовательных учреждений, предприятий и правительства.

В 1983 году Westinghouse Learning Corporation была приобретена компанией National Computer Systems (NCS). В 2000 году NCS была приобретена Pearson Education , где технология OMR составила ядро ​​группы управления данными Pearson. В феврале 2008 года M&F Worldwide приобрела группу управления данными у Pearson; группа теперь является частью бренда Scantron. [17]

OMR использовался во многих ситуациях, как указано ниже. Использование OMR в системах инвентаризации было переходом между перфокартами и штрих-кодами и не так часто используется для этой цели. [8] OMR все еще широко используется для опросов и тестирования.

Использование [ править ]

Использование OMR не ограничивается школами или агентствами по сбору данных; многие предприятия и учреждения здравоохранения используют OMR для оптимизации процессов ввода данных и уменьшения ошибок ввода. Технологии OMR, OCR и ICR позволяют собирать данные из бумажных форм. OMR также может быть выполнен с использованием сканера OMR (дискретная считывающая головка) или сканера изображений. [18]

Приложения [ править ]

Форма ставок OMR, используемая на ипподроме Фукусима Японской ассоциации гонок , Япония.
Букмекерская контора с использованием этой формы.

OMR имеет много других приложений, например:

  • В процессе институционального исследования
  • Опросы сообщества
  • Опросы потребителей
  • Тесты и оценки
  • Оценки и отзывы
  • Сбор данных
  • Оценка продукта
  • Табели учета рабочего времени и инвентаризация
  • Формы подписки на членство
  • Лотереи и голосование
  • Геокодирование (например, почтовые индексы )
  • Заявки на ипотечный кредит , банковское дело и страхование

Типы полей [ править ]

OMR имеет разные поля для предоставления желаемого пользователем формата. Эти поля включают:

  • Множественный, где есть несколько вариантов, но выбран только один. Например, форма может запрашивать один из вариантов ABCDE; 12345; совершенно не согласен, не согласен, безразличен, согласен, полностью согласен; или похожие.
  • Сетка: пузыри или линии настроены в формате сетки, чтобы пользователь мог ввести номер телефона, имя, идентификационный номер и так далее.
  • Сложить, суммировать ответы до одного значения
  • Логическое значение, отвечающее да или нет на все применимые
  • Двоичный, отвечая да или нет только на один
  • Поля с пунктирными линиями, разработанные Smartshoot OMR, позволяют опускать границы, как при традиционном опускании цвета.

Возможности / требования [ править ]

В прошлом и в настоящее время для некоторых систем OMR требуется специальная бумага, специальные чернила и специальный считыватель ввода (Bergeron, 1998). Это ограничивает типы вопросов, которые можно задать, и не допускает большого разнообразия при вводе формы. Прогресс в OMR теперь позволяет пользователям создавать и распечатывать свои собственные формы и использовать сканер (желательно с устройством подачи документов) для чтения информации. [19] Пользователь может упорядочивать вопросы в формате, соответствующем его потребностям, при этом при этом он может легко вводить данные. [20] Системы OMR достигают стопроцентной точности и в среднем распознают отметки всего за 5 миллисекунд . [19]Пользователи могут использовать квадраты, круги, эллипсы и шестиугольники для зоны отметки. Затем программное обеспечение можно настроить на распознавание заполненных пузырьков, крестиков или галочек.

OMR также можно использовать в личных целях. На рынке есть многофункциональные принтеры, которые будут печатать фотографии, выбранные пользователем, путем заполнения пузырьков для выбора размера и выбора бумаги на напечатанном индексном листе. После заполнения листа пользователь помещает лист на сканер для сканирования, и принтер распечатывает фотографии в соответствии с указанными отметками. [ необходима цитата ]

Недостатки [ править ]

У OMR также есть некоторые недостатки и ограничения. Если пользователь хочет собрать большие объемы текста, OMR усложняет сбор данных. [21] Также существует вероятность потери данных в процессе сканирования, а неправильные или ненумерованные страницы могут привести к их сканированию в неправильном порядке. Кроме того, если не приняты меры предосторожности, страница может быть повторно просканирована, что приведет к дублированию данных и искажению данных. [19]

В результате широкого распространения и простоты использования OMR стандартизированные экзамены могут состоять в основном из вопросов с несколькими вариантами ответов, что меняет характер того, что тестируется.

См. Также [ править ]

  • Эффект ИИ
  • Приложения искусственного интеллекта
  • Отметка часов
  • Электронный сбор данных
  • Отметить смысл
  • Распознавание объекта
  • Оптическое распознавание символов
  • Распознавание образов
  • Бенджамин Д. Вуд
Списки
  • Список новых технологий
  • Схема искусственного интеллекта

Ссылки [ править ]

  1. ^ «Оптическое распознавание меток» . Архивировано из оригинального 13 июня 2006 года . Проверено 13 июня 2006 года .
  2. ^ a b Исследование оптического распознавания символов | Научная библиотека Macmillan: Компьютерные науки . Bookrags.com. 2010-11-02 . Проверено 3 июля 2015 .
  3. ^ "Оптические сканирующие системы -" . Aceproject.org . Проверено 3 июля 2015 .
  4. ^ a b Хааг, С., Каммингс, М., МакКуббри, Д., Пинсонно, А., Донован, Р. (2006). Информационные системы управления для информационной эпохи (3-е изд.). Канада: Макгроу-Хилл Райерсон.
  5. ^ «Библиотека статистиков: использование сканеров и программного обеспечения OMR для доступного ввода данных» . Архивировано из оригинального 10 ноября 2005 года . Проверено 13 июня 2006 года .
  6. ^ «Сбор данных по дешевке» . Июль 2015. Архивировано из оригинала (PPT) 22.07.2015 . Проверено 21 июля 2015 .
  7. ^ «Remark Office OMR от Gravic (Principia Products), работает с популярными сканерами изображений для сканирования опросов, тестов и других форм на обычной бумаге» . Omrsolutions.com . Проверено 3 июля 2015 .
  8. ^ a b c Палмер, Роджер К. (1989, сентябрь) Основы автоматической идентификации [Электронная версия]. Канадские системы данных, 21 (9), 30-33
  9. ^ «Технология обработки форм» . Tkvision.com. Архивировано из оригинала на 2008-05-11 . Проверено 3 июля 2015 .
  10. ^ a b Исследования устройств ввода | Научная библиотека Macmillan: Компьютерные науки . Bookrags.com. 2010-11-02 . Проверено 3 июля 2015 .
  11. ^ a b c Блумфилд, Луис А. «Вопрос 1529: Почему тесты типа скантрона читают только карандаши №2? Могут ли работать другие карандаши?» . HowEverythingWorks.org.
  12. ^ Технического руководство Mullard Том 4 Раздела 4: Фотоэмиссионный Cells (1960 Edition)
  13. ^ «Архивная копия» (PDF) . Архивировано из оригинального (PDF) 20 марта 2009 года . Проверено 12 марта 2009 . CS1 maint: заархивированная копия как заголовок ( ссылка )
  14. ^ Майкл Вагенхайм. «Оценка экзаменов по биологии в большом государственном университете» . RemarkSoftware.com . Проверено 21 июля 2015 .
  15. ^ "Рынок образовательного тестирования" . Bc.edu . Проверено 3 июля 2015 .
  16. ^ "M&F Worldwide Corp" . Архивировано из оригинала 25 июля 2008 года . Проверено 20 июля 2008 года .
  17. ^ "NCS Pearson, Inc" . Архивировано из оригинального 14 июня 2010 года . Проверено 14 июня 2010 года .
  18. ^ http://datamanagement.scantron.com/pdf/icr-ocr-omr.pdf [ мертвая ссылка ]
  19. ^ a b c Бержерон, [ кто? ]
  20. ^ Лопрести, 1996 [ кто? ]
  21. ^ Грин, 2000 [ кто? ]