Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Хаар как функции являются цифровыми изображениями функции , используемая в распознавания объектов . Своим названием они обязаны интуитивному сходству с вейвлетами Хаара и использовались в первом детекторе лиц в реальном времени. [1]

Исторически сложилось так, что работа только с интенсивностями изображения (т. Е. Значениями пикселей RGB для каждого пикселя изображения) делала задачу вычисления признаков дорогостоящей в вычислительном отношении . Публикация Papageorgiou et al. [2] обсуждает работу с альтернативным набором функций, основанным на вейвлетах Хаара вместо обычных интенсивностей изображения. Пол Виола и Майкл Джонс [1] адаптировали идею использования вейвлетов Хаара и разработали так называемые свойства Хаара. Функция типа Хаара рассматривает смежные прямоугольные области в определенном месте в окне обнаружения, суммирует интенсивности пикселей в каждой области и вычисляет разницу между этими суммами. Эта разница затем используется для категоризациичасти изображения. Например, с человеческим лицом обычно наблюдается, что у всех лиц область глаз темнее, чем область щек. Таким образом, общая функция Хаара для распознавания лиц - это набор из двух смежных прямоугольников, которые расположены над глазом и в области щек. Положение этих прямоугольников определяется относительно окна обнаружения, которое действует как ограничивающая рамка для целевого объекта (в данном случае лица).

На этапе обнаружения структуры обнаружения объектов Виолы – Джонса окно целевого размера перемещается по входному изображению, и для каждого фрагмента изображения вычисляется характеристика Хаара. Затем это различие сравнивается с полученным порогом, который отделяет объекты, не являющиеся объектами. Поскольку такая характеристика Хаара является лишь слабым учеником или классификатором (ее качество обнаружения немного лучше, чем случайное предположение), для описания объекта с достаточной точностью необходимо большое количество свойств, подобных Хаару. Таким образом, в структуре обнаружения объектов Виолы – Джонса функции, подобные Хаару, организованы в нечто, называемое каскадом классификаторов, чтобы сформировать сильного ученика или классификатора.

Ключевым преимуществом функции, подобной Хаару, перед большинством других функций является ее скорость вычислений. Благодаря использованию интегральных изображений элемент Хаара любого размера может быть рассчитан за постоянное время (примерно 60 инструкций микропроцессора для элемента с двумя прямоугольниками).

Прямоугольные детали типа Хаара [ править ]

Простая прямоугольная функция типа Хаара может быть определена как разница суммы пикселей областей внутри прямоугольника, которая может находиться в любом положении и в любом масштабе в пределах исходного изображения. Этот измененный набор функций называется функцией двух прямоугольников . Виола и Джонс также определили 3-прямоугольные и 4-прямоугольные элементы. Значения указывают на определенные характеристики определенной области изображения. Каждый тип элемента может указывать на наличие (или отсутствие) определенных характеристик в изображении, таких как края или изменения текстуры. Например, объект с двумя прямоугольниками может указывать, где проходит граница между темной и светлой областью.

Быстрое вычисление характеристик, подобных Хаару [ править ]

Одним из вкладов Виола и Джонс должен был использовать таблицы суммируется-площадь , [3] , который они назвали интегральные образы . Интегральные изображения можно определить как двумерные справочные таблицы в форме матрицы с таким же размером исходного изображения. Каждый элемент целостного изображения содержит сумму всех пикселей, расположенных в верхней левой области исходного изображения (по отношению к положению элемента). Это позволяет вычислить сумму прямоугольных областей изображения в любом положении и в любом масштабе, используя только четыре поиска:

Нахождение суммы заштрихованной прямоугольной области

где точки принадлежат целостному изображению , как показано на рисунке.

Для каждой функции, подобной Хаару, может потребоваться более четырех поисков, в зависимости от того, как она была определена. Для 2-прямоугольных функций Виолы и Джонса требуется шесть поисков, для 3-прямоугольных функций требуется восемь поисков, а для 4-прямоугольных функций требуется девять поисков.

Наклонные детали, похожие на Хаара [ править ]

Линхарт и Мейдт [4] ввели понятие наклонной (45 °) детали типа Хаара. Это было использовано для увеличения размерности набора функций в попытке улучшить обнаружение объектов на изображениях. Это было успешным, поскольку некоторые из этих функций могут лучше описать объект. Например, двухпрямоугольный наклонный элемент типа Хаара может указывать на наличие ребра под углом 45 °.

Мессом и Барчак [5] расширили идею до типичного повернутого объекта типа Хаара. Хотя идея математически обоснована, практические проблемы не позволяют использовать свойства Хаара под любым углом. Чтобы быть быстрыми, алгоритмы обнаружения используют изображения с низким разрешением, что приводит к ошибкам округления . По этой причине повернутые элементы типа Хаара обычно не используются.

Ссылки [ править ]

  1. ^ a b Виола и Джонс, « Быстрое обнаружение объектов с использованием усиленного каскада простых функций », Компьютерное зрение и распознавание образов , 2001
  2. ^ Папагеоргиу, Орен и Поджио, «Общая структура для обнаружения объектов», Международная конференция по компьютерному зрению, 1998.
  3. Crow, F, « Таблицы суммированных площадей для отображения текстуры », в Proceedings of SIGGRAPH , 18 (3): 207–212, 1984.
  4. ^ Lienhart, Р. и Maydt, J., " расширенный набор Хаара-подобные функции для быстрого обнаружения объекта ", ICIP02, стр I:. 900-903, 2002
  5. ^ Messom, CH и Barczak, ALC, « Быстрая и эффективная повернутого Хаара как функции с помощью повернутой Интегральные изображения », австралийской конференции по робототехнике и автоматизации (ACRA2006), стр. 1-6, 2006