Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Hessian детектор аффинной области является детектор функции используется в области компьютерного зрения и анализ изображений . Как и другие детекторы признаков, аффинный детектор Гессе обычно используется в качестве этапа предварительной обработки алгоритмов, которые полагаются на идентифицируемые характерные точки интереса .

Аффинный детектор Гессе является частью подкласса детекторов признаков, известных как аффинно-инвариантные детекторы: детектор аффинной области Харриса, аффинные области Гессе, максимально устойчивые экстремальные области , детектор яркости Кадира – Брэди , краевые области (EBR) и экстремумы интенсивности. -базированные (IBR) регионы.

Описание алгоритма [ править ]

Алгоритм аффинного детектора Гессе практически идентичен детектору аффинной области Харриса . Фактически, оба алгоритма были получены Кристианом Миколайчиком и Корделией Шмид в 2002 г. [1] на основе более ранних работ в [2] [3], см. Также [4] для более общего обзора.

Чем отличается аффинность Гессе? [ редактировать ]

Аффинный детектор Харриса полагается на точки интереса, обнаруженные в нескольких масштабах с использованием угловой меры Харриса на матрице второго момента. Аффинная функция Гессе также использует итеративный алгоритм с несколькими масштабами для пространственной локализации и выбора масштабных и аффинных инвариантных точек. Однако в каждом отдельном масштабе аффинный детектор Гессе выбирает точки интереса на основе матрицы Гессе в этой точке:

где находится вторая частная производная в направлении и является смешанной частичной второй производной в и направлениях. Важно отметить , что производные вычисляются в текущей итерации масштабе и , следовательно , являются производными образом сглаженного гауссовым ядром: . Как обсуждались в аффинной детекторной области Harris статьи, производные должны быть масштабированы соответствующим образом на коэффициент , связанный с гауссовским ядром: .

В каждом масштабе точки интереса - это те точки, которые одновременно являются локальными экстремумами как определителя, так и следа матрицы Гессе. След матрицы Гессе идентичен лапласиану гауссиана (LoG): [5]

Как обсуждалось в Mikolajczyk et al. (2005), выбирая точки, которые максимизируют детерминант гессиана, эта мера штрафует более длинные структуры, которые имеют малые вторые производные (изменения сигнала) в одном направлении. [6] Этот тип меры очень похож на меры, используемые в схемах обнаружения капель, предложенных Линдебергом (1998), где либо лапласиан, либо детерминант гессиана использовались в методах обнаружения капель с автоматическим выбором шкалы.

Подобно аффинному алгоритму Харриса, эти точки интереса, основанные на матрице Гессе, также пространственно локализованы с помощью итеративного поиска, основанного на лапласиане гауссианов. Как и следовало ожидать, эти точки интереса называют интересными точками Гессе – Лапласа . Кроме того, используя эти первоначально обнаруженные точки, аффинный детектор Гессе использует алгоритм итеративной адаптации формы для вычисления локального аффинного преобразования для каждой интересующей точки. Реализация этого алгоритма почти идентична реализации аффинного детектора Харриса; однако вышеупомянутая мера Гессе заменяет все экземпляры угловой меры Харриса.

Устойчивость к аффинным и другим преобразованиям [ править ]

Mikolajczyk et al. (2005) сделал тщательный анализ состояния нескольких детекторов аффинной области искусства: Harris аффинного, аффинного гессенском, MSER , [7] IBR & EBR [8] и выступ [9] детекторов. [6] Mikolajczyk et al. проанализировали как структурированные, так и текстурированные изображения в своей оценке. Бинарные файлы для Linux детекторов и их тестовые изображения находятся в свободном доступе на их веб-странице] Краткое изложение результатов Mikolajczyk et al. (2005) следовать; см . Сравнение детекторов аффинной области для более количественного анализа.

В целом аффинный детектор Гессе работает на втором месте после MSER. Подобно аффинному детектору Харриса, аффинные области интереса Гессе имеют тенденцию быть более многочисленными и меньшими, чем другие детекторы. Для одного изображения аффинный детектор Гессе обычно определяет более надежные области, чем детектор Харриса-Аффинного. Производительность меняется в зависимости от типа анализируемой сцены. Аффинный детектор Гессе хорошо реагирует на текстурированные сцены, в которых много угловых частей. Однако для некоторых структурированных сцен, таких как здания, аффинный детектор Гессе работает очень хорошо. Это дополняет MSER, который имеет тенденцию лучше работать с хорошо структурированными (сегментированными) сценами.

Пакеты программного обеспечения [ править ]

  • Аффинные ковариантные функции : К. Миколайчик поддерживает веб-страницу, которая содержит двоичные файлы Linux детектора Гессе-Аффинного типа в дополнение к другим детекторам и дескрипторам. Также доступен код Matlab, который можно использовать для иллюстрации и вычисления повторяемости различных детекторов. Также доступны код и изображения для дублирования результатов, найденных в Mikolajczyk et al. (2005) бумага.
  • lip-vireo : - двоичный код для Linux, Windows и SunOS от исследовательской группы VIREO, подробнее см. на домашней странице

См. Также [ править ]

  • Адаптация аффинной формы
  • Изотропия

Ссылки [ править ]

  1. Mikolajczyk, K. и Schmid, C. 2002. Аффинный инвариантный детектор точки интереса. В материалах 8-й Международной конференции по компьютерному зрению , Ванкувер, Канада.
  2. ^ Линдеберг, Тони. «Обнаружение признаков с автоматическим выбором шкалы», Международный журнал компьютерного зрения, 30, 2, стр. 77-116, 1998.
  3. ^ Т. Линдеберг и Дж. Гардинг (1997). «Адаптированное к форме сглаживание при оценке трехмерных сигналов глубины от аффинных искажений локальной двумерной структуры» . Вычисления изображений и зрения . 15 (6): 415–434. DOI : 10.1016 / S0262-8856 (97) 01144-X .
  4. ^ Т. Линдеберг (2008–2009). «Масштаб-пространство» . Энциклопедия компьютерных наук и инженерии (Бенджамин Ва, изд.), John Wiley and Sons . IV . С. 2495–2504. DOI : 10.1002 / 9780470050118.ecse609 .
  5. ^ Миколайчик К. и Шмид, C. 2004. Масштабные и аффинные инвариантные детекторы точки интереса. Международный журнал компьютерного зрения 60 (1): 63-86.
  6. ^ a b К. Миколайчик, Т. Туйтелаарс, К. Шмид, А. Зиссерман, Дж. Матас, Ф. Шаффалицки, Т. Кадир и Л. Ван Гул, Сравнение детекторов аффинных областей. В IJCV 65 (1/2): 43-72, 2005.
  7. ^ Дж. Матас, О. Чум, М. Урбан и Т. Пайдла, Устойчивое стереозвучание с широкой базой из максимально стабильных экстремальных регионов. В BMVC п. 384-393, 2002.
  8. ^ T.Tuytelaars и L. Van Gool, Сопоставление широко разделенных взглядов, основанных на аффинно-инвариантных областях. В IJCV 59 (1): 61-85, 2004.
  9. ^ Т. Кадир, А. Зиссерман и М. Брэди, Детектор аффинно-инвариантной выступающей области. В ECCV п. 404-416, 2004.

Внешние ссылки [ править ]

  • [1] - Презентационные слайды Mikolajczyk et al. на их бумаге 2005 года.
  • [2] - Лаборатория компьютерного зрения Корделии Шмид.
  • [3] - Код, тестовые изображения, библиография аффинных ковариантных функций, поддерживаемая Кристианом Миколайчиком и группой визуальной геометрии из группы робототехники Оксфордского университета.
  • [4] - Библиография детекторов признаков (и блобов), поддерживаемая Институтом робототехники и интеллектуальных систем Университета Южной Калифорнии.