Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Обнаружение гребней - это попытка с помощью программного обеспечения найти гребни (или края) на изображении.

В математике и компьютерного зрения , что выступы (или множество гребень ) от гладкой функции двух переменных представляют собой набор кривых, точки, в одном или нескольких способов быть точным ниже локальных максимумов функции по меньшей мере в одном измерение. Это понятие отражает интуицию географических хребтов . Для функции от N переменных ее гребни представляют собой набор кривых, точки которых являются локальными максимумами в N - 1 измерениях. В этом отношении понятие гребневых точек расширяет понятие локального максимума . Соответственно, понятие долиндля функции можно определить, заменив условие локального максимума условием локального минимума . Объединение наборов гребней и впадин вместе со связанным набором точек, называемым набором соединителей, образуют связанный набор кривых, которые разделяют, пересекаются или встречаются в критических точках функции. Это объединение множеств вместе называется относительным критическим множеством функции . [1] [2]

Наборы гребней, долин и относительные критические множества представляют важную геометрическую информацию, присущую функции. В некотором смысле они обеспечивают компактное представление важных характеристик функции, но степень, в которой они могут быть использованы для определения глобальных характеристик функции, остается открытым вопросом. Основная мотивация для создания процедур обнаружения гребней и впадин пришла из анализа изображений и компьютерного зрения и заключается в том, чтобы захватить внутреннюю часть удлиненных объектов в области изображения. Представления, связанные с хребтами, с точки зрения водоразделов , использовались для сегментации изображений.. Также были попытки зафиксировать формы объектов с помощью графических представлений, которые отражают гребни, впадины и критические точки в области изображения. Однако такие представления могут быть очень чувствительными к шуму, если они вычисляются только в одном масштабе. Поскольку теоретические вычисления в масштабном пространстве включают свертку с гауссовым (сглаживающим) ядром, есть надежда, что использование многомасштабных гребней, впадин и критических точек в контексте теории масштабного пространства должно позволить более надежное представление объектов (или формы) на изображении.

В этом отношении гребни и долины можно рассматривать как дополнение к естественным достопримечательностям или местным экстремальным точкам. При должным образом определенных концепциях гребни и впадины в ландшафте интенсивности (или в каком-либо другом представлении, полученном из ландшафта интенсивности) могут образовывать масштабно-инвариантный каркас для организации пространственных ограничений на локальный внешний вид, с рядом качественных сходств с тем, как средний слой Блюма Преобразование оси обеспечивает каркас формы для двоичных изображений . В типичных приложениях дескрипторы гребней и долин часто используются для обнаружения дорог на аэрофотоснимках и для обнаружения кровеносных сосудов.в изображениях сетчатки или трехмерных изображениях магнитного резонанса .

Дифференциально-геометрическое определение гребней и впадин в фиксированном масштабе на двухмерном изображении [ править ]

Пусть обозначает двумерную функцию, и пусть будет в масштабно-пространстве представление о получено свертка с функцией Гаусса

.

Кроме того, пусть и обозначают собственные значения на матрицы Гессе

представления масштабного пространства с преобразованием координат (вращением), применяемым к операторам локальной производной по направлению,

где p и q - координаты повернутой системы координат.

Можно показать, что смешанная производная в преобразованной системе координат равна нулю, если выбрать

, .

Тогда формальное дифференциально-геометрическое определение гребней в фиксированном масштабе может быть выражено как набор точек, удовлетворяющих [3]

Соответственно, впадины масштаба - это набор точек

В системе координат с направлением, параллельным градиенту изображения

куда

можно показать, что это определение гребня и впадины может быть эквивалентно [4] записано как

куда

а знак определяет полярность; для хребтов и для долин.

Расчет гребней переменного масштаба из двухмерных изображений [ править ]

Основная проблема с определением гребня фиксированной шкалы, представленной выше, заключается в том, что она может быть очень чувствительной к выбору уровня шкалы. Эксперименты показывают, что параметр масштаба ядра предварительного сглаживания Гаусса должен быть тщательно настроен на ширину гребневой структуры в области изображения, чтобы гребневой детектор создавал соединенную кривую, отражающую нижележащие структуры изображения. Чтобы справиться с этой проблемой в отсутствие априорной информации, понятие гребней масштабно-пространственногобыла введена, которая рассматривает параметр масштаба как неотъемлемое свойство определения гребня и позволяет уровням масштаба изменяться вдоль гребня пространства масштаба. Более того, концепция гребня в масштабе пространства также позволяет автоматически настраивать параметр масштаба в соответствии с шириной структур гребня в области изображения, фактически, как следствие хорошо сформулированного определения. В литературе предлагается ряд различных подходов, основанных на этой идее.

Пусть обозначает меру прочности гребня (будет указано ниже). Тогда для двумерного изображения гребнем в масштабном пространстве называется множество точек, удовлетворяющих

где - параметр масштаба в представлении масштабного пространства . Точно так же долина в масштабном пространстве - это набор точек, удовлетворяющих

Непосредственным следствием этого определения является то, что для двумерного изображения концепция гребней в масштабном пространстве выметает набор одномерных кривых в трехмерном масштабном пространстве, где параметр масштаба может изменяться по шкале. -пространственный гребень (или долина масштабного пространства). Дескриптор гребня в области изображения будет тогда проекцией этой трехмерной кривой на плоскость двумерного изображения, где информация о масштабе атрибута в каждой точке гребня может использоваться как естественная оценка ширины структуры гребня в область изображения в окрестности этой точки.

В литературе предлагались различные меры прочности гребня. Когда Линдеберг (1996, 1998) [5] ввел термин гребень в масштабе пространства, он рассмотрел три меры прочности гребня:

  • Основная основная кривизна
выражается через -нормированные производные с
.
  • Квадрат -нормированной квадратной разности собственных значений
  • Квадрат -нормированной разности собственных значений

Здесь важно понятие -нормализованных производных, поскольку оно позволяет правильно откалибровать алгоритмы детектора гребня и впадины. Требуя, чтобы для одномерного гауссова гребня, встроенного в два (или три измерения), масштаб обнаружения был равен ширине структуры гребня при измерении в единицах длины (требование соответствия между размером фильтра обнаружения и структура изображения, на которую он реагирует), следует выбирать . Из этих трех показателей прочности гребня первый представляет собой универсальный измеритель прочности гребня со многими приложениями, такими как обнаружение кровеносных сосудов и извлечение дороги. Тем не менее, объект использовался в таких приложениях, как улучшение отпечатков пальцев [6]отслеживание рук и распознавание жестов в реальном времени [7], а также для моделирования локальной статистики изображений для обнаружения и отслеживания людей на изображениях и видео. [8]

Существуют также другие тесно связанные определения гребня, в которых используются нормализованные производные с неявным допущением . [9] Разработайте эти подходы более подробно. Однако при обнаружении гребней с помощью шкалы обнаружения будет вдвое больше, чем у , что приведет к большему искажению формы и меньшей способности захватывать гребни и впадины с соседними мешающими структурами изображения в области изображения.

История [ править ]

Понятие гребней и впадин на цифровых изображениях было введено Хараликом в 1983 году [10] и Кроули в связи с различием пирамид Гаусса в 1984 году. [11] [12] Применение дескрипторов гребней в анализе медицинских изображений широко изучалось Пайзером. и его коллеги [13] [14] [15], что привело к их понятию M-повторов. [16] Линдеберг также способствовал обнаружению гребней с введением-нормализованные производные и гребни в пространстве масштаба, определенные путем локальной максимизации соответственно нормализованной главной главной кривизны матрицы Гессе (или других мер силы гребня) в пространстве и в масштабе. Эти понятия позже были развиты Steger et al., Применительно к выемке дорог. [17] [18] и сегментации кровеносных сосудов Frangi et al. [19], а также обнаружению криволинейных и трубчатых структур Sato et al. [20] и Криссиан и др. [21] Обзор некоторых классических определений гребня в фиксированном масштабе, включая отношения между ними, был дан Кендеринком и ван Доорном. [22]Обзор методов извлечения сосудов был представлен Кирбасом и Квеком. [23]

Определение гребней и впадин в N измерениях [ править ]

В самом широком смысле понятие гребня обобщает идею локального максимума вещественнозначной функции. Точка в области определения функции является локальным максимумом функции, если существует расстояние со свойством, которое находится в пределах единиц , то . Хорошо известно, что критические точки, из которых локальные максимумы относятся только к одному типу, являются изолированными точками в области определения функции во всех ситуациях, кроме самых необычных ( т. Е. В неуниверсальных случаях).

Рассмотрим ослабление условия, при котором во всей окрестности немного требуется только, чтобы это выполнялось на размерном подмножестве. Предположительно это ослабление позволяет множеству точек, удовлетворяющих критериям, которые мы назовем гребнем, иметь единственную степень свободы, по крайней мере, в общем случае. Это означает, что набор точек гребня образует одномерное геометрическое место или кривую гребня. Обратите внимание, что приведенное выше можно изменить, чтобы обобщить идею на локальные минимумы и получить то, что можно назвать одномерными кривыми долины.

Это следующее определение гребня следует из книги Эберли [24] и может рассматриваться как обобщение некоторых из вышеупомянутых определений гребня. Позвольте быть открытым множеством и быть гладким. Пусть . Позвольте быть градиентом at , и пусть быть матрицей Гессе at . Позвольте быть упорядоченными собственными значениями и позвольте быть единичным собственным вектором в собственном подпространстве для . (Для этого следует предположить, что все собственные значения различны.)

Точка - это точка на одномерном гребне, если выполняются следующие условия:

  1. , и
  2. для .

Это уточняет концепцию, которая ограничена этим конкретным -мерным подпространством, имеет локальный максимум при .

Это определение естественным образом обобщается на k -мерный гребень следующим образом: точка является точкой на k -мерном гребне, если выполняются следующие условия:

  1. , и
  2. для .

Во многих отношениях эти определения естественным образом обобщают определение локального максимума функции. Свойства гребней максимальной выпуклости положены на прочную математическую основу Деймоном [1] и Миллером. [2] Их свойства в однопараметрических семействах установлены Келлером. [25]

Максимальный масштабный хребет [ править ]

Следующее определение можно проследить до Фрича [26], который интересовался извлечением геометрической информации о фигурах из двумерных изображений в оттенках серого. Фрич отфильтровал свое изображение с помощью фильтра «медиальности», который давал ему информацию, аналогичную данным «далекие от границы» в масштабном пространстве. Гребни этого изображения, спроецированные на исходное изображение, должны были быть аналогичны скелету формы ( например , медиальной оси Блюма) исходного изображения.

Далее следует определение максимального масштабного гребня функции трех переменных, одна из которых является параметром «масштаб». Одна вещь, которую мы хотим, чтобы это определение соответствовало действительности, заключается в том, что если на этом гребне находится точка, то значение функции в этой точке будет максимальным в масштабе. Позвольте быть гладкой дифференцируемой функцией на . Это точка на гребне максимального масштаба тогда и только тогда, когда

  1. и , и
  2. и .

Связь между обнаружением кромки и обнаружением гребня [ править ]

Целью обнаружения гребня, как правило , чтобы захватить большую ось симметрии удлиненного объекта, [ править ] в то время как цель обнаружения края , как правило , чтобы захватить границу объекта. Однако в некоторой литературе по обнаружению краев ошибочно [ необходима цитата ] понятие выступов включено в понятие краев, что запутывает ситуацию.

С точки зрения определений, существует тесная связь между детекторами края и детекторами гребня. С формулировкой не-максимума, как это дано Кэнни [27], следует, что края определяются как точки, в которых величина градиента принимает локальный максимум в направлении градиента. Следуя дифференциально-геометрическому способу выражения этого определения, [28] мы можем в вышеупомянутой системе координат указать, что величина градиента представления масштабного пространства, которая равна производной по направлению первого порядка в -направлении , должна иметь свою производную первого порядка по направлению в -направлении, равную нулю

в то время как производная по направлению второго порядка в направлении оси от должна быть отрицательной, т.е.

.

Записанное как явное выражение в терминах локальных частных производных , ... , это определение ребра может быть выражено как кривые перехода через нуль дифференциального инварианта

удовлетворяющие знаковому условию на следующий дифференциальный инвариант

(дополнительную информацию см. в статье об обнаружении краев ). Примечательно, что края, полученные таким образом, являются выступами величины градиента.

См. Также [ править ]

  • Масштабировать пространство
  • Обнаружение функций (компьютерное зрение)
  • Обнаружение края
  • Обнаружение точки интереса
  • Обнаружение BLOB-объектов
  • Компьютерное зрение

Ссылки [ править ]

  1. ^ a b Дэймон, Дж. (март 1999 г.). «Свойства гребней и ядер в двумерных изображениях». J Math Imaging Vis . 10 (2): 163–174. DOI : 10,1023 / A: 1008379107611 .
  2. ^ Б Миллер, J. Относительные Критические наборы в и приложения для анализа изображений. Кандидат наук. Диссертация. Университет Северной Каролины. 1998 г.
  3. ^ Т. Линдеберг (2009). «Масштаб-пространство» . В Бенджамине Ва (ред.). Энциклопедия компьютерных наук и инженерии . IV . Джон Вили и сыновья. С. 2495–2504. DOI : 10.1002 / 9780470050118.ecse609 . ISBN 978-0470050118.
  4. ^ Линдеберга, Т (1994). «Теория масштабного пространства: основной инструмент для анализа структур в различных масштабах» . Журнал прикладной статистики . 21 (2): 224–270. DOI : 10.1080 / 757582976 .
  5. ^ Линдеберга, Т. (1998). «Обнаружение края и обнаружение гребня с автоматическим выбором шкалы» . Международный журнал компьютерного зрения . 30 (2): 117–154. DOI : 10,1023 / A: 1008097225773 . Более ранняя версия была представлена ​​на конференции IEEE по распознаванию образов и компьютерному зрению, CVPR'96, Сан-Франциско, Калифорния, страницы 465–470, июнь 1996 г.
  6. Перейти ↑ Almansa, A., Lindeberg, T. (2000). «Улучшение отпечатка пальца путем адаптации формы операторов масштаба-пространства с автоматическим выбором масштаба» . IEEE Transactions по обработке изображений . 9 (12): 2027–42. DOI : 10.1109 / 83.887971 . PMID 18262941 . CS1 maint: multiple names: authors list (link)
  7. ^ Л. Бретцнер, И. Лаптев и Т. Линдеберг: Распознавание жестов рук с использованием многомасштабных цветовых характеристик, иерархических моделей и фильтрации частиц, Proc. Конференция IEEE по лицам и жестам, 2002 г., Вашингтон, округ Колумбия, 423–428.
  8. ^ Sidenbladh, H., Черный, М. (2003). «Изучение статистики людей по изображениям и видео» (PDF) . Международный журнал компьютерного зрения . 54 (1–2): 183–209. DOI : 10.1023 / а: 1023765619733 . CS1 maint: multiple names: authors list (link)
  9. ^ Дж. Ферст и Дж. Миллер, « Максимальный масштабный хребет: включение масштаба в определение хребта », Теория масштабного пространства в компьютерном зрении: материалы Первой международной конференции по масштабному пространству '97, стр. 93–104. Конспект лекций Springer по информатике, т. 1682.
  10. ^ Haralick, R. (апрель 1983). «Горные хребты и долины на цифровых изображениях». Компьютерное зрение, графика и обработка изображений . 22 (10): 28–38. DOI : 10.1016 / 0734-189X (83) 90094-4 .
  11. Перейти ↑ Crowley, JL, Parker, AC (март 1984). «Представление формы на основе пиков и гребней в разнице преобразования нижних частот» (PDF) . IEEE Trans Pattern Anal Mach Intell . 6 (2): 156–170. CiteSeerX 10.1.1.161.3102 . DOI : 10.1109 / TPAMI.1984.4767500 . PMID 21869180 .   CS1 maint: multiple names: authors list (link)
  12. Перейти ↑ Crowley, JL, Sanderson, A. (январь 1987 г.). «Представление с множеством разрешений и вероятностное соответствие двухмерной шкалы серого» (PDF) . IEEE Trans Pattern Anal Mach Intell . 9 (1): 113–121. CiteSeerX 10.1.1.1015.9294 . DOI : 10.1109 / TPAMI.1987.4767876 . PMID 21869381 .   CS1 maint: multiple names: authors list (link)
  13. ^ Gauch, JM, Pizer, SM (июнь 1993). "Анализ горных хребтов и долин с несколькими разрешениями в полутоновых изображениях". IEEE Trans Pattern Anal Mach Intell . 15 (6): 635–646. DOI : 10.1109 / 34.216734 .CS1 maint: multiple names: authors list (link)
  14. ^ Eberly D .; Gardner R .; Морс Б .; Pizer S .; Шарлах К. (декабрь 1994 г.). «Гребни для анализа изображений». Журнал математической визуализации и зрения . 4 (4): 353–373. DOI : 10.1007 / BF01262402 .
  15. ^ Пайзер, Стивен М., Эберли, Дэвид, Фрич, Дэниел С. (январь 1998 г.). «Масштабно-инвариантное видение фигурных фигур: математика ядер». Компьютерное зрение и понимание изображений . 69 (1): 55–71. CiteSeerX 10.1.1.38.3116 . DOI : 10.1006 / cviu.1997.0563 . CS1 maint: multiple names: authors list (link)
  16. ^ С. Пайзер, С. Джоши, Т. Флетчер, М. Стайнер, Г. Трактон, Дж. Чен (2001) "Сегментация однофигурных объектов деформируемыми M-образными", Труды 4-й Международной конференции по медицинскому изображению Вычислительная техника и компьютерное вмешательство, Конспект лекций по информатике; Vol. 2208, стр. 862–871.
  17. ^ Штегер C. (1998). «Несмещенный детектор криволинейных структур». IEEE Trans Pattern Anal Mach Intell . 20 (2): 113–125. CiteSeerX 10.1.1.42.2266 . DOI : 10.1109 / 34.659930 . 
  18. ^ Лаптев И .; Mayer H .; Lindeberg T .; Экштейн В .; Steger C .; Баумгартнер А. (2000). «Автоматическое извлечение дорог из аэрофотоснимков на основе масштабного пространства и змей» (PDF) . Машинное зрение и приложения . 12 (1): 23–31. DOI : 10.1007 / s001380050121 .
  19. ^ Frangi AF, Нейссен WJ, Хогевен RM, ван Валсум T, Viergever MA (октябрь 1999). «Модельное количественное определение трехмерных магнитно-резонансных ангиографических изображений». IEEE Trans Med Imaging . 18 (10): 946–56. CiteSeerX 10.1.1.502.5994 . DOI : 10.1109 / 42.811279 . PMID 10628954 .  
  20. ^ Sato Y, Nakajima S, Shiraga N, Atsumi H, Yoshida S и др. (1998). «Трехмерный многомасштабный линейный фильтр для сегментации и визуализации криволинейных структур на медицинских изображениях» (PDF) . Анализ медицинских изображений . 2 (2): 143–168. DOI : 10.1016 / s1361-8415 (98) 80009-1 .
  21. ^ Криссиан К .; Malandain G .; Ayache N .; Vaillan R .; Труссе Ю. (2000). «Модельное обнаружение трубчатых конструкций на 3D-изображениях» . Компьютерное зрение и понимание изображений . 80 (2): 130–171. DOI : 10.1006 / cviu.2000.0866 .
  22. ^ Koenderink, Ян J. ван Дорн, Andrea J. (май 1994). «2 + 1-мерная дифференциальная геометрия». Письма о распознавании образов . 15 (5): 439–443. DOI : 10.1016 / 0167-8655 (94) 90134-1 .CS1 maint: multiple names: authors list (link)
  23. ^ Kirbas C, Quek F (2004). «Обзор методов и алгоритмов извлечения сосудов» (PDF) . ACM Computing Surveys . 36 (2): 81–121. CiteSeerX 10.1.1.460.8544 . DOI : 10.1145 / 1031120.1031121 .  
  24. ^ Eberly, D. (1996). Гряды в анализе изображений и данных . Kluwer. ISBN 978-0-7923-4268-7.
  25. ^ Керрел, Р. Общие переходы относительных критических наборов в параметризованных семьях с приложениями к анализу изображений . Университет Северной Каролины. 1999 г.
  26. Перейти ↑ Fritsch, DS, Eberly, D., Pizer, SM, and McAuliffe, MJ. «Стимулированные сердечники и их применение в медицинской визуализации». Обработка информации в медицинской визуализации, Y. Bizais, C Barillot, R. DiPaola, eds., Kluwer Series in Computational Imaging and Vision, pp. 365–368.
  27. ^ Канни J. (1986). «Вычислительный подход к обнаружению края» . IEEE Trans Pattern Anal Mach Intell . 8 (6): 679–698. DOI : 10.1109 / TPAMI.1986.4767851 .
  28. ^ Линдеберг Т. (1993). «Дискретные производные приближения со свойствами масштабного пространства: основа для низкоуровневого извлечения признаков» . Журнал математической визуализации и зрения . 3 (4): 349–376. DOI : 10.1007 / BF01664794 .

Внешние ссылки [ править ]