Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Вывод типичного алгоритма обнаружения углов

Обнаружение углов - это подход, используемый в системах компьютерного зрения для извлечения определенных видов функций и определения содержания изображения. Обнаружение углов часто используется при обнаружении движения , регистрации изображений , видеотрекинге , мозаике изображений , сшивании панорам , 3D-реконструкции и распознавании объектов . Обнаружение углов перекликается с темой обнаружения точек интереса .

Формализация [ править ]

Угол можно определить как пересечение двух ребер. Угол также можно определить как точку, для которой существуют два доминирующих и разных направления кромок в локальной окрестности точки.

Интересующая точка - это точка на изображении, которая имеет четко определенное положение и может быть надежно обнаружена. Это означает, что точка интереса может быть углом, но она также может быть, например, изолированной точкой локального максимума или минимума интенсивности, окончанием линии или точкой на кривой, где кривизна локально максимальна.

На практике большинство так называемых методов обнаружения углов обнаруживают точки интереса в целом, и на самом деле термины «угол» и «точка интереса» используются более или менее взаимозаменяемо в литературе. [1] Как следствие, если должны быть обнаружены только углы, необходимо провести локальный анализ обнаруженных точек интереса, чтобы определить, какие из них являются реальными углами. Примерами обнаружения краев, которые можно использовать с постобработкой для обнаружения углов, являются оператор Кирша и набор маскирования Фрай-Чен. [2]

«Уголок», «точка интереса» и «особенность» используются в литературе как синонимы, что сбивает с толку вопрос. В частности, существует несколько детекторов больших двоичных объектов, которые можно назвать «операторами точки интереса», но которые иногда ошибочно называют «детекторами углов». Более того, существует понятие обнаружения гребня, чтобы фиксировать присутствие удлиненных объектов.

Угловые детекторы обычно не очень надежны и часто требуют введения большого количества избыточных данных, чтобы предотвратить преобладание влияния отдельных ошибок на задачу распознавания.

Одним из факторов, определяющих качество детектора углов, является его способность обнаруживать один и тот же угол на нескольких похожих изображениях в условиях разного освещения, перемещения, поворота и других преобразований.

Простым подходом к обнаружению углов на изображениях является использование корреляции , но это требует больших вычислительных ресурсов и неоптимально. Часто используемый альтернативный подход основан на методе, предложенном Харрисом и Стивенсом (см. Ниже), который, в свою очередь, является усовершенствованием метода Моравека.

Алгоритм определения углов Moravec [ править ]

Это один из самых ранних алгоритмов обнаружения углов, который определяет угол как точку с низким самоподобием. [3] Алгоритм проверяет каждый пиксель в изображении, чтобы увидеть, присутствует ли угол, рассматривая, насколько похож патч с центром на пикселе на соседние, в основном перекрывающиеся участки. Сходство измеряется путем суммирования квадратов разностей (SSD) между соответствующими пикселями двух участков. Меньшее число указывает на большее сходство.

Если пиксель находится в области с одинаковой интенсивностью, то соседние участки будут выглядеть одинаково. Если пиксель находится на краю, то соседние участки в направлении, перпендикулярном краю, будут выглядеть совершенно иначе, но соседние участки в направлении, параллельном краю, приведут только к небольшому изменению. Если пиксель находится на объекте с вариациями во всех направлениях, то ни один из ближайших участков не будет выглядеть одинаково.

Сила угла определяется как наименьший SSD между патчем и его соседями (по горизонтали, вертикали и по двум диагоналям). Причина в том, что если это число велико, то вариация по всем сдвигам либо равна ему, либо больше, поэтому при захвате все соседние участки выглядят по-разному.

Если число прочности угла вычисляется для всех местоположений, то то, что оно является максимальным локально для одного местоположения, указывает на то, что в нем присутствует интересующий объект.

Как указал Моравец, одна из основных проблем с этим оператором заключается в том, что он не изотропен : если присутствует край, который не в направлении соседей (горизонтальный, вертикальный или диагональный), то SSD будет наименьшего размера. большой, и край будет неправильно выбран в качестве точки интереса. [4]

Алгоритмы определения углов Харриса и Стивенса / Ши – Томази [ править ]

См. Угловой детектор Харриса .

Харрис и Стивенс [5] усовершенствовали детектор углов Моравека, рассматривая разницу угловой оценки непосредственно по направлению, вместо использования смещенных участков. (Эта угловая оценка часто называется автокорреляцией , поскольку этот термин используется в статье, в которой описывается этот детектор. Однако математические данные в статье ясно показывают, что используется сумма квадратов разностей.)

Не умаляя общности, мы будем предполагать, что используется двухмерное изображение в градациях серого. Пусть это изображение будет дано . Подумайте о том, чтобы нанести пятно изображения на область и сместить его . Взвешенная сумма квадратов разностей (SSD) между этими двумя патчами, обозначенная как:

можно аппроксимировать разложением Тейлора . Пусть и быть частичные производные от , например , что

Это дает приближение

который можно записать в матричной форме:

где A - структурный тензор ,

На словах мы находим ковариацию частной производной интенсивности изображения по отношению к и осей.

Угловые скобки обозначают усреднение (т.е. суммирование по ). обозначает тип окна, которое скользит по изображению. Если используется фильтр Box, отклик будет анизотропным , но если используется гауссовский фильтр , то отклик будет изотропным .

Угол (или вообще точка интереса) характеризуется большим изменением вектора во всех направлениях . Анализируя собственные значения , эту характеристику можно выразить следующим образом: должно иметь два «больших» собственных значения для точки интереса. Основываясь на величинах собственных значений, на основании этого аргумента можно сделать следующие выводы:

  1. Если да, то у этого пикселя нет интересных особенностей.
  2. Если и имеет большое положительное значение, то ребро найдено.
  3. Если и имеют большие положительные значения, угол найден.

Харрис и Стивенс отмечают, что точное вычисление собственных значений требует больших вычислительных ресурсов, поскольку требует вычисления квадратного корня , и вместо этого предлагают следующую функцию , где - настраиваемый параметр чувствительности:

Таким образом, алгоритм [6] не имеет на самом деле вычислить собственное значение разложения матрицы , а вместо этого достаточно , чтобы оценить определитель и след от найти углы, или скорее процентные пункты в целом.

Детектор углов Ши – Томази [7] выполняет прямые вычисления, потому что при определенных предположениях углы более стабильны для отслеживания. Обратите внимание, что этот метод также иногда называют угловым детектором Канаде – Томази.

Значение должно быть определено эмпирически, и в литературе значения в диапазоне 0,04–0,15 указаны как возможные.

Можно избежать установки параметра , используя угловую меру Нобла [8], которая составляет гармоническое среднее значение собственных значений:

будучи небольшой положительной константой.

Если это можно интерпретировать как матрицу точности для углового положения, ковариационная матрица для углового положения равна , т. Е.

Сумма собственных значений , которая в этом случае может быть интерпретирована как обобщенная дисперсия (или «полная неопределенность») углового положения, связана с угловой мерой Нобла следующим уравнением:

Угловой детектор Förstner [ править ]

Обнаружение углов с использованием алгоритма Ферстнера

В некоторых случаях может потребоваться вычислить положение угла с точностью до субпикселей. Для достижения приближенного решения алгоритм Ферстнера [9] находит точку, ближайшую ко всем касательным линиям угла в данном окне, и представляет собой решение по методу наименьших квадратов. Алгоритм основан на том факте, что для идеального угла касательные линии пересекаются в одной точке.

Уравнение касательной в пикселе задается следующим образом:

где - вектор градиента изображения в точке .

Ближайшая ко всем касательным линиям в окне точка :

Расстояние от касательных линий до них взвешивается величиной градиента, что придает большее значение касательным, проходящим через пиксели с сильными градиентами.

Решение для :

определяются как:

Минимизировать это уравнение можно, дифференцировав по и установив его равным 0:

Обратите внимание, что это структурный тензор . Чтобы уравнение имело решение, оно должно быть обратимым, что означает, что оно должно иметь полный ранг (ранг 2). Таким образом, решение

существует только там, где в окне есть реальный угол .

Методология выполнения автоматического выбора масштаба для этого метода локализации угла была представлена ​​Линдебергом [10] [11] путем минимизации нормализованной невязки.

по весам. Таким образом, способ имеет возможность автоматически адаптировать уровни шкалы для вычисления градиентов изображения к уровню шума в данных изображения, выбирая более грубые уровни шкалы для зашумленных данных изображения и более тонкие уровни шкалы для почти идеальных угловидных структур.

Примечания:

  • можно рассматривать как невязку при вычислении решения методом наименьших квадратов: если , то ошибки не было.
  • этот алгоритм можно модифицировать для вычисления центров круговых объектов, заменив касательные на нормальные.

Многомасштабный оператор Харриса [ править ]

Вычисление второй матрицы моментов (иногда также называемой тензором структуры ) в операторе Харриса требует вычисления производных изображения в области изображения, а также суммирования нелинейных комбинаций этих производных по локальным окрестностям. Поскольку вычисление производных обычно включает этап сглаживания масштабного пространства, для рабочего определения оператора Харриса требуются два масштабных параметра: (i) локальный масштаб для сглаживания перед вычислением производных изображения и (ii) масштаб интегрирования. для накопления нелинейных операций над производными операторами в интегрированном дескрипторе изображения.

С обозначающим исходной интенсивностью изображения, пусть обозначит масштаб пространства представления о полученном пути свертки с гауссовым ядром

с параметром местного масштаба :

и пусть и обозначают частные производные . Кроме того, введите функцию окна Гаусса с параметром масштаба интегрирования . Тогда многомасштабная матрица второго момента [12] [13] [14] может быть определена как

Затем мы можем вычислить собственные значения так же, как собственные значения, и определить многомасштабную угловую меру Харриса как

.

Что касается выбора параметра локального масштаба и параметра масштаба интегрирования , эти параметры масштаба обычно связаны с параметром относительного масштаба интегрирования , так что , где обычно выбирается в интервале . [12] [13] Таким образом, мы можем вычислить многомасштабную угловую меру Харриса в любом масштабе в пространстве масштаба, чтобы получить многомасштабный детектор углов, который реагирует на угловые структуры различных размеров в области изображения.

На практике этот многомасштабный угловой детектор часто дополняется этапом выбора масштаба , на котором применяется нормированный по масштабу лапласовский оператор [11] [12]

вычисляется в каждом масштабе в пространстве- масштабе, а угловые точки, адаптированные к масштабу, с автоматическим выбором масштаба («оператор Харриса-Лапласа») вычисляются из точек, которые одновременно: [15]

  • пространственные максимумы многомасштабной угловой меры
  • локальные максимумы или минимумы на масштабах нормированного на масштаб оператора лапласа [11] :

Подход кривизны кривой уровня [ править ]

Более ранний подход к обнаружению углов заключался в обнаружении точек, в которых кривизна кривых уровня и величина градиента одновременно велики. [16] [17] Дифференциальный способ обнаружения таких точек заключается в вычислении измененной кривизны кривой уровня (произведение кривизны кривой уровня и величины градиента в степени трех).

и для обнаружения положительных максимумов и отрицательных минимумов этого дифференциального выражения в некотором масштабе в представлении масштабного пространства исходного изображения. [10] [11] Однако основная проблема при вычислении объекта кривизны измененной кривой уровня в едином масштабе заключается в том, что он может быть чувствительным к шуму и к выбору уровня шкалы. Лучшим методом является вычисление -нормализованной кривизны измененной кривой уровня.

с помощью и для обнаружения знаковых экстремумов масштабного пространства этого выражения, то есть точек и масштабов, которые являются положительными максимумами и отрицательными минимумами как по пространству, так и по масштабу

в сочетании с дополнительным этапом локализации, чтобы справиться с увеличением ошибки локализации в более грубых масштабах. [10] [11] [12] Таким образом, большие значения масштаба будут связаны с закругленными углами большой пространственной протяженности, тогда как меньшие значения масштаба будут связаны с острыми углами с малой пространственной протяженностью. Этот подход является первым детектором углов с автоматическим выбором масштаба (до «оператора Харриса-Лапласа» выше) и использовался для отслеживания углов при крупномасштабных вариациях в области изображения [18] и для сопоставления угловых откликов с краями для вычисления особенности структурного изображения для распознавания объектов на основе geon . [19]

Лапласиан гауссиана, разности гауссианов и определитель точек интереса масштабного пространства Гессе [ править ]

LoG [11] [12] [15] - это аббревиатура от Laplacian of Gaussian , DoG [20] - это аббревиатура, обозначающая разность гауссианов (DoG - это приближение к LoG), а DoH - это аббревиатура, обозначающая определитель Гессен. [11] Все эти масштабно-инвариантные точки интереса извлекаются путем обнаружения экстремумов в масштабном пространстве нормализованных по масштабу дифференциальных выражений, т. Е. Точек в масштабном пространстве, где соответствующие нормализованные по масштабу дифференциальные выражения предполагают локальные экстремумы как по пространству, так и по масштабу. [11]

где обозначает соответствующий дифференциал с нормализованной шкалой (определен ниже).

Эти детекторы более полно описаны в разделе «Обнаружение блобов» . Нормированный по масштабу лапласиан гауссовских и разностных гауссовых функций (Lindeberg 1994, 1998; Lowe 2004) [11] [12] [20]

не обязательно создавать высокоселективные функции, поскольку эти операторы также могут приводить к откликам на краях. Для того, чтобы улучшить способность обнаружения угла различия детектора гауссиан, детектор признака , используемый в SIFT [20] Поэтому система использует дополнительный пост-обработку сцену, где собственные значения по гессиану изображения в масштабе обнаружения уже рассмотрены в аналогично оператору Харриса. Если соотношение собственных значений слишком велико, тогда локальное изображение рассматривается как слишком похожее на кромку, поэтому признак отклоняется. Также можно определить лапласиан Линдеберга гауссовского детектора признаков, чтобы он содержал дополнительную пороговую обработку для дополнительного дифференциального инварианта для подавления откликов вблизи краев. [21]

Масштабно-нормированный определитель оператора Гессе (Lindeberg 1994, 1998) [11] [12]

с другой стороны, очень селективен к хорошо локализованным характеристикам изображения и реагирует только при значительных вариациях уровня серого в двух направлениях изображения [11] [14] и в этом и других отношениях является лучшим детектором точки интереса, чем лапласиан гауссовский. Определитель гессиана является аффинно-ковариантным дифференциальным выражением и имеет лучшие свойства масштабного выбора при преобразованиях аффинных изображений, чем оператор Лапласа (Lindeberg 2013, 2015). [21] [22]Экспериментально это означает, что определитель точек интереса Гессе имеет лучшие свойства повторяемости при локальной деформации изображения, чем точки интереса Лапласа, что, в свою очередь, приводит к лучшей производительности сопоставления на основе изображений с точки зрения более высоких оценок эффективности и более низких оценок точности 1. [21]

Свойства выбора масштаба, свойства аффинного преобразования и экспериментальные свойства этих и других детекторов точек интереса в масштабном пространстве подробно анализируются в (Lindeberg 2013, 2015). [21] [22]

Масштабные точки интереса, основанные на измерениях силы признаков Линдеберга-Гессе [ править ]

Вдохновленный структурно схожими свойствами матрицы Гессе функции и матрицы второго момента (структурного тензора) , что может, например, проявляться в терминах их аналогичных свойств преобразования при деформациях аффинного изображения [13] [21]

,
,

Линдеберг (2013, 2015) [21] [22] предложил определить четыре меры силы характеристик из матрицы Гессе родственными способами, поскольку операторы Харриса и Ши-и-Томази определяются из структурного тензора (матрицы второго момента). В частности, он определил следующие беззнаковые и подписанные меры силы гессенских признаков:

  • мера силы I беззнакового гессенского элемента:
  • подписанная мера силы гессенских элементов I:
  • беззнаковая мера силы гессенской характеристики II:
  • подписанная мера силы гессенских элементов II:

где и обозначают след и определитель матрицы Гессе представления масштабного пространства в любом масштабе , тогда как

обозначают собственные значения матрицы Гессе. [23]

Беззнаковая мера силы гессенской характеристики реагирует на локальные экстремумы положительными значениями и не чувствительна к седловым точкам, тогда как знаковая мера силы гессенской характеристики дополнительно реагирует на седловые точки отрицательными значениями. Мера силы признака Гессе без знака нечувствительна к локальной полярности сигнала, тогда как мера силы признака Гессе со знаком реагирует на локальную полярность сигнала знаком его выходного сигнала.

В Lindeberg (2015) [21] эти четыре дифференциальных объекта были объединены с выбором локального масштаба на основе обнаружения экстремумов в пространстве-масштабе.

или масштабное связывание. Кроме того, знак и без знака гессенских мер прочности функции и были объединены с дополнительным пороговым на .

Путем экспериментов по сопоставлению изображений при масштабных преобразованиях на наборе данных плаката с 12 плакатами с согласованием нескольких ракурсов при масштабных преобразованиях с коэффициентом масштабирования до 6 и вариациями направления обзора до угла наклона 45 градусов с локальными дескрипторами изображения, определенными из переформулировок было показано, что дескрипторы чистого изображения в операторах SIFT и SURF для измерений изображения в терминах операторов производной Гаусса (Gauss-SIFT и Gauss-SURF) вместо исходного SIFT, как определено из пирамиды изображения или исходного SURF, как определено из вейвлетов Хаара, было показано что обнаружение точки интереса в пространстве масштаба на основе беззнаковой меры силы гессенской характеристики позволило обеспечить лучшую производительность и лучшую производительность, чем точки интереса в пространстве масштаба, полученные из детерминанта Гессе.. И беззнаковая мера силы гессенской характеристики , и знаковая мера силы гессенской характеристики, и определитель гессиана позволили получить лучшие характеристики, чем лапласиан гауссиана . В сочетании с привязкой масштабов и дополнительным пороговым значением мера силы признаков Гессе со знаком дополнительно обеспечила лучшую производительность, чем лапласиан гауссиана .

Кроме того, было показано, что все эти дифференциальные детекторы точек интереса в масштабном пространстве, определенные на основе матрицы Гессе, позволяют обнаруживать большее количество точек интереса и лучше согласовывать характеристики по сравнению с операторами Харриса и Ши-и-Томази, определенными из структуры тензор (матрица второго момента).

Теоретический анализ свойств выбора шкалы этих четырех мер силы признаков Гессе и других дифференциальных сущностей для обнаружения точек интереса в масштабном пространстве, включая лапласиан гауссиана и определитель гессиана, приведен в Lindeberg (2013) [22]. и анализ их свойств аффинного преобразования, а также экспериментальных свойств в Lindeberg (2015). [21]

Аффинно-адаптированные операторы точки интереса [ править ]

Точки интереса, полученные с помощью многомасштабного оператора Харриса с автоматическим выбором масштаба, инвариантны к сдвигам, поворотам и равномерному изменению масштаба в пространственной области. Однако изображения, входящие в систему компьютерного зрения, также подвержены перспективным искажениям. Чтобы получить оператор точки интереса, который более устойчив к перспективным преобразованиям, естественным подходом является разработка детектора признаков, который инвариантен к аффинным преобразованиям . На практике аффинно-инвариантные точки интереса можно получить, применяя адаптацию аффинной формы.где форма сглаживающего ядра итеративно деформируется, чтобы соответствовать локальной структуре изображения вокруг интересующей точки, или, что эквивалентно, локальный участок изображения итеративно деформируется, в то время как форма сглаживающего ядра остается вращательно-симметричной (Lindeberg 1993, 2008; Lindeberg and Garding 1997; Миколайзцик и Шмид 2004). [12] [13] [14] [15] Следовательно, помимо широко используемого многомасштабного оператора Харриса, адаптация аффинной формы может применяться к другим детекторам углов, перечисленным в этой статье, а также к дифференциальным детекторам капель, таким как лапласиан. / разность гауссовского оператора, определитель гессиана [14] и оператора Гессе – Лапласа.

Алгоритм обнаружения углов Ванга и Брэди [ править ]

Детектор Ванга и Брэди [24] рассматривает изображение как поверхность и ищет места с большой кривизной по краю изображения. Другими словами, алгоритм ищет места, где край быстро меняет направление. Угловой счет определяется по формуле:

где - единичный вектор, перпендикулярный градиенту, и определяет степень фобии края детектора. Авторы также отмечают, что для уменьшения шума требуется сглаживание (предлагается гауссово).

Сглаживание также вызывает смещение углов, поэтому авторы получают выражение для смещения угла 90 градусов и применяют его в качестве поправочного коэффициента к обнаруженным углам.

Угловой детектор SUSAN [ править ]

SUSAN [25] - это аббревиатура, обозначающая ассимилирующее ядро ​​наименьшего однозначного сегмента. Этот метод является предметом патента Великобритании 1994 года, который больше не действует. [26]

Для обнаружения признаков SUSAN накладывает круговую маску на проверяемый пиксель (ядро). Область маски равна , а пиксель в этой маске представлен значком . Ядро находится при . Каждый пиксель сравнивается с ядром с помощью функции сравнения:

где - порог разности яркости, [27] - яркость пикселя, а степень экспоненты была определена эмпирически. Эта функция имеет вид сглаженного цилиндра или прямоугольной функции . Площадь СУЗАНА определяется по:

Если - прямоугольная функция, то - количество пикселей в маске, которые находятся внутри ядра. Ответ оператора SUSAN дает:

где называется "геометрический порог". Другими словами, оператор SUSAN получает положительную оценку только в том случае, если область достаточно мала. Наименьший локальный SUSAN можно найти с помощью немаксимального подавления, и это полный оператор SUSAN.

Значение определяет, насколько похожими должны быть точки для ядра, прежде чем они будут считаться частью однозначного сегмента. Значение определяет минимальный размер однозначного сегмента. Если он достаточно большой, то он становится детектором края .

Для определения угла используются еще два шага. Во-первых, находится центроид СУЗАНА. В правильном углу центр тяжести находится далеко от ядра. Второй шаг настаивает на том, чтобы все точки на линии от ядра через центроид до края маски находились в SUSAN.

Угловой детектор Трайковича и Хедли [ править ]

Подобно SUSAN, этот детектор [28] непосредственно проверяет, является ли участок под пикселем самоподобным, исследуя соседние пиксели. - это пиксель, который необходимо учитывать, и представляет собой точку на круге с центром вокруг . Точка - это точка, противоположная диаметру.

Функция ответа определяется как:

Это будет большим, если нет направления, в котором центральный пиксель похож на два соседних пикселя по диаметру. представляет собой дискретный круг (круг Брезенхема ), поэтому для промежуточных диаметров используется интерполяция, чтобы получить более изотропный отклик. Поскольку любое вычисление дает верхнюю границу для , сначала проверяются горизонтальное и вертикальное направления, чтобы увидеть, стоит ли продолжать полное вычисление .

Детекторы признаков на основе AST [ править ]

AST - это аббревиатура, обозначающая ускоренный сегментный тест. Этот тест является упрощенной версией критерия угла SUSAN. Вместо оценки круглого диска учитываются только пиксели в круге Брезенхема с радиусом вокруг точки-кандидата. Если смежные пиксели все ярче ядра по крайней мере или все темнее ядра на , то пиксель под ядром считается признаком. Сообщается, что этот тест дает очень стабильные функции. [29] Выбор порядка, в котором проверяются пиксели, представляет собой так называемую задачу «Двадцать вопросов».. Построение коротких деревьев решений для этой проблемы приводит к наиболее эффективным с вычислительной точки зрения доступным детекторам.

Первым алгоритмом обнаружения углов, основанным на AST, является FAST ( функции из ускоренного тестирования сегмента ). [29] Хотя в принципе может принимать любое значение, FAST использует только значение 3 (соответствует окружности окружности в 16 пикселей), и тесты показывают, что наилучшие результаты достигаются при значении 9. Это значение является самым низким при какие края не обнаруживаются. Порядок проверки пикселей определяется алгоритмом ID3 из обучающего набора изображений. Как ни странно, название детектора несколько похоже на название статьи, описывающей детектор Трайковича и Хедли.

Автоматический синтез детекторов [ править ]

Трухильо и Олаге [30] представили метод, с помощью которого генетическое программирование используется для автоматического синтеза операторов изображений, которые могут обнаруживать точки интереса. Наборы терминалов и функций содержат примитивные операции, которые являются общими для многих ранее предложенных искусственных конструкций. Пригодность измеряет стабильность каждого оператора с помощью коэффициента повторяемости и способствует равномерному распределению обнаруженных точек по плоскости изображения. Производительность усовершенствованных операторов была подтверждена экспериментально с использованием обучающих и тестовых последовательностей прогрессивно преобразованных изображений. Следовательно, предложенный алгоритм GP считается конкурентоспособным для человека в задаче обнаружения точки интереса.

Детекторы пространственно-временных точек интереса [ править ]

Оператор Харриса был расширен на пространство-время Лаптевым и Линдебергом. [31] Позвольте обозначить пространственно-временную матрицу второго момента, определенную как

Затем, для подходящего выбора , пространственно-временные точки интереса обнаруживаются из пространственно-временных экстремумов следующей пространственно-временной меры Харриса:

Определитель оператора Гессе был расширен на совместное пространство-время Виллемсом и др. [32] и Линдебергом [33], что привело к следующему нормированному по масштабу дифференциальному выражению:

В работе Виллемса и др. [32] использовалось более простое выражение, соответствующее и . В Lindeberg [33] было показано, что и подразумевает лучшие свойства масштабного выбора в том смысле, что выбранные масштабные уровни, полученные из пространственно-временного гауссовского блоба с пространственной протяженностью и временной протяженностью, будут идеально соответствовать пространственной протяженности и временной продолжительности blob, с выбором масштаба, выполняемым путем обнаружения пространственно-временных экстремумов масштабного пространства дифференциального выражения.

Оператор Лапласа был расширен Линдебергом на пространственно-временные видеоданные [33], что привело к следующим двум пространственно-временным операторам, которые также составляют модели рецептивных полей неотложных и запаздывающих нейронов в LGN:

Для первого оператора свойства выбора масштаба требуют использования и , если мы хотим, чтобы этот оператор принимал максимальное значение по пространственно-временным масштабам на пространственно-временном масштабном уровне, отражающем пространственную протяженность и временную продолжительность начинающегося гауссова блоба. Для второго оператора свойства выбора масштаба требуют использования и , если мы хотим, чтобы этот оператор принимал максимальное значение по пространственно-временным масштабам на пространственно-временном масштабном уровне, отражающем пространственную протяженность и временную продолжительность мигающего гауссовского пятна.

Цветовые расширения пространственно-временных детекторов точек интереса были исследованы Everts et al. [34]

Библиография [ править ]

  1. ^ Эндрю Уиллис и Юньфэн Суй (2009). «Алгебраическая модель для быстрого обнаружения углов». 2009 12-я Международная конференция IEEE по компьютерному зрению . IEEE. С. 2296–2302. DOI : 10.1109 / ICCV.2009.5459443 . ISBN 978-1-4244-4420-5.
  2. ^ Шапиро, Линда и Джордж С. Стокман (2001). Компьютерное зрение , стр. 257. Prentice Books, Верхняя Сэдл-Ривер. ISBN 0-13-030796-3 . 
  3. ^ Х. Моравец (1980). «Избегание препятствий и навигация в реальном мире с помощью видящего робота-вездехода» . Технический отчет CMU-RI-TR-3 Университет Карнеги-Меллона, Институт робототехники .
  4. ^ Избегание препятствий и навигация в реальном мире с помощью видящего робота-вездехода, Ханс Моравец, март 1980, факультет компьютерных наук Стэнфордского университета (докторская диссертация)
  5. ^ С. Харрис и М. Стивенс (1988). «Комбинированный детектор угла и края» (PDF) . Труды 4-й конференции Alvey Vision . С. 147–151.
  6. ^ Хавьер Санчес, Нельсон Монсон и Агустин Сальгадо (2018). "Анализ и реализация детектора угла Харриса" (PDF) . Обработка изображений в режиме онлайн . 8 : 305–328. DOI : 10.5201 / ipol.2018.229 . Архивировано из оригинала на 2018-10-03.
  7. J. Shi и C. Tomasi (июнь 1994 г.). «Хорошие возможности для отслеживания». 9-я конференция IEEE по компьютерному зрению и распознаванию образов . Springer. С. 593–600. CiteSeerX 10.1.1.36.2669 . DOI : 10,1109 / CVPR.1994.323794 . 
    {{cite techreport | автор = C. Томази и Т. Канаде | title = Обнаружение и отслеживание точечных объектов | год = 1991 | номер = CMU-CS-91-132 | учреждение = Школа компьютерных наук, Университет Карнеги-Меллона | citeseerx = 10.1.1.45.5770
  8. Перейти ↑ A. Noble (1989). Описание поверхностей изображения (Ph.D.). Департамент инженерных наук Оксфордского университета. п. 45.
  9. ^ Förstner, W; Гюльх (1987). «Быстрый оператор для обнаружения и точного определения местоположения отличных точек, углов и центров круговых объектов» (PDF) . ISPRS . [ постоянная мертвая ссылка ]
  10. ^ а б в Т. Линдеберг (1994). «Обнаружение стыков с автоматическим выбором шкал обнаружения и масштабов локализации» . Proc. 1-я Международная конференция по обработке изображений . Я . Остин, Техас. С. 924–928.
  11. ^ Б с д е е г ч я J K Тони Линдеберга (1998). «Обнаружение признаков с автоматическим выбором шкалы» . Международный журнал компьютерного зрения . 30 (2). С. 77–116.
  12. ^ a b c d e f g h Т. Линдеберг (1994). Теория масштабного пространства в компьютерном зрении . Springer. ISBN 978-0-7923-9418-1.
  13. ^ a b c d Т. Линдеберг и Дж. Гардинг "Сглаживание с учетом формы в оценке трехмерных сигналов глубины на основе аффинных искажений локальной двумерной структуры". Image and Vision Computing 15 (6): pp 415–434, 1997.
  14. ^ а б в г Т. Линдеберг (2008). «Масштаб-Пространство» . В Бенджамине Ва (ред.). Энциклопедия компьютерных наук и инженерии Wiley . IV . Джон Вили и сыновья. С. 2495–2504. DOI : 10.1002 / 9780470050118.ecse609 . ISBN 978-0-470-05011-8.
  15. ^ a b c К. Миколайчик, К. и К. Шмид (2004). "Масштабные и аффинно-инвариантные детекторы точки интереса" (PDF) . Международный журнал компьютерного зрения . 60 (1): 63–86. DOI : 10,1023 / Б: VISI.0000027790.02288.f2 .
  16. ^ Л. Китчен и А. Розенфельд (1982). «Обнаружение углов на уровне серого». Письма о распознавании образов . 1 (2). С. 95–102.
  17. ^ JJ Koenderink и W. Richards (1988). «Двумерные операторы кривизны» . Журнал Оптического общества Америки A . 5 (7). С. 1136–1141.
  18. ^ Л. Бретцнер и Т. Линдеберг (1998). «Отслеживание признаков с автоматическим выбором пространственных масштабов» . Компьютерное зрение и понимание изображений . 71 . С. 385–392.
  19. ^ Т. Линдеберг и М.-Х. Ли (1997). «Сегментация и классификация ребер с использованием аппроксимации минимальной длины описания и дополнительных точек соединения» . Компьютерное зрение и понимание изображений . 67 (1). С. 88–98.
  20. ^ а б в Д. Лоу (2004). "Отличительные особенности изображения от масштабно-инвариантных ключевых точек" . Международный журнал компьютерного зрения . 60 (2): 91. CiteSeerX 10.1.1.73.2924 . DOI : 10,1023 / Б: VISI.0000029664.99615.94 . 
  21. ^ a b c d e f g h Т. Линдеберг, «Сопоставление изображений с использованием обобщенных точек интереса в масштабном пространстве», Journal of Mathematical Imaging and Vision, volume 52, number 1, pages 3-36, 2015.
  22. ^ a b c d Т. Линдеберг «Свойства выбора масштаба для детекторов точек интереса с обобщенным масштабным пространством», Journal of Mathematical Imaging and Vision, Volume 46, Issue 2, pages 177-210, 2013.
  23. ^ Линдеберга, Т. (1998). «Обнаружение края и обнаружение гребня с автоматическим выбором шкалы» . Международный журнал компьютерного зрения . 30 (2): 117–154. DOI : 10,1023 / A: 1008097225773 .
  24. Х. Ван и М. Брэди (1995). «Алгоритм определения угла в реальном времени для оценки движения». Вычисления изображений и зрения . 13 (9): 695–703. DOI : 10.1016 / 0262-8856 (95) 98864-P .
  25. SM Smith и JM Brady (май 1997 г.). «SUSAN - новый подход к обработке изображений низкого уровня» . Международный журнал компьютерного зрения . 23 (1): 45–78. DOI : 10,1023 / A: 1007963824710 .
    С. М. Смит и Дж. М. Брэди (январь 1997 г.), «Метод цифровой обработки изображений для определения положения краев и / или углов в них для управления беспилотным транспортным средством». Патент Великобритании 2272285, владелец: министр обороны Великобритании.
  26. ^ Патент Великобритании 2272285 , список изобретателей (свободный формат), «Определение положения краев и углов в изображениях», опубликован 11 мая 1994 г., выдан 11 мая 1994 г., передан Secr Defense 
  27. ^ "Детектор края SUSAN в деталях" .
  28. ^ М. Трайкович и М. Хедли (1998). «Быстрое обнаружение углов». Вычисления изображений и зрения . 16 (2): 75–87. DOI : 10.1016 / S0262-8856 (97) 00056-5 .
  29. ^ a b Э. Ростен и Т. Драммонд (май 2006 г.). «Машинное обучение для высокоскоростного обнаружения углов» . Европейская конференция по компьютерному зрению .
  30. ^ Леонардо Трухильо и Густаво Олаге (2008). «Автоматизированный дизайн операторов изображений, обнаруживающих точки интереса» (PDF) . Эволюционные вычисления . 16 (4): 483–507. DOI : 10.1162 / evco.2008.16.4.483 . PMID 19053496 . Архивировано из оригинального (PDF) 17 июля 2011 года.  
  31. ^ Иван Лаптев и Тони Линдеберг (2003). «Пространственно-временные точки интереса» . Международная конференция по компьютерному зрению . IEEE. С. 432–439.
  32. ^ a b Герт Виллемс, Тинне Тайтелаарс и Люк ван Гул (2008). "Эффективный плотный и масштабно-инвариантный пространственно-временный детектор точек интереса". Европейская конференция по компьютерному зрению . Конспект лекций по информатике. 5303 . С. 650–663. DOI : 10.1007 / 978-3-540-88688-4_48 .
  33. ^ a b c Тони Линдеберг (2018). «Выбор пространственно-временного масштаба в видеоданных». Журнал математической визуализации и зрения . 60 (4). С. 525–562. DOI : 10.1007 / s10851-017-0766-9 .
  34. I. Everts, J. van Gemert и T. Gevers (2014). «Оценка цветовых пространственно-временных точек интереса для распознавания действий человека». IEEE Transactions по обработке изображений . 23 (4). С. 1569–1589. DOI : 10.1109 / TIP.2014.2302677 .

Эталонные реализации [ править ]

В этом разделе представлены внешние ссылки на эталонные реализации некоторых детекторов, описанных выше. Эти эталонные реализации предоставлены авторами статьи, в которой детектор впервые описывается. Они могут содержать детали, не представленные или явные в документах, описывающих функции.

  • Обнаружение DoG (как часть системы SIFT ), исполняемые файлы Windows и x86 Linux
  • Харрис-Лаплас , статические исполняемые файлы Linux . Также содержит детекторы DoG и LoG и аффинную адаптацию для всех включенных детекторов.
  • Детектор FAST , исходный код C, C ++, MATLAB и исполняемые файлы для различных операционных систем и архитектур.
  • lip-vireo , [LoG, DoG, Harris-Laplacian, Hessian и Hessian-Laplacian], [SIFT, инвариантный SIFT, PCA-SIFT, PSIFT, управляемые фильтры, SPIN] [Linux, Windows и SunOS] исполняемые файлы.
  • SUSAN Низкоуровневая обработка изображений , исходный код C.
  • Онлайн-реализация детектора угла Харриса - IPOL

См. Также [ править ]

  • обнаружение капли
  • адаптация аффинной формы
  • масштабное пространство
  • обнаружение гребня
  • обнаружение точки интереса
  • обнаружение признаков (компьютерное зрение)
  • производные изображения

Внешние ссылки [ править ]

  • Линдеберг, Тони (2001) [1994], «Обнаружение углов» , Энциклопедия математики , EMS Press
  • Бростоу, "Обнаружение углов - UCL Computer Science"