Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Масштабное пространство теория является основой для разномасштабную сигнала представления , разработанного компьютерного зрения , обработки изображений и обработка сигналов сообществ с дополнительными мотивами из физики и биологического видения . Это формальная теория для обработки структур изображений в различных масштабах , представляющая изображение как однопараметрическое семейство сглаженных изображений, представление в масштабном пространстве , параметризованное размером сглаживающего ядра, используемого для подавления мелкомасштабных структур. [1] [2] [3] [4][5] [6] [7] [8] Параметрв этом семействе упоминается как параметр масштаба , с интерпретацией, что структуры изображения пространственного размера меньше, чем примерно,были в значительной степени сглажены на уровне масштабного пространства в масштабе.

Основным типом масштабного пространства является линейное (гауссово) масштабное пространство , которое имеет широкую применимость, а также привлекательное свойство возможности быть выведенным из небольшого набора аксиом масштабного пространства . Соответствующая структура масштабного пространства включает в себя теорию операторов производной Гаусса, которая может использоваться в качестве основы для выражения большого класса визуальных операций для компьютеризированных систем, обрабатывающих визуальную информацию. Эта структура также позволяет сделать визуальные операции инвариантными к масштабу , что необходимо для работы с изменениями размера, которые могут возникать в данных изображения, поскольку реальные объекты могут иметь разные размеры и, кроме того, расстояние между объектом и камерой может быть неизвестным и может отличаться в зависимости от обстоятельств.[9] [10]

Определение [ править ]

Понятие масштабного пространства применяется к сигналам с произвольным числом переменных. Наиболее распространенный в литературе случай относится к двумерным изображениям, которые и представлены здесь. Для данного изображения , его линейное (гауссово) масштаба пространство представление представляет собой семейство производных сигналов определяется сверткой из с двумерный гауссовым ядром

такой, что

где точка с запятой в аргументе означает, что свертка выполняется только по переменным , а параметр масштаба после точки с запятой просто указывает, какой уровень масштабирования определяется. Это определение работает для континуума масштабов , но обычно фактически рассматривается только конечный дискретный набор уровней в представлении масштабного пространства.

Масштабный параметр представляет собой дисперсию от фильтра гауссова и , как предел для фильтра становится импульсной функции , такие , что , то есть представление масштаба пространство в масштабе уровня является изображение само по себе. По мере увеличения является результатом сглаживания все более и более крупным фильтром, тем самым удаляя все больше и больше деталей, содержащихся в изображении. Поскольку стандартное отклонение фильтра равно , детали, которые значительно меньше этого значения, в значительной степени удаляются из изображения при параметре масштаба , см. Следующий рисунок и [11] для графических иллюстраций.

  • Масштабное представление в масштабе , соответствующем исходному изображению

  • Масштабно-пространственное представление в масштабе

  • Масштабно-пространственное представление в масштабе

  • Масштабно-пространственное представление в масштабе

  • Масштабно-пространственное представление в масштабе

  • Масштабно-пространственное представление в масштабе

Почему фильтр Гаусса? [ редактировать ]

Столкнувшись с задачей генерации многомасштабного представления, можно спросить: может ли любой фильтр g низкочастотного типа и с параметром t, определяющим его ширину, использоваться для генерации масштабного пространства? Ответ - нет, поскольку крайне важно, чтобы сглаживающий фильтр не вводил новые ложные структуры в грубых масштабах, которые не соответствуют упрощениям соответствующих структур в более мелких масштабах. В литературе по масштабному пространству было выражено несколько различных способов сформулировать этот критерий в точных математических терминах.

Вывод из нескольких различных аксиоматических выводов, которые были представлены, заключается в том, что гауссово масштабное пространство представляет собой канонический способ создания линейного масштабного пространства, основанного на важном требовании, что новые структуры не должны создаваться при переходе от мелкого масштаба к любому более грубому масштабу. . [1] [3] [4] [6] [9] [12] [13] [14] [15] [16] [17] [18] [19] » Условия, называемые аксиомами масштабного пространства , которые были использованы для вывода уникальности ядра Гаусса, включая линейность , инвариантность сдвига , полугруппуструктура, отсутствие усиления локальных экстремумов , масштабная инвариантность и вращательная инвариантность . В работах [15] [20] [21] критиковалась уникальность аргументов, основанных на масштабной инвариантности, и предлагались альтернативные самоподобные ядра масштабного пространства. Однако гауссово ядро ​​является уникальным выбором в соответствии с аксиоматикой масштабного пространства, основанной на причинности [3] или отсутствии усиления локальных экстремумов. [16] [18]

Альтернативное определение [ править ]

Эквивалентно семейство масштабных пространств можно определить как решение уравнения диффузии (например, в терминах уравнения теплопроводности ),

с начальным состоянием . Эта формулировка представления масштабного пространства L означает, что можно интерпретировать значения интенсивности изображения f как «распределение температуры» в плоскости изображения и что процесс, который генерирует представление масштабного пространства как функцию t, соответствует к диффузии тепла в плоскости изображения за время t (при условии, что теплопроводность материала равна произвольно выбранной постоянной ½). Хотя эта связь может показаться поверхностной для читателя, не знакомого с дифференциальными уравнениями, действительно так, что основная формулировка масштабного пространства в терминах неусиления локальных экстремумов выражается в терминах условия знака для частных производных в 2 + 1-мерном объеме, порожденном масштабным пространством, то есть в пределах система дифференциальных уравнений в частных производных . Кроме того, подробный анализ дискретного случая показывает, что уравнение диффузии обеспечивает объединяющую связь между непрерывными и дискретными масштабными пространствами, которые также обобщаются на нелинейные масштабные пространства, например, с использованием анизотропной диффузии . Следовательно, можно сказать, что основным способом создания масштабного пространства является уравнение диффузии, и что гауссово ядро ​​возникает как функция Грина этого конкретного уравнения в частных производных.

Мотивации [ править ]

Мотивация для создания представления заданного набора данных в масштабном пространстве проистекает из основного наблюдения, что объекты реального мира состоят из разных структур в разных масштабах . Это означает, что объекты реального мира, в отличие от идеализированных математических объектов, таких как точки или линии , могут появляться по-разному в зависимости от масштаба наблюдения. Например, концепция «дерева» уместна в масштабе метров, тогда как такие понятия, как листья и молекулы, более уместны в более мелких масштабах. Для системы компьютерного зрения , анализирующей неизвестную сцену, невозможно заранее узнать, какие масштабыподходят для описания интересных структур в данных изображения. Следовательно, единственный разумный подход - рассматривать описания в нескольких масштабах, чтобы иметь возможность фиксировать неизвестные вариации масштаба, которые могут произойти. В пределе масштабное представление рассматривает представления во всех масштабах. [9]

Другая мотивация концепции масштабного пространства проистекает из процесса выполнения физических измерений на реальных данных. Чтобы извлечь любую информацию из процесса измерения, нужно применять к данным операторы не бесконечно малого размера . Во многих областях информатики и прикладной математики размер оператора измерения не принимается во внимание при теоретическом моделировании проблемы. С другой стороны, теория масштабного пространства явно включает необходимость не бесконечно малого размера операторов изображения как неотъемлемой части любого измерения, а также любой другой операции, которая зависит от реального измерения. [5]

Существует тесная связь между теорией масштабного пространства и биологическим видением. Многие масштабно-пространственные операции показывают высокую степень сходства с профилями рецептивного поля, записанными на сетчатке млекопитающих и на первых этапах в зрительной коре. В этом отношении каркас масштаб-пространство можно рассматривать как теоретически хорошо обоснованную парадигму раннего видения, которая, кроме того, была тщательно проверена алгоритмами и экспериментами. [4] [9]

Гауссовские производные [ править ]

В любом масштабе в масштабном пространстве мы можем применить операторы локальной производной к представлению в масштабном пространстве:

Благодаря свойству коммутативности между оператором производной и оператором сглаживания по Гауссу, такие производные в масштабном пространстве могут быть эквивалентно вычислены путем свертки исходного изображения с операторами производных по Гауссу. По этой причине их часто также называют производными Гаусса :

Уникальность операторов гауссовой производной как локальных операций, полученных из представления масштабного пространства, может быть получена с помощью аналогичных аксиоматических выводов, которые используются для вывода уникальности гауссовского ядра для сглаживания масштабного пространства. [4] [22]

Визуальный интерфейс [ править ]

Эти операторы производной Гаусса, в свою очередь, могут быть объединены линейными или нелинейными операторами в большее количество различных типов детекторов признаков, которые во многих случаях могут быть хорошо смоделированы с помощью дифференциальной геометрии . В частности, инвариантность (или более подходящая ковариация ) к локальным геометрическим преобразованиям, таким как вращения или локальные аффинные преобразования, может быть получена путем рассмотрения дифференциальных инвариантов в соответствующем классе преобразований или, в качестве альтернативы, путем нормализации операторов производной Гаусса на локально определенную систему координат, определенную из, например, предпочтительной ориентации в области изображения или путем применения предпочтительного локального аффинного преобразования к локальному фрагменту изображения (см. статью об адаптации аффинной формы для получения дополнительной информации).

Когда гауссовские производные операторы и дифференциальные инварианты используются таким образом в качестве детекторов основных признаков в нескольких масштабах, незафиксированные первые этапы визуальной обработки часто называют визуальным интерфейсом . Эта общая структура была применена к большому разнообразию проблем в области компьютерного зрения, в том числе обнаружения особенностей , классификации признака , сегментаций изображений , согласование изображений , оценки движения , расчет формы реплик и распознавание объектов . Набор операторов производной Гаусса до определенного порядка часто называют N-струей и составляет основной тип объекта в рамках масштабного пространства.

Примеры детекторов [ править ]

Следуя идее выражения визуальных операций в терминах дифференциальных инвариантов, вычисляемых в нескольких масштабах с использованием операторов производной Гаусса, мы можем выразить детектор края из набора точек, которые удовлетворяют требованию, чтобы величина градиента

должен принимать локальный максимум в направлении градиента

Путем разработки дифференциальной геометрии можно показать [4], что этот дифференциальный детектор кромок может быть эквивалентно выражен из переходов через нуль дифференциального инварианта второго порядка

удовлетворяющие следующему знаковому условию на дифференциальный инвариант третьего порядка:

Точно так же многомасштабные детекторы капель в любом заданном фиксированном масштабе [23] [9] могут быть получены из локальных максимумов и локальных минимумов любого оператора Лапласа (также называемого лапласианом Гаусса )

или определитель матрицы Гессе

Аналогичным образом детекторы углов и детекторы гребней и впадин могут быть выражены как локальные максимумы, минимумы или переходы через нуль многомасштабных дифференциальных инвариантов, определенных из производных Гаусса. Однако алгебраические выражения для операторов обнаружения углов и выступов несколько сложнее, и читателю отсылают к статьям об обнаружении углов и обнаружении гребней для получения более подробной информации.

Операции масштабного пространства также часто использовались для выражения методов от грубого к точному, в частности, для таких задач, как сопоставление изображений и многомасштабная сегментация изображений .

Выбор шкалы [ править ]

Теория, представленная до сих пор, описывает хорошо обоснованную основу для представления структур изображений в нескольких масштабах. Однако во многих случаях также необходимо выбрать масштаб, соответствующий местным условиям, для дальнейшего анализа. Необходимость выбора шкалы проистекает из двух основных причин; (i) объекты реального мира могут иметь разный размер, и этот размер может быть неизвестен системе зрения, и (ii) расстояние между объектом и камерой может меняться, и эта информация о расстоянии также может быть неизвестна априори . Очень полезным свойством представления масштабного пространства является то, что представления изображений можно сделать инвариантными к масштабам, выполнив автоматический выбор локального масштаба [9] [10] [23] [24] [25][26] [27] [28] на основе локальных максимумов (или минимумов ) по шкалам нормированных по масштабу производных

где - параметр, связанный с размерностью элемента изображения. Это алгебраическое выражение для операторов масштабно нормализованной производной Гаусса происходит от введения -нормированных производных в соответствии с

а также

Теоретически можно показать, что модуль выбора масштаба, работающий по этому принципу, будет удовлетворять следующему свойству ковариации масштаба : если для определенного типа характеристики изображения предполагается локальный максимум на определенном изображении в определенном масштабе , то при изменении масштаба изображение с коэффициентом масштабирования, локальный максимум по масштабам в масштабированном изображении будет преобразовано в масштабный уровень . [23]

Обнаружение инвариантной функции масштабирования [ править ]

Следуя этому подходу гамма-нормированных производных, можно показать, что различные типы масштабно-адаптивных и масштабно-инвариантных детекторов признаков [9] [10] [23] [24] [25] [29] [30] [27] могут быть выражаемся для таких задач, как обнаружение большого двоичного объекта , обнаружение угла , обнаружение конька , обнаружение края и обнаружение интерес точки пространственно-временной(см. конкретные статьи по этим темам для подробного описания того, как сформулированы эти масштабно-инвариантные детекторы признаков). Кроме того, уровни шкалы, полученные в результате автоматического выбора шкалы, могут использоваться для определения областей интереса для последующей адаптации аффинной формы [31] для получения аффинно-инвариантных точек интереса [32] [33] или для определения уровней шкалы для вычисления связанных дескрипторов изображений , таких как как адаптированные к местным условиям N-форсунки .

Недавняя работа показала, что таким образом могут быть выполнены и более сложные операции, такие как масштабно-инвариантное распознавание объектов , путем вычисления локальных дескрипторов изображения (N-струй или локальных гистограмм направлений градиента) в точках интереса, адаптированных к масштабу, полученных из масштабирования. пространственные экстремумы нормализованного оператора Лапласа (см. также масштабно-инвариантное преобразование признаков [34] ) или определитель гессиана (см. также SURF ); [35] см. Также статью Scholarpedia о масштабно-инвариантном преобразовании признаков [36] для более общего взгляда на подходы к распознаванию объектов, основанные на ответах рецептивного поля [19] [37] [38][39] в терминах гауссовских производных операторов или их приближений.

Связанные многомасштабные представления [ править ]

Пирамида изображений - это дискретное представление, в котором масштабное пространство выбирается как в пространстве, так и в масштабе. Для масштабной инвариантности масштабные коэффициенты следует выбирать экспоненциально, например, как целые степени 2 или 2 . При правильном построении соотношение частот дискретизации в пространстве и масштабе остается постоянным, так что импульсный отклик идентичен на всех уровнях пирамиды. [40] [41] [42] [43] Существуют быстрые, O (N) алгоритмы для вычисления масштабно-инвариантной пирамиды изображения, в которой изображение или сигнал многократно сглаживаются, а затем субдискретизируются. Значения шкалы между образцами пирамиды можно легко оценить с помощью интерполяции внутри шкалы и между шкалами, а также с учетом оценок масштаба и положения с точностью до субразрешения. [43]

В представлении масштабного пространства наличие непрерывного масштабного параметра позволяет отслеживать пересечения нуля масштабов, что приводит к так называемой глубокой структуре . Для функций , определенных в качестве переходов через нуль из дифференциальных инвариантов , то теорема о неявной функции непосредственно определяет траектории по шкалам, [4] [44] и в тех масштабах , где бифуркации происходят, локальное поведение может быть смоделированы с помощью теории особенностей . [4] [44] [45] [46] [47]

Расширения теории линейного масштабного пространства касаются формулировки понятий нелинейного масштабного пространства, более ориентированных на конкретные цели. [48] [49] Эти нелинейные масштабные пространствачасто начинают с эквивалентной диффузной формулировки концепции масштабного пространства, которая впоследствии расширяется нелинейным образом. Таким образом было сформулировано большое количество эволюционных уравнений, мотивированных различными конкретными требованиями (дополнительную информацию см. В упомянутых выше справочниках по книгам). Следует отметить, однако, что не все эти нелинейные масштабные пространства удовлетворяют тем же «хорошим» теоретическим требованиям, что и концепция линейного гауссовского масштабного пространства. Следовательно, иногда могут возникать неожиданные артефакты, и нужно быть очень осторожным, чтобы не использовать термин «масштабное пространство» только для любого типа однопараметрического семейства изображений.

Расширение первого порядка изотропного гауссовского масштабного пространства обеспечивается аффинным (гауссовым) масштабным пространством . [4] Одна из причин для этого расширения проистекает из общей потребности в вычислении дескрипторов изображений для реальных объектов, которые просматриваются в рамках модели перспективной камеры . Чтобы обрабатывать такие нелинейные деформации локально, частичная инвариантность (или, точнее, ковариантность ) к локальным аффинным деформациям может быть достигнута путем рассмотрения аффинных гауссовских ядер с их формой, определяемой локальной структурой изображения, [31] см. Статью об адаптации аффинной формыпо теории и алгоритмам. В самом деле, это аффинное масштабное пространство также может быть выражено из неизотропного расширения линейного (изотропного) уравнения диффузии, все еще находясь в классе линейных уравнений в частных производных .

Существует более общее расширение модели гауссовского масштабного пространства на аффинные и пространственно-временные масштабные пространства. [4] [31] [18] [19] [50] В дополнение к изменчивости по шкале, для решения которой была разработана оригинальная теория масштабного пространства, эта обобщенная теория масштабного пространства [19]также включает другие типы изменчивости, вызванные геометрическими преобразованиями в процессе формирования изображения, включая вариации направления взгляда, аппроксимируемые локальными аффинными преобразованиями, и относительные движения между объектами в мире и наблюдателем, аппроксимируемые локальными преобразованиями Галилея. Эта обобщенная теория масштабного пространства приводит к предсказаниям о профилях рецептивного поля в хорошем качественном согласии с профилями рецептивного поля, измеренными с помощью записей клеток в биологическом зрении. [51] [52] [50] [53]

Между теорией масштабного пространства и теорией всплесков существует тесная связь , хотя эти два понятия многомасштабного представления были разработаны из несколько разных предпосылок. Также велась работа над другими многомасштабными подходами , такими как пирамиды и множество других ядер, которые не используют или не требуют тех же требований, что и истинные описания в масштабе пространства.

Связь с биологическим зрением и слухом [ править ]

Есть интересные отношения между представлением в масштабном пространстве и биологическим зрением и слухом. Нейрофизиологические исследования биологического зрения показали, что существуют профили рецептивного поля в сетчатке и зрительной коре млекопитающих , которые могут быть хорошо смоделированы операторами линейной производной Гаусса, в некоторых случаях также дополненными неизотропной аффинной моделью масштабного пространства, пространственной -временная масштабно-пространственная модель и / или нелинейные комбинации таких линейных операторов. [18] [51] [52] [50] [53] [54] [55] [56] [57]

Что касается биологического слуха, существуют профили рецептивного поля в нижних бугорках и первичной слуховой коре, которые могут быть хорошо смоделированы спектрально-временными рецептивными полями, которые могут быть хорошо смоделированы гауссовыми производными по логарифмическим частотам и оконным преобразованием Фурье с течением времени с оконными функциями. ядра временного масштабного пространства. [58] [59]

Проблемы реализации [ править ]

При реализации сглаживания масштабного пространства на практике существует ряд различных подходов, которые можно использовать в терминах непрерывного или дискретного сглаживания по Гауссу, реализации в области Фурье, в терминах пирамид на основе биномиальных фильтров, которые аппроксимируют гауссово, или с использованием рекурсивных фильтров. . Подробнее об этом читайте в отдельной статье о реализации масштабного пространства .

См. Также [ править ]

  • Разница гауссианов
  • Функция Гаусса
  • mipmapping

Ссылки [ править ]

  1. ^ а б Иджима, Т. "Основы теории нормализации шаблона (в случае типичного одномерного шаблона)". Бык. Электротех. Лаборатория. 26, 368–388, 1962. (на яп.)
  2. ^ Виткин, А.П. "Масштабная фильтрация", Proc. 8-й Int. Совместная конф. Изобразительное искусство. Intell., Карлсруэ, Германия, 1019–1022, 1983.
  3. ^ a b c Кендеринк, Ян " Структура образов ", Биологическая кибернетика, 50: 363–370, 1984
  4. ^ a b c d e f g h i Линдеберг, Т., Теория масштабного пространства в компьютерном зрении, Kluwer Academic Publishers, 1994 , ISBN  0-7923-9418-6
  5. ^ а б Т. Линдеберг (1994). «Теория масштабного пространства: основной инструмент для анализа структур в различных масштабах» . Журнал прикладной статистики (Приложение о достижениях в прикладной статистике: статистика и изображения: 2) . 21 (2). С. 224–270. DOI : 10.1080 / 757582976 .
  6. ^ a b Флорак, Люк, Структура изображения, Kluwer Academic Publishers, 1997.
  7. ^ Спорринг, Джон и др. (Редакторы), Гауссова теория масштабного пространства, Kluwer Academic Publishers, 1997.
  8. ^ тер Хаар Ромени, Барт М. (2008). Front-End Vision и многомасштабный анализ изображений: многомасштабная теория компьютерного зрения и приложения, написанные в системе Mathematica . Springer Science & Business Media. ISBN 978-1-4020-8840-7.
  9. ^ Б с д е е г Линдеберга, Tony (2008). «Масштаб-пространство» . В Бенджамине Ва (ред.). Энциклопедия компьютерных наук и инженерии . IV . Джон Вили и сыновья. С. 2495–2504. DOI : 10.1002 / 9780470050118.ecse609 . ISBN 978-0470050118.
  10. ^ a b c Т. Линдеберг (2014) «Выбор шкалы», Компьютерное зрение: Справочное руководство, (К. Икеучи, редактор), Springer, страницы 701–713.
  11. ^ Графическая иллюстрация основных идей представления масштабного пространства на http://www.csc.kth.se/~tony/cern-review/cern-html/node2.html
  12. ^ Ж. Бабауд, А.П. Виткин, М. Бауден, Р.О. Дуда, Уникальность гауссовского ядра для фильтрации в масштабном пространстве. IEEE Trans. Pattern Anal. Machine Intell. 8 (1), 26–33, 1986.
  13. ^ А. Юилле, Т. А. Поджио: теоремы масштабирования для нулевых переходов. IEEE Trans. Анализ паттернов и машинный интеллект, Vol. ПАМИ-8, № 1. С. 15–25, январь 1986 г.
  14. ^ Линдеберг, Т., "Масштабное пространство для дискретных сигналов", IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. ПАМИ-12, № 3, март 1990 г., стр. 234–254.
  15. ^ a b Пауэлс, Э., ван Гул, Л., Фидделаерс, П. и Мунс, Т .: Расширенный класс масштабно-инвариантных и рекурсивных масштабных пространственных фильтров, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 7, pp. 691–701, 1995.
  16. ^ a b Линдеберг, Т .: Об аксиоматических основах линейного масштабного пространства: сочетание структуры полугруппы с причинностью и масштабной инвариантностью. В: J. Sporring et al. (ред.) Гауссова теория масштабного пространства: Proc. Школа PhD по теории масштабного пространства (Копенгаген, Дания, май 1996 г.), страницы 75–98, Kluwer Academic Publishers, 1997.
  17. ^ Weickert, J. Пространство линейного масштаба было впервые предложено в Японии. Журнал математической визуализации и зрения, 10 (3): 237–252, 1999.
  18. ^ a b c d Линдеберг, Т. Обобщенная аксиоматика гауссовского масштабного пространства, включающая линейное масштабное пространство, аффинное масштабное пространство и пространственно-временное масштабное пространство, Journal of Mathematical Imaging and Vision, 40 (1): 36–81, 2011 .
  19. ^ a b c d Линдеберг, Т. Обобщенная аксиоматическая теория масштабного пространства , Достижения в области визуализации и электронной физики, Elsevier, том 178, страницы 1–96, 2013.
  20. ^ М. Фельсберг и Г. Зоммер « Моногенное масштабное пространство: объединяющий подход к фазовой обработке изображений в масштабном пространстве », Журнал математической визуализации и зрения, 21 (1): 5–28, 2004.
  21. ^ R. Duits, L. Florack, J. de Graaf и B. ter Haar Romeny " Об аксиомах теории масштабного пространства ", Journal of Mathematical Imaging and Vision, 20 (3): 267–298, 2004.
  22. ^ Koenderink, Ян и ван Дорн, Ans: "Универсальные операторы окрестности", IEEE Transactions на Узор анализа и машинного интеллекта, том 14, стр 597-605, 1992.
  23. ^ a b c d Линдеберг, Тони «Обнаружение признаков с автоматическим выбором шкалы», Международный журнал компьютерного зрения, 30, 2, стр 77–116, 1998.
  24. ^ a b Линдеберг, Тони «Обнаружение краев и обнаружение выступов с автоматическим выбором шкалы», Международный журнал компьютерного зрения, 30, 2, стр 117–154, 1998.
  25. ^ a b Линдеберг, Тони, «Принципы автоматического выбора шкалы», В: Б. Яне (и др., ред.), Справочник по компьютерному зрению и приложениям, том 2, стр. 239-274, Academic Press, Бостон, США. , 1999.
  26. ^ Т. Линдеберг "Выбор временной шкалы в пространстве шкалы времени и причинности", Журнал математической визуализации и зрения, 58 (1): 57–101, 2017.
  27. ^ a b T. Lindeberg «Выбор пространственно-временного масштаба в видеоданных», Journal of Mathematical Imaging and Vision, 60 (4): 525–562, 2018.
  28. ^ Т. Линдеберг «Выбор плотной шкалы в пространстве, времени и пространстве-времени», SIAM Journal on Imaging Sciences, 11 (1): 407–441, 2018.
  29. ^ Т. Линдеберг «Свойства выбора масштаба для детекторов точек интереса с обобщенным масштабным пространством», Journal of Mathematical Imaging and Vision, 46 (2): 177–210, 2013.
  30. ^ Т. Линдеберг. «Сопоставление изображений с использованием обобщенных точек интереса в масштабном пространстве», Journal of Mathematical Imaging and Vision, 52 (1): 3–36, 2015.
  31. ^ a b c Линдеберг, Т. и Гардинг, Дж .: Сглаживание с учетом формы при оценке трехмерных сигналов глубины на основе аффинных искажений локальной двумерной структуры, Image and Vision Computing, 15, ~ 415–434, 1997.
  32. ^ Baumberg, A .: Надежное сопоставление функций в широко разделенных представлениях, Proc. Распознавание образов компьютерного зрения, I: 1774–1781, 2000.
  33. ^ Миколайчик, К. и Шмид, Ч .: Масштабные и аффинно-инвариантные детекторы точки интереса, Int. Журнал компьютерного зрения, 60: 1, 63 - 86, 2004.
  34. ^ Лоу, Д.Г., «Отличительные особенности изображения от масштабно-инвариантных ключевых точек», Международный журнал компьютерного зрения, 60, 2, стр. 91–110, 2004.
  35. ^ H. Bay, А. Ess, Т. Tuytelaars и Л. ван GOOL, "ускоренный надежные функции (SURF)", компьютерное зрение и изображения Понимание, 110: 3, 2008, стр 346-359
  36. ^ Линдеберг, Т. «Масштабно-инвариантное преобразование признаков», Scholarpedia, 7 (5): 10491, 2012.
  37. ^ B. Schiele и JL Crowley "Распознавание без соответствия с использованием многомерных гистограмм рецептивного поля", International Journal of Computer Vision, 36: 1, 31–50, 2000
  38. ^ О. Линде и Т. Линдеберг "Распознавание объектов с использованием составных гистограмм рецептивного поля более высокой размерности", Proc. Международная конференция по распознаванию образов (ICPR'04), Кембридж, Великобритания II: 1–6, 2004.
  39. ^ О. Линде и Т. Линдеберг "Составные гистограммы сложных сигналов: исследование информационного содержания в дескрипторах изображений на основе рецептивного поля для распознавания объектов", Компьютерное зрение и понимание изображений, 116: 4, 538–560, 2012.
  40. ^ Берт, Питер и Адельсон, Тед, « Лапласианская пирамида как компактный код изображения », IEEE Trans. Коммуникации, 9: 4, 532–540, 1983.
  41. ^ Кроули, JL и Стерн, RM (1984) Быстрое вычисление разницы низкочастотного преобразования, транзакции IEEE по анализу шаблонов и машинному интеллекту 6: 212-222
  42. ^ Кроули, JL и Сандерсон, AC «Представление с множеством разрешений и вероятностное соответствие двухмерной серой шкалы», IEEE Transactions on Pattern Analysis and Machine Intelligence, 9 (1), pp 113–121, 1987.
  43. ^ a b Т. Линдеберг и Л. Бретцнер (2003) "Выбор шкалы в реальном времени в гибридных многомасштабных представлениях", Proc. Scale-Space'03, остров Скай, Шотландия, Springer Lecture Notes по информатике, том 2695, страницы 148–163.
  44. ^ a b Т. Линдеберг (1992). Поведение локальных экстремумов и пятен в пространстве масштаба , J. of Mathematical Imaging and Vision, 1 (1), страницы 65–99.
  45. ^ Jan Koenderink и Андреа ван Дорн, AJ (1986), ' Динамическая форма ',биологическая кибернетика 53, 383-396.
  46. ^ Деймон, Дж. (1995), ' Локальная теория Морса для решений уравнения теплопроводности и размытие по Гауссу ', Журнал дифференциальных уравнений 115 (2), 386–401.
  47. ^ Флорак, Л., Куиджпер, А. Топологическая структура изображений в масштабном пространстве. Journal of Mathematical Imaging and Vision 12, 65–79, 2000.
  48. ^ тер Хаар Ромени, Барт М. (редактор), Геометрическая диффузия в компьютерном зрении , Kluwer Academic Publishers, 1994.
  49. ^ Вейкерт, Дж. Анизотропная диффузия в обработке изображений, Teuber Verlag, Штутгарт, 1998.
  50. ^ a b c Т. Линдеберг (2016) «Временно-причинные и временно-рекурсивные пространственно-временные рецептивные поля», Journal of Mathematical Imaging and Vision, 55 (1): 50–88.
  51. ^ a b Линдеберг, Т. Вычислительная теория зрительных рецептивных полей, Биологическая кибернетика, 107 (6): 589–635, 2013.
  52. ^ a b Линдеберг, Т. Инвариантность зрительных операций на уровне рецептивных полей, PLoS ONE 8 (7): e66990, 2013
  53. ^ a b Линдеберг, Т. (2021) Нормативная теория зрительных рецептивных полей, Heliyon 7 (1): e05897
  54. ^ DeAngelis, GC, Ohzawa, I., и Freeman, RD, "Динамика рецептивного поля в центральных зрительных путях", Trends Neurosci. 18: 451–458, 1995.
  55. ^ Янг, Р. А. " Модель производной Гаусса для пространственного зрения: механизмы сетчатки ", Пространственное зрение, 2: 273–293, 1987.
  56. ^ Янг Р.А., Лесперанс Р.М., Мейер В.В. (2001) Модель производной Гаусса для пространственно-временного зрения: I. Корковая модель. Плевать. Vis. 14: 261-319
  57. ^ Молодой Р. А. Лесперанс RM (2001) Модель производной Гаусса для пространственно-временного зрения: II. Корковые данные. Плевать. Vis. 14: 321-389
  58. ^ Т. Линдеберг и А. Фриберг "Идеализированные вычислительные модели слуховых рецептивных полей", PLOS ONE, 10 (3): e0119032, страницы 1–58, 2015
  59. ^ Т. Линдеберг и А. Фриберг (2015) «Теория масштабного пространства для слуховых сигналов», Proc. SSVM 2015: масштабно-пространственные и вариационные методы в компьютерном зрении, Springer LNCS 9087: 3–15.

Дальнейшее чтение [ править ]

  • Линдеберг, Тони (2008). «Масштаб-пространство» . В Бенджамине Ва (ред.). Энциклопедия компьютерных наук и инженерии . IV . Джон Вили и сыновья. С. 2495–2504. DOI : 10.1002 / 9780470050118.ecse609 . ISBN 978-0470050118.
  • Линдеберг, Тони: Теория масштабного пространства: основной инструмент для анализа структур в различных масштабах, в J. of Applied Statistics, 21 (2), стр. 224–270, 1994. (более длинный учебник в формате pdf по масштабному пространству)
  • Линдеберг, Тони: Масштаб-пространство: структура для обработки структур изображений в различных масштабах, Proc. Компьютерная школа ЦЕРН, 96 (8): 27-38, 1996.
  • Ромени, Барт тер Хаар: Введение в теорию масштабного пространства: многомасштабный анализ геометрических изображений, Учебник VBC '96, Гамбург, Германия, Четвертая международная конференция по визуализации в биомедицинских вычислениях.
  • Флорак, Люк, Ромени, Барт тер Хаар, Виергевер, Макс и Кендеринк, Ян: Пространство линейных масштабов, Журнал математической визуализации и зрения, том 4: 325–351, 1994.
  • Линдеберг, Тони, «Принципы автоматического выбора шкалы», В: Б. Яне (и др., Ред.), Справочник по компьютерному зрению и приложениям, том 2, стр. 239-274, Academic Press, Бостон, США, 1999. (учебник по подходам к автоматическому выбору шкалы)
  • Линдеберг, Тони: "Теория масштабного пространства" В: Энциклопедия математики, ( Michiel Hazewinkel , ed) Kluwer, 1997.
  • Резервное копирование веб-архива: Лекция по масштабному пространству в Массачусетском университете (pdf)

Внешние ссылки [ править ]

  • Интерактивное руководство по Java Powers of Ten на веб-сайте Molecular Expressions
  • Он-лайн ресурс с пространственно-временными рецептивными полями зрительных нейронов, предоставленный Идзуми Охзава из Университета Осаки
  • Обнаружение пиков в одномерных данных с использованием масштабно-пространственного подхода Лицензированный BSD код MATLAB