Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В обработке изображений и компьютерного зрения , A пространственный масштаб рамки могут быть использованы для представления изображения в виде семейства постепенно сглаженных изображений. Эта структура очень общая, и существует множество представлений о масштабном пространстве . Типичный подход к выбору конкретного типа представления масштабного пространства состоит в том, чтобы установить набор аксиом масштабного пространства , описывающий основные свойства желаемого представления масштабного пространства и часто выбираемых таким образом, чтобы сделать представление полезным в практических приложениях. После установления аксиомы сужают возможные представления в масштабном пространстве до меньшего класса, обычно с несколькими свободными параметрами.

Набор аксиом стандартного масштабного пространства, обсуждаемый ниже, приводит к линейному гауссовскому масштабному пространству, которое является наиболее распространенным типом масштабного пространства, используемым в обработке изображений и компьютерном зрении.

Аксиомы масштабного пространства для линейного представления масштабного пространства [ править ]

Линейное масштабное пространственное представление сигнала, полученное сглаживанием с помощью ядра Гаусса, удовлетворяет ряду свойств « аксиом масштабного пространства», которые делают его специальной формой многомасштабного представления:

  • линейность

где и - сигналы, а и - константы,

  • инвариантность сдвига

где обозначает оператор сдвига (трансляции)

  • структура полугруппы

с соответствующим свойством каскадного сглаживания

  • существование бесконечно малого генератора
  • отсутствие локальных экстремумов (нулевых переходов) в одном измерении,
  • отсутствие усиления локальных экстремумов в любом количестве измерений
в пространственных максимумах и в пространственных минимумах,
  • вращательная симметрия
для какой-то функции ,
  • масштабная инвариантность

для некоторых функций и где обозначает преобразование Фурье ,

  • позитивность :
,
  • нормализация :
.

Фактически, можно показать, что гауссово ядро ​​является уникальным выбором, учитывая несколько различных комбинаций подмножеств этих аксиом масштабного пространства: [1] [2] [3] [4] [5] [6] [7] [ 8] [9] [10] [11] большинство аксиом (линейность, инвариантность к сдвигу, полугруппа) соответствуют масштабированию как полугруппе инвариантных к сдвигу линейных операторов, которым удовлетворяет ряд интегральных преобразований семейств , в то время как " не создание локальных экстремумов » [4] для одномерных сигналов или« неусиление локальных экстремумов » [4] [7] [10]для сигналов более высокой размерности являются ключевыми аксиомами, которые связывают масштабные пространства со сглаживанием (формально параболические уравнения в частных производных ) и, следовательно, выбирают для гауссовского.

Гауссово ядро также разъемные в декартовой системе координат, то есть . Однако разделимость не считается аксиомой пространства масштаба, поскольку это свойство, зависящее от координат, связанное с проблемами реализации. Кроме того, требование разделимости в сочетании с вращательной симметрией как таковое фиксирует сглаживающее ядро ​​как гауссово.

Существует обобщение теории гауссовского масштабного пространства на более общие аффинные и пространственно-временные масштабные пространства. [10] [11] В дополнение к изменчивости по шкале, для решения которой была разработана оригинальная теория масштабного пространства, эта обобщенная теория масштабного пространстватакже включает другие типы изменчивости, в том числе деформации изображения, вызванные вариациями просмотра, аппроксимируемые локальными аффинными преобразованиями, и относительные движения между объектами в мире и наблюдателем, аппроксимируемые локальными преобразованиями Галилея. В этой теории вращательная симметрия не является необходимой аксиомой масштабного пространства, а вместо этого заменяется требованиями аффинной и / или галилеевой ковариантности. Обобщенная теория масштабного пространства приводит к предсказаниям о профилях рецептивного поля в хорошем качественном согласии с профилями рецептивного поля, измеренными посредством записи клеток в биологическом зрении. [12] [13] [14]

В компьютерном зрении , обработки изображений и обработка сигналов литературы существует много других многомасштабный подходов, с использованием вейвлет и множества других ядер, которые не эксплуатируют или требуют того же требования, масштаб пространства сделать описание; см. статью о связанных многомасштабных подходах . Также велась работа над концепциями дискретного масштабного пространства, которые переносят свойства масштабного пространства в дискретную область; см. статью о реализации масштабного пространства для примеров и ссылок.

См. Также [ править ]

Ссылки [ править ]

  1. ^ Кендеринк, Ян "Структура изображений", Биологическая кибернетика, 50: 363–370, 1984
  2. ^ Ж. Бабауд, А.П. Виткин, М. Бауден, Р.О. Дуда, Уникальность гауссовского ядра для фильтрации в масштабном пространстве. IEEE Trans. Pattern Anal. Machine Intell. 8 (1), 26–33, 1986.
  3. ^ А. Юилле, Т. А. Поджио: теоремы масштабирования для нулевых переходов. IEEE Trans. Анализ паттернов и машинный интеллект, Vol. ПАМИ-8, № 1. С. 15–25, январь 1986 г.
  4. ^ a b c Линдеберг, Т., "Масштабное пространство для дискретных сигналов", ПАМИ (12), № 3, март 1990 г., стр. 234–254.
  5. ^ Линдеберг, Тони, Теория масштабного пространства в компьютерном зрении, Kluwer, 1994 ,
  6. ^ Пауэлс, Э., ван Гул, Л., Фидделаерс, П. и Мунс, Т .: Расширенный класс масштабно-инвариантных и рекурсивных масштабных пространственных фильтров, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 7, pp. 691–701, 1995.
  7. ^ a b Линдеберг, Т .: Об аксиоматических основах линейного масштабного пространства: сочетание структуры полугруппы с причинностью и масштабной инвариантностью. В: J. Sporring et al. (ред.) Гауссова теория масштабного пространства: Proc. Школа PhD по теории масштабного пространства (Копенгаген, Дания, май 1996 г.), страницы 75–98, Kluwer Academic Publishers, 1997.
  8. ^ Florack, Люк, структура изображения, Kluwer Academic Publishers, 1997.
  9. ^ Weickert, J. Пространство линейного масштаба было впервые предложено в Японии. Журнал математической визуализации и зрения, 10 (3): 237–252, 1999.
  10. ^ a b c Линдеберг, Т. Обобщенная аксиоматика гауссовского масштабного пространства, включающая линейное масштабное пространство, аффинное масштабное пространство и пространственно-временное масштабное пространство, Journal of Mathematical Imaging and Vision, Volume 40, Number 1, 36-81, 2011 .
  11. ^ a b Линдеберг, Т. Обобщенная аксиоматическая теория масштабного пространства , Достижения в области визуализации и электронной физики, Elsevier, том 178, страницы 1-96, 2013.
  12. ^ Линдеберг, Т. Вычислительная теория зрительных рецептивных полей, Биологическая кибернетика, 107 (6): 589-635, 2013.
  13. ^ Линдеберг, Т. Инвариантность зрительных операций на уровне рецептивных полей, PLoS ONE 8 (7): e66990, 2013
  14. ^ Т. Линдеберг "Нормативная теория зрительных рецептивных полей", Heliyon 7 (1): e05897, 2021.