Обнаружение функции |
---|
Обнаружение края |
Обнаружение углов |
Обнаружение BLOB-объектов |
Обнаружение гребня |
Преобразование Хафа |
Структурный тензор |
Обнаружение аффинно-инвариантных признаков |
Описание функции |
Масштабировать пространство |
Пирамида , или представление пирамиды , представляет собой тип разномасштабную сигнала представления , разработанная компьютерного зрения , обработки изображений и обработки сигналов сообществ, в которых сигнал или изображение подлежит повторному сглаживанием и подвыборки . Представление пирамиды является предшественником представления в масштабном пространстве и анализа с несколькими разрешениями .
Существует два основных типа пирамид: lowpass и bandpass.
Пирамида нижних частот создается путем сглаживания изображения с помощью соответствующего сглаживающего фильтра и затем субдискретизации сглаженного изображения, обычно с коэффициентом 2 вдоль каждого координатного направления. Полученное изображение затем подвергается той же процедуре, и цикл повторяется несколько раз. Каждый цикл этого процесса приводит к уменьшению изображения с повышенным сглаживанием, но с уменьшенной плотностью пространственной выборки (то есть уменьшенным разрешением изображения). Если проиллюстрировать графически, все многомасштабное представление будет выглядеть как пирамида с исходным изображением внизу и меньшим изображением, полученным в результате каждого цикла, уложенным одно поверх другого.
Пирамида полосы пропускания создается путем формирования разницы между изображениями на соседних уровнях в пирамиде и выполнения интерполяции изображений между соседними уровнями разрешения, чтобы обеспечить вычисление пиксельных различий. [1]
Для создания пирамид было предложено множество различных ядер сглаживания . [2] [3] [4] [5] [6] [7] Среди предложений, которые были даны, биномиальные ядра, возникающие из биномиальных коэффициентов, выделяются как особенно полезный и теоретически хорошо обоснованный класс. [3] [8] [9] [10] [11]Таким образом, для двумерного изображения мы можем применить (нормализованный) биномиальный фильтр (1/4, 1/2, 1/4), как правило, дважды или более по каждому пространственному измерению, а затем выполнить субдискретизацию изображения с коэффициентом два. Затем эта операция может выполняться сколько угодно раз, что приводит к компактному и эффективному многомасштабному представлению. Если это мотивировано особыми требованиями, промежуточные уровни шкалы также могут быть сгенерированы, когда этап субдискретизации иногда не учитывается, что приводит к избыточной выборке или гибридной пирамиде . [10] С ростом вычислительной эффективности доступных сегодня ЦП , в некоторых ситуациях также возможно использовать более широкие поддерживаемые фильтры Гаусса в качестве сглаживающих ядер на этапах создания пирамиды.
В пирамиде Гаусса последующие изображения уменьшаются с использованием среднего значения по Гауссу ( размытие по Гауссу ) и уменьшаются в масштабе. Каждый пиксель, содержащий локальное среднее значение, соответствует пикселю соседства на нижнем уровне пирамиды. Этот метод особенно используется при синтезе текстур .
Пирамида Лапласа очень похожа на пирамиду Гаусса, но сохраняет различное изображение размытых версий между каждым уровнем. Только наименьший уровень не является разностным изображением, чтобы можно было восстановить изображение с высоким разрешением с использованием разностных изображений на более высоких уровнях. Этот метод можно использовать при сжатии изображений . [12]
Управляемая пирамида, разработанная Симончелли и другими, представляет собой реализацию многомасштабного банка полосовых фильтров с разной ориентацией, используемого для приложений, включая сжатие изображений , синтез текстур и распознавание объектов . Его можно рассматривать как вариант лапласовской пирамиды с селективной ориентацией, в которой на каждом уровне пирамиды используется набор управляемых фильтров вместо одного лапласовского или гауссовского фильтра . [13] [14] [15]
На заре компьютерного зрения пирамиды использовались в качестве основного типа многомасштабного представления для вычисления функций многомасштабного изображения из данных реального мира. Более современные методы включают представление масштабного пространства , которое было популярно среди некоторых исследователей из-за его теоретической основы, способности отделить этап подвыборки от многомасштабного представления, более мощные инструменты для теоретического анализа, а также способность вычислять представление в любом желаемом масштабе, что позволяет избежать алгоритмических проблем соотнесения представлений изображений с разным разрешением. Тем не менее пирамиды по-прежнему часто используются для выражения вычислительно эффективных приближений к представлению в масштабном пространстве.. [10] [16] [17]
Пирамиды лапласовских изображений, основанные на двустороннем фильтре, обеспечивают хорошую основу для улучшения деталей изображения и манипулирования ими. [ Требуется цитата ] Различия изображений между каждым слоем изменены, чтобы преувеличить или уменьшить детали в разных масштабах изображения.
Некоторые форматы файлов сжатия изображений используют алгоритм Adam7 или другую технику чересстрочной развертки . Их можно рассматривать как своего рода пирамиду изображений. Поскольку в этом формате файла сначала сохраняются «крупномасштабные» функции, а затем мелкие детали в файле, конкретный зритель, отображающий небольшую «миниатюру» или на маленьком экране, может быстро загрузить ровно столько изображения, чтобы отобразить его в доступные пиксели - поэтому один файл может поддерживать множество разрешений средства просмотра, вместо того, чтобы хранить или создавать разные файлы для каждого разрешения.
|journal=
( помощь )