Ускоренные надежные функции


В компьютерном зрении ускоренные надежные функции ( SURF ) — это запатентованный детектор локальных признаков и дескриптор. Его можно использовать для таких задач, как распознавание объектов , регистрация изображений , классификация или трехмерная реконструкция . Частично он вдохновлен дескриптором масштабно-инвариантного преобразования функций (SIFT). Стандартная версия SURF в несколько раз быстрее, чем SIFT, и, как утверждают ее авторы, более устойчива к различным преобразованиям изображений, чем SIFT.

Для обнаружения точек интереса SURF использует целочисленную аппроксимацию определителя гессианского детектора блоба , который можно вычислить с помощью 3 целочисленных операций с использованием предварительно вычисленного интегрального изображения . Его дескриптор функции основан на сумме отклика вейвлета Хаара вокруг интересующей точки. Их также можно вычислить с помощью интегрального изображения.

Дескрипторы SURF использовались для обнаружения и распознавания объектов, людей или лиц, для реконструкции трехмерных сцен, для отслеживания объектов и выделения точек интереса.

SURF был впервые опубликован Гербертом Бэем , Тинне Туйтелаарсом и Люком Ван Гулом и представлен на Европейской конференции по компьютерному зрению 2006 года . Применение алгоритма запатентовано в США. [1] «Прямая» версия SURF (называемая U-SURF) не инвариантна к вращению изображения и, следовательно, быстрее вычисляется и лучше подходит для приложений, в которых камера остается более или менее горизонтальной.

Изображение преобразуется в координаты с использованием метода пирамиды с несколькими разрешениями для копирования исходного изображения в форме пирамидальной гауссовой или лапласианской пирамиды для получения изображения того же размера, но с уменьшенной пропускной способностью. Это обеспечивает особый эффект размытия исходного изображения, называемый Scale-Space, и гарантирует, что точки интереса не зависят от масштаба.

Алгоритм SURF основан на тех же принципах и шагах, что и SIFT; но детали на каждом шаге разные. Алгоритм состоит из трех основных частей: обнаружение точки интереса, описание локальной окрестности и сопоставление.