Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Регистрация набора точек - это процесс выравнивания двух наборов точек. Здесь синяя рыба записывается на красную.

В компьютерном зрении , распознавании образов и робототехнике , точка множества регистрации , также известное как регистрации облака точек или соответствия сканирования , является процессом поиска пространственного преобразования ( например, масштабирование , вращение и перевод ) , который выравнивает два точечных облаков . Цель поиска такого преобразования включает объединение нескольких наборов данных в глобально согласованную модель (или систему координат) и сопоставление нового измерения с известным набором данных для идентификации функций или оценки его положения.. Необработанные данные облака точек 3D обычно получают с лидаров и камер RGB-D . Трехмерные облака точек также могут быть сгенерированы с помощью алгоритмов компьютерного зрения, таких как триангуляция , настройка пучков и, в последнее время, оценка глубины монокулярного изображения с использованием глубокого обучения . Для регистрации набора двухмерных точек, используемой при обработке изображения и регистрации изображения на основе признаков , набор точек может представлять собой двухмерные пиксельные координаты, полученные путем выделения признаков из изображения, например обнаружения углов . Точка регистрации облако имеет широкое применение в автономных вождения , [1] оценка движения и трехмерная реконструкция , [2] обнаружение объекта и оценка позы , [3] [4] роботизированная манипуляция , [5] одновременная локализация и отображение (SLAM), [6] [7] сшивание панорамы , [8] виртуальная и дополненная реальность , [9] и медицинская визуализация . [10]

В качестве особого случая регистрация двух наборов точек, которые отличаются только трехмерным вращением ( т. Е. Отсутствуют масштабирование и перенос), называется проблемой Вахбы и также связана с проблемой ортогональных прокрастов .

Обзор проблемы [ править ]

Данные двух 3D-сканирований одной и той же среды необходимо согласовать с помощью регистрации набора точек.
Данные сверху, успешно зарегистрированные с использованием варианта итеративной ближайшей точки.

Проблема может быть резюмирована следующим образом: [11] Пусть будет два набора точек конечного размера в конечномерном реальном векторном пространстве , которые содержат и точки соответственно ( например, восстанавливает типичный случай, когда и являются трехмерными наборами точек). Проблема состоит в том, чтобы найти преобразование, которое должно быть применено к движущемуся набору «модельных» точек , чтобы разница (обычно определяемая в смысле точечного евклидова расстояния ) между статическим набором «сцен» была минимальной. Другими словами, отображение от к желательно, что дает наилучшее согласование между преобразованным набором «модель» и набором «сцена». Отображение может состоять из жесткого или нежесткого преобразования. Модель преобразования может быть записана в виде , с помощью которого преобразованный, зарегистрированный набор точек модели имеет вид:

Таким образом, результат алгоритма регистрации набора точек является оптимальным преобразованием , которое лучше всего согласовано с некоторым определенным понятием функции расстояния :

где используется для обозначения набора всех возможных преобразований, которые пытается найти оптимизация. Самый популярный выбор функции расстояния - это возведение в квадрат евклидова расстояния для каждой пары точек:

где обозначает вектор 2-норму , - соответствующая точка в множестве, которая достигает кратчайшего расстояния до данной точки в множестве . Минимизация такой функции при жесткой регистрации эквивалентна решению задачи наименьших квадратов . Когда соответствия ( т. Е. ) Задаются до оптимизации, например, с использованием методов сопоставления признаков, тогда для оптимизации необходимо только оценить преобразование. Этот тип регистрации называется регистрацией по переписке. . С другой стороны, если соответствия неизвестны, то требуется оптимизация, чтобы совместно определить соответствия и совместное преобразование. Этот тип регистрации называется одновременной позой и регистрацией по переписке .

Жесткая регистрация [ править ]

Для двух наборов точек жесткая регистрация дает жесткое преобразование, которое отображает один набор точек на другой. Жесткое преобразование определяется как преобразование, которое не изменяет расстояние между любыми двумя точками. Обычно такое преобразование состоит из сдвига и вращения . [12] В редких случаях набор точек также может быть зеркальным. В робототехнике и компьютерном зрении жесткая регистрация находит наибольшее применение.

Нежесткая регистрация [ править ]

Зарегистрированное облако точек от лидара, установленного на движущемся автомобиле.

Для двух наборов точек нежесткая регистрация дает нежесткое преобразование, которое отображает один набор точек на другой. Нежесткие преобразования включают аффинные преобразования, такие как масштабирование и отображение сдвига . Однако в контексте регистрации набора точек нежесткая регистрация обычно включает нелинейное преобразование. Если собственные моды изменения набора точек известны, нелинейное преобразование может быть параметризовано собственными значениями. [13] Нелинейное преобразование также может быть параметризовано как шлиц тонкой пластины . [14] [13]

Алгоритмы [ править ]

Некоторые подходы к регистрации набора точек используют алгоритмы, которые решают более общую задачу сопоставления графов . [11] Однако вычислительная сложность таких методов, как правило, высока, и они ограничиваются жесткой регистрацией. Алгоритмы, специфичные для задачи регистрации набора точек, описаны в следующих разделах. PCL (точка Облако библиотека) представляет собой каркас с открытым исходным кодом для п-мерного облака точек и 3D обработки геометрии. Он включает в себя несколько алгоритмов регистрации точек. [15]

В этом разделе мы рассмотрим только алгоритмы жесткой регистрации, в которых предполагается, что преобразование содержит трехмерные повороты и перемещения (возможно, также включая равномерное масштабирование).

Методы, основанные на переписке [ править ]

Методы, основанные на соответствиях, предполагают, что предполагаемые соответствия даны для каждой точки . Таким образом, мы приходим к обстановке , где оба множества точек и имеют точки и соответствия приведены.

Регистрация без выбросов [ править ]

В простейшем случае можно предположить, что все соответствия верны, а это означает, что точки генерируются следующим образом:

где - коэффициент равномерного масштабирования (во многих случаях предполагается), - правильная матрица трехмерного вращения ( является специальной ортогональной группой степеней ), - вектор трехмерного переноса и моделирует неизвестный аддитивный шум ( например, гауссовский шум ). В частности, если предполагается , что шум следует изотропному гауссовскому распределению с нулевым средним и стандартным отклонением , т. Е. Можно показать, что следующая оптимизация дает оценку максимального правдоподобия для неизвестного масштаба, поворота и сдвига:

Обратите внимание: когда коэффициент масштабирования равен 1, а вектор сдвига равен нулю, оптимизация восстанавливает формулировку задачи Вахбы . Несмотря на невыпуклость оптимизации ( cb.2 ) из-за невыпуклости множества , основополагающая работа Бертольда К.П. Хорна показала, что ( cb.2 ) фактически допускает решение в замкнутой форме, путем разделения оценки масштаба, вращение и перевод. [16] Подобные результаты были обнаружены Arun et al . [17] Кроме того, чтобы найти уникальное преобразование , требуются как минимум неколлинеарные точки в каждом наборе точек.

Совсем недавно Бриалес и Гонсалес-Хименес разработали полуопределенную релаксацию с использованием лагранжевой двойственности для случая, когда набор моделей содержит различные трехмерные примитивы, такие как точки, линии и плоскости (что имеет место, когда модель представляет собой трехмерную сетку). [18] Интересно, что полуопределенная релаксация эмпирически точна , т. Е. Гарантированно глобально оптимальное решение может быть получено из решения полуопределенной релаксации.

Надежная регистрация [ править ]

Наименьших квадратов препарат ( cb.2 ) , как известно для выполнения сколь угодно плохо в присутствии выбросов . Соответствие выброса - это пара измерений, которая отклоняется от генеративной модели ( cb.1 ). В этом случае можно рассмотреть другую генеративную модель следующим образом: [19]

где, если th пара является промежуточной, то она подчиняется модели без выбросов ( cb.1 ), т. е. получается из пространственного преобразования плюс некоторый небольшой шум; однако, если th пара является выбросом, то это может быть любой произвольный вектор . Поскольку заранее неизвестно, какие соответствия являются выбросами, надежная регистрация в генеративной модели ( cb.3 ) имеет первостепенное значение для компьютерного зрения и робототехники, применяемых в реальном мире, поскольку современные методы сопоставления признаков имеют тенденцию выводить сильно искаженные соответствия, где больше соответствий могут быть выбросами. [20]

Далее мы опишем несколько общих парадигм надежной регистрации.

Максимальный консенсус [ править ]

Максимальный консенсус стремится найти наибольший набор соответствий, которые согласуются с генеративной моделью ( cb.1 ) для некоторого выбора пространственного преобразования . Формально, максимальный консенсус решает следующую оптимизацию:

где обозначает мощность множества . Ограничение в ( cb.4 ) требует, чтобы каждая пара измерений в наборе вставки имела остатки меньше заранее определенного порога . К сожалению, недавний анализ показал, что глобальное решение проблемы (cb.4) является NP- трудным , и глобальные алгоритмы обычно должны прибегать к методам ветвей и границ (BnB), которые в худшем случае принимают экспоненциально-временную сложность. [21] [22] [23] [24] [25]

Хотя точное решение максимизации консенсуса сложно, существуют эффективные эвристики, которые довольно хорошо работают на практике. Одна из самых популярных эвристик - это схема согласования случайной выборки (RANSAC) . [26] RANSAC - это итеративный метод гипотезы и проверки. На каждой итерации метод сначала случайным образом выбирает 3 из общего числа соответствий и вычисляет гипотезу, используя метод Хорна [16], затем метод оценивает ограничения в ( cb.4 ), чтобы подсчитать, сколько соответствий фактически согласуются с таким гипотезы (т. е. вычисляет остаток и сравнивает его с порогомдля каждой пары измерений). Алгоритм завершается либо после того, как он найдет консенсусный набор, имеющий достаточно соответствий, либо после того, как он достигнет общего числа разрешенных итераций. RANSAC очень эффективен, поскольку основное вычисление каждой итерации - выполнение решения в замкнутой форме в методе Хорна. Однако RANSAC не является детерминированным и хорошо работает только в режиме с низким коэффициентом выбросов ( например, ниже ), потому что его время выполнения растет экспоненциально по отношению к коэффициенту выбросов. [20]

Чтобы заполнить пробел между быстрой, но неточной схемой RANSAC и точной, но исчерпывающей оптимизацией BnB, недавние исследования разработали детерминированные приближенные методы для решения максимизации консенсуса. [21] [22] [27] [23]

Удаление выбросов [ править ]

Методы удаления выбросов стремятся предварительно обработать набор сильно искаженных соответствий перед оценкой пространственного преобразования. Мотивация удаления выбросов состоит в том, чтобы значительно сократить количество соответствий выбросов при сохранении соответствий между ними, чтобы оптимизация преобразования стала проще и эффективнее ( например, RANSAC плохо работает, когда коэффициент выбросов выше, но работает достаточно хорошо, когда коэффициент выбросов ниже ).

Parra et al. предложили метод под названием "Гарантированное удаление выбросов" (GORE), в котором используются геометрические ограничения для сокращения выбросов выбросов при одновременном сохранении исходных соответствий. [20] Было показано, что GORE может резко снизить коэффициент выбросов, что может значительно повысить производительность максимизации консенсуса с использованием RANSAC или BnB. Янг и Карлоне предложили построить парные измерения, инвариантные к сдвигу и вращению (TRIM) из исходного набора измерений, и встроить TRIM в качестве ребер графа , узлы которого являются трехмерными точками. Поскольку инлисты попарно согласованы по масштабу, они должны образовывать клику внутри графа. Следовательно, используя эффективные алгоритмы вычислениямаксимальная клика графа может находить выбросы и эффективно удалять выбросы. [4] Метод удаления выбросов на основе максимальной клики также оказался весьма полезным в реальных задачах регистрации набора точек. [19] Подобные идеи удаления выбросов были также предложены Парра и др. . [28]

М-оценка [ править ]

M-оценка заменяет целевую функцию наименьших квадратов в ( cb.2 ) устойчивой функцией стоимости, которая менее чувствительна к выбросам. Формально М-оценка направлена ​​на решение следующей задачи:

где представляет собой выбор робастной функции стоимости. Обратите внимание, что выбор восстанавливает оценку наименьших квадратов в ( cb.2 ). Популярные функции включают в себя стоимость надежные -норме потери, потери Huber , [29] Geman-McClure потери [30] и усеченный потери наименьших квадратов . [19] [8] [4] М-оценка была одной из самых популярных парадигм надежной оценки в робототехнике и компьютерном зрении. [31] [32] Поскольку робастные целевые функции обычно невыпуклые ( например,усеченные потери по методу наименьших квадратов против потерь по методу наименьших квадратов), алгоритмы решения невыпуклой M-оценки обычно основаны на локальной оптимизации , где сначала предоставляется начальное предположение, а затем итерационные уточнения преобразования для дальнейшего уменьшения целевой функции . Локальная оптимизация имеет тенденцию работать хорошо, когда первоначальное предположение близко к глобальному минимуму, но она также может застрять в локальных минимумах, если обеспечивается плохая инициализация.

Градуированная невыпуклость [ править ]

Градуированная невыпуклость (GNC) - это универсальная среда для решения невыпуклых задач оптимизации без инициализации. Он добился успеха в приложениях для раннего видения и машинного обучения. [33] [34] Ключевая идея GNC - решить сложную невыпуклую задачу, начав с простой выпуклой задачи. В частности, для данной устойчивой функции стоимости можно построить суррогатную функцию с гиперпараметром , настройка которого может постепенно увеличивать невыпуклость суррогатной функции до тех пор, пока она не сходится к целевой функции . [34] [35] Следовательно, на каждом уровне гиперпараметра решается следующая оптимизация:

Блэк и Рангараджан доказали, что целевая функция каждой оптимизации ( cb.6 ) может быть дуализирована в сумму взвешенных наименьших квадратов и так называемую функцию процесса выброса на весах, которые определяют достоверность оптимизации в каждой паре измерений. [33] Используя двойственность Блэка-Рангараджана и GNC, адаптированную для функции Гемана-МакКлюра, Чжоу и др. разработал алгоритм быстрой глобальной регистрации, устойчивый к выбросам в корреспонденции. [30] Совсем недавно Ян и др.показали, что совместное использование GNC (адаптированной к функции Джемана-МакКлюра и усеченной функции наименьших квадратов) и двойственности Блэка-Рангараджана может привести к универсальному решателю для надежных проблем регистрации, включая облака точек и регистрацию сетки. [35]

Гарантированно надежная регистрация [ править ]

Практически ни один из упомянутых выше надежных алгоритмов регистрации (за исключением алгоритма BnB, который в худшем случае работает в экспоненциальном режиме) не имеет гарантий производительности , что означает, что эти алгоритмы могут возвращать совершенно неверные оценки без уведомления. Следовательно, эти алгоритмы нежелательны для критически важных для безопасности приложений, таких как автономное вождение.

Совсем недавно Ян и др. разработал первый сертифицированный надежный алгоритм регистрации, названный оценкой усеченных наименьших квадратов и полуопределенной релаксацией (TEASER). [19] Для регистрации облака точек TEASER не только выводит оценку преобразования, но также количественно определяет оптимальность данной оценки. TEASER использует следующую оценку методом усеченных наименьших квадратов (TLS):

которое получается путем выбора надежной функции стоимости TLS , где - предварительно определенная константа, определяющая максимально допустимые остатки, которые следует рассматривать как выбросы. Целевая функция TLS обладает тем свойством, что для промежуточных соответствий ( ) применяется обычный штраф по методу наименьших квадратов; в то время как для соответствий с выбросами ( ) штраф не применяется, а выбросы отбрасываются. Если оптимизация TLS ( cb.7 ) решается до глобальной оптимальности, то это эквивалентно запуску метода Хорна только для внутренних соответствий.

Однако решение ( cb.7 ) довольно сложно из-за его комбинаторной природы. TEASER решает ( cb.7 ) следующим образом: (i) Он строит инвариантные измерения, так что оценка масштаба, поворота и перемещения может быть отделена и решена отдельно, стратегия, вдохновленная оригинальным методом Хорна; (ii) Одна и та же оценка TLS применяется для каждой из трех подзадач, где задача TLS масштаба может быть решена точно с использованием алгоритма, называемого адаптивным голосованием, задача TLS поворота может быть упрощена до полуопределенной программы (SDP), где релаксация точно на практике, [8]даже при большом количестве выбросов; Проблема трансляции TLS может быть решена с помощью покомпонентного адаптивного голосования. Быстрое внедрение используя GNC является открытым исходным кодом здесь . На практике TEASER допускает больше, чем выбросы соответствий, и выполняется за миллисекунды.

Помимо разработки TEASER, Ян и др. также доказать, что при некоторых мягких условиях для данных облака точек расчетное преобразование TEASER имеет ограниченные ошибки из преобразования наземной истины. [19]

Одновременные позы и методы корреспонденции [ править ]

Итеративная ближайшая точка [ править ]

Итеративным ближайшая точка алгоритма (ПМС) был введен BESL и Маккей. [36] Алгоритм выполняет жесткую регистрация в итерационных модах переменных в (I) с учетом преобразования, нахождением ближайшей точки в течение каждой точки ; и (ii) с учетом соответствий, нахождение наилучшего жесткого преобразования путем решения задачи наименьших квадратов ( cb.2 ). Таким образом, он работает лучше всего, если исходная поза достаточно близка к . В псевдокоде основной алгоритм реализован следующим образом:

алгоритм  ICP ( )  пока не зарегистрирован: X  : = ∅ для : θ  : = наименьших квадратов ( X ) вернуть θ       

Здесь функция least_squaresвыполняет оптимизацию методом наименьших квадратов, чтобы минимизировать расстояние в каждой из пар, используя решения в замкнутой форме Хорна [16] и Аруна. [17]

Поскольку функция стоимости регистрации зависит от нахождения ближайшей точки к каждой точке , она может меняться по мере выполнения алгоритма. Таким образом, трудно доказать, что ICP действительно сходится точно к локальному оптимуму. [37] Фактически, эмпирически ICP и EM-ICP не сходятся к локальному минимуму функции стоимости. [37] Тем не менее, поскольку ICP интуитивно понятен и прост в реализации, он остается наиболее часто используемым алгоритмом регистрации набора точек. [37] Было предложено множество вариантов ICP, влияющих на все фазы алгоритма от выбора и сопоставления точек до стратегии минимизации. [13] [38]Например, алгоритм максимизации ожидания применяется к алгоритму ICP для формирования метода EM-ICP, а алгоритм Левенберга-Марквардта применяется к алгоритму ICP для формирования метода LM-ICP . [12]

Надежное сопоставление точек [ править ]

Робастное согласование точек (RPM) было введено Gold et al. [39] Метод выполняет регистрацию с использованием детерминированного отжига и мягкого присвоения соответствий между наборами точек. В то время как в ICP соответствие, генерируемое эвристикой ближайшего соседа, является двоичным, RPM использует мягкое соответствие, где соответствие между любыми двумя точками может быть от 0 до 1, хотя в конечном итоге оно сходится либо к 0, либо к 1. Соответствия, найденные в RPM всегда взаимно однозначно, что не всегда происходит в случае ICP. [14] Позвольте быть й точкой в и быть й точкой в . Матрица матча определяется как , например:

Затем проблема определяется следующим образом: даны два набора точек и найдите аффинное преобразование и матрицу соответствия, которая наилучшим образом связывает их. [39] Знание оптимального преобразования упрощает определение матрицы соответствия, и наоборот. Однако алгоритм RPM определяет и то, и другое одновременно. Преобразование можно разложить на вектор перевода и матрицу преобразования:

Матрица в 2D состоит из четырех отдельных параметров , которые представляют собой масштаб, поворот и компоненты вертикального и горизонтального сдвига соответственно. Тогда функция стоимости будет следующей:

при условии , , . Этот термин смещает цель в сторону более сильной корреляции, уменьшая стоимость, если в матрице соответствия больше единиц. Функция служит для регуляризации аффинного преобразования за счет штрафов за большие значения компонентов масштаба и сдвига:

для некоторого параметра регуляризации .

Метод RPM оптимизирует функцию стоимости с помощью алгоритма Softassign . Здесь будет выведен одномерный случай. Учитывая набор переменных, где . Переменная связана с каждым таким, что . Цель состоит в том , чтобы найти то, что максимизирует . Это можно сформулировать как непрерывную задачу, введя управляющий параметр . В детерминированном методе отжига управляющий параметр медленно увеличивается по мере выполнения алгоритма. Пусть будет:

это известно как функция softmax . По мере увеличения оно приближается к двоичному значению, как требуется в уравнении (об / мин.1 ). Теперь проблема может быть обобщена на 2D-случай, где вместо максимизации максимизируется следующее:

куда

Это просто, за исключением того, что теперь ограничения являются двустохастическими матричными ограничениями: и . Таким образом, знаменатель из уравнения (об / мин.3 ) не может быть просто выражен для двумерного случая. Чтобы удовлетворить ограничениям, можно использовать результат Синкхорна [39], который утверждает, что дважды стохастическая матрица получается из любой квадратной матрицы со всеми положительными элементами посредством итерационного процесса чередующихся нормализаций строк и столбцов. Таким образом, алгоритм записывается так: [39]

алгоритм RPM2D  t  : = 0  while : пока μ не сошлось :  // обновить параметры соответствия с помощью softassign // применить метод Sinkhorn, пока не сошлось : // обновить путем нормализации по всем строкам: // обновить путем нормализации по всем столбцам: / / обновить параметры позы путем спуска по координатам; обновить θ с помощью аналитического решения.                 обновить t с помощью аналитического решения обновить a, b, c, используя метод Ньютона, вернуть a, b, c, θ и t   

где детерминированный параметр управления отжигом изначально установлен и увеличивается в раз, пока не достигнет максимального значения . Суммирования на этапах нормализации суммируют, а не просто, и потому, что ограничения на них являются неравенствами. Таким образом, элементы th и th являются резервными переменными .

Алгоритм также может быть расширен для наборов точек в 3D или более высоких измерениях. Ограничения на матрицу соответствия в случае 3D такие же, как и в случае 2D. Следовательно, структура алгоритма остается неизменной, с основным отличием в том, как решаются матрицы вращения и перемещения. [39]

Устойчивое согласование точек тонких шлицевых пластин [ править ]
Анимация нежесткой двухмерной регистрации зеленой точки, установленной на пурпурной, искажена из-за шумных выбросов. Размер синих кружков обратно пропорционален параметру управления . Желтые линии обозначают соответствие.

Алгоритм согласования точек на тонкой пластине (TPS-RPM), разработанный Чуи и Рангараджаном, дополняет метод RPM для выполнения нежесткой регистрации путем параметризации преобразования как тонкой пластины . [14] Однако, поскольку параметризация тонких пластин сплайнами существует только в трех измерениях, метод не может быть расширен для задач, включающих четыре или более измерений.

Корреляция ядра [ править ]

Подход на основе ядерной корреляции (KC) для регистрации набора точек был введен Цином и Канаде. [37] По сравнению с ICP алгоритм KC более устойчив к зашумленным данным. В отличие от ICP, где для каждой точки модели учитывается только ближайшая точка сцены, здесь каждая точка сцены влияет на каждую точку модели. [37] Таким образом, это многосвязный алгоритм регистрации. Для некоторой ядерной функции ядерная корреляция двух точек определяется следующим образом: [37]

Функция ядра, выбранная для регистрации набора точек, обычно является симметричным и неотрицательным ядром, аналогичным тем, которые используются при оценке плотности окна Парзена. Gaussian ядро обычно используется для его простоты, хотя и другие из них , как ядро Епанечникова и ядро tricube может быть заменен. [37] Ядровая корреляция всего набора точек определяется как сумма ядерных корреляций каждой точки в наборе с каждой другой точкой в ​​наборе: [37]

Логарифм KC набора точек пропорционален с точностью до постоянного множителя информационной энтропии . Обратите внимание, что KC является мерой «компактности» набора точек - тривиально, если бы все точки в наборе точек находились в одном и том же месте, KC оценил бы большое значение. Функция стоимости алгоритма регистрации набора точек для некоторого параметра преобразования определяется следующим образом:

Некоторые алгебраические манипуляции дают:

Выражение упрощается за счет наблюдения, которое не зависит от . Более того, предполагая жесткую регистрацию, инвариантно при изменении, потому что евклидово расстояние между каждой парой точек остается неизменным при жестком преобразовании . Таким образом, приведенное выше уравнение можно переписать как:

В оценках плотности ядра определяется следующим образом:

Затем можно показать, что функция стоимости является корреляцией двух оценок плотности ядра:

Установив функцию стоимости , алгоритм просто использует градиентный спуск, чтобы найти оптимальное преобразование. Вычисление функции стоимости с нуля на каждой итерации требует больших затрат вычислительных ресурсов , поэтому используется дискретная версия уравнения функции стоимости ( kc.6 ). Оценки плотности ядра можно оценивать в точках сетки и сохранять в справочной таблице . В отличие от ICP и связанных с ним методов, нет необходимости находить ближайшего соседа, что позволяет алгоритму KC быть сравнительно простым в реализации.

По сравнению с ICP и EM-ICP для зашумленных наборов точек 2D и 3D, алгоритм KC менее чувствителен к шуму и чаще приводит к правильной регистрации. [37]

Модель гауссовой смеси [ править ]

Оценки плотности ядра представляют собой суммы гауссианов и поэтому могут быть представлены как модели гауссовой смеси (GMM). [40] Цзянь и Вемури используют GMM-версию алгоритма регистрации KC для выполнения нежесткой регистрации, параметризованной с помощью шлицевых тонких пластин .

Когерентный дрейф точки [ править ]

Жесткая (с добавлением масштабирования) регистрация синей точки, установленной на красную точку, установленную с помощью алгоритма когерентного дрейфа точки. Оба набора точек были повреждены удаленными точками и случайными ложными выбросами.
Аффинная регистрация синей точки, установленной для красной точки, с использованием алгоритма когерентного дрейфа точки.
Нежесткая регистрация синей точки, установленной для красной точки, с использованием алгоритма когерентного дрейфа точки. Оба набора точек были повреждены удаленными точками и случайными ложными выбросами.

Когерентный дрейф точки (CPD) был введен Мироненко и Сонг. [13] [41] Алгоритм использует вероятностный подход к выравниванию наборов точек, аналогичный методу GMM KC. В отличие от более ранних подходов к нежесткой регистрации, которые предполагали модель преобразования шлицевых тонких пластин , CPD не зависит от используемой модели преобразования. Набор точек представляет собой центроиды модели смеси Гаусса (GMM). Когда два набора точек оптимально выровнены, соответствие является максимумом апостериорной вероятности GMM для данной точки данных. Чтобы сохранить топологическую структуру наборов точек, центроиды GMM вынуждены двигаться когерентно как группа. Ожидания максимизацияалгоритм используется для оптимизации функции стоимости. [13]

Пусть имеется M точек в и N точек в . Функция плотности вероятности GMM для точки s :

где в размерности D - распределение Гаусса с центром в точке .

Вероятности членства одинаковы для всех компонентов GMM. Вес равномерного распределения обозначается как . Тогда модель смеси выглядит так:

Центроиды GMM повторно параметризованы набором параметров, оцениваемых путем максимизации правдоподобия. Это эквивалентно минимизации функции отрицательного логарифма правдоподобия :

где предполагается, что данные независимы и одинаково распределены . Вероятность соответствия между двумя точками и определяется как апостериорная вероятность центроида GMM для данной точки данных:

Ожидания максимизации алгоритм (ЭМ) используется для поиска и . Алгоритм EM состоит из двух шагов. Сначала на этапе E или этапе оценки он угадывает значения параметров («старые» значения параметров), а затем использует теорему Байеса для вычисления апостериорных распределений вероятностей компонентов смеси. Во-вторых, на этапе M или этапе максимизации «новые» значения параметров затем находятся путем минимизации математического ожидания полной отрицательной функции логарифмического правдоподобия, то есть функции стоимости:

Игнорируя константы, не зависящие от и , уравнение ( cpd.4 ) можно выразить так:

куда

с только если . Апостериорные вероятности компонентов GMM, вычисленные с использованием предыдущих значений параметров :

Минимизация функции стоимости в уравнении ( cpd.5 ) обязательно уменьшает отрицательную функцию логарифмического правдоподобия E в уравнении ( cpd.3 ), если она уже не находится на локальном минимуме. [13] Таким образом, алгоритм может быть выражен с помощью следующего псевдокода, где множество точек , и представлены в виде и матриц и соответственно: [13]

алгоритм CPD  инициализируется, пока не зарегистрирован:  // E-шаг, вычисление P для и : // M-шаг, решение для оптимального возврата преобразования θ          

где вектор - это вектор-столбец из единиц. Функция зависит от типа выполненной регистрации. Например, при жесткой регистрации выходными данными являются масштаб a , матрица вращения и вектор перемещения . Параметр можно записать в виде кортежа:solve

который инициализируется единицей , единичной матрицей и вектор-столбцом нулей:

Набор выровненных точек:

Тогда solve_rigidфункция жесткой регистрации может быть записана следующим образом, с выводом алгебры, объясненным в статье Мироненко 2010 года. [13]

Solve_rigid  // разложение по сингулярным значениям // diag (ξ) - это диагональная матрица, сформированная из вектора ξ // tr - это след матрицы return                    

Для аффинной регистрации, где цель состоит в том, чтобы найти аффинное преобразование вместо жесткого, на выходе получается матрица аффинного преобразования и перевод , так что набор выровненных точек равен:

Тогда solve_affineфункция жесткой регистрации может быть записана следующим образом, с выводом алгебры, объясненным в статье Мироненко 2010 года. [13]

решить_affine  return         

Также можно использовать CPD с нежесткой регистрацией, используя параметризацию, полученную с использованием вариационного исчисления . [13]

Суммы гауссовых распределений могут быть вычислены за линейное время с помощью быстрого преобразования Гаусса (FGT). [13] Следовательно, временная сложность CPD составляет , что асимптотически намного быстрее, чем у методов. [13]

Сортировка пространства корреспонденции (SCS) [ править ]

Этот алгоритм был представлен в 2013 году Х. Ассалихом для регистрации изображений сонара. [42] Эти типы изображений, как правило, содержат большое количество шума, поэтому ожидается, что в наборах точек будет много выбросов. SCS обеспечивает высокую устойчивость к выбросам и может превосходить показатели ICP и CPD при наличии выбросов. SCS не использует итеративную оптимизацию в многомерном пространстве и не является ни вероятностным, ни спектральным. SCS может согласовывать жесткие и нежесткие преобразования и лучше всего работает, когда целевое преобразование находится между тремя и шестью степенями свободы .

Байесовский когерентный дрейф точки (BCPD) [ править ]

Вариант когерентного дрейфа точки, называемый байесовским когерентным дрейфом точки (BCPD), был получен с помощью байесовской формулировки регистрации набора точек.[43] BCPD имеет несколько преимуществ по сравнению с CPD, например (1) нежесткая и жесткая регистрация может выполняться в одном алгоритме, (2) алгоритм может быть ускорен независимо от гауссовости матрицы Грама для определения согласованности движения, (3 ) алгоритм более устойчив к выбросам из-за более разумного определения распределения выбросов. Кроме того, в байесовской формулировке согласованность движения вводилась через предварительное распределение векторов смещения, обеспечивая четкую разницу между параметрами настройки, которые управляют согласованностью движения.

См. Также [ править ]

  • Сопоставление точечных объектов

Ссылки [ править ]

  1. ^ Чжан, Цзи; Сингх, Санджив (май 2015 г.). «Визуально-лидарная одометрия и картографирование: низкий дрейф, надежность и скорость». Международная конференция IEEE по робототехнике и автоматизации, 2015 г. (ICRA) : 2174–2181. DOI : 10.1109 / ICRA.2015.7139486 , ISBN 978-1-4799-6923-4. S2CID  6054487 .
  2. ^ Choi, Sungjoon; Чжоу, Цянь-И; Колтун, Владлен (2015). «Надежная реконструкция внутренних сцен» (PDF) . Труды конференции IEEE по компьютерному зрению и распознаванию образов (CVPR) : 5556–5565.
  3. ^ Лай, Кевин; Бо, Лифэн; Рен, Сяофэн; Фокс, Дитер (май 2011 г.). «Крупномасштабный иерархический набор данных объекта RGB-D с несколькими представлениями». 2011 Международная конференция IEEE по робототехнике и автоматизации : 1817–1824 гг. CiteSeerX 10.1.1.190.1598 . DOI : 10.1109 / ICRA.2011.5980382 . ISBN  978-1-61284-386-5. S2CID  14986048 .
  4. ^ a b c Ян, Хэн; Карлоне, Лука (2019). «Решение с полиномиальным временем для надежной регистрации с экстремальными выбросами». Робототехника: наука и системы . arXiv : 1903.08588 . DOI : 10,15607 / RSS.2019.XV.003 . ISBN 978-0-9923747-5-4. S2CID  84186750 .
  5. ^ Калли, Берк; Сингх, Арджун; Брюс, Джеймс; Уолсман, Аарон; Конолиге, Курт; Шриниваса, Сиддхартха; Аббель, Питер; Доллар, Аарон М (2017-03-01). «Набор данных Yale-CMU-Berkeley для исследования манипуляций с роботами». Международный журнал исследований робототехники . 36 (3): 261–268. DOI : 10.1177 / 0278364917700714 . ISSN 0278-3649 . S2CID 6522002 .  
  6. ^ Кадена, Сезар; Карлоне, Лука; Каррильо, Генри; Латиф, Ясир; Скарамуцца, Давиде; Нейра, Хосе; Рид, Ян; Леонард, Джон Дж. (Декабрь 2016 г.). «Прошлое, настоящее и будущее одновременной локализации и картирования: к эпохе устойчивого восприятия». IEEE Transactions по робототехнике . 32 (6): 1309–1332. arXiv : 1606.05830 . Bibcode : 2016arXiv160605830C . DOI : 10.1109 / TRO.2016.2624754 . ISSN 1941-0468 . S2CID 2596787 .  
  7. Мур-Арталь, Рауль; Montiel, JMM; Тардос, Хуан Д. (октябрь 2015 г.). «ORB-SLAM: универсальная и точная монокулярная система SLAM». IEEE Transactions по робототехнике . 31 (5): 1147–1163. arXiv : 1502.00956 . Bibcode : 2015arXiv150200956M . DOI : 10.1109 / TRO.2015.2463671 . ISSN 1941-0468 . S2CID 206775100 .  
  8. ^ a b c Ян, Хэн; Карлоне, Лука (2019). «Кватернионное гарантированно оптимальное решение проблемы Вахба с выбросами» (PDF) . Труды Международной конференции IEEE по компьютерному зрению (ICCV) : 1665–1674. arXiv : 1905.12536 . Bibcode : 2019arXiv190512536Y .
  9. ^ Ньюкомб, Ричард А .; Изади, Шахрам; Хиллигес, Отмар; Молино, Дэвид; Ким, Дэвид; Дэвисон, Эндрю Дж .; Кохи, Пушмит; Шоттон, Джейми; Ходжес, Стив; Фитцгиббон, Эндрю (октябрь 2011 г.). «KinectFusion: картографирование и отслеживание плотной поверхности в реальном времени». 2011 10-й Международный симпозиум IEEE по смешанной и дополненной реальности : 127–136. CiteSeerX 10.1.1.453.53 . DOI : 10.1109 / ISMAR.2011.6092378 . ISBN  978-1-4577-2183-0. S2CID  11830123 .
  10. ^ Audette, Мишель A .; Ферри, Фрэнк П .; Питерс, Терри М. (01.09.2000). «Алгоритмический обзор методов регистрации поверхности для медицинской визуализации». Анализ медицинских изображений . 4 (3): 201–217. DOI : 10.1016 / S1361-8415 (00) 00014-1 . ISSN 1361-8415 . PMID 11145309 .  
  11. ^ а б Цзянь, Бинг; Вемури, Баба С. (2011). «Надежная регистрация множества точек с использованием моделей гауссовой смеси». IEEE Transactions по анализу шаблонов и машинному анализу . 33 (8): 1633–1645. DOI : 10.1109 / tpami.2010.223 . PMID 21173443 . S2CID 10923565 .  
  12. ^ a b Фитцгиббон, Эндрю В. (2003). «Надежная регистрация наборов точек 2D и 3D». Вычисления изображений и зрения . 21 (13): 1145–1153. CiteSeerX 10.1.1.335.116 . DOI : 10.1016 / j.imavis.2003.09.004 . 
  13. ^ a b c d e f g h i j k l Мироненко Андрей; Песня, Сюбо (2010). «Регистрация набора точек: когерентный дрейф точки». IEEE Transactions по анализу шаблонов и машинному анализу . 32 (2): 2262–2275. arXiv : 0905.2635 . DOI : 10.1109 / tpami.2010.46 . PMID 20975122 . S2CID 10809031 .  
  14. ^ a b c Чуй, Хайли; Рангараджан, Ананд (2003). «Новый алгоритм сопоставления точек для нежесткой регистрации». Компьютерное зрение и понимание изображений . 89 (2): 114–141. CiteSeerX 10.1.1.7.4365 . DOI : 10.1016 / S1077-3142 (03) 00009-2 . 
  15. ^ Хольц, Дирк; Ichim, Alexandru E .; Томбари, Федерико; Русу, Раду Б .; Бенке, Свен (2015). «Регистрация в библиотеке облака точек: модульная структура для трехмерного выравнивания» . Журнал IEEE Robotics Automation . 22 (4): 110–124. DOI : 10.1109 / MRA.2015.2432331 . S2CID 2621807 . 
  16. ^ a b c Хорн, Бертольд КП (1987-04-01). «Замкнутое решение абсолютной ориентации с использованием единичных кватернионов». JOSA . 4 (4): 629–642. Bibcode : 1987JOSAA ... 4..629H . DOI : 10.1364 / JOSAA.4.000629 . ISSN 1520-8532 . 
  17. ^ а б Арун, KS; Хуанг, Т.С.; Blostein, SD (сентябрь 1987 г.). «Аппроксимация методом наименьших квадратов двух наборов трехмерных точек». IEEE Transactions по анализу шаблонов и машинному анализу . ПАМИ-9 (5): 698–700. DOI : 10.1109 / TPAMI.1987.4767965 . ISSN 1939-3539 . PMID 21869429 . S2CID 8724100 .   
  18. ^ Бриалес, Иисус; Гонсалес-Хименес, Хавьер (июль 2017 г.). «Выпуклая глобальная трехмерная регистрация с лагранжевой двойственностью». Конференция IEEE 2017 года по компьютерному зрению и распознаванию образов (CVPR) : 5612–5621. DOI : 10.1109 / CVPR.2017.595 . ЛВП : 10630/14599 . ISBN 978-1-5386-0457-1. S2CID  11549421 .
  19. ^ a b c d e Ян, Хэн; Ши, Цзиннань; Карлоне, Лука (21 января 2020 г.). «TEASER: быстрая и сертифицированная регистрация облака точек». arXiv : 2001.07715 [ cs.RO ].
  20. ^ a b c Парра Бустос, Альваро; Чин, Тат-Джун (декабрь 2018 г.). «Гарантированное удаление выбросов для регистрации облака точек с корреспонденциями». IEEE Transactions по анализу шаблонов и машинному анализу . 40 (12): 2868–2882. arXiv : 1711.10209 . DOI : 10.1109 / TPAMI.2017.2773482 . ISSN 1939-3539 . PMID 29990122 . S2CID 3331003 .   
  21. ^ а б Чин, Тат-Джун; Сутер, Дэвид (27.02.2017). «Проблема максимального консенсуса: последние достижения в области алгоритмов». Синтез лекций по компьютерному зрению . 7 (2): 1–194. DOI : 10.2200 / s00757ed1v01y201702cov011 . ISSN 2153-1056 . 
  22. ^ а б Вэнь, Фэй; Инь, Рендун; Гонг, Чжэн; Лю, Пэйлинь (февраль 2020 г.). «Эффективные алгоритмы для максимального согласования робастного соответствия». IEEE Transactions по робототехнике . 36 (1): 92–106. DOI : 10.1109 / TRO.2019.2943061 . ISSN 1941-0468 . S2CID 209976632 .  
  23. ^ а б Цай, Чжипэн; Чин, Тат-Джун; Колтун, Владлен (2019). «Возвращение к поиску дерева максимизации консенсуса» . Труды Международной конференции IEEE по компьютерному зрению (ICCV) : 1637–1645. arXiv : 1908.02021 . Bibcode : 2019arXiv190802021C .
  24. ^ Базен, Жан-Шарль; Со, Ёндук; Поллефейс, Марк (2013). Ли, Кён Му; Мацусита, Ясуюки; Rehg, Джеймс М .; Ху, Чжаньи (ред.). «Оптимизация глобального консенсусного набора путем поиска вращения». Компьютерное зрение - ACCV 2012 . Конспект лекций по информатике. Берлин, Гейдельберг: Springer. 7725 : 539–551. DOI : 10.1007 / 978-3-642-37444-9_42 . ISBN 978-3-642-37444-9.
  25. ^ Хартли, Ричард I .; Каль, Фредрик (1 апреля 2009 г.). «Глобальная оптимизация через поиск пространства вращения». Международный журнал компьютерного зрения . 82 (1): 64–79. DOI : 10.1007 / s11263-008-0186-9 . ЛВП : 1885/50831 . ISSN 1573-1405 . S2CID 509788 .  
  26. ^ Фишлер, Мартин; Боллес, Роберт (1981). «Консенсус случайной выборки: парадигма для подгонки модели с приложениями для анализа изображений и автоматизированной картографии». Коммуникации ACM . 24 (6): 381–395. DOI : 10.1145 / 358669.358692 . S2CID 972888 . 
  27. Ле, Ху Минь; Чин, Тат-Джун; Эрикссон, Андерс; До, Тхань-Тоан; Сутер, Дэвид (2019). «Детерминированные приближенные методы для максимального согласования робастного соответствия». IEEE Transactions по анализу шаблонов и машинному анализу . 43 (3): 842–857. arXiv : 1710.10003 . DOI : 10.1109 / TPAMI.2019.2939307 . ISSN 1939-3539 . PMID 31494545 . S2CID 29346470 .   
  28. ^ Бустос, Альваро Парра; Чин, Тат-Джун; Нойман, Франк; Фридрих, Тобиас; Кацманн, Максимилиан (04.02.2019). «Практический алгоритм максимальной клики для сопоставления с попарными ограничениями». arXiv : 1902.01534 [ cs.CV ].
  29. ^ Хубер, Питер Дж .; Ронкетти, Эльвезио М. (29 января 2009 г.). Надежная статистика . Серия Уайли по вероятности и статистике. Хобокен, Нью-Джерси, США: John Wiley & Sons, Inc. DOI : 10.1002 / 9780470434697 . ISBN 978-0-470-43469-7.
  30. ^ а б Чжоу, Цянь-И; Park, Jaesik; Колтун, Владлен (2016). Лейбе, Бастиан; Матас, Иржи; Себе, Нику; Веллинг, Макс (ред.). «Быстрая глобальная регистрация». Компьютерное зрение - ECCV 2016 . Конспект лекций по информатике. Чам: Издательство Springer International. 9906 : 766–782. DOI : 10.1007 / 978-3-319-46475-6_47 . ISBN 978-3-319-46475-6.
  31. ^ MacTavish, Кирк; Барфут, Тимоти Д. (2015). «Любой ценой: сравнение надежных функций затрат для выбросов камеры». 2015 12-я конференция по компьютерному зрению и зрению роботов : 62–69. DOI : 10.1109 / CRV.2015.52 . ISBN 978-1-4799-1986-4. S2CID  9305263 .
  32. ^ Боссе, Майкл; Агаменнони, Габриэль; Гилищенский, Игорь (2016). «Робастная оценка и приложения в робототехнике» . Основы и тенденции в робототехнике . сейчас же. 4 (4): 225–269. DOI : 10.1561 / 2300000047 .
  33. ^ a b Блэк, Майкл Дж .; Рангараджан, Ананд (1 июля 1996 г.). «Об объединении линейных процессов, отклонении выбросов и надежной статистике с приложениями в раннем видении». Международный журнал компьютерного зрения . 19 (1): 57–91. DOI : 10.1007 / BF00131148 . ISSN 1573-1405 . S2CID 7510079 .  
  34. ^ a b Блейк, Эндрю; Зиссерман, Андрей (1987). Визуальная реконструкция . MIT Press. ISBN 9780262524063.
  35. ^ а б Ян, Хэн; Антонанте, Паскуале; Тзумас, Василиос; Карлоне, Лука (2020). «Градуированная невыпуклость для устойчивого пространственного восприятия: от неминимальных решателей к глобальному отклонению выбросов». Письма IEEE по робототехнике и автоматизации . 5 (2): 1127–1134. arXiv : 1909.08605 . DOI : 10,1109 / LRA.2020.2965893 . ISSN 2377-3774 . S2CID 202660784 .  
  36. ^ BESL, Павел; Маккей, Нил (1992). «Метод регистрации трехмерных фигур» . IEEE Transactions по анализу шаблонов и машинному анализу . 14 (2): 239–256. Bibcode : 1992SPIE.1611..586B . DOI : 10.1109 / 34.121791 .
  37. ^ Б с д е е г ч я Цинь, Yanghai; Канаде, Такео (2004). Основанный на корреляции подход к надежной регистрации набора точек . Компьютерное зрение ECCV . Конспект лекций по информатике. 3023 . Springer Berlin Heidelberg. С. 558–569. CiteSeerX 10.1.1.156.6729 . DOI : 10.1007 / 978-3-540-24672-5_44 . ISBN  978-3-540-21982-8.
  38. ^ Русинкевич, Шимон; Левой, Марк (2001). Эффективные варианты алгоритма ICP . Труды Третьей Международной конференции по трехмерной цифровой визуализации и моделированию, 2001. IEEE. С. 145–152. DOI : 10.1109 / IM.2001.924423 .
  39. ^ a b c d e Голд, Стивен; Рангараджан, Ананд; Лу, Цзянь-Пин; Сугуна, Паппу; Mjolsness, Эрик (1998). «Новые алгоритмы сопоставления 2-х и 3-х точек :: оценка позы и соответствие». Распознавание образов . 38 (8): 1019–1031. DOI : 10.1016 / S0031-3203 (98) 80010-1 .
  40. ^ Цзянь, Бинг; Вемури, Баба С. (2005). Надежный алгоритм регистрации набора точек с использованием смеси гауссианов . Десятая Международная конференция IEEE по компьютерному зрению 2005 г. 2 . С. 1246–1251.
  41. ^ Мироненко, Андрей; Песня, Сюбо; Карьера-Перпинан, Мигель А. (2006). «Регистрация нежесткой точки: когерентный дрейф точки» . Достижения в системах обработки нейронной информации . 19 : 1009–1016 . Проверено 31 мая 2014 года .
  42. ^ Assalih, Хасан. (2013). «Глава 6: Сортировка пространства корреспонденции» (PDF) . Трехмерная реконструкция и оценка движения с помощью гидролокатора прямого обзора (доктор философии). Университет Хериот-Ватт.
  43. ^ Хиросе, Осаму (2020). «Байесовская формулировка когерентного дрейфа точки» . IEEE Transactions по анализу шаблонов и машинному анализу . Ранний доступ: 1–18. DOI : 10.1109 / TPAMI.2020.2971687 . PMID 32031931 . 

Внешние ссылки [ править ]

  • Эталонная реализация надежного согласования точек шлицевого соединения тонкой пластины
  • Эталонная реализация регистрации набора точек корреляции ядра
  • Эталонная реализация когерентного дрейфа точки
  • Эталонная реализация вариантов ICP
  • Эталонная реализация байесовского когерентного дрейфа точки