Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В компьютерном зрении и робототехнике типичной задачей является идентификация конкретных объектов на изображении и определение положения и ориентации каждого объекта относительно некоторой системы координат. Затем эту информацию можно использовать, например, чтобы позволить роботу манипулировать объектом или избежать попадания внутрь объекта. Комбинация положения и ориентации называется позой объекта, хотя это понятие иногда используется только для описания ориентации. Внешняя ориентация и перевод также используются как синонимы позы.

Данные изображения, на основе которых определяется поза объекта, могут быть либо одиночным изображением, либо парой стереоизображений , либо последовательностью изображений, где обычно камера движется с известной скоростью. Рассматриваемые объекты могут быть довольно общими, включая живое существо или части тела, например, голову или руки. Однако методы, которые используются для определения позы объекта, обычно специфичны для определенного класса объектов, и, как правило, нельзя ожидать, что они будут хорошо работать для других типов объектов.

Поза может быть описана посредством преобразования вращения и перемещения, которое переводит объект из исходной позы в наблюдаемую [ требуется пояснение ] . Это преобразование вращения может быть представлено по-разному, например, как матрица вращения или кватернион .

Оценка позы [ править ]

Конкретная задача определения позы объекта на изображении (или стереоизображениях, последовательности изображений) называется оценкой позы . Проблема оценки позы может быть решена по-разному в зависимости от конфигурации датчика изображения и выбора методологии. Можно выделить три класса методологий:

  • Аналитические или геометрические методы: при условии, что датчик изображения (камера) откалиброван и сопоставление трехмерных точек сцены и двухмерных точек изображения известно. Если также известна геометрия объекта, это означает, что проецируемое изображение объекта на изображении камеры является хорошо известной функцией позы объекта. После определения набора контрольных точек на объекте, обычно углов или других характерных точек, можно решить преобразование позы из набора уравнений, которые связывают трехмерные координаты точек с координатами их двухмерного изображения. Алгоритмы, которые определяют положение облака точек относительно другого облака точек, известны как алгоритмы регистрации набора точек , если соответствия между точками еще не известны.
  • Методы генетического алгоритма : если не требуется вычислять позу объекта в реальном времени, можно использовать генетический алгоритм . Этот подход надежен, особенно когда изображения не откалиброваны идеально. В этом конкретном случае поза представляет собой генетическое представление, а ошибка между проекцией контрольных точек объекта и изображением является функцией приспособленности .
  • Методы, основанные на обучении: эти методы используют систему на основе искусственного обучения, которая изучает сопоставление с функциями 2D-изображения для преобразования позы. Короче говоря, это означает, что достаточно большой набор изображений объекта в разных позах должен быть представлен системе на этапе обучения. После завершения этапа обучения система должна иметь возможность представить оценку позы объекта с учетом его изображения.

См. Также [ править ]

Ссылки [ править ]