Активное зрение


Одной из областей компьютерного зрения является активное зрение , иногда также называемое активным компьютерным зрением . Система активного зрения — это система, которая может манипулировать точкой обзора камеры (камер), чтобы исследовать окружающую среду и получать от нее более точную информацию. [1] [2] [3] [4]

Интерес к системе активных камер возник еще два десятилетия назад. Начиная с конца 1980-х, Aloimonos et al. представил первую общую основу для активного зрения, чтобы улучшить качество восприятия результатов отслеживания. [3] Активное зрение особенно важно для решения таких проблем, как окклюзии, ограниченное поле зрения и ограниченное разрешение камеры. [5] Другие преимущества могут заключаться в уменьшении размытости движущегося объекта [6] и улучшении восприятия глубины объекта за счет фокусировки двух камер на одном объекте или перемещения камер. [3] Активное управление точкой обзора камеры также помогает сосредоточить вычислительные ресурсы на соответствующем элементе сцены. [7]В этом избирательном аспекте активное зрение можно рассматривать как строго связанное с (явным и скрытым) зрительным вниманием в биологических организмах, которое, как было показано, улучшает восприятие выбранной части поля зрения. Этот избирательный аспект человеческого (активного) зрения можно легко связать с фовеальной структурой человеческого глаза, [8] [9] , где примерно в 5% сетчатки расположено более 50% цветовых рецепторов.

Также было высказано предположение, что визуальное внимание и избирательный аспект активного управления камерой могут помочь в других задачах, таких как изучение более надежных моделей объектов и сред с менее размеченными образцами или автономно. [4] [10]

Автономные камеры — это камеры, которые могут управлять собой в своей среде. Недавно было проведено несколько работ, использующих этот подход. В работе Denzler et al. Движение отслеживаемого объекта моделируется с использованием фильтра Калмана, при этом используется фокусное расстояние, минимизирующее неопределенность в оценках состояния. Использовалась стереосистема с двумя камерами с зумом. Несколько статей были написаны для управления масштабированием и не касаются общей оценки положения объекта-камеры. Попытка объединить оценку и контроль в одной структуре можно найти в работе Багданова и др., где для отслеживания лиц используется камера Pan-Tilt-Zoom. [12] Используемые модели оценки и управления являются специальными, и подход к оценке основан на характеристиках изображения, а не на трехмерных свойствах отслеживаемой цели. [13]

В конфигурации «ведущий/ведомый» наблюдающая статическая камера используется для наблюдения за широким полем зрения и отслеживания каждой интересующей движущейся цели. Затем положение каждой из этих целей с течением времени передается на фовеальную камеру, которая пытается наблюдать за целями с более высоким разрешением. И статическая, и активная камеры откалиброваны по общему эталону, поэтому данные, поступающие с одной из них, можно легко спроецировать на другую, чтобы координировать управление активными датчиками. Другое возможное использование подхода «ведущий/ведомый» состоит в том, что статическая (ведущая) камера извлекает визуальные характеристики интересующего объекта, в то время как активный (ведомый) датчик использует эти функции для обнаружения желаемого объекта без необходимости каких-либо обучающих данных. [13] [14]

В последние годы растет интерес к созданию сетей активных камер и дополнительных статических камер, чтобы вы могли охватить большую площадь, сохраняя при этом высокое разрешение нескольких целей. В конечном счете, это увеличенная версия подхода «ведущий/ведомый» или подхода с автономной камерой. Такой подход может быть очень эффективным, но и невероятно дорогостоящим. Мало того, что задействовано несколько камер, вы также должны обеспечить их связь друг с другом, что может быть дорогостоящим в вычислительном отношении. [13] [14]