В информатике , геометрическая хеширование представляет собой способ эффективного обнаружения двумерных объектов , представленных дискретных точек , которые претерпели аффинное преобразование , хотя расширений существуют для других представлений объектов и преобразований. В автономном режиме объекты кодируются, рассматривая каждую пару точек как геометрическую основу . Остальные точки можно представить инвариантно относительно этого базиса с помощью двух параметров. Для каждой точки ее квантованные преобразованные координаты хранятся в хэш-таблице.в качестве ключа, а индексы базисных точек - в качестве значения. Затем выбирается новая пара базисных точек, и процесс повторяется. На этапе онлайн (распознавания) случайно выбранные пары точек данных рассматриваются как базы-кандидаты. Для каждой основы-кандидата оставшиеся точки данных кодируются в соответствии с основанием, а возможные соответствия объекта находятся в ранее созданной таблице. Основа-кандидат принимается, если достаточно большое количество точек данных указывает на непротиворечивую основу объекта.
Геометрическая хеширование первоначально была предложено в области компьютерного зрения для распознавания объектов в 2D и 3D, [1] , но позже было применен к различным проблемам , таким , как структурное выравнивание из белков . [2] [3]
Геометрическое хеширование в компьютерном зрении [ править ]
Геометрическое хеширование - это метод, используемый для распознавания объектов. Допустим, мы хотим проверить, можно ли увидеть изображение модели во входном изображении. Этого можно добиться с помощью геометрического хеширования. Метод может использоваться для распознавания одного из нескольких объектов в базе, в этом случае хеш-таблица должна хранить не только информацию о позе, но и индекс объектной модели в базе.
Пример [ править ]
Для простоты в этом примере не будет использоваться слишком много точечных объектов и предполагается, что их дескрипторы задаются только их координатами (на практике для индексации могут использоваться локальные дескрипторы, такие как SIFT ).
Фаза обучения [ править ]
- Найдите характерные черты модели. Предположим, что на изображении модели обнаружены 5 характерных точек с координатами , см. Рисунок.
- Введите основу для описания местоположения характерных точек. Для двумерного пространства и преобразования подобия базис определяется парой точек. Исходная точка находится в середине отрезка, соединяющего две точки (P2, P4 в нашем примере), ось направлена к одной из них, ортогональна и проходит через начало координат. Масштаб выбран таким образом, чтобы абсолютное значение для обеих базисных точек было равно 1.
- Опишите расположение объектов относительно этого базиса, т.е. вычислите проекции на новые оси координат. Чтобы сделать распознавание устойчивым к шуму, координаты должны быть дискретизированы , мы берем размер бина 0,25. Таким образом, мы получаем координаты
- Сохраните основу в хеш-таблице, проиндексированной по функциям (в данном случае только преобразованные координаты). Если бы было больше объектов для сопоставления, мы также должны сохранить номер объекта вместе с базисной парой.
- Повторите процесс для другой пары базисов (шаг 2). Это необходимо для обработки окклюзий . В идеале все неколлинеарные пары должны быть пронумерованы. Предоставляем хеш-таблицу после двух итераций, для второй выбирается пара (P1, P3).
Хеш-таблица:
Вектор ( , ) | основа |
---|---|
(P2, P4) | |
(P2, P4) | |
(P2, P4) | |
(P2, P4) | |
(P2, P4) | |
(P1, P3) | |
(P1, P3) | |
(P1, P3) | |
(P1, P3) | |
(P1, P3) |
В большинстве хэш-таблиц не может быть одинаковых ключей, сопоставленных с разными значениями. Таким образом, в реальной жизни нельзя кодировать базовые ключи (1.0, 0.0) и (-1.0, 0.0) в хеш-таблице.
Фаза признания [ править ]
- Найдите интересные особенности на входном изображении.
- Выбираем произвольную основу. Если подходящей произвольной основы нет, то вполне вероятно, что входное изображение не содержит целевой объект.
- Опишите координаты характерных точек в новом базисе. Квантовать полученные координаты, как это делалось ранее.
- Сравните все преобразованные точечные объекты на входном изображении с хеш-таблицей. Если точечные объекты идентичны или похожи, увеличьте счетчик для соответствующего базиса (и типа объекта, если таковой имеется).
- Для каждого базиса, в котором счет превышает определенный порог, проверьте гипотезу о том, что он соответствует базису изображения, выбранному на шаге 2. Перенесите систему координат изображения в модельную (для предполагаемого объекта) и попробуйте сопоставить их. В случае успеха объект найден. В противном случае вернитесь к шагу 2.
Поиск зеркального рисунка [ править ]
Кажется, что этот метод способен обрабатывать только масштабирование, перемещение и вращение. Однако входное изображение может содержать объект в зеркальном преобразовании. Следовательно, геометрическое хеширование также должно иметь возможность найти объект. Есть два способа обнаружить зеркальные объекты.
- Для векторного графика сделайте левую часть положительной, а правую - отрицательной. Умножение позиции x на -1 даст тот же результат.
- За основу возьмите 3 точки. Это позволяет обнаруживать зеркальные изображения (или объекты). Собственно, использование трех точек за основу - это еще один подход к геометрическому хешированию.
Геометрическое хеширование в более высоких измерениях [ править ]
Как и в примере выше, хеширование применяется к многомерным данным. Для трехмерных точек данных также необходимы три точки в качестве основы. Первые две точки определяют ось x, а третья точка определяет ось y (с первой точкой). Ось z перпендикулярна созданной оси с использованием правила правой руки. Обратите внимание, что порядок точек влияет на итоговую основу.
См. Также [ править ]
Ссылки [ править ]
- ^ С. Миан, М. Bennamoun, Р. Оуэнс, Трехмерная модель на основе распознавания объектов и сегментации в загроможденных сцен ., IEEE Transactions на шаблон анализа и Machine Intelligence, Vol. 28 октября 2006 г., стр. 1584-601.
- ^ Молл, Марк; Брайант, Дрю Х .; Кавраки, Лидия Э. (11.11.2010). «Алгоритм LabelHash для сопоставления субструктур» . BMC Bioinformatics . 11 : 555. DOI : 10,1186 / 1471-2105-11-555 . ISSN 1471-2105 . PMC 2996407 . PMID 21070651 .
- ^ Нусинов, Р .; Вольфсон, HJ (1991-12-01). «Эффективное обнаружение трехмерных структурных мотивов в биологических макромолекулах методами компьютерного зрения» . Труды Национальной академии наук Соединенных Штатов Америки . 88 (23): 10495–10499. DOI : 10.1073 / pnas.88.23.10495 . ISSN 0027-8424 . PMC 52955 . PMID 1961713 .
- Вольфсон, HJ и Rigoutsos, I. (1997). Геометрическое хеширование: обзор. IEEE Computational Science and Engineering, 4 (4), 10-21.