VisualRank

VisualRank - это система для поиска и ранжирования изображений путем анализа и сравнения их содержимого, а не поиска по именам изображений, веб-ссылкам или другому тексту. Ученые Google обнародовали результаты своей работы с VisualRank в документе, описывающем применение PageRank для поиска изображений Google на Международной конференции World Wide Web в Пекине в 2008 году ^[1].

Мы ставим задачу ранжирования изображений в задачу определения «авторитетных» узлов на предполагаемом графе визуального сходства и предлагаем VisualRank для анализа структур визуальных связей между изображениями. Изображения, признанные «авторитетными», выбираются как те, которые хорошо отвечают на запросы изображений.

Методы [ править ]

В алгоритме VisualRank используются как методы компьютерного зрения , так и хеширование с учетом местоположения (LSH) . Рассмотрим поиск изображений, инициированный текстовым запросом. Существующая методика поиска, основанная на метаданных изображения и окружающем тексте, используется для извлечения кандидатов начального результата ( PageRank ), которые вместе с другими изображениями в индексе группируются на графе в соответствии с их сходством (которое предварительно вычисляется). Центральность затем измеряется при кластеризации, которая возвращает наиболее канонические изображения по отношению к запросу. Идея заключается в том, что соглашение между пользователями Интернета об изображении и связанных с ним концепциях приведет к тому, что эти изображения будут считаться более похожими. VisualRank определяется итеративно с помощью , где - матрица сходства изображений. При использовании матриц центральность собственного вектора будет применяться в качестве меры с многократным умножением и получением искомого собственного вектора . Очевидно, что мера сходства изображений имеет решающее значение для производительности VisualRank, поскольку она определяет базовую структуру графа. ${\ displaystyle VR = S ^ {*} \ times VR}$ ${\ Displaystyle S ^ {*}}$ ${\ displaystyle VR}$ ${\ Displaystyle S ^ {*}}$

Основная система VisualRank начинается с извлечения локальных векторов признаков из изображений с помощью масштабно-инвариантного преобразования признаков (SIFT). Дескрипторы локальных объектов используются вместо цветовых гистограмм, поскольку они позволяют учитывать сходство между изображениями с потенциальными преобразованиями поворота, масштаба и перспективы. Затем к этим векторам признаков применяется хеширование с учетом местоположения с использованием p-стабильной схемы распределения . В дополнение к этому применяется усиление LSH с использованием конструкций И / ИЛИ. В рамках применяемой схемы используется распределение Гаусса по норме . ${\ displaystyle \ ell _ {2}}$

Ссылки [ править ]

^ Yushi Jing и Baluja, S. (2008). «VisualRank: применение PageRank для поиска крупномасштабных изображений». IEEE Transactions по анализу шаблонов и машинному анализу . 30 (11): 1877–1890. CiteSeerX 10.1.1.309.741 . DOI : 10.1109 / TPAMI.2008.121 . ISSN 0162-8828 . PMID 18787237 . .

[Jing08-1] Yushi Jing и Baluja, S. (2008). «VisualRank: применение PageRank для поиска крупномасштабных изображений». IEEE Transactions по анализу шаблонов и машинному анализу . 30 (11): 1877–1890. CiteSeerX 10.1.1.309.741 . DOI : 10.1109 / TPAMI.2008.121 . ISSN 0162-8828 . PMID 18787237 . .

[1].