Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Общая схема контентного поиска изображений

Поиск изображений на основе содержимого , также известный как запрос по содержимому изображения ( QBIC ) и поиск визуальной информации на основе содержимого ( CBVIR ), представляет собой применение методов компьютерного зрения к проблеме поиска изображений , то есть проблеме поиска цифровых изображений в больших базах данных (см. этот обзор [1] для научного обзора области CBIR). Поиск изображений на основе содержимого отличается от традиционных подходов, основанных на концепциях (см. Индексирование изображений на основе концепций ).

«На основе содержания» означает, что поиск анализирует содержимое изображения, а не метаданные, такие как ключевые слова, теги или описания, связанные с изображением. Термин «контент» в этом контексте может относиться к цветам, формам, текстурам или любой другой информации, которая может быть получена из самого изображения. CBIR желателен, потому что поиски, основанные исключительно на метаданных, зависят от качества и полноты аннотаций .

Если люди вручную аннотируют изображения путем ввода ключевых слов или метаданных в большую базу данных, это может занять много времени и может не захватить ключевые слова, необходимые для описания изображения. Оценка эффективности поиска изображений по ключевым словам является субъективной и четко не определена. В том же отношении системы CBIR сталкиваются с аналогичными проблемами в определении успеха. [2] «Ключевые слова также ограничивают объем запросов набором заранее определенных критериев». и «быть настроенным» менее надежны, чем использование самого контента. [3]

История [ править ]

Термин «поиск изображений на основе содержания», кажется, возник в 1992 году, когда он был использован инженером японской электротехнической лаборатории Тошиказу Като для описания экспериментов по автоматическому извлечению изображений из базы данных на основе имеющихся цветов и форм. [2] [4] С тех пор этот термин используется для описания процесса получения желаемых изображений из большой коллекции на основе синтаксических характеристик изображения. Используемые методы, инструменты и алгоритмы происходят из таких областей, как статистика, распознавание образов, обработка сигналов и компьютерное зрение. [1]

Контентный просмотр видео был представлен иранским инженером Фаршидом Арманом, тайваньским компьютерным ученым Ардингом Хсу и компьютерным ученым Минг-Йи Чиу во время работы в Siemens , и он был представлен на Международной конференции ACM в августе 1993 года [5] [6 ]. ] Они описали алгоритм обнаружения кадров для сжатого видео, которое изначально было закодировано с использованием стандартов кодирования видео с дискретным косинусным преобразованием (DCT), таких как JPEG , MPEG и H.26x.. Основная идея заключалась в том, что, поскольку коэффициенты DCT математически связаны с пространственной областью и представляют содержимое каждого кадра, их можно использовать для обнаружения различий между видеокадрами. В алгоритме подмножество блоков в кадре и подмножество DCT-коэффициентов для каждого блока используются в качестве представления вектора движения для кадра. Работая со сжатыми представлениями DCT, алгоритм значительно снижает вычислительные требования для распаковки и обеспечивает эффективный просмотр видео. [7]Алгоритм представляет отдельные кадры видеопоследовательности в виде r-кадра, эскиза кадра, обрамленного областью отслеживания движения. Вариант этой концепции позже был принят для мозаики видеоконтента QBIC, где каждый r-кадр представляет собой заметный кадр из кадра, который он представляет. [8]

QBIC - Запрос по содержанию изображения [ править ]

Самая ранняя коммерческая система CBIR была разработана IBM и называлась QBIC ( Q uery B y I mage C ontent). [9] [10] Недавние сетевые и графические подходы представили простую и привлекательную альтернативу существующим методам. [11]

Хотя хранение нескольких изображений как части одного объекта предшествовало термину BLOB ( B inary L arge OB ject), [12] возможность полного поиска по содержимому, а не по описанию, должна была ждать QBIC IBM. [3]

Технический прогресс [ править ]

Интерес к CBIR вырос из-за ограничений, присущих системам на основе метаданных, а также из-за большого диапазона возможных применений для эффективного поиска изображений. Текстовую информацию об изображениях можно легко найти с помощью существующих технологий, но для этого нужно, чтобы люди вручную описывали каждое изображение в базе данных. Это может быть непрактично для очень больших баз данных или для изображений, которые создаются автоматически, например, с камер наблюдения.. Также можно пропустить изображения, в описании которых используются разные синонимы. Системы, основанные на категоризации изображений по семантическим классам, таким как «кошка» как подкласс «животное», могут избежать проблемы неправильной категоризации, но потребуют от пользователя дополнительных усилий для поиска изображений, которые могут быть «кошками», но классифицируются только как « животное ". Было разработано множество стандартов для категоризации изображений, но все еще сталкиваются с проблемами масштабирования и неправильной категоризации. [2]

Первоначальные системы CBIR были разработаны для поиска в базах данных на основе свойств цвета, текстуры и формы изображения. После разработки этих систем потребность в удобных интерфейсах стала очевидной. Таким образом, усилия в области CBIR начали включать дизайн, ориентированный на человека, который пытался удовлетворить потребности пользователя, выполняющего поиск. Обычно это означает включение: методов запроса, которые могут допускать описательную семантику, запросов, которые могут включать обратную связь с пользователем, систем, которые могут включать машинное обучение, и систем, которые могут понимать уровни удовлетворенности пользователей. [1]

Методы [ править ]

Было разработано множество систем CBIR, но по состоянию на 2006 г. проблема получения изображений на основе их пиксельного содержимого остается в значительной степени нерешенной. [1] [ требуется обновление ]

Различные методы запросов и реализации CBIR используют разные типы пользовательских запросов.

Запрос по примеру [ править ]

QBE ( Q uery B y E xample ) - это метод запроса [13], который включает предоставление системе CBIR примера изображения, на котором она затем будет основывать свой поиск. Базовые алгоритмы поиска могут различаться в зависимости от приложения, но все изображения результатов должны иметь общие элементы с приведенным примером. [14]

Варианты предоставления в систему примеров изображений включают:

  • Существующее ранее изображение может быть предоставлено пользователем или выбрано из случайного набора.
  • Пользователь рисует приблизительное изображение искомого изображения, например, с помощью цветных пятен или общих форм. [14]

Этот метод запросов устраняет трудности, которые могут возникнуть при попытке описать изображения словами.

Семантический поиск [ править ]

Семантический поиск начинается с того, что пользователь делает запрос типа «найти фотографии Авраама Линкольна». Этот тип неограниченной задачи очень сложен для компьютеров - Линкольн не всегда может смотреть в камеру или находиться в одной и той же позе. Поэтому многие системы CBIR обычно используют функции более низкого уровня, такие как текстура, цвет и форма. Эти функции используются либо в сочетании с интерфейсами, которые упрощают ввод критериев, либо с базами данных, которые уже были обучены сопоставлению функций (таких как лица, отпечатки пальцев или сопоставление форм). Однако в целом поиск изображений требует обратной связи от человека для определения концепций более высокого уровня. [10]

Отзыв о релевантности (взаимодействие с человеком) [ править ]

Сочетание методов поиска CBIR, доступных для широкого круга потенциальных пользователей и их намерений, может быть сложной задачей. Один из аспектов успеха CBIR полностью зависит от способности понимать намерения пользователя. [15] Системы CBIR могут использовать обратную связь по релевантности , когда пользователь постепенно уточняет результаты поиска, отмечая изображения в результатах как «релевантные», «нерелевантные» или «нейтральные» по отношению к поисковому запросу, затем повторяя поиск с новая информация. Были разработаны примеры такого типа интерфейса. [16]

Итеративное / машинное обучение [ править ]

Машинное обучение и применение итерационных методов становятся все более распространенными в CBIR. [17]

Другие методы запроса [ править ]

Другие методы запросов включают просмотр, например, изображений, навигацию по настраиваемым / иерархическим категориям, запросы по области изображения (а не по всему изображению), запросы по нескольким примерам изображений, запросы по визуальному эскизу, запросы с прямым указанием характеристик изображения и мультимодальные запросы ( например, сочетание прикосновения, голоса и т. д.) [18]

Сравнение содержания с использованием меры расстояния между изображениями [ править ]

Наиболее распространенный метод сравнения двух изображений при извлечении изображения на основе содержимого (обычно пример изображения и изображение из базы данных) - это использование меры расстояния между изображениями. Мера расстояния до изображения сравнивает сходство двух изображений в различных измерениях, таких как цвет, текстура, форма и другие. Например, расстояние, равное 0, означает точное совпадение с запросом с учетом рассмотренных измерений. Как можно интуитивно догадаться, значение больше 0 указывает на различную степень сходства между изображениями. Затем результаты поиска можно отсортировать по расстоянию до запрашиваемого изображения. [14] Были разработаны многие меры расстояния между изображениями (модели подобия). [19]

Цвет [ править ]

Вычисление мер расстояния на основе цветового сходства достигается путем вычисления цветовой гистограммы для каждого изображения, которая определяет долю пикселей в изображении, содержащем определенные значения. [2] Изучение изображений на основе содержащихся в них цветов является одним из наиболее широко используемых методов, поскольку его можно выполнять независимо от размера или ориентации изображения. [10] Однако исследования также попытались сегментировать пропорции цвета по регионам и по пространственным отношениям между несколькими цветовыми регионами. [18]

Текстура [ править ]

Меры текстуры ищут визуальные шаблоны в изображениях и их пространственное определение. Текстуры представлены текселями, которые затем помещаются в несколько наборов, в зависимости от того, сколько текстур обнаружено в изображении. Эти наборы определяют не только текстуру, но и то, где на изображении находится текстура. [14]

Текстуру сложно представить. Идентификация конкретных текстур в изображении достигается прежде всего путем моделирования текстуры как двухмерной вариации уровня серого. Относительная яркость пар пикселей вычисляется так, чтобы можно было оценить степень контраста, регулярности, грубости и направленности. [10] [20] Проблема состоит в том, чтобы идентифицировать паттерны вариации сопикселей и связывать их с определенными классами текстур, такими как шелковистая или грубая .

Другие методы классификации текстур включают:

  • Матрица совместной встречаемости
  • Законы текстуры энергии
  • Вейвлет-преобразование
  • Ортогональные преобразования (дискретные моменты Чебичефа)

Форма [ править ]

Форма относится не к форме изображения, а к форме конкретной области, которую ищут. Формы часто определяются сначала путем сегментации или обнаружения краев изображения. Другие методы используют фильтры формы для определения заданных форм изображения. [21] Дескрипторы формы также могут быть инвариантными по отношению к перемещению, повороту и масштабированию. [10]

Некоторые дескрипторы формы включают: [10]

  • преобразование Фурье
  • Инвариант момента

Уязвимости, атаки и защиты [ править ]

Как и другие задачи компьютерного зрения, такие как распознавание и обнаружение, новейшие алгоритмы поиска на основе нейронных сетей восприимчивы к состязательным атакам как в качестве кандидатов, так и в качестве атак по запросу. [22] Показано, что полученное ранжирование может быть резко изменено только с помощью небольших возмущений, незаметных для людей. Кроме того, также возможны переносимые состязательные примеры, не зависящие от модели, что позволяет проводить состязательные атаки методом черного ящика на системы глубокого ранжирования, не требуя доступа к их базовым реализациям. [22] [23]

И наоборот, сопротивление таким атакам может быть улучшено с помощью противостоящей защиты, такой как защита Мэдри. [24]

Оценка поиска изображений [ править ]

Меры поиска изображений можно определить с точки зрения точности и запоминания . Однако рассматриваются и другие методы. [25]

Получение изображений в системе CBIR одновременно разными методами [ править ]

Изображение извлекается в системе CBIR путем одновременного применения нескольких методов, таких как интеграция индексации кластера пикселей, пересечение гистограммы и методы дискретного вейвлет-преобразования. [26]

Приложения [ править ]

Возможные варианты использования CBIR: [2]

  • Архитектурно-инженерное проектирование
  • Коллекции произведений искусства
  • Предотвращение преступления
  • Системы географической информации и дистанционного зондирования
  • Интеллектуальная собственность
  • Медицинский диагноз
  • Военный
  • Фото архивы
  • Каталоги розничной торговли
  • Фильтры обнаружения наготы [27]
  • Поиск лица
  • Текстильная промышленность [16]

К коммерческим системам, которые были разработаны, относятся: [2]

  • IBM QBIC
  • VIR Image Engine от Virage
  • Программа для восстановления изображений Экскалибура
  • VisualSEEk и WebSEEk
  • Нетра
  • МАРС
  • Фото
  • Pixolution

Экспериментальные системы включают: [2]

  • Фотокнига MIT
  • WebSEEk Колумбийского университета
  • Информация Университета Карнеги-Меллона
  • iSearch - PICT

См. Также [ править ]

  • Классификация документов
  • ГазоПа
  • Поиск изображений
  • Список двигателей CBIR
  • Визуальный поиск макроглоссы
  • MPEG-7
  • Поиск мультимедийной информации
  • Множественное обучение
  • Поиск ближайшего соседа
  • Учимся ранжировать

Ссылки [ править ]

  1. ^ a b c d Поиск мультимедийной информации на основе контента: современное состояние и проблемы (Первоисточник, 404'd) Поиск мультимедийной информации на основе содержимого: состояние искусства и проблемы. Архивировано 28 сентября 2007 г. в Wayback Machine , Майкл Лью и др., ACM Transactions по мультимедийным вычислениям, коммуникациям и приложениям , стр. 1–19, 2006 г.
  2. ^ a b c d e f g Икинс, Джон; Грэм, Маргарет. «Поиск изображений на основе содержимого» . Университет Нортумбрии в Ньюкасле. Архивировано из оригинала на 2012-02-05 . Проверено 10 марта 2014 .
  3. ^ Б Джули Андерсон (29 апреля 1996). "Search Images / Object Design Inc - Лучшая сделка года на фондовых дискуссионных форумах (6 августа 1996 г.)" . Информационная неделя (Интернет-перепечатано в Silicon Investor's Stock Discussion Forums (6 августа 1996 г.) . Стр. 69 (IW). На выставке DB Expo в Сан-Франциско в начале этого месяца ...[ постоянная мертвая ссылка ]
  4. Като, Тошиказу (апрель 1992 г.). «Архитектура базы данных для поиска изображений на основе содержимого». Системы хранения и поиска изображений . Международное общество оптики и фотоники. 1662 : 112–123. Bibcode : 1992SPIE.1662..112K . DOI : 10.1117 / 12.58497 . S2CID 14342247 . 
  5. ^ Arman, Farshid; Хсу, Ардинг; Чиу, Мин-Йи (август 1993 г.). «Обработка изображений на сжатых данных для больших баз видеоданных» . Труды Первой международной конференции ACM по мультимедиа . Ассоциация вычислительной техники : 267–272. DOI : 10.1145 / 166266.166297 . ISBN 0897915968. S2CID  10392157 .
  6. ^ Arman, Farshid; Депомье, Реми; Хсу, Ардинг; Чиу, Мин-Йи (октябрь 1994 г.). «Контентный просмотр видеопоследовательностей» . Труды Второй Международной конференции ACM по мультимедиа . Ассоциация вычислительной техники : 97–103. CiteSeerX 10.1.1.476.7139 . DOI : 10.1145 / 192593.192630 . ISBN  0897916867. S2CID  1360834 .
  7. ^ Чжан, Хунцзян (1998). «Просмотр и поиск видео на основе содержимого» . In Furht, Borko (ред.). Справочник Интернет и мультимедийных систем и приложений . CRC Press . С.  83–108 (89) . ISBN 9780849318580.
  8. ^ Стил, Майкл; Hearst, Marti A .; Лоуренс, А. Роу (1998). «Video Workbench: интерфейс прямого управления для редактирования цифровых медиа видеооператорами-любителями». Semantic Scholar : 1-19 (14). S2CID 18212394 . 
  9. ^ Фликнер, М .; Sawhney, H .; Niblack, W .; Эшли, Дж .; Цянь Хуан; Дом, Б .; Горкани, М .; Hafner, J .; Ли, Д .; Петкович, Д .; Стил, Д .; Янкер, П. (1995). «Запрос по изображению и видеоконтенту: система QBIC». Компьютер . 28 (9): 23–32. DOI : 10.1109 / 2.410146 . Аннотация: Исследования способов расширения и улучшения методов запросов к базам данных изображений широко распространены. Мы разработали QBIC (запрос по содержанию изображения) ...
  10. ^ Б с д е е Rui, Юн; Хуанг, Томас С .; Чанг, Ши-Фу (1999). «Поиск изображений: современные методы, перспективные направления и нерешенные вопросы». Журнал визуальной коммуникации и изображения . 10 : 39–62. CiteSeerX 10.1.1.32.7819 . DOI : 10.1006 / jvci.1999.0413 . [ постоянная мертвая ссылка ]
  11. ^ Банерджи, SJ; и другие. (2015). «Использование сложных сетей для поиска информации и диагностики в многомерной визуализации» . Научные отчеты . 5 : 17271. arXiv : 1506.02602 . Bibcode : 2015NatSR ... 517271B . DOI : 10.1038 / srep17271 . PMC 4667282 . PMID 26626047 .  
  12. ^ "Правдивая история BLOBs" . Архивировано из оригинала на 2011-07-23.
  13. ^ «Запрос по примеру» . Центр знаний IBM.com . QBE - это язык для запросов ...
  14. ^ a b c d Шапиро, Линда ; Джордж Стокман (2001). Компьютерное зрение . Река Аппер Сэдл, Нью-Джерси: Prentice Hall. ISBN 978-0-13-030796-5.
  15. ^ Датта, Ритендра; Дхирадж Джоши; Цзя Ли; Джеймс З. Ван (2008). «Поиск изображений: идеи, влияния и тенденции нового века» . ACM Computing Surveys . 40 (2): 1–60. DOI : 10.1145 / 1348246.1348248 . S2CID 7060187 . 
  16. ^ а б Птица, КЛ; П. Дж. Эллиотт, Гриффитс (1996). «Пользовательские интерфейсы для поиска изображений на основе содержимого». Цитировать журнал требует |journal=( помощь )
  17. ^ Кардосо, Дуглас; и другие. «Итерационный метод поиска изображений на основе содержимого с использованием нескольких ансамблей SVM» (PDF) . Федеральный университет Параны (Бразилия) . Проверено 11 марта 2014 .
  18. ^ a b Лиам М. Майрон. «Поиск изображений с использованием визуального внимания» (PDF) . Mayron.net . Проверено 18 октября 2012 .
  19. ^ Eidenberger Хорст (2011). «Фундаментальное понимание СМИ», атпресс. ISBN 978-3-8423-7917-6 . 
  20. Тамура, Хидеюки; Мори, Сюндзи; Ямаваки, Такаши (1978). «Текстурные особенности, соответствующие зрительному восприятию». IEEE Transactions по системам, человеку и кибернетике . 8 (6): 460, 473. DOI : 10,1109 / tsmc.1978.4309999 . S2CID 32197839 . 
  21. ^ Tushabe, F .; MHF Wilkinson (2008). Получение изображений на основе содержимого с использованием комбинированных двухмерных спектров шаблонов атрибутов (PDF) . Конспект лекций по информатике . Конспект лекций по информатике. 5152 . С. 554–561. DOI : 10.1007 / 978-3-540-85760-0_69 . ISBN  978-3-540-85759-4.
  22. ^ а б Чжоу, Мо; Ню, Чжэньсин; Ван, Ле; Чжан, Цилинь; Хуа, банда (2020). «Состязательный рейтинг атаки и защиты». arXiv : 2002.11293v2 [ cs.CV ].
  23. ^ Ли, Цзе; Джи, Ронгронг; Лю, Хун; Хун, Сяопэн; Гао, Юэ; Тиан, Ци. «Универсальная атака возмущения против поиска изображений» . Международная конференция по компьютерному зрению (ICCV 2019) . С. 4899–4908.
  24. ^ Мадри, Александр; Макелов, Александр; Шмидт, Людвиг; Ципрас, Димитрис; Влада, Адриан (19.06.2017). «На пути к моделям глубокого обучения, устойчивым к враждебным атакам». arXiv : 1706.06083v4 [ stat.ML ].
  25. ^ Deselaers, Томас; Кейзерс, Дэниел; Ней, Германн (2007). «Возможности для поиска изображений: экспериментальное сравнение» (PDF) . RWTH Ахенский университет . Проверено 11 марта 2014 .
  26. ^ Бхаттачарджи, Pijush канти (2010). «Интеграция методов индексирования кластера пикселей, пересечения гистограммы и дискретного вейвлет-преобразования для системы поиска изображений на основе содержимого цветных изображений» (PDF) . Международный журнал компьютерной и электротехнической инженерии [IJCEE], Сингапур, вып. 2, вып. 2. С. 345-352, 2010 .
  27. ^ Ван, Джеймс Зе; Цзя Ли; Джио Видерхольд; Оскар Фиршейн (1998). «Система отсеивания нежелательных изображений». Компьютерные коммуникации . 21 (15): 1355–1360. CiteSeerX 10.1.1.78.7689 . DOI : 10.1016 / s0140-3664 (98) 00203-5 . 

Дальнейшее чтение [ править ]

Соответствующие исследовательские работы [ править ]

  • Запрос по изображениям и видеоконтенту: система QBIC (Flickner, 1995)
  • В поисках обнаженных людей (Fleck et al., 1996)
  • Virage Video Engine [ постоянная мертвая ссылка ] , (Хампапур, 1997)
  • Кодирование на основе библиотеки: представление об эффективном сжатии и извлечении видео , (Vasconcelos & Lippman, 1997)
  • Система проверки нежелательных изображений (Ван и др., 1998)
  • Content-based Image Retrieval ( JISC Technology Applications Program Report 39) (Eakins & Graham 1999).
  • Виндсерфинг: поиск изображений по регионам с использованием вейвлетов (Ардиццони, Бартолини и Пателла, 1999)
  • Вероятностная архитектура для поиска изображений на основе содержимого (Vasconcelos & Lippman, 2000)
  • Объединяющий взгляд на сходство изображений (Vasconcelos & Lippman, 2000)
  • Веб-поиски визуального контента нового поколения (Лью, 2000)
  • Индексирование изображений с помощью смешанных иерархий (Vasconcelos, 2001)
  • ПРОСТОТА: Чувствительное к семантике интегрированное сопоставление для библиотек изображений (Ван, Ли и Видерхолд, 2001)
  • Концептуальный подход к поиску изображений в Интернете (Попеску и Грефенстетт, 2008 г.)
  • FACERET: интерактивная система поиска лиц, основанная на самоорганизующихся картах (Руис-дель-Солар и др., 2002)
  • Автоматическое лингвистическое индексирование изображений с помощью статистического моделирования (Ли и Ван, 2003 г.)
  • Видео Google: подход поиска текста для сопоставления объектов в видеороликах (Sivic & Zisserman, 2003)
  • Минимальная вероятность получения изображения с ошибкой (Vasconcelos, 2004)
  • Об эффективной оценке вероятностных функций подобия для поиска изображений (Vasconcelos, 2004)
  • Расширение систем поиска изображений с помощью тезауруса форм (Hove, 2004)
  • Имена и лица в новостях (Berg et al., 2004)
  • Cortina: система для крупномасштабного поиска веб-изображений на основе контента (Quack et al., 2004)
  • Новый взгляд на визуальный поиск информации (Eidenberger 2004)
  • Запросы к коллекциям изображений на основе языка на основе расширяемой онтологии (Town and Sinclair, 2004)
  • Персонализированный механизм просмотра изображений PIBE (Бартолини, Чачча и Пателла, 2004 г.)
  • Костюм: новая функция для автоматической индексации видеоконтента (Jaffre 2005)
  • Автоматическое распознавание лиц для поиска персонажей в полнометражных фильмах (Аранджелович и Зиссерман, 2005)
  • Значимые пространства изображений (Rouw, 2005)
  • Content-based Multimedia Information Retrieval: State of the Art and Challenges (Lew et al. 2006).
  • Адаптивный просмотр баз данных изображений с помощью PIBE (Bartolini, Ciaccia, and Patella, 2006)
  • Алгоритм, на котором основан Retrievr (поиск Flickr) и imgSeek (Jacobs, Finkelstein, Salesin)
  • Воображение: использование анализа ссылок для точной аннотации изображения (Бартолини и Чачча, 2007)
  • Оценка использования интерфейсов для спецификации визуального запроса. (Хоув, 2007)
  • От пикселей к семантическим пространствам: достижения в поиске изображений на основе содержимого (Васконселос, 2007 г.)
  • Поиск изображений на основе содержимого путем индексации случайных подокон с рандомизированными деревьями (Maree et al., 2007)
  • Поиск изображений: идеи, влияния и тенденции нового века (Datta et al., 2008)
  • Компьютеризированная аннотация изображений в реальном времени (Ли и Ван, 2008 г.)
  • Проблемы обработки запросов в базах данных изображений на основе регионов (Bartolini, Ciaccia, and Patella, 2010)
  • Шиацу: основанная на семантике иерархическая автоматическая маркировка видео путем сегментации с использованием сокращений (Бартолини, Пателла и Романи, 2010)
  • Эффективный и действенный поиск видео на основе сходства (Бартолини и Романи, 2010)
  • Аннотации и поиск изображений на основе многомерных ключевых слов (Bartolini and Ciaccia, 2010)
  • Библиотека виндсерфинга для эффективного поиска мультимедийных иерархических данных (Бартолини, Пателла и Стромей, 2011 г.)
  • « Pl @ ntNet: интерактивная идентификация растений на основе данных социальных изображений » (Джоли, Алексис и др.)
  • " Поиск изображений на основе содержания (Tyagi, V, 2017)
  • Superimage: упаковка семантически релевантных изображений для индексации и поиска (Луо, Чжан, Хуанг, Гао, Тянь, 2014)
  • Индексирование и поиск 100 миллионов изображений с помощью Map-Reduce (Моисе, Шестаков, Гудмундссон и Амсалег, 2013 г.)

Внешние ссылки [ править ]

  • Алхазрадж, Хутафа (09.08.2017). «Исследование на основе постоянного изображения относительного: Обзор» . Обработка изображений IET . IEEE (обработка изображений). ISSN  1751-9659 . Проверено 22 января 2019 . - оригинальная статья
  • cbir.info Статьи по CBIR
  • IJMIR много статей, связанных с CBIR
  • Поиск по рисунку
  • Демонстрация визуального поисковика изображений. (Поиск по образцу изображения или цветов)