Из Википедии, бесплатной энциклопедии
  (Перенаправлено из Random Walker (компьютерное зрение) )
Перейти к навигации Перейти к поиску

Случайный ходок алгоритм является алгоритмом сегментации изображений . В первом описании алгоритма [1]пользователь интерактивно маркирует небольшое количество пикселей известными метками (называемыми начальными числами), например, «объект» и «фон». Предполагается, что каждый немаркированный пиксель высвобождает случайного блуждающего, и вычисляется вероятность того, что случайный блуждающий элемент каждого пикселя сначала достигает начального числа с каждой меткой, т. Е. Если пользователь помещает K начальных чисел, каждый с другой меткой, тогда необходимо чтобы вычислить для каждого пикселя вероятность того, что случайный прохожий, покинувший пиксель, первым достигнет каждого начального числа. Эти вероятности можно определить аналитически, решив систему линейных уравнений. После вычисления этих вероятностей для каждого пикселя пикселю присваивается метка, для которой он, скорее всего, отправит случайного блуждающего. Изображение моделируется в виде графика, в котором каждый пиксель соответствует узлу, который соединен с соседними пикселями краями, а края взвешиваются, чтобы отразить сходство между пикселями. Следовательно, случайное блуждание происходит на взвешенном графе (см. Введение в случайные блуждания на графах у Дойла и Снелла [2] ).

Хотя первоначальный алгоритм был сформулирован как интерактивный метод сегментации изображения, он был расширен до полностью автоматического алгоритма с учетом срока точности данных (например, предшествующей интенсивности). [3] Он также был распространен на другие приложения.

Алгоритм был первоначально опубликован Лео Грэди как доклад на конференции [4], а затем как статья в журнале. [1]

Математика [ править ]

Хотя алгоритм был описан в терминах случайных блужданий , вероятность того, что каждый узел отправит случайного блуждания к начальным числам, может быть вычислена аналитически путем решения разреженной положительно определенной системы линейных уравнений с графической матрицей Лапласа , которую мы можем представить с помощью переменная . Было показано, что алгоритм применим к произвольному количеству меток (объектов), но здесь описание представлено в виде двух меток (для простоты изложения).

Предположим, что изображение представлено графом , в котором каждый узел связан с пикселем, а каждое ребро соединяет соседние пиксели и . Веса краев используются для кодирования сходства узлов, которое может быть получено из различий в интенсивности изображения, цвете, текстуре или любых других значимых характеристиках. Например, используя интенсивность изображения в узле , обычно используется функция взвешивания краев.

Затем узлы, ребра и веса можно использовать для построения матрицы Лапласа графа .

Алгоритм случайного блуждания оптимизирует энергию

где представляет собой переменную с действительным знаком, связанную с каждым узлом в графе, а оптимизация ограничена for и for , где и представляют наборы начальных значений переднего плана и фона соответственно. Если мы позволим представить набор узлов, которые были засеяны (т. Е. ), И представить набор незавершенных узлов (т. Е. Где - множество всех узлов), то оптимум задачи минимизации энергии дается решением

где нижние индексы используются для обозначения части лапласовской матрицы графа, проиндексированной соответствующими наборами.

В [3] было показано, что для включения в алгоритм вероятностных (унарных) членов можно оптимизировать энергию

для положительных диагональных матриц и . Оптимизация этой энергии приводит к системе линейных уравнений

Набор засеянных узлов может быть пустым в этом случае (т. Е. ), Но наличие положительных диагональных матриц позволяет получить уникальное решение этой линейной системы.

Например, если правдоподобные / унарные термины используются для включения цветовой модели объекта, то это будет представлять уверенность в том, что цвет в узле будет принадлежать объекту (т. Е. Большее значение указывает на большую уверенность, принадлежащую метке объекта. ) и будет представлять уверенность в том, что цвет в узле принадлежит фону.

Интерпретации алгоритмов [ править ]

Алгоритм случайного блуждания изначально был мотивирован маркировкой пикселя как объекта / фона на основе вероятности того, что случайный блуждающий объект, упавший на пиксель, сначала достигнет начального значения объекта (переднего плана) или начального значения фона. Однако есть несколько других интерпретаций этого же алгоритма, появившихся в [1].

Интерпретации теории цепей [ править ]

Между теорией электрических цепей и случайными блужданиями по графам есть хорошо известные связи . [5] Следовательно, алгоритм случайного блуждания имеет две разные интерпретации с точки зрения электрической цепи. В обоих случаях график рассматривается как электрическая цепь, в которой каждое ребро заменено пассивным линейным резистором . Сопротивление, связанное с кромкой , устанавливается равным (т. Е. Вес кромки равен электрической проводимости ).

В первой интерпретации каждый узел, связанный с исходным значением фона, привязан непосредственно к земле, в то время как каждый узел, связанный с исходным элементом объекта / переднего плана, присоединен к единичному источнику идеального напряжения постоянного тока, привязанному к земле (т. потенциал у каждого ). Установившиеся потенциалы электрической цепи, установленные в каждом узле этой конфигурацией цепи, будут точно равны вероятностям случайного блуждающего. В частности, электрический потенциал в узле будет равен вероятности того, что случайный бродяга, сброшенный в узле , достигнет узла объекта / переднего плана, прежде чем достигнет узла заднего плана.

Во второй интерпретации маркировка узла как объекта или фона путем установления порога вероятности случайного блуждания на уровне 0,5 эквивалентна маркировке узла как объекта или фона на основе относительной эффективной проводимости между узлом и объектом или начальными числами фона. В частности, если узел имеет более высокую эффективную проводимость (более низкое эффективное сопротивление) по отношению к исходным объектам объекта, чем к исходным элементам фона, то узел помечается как объект. Если узел имеет более высокую эффективную проводимость (более низкое эффективное сопротивление) по отношению к исходным объектам фона, чем к исходным объектам объекта, то узел помечается как фоновый.

Расширения [ править ]

Описанный выше традиционный алгоритм случайного блуждания был расширен несколькими способами:

  • Случайные блуждания с перезапуском [6]
  • Альфа-матирование [7]
  • Выбор порога [8]
  • Мягкие входы [9]
  • Запуск на предварительно сегментированном изображении [10]
  • Масштабируемое случайное блуждание по пространству [11]
  • Устройство для быстрой ходьбы с использованием предварительного вычисления в автономном режиме [12] [13]
  • Обобщенные случайные блуждания, обеспечивающие гибкие функции совместимости [14]
  • Мощные водоразделы, объединяющие разрезы графа, случайное блуждание и кратчайший путь [15]
  • Водоразделы, ходящие случайно [16]
  • Многомерное гауссовское условное случайное поле [17]

Приложения [ править ]

Помимо сегментации изображений, алгоритм случайного блуждания или его расширения были дополнительно применены к нескольким задачам компьютерного зрения и графики:

  • Раскрашивание изображения [18]
  • Интерактивное ротоскопирование [19]
  • Сегментация медицинских изображений [20] [21] [22]
  • Объединение нескольких сегментов [23]
  • Сегментация сетки [24] [25]
  • Сетка шумоподавления [26]
  • Редактирование сегментации [27]
  • Устранение тени [28]
  • Стерео сопоставление (т. Е. Регистрация одномерного изображения ) [29]
  • Объединение изображений [14] [17]

Ссылки [ править ]

  1. ^ a b c Грейди, Л .: « Случайные блуждания для сегментации изображений ». ПАМИ, 2006 г.
  2. ^ П. Дойл, Дж. Л. Снелл: Случайные блуждания и электрические сети, Математическая ассоциация Америки, 1984
  3. ^ a b Лео Грэди: " Сегментация изображений со случайным ходом с несколькими метками с использованием предшествующих моделей ", Proc. CVPR, Vol. 1. С. 763–770, 2005.
  4. ^ Лео Грейди, Гарет Фанка-Ли: Сегментация изображений с несколькими метками для медицинских приложений на основе теоретико-графических электрических потенциалов , Proc. 8-го семинара ECCV по подходам компьютерного зрения к анализу медицинских изображений и математическим методам в биомедицинском анализе изображений, стр. 230–245, 2004 г.
  5. ^ PG Дойл, JL Снелл: Случайные блуждания и электрические сети, Математические монографии Carus, 1984
  6. ^ TH Kim, KM Lee, SU Lee: Генеративная сегментация изображений с использованием случайных блужданий с перезапуском , Proc. of ECCV 2008, стр. 264–275
  7. ^ J. Wang, M. Agrawala, MF Cohen: Soft scissors: интерактивный инструмент для высококачественного матирования в реальном времени , Proc. СИГГРАФА 2007
  8. ^ С. Рысавый, А. Флорес, Р. Энсизо, К. Окада: критерии классифицируемости для уточнения сегментации случайных блужданий , Proc. ICPR 2008
  9. ^ W. Yang, J. Cai, J. Zheng, J. Luo: Удобная для пользователя интерактивная сегментация изображений с помощью унифицированных комбинаторных пользовательских входов , IEEE Trans. по Image Proc., 2010
  10. ^ C. Chefd'hotel, A. Sebbane: Случайное блуждание и фронтальное распространение на графах смежности водоразделов для сегментации изображений с несколькими метками , Proc. ICV 2007
  11. ^ Р. Жешутек, Т. Эль-Мараги, Д. Андроутсос: сегментация изображений с использованием случайных блужданий в масштабном пространстве , Proc. 16-й Международной конференции по цифровой обработке сигналов, стр. 458–461, 2009 г.
  12. ^ Л. Грэди, А. К. Синоп, " Быстрая приближенная сегментация случайного ходока с использованием предварительного вычисления собственного вектора ". В IEEE Conf. CVPR, стр. 1–8, 2008 г.
  13. ^ С. Эндрюс, Г. Хамарнех, А. Саад. Средство быстрого случайного обхода с априорными значениями с использованием предварительного вычисления для интерактивной сегментации медицинских изображений , Proc. MICCAI 2010
  14. ^ a b Р. Шен, И. Ченг, Дж. Ши, А. Басу: Обобщенные случайные блуждания для слияния изображений с множественной экспозицией , IEEE Trans. по обработке изображений, 2011.
  15. ^ Камилла Купри, Лео Грейди, Лоран Наджман и Хьюг Талбот, « Power Watersheds: Unifying Graph-Based Optimization Framework », IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 33, No. 7, pp. 1384-1399, июль 2011 г.
  16. S. Ram, JJ Rodriguez: Random Walker Watershads: A New Image Segmentation Approach , in IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), pp. 1473-1477, Ванкувер, Канада, май 2013 г.
  17. ^ a b Р. Шен, И. Ченг, А. Басу: Многоэкспозиционное объединение на основе QoE в иерархической многомерной гауссовской CRF , IEEE Trans. по обработке изображений, 2013.
  18. ^ X. Liu, J. Liu, Z. Feng: Colorization Using Segmentation with Random Walk , Computer Analysis of Images and Patterns, pp. 468–475, 2009.
  19. ^ Р. Жешутек, Т. Эль-Мараги, Д. Андроутсос: Интерактивное ротоскопирование с помощью случайных блужданий в масштабном пространстве , Proc. Международной конференции по мультимедиа и выставкам IEEE 2009 г.
  20. ^ SP Dakua, JS Sahambi: Извлечение контура ЛЖ из изображений МРТ сердца с использованием подхода случайных блужданий , Int. Журнал последних тенденций в машиностроении, Том 1, № 3, май 2009 г.
  21. ^ Ф. Майер, А. Виммер, Г. Соза, Дж. Н. Кафтан, Д. Фриц, Р. Диллманн: Автоматическая сегментация печени с использованием алгоритма случайного ходока , Bildverarbeitung für die Medizin 2008
  22. ^ П. Уайтон, М. Садеги, Т.К. Ли, М.С. Аткинс: Полностью автоматическая сегментация случайного ходунка для кожных повреждений в условиях наблюдения , Proc. MICCAI 2009
  23. ^ P. Wattuya, K. Rothaus, JS Prassni, X. Jiang: Подход, основанный на случайном ходьбе, для объединения нескольких сегментов , Proc. ICPR 2008
  24. ^ Ю.-К. Лай, С.-М. Ху, Мартин Р. Р., Розин П. Л.: Быстрая сегментация сетки с использованием случайных блужданий , Proc. симпозиума ACM 2008 г. по твердому телу и физическому моделированию
  25. ^ Дж. Чжан, Дж. Чжэн, Дж. Цай: интерактивное вырезание сетки с использованием ограниченных случайных блужданий , IEEE Trans. по визуализации и компьютерной графике, 2010.
  26. ^ X. Сан, П.Л. Розин, Р.Р. Мартин, Ф.К. Лангбейн: Случайные блуждания для сохранения характеристик сетки шумоподавления , Компьютерный геометрический дизайн, Vol. 25, № 7, октябрь 2008 г., стр. 437–456.
  27. ^ L. Grady, G. Funka-Lea: " Подход к минимизации энергии для управляемого данными редактирования предварительно сегментированных изображений / объемов ", Proc. MICCAI, Vol. 2, 2006, стр. 888–895
  28. ^ Г. Ли, Л. Циншэн, К. Сяосюй: Устранение тени движущегося транспортного средства на основе случайного блуждания и характеристик края, Proc. IITA 2008
  29. ^ Р. Шен, И. Ченг, X. Ли, А. Басу: Стерео сопоставление с использованием случайных блужданий , Proc. ICPR 2008

Внешние ссылки [ править ]

  • Код Matlab, реализующий оригинальный алгоритм случайного блуждания
  • Код Matlab, реализующий алгоритм случайного блуждания с предварительным вычислением
  • Реализация на Python оригинального алгоритма случайного блуждания в наборе инструментов обработки изображений scikit-image