Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Модель сегментированной левой бедренной кости человека . Он показывает внешнюю поверхность (красный), поверхность между компактной костью и губчатой ​​костью (зеленый) и поверхность костного мозга (синий).

В цифровой обработки изображений и компьютерного зрения , сегментации изображений является процесс разбиения цифрового изображения на несколько сегментов ( наборы из пикселей , также известные как объекты изображения). Цель сегментации - упростить и / или изменить представление изображения на что-то более значимое и более простое для анализа. [1] [2] Сегментация изображения обычно используется для определения местоположения объектов и границ (линий, кривых и т. Д.) На изображениях. Точнее, сегментация изображения - это процесс присвоения метки каждому пикселю изображения таким образом, чтобы пиксели с одинаковой меткой обладали определенными характеристиками.

Результат сегментации изображения - это набор сегментов, которые вместе покрывают все изображение, или набор контуров, извлеченных из изображения (см. Определение краев ). Каждый из пикселей в области подобен в отношении некоторых характеристик или вычисленных свойств, таких как цвет , интенсивность или текстура . Соседние регионы значительно различаются по одним и тем же характеристикам. [1] При применении к стопке изображений, типичной для медицинской визуализации , полученные контуры после сегментации изображения можно использовать для создания трехмерных реконструкций с помощью алгоритмов интерполяции, таких как маршевые кубы .[3]

Приложения [ править ]

Объем сегментация 3D-оказанной КТ в грудной клетке : Передняя грудная стенка, дыхательные пути и легочные сосуды передних к корню легкого, были в цифровом виде удалены для того , чтобы визуализировать грудное содержание:
- синие : легочные артерии
- красные : легочные вены (а также брюшная стенка )
- желтый : средостение
- фиолетовый : диафрагма

Некоторые из практических применений сегментации изображений:

  • Поиск изображений на основе содержимого [4]
  • Машинное зрение
  • Медицинская визуализация , [5] [6] в том числе объема оказываемых изображений с компьютерной томографии и магнитно - резонансной томографии .
    • Найдите опухоли и другие патологии [7] [8]
    • Измерьте объемы тканей
    • Диагностика, изучение анатомического строения [9]
    • Планирование операции
    • Виртуальная симуляция хирургии
    • Внутриоперационная навигация
  • Обнаружение объекта [10]
    • Обнаружение пешеходов
    • Распознавание лиц
    • Обнаружение стоп-сигнала
    • Найдите объекты на спутниковых снимках (дороги, леса, посевы и т. Д.)
  • Задачи распознавания
    • Распознавание лица
    • Распознавание отпечатков пальцев
    • Признание ириса
  • Системы управления дорожным движением
  • Видеонаблюдение
  • Совместная сегментация видеообъектов и локализация действий [11] [12]

Для сегментации изображений было разработано несколько универсальных алгоритмов и методов. Чтобы быть полезными, эти методы обычно должны сочетаться с конкретными знаниями предметной области, чтобы эффективно решать проблемы сегментации предметной области.

Классы методов сегментации [ править ]

Есть три класса техник сегментации.

  • Классические подходы
  • Методы на основе искусственного интеллекта
  • Техники, не попадающие в две вышеупомянутые категории. [13]

Группы сегментации изображений [ править ]

  • Семантическая сегментация - это подход, определяющий для каждого пикселя принадлежность к классу объекта. [14] Например, когда все люди на фигуре сегментированы как один объект, а фон - как один объект.
  • Сегментация экземпляров - это подход, который идентифицирует для каждого пикселя принадлежащий ему экземпляр объекта. Он обнаруживает каждый отдельный интересующий объект на изображении. [15] Например, когда каждый человек на фигуре сегментируется как отдельный объект.

Порог [ править ]

Самый простой метод сегментации изображения называется методом пороговой обработки . Этот метод основан на уровне клипа (или пороговом значении) для преобразования полутонового изображения в двоичное изображение.

Ключевым моментом этого метода является выбор порогового значения (или значений при выборе нескольких уровней). В промышленности используются несколько популярных методов, в том числе метод максимальной энтропии, пороговая обработка сбалансированной гистограммы , метод Оцу (максимальная дисперсия) и кластеризация k-средних .

В последнее время были разработаны методы определения пороговых значений изображений компьютерной томографии (КТ). Ключевая идея заключается в том, что, в отличие от метода Оцу, пороговые значения выводятся на основе рентгенограмм, а не (реконструированного) изображения. [16] [17]

Новые методы предполагали использование многомерных нелинейных пороговых значений на основе нечетких правил. В этих работах решение о принадлежности каждого пикселя к сегменту основано на многомерных правилах, полученных из нечеткой логики и эволюционных алгоритмов, основанных на среде освещения изображения и приложении. [18]

Методы кластеризации [ править ]

Изображение после запуска k- средних с k = 16 . Обратите внимание, что распространенный метод повышения производительности для больших изображений - это уменьшить разрешение изображения, вычислить кластеры, а затем при необходимости переназначить значения большему изображению.

Алгоритм K-средство представляет собой итеративный метод , который используется для разбиения изображения на K кластеров. [19] Основной алгоритм является

  1. Выберите K кластерных центров либо случайным образом, либо на основе какого-либо эвристического метода, например K-средних ++
  2. Назначьте каждый пиксель изображения кластеру, чтобы минимизировать расстояние между пикселем и центром кластера.
  3. Пересчитайте центры кластера, усреднив все пиксели в кластере.
  4. Повторяйте шаги 2 и 3 до тех пор, пока не будет достигнута сходимость (т. Е. Кластеры не изменятся пикселями).

В этом случае расстояние - это квадрат или абсолютная разница между пикселем и центром кластера. Разница обычно основана на цвете пикселя , интенсивности , текстуре и местоположении или на взвешенной комбинации этих факторов. K можно выбрать вручную, случайным образом или с помощью эвристики . Этот алгоритм гарантированно сходится, но он может не вернуть оптимальное решение. Качество решения зависит от исходного набора кластеров и значения K .

Движение и интерактивная сегментация [ править ]

Сегментация на основе движения - это метод, основанный на движении изображения для выполнения сегментации.

Идея проста: посмотрите на различия между парой изображений. Если предположить, что интересующий объект движется, разница будет именно в этом объекте.

Улучшив эту идею, Kenney et al. предложена интерактивная сегментация [2] . Они используют робота, чтобы толкать объекты, чтобы генерировать сигнал движения, необходимый для сегментации на основе движения.

Интерактивная сегментация следует структуре интерактивного восприятия, предложенной Довом Кацем [3] и Оливером Броком [4] .

Методы на основе сжатия [ править ]

Методы, основанные на сжатии, постулируют, что оптимальная сегментация - это та, которая минимизирует по всем возможным сегментам длину кодирования данных. [20] [21] Связь между этими двумя концепциями заключается в том, что сегментация пытается найти закономерности в изображении, и любая регулярность изображения может использоваться для его сжатия. Метод описывает каждый сегмент своей текстурой и формой границы. Каждый из этих компонентов моделируется функцией распределения вероятностей, и длина его кодирования вычисляется следующим образом:

  1. Кодирование границ использует тот факт, что области естественных изображений имеют тенденцию иметь гладкий контур. Этот предварительный код используется при кодировании Хаффмана для кодирования кода цепочки разностей контуров изображения. Таким образом, чем более гладкая граница, тем короче длина кодирования, которую она достигает.
  2. Текстура кодируется сжатием с потерями аналогично принципу минимальной длины описания (MDL), но здесь длина данных, заданных в модели, аппроксимируется числом выборок, умноженным на энтропию модели. Текстура в каждой области моделируется многомерным нормальным распределением , энтропия которого имеет выражение в замкнутой форме. Интересным свойством этой модели является то, что оцененная энтропия ограничивает истинную энтропию данных сверху. Это связано с тем, что среди всех распределений с заданным средним значением и ковариацией нормальное распределение имеет наибольшую энтропию. Таким образом, истинная длина кодирования не может быть больше той, которую алгоритм пытается минимизировать.

Для любой данной сегментации изображения эта схема дает количество битов, необходимых для кодирования этого изображения на основе данной сегментации. Таким образом, среди всех возможных сегментов изображения цель состоит в том, чтобы найти сегментацию, которая дает наименьшую длину кодирования. Этого можно добиться с помощью простого метода агломерационной кластеризации. Искажение при сжатии с потерями определяет грубость сегментации, и его оптимальное значение может отличаться для каждого изображения. Этот параметр можно эвристически оценить по контрасту текстур на изображении. Например, когда текстуры в изображении похожи, например, в камуфляжных изображениях, требуется более высокая чувствительность и, следовательно, меньшее квантование.

Методы на основе гистограмм [ править ]

Методы, основанные на гистограммах , очень эффективны по сравнению с другими методами сегментации изображения, поскольку обычно для них требуется только один проход через пиксели . В этом методе гистограмма вычисляется по всем пикселям изображения, а пики и впадины на гистограмме используются для определения местоположения кластеров на изображении. [1] В качестве меры можно использовать цвет или интенсивность .

Уточнение этого метода состоит в том, чтобы рекурсивно применять метод поиска гистограммы к кластерам в изображении, чтобы разделить их на более мелкие кластеры. Эта операция повторяется с все меньшими и меньшими кластерами, пока не перестанут образовываться кластеры. [1] [22]

Одним из недостатков метода поиска гистограммы является то, что может быть трудно идентифицировать значимые пики и впадины на изображении.

Подходы на основе гистограмм также можно быстро адаптировать для применения к нескольким кадрам, сохраняя при этом их эффективность за один проход. Гистограмма может быть построена несколькими способами, если рассматривается несколько кадров. Тот же подход, который применяется к одному кадру, может быть применен к нескольким, и после объединения результатов пики и впадины, которые ранее было трудно идентифицировать, с большей вероятностью будут различимы. Гистограмма также может применяться на попиксельной основе, где полученная информация используется для определения наиболее частого цвета для местоположения пикселя. Этот подход сегментирует на основе активных объектов и статической среды, что приводит к другому типу сегментации, полезной при отслеживании видео .

Обнаружение края [ править ]

Обнаружение краев - это хорошо развитая область обработки изображений. Границы и края областей тесно связаны, так как часто происходит резкое изменение интенсивности на границах области. Поэтому методы обнаружения краев были использованы в качестве основы для другого метода сегментации.

Края, идентифицированные с помощью обнаружения кромок, часто не соединяются. Однако, чтобы отделить объект от изображения, нужны замкнутые границы области. Желаемые края - это границы между такими объектами или пространственными таксонами. [23] [24]

Пространственные таксоны [25] - это информационные гранулы [26], состоящие из четкой пиксельной области, размещенной на уровнях абстракции в иерархической вложенной архитектуре сцены. Они похожи на гештальт- психологическое обозначение фигуры-фона, но расширены, чтобы включать передний план, группы объектов, объекты и заметные части объекта. Методы обнаружения краев могут применяться к области пространственного таксона точно так же, как они применяются к силуэту. Этот метод особенно полезен, когда отключенный край является частью иллюзорного контура [27] [28]

Методы сегментации также могут применяться к кромкам, полученным с помощью детекторов кромок. Линдеберг и Ли [29] разработали интегрированный метод, который сегментирует кромки на прямые и изогнутые кромочные сегменты для распознавания объектов на основе частей на основе критерия минимальной длины описания (M DL ), который был оптимизирован методом, подобным разделению и слиянию. с точками-кандидатами, полученными из дополнительных реплик соединений, чтобы получить более вероятные точки, в которых следует рассматривать разбиения на разные сегменты.

Метод двойной кластеризации [ править ]

Этот метод представляет собой комбинацию трех характеристик изображения: разбиение изображения на основе анализа гистограмм проверяется высокой компактностью кластеров (объектов) и высокими градиентами их границ. Для этого необходимо ввести два пространства: одно пространство - одномерная гистограмма яркости HH ( B ); второе пространство - это двойное трехмерное пространство самого исходного изображения BB ( xy ). Первое пространство позволяет измерить, насколько компактно распределена яркость изображения, вычисляя минимальную кластеризацию kmin. Пороговая яркость T, соответствующая kmin, определяет двоичное (черно-белое) изображение - растровое изображение.бφ ( ху ), где φ ( ху ) = 0, если B ( ху ) <  Т , и φ ( ху ) = 1, если B ( ху ) ≥  T . Растровое изображение b - это объект в двойном пространстве. На этом растровом изображении необходимо определить меру, отражающую, насколько компактно распределены черные (или белые) пиксели. Итак, цель - найти объекты с хорошими границами. Для всех T мера M DCG / ( k  ×  L ) должно быть вычислено (где k - разница в яркости между объектом и фоном, L - длина всех границ, а G - средний градиент на границах). Максимум MDC определяет сегментацию. [30]

Способы выращивания регионов [ править ]

Методы наращивания области основаны в основном на предположении, что соседние пиксели в одной области имеют одинаковые значения. Обычная процедура - это сравнение одного пикселя с его соседями. Если критерий подобия удовлетворен, пиксель может быть установлен так, чтобы он принадлежал тому же кластеру, что и один или несколько его соседей. Выбор критерия подобия важен, и на результаты во всех случаях влияет шум.

Метод статистического объединения областей [31] (SRM) начинается с построения графа пикселей с использованием 4-связности с краями, взвешенными по абсолютной величине разности интенсивностей. Первоначально каждый пиксель образует одну пиксельную область. Затем SRM сортирует эти края в очереди по приоритету и решает, следует ли объединить текущие области, принадлежащие краевым пикселям, с использованием статистического предиката.

Одним из методов выращивания области является метод выращивания области с посевом. Этот метод принимает набор семян в качестве входных данных вместе с изображением. Семена отмечают каждый из объектов, которые нужно сегментировать. Области итеративно увеличиваются путем сравнения всех нераспределенных соседних пикселей с областями. Разница между значением интенсивности пикселя и средним значением области используется в качестве меры сходства . Пиксель с наименьшей разницей, измеренной таким образом, назначается соответствующей области. Этот процесс продолжается до тех пор, пока все пиксели не будут присвоены области. Поскольку для выращивания посевной области требуются семена в качестве дополнительных входных данных, результаты сегментации зависят от выбора семян, а шум на изображении может привести к неправильному размещению семян.

Другой метод выращивания регионов - это метод выращивания незасеянных регионов. Это модифицированный алгоритм, не требующий явных начальных чисел. Он начинается с одной области - выбранный здесь пиксель не оказывает заметного влияния на окончательную сегментацию. На каждой итерации он учитывает соседние пиксели так же, как растёт засеянная область. Он отличается от выращивания засеянной области тем, что если минимум меньше заранее определенного порога, то он добавляется в соответствующую область . В противном случае пиксель считается отличным от всех текущих областей, и с этим пикселем создается новая область .

Один из вариантов этого метода, предложенный Хараликом и Шапиро (1985), [1] , основан на интенсивности пикселей . Средний и разброс региона и интенсивность кандидата пикселя используются для вычисления тестовой статистики. Если статистика теста достаточно мала, пиксель добавляется к области, а среднее значение области и разброс пересчитываются. В противном случае пиксель отклоняется и используется для формирования новой области.

Особый метод наращивания области называется -связной сегментацией (см. Также лямбда-связность ). Он основан на интенсивности пикселей и путях связывания соседей. Степень связности (связности) рассчитывается на основе пути, образованного пикселями. Для определенного значения два пикселя называются -связанными, если существует путь, соединяющий эти два пикселя, и связность этого пути не меньше . -связность - это отношение эквивалентности. [32]

Сегментация с разделением и слиянием основана на разделе изображения в виде дерева квадрантов . Иногда это называют сегментацией дерева квадрантов.

Этот метод начинается с корня дерева, представляющего все изображение. Если он оказывается неоднородным (неоднородным), то он разбивается на четыре дочерних квадрата (процесс разделения) и так далее. Если, напротив, четыре дочерних квадрата однородны, они объединяются как несколько связанных компонентов (процесс объединения). Узел в дереве - это сегментированный узел. Этот процесс продолжается рекурсивно до тех пор, пока дальнейшие разделения или слияния не станут невозможными. [33] [34] Когда в реализации алгоритма метода задействована специальная структура данных, ее временная сложность может достигать оптимального алгоритма метода. [35]

Методы на основе дифференциальных уравнений в частных производных [ править ]

Используя метод на основе уравнения в частных производных (PDE) и решая уравнение PDE с помощью числовой схемы, можно сегментировать изображение. [36] Распространение кривой - популярный метод в этой категории, с многочисленными приложениями для извлечения объектов, отслеживания объектов, стерео реконструкции и т. Д. Центральная идея состоит в том, чтобы развить начальную кривую в направлении наименьшего потенциала функции стоимости, где ее определение отражает задача, которую нужно решить. Что касается большинства обратных задач , минимизация функционала стоимости является нетривиальной и накладывает определенные ограничения гладкости на решение, которые в данном случае могут быть выражены как геометрические ограничения на развивающуюся кривую.

Параметрические методы [ править ]

Лагранжевые методы основаны на параметризации контура в соответствии с некоторой стратегией выборки и последующем развитии каждого элемента в соответствии с изображением и внутренними условиями. Такие методы являются быстрыми и эффективными, однако первоначальная «чисто параметрическая» формулировка (введенная Кассом , Уиткиным и Терзопулосом в 1987 г. и известная как « змеи»"), обычно критикуют за его ограничения в отношении выбора стратегии выборки, внутренних геометрических свойств кривой, изменений топологии (разделение и слияние кривой), решения проблем в более высоких измерениях и т. д. В настоящее время эффективные" дискретизированные "формулировки имеют были разработаны для устранения этих ограничений при сохранении высокой эффективности.В обоих случаях минимизация энергии обычно проводится с использованием спуска с наивысшим градиентом, в результате чего производные вычисляются с использованием, например, конечных разностей.

Методы установки уровня [ править ]

Метод установки уровня был первоначально предложен для отслеживания движущихся поверхностей раздела Дервье и Томассет [37] [38] в 1979 и 1981 годах, а позже был заново изобретен Ошером и Сетиан в 1988 году [39].В конце 1990-х это распространилось на различные области визуализации. Его можно использовать для эффективного решения проблемы кривой / поверхности / и т. Д. распространение неявным образом. Основная идея состоит в том, чтобы представить развивающийся контур с помощью функции со знаком, ноль которой соответствует фактическому контуру. Тогда, согласно уравнению движения контура, можно легко получить аналогичный поток для неявной поверхности, который при применении к нулевому уровню будет отражать распространение контура. Метод установки уровней дает множество преимуществ: он неявный, не содержит параметров, обеспечивает прямой способ оценки геометрических свойств развивающейся структуры, позволяет изменять топологию и является внутренним. Его можно использовать для определения структуры оптимизации, предложенной Чжао, Мерриманом и Ошером в 1996 году.Можно сделать вывод, что это очень удобная среда для решения многочисленных приложений компьютерного зрения и анализа медицинских изображений.[40] Исследования различных структур данных с набором уровней привели к очень эффективной реализации этого метода.

Методы быстрого передвижения [ править ]

Метод быстрого перехода использовался при сегментации изображения [41], и эта модель была улучшена (допуская как положительные, так и отрицательные скорости распространения) в подходе, называемом обобщенным методом быстрого перехода. [42]

Вариационные методы [ править ]

Цель вариационных методов - найти сегментацию, оптимальную по отношению к конкретному функционалу энергии. Функционалы состоят из члена аппроксимации данных и регуляризующего члена. Классическим представителем является модель Потс определена для изображения с помощью

Минимизатор - это кусочно-постоянное изображение, которое имеет оптимальный компромисс между квадратом расстояния L2 до данного изображения и общей длиной его набора скачков. Набор переходов определяет сегментацию. Относительный вес энергий настраивается параметром . Бинарный вариант модели Поттса, т. Е. Если диапазон ограничен двумя значениями, часто называют моделью Чанвеса . [43] Важным обобщением является модель Мамфорда-Шаха [44], данная

Функциональное значение - это сумма общей длины кривой сегментации , гладкости аппроксимации и расстояния до исходного изображения . Вес штрафа за гладкость регулируется на . Модель Поттса часто называют кусочно-постоянной моделью Мамфорда-Шаха, поскольку ее можно рассматривать как вырожденный случай . Как известно, задачи оптимизации в целом являются NP-трудными, но стратегии, близкие к минимизации, хорошо работают на практике. Классические алгоритмы - это градуированная невыпуклость и приближение Амброзио-Торторелли .

Методы разбиения графа [ править ]

Методы разделения графа являются эффективными инструментами для сегментации изображений, поскольку они моделируют влияние окрестностей пикселей на данный кластер пикселей или пиксель в предположении однородности изображений. В этих методах изображение моделируется как взвешенный неориентированный граф . Обычно пиксель или группа пикселей связаны с узлами, а веса краев определяют (не) сходство между соседними пикселями. Затем граф (изображение) разделяется в соответствии с критерием, разработанным для моделирования «хороших» кластеров. Каждый раздел узлов (пикселей), выводимых этими алгоритмами, считается сегментом объекта на изображении. Некоторые популярные алгоритмы этой категории - это нормализованные разрезы, [45] случайное блуждание ,[46] минимальный разрез, [47] изопериметрическое разбиение, [48] минимальная сегментация на основе остовного дерева , [49] и категоризация объектов на основе сегментации .

Марковские случайные поля [ править ]

Применение марковских случайных полей (MRF) для изображений было предложено в начале 1984 г. Геманом и Геманом. [50] Их сильная математическая основа и способность обеспечивать глобальный оптимум даже при определении локальных характеристик оказались основой новых исследований в области анализа изображений, уменьшения шума и сегментации. MRF полностью характеризуются своими априорными распределениями вероятностей, распределениями предельных вероятностей, кликами , ограничением сглаживания, а также критерием обновления значений. Критерий сегментации изображения с использованием MRF переформулируется как нахождение схемы маркировки, которая имеет максимальную вероятность для данного набора функций. Широкие категории сегментации изображений с использованием MRF включают контролируемую и неконтролируемую сегментацию.

Контролируемая сегментация изображений с использованием MRF и MAP [ править ]

С точки зрения сегментации изображения функция, которую MRF стремятся максимизировать, - это вероятность идентификации схемы маркировки при условии, что в изображении обнаружен конкретный набор функций. Это повторение метода максимальной апостериорной оценки .

Окрестности MRF для выбранного пикселя

Общий алгоритм сегментации изображений с использованием MAP приведен ниже:

  1. Определите окрестности каждого объекта (случайная величина в терминах MRF).
    Обычно это включает в себя соседей 1-го или 2-го порядка.
  2. Установите начальные вероятности P ( f i ) > для каждого объекта как 0 или
  3. где f i ∈ Σ - это набор, содержащий признаки, извлеченные
    для пикселя i и определяющие начальный набор кластеров.
  4. Используя данные обучения, вычислите среднее значение ( μ i ) и дисперсию ( σ i ) для каждой метки. Это называется классовой статистикой.
  5. Вычислите маржинальное распределение для данной схемы разметки P ( f i  |  i ), используя теорему Байеса и статистику классов, вычисленную ранее. Для маржинального распределения используется гауссовская модель.
  6. Вычислите вероятность каждой метки класса с учетом ранее определенной окрестности. Потенциалы
    клики используются для моделирования социального воздействия маркировки.
  7. Перебирайте новые априорные вероятности и переопределяйте кластеры так, чтобы эти вероятности были максимальными.
    Это делается с помощью множества алгоритмов оптимизации, описанных ниже.
  8. Остановитесь, когда вероятность максимальна и схема маркировки не изменится.
    Расчеты также могут быть реализованы в терминах логарифмического правдоподобия .

Алгоритмы оптимизации [ править ]

Каждый алгоритм оптимизации представляет собой адаптацию моделей из различных областей, и они отличаются своими уникальными функциями стоимости. Общей чертой функций стоимости является наказание за изменение значения пикселя, а также за разницу в метке пикселя по сравнению с метками соседних пикселей.

Итерированные условные режимы / градиентный спуск [ править ]

Итерироваться условные режимы алгоритм (ИВМ) пытается восстановить схему идеальной маркировки путем изменения значения каждого пикселя над каждой итерации и оценки энергии новой схемы маркировки с использованием функции затрат , приведенной ниже,

где α - штраф за изменение метки пикселя, а β - штраф за разницу в метке между соседними пикселями и выбранным пикселем. Здесь окрестность пикселя i, а δ - дельта-функция Кронекера. Основная проблема с ICM заключается в том, что, как и в случае с градиентным спуском, он имеет тенденцию задерживаться над локальными максимумами и, таким образом, не может получить глобально оптимальную схему маркировки.

Имитация отжига (SA) [ править ]

Полученный как аналог отжига в металлургии, имитация отжига (SA) использует изменение метки пикселя во время итераций и оценивает разницу в энергии каждого вновь сформированного графа с исходными данными. Если вновь сформированный график более выгоден с точки зрения низкой стоимости энергии, рассчитывается следующим образом:

алгоритм выбирает вновь сформированный граф. Имитация отжига требует ввода температурных графиков, которые напрямую влияют на скорость сходимости системы, а также на энергетический порог для минимизации.

Альтернативные алгоритмы [ править ]

Существует ряд других методов для решения простых MRF, а также MRF более высокого порядка. Они включают в себя максимизацию заднего края, многомасштабную оценку MAP, [51] сегментацию с несколькими разрешениями [52] и другие. Помимо оценок правдоподобия, для решения MRF существуют вырезание графа с использованием максимального потока [53] и другие сильно ограниченные методы на основе графов [54] [55] .

Сегментация изображения с использованием MRF и максимального ожидания [ править ]

Алгоритм ожидания Максимизация используется для итерационного оценить заднюю вероятности и распределения мечения , когда никакой подготовки данных не имеется , и никакой оценки сегментации модели не может быть сформирована. Общий подход состоит в том, чтобы использовать гистограммы для представления характеристик изображения и действовать, как кратко изложено в этом трехэтапном алгоритме:

1. Используется случайная оценка параметров модели.

2. Шаг E: оценка статистики класса на основе определенной модели случайной сегментации. Используя их, вычислите условную вероятность принадлежности к метке, учитывая, что набор функций рассчитывается с использованием наивной теоремы Байеса .

Здесь набор всех возможных этикеток.

3. Шаг M: Установленная релевантность данного набора характеристик схеме маркировки теперь используется для вычисления априорной оценки данной метки во второй части алгоритма. Поскольку фактическое количество общих меток неизвестно (из набора обучающих данных), в вычислениях используется скрытая оценка количества меток, заданных пользователем.

где - набор всех возможных функций.

Сегментация цветного изображения с использованием модели HMRF-EM

Недостатки сегментации изображений на основе MAP и EM [ править ]

  1. Точные оценки MAP не могут быть легко вычислены.
  2. Приблизительные оценки MAP требуют больших вычислительных ресурсов для вычисления.
  3. Расширение до мультиклассовой маркировки снижает производительность и увеличивает необходимое пространство для хранения.
  4. Для достижения глобальных оптимумов требуется надежная оценка параметров ЭМ.
  5. На основе метода оптимизации сегментация может группироваться до локальных минимумов.

Трансформация водораздела [ править ]

Преобразование водораздела рассматривает величину градиента изображения как топографической поверхности. Пиксели, имеющие наивысшие значения интенсивности градиента (GMI), соответствуют линиям водоразделов, которые представляют границы области. Вода, помещенная на любой пиксель, ограниченный общей линией водораздела, течет вниз до общего локального минимума интенсивности (LIM). Пиксели, стекающие к общему минимуму, образуют бассейн, который представляет собой сегмент. .

Сегментация на основе модели [ править ]

Центральное предположение подходов, основанных на моделях, состоит в том, что интересующие структуры имеют тенденцию к определенной форме. Следовательно, можно искать вероятностную модель, которая характеризует форму и ее изменение. При сегментировании изображения ограничения могут быть наложены с использованием этой модели в качестве априорной. [56] Такая задача может включать (i) регистрацию обучающих примеров в общей позе, (ii) вероятностное представление вариации зарегистрированных образцов и (iii) статистический вывод между моделью и изображением. Другие важные методы в литературе для сегментации на основе модели включают активные модели формы и активные модели внешнего вида .

Многомасштабная сегментация [ править ]

Сегментация изображения вычисляется в нескольких масштабах в пространстве шкалы и иногда распространяется от грубого до мелкого масштаба; см. сегментацию пространства масштаба .

Критерии сегментации могут быть сколь угодно сложными и могут учитывать как глобальные, так и локальные критерии. Общее требование состоит в том, что каждый регион должен быть в некотором смысле связан.

Одномерная иерархическая сегментация сигнала [ править ]

Основополагающая работа Виткина [57] [58] в масштабном пространстве включала понятие, что одномерный сигнал может быть однозначно сегментирован на области, с одним параметром масштаба, контролирующим масштаб сегментации.

Ключевое наблюдение состоит в том, что пересечения нуля вторых производных (минимумов и максимумов первой производной или наклона) многомасштабных сглаженных версий сигнала образуют дерево вложенности, которое определяет иерархические отношения между сегментами на разных масштабах. В частности, экстремумы наклона на крупных масштабах можно проследить до соответствующих особенностей на мелких масштабах. Когда максимум наклона и минимум наклона аннигилируют друг друга в большем масштабе, три сегмента, которые они разделяют, сливаются в один сегмент, тем самым определяя иерархию сегментов.

Сегментация изображения и первичный набросок [ править ]

В этой области было проведено множество исследовательских работ, из которых некоторые сейчас достигли состояния, когда они могут применяться либо с интерактивным ручным вмешательством (обычно применительно к медицинской визуализации), либо полностью автоматически. Ниже приводится краткий обзор некоторых основных исследовательских идей, на которых основаны современные подходы.

Однако структура вложенности, описанная Уиткиным, специфична для одномерных сигналов и нетривиально переносится на изображения более высокой размерности. Тем не менее, эта общая идея вдохновила нескольких других авторов на исследование схем от грубого к точному для сегментации изображений. Кендеринк [59] предложил изучить, как изоинтенсивные контуры эволюционируют по масштабам, и этот подход более подробно исследовали Лифшиц и Пайзер. [60] К сожалению, однако, интенсивность элементов изображения изменяется в зависимости от масштаба, что означает, что трудно отследить крупномасштабные элементы изображения до более мелких масштабов, используя информацию изоинтенсивности.

Линдеберг [61] [62] изучил проблему связывания локальных экстремумов и седловых точек на масштабах и предложил представление изображения, называемое первичным эскизом в масштабном пространстве, которое делает явными отношения между структурами в разных масштабах, а также указывает, какие особенности изображения стабильны в широком диапазоне масштабов, включая соответствующие для них масштабы. Бергхольм предложил обнаруживать края в грубых масштабах в пространстве масштабов, а затем прослеживать их до более мелких масштабов с ручным выбором шкалы грубого обнаружения и шкалы точной локализации.

Gauch и Pizer [63] изучили дополнительную проблему гребней и долин в нескольких масштабах и разработали инструмент для интерактивной сегментации изображений на основе многомасштабных водоразделов. Использование многомасштабного водораздела с приложением к карте градиента также исследовалось Олсеном и Нильсеном [64] и было перенесено в клиническое использование компанией Dam. [65] Винкен и др. [66] предложил гиперстек для определения вероятностных отношений между структурами изображения в различных масштабах. Ахуджа [67] [68] поддержал использование стабильных структур изображения в масштабе.и его коллег в полностью автоматизированную систему. Полностью автоматический алгоритм сегментации мозга, основанный на тесно связанных идеях многомасштабных водоразделов, был представлен Ундеманом и Линдебергом [69] и тщательно протестирован в базах данных мозга.

Эти идеи многомасштабной сегментации изображения путем связывания структур изображения по масштабам также были подхвачены Флорак и Куиджпер. [70] Биджауи и Руэ [71] связывают структуры, обнаруженные в масштабном пространстве выше минимального порога шума, с деревом объектов, которое охватывает несколько масштабов и соответствует некоторому типу признака в исходном сигнале. Извлеченные объекты точно реконструируются с использованием итеративного метода матрицы сопряженных градиентов.

Полуавтоматическая сегментация [ править ]

В одном из видов сегментации пользователь выделяет интересующую область с помощью щелчков мышью, и применяются алгоритмы, так что путь, который лучше всего подходит к краю изображения, отображается.

В этом виде сегментации используются такие методы, как SIOX , Livewire , Intelligent Scissors или IT-SNAPS. В альтернативном виде полуавтоматической сегментации алгоритмы возвращают пространственный таксон (т.е. передний план, группу объектов, объект или часть объекта), выбранный пользователем или обозначенный через априорные вероятности. [72] [73]

Обучаемая сегментация [ править ]

Большинство вышеупомянутых методов сегментации основаны только на информации о цвете пикселей изображения. Люди используют гораздо больше знаний при выполнении сегментации изображений, но реализация этих знаний потребует значительных затрат человеческих инженерных и вычислительных затрат и потребует огромной базы данных знаний в предметной области, которой в настоящее время не существует. Обучаемые методы сегментации, такие как сегментация нейронной сети, позволяют преодолеть эти проблемы, моделируя знания предметной области из набора данных с помеченными пикселями.

Нейронная сеть сегментации изображений может обрабатывать небольшие области изображения для извлечения простых функций, таких как края. [74] Другая нейронная сеть или любой другой механизм принятия решений может затем объединить эти функции, чтобы соответствующим образом пометить области изображения. Разновидностью сети, построенной таким образом, является карта Кохонена .

Нейронные сети с импульсной связью (PCNN) - это нейронные модели, предложенные путем моделирования зрительной коры головного мозга кошки и разработанные для высокопроизводительной биомиметической обработки изображений . В 1989 году Райнхард Экхорн представил нейронную модель, имитирующую механизм зрительной коры головного мозга кошки. Модель Экхорна предоставила простой и эффективный инструмент для изучения зрительной коры мелких млекопитающих и вскоре была признана имеющей значительный потенциал применения в обработке изображений. В 1994 году модель Экхорна была адаптирована как алгоритм обработки изображений Джоном Л. Джонсоном, который назвал этот алгоритм импульсной нейронной сетью. [75]За последнее десятилетие PCNN использовались для множества приложений обработки изображений, в том числе для сегментации изображений, генерации функций, выделения лиц, обнаружения движения, увеличения области, уменьшения шума и т. Д. PCNN - это двухмерная нейронная сеть. Каждый нейрон в сети соответствует одному пикселю во входном изображении, получая информацию о цвете соответствующего пикселя (например, интенсивность) в качестве внешнего стимула. Каждый нейрон также соединяется со своими соседними нейронами, получая от них локальные стимулы. Внешние и местные стимулы объединяются во внутреннюю систему активации, которая накапливает стимулы до тех пор, пока не превысит динамический порог, что приводит к импульсному выходу. Путем итеративного вычисления нейроны PCNN производят временные серии выходных импульсов.Временной ряд выходных импульсов содержит информацию о входных изображениях и может использоваться для различных приложений обработки изображений, таких как сегментация изображения и генерация признаков. По сравнению с обычными средствами обработки изображений, PCNN имеют несколько существенных достоинств, включая устойчивость к шуму, независимость от геометрических изменений во входных рисунках, способность преодолевать незначительные изменения интенсивности во входных рисунках и т. Д.

U-Net - это сверточная нейронная сеть, которая принимает на вход изображение и выводит метку для каждого пикселя. [76] U-Net изначально был разработан для обнаружения границ клеток на биомедицинских изображениях. U-Net следует классическому автоэнкодеруархитектура, как таковая, состоит из двух подструктур. Структура кодировщика следует традиционному стеку сверточных слоев и слоев максимального пула, чтобы уменьшить принимающее поле, когда оно проходит через слои. Он используется для фиксации контекста изображения. В структуре декодера используются транспонированные сверточные слои для повышения дискретизации, так что конечные размеры близки к размерам входного изображения. Пропускные соединения размещаются между сверточными и транспонированными сверточными слоями одинаковой формы, чтобы сохранить детали, которые в противном случае были бы потеряны.

В дополнение к задачам семантической сегментации на уровне пикселей, которые присваивают заданную категорию каждому пикселю, современные приложения сегментации включают задачи семантической сегментации на уровне экземпляра, в которых каждый человек в данной категории должен быть уникально идентифицирован, а также задачи паноптической сегментации, которые объединяют эти две задачи для обеспечения более полной сегментации сцены. [77]

Сегментация похожих изображений и видео [ править ]

Связанные изображения, такие как фотоальбом или последовательность видеокадров, часто содержат семантически похожие объекты и сцены, поэтому часто полезно использовать такие корреляции. [78] Задача одновременно сегментации сцены из связанных изображений или видеокадров, называется со-сегментация , [11] , который обычно используется в локализации действий человека . В отличие от обычного обнаружения объектов на основе ограничивающего прямоугольника , методы локализации действий человека обеспечивают более детализированные результаты, обычно сегментируя маски по изображению, очерчивая интересующий человеческий объект и его категорию действия (например, сегмент-трубка [12] ). Такие методы, как динамическиеМарковские сети , CNN и LSTM часто используются для использования межкадровых корреляций.

Другие методы [ править ]

Существует множество других методов сегментации, таких как мультиспектральная сегментация или сегментация на основе связности, основанная на изображениях DTI . [79] [80]

Тестирование сегментации [ править ]

Доступны несколько тестов сегментации для сравнения производительности методов сегментации с современными методами сегментации на стандартизованных наборах:

  • Он-лайн бенчмарк сегментации текстур в Праге [81]
  • Набор данных сегментации Беркли и эталонный тест [82]

См. Также [ править ]

  • Совместная сегментация объектов
  • Компьютерное зрение
  • Создание сетки на основе изображений
  • Сегментация изображения диапазона
  • Векторное квантование
  • Квантование изображения
  • Цветовое квантование
  • Объектно-ориентированный анализ изображений
  • Список инструментов ручного аннотирования изображений

Заметки [ править ]

  1. ^ a b c d e Линда Г. Шапиро и Джордж К. Стокман (2001): «Компьютерное зрение», стр. 279–325, Нью-Джерси, Прентис-Холл, ISBN  0-13-030796-3
  2. ^ Баргут, Лорен и Лоуренс В. Ли. «Система обработки перцептивной информации». Заявка на патент США 10/618 543 компании Paravue Inc., поданная 11 июля 2003 г.
  3. ^ Zachow, Стефан, Майкл Zilske, и Ханс-Кристиан Хеге. « Трехмерная реконструкция индивидуальной анатомии по данным медицинских изображений: сегментация и обработка геометрии ». (2007).
  4. ^ Белонги, Серж и др. « Сегментация изображения на основе цвета и текстуры с использованием EM и его применения для поиска изображений на основе содержимого ». Шестая международная конференция по компьютерному зрению (IEEE Cat. No. 98CH36271). IEEE, 1998.
  5. ^ Pham, Dzung L .; Сюй, Чэньян; Принц, Джерри Л. (2000). «Современные методы сегментации медицинских изображений». Ежегодный обзор биомедицинской инженерии . 2 : 315–337. DOI : 10.1146 / annurev.bioeng.2.1.315 . PMID 11701515 . 
  6. ^ Форгани, М .; Forouzanfar, M .; Тешнехлаб М. (2010). «Оптимизация параметров улучшенного алгоритма кластеризации нечетких c-средних для сегментации МРТ изображений головного мозга». Инженерные приложения искусственного интеллекта . 23 (2): 160–168. DOI : 10.1016 / j.engappai.2009.10.002 .
  7. ^ W. Wu, AYC Chen, L. Zhao и JJ Corso (2014): «Обнаружение и сегментация опухолей головного мозга в рамках CRF с попарно-пиксельным сродством и функциями суперпиксельного уровня», Международный журнал компьютерной радиологии и хирургии, С. 241–253. 9.
  8. ^ EB Джордж и М. Карнан (2012): « МРТ сегментация изображений мозга с использованием алгоритма оптимизации сбора бактерий », Международный журнал инженерии и технологий , Vol. 4.
  9. ^ Камалаканнан, Шридхаран; Гурураджан, Арункумар; Сари-Сарраф, Хамед; Родни, Лонг; Антани, Самир (17 февраля 2010 г.). «Обнаружение двойного края рентгенографических изображений поясничных позвонков с использованием сжатых открытых змей DGVF». IEEE Transactions по биомедицинской инженерии . 57 (6): 1325–1334. DOI : 10.1109 / tbme.2010.2040082 . PMID 20172792 . S2CID 12766600 .  
  10. ^ Дж. А. Дельмерико, П. Дэвид и Дж. Дж. Корсо (2011): « Обнаружение фасадов зданий, сегментация и оценка параметров для локализации и управления мобильными роботами », Международная конференция по интеллектуальным роботам и системам, стр. 1632–1639.
  11. ^ а б Лю, Цзыи; Ван, Ле; Хуа, банда; Чжан, Цилинь; Ню, Чжэньсин; Ву, Инь; Чжэн, Наньнин (2018). «Совместное обнаружение и сегментация видеообъектов с помощью связанных динамических марковских сетей» (PDF) . IEEE Transactions по обработке изображений . 27 (12): 5840–5853. Bibcode : 2018ITIP ... 27.5840L . DOI : 10.1109 / tip.2018.2859622 . ISSN 1057-7149 . PMID 30059300 . S2CID 51867241 .    
  12. ^ а б Ван, Ле; Дуань, Сюйхуань; Чжан, Цилинь; Ню, Чжэньсин; Хуа, банда; Чжэн, Наньнин (22.05.2018). «Сегмент-трубка: пространственно-временная локализация действия в видео без обрезки с покадровой сегментацией» (PDF) . Датчики . 18 (5): 1657. DOI : 10,3390 / s18051657 . ISSN 1424-8220 . PMC 5982167 . PMID 29789447 .    
  13. ^ АМЗА, КАТАЛИН. «ОБЗОР МЕТОДОВ СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ НА ОСНОВЕ НЕЙРОННОЙ СЕТИ» (PDF) . Cite journal requires |journal= (help)
  14. ^ Го, Дачжоу; Пей, Янтин; Чжэн, Канг; Ю, Хонгкай; Лу, Юханг; Ван, Сонг (2020). «Семантическая сегментация деградированного изображения с сетями плотной грамматики» . IEEE Transactions по обработке изображений . 29 : 782–795. DOI : 10.1109 / TIP.2019.2936111 . ISSN 1057-7149 . 
  15. ^ Йи, Джингру; У, Пэнсян; Цзян, Менглин; Хуан, Цяоин; Hoeppner, Daniel J .; Метаксас, Димитрис Н. (июль 2019 г.). «Сегментация экземпляра внимательной нервной клетки». Анализ медицинских изображений . 55 : 228–240. DOI : 10.1016 / j.media.2019.05.004 .
  16. ^ Batenburg, K J .; Сиджберс, Дж. (2009). «Адаптивная пороговая обработка томограмм путем минимизации проекционного расстояния». Распознавание образов . 42 (10): 2297–2305. CiteSeerX 10.1.1.182.8483 . DOI : 10.1016 / j.patcog.2008.11.027 . 
  17. ^ Batenburg, K J .; Сиджберс, Дж. (Июнь 2009 г.). «Выбор оптимального порога сегментации томограммы путем минимизации проекционного расстояния» . IEEE Transactions по медицинской визуализации . 28 (5): 676–686. DOI : 10.1109 / tmi.2008.2010437 . PMID 19272989 . S2CID 10994501 . Архивировано из оригинального (PDF) 03.05.2013 . Проверено 31 июля 2012 .  
  18. ^ Кашанипур, А .; Милани, N; Kashanipour, A .; Еграри, Х. (май 2008 г.). «Надежная цветовая классификация с использованием оптимизации роя частиц на основе нечетких правил». Конгресс IEEE по обработке изображений и сигналов . 2 : 110–114. DOI : 10,1109 / CISP.2008.770 . ISBN 978-0-7695-3119-9. S2CID  8422475 .
  19. ^ Barghout, Лорен; Шейнин, Яков (2013). «Восприятие сцены реального мира и организация восприятия: уроки компьютерного зрения» . Журнал видения . 13 (9): 709. DOI : 10,1167 / 13.9.709 .
  20. ^ Хоссейн Мобахи; Шанкар Рао; Аллен Янг; Шанкар Састри; Йи Ма. (2011). «Сегментация естественных изображений по текстуре и граничному сжатию» (PDF) . Международный журнал компьютерного зрения . 95 : 86–98. arXiv : 1006,3679 . CiteSeerX 10.1.1.180.3579 . DOI : 10.1007 / s11263-011-0444-0 . S2CID 11070572 . Архивировано из оригинального (PDF) 08.08.2017 . Проверено 8 мая 2011 .   
  21. ^ Шанкар Рао, Хоссейн Мобахи, Аллен Янг, Шанкар Састри и Йи Ма Сегментация естественного изображения с адаптивной текстурой и граничным кодированием. Архивировано 19 мая 2016 г.в Wayback Machine , Труды Азиатской конференции по компьютерному зрению (ACCV) 2009, H. Жа, Р.-и. Танигучи и С. Мэйбанк (ред.), Часть I, LNCS 5994, стр. 135–146, Springer.
  22. ^ Оландер, Рон; Прайс, Кейт; Редди, Д. Радж (1978). «Сегментация изображения с использованием метода рекурсивного разделения области». Компьютерная графика и обработка изображений . 8 (3): 313–333. DOI : 10.1016 / 0146-664X (78) 90060-6 .
  23. ^ Р. Киммел и А. М. Брукштейн. https://www.cs.technion.ac.il/~ron/PAPERS/Paragios_chapter2003.pdf , Международный журнал компьютерного зрения, 2003 г .; 53 (3): 225–243.
  24. ^ Р. Киммел , https://www.cs.technion.ac.il/~ron/PAPERS/laplacian_ijcv2003.pdf , глава «Методы набора геометрических уровней в визуализации, зрении и графике» (С. Ошер, Н. Парагиос, Редакторы), Springer Verlag, 2003. ISBN 0387954880 
  25. Barghout, Лорен. Визуальный таксометрический подход. Сегментация изображений с использованием нечетко-пространственного сокращения таксонов дает контекстно-релевантные регионы . Коммуникации в компьютерных и информационных науках (CCIS). Springer-Verlag. 2014 г.
  26. ^ Витольд Педрайкс (редактор), Анджей Skowron (Со-редактор), Владик Крейнович (Со-редактор). Справочник по гранулярным вычислениям. Wiley 2008
  27. Перейти ↑ Barghout, Lauren (2014). Зрение. Глобальный концептуальный контекст меняет обработку локального контраста (докторская диссертация, 2003 г.). Обновлено, чтобы включить методы компьютерного зрения. Научная пресса. ISBN 978-3-639-70962-9 . 
  28. Бархут, Лорен и Лоуренс Ли. «Система обработки перцептивной информации». Патенты Google
  29. ^ Lindeberg, T .; Ли, М.-Х. (1997). «Сегментация и классификация ребер с использованием аппроксимации минимальной длины описания и дополнительных точек соединения» . Компьютерное зрение и понимание изображений . 67 (1): 88–98. DOI : 10.1006 / cviu.1996.0510 .
  30. ^ [1] Архивировано 13 октября 2017 г. в Wayback Machine. Шелия Губерман , Вадим В. Максимов, Алексей Пашинцев. Гештальт и понимание изображений. ГЕСТАЛЬТОВАЯ ТЕОРИЯ 2012, Т. 34, №2, 143–166.
  31. ^ Р. Нок и Ф. Нильсен, Слияние статистических областей , IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol 26, No. 11, pp 1452–1458, 2004.
  32. ^ Л. Чен, HD Ченг и Дж. Чжан, Нечеткое субволокно и его применение в классификации сейсмической литологии , Информационные науки: Приложения, Том 1, № 2, стр 77–95, 1994.
  33. ^ SL Горовиц и Т. Павлидис, Сегментация изображения с помощью направленной процедуры разделения и слияния, Proc. ICPR, 1974, Дания, стр. 424–433.
  34. ^ С. Л. Хоровиц и Т. Павлидис, Сегментация изображений с помощью алгоритма обхода дерева, Журнал ACM, 23 (1976), стр. 368–388.
  35. ^ Л. Чен, Лямбда-связная сегментация и оптимальный алгоритм для сегментации с разделением и слиянием , Chinese J. Computers, 14 (1991), стр 321–331
  36. ^ Caselles, V .; Kimmel, R .; Сапиро, Г. (1997). «Геодезические активные контуры» (PDF) . Международный журнал компьютерного зрения . 22 (1): 61–79. DOI : 10,1023 / A: 1007979827043 . S2CID 406088 .  
  37. ^ Dervieux, A. и Thomasset, F. 1979. Метод конечных элементов для моделирования неустойчивости Рэли-Тейлора. Springer Lect. Примечания по математике, 771: 145–158.
  38. ^ Dervieux, A. и Thomasset, F. 1981. Многожидкостные несжимаемые потоки методом конечных элементов . Конспект лекций по физике, 11: 158–163.
  39. ^ Ошер, Стэнли; Сетиан, Джеймс А. (1988). «Фронты, распространяющиеся со скоростью, зависящей от кривизны: алгоритмы, основанные на формулировках Гамильтона-Якоби». Журнал вычислительной физики . 79 (1): 12–49. Bibcode : 1988JCoPh..79 ... 12O . CiteSeerX 10.1.1.46.1266 . DOI : 10.1016 / 0021-9991 (88) 90002-2 . ISSN 0021-9991 .  
  40. ^ С. Ошер и Н. Парагиос. Методы набора геометрических уровней в визуализации и графике , Springer Verlag, ISBN 0-387-95488-0 , 2003. 
  41. ^ Джеймс А. Сетиан. «Сегментация в медицинской визуализации» . Проверено 15 января 2012 года .
  42. ^ Форкадель, Николас; Ле Гюядер, Кэрол; Подагра, Кристиан (июль 2008), "Обобщенная быстрый способ маршировать: приложения к сегментации изображений", Численные алгоритмы , 48 (1-3): 189-211, DOI : 10.1007 / s11075-008-9183-х , S2CID 7467344 
  43. ^ Чан, TF; Весе, Л. (2001). «Активные контуры без краев». IEEE Transactions по обработке изображений . 10 (2): 266–277. Bibcode : 2001ITIP ... 10..266C . DOI : 10.1109 / 83.902291 . PMID 18249617 . 
  44. ^ Дэвид Мамфорд и Джаянт Шах (1989): Оптимальные приближения кусочно-гладкими функциями и связанные с ними вариационные задачи , Сообщения по чистой и прикладной математике , стр. 577–685, Vol. 42, № 5
  45. ^ Джианбо Ши и Джитендра Малик (2000): «Нормализованные сокращения и сегментация изображений» , IEEE Transactions on Pattern Analysis and Machine Intelligence , pp 888–905, Vol. 22, № 8
  46. ^ Лео Грэди (2006): «Случайные блуждания для сегментации изображений» , IEEE Transactions on Pattern Analysis and Machine Intelligence , pp. 1768–1783, Vol. 28, № 11
  47. ^ З. Ву и Р. Лихи (1993): «Оптимальный теоретико-графический подход к кластеризации данных: теория и ее применение к сегментации изображений» [ постоянная мертвая ссылка ] , IEEE Transactions on Pattern Analysis and Machine Intelligence , стр. 1101–1113 , Vol. 15, №11
  48. Лео Грейди и Эрик Л. Шварц (2006): «Изопериметрическое разбиение графа для сегментации изображений» Архивировано 19 июля 2011 г.в Wayback Machine , IEEE Transactions on Pattern Analysis and Machine Intelligence , pp. 469–475, Vol. 28, № 3
  49. ^ CT Zahn (1971): «Теоретико-графические методы обнаружения и описания гештальт-кластеров» , IEEE Transactions on Computers , стр. 68–86, Vol. 20, №1
  50. ^ С. Геман и Д. Геман (1984): «Стохастическая релаксация, распределения Гиббса и байесовское восстановление изображений», IEEE Transactions по анализу шаблонов и машинному интеллекту, стр. 721–741, Vol. 6, №6.
  51. ^ А. Боуман и М. Шапиро (2002): "Многомасштабная модель случайного поля для байесовской сегментации изображений", IEEE Transactions on Image Processing, стр. 162–177, Vol. 3.
  52. ^ Дж. Лю и Й. Х. Ян (1994): " Сегментация цветных изображений с несколькими разрешениями ", IEEE Transactions on Pattern Analysis and Machine Intelligence, pp. 689-700, Vol. 16.
  53. ^ С. Висенте, В. Колмогоров и К. Ротер (2008): " Сегментация изображений на основе вырезания графа с априори связности ", CVPR
  54. ^ Корсо, З. Ту и А. Юилле (2008): «Маркировка MRF с алгоритмом сдвига графа», Труды международного семинара по комбинаторному анализу изображений
  55. ^ BJ Frey и D. MacKayan (1997): « Революция: распространение Вера в графах с циклами », Труды систем Neural обработки информации (Н)
  56. ^ Staib, LH; Дункан, Дж. С. (1992). «Определение границ с параметрически деформируемыми моделями». IEEE Transactions по анализу шаблонов и машинному анализу . 14 (11): 1061–1075. DOI : 10.1109 / 34.166621 . ISSN 0162-8828 . 
  57. ^ Виткин, А.П. "Масштабная фильтрация", Proc. 8-й Int. Совместная конф. Изобразительное искусство. Intell., Карлсруэ, Германия, 1019–1022, 1983.
  58. ^ А. Виткин, " Масштабная фильтрация: новый подход к многомасштабному описанию ", в Proc. IEEE Int. Конф. Акуст., Речь, Обработка сигналов ( ICASSP ), т. 9, Сан-Диего, Калифорния, март 1984 г., стр. 150–153.
  59. ^ Кендеринк, Ян "Структура изображений", Биологическая кибернетика, 50: 363–370, 1984
  60. ^ Лифшиц, Л. и Пайзер, С .: Иерархический подход с несколькими разрешениями к сегментации изображений на основе экстремумов интенсивности, IEEE Transactions on Pattern Analysis and Machine Intelligence, 12: 6, 529–540, 1990.
  61. ^ Линдеберг, Т .: Обнаружение заметных каплевидных структур изображений и их масштабов с помощью первичного эскиза в масштабном пространстве: метод фокусировки внимания, Международный журнал компьютерного зрения, 11 (3), 283–318, 1993.
  62. ^ Линдеберг, Тони, Теория масштабного пространства в компьютерном зрении, Kluwer Academic Publishers, 1994 , ISBN 0-7923-9418-6 
  63. ^ Gauch, Дж и Pizer, С .: Кратномасштабный анализ гребней и впадин в полутоновых изображений, IEEE Transactions на шаблон анализа и Machine Intelligence, 15: 6 (июнь 1993), страницы: 635-646, 1993.
  64. ^ Olsen, O. и Nielsen, M .: многомасштабная сегментация водораздела по величине градиента , Proc. of ICIAP 97, Флоренция, Италия, Конспекты лекций по информатике, стр. 6–13. Springer Verlag, сентябрь 1997 г.
  65. ^ Dam, E., Johansen, P., Olsen, O. Thomsen, A. Darvann, T., Dobrzenieck, A., Hermann, N., Kitai, N., Kreiborg, S., Larsen, P., Нильсен, М .: «Интерактивная многомасштабная сегментация в клиническом использовании» на Европейском конгрессе радиологов, 2000 г.
  66. ^ Винкен, К., Костер, А. и Виергевер, М .: Вероятностная многомасштабная сегментация изображений , IEEE Transactions on Pattern Analysis and Machine Intelligence, 19: 2, pp. 109–120, 1997.]
  67. ^ М. Табб и Н. Ахуджа, Неконтролируемая многомасштабная сегментация изображений с помощью интегрированного обнаружения краев и областей, IEEE Transactions on Image Processing, Vol. 6, No. 5, 642–655, 1997. Архивировано 20 июля 2011 г. в Wayback Machine.
  68. ^ Э. Акбас и Н. Ахуджа, "От разрывов рампы к дереву сегментации"
  69. ^ С. Ундеман и Т. Линдеберг (2003) "Полностью автоматическая сегментация МРТ изображений мозга с использованием вероятностной анизотропной диффузии и многомасштабных водоразделов", Proc. Scale-Space'03, остров Скай, Шотландия, Springer Lecture Notes по информатике, том 2695, страницы 641–656.
  70. ^ Florack, Л. и Kuijper, А .: топологическая структура масштаба космических снимков, Журнал математической обработки изображений и Vision, 12: 1, 65-79, 2000.
  71. ^ Bijaoui, A .; Руэ, Ф. (1995). «Мультимасштабная модель зрения». Обработка сигналов . 46 (3): 345. DOI : 10,1016 / 0165-1684 (95) 00093-4 .
  72. Barghout, Лорен. Визуальный таксометрический подход к сегментации изображений с использованием нечетко-пространственного вырезания таксонов дает контекстуально релевантные регионы. ИПМУ 2014, Часть II. А. Лоран и др. (Ред.) CCIS 443, стр. 163–173. Springer International Publishing Switzerland
  73. Перейти ↑ Barghout, Lauren (2014). Видение: как глобальный контекст восприятия изменяет обработку локального контраста (докторская диссертация, 2003 г.). Обновлено, чтобы включить методы компьютерного зрения . Scholars Press. ISBN 978-3-639-70962-9.
  74. ^ Mahinda Pathegama & Ö Göl (2004): "экстракция пикселей Edge-енд для сегментации изображений краяоснове", Труды по инженерной, вычислительной технике и технологии, т. 2. С. 213–216, ISSN 1305-5313.
  75. ^ Джонсон, Джон Л. (сентябрь 1994). «Нейронные сети с импульсной связью: перевод, вращение, масштаб, искажение и инвариантность сигнала интенсивности для изображений». Прикладная оптика . OSA. 33 (26): 6239–6253. DOI : 10,1364 / AO.33.006239 . PMID 20936043 . 
  76. ^ Роннебергер, Олаф; Фишер, Филипп; Брокс, Томас (2015). «U-Net: сверточные сети для сегментации биомедицинских изображений». arXiv : 1505.04597 [ cs.CV ].
  77. ^ Александр Кириллов, Kaiming Он, Росс Girshick, Карстен Rother, Петр ДОЛЛАР (2018). «Паноптическая сегментация». arXiv : 1801.00868 [ cs.CV ].CS1 maint: uses authors parameter (link)
  78. ^ Висенте, Сара; Ротер, Карстен; Колмогоров, Владимир (2011). Сосегментация объектов . IEEE. DOI : 10.1109 / cvpr.2011.5995530 . ISBN 978-1-4577-0394-2.
  79. ^ Сайгин, З.М., Ошер, DE, Августинак, Дж., Фишл, Б. и Габриэли, JDE: Сегментация ядер миндалины человека на основе связи с использованием вероятностной трактографии. , Neuroimage, 56: 3, стр. 1353–61, 2011.
  80. ^ Menke, RA, Jbabdi, S, Миллер, KL, Matthews, PM и Zarei, М .: Связь на основе сегментации черной субстанции в человеке и его последствия при болезни Паркинсона , Neuroimage, 52:. 4, стр 1175-80 , 2010.]
  81. ^ Haindl, Михал; Майкс, Станислав (2008). Тест сегментации текстур . 2008 19-я Международная конференция по распознаванию образов . CiteSeerX 10.1.1.214.2307 . DOI : 10.1109 / ICPR.2008.4761118 . ISBN  978-1-4244-2174-9. S2CID  9191160 .
  82. ^ Д. Мартин; К. Фаулкс; Д. Таль; Дж. Малик (июль 2001 г.). «База данных человеческих сегментированных природных изображений и ее применение для оценки алгоритмов сегментации и измерения экологической статистики». Proc. 8-я Международная конф. Компьютерное зрение . 2 . С. 416–423.

Ссылки [ править ]

  • Сегментация изображений на основе трехмерной энтропии
  • Фруччи, Мария; Саннити ди Баха, Габриэлла (2008). «От сегментации к бинаризации серых изображений». Журнал исследований распознавания образов . 3 (1): 1–13. DOI : 10.13176 / 11,54 .

Внешние ссылки [ править ]

  • Пример кода, который выполняет базовую сегментацию , Сайед Зайнудин. Технологический университет Малайзии.
  • Обобщенный метод Fast Marching Forcadel et al. [2008] для приложений сегментации изображений.
  • Исследовательская группа по обработке изображений Открытое онлайн-сообщество по исследованию обработки изображений.
  • Методы сегментации при обработке и анализе изображений и минимизация энергии для сегментации изображений с помощью Mathworks
  • Дополнительные методы сегментации изображений с подробными алгоритмами, разработанные Yu-Hsiang Wang (王昱 翔), Национальный университет Тайваня, Тайбэй, Тайвань, Китай.
  • Онлайн-демонстрация кусочно-линейной сегментации изображения от журнала IPOL