Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Пример двумерного фильтра Габора

В обработке изображений , A фильтр Габора , названный в честь Дениса Габора , является линейным фильтр используется для текстуры анализа, который по существу означает , что он анализирует , есть ли какая - либо содержимое определенная частота в изображении в конкретных направлениях в локализованной области вокруг точки или области анализа. Многие современные специалисты по зрению утверждают, что представления частот и ориентации фильтров Габора подобны представлениям зрительной системы человека . [1] Было обнаружено, что они особенно подходят для отображения текстуры и различения. В пространственной области 2D-фильтр Габора представляет собой гауссову функцию ядра.модулируется синусоидальной плоской волной (см. преобразование Габора ).

Некоторые авторы утверждают , что простые клетки в зрительной коре в мозге млекопитающих могут быть смоделированы функциями Габора. [2] [3] Таким образом, некоторые считают , что анализ изображений с помощью фильтров Габора подобен восприятию в зрительной системе человека .

Определение [ править ]

Его импульсная характеристика определяется синусоидальной волной ( плоская волна для 2D-фильтров Габора), умноженной на функцию Гаусса . [4] Из-за свойства умножения-свертки ( теорема свертки ) преобразование Фурье импульсной характеристики фильтра Габора представляет собой свертку преобразования Фурье гармонической функции (синусоидальной функции) и преобразования Фурье функции Гаусса. Фильтр имеет действительную и мнимую составляющие, представляющие ортогональные направления. [5] Два компонента могут быть объединены в комплексное число. или используется индивидуально.

Сложный

Настоящий

Воображаемый

куда

и

В этом уравнении представляет длину волны синусоидального фактора, представляет ориентацию нормали к параллельным полосам функции Габора , представляет собой сдвиг фазы, представляет собой сигма / стандартное отклонение огибающей Гаусса и является пространственным соотношением сторон, и задает эллиптичность опоры функции Габора.

Пространство вейвлета [ править ]

Демонстрация применения фильтра Габора к китайскому OCR. Справа показаны четыре ориентации: 0 °, 45 °, 90 ° и 135 °. Исходное изображение персонажа и наложение всех четырех ориентаций показаны слева.

Фильтры Габора напрямую связаны с вейвлетами Габора , поскольку они могут быть разработаны для ряда расширений и вращений. Однако, как правило, разложение не применяется для вейвлетов Габора, поскольку это требует вычисления биортогональных вейвлетов, что может занять очень много времени. Поэтому обычно создается набор фильтров, состоящий из фильтров Габора с различными масштабами и поворотами. Фильтры свертываются с сигналом, в результате получается так называемое пространство Габора. Этот процесс тесно связан с процессами в первичной зрительной коре . [6] Джонс и Палмер показали, что реальная часть сложной функции Габора хорошо согласуется с весовыми функциями рецептивного поля, обнаруженными в простых клетках полосатой коры головного мозга кошки. [7]

Извлечение функций из изображений [ править ]

Набор фильтров Габора с разными частотами и ориентациями может быть полезен для извлечения полезных функций из изображения. [8] В дискретной области двумерные фильтры Габора имеют вид

где B и C - нормализующие коэффициенты, которые необходимо определить.

Двухмерные фильтры Габора находят широкое применение в обработке изображений, особенно при извлечении признаков для анализа текстур и сегментации. [9] определяет частоту, которую ищут в текстуре. Варьируя , мы можем искать текстуру, ориентированную в определенном направлении. Варьируя , мы меняем опору основы или размер анализируемой области изображения.

Применение двумерных фильтров Габора в обработке изображений [ править ]

При обработке изображений документа функции Gabor идеально подходят для определения шрифта слова в многоязычном документе. [10] Фильтры Габора с разной частотой и ориентацией в разных направлениях использовались для локализации и извлечения областей только текста из сложных изображений документа (как серых, так и цветных), поскольку текст богат высокочастотными компонентами, тогда как изображения относительно гладкие. в природе. [11] [12] [13] Он также применялся для распознавания выражения лица [14] Фильтры Габора также широко использовались в приложениях для анализа паттернов. Например, он был использован для изучения распределения внутри направленностей пористой губчатой трабекулярной кости впозвоночник . [15] Габор пространство очень полезно в обработке изображений приложений , такие как оптическое распознавание символов , распознавание радужной оболочки глаза и распознавание отпечатков пальцев . Отношения между активациями для определенного пространственного положения очень различны между объектами на изображении. Кроме того, важные активации могут быть извлечены из пространства Габора, чтобы создать разреженное представление объекта.

Примеры реализации [ править ]

(Код для извлечения функций Gabor из изображений в MATLAB можно найти по адресу http://www.mathworks.com/matlabcentral/fileexchange/44630 .)

Это пример реализации на Python :

импортировать  numpy  как  npdef  gabor ( sigma ,  theta ,  Lambda ,  psi ,  gamma ):  "" "Извлечение признаков Габора." ""  sigma_x  =  sigma  sigma_y  =  float ( sigma )  /  gamma # Ограничивающего прямоугольника  nstds  =  3  # Количество стандартного отклонения сигма  Xmax  =  макс ( абс ( nstds  *  sigma_x  *  нп . Соз ( тета )),  абс ( nstds  *  sigma_y  *  нп . Грех ( тета )))  Xmax  =  нп . ceil ( max ( 1 ,  xmax ))  ymax  =  max ( abs ( nstds *  sigma_x  *  нп . sin ( theta )),  abs ( nstds  *  sigma_y  *  np . cos ( theta )))  ymax  =  np . ceil ( max ( 1 ,  ymax ))  xmin  =  - xmax  ymin  =  - ymax  ( y ,  x )  =  np . сетка ( np . arange (ymin ,  ymax  +  1 ),  np . arange ( xmin ,  xmax  +  1 )) # Вращение  x_theta  =  x  *  np . cos ( тета )  +  y  *  np . грех ( тета )  y_theta  =  - х  *  нп . грех ( тета )  +  у  *  нп . соз ( тета ) gb  =  np . exp ( -. 5  *  ( x_theta  **  2  /  sigma_x  **  2  +  y_theta  **  2  /  sigma_y  **  2 ))  *  np . cos ( 2  *  np . pi  /  Lambda  *  x_theta  +  psi )  return  gb

Для реализации на изображениях см. [1] .

Это пример реализации в MATLAB / Octave :

функция  gb = gabor_fn ( сигма, тета, лямбда, фунты на квадратный дюйм, гамма )sigma_x = сигма ;  sigma_y = сигма / гамма ;    % Ограничительная рамкаnstds = 3 ;  xmax = max ( abs ( nstds * sigma_x * cos ( theta )), abs ( nstds * sigma_y * sin ( theta )));           xmax = ceil ( max ( 1 , xmax ));   ymax = max ( abs ( nstds * sigma_x * sin ( theta )), abs ( nstds * sigma_y * cos ( theta )));           ymax = ceil ( max ( 1 , ymax ));   xmin = - xmax ; ymin = - ymax ;     [ x , y ] = сетка ( xmin : xmax , ymin : ymax );   % Вращения x_theta = x * cos ( тета ) + y * sin ( тета );        y_theta = - x * sin ( тета ) + y * cos ( тета );        gb = exp ( - .5 * ( x_theta . ^ 2 / sigma_x ^ 2 + y_theta . ^ 2 / sigma_y ^ 2 )) . * cos ( 2 * pi / lambda * x_theta + psi );  

Это еще один пример реализации в Haskell :

import  Data.Complex  ( Complex (( : + ))) gabor  λ  θ  ψ  σ  γ  x  y  =  exp  (  ( - 0,5 )  *  (( x ' ^ 2  +  γ ^ 2 * y' ^ 2 )  /  ( σ ^ 2) ))  : +  0 )  *  exp  (  0  : +  ( 2 * pi * x ' / λ+ ψ )  )  где  x '  =  x  *  cos  θ  +  y  *  sin  θ  y'  =  - x  *  sin  θ  +  y  *  cos  θ

(Примечание: a :+ bследует читать как )

См. Также [ править ]

  • Преобразование Габора
  • Вейвлет Габора
  • Атом Габора
  • Фильтр Log Gabor

Ссылки [ править ]

  1. ^ Olshausen, BA & Field, DJ (1996). «Появление свойств рецептивного поля простых клеток путем изучения разреженного кода для естественных изображений». Природа . 381 (6583): 607–609. Bibcode : 1996Natur.381..607O . DOI : 10.1038 / 381607a0 . PMID  8637596 . S2CID  4358477 .CS1 maint: multiple names: authors list (link)
  2. ^ Марчелия, S. (1980). «Математическое описание ответов простых корковых клеток». Журнал Оптического общества Америки . 70 (11): 1297–1300. Bibcode : 1980JOSA ... 70.1297M . DOI : 10.1364 / JOSA.70.001297 . PMID 7463179 . 
  3. ^ Даугман, Джон Г. (1985-07-01). «Отношение неопределенности для разрешения в пространстве, пространственной частоты и ориентации, оптимизированных двумерными визуальными кортикальными фильтрами». Журнал Оптического общества Америки A . 2 (7): 1160–9. Bibcode : 1985JOSAA ... 2.1160D . CiteSeerX 10.1.1.465.8506 . DOI : 10.1364 / JOSAA.2.001160 . ISSN 1084-7529 . PMID 4020513 .   
  4. ^ Fogel, I .; Саги, Д. (июнь 1989 г.). «Фильтры Габора как дискриминатор текстуры». Биологическая кибернетика . 61 (2). CiteSeerX 10.1.1.367.2700 . DOI : 10.1007 / BF00204594 . ISSN 0340-1200 . OCLC 895625214 . S2CID 14952808 .    
  5. ^ Трехмерное отслеживание поверхности и аппроксимация с использованием фильтров Габора, Джеспер Юул Хенриксен, Университет Южной Дании, 28 марта 2007 г.
  6. ^ Даугман, JG (1980), "Двумерный спектральный анализ профилей рецептивного поля коры", Vision Res. , 20 (10): 847-56, DOI : 10,1016 / 0042-6989 (80) 90065-6 , PMID 7467139 , S2CID 40518532  
  7. ^ Джонс, JP; Палмер, Л.А. (1987). «Оценка двухмерной модели фильтра Габора простых рецептивных полей в полосатом коре головного мозга кошки» (PDF) . J. Neurophysiol . 58 (6): 1233–1258. DOI : 10,1152 / jn.1987.58.6.1233 . PMID 3437332 . S2CID 16809045 .   
  8. ^ Haghighat, M .; Зоноуз, С .; Абдель-Мотталеб, М. (2013). «Идентификация с использованием зашифрованной биометрии». Компьютерный анализ изображений и паттернов . Конспект лекций по информатике. 8048 . п. 440. DOI : 10.1007 / 978-3-642-40246-3_55 . ISBN 978-3-642-40245-6.
  9. ^ Рамакришнан, AG; Kumar Raja, S .; Рагху Рам, HV (2002). «Сегментация текстур на основе нейронных сетей с использованием функций Габора» (PDF) . Труды 12-го семинара IEEE по нейронным сетям для обработки сигналов . Мартиньи, Швейцария: IEEE: 365–374. DOI : 10.1109 / NNSP.2002.1030048 . ISBN  978-0-7803-7616-8. OCLC  812617471 . S2CID  10994982 .
  10. ^ Пати, Пит Баса; Рамакришнан, А.Г. (июль 2008 г.). «Многоканальная идентификация на уровне слов». Письма о распознавании образов . 29 (9): 1218–1229. DOI : 10.1016 / j.patrec.2008.01.027 . ISSN 0167-8655 . 
  11. ^ Raju S, S .; Пати ПБ; Рамакришнан, А.Г. (2004). «Анализ энергии блоков на основе фильтра Габора для извлечения текста из изображений цифрового документа» (PDF) . Первый международный семинар по анализу изображений документов для библиотек, 2004 г. Труды . Пало-Альто, Калифорния, США: IEEE: 233–243. DOI : 10,1109 / DIAL.2004.1263252 . ISBN  978-0-7695-2088-9. LCCN  2003116308 . ПР  8067708М . S2CID  21856192 .
  12. ^ Раджу, С. Сабари; Пати ПБ; Рамакришнан, А.Г. (2005). «Локализация и извлечение текста из сложных цветных изображений» . Конспект лекций по информатике . 3804 : 486–493. DOI : 10.1007 / 11595755_59 . ISBN 978-3-540-30750-1. ISSN  0302-9743 . LCCN  2005936803 . ПР  9056158М .
  13. ^ Сабари Раджу, ПБ Пати и А.Г. Рамакришнан, «Локализация текста и извлечение из сложных цветных изображений», Proc. Первая международная конференция по достижениям в области визуальных вычислений (ISVC05) , Невада, США, LNCS 3804, Springer Verlag, 5-7 декабря 2005 г., стр. 486-493.
  14. ^ Lyons, M .; Akamatsu, S .; Камачи, М .; Гёба, Дж. (1998). Кодирование мимики с помощью вейвлетов Габора . С. 200–205. DOI : 10.1109 / AFGR.1998.670949 . ISBN 0-8186-8344-9. ПР  11390549М . S2CID  1586662 .
  15. ^ Гдычинский, CM; Manbachi, A .; и другие. (2014). «Об оценке распределения направленности в трабекулярной кости ножки по изображениям микро-компьютерной томографии». Журнал физиологических измерений . 35 (12): 2415–2428. Bibcode : 2014PhyM ... 35.2415G . DOI : 10.1088 / 0967-3334 / 35/12/2415 . PMID 25391037 . 

Внешние ссылки [ править ]

  • Код MATLAB для фильтров Габора и извлечения признаков Габора
  • 3D Габор продемонстрировал с помощью Mathematica
  • реализация log-Gabors на python для неподвижных изображений
  • Фильтр Габора для обработки изображений и компьютерного зрения (демонстрация)

Дальнейшее чтение [ править ]

  • Файхтингер, Ханс Г .; Стромер, Томас, ред. (1998). Анализ и алгоритмы Габора: теория и приложения . Бостон: Биркхойзер. ISBN 0-8176-3959-4. LCCN  97032252 . OCLC  37761814 . ПР  685385М .
  • Грёчениг, Карлхайнц (2001). Основы частотно-временного анализа: с 15 цифрами . Прикладной и численный гармонический анализ. Бостон: Биркхойзер. DOI : 10.1007 / 978-1-4612-0003-1 . ISBN 0-8176-4022-3. LCCN  00044508 . OCLC  44420790 . ПР  8074618М .
  • Даугман, JG (1988). «Полные дискретные двухмерные преобразования Габора с помощью нейронных сетей для анализа и сжатия изображений» (PDF) . Транзакции IEEE по акустике, речи и обработке сигналов . 36 (7): 1169–1179. CiteSeerX  10.1.1.371.5847 . DOI : 10.1109 / 29.1644 . ISSN  0096-3518 .
  • «Онлайн-демонстрация фильтра Габора» . Архивировано из оригинала на 2009-06-15 . Проверено 25 мая 2009 .
  • Мовеллан, Хавьер Р. «Учебное пособие по фильтрам Габора» (PDF) . Архивировано из оригинального (PDF) 19 апреля 2009 года . Проверено 14 мая 2008 .
  • Лагаэ, Арес; Лефевр, Сильвен; Дреттакис, Джордж; Дютре, Филипп (2009). «Процедурный шум с использованием разреженной свертки Габора» . Транзакции ACM на графике . 28 (3): 1. CiteSeerX  10.1.1.232.5566 . DOI : 10.1145 / 1531326.1531360 . Проверено 12 сентября 2009 .
  • Управляемые пирамиды:
    1. Страница Ээро Симончелли о управляемых пирамидах
    2. Manduchi, R .; Perona, P .; Шай, Д. (апрель 1998 г.). «Эффективные деформируемые блоки фильтров» (PDF) . Транзакции IEEE по обработке сигналов . 46 (4): 1168–1173. Bibcode : 1998ITSP ... 46.1168M . DOI : 10.1109 / 78.668570 . ISSN  1053-587X . OCLC  926890247 .( PDF ) ( Код )
  • Фишер, Сильвен; Шроубек, Филип; Perrinet, Laurent; Редондо, Рафаэль; Кристобаль, Габриэль (2007). "Самообратимые двумерные всплески лог-Габора" (PDF) . Международный журнал компьютерного зрения . 75 (2): 231–246. CiteSeerX  10.1.1.329.6283 . DOI : 10.1007 / s11263-006-0026-8 . ISSN  0920-5691 . S2CID  1452724 .