Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

Геоны - это простые 2D или 3D формы, такие как цилиндры , кирпичи , клинья , конусы , круги и прямоугольники, соответствующие простым частям объекта в теории распознавания по компонентам Бидермана . [1] Теория предполагает, что визуальный ввод сопоставляется со структурными представлениями объектов в мозгу . Эти структурные представления состоят из геонов и их отношений (например, рожок мороженого можно разбить на сферу, расположенную над конусом). Предполагается лишь небольшое количество геонов (<40). При сочетании в различных отношениях друг к другу (например, сверху, больше, чем, от конца до конца, от конца до середины) и грубых метрических вариаций, таких как соотношение сторон и 2D-ориентация, миллиарды возможных 2- и могут быть созданы 3-геонные объекты. Два класса визуальной идентификации на основе формы, которые не выполняются через репрезентации геонов, - это те, которые участвуют в: а) различении похожих лиц и б) классификации, не имеющей определенных границ, например, кустов или мятой одежды. Обычно такие отождествления не зависят от точки зрения.

Свойства геонов [ править ]

Два случая двух взаимосвязанных геонов. Что читатель представляет в каждом случае?

У геонов есть 4 основных свойства:

  1. Инвариантность взгляда: каждый геон можно отличить от других практически с любых точек зрения, за исключением «случайностей» под сильно ограниченными углами, в которых один геон проецирует изображение, которое может быть другим геоном, как, например, когда вид с конца цилиндра может быть сферой или кругом. Точно так же объекты, представленные в виде набора геонов, не будут зависеть от точки обзора.
  2. Стабильность или устойчивость к визуальному шуму: поскольку геоны просты, они легко поддерживаются гештальт-свойством плавного продолжения, что делает их идентификацию устойчивой к частичному перекрытию и ухудшению визуальным шумом, как, например, когда цилиндр может просматриваться позади куст.
  3. Неизменность направления освещения, отметок и текстуры поверхности.
  4. Высокая различимость: геоны различаются качественно, всего с двумя или тремя уровнями атрибутов, такими как прямой или изогнутый, параллельный или непараллельный, положительная кривизна или отрицательная кривизна. Эти качественные различия можно легко различить, что делает геоны легко различимыми, а объекты, составленные таким образом, - легко различимыми.

Вывод инвариантных свойств геонов [ править ]

Инвариантность точки обзора: инвариантность точки обзора геонов происходит из-за того, что они отличаются тремя неслучайными свойствами (NAP) контуров, которые не меняются с ориентацией по глубине:

  1. Будь контур прямой или изогнутый,
  2. Вершина, которая образуется, когда два или три контура совпадают (то есть заканчиваются вместе в одной точке) на изображении, то есть L (2 контура), вилка (3 контура со всеми углами <180 °) или стрелка (3 контура, один угол> 180 °), и
  3. Параллельна пара контуров или нет (с учетом перспективы). Когда не параллельны, контуры могут быть прямыми (сходящимися или расходящимися) или изогнутыми, с положительной или отрицательной кривизной, образующей выпуклую или вогнутую огибающую соответственно (см. Рисунок ниже).
Geon2.png

NAP можно отличить от метрических свойств (MP), таких как степень ненулевой кривизны контура или его длина, которые действительно меняются с изменениями ориентации по глубине.

Инвариантность к направлению освещения и характеристикам поверхности [ править ]

Геоны могут быть определены по контурам, которые отмечают края на неоднородностях ориентации и глубины изображения объекта, т. Е. Контурам, которые определяют хорошее рисование линий формы или объема объекта. Разрывы ориентации определяют те края, где наблюдается резкое изменение ориентации нормали к поверхности объема, как это происходит на контуре на границах разных сторон кирпича. Разрыв глубины - это место, где линия взгляда наблюдателя перескакивает с поверхности объекта на фон (т. Е. Касается поверхности), как это происходит на сторонах цилиндра. Один и тот же контур может обозначать неоднородность ориентации и глубины, как и задний край кирпича. Поскольку геоны основаны на этих неоднородностях, они инвариантны к изменениям направления освещения, теней и т. Д.и текстура поверхности и маркировка.

Геоны и обобщенные конусы [ править ]

Геоны составляют часть набора обобщенных конусов [2], которые представляют собой объемы, создаваемые при движении поперечного сечения вдоль оси. Например, круг, движущийся по прямой оси, будет определять цилиндр (см. Рисунок). Прямоугольник, перемещаемый по прямой оси, определил бы «кирпич» (см. Рисунок). Четыре измерения с контрастными значениями (т. Е. Взаимоисключающими значениями) определяют текущий набор геонов (см. Рисунок):

  1. Форма поперечного сечения: круглое или прямое. Например, как указано выше, прямоугольник, перемещаемый по прямой оси, будет определять «кирпич», а поперечное сечение будет прямым.
  2. Ось: прямая или изогнутая.
  3. Размер поперечного сечения при перемещении по оси: постоянный против расширения (или сжатия) против расширения, затем сжатия против сжатия, затем расширения. Размер поперечного сечения «кирпича» будет постоянным.
  4. Окончание геона с поперечными сечениями постоянного размера: усеченное или сходящееся к точке или округленное.

Эти вариации в генерации геонов создают формы, различающиеся по NAP.

Экспериментальные проверки инвариантности точки зрения геонов [ править ]

В настоящее время имеется значительная поддержка основных предположений теории геонов (см. Теорию распознавания по компонентам ). Одной из проблем, вызвавших некоторую дискуссию, было открытие [3], что геоны были инвариантными к точке обзора с небольшими затратами или без каких-либо затрат на скорость или точность распознавания или сопоставления геонов при ориентации в глубину, которую ранее не испытывали. В некоторых исследованиях [4] сообщается о скромных затратах на сопоставление геонов в новых ориентациях в глубину, но эти исследования имели несколько методологических недостатков. [5] [6]

Исследования геонов [ править ]

Существует много исследований о геонах и их интерпретации. Важное исследование, проводимое сейчас [ когда? ] - это исследование, посвященное тому, как скремблирование геонов влияет на распознавание изображений у голубей. Ким Киркпатрик-Стегер, Эдвард А. Вассерман и Ирвинг Бидерман проводят это исследование и обнаружили, что отдельные геоны вместе с их пространственным составом важны для распознавания. [7] Кроме того, результаты этого исследования, кажется, указывают на то, что неслучайная чувствительность может быть обнаружена у всех видов, различающих форму. [8]

Заметки [ править ]

  1. ^ Бидерман, Ирвинг (1987). «Распознавание по компонентам: теория понимания человеческого образа» (PDF) . Психологический обзор . 94 (2): 115–47. DOI : 10.1037 / 0033-295X.94.2.115 . PMID  3575582 .
  2. ^ Неватия, Р. (1982) Машинное восприятие. Прентис-Холл. [ требуется страница ]
  3. ^ Бидерман, Ирвинг; Герхардштейн, Питер К. (1993). «Распознавание повернутых в глубину объектов: свидетельства и условия трехмерной инвариантности точки обзора» (PDF) . Журнал экспериментальной психологии: человеческое восприятие и производительность . 19 (6): 1162–82. DOI : 10.1037 / 0096-1523.19.6.1162 . PMID 8294886 .  
  4. ^ Тарр, Майкл Дж .; Уильямс, Пеппер; Хейворд, Уильям Дж .; Готье, Изабель (1998). «Распознавание трехмерных объектов зависит от точки обзора». Природа Неврологии . 1 (4): 275–7. DOI : 10,1038 / 1089 . PMID 10195159 . S2CID 14389169 .  
  5. ^ Бидерман, я; Бар, М. (1999). «Одноразовая инвариантность точки зрения при сопоставлении новых объектов». Исследование зрения . 39 (17): 2885–99. DOI : 10.1016 / S0042-6989 (98) 00309-5 . PMID 10492817 . S2CID 2494577 .  
  6. ^ Дилл, Маркус; Эдельман, Шимон (2001). «Несовершенная инвариантность к объектному переводу при распознавании сложных форм» . Восприятие . 30 (6): 707–24. DOI : 10,1068 / p2953 . PMID 11464559 . S2CID 12607120 .  
  7. ^ Бидерман, Ирвинг; Киркпатрик-Стегер, Ким; Вассерман, Эдвард (1998). «Влияние удаления, скремблирования и движения геона на распознавание изображений у голубей». Журнал экспериментальной психологии: процессы поведения животных . 24 (1): 34–46. DOI : 10.1037 / 0097-7403.24.1.34 . PMID 9438964 . 
  8. ^ Бидерман, Ирвинг; Киркпатрик-Стегер, Ким; Вассерман, Эдвард (1998). «Влияние удаления, скремблирования и движения геона на распознавание изображений у голубей». Журнал экспериментальной психологии: процессы поведения животных . 24 (1): 34–46. DOI : 10.1037 / 0097-7403.24.1.34 . PMID 9438964 .