Теория визуального индексирования


Теория визуального индексирования , также известная как теория FINST , представляет собой теорию раннего визуального восприятия , разработанную Зеноном Пилишиным в 1980-х годах. Он предлагает механизм предварительного внимания («FINST»), функция которого состоит в том, чтобы выделять существенные элементы визуальной сцены и отслеживать их местоположение в пространстве и времени. Теория визуального индексирования, разработанная в ответ на то, что Пилишин считал ограничениями известных теорий визуального восприятия того времени, подтверждается несколькими линиями эмпирических данных.

«FINST» означает «FINgers of INSTantiation». Пилишин описывает теорию визуального индексирования в терминах этой аналогии. [1] Представьте, предлагает он, положив пальцы на пять отдельных объектов в сцене. Когда эти объекты перемещаются, ваши пальцы остаются в соответствующем контакте с каждым из них, что позволяет вам постоянно отслеживать их местонахождение и положение относительно друг друга. Хотя вы, возможно, не сможете таким образом различить какую-либо подробную информацию о самих объектах, наличие ваших пальцев обеспечивает ссылку, с помощью которой вы можете получить доступ к такой информации в любое время, без необходимости перемещать объекты в пределах сцены. Кроме того, непрерывность объектов во времени сохраняется по своей природе — вы знаете объект, на который ссылается ваш мизинец в момент времени t.— это тот же самый объект, на который ссылается ваш мизинец в момент времени t −1 , независимо от любых пространственных преобразований, которые он претерпел, потому что ваш палец оставался с ним в постоянном контакте.

Теория зрительной индексации утверждает, что система зрительного восприятия работает аналогичным образом. FINST ведут себя как пальцы в приведенном выше сценарии, указывая и отслеживая местоположение различных объектов в визуальном пространстве. Как и пальцы, FINST:

FINST работают предварительно внимательно, то есть до того, как внимание будет привлечено или направлено на объект в поле зрения. Их основная задача состоит в том, чтобы индивидуализировать определенные характерные особенности сцены, концептуально отличая их от других стимулов. В соответствии с теорией визуальной индексации FINSTing является необходимой предпосылкой для перцептивной обработки более высокого уровня.

Пилишин предполагает, что то, на что FINST воздействуют в прямом смысле, - это «кластеры признаков» на сетчатке, хотя точный набор критериев для распределения FINST не определен. «Вопрос о том, как FINST назначаются в первую очередь, остается открытым, хотя кажется разумным, что они назначаются в первую очередь стимул-управляемым образом, возможно, активацией локально отличных свойств стимула — в частности, новыми признаками, входящими в зрительную систему. поле." [1]

FINST имеют ограничения по ресурсам. В любой момент времени может быть выделено до пяти FINST, и они предоставляют визуальной системе информацию об относительном расположении FINST-объектов по отношению друг к другу.


FINST модель зрительного восприятия.