Достоверность визуальной информации

Достоверность визуальной информации (VIF) — это показатель оценки качества полного эталонного изображения, основанный на статистике естественной сцены и понятии информации об изображении, извлеченной зрительной системой человека . ^[1] Он был разработан Хамидом Р. Шейхом и Аланом Бовиком в Лаборатории обработки изображений и видео (LIVE) Техасского университета в Остине в 2006 году. Он развернут в ядре системы мониторинга качества видео Netflix VMAF , которая управляет качеством изображения всех закодированных видео, транслируемых Netflix.

Изображения и видео трехмерной визуальной среды относятся к общему классу: классу природных сцен. Естественные сцены из крошечного подпространства в пространстве всех возможных сигналов, и исследователи разработали сложные модели, чтобы охарактеризовать эту статистику. Большинство реальных процессов искажения искажают эту статистику и делают изображение или видеосигналы неестественными. Индекс VIF использует статистические модели естественной сцены (NSS) в сочетании с моделью искажения (канала) для количественной оценки информации, совместно используемой между тестовым и эталонным изображениями. Далее индекс VIF основан на гипотезечто эта общая информация является аспектом точности, который хорошо связан с визуальным качеством. В отличие от предыдущих подходов, основанных на чувствительности к ошибкам зрительной системы человека (HVS) и измерении структуры ^[2] , этот статистический подход, используемый в информационно-теоретических условиях, дает метод полной эталонной (FR) оценки качества (QA), который не не полагается ни на HVS, ни на параметры просмотра геометрии, ни на какие-либо константы, требующие оптимизации, и при этом конкурентоспособен с современными методами обеспечения качества. ^{[ нужна ссылка ]}

В частности, эталонное изображение моделируется как результат стохастического«естественный» источник, который проходит через канал HVS и позже обрабатывается мозгом. Информационное содержание эталонного изображения количественно определяется как взаимная информация между входом и выходом канала HVS. Это та информация, которую мозг в идеале мог бы извлечь из выходных данных HVS. Затем та же мера количественно определяется при наличии канала искажения изображения, который искажает выходные данные естественного источника до того, как они проходят через канал HVS, тем самым измеряя информацию, которую мозг мог бы в идеале извлечь из тестового изображения. Это показано графически на рисунке 1. Затем две информационные меры объединяются для формирования меры достоверности визуальной информации, которая связывает визуальное качество с относительной информацией об изображении.

Рисунок 1