Артефакт сжатия


Артефакт сжатия (или артефакт ) — это заметное искажение мультимедиа (включая изображения , аудио и видео ), вызванное применением сжатия с потерями . Сжатие данных с потерями включает в себя отбрасывание некоторых данных носителя, чтобы они стали достаточно маленькими для хранения в пределах желаемого дискового пространства или передачи ( потоковой передачи ) в пределах доступной полосы пропускания (известной как скорость передачи данных или скорость передачи ). Если компрессор не может сохранить достаточно данных в сжатой версии, результатом будет потеря качества или появление артефактов. ТоАлгоритм сжатия может быть недостаточно интеллектуальным, чтобы различать искажения, не имеющие большого субъективного значения, и искажения, нежелательные для пользователя.

Наиболее распространенными артефактами цифрового сжатия являются блоки DCT, вызванные алгоритмом сжатия дискретного косинусного преобразования (DCT), используемым во многих стандартах цифрового мультимедиа , таких как форматы видеофайлов JPEG , MP3 и MPEG . [1] [2] [3] Эти артефакты сжатия появляются, когда применяется сильное сжатие, [1] и часто возникают на распространенных цифровых носителях, таких как DVD , распространенных компьютерных форматах файлов, таких как файлы JPEG, MP3 и MPEG, и некоторых альтернативных форматах. на компакт-диск , такой как формат Sony MiniDisc . Несжатые носители (например, на лазерных дисках, аудио компакт -диски и файлы WAV ) или носители, сжатые без потерь (такие как FLAC или PNG ), не страдают от артефактов сжатия.

Минимизация воспринимаемых артефактов является ключевой целью реализации алгоритма сжатия с потерями. Тем не менее, артефакты иногда намеренно создаются для художественных целей, стиль, известный как глитч-арт [4] или мошенничество данных. [5]

С технической точки зрения артефакт сжатия — это особый класс ошибок данных, который обычно является следствием квантования при сжатии данных с потерями. Там , где используется кодирование с преобразованием , оно обычно принимает форму одной из базовых функций пространства преобразования кодера.

При выполнении кодирования на основе блочного дискретного косинусного преобразования (DCT) [1] для квантования , как и в JPEG -сжатых изображениях, могут появляться артефакты нескольких типов.

Другие алгоритмы с потерями, которые используют сопоставление с образцом для дедупликации похожих символов, склонны к введению трудно обнаруживаемых ошибок в печатном тексте. Например, цифры «6» и «8» могут быть заменены. Было замечено, что это происходит с JBIG2 в некоторых фотокопировальных машинах. [6] [7]


Исходное изображение с хорошими краями текста и цветовой гаммой
Потеря четкости краев и «размытость» тона при сильном сжатии JPEG
Иллюстрация эффекта сжатия JPEG на слегка зашумленном изображении со смесью текста и пробелов. Текст представляет собой снимок экрана из разговора в Википедии с добавленным шумом (интенсивность 10 в Paint.NET). Один кадр анимации был сохранен в формате JPEG (качество 90) и перезагружен. Затем оба кадра были увеличены в 4 раза (интерполяция ближайшего соседа).
Артефакты блочного кодирования в изображении JPEG. Плоские блоки вызваны грубым квантованием. Видны разрывы на границах блоков преобразования.
Пример изображения с артефактами из-за ошибки передачи
Воспроизвести медиа
Видео глитч-арт