Артефакт сжатия (или артефакт ) — это заметное искажение мультимедиа (включая изображения , аудио и видео ), вызванное применением сжатия с потерями . Сжатие данных с потерями включает в себя отбрасывание некоторых данных носителя, чтобы они стали достаточно маленькими для хранения в пределах желаемого дискового пространства или передачи ( потоковой передачи ) в пределах доступной полосы пропускания (известной как скорость передачи данных или скорость передачи ). Если компрессор не может сохранить достаточно данных в сжатой версии, результатом будет потеря качества или появление артефактов. ТоАлгоритм сжатия может быть недостаточно интеллектуальным, чтобы различать искажения, не имеющие большого субъективного значения, и искажения, нежелательные для пользователя.
Наиболее распространенными артефактами цифрового сжатия являются блоки DCT, вызванные алгоритмом сжатия дискретного косинусного преобразования (DCT), используемым во многих стандартах цифрового мультимедиа , таких как форматы видеофайлов JPEG , MP3 и MPEG . [1] [2] [3] Эти артефакты сжатия появляются, когда применяется сильное сжатие, [1] и часто возникают на распространенных цифровых носителях, таких как DVD , распространенных компьютерных форматах файлов, таких как файлы JPEG, MP3 и MPEG, и некоторых альтернативных форматах. на компакт-диск , такой как формат Sony MiniDisc . Несжатые носители (например, на лазерных дисках, аудио компакт -диски и файлы WAV ) или носители, сжатые без потерь (такие как FLAC или PNG ), не страдают от артефактов сжатия.
Минимизация воспринимаемых артефактов является ключевой целью реализации алгоритма сжатия с потерями. Тем не менее, артефакты иногда намеренно создаются для художественных целей, стиль, известный как глитч-арт [4] или мошенничество данных. [5]
С технической точки зрения артефакт сжатия — это особый класс ошибок данных, который обычно является следствием квантования при сжатии данных с потерями. Там , где используется кодирование с преобразованием , оно обычно принимает форму одной из базовых функций пространства преобразования кодера.
При выполнении кодирования на основе блочного дискретного косинусного преобразования (DCT) [1] для квантования , как и в JPEG -сжатых изображениях, могут появляться артефакты нескольких типов.
Другие алгоритмы с потерями, которые используют сопоставление с образцом для дедупликации похожих символов, склонны к введению трудно обнаруживаемых ошибок в печатном тексте. Например, цифры «6» и «8» могут быть заменены. Было замечено, что это происходит с JBIG2 в некоторых фотокопировальных машинах. [6] [7]