Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Сжатие изображений - это тип сжатия данных, применяемый к цифровым изображениям , чтобы снизить их стоимость при хранении или передаче . Алгоритмы могут использовать преимущества визуального восприятия и статистических свойств данных изображения, чтобы обеспечить превосходные результаты по сравнению с общими методами сжатия данных, которые используются для других цифровых данных. [1]

Сравнение изображений JPEG, сохраненных в Adobe Photoshop с разными уровнями качества, с функцией сохранения в Интернете или без нее.

Сжатие изображений с потерями и без потерь [ править ]

Сжатие изображения может быть с потерями или без потерь . Сжатие без потерь предпочтительнее для архивных целей и часто для медицинских изображений, технических чертежей, картинок или комиксов. Методы сжатия с потерями, особенно при использовании с низкой скоростью передачи данных , вызывают артефакты сжатия . Методы с потерями особенно подходят для естественных изображений, таких как фотографии, в приложениях, где допустима незначительная (иногда незаметная) потеря точности для достижения существенного снижения скорости передачи данных. Сжатие с потерями, которое дает незначительные различия, можно назвать визуально без потерь.

Методы сжатия с потерями :

Способы сжатия без потерь :

  • Кодирование длин серий - используется в методе по умолчанию в PCX и как один из возможных в BMP , TGA , TIFF
  • Сжатие изображения области
  • Предиктивное кодирование - используется в DPCM
  • Энтропийное кодирование - два наиболее распространенных метода энтропийного кодирования - это арифметическое кодирование и кодирование Хаффмана.
  • Адаптивные словарные алгоритмы, такие как LZW - используются в GIF и TIFF.
  • DEFLATE - используется в PNG , MNG и TIFF
  • Цепные коды

Другие свойства [ править ]

Наилучшее качество изображения при заданной степени сжатия (или скорости передачи данных ) является основной целью сжатия изображения, однако существуют и другие важные свойства схем сжатия изображений:

Масштабируемость обычно относится к снижению качества, достигаемому манипулированием потоком битов или файлом (без декомпрессии и повторного сжатия). Другие названия масштабируемости - прогрессивное кодирование или встроенные потоки битов . Несмотря на противоположную природу, масштабируемость также может быть обнаружена в кодеках без потерь, обычно в форме сканирования пикселей от грубого до тонкого. Масштабируемость особенно полезна для предварительного просмотра изображений при их загрузке (например, в веб-браузере) или для обеспечения доступа с переменным качеством, например, к базам данных. Есть несколько типов масштабируемости:

  • Качественный прогрессивный или послойный прогрессивный: битовый поток последовательно улучшает восстановленное изображение.
  • Прогрессивное разрешение : сначала кодируйте изображение с более низким разрешением; затем закодируйте разницу в более высоком разрешении. [3] [4]
  • Компонент с прогрессивной разверткой : сначала кодируется версия в серой шкале; затем добавляем полный цвет.

Кодирование интересующей области . Некоторые части изображения кодируются с более высоким качеством, чем другие. Это может сочетаться с масштабируемостью (сначала кодируйте эти части, а другие - позже).

Мета-информация . Сжатые данные могут содержать информацию об изображении, которая может использоваться для категоризации, поиска или просмотра изображений. Такая информация может включать статистику цвета и текстуры, небольшие изображения для предварительного просмотра , а также информацию об авторе или авторских правах.

Мощность обработки . Алгоритмы сжатия требуют разной вычислительной мощности для кодирования и декодирования. Некоторые алгоритмы с высокой степенью сжатия требуют высокой вычислительной мощности.

Качество метода сжатия часто измеряется пиковым отношением сигнал / шум . Он измеряет количество шума, вносимого в результате сжатия изображения с потерями, однако субъективное суждение зрителя также считается важной мерой, возможно, самой важной мерой.

История [ править ]

Энтропийного кодирования началось в 1940 - х с введением Шеннона-Фано кодирования , [5] основой для кодирования Хаффмана , который был разработан в 1950 году [6] Преобразование кодирования восходит к концу 1960-х с введением быстрого преобразования Фурье (БПФ ) кодирование в 1968 году и преобразование Адамара в 1969 году. [7]

Важным достижением в области сжатия данных изображения стало дискретное косинусное преобразование (DCT), метод сжатия с потерями , впервые предложенный Насиром Ахмедом в 1972 году. [8] DCT-сжатие стало основой для JPEG , который был представлен Объединенной группой экспертов по фотографии (JPEG). ) в 1992 году. [9] JPEG сжимает изображения до файлов гораздо меньшего размера и стал наиболее широко используемым форматом файлов изображений . [10] Его высокоэффективный алгоритм сжатия DCT в значительной степени способствовал широкому распространению цифровых изображений и цифровых фотографий., [11], при этом по состоянию на 2015 год ежедневно создавалось несколько миллиардов изображений JPEG. [12]

Lempel – Ziv – Welch (LZW) - это алгоритм сжатия без потерь , разработанный Абрахамом Лемпелем , Якобом Зивом и Терри Велчем в 1984 году. Он используется в формате GIF , представленном в 1987 году. [13] DEFLATE , алгоритм сжатия без потерь, разработанный Филом. Katz и указанный в 1996 году, используется в формате Portable Network Graphics (PNG). [14]

Вейвлет- кодирование, использование вейвлет-преобразований при сжатии изображений, началось после разработки кодирования DCT. [15] Введение DCT привело к развитию вейвлет-кодирования, варианта DCT-кодирования, в котором вместо блочного алгоритма DCT используются вейвлеты. [15] Стандарт JPEG 2000 был разработан с 1997 по 2000 год комитетом по JPEG под председательством Тураджа Эбрахими (впоследствии президента JPEG). [16] В отличие от алгоритма DCT, используемого в исходном формате JPEG, JPEG 2000 вместо этого использует алгоритмы дискретного вейвлет-преобразования (DWT). Он использует вейвлет-преобразование CDF 9/7 (разработано Ингрид Добешив 1992 г.) за алгоритм сжатия с потерями [17] и вейвлет-преобразование ЛеГалла-Табатабаи (LGT) 5/3 [18] [19] (разработанное Дидье Ле Галлом и Али Дж. Табатабаи в 1988 г.) [20] за его алгоритм сжатия без потерь. [17] Технология JPEG 2000 , которая включает расширение Motion JPEG 2000 , была выбрана в качестве стандарта кодирования видео для цифрового кино в 2004 году. [21]

Примечания и ссылки [ править ]

  1. ^ «Сжатие данных изображения» .
  2. ^ Насир Ахмед , Т. Натараджан и К. Р. Рао , " Дискретное косинусное преобразование ", IEEE Trans. Компьютеры , 90–93, январь 1974 г.
  3. ^ Burt, P .; Адельсон, Э. (1 апреля 1983 г.). «Лапласовская пирамида как компактный код изображения». Транзакции IEEE по коммуникациям . 31 (4): 532–540. CiteSeerX 10.1.1.54.299 . DOI : 10.1109 / TCOM.1983.1095851 . 
  4. ^ Шао, Дэн; Кропач, Вальтер Г. (3–5 февраля 2010 г.). Шпачек, Либор; Франк, Войтех (ред.). "Неправильная пирамида лапласовского графа" (PDF) . Зимний семинар по компьютерному зрению 2010 . Нове Грады, Чешская Республика: Чешское общество распознавания образов.
  5. ^ Клод Элвуд Шеннон (1948). Alcatel-Lucent (ред.). «Математическая теория коммуникации» (PDF) . Технический журнал Bell System . 27 (3–4): 379–423, 623–656. DOI : 10.1002 / j.1538-7305.1948.tb01338.x . hdl : 11858 / 00-001M-0000-002C-4314-2 . Проверено 21 апреля 2019 .
  6. ^ Дэвид Альберт Хаффман (сентябрь 1952 г.), «Метод построения кодов с минимальной избыточностью» (PDF) , Proceedings of the IRE , 40 (9), pp. 1098–1101, doi : 10.1109 / JRPROC.1952.273898
  7. ^ Уильям К. Пратт, Джулиус Кейн, Гарри С. Эндрюс: « Кодирование изображений с преобразованием Адамара », в Proceedings of the IEEE 57.1 (1969): Seiten 58–68
  8. Ахмед, Насир (январь 1991 г.). «Как я пришел к дискретному косинусному преобразованию» . Цифровая обработка сигналов . 1 (1): 4–5. DOI : 10.1016 / 1051-2004 (91) 90086-Z .
  9. ^ «T.81 - ЦИФРОВОЕ СЖАТИЕ И КОДИРОВАНИЕ НЕПРЕРЫВНЫХ ТОНОВЫХ ИЗОБРАЖЕНИЙ - ТРЕБОВАНИЯ И РЕКОМЕНДАЦИИ» (PDF) . CCITT . Сентябрь 1992 . Проверено 12 июля 2019 .
  10. ^ «Объяснение формата изображения JPEG» . BT.com . BT Group . 31 мая 2018 . Дата обращения 5 августа 2019 .
  11. ^ «Что такое JPEG? Невидимый объект, который вы видите каждый день» . Атлантика . 24 сентября 2013 . Проверено 13 сентября 2019 .
  12. ^ Baraniuk, Крис (15 октября 2015). «Защита от копирования может приходить на файлы JPEG» . BBC News . BBC . Проверено 13 сентября 2019 .
  13. ^ «Противоречие GIF: перспектива разработчика программного обеспечения» . Дата обращения 26 мая 2015 .
  14. ^ Л. Питер Дойч (май 1996). DEFLATE Спецификация формата сжатых данных версии 1.3 . IETF . п. 1 сек. Абстрактный. DOI : 10,17487 / RFC1951 . RFC 1951 . Проверено 23 апреля 2014 .
  15. ^ a b Хоффман, Рой (2012). Сжатие данных в цифровых системах . Springer Science & Business Media . п. 124. ISBN 9781461560319. По сути, вейвлет-кодирование - это вариант кодирования с преобразованием на основе DCT, который уменьшает или устраняет некоторые из его ограничений. (...) Другое преимущество заключается в том, что вместо работы с блоками 8 × 8 пикселей, как это делают JPEG и другие методы DCT на основе блоков, вейвлет-кодирование может одновременно сжимать все изображение.
  16. ^ Таубман, Дэвид; Марселлин, Майкл (2012). JPEG2000: Основы, стандарты и практика сжатия изображений: Основы, стандарты и практика сжатия изображений . Springer Science & Business Media . ISBN 9781461507994.
  17. ^ a b Unser, M .; Блю Т. (2003). «Математические свойства вейвлет-фильтров JPEG2000» (PDF) . IEEE Transactions по обработке изображений . 12 (9): 1080–1090. Bibcode : 2003ITIP ... 12.1080U . DOI : 10.1109 / TIP.2003.812329 . PMID 18237979 . S2CID 2765169 .   
  18. Салливан, Гэри (8–12 декабря 2003 г.). «Общие характеристики и конструктивные соображения для кодирования видео временного поддиапазона» . ITU-T . Группа экспертов по кодированию видео . Проверено 13 сентября 2019 .
  19. ^ Bovik, Алан С. (2009). Основное руководство по обработке видео . Академическая пресса . п. 355. ISBN 9780080922508.
  20. Галл, Дидье Ле; Табатабай, Али Дж. (1988). «Подполосное кодирование цифровых изображений с использованием симметричных коротких ядерных фильтров и методов арифметического кодирования». ICASSP-88., Международная конференция по акустике, речи и обработке сигналов : 761–764, том 2. DOI : 10.1109 / ICASSP.1988.196696 . S2CID 109186495 . 
  21. ^ Шварц, Чарльз С. (2005). Понимание цифрового кино: профессиональное руководство . Тейлор и Фрэнсис . п. 147. ISBN. 9780240806174.

Внешние ссылки [ править ]

  • Сжатие изображений  - лекция MIT OpenCourseWare
  • Основы кодирования изображений
  • Исследование сжатия изображений  - с основами, сравнение различных методов сжатия, таких как JPEG2000, JPEG и JPEG XR / HD Photo
  • Основы сжатия данных  - включает сравнение форматов PNG, JPEG и JPEG-2000
  • Часто задаваемые вопросы: каковы современные достижения в области сжатия изображений без потерь? от comp.compression
  • IPRG  - открытая группа, связанная с ресурсами исследования обработки изображений