Преобразование кодирования представляет собой тип сжатия данных для «естественных» данных , таких как аудио сигналов или фотографических изображений . Преобразование обычно выполняется без потерь (полностью обратимо) само по себе, но используется для обеспечения лучшего (более целенаправленного) квантования , которое затем приводит к более низкому качеству копии исходного ввода ( сжатие с потерями ).
При кодировании с преобразованием знания о приложении используются для выбора информации, которую следует отбросить, тем самым снижая его пропускную способность . Оставшуюся информацию затем можно сжать различными способами. Когда вывод декодируется, результат может не совпадать с исходным вводом, но ожидается, что он будет достаточно близким для целей приложения.
Цветное телевидение
NTSC
Одна из наиболее успешных систем кодирования с преобразованием обычно не упоминается как таковая - примером является цветное телевидение NTSC . После обширной серии исследований в 1950-х годах Альда Бедфорд показала, что человеческий глаз имеет высокое разрешение только для черного и белого, несколько меньше для «средних» цветов, таких как желтый и зеленый, и гораздо меньше для цветов в конце диапазона. спектр, красный и синий.
Использование этих знаний позволило RCA разработать систему, в которой они отбрасывали большую часть синего сигнала после того, как он исходит от камеры, сохраняя большую часть зеленого и только часть красного; это субдискретизация цветности в цветовом пространстве YIQ .
В результате получается сигнал со значительно меньшим содержанием, который вписывается в существующие черно-белые сигналы с полосой пропускания 6 МГц в качестве фазомодулированного дифференциального сигнала. Средний телевизор отображает эквивалент 350 пикселей в строке, но ТВ-сигнал содержит достаточно информации только для 50 пикселей синего и, возможно, 150 пикселей красного. В большинстве случаев это не очевидно для зрителя, так как глаз в любом случае мало использует «недостающую» информацию.
PAL и SECAM
В системах PAL и SECAM используются почти идентичные или очень похожие методы передачи цвета. В любом случае обе системы включены в подвыборку.
Цифровой
Этот термин гораздо чаще используется в цифровых носителях и цифровой обработке сигналов . Наиболее широко используемым методом кодирования с преобразованием в этом отношении является дискретное косинусное преобразование (DCT) [1] [2], предложенное Насиром Ахмедом в 1972 году [3] [4] и представленное Ахмедом с Т. Натараджаном и К. Р. Рао в 1974. [5] Этот DCT, в контексте семейства дискретных косинусных преобразований, является DCT-II. Она является основой для общего JPEG сжатия изображения стандарта, [6] , который рассматривает небольшие блоки изображения и преобразует их в частотной области для более эффективного квантования ( с потерями) и сжатия данных . При кодировании видео стандарты H.26x и MPEG модифицируют этот метод сжатия изображения DCT по кадрам в движущемся изображении с использованием компенсации движения , дополнительно уменьшая размер по сравнению с серией JPEG.
При кодировании звука сжатие звука MPEG анализирует преобразованные данные в соответствии с психоакустической моделью, которая описывает чувствительность человеческого уха к частям сигнала, аналогично модели телевизора. MP3 использует гибридный алгоритм кодирования, сочетающий модифицированное дискретное косинусное преобразование (MDCT) и быстрое преобразование Фурье (FFT). [7] На смену ему пришло Advanced Audio Coding (AAC), в котором используется чистый алгоритм MDCT для значительного повышения эффективности сжатия. [8]
Базовый процесс оцифровки аналогового сигнала - это своего рода кодирование с преобразованием, в котором в качестве преобразования используется выборка в одной или нескольких областях.
Смотрите также
Рекомендации
- ^ Muchahary, D .; Мондал, AJ; Parmar, RS; Borah, AD; Маджумдер, А. (2015). «Упрощенный подход к проектированию для эффективного вычисления DCT». 2015 Пятая международная конференция по системам связи и сетевым технологиям : 483–487. DOI : 10,1109 / CSNT.2015.134 .
- ^ Чен, Вай Кай (2004). Справочник по электротехнике . Эльзевир . п. 906. ISBN. 9780080477480.
- ^ Ахмед, Насир (январь 1991 г.). «Как я пришел к дискретному косинусному преобразованию» . Цифровая обработка сигналов . 1 (1): 4–5. DOI : 10.1016 / 1051-2004 (91) 90086-Z .
- ^ Станкович, Радомир С .; Астола, Яакко Т. (2012). "Воспоминания о ранних работах в DCT: Интервью с К.Р. Рао" (PDF) . Отпечатки с первых дней информационных наук . 60 . Проверено 13 октября 2019 .
- ^ Ахмед, Насир ; Натараджан, Т .; Рао, КР (январь 1974), "дискретного косинусного преобразования", IEEE Transactions на компьютерах , C-23 (1): 90-93, DOI : 10,1109 / TC.1974.223784
- ^ «T.81 - Цифровое сжатие и кодирование неподвижных изображений с непрерывным тоном - Требования и рекомендации» (PDF) . CCITT . Сентябрь 1992 . Проверено 12 июля 2019 .
- ^ Гукерт, Джон (весна 2012 г.). «Использование БПФ и MDCT в сжатии аудио MP3» (PDF) . Университет Юты . Проверено 14 июля 2019 .
- ^ Бранденбург, Карлхайнц (1999). «Объяснение MP3 и AAC» (PDF) . Архивировано (PDF) из оригинала 13 февраля 2017 года.