Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Дискретного косинусного преобразования ( ДКП ) выражает конечную последовательность точек данных в терминах суммы косинус функций осциллирующих на разных частотах . DCT, впервые предложенный Насиром Ахмедом в 1972 году, представляет собой широко используемый метод преобразования при обработке сигналов и сжатии данных . Он используется в большинстве цифровых носителей , включая цифровые изображения (например, JPEG и HEIF , где небольшие высокочастотные компоненты могут быть отброшены), цифровое видео (например, MPEG и H.26x).), цифровое аудио (например, Dolby Digital , MP3 и AAC ), цифровое телевидение (например, SDTV , HDTV и VOD ), цифровое радио (например, AAC + и DAB + ) и кодирование речи (например, AAC-LD , Siren и Opus ). DCT также важны для множества других приложений в науке и технике , таких как цифровая обработка сигналов , телекоммуникационные устройства, уменьшение пропускной способности сети.использование и спектральные методы для численного решения уравнений в частных производных .

Использование косинусных функций, а не синусоидальных функций имеет решающее значение для сжатия, поскольку оказывается (как описано ниже), что требуется меньше косинусных функций для аппроксимации типичного сигнала , тогда как для дифференциальных уравнений косинусы выражают конкретный выбор граничных условий . В частности, DCT - это преобразование Фурье, подобное дискретному преобразованию Фурье (ДПФ), но с использованием только действительных чисел.. DCT обычно связаны с коэффициентами ряда Фурье периодически и симметрично расширенной последовательности, тогда как DFT связаны с коэффициентами ряда Фурье периодически расширенной последовательности. DCT эквивалентны DFT примерно в два раза большей длины, работающим с реальными данными с четной симметрией (поскольку преобразование Фурье действительной и четной функции является действительным и четным), тогда как в некоторых вариантах входные и / или выходные данные сдвигаются вдвое. образец. Существует восемь стандартных вариантов DCT, четыре из которых являются общими.

Наиболее распространенным вариантом дискретного косинусного преобразования является DCT типа II, который часто называют просто «DCT». Это был оригинальный DCT, впервые предложенный Ахмедом. Его обратный DCT типа III, соответственно, часто называют просто «обратным DCT» или «IDCT». Два связанных преобразования - это дискретное синусоидальное преобразование (DST), которое эквивалентно DFT действительных и нечетных функций, и модифицированное дискретное косинусное преобразование (MDCT), которое основано на DCT перекрытияданные. Многомерные DCT (MD DCT) разработаны для расширения концепции DCT для сигналов MD. Существует несколько алгоритмов вычисления MD DCT. Для уменьшения вычислительной сложности реализации DCT было разработано множество быстрых алгоритмов. Одним из них является целочисленный DCT [1] (IntDCT), целочисленное приближение стандарта DCT [2], используемого в нескольких международных стандартах ISO / IEC и ITU-T . [2] [1]

Сжатие DCT, также известное как сжатие блоков, сжимает данные в наборы дискретных блоков DCT. [3] Блоки DCT могут иметь несколько размеров, включая 8x8 пикселей для стандартного DCT и различные целочисленные размеры DCT от 4x4 до 32x32 пикселей. [1] [4] DCT обладает сильным свойством «сжатия энергии» [5] [6], позволяющим достичь высокого качества при высоких степенях сжатия данных . [7] [8] Однако блочные артефакты сжатия могут появиться при применении сильного сжатия DCT.

История [ править ]

Насир Ахмед , изобретатель дискретного косинусного преобразования (DCT), который он впервые предложил в 1972 году.

Дискретное косинусное преобразование (DCT) было впервые задумано Насиром Ахмедом , когда он работал в Государственном университете Канзаса , и он предложил концепцию Национальному научному фонду в 1972 году. Первоначально он предназначал DCT для сжатия изображений . [9] [1] Ахмед разработал практический алгоритм ДКП со своим аспирантом Т. Natarajan и друга КР Рао в Университете штата Техас в Арлингтоне в 1973 году, и они обнаружили , что это был наиболее эффективный алгоритм для сжатия изображений. [9] Они представили свои результаты в статье под названием «Дискретное косинусное преобразование», опубликованной в январе 1974 года. [5] [6] [10]В нем описывается то, что сейчас называется DCT типа II (DCT-II), [11], а также обратное DCT типа III (IDCT). [5] Это была эталонная публикация, [12] [13] и с момента публикации она упоминалась как фундаментальное развитие в тысячах работ. [14] Основная исследовательская работа и события, которые привели к развитию DCT, были обобщены в более поздней публикации Ахмеда «Как я пришел к дискретному косинусному преобразованию». [9]

С момента его появления в 1974 году DCT проводились обширные исследования. [10] В 1977 году Вен-Сюн Чен опубликовал статью с К. Харрисоном Смитом и Стэнли К. Фраликом, в которой представил быстрый алгоритм DCT, [15] [10] и основал Compression Labs для коммерциализации технологии DCT. [1] Дальнейшие разработки включают статью 1978 года М.Дж. Нарасимхи и А.М. Петерсона и статью 1984 года Б.Г. Ли. [10] Эти исследовательские работы, наряду с оригинальной статьей Ахмеда 1974 года и статьей Чена 1977 года, были процитированы Joint Photographic Experts Group в качестве основы для алгоритма сжатия изображений JPEG с потерями в 1992 году. [10] [16]

В 1975 году Джон А. Роуз и Ганер С. Робинсон адаптировали DCT для межкадрового кодирования видео с компенсацией движения . Они экспериментировали с DCT и быстрым преобразованием Фурье (FFT), разрабатывая межкадровые гибридные кодеры для обоих, и обнаружили, что DCT является наиболее эффективным из-за его меньшей сложности, способного сжимать данные изображения до 0,25 бит на пиксель. для сцены видеотелефона с качеством изображения, сравнимым с внутрикадровым кодером, требующим 2 бита на пиксель. [17] [18] DCT был применен к кодированию видео Wen-Hsiung Chen, [1] который разработал быстрый алгоритм DCT с CH Smith и SC Fralick в 1977 году.[15] [10] и основал Compression Labs для коммерциализации технологии DCT. [1] В 1979 году Анил К. Джайн и Джасвант Р. Джайн усовершенствовали сжатие видео DCT с компенсацией движения [19] [20], которое также называется компенсацией движения блоков. [20] Это привело к тому, что в 1981 году Чен разработал практический алгоритм сжатия видео, названный DCT с компенсацией движения или адаптивным кодированием сцены. [20] DCT с компенсацией движения позже стал стандартным методом кодирования для сжатия видео с конца 1980-х годов. [21] [22]

Целочисленный DCT используется в Advanced Video Coding (AVC), [23] [1], введенном в 2003 году, и High Efficiency Video Coding (HEVC), [4] [1], представленном в 2013 году. Целочисленный DCT также используется в Формат высокоэффективного изображения (HEIF), который использует подмножество формата кодирования видео HEVC для кодирования неподвижных изображений. [4]

ДКП вариант, модифицированного дискретного косинусного преобразования (МДКП), был разработан Джоном П. Princen, AW Джонсон и Алан Б. Брэдли в университете Суррей в 1987 году, [24] Ниже более ранней работы по Princen и Брэдли в 1986 году [ 25] MDCT используется в большинстве современных форматов сжатия звука , таких как Dolby Digital (AC-3), [26] [27] MP3 (в котором используется гибридный алгоритм DCT- FFT ), [28] Advanced Audio Coding (AAC). , [29] и Vorbis ( Ogg ). [30]

Дискретное преобразование синус (DST) , был получен из ДКПА, путем замены условию Неймана при х = 0 с условием Дирихля . [31] Летнее время было описано в документе DCT 1974 года Ахмедом, Натараджаном и Рао. [5] ТЛЧ I типа (ТЛЧ-I) было позже описано Анилом К. Джайном в 1976 году, а ТЛЧ II типа (ТЛЧ-II) было затем описано Х. Б. Кекрой и Дж. К. Соланка в 1978 г. [32]

Насир Ахмед также разработал алгоритм DCT без потерь с Гиридхаром Мандьямом и Нираджем Маготрой из Университета Нью-Мексико в 1995 году. Это позволяет использовать метод DCT для сжатия изображений без потерь . Это модификация исходного алгоритма DCT, включающая элементы обратной DCT и дельта-модуляции . Это более эффективный алгоритм сжатия без потерь, чем энтропийное кодирование . [33] DCT без потерь также известен как LDCT. [34]

Вейвлет- кодирование, использование вейвлет-преобразований при сжатии изображений, началось после разработки кодирования DCT. [35] Введение DCT привело к развитию вейвлет-кодирования, варианта DCT-кодирования, в котором вместо блочного алгоритма DCT используются вейвлеты. [35] дискретное вейвлет - преобразование (DWT) кодирование используется в формате JPEG 2000 стандарта, [36] разработан с 1997 по 2000, [37] и в BBC «ы Дирака формат сжатия видео выпущен в 2008. Вейвлетный кодирования является более processor- интенсивно, и он еще не получил широкого распространения в обращении к потребителю. [38]

Приложения [ править ]

ДКП является наиболее широко используемым методом преобразования в обработке сигналов , [39] , и, безусловно, наиболее широко используется линейное преобразование в сжатии данных . [40] Сжатие данных DCT было основополагающим для цифровой революции . [8] [41] [42] Несжатые цифровые носители, а также сжатие без потерь имели непрактично высокие требования к памяти и полосе пропускания , которые были значительно сокращены за счет высокоэффективного метода сжатия DCT с потерями [7] [8], способного обеспечитькоэффициенты сжатия данных от 8: 1 до 14: 1 для качества, близкого к студийному [7], до 100: 1 для контента приемлемого качества. [8] Широкое распространение стандартов сжатия DCT привело к появлению и распространению цифровых медиа-технологий, таких как цифровые изображения , цифровые фотографии , [43] [44] цифровое видео , [21] [42] потоковое мультимедиа , [45] цифровое телевидение , потоковое телевидение , видео по запросу (VOD), [8] цифровое кино , [26] видео высокой четкости (HD видео) ителевидение высокой четкости (HDTV). [7] [46]

DCT, и в частности DCT-II, часто используется при обработке сигналов и изображений, особенно для сжатия с потерями, поскольку он обладает сильным свойством «сжатия энергии»: [5] [6] в типичных приложениях большая часть сигнала информация имеет тенденцию концентрироваться в нескольких низкочастотных компонентах DCT. Для сильно коррелированных марковских процессов DCT может приблизиться к эффективности сжатия преобразования Карунена-Лоэва (что является оптимальным с точки зрения декорреляции). Как поясняется ниже, это происходит из граничных условий, неявных в функциях косинуса.

ДКП также широко используется при решении дифференциальных уравнений с помощью спектральных методов , где различные варианты соответствуют ДКП в несколько различных четных / нечетных граничных условий на двух концах массива.

DCT также тесно связаны с полиномами Чебышева , и быстрые алгоритмы DCT (см. Ниже) используются в приближении Чебышева произвольных функций сериями полиномов Чебышева, например, в квадратуре Кленшоу – Кертиса .

DCT - это стандарт кодирования мультимедийных телекоммуникационных устройств. Он широко используется для снижения скорости передачи данных и уменьшения использования полосы пропускания сети . [1] Сжатие DCT значительно уменьшает объем памяти и полосу пропускания, необходимые для цифровых сигналов . [8]

Общие приложения [ править ]

DCT широко используется во многих приложениях, включая следующие.

  • Аудио обработка сигналов - кодирования звука , аудио сжатие данных ( с потерями и без потерь), [47] объемный звук , [26] акустического эха и подавления обратной связи , фонемы признание, во временной области наложения спектров отмены (TDAC) [48]
    • Цифровое аудио [1]
    • Цифровое радио - цифровое аудиовещание (DAB +), [49] HD Radio [50]
    • Обработка речи - кодирование речи [51] [52] распознавание речи , обнаружение голосовой активности (VAD) [48]
    • Цифровая телефония - передача голоса по IP (VoIP), [51] мобильная телефония , видеотелефония , [52] телеконференцсвязь , видеоконференцсвязь [1]
  • Биометрия - ориентация отпечатков пальцев , системы распознавания лиц , биометрические водяные знаки , биометрические водяные знаки на основе отпечатков пальцев, идентификация / распознавание отпечатков ладони [48]
    • Распознавание лиц - распознавание лиц [48]
  • Компьютеры и Интернет - Всемирная паутина , социальные сети , [43] [44] Интернет-видео [53]
    • Снижение использования пропускной способности сети [1]
  • Бытовая электроника [48] - мультимедийные системы, [1] мультимедийные телекоммуникационные устройства, [1] бытовые устройства [53]
  • Криптография - шифрование , стеганография , защита авторских прав [48]
  • Сжатие данных - кодирование с преобразованием , сжатие с потерями , сжатие без потерь [47]
    • Операции кодирования - квантование , перцепционное взвешивание, энтропийное кодирование , кодирование переменных [1]
  • Цифровые медиа [45] - цифровое распространение [54]
    • Потоковое мультимедиа [45] - потоковое аудио , потоковое видео , потоковое телевидение , видео по запросу (VOD) [8]
  • Обнаружение подделки [48]
  • Геофизические переходные электромагнитные поля ( переходные электромагнитные поля) [48]
  • Изображения - идентификация художника , [48] мера фокусировки и размытости , [48] выделение признаков [48]
    • Форматирование цвета - форматирование яркости и цветовых различий, цветовых форматов (например, YUV444 и YUV411 ), операции декодирования, такие как обратная операция между отображаемыми цветовыми форматами ( YIQ , YUV , RGB ) [1]
    • Цифровая обработка изображений - цифровые изображения , цифровые фотоаппараты , цифровая фотография , [43] [44] формирование изображений с высоким динамическим диапазоном (HDR) [55]
    • Сжатие изображений [48] [56] - форматы файлов изображений , [57] сжатие многовидовых изображений , прогрессивная передача изображений [48]
    • Обработка изображений - цифровая обработка изображений , [1] анализ изображений , поиск изображений на основе контента , обнаружение угла , поблочны направленное представление изображения , обнаружение края , улучшение изображения , слияние изображений , сегментации изображения , интерполяция , шум изображения оценка уровня, зеркальное отображение, вращение, профиль едва заметного искажения (JND), пространственно-временные маскирующие эффекты, фовированное изображение [48]
    • Оценка качества изображения - метрика ухудшения качества на основе DCT (DCT QM) [48]
    • Реконструкция изображения - автоматическая проверка направленных текстур , восстановление изображений , рисование , восстановление изображений [48]
  • Медицинские технологии
    • Электрокардиография (ЭКГ) - векторкардиография ( ВКГ ) [48]
    • Медицинская визуализация - сжатие медицинских изображений, объединение изображений, нанесение водяных знаков, классификация компрессии опухолей головного мозга [48]
  • Распознавание образов [48]
  • Извлечение области интереса (ROI) [48]
  • Обработка сигнала - цифровая обработка сигналов , цифровые сигнальные процессоры (DSP), DSP программного обеспечение , Мультиплексирование , сигнализация , управляющие сигналы, аналого-цифровое преобразование (АЦП), [1] сжимающая выборка , ДКП пирамида маскирование ошибок , понижающая дискретизация , повышающая дискретизация , сигнал , оценка отношения шума к шуму (SNR), transmux , фильтр Винера [48]
    • Комплексный анализ особенностей кепстра [48]
    • DCT- фильтрация [48]
  • Наблюдение [48]
  • Автомобильная камера " черный ящик" [48]
  • видео
    • Цифровое кино [56] - цифровая кинематография , цифровые кинокамеры , видеомонтаж , монтаж фильмов , [58] [59] Dolby Digital аудио [1] [26]
    • Цифровое телевидение (ЦТВ) [7] - цифровое телевизионное вещание , [56] стандартной четкости телевизионного (SDTV), телевидение высокой четкости (HDTV), [7] [46] HDTV - кодер / декодер чипов , ультра HDTV (UHDTV) [ 1]
    • Цифровое видео [21] [42] - универсальный цифровой диск (DVD), [56] видео высокой четкости (HD) [7] [46]
    • Кодирование видеосигнал - сжатия видео , [1] видео стандартов кодирования , [48] оценка движения , компенсация движения , межкадровое предсказание, векторы движения , [1] кодирование 3D видео , вероятность обнаружения локального искажения (LDDP) модель, двигаясь обнаружение объекта , Кодирование видео с несколькими ракурсами (MVC) [48]
    • Обработка видео - анализ движения, анализ движения 3D-DCT, анализ видеоконтента , извлечение данных , [48] просмотр видео , [60] профессиональное производство видео [61]
  • Водяные знаки - цифровые водяные знаки , водяные знаки для изображений, водяные знаки для видео, водяные знаки для 3D-видео , обратимое скрытие данных , обнаружение водяных знаков [48]
  • Беспроводная технология
    • Мобильные устройства [53] - мобильные телефоны , смартфоны , [52] видеотелефоны [1]
    • Радиочастотная (РЧ) технология - ВЧ инженерная , диафрагмы массивов , [48] диаграммообразующие , цифровые арифметические схемы , направленное зондирование , пространство изображения [62]
  • Беспроводная сенсорная сеть (WSN) - беспроводные акустические сенсорные сети [48]

Стандарты визуальных медиа DCT [ править ]

DCT-II, также известный как DCT, является наиболее важным методом сжатия изображений . [ необходима цитата ] Он используется в стандартах сжатия изображений, таких как JPEG , и стандартах сжатия видео, таких как H.26x , MJPEG , MPEG , DV , Theora и Daala . Здесь вычисляется двумерный DCT-II блоков, а результаты квантуются и кодируются энтропийным кодом . В таком случае,обычно равно 8, и формула DCT-II применяется к каждой строке и столбцу блока. Результатом является массив коэффициентов преобразования 8 × 8, в котором элемент (вверху слева) представляет собой компонент DC (нулевой частоты), а записи с увеличивающимися значениями индекса по вертикали и горизонтали представляют более высокие пространственные частоты по вертикали и горизонтали.

Advanced Video Coding (AVC) использует целочисленное DCT [23] [1] (IntDCT), целочисленное приближение DCT. [2] [1] Он использует целочисленные блоки DCT 4x4 и 8x8. Высокоэффективное кодирование видео (HEVC) и высокоэффективный формат изображения (HEIF) используют различные целочисленные размеры блоков DCT от 4x4 до 32x32 пикселей . [4] [1] По состоянию на 2019 год , AVC является наиболее часто используемым форматом для записи, сжатия и распространения видеоконтента, который используется 91% разработчиков видео, за ним следует HEVC, который используется 43% разработчиков. [54]

Форматы изображений [ править ]

Форматы видео [ править ]

Аудиостандарты MDCT [ править ]

Общий звук [ править ]

Кодирование речи [ править ]

MD DCT [ править ]

Многомерные DCT (MD DCT) имеют несколько приложений, в основном 3-D DCT, такие как 3-D DCT-II, у которого есть несколько новых приложений, таких как системы кодирования гиперспектральных изображений, [92] кодирование 3-D DCT с переменной временной длиной, [93 ] алгоритмы кодирования видео , [94] адаптивное кодирование видео [95] и трехмерное сжатие. [96] В связи с усовершенствованием аппаратного и программного обеспечения и внедрением нескольких быстрых алгоритмов необходимость использования MD DCT быстро возрастает. DCT-IV приобрел популярность благодаря своим приложениям в быстрой реализации многофазных фильтров с действительным знаком [97], ортогональных преобразований с перекрытием [98] [99]и косинус-модулированные базисы вейвлетов. [100]

Цифровая обработка сигналов [ править ]

DCT играет очень важную роль в цифровой обработке сигналов . Используя DCT, можно сжимать сигналы. DCT может использоваться в электрокардиографии для сжатия сигналов ЭКГ. DCT2 обеспечивает лучшую степень сжатия, чем DCT.

DCT широко применяется в процессорах цифровых сигналов (DSP), а также в программном обеспечении цифровой обработки сигналов. Многие компании разработали DSP на основе технологии DCT. DCT широко используются для таких приложений, как кодирование , декодирование, видео, аудио, мультиплексирование , управляющие сигналы, сигнализация и аналого-цифровое преобразование . DCT также обычно используются для микросхем кодера / декодера телевидения высокой четкости (HDTV) . [1]

Артефакты сжатия [ править ]

Общая проблема со сжатием DCT в цифровых носителях являются блочными артефактами сжатия , [101] , вызванные DCT блоков. [3] Алгоритм DCT может вызывать блочные артефакты при применении сильного сжатия. Поскольку DCT используется в большинстве стандартов кодирования цифровых изображений и видео (таких как форматы JPEG , H.26x и MPEG ), блочные артефакты сжатия на основе DCT широко распространены в цифровых носителях.. В алгоритме DCT изображение (или кадр в последовательности изображений) делится на квадратные блоки, которые обрабатываются независимо друг от друга, затем берется DCT этих блоков, и результирующие коэффициенты DCT квантуются . Этот процесс может вызвать артефакты блокировки, в первую очередь при высоких степенях сжатия данных . [101] Это также может вызвать эффект « москитного шума », обычно встречающийся в цифровом видео (например, в форматах MPEG). [102]

Блоки DCT часто используются в глитч-арте . [3] Художница Роза Менкман использует артефакты сжатия на основе DCT в своем глитч-арте [103], особенно блоки DCT, которые можно найти в большинстве цифровых медиаформатов, таких как цифровые изображения JPEG и цифровой звук MP3 . [3] Другой пример - Jpegs немецкого фотографа Томаса Руффа , который использует преднамеренные артефакты JPEG в качестве основы стиля изображения. [104] [105]

Неофициальный обзор [ править ]

Как и любое преобразование, связанное с Фурье, дискретные косинусные преобразования (DCT) выражают функцию или сигнал в виде суммы синусоид с разными частотами и амплитудами . Подобно дискретному преобразованию Фурье (ДПФ), ДКП работает с функцией в конечном числе дискретных точек данных. Очевидное различие между DCT и DFT состоит в том, что в первом используются только косинусные функции, а во втором - как косинусы, так и синусы (в форме комплексных экспонент ). Однако это видимое различие является просто следствием более глубокого различия: DCT подразумевает отличные от DFT или других связанных преобразований граничные условия .

Связанные с Фурье преобразования, которые работают с функцией в конечной области , такие как ДПФ, ДКП или ряд Фурье , можно рассматривать как неявно определяющие расширение этой функции за пределы области. То есть, как только вы напишете функцию как сумму синусоид, вы можете вычислить эту сумму в любом случае , даже если оригинал не был указан. ДПФ, как и ряд Фурье, подразумевает периодическое расширение исходной функции. DCT, как и косинусное преобразование , подразумевает четное расширение исходной функции.

Иллюстрация неявных четных / нечетных расширений входных данных DCT для N = 11 точек данных (красные точки) для четырех наиболее распространенных типов DCT (типы I-IV).

Однако, поскольку ДКП работают на конечных , дискретных последовательностей, две проблемы возникают , которые не применяются для непрерывного косинусного преобразования. Во-первых, необходимо указать, является ли функция четной или нечетной как на левой, так и на правой границах области (т. Е. На границах min- n и max- n в определениях ниже, соответственно). Во-вторых, нужно указать, в какой точке функция четная или нечетная. В частности, рассмотрим последовательность abcd из четырех равноотстоящих точек данных и скажем, что мы задаем четную левую границу. Есть два разумных варианта: либо данные даже о пробе а, и в этом случае четное расширение - это dcbabcd , или данные даже находятся примерно в точке на полпути между a и предыдущей точкой, и в этом случае четное расширение - dcbaabcd ( повторяется a ).

Этот выбор приводит ко всем стандартным вариациям DCT, а также к дискретным синусоидальным преобразованиям (DST). Каждая граница может быть четной или нечетной (2 варианта на границу) и может быть симметричной относительно точки данных или точки на полпути между двумя точками данных (2 варианта на границу), всего 2 × 2 × 2 × 2 = 16 возможности. Половина этих возможностей, с четной левой границей, соответствуют 8 типам DCT; другая половина - это 8 типов DST.

Эти различные граничные условия сильно влияют на приложения преобразования и приводят к уникальным полезным свойствам для различных типов DCT. Наиболее непосредственно, при использовании Фурье-преобразования , связанные решать дифференциальные уравнения в частных от спектральных методов , граничные условия непосредственно определены как часть решаемой задачи. Или, для MDCT (основанного на DCT типа IV), граничные условия тесно связаны с критическим свойством MDCT отмены наложения спектров во временной области. Более тонко, граничные условия отвечают за свойства «энергетической компактификации», которые делают DCT полезными для сжатия изображения и звука, потому что границы влияют на скорость сходимости любого ряда, подобного Фурье.

В частности, хорошо известно, что любые разрывы в функции снижают скорость сходимости ряда Фурье, так что требуется больше синусоид для представления функции с заданной точностью. Тот же принцип регулирует полезность ДПФ и других преобразований для сжатия сигнала; чем плавнее функция, тем меньше членов в ее ДПФ или ДКП требуется для ее точного представления и тем больше она может быть сжата. (Здесь мы думаем о ДПФ или ДКП как о приближении ряда Фурье или ряда косинусов.функции, соответственно, чтобы говорить о ее "гладкости".) Однако неявная периодичность ДПФ означает, что разрывы обычно возникают на границах: любой случайный сегмент сигнала вряд ли будет иметь одинаковое значение на обоих концах. левая и правая границы. (Аналогичная проблема возникает для DST, в котором нечетное левое граничное условие подразумевает разрыв для любой функции, которая не оказывается равной нулю на этой границе.) Напротив, DCT, где обе границы четные, всегда дает непрерывное расширение на границы (хотя наклонобычно прерывистый). Вот почему DCT и, в частности, DCT типов I, II, V и VI (типы, которые имеют две четные границы) обычно работают лучше для сжатия сигнала, чем DFT и DST. На практике DCT типа II обычно предпочтительнее для таких приложений, отчасти по причинам вычислительного удобства.

Формальное определение [ править ]

Формально дискретное косинус - преобразование является линейным , обратимо функция (где обозначает множество действительных чисел ), или , что эквивалентно обратимый N × N квадратная матрица . Есть несколько вариантов DCT с немного измененными определениями. В N действительных чисел х 0 , ..., х N -1 преобразуются в N действительных чисел х 0 , ..., Х Н -1 в соответствии с одной из формул:

DCT-I [ править ]

Некоторые авторы дополнительно умножают члены x 0 и x N −1 на 2 и соответственно умножают члены X 0 и X N −1 на 1 / 2 . Это делает матрицу DCT-I ортогональной , если еще умножить ее на общий масштабный коэффициент , но нарушает прямое соответствие с реальным четным ДПФ.

DCT-I в точности эквивалентен (с общим масштабным коэффициентом 2) ДПФ действительных чисел с четной симметрией. Например, DCT-I из N  = 5 действительных чисел abcde в точности эквивалентен ДПФ из восьми действительных чисел abcdedcb (даже симметрия), разделенных на два. (Напротив, DCT типов II-IV включают сдвиг на половину выборки в эквивалентном ДПФ.)

Однако обратите внимание, что DCT-I не определен для N меньше 2. (Все другие типы DCT определены для любого положительного N. )

Таким образом, DCT-I соответствует граничным условиям: x n четно около n = 0 и даже около n = N −1; аналогично для X k .

DCT-II [ править ]

DCT-II, вероятно, является наиболее часто используемой формой, и ее часто называют просто «DCT». [5] [6]

Это преобразование в точности эквивалентно (с общим масштабным коэффициентом 2) ДПФ реальных входных данных четной симметрии, где элементы с четным индексом равны нулю. То есть, это половина ДПФ входов , где , для , и для . Преобразование DCT II также возможно с использованием сигнала 2N с последующим умножением на половину сдвига. Это демонстрирует Махул .

Некоторые авторы дополнительно умножают член X 0 на 1 / 2 и умножают полученную матрицу на общий масштабный коэффициент (см. Ниже соответствующие изменения в DCT-III). Это делает матрицу DCT-II ортогональной , но нарушает прямое соответствие с реальным четным ДПФ полусмещенного ввода. Это нормализация, используемая , например, в Matlab . [106] Во многих приложениях, таких как JPEG , масштабирование является произвольным, поскольку масштабные коэффициенты могут быть объединены с последующим этапом вычислений (например, этапом квантования в JPEG [107]), и можно выбрать масштаб, который позволяет вычислить DCT с меньшим количеством умножений. [108] [109]

DCT-II подразумевает граничные условия: x n четно около n = −1/2 и даже около n = N  - 1/2; Х к даже вокруг K = 0 и нечетное вокруг K = N .

DCT-III [ править ]

Поскольку это обратный DCT-II (с точностью до масштабного коэффициента, см. Ниже), эту форму иногда называют просто «обратным DCT» («IDCT»). [6]

Некоторые авторы делят член x 0 на 2 вместо 2 (в результате получается общий член x 0 / 2 ) и умножают полученную матрицу на общий масштабный коэффициент (см. Выше соответствующее изменение в DCT-II), так что DCT-II и DCT-III являются транспозициями друг друга. Это делает матрицу DCT-III ортогональной , но нарушает прямое соответствие с реальным четным ДПФ с полусмещенным выходом.

DCT-III подразумевает граничные условия: x n четно около n = 0 и нечетно около n = N ; X k четно около k = −1/2 и даже около k = N −1/2.

DCT-IV [ править ]

Матрица DCT-IV становится ортогональной (и, таким образом, будучи явно симметричной, своей собственной инверсией), если еще умножить на общий масштабный коэффициент .

Вариант DCT-IV, в котором данные от различных преобразований перекрываются , называется модифицированным дискретным косинусным преобразованием (MDCT). [110]

DCT-IV подразумевает граничные условия: x n четно около n = −1/2 и нечетно около n = N  - 1/2; аналогично для X k .

DCT V-VIII [ править ]

DCT типов I-IV обрабатывают обе границы последовательно относительно точки симметрии: они четные / нечетные либо вокруг точки данных для обеих границ, либо на полпути между двумя точками данных для обеих границ. Напротив, DCT типов V-VIII подразумевают четные / нечетные границы вокруг точки данных для одной границы и на полпути между двумя точками данных для другой границы.

Другими словами, типы DCT I-IV эквивалентны вещественно-четным ДПФ четного порядка (независимо от того, является ли N четным или нечетным), поскольку соответствующее ДПФ имеет длину 2 ( N  - 1) (для DCT-I) или 4 Н (для DCT-II / III) или 8 Н (для DCT-IV). Четыре дополнительных типа дискретного косинусного преобразования [111] по существу соответствуют вещественно-четным ДПФ логически нечетного порядка, которые имеют множители N  ± & nbps; ½ в знаменателях аргументов косинуса.

Однако на практике эти варианты используются редко. Одна из причин, возможно, заключается в том, что алгоритмы БПФ для ДПФ нечетной длины обычно сложнее, чем алгоритмы БПФ для ДПФ четной длины (например, простейшие алгоритмы с основанием 2 предназначены только для четных длин), и эта повышенная сложность распространяется и на DCT. как описано ниже.

(Тривиальный вещественно-четный массив, ДПФ длиной один (нечетная длина) одного числа a , соответствует DCT-V длины N = 1.)

Обратные преобразования [ править ]

Используя приведенные выше соглашения о нормализации, обратное значение DCT-I представляет собой DCT-I, умноженное на 2 / ( N  - 1). Обратное ДКП-IV является ДКП-IV , умноженное на 2 / N . Обратным DCT-II является DCT-III, умноженный на 2 / N, и наоборот. [6]

Как и для ДПФ , коэффициент нормализации перед этими определениями преобразования является просто условием и различается в зависимости от обработки. Например, некоторые авторы умножают преобразования на, чтобы обратное преобразование не требовало дополнительного мультипликативного множителя. В сочетании с соответствующими множителями 2 (см. Выше) это можно использовать, чтобы сделать матрицу преобразования ортогональной .

Многомерные DCT [ править ]

Многомерные варианты различных типов DCT прямо следуют из одномерных определений: они просто отделимый продукт (то есть композиция) DCT по каждому измерению.

MD DCT-II [ править ]

Например, двухмерный DCT-II изображения или матрицы - это просто одномерный DCT-II сверху, выполняемый вдоль строк, а затем вдоль столбцов (или наоборот). То есть 2D DCT-II задается формулой (без нормализации и других масштабных коэффициентов, как указано выше):

Инверсия многомерного DCT - это просто разделимое произведение инверсий соответствующих одномерных DCT (см. Выше), например, одномерные инверсии, применяемые по одному измерению за раз в алгоритме строка-столбец.

3-D ДКП-II , является лишь продолжением 2-D DCT-II в трехмерном пространстве и математически можно вычислить по формуле

Обратное к 3-D DCT-II является 3-D DCT-III и может быть вычислено по формуле, представленной

Технически вычисление двух-, трехмерного (или многомерного) DCT с помощью последовательностей одномерных DCT по каждому измерению известно как алгоритм строки-столбца . Как и в случае с многомерными алгоритмами БПФоднако существуют другие методы для вычисления того же самого при выполнении вычислений в другом порядке (т. е. чередование / комбинирование алгоритмов для разных измерений). В связи с быстрым ростом приложений, основанных на 3-D DCT, разработано несколько быстрых алгоритмов для вычисления 3-D DCT-II. Алгоритмы Vector-Radix применяются для вычисления MD DCT, чтобы уменьшить вычислительную сложность и увеличить скорость вычислений. Для эффективного вычисления 3-D DCT-II был разработан быстрый алгоритм векторно-радикального прореживания по частоте (VR DIF).

3-D DCT-II VR DIF [ править ]

Чтобы применить алгоритм VR DIF, входные данные должны быть сформулированы и преобразованы следующим образом. [112] [113] Предполагается, что размер преобразования N × N × N равен 2.

Четыре основных этапа вычисления 3-D DCT-II с использованием алгоритма VR DIF.
где

На рисунке рядом показаны четыре этапа, которые участвуют в вычислении 3-D DCT-II с использованием алгоритма VR DIF. Первый этап - это трехмерное переупорядочение с использованием отображения индекса, проиллюстрированного приведенными выше уравнениями. Второй этап - расчет бабочки. Каждая бабочка вместе вычисляет восемь точек, как показано на рисунке ниже, где .

Исходный 3-D DCT-II теперь можно записать как

где

Если даже и нечетные части и и рассматриваются, общая формула для вычисления 3-D DCT-II может быть выражена как

Стадия одиночной бабочки алгоритма VR DIF.

где

Арифметическая сложность [ править ]

Для всего трехмерного расчета DCT нужны этапы, и каждый этап включает в себя бабочек. Для всего 3-D DCT необходимо вычислить бабочек. Каждая бабочка требует семи реальных умножений (включая тривиальное умножение) и 24 реальных сложений (включая тривиальные сложения). Таким образом, общее количество реальных умножений, необходимых для этого этапа, равно , а общее количество реальных сложений, то есть включая пост-сложения (рекурсивные добавления), которые могут быть вычислены непосредственно после этапа бабочки или после этапа обратного побитового преобразования, задается следующим образом: [113] .

Традиционный метод расчета MD-DCT-II использует подход «строка-столбец-кадр» (RCF), который является сложным в вычислительном отношении и менее производительным на самых современных современных аппаратных платформах. Количество умножений, необходимых для вычисления алгоритма VR DIF по сравнению с алгоритмом RCF, довольно невелико. Количество умножений и сложений, задействованных в подходе RCF, обозначено и соответственно. Из таблицы 1 видно, что общее количество

умножений, связанных с алгоритмом 3-D DCT VR, меньше, чем связанное с подходом RCF, более чем на 40%. Кроме того, подход RCF включает в себя транспонирование матрицы и большее количество операций индексации и обмена данными, чем новый алгоритм VR. Это делает алгоритм 3-D DCT VR более эффективным и лучше подходит для 3-D приложений, которые включают 3-D DCT-II, таких как сжатие видео и другие приложения для обработки 3-D изображений. Главное соображение при выборе быстрого алгоритма - избежать вычислительных и структурных сложностей. По мере развития технологий компьютеров и DSP время выполнения арифметических операций (умножения и сложения) становится очень быстрым, и регулярная вычислительная структура становится наиболее важным фактором. [114]Следовательно, хотя предложенный выше алгоритм 3-D VR не достигает теоретической нижней границы числа умножений, [115] он имеет более простую вычислительную структуру по сравнению с другими алгоритмами 3-D DCT. Он может быть реализован на месте с использованием единственной бабочки и обладает свойствами алгоритма БПФ Кули – Тьюки в трехмерном пространстве . Следовательно, 3-D VR представляет собой хороший выбор для сокращения арифметических операций при вычислении 3-D DCT-II при сохранении простой структуры, характерной для алгоритмов БПФ Кули – Тьюки в стиле бабочки .

Двумерные частоты DCT из JPEG DCT

Изображение справа показывает комбинацию горизонтальных и вертикальных частот для двумерного DCT 8 x 8 ( ). Каждый шаг слева направо и сверху вниз - это увеличение частоты на 1/2 цикла. Например, перемещение вправо от верхнего левого квадрата дает увеличение на полупериод горизонтальной частоты. Еще одно движение вправо дает два полупериода. Движение вниз дает два полупериода по горизонтали и полупериод по вертикали. Исходные данные (8x8) преобразуются в линейную комбинацию этих 64 квадратов частот.

MD-DCT-IV [ править ]

MD DCT-IV - это просто расширение 1-D DCT-IV на M размерную область. Двумерный DCT-IV матрицы или изображения задается формулой

Мы можем вычислить MD DCT-IV, используя обычный метод строка-столбец, или мы можем использовать метод полиномиального преобразования [116] для быстрого и эффективного вычисления. Основная идея этого алгоритма заключается в использовании полиномиального преобразования для прямого преобразования многомерного DCT в серию одномерных DCT. MD DCT-IV также имеет несколько приложений в различных областях.

Вычисление [ править ]

Хотя прямое применение этих формул потребует O ( N 2 ) операций, можно вычислить то же самое со сложностью только O ( N log N ) путем факторизации вычислений аналогично быстрому преобразованию Фурье (БПФ). Можно также вычислить DCT с помощью БПФ в сочетании с O ( N ) этапами предварительной и постобработки. В общем, методы O ( N log N ) для вычисления DCT известны как алгоритмы быстрого косинусного преобразования (FCT).

В принципе, наиболее эффективными алгоритмами обычно являются те, которые предназначены непосредственно для DCT, в отличие от использования обычного БПФ плюс O ( N ) дополнительных операций (см. Исключение ниже). Однако даже «специализированные» алгоритмы DCT (включая все те, которые достигают наименьшего известного арифметического счета, по крайней мере, для размеров степени двойки ), как правило, тесно связаны с алгоритмами БПФ, поскольку DCT по сути являются ДПФ реальных четных данных, можно разработать быстрый алгоритм DCT, взяв БПФ и исключив избыточные операции из-за этой симметрии. Это можно сделать даже автоматически (Frigo & Johnson, 2005). Алгоритмы, основанные на алгоритме БПФ Кули – Тьюки, являются наиболее распространенными, но применим и любой другой алгоритм БПФ. Например,Алгоритм Винограда БПФ приводит к алгоритмам минимального умножения для ДПФ, хотя, как правило, за счет дополнительных добавлений, и аналогичный алгоритм был предложен Фейгом и Виноградом (1992) для DCT. Поскольку алгоритмы для DFT, DCT и подобных преобразований очень тесно связаны, любое улучшение алгоритмов для одного преобразования теоретически приведет к немедленному улучшению и для других преобразований ( Duhamel & Vetterli, 1990 ).

Хотя алгоритмы DCT, которые используют немодифицированное БПФ, часто имеют некоторые теоретические издержки по сравнению с лучшими специализированными алгоритмами DCT, первые также имеют явное преимущество: широко доступны высокооптимизированные программы БПФ. Таким образом, на практике часто легче получить высокую производительность для общей длины N с помощью алгоритмов на основе БПФ. (Производительность на современном оборудовании обычно не зависит от простого арифметического подсчета, а оптимизация требует значительных инженерных усилий.) С другой стороны, специализированные алгоритмы DCT широко используются для преобразований небольших фиксированных размеров, таких как DCT-II, используемый в JPEG.сжатие или небольшие DCT (или MDCT), обычно используемые при сжатии звука. (Уменьшение размера кода также может быть причиной использования специализированного DCT для приложений встроенных устройств.)

Фактически, даже алгоритмы DCT, использующие обычное БПФ, иногда эквивалентны сокращению избыточных операций из большего БПФ вещественно-симметричных данных, и они могут быть даже оптимальными с точки зрения арифметических подсчетов. Например, DCT типа II эквивалентен DFT размера с вещественно-четной симметрией, чьи четные индексированные элементы равны нулю. Один из наиболее распространенных методов вычисления этого с помощью БПФ (например, метод, используемый в FFTPACK и FFTW ) был описан Narasimha & Peterson (1978) и Makhoul (1980)., и этот метод в ретроспективе можно рассматривать как один из этапов алгоритма децимации во времени с основанием 4 счисления, применяемого к «логическому» ДПФ с вещественной четностью, соответствующему DCT II. (Шаг radix-4 уменьшает размер DFT до четырех размеров - DFT реальных данных, два из которых равны нулю, а два из которых равны друг другу по четной симметрии, что дает единый размер - FFT реальных данных плюс бабочки .) Поскольку элементы с четным индексом равны нулю, этот шаг по основанию счисления-4 в точности совпадает с шагом с разделением по основанию; если последующее БПФ с реальными данными размера также выполняется с помощью алгоритма с разделением на основе реальных данных (как у Соренсена и др., 1987 г. ), то полученный алгоритм фактически совпадает с самым низким из опубликованных арифметических подсчетов для DCT-II степени двойки ( действительные арифметические операции [a] ). Недавнее сокращение числа операций до также использует БПФ с реальными данными. [117] Итак, нет ничего плохого в вычислении DCT с помощью БПФ с арифметической точки зрения - иногда это просто вопрос, является ли соответствующий алгоритм БПФ оптимальным. (На практике накладные расходы на вызов функции при вызове отдельной процедуры БПФ могут быть значительными для small , но это вопрос реализации, а не алгоритмический, поскольку он может быть решен путем развертывания / встраивания.)

Пример IDCT [ править ]

Пример, показывающий восемь различных фильтров, примененных к тестовому изображению (вверху слева) путем умножения его спектра DCT (вверху справа) на каждый фильтр.

Рассмотрим это изображение большой буквы A в оттенках серого 8x8.

Исходный размер, масштаб 10x (ближайший сосед), масштаб 10x (билинейный).
Базисные функции дискретного косинусного преобразования с соответствующими коэффициентами (специфичными для нашего изображения).
DCT изображения = .

Каждая базовая функция умножается на свой коэффициент, а затем это произведение добавляется к окончательному изображению.

Слева финальное изображение. В середине - взвешенная функция (умноженная на коэффициент), которая добавляется к окончательному изображению. Справа - текущая функция и соответствующий коэффициент. Изображения масштабируются (с использованием билинейной интерполяции) в 10 раз.

См. Также [ править ]

  • Дискретное вейвлет-преобразование
  • JPEG # Дискретное косинусное преобразование - содержит потенциально более простой для понимания пример преобразования DCT.
  • Список преобразований, связанных с Фурье
  • Модифицированное дискретное косинусное преобразование

Пояснительные примечания [ править ]

  1. ^ Точное количество реальных арифметических операций и, в частности, количество действительных умножений, в некоторой степени зависит от масштабирования определения преобразования. Счетчик для определения DCT-IIпоказанного здесь; два умножения могут быть сохранены, если преобразование масштабируется на общийкоэффициент. Дополнительные умножения можно сохранить, если разрешить масштабирование выходных данных преобразования индивидуально, как было показано Араи, Агуи и Накадзима (1988) для случая размера 8, используемого в JPEG.

Цитаты [ править ]

  1. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae Аф Станкович, Радомир С .; Астола, Яакко Т. (2012). "Воспоминания о ранних работах в DCT: Интервью с К.Р. Рао" (PDF) . Отпечатки с первых дней информационных наук . 60 . Проверено 13 октября 2019 .
  2. ^ a b c Британак, Владимир; Ип, Патрик С .; Рао, КР (2010). Дискретные косинусные и синусоидальные преобразования: общие свойства, быстрые алгоритмы и целочисленные приближения . Эльзевир . С. ix, xiii, 1, 141–304. ISBN 9780080464640.
  3. ^ а б в г Алихани, Дарья (1 апреля 2015 г.). «За гранью разрешения: глюк-арт Розы Менкман» . POSTmatter . Проверено 19 октября 2019 года .
  4. ^ a b c d e Томсон, Гэвин; Шах, Атар (2017). «Знакомство с HEIF и HEVC» (PDF) . Apple , Inc. Проверено 5 август +2019 .
  5. ^ a b c d e f Ахмед, Насир ; Натараджан, Т .; Рао, KR (январь 1974), "дискретного косинусного преобразования" (PDF) , IEEE Transactions на компьютерах , C-23 (1): 90-93, DOI : 10,1109 / TC.1974.223784
  6. ^ a b c d e f Рао, КР ; Ип П. (1990), Дискретное косинусное преобразование: алгоритмы, преимущества, приложения , Бостон: Academic Press, ISBN 978-0-12-580203-1
  7. ^ a b c d e f g Barbero, M .; Hofmann, H .; Уэллс, Северная Дакота (14 ноября 1991 г.). «Кодирование источника DCT и текущие реализации для HDTV» . Технический обзор EBU . Европейский вещательный союз (251): 22–33 . Проверено 4 ноября 2019 года .
  8. ^ a b c d e f g Ли, Уильям (1994). «Видео по запросу: исследовательский доклад 94/68» . Библиотека Палаты общин . 9 мая 1994 . Проверено 20 сентября 2019 года .CS1 maint: location (link)
  9. ^ a b c Ахмед, Насир (январь 1991 г.). «Как я пришел к дискретному косинусному преобразованию» . Цифровая обработка сигналов . 1 (1): 4–5. DOI : 10.1016 / 1051-2004 (91) 90086-Z .
  10. ^ a b c d e f «T.81 - Цифровое сжатие и кодирование неподвижных изображений с непрерывным тоном - Требования и рекомендации» (PDF) . CCITT . Сентябрь 1992 . Проверено 12 июля 2019 .
  11. ^ Британак, Владимир; Ип, Патрик С .; Рао, КР (2010). Дискретные косинусные и синусоидальные преобразования: общие свойства, быстрые алгоритмы и целочисленные приближения . Эльзевир . п. 51. ISBN 9780080464640.
  12. ^ Избранные статьи по визуальной коммуникации: технологии и приложения , (SPIE Press Book), редакторы Т. Рассел Хсинг и Эндрю Г. Тешер, апрель 1990 г., стр. 145-149 [1] .
  13. ^ Избранные статьи и учебное пособие по обработке и анализу цифровых изображений, Том 1, Обработка и анализ цифровых изображений , (IEEE Computer Society Press), редакторы Р. Челлаппа и А. А. Савчук, июнь 1985 г., стр. 47.
  14. ^ Цитирование DCT через Google Scholar [2] .
  15. ^ a b Чен, Вэнь-Сюн; Smith, CH; Fralick, SC (сентябрь 1977 г.). «Быстрый вычислительный алгоритм для дискретного косинусного преобразования». Транзакции IEEE по коммуникациям . 25 (9): 1004–1009. DOI : 10.1109 / TCOM.1977.1093941 .
  16. ^ Смит, C .; Фралик, С. (1977). «Быстрый вычислительный алгоритм для дискретного косинусного преобразования». Транзакции IEEE по коммуникациям . 25 (9): 1004–1009. DOI : 10.1109 / TCOM.1977.1093941 . ISSN 0090-6778 . 
  17. Перейти ↑ Huang, TS (1981). Анализ последовательности изображений . Springer Science & Business Media . п. 29. ISBN 9783642870378.
  18. ^ Роуз, Джон А .; Робинсон, Гунер С. (30 октября 1975 г.). «Комбинированное пространственное и временное кодирование последовательностей цифровых изображений». Эффективная передача графической информации . Международное общество оптики и фотоники. 0066 : 172–181. Bibcode : 1975SPIE ... 66..172R . DOI : 10.1117 / 12.965361 . S2CID 62725808 . 
  19. ^ Cianci, Philip J. (2014). Телевидение высокой четкости: создание, развитие и внедрение технологии HDTV . МакФарланд. п. 63. ISBN 9780786487974.
  20. ^ a b c «История сжатия видео» . ITU-T . Объединенная группа по видео (JVT) ISO / IEC MPEG и ITU-T VCEG (ISO / IEC JTC1 / SC29 / WG11 и ITU-T SG16 Q.6). Июль 2002. С. 11, 24–9, 33, 40–1, 53–6 . Дата обращения 3 ноября 2019 .
  21. ^ a b c Ганбари, Мохаммед (2003). Стандартные кодеки: от сжатия изображений до расширенного кодирования видео . Институт инженерии и технологий . С. 1–2. ISBN 9780852967102.
  22. ^ Ли, Цзянь Пинг (2006). Труды Международной компьютерной конференции 2006 года по вейвлетовской активной медиа - технологий и обработке информации: Чунцин, Китай, 29-31 августа 2006 года . World Scientific . п. 847. ISBN 9789812709998.
  23. ^ a b c Ван, Ханьли; Kwong, S .; Кок, К. (2006). «Эффективный алгоритм прогнозирования целочисленных коэффициентов DCT для оптимизации H.264 / AVC». IEEE Transactions on Circuits and Systems for Video Technology . 16 (4): 547–552. DOI : 10.1109 / TCSVT.2006.871390 . S2CID 2060937 . 
  24. ^ Princen, Джон П .; Джонсон, AW; Брэдли, Алан Б. (1987). «Кодирование поддиапазона / преобразования с использованием схем набора фильтров, основанных на отмене наложения спектров во временной области». ICASSP '87. Международная конференция IEEE по акустике, речи и обработке сигналов . 12 : 2161–2164. DOI : 10.1109 / ICASSP.1987.1169405 . S2CID 58446992 . 
  25. ^ Джон П. Принсен, Алан Б. Брэдли: Дизайн банка фильтров анализа / синтеза, основанный на отмене наложения спектров во временной области , IEEE Trans. Акуст. Обработка речевых сигналов, ASSP-34 (5), 1153–1161, 1986
  26. ^ Б с д е е г ч я J K Ло, Fa-Long (2008). Стандарты мобильного мультимедийного вещания: технологии и практика . Springer Science & Business Media . п. 590. ISBN 9780387782638.
  27. ^ a b Британак, В. (2011). «О свойствах, взаимосвязях и упрощенной реализации банков фильтров в стандартах аудиокодирования Dolby Digital (Plus) AC-3». Транзакции IEEE по обработке звука, речи и языка . 19 (5): 1231–1241. DOI : 10,1109 / TASL.2010.2087755 . S2CID 897622 . 
  28. ^ a b Гукерт, Джон (весна 2012 г.). «Использование БПФ и MDCT в сжатии аудио MP3» (PDF) . Университет Юты . Проверено 14 июля 2019 .
  29. ^ a b Бранденбург, Карлхайнц (1999). «Объяснение MP3 и AAC» (PDF) . Архивировано (PDF) из оригинала 13 февраля 2017 года.
  30. ^ a b Фонд Xiph.Org (02.06.2009). «Спецификация Vorbis I - 1.1.2 Классификация» . Фонд Xiph.Org . Проверено 22 сентября 2009 .
  31. ^ Британак, Владимир; Ип, Патрик С .; Рао, КР (2010). Дискретные косинусные и синусоидальные преобразования: общие свойства, быстрые алгоритмы и целочисленные приближения . Эльзевир . С. 35–6. ISBN 9780080464640.
  32. ^ Дхамия, Свати; Джайн, Приянка (сентябрь 2011 г.). «Сравнительный анализ дискретного синусоидального преобразования как подходящий метод для оценки шума» . Международный журнал компьютерных наук IJCSI . 8 (5, № 3): 162–164 (162) . Проверено 4 ноября 2019 года .
  33. ^ Мандьям, Гиридхар Д .; Ахмед, Насир; Маготра, Нирадж (17 апреля 1995 г.). «Схема на основе DCT для сжатия изображений без потерь». Сжатие цифрового видео: алгоритмы и технологии 1995 . Международное общество оптики и фотоники. 2419 : 474–478. Bibcode : 1995SPIE.2419..474M . DOI : 10.1117 / 12.206386 . S2CID 13894279 . 
  34. ^ Komatsu, K .; Сезаки, Каору (1998). «Обратимое дискретное косинусное преобразование» . Материалы Международной конференции по акустике, речи и обработке сигналов IEEE 1998 г., ICASSP '98 (каталожный номер 98CH36181) . 3 : 1769–1772 т. 3. DOI : 10.1109 / ICASSP.1998.681802 . ISBN 0-7803-4428-6. S2CID  17045923 .
  35. ^ a b Хоффман, Рой (2012). Сжатие данных в цифровых системах . Springer Science & Business Media . п. 124. ISBN 9781461560319. По сути, вейвлет-кодирование - это вариант кодирования с преобразованием на основе DCT, который уменьшает или устраняет некоторые из его ограничений. (...) Еще одно преимущество заключается в том, что вместо работы с блоками 8 × 8 пикселей, как это делают JPEG и другие блочные методы DCT, вейвлет-кодирование может одновременно сжимать все изображение.
  36. ^ Unser, M .; Блю Т. (2003). «Математические свойства вейвлет-фильтров JPEG2000» . IEEE Transactions по обработке изображений . 12 (9): 1080–1090. Bibcode : 2003ITIP ... 12.1080U . DOI : 10.1109 / TIP.2003.812329 . PMID 18237979 . S2CID 2765169 .  
  37. ^ Таубман, Дэвид; Марселлин, Майкл (2012). JPEG2000: Основы, стандарты и практика сжатия изображений: Основы, стандарты и практика сжатия изображений . Springer Science & Business Media . ISBN 9781461507994.
  38. ^ МакКернан, Брайан (2005). Цифровое кино: революция в кинематографии, постпродакшне и дистрибуции . Макгроу-Хилл . п. 59. ISBN 978-0-07-142963-4. Вейвлеты использовались в ряде систем, но эта технология требует более интенсивного использования процессора, чем DCT, и еще не получила широкого распространения.
  39. ^ Muchahary, D .; Мондал, AJ; Parmar, RS; Borah, AD; Маджумдер, А. (2015). «Упрощенный подход к проектированию для эффективного вычисления DCT». 2015 Пятая международная конференция по системам связи и сетевым технологиям : 483–487. DOI : 10,1109 / CSNT.2015.134 . ISBN 978-1-4799-1797-6. S2CID  16411333 .
  40. ^ Чен, Вай Кай (2004). Справочник по электротехнике . Эльзевир . п. 906. ISBN. 9780080477480.
  41. ^ Фролов, Артем; Примечаев, С. (2006). «Получение сжатых изображений домена на основе обработки DCT». Семантический ученый . Кириллович 4553 . 
  42. ^ a b c Ли, Руби Бей-Ло; Бек, Джон П .; Агнец, Иоиль; Северсон, Кеннет Э. (апрель 1995 г.). «Программный декодер видео MPEG в реальном времени на процессорах PA 7100LC с улучшенными возможностями мультимедиа» (PDF) . Журнал Hewlett-Packard . 46 (2). ISSN 0018-1153 .  
  43. ^ a b c «Что такое JPEG? Невидимый объект, который вы видите каждый день» . Атлантика . 24 сентября 2013 . Проверено 13 сентября 2019 .
  44. ^ a b c Пессина, Лор-Анна (12 декабря 2014 г.). «JPEG изменил наш мир» . Новости EPFL . Федеральная политехническая школа Лозанны . Проверено 13 сентября 2019 .
  45. ^ a b c Ли, Джек (2005). Масштабируемые системы непрерывной потоковой передачи мультимедиа: архитектура, дизайн, анализ и реализация . Джон Вили и сыновья . п. 25. ISBN 9780470857649.
  46. ^ a b c Шишикуи, Ёсиаки; Наканиши, Хироши; Имаидзуми, Хироюки (26–28 октября 1993 г.). «Схема кодирования HDTV с использованием DCT с адаптивным размером» . Обработка сигналов HDTV: Материалы международного семинара по HDTV '93, Оттава, Канада . Эльзевир : 611–618. DOI : 10.1016 / B978-0-444-81844-7.50072-3 . ISBN 9781483298511.
  47. ^ a b Очоа-Домингес, Умберто; Рао, КР (2019). Дискретное косинусное преобразование, второе издание . CRC Press . С. 1–3, 129. ISBN 9781351396486.
  48. ^ Б с д е е г ч я J к л м п о р а Q R сек т у V ш х у г аа аб переменного объявления аи Ochoa-Dominguez, Умберто; Рао, КР (2019). Дискретное косинусное преобразование, второе издание . CRC Press . С. 1–3. ISBN 9781351396486.
  49. ^ a b Британак, Владимир; Рао, КР (2017). Банки фильтров с косинусной / синусоидальной модуляцией: общие свойства, быстрые алгоритмы и целочисленные приближения . Springer. п. 478. ISBN 9783319610801.
  50. ^ a b Джонс, Грэм А .; Layer, Дэвид Х .; Осенковский, Томас Г. (2013). Технический справочник Национальной ассоциации вещателей: Технический справочник NAB . Тейлор и Фрэнсис . С. 558–9. ISBN 978-1-136-03410-7.
  51. ^ a b c Hersent, Оливье; Пети, Жан-Пьер; Гурл, Дэвид (2005). Помимо протоколов VoIP: понимание голосовых технологий и сетевых технологий для IP-телефонии . Джон Вили и сыновья . п. 55. ISBN 9780470023631.
  52. ^ a b c d e Дэниел Эран Дилгер (8 июня 2010 г.). «Внутри iPhone 4: видеозвонки FaceTime» . AppleInsider . Проверено 9 июня 2010 года .
  53. ^ a b c d Блог, Netflix Technology (19 апреля 2017 г.). «Более эффективные мобильные кодировки для загрузок Netflix» . Medium.com . Netflix . Проверено 20 октября 2019 года .
  54. ^ a b «Отчет разработчика видео за 2019 год» (PDF) . Битмовин . 2019 . Дата обращения 5 ноября 2019 .
  55. ^ Очоа-Домингес, Умберто; Рао, КР (2019). Дискретное косинусное преобразование, второе издание . CRC Press. п. 186. ISBN. 9781351396486.
  56. ^ а б в г МакКернан, Брайан (2005). Цифровое кино: революция в кинематографии, постпродакшн, дистрибуция . Макгроу-Хилл . п. 58. ISBN 978-0-07-142963-4. DCT используется в большинстве систем сжатия, стандартизированных Группой экспертов по движущимся изображениям (MPEG), и является доминирующей технологией для сжатия изображений. В частности, это основная технология MPEG-2, системы, используемой для DVD, цифрового телевизионного вещания, которая использовалась во многих испытаниях цифрового кино.
  57. ^ a b Баранюк, Крис (15 октября 2015 г.). «Защита от копирования может прийти к JPegs» . BBC News . BBC . Проверено 13 сентября 2019 .
  58. ^ Ашер, Стивен; Пинкус, Эдвард (2012). Справочник кинематографиста: всестороннее руководство для цифровой эпохи: пятое издание . Пингвин. С. 246–7. ISBN 978-1-101-61380-1.
  59. ^ Bertalmio, Марсело (2014). Обработка изображений для кино . CRC Press . п. 95. ISBN 978-1-4398-9928-1.
  60. ^ Чжан, Хунцзян (1998). «Просмотр и поиск видео на основе содержимого» . In Furht, Borko (ред.). Справочник Интернет и мультимедийных систем и приложений . CRC Press . С.  83–108 (89) . ISBN 9780849318580.
  61. ^ a b «Семейство кодеков Apple ProRes 422» . Библиотека Конгресса . 17 ноября 2014 . Проверено 13 октября 2019 .
  62. ^ Потлури, США; Madanayake, A .; Cintra, RJ; Байер, FM; Раджапакша, Н. (17 октября 2012 г.). "Аппроксимации DCT без умножителей для многолучевой цифровой визуализации пространственной апертурной матрицы и направленного зондирования". Измерительная наука и технология . 23 (11): 114003. DOI : 10,1088 / 0957-0233 / 23/11/114003 . ISSN 0957-0233 . 
  63. ^ Хадсон, Грэм; Леже, Ален; Нисс, Биргер; Себастьен, Иштван; Ваабен, Йорген (31 августа 2018 г.). «Стандарт JPEG-1 25 лет: прошлые, настоящие и будущие причины успеха» . Журнал электронного изображения . 27 (4): 1. DOI : 10,1117 / 1.JEI.27.4.040901 .
  64. ^ «Объяснение формата изображения JPEG» . BT.com . BT Group . 31 мая 2018 . Дата обращения 5 августа 2019 .
  65. ^ Томсон, Гэвин; Шах, Атар (2017). «Знакомство с HEIF и HEVC» (PDF) . Apple , Inc. Retrieved +5 августе 2 019 .
  66. ^ «Сравнение HEIF - высокоэффективный формат файла изображения» . Nokia Technologies . Дата обращения 5 августа 2019 .
  67. ^ a b Яо Ван, Стандарты кодирования видео: Часть I, 2006 г.
  68. Перейти ↑ Yao Wang, Video Coding Standards: Part II, 2006
  69. ^ Хоффман, Рой (2012). Сжатие данных в цифровых системах . Springer Science & Business Media . п. 255. ISBN 9781461560319.
  70. ^ a b К. Р. Рао и Дж. Дж. Хван, Методы и стандарты кодирования изображений, видео и аудио , Прентис Холл, 1996; JPEG: Глава 8; H.261: Глава 9; MPEG-1: Глава 10; MPEG-2: Глава 11.
  71. Дэвис, Эндрю (13 июня 1997 г.). «Обзор рекомендаций H.320» . EE Times . Дата обращения 7 ноября 2019 .
  72. ^ IEEE WESCANEX 97: связь, мощность и вычисления: материалы конференции . Университет Манитобы, Виннипег, Манитоба, Канада: Институт инженеров по электротехнике и электронике . 22–23 мая 1997 г. с. 30. ISBN 9780780341470. H.263 похож на H.261, но более сложен. В настоящее время это наиболее широко используемый международный стандарт сжатия видео для видеотелефонии на телефонных линиях ISDN (Integrated Services Digital Network).
  73. ^ Herre, J .; Дитц, М. (2008). «MPEG-4 высокоэффективное кодирование AAC [в двух словах о стандартах]». Журнал обработки сигналов IEEE . 25 (3): 137–142. Bibcode : 2008ISPM ... 25..137H . DOI : 10.1109 / MSP.2008.918684 .
  74. ^ Британак, Владимир; Рао, КР (2017). Банки фильтров с косинусной / синусоидальной модуляцией: общие свойства, быстрые алгоритмы и целочисленные приближения . Springer. п. 478. ISBN 9783319610801.
  75. ^ «Dolby AC-4: передача звука для развлекательных услуг нового поколения» (PDF) . Dolby Laboratories . Июнь 2015 . Проверено 11 ноября 2019 .
  76. ^ Bleidt, RL; Отправить.; Niedermeier, A .; Czelhan, B .; Füg, S .; и другие. (2017). «Разработка аудиосистемы телевидения MPEG-H для ATSC 3.0» (PDF) . IEEE Transactions on Broadcasting . 63 (1): 202–236. DOI : 10.1109 / TBC.2017.2661258 . S2CID 30821673 .  
  77. ^ Шнелл, Маркус; Шмидт, Маркус; Джандер, Мануэль; Альберт, Тобиас; Гейгер, Ральф; Руоппила, Веса; Экстранд, Пер; Бернхард, Гриль (октябрь 2008 г.). MPEG-4 Enhanced Low Delay AAC - новый стандарт высококачественной связи (PDF) . 125-я конвенция AES. Фраунгофера IIS . Аудио инженерное общество . Проверено 20 октября 2019 года .
  78. ^ Луцки, Манфред; Шуллер, Джеральд; Гейер, Марк; Кремер, Ульрих; Вабник, Стефан (май 2004 г.). Руководство по задержке аудиокодека (PDF) . 116-я Конвенция AES. Фраунгофера IIS . Аудио инженерное общество . Проверено 24 октября 2019 года .
  79. ^ a b Нагиредди, Шиваннараяна (2008). Обработка голосовых и факсимильных сигналов VoIP . Джон Вили и сыновья . п. 69. ISBN. 9780470377864.
  80. ^ a b Британак, Владимир; Рао, КР (2017). Банки фильтров с косинусной / синусоидальной модуляцией: общие свойства, быстрые алгоритмы и целочисленные приближения . Springer. С. 31, 478. ISBN 9783319610801.
  81. ^ Программа работы ИК 16 МСЭ-Т (2005-2008 гг.) - G.718 (бывший G.VBR-EV)
  82. ^ Презентация кодека CELT Тимоти Б. Террибери (65 минут видео, см. Также слайды презентации в PDF)
  83. ^ Доступна Ekiga 3.1.0
  84. ^ FreeSWITCH: новый релиз на новый год
  85. ^ Валин, Жан-Марк; Максвелл, Грегори; Террибери, Тимоти Б .; Вос, Коэн (октябрь 2013 г.). Высококачественное кодирование музыки с малой задержкой в ​​кодеке Opus . 135-я Конвенция AES. Аудио инженерное общество . arXiv : 1602.04845 .
  86. ^ "Кодек Opus" . Opus (Домашняя страница). Фонд Xiph.org . Проверено 31 июля 2012 года .
  87. Лейден, Джон (27 октября 2015 г.). «WhatsApp обнажился: исследованы внутренности информативного приложения» . Реестр . Проверено 19 октября 2019 года .
  88. ^ Хазра, Судип; Матети, Прабхакер (13–16 сентября 2017 г.). «Проблемы криминалистики Android» . In Thampi, Sabu M .; Перес, Грегорио Мартинес; Вестфалл, Карлос Беккер; Ху, Цзянькунь; Fan, Chun I .; Мармол, Феликс Гомес (ред.). Безопасность в вычислениях и коммуникациях: 5-й международный симпозиум, SSCC 2017 . Springer. С. 286–299 (290). DOI : 10.1007 / 978-981-10-6898-0_24 . ISBN 9789811068980.
  89. ^ Шривастава, Саураб Ранджан; Дубе, Сачин; Шривастая, Гульшан; Шарма, Кавита (2019). «Проблемы безопасности, инициируемые смартфонами: проблемы, примеры из практики и предотвращение» . В Ле, Дак-Нхуонг; Кумар, Рагвендра; Мишра, Броджо Кишор; Чаттерджи, Джйотир Мой; Хари, Манджу (ред.). Кибербезопасность в параллельных и распределенных вычислениях: концепции, методы, приложения и примеры из практики . Кибербезопасность в параллельных и распределенных вычислениях . Джон Вили и сыновья. С. 187–206 (200). DOI : 10.1002 / 9781119488330.ch12 . ISBN 9781119488057.
  90. ^ «Программное обеспечение с открытым исходным кодом, используемое в PlayStation®4» . Sony Interactive Entertainment Inc . Проверено 11 декабря 2017 .
  91. ^ "Кодек расширенных голосовых служб (EVS)" (PDF) . Фраунгофера IIS . Марта 2017 года . Проверено 19 октября 2019 года .
  92. ^ Abousleman, GP; Марселлин, МВт; Хант, Б.Р. (январь 1995 г.), «Сжатие гиперспектральных изображений с использованием 3-D DCT и гибридного DPCM / DCT», IEEE Trans. Geosci. . Remote Sens , 33 (1): 26-34, Bibcode : 1995ITGRS..33 ... 26A , DOI : 10,1109 / 36,368225
  93. ^ Чан, Й .; Сиу, В. (май 1997 г.), "Кодирование трехмерного дискретного косинусного преобразования переменной временной длины" (PDF) , IEEE Trans. Обработка изображений. , 6 (5): 758-763, Bibcode : 1997ITIP .... 6..758C , CiteSeerX 10.1.1.516.2824 , DOI : 10,1109 / 83,568933 , PMID 18282969   
  94. ^ Песня, J .; SXiong, Z .; Лю, X .; Лю, Ю., "Алгоритм для многоуровневого кодирования и передачи видео", Proc. Четвертый Int. Конф. / Отл. Высокопроизводительное вычисление. Азиатско-Тихоокеанский регион , 2 : 700–703
  95. ^ Тай, С.-К; Gi, Y .; Лин, К.-В. (Сентябрь 2000 г.), «Адаптивный кодер трехмерного дискретного косинусного преобразования для сжатия медицинских изображений», IEEE Trans. Инф. Technol. Биомед. , 4 (3): 259-263, DOI : 10,1109 / +4233,870036 , PMID 11026596 , S2CID 18016215  
  96. ^ Йео, Б .; Лю Б. (май 1995 г.), "Объемный рендеринг сжатых трехмерных скалярных данных на основе DCT", IEEE Trans. Comput. Графика. , 1 : 29-43, DOI : 10,1109 / +2945,468390
  97. ^ CHAN, SC, LlU, W. и HO, KL: «Модулированные блоки фильтров с идеальной реконструкцией с суммой коэффициентов степеней двойки». Труды Inte.n Symp. Circuits and syst., 28-3 1 мая 2000 г., Женева, Швейцария, стр. 28-31
  98. ^ Queiroz, RL; Нгуен, Т.К. (1996). «Преобразования с перекрытием для эффективного кодирования преобразования / поддиапазона». IEEE Trans. Сигнальный процесс . 44 (5): 497–507.
  99. ^ Малвар, HS (1992). Обработка сигналов с перекрывающимися преобразованиями . Энглвуд Клиффс, Нью-Джерси: Prentice Hall.
  100. ^ Чан, Южная Каролина; Luo, L .; Хо, К.Л. (1998). «Биортогональные косинусно-модулированные вейвлеты с компактной опорой на M-канале». IEEE Trans. Сигнальный процесс . 46 (2): 1142–1151. Bibcode : 1998ITSP ... 46.1142C . DOI : 10.1109 / 78.668566 . hdl : 10722/42775 .
  101. ^ a b Katsaggelos, Aggelos K .; Бабаджан, С. Дерин; Чун-Джен, Цай (2009). «Глава 15 - Итеративное восстановление образа». Основное руководство по обработке изображений . Академическая пресса . С. 349–383. ISBN 9780123744579.
  102. ^ "Москитный шум" . Журнал ПК . Проверено 19 октября 2019 года .
  103. ^ Menkman, Роза (октябрь 2011). Момент глюка (гм) (PDF) . Институт сетевых культур. ISBN  978-90-816021-6-7. Проверено 19 октября 2019 года .
  104. ^ jpegs , Томас Рафф , Aperture , 31 мая 2009 г., 132 стр., ISBN 978-1-59711-093-8 
  105. ^ Обзор: JPEGs Томас Рафф , по Йорг Colberg , 17 апреля 2009
  106. ^ "Дискретное косинусное преобразование - MATLAB dct" . www.mathworks.com . Проверено 11 июля 2019 .
  107. ^ WB Pennebaker и JL Mitchell , Стандарт сжатия данных неподвижных изображений JPEG . Нью-Йорк: Ван Ностранд Рейнхольд, 1993.
  108. Y. Arai, T. Agui и M. Nakajima, «Быстрая схема DCT-SQ для изображений», Пер. IEICE , т. 71, нет. 11. С. 1095–1097, 1988.
  109. ^ X. Шао и С.Г. Джонсон, «Алгоритмы DCT / DST типа II / III с уменьшенным числом арифметических операций», Обработка сигналов , т. 88, стр. 1553–1564, июнь 2008 г.
  110. ^ Malvar 1992 harvnb error: несколько целей (2 ×): CITEREFMalvar1992 ( справка )
  111. ^ Мартуччи 1994
  112. ^ SC Chan и KL Ho, "Прямые методы вычисления дискретных синусоидальных преобразований", в Proc. Inst. Избрать. Англ. Обработка сигналов радара., Т. 137, декабрь 1990 г., стр. 433–442.
  113. ^ a b О. Алшибами и С. Буссакта, «Трехмерный алгоритм для 3-D DCT-III», в Proc. Шестой Int. Symp. Commun., Theory Applications, июль 2001 г., стр. 104–107.
  114. ^ Г. Би, Г. Ли, К.-К. Ма и Т.С. Тан, «О вычислении двумерного DCT», IEEE Trans. Сигнальный процесс., Т. 48, pp. 1171–1183, апрель 2000 г.
  115. ^ Э. Фейг, "О мультипликативной сложности дискретных \ косинусных преобразований", IEEE Trans. Инф. Теория, т. 38, стр. 1387–1390, август 1992 г.
  116. ^ Nussbaumer, HJ (1981). Алгоритмы быстрого преобразования Фурье и свертки (1-е изд.). Нью-Йорк: Springer-Verlag.
  117. ^ Шао, Сюаньчэн; Джонсон, Стивен Г. (2008). «Алгоритмы DCT / DST типа II / III с уменьшенным количеством арифметических операций». Обработка сигналов . 88 (6): 1553–1564. arXiv : cs / 0703150 . DOI : 10.1016 / j.sigpro.2008.01.004 . S2CID 986733 . 

Дальнейшее чтение [ править ]

  • Нарасимха, М .; Петерсон, А. (июнь 1978 г.). «О вычислении дискретного косинусного преобразования». Транзакции IEEE по коммуникациям . 26 (6): 934–936. DOI : 10.1109 / TCOM.1978.1094144 .
  • Махоул, Дж. (Февраль 1980 г.). «Быстрое косинусное преобразование в одном и двух измерениях». Транзакции IEEE по акустике, речи и обработке сигналов . 28 (1): 27–34. DOI : 10,1109 / TASSP.1980.1163351 .
  • Соренсен, H .; Jones, D .; Heideman, M .; Буррус, К. (июнь 1987 г.). «Действительные алгоритмы быстрого преобразования Фурье». Транзакции IEEE по акустике, речи и обработке сигналов . 35 (6): 849–863. CiteSeerX  10.1.1.205.4523 . DOI : 10,1109 / TASSP.1987.1165220 .
  • Arai, Y .; Агуи, Т .; Накадзима, М. (ноябрь 1988 г.). «Быстрая схема DCT-SQ для изображений» . Сделки IEICE . 71 (11): 1095–1097.
  • Плонка, Г .; Таше, М. (январь 2005 г.). «Быстрые и численно устойчивые алгоритмы дискретных косинусных преобразований» . Линейная алгебра и ее приложения . 394 (1): 309–345. DOI : 10.1016 / j.laa.2004.07.015 .
  • Duhamel, P .; Веттерли, М. (апрель 1990 г.). «Быстрые преобразования Фурье: обзор учебного пособия и современное состояние» . Обработка сигналов (Представленная рукопись). 19 (4): 259–299. DOI : 10.1016 / 0165-1684 (90) 90158-U .
  • Ахмед, Н. (январь 1991 г.). «Как я придумал дискретное косинусное преобразование» . Цифровая обработка сигналов . 1 (1): 4–9. DOI : 10.1016 / 1051-2004 (91) 90086-Z .
  • Feig, E .; Виноград, С. (сентябрь 1992 г.). «Быстрые алгоритмы дискретного косинусного преобразования». Транзакции IEEE по обработке сигналов . 40 (9): 2174–2193. Bibcode : 1992ITSP ... 40.2174F . DOI : 10.1109 / 78.157218 .
  • Малвар, Энрике (1992), Обработка сигналов с перекрывающимися преобразованиями , Бостон: Дом Artech, ISBN 978-0-89006-467-2
  • Мартуччи, С.А. (май 1994 г.). «Симметричная свертка и дискретные синусоидальные и косинусные преобразования». Транзакции IEEE по обработке сигналов . 42 (5): 1038–1051. Bibcode : 1994ITSP ... 42.1038M . DOI : 10.1109 / 78.295213 .
  • Оппенгейм, Алан; Шафер, Рональд; Бак, Джон (1999), Обработка сигналов в дискретном времени (2-е изд.), Верхняя река Сэдл, Нью-Джерси: Prentice Hall, ISBN 978-0-13-754920-7
  • Frigo, M .; Джонсон, С. Г. (февраль 2005 г.). «Дизайн и реализация FFTW3» (PDF) . Труды IEEE . 93 (2): 216–231. CiteSeerX  10.1.1.66.3097 . DOI : 10.1109 / JPROC.2004.840301 . S2CID  6644892 .
  • Boussakta, Said .; Алшибами, Хамуд О. (апрель 2004 г.). «Быстрый алгоритм для 3-D DCT-II» (PDF) . Транзакции IEEE по обработке сигналов . 52 (4): 992–1000. Bibcode : 2004ITSP ... 52..992B . DOI : 10.1109 / TSP.2004.823472 . S2CID  3385296 .
  • Cheng, LZ; Цзэн, YH (2003). «Новый быстрый алгоритм многомерного ДКП IV типа». Транзакции IEEE по обработке сигналов . 51 (1): 213–220. DOI : 10.1109 / TSP.2002.806558 .
  • Вен-Сюн Чен; Smith, C .; Фралик, С. (сентябрь 1977 г.). «Быстрый вычислительный алгоритм для дискретного косинусного преобразования». Транзакции IEEE по коммуникациям . 25 (9): 1004–1009. DOI : 10.1109 / TCOM.1977.1093941 .
  • Нажмите, WH; Теукольский, С.А. Феттерлинг, Вашингтон; Фланнери, Б.П. (2007), «Раздел 12.4.2. Косинусное преобразование» , Численные рецепты: Искусство научных вычислений (3-е изд.), Нью-Йорк: Cambridge University Press, ISBN. 978-0-521-88068-8

Внешние ссылки [ править ]

  • Сайед Али Хайям: Дискретное косинусное преобразование (DCT): теория и применение
  • Реализация целочисленной аппроксимации MPEG 8x8 IDCT (ISO / IEC 23002-2)
  • Маттео Фриго и Стивен Джонсон : FFTW , http://www.fftw.org/ . Бесплатная ( GPL ) библиотека C, которая может вычислять быстрые DCT (типы I-IV) в одном или нескольких измерениях произвольного размера.
  • Такуя Оура: универсальный пакет FFT, http://www.kurims.kyoto-u.ac.jp/~ooura/fft.html . Бесплатные библиотеки C и FORTRAN для вычисления быстрых DCT (типы II – III) в одном, двух или трех измерениях, мощность двух размеров.
  • Тим Кинцле: быстрые алгоритмы для вычисления 8-точечного DCT и IDCT, http://drdobbs.com/parallel/184410889 .
  • LTFAT - это бесплатный набор инструментов Matlab / Octave с интерфейсами для реализации FFTW DCT и DST типа I-IV.