Из Википедии, бесплатной энциклопедии
  (Перенаправлено с H.262 )
Перейти к навигации Перейти к поиску

H.262 [1] или MPEG-2 Part 2 (официально известный как Рекомендация ITU-T H.262 и ISO / IEC 13818-2 , [2] также известный как MPEG-2 Video ) - это стандартизованный и совместно используемый формат кодирования видео. поддерживается Группой экспертов по кодированию видео (VCEG) 16-й Исследовательской комиссии ITU-T и группой экспертов ISO / IEC по движущимся изображениям (MPEG) и разработан с участием многих компаний. Это вторая часть стандарта ISO / IEC MPEG-2 . Документы Рекомендации ITU-T H.262 и ISO / IEC 13818-2 идентичны.

Стандарт доступен за плату в ITU-T [1] и ISO. Видео MPEG-2 очень похоже на MPEG-1 , но также обеспечивает поддержку чересстрочного видео (метод кодирования, используемый в аналоговых телевизионных системах NTSC, PAL и SECAM). Видео MPEG-2 не оптимизировано для низких скоростей передачи данных (например, менее 1 Мбит / с), но несколько превосходит MPEG-1 при более высоких скоростях передачи данных (например, 3 Мбит / с и выше), хотя и не с большим отрывом. если видео не чересстрочное. Все соответствующие стандартам видеодекодеры MPEG-2 также полностью способны воспроизводить видеопотоки MPEG-1. [3]

История [ править ]

Процесс утверждения ISO / IEC был завершен в ноябре 1994 года. [4] Первая редакция была утверждена в июле 1995 года [5] и опубликована ITU-T [1] и ISO / IEC в 1996 году. [6] Под председательством Дидье ЛеГалла из Bellcore при разработке стандарта [7] Сакаэ Окубо из NTT был координатором ITU-T и руководил соглашениями по его требованиям. [8]

Технология была разработана при участии ряда компаний. Hyundai Electronics (ныне SK Hynix ) разработала первый декодер MPEG-2 SAVI (система / аудио / видео) в 1995 году. [9]

Большинство патентов , которые позже были заявлены в патентном пуле как существенные для реализации стандарта, поступили от трех компаний: Sony (311 патентов), Thomson (198 патентов) и Mitsubishi Electric (119 патентов). [10]

В 1996 году он был расширен двумя поправками, включив в него регистрацию идентификаторов авторских прав и профиль 4: 2: 2. [1] [11] МСЭ-Т опубликовал эти поправки в 1996 году, а ISO - в 1997 году. [6]

Есть также другие поправки, опубликованные позже ITU-T и ISO. [1] [12] Самая последняя редакция стандарта была опубликована в 2013 году и включает все предыдущие поправки. [2]

Редакции [ править ]

Кодирование видео [ править ]

Образец изображения [ править ]

HDTV камера с 8-битовой выборкой генерирует сырую видео поток 25 × 1920 × 1080 × 3 = 155520000 байт в секунду в течение 25 кадров в секунду видео ( с использованием 4: 4: 4 выборки формата). Этот поток данных должен быть сжат, если цифровое телевидение должно соответствовать полосе пропускания доступных телеканалов и если фильмы должны уместиться на DVD. Сжатие видео практично, потому что данные в изображениях часто избыточны во времени и пространстве. Например, небо может быть синим в верхней части изображения, и это голубое небо может сохраняться кадр за кадром. Кроме того, из-за того, как работает глаз, можно удалить или аппроксимировать некоторые данные из видеоизображений с незначительным ухудшением качества изображения или без него.

Распространенный (и старый) трюк для уменьшения объема данных заключается в разделении каждого полного «кадра» видео на два «поля» при трансляции / кодировании: «верхнее поле», которое представляет собой горизонтальные строки с нечетными номерами, и « нижнее поле », которое представляет собой четные строки. После приема / декодирования два поля отображаются поочередно со строками одного поля, чередующимися между строками предыдущего поля; этот формат называется видео с чересстрочной разверткой . Типичная скорость поля составляет 50 (Европа / PAL) или 59,94 (США / NTSC) полей в секунду, что соответствует 25 (Европа / PAL) или 29,97 (Северная Америка / NTSC) полным кадрам в секунду. Если видео не чересстрочное, это называется прогрессивной разверткой.видео и каждая картинка представляет собой законченный кадр. MPEG-2 поддерживает оба варианта.

Цифровое телевидение требует, чтобы эти изображения были оцифрованы, чтобы их можно было обрабатывать с помощью компьютерного оборудования. Каждый элемент изображения ( пиксель ) затем представлен одним номером яркости и двумя номерами цветности . Они описывают яркость и цвет пикселя (см. YCbCr ). Таким образом, каждое оцифрованное изображение изначально представлено тремя прямоугольными массивами чисел.

Другой распространенной практикой для уменьшения объема данных, подлежащих обработке, является субдискретизация двух плоскостей цветности (после фильтрации нижних частот, чтобы избежать наложения спектров ). Это работает, потому что человеческая зрительная система лучше распознает детали яркости, чем детали оттенка и насыщенности цветов. Термин 4: 2: 2 используется для видео с субдискретизацией цветности с соотношением 2: 1 по горизонтали, а 4: 2: 0 используется для видео с субдискретизацией цветности 2: 1 как по вертикали, так и по горизонтали. Видео с одинаковым разрешением яркости и цветности называется 4: 4: 4.. В документе MPEG-2 Video рассматриваются все три типа выборки, хотя 4: 2: 0, безусловно, является наиболее распространенным для потребительского видео, и нет определенных «профилей» MPEG-2 для видео 4: 4: 4 (см. Ниже для дальнейшего обсуждения профилей).

Хотя обсуждение ниже в этом разделе в целом описывает сжатие видео MPEG-2, есть много деталей, которые не обсуждаются, включая детали, включающие поля, форматы цветности, реакции на изменения сцены, специальные коды, которые маркируют части потока битов, и другие части. информации. Помимо функций для обработки полей для чересстрочного кодирования, видео MPEG-2 очень похоже на видео MPEG-1 (и даже очень похоже на более ранний стандарт H.261 ), поэтому все описание, приведенное ниже, одинаково хорошо применимо к MPEG-1.

I-кадры, P-кадры и B-кадры [ править ]

MPEG-2 включает в себя три основных типа кодированных кадров: кадры с внутренним кодированием ( I-кадры ), кадры с кодированием с предсказанием ( P-кадры ) и кадры с двунаправленным кодированием с предсказанием ( B-кадры ).

I-кадр - это отдельно сжатая версия одного несжатого (необработанного) кадра. Кодирование I-кадра использует преимущества пространственной избыточности и неспособности глаза обнаруживать определенные изменения в изображении. В отличие от P-кадров и B-кадров, I-кадры не зависят от данных в предыдущем или следующих кадрах, и поэтому их кодирование очень похоже на то, как будет кодироваться неподвижная фотография (примерно аналогично кодированию изображений JPEG ). Вкратце, необработанный кадр делится на блоки размером 8 пикселей на 8 пикселей. Данные в каждом блоке преобразуются с помощью дискретного косинусного преобразования (DCT). Результатом является матрица коэффициентов 8 × 8 с действительными числами.значения. Преобразование преобразует пространственные вариации в вариации частоты, но не изменяет информацию в блоке; если преобразование вычисляется с идеальной точностью, исходный блок можно точно воссоздать, применяя преобразование обратного косинуса (также с идеальной точностью). Преобразование из 8-битных целых чисел в действительные коэффициенты преобразования фактически увеличивает объем данных, используемых на этом этапе обработки, но преимущество преобразования состоит в том, что данные изображения затем могут быть аппроксимированы путем квантования.коэффициенты. Многие из коэффициентов преобразования, обычно более высокочастотные компоненты, будут равны нулю после квантования, которое, по сути, является операцией округления. Наказанием на этом этапе является потеря некоторых тонких различий в яркости и цвете. Квантование может быть грубым или точным, в зависимости от выбора кодировщика. Если квантование не слишком грубое и к матрице применяется обратное преобразование после ее квантования, получается изображение, которое очень похоже на исходное изображение, но не совсем то же самое. Затем сама квантованная матрица коэффициентов сжимается. Обычно один угол массива коэффициентов 8 × 8 содержит только нули после применения квантования. Начиная с противоположного угла матрицы, затем зигзагообразно перемещаясь по матрице, чтобы объединить коэффициенты в строку, затем подставляякоды длин серий для последовательных нулей в этой строке, а затем применяя кодирование Хаффмана к этому результату, сокращают матрицу до меньшего количества данных. Именно эти данные с энтропийным кодированием транслируются или записываются на DVD. В приемнике или плеере весь процесс меняется на противоположный, что позволяет приемнику восстановить с близким приближением исходный кадр.

Обработка B-кадров аналогична обработке P-кадров, за исключением того, что B-кадры используют изображение в последующем опорном кадре, а также изображение в предыдущем опорном кадре. В результате B-кадры обычно обеспечивают большее сжатие, чем P-кадры. B-кадры никогда не являются опорными кадрами в MPEG-2 Video.

Обычно каждый 15-й кадр или около того превращается в I-кадр. P-кадры и B-кадры могут следовать за I-кадром, подобным этому, IBBPBBPBBPBB (I), чтобы сформировать группу изображений (GOP) ; однако стандарт гибок в этом отношении. Кодер выбирает, какие изображения кодируются как I-, P- и B-кадры.

Макроблоки [ править ]

P-кадры обеспечивают большее сжатие, чем I-кадры, потому что они используют данные в предыдущем I-кадре или P-кадре - опорном кадре . Чтобы сгенерировать P-кадр, предыдущий опорный кадр восстанавливается, как это было бы в ТВ-приемнике или DVD-плеере. Сжимаемый кадр делится на макроблоки размером 16 на 16 пикселей.. Затем для каждого из этих макроблоков производится поиск восстановленного опорного кадра, чтобы найти область 16 на 16, которая близко соответствует содержимому сжимаемого макроблока. Смещение кодируется как «вектор движения». Часто смещение равно нулю, но если что-то на изображении движется, смещение может быть примерно на 23 пикселя вправо и на 4 с половиной пикселя вверх. В MPEG-1 и MPEG-2 значения вектора движения могут представлять либо целочисленные смещения, либо полуцелые смещения. Совпадение между двумя регионами часто не будет идеальным. Чтобы исправить это, кодер берет разность всех соответствующих пикселей двух областей и на этой разнице макроблоков затем вычисляет DCT и строки значений коэффициентов для четырех областей 8 × 8 в макроблоке 16 × 16, как описано выше. Этот «остаточный»добавляется к вектору движения, и результат отправляется приемнику или сохраняется на DVD для каждого сжимаемого макроблока. Иногда подходящего совпадения не удается найти. Затем макроблок обрабатывается как макроблок I-кадра.

Профили и уровни видео [ править ]

Видео MPEG-2 поддерживает широкий спектр приложений, от мобильных до высококачественного редактирования HD. Для многих приложений поддерживать весь стандарт нереально и слишком дорого. Чтобы позволить таким приложениям поддерживать только его подмножества, стандарт определяет профили и уровни.

А профиль определяет множества функций , такие как B-изображения, 3D видео, формат цветность и т.д. Уровень ограничивает память и вычислительную мощность , необходимую, определение максимальных скоростей передачи бит, размеров кадра и частоты кадров.

Затем приложение MPEG определяет возможности с точки зрения профиля и уровня. Например, DVD-плеер может сказать, что поддерживает до основного профиля и основного уровня (часто обозначаемого как MP @ ML). Это означает, что проигрыватель может воспроизводить любой поток MPEG, закодированный как MP @ ML или меньше.

В таблицах ниже приведены ограничения для каждого профиля и уровня, хотя есть ограничения, не перечисленные здесь. [1] : Приложение E Обратите внимание, что не все комбинации профиля и уровня допустимы, а масштабируемые режимы изменяют ограничения уровня.

  1. ^ a b c Масштабируемость SNR отправляет различия в области преобразования на более низкий уровень квантования каждого блока, повышая качество и скорость передачи данных при объединении обоих потоков. Основной поток можно воссоздать без потерь.
  2. ^ a b Пространственная масштабируемость кодирует разницу между HD-потоками и масштабированными SD-потоками, которые объединяются с SD для воссоздания HD-потока. Основной поток не может быть воссоздан без потерь.
  3. ^ Временная масштабируемость вставляет дополнительные кадры между каждым базовым кадром, чтобы повысить частоту кадров или добавить трехмерную точку обзора. Это единственный профиль MPEG-2, допускающий адаптивные ссылки на кадры, что является важной особенностью H.264 / AVC . Главный поток может быть воссоздан без потерь, только если не используются расширенные ссылки.

Ниже представлены несколько распространенных комбинаций профиля / уровня MPEG-2 с указанием конкретных максимальных ограничений:

Приложения [ править ]

Некоторые приложения перечислены ниже.

  • DVD-Video - потребительский видеоформат стандартной четкости. Использует субдискретизацию цвета 4: 2: 0 и переменную скорость передачи видеоданных до 9,8 Мбит / с.
  • MPEG IMX - профессиональный формат видеозаписи стандартной четкости. Использует внутрикадровое сжатие, субдискретизацию цвета 4: 2: 2 и выбираемую пользователем постоянную скорость передачи видеоданных 30, 40 или 50 Мбит / с.
  • HDV - формат видеозаписи высокой четкости на магнитной ленте. Использует субдискретизацию цвета 4: 2: 0 и общую скорость передачи данных 19,4 или 25 Мбит / с.
  • XDCAM - семейство безленточных форматов видеозаписи, которое, в частности, включает форматы, основанные на MPEG-2 Part 2. Это: MPEG IMX стандартной четкости (см. Выше), MPEG HD высокой четкости, MPEG HD422 высокой четкости. MPEG IMX и MPEG HD422 используют субдискретизацию цвета 4: 2: 2, MPEG HD использует субдискретизацию цвета 4: 2: 0. В большинстве субформатов используется выбираемая постоянная скорость передачи видеоданных от 25 до 50 Мбит / с, хотя существует также режим переменной скорости передачи данных с максимальной скоростью передачи данных 18 Мбит / с.
  • XF Codec - профессиональный формат безленточной видеозаписи, похожий на MPEG HD и MPEG HD422, но хранящийся в другом файле-контейнере.
  • HD DVD - несуществующий потребительский видеоформат высокой четкости.
  • Blu-ray Disc - формат потребительского видео высокой четкости.
  • Broadcast TV - в некоторых странах MPEG-2 Part 2 используется для цифрового вещания в высоком разрешении . Например, ATSC определяет как несколько форматов сканирования (480i, 480p, 720p, 1080i, 1080p), так и частоту кадров / полей с субдискретизацией цвета 4: 2: 0 со скоростью передачи данных до 19,4 Мбит / с на канал.
  • Цифровое кабельное телевидение
  • Спутниковое ТВ

Патентообладатели [ править ]

Следующие организации имеют патенты на видеотехнологию MPEG-2, как указано в MPEG LA . Срок действия всех этих патентов истек.

Ссылки [ править ]

  1. ^ a b c d e f g «H.262: Информационные технологии - Общее кодирование движущихся изображений и связанной с ними звуковой информации: видео» . Веб-сайт МСЭ-Т . Международный союз электросвязи - Сектор стандартизации электросвязи ( ITU-T ). Февраль 2000 . Проверено 13 августа 2009 года .
  2. ^ а б в ISO. «ISO / IEC 13818-2: 2013 - Информационные технологии - Общее кодирование движущихся изображений и связанной с ними звуковой информации: видео» . ISO . Проверено 24 июля 2014 года .
  3. ^ Группа экспертов по движущемуся изображению. «Видео MPEG-2» . Проверено 15 июня 2019 г. - через mpeg.chiariglione.org.
  4. PN Tudor (декабрь 2005 г.). «Сжатие видео MPEG-2» . Проверено 1 ноября 2009 года .
  5. ^ H.262 (07/95) Информационные технологии - Общее кодирование движущегося изображения и связанной с ним аудиоинформации: видео (PDF) , ITU , получено 3 ноября 2009 г.
  6. ^ а б в ISO. «ISO / IEC 13818-2: 1996 - Информационные технологии. Общее кодирование движущихся изображений и связанной с ними звуковой информации: видео» . ISO . Проверено 24 июля 2014 года .
  7. ^ «Дидье ЛеГаль, исполнительный вице-президент» . Ambarella Inc. Retrieved +2 июне 2017 .
  8. ^ "Сакаэ Окубо" . ITU . Проверено 27 января 2017 года .
  9. ^ "История: 1990-е" . SK Hynix . Дата обращения 6 июля 2019 .
  10. ^ "Список патентов MPEG-2" (PDF) . MPEG LA . Дата обращения 7 июля 2019 .
  11. ^ Леонардо Чиариглен - Организатор (октябрь 2000). «Краткое описание MPEG-2» . Проверено 1 ноября 2009 года .
  12. ^ a b MPEG. «Стандарты MPEG» . chiariglione.org . Проверено 24 июля 2014 года .
  13. ^ ISO. «ISO / IEC 13818-2: 2000 / Amd 3 - Новый уровень для 1080 @ 50p / 60p» . Проверено 24 июля 2014 года .
  14. ^ ISO. «ISO / IEC 13818-2: 2000 - Информационные технологии. Общее кодирование движущихся изображений и связанной с ними звуковой информации: видео» . ISO . Проверено 24 июля 2014 года .
  15. ^ "Список патентов MPEG-2" (PDF) . MPEG LA . Дата обращения 7 июля 2019 .

Внешние ссылки [ править ]

  • Официальный веб-сайт MPEG
  • Кодирование видео MPEG-2 (H.262) - Библиотека Конгресса