Группа картинок


При кодировании видео группа изображений или структура GOP определяет порядок, в котором располагаются внутренние и внутренние кадры . GOP представляет собой набор последовательных изображений в закодированном видеопотоке. Каждый закодированный видеопоток состоит из последовательных GOP, из которых генерируются видимые кадры. Обнаружение новой GOP в сжатом видеопотоке означает, что декодеру не нужны никакие предыдущие кадры для декодирования следующих, и он обеспечивает быстрый поиск по видео.

Кадр I указывает начало GOP. Затем следуют несколько кадров P и B. В более старых проектах допустимая структура порядка и ссылок относительно ограничена. [2]

I-кадры содержат полное изображение и не требуют дополнительной информации для их восстановления. Как правило, кодеры используют структуры GOP, которые заставляют каждый I-кадр быть «чистой точкой произвольного доступа», так что декодирование может начаться чисто с I-кадра, а любые ошибки в структуре GOP исправляются после обработки правильного I-кадра.

В более новых разработках H.264/MPEG-4 AVC и HEVC, кодировщики обладают гораздо большей гибкостью в отношении структур ссылок. Они могут использовать те же структуры ссылок, которые использовались ранее в старых проектах, или они могут использовать больше изображений в качестве ссылок, и они могут использовать более гибкий порядок порядка кодирования относительно порядка отображения. Им также разрешено использовать B-изображения в качестве эталонов при кодировании других (B- или P)-изображений. Эта дополнительная гибкость может повысить эффективность сжатия, но может привести к распространению ошибок, если некоторые данные будут потеряны или повреждены. Одной из популярных структур для использования с более новыми проектами является использование иерархии B-изображений. Иерархические B-изображения могут обеспечить очень хорошую эффективность сжатия, а также могут ограничить распространение ошибок, поскольку иерархия может гарантировать, что количество изображений, затрагиваемых любой проблемой повреждения данных, строго ограничено.

Как правило, чем больше I кадров в видеопотоке, тем больше возможностей для его редактирования. Однако наличие большего количества I-кадров существенно увеличивает скорость передачи данных, необходимую для кодирования видео.

Структура GOP часто обозначается двумя числами, например, M=3, N=12. Первое число указывает расстояние между двумя опорными рамами (I или P). Второй сообщает расстояние между двумя полными изображениями (I-кадрами): это размер GOP. [3] Для примера M=3, N=12 структура GOP имеет вид IBBPBBPBBPBBI. Вместо параметра M можно использовать максимальное количество B-кадров между двумя последовательными опорными кадрами.