Типы изображений сжатия видео - Video compression picture types

В области сжатие видео а кадр видео сжат с использованием различных алгоритмы с различными преимуществами и недостатками, в основном вокруг количества Сжатие данных. Эти разные алгоритмы для видеокадров называются типы изображений или же типы кадров. В различных видео алгоритмах используются три основных типа изображений: я, п и B. Они различаются по следующим характеристикам:

я‑ Кадры являются наименее сжимаемыми, но не требуют для декодирования других видеокадров.
п‑Frames могут использовать данные из предыдущих кадров для распаковки и более сжимаемы, чем I-кадры.
B‑Frames могут использовать как предыдущие, так и прямые кадры для ссылки на данные, чтобы получить максимальное сжатие данных.

Резюме

Последовательность видеокадров, состоящая из двух ключевых кадров (I), одного кадра с прямым прогнозированием (P) и одного кадра с двунаправленным прогнозированием (B).

Три типа картинки (или фреймы) используются в сжатие видео: I, P и B. кадры.

An I-кадр (Изображение с внутренним кодированием ) представляет собой законченный образ, как JPG или же BMP файл изображения.

А П-образная рама (Прогнозируемое изображение) содержит только изменения изображения из предыдущего кадра. Например, в сцене, где автомобиль движется по неподвижному фону, необходимо кодировать только движения автомобиля. Кодировщику не нужно сохранять неизменные пиксели фона в P-кадре, что позволяет экономить место. P-кадры также известны как дельта-кадры.

А B ‑ рама (Изображение с двунаправленным предсказанием) экономит еще больше места за счет использования различий между текущим кадром и предыдущим и последующим кадрами для определения его содержимого.

Кадры P и B также называются Интер кадры. Порядок расположения кадров I, P и B называется Группа картинок.

Картины / рамки

Хотя термины «рамка» и «изображение» часто используются как синонимы, термин рисунок является более общим понятием, поскольку изображение может быть рамкой или поле. Кадр - это законченное изображение, а поле - это набор четных или нечетных номеров. линии сканирования составление частичного изображения. Например, изображение HD 1080 имеет 1080 строк (строк) пикселей. Нечетное поле состоит из информации о пикселях для строк 1, 3, 5 ... 1079. Четное поле содержит информацию о пикселях для строк 2, 4, 6 ... 1080. Когда видео отправлено чересстрочная развертка формат, каждый кадр отправляется в двух полях, поле строк с нечетными номерами, за которыми следует поле строк с четными номерами.

Кадр используется в качестве ссылки для предсказания других кадров называется опорным кадром.

Кадры, закодированные без информации из других кадров, называются I-кадрами. Рамки, что использование предсказание из одного предшествующих опорного кадра (или один кадра для предсказания каждого региона) называется P-кадры. B-кадры используют прогнозирование на основе (возможно, взвешенного) среднего двух опорных кадров, одного предшествующего и одного последующего.

Ломтики

в H.264 / MPEG-4 AVC В стандарте степень детализации типов прогнозов снижена до «уровня среза». Срез - это пространственно отличная область кадра, которая кодируется отдельно от любой другой области в том же кадре. I-срезы, P-срезы и B-срезы занимают место I, P и B.

Макроблоки

Обычно картинки (кадры) разбиваются на макроблоки, и отдельные типы прогнозирования могут быть выбраны для макроблока, а не для всего изображения, как показано ниже:

I-кадры могут содержать только внутренние макроблоки
P-кадры могут содержать либо внутренние макроблоки, либо предсказанные макроблоки.
B-кадры могут содержать макроблоки с внутренним, предсказанием или двойным предсказанием.

Кроме того, в H.264 стандарт видеокодирования, кадр может быть сегментирован на последовательности макроблоков, называемых ломтики, и вместо использования выбора типа I, B и P-кадра кодер может выбирать стиль прогнозирования отдельно для каждого отдельного среза. Также в H.264 есть несколько дополнительных типов кадров / срезов:

SI-кадры / слайсы (переключение I): облегчает переключение между кодированными потоками; содержит SI-макроблоки (особый тип макроблока с внутренним кодированием).
SP-кадры / слайсы (Switching P): облегчает переключение между кодированными потоками; содержит P и / или I-макроблоки
Многокадровый оценка движения (до 16 справочных кадров или 32 справочных полей)

Оценка многокадрового движения повышает качество видео при сохранении той же степени сжатия. Кадры SI и SP (определенные для расширенного профиля) улучшают исправление ошибки. Когда такие кадры используются вместе с интеллектуальным декодером, можно восстановить широковещательные потоки поврежденных DVD-дисков.

Внутрикодированные (I) кадры / фрагменты (ключевые кадры)

I-кадры содержат все изображение. Они кодируются без ссылки на какой-либо другой фрейм, кроме (части) самих себя.
Может генерироваться кодером для создания точки произвольного доступа (чтобы позволить декодеру правильно начать декодирование с нуля в этом месте изображения).
Может также генерироваться, когда различение деталей изображения запрещает создание эффективных P- или B-кадров.
Обычно для кодирования требуется больше битов, чем для других типов кадров.

Часто I-кадры используются для произвольного доступа и используются в качестве эталонов для декодирования других изображений. Периоды обновления в полсекунды обычно используются в таких приложениях, как цифровое телевидение трансляция и DVD место хранения. В некоторых средах могут использоваться более длительные периоды обновления. Например, в видео-конференция В системах I-кадры обычно отправляются очень редко.

Прогнозируемые (P) кадры / фрагменты

Требовать предварительного декодирования некоторых других изображений, чтобы их можно было декодировать.
Может содержать как данные изображения, так и смещения векторов движения и их комбинации.
Может ссылаться на предыдущие изображения в порядке декодирования.
Более старые стандартные конструкции (например, MPEG-2 ) использовать только одно ранее декодированное изображение в качестве эталона во время декодирования и требовать, чтобы это изображение также предшествовало P-изображению в порядке отображения.
В H.264 можно использовать несколько ранее декодированных изображений в качестве эталонов во время декодирования и может иметь любое произвольное отношение порядка отображения относительно изображения (изображений), используемого для его предсказания.
Обычно для кодирования требуется меньше битов, чем для изображений.

Двунаправленные предсказанные (B) кадры / срезы (макроблоки)

Требовать предварительного декодирования следующего кадра (ов) для отображения.
Может содержать данные изображения и / или смещения вектора движения. Старые стандарты допускают только один компенсация глобального движения вектор для всего кадра или один вектор компенсации движения для каждого макроблока.
Включите некоторые режимы прогнозирования, которые формируют прогноз области движения (например, макроблока или меньшей области) путем усреднения прогнозов, полученных с использованием двух различных ранее декодированных опорных областей. Некоторые стандарты допускают два вектора компенсации движения на макроблок (двойное предсказание).
В старых стандартах (таких как MPEG-2) B-кадры никогда не используются в качестве эталонов для предсказания других изображений. В результате для таких B-кадров может использоваться кодирование более низкого качества (требующее меньшего пространства), поскольку потеря деталей не повредит качеству прогнозирования для последующих изображений.
H.264 ослабляет это ограничение и позволяет использовать B-кадры в качестве ссылок для декодирования других кадров по усмотрению кодировщика.
Более старые стандарты (например, MPEG-2) используют ровно два ранее декодированных изображения в качестве эталонов во время декодирования и требуют, чтобы одно из этих изображений предшествовало B-кадру в порядке отображения, а другое - следовало за ним.
H.264 допускает одно, два или более двух ранее декодированных изображений в качестве эталонов во время декодирования и может иметь любую произвольную взаимосвязь порядка отображения относительно изображения (изображений), используемого для его предсказания.
Повышенная гибкость поиска информации означает, что B-кадры обычно требуют меньше бит для кодирования, чем I или P-кадры.

Смотрите также

Ключевой кадр термин в анимации
Сжатие видео
Внутри кадра
Межкадровый
Группа картинок применение типов каркаса
Датамош
видео

внешняя ссылка

Потоковое видео с кадрами SP и SI