Типы изображений сжатия видео - Video compression picture types
Эта статья не цитировать любой источники.Октябрь 2008 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
В области сжатие видео а кадр видео сжат с использованием различных алгоритмы с различными преимуществами и недостатками, в основном вокруг количества Сжатие данных. Эти разные алгоритмы для видеокадров называются типы изображений или же типы кадров. В различных видео алгоритмах используются три основных типа изображений: я, п и B. Они различаются по следующим характеристикам:
- я‑ Кадры являются наименее сжимаемыми, но не требуют для декодирования других видеокадров.
- п‑Frames могут использовать данные из предыдущих кадров для распаковки и более сжимаемы, чем I-кадры.
- B‑Frames могут использовать как предыдущие, так и прямые кадры для ссылки на данные, чтобы получить максимальное сжатие данных.
Резюме
Три типа картинки (или фреймы) используются в сжатие видео: I, P и B. кадры.
An I-кадр (Изображение с внутренним кодированием ) представляет собой законченный образ, как JPG или же BMP файл изображения.
А П-образная рама (Прогнозируемое изображение) содержит только изменения изображения из предыдущего кадра. Например, в сцене, где автомобиль движется по неподвижному фону, необходимо кодировать только движения автомобиля. Кодировщику не нужно сохранять неизменные пиксели фона в P-кадре, что позволяет экономить место. P-кадры также известны как дельта-кадры.
А B ‑ рама (Изображение с двунаправленным предсказанием) экономит еще больше места за счет использования различий между текущим кадром и предыдущим и последующим кадрами для определения его содержимого.
Кадры P и B также называются Интер кадры. Порядок расположения кадров I, P и B называется Группа картинок.
Картины / рамки
Хотя термины «рамка» и «изображение» часто используются как синонимы, термин рисунок является более общим понятием, поскольку изображение может быть рамкой или поле. Кадр - это законченное изображение, а поле - это набор четных или нечетных номеров. линии сканирования составление частичного изображения. Например, изображение HD 1080 имеет 1080 строк (строк) пикселей. Нечетное поле состоит из информации о пикселях для строк 1, 3, 5 ... 1079. Четное поле содержит информацию о пикселях для строк 2, 4, 6 ... 1080. Когда видео отправлено чересстрочная развертка формат, каждый кадр отправляется в двух полях, поле строк с нечетными номерами, за которыми следует поле строк с четными номерами.
Кадр используется в качестве ссылки для предсказания других кадров называется опорным кадром.
Кадры, закодированные без информации из других кадров, называются I-кадрами. Рамки, что использование предсказание из одного предшествующих опорного кадра (или один кадра для предсказания каждого региона) называется P-кадры. B-кадры используют прогнозирование на основе (возможно, взвешенного) среднего двух опорных кадров, одного предшествующего и одного последующего.
Ломтики
в H.264 / MPEG-4 AVC В стандарте степень детализации типов прогнозов снижена до «уровня среза». Срез - это пространственно отличная область кадра, которая кодируется отдельно от любой другой области в том же кадре. I-срезы, P-срезы и B-срезы занимают место I, P и B.
Макроблоки
Обычно картинки (кадры) разбиваются на макроблоки, и отдельные типы прогнозирования могут быть выбраны для макроблока, а не для всего изображения, как показано ниже:
- I-кадры могут содержать только внутренние макроблоки
- P-кадры могут содержать либо внутренние макроблоки, либо предсказанные макроблоки.
- B-кадры могут содержать макроблоки с внутренним, предсказанием или двойным предсказанием.
Кроме того, в H.264 стандарт видеокодирования, кадр может быть сегментирован на последовательности макроблоков, называемых ломтики, и вместо использования выбора типа I, B и P-кадра кодер может выбирать стиль прогнозирования отдельно для каждого отдельного среза. Также в H.264 есть несколько дополнительных типов кадров / срезов:
- SI-кадры / слайсы (переключение I): облегчает переключение между кодированными потоками; содержит SI-макроблоки (особый тип макроблока с внутренним кодированием).
- SP-кадры / слайсы (Switching P): облегчает переключение между кодированными потоками; содержит P и / или I-макроблоки
- Многокадровый оценка движения (до 16 справочных кадров или 32 справочных полей)
Оценка многокадрового движения повышает качество видео при сохранении той же степени сжатия. Кадры SI и SP (определенные для расширенного профиля) улучшают исправление ошибки. Когда такие кадры используются вместе с интеллектуальным декодером, можно восстановить широковещательные потоки поврежденных DVD-дисков.
Внутрикодированные (I) кадры / фрагменты (ключевые кадры)
- I-кадры содержат все изображение. Они кодируются без ссылки на какой-либо другой фрейм, кроме (части) самих себя.
- Может генерироваться кодером для создания точки произвольного доступа (чтобы позволить декодеру правильно начать декодирование с нуля в этом месте изображения).
- Может также генерироваться, когда различение деталей изображения запрещает создание эффективных P- или B-кадров.
- Обычно для кодирования требуется больше битов, чем для других типов кадров.
Часто I-кадры используются для произвольного доступа и используются в качестве эталонов для декодирования других изображений. Периоды обновления в полсекунды обычно используются в таких приложениях, как цифровое телевидение трансляция и DVD место хранения. В некоторых средах могут использоваться более длительные периоды обновления. Например, в видео-конференция В системах I-кадры обычно отправляются очень редко.
Прогнозируемые (P) кадры / фрагменты
- Требовать предварительного декодирования некоторых других изображений, чтобы их можно было декодировать.
- Может содержать как данные изображения, так и смещения векторов движения и их комбинации.
- Может ссылаться на предыдущие изображения в порядке декодирования.
- Более старые стандартные конструкции (например, MPEG-2 ) использовать только одно ранее декодированное изображение в качестве эталона во время декодирования и требовать, чтобы это изображение также предшествовало P-изображению в порядке отображения.
- В H.264 можно использовать несколько ранее декодированных изображений в качестве эталонов во время декодирования и может иметь любое произвольное отношение порядка отображения относительно изображения (изображений), используемого для его предсказания.
- Обычно для кодирования требуется меньше битов, чем для изображений.
Двунаправленные предсказанные (B) кадры / срезы (макроблоки)
- Требовать предварительного декодирования следующего кадра (ов) для отображения.
- Может содержать данные изображения и / или смещения вектора движения. Старые стандарты допускают только один компенсация глобального движения вектор для всего кадра или один вектор компенсации движения для каждого макроблока.
- Включите некоторые режимы прогнозирования, которые формируют прогноз области движения (например, макроблока или меньшей области) путем усреднения прогнозов, полученных с использованием двух различных ранее декодированных опорных областей. Некоторые стандарты допускают два вектора компенсации движения на макроблок (двойное предсказание).
- В старых стандартах (таких как MPEG-2) B-кадры никогда не используются в качестве эталонов для предсказания других изображений. В результате для таких B-кадров может использоваться кодирование более низкого качества (требующее меньшего пространства), поскольку потеря деталей не повредит качеству прогнозирования для последующих изображений.
- H.264 ослабляет это ограничение и позволяет использовать B-кадры в качестве ссылок для декодирования других кадров по усмотрению кодировщика.
- Более старые стандарты (например, MPEG-2) используют ровно два ранее декодированных изображения в качестве эталонов во время декодирования и требуют, чтобы одно из этих изображений предшествовало B-кадру в порядке отображения, а другое - следовало за ним.
- H.264 допускает одно, два или более двух ранее декодированных изображений в качестве эталонов во время декодирования и может иметь любую произвольную взаимосвязь порядка отображения относительно изображения (изображений), используемого для его предсказания.
- Повышенная гибкость поиска информации означает, что B-кадры обычно требуют меньше бит для кодирования, чем I или P-кадры.
Смотрите также
- Ключевой кадр термин в анимации
- Сжатие видео
- Внутри кадра
- Межкадровый
- Группа картинок применение типов каркаса
- Датамош
- видео