Сжатие данных - Data compression - Wikipedia
В обработка сигналов, Сжатие данных, исходное кодирование,[1] или же снижение битовой скорости это процесс кодирования Информация используя меньше биты чем исходное представление.[2] Любое конкретное сжатие либо с потерями или же без потерь. Сжатие без потерь сокращает количество битов за счет выявления и исключения статистическая избыточность. Никакая информация не теряется при сжатии без потерь. Сжатие с потерями уменьшает количество битов, удаляя ненужную или менее важную информацию.[3] Обычно устройство, которое выполняет сжатие данных, называется кодером, а устройство, которое выполняет обращение процесса (декомпрессию), - декодером.
Процесс уменьшения размера файл данных часто называют сжатием данных. В контексте передача данных, это называется исходным кодированием; кодирование выполняется в источнике данных перед их сохранением или передачей.[4] Исходное кодирование не следует путать с кодирование каналов, для обнаружения и исправления ошибок или линейное кодирование, средство для отображения данных на сигнал.
Сжатие полезно, поскольку сокращает ресурсы, необходимые для хранения и передачи данных. Вычислительные ресурсы расходуются в процессах сжатия и декомпрессии. Сжатие данных подлежит компромисс между пространственно-временной сложностью. Например, схема сжатия видео может потребоваться дорогой аппаратное обеспечение чтобы видео распаковывалось достаточно быстро, чтобы его можно было просматривать в процессе распаковки, а возможность полностью распаковать видео перед его просмотром может быть неудобной или потребовать дополнительного хранилища. При разработке схем сжатия данных используются компромиссы между различными факторами, включая степень сжатия, величину вносимого искажения (при использовании сжатие данных с потерями ), а также вычислительные ресурсы, необходимые для сжатия и распаковки данных.[5][6]
Без потерь
Сжатие данных без потерь алгоритмы обычно эксплуатируют статистическая избыточность для представления данных без потери Информация, так что процесс обратим. Сжатие без потерь возможно, потому что большинство реальных данных демонстрируют статистическую избыточность. Например, изображение может иметь участки цвета, которые не меняются на несколько пикселей; вместо кодирования «красный пиксель, красный пиксель…» данные могут быть закодированы как «279 красных пикселей». Это базовый пример кодирование длин серий; существует множество схем уменьшения размера файла за счет устранения избыточности.
В Лемпель-Зив (LZ) методы сжатия являются одними из самых популярных алгоритмов хранения без потерь.[7] ВЫПУСКАТЬ представляет собой вариант LZ, оптимизированный для скорости декомпрессии и степени сжатия, но сжатие может быть медленным. В середине 1980-х гг. После работы Терри Велч, то Лемпель – Зив – Велч (LZW) алгоритм быстро стал предпочтительным методом для большинства систем сжатия общего назначения. LZW используется в Гифка изображения, программы, такие как PKZIP, и аппаратные устройства, такие как модемы.[8] В методах LZ используется модель сжатия на основе таблиц, в которой записи таблицы заменяются повторяющимися строками данных. Для большинства методов LZ эта таблица создается динамически из более ранних данных во входных данных. Сам стол часто Закодировано Хаффманом. Коды на основе грамматики подобный этому может чрезвычайно эффективно сжимать повторяющиеся входные данные, например, сбор биологических данных одного и того же или близкородственного вида, огромная коллекция документов с поддержкой версий, архивирование в Интернете и т. д. Основная задача основанных на грамматике кодов - создание контекстно-свободных грамматика, выводящая единственную строку. Другие практические алгоритмы сжатия грамматики включают: Sequitur и повторное сопряжение.
Самые мощные современные компрессоры без потерь используют вероятностный модели, такие как прогноз путем частичного сопоставления. В Преобразование Барроуза – Уиллера также можно рассматривать как косвенную форму статистического моделирования.[9] При дальнейшем уточнении прямого использования вероятностное моделирование, статистические оценки могут быть объединены в алгоритм, называемый арифметическое кодирование. Арифметическое кодирование - это более современный метод кодирования, в котором используются математические вычисления конечный автомат для создания строки закодированных битов из серии символов входных данных. Он может обеспечить превосходное сжатие по сравнению с другими методами, такими как более известный алгоритм Хаффмана. Он использует состояние внутренней памяти, чтобы избежать необходимости выполнять однозначное сопоставление отдельных входных символов с различными представлениями, которые используют целое число бит, и очищает внутреннюю память только после кодирования всей строки символов данных. . Арифметическое кодирование особенно хорошо применимо к задачам адаптивного сжатия данных, где статистика различается и зависит от контекста, поскольку его можно легко объединить с адаптивной моделью распределение вероятностей входных данных. Ранний пример использования арифметического кодирования был в необязательной (но не широко используемой) функции JPEG стандарт кодирования изображений.[10] С тех пор он применялся в различных других конструкциях, включая H.263, H.264 / MPEG-4 AVC и HEVC для кодирования видео.[11]
Потерянный
В конце 1980-х годов цифровые изображения стали более распространенными, и стандарты для изображений без потерь сжатие изображений появился. В начале 1990-х годов стали широко использоваться методы сжатия с потерями.[8] В этих схемах допускается некоторая потеря информации, поскольку отбрасывание несущественных деталей может сэкономить место для хранения. Есть соответствующий компромисс между сохранением информации и уменьшением размера. Схемы сжатия данных с потерями разработаны на основе исследования того, как люди воспринимают данные, о которых идет речь. Например, человеческий глаз более чувствителен к незначительным изменениям яркость чем вариации в цвете. JPEG Сжатие изображений частично работает за счет округления несущественных битов информации.[12] Эти различия в восприятии используются в ряде популярных форматов сжатия, в том числе психоакустика для звука и психовизуалы для изображений и видео.
Большинство форм сжатия с потерями основаны на преобразование кодирования, особенно дискретное косинусное преобразование (DCT). Впервые он был предложен в 1972 г. Насир Ахмед, который затем разработал алгоритм работы с Т. Натараджаном и К. Р. Рао в 1973 году, прежде чем представить его в январе 1974 года.[13][14] DCT - это наиболее широко используемый метод сжатия с потерями, который используется в мультимедийных форматах для изображений (Такие как JPEG и HEIF ),[15] видео (Такие как MPEG, AVC и HEVC ) и аудио (например, MP3, AAC и Vorbis ).
Потерянный сжатие изображений используется в цифровые фотоаппараты, чтобы увеличить емкость хранения. По аналогии, DVD, Блю рей и потоковое видео использовать с потерями форматы кодирования видео. Сжатие с потерями широко используется в видео.
При сжатии звука с потерями используются методы психоакустики для удаления неслышимых (или менее слышимых) компонентов звука. звуковой сигнал. Сжатие человеческой речи часто выполняется с помощью даже более специализированных методов; кодирование речи выделяется как отдельная дисциплина от сжатия звука общего назначения. Кодирование речи используется в интернет-телефония, например, сжатие звука используется для копирования компакт-дисков и декодируется аудиоплеерами.[9]
Слабое сжатие может вызвать потеря поколения.
Теория
Теоретическая основа сжатия обеспечивается теория информации и, более конкретно, алгоритмическая теория информации для сжатия без потерь и теория скорости-искажения для сжатия с потерями. Эти направления обучения были созданы Клод Шеннон, опубликовавшие фундаментальные статьи по этой теме в конце 1940-х - начале 1950-х годов. Другие темы, связанные со сжатием, включают теория кодирования и статистические выводы.[16]
Машинное обучение
Существует тесная связь между машинное обучение и сжатие. Система, предсказывающая апостериорные вероятности последовательности с учетом всей ее истории можно использовать для оптимального сжатия данных (используя арифметическое кодирование по выходному распределению). Оптимальный компрессор можно использовать для прогнозирования (путем поиска символа, который сжимает лучше всего с учетом предыдущей истории). Эта эквивалентность использовалась как оправдание для использования сжатия данных в качестве эталона для «общего интеллекта».[17][18][19]
Альтернативный вид может показывать алгоритмы сжатия, неявно отображающие строки в неявные векторы пространства признаков, а меры сходства на основе сжатия вычисляют сходство в этих пространствах функций. Для каждого компрессора C (.) Мы определяем соответствующее векторное пространство ℵ, такое, что C (.) Отображает входную строку x, соответствующую векторной норме || ~ x ||. Исчерпывающее исследование пространств признаков, лежащих в основе всех алгоритмов сжатия, исключается из-за пробела; вместо этого векторы признаков выбирают для изучения три репрезентативных метода сжатия без потерь: LZW, LZ77 и PPM.[20]
В соответствии с AIXI теория, связь более прямо объясняется в Приз Хаттера, наилучшее сжатие x - это наименьшее возможное программное обеспечение, которое генерирует x. Например, в этой модели сжатый размер zip-файла включает как zip-файл, так и программное обеспечение для распаковки, поскольку вы не можете распаковать его без обоих, но может существовать еще меньшая комбинированная форма.
Различие данных
Сжатие данных можно рассматривать как частный случай различие данных.[21][22] Различие данных заключается в создании разница учитывая источник и цель, с исправлением воспроизведения цель учитывая источник и разница. Поскольку при сжатии данных нет отдельного источника и цели, сжатие данных можно рассматривать как разность данных с пустыми исходными данными, причем сжатый файл соответствует разнице из ничего. Это то же самое, что и абсолютное энтропия (соответствующий сжатию данных) как частный случай относительная энтропия (соответствует разности данных) без исходных данных.
Период, термин дифференциальное сжатие используется, чтобы подчеркнуть соединение разности данных.
Использует
Изображение
Энтропийное кодирование возникла в 1940-х годах с появлением Кодирование Шеннона – Фано,[23] основа для Кодирование Хаффмана который был разработан в 1950 году.[24] Преобразование кодирования восходит к концу 1960-х годов, с появлением быстрое преобразование Фурье (БПФ) в 1968 году и Преобразование Адамара в 1969 г.[25]
Важно сжатие изображений техника дискретное косинусное преобразование (DCT), метод, разработанный в начале 1970-х годов.[13] DCT - основа для JPEG, а сжатие с потерями формат, который был введен Объединенная группа экспертов по фотографии (JPEG) в 1992 году.[26] JPEG значительно сокращает объем данных, необходимых для представления изображения за счет относительно небольшого снижения качества изображения, и стал наиболее широко используемым. формат файла изображения.[27][28] Его высокоэффективный алгоритм сжатия на основе DCT во многом стал причиной широкого распространения цифровые изображения и цифровые фотографии.[29]
Лемпель – Зив – Велч (LZW) - это сжатие без потерь алгоритм разработан в 1984 году. Он используется в Гифка формат, представленный в 1987 году.[30] ВЫПУСКАТЬ, алгоритм сжатия без потерь, указанный в 1996 году, используется в Переносимая сетевая графика (PNG) формат.[31]
Вейвлет-сжатие, использование вейвлеты в сжатии изображений, началось после развития кодирования DCT.[32] В JPEG 2000 Стандарт был введен в 2000 году.[33] В отличие от алгоритма DCT, используемого в исходном формате JPEG, JPEG 2000 вместо этого использует дискретное вейвлет-преобразование (DWT) алгоритмы.[34][35][36] Технология JPEG 2000, которая включает Motion JPEG 2000 расширение, было выбрано в качестве стандарт кодирования видео за цифровое кино в 2004 г.[37]
Аудио
Сжатие аудиоданных, не путать с сжатие динамического диапазона, имеет потенциал для уменьшения передачи пропускная способность и требования к хранению аудиоданных. Алгоритмы сжатия звука реализуются в программного обеспечения как аудио кодеки. При сжатии как с потерями, так и без потерь информационная избыточность сокращается с использованием таких методов, как кодирование, квантование дискретное косинусное преобразование и линейное предсказание для уменьшения количества информации, используемой для представления несжатых данных.
Алгоритмы сжатия звука с потерями обеспечивают более высокое сжатие и используются во многих аудиоприложениях, включая Vorbis и MP3. Почти все эти алгоритмы полагаются на психоакустика для устранения или уменьшения точности менее слышимых звуков, тем самым уменьшая пространство, необходимое для их хранения или передачи.[2][38]
Приемлемый компромисс между потерей качества звука и размером передачи или хранилища зависит от приложения. Например, один 640 МБ компакт-диск (CD) вмещает примерно один час несжатого высокая точность музыки, менее 2 часов музыки, сжатой без потерь, или 7 часов музыки, сжатой в MP3 формат на носителе битрейт. Цифровой диктофон обычно может хранить около 200 часов четко разборчивой речи на 640 МБ.[39]
Сжатие звука без потерь дает представление цифровых данных, которые можно декодировать до точной цифровой копии оригинала. Степень сжатия составляет около 50–60% от исходного размера,[40] который аналогичен стандартному сжатию данных без потерь. Использование кодеков без потерь подгонка кривой или линейное предсказание как основа для оценки сигнала. Параметры, описывающие оценку и разницу между оценкой и фактическим сигналом, кодируются отдельно.[41]
Существует ряд форматов сжатия звука без потерь. Видеть список кодеков без потерь для листинга. Некоторые форматы связаны с отдельной системой, например Прямая передача потока, используется в Супер аудио компакт-диск и Упаковка без потерь Meridian, используется в DVD-аудио, Dolby TrueHD, Блю рей и HD DVD.
Немного форматы аудиофайлов иметь комбинацию формата с потерями и коррекции без потерь; это позволяет удалить исправление, чтобы легко получить файл с потерями. Такие форматы включают MPEG-4 SLS (Масштабируемый до без потерь), WavPack, и OptimFROG DualStream.
Когда аудиофайлы должны быть обработаны либо путем дальнейшего сжатия, либо для редактирование, желательно работать с неизмененным оригиналом (несжатым или сжатым без потерь). Обработка сжатого с потерями файла для какой-либо цели обычно дает конечный результат хуже, чем создание того же сжатого файла из несжатого оригинала. Помимо редактирования или микширования звука, сжатие звука без потерь часто используется для архивного хранения или в качестве мастер-копий.
Сжатие звука с потерями
Сжатие звука с потерями используется в широком спектре приложений. В дополнение к автономным аудио-приложениям для воспроизведения файлов в MP3-плеерах или компьютерах, аудиопотоки с цифровым сжатием используются в большинстве DVD-видео, цифровом телевидении, потоковом мультимедиа на Интернет, спутниковое и кабельное радио и все чаще наземные радиопередачи. Сжатие с потерями обычно обеспечивает гораздо большее сжатие, чем сжатие без потерь, за счет отбрасывания менее важных данных на основе психоакустический оптимизации.[42]
Психоакустика признает, что не все данные в аудиопотоке могут быть восприняты человеком. слуховая система. В большинстве случаев сжатие с потерями снижает избыточность, сначала идентифицируя несущественные для восприятия звуки, то есть звуки, которые очень трудно услышать. Типичные примеры включают высокие частоты или звуки, которые появляются одновременно с более громкими звуками. Эти нерелевантные звуки кодируются с пониженной точностью или вообще не кодируются.
Из-за природы алгоритмов с потерями, Качество звука страдает потеря цифрового поколения когда файл распаковывается и повторно сжимается. Это делает сжатие с потерями непригодным для хранения промежуточных результатов в профессиональных аудиотехнических приложениях, таких как редактирование звука и многодорожечная запись. Однако форматы с потерями, такие как MP3 очень популярны среди конечных пользователей, поскольку размер файла уменьшается до 5-20% от исходного размера, а в мегабайте можно хранить около минуты музыки с надлежащим качеством.
Методы кодирования
Чтобы определить, какая информация в аудиосигнале не имеет отношения к восприятию, большинство алгоритмов сжатия с потерями используют преобразования, такие как модифицированное дискретное косинусное преобразование (MDCT) преобразовать область времени дискретизированных сигналов в область преобразования, обычно частотная область. После преобразования частотам компонентов можно назначить приоритет в соответствии с их слышимостью. Слышимость спектральных составляющих оценивается с помощью абсолютный порог слышимости и принципы одновременная маскировка - явление, при котором сигнал маскируется другим сигналом, разделенным по частоте, и, в некоторых случаях, временная маскировка - где сигнал маскируется другим сигналом, разделенным по времени. Контуры равной громкости также может использоваться для взвешивания перцепционной важности компонентов. Модели сочетания человеческого уха и мозга, включающие такие эффекты, часто называют психоакустические модели.[43]
Другие типы компрессоров с потерями, такие как кодирование с линейным прогнозированием (LPC), используемые с речью, являются кодировщиками на основе исходного кода. LPC использует модель речевого тракта человека для анализа звуков речи и определения параметров, используемых моделью для их воспроизведения от момента к моменту. Эти изменяющиеся параметры передаются или сохраняются и используются для управления другой моделью в декодере, воспроизводящем звук.
Форматы с потерями часто используются для распространения потокового аудио или интерактивного общения (например, в сетях сотовой связи). В таких приложениях данные должны распаковываться по мере потока данных, а не после того, как весь поток данных был передан. Не все аудиокодеки можно использовать для потоковых приложений.[42]
Задержка возникает из-за методов, используемых для кодирования и декодирования данных. Некоторые кодеки будут анализировать более длинный сегмент данных для оптимизации эффективности, а затем кодировать его таким образом, который требует одновременного декодирования большего сегмента данных. (Часто кодеки создают сегменты, называемые «кадром», для создания дискретных сегментов данных для кодирования и декодирования.) задержка алгоритма кодирования может быть критичным; например, при двусторонней передаче данных, например при телефонном разговоре, значительные задержки могут серьезно ухудшить воспринимаемое качество.
В отличие от скорости сжатия, которая пропорциональна количеству операций, требуемых алгоритмом, здесь под задержкой понимается количество выборок, которые должны быть проанализированы перед обработкой блока аудио. В минимальном случае задержка равна нулю отсчетов (например, если кодер / декодер просто уменьшает количество битов, используемых для квантования сигнала). Алгоритмы временной области, такие как LPC, также часто имеют низкие задержки, отсюда их популярность в кодировании речи для телефонии. Однако в таких алгоритмах, как MP3, необходимо проанализировать большое количество выборок для реализации психоакустической модели в частотной области, а задержка составляет порядка 23 мс (46 мс для двусторонней связи).
Кодировка речи
Кодировка речи является важной категорией сжатия аудиоданных. Модели восприятия, используемые для оценки того, что может слышать человеческое ухо, обычно несколько отличаются от моделей, используемых для музыки. Диапазон частот, необходимых для передачи звуков человеческого голоса, обычно намного уже, чем диапазон частот, необходимый для музыки, и звук обычно менее сложен. В результате речь может быть кодирована с высоким качеством с использованием относительно низкой скорости передачи данных.
Если данные, подлежащие сжатию, являются аналоговыми (например, напряжение, которое изменяется со временем), квантование используется для преобразования их в цифровую форму в числа (обычно целые числа). Это называется аналого-цифровым (A / D) преобразованием. Если целые числа, сгенерированные квантованием, равны 8 битам каждое, то весь диапазон аналогового сигнала делится на 256 интервалов, и все значения сигнала в интервале квантуются до одного и того же числа. Если генерируются 16-битные целые числа, то диапазон аналогового сигнала делится на 65 536 интервалов.
Это соотношение иллюстрирует компромисс между высоким разрешением (большое количество аналоговых интервалов) и высоким сжатием (генерируются маленькие целые числа). Это приложение квантования используется несколькими методами сжатия речи. Как правило, это достигается комбинацией двух подходов:
- Кодирование только звуков, которые может издать один человеческий голос.
- Выбрасывание большего количества данных в сигнале - сохранение ровно столько, чтобы восстановить «понятный» голос, а не полный частотный диапазон человеческого слушание.
Возможно, самыми ранними алгоритмами, используемыми в кодировании речи (и сжатии аудиоданных в целом), были Алгоритм A-law и алгоритм μ-закона.
История
В 1950 г. Bell Labs подал патент на дифференциальная импульсно-кодовая модуляция (DPCM).[44] Адаптивный DPCM (ADPCM) был представлен П. Каммиски, Никил С. Джаянт и Джеймс Л. Фланаган в Bell Labs в 1973 г.[45][46]
Перцептивное кодирование был впервые использован для кодирование речи сжатие, с кодирование с линейным прогнозированием (LPC).[47] Первоначальные концепции LPC восходят к работе Фумитада Итакура (Нагойский университет ) и Сюдзо Сайто (Nippon Telegraph and Telephone ) в 1966 году.[48] В 1970-е годы Бишну С. Атал и Манфред Р. Шредер в Bell Labs разработал форму LPC под названием адаптивное кодирование с предсказанием (APC), алгоритм кодирования восприятия, который использовал маскирующие свойства человеческого уха, за которым в начале 1980-х гг. линейное предсказание с кодовым возбуждением (CELP), который достиг значительного коэффициент сжатия для своего времени.[47] Перцепционное кодирование используется современными форматами сжатия звука, такими как MP3[47] и AAC.
Дискретное косинусное преобразование (DCT), разработанная Насир Ахмед, Т. Натараджан и К. Р. Рао в 1974 г.,[14] послужил основой для модифицированное дискретное косинусное преобразование (MDCT) используется современными форматами сжатия звука, такими как MP3.[49] и AAC. MDCT был предложен Дж. П. Принсеном, А. В. Джонсоном и А. Б. Брэдли в 1987 г.[50] после более ранней работы Принсена и Брэдли в 1986 году.[51] MDCT используется современными форматами сжатия звука, такими как Dolby Digital,[52][53] MP3,[49] и Расширенное кодирование звука (AAC).[54]
Первая в мире реклама автоматизация вещания система сжатия звука была разработана Оскаром Бонелло, профессором инженерных наук Университет Буэнос-Айреса.[55] В 1983 году, используя психоакустический принцип маскировки критических полос, впервые опубликованный в 1967 году,[56] он начал разрабатывать практическое приложение на основе недавно разработанного IBM PC компьютер, а система автоматизации вещания была запущена в 1987 году под названием Audicom. Двадцать лет спустя почти все радиостанции в мире использовали аналогичную технологию, произведенную рядом компаний.
Сборник литературы по большому количеству систем кодирования звука был опубликован в IEEE's Журнал по избранным направлениям коммуникаций (JSAC) в феврале 1988 года. Несмотря на то, что были некоторые документы до того времени, эта коллекция документировала все разнообразие законченных, работающих аудиокодеров, почти все из которых использовали методы восприятия (то есть маскирования) и своего рода частотный анализ и бэк-энд. бесшумное кодирование.[57] В нескольких из этих статей отмечена сложность получения хорошего, чистого цифрового звука для исследовательских целей. Большинство, если не все, авторы JSAC издание также были активны в MPEG-1 Аудиокомитет, создавший формат MP3.
видео
Сжатие видео - это практическая реализация исходного кодирования в теории информации. На практике большинство видеокодеков используются вместе с методами сжатия звука для хранения отдельных, но дополнительных потоков данных в виде одного комбинированного пакета с использованием так называемого форматы контейнеров.[58]
Несжатое видео требует очень высокого скорость передачи данных. Несмотря на то что сжатие видео без потерь кодеки работают с коэффициентом сжатия от 5 до 12, типичный H.264 видео со сжатием с потерями имеет коэффициент сжатия от 20 до 200.[59]
Два основных метода сжатия видео, используемых в стандарты кодирования видео являются дискретное косинусное преобразование (DCT) и компенсация движения (MC). Большинство стандартов кодирования видео, например H.26x и MPEG форматы, как правило, используют кодирование видео DCT с компенсацией движения (компенсация движения блока).[60][61]
Теория кодирования
Видеоданные могут быть представлены как последовательность кадров неподвижного изображения. Такие данные обычно содержат большое количество пространственных и временных данных. избыточность. Алгоритмы сжатия видео пытаются уменьшить избыточность и хранить информацию более компактно.
Наиболее форматы сжатия видео и кодеки использовать как пространственную, так и временную избыточность (например, посредством разностного кодирования с компенсация движения ). Сходства можно закодировать, сохранив только различия между, например, смежные во времени кадры (межкадровое кодирование) или пространственно смежные пиксели (внутрикадровое кодирование).Межкадровый компрессия (временная дельта-кодирование ) - один из самых мощных методов сжатия. Он (повторно) использует данные из одного или нескольких более ранних или более поздних кадров в последовательности для описания текущего кадра. Внутрикадровое кодирование, с другой стороны, использует только данные из текущего кадра, фактически оставаясьсжатие изображений.[43]
А класс специализированных форматов Используемые в видеокамерах и для редактирования видео используют менее сложные схемы сжатия, которые ограничивают свои методы предсказания внутрикадровым предсказанием.
Обычно при сжатии видео дополнительно используются сжатие с потерями такие методы, как квантование которые уменьшают аспекты исходных данных, которые (более или менее) не имеют отношения к зрительному восприятию человека, за счет использования перцептивных характеристик человеческого зрения. Например, небольшие различия в цвете труднее воспринимать, чем изменения яркости. Алгоритмы сжатия могут усреднять цвет в этих похожих областях, чтобы уменьшить пространство, аналогично тем, которые используются в JPEG сжатие изображений.[10] Как и при любом сжатии с потерями, существует компромисс между качество видео и битрейт, стоимость обработки сжатия и распаковки, а также системные требования. Видео с высокой степенью сжатия может быть видимым или отвлекающим артефакты.
Другие методы, кроме распространенных форматов преобразования на основе DCT, такие как фрактальное сжатие, подходящее преследование и использование дискретное вейвлет-преобразование (DWT), были предметом некоторых исследований, но обычно не используются в практических продуктах (за исключением использования вейвлет-кодирование как кодеры неподвижных изображений без компенсации движения). Интерес к фрактальному сжатию, кажется, ослабевает из-за недавнего теоретического анализа, показывающего сравнительную неэффективность таких методов.[43]
Межкадровое кодирование
Межкадровое кодирование работает путем сравнения каждого кадра видео с предыдущим. Отдельные кадры видеопоследовательности сравниваются от одного кадра к другому, и кодек сжатия видео отправляет только различия в систему отсчета. Если кадр содержит области, в которых ничего не перемещалось, система может просто подать короткую команду, которая копирует эту часть предыдущего кадра в следующий. Если части кадра перемещаются простым способом, компрессор может выдать команду (немного более длинную), которая сообщает декомпрессору сдвинуть, повернуть, осветлить или затемнить копию. Эта более длинная команда остается намного короче, чем внутрикадровое сжатие. Обычно кодер также передает остаточный сигнал, который описывает оставшиеся более тонкие различия с эталонным изображением. Используя энтропийное кодирование, эти остаточные сигналы имеют более компактное представление, чем полный сигнал. В областях видео с большим количеством движения сжатие должно кодировать больше данных, чтобы не отставать от большего количества изменяющихся пикселей. Обычно во время взрывов, пламени, стай животных и в некоторых панорамных снимках высокочастотная детализация приводит к ухудшению качества или увеличению переменный битрейт.
Гибридные блочные форматы преобразования
Сегодня почти все широко используемые методы сжатия видео (например, в стандартах, утвержденных ITU-T или же ISO ) используют ту же базовую архитектуру, которая восходит к H.261 который был стандартизирован в 1988 году ITU-T. В основном они полагаются на DCT, применяемый к прямоугольным блокам соседних пикселей, и временное прогнозирование с использованием векторы движения, а также в настоящее время этап внутриконтурной фильтрации.
На этапе прогнозирования различные дедупликация и применяются методы разностного кодирования, которые помогают декоррелировать данные и описывать новые данные на основе уже переданных данных.
Тогда прямоугольные блоки (остатка) пиксель данные преобразуются в частотную область, чтобы упростить поиск нерелевантной информации при квантовании и для некоторого уменьшения пространственной избыточности. В дискретное косинусное преобразование (DCT), который широко используется в этом отношении, был введен Н. Ахмед, Т. Натараджан и К. Р. Рао в 1974 г.[14]
На этапе основной обработки с потерями данные квантуются, чтобы уменьшить количество информации, не имеющей отношения к зрительному восприятию человека.
На последнем этапе статистическая избыточность в значительной степени устраняется за счет энтропийный кодер который часто применяет некоторую форму арифметического кодирования.
На дополнительной стадии внутриконтурной фильтрации к сигналу восстановленного изображения могут применяться различные фильтры. Вычисляя эти фильтры также внутри цикла кодирования, они могут способствовать сжатию, поскольку их можно применять к справочному материалу до того, как он будет использован в процессе прогнозирования, и ими можно руководствоваться, используя исходный сигнал. Самый популярный пример: деблокирующие фильтры которые размывают блокирующие артефакты от разрывов квантования на границах блоков преобразования.
История
В 1967 году А.Х. Робинсон и К. Черри предложили кодирование длин серий схема сжатия полосы пропускания для передачи аналоговых телевизионных сигналов.[62] Дискретное косинусное преобразование (DCT), который лежит в основе современного сжатия видео,[63] был представлен Насир Ахмед, Т. Натараджан и К. Р. Рао в 1974 г.[14][64]
H.261, который дебютировал в 1988 году, коммерчески представил распространенную базовую архитектуру технологии сжатия видео.[65] Это был первый формат кодирования видео основанный на сжатии DCT, который впоследствии стал стандартом для всех последующих основных форматов кодирования видео.[63] H.261 был разработан рядом компаний, в том числе Hitachi, PictureTel, NTT, BT и Toshiba.[66]
Самый популярный стандарты кодирования видео для кодеков были MPEG стандарты. MPEG-1 был разработан Группа экспертов по киноискусству (MPEG) в 1991 году, и он был разработан для сжатия VHS -качественное видео. Его сменил в 1994 г. MPEG-2 /H.262,[65] который был разработан рядом компаний, в первую очередь Sony, Томсон и Mitsubishi Electric.[67] MPEG-2 стал стандартным видеоформатом для DVD и SD цифровое телевидение.[65] В 1999 году за ним последовали MPEG-4 /H.263, что стало большим шагом вперед в технологии сжатия видео.[65] Он был разработан рядом компаний, в первую очередь Mitsubishi Electric, Hitachi и Panasonic.[68]
Наиболее широко используемый формат кодирования видео - это H.264 / MPEG-4 AVC. Он был разработан в 2003 году рядом организаций, в первую очередь Panasonic, Godo Kaisha IP Bridge и LG Electronics.[69] AVC коммерчески представила современный контекстно-адаптивное двоичное арифметическое кодирование (CABAC) и контекстно-адаптивное кодирование переменной длины (CAVLC) алгоритмы. AVC - это основной стандарт кодирования видео для Диски Blu-ray, и широко используется потоковыми интернет-сервисами, такими как YouTube, Netflix, Vimeo, и ITunes магазин, веб-программное обеспечение, такое как Adobe Flash Player и Microsoft Silverlight, и различные HDTV вещает по наземному и спутниковому телевидению.
Генетика
Алгоритмы сжатия генетики представляют собой последнее поколение алгоритмов без потерь, которые сжимают данные (обычно последовательности нуклеотидов) с использованием как обычных алгоритмов сжатия, так и генетических алгоритмов, адаптированных к конкретному типу данных. В 2012 году группа ученых из Университета Джона Хопкинса опубликовала алгоритм генетического сжатия, который не использует для сжатия эталонный геном. HAPZIPPER был разработан для HapMap data и обеспечивает более чем 20-кратное сжатие (уменьшение размера файла на 95%), обеспечивая в 2–4 раза лучшее сжатие и намного быстрее, чем ведущие универсальные утилиты сжатия. Для этого Чанда, Эльхайк и Бадер ввели кодирование на основе MAF (MAFE), которое снижает неоднородность набора данных путем сортировки SNP по частоте их минорных аллелей, тем самым гомогенизируя набор данных.[70] Другие алгоритмы 2009 и 2013 годов (DNAZip и GenomeZip) имеют степень сжатия до 1200 раз, что позволяет хранить 6 миллиардов пар оснований диплоидных геномов человека в 2,5 мегабайтах (относительно эталонного генома или усредненных по многим геномам).[71][72] Сравнительный анализ компрессоров данных генетики / геномики см. [73]
Перспективы и неиспользованный в настоящее время потенциал
Подсчитано, что общий объем данных, хранящихся на мировых устройствах хранения, может быть дополнительно сжат с помощью существующих алгоритмов сжатия с оставшимся средним коэффициентом 4,5: 1.[74] По оценкам, совокупные технологические возможности мира по хранению информации обеспечивают 1300 эксабайты аппаратных цифр в 2007 году, но когда соответствующий контент оптимально сжат, это составляет всего 295 эксабайт Информация о Шеннон.[75]
Смотрите также
Рекомендации
- ^ Уэйд, Грэм (1994). Кодирование и обработка сигналов (2-е изд.). Издательство Кембриджского университета. п. 34. ISBN 978-0-521-42336-6. Получено 2011-12-22.
Основная цель кодирования исходного кода - использовать или удалить «неэффективную» избыточность в PCM источник и тем самым добиться уменьшения общей скорости источника R.
- ^ а б Mahdi, O.A .; Mohammed, M.A .; Мохамед, А.Дж. (Ноябрь 2012 г.). «Внедрение нового подхода к преобразованию сжатия звука в кодирование текста с помощью гибридной техники» (PDF). Международный журнал проблем компьютерных наук. 9 (6, № 3): 53–59.. Получено 6 марта 2013.
- ^ Pujar, J.H .; Кадласкар, Л.М. (май 2010 г.). «Новый метод сжатия и декомпрессии изображений без потерь с использованием методов кодирования Хаффмана» (PDF). Журнал теоретических и прикладных информационных технологий. 15 (1): 18–23.
- ^ Саломон, Дэвид (2008). Краткое введение в сжатие данных. Берлин: Springer. ISBN 9781848000728.
- ^ С. Миттал; Дж. Веттер (2015), «Обзор архитектурных подходов к сжатию данных в системах кэширования и основной памяти», Транзакции IEEE в параллельных и распределенных системах, IEEE, 27 (5): 1524–1536, Дои:10.1109 / TPDS.2015.2435788, S2CID 11706516
- ^ Танк, М.К. (2011). «Реализация алгоритма Lempel-ZIV для сжатия без потерь с использованием VHDL». Реализация алгоритма Лимпеля-Зива для сжатия без потерь с использованием VHDL. Thinkquest 2010: Труды Первой Международной конференции по контурам компьютерных технологий. Берлин: Springer. С. 275–283. Дои:10.1007/978-81-8489-989-4_51. ISBN 978-81-8489-988-7.
- ^ Навки, Сауд; Naqvi, R .; Riaz, R.A .; Сиддики, Ф. (апрель 2011 г.). «Оптимизированный дизайн RTL и реализация алгоритма LZW для приложений с высокой пропускной способностью» (PDF). Электрический обзор. 2011 (4): 279–285.
- ^ а б Вольфрам, Стивен (2002). Новый вид науки. Wolfram Media, Inc. стр.1069. ISBN 978-1-57955-008-0.
- ^ а б Махмуд, Салауддин (март 2012 г.). «Улучшенный метод сжатия данных для общих данных» (PDF). Международный журнал научных и инженерных исследований. 3 (3): 2. Получено 6 марта 2013.
- ^ а б Лейн, Том. "Часто задаваемые вопросы о сжатии изображений JPEG, часть 1". Интернет-архивы часто задаваемых вопросов. Независимая группа JPEG. Получено 6 марта 2013.
- ^ Г. Дж. Салливан; Ж.-Р. Ом; W.-J. Хан; Т. Виганд (Декабрь 2012 г.). «Обзор стандарта высокоэффективного кодирования видео (HEVC)». IEEE Transactions по схемам и системам для видеотехнологий. IEEE. 22 (12): 1649–1668. Дои:10.1109 / TCSVT.2012.2221191.
- ^ Аркангел, Кори. «О сжатии» (PDF). Получено 6 марта 2013.
- ^ а б Ахмед, Насир (Январь 1991 г.). "Как я пришел к дискретному косинусному преобразованию". Цифровая обработка сигналов. 1 (1): 4–5. Дои:10.1016 / 1051-2004 (91) 90086-Z.
- ^ а б c d Насир Ахмед; Т. Натараджан; Камисетти Рамамохан Рао (январь 1974 г.). «Дискретное косинусное преобразование» (PDF). Транзакции IEEE на компьютерах. С-23 (1): 90–93. Дои:10.1109 / T-C.1974.223784.
- ^ Исследовательская группа CCITT VIII и Объединенная группа экспертов по фотографии (JPEG) от Объединенного технического комитета 1 ISO / IEC / Подкомитета 29 / Рабочей группы 10 (1993), «Приложение D - Арифметическое кодирование», Рекомендация T.81: Цифровое сжатие и кодирование неподвижных изображений с непрерывным тоном - Требования и рекомендации (PDF), стр. 54 и сл., получено 2009-11-07
- ^ Марак, Ласло. «О сжатии изображений» (PDF). Университет Марн-ла-Валле. Архивировано из оригинал (PDF) 28 мая 2015 г.. Получено 6 марта 2013.
- ^ Махони, Мэтт. «Обоснование теста на сжатие большого текста». Флоридский технологический институт. Получено 5 марта 2013.
- ^ Шмилович А .; Kahiri Y .; Бен-Гал I .; Хаузер С. (2009). «Измерение эффективности внутридневного рынка Форекс с помощью универсального алгоритма сжатия данных» (PDF). Вычислительная экономика. 33 (2): 131–154. CiteSeerX 10.1.1.627.3751. Дои:10.1007 / s10614-008-9153-3. S2CID 17234503.
- ^ И. Бен-Гал (2008). «Об использовании мер сжатия данных для анализа надежных конструкций» (PDF). Транзакции IEEE о надежности. 54 (3): 381–388. Дои:10.1109 / TR.2005.853280. S2CID 9376086.
- ^ Д. Скалли; Карла Э. Бродли (2006). «Сжатие и машинное обучение: новый взгляд на векторы пространства признаков». Конференция по сжатию данных, 2006 г.: 332. Дои:10.1109 / DCC.2006.13. ISBN 0-7695-2545-8. S2CID 12311412.
- ^ Korn, D .; и другие. «RFC 3284: Универсальный формат данных разности и сжатия VCDIFF». Инженерная группа Интернета. Получено 5 марта 2013.
- ^ Korn, D.G .; Во, К. (1995). Б. Кришнамурти (ред.). Vdelta: различие и сжатие. Практическое многоразовое программное обеспечение Unix. Нью-Йорк: John Wiley & Sons, Inc.
- ^ Клод Элвуд Шеннон (1948). Alcatel-Lucent (ред.). «Математическая теория коммуникации» (PDF). Технический журнал Bell System. 27 (3–4): 379–423, 623–656. Дои:10.1002 / j.1538-7305.1948.tb01338.x. HDL:11858 / 00-001M-0000-002C-4314-2. Получено 2019-04-21.
- ^ Дэвид Альберт Хаффман (Сентябрь 1952 г.), «Метод построения кодов с минимальной избыточностью» (PDF), Труды IRE, 40 (9), стр. 1098–1101, Дои:10.1109 / JRPROC.1952.273898
- ^ Уильям К. Пратт, Джулиус Кейн, Гарри К. Эндрюс: "Кодирование изображений с преобразованием Адамара ", в Proceedings of the IEEE 57.1 (1969): Seiten 58–68
- ^ «T.81 - ЦИФРОВОЕ СЖАТИЕ И КОДИРОВАНИЕ НЕПРЕРЫВНЫХ ТОНОВЫХ ИЗОБРАЖЕНИЙ - ТРЕБОВАНИЯ И РЕКОМЕНДАЦИИ» (PDF). CCITT. Сентябрь 1992 г.. Получено 12 июля 2019.
- ^ «Объяснение формата изображения JPEG». BT.com. BT Group. 31 мая 2018. Получено 5 августа 2019.
- ^ Баранюк, Крис (15 октября 2015 г.). «Защита от копирования может быть применена к файлам JPEG». Новости BBC. BBC. Получено 13 сентября 2019.
- ^ «Что такое JPEG? Невидимый объект, который вы видите каждый день». Атлантический океан. 24 сентября 2013 г.. Получено 13 сентября 2019.
- ^ «Противоречие GIF: взгляд разработчика программного обеспечения». Получено 26 мая 2015.
- ^ Л. Питер Дойч (Май 1996 г.). DEFLATE Спецификация формата сжатых данных версии 1.3. IETF. п. 1 сек. Абстрактный. Дои:10.17487 / RFC1951. RFC 1951. Получено 2014-04-23.
- ^ Хоффман, Рой (2012). Сжатие данных в цифровых системах. Springer Science & Business Media. п. 124. ISBN 9781461560319.
По сути, вейвлет-кодирование - это вариант кодирования с преобразованием на основе DCT, который уменьшает или устраняет некоторые из его ограничений. (...) Еще одно преимущество заключается в том, что вместо работы с блоками 8 × 8 пикселей, как это делают JPEG и другие блочные методы DCT, вейвлет-кодирование может одновременно сжимать все изображение.
- ^ Таубман, Дэвид; Марселлин, Майкл (2012). JPEG2000: основы, стандарты и практика сжатия изображений: основы, стандарты и практика сжатия изображений. Springer Science & Business Media. ISBN 9781461507994.
- ^ Unser, M .; Блю Т. (2003). «Математические свойства вейвлет-фильтров JPEG2000». IEEE Transactions по обработке изображений. 12 (9): 1080–1090. Bibcode:2003ITIP ... 12.1080U. Дои:10.1109 / TIP.2003.812329. PMID 18237979. S2CID 2765169.
- ^ Салливан, Гэри (8–12 декабря 2003 г.). «Общие характеристики и конструктивные соображения для кодирования видео временного поддиапазона». ITU-T. Группа экспертов по кодированию видео. Получено 13 сентября 2019.
- ^ Бовик, Алан С. (2009). Основное руководство по обработке видео. Академическая пресса. п. 355. ISBN 9780080922508.
- ^ Шварц, Чарльз С. (2005). Понимание цифрового кино: профессиональное руководство. Тейлор и Фрэнсис. п. 147. ISBN 9780240806174.
- ^ Каннингем, Стюарт; МакГрегор, Иэн (2019). «Субъективная оценка музыки, сжатой с помощью кодека ACER, по сравнению с AAC, MP3 и несжатым PCM». Международный журнал цифрового мультимедийного вещания. 2019: 1–16. Дои:10.1155/2019/8265301.
- ^ Цифровой диктофон Olympus WS-120, согласно его руководству, может хранить около 178 часов аудио с качеством речи в формате .WMA на 500 МБ флэш-памяти.
- ^ Коулсон, Джош. «Сравнение FLAC». Получено 2020-08-23.
- ^ «Обзор формата». Получено 2020-08-23.
- ^ а б Джайсвал, Р. (2009). Аудио-видео техника. Пуна, Махараштра: Нирали Пракашан. п. 3.41. ISBN 9788190639675.
- ^ а б c Факсин Ю. Хао Ло; Жеминг Лу (2010). Анализ и обработка трехмерных моделей. Берлин: Springer. п.47. ISBN 9783642126512.
- ^ Патент США 2605361, К. Чапин Катлер, "Дифференциальное квантование сигналов связи", выпущенный 1952-07-29.
- ^ П. Каммиски, Никил С. Джаянт и Дж. Л. Фланаган, "Адаптивное квантование в дифференциальном кодировании речи с ИКМ", Bell Syst. Tech. Дж., т. 52, стр. 1105–1118, сентябрь 1973 г.
- ^ Cummiskey, P .; Джаянт, Никил С .; Фланаган, Дж. Л. (1973). «Адаптивное квантование при дифференциальном кодировании речи с ИКМ». Технический журнал Bell System. 52 (7): 1105–1118. Дои:10.1002 / j.1538-7305.1973.tb02007.x. ISSN 0005-8580.
- ^ а б c Шредер, Манфред Р. (2014). "Bell Laboratories". Акустика, информация и связь: Мемориальный том в честь Манфреда Р. Шредера. Springer. п. 388. ISBN 9783319056609.
- ^ Грей, Роберт М. (2010). «История цифровой речи в режиме реального времени в пакетных сетях: часть II линейного предсказательного кодирования и Интернет-протокола» (PDF). Найденный. Тенденции сигнального процесса. 3 (4): 203–303. Дои:10.1561/2000000036. ISSN 1932-8346.
- ^ а б Гукерт, Джон (весна 2012 г.). «Использование БПФ и МДКП в сжатии аудио MP3» (PDF). Университет Юты. Получено 14 июля 2019.
- ^ Дж. П. Принсен, А. В. Джонсон и А. Б. Брэдли: Кодирование поддиапазона / преобразования с использованием схем набора фильтров на основе отмены наложения спектров во временной области, IEEE Proc. Intl. Конференция по акустике, речи и обработке сигналов (ICASSP), 2161–2164, 1987.
- ^ Джон П. Принсен, Алан Б. Брэдли: Разработка банка фильтров анализа / синтеза на основе отмены наложения спектров во временной области, IEEE Trans. Акуст. Обработка речевого сигнала, АССП-34 (5), 1153–1161, 1986.
- ^ Ло, Фа-Лонг (2008). Стандарты мобильного мультимедийного вещания: технологии и практика. Springer Science & Business Media. п. 590. ISBN 9780387782638.
- ^ Британак, В. (2011). «О свойствах, взаимосвязях и упрощенной реализации банков фильтров в стандартах аудиокодирования Dolby Digital (Plus) AC-3». Транзакции IEEE по обработке звука, речи и языка. 19 (5): 1231–1241. Дои:10.1109 / TASL.2010.2087755. S2CID 897622.
- ^ Бранденбург, Карлхайнц (1999). «Объяснение MP3 и AAC» (PDF). В архиве (PDF) из оригинала от 13.02.2017.
- ^ «Краткое изложение некоторых вкладов Solidyne в развитие радиовещания». Краткая история Solidyne. Буэнос-Айрес: Солидайн. Архивировано из оригинал 8 марта 2013 г.. Получено 6 марта 2013.
- ^ Цвикер, Эберхард; и другие. (1967). Ухо как приемник связи. Мелвилл, штат Нью-Йорк: Акустическое общество Америки. Архивировано из оригинал 14 сентября 2000 г.. Получено 2011-11-11.
- ^ «Возможности сжатия файлов». Краткое руководство по сжатию файла 4 различными способами.
- ^ «Кодирование видео». Сайт CSIP. Центр обработки сигналов и информации Технологического института Джорджии. Архивировано из оригинал 23 мая 2013 г.. Получено 6 марта 2013.
- ^ Дмитрий Ватолин; и другие. (Видеогруппа Graphics & Media Lab) (март 2007 г.). Сравнение видеокодеков без потерь '2007 (PDF) (Отчет). Московский Государственный Университет.
- ^ Чен, Цзе; Коч, Ут-Ва; Лю, Кей Джей Рэй (2001). Проектирование систем кодирования цифрового видео: подход в полной сжатой области. CRC Press. п. 71. ISBN 9780203904183.
- ^ Ли, Цзянь Пин (2006). Материалы Международной компьютерной конференции 2006 г. по технологии вейвлет-активных сред и обработке информации: Чунцин, Китай, 29-31 августа 2006 г.. Всемирный научный. п. 847. ISBN 9789812709998.
- ^ Робинсон, А. Х .; Черри, К. (1967). «Результаты прототипа схемы сжатия полосы пропускания телевидения». Труды IEEE. IEEE. 55 (3): 356–364. Дои:10.1109 / PROC.1967.5493.
- ^ а б Ганбари, Мохаммед (2003). Стандартные кодеки: от сжатия изображений до расширенного кодирования видео. Институт инженерии и технологий. С. 1–2. ISBN 9780852967102.
- ^ Читатель, Клифф (2016-08-31). «Патентный ландшафт для бесплатного кодирования видео». В Tescher, Andrew G (ред.). Приложения цифровой обработки изображений XXXIX. 9971. Сан-Диего, Калифорния: Общество инженеров по фотооптическому приборостроению. стр. 99711B. Bibcode:2016SPIE.9971E..1BR. Дои:10.1117/12.2239493. Запись лекции, с 3:05:10.
- ^ а б c d http://www.real.com/resources/digital-video-file-formats/
- ^ «Заявление о патенте, зарегистрированное как H261-07». ITU. Получено 11 июля 2019.
- ^ «Патентный список MPEG-2» (PDF). MPEG LA. Получено 7 июля 2019.
- ^ "MPEG-4 Visual - Патентный список" (PDF). MPEG LA. Получено 6 июля 2019.
- ^ «AVC / H.264 - Патентный список» (PDF). MPEG LA. Получено 6 июля 2019.
- ^ Чанда П., Бадер Дж. С., Эльхайк Э. (27 июля 2012 г.). «HapZipper: делиться популяциями HapMap стало еще проще» (PDF). Исследования нуклеиновых кислот. 40 (20): e159. Дои:10.1093 / нар / гкс709. ЧВК 3488212. PMID 22844100.
- ^ Кристли С., Лу И, Ли Ц, Се Х (15 января 2009 г.). «Геномы человека как вложения электронной почты». Биоинформатика. 25 (2): 274–5. Дои:10.1093 / биоинформатика / btn582. PMID 18996942.
- ^ Павличин Д.С., Вайсман Т., Йона Г. (сентябрь 2013 г.). «Геном человека снова сжимается». Биоинформатика. 29 (17): 2199–202. Дои:10.1093 / биоинформатика / btt362. PMID 23793748.
- ^ М. Хоссейни, Д. Пратас и А. Пиньо. 2016. Обзор методов сжатия данных для биологических последовательностей. Информация 7(4):(2016): 56
- ^ «Сжатие данных с помощью логического синтеза» (PDF).
- ^ Гильберт, Мартин; Лопес, Присцила (1 апреля 2011 г.). «Мировой технологический потенциал для хранения, передачи и вычисления информации». Наука. 332 (6025): 60–65. Bibcode:2011Наука ... 332 ... 60H. Дои:10.1126 / science.1200970. PMID 21310967. S2CID 206531385.
внешняя ссылка
- Основы сжатия данных (видео)
- Сжатие видео 4: 2: 2 10 бит и его преимущества
- Почему 10-битная пропускная способность экономится (даже если контент 8-битный)?
- Какую технологию сжатия следует использовать
- Wiley - Введение в теорию сжатия
- Субъективные тесты прослушивания EBU на аудиокодеках с низким битрейтом
- Руководство по архивированию аудио: музыкальные форматы (Руководство, помогающее пользователю выбрать правильный кодек)
- Введение в сжатие видео MPEG 1 и 2 (формат pdf) на Wayback Machine (архивировано 28 сентября 2007 г.)
- Hydrogenaudio wiki сравнение
- Введение в сжатие данных Гая Э Блеллоха из CMU
- HD Greetings - исходный материал без сжатия 1080p для тестирования и исследования сжатия
- Объяснение метода сжатия сигнала без потерь, используемого большинством кодеков
- Интерактивные слепые тесты аудиокодеков через Интернет
- TestVid - 2000+ видеоклипов в формате HD и других несжатых исходных видео для тестирования сжатия
- Videsignline - Введение в сжатие видео
- Технология уменьшения объема данных
- Что такое кодирование длины прогона при сжатии видео.