MPEG-4, часть 3 - MPEG-4 Part 3
MPEG-4, часть 3 или же MPEG-4 аудио (формально ISO /IEC 14496-3) - третья часть ISO /IEC MPEG-4 международный стандарт, разработанный Группа экспертов по киноискусству.[1] Он указывает кодирование звука методы. Первая версия ISO / IEC 14496-3 была опубликована в 1999 году.[2]
MPEG-4 Part 3 состоит из множества технологий кодирования звука - от с потерями кодирование речи (HVXC, CELP ), общее кодирование звука (AAC, TwinVQ, BSAC), без потерь сжатие звука (MPEG-4 SLS, Кодирование звука без потерь, MPEG-4 DST ), а Текст в речь Интерфейс (TTSI), Структурированное аудио (с помощью SAOL, SASL, MIDI ) и многие дополнительные методы синтеза и кодирования звука.[3][4][5][6][7][8][9][10][11]
MPEG-4 Audio не предназначен для одного приложения, такого как телефония в реальном времени или высококачественное сжатие звука. Это применимо ко всем приложениям, которые требуют использования усовершенствованного сжатия, синтеза, обработки или воспроизведения звука. MPEG-4 Audio - это новый тип аудиостандарт, который объединяет множество различных типов кодирования звука: естественный звук и синтетический звук, доставку с низким битрейтом. и качественная доставка, речь и музыка, сложные и простые саундтреки, традиционный контент и интерактивный контент.[7]
Версии
Версия | Дата выхода | Последняя поправка | Стандарт | Описание |
---|---|---|---|---|
Первое издание | 1999 | 2001 | ИСО / МЭК 14496-3: 1999[2] | также известен как "MPEG-4 Audio Version 1" |
2000 | ISO / IEC 14496-3: 1999 / Amd 1: 2000[13] | также известный как «MPEG-4 Audio Version 2», поправка к первому изданию[7][8] | ||
Второе издание | 2001 | 2005 | ИСО / МЭК 14496-3: 2001[14] | |
Третье издание | 2005 | 2008 | ИСО / МЭК 14496-3: 2005[15] | |
Четвертый выпуск | 2009 | 2015 г. и в стадии разработки[12] | ИСО / МЭК 14496-3: 2009[1][16] | |
Пятое издание | 2019 | ИСО / МЭК 14496-3: 2019[17] | Текущая версия |
Подчасти
MPEG-4 Part 3 содержит следующие части:[16]
- Подчасть 1: Основная (список типов аудиообъектов, профилей, уровней, интерфейс с ISO / IEC 14496-1, транспортный поток аудио MPEG-4 и т. Д.)
- Подчасть 2: Кодирование речи - HVXC (Кодирование возбуждения гармоническим вектором)
- Подчасть 3: Кодирование речи - CELP (Линейное предсказание с кодовым возбуждением)
- Подчасть 4: Общее аудиокодирование (GA) (временное / частотное кодирование) - AAC, TwinVQ, BSAC
- Подчасть 5: Структурированное аудио (SA)
- Подчасть 6: Текст в речь Интерфейс (TTSI)
- Подчасть 7: Параметрическое кодирование звука - HILN (Гармонические и индивидуальные линии плюс шум)
- Подчасть 8: Техническое описание параметрического кодирования высококачественного звука (SSC, Параметрическое стерео )
- Подчасть 9: MPEG-1 /MPEG-2 Аудио в MPEG-4
- Подчасть 10: Техническое описание кодирования без потерь сверхдискретизированного звука (MPEG-4 DST - Прямая передача потока )
- Подчасть 11: Кодирование звука без потерь (ALS)
- Подраздел 12: Масштабируемое кодирование без потерь (SLS)
Типы аудиообъектов MPEG-4
MPEG-4 Audio включает в себя систему для единообразной обработки разнообразной группы аудиоформатов. Каждому формату назначается уникальный тип аудиообъекта для его представления.[18][19] Тип объекта используется для различения различных методов кодирования. Он напрямую определяет подмножество инструментов MPEG-4, необходимых для декодирования конкретного объекта. Профили MPEG-4 основаны на типах объектов, и каждый профиль поддерживает разные списки типов объектов.[19]
ID типа объекта | Тип аудиообъекта | Дата первого публичного выпуска | Описание |
---|---|---|---|
1 | AAC Main | 1999 | содержит AAC LC |
2 | AAC LC (Низкая сложность) | 1999 | Используется в «Профиле AAC». Тип аудиообъекта MPEG-4 AAC LC основан на профиле низкой сложности (LC) MPEG-2 Part 7 в сочетании с восприятием замещения шума (PNS) (определенным в MPEG-4 Part 3 Subpart 4).[4][22] |
3 | AAC SSR (масштабируемая частота дискретизации) | 1999 | Тип аудиообъекта MPEG-4 AAC SSR основан на профиле масштабируемой частоты дискретизации (SSR) MPEG-2, часть 7, в сочетании с восприятием замещения шума (PNS) (определенным в MPEG-4 Part 3 Subpart 4).[4][22] |
4 | AAC LTP (Долгосрочное предсказание ) | 1999 | содержит AAC LC |
5 | SBR (Репликация спектрального диапазона ) | 2003[23] | используется с AAC LC в «Профиле AAC высокой эффективности» (HE-AAC v1) |
6 | Масштабируемый AAC | 1999 | |
7 | TwinVQ | 1999 | кодирование звука с очень низким битрейтом |
8 | CELP (Линейное предсказание с кодовым возбуждением ) | 1999 | кодирование речи |
9 | HVXC (Кодирование возбуждения гармоническим вектором) | 1999 | кодирование речи |
10 | (Зарезервированный) | ||
11 | (Зарезервированный) | ||
12 | TTSI (Текст в речь Интерфейс) | 1999 | |
13 | Основной синтез | 1999 | содержит 'таблица волн ' синтез на основе образцов[24] и алгоритмический синтез и звуковые эффекты |
14 | 'таблица волн ' синтез на основе образцов | 1999 | на основе SoundFont и Загружаемые звуки,[24] содержит General MIDI |
15 | General MIDI | 1999 | |
16 | Алгоритмический синтез и звуковые эффекты | 1999 | |
17 | ER AAC LC | 2000 | Устойчивый к ошибкам |
18 | (Зарезервированный ) | ||
19 | ER AAC LTP | 2000 | Устойчивый к ошибкам |
20 | ER AAC Масштабируемый | 2000 | Устойчивый к ошибкам |
21 | ER TwinVQ | 2000 | Устойчивый к ошибкам |
22 | ER BSAC (битовое арифметическое кодирование) | 2000 | Он также известен как «Fine Granule Audio» или инструмент тонкой масштабируемости. Он используется в сочетании с инструментами кодирования AAC и заменяет бесшумное кодирование и форматирование потока битов кодера MPEG-4 версии 1 GA. Устойчивый к ошибкам |
23 | ER AAC LD (Низкая задержка) | 2000 | Устойчивость к ошибкам, используется с CELP, ER CELP, HVXC, ER HVXC и TTSI в «Профиле низкой задержки» (обычно используется для приложений разговора в реальном времени) |
24 | ER CELP | 2000 | Устойчивый к ошибкам |
25 | ER HVXC | 2000 | Устойчивый к ошибкам |
26 | ER HILN (Гармонические и отдельные линии плюс шум) | 2000 | Устойчивый к ошибкам |
27 | ER Параметрический | 2000 | Устойчивый к ошибкам |
28 | SSC (синусоидальное кодирование) | 2004[25][26] | |
29 | PS (Параметрическое стерео ) | 2004[27] и 2006 г.[28][29] | используется с AAC LC и SBR в «Профиле HE-AAC v2». Инструмент кодирования PS был определен в 2004 году, а тип объекта - в 2006 году. |
30 | MPEG Surround | 2007[30] | также известный как MPEG Spatial Audio Coding (SAC), это тип пространственного кодирования звука.[31][32] (MPEG Surround также был определен в ISO / IEC 23003-1 в 2007 г.[33]) |
31 | (Зарезервированный) | ||
32 | MPEG-1/2 Уровень-1 | 2005[34] | |
33 | MPEG-1/2 Layer-2 | 2005[34] | |
34 | MPEG-1/2 Уровень-3 | 2005[34] | также известен как "MP3onMP4" |
35 | Летнее время (Прямая передача потока ) | 2005[35] | кодирование звука без потерь, используемое на Super Audio CD |
36 | ALS (Кодирование звука без потерь ) | 2006[29] | кодирование звука без потерь |
37 | SLS (Масштабируемое кодирование без потерь ) | 2006[36] | двухуровневое кодирование звука со слоем без потерь и ядром / слоем General Audio с потерями (например, AAC) |
38 | SLS непрофильный | 2006 | кодирование звука без потерь без потерь ядра / уровня General Audio (например, AAC) |
39 | ER AAC ELD (улучшенная низкая задержка) | 2008[37] | Устойчивый к ошибкам |
40 | SMR (символическое музыкальное представление) Простой | 2008 | примечание: символическое музыкальное представление также является MPEG-4 Стандарт, часть 23 (ISO / IEC 14496-23: 2008)[38][39] |
41 | SMR Main | 2008 | |
42 | USAC (Единое кодирование речи и звука ) | 2012 | Унифицированное кодирование речи и звука определяется в MPEG-D Часть 3 (ISO / IEC 23003-3: 2012)[40] |
43 | SAOC (кодирование пространственных звуковых объектов) | 2010[41][42] | примечание: пространственное кодирование аудиообъектов также является MPEG-D Часть 2 стандарта (ISO / IEC 23003-2: 2010)[43] |
44 | LD MPEG Surround | 2010[44] | Этот тип объекта передает дополнительную информацию MPEG Surround Coding с низкой задержкой (которая была определена в MPEG-D Часть 2 - ISO / IEC 23003-2[43] ) в структуре MPEG-4 Audio. |
45 | SAOC-DE | 2013 | Улучшение диалога кодирования пространственных звуковых объектов |
46 | Аудио синхронизация | 2015 | Инструмент синхронизации звука обеспечивает возможность синхронизации нескольких материалов на нескольких устройствах. |
Аудио профили
Стандарт MPEG-4 Audio определяет несколько профилей. Эти профили основаны на типах объектов, и каждый профиль поддерживает свой список типов объектов. Каждый профиль может также иметь несколько уровней, которые ограничивают некоторые параметры инструментов, присутствующих в профиле. Эти параметры обычно представляют собой частоту дискретизации и количество аудиоканалов, декодируемых одновременно.
Аудио профиль | Типы аудиообъектов | Дата первого публичного выпуска |
---|---|---|
Профиль AAC | AAC LC | 2003 |
Профиль AAC с высокой эффективностью | AAC LC, SBR | 2003 |
Профиль HE-AAC v2 | AAC LC, SBR, PS | 2006 |
Основной аудио профиль | AAC Main, AAC LC, AAC SSR, AAC LTP, AAC Scalable, TwinVQ, CELP, HVXC, TTSI, основной синтез | 1999 |
Масштабируемый аудио профиль | AAC LC, AAC LTP, AAC Scalable, TwinVQ, CELP, HVXC, TTSI | 1999 |
Речь Аудио Профиль | CELP, HVXC, TTSI | 1999 |
Синтетический аудио профиль | TTSI, Основной синтез | 1999 |
Профиль аудио высокого качества | AAC LC, AAC LTP, AAC Scalable, CELP, ER AAC LC, ER AAC LTP, ER AAC Scalable, ER CELP | 2000 |
Аудио профиль с низкой задержкой | CELP, HVXC, TTSI, ER AAC LD, ER CELP, ER HVXC | 2000 |
Профиль Natural Audio | AAC Main, AAC LC, AAC SSR, AAC LTP, AAC Scalable, TwinVQ, CELP, HVXC, TTSI, ER AAC LC, ER AAC LTP, ER AAC Scalable, ER TwinVQ, ER BSAC, ER AAC LD, ER CELP, ER HVXC , ER HILN, ER Parametric | 2000 |
Профиль межсетевого взаимодействия мобильного аудио | ER AAC LC, ER AAC Scalable, ER TwinVQ, ER BSAC, ER AAC LD | 2000 |
Профиль HD-AAC | AAC LC, SLS[45] | 2009[46] |
Простой профиль ALS | ALS | 2010[42][47] |
Хранение и транспортировка аудио
Стандарт | Описание | |
---|---|---|
Мультиплекс | ИСО / МЭК 14496-1 | Схема мультиплексирования MPEG-4 (M4Mux)[48] |
Мультиплекс | ИСО / МЭК 14496-3 | Транспортный мультиплексор с малыми накладными расходами (LATM) |
Место хранения | ISO / IEC 14496-3 (информативный) | Формат обмена аудиоданными (ADIF) - только для AAC |
Место хранения | ИСО / МЭК 14496-12 | Формат файла MPEG-4 (MP4 ) / Базовый формат медиафайлов ISO |
Передача инфекции | ISO / IEC 14496-3 (информативный) | Audio Data Transport Stream (ADTS) - только для AAC |
Передача инфекции | ИСО / МЭК 14496-3 | Аудиопоток с низким уровнем служебных данных (LOAS), основанный на LATM |
Нет стандарта на транспортировку элементарные потоки по каналу, потому что широкий спектр приложений MPEG-4 предъявляет слишком широкие требования к доставке, чтобы их можно было легко описать с помощью одного решения.
Возможности транспортного уровня и связь между функциями транспорта, мультиплексирования и демультиплексирования описаны в Платформа интеграции мультимедиа доставки (DMIF) в ИСО / МЭК 14496-6.[16] Под этим интерфейсом существует множество разнообразных механизмов доставки, например, Транспортный поток MPEG, Транспортный протокол в реальном времени (RTP) и т. Д.
Транспорт в транспортном протоколе в реальном времени определяется в RFC 3016 (Формат полезной нагрузки RTP для аудио / визуальных потоков MPEG-4), RFC 3640 (Формат полезной нагрузки RTP для транспортировки элементарных потоков MPEG-4), RFC 4281 (Параметр кодеков для типов носителей "Bucket") и RFC 4337 (Регистрация типа MIME для MPEG-4).
LATM и LOAS были определены для приложений естественного звука, которые не требуют сложного объектно-ориентированного кодирования или других функций, предоставляемых системами MPEG-4.
Бифуркация в техническом стандарте AAC
В Расширенное кодирование звука в MPEG-4 Part 3 (MPEG-4 Audio) Subpart 4 был улучшен по сравнению с предыдущим стандартом MPEG-2 Часть 7 (Advanced Audio Coding), чтобы обеспечить лучшее качество звука для заданного битрейта кодирования.
Предполагается, что любые различия в Части 3 и Части 7 будут устранены органом по стандартизации ISO в ближайшем будущем, чтобы избежать возможности несовместимости потоков битов в будущем. В настоящее время нет известных несовместимостей проигрывателей или кодеков из-за новизны стандарта.
Стандарт MPEG-2 Part 7 (Advanced Audio Coding) был впервые опубликован в 1997 году и предлагает три профиля по умолчанию:[49][50] Профиль низкой сложности (LC), основной профиль и профиль масштабируемой частоты дискретизации (SSR).
MPEG-4 Part 3 Subpart 4 (General Audio Coding) объединил профили из MPEG-2 Part 7 с Perceptual Noise Substitution (PNS) и определил их как типы аудиообъектов (AAC LC, AAC Main, AAC SSR).[4]
HE-AAC
Высокоэффективное кодирование звука Advanced Audio является продолжением AAC LC с помощью репликация спектральной полосы (SBR), и Параметрическое стерео (PS). Он разработан для повышения эффективности кодирования при низкой скорости передачи данных за счет частичного параметрического представления звука.
AAC-SSR
Масштабируемая частота дискретизации AAC был представлен Sony в стандартах MPEG-2 Part 7 и MPEG-4 Part 3.[нужна цитата ] Впервые он был опубликован в ISO / IEC 13818-7, Часть 7: Advanced Audio Coding (AAC) в 1997 году.[49][50] Аудиосигнал сначала разделяется на 4 полосы, используя 4 полосы. многофазный квадратурный фильтр банк. Затем эти 4 полосы разделяются с помощью MDCT с размером k из 32 или 256 образцов. Это похоже на обычный AAC LC, который использует MDCT с размером k 128 или 1024 непосредственно на аудиосигнале.
Преимущество этого метода в том, что переключение коротких блоков может выполняться отдельно для каждого PQF группа. Таким образом, высокие частоты можно кодировать с использованием короткого блока для улучшения временного разрешения, а низкие частоты по-прежнему могут кодироваться с высоким спектральным разрешением. Однако из-за наложения спектров между 4 полосами PQF эффективность кодирования около (1,2,3) * fs / 8 хуже, чем у обычного MPEG-4 AAC LC.[нужна цитата ]
MPEG-4 AAC-SSR очень похож на ATRAC и ATRAC-3.
Почему был представлен AAC-SSR
Идея AAC-SSR заключалась не только в перечисленных выше преимуществах, но и в возможности снижения скорости передачи данных путем удаления 1, 2 или 3 верхних полос PQF. Очень простой разделитель битового потока может удалить эти полосы и таким образом снизить битрейт и частоту дискретизации.
Пример:
- 4 поддиапазона: битрейт = 128 кбит / с, частота дискретизации = 48 кГц, f_lowpass = 20 кГц
- 3 поддиапазона: битрейт ~ 120 кбит / с, частота дискретизации = 48 кГц, f_lowpass = 18 кГц
- 2 поддиапазона: битрейт ~ 100 кбит / с, частота дискретизации = 24 кГц, f_lowpass = 12 кГц
- 1 поддиапазон: битрейт ~ 65 кбит / с, частота дискретизации = 12 кГц, f_lowpass = 6 кГц
Примечание: хотя это возможно, качество результата намного хуже, чем типичное для этого битрейта. Таким образом, для обычного AAC LC 64 кбит / с полоса пропускания 14–16 кГц достигается за счет использования стерео интенсивности и сокращенных ЯМР. Это ухудшает качество звука меньше, чем передача с полосой пропускания 6 кГц с идеальным качеством.
BSAC
Битовое арифметическое кодирование - это стандарт MPEG-4 (ISO / IEC 14496-3, подраздел 4) для масштабируемого кодирования звука. BSAC использует альтернативное бесшумное кодирование для AAC, а остальная часть обработки идентична AAC. Эта поддержка масштабируемости обеспечивает почти прозрачное качество звука на скорости 64 кбит / с и изящная деградация при более низких скоростях передачи данных. Кодирование BSAC лучше всего выполнять в диапазоне от 40 кбит / с до 64 кбит / с, хотя оно работает в диапазоне от 16 кбит / с до 64 кбит / с. Кодек AAC-BSAC используется в Цифровое мультимедийное вещание (DMB) Приложения.
Лицензирование
В 2002 году Комитет по лицензированию аудио MPEG-4 выбрал Via Licensing Corporation в качестве администратора лицензирования для MPEG-4 Audio. патентный пул.[3][51][52]
Смотрите также
- TwinVQ - один из типов объектов, определенных в MPEG-4 Audio версии 1
- MPEG-4, часть 2
- MPEG-4, часть 14 формат контейнера (MP4)
- Управление цифровыми правами
- Расширенное кодирование звука (AAC)
- ISO / IEC JTC 1 / SC 29
Рекомендации
- ^ а б ISO (2009). «ISO / IEC 14496-3: 2009 - Информационные технологии - Кодирование аудиовизуальных объектов - Часть 3: Аудио». ISO. Получено 2009-10-06.
- ^ а б ISO (1999). «ISO / IEC 14496-3: 1999 - Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3: Аудио». ISO. Получено 2009-10-06.
- ^ а б Business Wire (2002-12-02). «Комитет по лицензированию аудио в формате MPEG-4 выбирает через Licensing Corporation в качестве администратора; Комитет по лицензированию аудио в формате MPEG-4 завершает согласование условий лицензирования профиля аудио». Бесплатная библиотека. Получено 2009-10-06.
- ^ а б c d Карлхайнц Бранденбург; Оливер Кунц; Акихико Сугияма (1999). «Кодирование естественного звука MPEG-4 - профили и уровни звука». chiariglione.org. Архивировано из оригинал на 2010-07-17. Получено 2009-10-06.
- ^ Карлхайнц Бранденбург; Оливер Кунц; Акихико Сугияма. «Кодирование естественного звука MPEG-4 - масштабируемость в естественном звуке MPEG-4». chiariglione.org. Архивировано из оригинал 28.02.2010. Получено 2009-10-06.
- ^ Д. Том, Х. Пурнхаген и подгруппа MPEG Audio (октябрь 1998 г.). «Часто задаваемые вопросы по MPEG Audio - MPEG-4». chiariglione.org. Получено 2009-10-06.CS1 maint: несколько имен: список авторов (связь)
- ^ а б c d ISO /IEC JTC 1 / SC 29 / WG 11 (июль 1999 г.), ISO / IEC 14496-3: /Amd.1 - Проект окончательного комитета - MPEG-4 Audio Version 2 (PDF), заархивировано из оригинал (PDF) на 2012-08-01, получено 2009-10-07
- ^ а б Хайко Пурнхаген (1999-06-07), Обзор MPEG-4 Audio Version 2 (PDF), Хайко Пурнхаген, получено 2009-10-07[постоянная мертвая ссылка ]
- ^ а б Хайко Пурнхаген (01.06.2001). «Аудиостандарт MPEG-4: обзор и приложения». Хайко Пурнхаген. Получено 2009-10-07.[мертвая ссылка ]
- ^ Хайко Пурнхаген (07.11.2001). «Веб-страница MPEG Audio - MPEG-4 Audio (ISO / IEC 14496-3)». Получено 2009-10-07.[мертвая ссылка ]
- ^ Роб Коенен, ISO / IEC JTC1 / SC29 / WG11 (март 2002 г.). «Обзор стандарта MPEG-4». chiariglione.org. Получено 2009-10-06.
- ^ а б MPEG. «Стандарты MPEG - Полный список стандартов, разработанных или разрабатываемых». chiariglione.org. Архивировано из оригинал 20 апреля 2010 г.. Получено 2009-10-31.
- ^ ISO (2000). «ISO / IEC 14496-3: 1999 / Amd 1: 2000 - Расширения аудио». ISO. Получено 2009-10-07.
- ^ ISO (2001). «ISO / IEC 14496-3: 2001 - Информационные технологии - Кодирование аудиовизуальных объектов - Часть 3: Аудио». ISO. Получено 2009-10-14.
- ^ ISO (2005). «ISO / IEC 14496-3: 2005 - Информационные технологии - Кодирование аудиовизуальных объектов - Часть 3: Аудио». ISO. Получено 2009-10-14.
- ^ а б c d ISO /IEC (2009-09-01), ISO / IEC 14496-3: 2009 - Информационные технологии - Кодирование аудиовизуальных объектов - Часть 3: Аудио (PDF), МЭК, получено 2009-10-07
- ^ ISO /IEC (2019-12-01), ISO / IEC 14496-3: 2019 - Информационные технологии - Кодирование аудиовизуальных объектов - Часть 3: Аудио, МЭК, получено 2020-06-02
- ^ а б MultimediaWiki (2009). "MPEG-4 Audio". Мультимедиа Вики. Получено 2009-10-09.
- ^ а б c Бернхард Гриль; Стефан Гейерсбергер; Йоханнес Хильперт; Бодо Тайхманн (июль 2004 г.), Реализация аудиокомпонентов MPEG-4 на различных платформах (PDF), Fraunhofer Gesellschaft, архивировано из оригинал (PDF) на 2007-06-10, получено 2009-10-09
- ^ ISO / IEC JTC1 / SC29 / WG11 N2203 (март 1998 г.). «MPEG-4 Audio (проект заключительного комитета 14496-3)». Хайко Пурнхаген. Получено 2009-10-07.[мертвая ссылка ]
- ^ а б c ISO / IEC JTC1 / SC29 / WG11 / N7016 (2005-01-11), Текст ISO / IEC 14496-3: 2001 / FPDAM 4, Кодирование без потерь звука (ALS), новые профили звука и расширения BSAC, заархивировано из оригинал (DOC) на 2014-05-12, получено 2009-10-09
- ^ а б Карлхайнц Бранденбург; Оливер Кунц; Акихико Сугияма (1999). «Кодирование естественного звука MPEG-4 - общее кодирование звука (на основе AAC)». chiariglione.org. Архивировано из оригинал на 2010-02-19. Получено 2009-10-06.
- ^ ISO (2003). «Расширение полосы пропускания, ISO / IEC 14496-3: 2001 / Amd 1: 2003». ISO. Получено 2009-10-13.
- ^ а б Scheirer, Eric D .; Рэй, Ли (1998). «Алгоритмический синтез и синтез волновых таблиц в стандарте мультимедиа MPEG-4». Конвенция Общества звукорежиссеров 105, 1998. CiteSeerX 10.1.1.35.2773.
2.2 Синтез волновой таблицы с помощью SASBF: Формат банка волновых таблиц SASBF имел довольно сложную историю развития. Первоначальная спецификация была предоставлена E-Mu Systems и основана на их формате «SoundFont» [15]. После завершения интеграции этого компонента в эталонное программное обеспечение MPEG-4 Ассоциация производителей MIDI (MMA) обратилась к MPEG с просьбой, чтобы MPEG-4 SASBF был совместим с их форматом «Загруженные звуки» [13]. Е-Му согласился, что такая совместимость желательна, и поэтому все стороны согласовали и разработали новый формат.
- ^ ISO (2004). «Параметрическое кодирование для высококачественного звука, ISO / IEC 14496-3: 2001 / Amd 2: 2004». ISO. Получено 2009-10-13.
- ^ ISO / IEC JTC1 / SC29 / WG11 (25.07.2003). «Текст ISO / IEC 14496-3: 2001 / FPDAM2 (Parametric Audio) - N5713». Архивировано из оригинал (DOC) на 2014-05-12. Получено 2009-10-13.
- ^ 3GPP (30 сентября 2004 г.). "3GPP TS 26.401 V6.0.0 (2004-09), Функции обработки звука общего аудиокодека; Улучшенный аудиокодек общего назначения aacPlusОбщий Описание (Выпуск 6) » (DOC). 3GPP. Получено 2009-10-13.
- ^ 3GPP (4 января 2005 г.). "ETSI TS 126 401 V6.1.0 (2004-12) - Универсальная система мобильной связи (UMTS)Общий аудиокодек функции обработки звука; Улучшенный общий аудиокодек aacPlusОбщий описание (3GPP TS 26.401 версия 6.1.0 Выпуск 6) ". 3GPP. Получено 2009-10-13.
- ^ а б ISO (2006). «Кодирование без потерь звука (ALS), новые профили звука и расширения BSAC, ISO / IEC 14496-3: 2005 / Amd 2: 2006». ISO. Получено 2009-10-13.
- ^ ISO (2007). «Расширения BSAC и транспортировка MPEG Surround, ISO / IEC 14496-3: 2005 / Amd 5: 2007». ISO. Получено 2009-10-13.
- ^ ISO / IEC JTC1 / SC29 / WG11 (июль 2005 г.). «Учебное пособие по кодированию звука в формате MPEG Surround». Архивировано из оригинал на 2010-04-30. Получено 2010-02-09.
- ^ ISO / IEC JTC1 / SC29 / WG11 (июль 2005 г.). «Учебное пособие по кодированию звука в формате MPEG Surround». Архивировано из оригинал на 2008-03-24. Получено 2010-02-09.
- ^ ИСО (29 января 2007 г.). «ISO / IEC 23003-1: 2007 - Информационные технологии - Аудиотехнологии MPEG - Часть 1: MPEG Surround». ISO. Получено 2009-10-24.
- ^ а б c ISO (2005). «Аудио MPEG-1/2 в MPEG-4, ISO / IEC 14496-3: 2001 / Amd 3: 2005». ISO. Получено 2009-10-13.
- ^ ISO (2005). «Кодирование передискретизированного звука без потерь, ISO / IEC 14496-3: 2001 / Amd 6: 2005». ISO. Получено 2009-10-13.
- ^ ISO (2006). «Масштабируемое кодирование без потерь (SLS), ISO / IEC 14496-3: 2005 / Amd 3: 2006». ISO. Получено 2009-10-13.
- ^ ISO (2008). «Улучшенный AAC с низкой задержкой, ISO / IEC 14496-3: 2005 / Amd 9: 2008». ISO. Получено 2009-10-13.
- ^ ISO (2008). «ISO / IEC 14496-23: 2008, Информационные технологии - Кодирование аудиовизуальных объектов - Часть 23: Символическое музыкальное представление». ISO. Получено 2009-10-13.
- ^ ISO (2008). «Соответствие символического представления музыки, ISO / IEC 14496-4: 2004 / Amd 29: 2008». ISO. Получено 2009-10-13.
- ^ ISO (2012). «ISO / IEC 23003-3: 2012 - Информационные технологии - Аудиотехнологии MPEG - Часть 3: Унифицированное кодирование речи и звука». ISO. Получено 2019-11-07.
- ^ ISO (2009). «ISO / IEC 14496-3: 2009 / Amd 2: 2010, простой профиль ALS и транспортировка SAOC». ISO. Получено 2009-10-13.
- ^ а б ISO / IEC JTC1 / SC29 / WG11 (2009-07-03), ISO / IEC 14496-3: 200X / PDAM 2 - Простой профиль ALS и транспортировка SAOC, N10826, заархивировано из оригинал (DOC) в 2014-07-29, получено 2009-10-13
- ^ а б ISO (2010). «ISO / IEC 23003-2: 2010 - Информационные технологии - Аудиотехнологии MPEG - Часть 2: Кодирование пространственных звуковых объектов (SAOC)». ISO. Получено 2010-12-27.
- ^ Документ Конвенции AES 8099 - Новое параметрическое стерео и многоканальное расширение для MPEG-4 Enhanced Low Delay AAC (AAC-ELD) (PDF), получено 2019-11-07
- ^ ISO / IEC JTC1 / SC29 / WG11 (2008-10-17), ISO / IEC 14496-3: 2005 / PDAM 10: 200X профиль HD-AAC, MPEG2008 / N10188, заархивировано из оригинал (DOC) на 2014-05-12, получено 2009-10-19
- ^ ISO (2009-09-11). «ISO / IEC 14496-3: 2009 / Amd 1: 2009 - Профиль HD-AAC и сигнализация MPEG Surround». ISO. Получено 2009-10-15.
- ^ ISO (2008-10-08). «ISO / IEC 14496-3: 2009 / Amd 2: 2010 - Простой профиль ALS и транспортировка SAOC». ISO. Получено 2009-10-15.
- ^ ISO (2004-11-15), ISO / IEC 14496-1, Третье издание 2004-11-15, Часть 1: Системы (PDF), ISO, заархивировано из оригинал (PDF) 14 июня 2011 г., получено 2009-10-14
- ^ а б ISO (2004-10-15), ISO / IEC 13818-7, Третье издание, Часть 7 - Расширенное кодирование звука (AAC) (PDF), п. 32, заархивировано из оригинал (PDF) на 2011-07-13, получено 2009-10-19
- ^ а б ISO (1997). «ISO / IEC 13818-7: 1997, Информационные технологии. Общее кодирование движущихся изображений и связанной с ними звуковой информации. Часть 7: Расширенное кодирование звука (AAC)». Получено 2009-10-19.
- ^ Business Wire (05.01.2009). «Via Licensing объявляет о лицензии на патентный пул MPEG-4 SLS». Рейтер. Архивировано из оригинал на 2013-01-04. Получено 2009-10-09.
- ^ Via Licensing Corporation (12 мая 2009 г.). «Via Licensing объявляет о доступности совместной программы патентного лицензирования MPEG-4 SLS». Деловой провод. Получено 2009-10-09.
внешняя ссылка
- Apple: MPEG-4: AAC
- «AAC» (VideoLAN WIKI)
- Субъективные тесты прослушивания EBU на аудиокодеках с низким битрейтом
- Радиостанции AAC - Интернет-радиостанции в формате AAC
- Тюнер2 - Каталог радиостанций в формате AAC + с разным битрейтом
- RadioFeeds Великобритания и Ирландия - Страница, содержащая множество наземных станций интернет-вещания в формате AAC +.
- [1] Страница сравнения кодеков, включая HE-AAC @ 64 кбит / с, с помощью тестов прослушивания. (Страница не в сети)
- Официальный веб-сайт MPEG
- RFC 3016 - Формат полезной нагрузки RTP для аудио / видео потоков MPEG-4
- RFC 3640 - Формат полезной нагрузки RTP для транспортировки элементарных потоков MPEG-4
- RFC 4281 - Параметр кодеков для типов носителей "Bucket"
- RFC 4337 - Регистрация типа MIME для MPEG-4