Высокоэффективное кодирование звука Advanced Audio - High-Efficiency Advanced Audio Coding

Высокоэффективное кодирование звука Advanced Audio
Расширения имени файлаКонтейнер MPEG / 3GPP

Яблочный контейнер

  • .m4a, .m4b, .m4p, .m4r, .m4v

Поток ADTS - НЕ сырой - содержит заголовки

  • .aac
Тип интернет-СМИаудио / aac
аудио / aacp
аудио / 3gpp
аудио / 3gpp2
аудио / mp4
РазработанISO
Тип форматаФормат сжатия аудио
СодержитсяMPEG-4, часть 14, 3GP и 3G2, Базовый формат медиафайлов ISO, Формат обмена аудиоданными (ADIF), Транспортный поток аудиоданных (ADTS)
Расширен сAAC
СтандартИСО / МЭК 14496-3
Иерархическая структура профиля AAC, профиля AAC-HE и профиля AAC-HE v2 и совместимость между ними. Декодер профиля AAC-HE полностью способен декодировать любой поток профиля AAC. Точно так же декодер AAC-HE v2 может обрабатывать все потоки профиля AAC-HE, а также все потоки профиля AAC. На основе технической спецификации MPEG-4, часть 3.[1]
Эволюция профиля MPEG-2 AAC-LC (низкая сложность) и MPEG-4 AAC-LC Тип объекта в профиль AAC-HE v2.[2]

Высокоэффективное кодирование звука Advanced Audio (AAC-HE) является формат кодирования звука за сжатие данных с потерями из цифровой звук определяется как MPEG-4 аудио профиль в ISO /IEC 14496-3. Это расширение низкой сложности AAC (AAC-LC) оптимизирован длябитрейт такие приложения, как потоковое аудио. Профиль использования AAC-HE v1 использует репликация спектральной полосы (SBR) для повышения модифицированное дискретное косинусное преобразование (MDCT) эффективность сжатия в частотная область.[3] Профиль использования AAC-HE v2 связывает SBR с Параметрическое стерео (PS) для дальнейшего повышения эффективности сжатия стереосигналов.

AAC-HE используется в цифровое радио стандарты как HD Радио,[4] DAB + и Цифровое радио Mondiale.

История

Прародитель AAC-HE был разработан Технологии кодирования путем объединения MPEG-2 AAC-LC с запатентованным механизмом для репликация спектральной полосы (SBR), который будет использоваться XM Радио для их службы спутникового радио. Впоследствии Coding Technologies представила свой механизм SBR в MPEG в качестве основы того, что в конечном итоге стало AAC-HE.

AAC-HE v1 был стандартизирован как профиль MPEG-4 Audio в 2003 г. MPEG и опубликовано как часть ISO / IEC 14496-3: 2001 / Amd 1: 2003[5] Технические характеристики.

Профиль AAC-HE v2 был стандартизирован в 2006 году в соответствии с ISO / IEC 14496-3: 2005 / Amd 2: 2006.[1][6]

Части спецификации AAC-HE ранее были стандартизированы и опубликованы различными организациями в3GPP TS 26.401,[7]ETSI TS 126 401 V6.1.0,[8]ISO / IEC 14496-3: 2001 / Amd.1: 2003 и ISO / IEC 14496-3: 2001 / Amd 2: 2004.[9]

В то время Coding Technologies уже начала использовать торговые названия AAC + и aacPlus для того, что сейчас известно как AAC-HE v1, и aacPlus v2 и eAAC + для того, что сейчас известно как AAC-HE v2.

Воспринимаемое качество

Тестирование показывает, что материал, декодированный из AAC-HE со скоростью 64 кбит / с, не имеет такого же качества звука, как материал, декодированный из MP3 со скоростью 128 кбит / с с использованием высококачественных кодеров.[10][11][12][13] Тест, взяв битрейт распределения и RMSD во внимание, это связь между mp3PRO, AAC-HE и Ogg Vorbis.

Дальнейшее контролируемое тестирование 3GPP во время их пересмотра 6 процесс спецификации указывает, что AAC-HE и AAC-HE v2 обеспечивают "хорошее" качество звука для музыки при низких скоростях передачи данных (например, 24 кбит / с).

В 2011 году публичное прослушивание[14] сравнение двух кодировщиков AAC-HE с лучшими показателями на тот момент Opus и Ogg Vorbis указал на статистически значимое превосходство Opus на скорости 64 кбит / с над всеми другими соперниками и поставил реализацию Apple AAC-HE на второе место как статистически превосходящую Ogg Vorbis и Nero AAC-HE, которые заняли третье место.

MPEG-2 и декодеры MPEG-4 AAC-LC без поддержки SBR будут декодировать часть звука AAC-LC, в результате чего вывод звука будет иметь только половину частоты дискретизации, тем самым уменьшая полосу пропускания звука. Обычно это приводит к высокому классу или тройной, часть аудиосигнала отсутствует в аудиопродукте.

Поддерживать

Кодирование

Orban Opticodec-PC Streaming and File Encoders были первыми коммерчески доступными кодировщиками, поддерживающими AAC-LC / AAC-HE еще в 2003 году. Теперь они устарели и заменены кодировщиками StreamS из StreamS / Modulation Index со многими другими функциями, включая поддержку xAAC-HE /Единое кодирование речи и звука. Сейчас они используются некоторыми из крупнейших поставщиков контента и считаются отраслевым стандартом кодирования в реальном времени.

Sony поддерживает кодирование AAC-HE, начиная с версии 4 SonicStage.

iTunes 9 поддерживает кодирование и воспроизведение AAC-HE.[15][16]

Неро выпустила бесплатный кодировщик AAC-HE для командной строки, Кодек Nero AAC,[17] а также поддерживает AAC-HE в программном пакете Nero.

Sorenson Media Squeeze Compression Suite включает кодировщик AAC-HEv1 и доступен для macOS а также Windows.

В 3GPP Консорциум выпустил исходный код эталонного кодировщика AAC-HEv2, который, по всей видимости, обеспечивает конкурентоспособное качество.[18]

Die Plattenkiste и Winamp Pro также поддерживает копирование музыки в AAC-HE. Используя плагин перекодирования для медиа-библиотеки Winamp, любой файл можно перекодировать в AAC-HE.[19]

XLD, программа кодирования аудио для macOS, предлагает кодирование любого из поддерживаемых форматов в AAC-HE.

Nokia PC Suite может кодировать аудиофайлы в формат eAAC + перед их передачей на мобильный телефон.

Кодеры AAC-HE v1 и v2 предоставляются Фраунгофер FDK AAC библиотека в Android 4.1 и более поздние версии.[20]

Расшифровка

AAC-HE поддерживается в Открытый исходный код FAAD /FAAD2 библиотека декодирования и все проигрыватели, использующие ее, например Медиаплеер VLC, Winamp, foobar2000, Audacious Media Player, SonicStage и Die Plattenkiste.

В Кодек Nero AAC поддерживает декодирование HE и HEv2 AAC.

AAC-HE также используется AOL Radio и Пандора Радио клиентов для доставки музыки высокого качества с низким битрейтом.

iTunes 9.2 и iOS 4 включают полное декодирование параметрических стереопотоков AAC-HE v2.

  • iTunes 9–9.1, iPhone OS 3.1 и iPod Fall 2009 имеют поддержку воспроизведения AAC-HE для версии 1 без параметрического стерео.
  • Старые версии Apple iTunes, Ipod Touch, и iPhone будут воспроизводить файлы AAC-HE с пониженной точностью, потому что они игнорируют репликацию спектрального диапазона и параметрическую стереофоническую информацию, вместо этого воспроизводя их, как если бы они были стандартными файлами AAC-LC без высокочастотной или "тройной" информации, которая только присутствует в части сигнала SBR.[21] Они сообщат, что длина трека будет вдвое больше фактической.[нужна цитата ]

Dolby выпустила декодеры и кодеры Dolby Pulse в сентябре 2008 года. AAC-HE v2 является ядром Dolby Pulse, поэтому файлы и потоки, закодированные в Dolby Pulse, будут воспроизводиться на декодерах AAC, AAC-HE v1 и v2. И наоборот, файлы и потоки, закодированные в AAC, AAC-HE v1 или v2, будут воспроизводиться на декодерах Dolby Pulse.

Dolby Pulse предоставляет следующие дополнительные возможности помимо AAC-HE v2:

  • Возможность разумно генерировать и вставлять обратимые метаданные нормализации громкости и динамического диапазона в закодированный файл / поток; затем эти метаданные можно использовать для оптимизации воспроизведения в зависимости от приложения и / или устройства.
  • Возможность вставлять собственные метаданные в закодированный файл и извлекать эти метаданные при воспроизведении.

Dolby дополнительно выпустила декодер для ПК в виде SDK, подходящего для интеграции в приложения ПК, требующие возможности воспроизведения Dolby Pulse, AAC-HE или AAC.

Декодеры AAC-HE v2 имеются во всех версиях Android.[20] Декодированием занимается Фраунгофер FDK AAC начиная с версии Android 4.1.

Клиенты

ЗаявлениеПлатформаОписание
AIMPWindowsАльтернативный музыкальный проигрыватель в стиле Winamp.[22]
Adobe Flash PlayerWindows, macOS, Chrome OS, LinuxПлагин браузера.[23][24] Поддерживает AAC + с любого RTMP источник.
Прямые потоки, заключенные в контейнер ADTS, изначально не поддерживаются и должны быть повторно упакованы. (например. Icecast KH может обслуживать потоки в .flv контейнер, совместимый с Flash.)[а]
Amarok (программное обеспечение)Windows, LinuxМузыкальный проигрыватель с открытым исходным кодом.
Audacious Media PlayerWindows, LinuxМузыкальный проигрыватель с открытым исходным кодом.
DeadbeefLinux, AndroidМузыкальный проигрыватель с открытым исходным кодом.
Die PlattenkisteWindowsБесплатное приложение интернет-радио (на немецком языке).
foobar2000WindowsБесплатный музыкальный плеер.
fre: acWindows, macOS, LinuxКонвертер аудио с открытым исходным кодом.
FStreammacOS, iOSПриложение Интернет-радио.
ГугуРадиоiOSПриложение Интернет-радио.
Интернет-радио плеерAndroidИнтернет-радио плеер.
Интернет-радиоiOSПриложение Интернет-радио.
iTunesWindows, macOSБесплатный музыкальный плеер. Предустановлен на компьютерах Mac.
JetAudioWindows, AndroidУсловно-бесплатный медиаплеер.
Аудио конвертер MediaHumanWindows, macOSБесплатный аудио конвертер.
(Поддерживает преобразование MP3, AAC, AIFF, WAV и т. Д.)
MPlayerWindows, macOS и LinuxМедиаплеер с открытым исходным кодом.
Mpv (медиаплеер)Windows, macOS и LinuxМедиаплеер с открытым исходным кодом.
RockboxРазличные портативные мультимедийные устройстваАльтернативные прошивки для различных портативных медиаплееров, таких как Apple iPod и Creative Zen.
QuickTime XmacOSМедиаплеер предустановлен в Mac OS X Snow Leopard или более поздней версии.
Реальный игрокWindows, macOS, Linux, AndroidМедиаплеер Freemium.
(AAC-HE v2 будет воспроизводиться только в моно)[26]
РитмбоксLinuxМузыкальный проигрыватель с открытым исходным кодом.
Снежная лентаmacOSУсловно-бесплатное приложение для интернет-радио.
streamWriterWindowsПриложение Интернет-радио с открытым исходным кодом.
StreamS HiFi RadioiOSПлатный интернет-радио плеер.
Тюнинговое радиоiOS, Android, Windows Phone, BlackberryИнтернет-радио плеер.
Медиаплеер VLCWindows, macOS, Linux, iOS, AndroidМедиаплеер с открытым исходным кодом.
WinampWindows, macOS, AndroidБесплатный медиаплеер.
XiiaLiveAndroid, iOSИнтернет-радио плеер.
КодиWindows, Linux, macOS, AndroidМедиаплеер с открытым исходным кодом.
Классический медиаплеерWindowsМедиа-плеер с открытым исходным кодом

Аспекты продвижения

Коммерческие товарные знаки и маркировка

AAC-HE продается под торговой маркой aacPlus компанией Технологии кодирования и под торговой маркой Nero Digital от Nero AG. Sony Ericsson, Nokia и Samsung используют AAC + для обозначения поддержки AAC-HE v1 и eAAC + для обозначения поддержки AAC-HE v2 на своих телефонах. Motorola использует AAC + для обозначения AAC-HE v1 и «AAC + Enhanced» для обозначения AAC-HE v2.[нужна цитата ]

Лицензирование и патенты

Компании, обладающие патентами на AAC-HE, сформировали патентный пул администрируется Via Licensing Corporation[27] чтобы предоставить производителям продуктов единую точку лицензии.

Патентные лицензии требуются компаниям, производящим конечные продукты, которые производят оборудование или программное обеспечение, которое включает кодеры и / или декодеры AAC-HE.[28] В отличие от формата MP3 до 23 апреля 2017 г.,[29] Владельцы контента не обязаны платить лицензионные сборы для распространения контента в AAC-HE.

Стандарты

Профиль AAC-HE был впервые стандартизирован в ISO / IEC 14496-3: 2001 / Amd 1: 2003.[5] Профиль AAC-HE v2 (AAC-HE с параметрическим стерео) был впервые указан в ISO / IEC 14496-3: 2005 / Amd 2: 2006.[1][6][30] Инструмент параметрического стереофонического кодирования, используемый AAC-HE v2, был стандартизирован в 2004 году и опубликован как ISO / IEC 14496-3: 2001 / Amd 2: 2004.[9][7]

Текущая версия MPEG-4 Audio (включая стандарты AAC-HE) опубликована в ISO / IEC 14496-3: 2009.

Расширенный aacPlus требуется формат сжатия звука в 3GPP технические характеристики для 3G UMTS мультимедийные услуги и должны поддерживаться в Подсистема IP-мультимедиа (IMS), Служба мультимедийных сообщений (MMS), Мультимедийное вещание / многоадресная передача (MBMS) и прозрачная служба потоковой передачи с сквозной коммутацией пакетов (PSS).[31][32][33][34] AAC-HE версии 2 был стандартизирован под названием Enhanced aacPlus by 3GPP для мультимедийных услуг 3G UMTS в сентябре 2004 г. (3GPP TS 26.401).[35]

Кодирование звука AAC-HE и AAC-HE v2 для DVB приложения стандартизированы TS 101 154.[36][37] AacPlus v2 от Coding Technologies[38] также стандартизирован ETSI как TS 102 005 для спутниковых услуг для портативных устройств (DVB-SH) ниже 3 ГГц.

В декабре 2007 года Бразилия начала вещание наземного стандарта DTV под названием International. ISDB-Tb который реализует кодирование видео H.264 с аудио AAC-LC в основной программе (одиночной или множественной) и видео H.264 со звуком AAC-HEv2 в мобильной подпрограмме 1Seg.

Версии

Ниже приводится краткое описание различных версий AAC-HE:

ВерсияОбщие торговые наименованияФункция кодекаСтандарты
AAC-HE v1aacPlus v1, eAAC, AAC +, CT-aacPlusAAC-LC + SBRISO / IEC 14496-3: 2001 / Amd 1: 2003
AAC-HE v2aacPlus v2, eAAC +, AAC ++, улучшенный AAC +AAC-LC + SBR + PSISO / IEC 14496-3: 2005 / Amd 2: 2006
xAAC-HEaacPlus v2, eAAC +, AAC ++, улучшенный AAC +AAC-LC + SBR + PS + USACISO / IEC 23003-3: 2012 / Amd 2: 2012
[39]

Смотрите также

Примечания

  1. ^ Для доставки потокового аудио данные AAC, скорее всего, передаются либо в формате обмена аудиоданными (ADIF), либо через транспортный поток аудиоданных (ADTS). Вы можете проанализировать эти контейнеры и создать аудиотеги FLV, чтобы использовать аудиофайл в режиме генерации данных.[25]

Рекомендации

  1. ^ а б c ISO / IEC JTC1 / SC29 / WG11 / N7016 (2005-01-11), Текст ISO / IEC 14496-3: 2001 / FPDAM 4, Кодирование без потерь звука (ALS), новые профили звука и расширения BSAC, заархивировано из оригинал (DOC) на 2014-05-12, получено 2009-10-09
  2. ^ Фраунгофера IIS, Аудио и видео технология MPEG-4 (PDF), получено 2009-10-15[мертвая ссылка ]
  3. ^ Herre, J .; Дитц, М. (2008). «MPEG-4 высокоэффективное кодирование AAC [в двух словах о стандартах]». Журнал IEEE Signal Processing Magazine. 25 (3): 137–142. Дои:10.1109 / MSP.2008.918684.
  4. ^ «Прием НРК-5». theori.io. В архиве с оригинала 20 августа 2017 г.. Получено 14 апреля 2018.
  5. ^ а б ISO (2003). «Расширение полосы пропускания, ISO / IEC 14496-3: 2001 / Amd 1: 2003». ISO. В архиве из оригинала от 04.01.2012. Получено 2009-10-13.
  6. ^ а б ISO (2006). «Кодирование без потерь звука (ALS), новые профили звука и расширения BSAC, ISO / IEC 14496-3: 2005 / Amd 2: 2006». ISO. В архиве из оригинала от 04.01.2012. Получено 2009-10-13.
  7. ^ а б 3GPP (30 сентября 2004 г.). «3GPP TS 26.401 V6.0.0 (2004-09), функции обработки звука с помощью общего аудиокодека; улучшенный аудиокодек общего назначения aacPlus; общее описание (версия 6)» (DOC). 3GPP. В архиве из оригинала 19.08.2006. Получено 2009-10-13.
  8. ^ 3GPP (4 января 2005 г.). «ETSI TS 126 401 V6.1.0 (2004-12) - Универсальная система мобильной связи (UMTS); общие функции обработки звука аудиокодеком; улучшенный общий аудиокодек aacPlus; общее описание (3GPP TS 26.401 версия 6.1.0, выпуск 6)». 3GPP. Получено 2009-10-13.
  9. ^ а б ISO (2004). «Параметрическое кодирование для высококачественного звука, ISO / IEC 14496-3: 2001 / Amd 2: 2004». ISO. В архиве из оригинала от 04.01.2012. Получено 2009-10-13.
  10. ^ «Результаты теста прослушивания 64 кбит / с». archive.org. 23 июня 2007 г. Архивировано 23 июня 2007 г.. Получено 3 мая 2018.CS1 maint: BOT: статус исходного URL-адреса неизвестен (связь)
  11. ^ "Многоформатный тест на прослушивание @ 48 кбит / с - ЗАВЕРШЕНО". www.hydrogenaud.io. В архиве из оригинала 8 июля 2014 г.. Получено 3 мая 2018.
  12. ^ «Персональный тест на прослушивание 80 кбит / с (лето 2005 г.)». www.hydrogenaud.io. В архиве из оригинала 8 июля 2014 г.. Получено 3 мая 2018.
  13. ^ "MP3 - WMA - AAC - OGG - качество 96 кбит / с (оценка) - Traitement Audio - Video & Son - FORUM HardWare.fr". forum.hardware.fr. В архиве из оригинала 15 июля 2012 г.. Получено 3 мая 2018.
  14. ^ "Страница неофициальных результатов многоформатного прослушивания Hydrogen audio 2011". people.xiph.org. В архиве из оригинала 25 июля 2012 г.. Получено 3 мая 2018.
  15. ^ «Архивная копия». Архивировано из оригинал на 2011-03-29. Получено 2011-03-29.CS1 maint: заархивированная копия как заголовок (связь)
  16. ^ «iTunes». яблоко. В архиве из оригинала 29 марта 2011 г.. Получено 3 мая 2018.
  17. ^ «Кодек Nero AAC». В архиве из оригинала от 11.12.2009. Получено 2009-11-23.
  18. ^ Бувинь, Габриэль (20 марта 2006 г.). «Результаты публичного тестирования AAC 48 кбит / с». MP3'Tech. В архиве из оригинала от 24.07.2008. Получено 2008-09-05.
  19. ^ "Бесплатная загрузка Winamp Transcoder 2.0". www.free-codecs.com. В архиве с оригинала от 20 августа 2008 г.. Получено 3 мая 2018.
  20. ^ а б «Поддерживаемые форматы мультимедиа». Google. В архиве из оригинала от 11.03.2012. Получено 2013-10-10.
  21. ^ «iPod touch: поддерживаемые форматы файлов». Служба поддержки Apple. Получено 2019-04-07.
  22. ^ «АИМП». www.aimp.ru. В архиве из оригинала 8 ноября 2014 г.. Получено 3 мая 2018.
  23. ^ «Adobe Flash Player». www.adobe.com. В архиве из оригинала 23 июля 2008 г.. Получено 3 мая 2018.
  24. ^ «Adobe предоставляет HD-видео и высококачественный звук во Flash с использованием H.264, AAC (поддержка iPhone Flash?) - MacDailyNews - Добро пожаловать домой». macdailynews.com. В архиве из оригинала 21 июня 2015 г.. Получено 3 мая 2018.
  25. ^ «Воспроизведение потокового аудио Icecast в Flash Player - Adobe Developer Connection». www.adobe.com. В архиве из оригинала 16 марта 2015 г.. Получено 3 мая 2018.
  26. ^ «Архивная копия». Архивировано из оригинал на 2015-03-18. Получено 2014-10-19.CS1 maint: заархивированная копия как заголовок (связь)
  27. ^ Через лицензирование. «Лицензионные программы». В архиве из оригинала на 13.05.2017. Получено 2017-05-11.
  28. ^ Через лицензирование. «Часто задаваемые вопросы о лицензировании AAC». В архиве из оригинала на 22.05.2017. Получено 2017-05-11.
  29. ^ Томсон. "Thomson / FhG Лицензирование MP3". Архивировано из оригинал 17 января 2017 г.
  30. ^ Михир Моди (06.06.2005). «Сжатие звука становится лучше и сложнее». Embedded.com. Получено 2009-10-13.[постоянная мертвая ссылка ]
  31. ^ ETSI (2009-04) ETSI TS 126 234 V8.2.0 (2009-04); 3GPP TS 26.234; Прозрачная сквозная потоковая служба с коммутацией пакетов (PSS); Протоколы и кодеки В архиве 2008-12-01 на Wayback Machine Страница 58. Проверено 2 июня 2009.
  32. ^ ETSI (2009-01) ETSI TS 126 140 V8.0.0 (2009-01); 3GPP TS 26.140; Служба мультимедийных сообщений (MMS); Форматы и коды мультимедиа В архиве 2008-12-06 на Wayback Machine Страница 11. Проверено 2 июня 2009.
  33. ^ ETSI (2009-01) ETSI TS 126 141 V8.0.0 (2009-01); 3GPP TS 26.141; Передача сообщений и присутствие в мультимедийной IP-системе (IMS); Медиаформаты и кодеки В архиве 2008-10-07 на Wayback Machine Стр. 10. Проверено 2 июня 2009.
  34. ^ 3GPP (2009). «ETSI TS 126 346 V8.3.0 (2009-06); 3GPP TS 26.346; мультимедийная широковещательная / многоадресная служба (MBMS); протоколы и кодеки». ETSI. п. 85. В архиве из оригинала от 04.10.2008. Получено 2009-10-13.
  35. ^ 3GPP (2004 г.). «3GPP TS 26.401 - Общие функции обработки звука аудиокодеком; Улучшенный общий аудиокодек aacPlus; Общее описание». 3GPP. В архиве из оригинала от 04.10.2008. Получено 2009-10-13.
  36. ^ ETSI TS 101 154 v1.5.1: Спецификация для использования кодирования видео и аудио в приложениях вещания на основе Транспортный поток MPEG-2
  37. ^ ETSI (31 марта 2009 г.). «TS 101 154 версия 1.9.1 - Цифровое видеовещание (DVB); Спецификация для использования кодирования видео и звука в приложениях вещания на основе транспортного потока MPEG-2». ETSI. В архиве из оригинала 2013-04-14. Получено 2009-10-13.
  38. ^ «Архивная копия» (PDF). Архивировано из оригинал (PDF) на 2006-10-26. Получено 2007-01-29.CS1 maint: заархивированная копия как заголовок (связь)
  39. ^ «xHE-AAC». Институт интегральных схем им. Фраунгофера IIS. В архиве с оригинала 30 декабря 2017 г.. Получено 3 мая 2018.

внешняя ссылка