Насир Ахмед (инженер) - Nasir Ahmed (engineer)

Насир Ахмед
Насир Ахмед.png
Родившийся1940
НациональностьИндийский
Американец
ОбразованиеШкола для мальчиков Bishop Cotton,
Университет Висвесварая Инженерный колледж (Бакалавр),
Университет Нью-Мексико (Магистр, Кандидат наук)
ИзвестенДискретное косинусное преобразование (DCT)
Обратный DCT (IDCT)
DCT сжатие с потерями
DCT сжатие изображений
Без потерь DCT (LDCT)
Дискретное синусоидальное преобразование (Летнее время)

Насир Ахмед (1940 г.р. Бангалор, Индия) является Индо-американец Инженер-электрик и ученый-компьютерщик. Он Заслуженный профессор в отставке электротехники и вычислительной техники в Университет Нью-Мексико (ЕНД). Он известен прежде всего изобретением дискретное косинусное преобразование (DCT) в начале 1970-х годов. DCT - наиболее широко используемый Сжатие данных трансформация, основа для большинства цифровые СМИ стандарты (изображение, видео и аудио ) и обычно используется в цифровая обработка сигналов. Он также описал дискретное синусоидальное преобразование (DST), что связано с DCT.

Дискретное косинусное преобразование (DCT)

Дискретное косинусное преобразование (DCT) - это сжатие с потерями алгоритм, который был впервые разработан Ахмедом во время работы в Канзасский государственный университет, и он предложил эту технику Национальный фонд науки в 1972 году. Первоначально он предназначал DCT для сжатие изображений.[1][2] Ахмед разработал рабочий алгоритм DCT со своим аспирантом Т. Натараджаном и другом. К. Р. Рао в 1973 г.,[1] и они представили свои результаты в статье, опубликованной в январе 1974 г.[3][4][5] В нем описывается то, что сейчас называется DCT типа II (DCT-II),[6] а также обратный DCT типа III (IDCT).[3]

Ахмед был ведущим автором эталонной публикации,[7][8] Дискретное косинусное преобразование (совместно с Т. Натараджаном и К. Р. Рао ),[9] который был отмечен как фундаментальное развитие во многих работах[10] с момента его публикации. Основная исследовательская работа и события, которые привели к развитию DCT, были обобщены в более поздней публикации Н. Ахмеда «Как я придумал дискретное косинусное преобразование».[1]

DCT широко используется для цифровых сжатие изображений.[11][12][13] Это основной компонент 1992 года. JPEG технология сжатия изображений, разработанная Группа экспертов JPEG[14] рабочей группы и стандартизированы совместно ITU,[15] ISO и IEC. Обсуждение того, как это используется для достижения цифровых видео сжатие в различных международных стандартах, определенных ITU и MPEG (Группа экспертов по кинофильмам) доступна в статье К. Р. Рао и Дж. Дж. Хванга.[16] который был опубликован в 1996 году, а обзор был представлен в двух публикациях Яо Ванга в 2006 году.[17][18] Благодаря свойствам сжатия изображения и видео DCT стал неотъемлемым компонентом следующих широко используемых международных стандартных технологий:

СтандартТехнологии
JPEGХранение и передача фотоизображений во всемирной паутине (JPEG / JFIF); и широко используется в цифровых камерах и других устройствах захвата фотографических изображений (JPEG /Exif ).
MPEG-1 видеоРаспространение видео на компакт-дисках или через Интернет.
MPEG-2 видео (или же H.262 )Хранение и обработка цифровых изображений в вещательных приложениях: цифровое телевидение, HDTV, кабельное, спутниковое, высокоскоростной Интернет; распространение видео на DVD.
H.261Первый из семейства стандартов кодирования видео (1988 г.). Используется в основном в старых продуктах для видеоконференцсвязи и видеотелефонии.
H.263Видеотелефония по коммутируемой телефонной сети общего пользования (PSTN )

Форма DCT, используемая в приложениях сжатия сигнала, иногда упоминается как «DCT-2» в контексте семейства дискретных косинусных преобразований,[19] или как «DCT-II».[20]

В более поздних стандартах используются преобразования на основе целых чисел, которые имеют аналогичные свойства с DCT, но явно основаны на обработке целых чисел, а не определяются тригонометрическими функциями.[21] В результате того, что эти преобразования имеют аналогичные свойства симметрии с DCT и являются в некоторой степени приближениями DCT, их иногда называют «целочисленными DCT-преобразованиями». Такие преобразования используются для сжатия видео в следующих технологиях, относящихся к более современным стандартам:

СтандартТехнологии
ВК-1Windows медиа, Диски Blu-ray.
H.264 / MPEG-4 AVCНаиболее часто используемый формат для записи, сжатия и распространения видео высокой четкости; потоковое интернет-видео; Диски Blu-ray; HDTV-вещание (эфирное, кабельное и спутниковое).
HEVCНовый преемник стандарта H.264 / MPEG-4 AVC, обладающий существенно улучшенными возможностями сжатия.
WebP ИзображенийГрафический формат, поддерживающий сжатие цифровых изображений с потерями. Разработано Google.
WebM видеоМультимедийный формат с открытым исходным кодом, разработанный Google и предназначенный для использования с HTML5.

Дизайн «целочисленного DCT» концептуально аналогичен традиционному DCT; однако он упрощен и предназначен для обеспечения точно заданного декодирования.

DCT широко цитируется в патентах, выдаваемых с 1976 года, некоторые примеры которых приведены ниже:

  • Быстрый поиск по патентам США: Название: DCT. Описание / Спецификация: Видео [6];
  • Быстрый поиск по патентам США: Название: Изображение. Аннотация: DCT [7];
  • Быстрый поиск по патентам США: Название: Видео. Аннотация: DCT [8];
  • Быстрый поиск по патентам США: Название: Изображение. Описание / Спецификация: DCT [9];
  • Быстрый поиск по патентам США: Название: Видео. Описание / спецификация: DCT [10].

Вариант DCT, модифицированное дискретное косинусное преобразование (MDCT), используется в современных сжатие звука форматы, такие как MP3,[22] Расширенное кодирование звука (AAC) и Vorbis (OGG).

В дискретное синусоидальное преобразование (DST) выводится из DCT путем замены Условие Неймана в х = 0 с Условие Дирихле.[23] DST был описан в документе DCT 1974 года Ахмедом, Натараджаном и Рао.[3]

Позже Ахмед участвовал в разработке DCT. сжатие без потерь алгоритм с Гиридхаром Мандьямом и Нираджем Маготрой на Университет Нью-Мексико в 1995 г. Это позволяет использовать технику DCT для сжатие без потерь изображений. Это модификация исходного алгоритма DCT и включает элементы обратного DCT и дельта-модуляция. Это более эффективный алгоритм сжатия без потерь, чем энтропийное кодирование.[24]

Фон

Книги

Переведены на русский, китайский и японский языки:

  • Ведущий автор Ортогональные преобразования для цифровой обработки сигналов, Springer-Verlag (Берлин - Гейдельберг - Нью-Йорк), 1975, с К. Рао; переведено на русский (1980 г.) и китайский (1979 г.). Это первое учебное пособие, включающее DCT, и одно из первых, в котором представлен единый подход к использованию синусоидальных и несинусоидальных ортогональных преобразований для обработки сигналов. Процитирую одного рецензента: "авторы пошли туда, куда другие боялись рискнуть. При этом они разработали полезную книгу в качестве первой попытки в захватывающей области цифровой обработки сигналов и общих ортогональных преобразований;"подробнее см. Х. Эндрюс [11].

Его продолжают цитировать в отношении широкого спектра приложений обработки сигналов - см. Цитаты из Google-Scholar.[12]. Доступно примерно в 230 библиотеках. Переиздание этого первого издания в мягкой обложке теперь доступно - например, см. Springer-Verlag, Amazon, Барнс и Ноубл и Алибрис.

  • Ведущий автор Сигналы и системы с дискретным временем, Reston Publishing Company, Inc. (A Prentice-Hall Company), Рестон, Вирджиния, 1983, с Т. Натараджаном; переведено на японский язык (1990). Доступно примерно в 215 библиотеках.

Рекомендации

  1. ^ а б c Ахмед, Насир (Январь 1991 г.). "Как я пришел к дискретному косинусному преобразованию". Цифровая обработка сигналов. 1 (1): 4–5. Дои:10.1016 / 1051-2004 (91) 90086-Z.
  2. ^ Станкович, Радомир С .; Астола, Яакко Т. (2012). «Воспоминания о ранних работах в DCT: интервью с К.Р. Рао» (PDF). Отпечатки с первых дней информационных наук. 60. Получено 13 октября 2019.
  3. ^ а б c Ахмед, Насир; Натараджан, Т .; Рао, К. Р. (январь 1974 г.), «Дискретное косинусное преобразование» (PDF), Транзакции IEEE на компьютерах, С-23 (1): 90–93, Дои:10.1109 / T-C.1974.223784
  4. ^ Рао, К.; Ип, П. (1990), Дискретное косинусное преобразование: алгоритмы, преимущества, приложения, Бостон: Academic Press, ISBN  978-0-12-580203-1
  5. ^ «T.81 - ЦИФРОВОЕ СЖАТИЕ И КОДИРОВАНИЕ НЕПРЕРЫВНЫХ ТОНОВЫХ ИЗОБРАЖЕНИЙ - ТРЕБОВАНИЯ И РЕКОМЕНДАЦИИ» (PDF). CCITT. Сентябрь 1992 г.. Получено 12 июля 2019.
  6. ^ Британак, Владимир; Ип, Патрик С .; Рао, К. (2010). Дискретные косинусные и синусоидальные преобразования: общие свойства, быстрые алгоритмы и целочисленные приближения. Эльзевир. п. 51. ISBN  9780080464640.
  7. ^ Избранные статьи о визуальной коммуникации: Технологии и приложения, (SPIE Press Book), редакторы Т. Рассел Хсинг и Эндрю Г. Тешер, апрель 1990 г., стр. 145-149. [1].
  8. ^ Избранные статьи и учебное пособие по обработке и анализу цифровых изображений, Том 1, Цифровая обработка и анализ изображений(IEEE Computer Society Press), редакторы Р. Челлаппа и А. А. Савчук, июнь 1985 г., стр. 47.
  9. ^ Ахмед, Н.; Натараджан, Т .; Рао, К. Р. (январь 1974 г.), "Дискретное косинусное преобразование", Транзакции IEEE на компьютерах, С-23 (1): 90–93, Дои:10.1109 / T-C.1974.223784
  10. ^ Цитирование DCT через Google Scholar [2].
  11. ^ Эндрю Б. Уотсон (1994). «Сжатие изображения с использованием дискретного косинусного преобразования» (PDF). Математика журнал. 4 (1): 81–88.
  12. ^ сжатие изображений.
  13. ^ Преобразование кодирования.
  14. ^ Г. К. Уоллес, JPEG 1992 [3].
  15. ^ CCITT 1992 [4].
  16. ^ К. Р. Рао и Дж. Дж. Хван, Методы и стандарты кодирования изображений, видео и аудио, Prentice Hall, 1996; JPEG: Глава 8; H.261: Глава 9; MPEG-1: Глава 10; MPEG-2: Глава 11.
  17. ^ Яо Ван, Стандарты видеокодирования: Часть I, 2006 г.
  18. ^ Яо Ван, Стандарты видеокодирования: Часть II, 2006 г.
  19. ^ Гилберт Стрэнг (1999). "Дискретное косинусное преобразование" (PDF). SIAM Обзор. 41 (1): 135–147. Bibcode:1999SIAMR..41..135S. Дои:10.1137 / S0036144598336745.
  20. ^ Дискретное косинусное преобразование.
  21. ^ Чже-Бом Ли и Хари Калва, Стандарты сжатия видео VC-1 и H.264 для широкополосных видеоуслуг, Springer Science + Business Media, LLC, 2008 г., стр. 217-245; подробнее об этой книге см. [5]
  22. ^ Гукерт, Джон (весна 2012 г.). «Использование БПФ и МДКП в сжатии аудио MP3» (PDF). Университет Юты. Получено 14 июля 2019.
  23. ^ Британак, Владимир; Ип, Патрик С .; Рао, К. (2010). Дискретные косинусные и синусоидальные преобразования: общие свойства, быстрые алгоритмы и целочисленные приближения. Эльзевир. С. 35–6. ISBN  9780080464640.
  24. ^ Мандьям, Гиридхар Д.; Ахмед, Насир; Маготра, Нирадж (17 апреля 1995 г.). «Схема на основе DCT для сжатия изображений без потерь». Сжатие цифрового видео: алгоритмы и технологии 1995 г.. Международное общество оптики и фотоники. 2419: 474–478. Дои:10.1117/12.206386.

внешняя ссылка