Кодирование Шеннона – Фано – Элиаса - Shannon–Fano–Elias coding
Эта статья нужны дополнительные цитаты для проверка.Апрель 2016 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
В теория информации, Кодирование Шеннона – Фано – Элиаса является предшественником арифметическое кодирование, в котором вероятности используются для определения кодовых слов.[1]
Описание алгоритма
Учитывая дискретная случайная величина Икс из упорядоченный значения для кодирования, пусть быть вероятностью для любого Икс в Икс. Определите функцию
Алгоритм:
- Для каждого Икс в Икс,
- Позволять Z быть двоичным разложением .
- Выберите длину кодировки Икс, , чтобы быть целым числом
- Выберите кодировку Икс, , быть первым старшие биты после десятичной точки Z.
Пример
Пусть X = {A, B, C, D} с вероятностями p = {1/3, 1/4, 1/6, 1/4}.
- Для
- В двоичном формате Z (A) = 0.0010101010...
- L (А) = = 3
- код (A) - 001
- Для B
- В двоичном формате Z (B) = 0.01110101010101...
- L (B) = = 3
- код (B) - 011
- Для C
- В двоичном формате Z (C) = 0.101010101010...
- L (C) = = 4
- код (C) - 1010
- Для D
- В двоичном формате Z (D) = 0.111
- L (D) = = 3
- код (D) 111
Анализ алгоритмов
Код префикса
Кодирование Шеннона – Фано – Элиаса дает двоичный код префикса, позволяя прямое декодирование.
Пусть bcode (x) будет рациональным числом, образованным добавлением десятичной точки перед двоичным кодом. Например, если code (C) = 1010, то bcode (C) = 0.1010. Для всех x, если не существует y такого, что
тогда все коды образуют префиксный код.
Сравнивая F с CDF X, это свойство может быть продемонстрировано графически для кодирования Шеннона – Фано – Элиаса.
По определению L следует, что
И поскольку биты после L (y) усекаются от F (y) для формирования кода (y), из этого следует, что
таким образом, bcode (y) должен быть не меньше CDF (x).
Итак, приведенный выше график демонстрирует, что , поэтому свойство префикса сохраняется.
Длина кода
Средняя длина кода .
Таким образом, для H (X) Энтропия случайной величины X,
Шеннон Фано Элиас кодирует от 1 до 2 дополнительных бит на символ из X, чем энтропия, поэтому на практике этот код не используется.
Рекомендации
- ^ Т. М. Ковер и Джой А. Томас (2006). Элементы теории информации (2-е изд.). Джон Уайли и сыновья. С. 127–128. ISBN 978-0-471-24195-9.