Список двоичных кодов - List of binary codes
Это список некоторых двоичные коды которые используются (или использовались) для представления текст как последовательность двоичные цифры «0» и «1». Двоичные коды фиксированной ширины используют заданное количество битов для представления каждого символа в тексте, а в переменная ширина двоичные коды, количество битов может варьироваться от символа к символу.
Пятибитные двоичные коды
Ряд различных пятибитовых кодов использовался для ранних перфолента системы.
Пять битов на символ допускают только 32 различных символа, поэтому многие из пятибитовых кодов использовали два набора символов на значение, называемые FIGS (цифры) и LTRS (буквы), и зарезервировали два символа для переключения между этими наборами. Это фактически позволило использовать 60 символов.
Стандартные пятибитные стандартные коды:
- Международный телеграфный алфавит № 1 (ITA1) - также обычно называют Код Бодо[1]
- Международный телеграфный алфавит № 2 (ITA2) - Также обычно называют Код Мюррея[1][2]
- Код американского телетайпа (USTTY) - вариант ITA2, используемый в США.[2]
- DIN 66006 - Разработано для презентации АЛГОЛ /АЛКОР программы на бумажной ленте и перфокартах
Каждая из следующих ранних компьютерных систем использовала свой пятибитный код:
- J. Lyons and Co. ЛЕО (Электронный офис Лиона)
- Английский Электрический DEUCE
- Иллинойсский университет в Урбана-Шампейн ИЛЛИАК
- ЗЕБРА
- EMI 1100
- Ферранти Меркурий, Пегас, и Орион системы[3]
Стеганографический код, широко известный как Шифр Бэкона использует группы из 5 двоичных элементов для представления букв алфавита.
Шестибитные двоичные коды
Шесть бит на символ позволяют представить 64 различных символа.
Примеры шестибитных двоичных кодов:
- Международный телеграфный алфавит № 4 (ITA4 )[4]
- Шестибитный BCD (Двоично-десятичное кодирование), использовавшееся ранними мэйнфрейм компьютеры.
- Шестибитный ASCII подмножество примитива семибитный ASCII
- Шрифт Брайля - Символы Брайля представлены шестью точками, расположенными в прямоугольнике. Каждая позиция может содержать или не содержать выпуклую точку, поэтому шрифт Брайля можно рассматривать как шестибитный двоичный код.
Смотрите также: Шестибитные коды символов
Семибитные двоичные коды
Примеры семибитных двоичных кодов:
- Международный телеграфный алфавит № 3 (ITA3 ) - полученный из кода ARQ Мура, также известный как RCA
- ASCII - Вездесущий код ASCII изначально был определен как семибитный набор символов. В статье ASCII представлен подробный набор эквивалентных стандартов и вариантов. Кроме того, существуют различные расширения ASCII до восьми бит (см. Восьмиразрядные двоичные коды )
- CCIR 476 - расширяет ITA2 с 5 до 7 бит, используя дополнительные 2 бита в качестве проверить цифры[4]
- Международный телеграфный алфавит № 4 (ITA4 )[4]
Восьмиразрядные двоичные коды
- Расширенный ASCII - Ряд стандартов расширяют ASCII до восьми битов, добавляя еще 128 символов, например:
- EBCDIC - Используется в начале IBM компьютеры и ток Система i и Система z компьютеры
10-битные двоичные коды
- AUTOSPEC - также известен как код Бауэра. AUTOSPEC повторяет пятибитовый символ дважды, но если у символа нечетная четность, повторение инвертируется.[4]
16-битные двоичные коды
- UCS-2 - Устаревшая кодировка, способная представлять базовый многоязычный самолет Юникода
32-битные двоичные коды
- UTF-32 / UCS-4 - Четырехбайтовое представление символа Unicode
Двоичные коды переменной длины
- UTF-8 - Кодирует символы способом, который в основном совместим с ASCII но также может кодировать полный набор символов Unicode с последовательностями до четырех 8-битных байтов.
- UTF-16 - Расширяет UCS-2 для охвата всего Unicode последовательностями из одного или двух 16-битных элементов
- ГБ 18030 - Код переменной длины с полным Unicode, разработанный для совместимости со старыми китайскими многобайтовыми кодировками.
- Кодирование Хаффмана - Методика выражения более общих символов с использованием более коротких битовых строк, чем те, которые используются для менее распространенных символов.
Сжатие данных такие системы как Лемпель – Зив – Велч умеют сжимать произвольные двоичные данные. Поэтому они не являются двоичными кодами сами по себе, но могут применяться к двоичным кодам для уменьшения потребности в хранении.
Другой
- азбука Морзе представляет собой телеграфный код переменной длины, который традиционно использует серию длинных и коротких импульсов для кодирования символов. Он основан на промежутках между импульсами, чтобы обеспечить разделение между буквами и словами, поскольку буквенные коды не имеют "свойство префикса". Код Морзе можно представить в виде двоичного потока, позволяя каждому биту представлять одну единицу времени. Таким образом, «точка» или «точка» представлены как один бит 1, а «dah» или «тире» представлены как три последовательных 1 бита. Пробелы между символами, буквами и словами представлены в виде одного, трех или семи последовательных 0 битов. Например, «ВВЕРХ» в азбуке Морзе - это «..- .--.», Что может быть представлено в двоичном виде как «101011100010111011101».
Смотрите также
Рекомендации
- ^ а б Алан Г. Хоббс (1999-03-05). «Пятизначные коды». Музей NADCOMM. Архивировано из оригинал на 1999-11-04.
- ^ а б Гил Смит (2001). "Коды связи телетайпа" (PDF).
- ^ "Считыватели бумажной ленты и перфораторы". Веб-сайт Ferranti Orion. Архивировано из оригинал на 2011-07-21.
- ^ а б c d «Устройства телешифрования». Домашняя страница Джона Сэварда.