Шестибитный символьный код - Six-bit character code
А шестибитный код символа это кодировка символов разработан для использования на компьютерах с длина слова кратное 6. Шесть битов могут кодировать только 64 различных символа, поэтому эти коды обычно включают только прописные буквы, цифры, некоторые знаки пунктуации и иногда управляющие символы. Такие коды с дополнительными бит четности были естественным способом хранения данных на 7-трековый магнитная лента.
Типы шестибитных кодов
Ранний шестибитный двоичный код использовался для Шрифт Брайля, система чтения для слепых, разработанная в 1820-х годах.
Самые ранние компьютеры имели дело только с числовыми данными и не предусматривали символьных данных. Шестибитный BCD использовался IBM на ранних компьютерах, таких как IBM 704 в 1954 г.[1]:стр.35 Эта кодировка была заменена 8-битной EBCDIC код, когда Система / 360 стандартизован на 8-битный байты. Есть несколько вариантов этого типа кода (см. ниже ).
Шестибитные коды символов обычно заменяли пятибитные. Код Бодо и предшествующий семибитный ASCII. Один из популярных вариантов был DEC ШЕСТИБИТ. Это просто коды символов ASCII от 32 до 95, закодированные как от 0 до 63, путем вычитания 32 (т. Е. Столбцов 2, 3, 4 и 5 таблицы ASCII (16 символов в столбце), сдвинутых в столбцы с 0 по 3, путем вычитания 2 из старших битов); он включает пробелы, знаки препинания, цифры и заглавные буквы, но не управляющие символы. Поскольку он не содержал управляющих символов, даже конца строки, он не использовался для общей обработки текста. Однако шестизначные имена, такие как имена файлов и ассемблер символы можно хранить в одном 36-битный слово PDP-10, и в каждое слово PDP-1 и два символа помещаются в каждое слово PDP-8.
Шестибитные коды могут кодировать более 64 символов с помощью Shift Out и Shift In символы, по сути включающий два различных набора из 62 символов и переключение между ними. Например, популярный IBM 2741 Терминал связи поддерживал различные наборы символов до 88 печатных символов плюс управляющие символы.
А UTF-6 кодировка была предложена для Unicode[2] но был заменен Punycode.
Шестибитный код BCD
Шестибитный BCD код был адаптацией код перфокарты к бинарный код. IBM применил условия двоично-десятичный и BCD к вариациям BCD альфамеры использовался в большинстве ранних компьютеров IBM, включая IBM 1620, IBM 1400 серии, и недесятичная архитектура члены IBM 700/7000 серии.
Базы данных COBOL шестибитный код
Шестибитный код также использовался в базах данных COBOL, где информация о конце записи хранилась отдельно.[нужна цитата ]
Карта с магнитной полосой, шестибитный код
Шестибитный код с добавленным нечетным бит четности, используется на дорожке 1 карты с магнитной полосой, как указано в ISO / IEC 7811 -2.
Шестибитный код DEC
Код DEC SIXBIT, включающий несколько управляющих символов вместе с SO / SI, разрешающее расширение кода - было указано как ECMA -1 в 1963 г. (см. ниже ). Другой, менее распространенный вариант получается простым удалением старшего бита кода ASCII в диапазоне 32-95 (коды 32-63 остаются на своих позициях, из более высоких значений вычитается 64). Такой вариант иногда использовался на DEC. PDP-8 (1965).
Шестибитный код FIELDATA
FIELDATA был семибитным кодом (с необязательной проверкой четности), из которого формально были определены только 64 позиции кода (занимающие шесть битов).[3] Вариант был использован UNIVAC компьютеры 1100-й серии.[4] Рассматривая код как шестибитный код, эти системы использовали 36-битное слово (способное хранить шесть таких сокращенных символов FIELDATA).[5]
Шестибитный код Брайля
Шрифт Брайля символы представлены с помощью шести точек, расположенных в прямоугольнике. Каждая позиция может содержать или не содержать выпуклую точку, поэтому шрифт Брайля можно рассматривать как шестибитный двоичный код. Некоторые более современные системы Брайля добавляют две дополнительные точки, превращая эти системы в восьмибитный код.
Шестибитные коды для двоичного кодирования текста
Передача двоичных данных по системам, предназначенным только для текста, иногда может вызывать проблемы. Например, электронное письмо исторически поддерживал только 7-битные коды ASCII и удалял 8-й бит, тем самым искажая двоичные данные, отправляемые напрямую через любой проблемный почтовый сервер. Другие системы могут вызывать проблемы из-за неправильной интерпретации управляющих символов во время хранения или передачи. Существует ряд схем для упаковки 8-битных данных в текстовые представления, которые могут проходить через системы текстовой почты для декодирования в месте назначения. Примеры подмножеств 6-битных символов, используемых для упаковки двоичных данных, включают: Uuencode и Base64. Эти наборы не содержат управляющих символов (только цифры, буквы, некоторые знаки препинания и, возможно, пробелы) и позволяют передавать данные через любой носитель, который также может передавать читаемый человеком текст.
Примеры шестибитных кодов BCD
Персонажи показаны со своими Unicode эквиваленты.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | 0 0030 | # 0023 | @ 0040 | ЛЕНТА ОТМЕТКА | |||
1_ | SP 0020 | / 002F | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | Икс 0058 | Y 0059 | Z 005A | ЗАПИСЫВАТЬ ОТМЕТКА | , 002C | % 0025 | |||
2_ | - 002D | J 004A | K 004B | L 004C | M 004D | N 004E | О 004F | п 0050 | Q 0051 | р 0052 | -0 002D 0030 | $ 0024 | * 002A | |||
3_ | & 0026 | А 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | грамм 0047 | ЧАС 0048 | я 0049 | +0 002B 0030 | . 002E | ¤ 00A4 | ГРУППА ОТМЕТКА |
Письмо Число Пунктуация Символ Другой Неопределенный
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | 0 0030 | = 003D | − 2212 | ||||
1_ | SP 0020 | / 002F | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | Икс 0058 | Y 0059 | Z 005A | , 002C | ( 0028 | ||||
2_ | — 2014 | J 004A | K 004B | L 004C | M 004D | N 004E | О 004F | п 0050 | Q 0051 | р 0052 | -0 002D 0030 | $ 0024 | * 002A | |||
3_ | + 002B | А 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | грамм 0047 | ЧАС 0048 | я 0049 | +0 002B 0030 | . 002E | ) 0029 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | : 003A | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | 0 0030 | = 003D | ≠ 2260 | ≤ 2264 | ! 0021 | [ 005B |
1_ | SP 0020 | / 002F | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | Икс 0058 | Y 0059 | Z 005A | ] 005D | , 002C | ( 0028 | → 2192 | ≡ 2261 | ~ 007E |
2_ | − 2212 | J 004A | K 004B | L 004C | M 004D | N 004E | О 004F | п 0050 | Q 0051 | р 0052 | % 0025 | $ 0024 | * 002A | ↑ 2191 | ↓ 2193 | > 003E |
3_ | + 002B | А 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | грамм 0047 | ЧАС 0048 | я 0049 | < 003C | . 002E | ) 0029 | ≥ 2265 | ? 003F | ; 003B |
Примеры шестибитных вариантов ASCII
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
1_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
2_ | @ 0040 | А 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | грамм 0047 | ЧАС 0048 | я 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | О 004F |
3_ | п 0050 | Q 0051 | р 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | Икс 0058 | Y 0059 | Z 005A | [ 005B | 005C | ] 005D | ^ 005E | _ 005F |
Письмо Число Пунктуация Символ Другой Неопределенный
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | SP 0020 | HT 0009 | LF 000A | VT 000B | FF 000C | CR 000D | ТАК 000E | SI 000F | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
1_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
2_ | NUL 0000 | А 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | грамм 0047 | ЧАС 0048 | я 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | О 004F |
3_ | п 0050 | Q 0051 | р 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | Икс 0058 | Y 0059 | Z 005A | [ 005B | 005C | ] 005D | ESC 001B | DEL 007F |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
1_ | SP 0020 | ! 0021 | " 0022 | # 0023 | £ 00A3 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
2_ | @ 0040 | А 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | грамм 0047 | ЧАС 0048 | я 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | О 004F |
3_ | п 0050 | Q 0051 | р 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | Икс 0058 | Y 0059 | Z 005A | [ 005B | $ 0024 | ] 005D | ↑ 2191 | ← 2190 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | @ 0040 | А 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | грамм 0047 | ЧАС 0048 | я 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | О 004F |
1_ | п 0050 | Q 0051 | р 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | Икс 0058 | Y 0059 | Z 005A | [ 005B | 005C | ] 005D | ^ 005E | _ 005F |
2_ | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
6-битный код ГОСТ
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | + 002B | - 002D | / 002F | , 002C | . 002E | SP 0020 |
1_ | ⏨ 23E8 | ↑ 2191 | ( 0028 | ) 0029 | × 00D7 | = 003D | ; 003B | [ 005B | ] 005D | * 002A | ‘ 2018 | ’ 2019 | ≠ 2260 | < 003C | > 003E | : 003A |
2_ | А 0410 | Б 0411 | В 0412 | Г 0413 | Д 0414 | Е 0415 | Ж 0416 | З 0417 | И 0418 | Й 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E | П 041F |
3_ | Р 0420 | С 0421 | Т 0422 | У 0423 | Ф 0424 | Х 0425 | Ц 0426 | Ч 0427 | Ш 0428 | Щ 0429 | Ы 042B | Ь 042C | Э 042D | Ю 042E | Я 042F | DEL 007F |
Письмо Число Пунктуация Символ Другой Неопределенный
Пример шестибитных кодов Брайля
В следующей таблице показано расположение символов с шестнадцатеричным значением, соответствующим символом ASCII, 6-битными кодами Брайля (комбинации точек), шрифтом Брайля. Unicode глиф и общее значение (фактическое значение может меняться в зависимости от контекста).[7][8]
|
|
Смотрите также
- Десятичное число с двоичным кодом
- BCD (кодировка символов)
- Код дисплея CDC
- ДЕКАБРЬ RADIX 50 / MOD40
- IBM SQUOZE
- IBM Transcode
- ASCII
- Код Бодо
- EBCDIC
- Unicode
- ANSI X3.64
- UTF-8
- UTF-16
Рекомендации
- ^ Корпорация IBM (1954). 704 электронная машина обработки данных: руководство по эксплуатации (PDF).
- ^ Велтер, Марк; Сполярич, Брайан В. (2000-11-16). «UTF-6 - еще одна кодировка, совместимая с ASCII для идентификаторов». Инженерная группа Интернета. В архиве из оригинала от 23.05.2016. Получено 2016-04-09.
- ^ Маккензи, Чарльз Э. (1980). Наборы кодированных символов, история и развитие. Серия системного программирования (1-е изд.). Addison-Wesley Publishing Company, Inc. п. 64. ISBN 0-201-14460-3. LCCN 77-90165. ISBN 978-0-201-14460-4. Получено 2016-05-22.
- ^ Уокер, Джон (1996-08-06). "Код FIELDATA для UNIVAC серии 1100". Воспоминания UNIVAC. В архиве из оригинала от 22.05.2016. Получено 2016-05-22.
- ^ Дженнингс, Томас Дэниел (2016-04-20) [1999]. «Аннотированная история некоторых кодов символов или ASCII: американский стандартный код для проникновения информации». Мировые энергетические системы (WPS). В архиве из оригинала от 22.05.2016. Получено 2016-05-22.
- ^ Раймонд, Эрик С. (2017-08-29). «Типы данных полезной нагрузки AIS». catb.org. Получено 2017-11-16.
- ^ «Представление и отображение шрифта Брайля». DotlessBraille.org. 2002-02-20. Получено 2009-08-09.
- ^ Халлек, Джон (2000-08-24). "braille-ascii.ads". Брайль.Ascii. Получено 2009-08-10.
внешняя ссылка
- "Справочное руководство компьютера Control Data 1604-C" (PDF). (7,44 МБ)
- «Стандарт ECMA для 6-битного кода символов ввода / вывода» (PDF). (1,53 МБ)
- Справочник по коду символов SIXBIT Система кодирования символов SIXBIT от Digital Equipment Corporation