Шестибитный символьный код - Six-bit character code

А шестибитный код символа это кодировка символов разработан для использования на компьютерах с длина слова кратное 6. Шесть битов могут кодировать только 64 различных символа, поэтому эти коды обычно включают только прописные буквы, цифры, некоторые знаки пунктуации и иногда управляющие символы. Такие коды с дополнительными бит четности были естественным способом хранения данных на 7-трековый магнитная лента.

Типы шестибитных кодов

Ранний шестибитный двоичный код использовался для Шрифт Брайля, система чтения для слепых, разработанная в 1820-х годах.

Самые ранние компьютеры имели дело только с числовыми данными и не предусматривали символьных данных. Шестибитный BCD использовался IBM на ранних компьютерах, таких как IBM 704 в 1954 г.[1]:стр.35 Эта кодировка была заменена 8-битной EBCDIC код, когда Система / 360 стандартизован на 8-битный байты. Есть несколько вариантов этого типа кода (см. ниже ).

Шестибитные коды символов обычно заменяли пятибитные. Код Бодо и предшествующий семибитный ASCII. Один из популярных вариантов был DEC ШЕСТИБИТ. Это просто коды символов ASCII от 32 до 95, закодированные как от 0 до 63, путем вычитания 32 (т. Е. Столбцов 2, 3, 4 и 5 таблицы ASCII (16 символов в столбце), сдвинутых в столбцы с 0 по 3, путем вычитания 2 из старших битов); он включает пробелы, знаки препинания, цифры и заглавные буквы, но не управляющие символы. Поскольку он не содержал управляющих символов, даже конца строки, он не использовался для общей обработки текста. Однако шестизначные имена, такие как имена файлов и ассемблер символы можно хранить в одном 36-битный слово PDP-10, и в каждое слово PDP-1 и два символа помещаются в каждое слово PDP-8.

Шестибитные коды могут кодировать более 64 символов с помощью Shift Out и Shift In символы, по сути включающий два различных набора из 62 символов и переключение между ними. Например, популярный IBM 2741 Терминал связи поддерживал различные наборы символов до 88 печатных символов плюс управляющие символы.

А UTF-6 кодировка была предложена для Unicode[2] но был заменен Punycode.

Шестибитный код BCD

Шестибитный BCD код был адаптацией код перфокарты к бинарный код. IBM применил условия двоично-десятичный и BCD к вариациям BCD альфамеры использовался в большинстве ранних компьютеров IBM, включая IBM 1620, IBM 1400 серии, и недесятичная архитектура члены IBM 700/7000 серии.

Базы данных COBOL шестибитный код

Шестибитный код также использовался в базах данных COBOL, где информация о конце записи хранилась отдельно.[нужна цитата ]

Карта с магнитной полосой, шестибитный код

Шестибитный код с добавленным нечетным бит четности, используется на дорожке 1 карты с магнитной полосой, как указано в ISO / IEC 7811 -2.

Шестибитный код DEC

Код DEC SIXBIT, включающий несколько управляющих символов вместе с SO / SI, разрешающее расширение кода - было указано как ECMA -1 в 1963 г. (см. ниже ). Другой, менее распространенный вариант получается простым удалением старшего бита кода ASCII в диапазоне 32-95 (коды 32-63 остаются на своих позициях, из более высоких значений вычитается 64). Такой вариант иногда использовался на DEC. PDP-8 (1965).

Шестибитный код FIELDATA

FIELDATA был семибитным кодом (с необязательной проверкой четности), из которого формально были определены только 64 позиции кода (занимающие шесть битов).[3] Вариант был использован UNIVAC компьютеры 1100-й серии.[4] Рассматривая код как шестибитный код, эти системы использовали 36-битное слово (способное хранить шесть таких сокращенных символов FIELDATA).[5]

Шестибитный код Брайля

Шрифт Брайля символы представлены с помощью шести точек, расположенных в прямоугольнике. Каждая позиция может содержать или не содержать выпуклую точку, поэтому шрифт Брайля можно рассматривать как шестибитный двоичный код. Некоторые более современные системы Брайля добавляют две дополнительные точки, превращая эти системы в восьмибитный код.

Шестибитные коды для двоичного кодирования текста

Передача двоичных данных по системам, предназначенным только для текста, иногда может вызывать проблемы. Например, электронное письмо исторически поддерживал только 7-битные коды ASCII и удалял 8-й бит, тем самым искажая двоичные данные, отправляемые напрямую через любой проблемный почтовый сервер. Другие системы могут вызывать проблемы из-за неправильной интерпретации управляющих символов во время хранения или передачи. Существует ряд схем для упаковки 8-битных данных в текстовые представления, которые могут проходить через системы текстовой почты для декодирования в месте назначения. Примеры подмножеств 6-битных символов, используемых для упаковки двоичных данных, включают: Uuencode и Base64. Эти наборы не содержат управляющих символов (только цифры, буквы, некоторые знаки препинания и, возможно, пробелы) и позволяют передавать данные через любой носитель, который также может передавать читаемый человеком текст.

Примеры шестибитных кодов BCD

Персонажи показаны со своими Unicode эквиваленты.

CDC 1604: BCD-коды магнитной ленты
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
0
0030
#
0023
@
0040
ЛЕНТА
ОТМЕТКА
1_SP
0020
/
002F
S
0053
Т
0054
U
0055
V
0056
W
0057
Икс
0058
Y
0059
Z
005A
ЗАПИСЫВАТЬ
ОТМЕТКА
,
002C
%
0025
2_-
002D
J
004A
K
004B
L
004C
M
004D
N
004E
О
004F
п
0050
Q
0051
р
0052
-0
002D 0030
$
0024
*
002A
3_&
0026
А
0041
B
0042
C
0043
D
0044
E
0045
F
0046
грамм
0047
ЧАС
0048
я
0049
+0
002B 0030
.
002E
¤
00A4
ГРУППА
ОТМЕТКА

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный


CDC 1604: Перфокарта коды
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
0
0030
=
003D

2212
1_SP
0020
/
002F
S
0053
Т
0054
U
0055
V
0056
W
0057
Икс
0058
Y
0059
Z
005A
,
002C
(
0028
2_
2014
J
004A
K
004B
L
004C
M
004D
N
004E
О
004F
п
0050
Q
0051
р
0052
-0
002D 0030
$
0024
*
002A
3_+
002B
А
0041
B
0042
C
0043
D
0044
E
0045
F
0046
грамм
0047
ЧАС
0048
я
0049
+0
002B 0030
.
002E
)
0029


CDC 1612: коды принтеров (бизнес-приложения)
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_:
003A
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
0
0030
=
003D

2260

2264
!
0021
[
005B
1_SP
0020
/
002F
S
0053
Т
0054
U
0055
V
0056
W
0057
Икс
0058
Y
0059
Z
005A
]
005D
,
002C
(
0028

2192

2261
~
007E
2_
2212
J
004A
K
004B
L
004C
M
004D
N
004E
О
004F
п
0050
Q
0051
р
0052
%
0025
$
0024
*
002A

2191

2193
>
003E
3_+
002B
А
0041
B
0042
C
0043
D
0044
E
0045
F
0046
грамм
0047
ЧАС
0048
я
0049
<
003C
.
002E
)
0029

2265
?
003F
;
003B

Примеры шестибитных вариантов ASCII

DEC SIXBIT
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
1_0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
2_@
0040
А
0041
B
0042
C
0043
D
0044
E
0045
F
0046
грамм
0047
ЧАС
0048
я
0049
J
004A
K
004B
L
004C
M
004D
N
004E
О
004F
3_п
0050
Q
0051
р
0052
S
0053
Т
0054
U
0055
V
0056
W
0057
Икс
0058
Y
0059
Z
005A
[
005B

005C
]
005D
^
005E
_
005F

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный


ECMA-1
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_SP
0020
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
ТАК
000E
SI
000F
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
1_0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
2_NUL
0000
А
0041
B
0042
C
0043
D
0044
E
0045
F
0046
грамм
0047
ЧАС
0048
я
0049
J
004A
K
004B
L
004C
M
004D
N
004E
О
004F
3_п
0050
Q
0051
р
0052
S
0053
Т
0054
U
0055
V
0056
W
0057
Икс
0058
Y
0059
Z
005A
[
005B

005C
]
005D
ESC
001B
DEL
007F


Мэйнфреймы ICL
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
1_SP
0020
!
0021
"
0022
#
0023
£
00A3
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
2_@
0040
А
0041
B
0042
C
0043
D
0044
E
0045
F
0046
грамм
0047
ЧАС
0048
я
0049
J
004A
K
004B
L
004C
M
004D
N
004E
О
004F
3_п
0050
Q
0051
р
0052
S
0053
Т
0054
U
0055
V
0056
W
0057
Икс
0058
Y
0059
Z
005A
[
005B
$
0024
]
005D

2191

2190


SixBit ASCII (используется АИС )[6]
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_@
0040
А
0041
B
0042
C
0043
D
0044
E
0045
F
0046
грамм
0047
ЧАС
0048
я
0049
J
004A
K
004B
L
004C
M
004D
N
004E
О
004F
1_п
0050
Q
0051
р
0052
S
0053
Т
0054
U
0055
V
0056
W
0057
Икс
0058
Y
0059
Z
005A
[
005B

005C
]
005D
^
005E
_
005F
2_SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F

6-битный код ГОСТ

ГОСТ 6-битный код
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
+
002B
-
002D
/
002F
,
002C
.
002E
SP
0020
1_
23E8

2191
(
0028
)
0029
×
00D7
=
003D
;
003B
[
005B
]
005D
*
002A

2018

2019

2260
<
003C
>
003E
:
003A
2_А
0410
Б
0411
В
0412
Г
0413
Д
0414
Е
0415
Ж
0416
З
0417
И
0418
Й
0419
К
041A
Л
041B
М
041C
Н
041D
О
041E
П
041F
3_Р
0420
С
0421
Т
0422
У
0423
Ф
0424
Х
0425
Ц
0426
Ч
0427
Ш
0428
Щ
0429
Ы
042B
Ь
042C
Э
042D
Ю
042E
Я
042F
DEL
007F

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный

Пример шестибитных кодов Брайля

В следующей таблице показано расположение символов с шестнадцатеричным значением, соответствующим символом ASCII, 6-битными кодами Брайля (комбинации точек), шрифтом Брайля. Unicode глиф и общее значение (фактическое значение может меняться в зависимости от контекста).[7][8]

HexASCII-символТочки БрайляГлиф БрайляЗначение шрифта Брайля
20(Космос)⠀ (пустой шаблон Брайля)(Космос)
21!2-3-4-6⠮ (точки шрифта Брайля-2346)то
22"5⠐ (точки шрифта Брайля-5)(сокращение)
23#3-4-5-6⠼ (точки Брайля-3456)(префикс номера)
24$1-2-4-6⠫ (точки шрифта Брайля-1246)ред
25%1-4-6⠩ (точка брайля-146)ш
26&1-2-3-4-6⠯ (точки шрифта Брайля-12346)и
27'3⠄ (точки-3 шаблона Брайля)'
28(1-2-3-5-6⠷ (точка шрифта Брайля-12356)из
29)2-3-4-5-6⠾ (точки шрифта Брайля-23456)с
*1-6⠡ (точки шрифта Брайля-16)ch
2B+3-4-6⠬ (точка Брайля-346)ing
2C,6⠠ (точки брайля-6)(префикс в верхнем регистре)
2D-3-6⠤ (точки шрифта Брайля-36)-
2E.4-6⠨ (точки-46 шрифта Брайля)(курсивный префикс)
2F/3-4⠌ (точки-34 шаблона Брайля)ул
3003-5-6⠴ (узор Брайля точки-356)"
3112⠂ (точки шрифта Брайля-2),
3222-3⠆ (точки шрифта Брайля-23);
3332-5⠒ (точки шрифта Брайля-25):
3442-5-6⠲ (точек шрифта Брайля-256).
3552-6⠢ (точки-26 образца Брайля)en
3662-3-5⠖ (точки шрифта Брайля-235)!
3772-3-5-6⠶ (точки шрифта Брайля-2356)( или же )
3882-3-6⠦ (точки шрифта Брайля-236)" или же ?
3993-5⠔ (точки-35 шрифта Брайля)в
:1-5-6⠱ (точка брайля-156)wh
3B;5-6⠰ (точки брайля-56)(буквенный префикс)
3C<1-2-6⠣ (точки брайля-126)gh
3D=1-2-3-4-5-6⠿ (точки шрифта Брайля-123456)за
3E>3-4-5⠜ (точка Брайля-345)ар
3F?1-4-5-6⠹ (точки шрифта Брайля-1456)th
 
HexASCII-символТочки БрайляГлиф БрайляЗначение шрифта Брайля
40@4⠈ (точки шрифта Брайля-4)(префикс акцента)
41А1⠁ (точки шрифта Брайля-1)а
42B1-2⠃ (точки шрифта Брайля-12)б
43C1-4⠉ (точки-14 шрифта Брайля)c
44D1-4-5⠙ (точки брайля-145)d
45E1-5⠑ (точки шрифта Брайля-15)е
46F1-2-4⠋ (точки шрифта Брайля-124)ж
47грамм1-2-4-5⠛ (точки шрифта Брайля-1245)грамм
48ЧАС1-2-5⠓ (точки шрифта Брайля-125)час
49я2-4⠊ (точки-24 шаблона Брайля)я
J2-4-5⠚ (точки шрифта Брайля-245)j
4BK1-3⠅ (точки шрифта Брайля-13)k
4CL1-2-3⠇ (точки-123 шаблона Брайля)л
4DM1-3-4⠍ (точки шрифта Брайля-134)м
4EN1-3-4-5⠝ (точки шрифта Брайля-1345)п
4FО1-3-5⠕ (точки шрифта Брайля-135)о
50п1-2-3-4⠏ (точки шрифта Брайля-1234)п
51Q1-2-3-4-5⠟ (точки шрифта Брайля-12345)q
52р1-2-3-5⠗ (точки шрифта Брайля-1235)р
53S2-3-4⠎ (точки шрифта Брайля-234)s
54Т2-3-4-5⠞ (точки шрифта Брайля-2345)т
55U1-3-6⠥ (точки брайля-136)ты
56V1-2-3-6⠧ (точки шрифта Брайля-1236)v
57W2-4-5-6⠺ (точки шрифта Брайля-2456)ш
58Икс1-3-4-6⠭ (точки шрифта Брайля-1346)Икс
59Y1-3-4-5-6⠽ (точки шрифта Брайля-13456)у
Z1-3-5-6⠵ (точки шрифта Брайля-1356)z
5B[2-4-6⠪ (точки шрифта Брайля-246)ой
5C1-2-5-6⠳ (точки шрифта Брайля-1256)ОУ
5D]1-2-4-5-6⠻ (точки шрифта Брайля-12456)э
5E^4-5⠘ (точки шрифта Брайля-45)(сокращение)
5F_4-5-6⠸ (точки шрифта Брайля-456)(сокращение)

Смотрите также

Рекомендации

  1. ^ Корпорация IBM (1954). 704 электронная машина обработки данных: руководство по эксплуатации (PDF).
  2. ^ Велтер, Марк; Сполярич, Брайан В. (2000-11-16). «UTF-6 - еще одна кодировка, совместимая с ASCII для идентификаторов». Инженерная группа Интернета. В архиве из оригинала от 23.05.2016. Получено 2016-04-09.
  3. ^ Маккензи, Чарльз Э. (1980). Наборы кодированных символов, история и развитие. Серия системного программирования (1-е изд.). Addison-Wesley Publishing Company, Inc. п. 64. ISBN  0-201-14460-3. LCCN  77-90165. ISBN  978-0-201-14460-4. Получено 2016-05-22.
  4. ^ Уокер, Джон (1996-08-06). "Код FIELDATA для UNIVAC серии 1100". Воспоминания UNIVAC. В архиве из оригинала от 22.05.2016. Получено 2016-05-22.
  5. ^ Дженнингс, Томас Дэниел (2016-04-20) [1999]. «Аннотированная история некоторых кодов символов или ASCII: американский стандартный код для проникновения информации». Мировые энергетические системы (WPS). В архиве из оригинала от 22.05.2016. Получено 2016-05-22.
  6. ^ Раймонд, Эрик С. (2017-08-29). «Типы данных полезной нагрузки AIS». catb.org. Получено 2017-11-16.
  7. ^ «Представление и отображение шрифта Брайля». DotlessBraille.org. 2002-02-20. Получено 2009-08-09.
  8. ^ Халлек, Джон (2000-08-24). "braille-ascii.ads". Брайль.Ascii. Получено 2009-08-10.

внешняя ссылка