Многонациональный набор символов - Multinational Character Set
MIME / IANA | DEC-MCS |
---|---|
Псевдоним (а) | IBM1100, CP1100, WE8DEC, csDECMCS, декабрь |
Язык (и) | английский, различные другие |
Расширяется | US-ASCII |
Преемник | ISO 8859-1, LICS, BraSCII, Кодирование пробки |
В Многонациональный набор символов (DMCS или же MCS) это кодировка символов создан в 1983 г. Корпорация цифрового оборудования (DEC) для использования в популярных VT220 Терминал. Это было 8-битное расширение ASCII добавлены символы с диакритическими знаками, символы валюты, и другие глифы символов, отсутствующие в 7-битном ASCII. Это только один из кодовые страницы реализовано для VT220 Набор национальных заменяющих символов (NRCS).[1][2] MCS зарегистрирован как IBM кодовая страница /CCSID 1100 (Многонациональная эмуляция) с 1992 года.[3][4] В зависимости от связанной сортировки Oracle называет это WE8DEC, N8DEC, DK8DEC, S8DEC, или же SF8DEC.[5][6]
Такой "расширенный ASCII "наборы были обычными (Национальный набор заменяющих символов предоставлял наборы для более чем десятка европейских языков), но MCS является предком ECMA-94 в 1985 году[7] и ISO 8859-1 в 1987 г.[8]
Таблица кодов MCS с ECMA-94, ISO 8859-1 и первыми 256 кодовыми точками Unicode сходства гораздо больше, чем различий. Помимо неиспользуемых кодовых точек, отличия от ISO 8859-1 заключаются в следующем:
Кодовая точка MCS | Отображение Unicode | Характер |
---|---|---|
0xA8 | U + 00A4 | ¤ |
0xD7 | U + 0152 | Œ |
0xDD | U + 0178 | Ÿ |
0xF7 | U + 0153 | œ |
0xFD | U + 00FF | ÿ |
Набор символов
Отличия от ISO-8859-1 показаны более темным оттенком поверх цветов легенды.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | EOT 0004 | ENQ 0005 | ACK 0006 | BEL 0007 | BS 0008 | HT 0009 | LF 000A | VT 000B | FF 000C | CR 000D | ТАК 000E | SI 000F |
1_ 16 | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | DC4 0014 | НАК 0015 | SYN 0016 | ETB 0017 | МОЖЕТ 0018 | ЭМ 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | нас 001F |
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | А 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | грамм 0047 | ЧАС 0048 | я 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | О 004F |
5_ 80 | п 0050 | Q 0051 | р 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | Икс 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | а 0061 | б 0062 | c 0063 | d 0064 | е 0065 | ж 0066 | грамм 0067 | час 0068 | я 0069 | j 006A | k 006B | л 006C | м 006D | п 006E | о 006F |
7_ 112 | п 0070 | q 0071 | р 0072 | s 0073 | т 0074 | ты 0075 | v 0076 | ш 0077 | Икс 0078 | у 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | DEL 007F |
8_ 128 | IND 0084 | NEL 0085 | SSA 0086 | ЕКА 0087 | HTS 0088 | HTJ 0089 | СУДС 008A | PLD 008B | PLU 008C | RI 008D | SS2 008E | SS3 008F | ||||
9_ 144 | DCS 0090 | PU1 0091 | PU2 0092 | СТС 0093 | CCH 0094 | МВт 0095 | СПА 0096 | EPA 0097 | CSI 009B | ST 009C | OSC 009D | ВЕЧЕРА 009E | APC 009F | |||
A_ 160 | ¡ 00A1 | ¢ 00A2 | £ 00A3 | ¥ 00A5 | § 00A7 | ¤ 00A4 | © 00A9 | ª 00AA | « 00AB | |||||||
B_ 176 | ° 00B0 | ± 00B1 | ² 00B2 | ³ 00B3 | µ 00B5 | ¶ 00B6 | · 00B7 | ¹ 00B9 | º 00BA | » 00BB | ¼ 00BC | ½ 00BD | ¿ 00BF | |||
C_ 192 | А 00C0 | Á 00C1 | Â 00C2 | Ã 00C3 | Ä 00C4 | Å 00C5 | Æ 00C6 | Ç 00C7 | È 00C8 | É 00C9 | Ê 00CA | Ë 00CB | Я 00CC | Я 00CD | Я 00CE | Я 00CF |
D_ 208 | Ñ 00D1 | Ò 00D2 | Ó 00D3 | Ô 00D4 | Õ 00D5 | Ö 00D6 | Œ 0152 | Ø 00D8 | Ù 00D9 | Ú 00DA | Û 00 дБ | Ü 00DC | Ÿ 0178 | SS 00DF | ||
E_ 224 | à 00E0 | á 00E1 | â 00E2 | ã 00E3 | ä 00E4 | å 00E5 | æ 00E6 | ç 00E7 | è 00E8 | é 00E9 | ê 00EA | ë 00EB | я 00EC | я 00ED | я 00EE | я 00EF |
F_ 240 | ñ 00F1 | ò 00F2 | ó 00F3 | ô 00F4 | х 00F5 | ö 00F6 | œ 0153 | ø 00F8 | ù 00F9 | ú 00FA | û 00FB | ü 00FC | ÿ 00FF |
Письмо Число Пунктуация Символ Другой Неопределенный
Смотрите также
- Набор символов Lotus International (LICS), очень похожий набор символов
- BraSCII, очень похожий набор символов
- 8-битный DEC греческий (Кодовая страница 1287 )
- 8-битный DEC Турецкий (Кодовая страница 1288 )
- 8-битный DEC иврит
- 8-битная кириллица DEC (КОИ-8 кириллица )
- 8 бит Специальная графика DEC (Рисование линии VT100) (DEC-SPECIAL )
- 8 бит Набор технических символов DEC (DEC-TECHNICAL )
- DEC Kanji (JIS X 0208 )
Рекомендации
- ^ "Справочное руководство программиста VT220" (2-е изд.). Корпорация цифрового оборудования (DEC). 1984 [1983].
- ^ «Эмулятор TinyTERM - Национальный набор заменяемых символов (NRCS)». Century Software. В архиве из оригинала на 2016-12-01. Получено 2016-12-01. [sic]
- ^ а б "Информация о кодовой странице SBCS - CPGID: 01100 / Название: Многонациональная эмуляция". Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц. 1. IBM. 1992-10-01. В архиве из оригинала от 03.12.2016. Получено 2016-12-02. [1] [2] [3]
- ^ «Информационный документ CCSID 1100». Архивировано из оригинал на 2014-12-01.
- ^ Бэрд, Кэти; Чиба, Дэн; Чу, Уинсон; Фан, Джессика; Хо, Клэр; Закон, Саймон; Ли, Джефф; Линсли, Питер; Мацуда, Кени; Осрофт, Тамзин; Такеда, Шиге; Танака, Линус; Тозава, Макото; Трюте, Барри; Цудзимото, Маюми; У, Инь; Яу, Майкл; Ю, Тим; Ван, Чао; Вонг, Саймон; Чжан, Вейран; Чжэн, Лэй; Чжу, Ян; Мур, Валари (2002) [1996]. «Приложение A: Данные локали». Руководство по поддержке глобализации баз данных Oracle9i (PDF) (Выпуск 2 (9.2) изд.). Корпорация Oracle. Оракул A96529-01. В архиве (PDF) из оригинала на 2017-02-14. Получено 2017-02-14.
- ^ "Описание набора символов Oracle для 9.2". Дневные химические информационные системы. 2017 г. В архиве из оригинала от 17.06.2016. Получено 2017-02-14.
- ^ Стандартный ECMA-94: 8-битный однобайтовый набор графических символов (PDF) (1-е изд.). Европейская ассоциация производителей компьютеров (ECMA). Март 1985 [1984-12-14]. В архиве (PDF) из оригинала от 02.12.2016. Получено 2016-12-01.
С 1982 года острая необходимость в 8-битном однобайтовом кодированном наборе символов была признана в ECMA, а также в ANSI / X3L2, и эти две группы обменялись многочисленными рабочими документами. В феврале 1984 года ECMA TC1 представил ISO / TC97 / SC2 предложение о таком наборе кодированных символов. На своем заседании в апреле 1984 года SC решил подать в TC97 предложение о новом элементе работы по этой теме. Технические обсуждения во время и после этой встречи привели TC1 к принятию схемы кодирования, предложенной X3L2. Часть 1 проекта международного стандарта DTS 8859 основана на этом совместном предложении ANSI / ECMA .... Принят в качестве стандарта ECMA Генеральной ассамблеей 13–14 декабря 1984 г.
- ^ Чиборра, Роман (1998). «ISO 8859-1 и MCS». Суп с алфавитом ISO 8859. В архиве из оригинала на 2016-12-01. Получено 2016-12-01. [4] [5]
- ^ "Справочное руководство программиста VT220". Корпорация цифрового оборудования (DEC). Таблица 2-3: Многонациональный набор символов DEC (коды C1 и GR). Получено 2016-12-02.
- ^ VAX / VMS Руководство пользователя. Корпорация цифрового оборудования (DEC). Апрель 1986 г. AI-Y517A-TE.
- ^ DEC (февраль 1992 г.) [ноябрь 1989 г.]. «Глава 2: Кодирование символов - Набор дополнительных графических символов DEC». Справочное руководство программатора VT420 (PDF) (2-е изд.). Корпорация цифрового оборудования. С. 24–25. EK – VT420 – RM.002. В архиве (PDF) из оригинала от 29.01.2017. Получено 2017-01-29.
- ^ Флор, Гвидо (2016) [2006]. "Locale :: RecodeData :: DEC_MCS - Процедуры преобразования для DEC_MCS". CPAN libintl-perl. 1.0. В архиве из оригинала на 2017-01-14. Получено 2017-01-14.
- ^ Костис, Коста. «Многонациональный набор символов DEC (DEC MCS)». 1.20. В архиве из оригинала на 2017-01-16. Получено 2017-01-16.
- ^ Коуэн, Джон Вольдемар (1999-07-07). "Многонациональный набор символов DEC (1987) в Unicode". 0.1. Unicode, Inc. Архивировано из оригинал на 2017-02-18. Получено 2017-02-18.