ISO 2033 - ISO 2033
В ISO 2033: 1983 стандарт («Кодирование машиночитаемых символов (MICR и OCR)»)[1] определяет наборы символов для использования с Оптическое распознавание символов или же Распознавание символов магнитными чернилами системы. Японский стандарт JIS X 9010: 1984 («Кодирование машиночитаемых символов (OCR и MICR)», первоначально обозначенный JIS C 6229-1984) тесно связано.[2]
Набор символов для OCR-A
Версия кодировки для Шрифт OCR-A зарегистрирован в ISO-IR регистрировать как ISO-IR-91 - это японская (JIS X 9010 / JIS C 6229) версия, которая отличается от кодировки, определенной в ISO 2033, только добавлением Знак иены (показано ниже заштрихованным).[2]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | EOT 0004 | ENQ 0005 | ACK 0006 | BEL 0007 | BS 0008 | HT 0009 | LF 000A | VT 000B | FF 000C | CR 000D | ТАК 000E | SI 000F |
1_ 16 | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | DC4 0014 | НАК 0015 | SYN 0016 | ETB 0017 | МОЖЕТ 0018 | ЭМ 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | нас 001F |
2_ 32 | SP 0020 | " 0022 | £ 00A3 | $ 0024 | % 0025 | & 0026 | ' 0027 | { 007B | } 007D | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F | |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | ⑀ 2440 | = 003D | ⑁ 2441 | ? 003F |
4_ 64 | А 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | грамм 0047 | ЧАС 0048 | я 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | О 004F | |
5_ 80 | п 0050 | Q 0051 | р 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | Икс 0058 | Y 0059 | Z 005A | ¥ 00A5 | ⑂ 2442 | |||
6_ 96 | ||||||||||||||||
7_ 112 | | 007C | DEL 007F |
Письмо Число Пунктуация Символ Другой Неопределенный Новое определение по сравнению с JIS-Roman
Набор символов для OCR-B
Версия G0 установлен для Шрифт OCR-B зарегистрирован в ISO-IR регистрировать как ISO-IR-92 это японская версия (JIS X 9010 / JIS C 6229), которая отличается от кодировки, определенной в ISO 2033, только тем, что основана на JIS-Roman (с знак доллара в 0x24 и Знак иены при 0x5C), а не на ISO 646 IRV (с обратная косая черта при 0x5C и в то время универсальный знак валюты (¤) при 0x24).[3] Помимо этих кодовых точек, он отличается от ASCII только опуская в знак (@) и тильда (~).[3] Дополнительный дополнительный набор, зарегистрированный как ISO-IR-93 назначает знак фунта стерлингов (£), знак универсальной валюты (¤) и знак раздела (§) к их ISO-8859-1 кодовых точек, и обратная косая черта к кодовой точке ISO-8859-1 для знака иены.[4]
Набор символов для JIS X 9008 (JIS C 6257)
JIS X 9010 (JIS C 6229) также определяет наборы символов для шрифта OCR JIS X 9008: 1981 (ранее JIS C 6257-1981), напечатанного вручную.[5]:fn1 К ним относятся подмножества JIS X 0201 Римский набор (зарегистрирован как ISO-IR-94 и опуская знак at (@), строчные буквы, Фигурные скобки ({,}) и над чертой (‾)),[5] и набор кана (зарегистрированный как ISO-IR-96 и опуская запятую (、) и точку (。) в восточноазиатском стиле, вставлять (・) И маленькая кана),[6] в дополнение к набору (зарегистрирован как ISO-IR-95), содержащий только обратную косую черту, которая назначена той же кодовой точке, что и в ISO-IR-93.[7]
Шрифт JIS C 6527 стилизует косую черту[5] и обратная косая черта[7] персонажи с удвоенной внешностью. Приведены имена персонажей «Солидус».[5] и «Обратный солидус»,[7] соответствие имен символов Unicode для косой черты ASCII и обратной косой черты.[8] Однако Юникод Оптическое распознавание символов Блок включает дополнительную кодовую точку для "OCR Double Backslash" (⑊), но не для двойной (прямой) косой черты.[9]
Набор символов для E-13B
В ISO-IR-98 кодировка, определенная ISO 2033, кодирует репертуар символов Шрифт E13B, как используется с распознавание символов магнитными чернилами.[10] Хотя ISO 2033 также определяет другие кодировки, кодирование для E-13B - это кодировка, называемая ISO_2033_1983
к Perl libintl,[11] и, как ISO_2033-1983
или же csISO2033
посредством IANA.[12] Другие зарегистрированные лейблы включают iso-ir-98
, это ISO-IR регистрационный номер и просто e13b
.[12]
Цифры сохраняются в своих ASCII локации. Буквы и символы, отсутствующие в шрифте E13B, опускаются, а специальные знаки препинания для банковские чеки включен в добавлен шрифт E13B. Такие же символы доступны в Unicode в Блок оптического распознавания символов.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | EOT 0004 | ENQ 0005 | ACK 0006 | BEL 0007 | BS 0008 | HT 0009 | LF 000A | VT 000B | FF 000C | CR 000D | ТАК 000E | SI 000F |
1_ | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | DC4 0014 | НАК 0015 | SYN 0016 | ETB 0017 | МОЖЕТ 0018 | ЭМ 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | нас 001F |
2_ | SP 0020 | |||||||||||||||
3_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | ⑆ 2446 | ⑇ 2447 | ⑈ 2448 | ⑉ 2449 | ||
4_ | ||||||||||||||||
5_ | ||||||||||||||||
6_ | ||||||||||||||||
7_ | DEL 007F |
Письмо Число Пунктуация Символ Другой Неопределенный Новое определение по сравнению с ASCII
Рекомендации
- ^ ISO / IEC JTC 1 / SC 2 (1983). Обработка информации - Кодирование машиночитаемых символов (MICR и OCR). ISO. ISO 2033: 1983.
- ^ а б ISO / TC97 / SC2 (1985-08-01). ISO-IR-91: Японский набор графических символов OCR-A (PDF). ITSCJ /IPSJ.
- ^ а б ISO / TC97 / SC2 (1985-08-01). ISO-IR-92: базовый набор графических символов японского языка OCR-B (PDF). ITSCJ /IPSJ.
- ^ ISO / TC97 / SC2 (1985-08-01). ISO-IR-93: японский OCR-B - дополнительный набор графических символов (PDF). ITSCJ /IPSJ.
- ^ а б c d ISO / TC97 / SC2 (1985-08-01). ISO-IR-94: Японский базовый набор символов ручной печати для оптического распознавания текста (PDF). ITSCJ /IPSJ.
- ^ ISO / TC97 / SC2 (1985-08-01). ISO-IR-96: Набор символов катаканы, напечатанный вручную для OCR (PDF). ITSCJ /IPSJ.
- ^ а б c ISO / TC97 / SC2 (1985-08-01). ISO-IR-95: Японский дополнительный набор печатных вручную графических символов для OCR (PDF). ITSCJ /IPSJ.
- ^ Консорциум Unicode. «Элементы управления C0 и базовая латынь» (PDF). Стандарт Юникода.
- ^ Консорциум Unicode. "Оптическое распознавание символов" (PDF). Стандарт Юникода.
- ^ ISO / TC97 / SC2 (1985-08-01). ISO-IR-98: Набор из 14 графических символов шрифта E13B (PDF). ITSCJ /IPSJ.
- ^ а б Флор, Гвидо. «Процедуры преобразования для ISO_2033_1983». libintl. Локаль :: RecodeData :: ISO_2033_1983.
- ^ а б «Наборы символов». IANA.
внешняя ссылка
- ISO 2033 распространяется ISO
- JIS X 9010 распространяется AFNOR