VSCII - VSCII
Псевдоним (а) | x-viet-tcvn5712 [1] |
---|---|
Язык (и) | вьетнамский, английский |
Сделано | TCVN / TC1 |
Стандарт | TCVN 5712: 1993 |
Классификация | 8 бит SBCS; Расширенный ASCII (ВСКИИ-2 / -3) |
VSCII (Вьетнамский стандартный код для обмена информацией), также известный как TCVN 5712,[2] ISO-IR-180,[3] .VN,[4] ABC[4] или просто Кодировки TCVN,[4][5] представляет собой набор из трех тесно связанных Вьетнамский национальный стандарт кодировки символов за использование вьетнамского языка с компьютерами, разработанный Техническим комитетом по информационным технологиям TCVN (TCVN / TC1) и впервые принятый в 1993 году (как TCVN 5712: 1993).[2]
Его не следует путать с одноименным неофициальным VISCII кодирование, которое иногда использовалось иностранцами, говорящими на вьетнамском языке.[4] VISCII также должен был обозначать Вьетнамский стандартный код для обмена информацией, но не имеет отношения к VSCII.[6]
VSCII (TCVN) широко использовался на севере Вьетнама, в то время как ВНИ был популярен на юге.[4] Unicode и Окна-1258 кодовые страницы теперь используются практически для всех вьетнамских компьютерных данных,[нужна цитата ] но устаревшие файлы или заархивированные сообщения могут нуждаться в преобразовании.
Кодировки
Все три формы VSCII сохраняют 95 печатных символов ASCII немодифицированный.
ВСКИИ-3, также известный как TCVN 5712-3, VN3 или просто TCVN3,[7] включает наименьшее количество заданий. Это расширенный ASCII, потому что он сохраняет все 128 кодов ASCII без изменений. Он не переназначает ни один из Коды управления C0 и C1. В сравнении с ASCII, он добавляет 75 символов:
- 67 строчных символов, что обеспечивает полную поддержку строчных букв.
- 7 символов в верхнем регистре, что обеспечивает поддержку прописных букв для 29 базовых букв без тоновых знаков.
- В неразрывное пространство.
Тональные отметки на гласных в верхнем регистре выполняются в TCVN3 путем переключения на шрифт, состоящий только из заглавных букв.[8]
ВСКИИ-2, также известный как TCVN 5712-2 и VN2, является расширенным набором VSCII-3. Это расширенный ASCII, потому что он сохраняет все 128 кодов ASCII без изменений. Он не переназначает ни один из Коды управления C0 и C1, что делает его совместимым с ISO 2022 как 96-набор.[2][3] По сравнению с VSCII-3 он добавляет (всего 96 символов, отличных от ASCII):
- Еще 16 прописных символов с заранее составленными тональными метками (всего 23 прописных символа, отличных от ASCII)
- 5 сочетание диакритических знаков за тональные знаки, позволяя представить другие комбинации прописных букв и тоновых знаков. Комбинированные знаки следуют базовой букве[2] как в ВНИ (а не предшествовать им, как в ANSEL ).
ВСКИИ-1, также известный как TCVN 5712-1 и VN1, является расширением VSCII-2 и является модифицированным ASCII, поскольку заменяет 12 из 33 управляющие символы с заранее составленными символами. По сравнению с VSCII-2 он (всего 140 символов, отличных от ASCII):
- Добавляет еще 44 заранее составленных заглавных буквы, доводя их до того же количества, что и строчных
- Делается это путем замены 12 управляющих символов ASCII и выделения 32 графических символов в область управления C1, нарушая совместимость ISO 2022.
Преобразование из VSCII-3 в VSCII-2 или VSCII-1 и преобразование из VSCII-2 в VSCII-1 не требуется, но может привести к уменьшению размера файлов.
Преобразование из VSCII-1 в VSCII-2 или VSCII-3 и преобразование из VSCII-2 в VSCII-3 требует расширения некоторых предварительно составленных символов.
Набор символов
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | Ú 00DA | Ụ 1EE4 | ETX 0003 | Ừ 1EEA | Ử 1EEC | Ữ 1EEE | BEL 0007 | BS 0008 | HT 0009 | LF 000A | VT 000B | FF 000C | CR 000D | ТАК 000E | SI 000F |
1_ 16 | DLE 0010 | Ứ 1EE8 | Ự 1EF0 | Ỳ 1EF2 | Ỷ 1EF6 | Ỹ 1EF8 | Ý 00DD | Ỵ 1EF4 | МОЖЕТ 0018 | ЭМ 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | нас 001F |
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | А 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | грамм 0047 | ЧАС 0048 | я 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | О 004F |
5_ 80 | п 0050 | Q 0051 | р 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | Икс 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | а 0061 | б 0062 | c 0063 | d 0064 | е 0065 | ж 0066 | грамм 0067 | час 0068 | я 0069 | j 006A | k 006B | л 006C | м 006D | п 006E | о 006F |
7_ 112 | п 0070 | q 0071 | р 0072 | s 0073 | т 0074 | ты 0075 | v 0076 | ш 0077 | Икс 0078 | у 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | DEL 007F |
8_ 128 | А 00C0 | Ả 1EA2 | Ã 00C3 | Á 00C1 | Ạ 1EA0 | Ặ 1EB6 | Ậ 1EAC | È 00C8 | Ẻ 1EBA | Ẽ 1EBC | É 00C9 | Ẹ 1EB8 | Ệ 1EC6 | Я 00CC | Я 1EC8 | Я 0128 |
9_ 144 | Я 00CD | Я 1ECA | Ò 00D2 | Ỏ 1ECE | Õ 00D5 | Ó 00D3 | Ọ 1ECC | Ộ 1ED8 | Ờ 1EDC | Ở 1EDE | Ỡ 1EE0 | Ớ 1EDA | Ợ 1EE2 | Ù 00D9 | Ủ 1EE6 | Ũ 0168 |
A_ 160 | NBSP 00A0 | Ă 0102 | Â 00C2 | Ê 00CA | Ô 00D4 | Ơ 01A0 | Ư 01AF | Đ 0110 | ă 0103 | â 00E2 | ê 00EA | ô 00F4 | ơ 01A1 | ư 01B0 | đ 0111 | Ằ 1EB0 |
B_ 176 | ̀ 0300 | ̉ 0309 | ̃ 0303 | ́ 0301 | ̣ 0323 | à 00E0 | ả 1EA3 | ã 00E3 | á 00E1 | ạ 1EA1 | Ẳ 1EB2 | ằ 1EB1 | ẳ 1EB3 | ẵ 1EB5 | ắ 1EAF | Ẵ 1EB4 |
C_ 192 | Ắ 1EAE | Ầ 1EA6 | Ẩ 1EA8 | Ẫ 1EAA | Ấ 1EA4 | Ề 1EC0 | ặ 1EB7 | ầ 1EA7 | ẩ 1EA9 | ẫ 1EAB | ấ 1EA5 | ậ 1EAD | è 00E8 | Ể 1EC2 | ẻ 1EBB | ẽ 1EBD |
D_ 208 | é 00E9 | ẹ 1EB9 | ề 1EC1 | ể 1EC3 | ễ 1EC5 | ế 1EBF | ệ 1EC7 | я 00EC | я 1EC9 | Ễ 1EC4 | Ế 1EBE | Ồ 1ED2 | я 0129 | я 00ED | я 1ECB | ò 00F2 |
E_ 224 | Ổ 1ED4 | ỏ 1ECF | х 00F5 | ó 00F3 | ọ 1ECD | ồ 1ED3 | ổ 1ED5 | ỗ 1ED7 | ố 1ED1 | ộ 1ED9 | ờ 1EDD | ở 1EDF | ỡ 1EE1 | ớ 1EDB | ợ 1EE3 | ù 00F9 |
F_ 240 | Ỗ 1ED6 | ủ 1EE7 | ũ 0169 | ú 00FA | ụ 1EE5 | ừ 1EEB | ử 1EED | ữ 1EEF | ứ 1EE9 | ự 1EF1 | ỳ 1EF3 | ỷ 1EF7 | ỹ 1EF9 | ý 00FD | ỵ 1EF5 | Ố 1ED0 |
Письмо Число Пунктуация Символ Другой Неопределенный
Затенение шахматной доски указывает символы, которых нет в VSCII-3. Затененные символы в строках 0_, 1_, 8_ и 9_ не входят в VSCII-2 или VSCII-3.[9]
Рекомендации
- ^ Сивонен, Анри (26.09.2014). «Для изменения кодировки символов в m-c требуется действие c-c». mozilla.dev.apps.thunderbird.
- ^ а б c d е "[новости] TCVN 5712: 1993 (VSCII) - вьетнамский национальный стандарт". 1993-06-02. Архивировано из оригинал на 2017-01-11.
- ^ а б TVCN (1993). «ISO-IR-180: Правая часть кодовой таблицы VSCII-2» (PDF). ITSCJ /IPSJ.
- ^ а б c d е Нго, Хок Динь; Тран, Тубинь. «5. Зачем нужна вьетнамская кодировка (набор символов - кодировка)?». Некоторые специальные функции WinVNKey.
- ^ Нгуен, Минь Т. «Вьетнамские преобразования (Vietnet / VIQR, VNI, VPS, VISCII, VNU, TCVN, VietWare, unicode)».
- ^ Лунде, Кен. «Глава 1: Обзор обработки информации CJKV (§ Идентичны ли VISCII и VSCII? А как насчет TCVN?)». CJKV Обработка информации (2-е изд.). п. 17. ISBN 978-0-596-51447-1.
- ^ "Юникод и вьетнамские кодировки символов из унаследованных". Вьетнамский Unicode: часто задаваемые вопросы.
- ^ "Юникод и вьетнамские кодировки символов из унаследованных". Вьетнамский Unicode: часто задаваемые вопросы.
TCVN3 не является двухбайтовым, но из-за характера его кодирования заглавные буквы (гласные) отображаются в отдельный заглавный шрифт, аналогичный обычному строчному.
- ^ Лунде, Кен. «Приложение L: вьетнамские наборы символов» (PDF). CJKV Обработка информации (2-е изд.). ISBN 978-0-596-51447-1.