Базовая латынь (блок Unicode) - Basic Latin (Unicode block)
C0 контролирует и Базовая латынь | |
---|---|
Классифицировать | U + 0000..U + 007F (128 кодовых точек) |
Самолет | BMP |
Скрипты | латинский (52 символа) Общий (76 знаков) |
Основные алфавиты | английский Французский Немецкий испанский вьетнамский |
Наборы символов | арабские цифры Пунктуация |
Назначенный | 128 кодовых точек 33 Управление или форматирование |
Неиспользованный | 0 зарезервированных кодовых точек |
Исходные стандарты | ISO / IEC 8859, ISO 646 |
История версий Unicode | |
1.0.0 | 128 (+128) |
Примечание: [1][2] |
В Базовая латынь или же C0 Controls и базовая латынь Блок Unicode это первый блок Unicode стандарт, и единственный блок, который закодирован одним байтом в UTF-8. Блок содержит все буквы и коды управления кодировки ASCII. Он варьируется от U + 0000 до U + 007F, содержит 128 символов и включает C0 контролирует, ASCII пунктуация и символы, ASCII цифры, как верхний регистр и строчная буква из английский алфавит и управляющий персонаж.
Блок Basic Latin был включен в его нынешнем виде из версии 1.0.0 стандарта Unicode, без добавления или изменения репертуара символов.[3] Его имя блока в Unicode 1.0 было ASCII.[4]
Таблица персонажей
- А Буква U + 005C () может отображаться как знак йены (¥) или вон (₩) в японских / корейских шрифтах, ошибочно принимающих Unicode (особенно UTF-8 ) как устаревший набор символов, который заменил обратную косую черту этими знаками.[5]
Подзаголовки
Блок C0 Controls и Basic Latin содержит шесть подзаголовков.[6]
C0 контролирует
В C0 Элементы управления, называемые управляющими кодами C0 ASCII в версии 1.0, унаследованы от ASCII и других 7-битных и 8-битных схем кодирования. Имена псевдонимов для элементов управления C0 взяты из ИСО / МЭК 6429: 1992 стандарт.[6]
Пунктуация и символы ASCII
В данном подзаголовке используются стандартные символы пунктуации, простые математические операторы, а также символы, такие как знак доллара, процент, амперсанд, подчеркивание и вертикальная черта.[6]
Цифры ASCII
Подзаголовок цифр ASCII содержит стандартные европейские цифровые символы 1–9 и 0.[6]
Латинский алфавит в верхнем регистре
Подзаголовок прописного латинского алфавита содержит стандартный 26-буквенный латинский алфавит без ударения в маюскула.[6]
Строчный латинский алфавит
Подзаголовок нижнего латинского алфавита содержит стандартный 26-буквенный латинский алфавит без ударения в крошечный.[6]
Управляющий персонаж
Подзаголовок управляющего символа содержит символ «Удалить».[6]
Количество символов, букв и контрольных кодов
В таблице ниже показано количество буквы, символы и контрольные коды в каждом из подзаголовков в блоке C0 Controls и Basic Latin.
Тип подзаголовка | Количество символов | Диапазон персонажей |
---|---|---|
C0 контролирует | 32 управляющих кода | U + 0000 - U + 001F |
Пунктуация и символы ASCII | 33 знака препинания и символа | От U + 0020 до U + 002F, от U + 003A до U + 0040, от U + 005B до U + 0060 и от U + 007B до U + 007E |
Цифры ASCII | 10 цифр | U + 0030 - U + 0039 |
Латинский алфавит в верхнем регистре | 26 латинских букв без ударения в маюскуле. | U + 0041 - U + 005A |
Строчный латинский алфавит | 26 латинских букв без ударения в минускуле. | U + 0061 - U + 007A |
Управляющий персонаж | 1 управляющий код, содержащий символ «Удалить». | U + 007F |
Блокировать
C0 Controls и базовая латынь[1] Таблица кодов официального консорциума Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | B | C | D | E | F | |
U + 000x | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | ТАК | SI |
U + 001x | DLE | DC1 | DC2 | DC3 | DC4 | НАК | SYN | ETB | МОЖЕТ | ЭМ | SUB | ESC | FS | GS | RS | нас |
U + 002x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
U + 003x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
U + 004x | @ | А | B | C | D | E | F | грамм | ЧАС | я | J | K | L | M | N | О |
U + 005x | п | Q | р | S | Т | U | V | W | Икс | Y | Z | [ | ] | ^ | _ | |
U + 006x | ` | а | б | c | d | е | ж | грамм | час | я | j | k | л | м | п | о |
U + 007x | п | q | р | s | т | ты | v | ш | Икс | у | z | { | | | } | ~ | DEL |
Примечания
|
Варианты
Некоторые символы определены для рендеринга как стандартизированный вариант если за ними следуют вариантные индикаторы.
Для нуля с коротким диагональным ходом определен вариант: U + 0030 DIGIT ZERO, U + FE00 VS1 (0︀).[7][8]
За двенадцатью символами (#, * и цифры) может следовать U + FE0E VS15 или U + FE0F VS16 для создания смайлики варианты.[9][10][11][12]Они есть колпачок базовые символы, например # ️⃣ (U + 0023 НОМЕРНЫЙ ЗНАК U + FE0F VS16 U + 20E3 ОБЪЕДИНЕНИЕ ЗАКРЫТИЯ КЛАВИАТУРЫ). Версия VS15 - это «текстовое представление», а версия VS16 - «в стиле эмодзи».[8]
U + | 0023 | 002A | 0030 | 0031 | 0032 | 0033 | 0034 | 0035 | 0036 | 0037 | 0038 | 0039 |
основание | # | * | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
база + VS15 + колпачок | #︎⃣ | *︎⃣ | 0︎⃣ | 1︎⃣ | 2︎⃣ | 3︎⃣ | 4︎⃣ | 5︎⃣ | 6︎⃣ | 7︎⃣ | 8︎⃣ | 9︎⃣ |
база + VS16 + колпачок | #️⃣ | *️⃣ | 0️⃣ | 1️⃣ | 2️⃣ | 3️⃣ | 4️⃣ | 5️⃣ | 6️⃣ | 7️⃣ | 8️⃣ | 9️⃣ |
История
Следующие документы, связанные с Unicode, фиксируют цель и процесс определения конкретных символов в блоке Basic Latin:
Версия | Окончательный код[а] | Считать | универсальное глобальное время Я БЫ | L2 Я БЫ | WG2 Я БЫ | Документ |
---|---|---|---|---|---|---|
1.0.0 | U + 0000..007F | 128 | (быть определенным) | |||
UTC / 1999-013 | Карлссон, Кент (1999-05-27), Тильды и разложение микрознаков | |||||
L2 / 99-176R | Мур, Лиза (1999-11-04), "Micro Sign Case Mappings", Протокол совместного заседания UTC / L2 в Сиэтле 8-10 июня 1999 г. | |||||
L2 / 04-145 | Старнер, Дэвид (2004-04-30), C с примерами штрихового символа из отчета BAE 1884 (Дорси) | |||||
L2 / 04-202 | Андерсон, Дебора (07.06.2004), Обрезанная обратная связь C | |||||
N3046 | Suignard, Мишель (22 февраля 2006 г.), Улучшение формального определения управляющих символов | |||||
N3103 (pdf, док ) | Умамахесваран В. С. (25 августа 2006 г.), "M48.33", Неподтвержденный протокол заседания РГ 2 48, Маунтин-Вью, Калифорния, США; 2006-04-24 / 27 | |||||
L2 / 11-043 | Фрейтаг, Асмус; Карлссон, Кент (02.02.2011), Предложение по исправлению ошибок и несоответствий в присвоении определенных свойств для букв верхнего и нижнего индекса | |||||
L2 / 11-160 | PRI # 181 Изменение общей категории двенадцати символов, 2011-05-02 | |||||
L2 / 11-261R2 | Мур, Лиза (2011-08-16), «Консенсус 128-C3», UTC # 128 / L2 # 225 минут, Примите рекомендации Кена Уистлера в L2 / 11-281 по псевдонимам имен для управляющих символов с добавлением сокращений BEL и NUL. | |||||
L2 / 11-438[b][c] | N4182 | Эдберг, Питер (22 декабря 2011 г.), Последовательности вариаций эмодзи (редакция L2 / 11-429) | ||||
L2 / 15-107 | Мур, Лиза (2015-05-12), «Консенсус 143-C5», UTC # 143 минуты, Добавьте 12 последовательностей клавиш в emoji-data.txt как предварительные именованные последовательности в Unicode 8.0. | |||||
L2 / 15-268 | Битон, Барбара; Фрейтаг, Асмус; Янку, Лауреньиу; Сарджент, Мюррей (30.10.2015), Предложение представить нулевой вариант пустого множества с косой чертой | |||||
L2 / 15-301[d][c] | Пурнадер, Рузбех (01.11.2015), Предложение по 278 стандартизированным последовательностям вариаций для смайлов. | |||||
L2 / 15-254 | Мур, Лиза (2015-11-16), "B.12.1.2 Предложение по представлению варианта с нулевым косым чертом для пустого множества", UTC # 145 минут | |||||
L2 / 17-294 | N4914 | Лунде, Кен (2017-08-14), Предложение добавить стандартизированную последовательность вариантов для U + FF10 FULLWIDTH DIGIT ZERO | ||||
|
Смотрите также
Рекомендации
- ^ «База данных символов Юникода». Стандарт Юникода. Получено 2016-07-09.
- ^ «Нумерованные версии стандарта Unicode». Стандарт Юникода. Получено 2016-07-09.
- ^ Стандартная версия Unicode 1.0, том 1. Аддисон-Уэсли Паблишинг Компани, Инк. 1990 г. ISBN 0-201-56788-1.
- ^ «3.8: Блок-за-блок-схемы» (PDF). Стандарт Юникода. версия 1.0. Консорциум Unicode.
- ^ Сортировка всего: когда обратная косая черта не является обратной?
- ^ а б c d е ж грамм «Кодовые таблицы Unicode 6.2» (PDF). Стандарт Юникода. Получено 1 апреля 2013.
- ^ Битон, Барбара; Фрейтаг, Асмус; Янку, Лауреньиу; Сарджент, Мюррей (30 октября 2015 г.). «L2 / 15-268: Предложение по представлению нулевого варианта с косой чертой для пустого множества» (PDF).
- ^ а б "Последовательности вариаций эмодзи UTS # 51". Консорциум Unicode.
- ^ Эдберг, Питер (2011-12-22). «L2 / 11-438: Последовательности вариаций эмодзи (редакция L2 / 11-429)» (PDF).
- ^ Пурнадер, Рузбех (01.11.2015). «L2 / 15-301: предложение для 278 стандартизированных последовательностей вариантов для смайликов» (PDF).
- ^ "UTR # 51: Unicode Emoji". Консорциум Unicode. 2020-02-11.
- ^ "UCD: данные эмодзи для UTR №51". Консорциум Unicode. 2020-01-28.