Блок Юникода - Unicode block

А Блок Юникода является одним из нескольких смежных диапазонов кодов цифровых символов (кодовые точки ) из Unicode набор символов, который определяется Консорциум Unicode для административных и документальных целей. Обычно такие предложения, как добавление новых глифов, обсуждаются и оцениваются путем рассмотрения соответствующего блока или блоков в целом.

Каждый блок обычно, но не всегда, предназначен для предоставления глифов, используемых одним или несколькими конкретными языками или в какой-либо общей области приложения, такой как математика, геодезия, декоративный наборный, социальные форумы и т. д.

Дизайн и реализация

Блоки Unicode идентифицируются уникальными именами, которые используют только символы ASCII и обычно описывают природу символов в английский; такие как «Тибетский» или «Дополнительные стрелки-А». (При сравнении имен блоков предполагается, что прописные буквы приравниваются к строчным буквам и игнорируются любые пробелы, дефисы и символы подчеркивания; таким образом, последнее имя эквивалентно «additional_arrows__a» и «SUPPLEMENTALARROWSA».[1]

Блоки попарно непересекающиеся, то есть они не перекрываются. Начальная кодовая точка и размер (количество кодовых точек) каждого блока всегда кратны 16; поэтому в шестнадцатеричная запись, начальная (наименьшая) точка - U +ххх0, а конечная (самая большая) точка - U +гггF, где ххх и ггг являются тремя или более шестнадцатеричными цифрами. (Эти ограничения предназначены для упрощения отображения глифов в документах Unicode Consortium в виде таблиц с 16 столбцами, помеченных последней шестнадцатеричной цифрой кодовой точки.[1]) Размер блока может варьироваться от минимум 16 до максимум 65 536 кодовых точек.

Каждая назначенная кодовая точка имеет свойство глифа, называемое «Блок», значение которого представляет собой строку символов, указывающую уникальный блок, которому принадлежит эта точка.[2] Однако блок также может содержать неназначенные кодовые точки, обычно зарезервированные для будущих добавлений символов, которые «логически» должны принадлежать этому блоку. Кодовые точки, не принадлежащие ни одному из названных блоков, например в неназначенном самолеты 3–13, имеют значение block = "No_block".[1]

Другие классификации

Каждая точка Unicode также имеет свойство, называемое "Общая категория ", который пытается описать роль соответствующего символа в языках или приложениях, ради которых он был включен в систему. Примеры общих категорий:" Lu "(означает заглавную букву)," Nd "(десятичная цифра) , «Pi» (пунктуация в открытых кавычках) и «Mn» (знак без пробелов, т. Е. Диакритический знак для предыдущего глифа). Это деление полностью не зависит от кодовых блоков: кодовые точки с данной общей категорией обычно охватывают множество блоки, и не обязательно должны быть последовательными, даже внутри каждого блока.[3]

Каждая кодовая точка также имеет свойство скрипта, указав, какие система письма он предназначен или предназначен ли он для нескольких систем письма. Это также не зависит от блока.

В описаниях системы Unicode блок может быть разделен на более конкретные подгруппы, такие как "Шахматные символы "в блоке"Разные символы ". Эти подгруппы не являются" блоками "в техническом смысле, используемом консорциумом Unicode, и названы только для удобства пользователей.

Список блоков

Unicode 13.0 определяет 308 блоков:[1]

  • 163 в плоскости 0, базовая многоязычная плоскость (BMP)
  • 134 в плоскости 1, дополнительная многоязычная плоскость (SMP)
  • 6 в плоскости 2, дополнительной идеографической плоскости (SIP)
  • 1 в плоскости 3, третичной идеографической плоскости (TIP)
  • 2 в плоскости 14 (E в шестнадцатеричный ), Дополнительный самолет специального назначения (SSP)
  • По одному в самолетах 15 (Fшестнадцатеричный) и 16 (10шестнадцатеричный), называемые Зонами дополнительного частного использования-A и -B
Блоки Unicode и содержал скрипты
СамолетБлокировать диапазонИмя блокаКодовые точки[а]Назначенные символыСкрипты[b][c][d][e][f]
 
0 BMPU + 0000..U + 007FБазовая латынь[грамм]128128латинский (52 символа), Общий (76 символов)
U + 0080..U + 00FFДополнение Latin-1[час]128128Латинский (64 символа), Общий (64 символа)
U + 0100..U + 017FРасширенная латиница-A128128латинский
U + 0180..U + 024FРасширенная латиница-B208208латинский
U + 0250..U + 02AFРасширения IPA9696латинский
U + 02B0..U + 02FFБуквы модификатора интервала8080Бопомофо (2 символа), латинский (14 символов), общий (64 символа)
U + 0300..U + 036FКомбинирование диакритических знаков112112Унаследовано
U + 0370..U + 03FFГреческий и коптский144135Коптский (14 символов), Греческий (117 символов), Обычный (4 символа)
U + 0400..U + 04FFКириллица256256Кириллица (254 символа), унаследовано (2 символа)
U + 0500..U + 052FДополнение к кириллице4848Кириллица
0 BMPU + 0530..U + 058FАрмянский9691Армянский
U + 0590..U + 05FFиврит11288иврит
U + 0600..U + 06FFарабский256255арабский (237 символов), Common (6 символов), Inherited (12 символов)
U + 0700..U + 074FСирийский8077Сирийский
U + 0750..U + 077FДополнение на арабском языке4848арабский
U + 0780..U + 07BFThaana6450Thaana
U + 07C0..U + 07FFНКо6462Nko
U + 0800..U + 083FСамаритянин6461Самаритянин
U + 0840..U + 085FМандайский3229Мандайский
U + 0860..U + 086FСирийское дополнение1611Сирийский
0 BMPU + 08A0..U + 08FFАрабский расширенный-A9684Арабский (83 символа), Общий (1 символ)
U + 0900..U + 097FДеванагари128128Деванагари (122 символа), общий (2 символа), наследуемый (4 символа)
U + 0980..U + 09FFБенгальский12896Бенгальский
U + 0A00..U + 0A7FГурмукхи12880Гурмукхи
U + 0A80..U + 0AFFГуджарати12891Гуджарати
U + 0B00..U + 0B7FОрия12891Ория
U + 0B80..U + 0BFFТамильский12872Тамильский
U + 0C00..U + 0C7Fтелугу12898телугу
U + 0C80..U + 0CFFКаннада12889Каннада
U + 0D00..U + 0D7FМалаялам128118Малаялам
0 BMPU + 0D80..U + 0DFFСингальский12891Сингальский
U + 0E00..U + 0E7FТайский12887Тайский (86 символов), Обычный (1 символ)
U + 0E80..U + 0EFFЛаосский12882Лаосский
U + 0F00..U + 0FFFтибетский256211тибетский (207 знаков), Обычный (4 символа)
U + 1000..U + 109FМьянма160160Мьянма
U + 10A0..U + 10FFГрузинский9688Грузинский (87 символов), Обычный (1 символ)
U + 1100..U + 11FFХангыль джамо256256Хангыль
U + 1200..U + 137FЭфиопский384358Эфиопский
U + 1380..U + 139FЭфиопское дополнение3226Эфиопский
U + 13A0..U + 13FFЧероки9692Чероки
0 BMPU + 1400..U + 167FЕдиная слоговая речь канадских аборигенов640640Канадские аборигены
U + 1680..U + 169FОгам3229Огам
U + 16A0..U + 16FFРунический9689Рунический (86 символов), Обычный (3 символа)
U + 1700..U + 171FТагальский3220Тагальский
U + 1720..U + 173FХануноо3223Хануноо (21 символ), Обычный (2 символа)
U + 1740..U + 175FБухид3220Бухид
U + 1760..U + 177FTagbanwa3218Tagbanwa
U + 1780..U + 17FFКхмерский128114Кхмерский
U + 1800..U + 18AFМонгольский176157Монгольский (154 символа), Обычный (3 символа)
U + 18B0..U + 18FFУнифицированная слоговая речь канадских аборигенов расширенная8070Канадские аборигены
0 BMPU + 1900..U + 194FЛимбу8068Лимбу
U + 1950..U + 197FТай Ле4835Тай Ле
U + 1980..U + 19DFНовый Тай Лю9683Новый Тай Лю
U + 19E0..U + 19FFКхмерские символы3232Кхмерский
U + 1A00..U + 1A1FБугийский3230Бугийский
U + 1A20..U + 1AAFТай Тхам144127Тай Тхам
U + 1AB0..U + 1AFFОбъединение диакритических знаков расширено8017Унаследовано
U + 1B00..U + 1B7FБалийский128121Балийский
U + 1B80..U + 1BBFСуданский6464Суданский
U + 1BC0..U + 1BFFБатак6456Батак
0 BMPУ + 1C00..U + 1C4FЛепча8074Лепча
U + 1C50..U + 1C7FOl Chiki4848Ol Chiki
У + 1C80..U + 1C8FКириллица расширенная-C169Кириллица
U + 1C90..U + 1CBFГрузинский расширенный4846Грузинский
U + 1CC0..U + 1CCFСунданская добавка168Суданский
U + 1CD0..U + 1CFFВедические расширения4843Обычный (16 символов), Унаследованный (27 символов)
U + 1D00..U + 1D7FФонетические расширения128128Кириллица (2 символа), греческий (15 символов), латиница (111 символов)
U + 1D80..U + 1DBFДополнение к фонетическим расширениям6464Греческий (1 символ), латинский (63 символа)
У + 1DC0..U + 1DFFДополнение для комбинирования диакритических знаков6463Унаследовано
U + 1E00..U + 1EFFЛатинская расширенная дополнительная256256латинский
0 BMPU + 1F00..U + 1FFFГреческий расширенный256233Греческий
U + 2000..U + 206FОбщая пунктуация112111Обычный (109 символов), Унаследованный (2 символа)
U + 2070..U + 209FВерхние и нижние индексы4842Латинский (15 знаков), Обычный (27 знаков)
U + 20A0..U + 20CFСимволы валюты4832Общий
U + 20D0..U + 20FFКомбинирование диакритических знаков для символов4833Унаследовано
U + 2100..U + 214FБуквенные символы8080Греческий (1 символ), латинский (4 символа), общий (75 символов)
U + 2150..U + 218FЧисловые формы6460Латинский (41 символ), Обычный (19 символов)
U + 2190..U + 21FFСтрелки112112Общий
U + 2200..U + 22FFМатематические операторы256256Общий
U + 2300..U + 23FFРазное Техническое256256Общий
0 BMPU + 2400..U + 243FКонтрольные изображения6439Общий
U + 2440..U + 245FОптическое распознавание символов3211Общий
U + 2460..U + 24FFВложенные буквенно-цифровые символы160160Общий
U + 2500..U + 257FРисунок Коробки128128Общий
U + 2580..U + 259FБлочные элементы3232Общий
U + 25A0..U + 25FFГеометрические фигуры9696Общий
U + 2600..U + 26FFРазные символы256256Общий
U + 2700..U + 27BFДингбаты192192Общий
U + 27C0..U + 27EFРазные математические символы-A4848Общий
U + 27F0..U + 27FFДополнительные стрелки-A1616Общий
0 BMPU + 2800..U + 28FFШаблоны Брайля256256Шрифт Брайля
U + 2900..U + 297FДополнительные стрелки-B128128Общий
U + 2980..U + 29FFРазные математические символы-B128128Общий
U + 2A00..U + 2AFFДополнительные математические операторы256256Общий
U + 2B00..U + 2BFFРазные символы и стрелки256253Общий
U + 2C00..U + 2C5FГлаголица9694Глаголица
У + 2C60..U + 2C7FРасширенная латиница-C3232латинский
U + 2C80..U + 2CFFКоптский128123Коптский
У + 2Д00..У + 2Д2ФГрузинская добавка4840Грузинский
У + 2Д30..У + 2Д7ФТифинаг8059Тифинаг
0 BMPУ + 2Д80..У + 2ДДФЭфиопский расширенный9679Эфиопский
U + 2DE0..U + 2DFFКириллица расширенная-A3232Кириллица
U + 2E00..U + 2E7FДополнительная пунктуация12883Общий
U + 2E80..U + 2EFFПриложение CJK Radicals128115Хан
U + 2F00..U + 2FDFKangxi Radicals224214Хан
U + 2FF0..U + 2FFFСимволы идеографического описания1612Общий
U + 3000..U + 303FСимволы и знаки препинания CJK6464Хан (15 символов), Хангыль (2 символа), Обычный (43 символа), Унаследованный (4 символа)
U + 3040..U + 309FХирагана9693Хирагана (89 символов), общий (2 символа), наследуемый (2 символа)
U + 30A0..U + 30FFКатакана9696Катакана (93 символа), Обычный (3 символа)
U + 3100..U + 312FБопомофо4843Бопомофо
0 BMPU + 3130..U + 318FСовместимость с хангыль Джамо9694Хангыль
U + 3190..U + 319FКанбун1616Общий
U + 31A0..U + 31BFБопомофо расширенный3232Бопомофо
U + 31C0..U + 31EFCJK инсульты4836Общий
U + 31F0..U + 31FFФонетические расширения катаканы1616Катакана
U + 3200..U + 32FFПриложенные письма и месяцы CJK256255Хангыль (62 символа), Катакана (47 символов), Общий (146 символов)
U + 3300..U + 33FFСовместимость с CJK256256Катакана (88 символов), Обычный (168 символов)
U + 3400..U + 4DBFРасширение унифицированных иероглифов CJK A6,5926,592Хан
У + 4DC0..U + 4DFFСимволы гексаграммы Ицзин6464Общий
U + 4E00..U + 9FFFУнифицированные идеограммы CJK20,99220,989Хан
0 BMPU + A000..U + A48FYi слоги1,1681,165Йи
U + A490..U + A4CFYi Radicals6455Йи
U + A4D0..U + A4FFЛису4848Лису
U + A500..U + A63FВай320300Вай
U + A640..U + A69FКириллица расширенная-B9696Кириллица
U + A6A0..U + A6FFБамум9688Бамум
U + A700..U + A71FТональные буквы модификатора3232Общий
U + A720..U + A7FFРасширенная латиница-D224180Латинский (175 символов), Обычный (5 символов)
U + A800..U + A82FСилоти Нагри4845Силоти Нагри
U + A830..U + A83FОбщие индийские числовые формы1610Общий
0 BMPU + A840..U + A87FPhags-pa6456Phags Pa
U + A880..U + A8DFСаураштра9682Саураштра
U + A8E0..U + A8FFДеванагари расширенный3232Деванагари
U + A900..U + A92FКая Ли4848Кая Ли (47 символов), Обычный (1 символ)
U + A930..U + A95FRejang4837Rejang
U + A960..U + A97FХангыль Джамо расширенный-А3229Хангыль
U + A980..U + A9DFЯванский9691Яванский (90 символов), Обычный (1 символ)
U + A9E0..U + A9FFМьянма Extended-B3231Мьянма
U + AA00..U + AA5FЧам9683Чам
U + AA60..U + AA7FМьянма Extended-A3232Мьянма
0 BMPU + AA80..U + AADFТай Вьет9672Тай Вьет
U + AAE0..U + AAFFРасширения Meetei Mayek3223Митей Майек
U + AB00..U + AB2FЭфиопский язык Extended-A4832Эфиопский
U + AB30..U + AB6FРасширенная латиница-E6460Латинский (56 символов), греческий (1 символ), общий (3 символа)
U + AB70..U + ABBFДополнение Cherokee8080Чероки
U + ABC0..U + ABFFМитей Майек6456Митей Майек
U + AC00..U + D7AFСлоги хангыль11,18411,172Хангыль
U + D7B0..U + D7FFХангыль Джамо расширенный-B8072Хангыль
U + D800..U + DB7FВысокие суррогаты8960Неизвестно
U + DB80..U + DBFFСуррогаты с высоким уровнем частного использования1280Неизвестно
0 BMPU + DC00..U + DFFFНизкие суррогаты1,0240Неизвестно
U + E000..U + F8FFЗона частного использования6,4006,400Неизвестно
U + F900..U + FAFFИдеографы совместимости CJK512472Хан
U + FB00..U + FB4FАлфавитные формы представления8058Армянский (5 символов), иврит (46 символов), латинский (7 символов)
U + FB50..U + FDFFФормы представления на арабском языке-A688611Арабский (609 символов), Общий (2 символа)
U + FE00..U + FE0FСелекторы вариаций1616Унаследовано
U + FE10..U + FE1FВертикальные формы1610Общий
U + FE20..U + FE2FОбъединение половинок1616Кириллица (2 символа), Унаследованное (14 символов)
U + FE30..U + FE4FФормы совместимости CJK3232Общий
U + FE50..U + FE6FВарианты малой формы3226Общий
U + FE70..U + FEFFФормы представления на арабском языке-B144141Арабский (140 символов), общий (1 символ)
U + FF00..U + FFEFФормы половинной и полной ширины240225Хангыль (52 символа), катакана (55 символов), латиница (52 символа), общий (66 символов)
U + FFF0..U + FFFFСпециальные165Общий
1 SMPU + 10000..U + 1007FСлоговое письмо линейного письма B12888Линейное письмо B
U + 10080..U + 100FFИдеограммы линейного письма Б128123Линейное письмо B
U + 10100..U + 1013FЭгейские числа6457Общий
U + 10140..U + 1018FДревнегреческие числа8079Греческий
U + 10190..U + 101CFДревние символы6414Греческий (1 символ), Общий (13 символов)
U + 101D0..U + 101FFФестский диск4846Обычный (45 символов), Унаследованный (1 символ)
U + 10280..U + 1029FЛикийский3229Ликийский
U + 102A0..U + 102DFКарийский6449Карийский
U + 102E0..U + 102FFКоптские номера эпактов3228Обычный (27 символов), Унаследованный (1 символ)
U + 10300..U + 1032FСтарый курсив4839Старый курсив
1 SMPU + 10330..U + 1034FГотика3227Готика
U + 10350..U + 1037FСтарая Пермь4843Старая Пермь
U + 10380..U + 1039FУгаритский3231Угаритский
U + 103A0..U + 103DFСтароперсидский6450Староперсидский
U + 10400..U + 1044FDeseret8080Deseret
U + 10450..U + 1047FШавиан4848Шавиан
U + 10480..U + 104AFОсманья4840Османья
U + 104B0..U + 104FFОсейдж8072Осейдж
U + 10500..U + 1052FЭльбасан4840Эльбасан
U + 10530..U + 1056FКавказский албанский6453Кавказский албанский
1 SMPU + 10600..U + 1077FЛинейное письмо А384341Линейное письмо А
U + 10800..U + 1083FКипрская слоговая азбука6455Киприот
U + 10840..U + 1085FИмператорский арамейский3231Императорский арамейский
U + 10860..U + 1087FПальмирена3232Пальмирена
U + 10880..U + 108AFНабатейский4840Набатейский
U + 108E0..U + 108FFХатран3226Хатран
U + 10900..U + 1091FФиникийский3229Финикийский
U + 10920..U + 1093FЛидийский3227Лидийский
U + 10980..U + 1099FМероитские иероглифы3232Мероитские иероглифы
U + 109A0..U + 109FFМеройский курсив9690Меройский курсив
1 SMPU + 10A00..U + 10A5FKharoshthi9668Kharoshthi
U + 10A60..U + 10A7FСтарый южноаравийский3232Старый южноаравийский
U + 10A80..U + 10A9FСтарый северноаравийский3232Старый северноаравийский
U + 10AC0..U + 10AFFМанихейский6451Манихейский
U + 10B00..U + 10B3FАвестийский6461Авестийский
U + 10B40..U + 10B5FПисьменный парфянский3230Письменный парфянский
U + 10B60..U + 10B7FПехлеви с надписью3227Пехлеви с надписью
U + 10B80..U + 10BAFПсалтырь Пехлеви4829Псалтырь Пехлеви
U + 10C00..U + 10C4FДревнетюркский8073Древнетюркский
U + 10C80..U + 10CFFДревневенгерский128108Древневенгерский
1 SMPU + 10D00..U + 10D3FХанифи Рохинджа6450Ханифи Рохинджа
U + 10E60..U + 10E7FЦифровые символы Руми3231арабский
U + 10E80..U + 10EBFЕзиды6447Езиды
U + 10F00..U + 10F2FСтарый согдийский4840Старый согдийский
U + 10F30..U + 10F6FСогдийский6442Согдийский
U + 10FB0..U + 10FDFХорезмист4828Хорезмист
U + 10FE0..U + 10FFFElymaic3223Elymaic
U + 11000..U + 1107FБрахми128109Брахми
U + 11080..U + 110CFKaithi8067Kaithi
U + 110D0..U + 110FFСора Сомпенг4835Сора Сомпенг
1 SMPU + 11100..U + 1114FЧакма8071Чакма
U + 11150..U + 1117FМахаджани4839Махаджани
U + 11180..U + 111DFШарада9696Шарада
U + 111E0..U + 111FFСингальские архаические числа3220Сингальский
U + 11200..U + 1124FХойки8062Хойки
U + 11280..U + 112AFМултани4838Мултани
U + 112B0..U + 112FFХудавади8069Худавади
U + 11300..U + 1137FГранта12886Гранта (85 символов), унаследовано (1 символ)
U + 11400..U + 1147FNewa12897Newa
U + 11480..U + 114DFТирхута9682Тирхута
1 SMPU + 11580..U + 115FFСиддхам12892Сиддхам
U + 11600..U + 1165FМоди9679Моди
U + 11660..U + 1167FМонгольское дополнение3213Монгольский
U + 11680..U + 116CFТакри8067Такри
U + 11700..U + 1173FАхом6458Ахом
U + 11800..U + 1184FДогра8060Догра
U + 118A0..U + 118FFВаранг Сити9684Варанг Сити
U + 11900..U + 1195FДайвс Акуру9672Дайвс Акуру
U + 119A0..U + 119FFНандинагари9665Нандинагари
U + 11A00..U + 11A4FПлощадь Занабазар8072Площадь Занабазар
1 SMPU + 11A50..U + 11AAFСоёмбо9683Соёмбо
U + 11AC0..U + 11AFFПо Чин Хау6457По Чин Хау
U + 11C00..U + 11C6FБхайкуки11297Бхайкуки
U + 11C70..U + 11CBFМарчен8068Марчен
U + 11D00..U + 11D5FМасарам Гонди9675Масарам Гонди
U + 11D60..U + 11DAFГунджала Гонди8063Гунджала Гонди
U + 11EE0..U + 11EFFМакасар3225Макасар
U + 11FB0..U + 11FBFДополнение Lisu161Лису
U + 11FC0..U + 11FFFТамильское дополнение6451Тамильский
U + 12000..U + 123FFКлинопись1,024922Клинопись
1 SMPU + 12400..U + 1247FКлинописные числа и знаки препинания128116Клинопись
U + 12480..U + 1254FРаннединастическая клинопись208196Клинопись
U + 13000..U + 1342FЕгипетские иероглифы1,0721,071Египетские иероглифы
U + 13430..U + 1343FОрганы управления форматом египетских иероглифов169Египетские иероглифы
U + 14400..U + 1467FАнатолийские иероглифы640583Анатолийские иероглифы
U + 16800..U + 16A3FБамум Дополнение576569Бамум
U + 16A40..U + 16A6FMro4843Mro
U + 16AD0..U + 16AFFБасса Вах4836Басса Вах
U + 16B00..U + 16B8FПахау Хмонг144127Пахау Хмонг
U + 16E40..U + 16E9FМедефайдрин9691Медефайдрин
1 SMPU + 16F00..U + 16F9FМяо160149Мяо
U + 16FE0..U + 16FFFИдеографические символы и знаки препинания327Хан (2 символа), Киданьский маленький шрифт (1 символ), Нушу (1 символ), Тангут (1 символ), Общий (2 символа)
U + 17000..U + 187FFТангутский6,1446,136Тангутский
U + 18800..U + 18AFFТангутские компоненты768768Тангутский
U + 18B00..U + 18CFFКиданьский маленький шрифт512470Киданьский маленький шрифт
U + 18D00..U + 18D8FТангутское дополнение1449Тангутский
U + 1B000..U + 1B0FFДополнение кана256256Хирагана (255 символов), Катакана (1 символ)
U + 1B100..U + 1B12FКана Расширенная-А4831Хирагана
U + 1B130..U + 1B16FМаленькое расширение Кана647Хирагана (3 символа), Катакана (4 символа)
U + 1B170..U + 1B2FFНушу400396Нюшу
1 SMPU + 1BC00..U + 1BC9FДуплоян160143Дуплоян
U + 1BCA0..U + 1BCAFЭлементы управления сокращенным форматом164Общий
U + 1D000..U + 1D0FFВизантийские музыкальные символы256246Общий
U + 1D100..U + 1D1FFМузыкальные символы256231Обычный (209 символов), Унаследованный (22 символа)
U + 1D200..U + 1D24FДревнегреческая музыкальная нотация8070Греческий
U + 1D2E0..U + 1D2FFЦифры майя3220Общий
У + 1Д300..У + 1Д35ФСимволы Тай Сюань Цзин9687Общий
U + 1D360..U + 1D37FСчетные числа на стержнях3225Общий
У + 1D400..U + 1D7FFМатематические буквенно-цифровые символы1,024996Общий
U + 1D800..U + 1DAAFЗнак Саттона688672Знак
1 SMPU + 1E000..U + 1E02FДополнение к глаголице4838Глаголица
U + 1E100..U + 1E14FNyiakeng Puachue Hmong8071Nyiakeng Puachue Hmong
U + 1E2C0..U + 1E2FFWancho6459Wancho
U + 1E800..U + 1E8DFМенде Кикакуи224213Менде Кикакуи
U + 1E900..U + 1E95FАдлам9688Адлам
U + 1EC70..U + 1ECBFИндийские числа сияк8068Общий
U + 1ED00..U + 1ED4FОсманские числа Siyaq8061Общий
U + 1EE00..U + 1EEFFАрабские математические алфавитные символы256143арабский
U + 1F000..U + 1F02FМаджонг Плитки4844Общий
U + 1F030..U + 1F09FДомино Плитка112100Общий
1 SMPU + 1F0A0..U + 1F0FFИграя в карты9682Общий
U + 1F100..U + 1F1FFПрилагаемое буквенно-цифровое приложение256200Общий
U + 1F200..U + 1F2FFПрилагаемое идеографическое приложение25664Хирагана (1 символ), Обычный (63 символа)
U + 1F300..U + 1F5FFРазные символы и пиктограммы768768Общий
U + 1F600..U + 1F64FСмайлики8080Общий
U + 1F650..U + 1F67FДекоративные дингбаты4848Общий
U + 1F680..U + 1F6FFТранспортные и картографические символы128114Общий
1 SMPU + 1F700..U + 1F77FАлхимические символы128116Общий
U + 1F780..U + 1F7FFРасширенные геометрические фигуры128101Общий
U + 1F800..U + 1F8FFДополнительные стрелки-C256150Общий
U + 1F900..U + 1F9FFДополнительные символы и пиктограммы256254Общий
U + 1FA00..U + 1FA6FШахматные символы11298Общий
U + 1FA70..U + 1FAFFРасширенные символы и пиктограммы-A14457Общий
U + 1FB00..U + 1FBFFСимволы для устаревших вычислений256212Общий
2 SIPU + 20000..U + 2A6DFРасширение B унифицированных иероглифов CJK42,72042,718Хан
U + 2A700..U + 2B73FРасширение унифицированных иероглифов CJK C4,1604,149Хан
U + 2B740..U + 2B81FРасширение унифицированных иероглифов CJK D224222Хан
U + 2B820..U + 2CEAFРасширение унифицированных иероглифов CJK E5,7765,762Хан
U + 2CEB0..U + 2EBEFРасширение унифицированных иероглифов CJK F7,4887,473Хан
U + 2F800..U + 2FA1FПриложение к идеографам совместимости CJK544542Хан
3 СОВЕТU + 30000..U + 3134FРасширение унифицированных иероглифов CJK G4,9444,939Хан
14 SSPU + E0000..U + E007FТеги12897Общий
U + E0100..U + E01EFДополнение к селекторам вариаций240240Унаследовано
15 PUA-AU + F0000..U + FFFFFЗона дополнительного частного использования-A65,53665,534Неизвестно
16 PUA-BU + 100000..U + 10FFFFЗона дополнительного частного использования-B65,53665,534Неизвестно
  1. ^ Количество кодовых точек включает неназначенные кодовые точки: несимвольные, зарезервированные
  2. ^ В блоке сценария содержится один или несколько символов, как определено свойством сценария. Это не зависит от названия блока
  3. ^ «Обычный», «Неизвестный» (Zyyy) и «Унаследованный» (Zinh или Qaai) относятся к сценариям в ISO 15924
  4. ^ Файл данных Unicode Blocks. Начиная с версии Unicode 13.0
  5. ^ UAX 24: Свойство скрипта Unicode (4-х буквенный код)
  6. ^ UAX 24: файл данных сценария
  7. ^ Называется "C0 Controls and Basic Latin" на ISO / IEC 10646
  8. ^ Называется "C1 Controls и Latin-1 Supplement" в ISO / IEC 10646

Удаленные блоки

Политика стабильности Unicode требует, чтобы символ, однажды назначенный, нельзя было перемещать или удалять, хотя это может быть устаревшим. Это относится к Unicode 2.0 и всем последующим версиям.

До этого были удалены следующие бывшие блоки:

Бывший Блоки Unicode от до Unicode 2.0
Блокировать диапазонИмя блокаДальность теперь занятаЗаменено блокомКодовые точкиНазначенные символыСкрипты
U + 1000..U + 105Fтибетский[4]Мьянматибетский9671тибетский
U + 3400..U + 3D2DХангыль[5]Расширение унифицированных иероглифов CJK AСлоги хангыль23502350Хангыль
U + 3D2E..U + 44B7Дополнительный хангыль-A[5]Расширение унифицированных иероглифов CJK A19301930Хангыль
U + 44B8..U + 4DFFДополнительный хангыль-B[5]Расширение унифицированных иероглифов CJK A23762376Хангыль
Символы гексаграммы Ицзин

Рекомендации

  1. ^ а б c d "Файл данных Unicode Blocks, версия Unicode 13.0". Консорциум Unicode. Получено 2019-04-29.}
  2. ^ Глоссарий Unicode
  3. ^ «Основная спецификация Unicode, Глава 4: Свойства символов» (PDF). Получено 2020-03-14.
  4. ^ «3.8: Блок-за-блок-схемы» (PDF). Стандарт Юникода. Версия 1.0. Консорциум Unicode.
  5. ^ а б c «Приложение E: Имена блоков» (PDF). Стандарт Юникода. Версия 1.1. Консорциум Unicode.

внешняя ссылка