Кана половинной ширины - Half-width kana - Wikipedia

Кана половинной ширины (半角 カ ナ, Ханкаку кана) находятся катакана символы отображаются с половиной их нормальной ширины (1: 2 соотношение сторон ) вместо обычного квадратного (1: 1) соотношения сторон. Например, обычная (во всю ширину) форма катаканы ка равна カ, а форма полуширины - カ. Половина ширины хирагана не включен в Unicode, хотя его можно использовать в Интернете или Электронные книги через CSS с font-feature-settings: "hwid" 1 с Adobe-Japan1-6 на основе шрифтов OpenType.[1] Половина ширины кандзи не может использоваться на современных компьютерах, даже если он используется в некоторых принтерах чеков, электрических досках объявлений или старых компьютерах.[2]

Кана половинной ширины использовались на заре японских вычислений, чтобы японские символы отображались в той же сетке, что и моноширинные шрифты латинских символов. Кандзи половинной ширины не использовались. Символы кана половинной ширины сегодня обычно не используются, но находят некоторое применение в определенных настройках, таких как кассовый аппарат дисплеи на квитанциях магазинов, японское цифровое телевидение и субтитры на DVD, а также на этикетках с почтовыми адресами. Их использование иногда также является стилистическим выбором, особенно часто в определенных Интернет-сленг.

Термин «кана половинной ширины», который строго относится только к тому, как кана отображаетсяне как они хранится - также свободно используется для обозначения блока A0 – DF (шестнадцатеричный), где катакана хранится в некоторых кодировки символов, Такие как JIS X 0201 (1969) - см. кодировки, ниже. Однако это формально неверно - этот стандарт JIS просто указывает, что катакана должна храниться в этих местах, без указания того, как они должны отображаться; путаница связана с тем, что на ранних этапах вычислений символы, хранящиеся здесь, фактически отображались как кана половинной ширины - см. путаница, ниже.

История

Этот Светодиодный экран в Станция Хайки отображает シ ー サ イ ド ​​ラ イ ナ ー (Приморский лайнер) в катакане половинной ширины. В дакутэн однако, похоже, не рассматривается как отдельный персонаж.

Кана половинной ширины и Кана 2/3 ширины использовались с докомпьютерной эры.[3] В раннюю компьютерную эру ASCII определяется как 7-битный набор символов и имеет место для 128 символов. Однако, поскольку этот стандарт был разработан для Соединенные Штаты, он не содержит знаков и символов, таких как иена (¥) символ, необходимый для представления японской валюты, и при этом он не включает пространство для символов из других алфавитов, таких как кана или кандзи, поэтому японские символы не могут быть закодированный. Кроме того, японские иероглифы, как кана, так и кандзи, нарисованы на квадратной сетке, в то время как латинские символы обычно пишутся более узко - таким образом, японские символы не могут быть отображается либо.

JIS X 0201 был разработан в 1969 году, в то время, когда компьютеры, как правило, были неспособны, как по дизайну программного обеспечения, так и по аппаратным ресурсам, представлять тысячи китайцев. кандзи символы, используемые в японском языке. В качестве компромисса этот стандарт закодировал катакану (только - не хирагана или кандзи) как небольшой набор символов, назначенных в диапазоне значений старшего байта 0x80–0xFF. Это позволило 8-битным процессорам кодировать и обрабатывать японский текст фонетически (как катакана), но без возможности обработки хираганы или кандзи. Эти символы катаканы, в свою очередь, были отображается как «кана половинной ширины» - новый, неортодоксальный, более узкий форм-фактор, соответствующий той же ширине, что и машины с моноширинными латинскими алфавитами, способные печатать и отображать. С точки зрения кодирования JIS X 0201 является вариантом расширения ASCII - он включает дополнительные символы и не совсем соответствует ASCII в части перекрытия (раздел латинских символов).

Сообщения о транзакциях, написанные кана половинной ширины в банковской книге

Кана половинной ширины были разработаны как «... первые японские символы, закодированные на компьютерах, потому что они используются для японских телеграмм». [1]

Общенациональная система передачи банковских данных (全国 銀行 デ ー タ 通信 シ ス テ ム)Крупнейшая система денежных переводов в Японии была создана в 1973 году. В сообщениях о транзакциях между банками можно было использовать только латинские буквы, цифры и катакану половинной ширины в пределах 20 символов. В 2018 году эту систему заменила ZEDI (Национальная система обмена банковскими электронными данными), которая может обрабатывать хирагана и кандзи с символами переменной длины.[4][5]

Чтобы катакана поместилась в разрешенной более узкой области ячейки, были сделаны некоторые компромиссы. Например, диакритические знаки дакутэн и Handakuten рассматриваются как отдельные символы, а не как часть предыдущего символа. Этот компромисс привел к тому, что многие сочли "кана половинной ширины" визуально непривлекательной, и сегодня вызывает проблемы для многих компьютерных программ.[нужна цитата ]

Квитанция с использованием каны половинной ширины для экономии места

Еще одно применение каны половинной ширины - экономия места. Японская версия Windows 95 использовала катакану половинной ширины MS P Gothic в его пользовательском интерфейсе. На смену ей пришла полноширинная кана из MS UI Gothic, немного уже, чем MS P Gothic.[6][7]

Кодирование

в JIS X 0201 Согласно спецификации (1969 г.), катаканы кодируются в блоке A0 – DF (шестнадцатеричный) - не указано, как они отображаются, и не существует отдельного кодирования полноширинной и полушириной каны. В JIS X 0208, катакана, хирагана и кандзи - все закодированы (и отображаются как символы полной ширины; символы половинной ширины отсутствуют), хотя порядок каны отличается - см. JIS X 0208 # Хирагана и катакана.

В Shift JIS, который сочетает в себе JIS X 0201 и JIS X 0208, эти кодировки (обе из которых могут кодировать латинские символы и катакану) хранятся отдельно, при этом все JIS X 0201 отображаются как полуширины (таким образом, катакана JIS X 0201 отображается как половина -width kana), тогда как JIS X 0208 все отображаются как полноширинные (таким образом, латинские символы JIS X 0208 отображаются как полноширинные латинские символы). Таким образом, в Shift JIS латинские символы и катакана имеют две кодировки с двумя отдельными формами отображения, как половинной, так и полной ширины.

В Unicode, катакана и хирагана в основном используются как обычные полноширинные символы (блоки катакана и хирагана отображаются как полноширинные символы); отдельный блок, Формы половинной и полной ширины Блок используется для хранения вариантных символов, включая кана половинной ширины и латинские символы полной ширины.

Таким образом, катакана в JIS X 0201 и соответствующая часть производных кодировок (часть JIS X 0201 Shift JIS) отображаются как полуширина, тогда как в формах полуширины Unicode указываются отдельно.

Стол половинной ширины

"J" указывает первые четыре бита в JIS X 0201 (хотя Смотри ниже, это не обязательно указать половину ширины) и в других наборах, таких как Shift JIS, "U" указывает строку в Unicode в блоке Halfwidth и Fullwidth Forms.

JU0123456789АBCDEF
АFF6 
BFF7ソ
CFF8
DFF9

Обратите внимание, что пустая первая ячейка представляет собой несуществующий символ в JIS, A0; но двойные круглые скобки полной ширины ⦆ в Юникоде, U + FF60.

Кана половинной ширины в Интернете

Электронное письмо

Поскольку SMTP и NNTP протоколы (используются для доставки электронной почты и Usenet соответственно) раньше могли передавать только 7 бит, тогда было принято использовать ISO-2022-JP для отправки электронной почты на японском языке.

Кана половинной ширины не содержится в ISO-2022-JP: он включает римский набор JIS X 0201 и весь JIS X 0208, но не набор катаканы JIS X 0201 (который используется для половинной ширины каны в Shift JIS, например). Оба набора JIS X 0201 имеют коды ISO 2022, но профиль ISO-2022-JP включает только римский набор: это означает, что формат для включения катаканы половинной ширины в ISO-2022-JP является как четко определенным, так и нарушением формата ISO-2022-JP. По этой причине, если кана половинной ширины случайно была включена в сообщение, оно могло быть искажено во время передачи (см. моджибаке ). В WHATWG стандарт кодирования, используемый HTML5 позволяет декодировать, но не кодировать катакану JIS X 0201 в ISO-2022-JP в качестве расширения формата, и преобразует катакану половинной ширины в их эквиваленты JIS X 0208 при кодировании.[8]

Это больше не проблема, поскольку большинство серверов электронной почты сегодня используют ESMTP, поэтому допустимы 8-битные символы. В качестве альтернативы, система кодирования, такая как Base64 можно использовать и указать в сообщении с помощью MIME.

веб-страница

Проблема, которая существует в электронной почте, не существует с веб-страницами, поскольку HTTP принимает 8-битные символы.

Однако существует одна проблема: компьютерные программы не могут определить, следует ли рассматривать персонажа как Shift JIS, EUC-JP, или же UTF-8 - следовательно, информация о коде символа должна быть указана с заголовком ответа HTTP или Метатег.

Путаница

Строго говоря, кодировка JIS X 0201 как «катакана половинной ширины» неверна, поскольку стандарт не определяет ширину символов - он определяет только кодовое представление символов катаканы. В стандарте JIS X 0201 символы катаканы печатаются с нормальной (полной) шириной, а не с половинной шириной.

Символы половинной ширины использовались для отображения только в тот период, когда символы отображались с половинной шириной (и использовались однобайтовые кодировки), до того, как стали отображаться символы полной ширины (и связанные двухбайтовые кодировки, такие как JIS X 0208). широко распространен. Однако в стандарте Shift JIS, который сочетает в себе стандарт JIS X 0201 (символы которого - латиницу и катакана - отображались половинной шириной) и стандарт JIS X 0208 (символы которого - катакана, хирагана, кандзи и латынь - были отображаются как полноширинные), символы катакана и латинские символы кодируются дважды, как в JIS X 0201, так и в JIS 0208, но отображаются как полуширина или полная ширина в зависимости от того, в каком разделе они находятся (0201 или 0208) - таким образом, 0201 Блок катаканы можно рассматривать как соответствующий «кане половинной ширины», и широко распространено неправильное понимание того, что стандарт 0201 определяет символы «половинной ширины».

Кроме того, хотя JIS X 0201 является однобайтовой кодировкой (и отображается с полушириной), а JIS X 0208 является двухбайтовой кодировкой (и отображается с полной шириной), связи между количеством байтов и шириной нет ( кроме тех, которые соответствуют Shift JIS, как указано выше) - например, Unicode может быть закодирован четырьмя байтами (UTF-32 ) для отображения как полноширинных, так и одинарных символов.

В популярной культуре

Символы кана половинной ширины появляются на публике в Матричная трилогия, режиссер Вачовски. В 'цифровой дождь' состоит из зеркально отображаемых символов кана половинной ширины, латинских букв и арабских цифр.

Смотрите также

Рекомендации

  1. ^ 改 訂 新 Version ス タ イ ル シ ー ト ポ ン ス стр.107 (на японском языке), Хадзимэ Фудзимото, 5 марта 2013 г., ISBN  978-4774154862
  2. ^ TSP100futurePRNT (на японском языке), Star Micronics
  3. ^ 東京 築 地 活 Version 製造 所 - 活 Version 見 本 стр.33 (на японском языке), Соджуро Номура, 1903 г.
  4. ^ "経 理 部門 の 人材 不足 で 朗 報 、 金融 EDI「 ZEDI 」が 2018 年 稼 働 へ". Nikkei X-TECH. 2017-11-30. Получено 2019-05-11.
  5. ^ "全 銀 EDI シ ス テ ム (ZEDI) に 対 応 し た サ ー ビ ス に つ い て". Mizuho Bank. 2018-12-25. Получено 2019-05-11.
  6. ^ "Windows 98, версия β3 フ ァ ー ス ト イ ン プ レ ッ シ ョ ン 第 1 回". Impress PC Watch. 1998-03-03. Получено 2019-05-11.
  7. ^ "Windows98 の イ ン タ ー フ ェ イ ス". 1998-06-26. Получено 2019-05-11.
  8. ^ «12.2. ISO-2022-JP». Стандарт кодирования. WHATWG.
  • ^ Лунде, Кен. CJKV Обработка информации. О'Рейли, 2-е изд., 2009 г., п. 224–226 (также 1-е изд., 1999. с. 144–145)