Наборы западных латинских символов (вычисления) - Western Latin character sets (computing)
Несколько двоичных представлений 8-битных наборы символов для общего Западноевропейский языки сравниваются в этой статье. Эти кодировки были разработаны для представления Итальянский, испанский, португальский, Французский, Немецкий, нидерландский язык, английский, Датский, Шведский, норвежский язык, и исландский, которые используют Латинский алфавит, несколько дополнительных букв и буквы с предварительно составленными диакритические знаки, немного пунктуация, и различные символы (включая некоторые греческие буквы). Хотя их называют «западноевропейскими», на многих из этих языков говорят во всем мире. Кроме того, эти наборы символов поддерживают многие другие языки, такие как малайский, суахили, и Классическая латынь.
Этот материал технически устарел, функционально заменен на Unicode. Однако он по-прежнему представляет исторический интерес.
Резюме
В ISO-8859 серия 8 бит наборы символов кодирует все латинский наборы символов, используемые в Европа хотя то же самое кодовые точки имеют несколько применений, вызывающих определенные трудности (в том числе моджибаке, или искаженные символы, а также проблемы со связью). Прибытие из Unicode, с уникальным кодом для каждого глиф, решил эти проблемы.
- ИСО / МЭК 8859-1 или же Latin-1 является наиболее используемым и также определяет первые 256 коды в Unicode.
- ИСО / МЭК 8859-15 изменяет ISO-8859-1 полностью поддерживать эстонский, Финский и Французский и добавить знак евро.
- Окна-1252 это надмножество ISO-8859-1 это включает печатные символы из ИСО / МЭК 8859-15 и популярный пунктуация например изогнутый кавычки (также известен как умные цитаты, например, в Microsoft Word настройки и подобные программы). Обычно инструменты веб-страницы за Windows используйте Windows-1252, но пометьте страница в Интернете при использовании ISO-8859-1 это было рассмотрено в HTML5, который требует, чтобы страницы, помеченные как ISO-8859-1, интерпретировались как Windows-1252.
- IBM CP437, предназначенные для английский только, очень мало на пути буквы с ударением (особенно верхний регистр ) но гораздо больше графические персонажи чем другой IBM кодовые страницы перечисленные здесь, а также некоторые математический и Греческие символы которые полезны как технические символы.
- IBM CP850 имеет все печатные символы который ISO-8859-1 имеет (хотя и по-другому) и до сих пор получает достаточно графические персонажи построить удобный текстовый режим пользовательский интерфейс.
- IBM CP858 отличается от CP850 только одним персонажем - a без точки я (я ), редко используется за пределами Турции и без верхний регистр предоставленный эквивалент, был заменен на знак валюты евро (€ ).[1]
- IBM CP859 содержит все печатные символы который ИСО / МЭК 8859-15 имеет, так непохожий CP850 он поддерживает знак евро, эстонский, Финский и Французский.
- Кодовые страницы IBM 037, 500 и 1047 являются EBCDIC кодировки, включающие все ISO-8859-1 символы.
- В Mac OS Роман набор символов (часто называемый МакРоман и известный IANA как просто MACINTOSH) имеет большинство, но не все, тех же символов, что и ИСО / МЭК 8859-1 но в совсем другой аранжировке; а также добавляет много технических и математические символы (хотя в нем отсутствуют важные × ) и больше диакритические знаки. Старшая Macintosh веб-браузеры были известны munge несколько персонажей, которые были в ИСО / МЭК 8859-1 но не родной Macintosh набор символов при редактировании текста из Веб-сайты. И наоборот, в веб-материалах, подготовленных на старом Macintosh, многие символы были отображается неправильно когда читают другие операционные системы. В Кодировка латиницы Macintosh, модификация Mac OS Roman для поддержки ISO / IEC 8859-1, была создана создателями Кермит (протокол) чтобы решить эту проблему.
История
Более ранние семи-кусочек НАС. Американский стандартный код для обмена информацией ('ASCII') содержит символы, достаточные для правильного представления только нескольких языков, таких как английский, латинский, малайский и суахили. В нем отсутствуют некоторые буквы и буквенно-диакритические комбинации, используемые в других языках латинского алфавита. Однако, поскольку на большинстве компьютерных платформ, поставляемых в США, другого выбора не было, использование ASCII было неизбежным, за исключением тех случаев, когда существовала сильная национальная вычислительная промышленность. Был ISO 646 группа кодировок, которые заменяли некоторые символы в ASCII локальными символами, но пространство было очень ограниченным, а некоторые из замененных символов были довольно распространены в таких вещах, как языки программирования.
Большинство компьютеров внутренне использовали восьмибитные байты, но для связи (которая по своей сути ненадежная) использовалось семь бит данных плюс один. бит четности. Со временем стало обычным использовать все восемь бит для данных, создавая пространство для еще 128 символов. Вначале большинство из них были системными, но постепенно ISO / IEC 8859 стандарты появились для обеспечения некоторого межплатформенного сходства для обеспечения обмена информацией.
К концу 20-го века, когда снизились затраты на хранение и память, проблемы, связанные с множественными значениями данного восьмиразрядного кода (существует только семь кодовых наборов ISO-Latin), перестали быть оправданными. Все основные операционные системы перешли на Unicode как их основное внутреннее представление. Однако, поскольку Windows не поддерживает UTF-8 метод кодирования Unicode (предпочитая UTF-16 ), многие приложения по-прежнему ограничивались этими устаревшими наборами символов.
Знак евро
В евро и это знак евро оказало значительное давление на поддержку знака евро (€), и большинство 8-битных наборов символов пришлось каким-то образом адаптировать.
- Apple с MacRoman и Sun Microsystems с ОС Solaris просто заменил общий знак валюты (¤ ). Это вызвало значительные трудности, поскольку организации нашли ему другое применение, например, логотип компании.
- ISO представила дополнительный вариант ISO 8859, ISO 8859-15, который заменил общий знак валюты знаком евро, а также произвел некоторые другие замены символов буквами с диакритическими знаками. ISO 8859-15 так и не получил широкого распространения.
- С Окна-1252, Microsoft поместила знак евро в пробел (позиция 80шестнадцатеричный) в существующих Коды управления C1.
Все эти проблемы были решены, поскольку операционные системы были обновлены для поддержки Unicode как стандарт, который кодирует знак евро как U + 20AC (десятичное число 8364).
Сравнительная таблица
Кодовые точки U + 0000 до U + 007F в настоящее время не показаны в этой таблице, так как они напрямую отображаются во всех перечисленных здесь наборах символов. В ASCII Стандарт кодирования определяет исходную спецификацию для отображения первых 0–127 символов.
Таблица составлена Unicode кодовая точка. Наборы символов здесь называются их IANA имена в верхний регистр.
Характер | Кодовая точка | ISO-8859-1 | ISO-8859-15 | WINDOWS-1252 | IBM437 | IBM850 | МАКИНТОШ |
---|---|---|---|---|---|---|---|
NBSP | U + 00A0 | A0 | A0 | A0 | FF | FF | CA |
¡ | U + 00A1 | A1 | A1 | A1 | ОБЪЯВЛЕНИЕ | ОБЪЯВЛЕНИЕ | C1 |
¢ | U + 00A2 | A2 | A2 | A2 | 9B | BD | A2 |
£ | U + 00A3 | A3 | A3 | A3 | 9C | 9C | A3 |
¤ | U + 00A4 | A4 | A4 | CF | |||
¥ | U + 00A5 | A5 | A5 | A5 | 9D | БЫТЬ | B4 |
¦ | U + 00A6 | A6 | A6 | DD | |||
§ | U + 00A7 | A7 | A7 | A7 | F5 | A4 | |
¨ | U + 00A8 | A8 | A8 | F9 | AC | ||
© | U + 00A9 | A9 | A9 | A9 | B8 | A9 | |
ª | U + 00AA | AA | AA | AA | A6 | A6 | BB |
« | U + 00AB | AB | AB | AB | AE | AE | C7 |
¬ | U + 00AC | AC | AC | AC | AA | AA | C2 |
ЗАСТЕНЧИВЫЙ | U + 00AD | ОБЪЯВЛЕНИЕ | ОБЪЯВЛЕНИЕ | ОБЪЯВЛЕНИЕ | F0 | ||
® | U + 00AE | AE | AE | AE | A9 | A8 | |
¯ | U + 00AF | AF | AF | AF | EE | F8 | |
Характер | Кодовая точка | ISO-8859-1 | ISO-8859-15 | WINDOWS-1252 | IBM437 | IBM850 | МАКИНТОШ |
° | U + 00B0 | B0 | B0 | B0 | F8 | F8 | A1 |
± | U + 00B1 | B1 | B1 | B1 | F1 | F1 | B1 |
² | U + 00B2 | Би 2 | Би 2 | Би 2 | FD | FD | |
³ | U + 00B3 | B3 | B3 | B3 | FC | ||
´ | U + 00B4 | B4 | B4 | EF | AB | ||
µ | U + 00B5 | B5 | B5 | B5 | E6 | E6 | B5 |
¶ | U + 00B6 | B6 | B6 | B6 | F4 | A6 | |
· | U + 00B7 | B7 | B7 | B7 | FA | FA | E1 |
¸ | U + 00B8 | B8 | B8 | F7 | FC | ||
¹ | U + 00B9 | B9 | B9 | B9 | FB | ||
º | U + 00BA | BA | BA | BA | A7 | A7 | до н.э |
» | U + 00BB | BB | BB | BB | AF | AF | C8 |
¼ | U + 00BC | до н.э | до н.э | AC | AC | ||
½ | U + 00BD | BD | BD | AB | AB | ||
¾ | U + 00BE | БЫТЬ | БЫТЬ | F3 | |||
¿ | U + 00BF | BF | BF | BF | A8 | A8 | C0 |
Характер | Кодовая точка | ISO-8859-1 | ISO-8859-15 | WINDOWS-1252 | IBM437 | IBM850 | МАКИНТОШ |
А | U + 00C0 | C0 | C0 | C0 | B7 | CB | |
Á | U + 00C1 | C1 | C1 | C1 | B5 | E7 | |
 | U + 00C2 | C2 | C2 | C2 | B6 | E5 | |
à | U + 00C3 | C3 | C3 | C3 | C7 | CC | |
Ä | U + 00C4 | C4 | C4 | C4 | 8E | 8E | 80 |
Å | U + 00C5 | C5 | C5 | C5 | 8F | 8F | 81 |
Æ | U + 00C6 | C6 | C6 | C6 | 92 | 92 | AE |
Ç | U + 00C7 | C7 | C7 | C7 | 80 | 80 | 82 |
È | U + 00C8 | C8 | C8 | C8 | D4 | E9 | |
É | U + 00C9 | C9 | C9 | C9 | 90 | 90 | 83 |
Ê | U + 00CA | CA | CA | CA | D2 | E6 | |
Ë | U + 00CB | CB | CB | CB | D3 | E8 | |
Я | U + 00CC | CC | CC | CC | DE | ED | |
Я | U + 00CD | CD | CD | CD | D6 | EA | |
Я | U + 00CE | CE | CE | CE | D7 | EB | |
Я | U + 00CF | CF | CF | CF | D8 | EC | |
Характер | Кодовая точка | ISO-8859-1 | ISO-8859-15 | WINDOWS-1252 | IBM437 | IBM850 | МАКИНТОШ |
Ð | U + 00D0 | D0 | D0 | D0 | D1 | ||
Ñ | U + 00D1 | D1 | D1 | D1 | A5 | A5 | 84 |
Ò | U + 00D2 | D2 | D2 | D2 | E3 | F1 | |
Ó | U + 00D3 | D3 | D3 | D3 | E0 | EE | |
Ô | U + 00D4 | D4 | D4 | D4 | E2 | EF | |
Õ | U + 00D5 | D5 | D5 | D5 | E5 | CD | |
Ö | U + 00D6 | D6 | D6 | D6 | 99 | 99 | 85 |
× | U + 00D7 | D7 | D7 | D7 | 9E | ||
Ø | U + 00D8 | D8 | D8 | D8 | 9D | AF | |
Ù | U + 00D9 | D9 | D9 | D9 | EB | F4 | |
Ú | U + 00DA | DA | DA | DA | E9 | F2 | |
Û | U + 00DB | БД | БД | БД | EA | F3 | |
Ü | U + 00DC | ОКРУГ КОЛУМБИЯ | ОКРУГ КОЛУМБИЯ | ОКРУГ КОЛУМБИЯ | 9А | 9А | 86 |
Ý | U + 00DD | DD | DD | DD | ED | ||
Þ | U + 00DE | DE | DE | DE | E8 | ||
SS | U + 00DF | DF | DF | DF | E1 | E1 | A7 |
Характер | Кодовая точка | ISO-8859-1 | ISO-8859-15 | WINDOWS-1252 | IBM437 | IBM850 | МАКИНТОШ |
à | U + 00E0 | E0 | E0 | E0 | 85 | 85 | 88 |
á | U + 00E1 | E1 | E1 | E1 | A0 | A0 | 87 |
â | U + 00E2 | E2 | E2 | E2 | 83 | 83 | 89 |
ã | U + 00E3 | E3 | E3 | E3 | C6 | 8B | |
ä | U + 00E4 | E4 | E4 | E4 | 84 | 84 | 8A |
å | U + 00E5 | E5 | E5 | E5 | 86 | 86 | 8C |
æ | U + 00E6 | E6 | E6 | E6 | 91 | 91 | БЫТЬ |
ç | U + 00E7 | E7 | E7 | E7 | 87 | 87 | 8D |
è | U + 00E8 | E8 | E8 | E8 | 8A | 8A | 8F |
é | U + 00E9 | E9 | E9 | E9 | 82 | 82 | 8E |
ê | U + 00EA | EA | EA | EA | 88 | 88 | 90 |
ë | U + 00EB | EB | EB | EB | 89 | 89 | 91 |
я | U + 00EC | EC | EC | EC | 8D | 8D | 93 |
я | U + 00ED | ED | ED | ED | A1 | A1 | 92 |
я | U + 00EE | EE | EE | EE | 8C | 8C | 94 |
я | U + 00EF | EF | EF | EF | 8B | 8B | 95 |
Характер | Кодовая точка | ISO-8859-1 | ISO-8859-15 | WINDOWS-1252 | IBM437 | IBM850 | МАКИНТОШ |
ð | U + 00F0 | F0 | F0 | F0 | D0 | ||
ñ | U + 00F1 | F1 | F1 | F1 | A4 | A4 | 96 |
ò | U + 00F2 | F2 | F2 | F2 | 95 | 95 | 98 |
ó | U + 00F3 | F3 | F3 | F3 | A2 | A2 | 97 |
ô | U + 00F4 | F4 | F4 | F4 | 93 | 93 | 99 |
х | U + 00F5 | F5 | F5 | F5 | E4 | 9B | |
ö | U + 00F6 | F6 | F6 | F6 | 94 | 94 | 9А |
÷ | U + 00F7 | F7 | F7 | F7 | F6 | F6 | D6 |
ø | U + 00F8 | F8 | F8 | F8 | 9B | BF | |
ù | U + 00F9 | F9 | F9 | F9 | 97 | 97 | 9D |
ú | U + 00FA | FA | FA | FA | A3 | A3 | 9C |
û | U + 00FB | FB | FB | FB | 96 | 96 | 9E |
ü | U + 00FC | FC | FC | FC | 81 | 81 | 9F |
ý | U + 00FD | FD | FD | FD | EC | ||
þ | U + 00FE | FE | FE | FE | E7 | ||
ÿ | U + 00FF | FF | FF | FF | 98 | 98 | D8 |
Характер | Кодовая точка | ISO-8859-1 | ISO-8859-15 | WINDOWS-1252 | IBM437 | IBM850 | МАКИНТОШ |
я | U + 0131 | D5 | F5 | ||||
Œ | U + 0152 | до н.э | 8C | CE | |||
œ | U + 0153 | BD | 9C | CF | |||
Š | U + 0160 | A6 | 8A | ||||
š | U + 0161 | A8 | 9А | ||||
Ÿ | U + 0178 | БЫТЬ | 9F | D9 | |||
Ž | U + 017D | B4 | 8E | ||||
ž | U + 017E | B8 | 9E | ||||
ƒ | U + 0192 | 83 | 9F | 9F | C4 | ||
ˆ | U + 02C6 | 88 | F6 | ||||
ˇ | U + 02C7 | FF | |||||
˘ | U + 02D8 | F9 | |||||
˙ | U + 02D9 | FA | |||||
˚ | U + 02DA | FB | |||||
˛ | U + 02DB | FE | |||||
˜ | U + 02DC | 98 | F7 | ||||
Характер | Кодовая точка | ISO-8859-1 | ISO-8859-15 | WINDOWS-1252 | IBM437 | IBM850 | МАКИНТОШ |
˝ | U + 02DD | FD | |||||
Γ | U + 0393 | E2 | |||||
Θ | U + 0398 | E9 | |||||
Σ | U + 03A3 | E4 | |||||
Φ | U + 03A6 | E8 | |||||
Ω | U + 03A9 | EA | BD | ||||
α | U + 03B1 | E0 | |||||
δ | U + 03B4 | EB | |||||
ε | U + 03B5 | EE | |||||
π | U + 03C0 | E3 | B9 | ||||
σ | U + 03C3 | E5 | |||||
τ | U + 03C4 | E7 | |||||
φ | U + 03C6 | ED | |||||
– | U + 2013 | 96 | D0 | ||||
— | U + 2014 | 97 | D1 | ||||
‗ | U + 2017 | F2 | |||||
Характер | Кодовая точка | ISO-8859-1 | ISO-8859-15 | WINDOWS-1252 | IBM437 | IBM850 | МАКИНТОШ |
‘ | U + 2018 | 91 | D4 | ||||
’ | U + 2019 | 92 | D5 | ||||
‚ | U + 201A | 82 | E2 | ||||
“ | U + 201C | 93 | D2 | ||||
” | U + 201D | 94 | D3 | ||||
„ | U + 201E | 84 | E3 | ||||
† | U + 2020 | 86 | A0 | ||||
‡ | U + 2021 | 87 | E0 | ||||
• | U + 2022 | 95 | A5 | ||||
… | U + 2026 | 85 | C9 | ||||
‰ | U + 2030 | 89 | E4 | ||||
‹ | U + 2039 | 8B | ОКРУГ КОЛУМБИЯ | ||||
› | U + 203A | 9B | DD | ||||
⁄ | U + 2044 | DA | |||||
ⁿ | U + 207F | FC | |||||
₧ | U + 20A7 | 9E | |||||
Характер | Кодовая точка | ISO-8859-1 | ISO-8859-15 | WINDOWS-1252 | IBM437 | IBM850 | МАКИНТОШ |
€ | U + 20AC | A4 | 80 | (D5)[nb 1][2][3] | БД | ||
™ | U + 2122 | 99 | AA | ||||
∂ | U + 2202 | B6 | |||||
∆ | U + 2206 | C6 | |||||
∏ | U + 220F | B8 | |||||
∑ | U + 2211 | B7 | |||||
∙ | U + 2219 | F9 | |||||
√ | U + 221A | FB | C3 | ||||
∞ | U + 221E | EC | B0 | ||||
∩ | U + 2229 | EF | |||||
∫ | U + 222B | BA | |||||
≈ | U + 2248 | F7 | C5 | ||||
≠ | U + 2260 | ОБЪЯВЛЕНИЕ | |||||
≡ | U + 2261 | F0 | |||||
≤ | U + 2264 | F3 | Би 2 | ||||
≥ | U + 2265 | F2 | B3 | ||||
Характер | Кодовая точка | ISO-8859-1 | ISO-8859-15 | WINDOWS-1252 | IBM437 | IBM850 | МАКИНТОШ |
⌐ | U + 2310 | A9 | |||||
⌠ | U + 2320 | F4 | |||||
⌡ | U + 2321 | F5 | |||||
─ | U + 2500 | C4 | C4 | ||||
│ | U + 2502 | B3 | B3 | ||||
┌ | U + 250C | DA | DA | ||||
┐ | U + 2510 | BF | BF | ||||
└ | U + 2514 | C0 | C0 | ||||
┘ | U + 2518 | D9 | D9 | ||||
├ | U + 251C | C3 | C3 | ||||
┤ | U + 2524 | B4 | B4 | ||||
┬ | U + 252C | C2 | C2 | ||||
┴ | U + 2534 | C1 | C1 | ||||
┼ | U + 253C | C5 | C5 | ||||
═ | U + 2550 | CD | CD | ||||
║ | U + 2551 | BA | BA | ||||
Характер | Кодовая точка | ISO-8859-1 | ISO-8859-15 | WINDOWS-1252 | IBM437 | IBM850 | МАКИНТОШ |
╒ | U + 2552 | D5 | |||||
╓ | U + 2553 | D6 | |||||
╔ | U + 2554 | C9 | C9 | ||||
╕ | U + 2555 | B8 | |||||
╖ | U + 2556 | B7 | |||||
╗ | U + 2557 | BB | BB | ||||
╘ | U + 2558 | D4 | |||||
╙ | U + 2559 | D3 | |||||
╚ | U + 255A | C8 | C8 | ||||
╛ | U + 255B | БЫТЬ | |||||
╜ | U + 255C | BD | |||||
╝ | U + 255D | до н.э | до н.э | ||||
╞ | U + 255E | C6 | |||||
╟ | U + 255F | C7 | |||||
╠ | U + 2560 | CC | CC | ||||
╡ | U + 2561 | B5 | |||||
Характер | Кодовая точка | ISO-8859-1 | ISO-8859-15 | WINDOWS-1252 | IBM437 | IBM850 | МАКИНТОШ |
╢ | U + 2562 | B6 | |||||
╣ | U + 2563 | B9 | B9 | ||||
╤ | U + 2564 | D1 | |||||
╥ | U + 2565 | D2 | |||||
╦ | U + 2566 | CB | CB | ||||
╧ | U + 2567 | CF | |||||
╨ | U + 2568 | D0 | |||||
╩ | U + 2569 | CA | CA | ||||
╪ | U + 256A | D8 | |||||
╫ | U + 256B | D7 | |||||
╬ | U + 256C | CE | CE | ||||
▀ | U + 2580 | DF | DF | ||||
▄ | U + 2584 | ОКРУГ КОЛУМБИЯ | ОКРУГ КОЛУМБИЯ | ||||
█ | U + 2588 | БД | БД | ||||
▌ | U + 258C | DD | |||||
▐ | U + 2590 | DE | |||||
Характер | Кодовая точка | ISO-8859-1 | ISO-8859-15 | WINDOWS-1252 | IBM437 | IBM850 | МАКИНТОШ |
░ | U + 2591 | B0 | B0 | ||||
▒ | U + 2592 | B1 | B1 | ||||
▓ | U + 2593 | Би 2 | Би 2 | ||||
■ | U + 25A0 | FE | FE | ||||
◊ | U + 25CA | D7 | |||||
ф | U + FB01 | DE | |||||
fl | U + FB02 | DF |
- Отображения кодовых страниц IBM взяты из Unicode сайт предоставлен Microsoft. См. Документ Консорциума Unicode по различия между сопоставлениями IBM и Microsoft для этих кодовых страниц.
- IBM437 и IBM850 определили печатаемые символы для диапазонов управляющих кодов. Хотя их нельзя было использовать при печати текста через ДОС, поскольку они будут захвачены до того, как достигнут экрана, они могут использоваться приложениями, которые напрямую используют память экрана.
- Macintosh имеет логотип Apple ⟨⟩ по адресу 0xF0 и переводит его как U + F8FF в Зона частного использования для Юникода.
Примечания
- ^ IBM ПК DOS 2000, выпущенная в 1998 году, изменила определение кодовой страницы 850 на то, что они назвали измененная кодовая страница 850 теперь включают знак евро в кодовой точке 213 вместо добавления поддержки нового кодовая страница 858. Причина этого могла быть связана с существующими ограничениями в реализации логики переключения кодовых страниц в MS-DOS /ПК DOS, который ограничивал файлы .CPI размером 64 КБ или максимум шестью кодовыми страницами, ограничение, которое было обойдено в некоторых OEM-версиях MS-DOS, в Windows NT, а также не существует в DR-DOS. Кроме того, синтаксический анализатор в MS-DOS / PC DOS ограничивает количество возможных записей страны / кодовой страницы в COUNTRY.SYS файлов до 146 или 438, ограничение отсутствует в DR-DOS. Таким образом, добавление поддержки кодовой страницы 858 могло означать одновременное удаление другой (например, кодовой страницы 850), что могло не быть жизнеспособным решением в то время, учитывая, что некоторые приложения были жестко запрограммированы для использования кодовой страницы 850.
Рекомендации
- ^ "00858". Кодовые страницы по CPGID. IBM. В архиве из оригинала от 06.06.2016. Получено 2016-06-06.
- ^ Пол, Матиас Р. (15 августа 2001 г.). «Изменение кодовых страниц в FreeDOS» (Техническая спецификация на основе сообщения fd-dev [1] ). Архивировано из оригинал на 2016-06-06. Получено 2016-06-06.
Новый официальный идентификатор для многоязычной «кодовой страницы 850 с EURO SIGN» - 858, а не 850. IBM перейдет на использование 858 вместо своего варианта 850 в будущих выпусках своих продуктов. […] Я могу только догадываться, почему они не добавили 858 к своим EGAx.CPI, COUNTRY.SYS, и KEYBOARD.SYS файлы в ПК DOS 2000. Многие сторонние приложения разработаны для работы с 850 и не знали о 858 на момент выпуска PC DOS 2000, так что это проще для всех, но, к сожалению, несовместимо. […] Как объяснялось выше, COUNTRY.SYS и KEYBOARD.SYS содержат только две записи кодовой страницы для данной страны в западных выпусках DOS. (В выпусках на арабском языке и иврите может быть до 8 кодовых страниц для одной страны, теоретически нет предела ниже допустимого диапазона кодовых страниц 1..65534). […] Проблема в том, что удаление поддержки 850 могло вызвать проблемы совместимости с приложениями, которые жестко запрограммированы на использование 850. Добавление 858 в качестве третьего варианта ко всем файлам значительно увеличило бы размеры файлов и таблиц. Парсер файлов COUNTRY.SYS в MS-DOS / PC DOS IO.SYS /IBMBIO.COM выделяет блокнот размером 6 Кбайт (для DOS 6) для загрузки всей информации. Это позволяет принять не более 438 записей в файле COUNTRY.SYS, в противном случае вы получите сообщение «COUNTRY.SYS too large.». В NLSFUNC парсер не имеет этого ограничения, и парсеры файлов в DR-DOS (ядро и NLSFUNC) также не знают о таком ограничении. В более старых выпусках MS-DOS / PC DOS даже был буфер размером 2 Кбайта для максимум 146 записей.
- ^ Пол, Матиас Р. (27 августа 2001 г.). «Изменение кодовых страниц в FreeDOS (продолжение)». В архиве с оригинала на 2014-10-01. Получено 2013-05-08.
[…] Можно также без проблем создавать собственные файлы .CPI в традиционном стиле FONT, но вы можете сохранить только до […] шести кодовых страниц в таком файле, если он должен использоваться MS-DOS / PC DOS (некоторые OEM issues, а NT может обрабатывать файлы размером более 64 КБ, но MS-DOS / PC DOS не может).