Окна-1251 - Windows-1251

Окна-1251
MIME / IANAокна-1251
Псевдоним (а)cp1251 (Кодовая страница 1251)
Язык (и)английский, русский, украинец, Белорусский, болгарский, Сербская кириллица, македонский
СделаноMicrosoft
СтандартСтандарт кодирования WHATWG
Классификациярасширенный ASCII, Окна-125x
Другая связанная кодировка (и)Амига-1251, KZ-1048,
RFC 1345 "ECMA-Cyrillic"

Окна-1251 это 8-битный кодировка символов, предназначенный для языков, использующих Кириллица Такие как русский, болгарский, Сербская кириллица и другие языки. Это наиболее широко используемая кодировка для болгарский, сербский и македонский языков.[нужна цитата ] По состоянию на сентябрь 2020 г., 1,0% всех (и 0,6% ТОП-1000[1]) веб-сайты используйте Windows-1251.[2][3] Однако его используют 10,6% российских (.ru) сайтов,[4] где это второй по популярности вариант после UTF-8. В Linux кодировка известна как cp1251.[5] IBM использует кодовую страницу 1251 (CCSID 1251 и знак евро расширенный CCSID 5347) для Windows-1251.[6][7][8][9][10][11][12]

Windows-1251 и КОИ8-Р (или его украинец вариант КОИ8-У ) используются гораздо чаще, чем ISO 8859-5 (который «используется менее чем 0,1% веб-сайтов»).[13] В отличие от Окна-1252 и ISO 8859-1, Windows-1251 не имеет непосредственного отношения к ISO 8859-5.

Unicode предпочтительнее Windows-1251 или других кодировок кириллицы в современных приложениях, особенно в Интернете, что делает UTF-8 доминирующая кодировка для веб-страниц. (Для дальнейшего обсуждения полного покрытия Unicode и того, как однобайтовые кодировки символов, такие как Windows-1251 и КОИ8-Р, не могу предоставить это, см. Кириллица в Unicode.)

Набор символов

В следующей таблице показана Windows-1251. Каждый символ показан со своим Unicode эквивалент и его десятичный код.

Окна-1251[14]
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_
0
NUL
0000
SOH
0001
STX
0002
ETX
0003
EOT
0004
ENQ
0005
ACK
0006
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
ТАК
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013
DC4
0014
НАК
0015
SYN
0016
ETB
0017
МОЖЕТ
0018
ЭМ
0019
SUB
001A
ESC
001B
FS
001C
GS
001D
RS
001E
нас
001F
2_
32
SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
А
0041
B
0042
C
0043
D
0044
E
0045
F
0046
грамм
0047
ЧАС
0048
я
0049
J
004A
K
004B
L
004C
M
004D
N
004E
О
004F
5_
80
п
0050
Q
0051
р
0052
S
0053
Т
0054
U
0055
V
0056
W
0057
Икс
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
а
0061
б
0062
c
0063
d
0064
е
0065
ж
0066
грамм
0067
час
0068
я
0069
j
006A
k
006B
л
006C
м
006D
п
006E
о
006F
7_
112
п
0070
q
0071
р
0072
s
0073
т
0074
ты
0075
v
0076
ш
0077
Икс
0078
у
0079
z
007A
{
007B
|
007C
}
007D
~
007E
DEL
007F
8_
128
Ђ
0402
Ѓ
0403

201A
ѓ
0453

201E

2026

2020

2021

20AC

2030
Љ
0409

2039
Њ
040A
Ќ
040C
Ћ
040B
Џ
040F
9_
144
ђ
0452

2018

2019

201C

201D

2022

2013

2014

2122
љ
0459

203A
њ
045A
ќ
045C
ћ
045B
џ
045F
A_
160
NBSP
00A0
Ў
040E
ў
045E
Ј
0408
¤
00A4
Ґ
0490
¦
00A6
§
00A7
Ё
0401
©
00A9
Є
0404
«
00AB
¬
00AC
ЗАСТЕНЧИВЫЙ
00AD
®
00AE
Ї
0407
B_
176
°
00B0
±
00B1
І
0406
і
0456
ґ
0491
µ
00B5

00B6
·
00B7
ё
0451

2116
є
0454
»
00BB
ј
0458
Ѕ
0405
ѕ
0455
ї
0457
C_
192
А
0410
Б
0411
В
0412
Г
0413
Д
0414
Е
0415
Ж
0416
З
0417
И
0418
Й
0419
К
041A
Л
041B
М
041C
Н
041D
О
041E
П
041F
D_
208
Р
0420
С
0421
Т
0422
У
0423
Ф
0424
Х
0425
Ц
0426
Ч
0427
Ш
0428
Щ
0429
Ъ
042A
Ы
042B
Ь
042C
Э
042D
Ю
042E
Я
042F
E_
224
а
0430
б
0431
в
0432
г
0433
д
0434
е
0435
ж
0436
з
0437
и
0438
й
0439
к
043A
л
043B
м
043C
н
043D
о
043E
п
043F
F_
240
р
0440
с
0441
т
0442
у
0443
ф
0444
х
0445
ц
0446
ч
0447
ш
0448
щ
0449
ъ
044A
ы
044B
ь
044C
э
044D
ю
044E
я
044F

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный

Казахский вариант

Измененная версия Windows-1251 была стандартизирована в Казахстан как казахстанский стандарт STRK1048, и известен под этикеткой KZ-1048. Он отличается в строках, показанных ниже:

КЗ-1048 (СТРК1048-2002)[15]
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
8_
128
Ђ
0402
Ѓ
0403

201A
ѓ
0453

201E

2026

2020

2021

20AC

2030
Љ
0409

2039
Њ
040A
Қ
049A
Һ
04BA
Џ
040F
9_
144
ђ
0452

2018

2019

201C

201D

2022

2013

2014

2122
љ
0459

203A
њ
045A
қ
049B
һ
04BB
џ
045F
A_
160
NBSP
00A0
Ұ
04B0
ұ
04B1
Ә
04D8
¤
00A4
Ө
04E8
¦
00A6
§
00A7
Ё
0401
©
00A9
Ғ
0492
«
00AB
¬
00AC
ЗАСТЕНЧИВЫЙ
00AD
®
00AE
Ү
04AE
B_
176
°
00B0
±
00B1
І
0406
і
0456
ө
04E9
µ
00B5

00B6
·
00B7
ё
0451

2116
ғ
0493
»
00BB
ә
04D9
Ң
04A2
ң
04A3
ү
04AF

Вариант Amiga

Амига-1251
MIME / IANAАмига-1251
Псевдоним (а)Ami1251
Язык (и)английский, русский
Классификациярасширенный ASCII
На основеОкна-1251, ISO-8859-1, ISO-8859-15

русский Amiga OS системы использовали версию кодовой страницы 1251, которая соответствует Windows-1251 для Русское подмножество кириллических букв, но в остальном в основном следует ISO-8859-1. Эта версия известна как Амига-1251,[16] под каким именем он зарегистрирован в IANA.[17]

Амига-1251[16]
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_
0
NUL
0000
SOH
0001
STX
0002
ETX
0003
EOT
0004
ENQ
0005
ACK
0006
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
ТАК
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013
DC4
0014
НАК
0015
SYN
0016
ETB
0017
МОЖЕТ
0018
ЭМ
0019
SUB
001A
ESC
001B
FS
001C
GS
001D
RS
001E
нас
001F
2_
32
SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
А
0041
B
0042
C
0043
D
0044
E
0045
F
0046
грамм
0047
ЧАС
0048
я
0049
J
004A
K
004B
L
004C
M
004D
N
004E
О
004F
5_
80
п
0050
Q
0051
р
0052
S
0053
Т
0054
U
0055
V
0056
W
0057
Икс
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
а
0061
б
0062
c
0063
d
0064
е
0065
ж
0066
грамм
0067
час
0068
я
0069
j
006A
k
006B
л
006C
м
006D
п
006E
о
006F
7_
112
п
0070
q
0071
р
0072
s
0073
т
0074
ты
0075
v
0076
ш
0077
Икс
0078
у
0079
z
007A
{
007B
|
007C
}
007D
~
007E
DEL
007F
8_
128
XXX
0080
XXX
0081
Аденома простаты
0082
NBH
0083
IND
0084
NEL
0085
SSA
0086
ЕКА
0087
HTS
0088
HTJ
0089
СУДС
008A
PLD
008B
PLU
008C
RI
008D
SS2
008E
SS3
008F
9_
144
DCS
0090
PU1
0091
PU2
0092
СТС
0093
CCH
0094
МВт
0095
СПА
0096
EPA
0097
SOS
0098
XXX
0099
SCI
009A
CSI
009B
ST
009C
OSC
009D
ВЕЧЕРА
009E
APC
009F
A_
160
NBSP
00A0
¡
00A1
¢
00A2
£
00A3
[а]
20AC
¥
00A5
¦
00A6
§
00A7
Ё
0401
©
00A9
[b]
2116
«
00AB
¬
00AC
ЗАСТЕНЧИВЫЙ
00AD
®
00AE
¯
00AF
B_
176
°
00B0
±
00B1
²
00B2
³
00B3
´
00B4
µ
00B5

00B6
·
00B7
ё
0451
¹
00B9
º
00BA
»
00BB
¼
00BC
½
00BD
¾
00BE
¿
00BF
C_
192
А
0410
Б
0411
В
0412
Г
0413
Д
0414
Е
0415
Ж
0416
З
0417
И
0418
Й
0419
К
041A
Л
041B
М
041C
Н
041D
О
041E
П
041F
D_
208
Р
0420
С
0421
Т
0422
У
0423
Ф
0424
Х
0425
Ц
0426
Ч
0427
Ш
0428
Щ
0429
Ъ
042A
Ы
042B
Ь
042C
Э
042D
Ю
042E
Я
042F
E_
224
а
0430
б
0431
в
0432
г
0433
д
0434
е
0435
ж
0436
з
0437
и
0438
й
0439
к
043A
л
043B
м
043C
н
043D
о
043E
п
043F
F_
240
р
0440
с
0441
т
0442
у
0443
ф
0444
х
0445
ц
0446
ч
0447
ш
0448
щ
0449
ъ
044A
ы
044B
ь
044C
э
044D
ю
044E
я
044F
  Отличается от Windows-1251 для соответствия ISO-8859-1
  Отличается как от Windows-1251, так и от ISO-8859-1

Сноски

  1. ^ Соответствие ISO-8859-15; в другом месте, чем в Windows-1251.
  2. ^ Присутствует в Windows-1251, но в другом месте; отсутствует в ISO-8859-1 / 15.

Рекомендации

  1. ^ «Обзор использования кодировок символов с разбивкой по рейтингам». w3techs.com. Получено 2020-09-01.
  2. ^ «Исторические тенденции использования кодировок символов, апрель 2020 года». Получено 2020-01-01.
  3. ^ "Часто задаваемые вопросы".
  4. ^ «Распределение кодировок символов среди сайтов, использующих .ru». w3techs.com. Получено 2020-09-01.
  5. ^ "cp1251 (7) - страница руководства Linux". man7.org. Получено 2018-07-01.
  6. ^ «Кодовая страница 1251 информационного документа». Архивировано из оригинал на 03.03.2016.
  7. ^ «Информационный документ CCSID 1251». Архивировано из оригинал на 2014-11-29.
  8. ^ «Информационный документ CCSID 5347». Архивировано из оригинал на 2014-11-29.
  9. ^ Кодовая страница CPGID 01251 (pdf) (PDF), IBM
  10. ^ Кодовая страница CPGID 01251 (txt), IBM
  11. ^ Международные компоненты для Unicode (ICU), ibm-1251_P100-1995.ucm, 2002-12-03
  12. ^ Международные компоненты для Unicode (ICU), ibm-5347_P100-1998.ucm, 2002-12-03
  13. ^ «Статистика использования кодировок символов для веб-сайтов». w3techs.com. В архиве из оригинала от 20.02.2011.
  14. ^ Стил, Шон (1998). CP1251 в таблицу Unicode. Консорциум Unicode. CP1251.TXT.
  15. ^ Уистлер, Кен (2007). KZ-1048 в Unicode. Консорциум Unicode. KZ1048.TXT.
  16. ^ а б Малышев, Михаил (2003). "Amiga-1251 в таблицу Unicode". Регистрация новой кодировки [Amiga-1251]. IANA.
  17. ^ «Наборы символов». IANA.

дальнейшее чтение

  • Корнаи, Андрас; Бирнбаум, Дэвид Дж .; да Круз, Франк; Дэвис, Бур; Фаулер, Джордж; Пейн, Ричард Б.; Паперно, Слава; Simonsen, Keld J .; Thobe, Glenn E .; Вулис, Дмитрий; ван Винген, Йохан В. (1993-03-13). "FAQ по КИРИЛИЧЕСКОМУ КОДИРОВАНИЮ Версия 1.3". Получено 2020-06-24.

внешняя ссылка