MIME / IANA | окна-1251 |
---|---|
Псевдоним (а) | cp1251 ( Кодовая страница 1251) |
Язык (и) | Английский , русский , украинский , белорусский , болгарский , сербская кириллица , македонский |
Сделано | Microsoft |
Стандарт | Стандарт кодирования WHATWG |
Классификация | расширенный ASCII , Windows-125x |
Другая связанная кодировка (и) | Amiga-1251 , KZ-1048 , RFC 1345 "ECMA-Cyrillic" |
Windows-1251 - это 8-битная кодировка символов , предназначенная для языков, использующих кириллицу, таких как русский , болгарский , сербский кириллица и другие языки. Это наиболее широко используемая кодировка для болгарского , сербского и македонского языков. [ необходима цитата ] По состоянию на декабрь 2020 [Обновить]года 0,9% всех (и 0,6% из первой тысячи [1] ) веб-сайтов используют Windows-1251. [2] [3] Однако его используют 9,9% российских (.ru) сайтов, [4]где это второй по популярности вариант после UTF-8. В Linux эта кодировка известна как cp1251. [5] IBM использует кодовую страницу 1251 ( CCSID 1251 и расширенный CCSID 5347 для знака евро ) для Windows-1251. [6] [7] [8] [9] [10] [11] [12]
Windows-1251 и KOI8-R (или его украинский вариант KOI8-U ) используются гораздо чаще, чем ISO 8859-5 (который «используется менее чем на 0,1% веб-сайтов»). [13] В отличие от Windows-1252 и ISO 8859-1 , Windows-1251 не имеет тесного отношения к ISO 8859-5.
Unicode предпочтительнее Windows-1251 или других кодировок кириллицы в современных приложениях, особенно в Интернете, что делает UTF-8 доминирующей кодировкой для веб-страниц. (Для дальнейшего обсуждения полного охвата Unicode и того, как однобайтовые кодировки символов, такие как Windows-1251 и KOI8-R , не могут этого обеспечить, см. Кириллица в Unicode .)
Набор символов [ править ]
В следующей таблице показана Windows-1251. Каждый символ отображается с его эквивалентом в Юникоде и его десятичным кодом.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | EOT 0004 | ENQ 0005 | ACK 0006 | BEL 0007 | BS 0008 | HT 0009 | LF 000A | ВТ 000Б | FF 000C | CR 000D | SO 000E | SI 000F |
1_ 16 | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | DC4 0014 | NAK 0015 | SYN 0016 | ETB 0017 | CAN 0018 | EM 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | США 001F |
2_ 32 | SP 0020 | ! 0021 | « 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | I 0049 | J 004A | K 004B | L 004C | M 004D | № 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | а 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | г 0067 | h 0068 | я 0069 | j 006A | k 006B | l 006C | м 006D | № 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | х 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | DEL 007F |
8_ 128 | Ђ 0402 | Ѓ 0403 | ‚ 201A | ѓ 0453 | „ 201E | … 2026 г. | † 2020 г. | ‡ 2021 г. | € 20AC | ‰ 2030 г. | Љ 0409 | ‹ 2039 | Њ 040A | Ќ 040C | Ћ 040B | Џ 040F |
9_ 144 | ђ 0452 | ' 2018 | ' 2019 | « 201C | ” 201D | • 2022 г. | - 2013 г. | - 2014 г. | ™ 2122 | љ 0459 | › 203A | њ 045A | ќ 045C | ћ 045B | џ 045F | |
A_ 160 | NBSP 00A0 | Ў 040E | ў 045E | Ј 0408 | ¤ 00A4 | Ґ 0490 | ¦ 00A6 | § 00A7 | Ё 0401 | © 00A9 | Є 0404 | « 00AB | ¬ 00AC | SHY 00AD | ® 00AE | Ї 0407 |
B_ 176 | ° 00B0 | ± 00B1 | І 0406 | і 0456 | ґ 0491 | µ 00B5 | ¶ 00B6 | · 00B7 | ё 0451 | № 2116 | є 0454 | » 00BB | ј 0458 | Ѕ 0405 | ѕ 0455 | ї 0457 |
C_ 192 | А 0410 | Б 0411 | В 0412 | Г 0413 | Д 0414 | Е 0415 | Ж 0416 | З 0417 | И 0418 | № 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E | П 041F |
D_ 208 | Р 0420 | С 0421 | Т 0422 | У 0423 | Ф 0424 | Х 0425 | Ц 0426 | Ч 0427 | Ш 0428 | Щ 0429 | Ъ 042A | Ы 042B | Ь 042C | Э 042D | Ю 042E | Я 042F |
E_ 224 | а 0430 | б 0431 | в 0432 | г 0433 | д 0434 | е 0435 | ж 0436 | з 0437 | и 0438 | © 0439 | к 043A | л 043B | м 043C | н 043D | о 043E | п 043F |
F_ 240 | р 0440 | с 0441 | т 0442 | у 0443 | ф 0444 | х 0445 | ц 0446 | ч 0447 | ш 0448 | щ 0449 | ъ 044A | ы 044B | ь 044C | э 044D | ю 044E | я 044F |
Письмо Число Пунктуация Символ Другой Неопределенный
Казахский вариант [ править ]
Измененная версия Windows-1251 была стандартизирована в Казахстане как казахстанский стандарт STRK1048 и известна под этикеткой KZ-1048
. Он отличается в строках, показанных ниже:
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8_ 128 | Ђ 0402 | Ѓ 0403 | ‚ 201A | ѓ 0453 | „ 201E | … 2026 г. | † 2020 г. | ‡ 2021 г. | € 20AC | ‰ 2030 г. | Љ 0409 | ‹ 2039 | Њ 040A | Қ 049A | Һ 04BA | Џ 040F |
9_ 144 | ђ 0452 | ' 2018 | ' 2019 | « 201C | ” 201D | • 2022 г. | - 2013 г. | - 2014 г. | ™ 2122 | љ 0459 | › 203A | њ 045A | қ 049B | һ 04BB | џ 045F | |
A_ 160 | NBSP 00A0 | Ұ 04B0 | ұ 04B1 | Ә 04D8 | ¤ 00A4 | Ө 04E8 | ¦ 00A6 | § 00A7 | Ё 0401 | © 00A9 | Ғ 0492 | « 00AB | ¬ 00AC | SHY 00AD | ® 00AE | Ү 04AE |
B_ 176 | ° 00B0 | ± 00B1 | І 0406 | і 0456 | ө 04E9 | µ 00B5 | ¶ 00B6 | · 00B7 | ё 0451 | № 2116 | ғ 0493 | » 00BB | ә 04D9 | Ң 04A2 | ң 04A3 | ү 04AF |
Вариант Amiga [ править ]
MIME / IANA | Амига-1251 |
---|---|
Псевдоним (а) | Ami1251 |
Язык (и) | Английский , русский |
Классификация | расширенный ASCII |
На основе | Окна-1251, ISO-8859-1 , ISO-8859-15 |
В российских системах Amiga OS использовалась версия кодовой страницы 1251, которая соответствует Windows-1251 для русского подмножества кириллических букв, но в остальном в основном соответствует ISO-8859-1 . Эта версия известна как Amiga-1251 , [16] под именем которой она зарегистрирована в IANA . [17]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | EOT 0004 | ENQ 0005 | ACK 0006 | BEL 0007 | BS 0008 | HT 0009 | LF 000A | ВТ 000Б | FF 000C | CR 000D | SO 000E | SI 000F |
1_ 16 | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | DC4 0014 | NAK 0015 | SYN 0016 | ETB 0017 | CAN 0018 | EM 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | США 001F |
2_ 32 | SP 0020 | ! 0021 | « 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | I 0049 | J 004A | K 004B | L 004C | M 004D | № 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | а 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | г 0067 | h 0068 | я 0069 | j 006A | k 006B | l 006C | м 006D | № 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | х 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | DEL 007F |
8_ 128 | ХХХ 0080 | XXX 0081 | ДПЖ 0082 | NBH 0083 | IND 0084 | NEL 0085 | SSA 0086 | ESA 0087 | HTS 0088 | HTJ 0089 | VTS 008A | PLD 008B | PLU 008C | RI 008D | SS2 008E | SS3 008F |
9_ 144 | DCS 0090 | PU1 0091 | PU2 0092 | STS 0093 | CCH 0094 | MW 0095 | SPA 0096 | EPA 0097 | SOS 0098 | XXX 0099 | SCI 009A | CSI 009B | ST 009C | OSC 009D | PM 009E | APC 009F |
A_ 160 | NBSP 00A0 | ¡ 00A1 | ¢ 00A2 | £ 00A3 | € [год] 20AC | ¥ 00A5 | ¦ 00A6 | § 00A7 | Ё 0401 | © 00A9 | № [b] 2116 | « 00AB | ¬ 00AC | SHY 00AD | ® 00AE | ¯ 00AF |
B_ 176 | ° 00B0 | ± 00B1 | ² 00B2 | ³ 00B3 | ´ 00B4 | µ 00B5 | ¶ 00B6 | · 00B7 | ё 0451 | ¹ 00B9 | º 00BA | » 00BB | ¼ 00BC | ½ 00BD | ¾ 00BE | ¿ 00BF |
C_ 192 | А 0410 | Б 0411 | В 0412 | Г 0413 | Д 0414 | Е 0415 | Ж 0416 | З 0417 | И 0418 | № 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E | П 041F |
D_ 208 | Р 0420 | С 0421 | Т 0422 | У 0423 | Ф 0424 | Х 0425 | Ц 0426 | Ч 0427 | Ш 0428 | Щ 0429 | Ъ 042A | Ы 042B | Ь 042C | Э 042D | Ю 042E | Я 042F |
E_ 224 | а 0430 | б 0431 | в 0432 | г 0433 | д 0434 | е 0435 | ж 0436 | з 0437 | и 0438 | © 0439 | к 043A | л 043B | м 043C | н 043D | о 043E | п 043F |
F_ 240 | р 0440 | с 0441 | т 0442 | у 0443 | ф 0444 | х 0445 | ц 0446 | ч 0447 | ш 0448 | щ 0449 | ъ 044A | ы 044B | ь 044C | э 044D | ю 044E | я 044F |
Сноски [ править ]
- ^ Соответствие ISO-8859-15 ; в другом месте, чем в Windows-1251.
- ^ Присутствует в Windows-1251, но в другом месте; отсутствует в ISO-8859-1 / 15.
Ссылки [ править ]
- ^ «Обзор использования кодировок символов с разбивкой по рейтингам» . w3techs.com . Проверено 25 января 2021 .
- ^ «Исторические тенденции использования кодировок символов, январь 2021 г.» . Проверено 25 января 2021 .
- ^ «Часто задаваемые вопросы» .
- ^ «Распределение кодировок символов среди сайтов, использующих .ru» . w3techs.com . Проверено 25 января 2021 .
- ^ "cp1251 (7) - страница руководства Linux" . man7.org . Проверено 1 июля 2018 .
- ^ "Кодовая страница 1251 информационного документа" . Архивировано из оригинала на 2016-03-03.
- ^ "Информационный документ CCSID 1251" . Архивировано из оригинала на 2014-11-29.
- ^ "Информационный документ CCSID 5347" . Архивировано из оригинала на 2014-11-29.
- ^ Кодовая страница CPGID 01251 (pdf) (PDF) , IBM
- ^ Кодовая страница CPGID 01251 (txt) , IBM
- ^ Международные компоненты для Unicode (ICU), ibm-1251_P100-1995.ucm , 2002-12-03
- ^ Международные компоненты для Unicode (ICU), ibm-5347_P100-1998.ucm , 2002-12-03
- ^ «Статистика использования кодировок символов для веб-сайтов» . w3techs.com . Архивировано 20 февраля 2011 года.
- ^ Стил, Шон (1998). CP1251 в таблицу Unicode . Консорциум Unicode . CP1251.TXT.
- ^ Уистлер, Кен (2007). KZ-1048 в Unicode . Консорциум Unicode . KZ1048.TXT.
- ^ a b Малышев, Михаил (2003). "Amiga-1251 в таблицу Unicode". Регистрация новой кодировки [Amiga-1251] . IANA.
- ^ «Наборы символов» . IANA.
Дальнейшее чтение [ править ]
- Корнаи, Андрас; Бирнбаум, Дэвид Дж .; да Круз, Франк; Дэвис, Бур; Фаулер, Джордж; Пейн, Ричард Б.; Паперно, Слава; Simonsen, Keld J .; Thobe, Glenn E .; Вулис, Дмитрий; ван Винген, Йохан В. (13 марта 1993 г.). «FAQ по КИРИЛИЧЕСКОМУ КОДИРОВАНИЮ Версия 1.3» . Проверено 24 июня 2020 .
Внешние ссылки [ править ]
- Справочная таблица Windows 1251
- Регистрация имени кодировки IANA
- Отображение Unicode окон 1251 с "наилучшим соответствием"
- Universal Cyrillic decoder , онлайн-программа, которая может помочь восстановить нечитаемые кириллические тексты с неработающей кодировкой Windows-1251 или другими кодировками .