YUSCII - это неофициальное название нескольких стандартов JUS для 7- битной кодировки символов . Это включает:
- JUS I.B1.002 (ISO-IR-141, ISO 646-YU), который кодирует латинский алфавит Гая , используемый для сербского , хорватского и словенского языков [2]
- JUS I.B1.003 (ISO-IR-146), который кодирует сербскую кириллицу , [3] и
- JUS I.B1.004 (ISO-IR-147), который кодирует македонскую кириллицу . [4]
MIME / IANA | Латинский: JUS_I.B1.002 сербский, кириллица: JUS_I.B1.003-serb македонский: JUS_I.B1.003-mac [1] |
---|---|
Псевдоним (а) | Латинский: ISO 646-YU, CROSCII, SLOSCII Сербский: SRPSCII Македонский: MAKSCII |
Язык (и) | Сербский , хорватский , боснийский , словенский , македонский |
Стандарт | Latin: ЮС I.B1.002 сербской кириллицы: ЮС I.B1.003 Македонский: ЮС I.B1.004 |
Классификация | 7-битная кодировка Latin: ISO 646 |
Преемник | Латиница: ISO 8859-2 , Windows-1250 Кириллица: ISO 8859-5 , Windows-1251 |
Другая связанная кодировка (и) | КОИ-7 |
Кодировки основаны на стандарте кодирования 7- битных латинских символов ISO 646 и использовались в Югославии до широкого распространения более поздних стандартов CP 852 , ISO-8859-2 / 8859-5 , Windows-1250 / 1251 и Unicode . Он был назван в честь ASCII , где первое слово «американский» было заменено на «югославский»: «Югославский стандартный код для обмена информацией». Некоторые стандарты также иногда называются местными названиями: SLOSCII, CROSCII или SRPSCII для JUS I.B1.002, SRPSCII для JUS I.B1.003, MAKSCII для JUS I.B1.004.
JUS I.B1.002 - это национальный вариант ISO 646, то есть эквивалентный базовому ASCII с менее часто используемыми символами, замененными конкретными буквами алфавита Gaj. В стандартах кириллицы буквы латинского алфавита заменяются соответствующими буквами кириллицы. Љ (lj), Њ (nj), Џ (dž) и ѕ (dz) соответствуют латинским диграфам и отображаются на латинские буквы, которые не используются в сербском или македонском (q, w, x, y).
Первоначально YUSCII был разработан для телетайпов, но также распространился для использования на компьютерах . Это считалось плохой идеей среди разработчиков программного обеспечения, которым требовался исходный код ASCII, такой как {, [,},], ^, ~, |, \, в исходном коде (проблема частично решается с помощью триграфов в C ). С другой стороны, преимуществом YUSCII является то, что он остается сравнительно читаемым даже при отсутствии поддержки, как и российский KOI-7 . Многочисленные попытки заменить его на что-нибудь получше терпели неудачу из-за ограниченной поддержки. В конце концов, введение Microsoft кодовых страниц , появление Unicode и доступность шрифтов, наконец, ознаменовали верный (но, тем не менее, медленный) конец YUSCII. [ необходима цитата ]
Макет кодовой страницы
Кодовые точки остались в основном такими же, как в ASCII, для обеспечения максимальной совместимости. В следующей таблице показано распределение кодов символов в YUSCII. Записи с толстыми рамками подчеркивают отличия от ASCII, когда они интерпретируются как символы на основе латиницы. Оба латинские и кириллические символы показаны:
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | EOT 0004 | ENQ 0005 | ACK 0006 | BEL 0007 | BS 0008 | HT 0009 | LF 000A | ВТ 000Б | FF 000C | CR 000D | SO 000E | SI 000F |
1_ 16 | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | DC4 0014 | NAK 0015 | SYN 0016 | ETB 0017 | CAN 0018 | EM 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | США 001F |
2_ 32 | SP 0020 | ! 0021 | « 0022 | # 0023 | 0024 долл. США | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | Ž / Ж 017D / 0416 | А / А 0041/0410 | B / Б 0042/0411 | C / Ц 0043/0426 | D / Д 0044/0414 | E / Е 0045/0415 | Ф / Ф 0046/0424 | G / Г 0047/0413 | H / Х 0048/0425 | I / И 0049/0418 | J / Ј 004A / 0408 | К / К 004Б / 041А | L / Л 004C / 041B | М / М 004D / 041C | N / Н 004E / 041D | О / О 004F / 041E |
5_ 80 | П / П 0050 / 041F | Q / Љ 0051/0409 | Р / Р 0052/0420 | S / С 0053/0421 | Т / Т 0054/0422 | U / У 0055/0423 | В / В 0056/0412 | Вт / Њ 0057 / 040A | X / Џ 0058 / 040F | Г / Ѕ 0059/0405 | Z / З 005A / 0417 | Š / Ш 0160/0428 | Đ / Ђ / Ѓ 0110/0402 | Ć / Ћ / Ќ 0106 / 040B | Č / Ч 010C / 0427 | _ 005F |
6_ 96 | ž / ж 017E / 0436 | а / а 0061/0430 | б / б 0062/0431 | с / ц 0063/0446 | д / д 0064/0434 | э / е 0065/0435 | ф / ф 0066/0444 | г / г 0067/0433 | в / х 0068/0445 | i / и 0069/0438 | j / ј 006A / 0458 | к / к 006Б / 043А | л / л 006C / 043B | м / м 006D / 043C | н / н 006E / 043D | о / о 006F / 043E |
7_ 112 | п / п 0070 / 043F | q / љ 0071/0459 | р / р 0072/0440 | с / с 0073/0441 | т / т 0074/0442 | u / у 0075/0443 | в / в 0076/0432 | ж / њ 0077 / 045A | х / џ 0078 / 045F | у / ѕ 0079/0455 | z / з 007A / 0437 | š / ш 0161/0448 | đ / ђ / ѓ 0111/0452 | ć / ћ / ќ 0107 / 045B | č / ч 010D / 0447 | DEL 007F |
Письмо Число Пунктуация Символ Другой Неопределенный Латинский отличается от ASCII
Телетекст мировой системы
YUSCII не следует путать с латинским набором G0 для сербского, хорватского и словенского языков [5] или набором кириллицы G0 для сербского языка [6], определенным World System Teletext . Как и YUSCII, они основаны на ASCII и, где это возможно, гомологичны друг другу для сербских букв. Однако они принимают разные решения и, следовательно, несовместимы с YUSCII. Македонским буквам Ќ и Ѓ также присваиваются уникальные позиции, а не их сербским эквивалентам, тогда как строчная форма Џ и македонская буква Ѕ не поддерживаются. [a] Наборы WST G0 подробно описаны ниже для справки. Отличия от YUSCII показаны жирной зеленой рамкой.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | EOT 0004 | ENQ 0005 | ACK 0006 | BEL 0007 | BS 0008 | HT 0009 | LF 000A | ВТ 000Б | FF 000C | CR 000D | SO 000E | SI 000F |
1_ 16 | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | DC4 0014 | NAK 0015 | SYN 0016 | ETB 0017 | CAN 0018 | EM 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | США 001F |
2_ 32 | SP 0020 | ! 0021 | « 0022 | # 0023 | Ë / $ 00CB / 0024 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | Č / Ч 010C / 0427 | А / А 0041/0410 | B / Б 0042/0411 | C / Ц 0043/0426 | D / Д 0044/0414 | E / Е 0045/0415 | Ф / Ф 0046/0424 | G / Г 0047/0413 | H / Х 0048/0425 | I / И 0049/0418 | J / Ј 004A / 0408 | К / К 004Б / 041А | L / Л 004C / 041B | М / М 004D / 041C | N / Н 004E / 041D | О / О 004F / 041E |
5_ 80 | П / П 0050 / 041F | Q / Ќ 0051 / 040C | Р / Р 0052/0420 | S / С 0053/0421 | Т / Т 0054/0422 | U / У 0055/0423 | В / В 0056/0412 | W / Ѓ 0057/0403 | X / Љ 0058/0409 | Y / Њ 0059 / 040A | Z / З 005A / 0417 | Ć / Ћ 0106 / 040B | Ž / Ж 017D / 0416 | Đ / Ђ 0110/0402 | Š / Ш 0160/0428 | ë / Џ 00EB / 040F |
6_ 96 | č / ч 010D / 0447 | а / а 0061/0430 | б / б 0062/0431 | с / ц 0063/0446 | д / д 0064/0434 | э / е 0065/0435 | ф / ф 0066/0444 | г / г 0067/0433 | в / х 0068/0445 | i / и 0069/0438 | j / ј 006A / 0458 | к / к 006Б / 043А | л / л 006C / 043B | м / м 006D / 043C | н / н 006E / 043D | о / о 006F / 043E |
7_ 112 | п / п 0070 / 043F | q / ќ 0071 / 045C | р / р 0072/0440 | с / с 0073/0441 | т / т 0074/0442 | u / у 0075/0443 | в / в 0076/0432 | w / ѓ 0077/0453 | х / љ 0078/0459 | г / њ 0079 / 045A | z / з 007A / 0437 | ć / ћ 0107 / 045B | ž / ж 017E / 0436 | đ / ђ 0111/0452 | š / ш 0161/0448 | ■ 25A0 |
Письмо Число Пунктуация Символ Другой Неопределенный В отличие от ЮСКИИ
Смотрите также
- КОИ-7 , российский аналог.
- Кириллица
- Научная транслитерация
- Искра Дельта Партнер , компьютер со встроенным ЮСКИИ
Внешние ссылки
- Стандартная таблица за записывание (бывшая) Ю слова
Сноски
- ^ Набор телетекста G1 для использования с кириллицей, перечисленный в разделе 15.6.7, таблица 41 стандарта, содержит подмножество латинских букв, в основном без кириллических гомоглифов в наборах G0. К ним относятся S .
- ^ «Наборы символов» . IANA . 2018-12-12.
- ^ а б Федеральное учреждение стандартизации (1987-11-01). ISO-IR-141: сербско-хорватский и словенский латинский алфавит (PDF) . Комиссия по стандартам информационных технологий Японии (IPSJ / ITSCJ).
- ^ а б Федеральное учреждение стандартизации (1988-10-01). ISO-IR-146: сербско-хорватский кириллица (PDF) . Комиссия по стандартам информационных технологий Японии (IPSJ / ITSCJ).
- ^ а б Федеральное учреждение стандартизации (1988-10-01). ISO-IR-147: македонский кириллический алфавит (PDF) . Комиссия по стандартам информационных технологий Японии (IPSJ / ITSCJ).
- ^ а б «15.6.2 Поднаборы латинских национальных опций, таблица 36». ETS 300 706: расширенная спецификация телетекста (PDF) . Европейский институт телекоммуникационных стандартов ( ETSI ). п. 115.
- ^ а б «15.6.4 Набор кириллицы G0 - Вариант 1 - Сербский / Хорватский, Таблица 38». ETS 300 706: расширенная спецификация телетекста (PDF) . Европейский институт телекоммуникационных стандартов ( ETSI ). п. 117.