Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В томе 1 стандарта STD-B24 Ассоциации радиопромышленности и бизнеса ( ARIB ) для языка разметки вещания [2] , помимо прочего, указана кодировка символов для использования в радиовещании на японском языке. Введен в действие 26.10.1999 . [2] Последней версией является версия 6.3 от 06.07.2016 .

Он включает ряд расширенных символов ARIB ( ARIB 外 字, ARIB gaiji ), которых нет в базовых стандартах ( JIS X 0208 и JIS X 0201 ). Это был исходный стандарт для многих символьных символов, которые были добавлены в Unicode , включая части блоков « Разные символы» , « Вложенные буквенно-цифровые дополнения» и « Вложенные идеографические дополнения» . [3] Его вклад частично перекрывает эмодзи Unicode , но был добавлен годом ранее в Unicode 5.2. [4]

Стандарт ARIB STD-B62, опубликованный в 2014 году, определяет сопоставления Unicode для выбора расширенных символов B24 (за исключением, например, дублированных JIS X 0213 ), а также нескольких расширенных кандзи. [5] Он также включает отображение используемых символов вне базовой многоязычной плоскости в частную область использования BMP .

Наборы и коды [ править ]

Стандарт ARIB STD B24 определяет несколько наборов символов и метод переключения между ними. К ним относятся набор кандзи (расширение JIS X 0208 ), буквенно-цифровой набор, набор хирагана, наборы катакана, состоящие из двух отдельных макетов и четырех наборов мозаики . [6] Наборы выбираются с использованием механизмов ISO 2022 для 94 наборов с использованием следующих кодов (пропорциональные наборы используют ту же схему, что и соответствующие непропорциональные): [7]

Таблицы кодов [ править ]

Набор кандзи (двухбайтовый) [ править ]

Это двухбайтовый набор символов, расширяющий JIS X 0208 .

Ведущий байт [ править ]

Байты кодирования соответствуют номеру строки или ячейки плюс 0x20 или 32 в десятичном формате (см. Ниже). Следовательно, кодовый набор, начинающийся с 0x21, имеет номер строки 1, а его ячейка 1 имеет байт продолжения 0x21 (или 33) и так далее. Большая часть кода соответствует JIS X 0208, исключения показаны жирной рамкой.

Наборы символов 0x21-0x74 (номера строк 1-84: знаки препинания, алфавиты, числа, Кана, Кандзи) [ править ]

Набор символов 0x7A (номер строки 90, дорожные знаки) [ править ]

Символы с 90-45 по 90-63 и с 90-66 по 90-84 (показаны ниже с жирной рамкой) перечислены в стандарте B24 только в таблице 7-10 (список символов расширения), а также являются единственными символами. в строках с 90 по 91, которые не относятся к транспортным символам; это отмечено в стандарте B24 в примечании к таблице 7-10. [10] Остальные расширения перечислены как в таблице 7-4 (таблица двухбайтовых кодов), так и в таблице 7-10. [10]

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный

Набор символов 0x7B (номер строки 91, символы карты) [ править ]

Символы из ARIB STD-B24, которые не были сохранены в ARIB STD-B62, показаны затененными.

Набор символов 0x7C (номер строки 92, единицы, закрытые формы, маркеры списка, стрелки) [ править ]

Символы из ARIB STD-B24, которые не были сохранены в ARIB STD-B62, показаны затененными.

Набор символов 0x7D (номер строки 93, символы игры и погоды, дроби, единицы, вложенные формы) [ править ]

Символы из ARIB STD-B24, которые не были сохранены в ARIB STD-B62, показаны затененными.

Набор символов 0x7E (номер строки 94, маркеры списка) [ править ]

Символы из ARIB STD-B24, которые не были сохранены в ARIB STD-B62, показаны затененными.

Однобайтовые наборы [ править ]

Буквенно-цифровой набор [ править ]

Отличия от US-ASCII показаны жирной рамкой.

Набор хирагана [ править ]

Распределение символов, не следующих за строкой 4 стандарта JIS X 0208, показано жирной рамкой.

Катакана сет [ править ]

Распределение символов, не следующих за строкой 5 JIS X 0208, показано жирной рамкой.

Набор JIS X 0201 Katakana [ править ]

Наборы мозаики [ править ]

Вариант Shift_JIS [ править ]

В дополнение к модифицированной кодировке ISO 2022 стандарт B24 также определяет кодировку Shift JIS в соответствии с JIS X 0208: 1997, но с добавлением расширенных символов в наборе кандзи. [1]


См. Также [ править ]

Сноски [ править ]

  1. ^ Обозначено как «храм» (т.е. буддийский храм ) в таблице 7-10 B24 (список символов расширения).
  2. ^ a b c d e f Маленькая форма (размер 70% согласно кодовой таблице / таблице 7-10) символа кандзи. Здесь показано смоделированное.
  3. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad Музыкальная аббревиатура (или ее половина), отсутствующая в Unicode, смоделированная здесь с использованием нескольких символов.

Ссылки [ править ]

  1. ^ a b ARIB (2008) , стр. 105, часть 2, раздел 7.3
  2. ^ a b ARIB (2008)
  3. ^ Suignard, Мишель (2008-03-11). «ISO / IEC JTC1 / SC2 / WG2 N 3397: Японские телевизионные символы» (PDF) .
  4. ^ «Список эмодзи Unicode 5.2» . Emojipedia.
  5. ^ a b c d e f ARIB (2014) , стр. 33–50, часть 2, таблица 5-2
  6. ^ ARIB (2008) , стр. 48-52
  7. ^ a b ARIB (2008) , стр. 39, часть 2, таблица 7-3
  8. ^ "ISO-IR-087" (PDF) . Комиссия по стандартам информационных технологий Японии (IPSJ / ITSCJ).
  9. ^ a b RFC 1468 (IETF) 
  10. ^ a b ARIB (2008) , стр. 72
  11. ^ a b c d e ARIB (2008) , стр. 54-72, часть 2, таблица 7-10
  12. ^ a b c d ARIB (2008) , стр. 46-47, часть 2, таблица 7-4
  13. ^ ARIB (2008) , стр. 48, часть 2, таблица 7-5
  14. ^ ARIB (2008) , стр. 50, часть 2, таблица 7-7
  15. ^ ARIB (2008) , стр. 49, часть 2, таблица 7-6
  16. ^ ARIB (2008) , стр. 52, часть 2, таблица 7-9
  • Спецификация кодирования и передачи данных для цифрового вещания (PDF) (стандарт ARIB). 5.2-E1. 1 . Ассоциация радиопромышленности и бизнеса (ARIB). 2008-06-06 [1999-10-26]. ARIB STD-B24. Архивировано (PDF) из оригинала 10.07.2017 . Проверено 10 июля 2017 .
  • Спецификация кодирования мультимедиа для цифрового вещания (второе поколение) (PDF) (стандарт ARIB). 1.0-E1. 1 . Ассоциация радиопромышленности и бизнеса (ARIB). 2014-07-31. ARIB STD-B62 . Проверено 11 февраля 2019 .

Дальнейшее чтение [ править ]

  • Лунде, Кен Роджер (декабрь 2008 г.). CJKV Обработка информации (2-е изд.). О'Рейли . ISBN 978-0-596-51447-1.
  • Лунде, Кен Роджер (декабрь 1998 г.). CJKV Обработка информации (1-е изд.). О'Рейли . ISBN 1-56592-224-7. (NB. Переведено на японский и китайский языки в 2002 г.)

Внешние ссылки [ править ]

  • Официальный список изменений для ARIB STD-B24 (на японском языке)
  • STD-B24 и другие, Список стандартов ARIB в области вещания ( ARIB )